DiTing - mô hình AI tạo bước ngoặt trong dự báo động đất

Nhịp đập khoa học - Ngày đăng : 17:01, 31/07/2024

Trung Quốc đã phát triển mô hình ngôn ngữ lớn đầu tiên có tên DiTing để khai thác kho dữ liệu giúp dự báo động đất.
Nhịp đập khoa học

DiTing - mô hình AI tạo bước ngoặt trong dự báo động đất

Sơn Vân {Ngày xuất bản}

Trung Quốc đã phát triển mô hình ngôn ngữ lớn đầu tiên có tên DiTing để khai thác kho dữ liệu giúp dự báo động đất.

Theo các nhà phát triển, DiTing dựa trên một trong những tập dữ liệu lớn nhất về loại hình này trên thế giới và có thể được sử dụng để phát hiện tín hiệu động đất, theo dõi hoạt động địa chấn, hỗ trợ phản ứng nhanh với động đất.

Hôm 30.7, Chen Shi (Phó giám đốc Viện Địa vật lý thuộc Cục Quản lý Động đất Trung Quốc) nói tại buổi ra mắt mô hình ngôn ngữ lớn này tại thành phố Thành Đô: "DiTing dựa vào lượng dữ liệu khổng lồ từ Mạng lưới quan sát động đất Trung Quốc và công nghệ trí tuệ nhân tạo (AI) tiên tiến, đồng thời đã cải thiện đáng kể độ chính xác và tốc độ nhận dạng tín hiệu địa chấn".

Sự kiện ra mắt DiTing trùng với lễ kỷ niệm 48 năm trận động đất tàn khốc ở Đường Sơn, miền bắc Trung Quốc khiến ít nhất 300.000 người thiệt mạng và san phẳng thành phố này.

Dự án là nỗ lực chung của Trung tâm Siêu máy tính Quốc gia tại Thành Đô, Viện Địa vật lý và Đại học Thanh Hoa. Tên của dự án bắt nguồn từ một sinh vật thần thoại trong Phật giáo Trung Quốc có thể thu thập tín hiệu từ khắp vũ trụ.

Trung tâm Siêu máy tính Quốc gia cho biết đây là lần đầu tiên thông tin địa chấn được thu thập ở quy mô lớn như vậy để đào tạo AI tại Trung Quốc, vượt qua giới hạn của các mô hình AI thông thường hoặc nhỏ hơn.

Nhìn chung, DiTing đã có thể đánh giá 100 triệu tham số (biến số) để đưa ra dự đoán hoặc quyết định và con số đó dự kiến ​​sẽ tăng lên 1 tỉ vào tháng 8, tờ Nhật báo Khoa học và Công nghệ trích dẫn lời Guo Li - Chủ tịch Trung tâm Siêu máy tính Quốc gia.

Mô hình AI càng có nhiều tham số thì càng thành thạo trong việc nắm bắt các chi tiết trong tập dữ liệu và có thể cải thiện hiệu suất tổng thể tốt hơn.

diting-mo-hinh-ai-tao-buoc-ngoat-trong-du-bao-dong-dat.jpg
Mô hình DiTing đã được đào tạo dựa trên dữ liệu động đất trong 7 năm - Ảnh: Shutterstock

DiTing đã được đào tạo dựa trên 7 năm báo cáo địa chấn từ Trung tâm Mạng lưới Động đất Trung Quốc, theo bài viết của nhóm nghiên cứu được công bố trên Earthquake Science - tạp chí hàng đầu của Hiệp hội Địa chấn Trung Quốc.

Nhóm nghiên cứu cho biết thông tin có thể được sử dụng làm nền tảng cho hàng loạt nghiên cứu liên quan đến động đất, thiết lập "chuẩn mực cho phát triển mô hình học máy và nghiên cứu địa chấn dựa trên dữ liệu" trong các lĩnh vực như phát hiện động đất, dự đoán cường độ động đất và dự đoán chuyển động mặt đất.

1. Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.

Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...

Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.

2. Học sâu là một lĩnh vực trong AI tập trung vào việc xây dựng và huấn luyện các mô hình học máy sâu, còn được gọi là mạng nơ-ron sâu. Mục tiêu của học sâu là tự động học các đặc trưng và biểu diễn cấp cao từ dữ liệu, giúp máy tính tự động thực hiện các nhiệm vụ phức tạp mà trước đây đòi hỏi sự can thiệp của con người.

Mô hình học sâu thường được xây dựng bằng cách sử dụng nhiều lớp của các nơ-ron. Nơ-ron là các đơn vị tính toán cơ bản mô phỏng theo cách hoạt động của não người. Những mô hình này có khả năng học các biểu diễn phức tạp của dữ liệu thông qua quá trình huấn luyện trên tập dữ liệu lớn.

Học sâu đã đạt được sự chú ý lớn nhờ vào khả năng giải quyết hiệu quả nhiều vấn đề khác nhau, bao gồm nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói, dịch ngôn ngữ, phân tích dự đoán, robot và nhiều ứng dụng khác trong thực tế. Các mô hình nổi tiếng trong học sâu bao gồm Mạng nơ-ron tích chập (CNN) và Mạng nơ-ron hồi quy (RNN).

Liu Xin, phó giáo sư tại khoa Khoa học Trái đất của Đại học Hồng Kông, nói DiTing và các công cụ học sâu sẽ cải thiện đáng kể việc phát hiện tiền chất động đất và dư chấn.

Không tham gia vào nghiên cứu DiTing, Liu Xin cho biết: "Chúng tôi có thể sử dụng bộ dữ liệu DiTing này để đào tạo thế hệ thuật toán khử nhiễu động đất tiếp theo nhằm tăng cường giám sát động đất theo thời gian thực ở các thành phố có nguy cơ động đất cao hơn, chẳng hạn Thành Đô, Vấn Xuyên, Trùng Khánh và các đứt gãy động đất đã biết gần khu vực Đường Sơn - Bắc Kinh - Thiên Tân".

Thuật toán khử nhiễu động đất được sử dụng để loại bỏ các tín hiệu không mong muốn (nhiễu) khỏi dữ liệu địa chấn. Nhiễu trong dữ liệu địa chấn có thể đến từ nhiều nguồn khác nhau, bao gồm:

- Nhiễu tự nhiên: Sóng biển, gió, động vật, hoạt động địa chất nhỏ...

- Nhiễu nhân tạo: Giao thông, công trình xây dựng, hoạt động công nghiệp...

Lý do cần khử nhiễu

- Tăng độ chính xác: Loại bỏ nhiễu giúp làm nổi bật các tín hiệu động đất thực sự, từ đó tăng độ chính xác trong việc phát hiện, định vị và xác định cường độ của các trận động đất.

- Cải thiện khả năng phân tích: Dữ liệu sạch sẽ hơn sẽ giúp các nhà khoa học dễ dàng phân tích và hiểu rõ hơn về quá trình xảy ra động đất, cấu trúc địa chất và các hiện tượng liên quan.

Liu Xin nói DiTing dựa trên nhiều dữ liệu hơn mô hình STEAD, bộ dữ liệu địa chấn thường được các nhà nghiên cứu của Đại học Stanford (Mỹ) phát triển vào năm 2019.

Trong khi STEAD bao phủ khoảng 450.000 trận động đất từ ​​năm 1984 đến 2018, DiTing đã sử dụng dữ liệu bao phủ 787.010 trận động đất từ ​​năm 2013 đến 2020 tại Trung Quốc.

Các nhà nghiên cứu cho biết DiTing cũng có thể được sử dụng trong lĩnh vực như giám sát địa chấn mỏ, khai thác khí đá phiến, phát hiện cấu trúc không gian ngầm đô thị và giám sát động đất dưới nước.

Khí đá phiến là loại khí tự nhiên bị "nhốt" trong các lớp đá phiến sét. Đây là một nguồn năng lượng hóa thạch, được hình thành từ xác các sinh vật biển nhỏ bé bị chôn vùi và phân hủy trong điều kiện nhiệt độ và áp suất cao trong hàng triệu năm. Khí này chủ yếu gồm methane cùng một số lượng nhỏ các hydrocarbon khác.

"Hơn 95% các mỏ dầu khí được phát hiện trên thế giới chủ yếu dựa vào thăm dò địa chấn. DiTing có thể suy ra liệu lòng đất có chứa dầu khí hay không bằng cách tìm hiểu các đặc điểm dạng sóng của các khu vực lưu trữ dầu", Wang Jianbo, Phó Trung tâm Siêu máy tính Quốc gia, cho hay.

Sơn Vân