Khám phá mới

Mô hình AI giải mã tín hiệu não, chuyển suy nghĩ thành câu chữ

Một mô hình AI có thể quét não bằng thiết bị không xâm lấn và chuyển đổi các suy nghĩ của con người thành câu chữ mà không cần cấy ghép.

Các nhà khoa học tại Meta đã sử dụng trí tuệ nhân tạo (AI) và công nghệ quét não không xâm lấn để giải mã cách suy nghĩ được chuyển hóa thành câu chữ, theo hai nghiên cứu mới công bố.

Trong một nghiên cứu, các nhà khoa học đã phát triển một mô hình AI có khả năng giải mã tín hiệu não để tái tạo các câu mà tình nguyện viên đã nhập. Trong nghiên cứu thứ hai, nhóm nghiên cứu đã sử dụng AI để lập bản đồ cách não bộ tạo ra ngôn ngữ, biến suy nghĩ thành câu chữ.

Screenshot 2025-03-11 174452

Screenshot 2025-03-11 174909

Theo các nhà khoa học, những phát hiện này có thể mở đường cho việc phát triển giao diện não - máy tính không xâm lấn, hỗ trợ những người bị tổn thương não hoặc gặp khó khăn trong giao tiếp.

"Đây là một bước tiến lớn trong việc giải mã não bộ, đặc biệt với phương pháp không xâm lấn", ông Alexander Huth, nhà khoa học thần kinh tính toán tại Đại học Texas ở Austin (Texas, Mỹ) nhận định với Live Science.

Hiện nay, các giao diện não - máy tính sử dụng kỹ thuật giải mã tương tự thường yêu cầu cấy ghép vào não đối với những bệnh nhân mất khả năng giao tiếp. Tuy nhiên, những nghiên cứu mới của Meta có thể mở ra hướng phát triển thiết bị đeo hỗ trợ giao tiếp mà không cần phẫu thuật.

Trong nghiên cứu đầu tiên, nhóm nghiên cứu đã sử dụng kỹ thuật từ não đồ (MEG), phương pháp đo từ trường do các xung điện trong não tạo ra, để theo dõi hoạt động thần kinh khi người tham gia nhập câu. Sau đó, họ huấn luyện một mô hình AI ngôn ngữ để giải mã tín hiệu não và tái tạo lại các câu từ dữ liệu MEG.

Mô hình AI đã giải mã các chữ cái mà người tham gia nhập với độ chính xác 68%. Những chữ cái xuất hiện thường xuyên được nhận diện chính xác hơn, trong khi các chữ ít phổ biến như "Z" và "K" có tỷ lệ lỗi cao hơn. Khi mắc lỗi, AI thường thay thế bằng các ký tự nằm gần nhau trên bàn phím QWERTY, cho thấy mô hình này có thể sử dụng tín hiệu vận động từ não để dự đoán chữ cái mà người tham gia nhập.

Trong nghiên cứu thứ hai, nhóm khoa học đã mở rộng kết quả trước đó để tìm hiểu cách não bộ tạo ra ngôn ngữ khi một người gõ chữ. Các nhà nghiên cứu thu thập 1.000 ảnh chụp MEG mỗi giây trong quá trình người tham gia nhập câu, từ đó giải mã các giai đoạn khác nhau của quá trình sản xuất ngôn ngữ.

Screenshot 2025-03-11 174641

Kết quả cho thấy, não bộ đầu tiên tạo ra thông tin về bối cảnh và ý nghĩa của câu, sau đó dần dần chi tiết hóa thành từng từ, âm tiết và cuối cùng là chữ cái khi người tham gia gõ.

Để tránh tình trạng một từ hoặc một chữ cái ảnh hưởng đến từ hoặc chữ cái tiếp theo, não bộ sử dụng một "mã thần kinh động" để giữ chúng riêng biệt. Mã này liên tục thay đổi vị trí lưu trữ thông tin trong các khu vực sản sinh ngôn ngữ của não.

Phát hiện này cho phép não bộ liên kết các chữ cái, âm tiết và từ liên tiếp mà vẫn duy trì thông tin về từng đơn vị trong thời gian dài. Tuy nhiên, các thí nghiệm MEG chưa xác định chính xác vị trí trong não bộ mà các biểu diễn ngôn ngữ này được hình thành.

Tổng hợp lại, hai nghiên cứu, dù chưa được bình duyệt, có thể giúp các nhà khoa học thiết kế các thiết bị hỗ trợ giao tiếp không xâm lấn cho những người mất khả năng nói.

Dù hệ thống hiện tại vẫn còn cồng kềnh và nhạy cảm để hoạt động ngoài môi trường phòng thí nghiệm, các tiến bộ trong công nghệ MEG có thể mở ra cơ hội phát triển thiết bị đeo trong tương lai, nhóm nghiên cứu nhận định.

Theo Live Science