Giỏ hàng

Khi “giọng nói nội tâm” sắp có thể được nghe thấy

Casey Harrell, người mắc bệnh xơ cứng teo cơ một bên, là tình nguyện viên trong thử nghiệm lâm sàng dài hạn BrainGate2
 
Bước tiến mới trong công nghệ giải mã ngôn ngữ từ não bộ
 
Trong nhiều thập kỷ, các kỹ sư thần kinh đã nuôi giấc mơ hỗ trợ những người bị tách rời khỏi thế giới ngôn ngữ vì bệnh tật. Các căn bệnh như xơ cứng teo cơ một bên (ALS) khiến cơ bắp trong đường hô hấp suy yếu, hay đột quỵ làm chết các nơ-ron vốn truyền lệnh điều khiển giọng nói. Ý tưởng là: nếu cấy điện cực vào não, liệu các nhà khoa học có thể ghi lại hoạt động điện não và dịch thành ngôn ngữ?
 
Một nghiên cứu mới đây cho thấy bước đột phá quan trọng theo hướng đó. Trước đây, các nhóm nghiên cứu đã giải mã thành công tín hiệu não khi bệnh nhân cố gắng nói. Nhưng trong công trình vừa công bố trên tạp chí Cell, máy tính còn dự đoán đúng cả những từ mà người tham gia chỉ tưởng tượng nói ra trong đầu.
 
Christian Herff, nhà khoa học thần kinh tại Đại học Maastricht (Hà Lan), người không tham gia nghiên cứu, nhận xét: “Đây là một bước tiến tuyệt vời, vượt xa khía cạnh công nghệ đơn thuần và góp phần hé lộ bí ẩn của ngôn ngữ”.
 
Từ BrainGate2 đến thành tựu bất ngờ
 
Nghiên cứu này nằm trong khuôn khổ thử nghiệm lâm sàng dài hạn BrainGate2, vốn đã đạt nhiều thành công ấn tượng. Một trường hợp tiêu biểu là Casey Harrell, bệnh nhân ALS, hiện có thể trò chuyện cùng gia đình nhờ giao diện não – máy.
 
Năm 2023, khi giọng nói của Harrell trở nên khó hiểu, anh chấp nhận phẫu thuật cấy bốn mảng kim siêu nhỏ vào vùng vỏ não vận động bên trái – nơi phát lệnh điều khiển cơ bắp để tạo lời nói. Máy tính ghi lại hoạt động điện khi anh cố gắng phát âm nhiều từ. Sau thời gian huấn luyện với trí tuệ nhân tạo, hệ thống đã dự đoán chính xác gần 6.000 từ với độ chính xác 97,5%, rồi tổng hợp lại bằng giọng của chính Harrell, được ghi âm từ trước khi phát bệnh.
 
Thành công này cũng đặt ra câu hỏi: Liệu máy tính có vô tình thu được nhiều hơn những gì bệnh nhân muốn nói? Nó có thể nghe lén “giọng nói nội tâm” hay không?
 
“Chúng tôi muốn kiểm chứng liệu hệ thống có thể giải mã cả những từ không định phát ra thành tiếng,” tiến sĩ Erin Kunz (Đại học Stanford), tác giả nghiên cứu, cho biết. Bà và đồng nghiệp cũng đặt vấn đề: nếu bệnh nhân chỉ tưởng tượng câu nói, liệu sẽ bớt mệt mỏi hơn so với việc cố gắng phát âm? Điều này không chỉ giúp kéo dài thời gian giao tiếp mà còn tăng tốc độ xử lý.
 
Bản chất “giọng nói nội tâm” - tranh cãi chưa dứt
 
Tuy nhiên, việc giải mã “giọng nói nội tâm” không đơn giản, bởi ngay cả giới khoa học cũng chưa thống nhất nó là gì. Não bộ tạo ngôn ngữ thông qua một mạng lưới vùng não rộng bằng quả dâu tây lớn, nơi các từ được chọn lựa, sắp xếp thành câu. Những tín hiệu này có thể phát lệnh cho cơ quan phát âm, ra hiệu bằng tay hoặc gõ văn bản.
 
Song nhiều người còn cảm thấy mình nghe được suy nghĩ như một giọng nói vang lên trong đầu. Một số nhà nghiên cứu cho rằng ngôn ngữ là yếu tố cốt lõi của tư duy. Số khác lập luận phần lớn hoạt động suy nghĩ không cần ngôn ngữ; “giọng nói nội tâm” chỉ là bình luận ngẫu hứng trong đầu.
 
Evelina Fedorenko, nhà khoa học thần kinh nhận thức tại MIT, cho biết: “Nhiều người không hiểu bạn nói gì khi đề cập đến giọng nói nội tâm. Họ còn khuyên đi khám bác sĩ nếu bạn nghe thấy tiếng nói trong đầu”. Bà có “giọng nói nội tâm”, nhưng chồng bà thì không.
 
Khi trí tưởng tượng biến thành tín hiệu giải mã được
 
Để kiểm chứng, nhóm Stanford giao cho người tham gia bảy từ khác nhau như “kite” (diều), “day” (ngày), rồi so sánh tín hiệu não giữa hai tình huống: cố nói và chỉ tưởng tượng.
 
Kết quả cho thấy, tưởng tượng một từ tạo ra mô hình hoạt động tương tự nhưng yếu hơn so với khi cố gắng phát âm. Máy tính dự đoán khá chính xác từ được nghĩ đến. Với Harrell, kết quả ban đầu chỉ tương đương đoán ngẫu nhiên, nhưng một người tham gia khác đạt tỷ lệ đúng hơn 70%.
 
Sau khi được huấn luyện chuyên sâu cho ngôn ngữ tưởng tượng, máy tính tiến bộ rõ rệt, ngay cả với Harrell. Khi các tình nguyện viên tưởng tượng cả câu như “Tôi không biết anh đã ở đây bao lâu”, hệ thống giải mã được hầu hết các từ.
 
Herff, vốn cho rằng “giọng nói nội tâm” khác biệt hoàn toàn với tín hiệu vận động tạo lời nói, tỏ ra bất ngờ: “Nghiên cứu này cho thấy ở một số người, hai loại tín hiệu không khác nhau nhiều”.
 
Tuy nhiên, Kunz nhấn mạnh khả năng hiện tại vẫn chưa đủ để bệnh nhân có thể duy trì hội thoại. “Đây mới là bước chứng minh khái niệm ban đầu,” bà nói, đồng thời khẳng định độ chính xác và tốc độ đã cải thiện trong các thử nghiệm mới hơn, nhưng chưa công bố.
 
Vấn đề đạo đức: quyền riêng tư tư tưởng
 
Một khía cạnh quan trọng là quyền riêng tư của suy nghĩ. Trong một số thí nghiệm, máy tính phát hiện cả những từ người tham gia không cố hình dung. Ví dụ, khi họ được yêu cầu đếm số hình tròn xanh lá trong hàng loạt hình trên màn hình, máy tính đôi khi giải mã ra các từ chỉ con số. Nói cách khác, trong lúc đếm thầm, “giọng nói nội tâm” đã bị hệ thống nghe thấy.
 
Herff đánh giá: “Đây là phần thí nghiệm thú vị nhất, vì nó gợi ý ngôn ngữ có thể tham gia vào nhiều dạng tư duy khác ngoài giao tiếp. Một số người thật sự suy nghĩ theo cách đó”.
 
Để ngăn chặn nguy cơ “nghe lén” tư tưởng, nhóm nghiên cứu đề xuất hai giải pháp:
  • Chỉ giải mã lời nói cố gắng phát âm, bỏ qua tưởng tượng. Kết quả nghiên cứu cho thấy máy tính có thể phân biệt được hai dạng tín hiệu này.
  • Mật khẩu nội tâm để bật/tắt giải mã. Mật khẩu phải dài và hiếm gặp, vì vậy nhóm chọn cụm từ “Chitty Chitty Bang Bang” – tên tiểu thuyết năm 1964 và phim năm 1968. Một phụ nữ 68 tuổi bị ALS đã dùng cụm này trong đầu, và máy tính nhận diện chính xác 98,75%, chỉ giải mã lời nói tưởng tượng sau khi phát hiện mật khẩu.
Cohen Marcus Lionel Brown, nhà đạo đức sinh học tại Đại học Wollongong (Úc), nhận định: “Nghiên cứu này là bước đi đúng hướng về mặt đạo đức. Nếu triển khai nghiêm túc, nó sẽ trao cho bệnh nhân quyền kiểm soát lớn hơn đối với thông tin họ chia sẻ”.
 
Triển vọng và giới hạn
 
Fedorenko, người không tham gia nghiên cứu, gọi đây là “kỳ công về phương pháp”, nhưng nghi ngờ việc cấy ghép có thể nghe lén được phần lớn suy nghĩ. Theo bà, nhiều hoạt động tinh thần tự phát không phải câu chữ rõ ràng.
 
Bà dẫn chứng: khi người tham gia được yêu cầu nghĩ về sở thích thời thơ ấu, kết quả giải mã “hầu như vô giá trị”. “Phần lớn những gì ghi lại được chỉ là rác thông tin,” Fedorenko nói.
 
Dù còn nhiều tranh luận, nghiên cứu mới đã mở ra viễn cảnh nơi giao diện não – máy không chỉ giúp bệnh nhân lấy lại tiếng nói, mà còn biến “giọng nói nội tâm” thành công cụ giao tiếp. Với doanh nhân, giới công nghệ và nhà đầu tư, đây là lĩnh vực đầy tiềm năng, vừa đặt ra câu hỏi về tương lai của trí tuệ nhân tạo và quyền riêng tư, vừa mở ra cơ hội thương mại hóa các giải pháp y tế tiên tiến.
 
shared via nytimes, 

Bình luận

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Bình luận của bạn sẽ được duyệt trước khi đăng lên