様々な原因で四肢の麻痺が進むと、他の人とのコミュニケーションが取れなくなる。この問題を解決する切り札が、脳コンピュータインターフェース技術で、ある行動を意図した時興奮する脳活動を解読し、どの字を書こうと意図したのか、PC上に書くことができる。おそらく多くの方が、例えばALS患者さんが脳内でPCのキーボードを操作してコミュニケーションしている情景を一度はご覧になったのではないだろうか。
この技術は、それぞれの文字の脳内表象がどう形成されているかといった、脳科学的検討はすっ飛ばして、文字を表出する時に一定の領域で見られる活動を、文字と対応させる一種のAI技術で、どのような脳活動を、文字と対応させるのかで競っている。これまで、目で見えるPCの画面上でカーソルを動かす動作や、言葉を話すときの運動皮質の活動を読み取って文字に変える技術が報告されている。すなわち、表象した文字を表出する運動野の活動を解読する手法が主流になっている。
私のような素人は、運動野の活動を解読するなら、単純な動きほど解読できるように感じるが、話すときの運動野活動を使う方が、より単純と考えられるカーソルの動きに対応する運動野活動を使うより成功を収めているのは、面白い。
今日紹介するスタンフォード大学からの論文は、同じように複雑な動きが必要と思われる文字を手書きする運動に関わる皮質の活動を解読して、自然なスピードで文章が書けるようにした研究で、5月12日号Natureにオンライン掲載された。タイトルは、「High-performance brain-to-text communication via handwriting (手書き動作を介して脳活動を高いパーフォーマンスでテキストに変える技術)」だ。
この研究は、AIで区別させるには複雑であっても、違いがはっきりする方が良いと決めて、字を書くことを脳内で意図した時に、手指を動かす運動野の活動を、文字と対応させて、PCに学習させている。脳内に埋め込んだ1000個程度の電極が並んだクラスター電極で読み取り、それがコンピュータ上で文字として現れる様になっている。
具体的な方法やソフトなどについては、私自身機械学習として理解できているだけだ。面白いのは、最終的な文字に変換するだけでなく、実際に頭の中で書いた文字の形も読み取れる様にしており、この形を見るのが面白い。また、線を欠かせた時と、字を書かせたときの軌跡を調べることができる。この結果、単純な線を書こうと意図するより、複雑な文字を描こうと意図したときの脳活動の方が、文字の区別という点では優れており、しかも速いことを示している。
特に文字を書くとき、それぞれの文字に費やす時間的な差異は解読目的に大きな情報になることも示している。そしてその結果として、1分に90文字という、驚異的なスピードでコミュニケーションすることを達成している。他にも、脳活動として区別がしやすい文字の形まで提案できているのも、頭の中で描いている文字の軌跡が把握できているからだろう。
あとは、電極を留置することに関する問題の解決だが、これがクリアされれば、四肢麻痺の人たちと自由に筆談が可能になる日は近いと思う。