AASJホームページ > 新着情報 > 論文ウォッチ > 6月10日:顔認識機能を解読する(6月1日号Cell掲載論文)

6月10日:顔認識機能を解読する(6月1日号Cell掲載論文)

2017年6月10日
人間に劣らず、猿も個別の顔を認識できることがわかっており、この識別がどのようなアルゴリズムで行われているのかを明らかにすることは重要だ。実際、人間(おそらくサルも)は毎日の生活で常に他人の顔から相手の気持ちを読もうと努力する。これがコミュニケーションの基本にあり、最終的に言語へと発展していく一つの力だとしたら、この機能の解明は、最も高次な脳活動の理解に必須で、これまで多くの研究が行われてきたようだが、私の頭の中は教科書的知識で止まっていた。
   しかし今日紹介するカリフォルニア工科大学からの論文を読んで、この分野が大きく進展しているのを知って驚いた。論文のタイトルは「The code for facial identity in the primate brain(サルの脳内での顔を識別するコード)」で、6月1日号のCellに掲載された。
   様々な数理的手法が使われており、全てを理解できているわけではないことを断っておくが、この研究は微小電極による脳微小領域(カラム)の神経活動の記録と、その活動を誘導する顔写真による刺激とを丹念に対応させ、個々のカラムの神経活動から顔認識へと統合しようとした、オーソドックスな研究だと思う。
   研究では2匹のサルが使われ、それぞれにスタンダードとなる写真を見せて、MRIを用いて神経活動領域を特定する。その後、その領域内の様々なポイントに電極を挿入、スタンダードな顔から計算機により人工合成した写真に対する反応を調べるという、忍耐と技術が要求される大変な実験だ。
   さて刺激に使う顔の写真だが、active appearance modelと呼ばれるアルゴリズムを使って顔の変化に寄与する200ポイントのデータを、輪郭と見かけのそれぞれ25次元上の指標に分解している。これにより、それぞれのポイントの数値を変化させることで、50次元空間に分布する2000種類の異なる顔写真を合成することができる。こうして合成した写真をサルに見せたときの神経反応を、2箇所の顔認識領域ML/MFとAM内のそれぞれ50前後のポイントで記録している。実験する方にとっても、サルにとっても大変な実験だ。
   こうして得られた神経活動記録を、それぞれの顔写真を記述する50次元空間の数値と対応させることで、神経が顔の違いを計算しているアルゴリズムを解読しようとしている。実験が複雑なのでうまく表現できるかどうかわからないが、簡単に言ってしまうと、記録した各ポイントの神経反応を、今回用いたアルゴリズムで50次元に展開した顔と単純な線形関係で対応させられるという結果だ。例えば、LM/FM領域のポイントは、形に関わる次元により強く相関し、AMは見た目に対応した次元に反応する。
   言い換えると、各ポイントでの反応の強さを総合すると、どの顔に反応しているかを予測できることができ、また顔の分析データがあれば各ポイントの反応を予測できることになる。この研究では実際にどちらの予測も可能であることを示して、顔認識領域内の個々の神経細胞の活動の強さが組み合わさって、異なる顔の識別に対応していることを示している。
   限られた紙面では説明しきれないが、各神経の反応程度が、一つの次元で線形に並んでいるデータや、ある次元での顔の変化には全く神経反応に差がないことをみると、各神経細胞が顔という複雑な対象に決まった法則で反応していることがよくわかる。
   単一神経カラムの記録という極めてオーソドックスな研究手法が、神経活動研究とは無関係に進んできた私たちの顔の分析についての手法と完全に一致するのをみると、感激を禁じえない。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*