記事詳細
「サイレントコミュニケーション」を実現する上での基礎研究で、大学院情報工学専攻の山下正人さんが奨励賞。
単語を聴いた時の脳神経活動を磁場で計測しDeep Learningを用いて学習、人工的に再構成された音声の実現を目指す
金沢工業大学 大学院工学研究科情報工学専攻 博士前期課程2年の山下正人さん(指導教員 中沢実 AIラボ所長/情報工学科教授)が令和元年11月11日(月)から 13日(水)まで北海道登別市で行われた「第27回マルチ威廉希尔中文网站通信と分散処理ワークショップ (DPSWS2019)」で奨励賞を受賞しました。
当ワークショップで発表された論文賞は、最優秀論文賞1点、優秀論文賞3点、奨励賞5点。受賞者の所属大学は、大阪大学、奈良先端科学技術大学院大学、金沢工業大学の3大学でした。
山下正人さんの研究論文「脳磁図(MEG)による聴覚刺激再構成システムの提案と評価」の概要
山下さんの研究は、言葉がしゃべれない方も頭の中で言葉を浮かべるだけでコンピュータが言葉にしてくれる「サイレントコミュニケーション」を実現する上での基礎研究です。
頭で考えるだけでコンピューターを操作する「Brain Computer Interface」の研究が近年さかんです。脳の活動を測定する技術として大きく硬膜下皮質表面電位(ECoG)、頭皮脳波(EGG)、脳磁図(MEG)の3つの手法があります。このうち硬膜下皮質表面電位は手術をして硬膜下に測定電極を設置するのに対して、頭皮脳波と脳磁図は非侵襲型の測定手法です。脳磁図は脳の神経活動に伴い発生する磁場を非侵襲で計測するもので、脳磁図が時間分解能や空間分解能ともに優れ、しかも非侵襲であることから、山下さんは脳磁図を計測手法として採用しました。
脳から発生する磁場は地磁気の10億分の1という微弱なもので、安定した測定のためにはシールドルームが必要ですが、金沢工業大学の先端電子応用研究所では超高感度磁気センサである超伝導量子干渉素子やそれを使った脳磁計、脊磁計の開発に産学連携で取り組んでいるため、高度な研究環境が整っています。
山下さんは、日本語話者の音声の助数字から「個、枚、本、冊、台、番」の6種類を単語ごとに分割しランダムに並び替えた音声データを作成。被験者の学生3名に聞かせ、聴覚刺激時の脳活動を測定しました。そして測定データから特に低周波数と高ガンマ包絡線の信号に注目。AIの一手法であるDeep Learningで周波数のパタンを学習させ、今度は周波数をもとに人工的に再構成された音声を評価者に聞いてもらい精度を検証しました。今後はDeep Learningの構造の見直しやデータの拡張による学習量の増加などを行うことで精度の向上を目指す考えです。
また同ワークショップでは指導教員の中沢実教授も「拡張固有表現の分類とテンプレートによる案内文の一考察」の発表で優秀プレゼンテーション賞を受賞しています。近年、AIへの関心が高まり、AIが案内する文章の生成方法も注目を集めています。その方法のほとんどが時系列データに基づく統計的な分析で、文章全体を対象に生成を行うため、特定の対象の案内文を生成しようとすると、適切な文章が得られないことが多いことが課題にとなっています。中沢教授の研究グループでは、Wikipediaの記事から各拡張固有表現を識別する方法と、拡張固有表現を用いた観光地の案内文の生成方法について考案?実装を行い、その発表を行いました。
山下正人さんの関連記事
「念ずれば開く」金沢工業大、脳波認証で98%の認証精度を達成 (MIT Technology Review 2018.09.05)
【脳波を使った生体認証】金沢工業大学の研究グループが画像刺激を用いた個人認証で98%の認証精度を実現。指紋認証や虹彩認証に替わるセキュリティーの高い次世代個人認証方式として期待(2018.8.1)
関連ページ
「物語の始まりへ」File.780 山下正人 *動画で紹介