類似の先行研究で、発話をテキストに変換する音声認識の精度に課題

筑波大学は4月3日、アルツハイマー型認知症を早期に検出するための簡便な自己検査ツールとして、発話音声から認知機能障害の特徴を分析するモバイルアプリを開発したと発表した。この研究は、同大医学医療系の新井哲明教授らとIBM Reserch社が行ったもの。研究成果は、「Computer Speech &Language」に掲載されている。

画像: 画像はリリースより

画像はリリースより

世界的に高齢化が進む中で、認知症対策は喫緊の課題である。日本における認知症患者数は、2012年時点で462万人と推計され、2025年には700万人を超えると予想されている。認知症の過半数を占めるのはアルツハイマー病(Alzheimerʼs disease:AD)で、その予防・治療は、(mild cognitive impairment:MCI)を含む早期段階から開始することが極めて重要あるが、とりわけ、近年のコロナ禍においては、専門機関の受診が妨げられ、問題が深刻化している。さらに、MCIを含む早期段階でアルツハイマー型認知症を診断する方法は確立していない上、現在、実施可能で比較的信頼度が高いとされている検査法は、高価であるか身体的侵襲性が高く、一般の医療機関で行うことは困難である。

こうした中で、在宅や介護予防教室等でも安価で簡便に、MCIやADを検出できるツールが求められている。一方、認知機能検査中の発話音声から言語的特徴(何を話したか)を抽出し活用することで、従来の認知機能検査よりも高い精度を達成する研究が幾つも報告されている。こうした発話音声の解析を自動化することが、ツール開発の一助になると期待されているが、発話をテキストに変換する音声認識は、高齢者の発話や方言を含む言い回しで特に精度が悪く、これまでの研究の多くは、人手による書き起こしを用いて解析を行っていた。

MCI/ADで有意に変化し、音声認識精度にも頑健な言語的特徴に着目

研究グループは今回、MCIやADで有意に変化し、音声認識精度にも頑健な言語的特徴に着目し、5つの課題に音声で回答することで自己検査可能な認知機能障害の早期検出支援のためのモバイルアプリ(プロトタイプ)を開発した。これらの課題は、従来の認知機能検査を元にしており、写真を言葉で説明する課題や、動物の名前をできるだけ多く挙げる課題などが含まれる。

認知機能障害に関連する言語的特徴を自動で認識、MCIを88%、ADを91%の精度で検出

このモバイルアプリの検証のために、健常例43人、MCI例46人、AD例25人の3群、合計114人から音声データを収集し解析を行った。まず、認知機能障害に関連する言語的特徴を自動で推定することが可能かを検証した。音声認識を用い自動で変換したテキストを、人手で書き起こしたテキストを正解として、その認識精度を検証したところ、単語誤り率は32%だった。これは、英語などのその他の言語を含む過去の類似研究と同程度に誤りを多く含むものだった。

他方、音声認識を用いて自動変換したテキストから抽出した言語的特徴は、人手で書き起こしたテキストから抽出した特徴とほぼ一致しており、MCIやADで有意に変化する語彙力や情報量に関する言語的特徴を正確に推定できることを示した。さらに、音響韻律的特徴(どのように話したか)と組み合わせて機械学習モデルを構築することで、MCIを88%、ADを91%の精度で検出できることを示した。

言語的変化を伴う統合失調症やうつ病などの精神疾患にも適用可能

研究結果は、モバイルアプリによる自己検査を通じて、高齢者の発話や方言を含む言い回しなど、音声認識が苦手とする音声データからでも、認知機能障害に関連する言語的特徴を正確に推定し、MCIとADを高精度かつ安価で簡便に検出できる可能性を示した初めての成果である。「このようなツールは、アルツハイマー型認知症以外の認知症性疾患の他、言語的変化を伴う統合失調症やうつ病などの精神疾患にも適用可能であり、疾患の早期検出だけではなく、進行度の推定や介入効果の定量化などにも役立つと考えられる」と、研究グループは述べている。(

本記事は医療関係者専用記事です。

この先は、日本国内の医療関係者(医師・看護師・検査技師・栄養士・薬剤師など)の方に
当社商品に関する情報を提供することを目的としたページです。
日本国外の医療関係者および
一般の方に対する情報提供を目的としたものではございません。

あなたは医療関係者ですか?

  • はい
    ※医療関係者専用記事を閲覧する
  • いいえ
    ※TOPへ戻る

This article is a sponsored article by
''.