音声・音響信号処理分野のトップカンファレンス「ICASSP 2025」にて、IGSA AI Resarchの論文が採択

IGSA AI Researchチームの王 悦綸、松島 竜成、松島 創一郎および坂井 利光による論文「Enhancing and Exploring Mild Cognitive Impairment Detection with W2V-BERT-2.0」が、音声・音響信号処理分野の国際会議「ICASSP 2025」にて採択されたことをお知らせいたします。ICASSPは、IEEE Signal Processing Societyが主催する音声・音響信号処理分野における最も権威のある国際会議のひとつで、2025年は50回目の開催となります。このたび採択された論文は、2025年4月にインドのハイデラバードで開催される「ICASSP 2025」のSpeech Pathology Analysis and DEtection(SPADE)ワークショップにて発表予定です。
論文概要
This study explores a multi-lingual audio self-supervised learning model for detecting mild cognitive impairment (MCI) using the TAUKADIAL cross-lingual dataset. While speech transcription-based detection with BERT models is effective, limitations exist due to a lack of transcriptions and temporal information. To address these issues, the study utilizes features directly from speech utterances with W2V-BERT-2.0. We propose a visualization method to detect essential layers of the model for MCI classification and design a specific inference logic considering the characteristics of MCI. The experiment shows competitive results, and the proposed inference logic significantly contributes to the improvements from the baseline. We also conduct detailed analysis which reveals the challenges related to speaker bias in the features and the sensitivity of MCI classification accuracy to the data split, providing valuable insights for future research.
今後の展望
IGSA AI Researchでは引き続き、AI, DeepLearningに関する先端研究を推進し、ヘルスケアや高齢者福祉、サステナブル等を始めとするエッセンシャル領域での研究成果の社会実装を実現してまいります。弊社の研究にご興味のある研究者の皆様や、共同研究を希望する企業の皆様はお気軽にお声がけください。
参考
ICASSP 2025 Websitehttps://2025.ieeeicassp.org/