Home >

news Help

Publication Information


Title
Japanese:音韻レベルの話者情報を用いた音声認識における話者適応 
English: 
Author
Japanese: 伊藤光一, 篠田浩一.  
English: Koichi Ito, Koichi Shinoda.  
Language Japanese 
Journal/Book name
Japanese:日本音響学会第153回(2025年春季)研究発表会講演論文集 
English: 
Volume, Number, Page         pp. 991-992
Published date Mar. 3, 2025 
Publisher
Japanese:一般社団法人 日本音響学会 
English: 
Conference name
Japanese:日本音響学会第153回(2025年春季)研究発表会 
English: 
Conference site
Japanese:埼玉県 
English: 
Official URL https://acoustics.jp/annualmeeting/program/
 
Abstract 音声認識は音声をテキストに変換する技術であり,スマートスピーカーや会議記録システム,音声翻訳などのベースとなっている。近年の深層学習ベースの音声認識は,モデルとデータの大規模化に伴い高い精度を記録するようになった。しかし,雑音下や複数話者条件下などで課題が残り,話者適応が重要である。従来は深層学習における話者情報の利用では発話全体に対する特徴が利用されてきたが,話者の違いは音韻レベルにも現れる。本研究では音声認識における話者適応について,深層学習ベースの音韻レベルの細かい話者情報を用いたマルチタスク学習手法を提案する。話者情報の利用方法について複数の手法を比較検討するための実験を行い,その結果を示す。

©2007 Institute of Science Tokyo All rights reserved.