Japanese
Home
Search
Horizontal Search
Publication Search
( Advanced Search )
Patent Search
( Advanced Search )
Research Highlight Search
( Advanced Search )
Researcher Search
Search by Organization
Support
FAQ
T2R2 User Registration
Doctoral thesis registration
Support/Contact
About T2R2
What's T2R2?
Operation Guidance
Leaflets
About file disclosure
Related Links
Science Tokyo
STAR Search
NII IR Program
Home
>
Help
Publication Information
Title
Japanese:
音韻レベルの話者情報を用いた音声認識における話者適応
English:
Author
Japanese:
伊藤光一
,
篠田浩一
.
English:
Koichi Ito
,
Koichi Shinoda
.
Language
Japanese
Journal/Book name
Japanese:
日本音響学会第153回(2025年春季)研究発表会講演論文集
English:
Volume, Number, Page
pp. 991-992
Published date
Mar. 3, 2025
Publisher
Japanese:
一般社団法人 日本音響学会
English:
Conference name
Japanese:
日本音響学会第153回(2025年春季)研究発表会
English:
Conference site
Japanese:
埼玉県
English:
Official URL
https://acoustics.jp/annualmeeting/program/
Abstract
音声認識は音声をテキストに変換する技術であり,スマートスピーカーや会議記録システム,音声翻訳などのベースとなっている。近年の深層学習ベースの音声認識は,モデルとデータの大規模化に伴い高い精度を記録するようになった。しかし,雑音下や複数話者条件下などで課題が残り,話者適応が重要である。従来は深層学習における話者情報の利用では発話全体に対する特徴が利用されてきたが,話者の違いは音韻レベルにも現れる。本研究では音声認識における話者適応について,深層学習ベースの音韻レベルの細かい話者情報を用いたマルチタスク学習手法を提案する。話者情報の利用方法について複数の手法を比較検討するための実験を行い,その結果を示す。
©2007
Institute of Science Tokyo All rights reserved.