Home >

news ヘルプ

論文・著書情報


タイトル
和文:複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 
英文: 
著者
和文: 岩野公司, 荒毛 祐紀, 小平 優希, 篠田浩一.  
英文: Koji Iwano, Yuki ARAKE, Yuki KODAIRA, Koichi Shinoda.  
言語 Japanese 
掲載誌/書名
和文:電子情報通信学会技術研究報告 SP 
英文:Technical Report of IEICE SP 
巻, 号, ページ vol. 116    no. 189    pp. 53-58
出版年月 2016年8月25日 
出版者
和文:一般社団法人 電子情報通信学会 
英文:The Institute of Electronics, Information and Communication Engineers 
会議名称
和文:2016年8月度音声研究会 
英文: 
開催地
和文:〒606-8501 京都市左京区吉田二本松町 
英文:Yoshida-Honmachi, Sakyo-ku, Kyoto 606-8501 
アブストラクト 本稿では,会話や会議の参加者が各自の所有するスマートフォンで音声を収録することで集められた,複数の多人数会話音声の処理技術として,「対話グループ検出」と「話者決定」について論じる.先行研究で提案した対話グループ検出は,グループ数が既知であることを前提とした手法であったため,本研究ではその改善手法として,BIC基準に基づくグループ数推定機能を有する対話グループ検出手法の提案を行う.また,クラスタリング手法の改良による性能改善も試みる.話者決定については,従来の提案手法では性能が 6 割に満たなかったため,相互スペクトル減算によって発話重畳の影響を抑制した話者決定手法の提案を行い,性能の向上を試みる.対話グループ検出については,15 グループ60 会話音声データを使用した実験の結果,正しくグループ数が推定され,グ ループ検出性能も 100%に達することが確認された.話者決定手法については,5 セッションの雑談音声データを利 用した評価により,従来手法よりも約 6%の性能改善が確認され,提案手法の有効性が示された.

©2007 Institute of Science Tokyo All rights reserved.