Home >

news Help

Publication Information


Title
Japanese:マルチモーダルi-vectorを用いた話者ダイアライゼーション 
English:Multimodal i-vectors for speaker diarization 
Author
Japanese: 西 史人, 井上 中順, 篠田 浩一.  
English: Fumito Nishi, Nakamasa Inoue, Koichi Shinoda.  
Language Japanese 
Journal/Book name
Japanese:情報処理学会研究報告 SLP 
English: 
Volume, Number, Page vol. 107    no. 4    pp. 1-6
Published date July 17, 2015 
Publisher
Japanese: 
English: 
Conference name
Japanese:平成27年度 第107回情報処理学会音声言語情報処理研究会 
English: 
Conference site
Japanese:長野県諏訪市 
English:Suwa-shi, Nagano Pref. 
File
Abstract 映画を対象とするマルチモーダル話者ダイアライゼーションにおいて,マルチモーダル i-vector を用 いる手法を提案する. i-vector とは話者認識において使われている特徴量であり,発話者の情報を表した 低次元ベクトルである.音声の i-vector に,動画中の話者の顔画像から抽出した i-vector を結合すること で作られたマルチモーダル i-vector に対して教師無しクラスタリングを行う.評価実験は映画「ハンナと その姉妹」のデータセットで行い,Diarization Error Rate (DER) は音声のみを用いた場合比べ,68.3%か ら 65.5%に改善された.

©2007 Tokyo Institute of Technology All rights reserved.