Japanese
Home
Search
Horizontal Search
Publication Search
( Advanced Search )
Patent Search
( Advanced Search )
Research Highlight Search
( Advanced Search )
Researcher Search
Search by Organization
Support
FAQ
T2R2 User Registration
Doctoral thesis registration
Support/Contact
About T2R2
What's T2R2?
Operation Guidance
Leaflets
About file disclosure
Related Links
Tokyo Tech
STAR Search
NII IR Program
Home
>
Help
Publication Information
Title
Japanese:
マルチモーダルi-vectorを用いた話者ダイアライゼーション
English:
Multimodal i-vectors for speaker diarization
Author
Japanese:
西 史人
,
井上 中順
,
篠田 浩一
.
English:
Fumito Nishi
,
Nakamasa Inoue
,
Koichi Shinoda
.
Language
Japanese
Journal/Book name
Japanese:
情報処理学会研究報告 SLP
English:
Volume, Number, Page
vol. 107 no. 4 pp. 1-6
Published date
July 17, 2015
Publisher
Japanese:
English:
Conference name
Japanese:
平成27年度 第107回情報処理学会音声言語情報処理研究会
English:
Conference site
Japanese:
長野県諏訪市
English:
Suwa-shi, Nagano Pref.
File
Abstract
映画を対象とするマルチモーダル話者ダイアライゼーションにおいて,マルチモーダル i-vector を用 いる手法を提案する. i-vector とは話者認識において使われている特徴量であり,発話者の情報を表した 低次元ベクトルである.音声の i-vector に,動画中の話者の顔画像から抽出した i-vector を結合すること で作られたマルチモーダル i-vector に対して教師無しクラスタリングを行う.評価実験は映画「ハンナと その姉妹」のデータセットで行い,Diarization Error Rate (DER) は音声のみを用いた場合比べ,68.3%か ら 65.5%に改善された.
©2007
Tokyo Institute of Technology All rights reserved.