Home >

news ヘルプ

論文・著書情報


タイトル
和文:単一チャンネル音声分離のためのマルチチャンネルモデルを用いた知識蒸留手法 
英文:Multi-Channel Knowledge Distillation for Single-Channel Speech Separation 
著者
和文: 二通大地, Roland Hartanto, 篠田浩一.  
英文: Daichi Nitsu, Roland Hartanto, Koichi Shinoda.  
言語 Japanese 
掲載誌/書名
和文:電子情報通信学会技術研究報告 
英文:IEICE technical report 
巻, 号, ページ Vol. 125    no. 74    pp. 10-15
出版年月 2025年6月6日 
出版者
和文:一般社団法人電子情報通信学会 
英文:The Institute of Electronics, Information and Communication Engineers 
会議名称
和文:電子情報通信学会 音声研究会(SP)音学シンポジウム2025 
英文: 
開催地
和文:東京都 
英文: 
ファイル
公式リンク https://ken.ieice.org/ken/paper/20250613cck0/
 
アブストラクト 音声分離は,雑音環境下での音声処理において重要な技術であり,補聴器,音声認識システム,スマート スピーカーなど幅広い分野で応用されているが,単一チャンネルでは空間情報が利用できず,性能が劣る.本研究で は,マルチチャンネルモデルから単一チャンネルモデルへの知識蒸留手法 MCKD-SS を提案する.提案手法では,音 声分離と音源到来方向(DOA)推定を同時に行うマルチタスクモデルから中間層の空間情報を抽出し,単一チャンネ ルモデルに蒸留する.SMS-WSJ や WHAMR!で性能向上を確認し,無響環境では効果が限定的だったが,雑音・残響 環境での有効性を示した.

©2007 Institute of Science Tokyo All rights reserved.