Home >

news ヘルプ

論文・著書情報


タイトル
和文:雑音の基底信号を用いた耐雑音性の高い時間領域音声分離 
英文:Noise-robust time-domain speech separation with basis signals for noise 
著者
和文: 尾座本耕平, 岩野 公司, 宇都 有昭, 篠田 浩一.  
英文: Kohei OZAMOTO, Koji IWANO, Kuniaki UTO, Koichi SHINODA.  
言語 Japanese 
掲載誌/書名
和文:電子情報通信学会技術研究報告 
英文:TECHNICAL REPORT OF IEICE 
巻, 号, ページ vol. 120    no. 399    pp. 63-67
出版年月 2021年3月 
出版者
和文:一般社団法人 電子情報通信学会 
英文:The Institute of Electronics, Information and Communication Engineers 
会議名称
和文:音声研究会 (SP) (2021-03-EA-US-SP-SIP-SLP) 
英文: 
開催地
和文:オンライン開催 
英文: 
ファイル
公式リンク https://www.ieice.org/ken/paper/202103032CDr/
 
アブストラクト 近年,深層学習を用いた音声分離が盛んに研究されている.波形を直接入力する時間領域の手法であるTasNetは,音声を畳み込みによって特徴量に変換した上で分離を行い,分離した特徴量に対して畳み込みを行って波形を再構成する.畳み込みフィルタは基底信号と呼ばれ,話者間の分離精度を高めるように学習される.この手法は,音声に雑音が含まれている場合に分離性能が大きく低下する.そこで我々は,話者の基底信号に加え雑音の基底信号を追加することで分離性能を向上させる方法 TasNet with noise basis signals(TasNet-NB)を提案する.雑音のSN比を徐々に小さくするカリキュラム学習と雑音の再構成損失の計算を用いる.WHAM!データセットを用いて評価した結果,SI-SDRiが13.7から14.6に向上した.

©2007 Institute of Science Tokyo All rights reserved.