Home >

news Help

Publication Information


Title
Japanese:雑音の基底信号を用いた耐雑音性の高い時間領域音声分離 
English:Noise-robust time-domain speech separation with basis signals for noise 
Author
Japanese: 尾座本耕平, 岩野 公司, 宇都 有昭, 篠田 浩一.  
English: Kohei OZAMOTO, Koji IWANO, Kuniaki UTO, Koichi SHINODA.  
Language Japanese 
Journal/Book name
Japanese:電子情報通信学会技術研究報告 
English:TECHNICAL REPORT OF IEICE 
Volume, Number, Page vol. 120    no. 399    pp. 63-67
Published date Mar. 2021 
Publisher
Japanese:一般社団法人 電子情報通信学会 
English:The Institute of Electronics, Information and Communication Engineers 
Conference name
Japanese:音声研究会 (SP) (2021-03-EA-US-SP-SIP-SLP) 
English: 
Conference site
Japanese:オンライン開催 
English: 
File
Official URL https://www.ieice.org/ken/paper/202103032CDr/
 
Abstract 近年,深層学習を用いた音声分離が盛んに研究されている.波形を直接入力する時間領域の手法であるTasNetは,音声を畳み込みによって特徴量に変換した上で分離を行い,分離した特徴量に対して畳み込みを行って波形を再構成する.畳み込みフィルタは基底信号と呼ばれ,話者間の分離精度を高めるように学習される.この手法は,音声に雑音が含まれている場合に分離性能が大きく低下する.そこで我々は,話者の基底信号に加え雑音の基底信号を追加することで分離性能を向上させる方法 TasNet with noise basis signals(TasNet-NB)を提案する.雑音のSN比を徐々に小さくするカリキュラム学習と雑音の再構成損失の計算を用いる.WHAM!データセットを用いて評価した結果,SI-SDRiが13.7から14.6に向上した.

©2007 Tokyo Institute of Technology All rights reserved.