English
Home
各種検索
研究業績検索
論文・著書検索
( 詳細検索 )
特許検索
( 詳細検索 )
研究ハイライト検索
( 詳細検索 )
研究者検索
組織・担当から絞り込む
サポート
よくあるご質問(FAQ)
T2R2登録申請
学位論文登録について
組織単位データ出力について
(学内限定)
サポート・問合せ
T2R2について
T2R2とは?
運用指針
リーフレット
本文ファイルの公開について
関連リンク
東京科学大学
東京科学大学STARサーチ
国立情報学研究所(学術機関リポジトリ構築連携支援事業)
Home
>
ヘルプ
論文・著書情報
タイトル
和文:
雑音の基底信号を用いた耐雑音性の高い時間領域音声分離
英文:
Noise-robust time-domain speech separation with basis signals for noise
著者
和文:
尾座本耕平
,
岩野 公司
,
宇都 有昭
,
篠田 浩一
.
英文:
Kohei OZAMOTO
,
Koji IWANO
,
Kuniaki UTO
,
Koichi SHINODA
.
言語
Japanese
掲載誌/書名
和文:
電子情報通信学会技術研究報告
英文:
TECHNICAL REPORT OF IEICE
巻, 号, ページ
vol. 120 no. 399 pp. 63-67
出版年月
2021年3月
出版者
和文:
一般社団法人 電子情報通信学会
英文:
The Institute of Electronics, Information and Communication Engineers
会議名称
和文:
音声研究会 (SP) (2021-03-EA-US-SP-SIP-SLP)
英文:
開催地
和文:
オンライン開催
英文:
ファイル
公式リンク
https://www.ieice.org/ken/paper/202103032CDr/
アブストラクト
近年,深層学習を用いた音声分離が盛んに研究されている.波形を直接入力する時間領域の手法であるTasNetは,音声を畳み込みによって特徴量に変換した上で分離を行い,分離した特徴量に対して畳み込みを行って波形を再構成する.畳み込みフィルタは基底信号と呼ばれ,話者間の分離精度を高めるように学習される.この手法は,音声に雑音が含まれている場合に分離性能が大きく低下する.そこで我々は,話者の基底信号に加え雑音の基底信号を追加することで分離性能を向上させる方法 TasNet with noise basis signals(TasNet-NB)を提案する.雑音のSN比を徐々に小さくするカリキュラム学習と雑音の再構成損失の計算を用いる.WHAM!データセットを用いて評価した結果,SI-SDRiが13.7から14.6に向上した.
©2007
Institute of Science Tokyo All rights reserved.