Home >

news Help

Publication Information


Title
Japanese:音声強調のための拡散モデルにおける計算量の削減 
English: 
Author
Japanese: 西 悠希, 岩野 公司, 篠田 浩一.  
English: Yuki Nishi, 岩野 公司, Koichi Shinoda.  
Language Japanese 
Journal/Book name
Japanese:日本音響学会第151回(2024年春季)研究発表会 講演論文集 
English: 
Volume, Number, Page        
Published date Mar. 2024 
Publisher
Japanese:一般社団法人日本音響学会 
English:Acoustical Society of Japan 
Conference name
Japanese:日本音響学会第151回(2024年春季)研究発表会 
English: 
Conference site
Japanese:東京都文京区 
English: 
File
Official URL chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://acoustics.jp/cms/wp_asj/wp-content/uploads/004_2024spring_program.pdf
 
Abstract 雑音除去を目的とした音声強調で近年はニューラルネットワークを用いた技術が広く使われるようになり, より高い精度が実現されている. 一方で, 近年は拡散モデルと呼ばれる手法が, データの生成に関し高精度かつ訓練が安定しているということで注目されている. 音声強調においても, この拡散モデルを用いる研究がなされている. しかしこの手法は, 生成段階で繰り返しデータをネットワークに通す必要があるために計算量が多いという欠点を持つ.  本研究は, 拡散モデルにおける生成段階の計算コストを, なるべく精度を落とさずに削減することを目指す. AutoEncoderにより, 入力される音声データを圧縮し, その中で拡散モデルの生成処理プロセスを実行することで, 計算コストの削減を精度を落とさずに実現した.

©2007 Institute of Science Tokyo All rights reserved.