Home >

news Help

Publication Information


Title
Japanese:全層ゲート付き2次元畳み込みネットワークによる多重音信号の音高認識 
English: 
Author
Japanese: 生田目 敬弘, 亀岡 弘和, 篠田 浩一.  
English: Takahiro Namatame, Hirokazu KAMEOKA, Koichi Shinoda.  
Language Japanese 
Journal/Book name
Japanese:研究報告音声言語情報処理(SLP) 
English: 
Volume, Number, Page vol. 120    no. 12    pp. 1-7
Published date Feb. 13, 2018 
Publisher
Japanese:情報処理学会 
English: 
Conference name
Japanese:第120回音声言語情報処理研究会・第118回音楽情報科学研究会 共催研究会 
English: 
Conference site
Japanese:茨城県つくば市 
English: 
File
Official URL http://id.nii.ac.jp/1001/00185717/
 
Abstract 音楽は音高方向 (和音構成,調波構造) と時間方向 (旋律,リズム) の 2 次元構造を有する.我々は,音楽音響信号の音高認識の問題を音響スペクトログ ラムに対する音高ラベルの 2 次元的な配置問題と捉え,多重音信号の対数周波 数スペクトログラムから直接音高認識を行う全層ゲート付き 2 次元畳み込みネ ットワークを提案する.全層がゲート付き 2 次元畳み込みネットワークで構成 され,楽音の音響スペクトログラムと音楽の 2 次元構造を各層で表現する.従 来の確率的潜在成分分析手法と比較し,Bach10 データセットにおいて従来手法 の音符単位 F1 スコア 65.0% を 8.3% ポイント上回る 73.3% の性能を得た.ま た,室内楽データセットを新たに構築し,モデルの学習に用いた

©2007 Tokyo Institute of Technology All rights reserved.