Japanese
Home
Search
Horizontal Search
Publication Search
( Advanced Search )
Patent Search
( Advanced Search )
Research Highlight Search
( Advanced Search )
Researcher Search
Search by Organization
Support
FAQ
T2R2 User Registration
Doctoral thesis registration
Support/Contact
About T2R2
What's T2R2?
Operation Guidance
Leaflets
About file disclosure
Related Links
Tokyo Tech
STAR Search
NII IR Program
Home
>
Help
Publication Information
Title
Japanese:
全層ゲート付き2次元畳み込みネットワークによる多重音信号の音高認識
English:
Author
Japanese:
生田目 敬弘
,
亀岡 弘和
,
篠田 浩一
.
English:
Takahiro Namatame
,
Hirokazu KAMEOKA
,
Koichi Shinoda
.
Language
Japanese
Journal/Book name
Japanese:
研究報告音声言語情報処理(SLP)
English:
Volume, Number, Page
vol. 120 no. 12 pp. 1-7
Published date
Feb. 13, 2018
Publisher
Japanese:
情報処理学会
English:
Conference name
Japanese:
第120回音声言語情報処理研究会・第118回音楽情報科学研究会 共催研究会
English:
Conference site
Japanese:
茨城県つくば市
English:
File
Official URL
http://id.nii.ac.jp/1001/00185717/
Abstract
音楽は音高方向 (和音構成,調波構造) と時間方向 (旋律,リズム) の 2 次元構造を有する.我々は,音楽音響信号の音高認識の問題を音響スペクトログ ラムに対する音高ラベルの 2 次元的な配置問題と捉え,多重音信号の対数周波 数スペクトログラムから直接音高認識を行う全層ゲート付き 2 次元畳み込みネ ットワークを提案する.全層がゲート付き 2 次元畳み込みネットワークで構成 され,楽音の音響スペクトログラムと音楽の 2 次元構造を各層で表現する.従 来の確率的潜在成分分析手法と比較し,Bach10 データセットにおいて従来手法 の音符単位 F1 スコア 65.0% を 8.3% ポイント上回る 73.3% の性能を得た.ま た,室内楽データセットを新たに構築し,モデルの学習に用いた
©2007
Tokyo Institute of Technology All rights reserved.