Proceedings of the 15th Symposium on Humanities and Database
巻, 号, ページ
pp. 31-36
出版年月
2009年11月
出版者
和文:
第15回シンポジウム「人文科学とデータベース」実行委員会
英文:
会議名称
和文:
第15回公開シンポジウム「人文科学とデータベース」
英文:
The 15th Symposium of Humanities and Database
開催地
和文:
神戸大学
英文:
Kobe University
アブストラクト
本稿では八代集(905年頃〜1205年)用の品詞解析済みコーパスと品詞タグつき辞書を用いて、CRF(Conditional Random Field)法による連接コスト計算を実施し、二十一代集(905年頃〜1439年)に対応した和歌用形態素解析辞書の開発について述べる。八代集テキストのCRFによる連接コスト学習の結果、90.3%の連接が正しく解析できた。この辞書をもとに今後徐々に二十一代集テキストを増やしながら、辞書を育て、最終的には二十一代集対応の辞書に仕上げていく。