原田 隆史, 江藤 正己, 瀬口 真徳
情報処理学会研究報告. NL,自然言語処理研究会報告 184(33) 119-124 2008年3月27日
本研究の目的は,図書館におけるレファレンス記録の質問文および回答文から,そのレファレンス記録のキーワードとして適切な語句を自動的に抽出することである。自動抽出の手順は(1)候補となる語句を抽出し(2)キーワードとして適切か否かを判定するに大別できるが,本研究では(2)に焦点を当て,機械学習の手法を用いてこれを試みた。具体的には,キーワード候補となる語句の出現箇所,出現回数,語の前後の助詞など42個の特徴と人手に基づく正解判定の対を学習させ,自動判定をおこなった。日本史分野のレファレンス記録507件中の,人手によってキーワード判定を行った9,375語を対象とした実験の結果,精度56.9%,再現率48.3%でキーワードを正しく付与することができた。