酒井 浩之, 増山 繁
日本知能情報ファジィ学会誌 18(2) 265-279 2006年
本論文では, ユーザの要約要求を反映するためにユーザとのインタラクションを導入した複数文書要約手法を提案する. 従来, 文書自動要約とは, 主として1つの文書から1つの要約を自動的に生成する技術であった. しかしながら, 人間が知的な活動を行うためには1つの文書の要約を生成するよりも, ある事柄に関連した複数の文書から1つの要約を生成する技術 (すなわち, 複数文書要約技術) の方がより重要である. なぜなら, 人間の限られた情報処理能力では, 検索結果などで得られた関連した多くの文書を読むのに多大な時間が必要であり, それらを1つの要約にまとめることで読む時間の大幅な削減が可能になるからである. しかしながら, 一般にユーザごとに興味のある情報が異なるため, ユーザによって必要な情報が異なる. そこで, 本論文では, 複数文書要約においてユーザが知りたい情報を"要約要求"と定義し, ユーザの要約要求を考慮しそれに適合した要約を生成できる複数文書要約手法を提案する. 具体的には, 要約対象となる, ある事柄に関連した複数文書からその事柄に関連のあるキーワードを抽出しユーザに提示する. ユーザは提示されたキーワードから要約要求に適したキーワードを選択する. その選択されたキーワードによって生成される要約が変化する.<br>提案した要約手法の評価のために, 国立情報学研究所主催の, 検索と要約の評価のためのワークショップNTCIR4における要約タスク (TSC3) に参加した. その結果, 複数文書要約タスクにおいて良好な成績を得ることができた. なお, TSC3へは, 本システムによってスコア付けされたキーワードのうち上位12個を必ず選択するように変更することで, ユーザとのインタラクションを行わない複数文書要約システムとして参加した. また, ユーザとのインタラクションによる複数文書要約への効果を評価し, 提案手法の有効性を確認した.