情報推薦とは,情報収集支援アプローチの一つである.その名の通り,ユーザに対して情報を推薦する手法である.しかし,その情報がユーザに有益なものでなければならない.望まれる推薦システムとは,ユーザが要求してる情報を推薦するシステムである.
そもそも,情報収集は様々な活動において重要な作業である.それが近年のインターネットの爆発的発展により,誰でも膨大な情報源に対して触れることができるようになった.しかし,その膨大さは人の情報集収能力を圧倒し,「情報過負荷(Information Overload)」,あるいは「情報の氾濫(情報洪水)」を引き起こした.この問題に関してはインターネットの隆盛以前から表出していたのだが,いまだその解決策は見つかっていない.
情報過負荷を解決するために,早くから研究されてきた技術の一つに情報検索(Information Retrieval)がある.情報検索の成果の一つである検索エンジンは,WWWにおける情報収集支援ツールとして広く普及している.しかし,ユーザが情報を必要とする度に検索式を入力しなければならないし,さらに返された結果が膨大な量ならば,そこから絞り込みをかけねばならないといった問題がある.このような問題を解決する手法の一つとして,ユーザの要求を自動的に推定し,その要求を満たす情報を積極的に推薦するアプローチが考え出された.それが情報推薦である.
大量の情報を目の前にしたとき,我々が普段から日常的におこなっている行動を考えると,過去の経験や直感によって,重要な情報や有用性の高い情報を推測し,それらについてのみ処理を行っている事が多い.このような処理を「情報フィルタリング(Information Filtering)」と呼ぶ.この作業を自動化することで,ユーザの負担を軽減するシステムが,情報フィルタリングシステムである.情報フィルタリングには,不要な情報の除去だけでなく,情報の重み付けも含まれる.
検索エンジンや情報フィルタリングシステムの他に,ユーザの情報収集活動を支援するシステムとして推薦システム(Recommender System)がある.これは情報推薦の考え方に基づいて作られたシステムである.主に情報フィルタリングの技術を用いて作られることが多く,情報フィルタリングシステムとの区別は曖昧である.本文では,エージェントに基づく情報フィルタリングシステムで,ユーザに対して積極的にフィルタリング効果を与えるものを推薦システムと呼ぶ.これは,「推薦」という言葉が持つ能動的な印象と,エージェントの印象が重なるためである.
情報検索 | 検索式の修正と検索結果に対するフィードバックの繰り返しで,ユーザの求めるデータを特定する情報収集法.情報検索によって効率的な情報収集を実現するには,検索式を与えるユーザの熟練を要する. |
---|---|
情報フィルタリング | ユーザに送られる情報を除外したり,優先度を与えたりすることで,ユーザの情報収集を支援する情報収集法.ユーザは排除する情報や,優先度に関する情報をプロファイルとして作成しておく必要がある.情報フィルタリングによって効率的な情報収集を実現するには,プロファイルを作成するユーザの熟練を要する. |
ブラウジング | ハイパーテキストに特有の情報収集法.ユーザがリンクを辿ることで目的の情報に達する.しかし,目的の情報が必ず存在するわけではなく,存在したとしてもリンクの選択によっては辿り着けないといった問題がある.特徴として,リンクを辿るごとにユーザの目的が明確化されていく場合がある点が挙げられる. |
情報フィルタリングとは,ユーザにとって必要な情報を残し,それ以外を排除する技術である.情報の重み付けを行うことも情報フィルタリングの一種である.
情報フィルタリングは以下の三つに分類される.
内容に基づくフィルタリング (Cognitive Filtering) |
情報それ自身の内容と,ユーザの情報に対するニーズ(プロファイル)を比較し,与えられた情報とプロファイルの関係に基づいてフィルタリングを行う. |
---|---|
社会的フィルタリング (Social Filtering) |
情報の内容ではなく,情報の送信者の特徴や受信者との関係に基づいてフィルタリングを行う. |
経済的フィルタリング (Economic Filtering) |
情報を得ることによる利益と,情報を得るために必要な対価の比に基づいてフィルタリングを行う.ここでいう対価とは,情報に対する課金のような明示的なものだけでなく,メッセージの長さやその他の心理的な要因も含んでいる. |
情報フィルタリングの一種で,複数のユーザが共同で利用することを前提とした手法である.強調フィルタリングは「興味,関心,問題意識が類似している人は,同じ情報を求めている」という直感的,経験的な仮定に基づいている.情報フィルタリングを自然言語で定義すると以下のようになる.
「人間の情報収集行動から興味,関心,意図といった問題意識および獲得された情報を収集し,類似の問題意識を持ったものに提供することで情報収集活動を支援するための情報収集の手法」
協調フィルタリングは実用性が高い.よって,実用されている推薦システムの多くがこの手法に基づいている.また,それらの中には内容に基づくフィルタリングと協調フィルタリングを組み合わせることで,推薦の適合率の向上を試みているものもある.
推薦システムや情報フィルタリングシステムのように,ユーザの好みに対して動作するシステムでは,そのユーザの好みを明示的に計算機上に表現する必要がある.この表現をユーザモデル(ユーザプリファレンス)と呼び,表現する過程をユーザモデリングという.各フィルタリング手法によって,それぞれよく利用されるプロファイル構成要素の一例をあげる.
内容に基づくフィルタリング | キーワード,キーワードベクトル,概念マップなど |
---|---|
社会的フィルタリング | ユーザの地位,役職,友人関係,他のユーザとのプロファイルの類似度など |
経済的フィルタリング | ユーザの予算,許容できる長さなど |
ここでは推薦システムを評価する際に,一般的に用いられている二つの評価尺度について述べる.これらの評価尺度は情報検索の分野でも利用されていたものだが,推薦システムの評価にも適用できる.
推薦システムにおける適合率とは,システムが推薦した情報の中,どれだけユーザの要求を満たす情報を含んでいるかの割合である.
推薦システムにおける再現率とは,システムが推薦できる情報で,ユーザの要求を満たしているもののうち,実際に推薦された情報の割合である.