レコメンド

記事数:(3)

協調フィルタリング：好みに合う商品発見

「協調」という言葉が示す通り、この技術は多くの利用者の行動から共通点を見つけ出すことで成り立っています。インターネット上の買い物でよく見かける「おすすめ商品」も、この協調フィルタリングという技術によって選び出されていることが多いです。具体的には、過去にたくさんの人たちがどのような商品を買ったり、どのような評価をしたりしたのかという記録を集めて、それらを分析します。例えば、あなたが過去に買った物や高い評価をつけた物と、他の人が買った物や高い評価をつけた物を比べて、共通点を探します。もし、あなたと似たような買い物の記録や評価の記録を持つ人がいれば、その人が買ってあなたはまだ買っていない商品は、あなたにも好まれる可能性が高いと考えられるのです。そして、そのような商品が「おすすめ商品」として表示されます。例えば、あなたが推理小説をよく買い、高い評価をつけているとします。他の人も推理小説をよく買い、高い評価をつけているとします。さらに、その人は時代小説も買っており、高い評価をつけていたとします。すると、協調フィルタリングは、あなたも時代小説を好む可能性が高いと判断し、あなたにおすすめ商品として時代小説を表示するのです。このように、協調フィルタリングは、たくさんの商品の中から自分に合う物を見つけるのが難しい時に、特に役立ちます。自分では思いもよらなかった商品との出会いを可能にし、より楽しい買い物を体験させてくれる、現代のインターネット上の買い物には欠かせない技術と言えるでしょう。

コンテンツベースフィルタリングとは？

ものの内容を基に、おすすめを提示する方法として、コンテンツベースフィルタリングがあります。これは、推薦システムと呼ばれる、利用者の好みに合った品物や情報を自動的に選んで知らせる仕組みの中で使われています。たとえば、あなたが時代劇をよく見ているとしましょう。このとき、コンテンツベースフィルタリングは、時代劇というものの特徴、例えば侍が登場する、江戸時代が舞台である、刀を使った戦いがある、といった点に着目します。そして、これらの特徴と似た点を持つ他の作品、例えば、同じように侍が登場する作品や、江戸時代が舞台の作品を探し出し、あなたにおすすめとして提示するのです。この方法は、利用者の行動履歴、つまり過去にどんなものを選んできたかという記録に基づいておすすめをする方法とは大きく異なります。行動履歴に基づく方法は、協調フィルタリングと呼ばれています。協調フィルタリングは、多くの利用者の行動履歴を集め、似た行動をとる利用者同士をグループ化し、そのグループで人気のあるものを他のグループの利用者におすすめするという仕組みです。コンテンツベースフィルタリングと協調フィルタリングの大きな違いは、利用者の情報を使うかどうかという点です。協調フィルタリングは利用者同士の繋がりを重視するのに対し、コンテンツベースフィルタリングは品物そのものの内容に注目します。ですから、コンテンツベースフィルタリングは、まだ利用履歴が少ない新しい利用者に対しても、品物の特徴さえ分かればおすすめを提示することができます。また、新しく登場したばかりの品物でも、その特徴を分析することで、すぐにおすすめに含めることができます。このように、コンテンツベースフィルタリングは、品物そのものの特徴を捉え、似た特徴を持つものを探し出すことで、利用者の好みに合ったおすすめを提示する、シンプルながらも効果的な方法です。多くの場面で活用されており、インターネット上の様々なサービスで利用されています。

アルゴリズム

コンテンツベースフィルタリングとは？

コンテンツベースフィルタリングとは、推薦システムで使われる技術の一つです。この技術は、利用者の過去の行動や評価ではなく、対象物そのものの持つ特徴に基づいて、利用者に合ったものを探し出し、提示します。例えば、映画の推薦システムを考えてみましょう。この技術では、映画のジャンルや監督、出演者、あらすじ、あるいは制作年といった情報が、映画の特徴を表す要素として使われます。利用者が以前に見て面白かったと感じた映画の特徴と、よく似た特徴を持つ映画を探し出して推薦することで、利用者の好みに合うであろう新しい映画を見つけやすくする、これがコンテンツベースフィルタリングの基本的な考え方です。具体的には、まずそれぞれの映画を、先ほど挙げたような様々な特徴に基づいて数値化します。例えば、アクション映画であれば「アクション」という項目の値を高くし、コメディ映画であれば「コメディ」の値を高くするといった具合です。こうして数値化された映画の特徴を、多次元の空間上に配置した点として捉え、利用者が過去に高評価した映画と、空間的に近い位置にある映画を探し出します。空間的に近いということは、特徴が似ているということを意味しており、これが推薦の根拠となります。この技術には、利用者の行動履歴が少なくても、対象物の情報さえあれば推薦を実行できるという利点があります。新規の利用者に対する推薦、いわゆる最初の壁の問題に効果的です。また、利用者一人ひとりの好みに特化した、個性的な推薦をすることができます。なぜなら、他の人がどう評価しているかは考慮せず、あくまでその利用者自身が高評価した対象物の特徴だけを元に推薦を行うからです。しかし、利用者の過去の好みに基づいて推薦を行うため、これまで見てきたものと似たものばかりが推薦される傾向があり、新しい発見につながりにくいという側面もあります。多様な対象物を利用者に届けるためには、他の推薦技術と組み合わせるなどの工夫が必要となるでしょう。