レコメンドアルゴリズム

記事数:(2)

アルゴリズム

コンテンツベースフィルタリングとは?

ものの内容を基に、おすすめを提示する方法として、コンテンツベースフィルタリングがあります。これは、推薦システムと呼ばれる、利用者の好みに合った品物や情報を自動的に選んで知らせる仕組みの中で使われています。 たとえば、あなたが時代劇をよく見ているとしましょう。このとき、コンテンツベースフィルタリングは、時代劇というものの特徴、例えば侍が登場する、江戸時代が舞台である、刀を使った戦いがある、といった点に着目します。そして、これらの特徴と似た点を持つ他の作品、例えば、同じように侍が登場する作品や、江戸時代が舞台の作品を探し出し、あなたにおすすめとして提示するのです。 この方法は、利用者の行動履歴、つまり過去にどんなものを選んできたかという記録に基づいておすすめをする方法とは大きく異なります。行動履歴に基づく方法は、協調フィルタリングと呼ばれています。協調フィルタリングは、多くの利用者の行動履歴を集め、似た行動をとる利用者同士をグループ化し、そのグループで人気のあるものを他のグループの利用者におすすめするという仕組みです。 コンテンツベースフィルタリングと協調フィルタリングの大きな違いは、利用者の情報を使うかどうかという点です。協調フィルタリングは利用者同士の繋がりを重視するのに対し、コンテンツベースフィルタリングは品物そのものの内容に注目します。ですから、コンテンツベースフィルタリングは、まだ利用履歴が少ない新しい利用者に対しても、品物の特徴さえ分かればおすすめを提示することができます。また、新しく登場したばかりの品物でも、その特徴を分析することで、すぐにおすすめに含めることができます。 このように、コンテンツベースフィルタリングは、品物そのものの特徴を捉え、似た特徴を持つものを探し出すことで、利用者の好みに合ったおすすめを提示する、シンプルながらも効果的な方法です。多くの場面で活用されており、インターネット上の様々なサービスで利用されています。
機械学習

コンテンツベースフィルタリングとは?

コンテンツベースフィルタリングとは、推薦システムで使われる技術の一つです。この技術は、利用者の過去の行動や評価ではなく、対象物そのものの持つ特徴に基づいて、利用者に合ったものを探し出し、提示します。例えば、映画の推薦システムを考えてみましょう。この技術では、映画のジャンルや監督、出演者、あらすじ、あるいは制作年といった情報が、映画の特徴を表す要素として使われます。利用者が以前に見て面白かったと感じた映画の特徴と、よく似た特徴を持つ映画を探し出して推薦することで、利用者の好みに合うであろう新しい映画を見つけやすくする、これがコンテンツベースフィルタリングの基本的な考え方です。 具体的には、まずそれぞれの映画を、先ほど挙げたような様々な特徴に基づいて数値化します。例えば、アクション映画であれば「アクション」という項目の値を高くし、コメディ映画であれば「コメディ」の値を高くするといった具合です。こうして数値化された映画の特徴を、多次元の空間上に配置した点として捉え、利用者が過去に高評価した映画と、空間的に近い位置にある映画を探し出します。空間的に近いということは、特徴が似ているということを意味しており、これが推薦の根拠となります。 この技術には、利用者の行動履歴が少なくても、対象物の情報さえあれば推薦を実行できるという利点があります。新規の利用者に対する推薦、いわゆる最初の壁の問題に効果的です。また、利用者一人ひとりの好みに特化した、個性的な推薦をすることができます。なぜなら、他の人がどう評価しているかは考慮せず、あくまでその利用者自身が高評価した対象物の特徴だけを元に推薦を行うからです。しかし、利用者の過去の好みに基づいて推薦を行うため、これまで見てきたものと似たものばかりが推薦される傾向があり、新しい発見につながりにくいという側面もあります。多様な対象物を利用者に届けるためには、他の推薦技術と組み合わせるなどの工夫が必要となるでしょう。