コンテンツベースフィルタリングとは?
ものの内容を基に、おすすめを提示する方法として、コンテンツベースフィルタリングがあります。これは、推薦システムと呼ばれる、利用者の好みに合った品物や情報を自動的に選んで知らせる仕組みの中で使われています。
たとえば、あなたが時代劇をよく見ているとしましょう。このとき、コンテンツベースフィルタリングは、時代劇というものの特徴、例えば侍が登場する、江戸時代が舞台である、刀を使った戦いがある、といった点に着目します。そして、これらの特徴と似た点を持つ他の作品、例えば、同じように侍が登場する作品や、江戸時代が舞台の作品を探し出し、あなたにおすすめとして提示するのです。
この方法は、利用者の行動履歴、つまり過去にどんなものを選んできたかという記録に基づいておすすめをする方法とは大きく異なります。行動履歴に基づく方法は、協調フィルタリングと呼ばれています。協調フィルタリングは、多くの利用者の行動履歴を集め、似た行動をとる利用者同士をグループ化し、そのグループで人気のあるものを他のグループの利用者におすすめするという仕組みです。
コンテンツベースフィルタリングと協調フィルタリングの大きな違いは、利用者の情報を使うかどうかという点です。協調フィルタリングは利用者同士の繋がりを重視するのに対し、コンテンツベースフィルタリングは品物そのものの内容に注目します。ですから、コンテンツベースフィルタリングは、まだ利用履歴が少ない新しい利用者に対しても、品物の特徴さえ分かればおすすめを提示することができます。また、新しく登場したばかりの品物でも、その特徴を分析することで、すぐにおすすめに含めることができます。
このように、コンテンツベースフィルタリングは、品物そのものの特徴を捉え、似た特徴を持つものを探し出すことで、利用者の好みに合ったおすすめを提示する、シンプルながらも効果的な方法です。多くの場面で活用されており、インターネット上の様々なサービスで利用されています。