AIの解釈:ブラックボックスを開く
近ごろの人工知能、とりわけ深層学習の進歩には目を見張るものがあります。絵の判別や、普通の言葉の処理、病気の診断など、いろいろな分野で素晴らしい成果を上げています。しかし、その高い正答率の裏には、人工知能がどのように答えを出したのか、人が理解しづらいという問題が隠れています。これは、いわゆるブラックボックス化と呼ばれ、人工知能の信頼性や、きちんと説明する責任を問う際に大きな壁となっています。
たとえば、病気の診断で人工知能が病名を特定したとしても、その理由がはっきりしないならば、医師はその診断結果をそのまま受け入れることは難しいでしょう。また、自動運転の車が事故を起こした場合、なぜその行動を取ったのかが分からなければ、事故の原因究明や再発防止に繋がりません。さらに、融資の審査で人工知能が融資を拒否した場合、その理由が分からなければ、融資を希望する人は納得できないでしょう。このように、人工知能が社会の様々な場面で使われるようになるにつれ、その判断の過程を明らかにすることがますます重要になっています。
人工知能の判断を人が理解し、信頼するためには、人工知能がどのように答えを出したのかを説明できる技術が必要です。これはつまり、人工知能の思考過程を解き明かす技術、すなわちモデルの解釈が欠かせないということです。モデルの解釈は、人工知能が特定の判断を下した理由を明らかにするだけでなく、人工知能の弱点や改善点を見つけることにも役立ちます。それによって、より信頼性が高く、安全で、公正な人工知能を開発することができるのです。