新しいAI解説 +プラス

時系列データの深層学習：LSTM入門

{長短期記憶、略してエルエスティーエムとは、再帰型ニューラルネットワーク、いわゆるアールエヌエヌの一種です。アールエヌエヌは、時間とともに変化するデータ、例えば音声や文章といったものを扱うのが得意な学習モデルです。音声認識や文章の理解といった作業で力を発揮します。アールエヌエヌは過去の情報を覚えているため、現在の情報と合わせて結果を導き出せます。例えば、「私はご飯を食べる」の後に「が好きだ」が来ると予測できます。これは「食べる」という過去の情報を覚えているからです。しかし、単純なアールエヌエヌは少し前の情報しか覚えていられません。遠い過去の情報は忘れてしまいます。これは勾配消失問題と呼ばれ、長い文章を理解するのを難しくしていました。そこで、エルエスティーエムが登場しました。エルエスティーエムは特別な記憶の仕組みを持っています。この仕組みのおかげで、遠い過去の情報を忘れることなく覚えておくことができます。まるで人間の脳のように、必要な情報を覚えておき、不要な情報は忘れることができます。エルエスティーエムの記憶の仕組みは、情報を記憶しておくための特別な部屋のようなものだと考えてください。この部屋には、情報を書き込む、読み出す、消すための３つの扉があります。これらの扉は、過去の情報と現在の情報を組み合わせて、自動的に開いたり閉じたりします。３つの扉の開閉をうまく調整することで、エルエスティーエムは長期的な情報も覚えておくことができ、複雑な時系列データのパターンを学習できます。例えば、長い文章の全体的な意味を理解したり、複雑なメロディーを生成したりすることが可能になります。このように、エルエスティーエムは、アールエヌエヌが抱えていた問題を解決し、時系列データ処理の新たな可能性を開きました。

2024.11.25

深層学習

革新的な生成AI企業、neoAIとは？

近ごろの科学技術の進歩は目を見張るものがあり、中でも人工知能、とりわけ文章や画像などを作り出す人工知能の分野は、急速に発展を遂げています。絵を描いたり、文章を綴ったり、音楽を作ったりと、様々な分野でこの技術が用いられ始めており、世の中に大きな変化をもたらしています。このような状況下で、東京大学の松尾研究室から生まれたのが、この新しい人工知能、「neoAI」です。最先端の研究成果を実際に社会で役立てたいという熱い思いを持った研究者たちが集まり、設立されました。 neoAIは、人工知能の中でも、特に文章や画像などを作り出す技術を駆使し、世の中が抱える問題の解決や、今までにない新しい価値の創造を目指しています。具体的には、高精度な文章生成による文章作成支援、革新的な画像生成技術によるデザイン制作支援、そして高度な音楽生成技術による作曲支援など、様々な分野での応用が期待されています。これらの技術は、私たちの生活をより豊かに、より便利にする可能性を秘めています。 neoAIの開発チームは、東京大学松尾研究室の優秀な研究者たちで構成されており、常に最新の研究成果を取り入れながら、技術の向上に努めています。また、neoAIは単なる技術の開発に留まらず、倫理的な側面にも配慮しながら、責任ある開発と運用を進めていく方針です。人々の生活をより良くするために、neoAIはこれからも進化を続け、社会に貢献していきます。そして、将来は、様々な企業や団体との協力を通じて、より広範な分野での活用を目指しています。neoAIの挑戦は始まったばかりであり、今後の発展に大きな期待が寄せられています。

2024.11.25

ビジネスへの応用

マクロF1値：多クラス分類の評価指標

複数の種類に分ける作業で、機械学習の成果を測る物差しの一つに、マクロF1値というものがあります。これは、例えば、写真を見てそれが猫か犬か人間かを当てるような問題、迷惑メールを見分ける、お客さんをグループに分けるといった時に役立ちます。特に、三つ以上の種類に分ける場合、それぞれの種類の正解率をまとめて評価する必要があります。このマクロF1値は、まさにそのための物差しです。それぞれの種類の正解率を測るF1値というものをまず計算し、それらの平均値を算出することで、全体的な性能を測ります。この方法の利点は、データの偏りに左右されにくいことです。つまり、ある種類のデータが非常に多くても、その種類の正解率だけが全体の評価に過剰な影響を与えることはありません。例えば、犬の写真が大量にあって、猫や人間のデータが少ない場合でも、猫や人間の認識精度が低くても、犬の認識精度が高ければ全体の評価が高くなってしまう、ということが起きにくくなります。それぞれの種類の正解率を平等に評価できるため、データの数が種類によって大きく異なる場合でも、信頼できる評価結果を得られます。このことから、マクロF1値は、現実世界の様々な問題に適用できる、とても便利な物差しと言えるでしょう。

2024.11.25

機械学習

レンダリングとは？仕組みと活用例

色々な情報を、絵や動画、音といった形で作り出すことを「レンダリング」と言います。これは、コンピューターを使って絵や動画、音を作る世界で使われる言葉です。まるで設計図から実際の建物を作るように、コンピューターの中のデータから、目に見える絵や動画、耳に聞こえる音を作り出す作業です。例えば、立体的な絵や動画を作る場合を考えてみましょう。物体の形や、どんな素材でできているか、光がどこから当たっているか、カメラはどこにあるか、といった色々な情報をコンピューターはデータとして持っています。レンダリングでは、これらのデータを読み込み、複雑な計算を行います。そして、まるで写真のようにリアルな絵や動画を作り出すのです。私たちがゲームや映画、アニメで見ている美しい絵や動画のほとんどは、このレンダリングという作業によって作られています。また、音を作る場合にもレンダリングという言葉が使われます。例えば、作曲ソフトで曲を作るとき、音符や楽器の種類といった情報をコンピューターはデータとして持っています。レンダリングでは、これらのデータから実際に聞こえる音を作り出します。音符の情報が、実際に耳で聞ける音へと変わるのです。このように、レンダリングは、色々な種類のデータを、人間の五感で感じられる情報に変換する、大切な役割を担っています。データという、目に見えない情報を、絵や動画、音といった、私たちが見て聞いて楽しめるものに変える技術と言えるでしょう。

2024.11.25

画像生成