emoji

今、LLMが熱い

April 12, 2024

大規模言語モデル(だいきぼげんごモデル、英: large language model、LLM)は、多数のパラメータ(数千万から数十億)を持つ人工ニューラルネットワークで構成されるコンピュータ言語モデルで、膨大なラベルなしテキストを使用して自己教師あり学習または半教師あり学習によって訓練が行われる。

れたすです。生成AIもかなりいろんなところで使われ始めてますね。自分は学校の作文をまるまるAIに書かせたら怒られました。
ここ最近、生成AIの中でも、画像生成AIはMidjourneyやStable Diffusion、DALL-Eなど、色んなモデルがあり、どれも一長一短な感じですが、それに比べて、ChatGPTなどに利用されている、文章生成AIやチャットAIとも呼ばれるLLM(大規模言語モデル)は、ここ1年ほど、OpenAIの開発した、GPT-4一強状態にありました
ですがここ数か月の間に、いくつかのAIスタートアップが、GPT-4越えといわれるLLMをリリースしています

Claude 3

Anthropic「Claude 3 Opus」がLLM評価指標「Chatbot Arena」で初めてOpenAI「GPT-4」のパフォーマンスを上回る快挙を達成gigazine.net
a

つい最近、AIチャットボットの能力をユーザーの投票によって順位付けする、カルフォルニア大学の人達がつくったChatbot Arenaで、OpenAIのライバル企業、Anthropicが今年3月に公開したLLM、Claude 3 Opusが、初めてGPT-4のパフォーマンスを上回りました
Anthropicは、OpenAIの元社員が2021年に設立した米国のAI企業で、自分の中ではOpenAIに次いで2番目に強いAI企業みたいなイメージだった。 そして他にも、Claude 3の軽量版であるClaude 3 Sonnetが4位、Claude 3 Haikuが7位を記録しました。 Claude 3 Haikuは、Claude.aiから無料で利用できます

追記

新しいバージョンのGPT-4 Turboがリリースされ、再びChatbot Arenaで1位に返り咲きました。

Inflection 2.5

Inflection-2.5: meet the world's best personal AIinflection.ai
a

Claude 3はかなり話題になりましたが、Google傘下のAI企業、DeepMindの元社員らが設立した、Inflection AIが3月に発表した、Inflection-2.5もすごい。
性能は惜しくもGPT-4には少し届かないものの、GPT-4の40%の計算量の学習でGPT-4とほぼ同等の性能を実現しているらしい。
Inflection AIは、PiというAIチャットアプリも開発していて、Inflection-2.5を無料で利用できます。結構使いやすい。
けど最近CEOをはじめ多くの従業員がMicrosoftに引き抜かれたので結構やばい状況。

Command-R+

Cohereは、OpenAI、Anthropicに並ぶAI企業で、カナダに拠点を置いています
Cohereの創業者の一人、エイダン・ゴメスは、現代のAI技術の基礎となっている、Transformerという技術の論文、「Attention is all you need」の著者の一人。
Cohereが日本でOpenAIやAnthropic (Claude)と比べて知名度が少ないのは、ChatGPTやClaude.ai、Piのような個人や家庭向けのサービスではなく、法人向けの製品に力を入れているから。

そんなCohereが発表したのが、Command R+。
Command R+は、日本語含め10ヶ国語対応のLLMで、GPT-4 Turboに近い性能で、Tool Use(外部ツールを用いて回答精度を向上させる仕組み)などの一部の性能はGPT-4 Turboを上回っています。しかもAPIの価格もGPT-4 Turboの30~50%に抑えられています。
そして人間による性能評価では、GPT-4 Turboと比較すると、53%の人が、「Command R+の方が高性能」と判断しました。
そしてこのCommand R+、凄いのが、ローカル(自分のパソコン上)で動くんです。これがなぜすごいかというと、GPT-4やClaude 3のような高性能モデルは、性能が高い分サイズが大きいのと、たくさん利益を得るためにクローズドになっていて、APIからしか利用できないんですよ。
それに比べて、Command R+は、GPT-4並みの性能なのに加え、ネット上にモデルが公開されているため、誰でもダウンロードできるんです。(商用利用できないけど) そして同じくオープンモデルであるイーロンのAI会社が作ったGrok-1と比べてもかなり軽量なため、128GB搭載のMac上で動かすことができます
ちなみに高性能なPCを持ってない人でも、今のところ無料で使えるAPIHuggingChat、Web上のデモアプリなどから利用できます。
オフラインで誰でも高性能なAIアシスタントが使える日はそう遠くないかもしれません。

2024 © Lettuce