MENU

Llama — Metaが公開してオープンLLM潮流を作った基盤モデル

Llama アイキャッチ
Llama

LlamaはMeta Platforms(旧Facebook)のAI研究組織FAIRが開発した大規模言語モデル群で、2023年2月に研究者向けに重みが配布された初代Llamaを皮切りに、Llama 2、Code Llama、Llama 3、Llama 3.1 405Bと世代を重ねています。ヤン・ルカン率いるFAIRが「研究者がモデル中身を触れることが安全性向上に資する」という方針のもと、商用利用を含む比較的緩やかなライセンスでモデル重みを公開し、世界中の企業・大学・スタートアップが微調整できるオープンウェイトLLMの潮流を作り上げました。ChatGPTの躍進と裏腹に、企業内運用や自前ファインチューニングの世界では事実上の標準となっています。

目次

この記事の目次

  1. オープンウェイトという立ち位置
  2. Llamaから405Bまでの系譜
  3. 企業内運用での実用シーン
  4. GPT-4・Mistralとの比較
  5. まとめ

オープンウェイトという立ち位置

オープンウェイトという立ち位置

Llamaの最大の特徴は、ニューラルネット内部の重みパラメータがダウンロード可能な形で配布されていることです。OpenAIのGPT-4やAnthropicのClaudeはAPI越しにしか利用できず、推論ロジックは完全にベンダ側に閉じています。対してLlamaはHugging Face経由などで重みを取得でき、自社のGPUサーバーやプライベートクラウド上で推論を完結できます。個人情報を外部に出せない医療・金融、機密度の高いコード資産を持つ組織にとって、これが大きな採用理由になっています。

また、研究目的での再学習・蒸留・量子化・LoRA微調整など、モデルを「素材」として扱えるのが強みです。Vicuna、Alpaca、CodeLlama-Instruct、Llama Guardといった派生モデルが世界中で公開され、Llamaを土台にした業界特化型LLMが多数生まれました。Meta側もLlama Stackと呼ぶ開発フレームワークを2024年に提示し、「重み公開だけで終わらない、運用までセットの公開」へ踏み込んでいます。

Llamaから405Bまでの系譜

Llamaから405Bまでの系譜

Metaは2023年2月、7B・13B・33B・65Bパラメータの初代Llamaを研究目的限定で公開しました。直後に重みファイルがネットに流出したことで、結果的に研究者以外も触れる状況となり、オープンソースAIコミュニティが一気に活性化するきっかけになりました。同年7月にはマイクロソフトと共同でLlama 2を発表し、商用利用を含む実質的なフリーライセンスへと舵を切ります。

2024年4月のLlama 3では8B/70Bパラメータが投入され、同年7月にはLlama 3.1として4,050億(405B)パラメータの最上位モデルが公開されました。Llama 3.1 405Bはオープンウェイトとして当時最大級で、MMLU・GSM8Kなど主要ベンチマークで一部クローズドモデルに肉薄する水準に達しています。続くLlama 3.2では小型のオンデバイスモデルや視覚対応モデルが追加され、Llama 4世代では推論特化モデルも投入されるなど、公開のペースとモデルの幅は他社オープンモデルを大きく引き離す状況が続いています。

企業内運用での実用シーン

企業内運用での実用シーン

Llamaは「OpenAI APIに送れない」「特定ドメイン特化が必要」な企業ユースケースで主役を担っています。たとえば製造業のサポートマニュアルを社内Llamaに学習させ、現場端末から閉域ネットワーク経由で問い合わせる、金融機関で顧客データを外部に出さずにLlamaベースのRAG(後述)で社内検索を組む、病院がカルテに直接アクセスできる小型Llamaを院内サーバーで動かす、といった事例が増えてきています。

クラウド側でも、AWS Bedrock、Azure AI Studio、Google Vertex AIといった大手プラットフォームが、マネージドのLlama推論エンドポイントを提供しています。推論最適化を担うNVIDIA NIM、Groq、Together AI、Fireworks AIなども、Llama系を主力ラインアップに据えており、「クラウドAPIで使う場合もLlamaを選べる」状況が整いました。結果として、クローズドLLMでは表現しにくい言語(日本語ローカルLLMのELYZA-japanese-Llama-2など)も豊富に存在し、地域特化が進んでいます。

GPT-4・Mistralとの比較

GPT-4・Mistralとの比較

GPT-4やGeminiといったクローズドモデルは、サービスとしての完成度、対話品質、マルチモーダル機能で先行しています。一方Llamaは、モデルの中身を覗ける/自社で改造できる/オンプレで動かせるという、クローズドモデルでは得られない自由度を提供します。セキュリティ要件で外部APIを叩けない現場ほど、Llamaが第一候補になりやすいのが現状です。

オープンウェイト界隈の競合としてはフランス発のMistralがあり、Mixtral 8x7Bなどでスパース型MoE構造を打ち出しました。両者の関係は「最大規模はLlamaが先行、軽量×効率の尖り方ではMistralが先行」と整理されることが多く、用途と社内インフラに応じて使い分ける構図ができています。クラウド/オンプレ/端末まで全部を同じ家系で揃えたい場合はLlama、軽量モデル中心ならMistralという棲み分けが2024年時点で定着しました。

まとめ

LlamaはMetaが2023年から公開してきたオープンウェイトLLMで、Llama 3.1 405Bまで世代を重ねながらオープンAIの基準を引き上げ続けています。重み配布によって自社運用や派生モデルが世界中で生まれ、クローズドLLMでは届かない閉域・特化用途を一手に担う存在となっています。

※本記事はIT用語辞典の手書きドラフトです。公開前に最新情報・出典を確認のうえ加筆修正してください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメントする

目次