Llama — Metaが公開してオープンLLM潮流を作った基盤モデル

2026年6月3日

LlamaはMeta Platforms（旧Facebook）のAI研究組織FAIRが開発した大規模言語モデル群で、2023年2月に研究者向けに重みが配布された初代Llamaを皮切りに、Llama 2、Code Llama、Llama 3、Llama 3.1 405Bと世代を重ねています。ヤン・ルカン率いるFAIRが「研究者がモデル中身を触れることが安全性向上に資する」という方針のもと、商用利用を含む比較的緩やかなライセンスでモデル重みを公開し、世界中の企業・大学・スタートアップが微調整できるオープンウェイトLLMの潮流を作り上げました。ChatGPTの躍進と裏腹に、企業内運用や自前ファインチューニングの世界では事実上の標準となっています。

この記事の目次

オープンウェイトという立ち位置
Llamaから405Bまでの系譜
企業内運用での実用シーン
GPT-4・Mistralとの比較
まとめ

オープンウェイトという立ち位置

Llamaの最大の特徴は、ニューラルネット内部の重みパラメータがダウンロード可能な形で配布されていることです。OpenAIのGPT-4やAnthropicのClaudeはAPI越しにしか利用できず、推論ロジックは完全にベンダ側に閉じています。対してLlamaはHugging Face経由などで重みを取得でき、自社のGPUサーバーやプライベートクラウド上で推論を完結できます。個人情報を外部に出せない医療・金融、機密度の高いコード資産を持つ組織にとって、これが大きな採用理由になっています。

また、研究目的での再学習・蒸留・量子化・LoRA微調整など、モデルを「素材」として扱えるのが強みです。Vicuna、Alpaca、CodeLlama-Instruct、Llama Guardといった派生モデルが世界中で公開され、Llamaを土台にした業界特化型LLMが多数生まれました。Meta側もLlama Stackと呼ぶ開発フレームワークを2024年に提示し、「重み公開だけで終わらない、運用までセットの公開」へ踏み込んでいます。

Llamaから405Bまでの系譜

Metaは2023年2月、7B・13B・33B・65Bパラメータの初代Llamaを研究目的限定で公開しました。直後に重みファイルがネットに流出したことで、結果的に研究者以外も触れる状況となり、オープンソースAIコミュニティが一気に活性化するきっかけになりました。同年7月にはマイクロソフトと共同でLlama 2を発表し、商用利用を含む実質的なフリーライセンスへと舵を切ります。

2024年4月のLlama 3では8B／70Bパラメータが投入され、同年7月にはLlama 3.1として4,050億（405B）パラメータの最上位モデルが公開されました。Llama 3.1 405Bはオープンウェイトとして当時最大級で、MMLU・GSM8Kなど主要ベンチマークで一部クローズドモデルに肉薄する水準に達しています。続くLlama 3.2では小型のオンデバイスモデルや視覚対応モデルが追加され、Llama 4世代では推論特化モデルも投入されるなど、公開のペースとモデルの幅は他社オープンモデルを大きく引き離す状況が続いています。

企業内運用での実用シーン

Llamaは「OpenAI APIに送れない」「特定ドメイン特化が必要」な企業ユースケースで主役を担っています。たとえば製造業のサポートマニュアルを社内Llamaに学習させ、現場端末から閉域ネットワーク経由で問い合わせる、金融機関で顧客データを外部に出さずにLlamaベースのRAG（後述）で社内検索を組む、病院がカルテに直接アクセスできる小型Llamaを院内サーバーで動かす、といった事例が増えてきています。

クラウド側でも、AWS Bedrock、Azure AI Studio、Google Vertex AIといった大手プラットフォームが、マネージドのLlama推論エンドポイントを提供しています。推論最適化を担うNVIDIA NIM、Groq、Together AI、Fireworks AIなども、Llama系を主力ラインアップに据えており、「クラウドAPIで使う場合もLlamaを選べる」状況が整いました。結果として、クローズドLLMでは表現しにくい言語（日本語ローカルLLMのELYZA-japanese-Llama-2など）も豊富に存在し、地域特化が進んでいます。

GPT-4・Mistralとの比較

GPT-4やGeminiといったクローズドモデルは、サービスとしての完成度、対話品質、マルチモーダル機能で先行しています。一方Llamaは、モデルの中身を覗ける／自社で改造できる／オンプレで動かせるという、クローズドモデルでは得られない自由度を提供します。セキュリティ要件で外部APIを叩けない現場ほど、Llamaが第一候補になりやすいのが現状です。

オープンウェイト界隈の競合としてはフランス発のMistralがあり、Mixtral 8x7Bなどでスパース型MoE構造を打ち出しました。両者の関係は「最大規模はLlamaが先行、軽量×効率の尖り方ではMistralが先行」と整理されることが多く、用途と社内インフラに応じて使い分ける構図ができています。クラウド／オンプレ／端末まで全部を同じ家系で揃えたい場合はLlama、軽量モデル中心ならMistralという棲み分けが2024年時点で定着しました。