筆記 · 開源模型 · 各國比較 · jdd-kami
2026 年 6 月 18 日快照。涵蓋中國、美國、法國、德國、日本、韓國、印度、歐盟。資料來源:BenchLM、Presenc AI、klymentiev.com、lilting.ch、NII、arXiv 等。模型發展很快,排名每週都在變動。
欄位說明:「規模」= 總參數量(如 1.6T = 1.6 兆參數);「Active」= 每次推理實際啟動的參數量(MoE 架構);「Context」= 最大上下文長度(如 1M = 100 萬 tokens)。資料截至 2026-06-18。
| 國家 | 實驗室 | 旗艦模型 | 規模 | Active | 授權 | 強項 | Context |
|---|---|---|---|---|---|---|---|
| 中國 | DeepSeek 深度求索 |
DeepSeek V4 Pro | 1.6T | 49B | MIT | 程式 SWE-Bench 83.7%、最低成本 | 1M |
| 中國 | Alibaba (Qwen) 阿里巴巴 |
Qwen 3.5 397B | 397B | 17B | Apache 2.0 | 全能型、多語言、多模態 | 256K |
| 中國 | Moonshot (Kimi) 月之暗面 |
Kimi K2.6 | ~1T | ~32B | MIT | 程式 HumanEval 99% | 200K |
| 中國 | Z.ai (Zhipu) 智譜 |
GLM-5.2 | 744B | 40B | 開源 | 知識 MMLU 96、BenchLM #1 | 128K |
| 中國 | Tencent (Hunyuan) 騰訊 |
Hunyuan 3.0 | 295–406B | MoE | 開源 | 多模態:文字、影片、3D 世界 | 128K |
| 中國 | Huawei (Pangu) 華為 |
Pangu Ultra MoE | 718B | — | 開源 | 唯一在中國硬體棧(昇騰)上從零訓練 | 128K |
| 中國 | ByteDance (Doubao) 字節跳動 |
Seed 2.0 | 多層級 | — | 專有 | 最低價 $0.022/M output | — |
| 中國 | Baidu (ERNIE) 百度 |
ERNIE 5.0 | — | — | 混合 | LMArena top-10、15 億日 API 呼叫 | — |
| 中國 | 01.AI (Yi) 零一萬物 |
Yi-Lightning | 混合 | — | 混合 | 先驅者、Yi-Coder 仍強 | — |
| 中國 | MiniMax 稀宇科技 |
abab 系列 | 多層級 | — | 專有 | 長語境多模態、港交所上市 | — |
| 美國 | Meta 臭鼬實驗室 |
Llama 4 Maverick | 400B | 17B | Llama Community | 生態系最大、1M 語境 | 1M |
| 美國 | Meta 臭鼬實驗室 |
Llama 4 Scout | 109B | 17B | Llama Community | 10M 超長語境(開源最長) | 10M |
| 美國 | Google 谷歌 |
Gemma 4 medium | ~27B | dense | Gemma | 單 GPU 推論、安全調校 | 256K |
| 美國 | OpenAI 開放AI |
GPT-oss 120B | 120B | dense | Apache 2.0 | OpenAI 格式、一鍵替換 | 128K |
| 法國 | Mistral AI 米斯特拉爾 |
Mistral Medium 3.5 | 675B | 41B | Apache 2.0 | EU 友善、GDPR 合規、企業支援 | 128K |
| 法國 | kyutai 非營利 |
Moshi / Helium | 小規模 | — | 開源 | 語音模型 Moshi | — |
| 法國 | Pleias 普雷亞斯 |
Pleias 1.0 | — | — | 公有領域 | 嚴格開放資料 | — |
| 德國 | Aleph Alpha 阿萊夫 |
Pharia-1 / Luminous | — | — | 專有導向 | 企業主權、可審計、在地部署 | — |
| 歐盟 | Silo AI (AMD) 芬蘭 |
Poro / Viking | — | — | 開源 | 多語言 EU、OpenEuroLLM 共同主持 | — |
| 歐盟 | OpenEuroLLM 20+ 組織 |
開發中 | — | — | 開源 | 涵蓋所有 EU 語言 | — |
| 日本 | NII 情報學研究所 |
LLM-jp-4-32B-A3B | 32B | 3.8B | Apache 2.0 | 從零訓練(11.7T tokens)、MT-Bench JA 7.82 | — |
| 日本 | NVIDIA (JP) 輝達日本 |
Nemotron Nano 9B JP | 9B | — | NVIDIA Open | 主權 AI、sub-10B 第一 | — |
| 日本 | 東工大 / AIST 東京工業大學 |
Swallow 30B-A3B | 30B | 3B | 開源 | 續訓 + RL、OCR 修正強 | — |
| 日本 | Preferred Networks PFN |
PLaMo 2.0 | 31B | — | 未公開 | 從零訓練 | — |
| 日本 | NEC 日本電氣 |
cotomi v3 | — | — | 未公開 | 從零訓練 | — |
| 日本 | Sakana AI 佐川AI |
Namazu | 多規模 | — | 依基底 | 後訓練在 DeepSeek 上 | — |
| 韓國 | Upstage 上堂 |
Solar Open | 102B | MoE | Solar-Apache-2.0 | 雙語(韓英) | 128K |
| 韓國 | Naver 納弗 |
HyperCLOVA X Seed 32B | 32B | — | 有限開源 | 下載量領先韓國 | — |
| 印度 | Sarvam AI 薩爾瓦姆 |
Sarvam 105B / 30B | 105B | MoE | 開源 | 印度最大開源模型、從零訓練、22+ 印度語言 | — |
| 排名 | 模型 | BenchLM 分數 | 強項 | 授權 |
|---|---|---|---|---|
| #1 | GLM-5.2 Z.ai(智譜) |
94 | 知識、推理、agentic | 開源 |
| #2 | Qwen 3.7-Max Alibaba(阿里巴巴) |
90 | 程式、全語境 | Apache 2.0 |
| #3 | Qwen 3.7-Plus Alibaba(阿里巴巴) |
88 | 平衡型 | 混合 |
| #4 | DeepSeek V4 Pro DeepSeek(深度求索) |
87 | 程式(最強開源)、低成本 | MIT |
| #5 | Kimi K2.6 Moonshot(月之暗面) |
~85 | 程式(HumanEval 99%) | MIT |
10 家實驗室在前沿或接近前沿,西方僅 3–4 家(Meta、Mistral、AI2)。DeepSeek 是唯一完全 MIT 的頂級模型。
Z.ai(1 月港交所)和 MiniMax 相繼 IPO,改變了資本結構與揭露節奏。
唯一在前沿模型 + 前沿訓練晶片(昇騰)上都自有的實驗室。硬體主權的角度獨特。
從零訓練(LLM-jp-4)vs 續訓(Swallow、Nemotron JP)vs 後訓練(Namazu)。三種路線代表不同的主權策略。
不是拼規模,是拼可審計、GDPR 合規、多語言覆蓋。Mistral 是錨點實驗室($13.7B 估值)。
Sarvam AI 是第一個從零訓練的 105B 級模型,聚焦 22+ 印度語言。
多數中國實驗室開放基礎層、關閉旗艦層。DeepSeek(全 MIT)是例外。開源模型在多數基準上已追平閉源前沿。
多數實驗室在過去 12 個月內發布了 4–7 次旗艦級更新。模型發展很快,排名每週都在變動。
DeepSeek、Alibaba (Qwen)、Moonshot (Kimi)、Z.ai (GLM)、Tencent (Hunyuan)、Huawei (Pangu)、ByteDance (Doubao)、Baidu (ERNIE)、01.AI (Yi)、MiniMax。前五大在 BenchLM 上的分數從 94 到 ~85,密集程度全球最高。
Meta(Llama 4 Maverick / Scout)——生態系最大、超長語境 10M。Google(Gemma 4)——單 GPU 推論。OpenAI(GPT-oss 120B)——OpenAI 格式相容。
Mistral AI($13.7B 估值、Apache 2.0、GDPR 合規)。Aleph Alpha(企業主權、可審計)。kyutai(非營利、語音)。Pleias(公有領域)。Silo AI(多語言 EU)。OpenEuroLLM 聯盟(20+ 組織、涵蓋所有 EU 語言)。
從零訓練:NII LLM-jp-4(11.7T tokens、Apache 2.0)、PLaMo 2.0、cotomi v3。續訓:Nemotron Nano 9B JP(NVIDIA)、Swallow 30B-A3B(東工大/AIST)。後訓練:Namazu(Sakana AI、在 DeepSeek 上)。
Upstage Solar Open(102B MoE、Solar-Apache-2.0、韓英雙語)。Naver HyperCLOVA X Seed 32B(下載量領先韓國)。
Sarvam AI(Sarvam 105B / 30B)——印度最大的開源模型,從零訓練,聚焦 22+ 印度語言。2026 年 3 月開源。