筆記 · 各國開源模型比較 · 2026-06-18

中國美國法國德國日本韓國印度歐盟

01總覽：全部模型

欄位說明：「規模」= 總參數量（如 1.6T = 1.6 兆參數）；「Active」= 每次推理實際啟動的參數量（MoE 架構）；「Context」= 最大上下文長度（如 1M = 100 萬 tokens）。資料截至 2026-06-18。

國家	實驗室	旗艦模型	規模	Active	授權	強項	Context
中國	DeepSeek 深度求索	DeepSeek V4 Pro	1.6T	49B	MIT	程式 SWE-Bench 83.7%、最低成本	1M
中國	Alibaba (Qwen) 阿里巴巴	Qwen 3.5 397B	397B	17B	Apache 2.0	全能型、多語言、多模態	256K
中國	Moonshot (Kimi) 月之暗面	Kimi K2.6	~1T	~32B	MIT	程式 HumanEval 99%	200K
中國	Z.ai (Zhipu) 智譜	GLM-5.2	744B	40B	開源	知識 MMLU 96、BenchLM #1	128K
中國	Tencent (Hunyuan) 騰訊	Hunyuan 3.0	295–406B	MoE	開源	多模態：文字、影片、3D 世界	128K
中國	Huawei (Pangu) 華為	Pangu Ultra MoE	718B	—	開源	唯一在中國硬體棧（昇騰）上從零訓練	128K
中國	ByteDance (Doubao) 字節跳動	Seed 2.0	多層級	—	專有	最低價 $0.022/M output	—
中國	Baidu (ERNIE) 百度	ERNIE 5.0	—	—	混合	LMArena top-10、15 億日 API 呼叫	—
中國	01.AI (Yi) 零一萬物	Yi-Lightning	混合	—	混合	先驅者、Yi-Coder 仍強	—
中國	MiniMax 稀宇科技	abab 系列	多層級	—	專有	長語境多模態、港交所上市	—
美國	Meta 臭鼬實驗室	Llama 4 Maverick	400B	17B	Llama Community	生態系最大、1M 語境	1M
美國	Meta 臭鼬實驗室	Llama 4 Scout	109B	17B	Llama Community	10M 超長語境（開源最長）	10M
美國	Google 谷歌	Gemma 4 medium	~27B	dense	Gemma	單 GPU 推論、安全調校	256K
美國	OpenAI 開放AI	GPT-oss 120B	120B	dense	Apache 2.0	OpenAI 格式、一鍵替換	128K
法國	Mistral AI 米斯特拉爾	Mistral Medium 3.5	675B	41B	Apache 2.0	EU 友善、GDPR 合規、企業支援	128K
法國	kyutai 非營利	Moshi / Helium	小規模	—	開源	語音模型 Moshi	—
法國	Pleias 普雷亞斯	Pleias 1.0	—	—	公有領域	嚴格開放資料	—
德國	Aleph Alpha 阿萊夫	Pharia-1 / Luminous	—	—	專有導向	企業主權、可審計、在地部署	—
歐盟	Silo AI (AMD) 芬蘭	Poro / Viking	—	—	開源	多語言 EU、OpenEuroLLM 共同主持	—
歐盟	OpenEuroLLM 20+ 組織	開發中	—	—	開源	涵蓋所有 EU 語言	—
日本	NII 情報學研究所	LLM-jp-4-32B-A3B	32B	3.8B	Apache 2.0	從零訓練（11.7T tokens）、MT-Bench JA 7.82	—
日本	NVIDIA (JP) 輝達日本	Nemotron Nano 9B JP	9B	—	NVIDIA Open	主權 AI、sub-10B 第一	—
日本	東工大 / AIST 東京工業大學	Swallow 30B-A3B	30B	3B	開源	續訓 + RL、OCR 修正強	—
日本	Preferred Networks PFN	PLaMo 2.0	31B	—	未公開	從零訓練	—
日本	NEC 日本電氣	cotomi v3	—	—	未公開	從零訓練	—
日本	Sakana AI 佐川AI	Namazu	多規模	—	依基底	後訓練在 DeepSeek 上	—
韓國	Upstage 上堂	Solar Open	102B	MoE	Solar-Apache-2.0	雙語（韓英）	128K
韓國	Naver 納弗	HyperCLOVA X Seed 32B	32B	—	有限開源	下載量領先韓國	—
印度	Sarvam AI 薩爾瓦姆	Sarvam 105B / 30B	105B	MoE	開源	印度最大開源模型、從零訓練、22+ 印度語言	—

02中國前五大開源模型（BenchLM 排名）

排名	模型	BenchLM 分數	強項	授權
#1	GLM-5.2 Z.ai（智譜）	94	知識、推理、agentic	開源
#2	Qwen 3.7-Max Alibaba（阿里巴巴）	90	程式、全語境	Apache 2.0
#3	Qwen 3.7-Plus Alibaba（阿里巴巴）	88	平衡型	混合
#4	DeepSeek V4 Pro DeepSeek（深度求索）	87	程式（最強開源）、低成本	MIT
#5	Kimi K2.6 Moonshot（月之暗面）	~85	程式（HumanEval 99%）	MIT

03觀察重點

🌐

中國開源生態最密集

10 家實驗室在前沿或接近前沿，西方僅 3–4 家（Meta、Mistral、AI2）。DeepSeek 是唯一完全 MIT 的頂級模型。

📈

2026 是中國 AI 上市年

Z.ai（1 月港交所）和 MiniMax 相繼 IPO，改變了資本結構與揭露節奏。

🔧

華為唯一軟硬體一體

唯一在前沿模型 + 前沿訓練晶片（昇騰）上都自有的實驗室。硬體主權的角度獨特。

🇯🇵

日本三條路線並存

從零訓練（LLM-jp-4）vs 續訓（Swallow、Nemotron JP）vs 後訓練（Namazu）。三種路線代表不同的主權策略。

🇪🇺

歐盟走主權 + 合規路線

不是拼規模，是拼可審計、GDPR 合規、多語言覆蓋。Mistral 是錨點實驗室（$13.7B 估值）。

🇮🇳

印度剛起步

Sarvam AI 是第一個從零訓練的 105B 級模型，聚焦 22+ 印度語言。

⚖️

開源 vs 專有的收斂

多數中國實驗室開放基礎層、關閉旗艦層。DeepSeek（全 MIT）是例外。開源模型在多數基準上已追平閉源前沿。

⚡

發布節奏是季度或更快

多數實驗室在過去 12 個月內發布了 4–7 次旗艦級更新。模型發展很快，排名每週都在變動。

04按國家分布

中國 10 家實驗室

DeepSeek、Alibaba (Qwen)、Moonshot (Kimi)、Z.ai (GLM)、Tencent (Hunyuan)、Huawei (Pangu)、ByteDance (Doubao)、Baidu (ERNIE)、01.AI (Yi)、MiniMax。前五大在 BenchLM 上的分數從 94 到 ~85，密集程度全球最高。

美國 3 家主力

Meta（Llama 4 Maverick / Scout）——生態系最大、超長語境 10M。Google（Gemma 4）——單 GPU 推論。OpenAI（GPT-oss 120B）——OpenAI 格式相容。

法國 + 德國 + 歐盟

Mistral AI（$13.7B 估值、Apache 2.0、GDPR 合規）。Aleph Alpha（企業主權、可審計）。kyutai（非營利、語音）。Pleias（公有領域）。Silo AI（多語言 EU）。OpenEuroLLM 聯盟（20+ 組織、涵蓋所有 EU 語言）。

日本三種訓練路線

從零訓練：NII LLM-jp-4（11.7T tokens、Apache 2.0）、PLaMo 2.0、cotomi v3。續訓：Nemotron Nano 9B JP（NVIDIA）、Swallow 30B-A3B（東工大/AIST）。後訓練：Namazu（Sakana AI、在 DeepSeek 上）。

韓國雙雄

Upstage Solar Open（102B MoE、Solar-Apache-2.0、韓英雙語）。Naver HyperCLOVA X Seed 32B（下載量領先韓國）。

印度新進

Sarvam AI（Sarvam 105B / 30B）——印度最大的開源模型，從零訓練，聚焦 22+ 印度語言。2026 年 3 月開源。

各國開源模型比較表