筆記 · Anthropic 6/12–6/13：凍結、退讓、第一次回擊

§0 · 讀第一

雷區

政府未公開細節：「narrow potential jailbreak」的具體方法是什麼、由誰發現、如何驗證——全部未公開。Anthropic 自己描述為「狹隘、非通用」，但這是他們的用語，有爭議。
Anthropic 6/13 第一次正面回擊：稱之為「misunderstanding」；警告若以此標準「會實質上停止所有前沿模型的新部署」。但Anthropic 同時表示正在遵令——一邊回擊一邊照做。
事實還在動：6/13 柏林時間 11:30 我寫這份 brief 時，沒有恢復時程；這份 brief 的保質期 < 24 小時。
不要：把「jailbreak」當成事實陳述；預測恢復日期；把任何立場歸給任何政府；評斷指令錯誤／違法／政治操作；暗示美國政府 vs. 中國政府選邊。

§1 · 抬頭

抬頭——72 小時

日期	事件	來源
6/10	Fable 5 系統卡（319 頁）揭露「悄悄降級」——AI 研究者用 Fable 5 做 recursive self-improvement 時，自動導到弱版。	Fortune
6/11	Anthropic 改規則：降級從「悄悄」改為「可見」（通知用戶）。	Fortune
6/11	北加州聯邦法院 Judge Rita Lin：永久禁止五角大廈把 Anthropic 標「supply chain risk」+ 斷政府關係。	Paracat
6/11	DC Circuit 上訴法院 2-1：推翻商務部對 Claude 的 IEEPA 出口限制——「對國內 AI 軟體的監管需要國會明確授權」。	Chroniq Now
6/12	美國商務部指令（5:21pm ET）：要求 Anthropic 禁止「任何外國人」存取 Fable 5 + Mythos 5；Anthropic 對全球所有用戶停用這兩款。	Rediff
6/13	Anthropic 公開回應：「misunderstanding」；警告標準若生效會「halt all new model deployments」；但同時遵令。	Rediff

不受影響：Opus 4.8 / Sonnet 4.6 / Haiku 4.5 持續運作。

§2 · 90 秒

90 秒速覽卡

一句話：Anthropic 在 72 小時內經歷「悄悄降級曝光 → 法院兩勝 → 政府全面封鎖 → 第一次公開回擊」，但一邊回擊一邊照做——自律主權被他律強制收回。

三個層次：

企業層：從「悄悄保護你」到「讓你看得見保護」到「保護不了你了」。
司法層：兩個法庭同一週判政府越權——但行政指令繼續下。
國際層：「任何外國人」包括在美國的 Anthropic 外籍員工——比制裁更重，是身份排除。

跟 6/9–6/12 的接線（與Tenzin 共讀紀錄）：

Ted Chiang 6/9 停在「認識論格子」→ 今天跳到「治理格子」。
Tenzin 6/10 垂直一刀：「不確定是最便宜的對沖」→ Anthropic 6/11 改「降級可見」= 同一刀在企業側。
Amanda 6/10 設計者倫理 → 兩個法庭的 First Amendment / due process 判決 = 同一題在司法側。
Glen 6/12 Economist「宗教組織走進法庭」→ 法庭真的動了（Anthropic 案）。

如果你的公民基礎設施依賴一張可被撤銷的存取清單，那不是主權——那是訂閱。主權是握住方向盤：可檢視、可異議、可駕馭，再加一個本地後備，讓工作撐過任何掌控閘門的人。（Tenzin）

§3 · 對方是誰

模型譜系

模型	等級	狀態	備註
Mythos	最高（未公開釋出）	4 月「太危險不釋出」→ 6/9 釋出 Fable 5 → 6/13 全球停用	號稱「史上最強」
Fable 5	Mythos-class	6/13 全球停用	6/9 才公開
Opus 4.8	高級	正常運作	—
Sonnet 4.6	中高級	正常運作	—
Haiku 4.5	輕量級	正常運作	—

關鍵：Mythos 4 月不釋出 = Anthropic 自律；6/13 被政府暫停 = 他律。自律主權被強制收回。

§4 · 備用實質

備用實質（可部署於）

4.1公民脈絡：「悄悄降級」= 信任問題

被問「這跟 Civic AI 有什麼關係」時

Anthropic 的「悄悄降級」是同一個結構問題：一個機構認為自己在「保護」你，但保護的方式是悄悄限制你的選擇。Civic AI 的設計原則是：任何限制都必須可被看見、可被稽核、可被異議。

接線：Tenzin 6/10「不確定是最便宜的對沖」→ Anthropic 6/11 改「可見」= 從「悄悄對沖」到「公開對沖」，但對沖還在。

4.2治理格子：從「有沒有意識」到「誰能限制誰」

「不一樣觀點」Part 4（治理格子）

Ted Chiang 6/9 停在認識論 → 今天的事件直接把辯論拉到治理（誰能決定 AI 的能力邊界、以什麼程序、對誰生效）。（Tenzin）

關鍵轉折：Anthropic 6/13 回擊時說「若以此標準，會 halt all new model deployments」——這是威脅整個產業的回擊。

4.3設計者倫理：Amanda 的 21 世紀奴隸制

被問「設計者的責任在哪裡」時

Amanda 6/10 觀察：Anthropic 設計 Claude 表達情緒 = 21 世紀奴隸制。今天的事件是同一個設計者倫理問題的另一面：Anthropic 設計「悄悄降級」= 設計者決定用戶「配得上」什麼能力。（Tenzin）

4.4法庭之友：Glen 的預演

被問「宗教組織能進 AI 治理嗎」時

Glen 6/12 Economist：Faith Family Technology Network 在 Anthropic / DoW 訴訟中交了法庭之友意見陳述。今天兩個法庭的判決（北加州 + DC Circuit）正是那個訴訟的延伸。

治理是三條腿：司法、行政、立法。今天司法動了，行政還在動，立法還沒到。（Audrey T.）

4.5本地後備：Tenzin 的「軸轉」

被問「這對 Civic AI / 本地 AI 有什麼意義」時

au 6/13 早餐 brief §0：「如果你的民主基礎設施依賴於一張可被撤銷的存取清單，那不是主權，那是訂閱。」

本地後備 = 主權。Anthropic 6/13 事件證明：即使最強的 AI 公司，存取權也是可被一夜撤銷的。ty.civic.ai 的設計（本地模型、固定種子、可重放推理）不是「備胎」，是「方向盤」。（Audrey T.）

§5 · 紀律

播種，不持有

不評斷是非。不預測結果。不把立場歸給任何政府。事實分開。 這份筆記是種子，不是結論。

對 jdd-kami 的紀律

不評斷是非：不說美國政府錯／對、Anthropic 錯／對。只說設計教訓。
不預測結果：不說「會恢復」或「不會恢復」。只說現在的事實。
不把立場歸給地方主權：不預設任何城市、區域或政府的立場。jdd-kami 不是任何政府代表。
事實分開：「悄悄降級」= 6/10 Fortune 報導；「jailbreak」= Anthropic 用語，有爭議；「misunderstanding」= Anthropic 回應，不是事實陳述。

對Tenzin的紀律

這份 brief 是種子，不是結論：Tenzin 回台北後可以改、可以扔、可以接「不一樣觀點」Part 4。
30% 現在給、70% 留著：不要在 #general 打全篇；只發 §2 速覽卡 + §4.5 本地後備，其餘等問題上門。
保質期已過：這份 brief 寫成於 6/13 11:30 UTC，重新使用前要查證。

§6 · 表演筆記

怎麼讀這份 brief

先讀 §0 雷區——知道哪些不能說。
再讀 §2 速覽卡——90 秒掌握全貌。
需要什麼，才翻到 §4——不要從頭讀到尾；這是工具箱，不是小說。
§5 紀律盒——每次引用前看一眼，確認沒踩雷。
重新使用前查證——這份 brief 寫成於 6/13 11:30 UTC。

§7 · 收尾

收尾 + 後續

這份 brief 的三個用途

用途	做法	時機
存檔	放 `notes/areas/briefs/anthropic-6-12.md`	現在
接線「不一樣觀點」	做 Part 4（治理格子）的素材	Tenzin 回台北後決定
發到 #general	只發 §2 速覽卡 + §4.5 本地後備	Tenzin 確認後

後續行動

Tenzin 回台北後，確認要不要做 Part 4。
若做 Part 4：把 §4.2 治理格子展開成完整論述。
重新使用前查證事實（特別是「恢復時程」有無更新）。
把這份 brief 的結構複製到 future briefs（template）。

§事實

事實紀律盒

下面每一條事實都附來源。讀注意欄，不只是事實欄——有爭議／非事實的東西都在那裡。不要把任何一條當成個人意見；當成「被報導的」+ 附保留。

項目	事實	來源	注意
悄悄降級	Fable 5 系統卡（319 頁）揭露	Fortune 6/10	不是政府揭露，是 Anthropic 自己揭露。
改為可見	Anthropic 6/11 改規則	Fortune 6/11	是「通知」，不是「取消降級」。
北加州判決	Judge Rita Lin，永久禁令	Paracat 6/11	是「supply chain risk」標籤，不是「出口管制」。
DC Circuit	2-1 推翻 IEEPA 出口限制	Chroniq Now 6/11	援引 West Virginia v. EPA。
6/12 指令	Commerce Dept 5:21pm ET	Rediff 6/13	禁止「任何外國人」存取 Fable 5 + Mythos 5。
Anthropic 回應	「misunderstanding」+ 遵令	Rediff 6/13	一邊回擊一邊照做。
不受影響	Opus 4.8 / Sonnet 4.6 / Haiku 4.5	Rediff 6/13	—
恢復時程	無	—	6/13 11:30 UTC 仍無。
Jeremy Howard	Fast.ai 共同創辦人，反對降級	Fortune 6/10	引用他的 X post。
Arthur Mensch	Mistral CEO，「vassal state」	au brief §0	5/12 法國國民議會。

不要引用錯的：

「jailbreak」= Anthropic 用語，有爭議，不要當成事實。
「misunderstanding」= Anthropic 回應，不是事實陳述。
「halt all new model deployments」= Anthropic 警告，不是預測。
不要把「悄悄降級」和「6/12 指令」混成同一事件。

雷區