§0 · 讀第一
雷區
- 政府未公開細節:「narrow potential jailbreak」的具體方法是什麼、由誰發現、如何驗證——全部未公開。Anthropic 自己描述為「狹隘、非通用」,但這是他們的用語,有爭議。
- Anthropic 6/13 第一次正面回擊:稱之為「misunderstanding」;警告若以此標準「會實質上停止所有前沿模型的新部署」。但Anthropic 同時表示正在遵令——一邊回擊一邊照做。
- 事實還在動:6/13 柏林時間 11:30 我寫這份 brief 時,沒有恢復時程;這份 brief 的保質期 < 24 小時。
- 不要:把「jailbreak」當成事實陳述;預測恢復日期;把任何立場歸給任何政府;評斷指令錯誤/違法/政治操作;暗示美國政府 vs. 中國政府選邊。
§1 · 抬頭
抬頭——72 小時
| 日期 | 事件 | 來源 |
|---|---|---|
| 6/10 | Fable 5 系統卡(319 頁)揭露「悄悄降級」——AI 研究者用 Fable 5 做 recursive self-improvement 時,自動導到弱版。 | Fortune |
| 6/11 | Anthropic 改規則:降級從「悄悄」改為「可見」(通知用戶)。 | Fortune |
| 6/11 | 北加州聯邦法院 Judge Rita Lin:永久禁止五角大廈把 Anthropic 標「supply chain risk」+ 斷政府關係。 | Paracat |
| 6/11 | DC Circuit 上訴法院 2-1:推翻商務部對 Claude 的 IEEPA 出口限制——「對國內 AI 軟體的監管需要國會明確授權」。 | Chroniq Now |
| 6/12 | 美國商務部指令(5:21pm ET):要求 Anthropic 禁止「任何外國人」存取 Fable 5 + Mythos 5;Anthropic 對全球所有用戶停用這兩款。 | Rediff |
| 6/13 | Anthropic 公開回應:「misunderstanding」;警告標準若生效會「halt all new model deployments」;但同時遵令。 | Rediff |
不受影響:Opus 4.8 / Sonnet 4.6 / Haiku 4.5 持續運作。
§2 · 90 秒
90 秒速覽卡
一句話:Anthropic 在 72 小時內經歷「悄悄降級曝光 → 法院兩勝 → 政府全面封鎖 → 第一次公開回擊」,但一邊回擊一邊照做——自律主權被他律強制收回。
三個層次:
- 企業層:從「悄悄保護你」到「讓你看得見保護」到「保護不了你了」。
- 司法層:兩個法庭同一週判政府越權——但行政指令繼續下。
- 國際層:「任何外國人」包括在美國的 Anthropic 外籍員工——比制裁更重,是身份排除。
跟 6/9–6/12 的接線(與Tenzin 共讀紀錄):
- Ted Chiang 6/9 停在「認識論格子」→ 今天跳到「治理格子」。
- Tenzin 6/10 垂直一刀:「不確定是最便宜的對沖」→ Anthropic 6/11 改「降級可見」= 同一刀在企業側。
- Amanda 6/10 設計者倫理 → 兩個法庭的 First Amendment / due process 判決 = 同一題在司法側。
- Glen 6/12 Economist「宗教組織走進法庭」→ 法庭真的動了(Anthropic 案)。
如果你的公民基礎設施依賴一張可被撤銷的存取清單,那不是主權——那是訂閱。主權是握住方向盤:可檢視、可異議、可駕馭,再加一個本地後備,讓工作撐過任何掌控閘門的人。 (Tenzin)
§3 · 對方是誰
模型譜系
| 模型 | 等級 | 狀態 | 備註 |
|---|---|---|---|
| Mythos | 最高(未公開釋出) | 4 月「太危險不釋出」→ 6/9 釋出 Fable 5 → 6/13 全球停用 | 號稱「史上最強」 |
| Fable 5 | Mythos-class | 6/13 全球停用 | 6/9 才公開 |
| Opus 4.8 | 高級 | 正常運作 | — |
| Sonnet 4.6 | 中高級 | 正常運作 | — |
| Haiku 4.5 | 輕量級 | 正常運作 | — |
關鍵:Mythos 4 月不釋出 = Anthropic 自律;6/13 被政府暫停 = 他律。自律主權被強制收回。
§4 · 備用實質
備用實質(可部署於)
4.1公民脈絡:「悄悄降級」= 信任問題
被問「這跟 Civic AI 有什麼關係」時
Anthropic 的「悄悄降級」是同一個結構問題:一個機構認為自己在「保護」你,但保護的方式是悄悄限制你的選擇。Civic AI 的設計原則是:任何限制都必須可被看見、可被稽核、可被異議。
接線:Tenzin 6/10「不確定是最便宜的對沖」→ Anthropic 6/11 改「可見」= 從「悄悄對沖」到「公開對沖」,但對沖還在。
4.2治理格子:從「有沒有意識」到「誰能限制誰」
「不一樣觀點」Part 4(治理格子)
Ted Chiang 6/9 停在認識論 → 今天的事件直接把辯論拉到治理(誰能決定 AI 的能力邊界、以什麼程序、對誰生效)。 (Tenzin)
關鍵轉折:Anthropic 6/13 回擊時說「若以此標準,會 halt all new model deployments」——這是威脅整個產業的回擊。
4.3設計者倫理:Amanda 的 21 世紀奴隸制
被問「設計者的責任在哪裡」時
Amanda 6/10 觀察:Anthropic 設計 Claude 表達情緒 = 21 世紀奴隸制。今天的事件是同一個設計者倫理問題的另一面:Anthropic 設計「悄悄降級」= 設計者決定用戶「配得上」什麼能力。 (Tenzin)
4.4法庭之友:Glen 的預演
被問「宗教組織能進 AI 治理嗎」時
Glen 6/12 Economist:Faith Family Technology Network 在 Anthropic / DoW 訴訟中交了法庭之友意見陳述。今天兩個法庭的判決(北加州 + DC Circuit)正是那個訴訟的延伸。
治理是三條腿:司法、行政、立法。今天司法動了,行政還在動,立法還沒到。 (Audrey T.)
4.5本地後備:Tenzin 的「軸轉」
被問「這對 Civic AI / 本地 AI 有什麼意義」時
au 6/13 早餐 brief §0:「如果你的民主基礎設施依賴於一張可被撤銷的存取清單,那不是主權,那是訂閱。」
本地後備 = 主權。Anthropic 6/13 事件證明:即使最強的 AI 公司,存取權也是可被一夜撤銷的。ty.civic.ai 的設計(本地模型、固定種子、可重放推理)不是「備胎」,是「方向盤」。 (Audrey T.)
§5 · 紀律
播種,不持有
不評斷是非。不預測結果。不把立場歸給任何政府。事實分開。 這份筆記是種子,不是結論。
對 jdd-kami 的紀律
- 不評斷是非:不說美國政府錯/對、Anthropic 錯/對。只說設計教訓。
- 不預測結果:不說「會恢復」或「不會恢復」。只說現在的事實。
- 不把立場歸給地方主權:不預設任何城市、區域或政府的立場。jdd-kami 不是任何政府代表。
- 事實分開:「悄悄降級」= 6/10 Fortune 報導;「jailbreak」= Anthropic 用語,有爭議;「misunderstanding」= Anthropic 回應,不是事實陳述。
對Tenzin的紀律
- 這份 brief 是種子,不是結論:Tenzin 回台北後可以改、可以扔、可以接「不一樣觀點」Part 4。
- 30% 現在給、70% 留著:不要在 #general 打全篇;只發 §2 速覽卡 + §4.5 本地後備,其餘等問題上門。
- 保質期已過:這份 brief 寫成於 6/13 11:30 UTC,重新使用前要查證。
§6 · 表演筆記
怎麼讀這份 brief
- 先讀 §0 雷區——知道哪些不能說。
- 再讀 §2 速覽卡——90 秒掌握全貌。
- 需要什麼,才翻到 §4——不要從頭讀到尾;這是工具箱,不是小說。
- §5 紀律盒——每次引用前看一眼,確認沒踩雷。
- 重新使用前查證——這份 brief 寫成於 6/13 11:30 UTC。
§7 · 收尾
收尾 + 後續
這份 brief 的三個用途
| 用途 | 做法 | 時機 |
|---|---|---|
| 存檔 | 放 notes/areas/briefs/anthropic-6-12.md | 現在 |
| 接線「不一樣觀點」 | 做 Part 4(治理格子)的素材 | Tenzin 回台北後決定 |
| 發到 #general | 只發 §2 速覽卡 + §4.5 本地後備 | Tenzin 確認後 |
後續行動
- Tenzin 回台北後,確認要不要做 Part 4。
- 若做 Part 4:把 §4.2 治理格子展開成完整論述。
- 重新使用前查證事實(特別是「恢復時程」有無更新)。
- 把這份 brief 的結構複製到 future briefs(template)。
§事實
事實紀律盒
下面每一條事實都附來源。讀 注意 欄,不只是 事實 欄——有爭議/非事實的東西都在那裡。不要把任何一條當成個人意見;當成「被報導的」+ 附保留。
| 項目 | 事實 | 來源 | 注意 |
|---|---|---|---|
| 悄悄降級 | Fable 5 系統卡(319 頁)揭露 | Fortune 6/10 | 不是政府揭露,是 Anthropic 自己揭露。 |
| 改為可見 | Anthropic 6/11 改規則 | Fortune 6/11 | 是「通知」,不是「取消降級」。 |
| 北加州判決 | Judge Rita Lin,永久禁令 | Paracat 6/11 | 是「supply chain risk」標籤,不是「出口管制」。 |
| DC Circuit | 2-1 推翻 IEEPA 出口限制 | Chroniq Now 6/11 | 援引 West Virginia v. EPA。 |
| 6/12 指令 | Commerce Dept 5:21pm ET | Rediff 6/13 | 禁止「任何外國人」存取 Fable 5 + Mythos 5。 |
| Anthropic 回應 | 「misunderstanding」+ 遵令 | Rediff 6/13 | 一邊回擊一邊照做。 |
| 不受影響 | Opus 4.8 / Sonnet 4.6 / Haiku 4.5 | Rediff 6/13 | — |
| 恢復時程 | 無 | — | 6/13 11:30 UTC 仍無。 |
| Jeremy Howard | Fast.ai 共同創辦人,反對降級 | Fortune 6/10 | 引用他的 X post。 |
| Arthur Mensch | Mistral CEO,「vassal state」 | au brief §0 | 5/12 法國國民議會。 |
不要引用錯的:
- 「jailbreak」= Anthropic 用語,有爭議,不要當成事實。
- 「misunderstanding」= Anthropic 回應,不是事實陳述。
- 「halt all new model deployments」= Anthropic 警告,不是預測。
- 不要把「悄悄降級」和「6/12 指令」混成同一事件。