AI 巨頭的超級應用與本地模型大爆發：Apple Siri 重建、ChatGPT 改版與 Nemotron 3 Ultra 登陸 Ollama

2026-06-09 frank

AI 巨頭的超級應用與本地模型大爆發：Apple Siri 重建、ChatGPT 改版與 Nemotron 3 Ultra 登陸 Ollama

在過去的 24 小時內，AI 產業迎來了多項重大變革。從 Apple 在 WWDC 2026 宣佈全面重建 Siri AI，到 OpenAI 準備將 ChatGPT 轉型為超級應用，再到 NVIDIA 與 Google 推出強大的本地與開源模型，AI 的發展正從單純的對話機器人，迅速擴展至能夠執行複雜任務的代理人（Agent）與本地端智慧運算。

Apple WWDC 2026：Siri AI 全面重建與 Apple Intelligence

Apple 在 WWDC 2026 上正式揭曉了備受期待的 AI 佈局，其中最引人注目的便是全新重建的 Siri AI [1]。新版 Siri 深度整合了 Apple Intelligence，具備了前所未有的螢幕內容理解能力，能夠跨越不同的應用程式執行系統級操作。

這項更新將隨 iOS 27、iPadOS 27、macOS 27 等新一代作業系統一同推出。使用者現在可以要求 Siri 根據螢幕上的資訊執行任務，例如將訊息中的地址直接加入行事曆，或是跨裝置同步對話記錄。此外，Image Playground 也新增了寫實風格的圖片生成功能。然而，值得注意的是，歐盟地區的 iOS 與 iPadOS 用戶在初期將無法使用這些新的 Siri AI 功能，且部分依賴伺服器運算的圖片生成功能將設有每日使用上限。

OpenAI 的超級應用野心：「Chat Is Dead」

在 Apple 宣佈整合 AI 的同時，OpenAI 也正準備對其旗艦產品 ChatGPT 進行史上最大規模的改版 [2]。根據內部消息指出，OpenAI 的高層甚至直言「Chat is dead」，這意味著他們將重心從單純的對話機器人，轉向能夠執行複雜任務的「超級應用（Superapp）」。

這次改版將整合 Codex 編碼工具、AI 代理人、旅遊預訂與日程管理等多項功能。這項策略轉變主要著眼於企業市場的龐大潛力。數據顯示，Codex 的週活躍用戶自 2 月以來已成長 6 倍，達到 500 萬人，而企業客戶目前佔 OpenAI 總收入的 40%，公司目標在年底前將此比例提升至 50%。與此同時，OpenAI 也已向美國證券交易委員會（SEC）秘密提交了 S-1 上市申請，為未來的 IPO 鋪路。

本地與開源模型的新里程碑：NVIDIA 與 Google 的最新力作

在開源與本地模型領域，NVIDIA 與 Google 也分別推出了重量級的新模型，進一步推動了本地 AI 運算的發展。

NVIDIA Nemotron 3 Ultra 550B 登陸 Ollama

NVIDIA 發佈了專為高吞吐量推理和長時間代理人工作流設計的 Nemotron 3 Ultra 模型 [3]。這款模型擁有高達 550B 的總參數（激活參數為 55B），目前已正式上架 Ollama 模型庫。

模型名稱	總參數	激活參數	特色與應用場景
Nemotron 3 Ultra	550B	55B	高吞吐量推理、長時間代理人工作流
Nemotron 3 Super	120B	MoE	高效能混合專家模型
Nemotron 3 Nano	30B	3B	適合資源受限環境的輕量級模型

透過 MTP（Multi-Token Prediction）技術的支援，Nemotron 3 Ultra 的生成速度從原本的 10 tok/s 大幅提升至 15-30 tok/s。雖然這款模型需要如 DGX Spark 等高端硬體才能在本地執行，但開發者可以透過 OpenCode 免費使用其雲端版本。

Google Gemma 4 12B：本地多模態模型新標竿

Google 則推出了 Gemma 4 12B，這是一款支援文字、圖片、音訊與影片多模態理解的開源模型 [4]。Gemma 4 12B 採用了全新的編碼方案與 token 預測技術，使其效能足以媲美 26B 級別的模型。

最令人振奮的是，這款模型可以在配備 16GB RAM 的標準筆記型電腦上完全本地執行，為開發者提供了極大的便利性與隱私保障。目前，Gemma 4 系列模型已在 Ollama 上架，並迅速累積了超過 1260 萬次的下載量。

本週 Ollama 與 OpenRouter 新上架模型總覽

除了 NVIDIA 與 Google 的新模型外，本週 Ollama 與 OpenRouter 也迎來了多款重要模型的更新與上架，顯示出 AI 模型生態系的蓬勃發展。

LFM2.5-8B-A1B (Liquid AI)：專為邊緣設備設計的 MoE 模型，8.3B 參數中僅激活 1.5B，但在工具呼叫的可靠性上卻能媲美體積大三倍的模型。
Mistral Medium 3.5：Mistral 推出的首款融合指令跟隨、推理與多模態能力的旗艦模型。
IBM Granite 4.1：專為企業打造的多語言模型，特別強化了工具呼叫的能力。
GLM-5.1 (智譜 AI)：下一代旗艦代理人工程模型，在程式碼編寫能力上有顯著提升。
Kimi K2.6 (Moonshot AI)：開源的原生多模態代理人模型，特別適合處理長視野（Long-horizon）任務。

此外，Microsoft 在 Build 2026 大會上正式發佈了 GitHub Copilot SDK，讓開發者能夠自訂 Copilot 的工作流程，並將其代理人功能擴展至程式碼編寫以外的生產力任務 [5]。

參考資料

[1] Apple Newsroom. (2026, June 8). Apple unveils next generation of Apple Intelligence, Siri AI, and more.
[2] Entrepreneur. (2026, June 8). OpenAI Plans Biggest ChatGPT Overhaul Ever: ‘Chat Is Dead’.
[3] Reddit LocalLLaMA. (2026, June 4). nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16.
[4] Google Blog. (2026, June 3). Introducing Gemma 4 12B.
[5] kingy.ai. (2026, June 8). AI Launch Radar: June 8, 2026.