AI你我的未來

AI 巨頭的超級應用與本地模型大爆發:Apple Siri 重建、ChatGPT 改版與 Nemotron 3 Ultra 登陸 Ollama

AI 巨頭的超級應用與本地模型大爆發:Apple Siri 重建、ChatGPT 改版與 Nemotron 3 Ultra 登陸 Ollama

在過去的 24 小時內,AI 產業迎來了多項重大變革。從 Apple 在 WWDC 2026 宣佈全面重建 Siri AI,到 OpenAI 準備將 ChatGPT 轉型為超級應用,再到 NVIDIA 與 Google 推出強大的本地與開源模型,AI 的發展正從單純的對話機器人,迅速擴展至能夠執行複雜任務的代理人(Agent)與本地端智慧運算。

AI 巨頭的超級應用與本地模型大爆發

Apple WWDC 2026:Siri AI 全面重建與 Apple Intelligence

Apple 在 WWDC 2026 上正式揭曉了備受期待的 AI 佈局,其中最引人注目的便是全新重建的 Siri AI [1]。新版 Siri 深度整合了 Apple Intelligence,具備了前所未有的螢幕內容理解能力,能夠跨越不同的應用程式執行系統級操作。

這項更新將隨 iOS 27、iPadOS 27、macOS 27 等新一代作業系統一同推出。使用者現在可以要求 Siri 根據螢幕上的資訊執行任務,例如將訊息中的地址直接加入行事曆,或是跨裝置同步對話記錄。此外,Image Playground 也新增了寫實風格的圖片生成功能。然而,值得注意的是,歐盟地區的 iOS 與 iPadOS 用戶在初期將無法使用這些新的 Siri AI 功能,且部分依賴伺服器運算的圖片生成功能將設有每日使用上限。

OpenAI 的超級應用野心:「Chat Is Dead」

在 Apple 宣佈整合 AI 的同時,OpenAI 也正準備對其旗艦產品 ChatGPT 進行史上最大規模的改版 [2]。根據內部消息指出,OpenAI 的高層甚至直言「Chat is dead」,這意味著他們將重心從單純的對話機器人,轉向能夠執行複雜任務的「超級應用(Superapp)」。

這次改版將整合 Codex 編碼工具、AI 代理人、旅遊預訂與日程管理等多項功能。這項策略轉變主要著眼於企業市場的龐大潛力。數據顯示,Codex 的週活躍用戶自 2 月以來已成長 6 倍,達到 500 萬人,而企業客戶目前佔 OpenAI 總收入的 40%,公司目標在年底前將此比例提升至 50%。與此同時,OpenAI 也已向美國證券交易委員會(SEC)秘密提交了 S-1 上市申請,為未來的 IPO 鋪路。

本地與開源模型的新里程碑:NVIDIA 與 Google 的最新力作

在開源與本地模型領域,NVIDIA 與 Google 也分別推出了重量級的新模型,進一步推動了本地 AI 運算的發展。

NVIDIA Nemotron 3 Ultra 550B 登陸 Ollama

NVIDIA 發佈了專為高吞吐量推理和長時間代理人工作流設計的 Nemotron 3 Ultra 模型 [3]。這款模型擁有高達 550B 的總參數(激活參數為 55B),目前已正式上架 Ollama 模型庫。

模型名稱 總參數 激活參數 特色與應用場景
Nemotron 3 Ultra 550B 55B 高吞吐量推理、長時間代理人工作流
Nemotron 3 Super 120B MoE 高效能混合專家模型
Nemotron 3 Nano 30B 3B 適合資源受限環境的輕量級模型

透過 MTP(Multi-Token Prediction)技術的支援,Nemotron 3 Ultra 的生成速度從原本的 10 tok/s 大幅提升至 15-30 tok/s。雖然這款模型需要如 DGX Spark 等高端硬體才能在本地執行,但開發者可以透過 OpenCode 免費使用其雲端版本。

Google Gemma 4 12B:本地多模態模型新標竿

Google 則推出了 Gemma 4 12B,這是一款支援文字、圖片、音訊與影片多模態理解的開源模型 [4]。Gemma 4 12B 採用了全新的編碼方案與 token 預測技術,使其效能足以媲美 26B 級別的模型。

最令人振奮的是,這款模型可以在配備 16GB RAM 的標準筆記型電腦上完全本地執行,為開發者提供了極大的便利性與隱私保障。目前,Gemma 4 系列模型已在 Ollama 上架,並迅速累積了超過 1260 萬次的下載量。

本週 Ollama 與 OpenRouter 新上架模型總覽

除了 NVIDIA 與 Google 的新模型外,本週 Ollama 與 OpenRouter 也迎來了多款重要模型的更新與上架,顯示出 AI 模型生態系的蓬勃發展。

  • LFM2.5-8B-A1B (Liquid AI):專為邊緣設備設計的 MoE 模型,8.3B 參數中僅激活 1.5B,但在工具呼叫的可靠性上卻能媲美體積大三倍的模型。
  • Mistral Medium 3.5:Mistral 推出的首款融合指令跟隨、推理與多模態能力的旗艦模型。
  • IBM Granite 4.1:專為企業打造的多語言模型,特別強化了工具呼叫的能力。
  • GLM-5.1 (智譜 AI):下一代旗艦代理人工程模型,在程式碼編寫能力上有顯著提升。
  • Kimi K2.6 (Moonshot AI):開源的原生多模態代理人模型,特別適合處理長視野(Long-horizon)任務。

此外,Microsoft 在 Build 2026 大會上正式發佈了 GitHub Copilot SDK,讓開發者能夠自訂 Copilot 的工作流程,並將其代理人功能擴展至程式碼編寫以外的生產力任務 [5]。

參考資料

[1] Apple Newsroom. (2026, June 8). Apple unveils next generation of Apple Intelligence, Siri AI, and more.
[2] Entrepreneur. (2026, June 8). OpenAI Plans Biggest ChatGPT Overhaul Ever: ‘Chat Is Dead’.
[3] Reddit LocalLLaMA. (2026, June 4). nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16.
[4] Google Blog. (2026, June 3). Introducing Gemma 4 12B.
[5] kingy.ai. (2026, June 8). AI Launch Radar: June 8, 2026.