15/07/2026 06:47

Chat GPT o1 模型智商超過120！史上最聰明AI，已學會人類思考

OpenAI 推出使用最聰明模型 – GPT o1，是專為推理能力設計，和人類一樣學會「思考」，反覆推理、解決問題，智商測出 120 的高分！

Chat GPT o1 Preview 有什麼新亮點？往下了解更多 GPT o1 價格、功能，及與 GPT-4o 有什麼不同？

快速跳轉目錄

OpenAI 最新模型 GPT o1 是什麼？

GPT o1 是一系列經過優化，具備強化推理功能的大型語言模型。

GPT o1（GPT o1 Preview）為 AI 的問題解決能力帶來了重大變革，不再急於給予答案。而是採用了一種稱為「代理式逐步思維鏈」（agentic step by step chain of thought），可以將複雜問題拆解成可管理的步驟，再給出回答。

OpenAI 此次進階的訓練技術，強化了 AI 模型學習，達到模仿人類思考技術。

OpenAI 2024 年 9 月的首次發兩個模型，包括：

目前 GPT o1 Preview 定價是每百萬個輸入 token 收費 15 美元，每百萬個輸出 token 收費 60 美元。

這相比 GPT-4o，輸入價格貴了 3 倍，輸出價格貴了 4 倍。

以下是 GPT-o1 的三大使用亮點：

思考後再回答：在 GPT-o1 中，OpenAI 引入了一個思考過程，使其在編程和數學等領域的準確性有所提升。這不僅僅是慢速回答，而是謹慎分析。模型在跳到結論之前，會花更多時間分析問題。
更擅長處理複雜問題：無論是寫代碼還是解決數學問題，GPT-o1 在多步驟任務中表現出色。其推理過程更為先進，錯誤更少，結果更可靠。
細節導向任務不再出：以往 AI 模型在處理簡單任務時常常出錯，例如：計算單詞中的字母數量。而 GPT-o1 解決了這個問題。例如，如果你問「strawberry」這個單詞裡有多少個 “r”，GPT-o1 每次都能精確回答。

GPT o1 能夠執行許多任務，與其他 GPT 模型相似功能，包括：回答問題、摘要內容和生成新內容。

然而，作為一款具備高級推理能力的模型，GPT o1 特別適合以下任務和應用場景：

增強推理能力：GPT o1 模型專門為複雜推理任務進行優化，尤其在 STEM（科學、技術、工程和數學）領域表現出色。
創意生成：憑藉其先進的推理能力，GPT o1 在生成創意點子和解決方案方面非常有用，可應用於各種情境中。
科學研究：GPT o1 模型非常適合科學研究任務，例如：註釋細胞測序數據或處理量子光學等領域所需的複雜數學公式。
編程：o1 在生成和調試代碼方面表現優異，並在 HumanEval 和 Codeforces 等編程基準測試中表現出色，還能幫助開發者構建和執行多步驟的工作流。
數學能力：根據 OpenAI 的說法，o1 在數學相關基準測試中表現優於之前的模型。
自我檢查：o1 模型具備自我事實檢查的能力，能提高其回應的準確性。

由於 o1 的推理能力增強，只要使用簡單明確的指令，GPT o1 能夠自主進行分析並提供更準確的回答，簡化了用戶對提示的設計需求。

提示簡單化：這是一個聰明的模型，不需要像 GPT-4 系列那樣詳細的指導。因此，避免使用「思維鏈」式的提示——因為 o1 已經在內部進行推理了。

自 9 月 12 日起，ChatGPT Plus 和 Team 用戶已經能夠使用 ChatGPT o1 模型。

OpenAI 宣布將會向免費用戶開放 o1-mini 模型，但具體日期尚未確定。

以下是其他可以使用 GPT o1 的用戶：

ChatGPT Plus 和 Team 用戶：從 9 月 12 日起，o1-preview 和 o1-mini 模型可供 ChatGPT Plus 和 Team 用戶直接使用。用戶可以在模型選擇器中手動選擇這些模型。
ChatGPT Enterprise 和教育用戶：OpenAI 承諾從 2024 年 9 月 19 日起向企業和教育用戶提供兩款模型的訪問權限。
ChatGPT 免費用戶：在發布時，免費用戶無法使用 o1 模型。不過，OpenAI 計劃未來向所有免費用戶開放 o1-mini 的使用權限。
API 開發者：開發者可以通過 OpenAI 的 API 訪問 o1-preview 和 o1-mini 模型。
第三方服務：多個第三方服務已經提供這些模型，包括 Microsoft Azure AI Studio 和 GitHub Models。

GPT o1 和 GPT 4o 最大的差別就是推理能力和準確性。

如果你習慣使用 GPT-4o，可能會好奇 GPT-o1 的表現如何。讓我們來比較一下：

特性	GPT-o1	GPT-4o
主要定位	複雜推理、深度思考的問題處理	快速、多功能的回應
推理能力	專為處理多步驟和高難度推理的任務設計，準確性更高	專注於快速響應，適合一般性任務
亮點特色	擅長難題解決	更快速回應
STEM準確性	83%	13%
價格	每百萬個輸入 token 收費 15 美元每百萬個輸出 token 收費 60 美元	每個月20美元
使用場景	需要多步驟推理和複雜任務的領域	適合需要快速、即時回應的任務
成本效益	推理和準確性更高	速度快，適合多功能需求