13/10/2024 17:35

Chat GPT o1 模型智商超過120!史上最聰明AI,已學會人類思考

Chat GPT o1 模型智商超過120!史上最聰明AI,已學會人類思考

目錄

OpenAI 推出使用最聰明模型 – GPT o1是專為推理能力設計,和人類一樣學會「思考」,反覆推理、解決問題,智商測出 120 的高分!

Chat GPT o1 模型智商超過120!史上最聰明AI,已學會人類思考
GPT o1 Preview, GPT o1 mini

Chat GPT o1 Preview 有什麼新亮點?往下了解更多 GPT o1 價格、功能,及與 GPT-4o 有什麼不同?

OpenAI 最新模型 GPT o1 是什麼?

GPT o1 是一系列經過優化,具備強化推理功能的大型語言模型。

GPT o1(GPT o1 Preview)為 AI 的問題解決能力帶來了重大變革,不再急於給予答案。而是採用了一種稱為「代理式逐步思維鏈」(agentic step by step chain of thought),可以將複雜問題拆解成可管理的步驟,再給出回答。

OpenAI 此次進階的訓練技術,強化了 AI 模型學習,達到模仿人類思考技術。

OpenAI 2024 年 9 月的首次發兩個模型,包括:

  • OpenAI o1-preview —— 擅長處理複雜問題,每週限制 30 則訊息。
  • OpenAI o1-mini —— 提供 o1 的小型且更具成本效益的版本,每週限制 50 則訊息。

GPT o1價格

目前 GPT o1 Preview 定價是每百萬個輸入 token 收費 15 美元,每百萬個輸出 token 收費 60 美元

這相比 GPT-4o,輸入價格貴了 3 倍,輸出價格貴了 4 倍。

GPT o1 三大新亮點

以下是 GPT-o1 的三大使用亮點:

  1. 思考後再回答:在 GPT-o1 中,OpenAI 引入了一個思考過程,使其在編程和數學等領域的準確性有所提升。這不僅僅是慢速回答,而是謹慎分析。模型在跳到結論之前,會花更多時間分析問題。
  2. 更擅長處理複雜問題:無論是寫代碼還是解決數學問題,GPT-o1 在多步驟任務中表現出色。其推理過程更為先進,錯誤更少,結果更可靠。
  3. 細節導向任務不再出:以往 AI 模型在處理簡單任務時常常出錯,例如:計算單詞中的字母數量。而 GPT-o1 解決了這個問題。例如,如果你問「strawberry」這個單詞裡有多少個 “r”,GPT-o1 每次都能精確回答。

GPT o1 新功能有哪些?

GPT o1 能夠執行許多任務,與其他 GPT 模型相似功能,包括:回答問題、摘要內容和生成新內容。

然而,作為一款具備高級推理能力的模型,GPT o1 特別適合以下任務和應用場景:

  • 增強推理能力GPT o1 模型專門為複雜推理任務進行優化,尤其在 STEM(科學、技術、工程和數學)領域表現出色。
  • 創意生成:憑藉其先進的推理能力,GPT o1 在生成創意點子和解決方案方面非常有用,可應用於各種情境中。
  • 科學研究GPT o1 模型非常適合科學研究任務,例如:註釋細胞測序數據或處理量子光學等領域所需的複雜數學公式。
  • 編程:o1 在生成和調試代碼方面表現優異,並在 HumanEval 和 Codeforces 等編程基準測試中表現出色,還能幫助開發者構建和執行多步驟的工作流。
  • 數學能力:根據 OpenAI 的說法,o1 在數學相關基準測試中表現優於之前的模型。
  • 自我檢查:o1 模型具備自我事實檢查的能力,能提高其回應的準確性。

如何使用OpenAI GPT o1?

由於 o1 的推理能力增強,只要使用簡單明確的指令,GPT o1 能夠自主進行分析並提供更準確的回答,簡化了用戶對提示的設計需求。

提示簡單化:這是一個聰明的模型,不需要像 GPT-4 系列那樣詳細的指導。因此,避免使用「思維鏈」式的提示——因為 o1 已經在內部進行推理了。

誰可以使用GPT o1?

自 9 月 12 日起,ChatGPT Plus 和 Team 用戶 已經能夠使用 ChatGPT o1 模型。

Chat GPT o1 模型智商超過120!史上最聰明AI,已學會人類思考
可以使用 GPT-o1 使用者

OpenAI 宣布將會向免費用戶開放 o1-mini 模型,但具體日期尚未確定。

以下是其他可以使用 GPT o1 的用戶:

  • ChatGPT Plus 和 Team 用戶:從 9 月 12 日起,o1-preview 和 o1-mini 模型可供 ChatGPT Plus 和 Team 用戶直接使用。用戶可以在模型選擇器中手動選擇這些模型。
  • ChatGPT Enterprise 和 教育用戶:OpenAI 承諾從 2024 年 9 月 19 日起向企業和教育用戶提供兩款模型的訪問權限。
  • ChatGPT 免費用戶:在發布時,免費用戶無法使用 o1 模型。不過,OpenAI 計劃未來向所有免費用戶開放 o1-mini 的使用權限。
  • API 開發者:開發者可以通過 OpenAI 的 API 訪問 o1-preview 和 o1-mini 模型。
  • 第三方服務:多個第三方服務已經提供這些模型,包括 Microsoft Azure AI Studio 和 GitHub Models。

GPT-o1 vs. GPT-4o:兩款 OpenAI 模型有什麼不同?

GPT o1GPT 4o 最大的差別就是推理能力和準確性。

如果你習慣使用 GPT-4o,可能會好奇 GPT-o1 的表現如何。讓我們來比較一下:

特性GPT-o1GPT-4o
主要定位複雜推理、深度思考的問題處理快速、多功能的回應
推理能力專為處理多步驟和高難度推理的任務設計,準確性更高專注於快速響應,適合一般性任務
亮點特色擅長難題解決更快速回應
STEM準確性83%13%
價格每百萬個輸入 token 收費 15 美元
每百萬個輸出 token 收費 60 美元
每個月20美元
使用場景需要多步驟推理和複雜任務的領域適合需要快速、即時回應的任務
成本效益推理和準確性更高速度快,適合多功能需求
GPT-o1 vs. GPT-4o差別

GPT o1 結論

GPT o1 和 GPT-4o 的推出標誌著 AI 發展的一個重要里程碑。不再追求更大的模型和更多的參數,而是在創造能夠以往只有人類專家才能掌握的思維方式的專業化工具。

在未來,關鍵在於如何有效地利用這些工具。真正的力量在於了解何時應使用 GPT o1 的深度推理能力,何時應選擇 GPT-4o 的靈活性。

可以肯定的是,AI 領域變得更加有趣了。對於那些多年來一直在關注這個領域的人來說,這無疑是一個令人興奮的進展。

如果你希望獲得更多 AI 新發展,請關注新識界,提供您最新即時消息。

想讓您的品牌更上一層樓?
我們可以幫忙!

返回頂端