18/07/2024 03:34

Google Gemini 1.5 Pro 屌打 GPT-4o ?有哪些超強功能?一次整理報你知!

Gemini 1.5 Pro 屌打 GPT-4o ?有哪些超強功能 一次整理報你知!

目錄

在此次 Google I/O 2024 年度開發者大會上,Google 將重心放在新一代人工智慧模型 Gemini 更新上。本文就帶你一起來看看 Google Gemini 新模型 1.5 Pro 有什麼超強新功能吧!

Google Gemini 是什麼?

Google Gemini
Google Gemini

Gemini(前身 Bard) Google 推出的 AI 聊天機器人,專門用來生成對話內容。這個機器人背後的技術基於名為 Gemini 的大型語言模型。它的推出是為了應對OpenAI 的 ChatGPT 的迅速崛起。

Gemini 在 2023 年 3 月首先進行了小規模的測試,到了 2023 年 5 月,擴展到了更多國家。到 2024 年 2 月 8 日,這個聊天機器人正式改名為 Gemini。

一開始,Gemini 是基於 LaMDA 系列的大型語言模型,後來轉換成了 PaLM2,現在則是用 Gemini 系列的大型語言模型。Gemini在2024 年 5 月 14 日,更新了Gemini,推出了1.5 Pro 版本,還引入了 1.5 Flash。

Gemini 1.5 Pro 和 1.5 Flash 更新內容

特性Gemini 1.5 ProGemini 1.5 Flash
主要更新內容對翻譯、編碼、推理等多個關鍵用例進行了一系列改進。這個更小的型號專為需要快速反應的高頻任務而優化,速度快。
上市情況已在 200 多個國家和地區提供預覽版,6 月全面上市。
已在 200 多個國家和地區提供預覽版,6 月全面上市。
多模式功能配備 100 萬個 token 上下文窗口,支持交錯輸入文字、圖像、音訊和視訊。配備 100 萬個 token 上下文窗口,支持交錯文字、圖像、音訊和視訊。
上下文窗口擴展(Natively multimodal with long context)若要獲取配備 200 萬個 token 上下文窗口的 1.5 Pro,請加入 Google AI Studio 或 Google Cloud 的 Vertex AI 的候補名單。不適用此擴展功能。
Gemini 1.5 Pro 和 1.5 Flash 更新

這兩款型號在多模式功能和上下文窗口容量上都有顯著提升,為用戶提供更快、更準確的AI體驗。

上下文窗口擴展(Natively multimodal with long context):
這表示 Gemini 1.5 Pro 和 Gemini 1.5 Flash 這些模型不僅能夠自然地處理多種輸入形式(如文字、圖像、音訊和視訊),還能夠在處理過程中考慮和記住大量的上下文信息。這種能力使得模型能夠在更複雜和多樣化的情境中提供準確和有用的回應。

Gemini 1.5 Pro 將在私人預覽中擁有 200 萬個 token 上下文視窗。
Gemini 1.5 Pro 將在私人預覽中擁有 200 萬個 token 上下文視窗。

Gemini 1.5 Pro 介紹

Google的Gemini模型家族原本有三個版本:

  • 可以在手機上運行的版本:Gemini Nano
  • 通用版本:Gemini Pro
  • 最強大的版本:Gemini Ultra

1.5 Pro 功能

在 4月中的 Google NEXT ’24活動中,Gemini 1.5 Pro宣布了一系列新功能,提升了音訊串流處理、程式碼編寫輔助和工作流程自動化的能力,並全面開放給開發者和企業預覽。

這些功能整合在 Google Cloud 雲端服務平台上,支援多種應用場景,提供強大的資料處理與分析能力等,而以下是Gemini 1.5 Pro的新功能整理

功能說明
音訊串流處理支援處理音訊串流,提升語音應用的性能,能從音訊中提取文字、翻譯語言、生成創意內容和回答問題。
程式碼編寫輔助提供Gemini Code Assist功能,自動生成程式碼、偵錯、查找和修復錯誤,並建議最佳程式碼實踐。
簡化工作流程幫助企業簡化工作流程,提升效率,並支援超過30,000行程式碼或70萬個以上字詞的內容處理。
全面開放體驗在Google NEXT ’24活動中,向開發者和企業公開預覽,讓其集成到自己的應用程序和服務中。
雲端服務整合部署於Google Cloud雲端服務平台,整合在各個平台服務中,支援多種應用場景。
資料處理與分析在BigQuery中加快資料準備、探索、分析和治理,並支援從舊系統快速轉移資料至現代化雲端資料庫AlloyDB。
企業數位助理服務協助企業建構自有數位助理服務(Customer Agents),提供24/7客戶服務和自動化客戶服務任務。
工作效率提升在Workspace服務中協助縮短工作流程,加快效率,自動化重複性任務,提升工作效率,降低工作成本。
安全擴充提供安全擴充功能,檢測和防止安全威脅,保護敏感數據,提高安全性。
雲端輔助功能在不同生命週期階段提供人工智慧輔助,幫助開發者設計、保護、操作和進行問題排解,優化應用效能與成本。
Gemini 1.5 Pro 新功能

而在本週,Google 又新增了一個新成員,叫做「Gemini Flash」。由於它奠基在Gemini 1.5上,所以目前稱為Gemini 1.5 Flash

1.5 Flash 功能

根據 Google 的說法,Gemini 1.5 Flash 是由 Gemini 1.5 Pro 精簡而來。它把大模型的知識和技能轉移到一個更小但更高效的模型中。這兩個版本都支援 100 萬個Token 的脈絡,不過,Gemini 1.5 Flash 專門針對大規模和高頻率任務進行了優化,成為目前速度最快的 Gemini API 版本

儘管 Gemini 1.5 Flash 只是Gemini 1.5 Pro 的輕量版,Google 強調它在多模態推理上依然非常強大,尤其擅長以下幾個方面:

  • 摘要
  • 聊天應用
  • 圖像和影像字幕
  • 從大量文字和表格中提取資料

如何下載Google Gemini?

Google Gemini App 繁體中文版已經開放下載,以下是詳細的使用步驟:

  • Step1. 註冊並登入 Google 帳戶:開啟 Google 應用程式,註冊或登入您的 Google 帳戶。
  • Step2. 下載並安裝 Gemini 應用程式:前往 Google Play 商店,搜尋並下載「Gemini」應用程式;安裝完成後,打開應用程式。
  • Step3. 登入應用程式打開 Gemini 應用程式,系統會提示您需要先登入 Google 應用程式才能使用。
  • Step4. 登入應用程式登入後,您可以在應用程式內選擇所需的功能,如文本輸入或圖像上傳。
  • Step5. 根據提示進行操作按照應用程式的提示進行操作,如輸入文本或上傳圖像等。

延伸閱讀:【AI工具分類】2024年AI工具大全都在這!AI工具懶人包一次看

如何查證 Google Gemini 回答是否正確?

Google Gemini 提供了一個獨特功能:「查證回覆內容」,幫助你確保獲得的資訊是準確的。以下是使用這個功能的步驟:

  • Step1. 在 Gemini 中提出問題打開 Gemini,輸入你想詢問的問題。
  • Step2. 點擊 Google 圖標在 Gemini 的回答下方,點擊 Google 圖標(查證回覆內容)。
Google Gemini 回答正確性
Google Gemini 回答正確性
  • Step3. 檢視答案標記Google 會檢視 Gemini 的答案,並標記顏色【綠色:表示搜尋結果與答案相似,信息準確。橘色:表示資訊可能有出入,需要進一步確認。】
Google Gemini 回答正確性
  • Step4. 點擊顏色標記點擊顏色標記,連結到相關的資料來源,方便你進行延伸閱讀和驗證。

這樣,你可以通過 Google Gemini 的查證功能,輕鬆核實答案的準確性,確保你得到的信息是可靠的。

Gemini 1.5 Pro 和 GPT-4o 差異比較

Gemini 1.5 Pro 和 GPT-4o 比較、差異
Gemini 1.5 Pro 和 GPT-4o 比較、差異

在選擇購買 Google Gemini 1.5 Pro 還是 GPT-4o 之前,了解兩者之間的詳細差異蠻重要的。根據不同的需求和偏好,這兩款 AI 服務各有其優勢和劣勢。以下針對價格、功能、應用程式連結、影片處理等進行比較:

價格差異

價格服務差異Gemini 1.5 ProGPT-4o
價格新台幣 650 元/月新台幣 641 元 ( 20 美元/月 )
附加雲端空間2TB 雲端空間
免費試用前兩個月免費免費版使用量是付費版的 1/5
Gemini 1.5 Pro 和 GPT-4o 費用差異

功能差異

共同功能

  • 先進的自然語言處理能力
  • 支持多語言翻譯和文本生成
  • 多種應用場景,如寫作輔助和聊天機器人

Gemini 1.5 Pro 獨有功能

  • 深度整合 Google 服務:與 Gmail、Google Docs、Google Drive 和 Google 日曆無縫整合,方便管理郵件、文件和日程
  • Ask Photos:在 Google 相簿中進行深度搜尋,找出特定照片或物件
  • Ask with Video:透過影片詢問問題,進行實時故障診斷和修復建議
  • AI Teammate:在團隊專案中作為協同作業助理,幫助尋找資料和追蹤進度
  • 旅遊規劃功能:根據用戶需求推薦機票、飯店和餐飲店,動態調整行程計劃
  • AI 分析通話防詐騙:即時分析通話內容,防範詐騙行為

GPT-4o 獨有功能

  • 語音即時翻譯:在對話中即時翻譯多種語言,充當即時口譯員
  • 即時影片辨識:教學和盲人導航功能,如解數學題,提供環境狀況描述
  • 語調和插話:根據指令改變情緒和語調,允許用戶在回答過程中插話
  • 桌機版軟體:將推出桌機版原生軟體,方便在電腦上使用
  • GPT Store 外掛服務:提供各種外掛應用,如設計軟體 Canva 和流程圖工具 Diagrams

Gemini 1.5 Pro 和 GPT-4o 應用程式差異

Gemini 1.5 Pro

  • 適合重度使用 Google 服務的用戶
  • 無縫整合 Gmail、Google Docs、Google Drive 和 Google 日曆
  • 提供獨特功能 Ask PhotosAsk with Video,提升工作和生活效率

GPT-4o

  • 適合需要多元應用場景的用戶
  • 提供多種外掛應用(如 Canva 設計、Diagrams 流程圖)
  • 支持即時語音翻譯和影片教學,適合語言學習和即時互動

影片處理比較

服務功能描述
Gemini 1.5 ProAsk with Video:用戶可邊拍影片邊向 Gemini 詢問問題,獲得實時分析和建議
GPT-4o影片教學:如解數學題目,逐步教學,並提供詳細解答過程
Gemini 1.5 Pro 和 GPT-4o 影片溝通處理

Gemini 1.5 Pro 和 GPT-4o 適用場景

Gemini 1.5 Pro

  • 適合重度使用 Google 服務的用戶
  • 與 Gmail、Google Docs、Google 日曆 和 Google 相簿無縫整合
  • 提供獨特功能如 Ask Photos 和 Ask with Video,提升工作和生活效率

它與這些服務無縫整合,並且有獨特功能如 Ask Photos 和 Ask with Video,能極大提升你的工作和生活效率。

GPT-4o

  • 適合希望 AI 成為私人老師或夥伴的用戶
  • 提供語音即時翻譯、即時影片辨識和多種外掛服務
  • 適合需要多元應用場景的用戶,如語言學習和即時互動

它提供更多樣化的功能,包括語音即時翻譯、即時影片辨識和多種外掛服務,適合需要多元應用場景的用戶。

最終選擇哪一種取決於你的需求和偏好。希望這些信息能幫助你做出最佳選擇!

延伸閱讀:OpenAI史上最強GPT-4o有哪些新功能?太扯了!還能與AI談戀愛

Google Gemini 相關問題

Q1. gemini 能生成圖片嗎?

Google 的 Bard 改名為 Gemini 後,不僅升級為 Gemini Pro 模型,還導入了新版 Imagen 2 模型,可以直接在聊天視窗內生成圖片。
只需用文字描述想要的圖片內容,Gemini 就能根據描述生成相應的圖片。
此功能目前僅支援英文,但未來會推出更多語言版本。如果英文描述不夠順暢,可以使用 Google 翻譯輔助。
用戶還可以上傳圖片範本供 Gemini 參考,再生成相似圖片。每次生成 4 張圖片,如需更多圖片可按「生成更多內容」按鈕再增加 2 張。生成圖片的解析度為 1536 × 1536,適合一般需求,若需更高畫質,可使用 AI 放大工具處理。

Q2. google gemini 怎麼用?

Google Gemini 是由 Google AI 開發的大型語言模型,適用於寫作、規劃和學習等多種任務。
您可以通過 Gemini 應用程式或 Gemini 網站訪問。登入後,輸入您的提示或問題,Gemini 會根據您的指示生成結果。以下是使用技巧:

使用換行符:將不同的提示或問題分開,便於理解和處理。
強調重要文字:使用粗體或斜體來突出關鍵詞。
嘗試不同的模型:Gemini 提供三個模型:Gemini Ultra、Gemini Pro 和 Gemini Nano。可以試用不同的模型,找到最適合您的。

Q3. google gemini有ios app 嗎?

Android 裝置的使用者:你可以前往 Google Play 商店下載 Gemini 應用程式。一旦下載並安裝完成,你就可以開始和 Gemini 對話。
iOS 裝置的使用者:由於 iOS 裝置無法直接從 App Store 下載 Gemini 應用程式,你需要通過 Google 應用程式(App)來體驗 Gemini 的服務。這意味著你需要先下載並安裝 Google 應用程式,然後在這個應用程式內使用 Gemini 的功能。

如果你希望獲得更多相關資訊,請關注新識界,提供您最新即時消息。

想讓您的品牌更上一層樓?
我們可以幫忙!

延伸閱讀

Scroll to Top