高清国产精品久久,男女交性视频免费,天天操天天插天天干

編輯：澤南、杜偉、陳萍

又不求融資，怎么也給 demo 加美顏？

「谷歌，這就有點尷尬了。」

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

沒有想到，Gemini 上線頭一天，熱門評論會是這個樣子。

本周三，谷歌的 Gemini 讓生成式 AI 進(jìn)入了原生多模態(tài)時代。人們第一時間涌入新模型加持的 Bard 想要試試 AI 的能力，結(jié)果給出的評價褒貶不一。

其中最值得注意的是有人指出，Gemini 在發(fā)布時，谷歌給出的一系列 Demo 中最令人眼花繚亂的部分是偽造的。

名為《Hands-on with Gemini: Interacting with multimodal AI》的視頻現(xiàn)在的播放量已經(jīng)有 140 萬次，其中展示了谷歌認(rèn)為自己「最喜歡的與 Gemini 的交互案例」，展示了多模態(tài)模型（即它理解并混合語言和視覺理解）如何靈活地響應(yīng)各種輸入。

谷歌展示了 Gemini 神奇的理解和交互能力，人用畫筆繪制一只鴨子的草圖，從一條曲線到一幅完整的圖畫，AI 評論說藍(lán)色是一種不切實際的動物顏色。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

然后 AI 看到一只實體的玩具藍(lán)色鴨時表現(xiàn)出了驚訝。然后它會響應(yīng)人類圍繞鴨子的各種問題，包括地球的哪個地點會有鴨子，鴨子在各種語言里的讀法等等。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

隨后演示繼續(xù)進(jìn)行，AI 實現(xiàn)了在換杯子游戲中正確跟蹤、識別皮影手勢、識別材料給出組合建議、重新排序行星草圖等等。

但點擊 YouTube 上的視頻描述，可以發(fā)現(xiàn) google 有一個重要的免責(zé)聲明：「為了演示的目的，他們已經(jīng)減少延遲，為了簡潔，Gemini 的輸出也縮短了。」

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

根據(jù)彭博社消息，谷歌在被要求發(fā)表評論時承認(rèn)，視頻演示并不是實時的，而是使用了原始鏡頭中的靜止圖像幀，然后編寫了文本提示，讓 Gemini 做出回應(yīng)。

視頻看起來很美好，然而，卻也反映出了這一問題：視頻不是真實的。人們使用了各種方式來進(jìn)行驗證，包括使用視頻的截圖來問 Bard 中的 Gemini，發(fā)現(xiàn) AI 并不能準(zhǔn)確地回答問題。

有理由懷疑，谷歌可能只是制作了一個夸張的視頻，然后使用靜態(tài)圖像幀和文本進(jìn)行拼湊來作為 Gemini 的提示語。也就是說，視頻 Demo 是精心挑選的結(jié)果。

也許 Gemini 可以如實的完成視頻展示的內(nèi)容，但谷歌沒有這樣做，而是加了速；又或許 Gemini 根本不像視頻中展示的那樣絲滑，有人從好幾個錯誤結(jié)果中挑出了正確的作為素材。

但無論如何，Gemini 的演示看起來都像是經(jīng)過精心調(diào)整好的，對實際交互情況進(jìn)行了歪曲。

谷歌在這篇名為《How it’s Made: Interacting with Gemini through multimodal prompting》的博客中也解釋了多模態(tài)交互過程，即如何通過多模態(tài) prompting 來與 Gemini 交互。

注：Gemini 的提示語可以是多模態(tài) prompting（即不同模態(tài)的組合，如圖像和文本），之后讓 Gemini 預(yù)測接下來會發(fā)生什么，從而做出反應(yīng)。

例如，在玩剪刀石頭布的游戲中，谷歌的實驗過程是這樣的：將照片展示給 Gemini，并要求 Gemini 描述所看到的內(nèi)容：

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

在演示中，一方面，Gemini 似乎確實產(chǎn)生了視頻中所示的反應(yīng)。但在另一方面，觀眾可能被誤導(dǎo)了，主要體現(xiàn)在與模型的交互速度、準(zhǔn)確性等方面。

例如，在視頻的 2:45 處，一只手靜靜地做出一系列手勢。Gemini 很快回應(yīng)：「我知道你在做什么！你在玩石頭、剪刀、布！」

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

然而在谷歌博客中，用戶必須同時顯示所有三個手勢并提示：你認(rèn)為我在做什么？外加提示：這是一個游戲。Gemini 才回答道：「你在玩石頭、剪刀、布。」就像下圖所展示的，當(dāng)用戶伸出兩根手指時，Gemini 并不知道這是石頭、剪刀、布的游戲。只有三張圖片都齊全了，Gemini 才能猜對。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

比較視頻和博客介紹的推理過程，給人一種完全不同的交互方式，視頻中顯示的「互動」過程并沒有發(fā)生。

在隨后的演示中，將三張帶有太陽、土星和地球涂鴉的草圖展示給 Gemini。在視頻中，用戶問道「這個順序正確嗎？」Gemini 回答：「不，是太陽、地球、土星。」注意，原視頻中用戶除了「這個順序正確嗎？」這句話，沒有其他信息。Gemini 卻給出了答案。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

但在實際的提示中（還是書面的），提示語卻是「這個順序?qū)幔靠紤]到與太陽的距離，并解釋你的理由。」Gemini 回答：正確的順序是太陽、地球、土星。太陽離太陽系中心最近，其次是地球，然后是土星。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

我們可以推測，在視頻中，Gemini 的回答可能需要其他幫助，只是谷歌沒有體現(xiàn)出來。

在視頻展示的另一個示例中，紙團(tuán)在杯子之間交換，視頻中，Gemini 立即且看似直觀地進(jìn)行檢測和跟蹤。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

但在博客中，完成這一過程還是很復(fù)雜的。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

每動一次都要和大模型交流一下。也許我們應(yīng)該假設(shè)谷歌人工智能演示中的所有功能都被夸大了。

面對人們的質(zhì)疑，谷歌的回應(yīng)是：他們直接承認(rèn)了。

在本文發(fā)表后發(fā)布的社交媒體帖子中，Google DeepMind 的研究副總裁 Oriol Vinyals 詳細(xì)介紹了「錄制該視頻時 Gemini 是如何使用的」。

Oriol Vinyals 表示，谷歌為 Gemini 提供的多模態(tài)能力和即時響應(yīng)將在 12 月 13 日開放 Pro 訪問權(quán)限時供開發(fā)者使用。不過 Demo 視頻里的內(nèi)容是使用 Ultra 模型做到的。視頻中的所有人類提示和 AI 輸出都是真實的，但為簡潔起見進(jìn)行了縮短。

谷歌 Gemini 聯(lián)合負(fù)責(zé)人 Oriol Vinyals 的推特：

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

圖源：https://x.com/OriolVinyalsML/status/1732885990291775553?s=20

對此網(wǎng)友們并不買賬：你說它是真的，又說不是真實的大模型推理速度，這不是自相矛盾嗎？

Gemini 遭自家員工指責(zé)，Pro 版本打不過 GPT-3.5

彭博社等媒體指出，在谷歌宣傳其 demo 視頻的同時，又遭到了一些自家員工的非議。尤其是在畫鴨子時，Gemini 似乎能夠在繪制時進(jìn)行實時分析，并在與用戶對話時以人聲回應(yīng)。

谷歌 CEO 皮查伊極力推廣這段 demo，并表示了解 Gemini 潛在驚人能力的最好方式是看它的實際效果。看客們也對 demo 贊賞有加，直呼令人興奮和不真實（unreal）。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

圖源：https://Twitter.com/sundarpichai/status/1732433036929589301

不過很快有人指出，Gemini 并不像想象中那么好，你無法指望它像 demo 中那樣地靈敏智能。一些谷歌內(nèi)部員工指出了其中的「貓膩」。

一位員工向彭博社透露稱，這段 demo 描述了一副不切實際的畫面，過分渲染了從 Gemini 中輸出驚艷的效果是如此得容易。

另一位員工則表示，他們對 demo 并不感到驚訝，并且已經(jīng)習(xí)慣了公司在定位自身產(chǎn)品時存在某種程度的營銷炒作。當(dāng)然，所有公司都會這樣做。因此他認(rèn)為，大多數(shù)使用過任何 LLM 技術(shù)的員工都知道要對 demo 持保留態(tài)度。

對此，谷歌 DeepMind 產(chǎn)品副總裁 Eli Collins 告訴彭博社稱，鴨子繪圖演示仍然是研究層面的功能，正在開發(fā)當(dāng)中，而并不是實際的產(chǎn)品，至少目前是這樣。

對此，還有一些谷歌員工一直在討論，在沒有明確透露實情的情況下展示視頻是否會誤導(dǎo)公眾。甚至有人分享了一個模因，暗示鴨子視頻經(jīng)過了欺騙性編輯。「我猜視頻創(chuàng)建者更看重『講故事』的能力。」

除了 demo 視頻遭到公眾和內(nèi)部員工質(zhì)疑之外，Gemini 真如宣稱的那樣強大嗎？我們知道，Gemini 此次有三個版本，能力最強的 Gemini Ultra、多任務(wù)的 Gemini Pro、以及特定任務(wù)和端側(cè)的 Gemini Nano。

目前，谷歌類 ChatGPT 應(yīng)用 Bard 可免費升級到 Gemini Pro 版本，Gemini Ultra 預(yù)計于明年初通過 Bard Advanced 與用戶見面。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

在與 GPT-4 的比較中，谷歌給出的數(shù)據(jù)是 Gemini Ultra 全面超越 GPT-4，Pro 在大多數(shù)指標(biāo)上超越 GPT-3.5。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了

但實際效果究竟如何呢？推特用戶 Brett Winton 首次對 Gemini Pro、Claude 和 GPT-3.5 進(jìn)行了基準(zhǔn)測試，對每個模型提了一道 8 年級的故事題。他得出的結(jié)論是：GPT-3.5 滿分、Claude 約 67 分，Gemini Pro 完全沒有那個味。

Gemini上線首日：用戶褒貶不一，演示被質(zhì)疑「造假」，谷歌承認(rèn)了