谷歌近期宣布,其人工智能助手Gemini Live將迎來一系列創(chuàng)新升級,旨在為用戶提供更加流暢和人性化的交互體驗。這些改動不僅將日常生活變得更加便捷,還預示著AI技術的一大步躍進。
據(jù)悉,Gemini Live即將推出的一項重磅功能是屏幕高亮技術。用戶只需利用手機攝像頭掃描周圍環(huán)境,AI助手便能迅速在屏幕上標記出用戶所需的物品。想象一下,當你急需在工具箱中找到一把合適的螺絲刀時,只需簡單地將手機對準工具箱,Gemini Live就會立刻為你指出正確的選擇。這一功能預計將于8月28日伴隨Pixel 10的發(fā)布同步上線,隨后將擴展至其他安卓設備,并逐步覆蓋至iOS平臺。
谷歌還引入了全新的應用集成功能,使Gemini Live能夠與更多日常應用如短信、電話和時鐘等進行無縫對接。假設你正在與Gemini規(guī)劃出行路線,卻突然發(fā)現(xiàn)可能會遲到,這時你可以輕松打斷對話,指令道:“這條路線挺好,幫我給亞歷克斯發(fā)個信息,說我大概會晚到十分鐘。”Gemini會即刻為你起草并發(fā)送短信,極大提升了溝通效率。
不僅如此,Gemini Live的音頻模型也得到了全面升級。谷歌聲稱,這次更新將顯著提升助手在對話中的語音表現(xiàn),包括語調(diào)、節(jié)奏和音高等關鍵細節(jié)。未來,Gemini將能根據(jù)對話內(nèi)容自動調(diào)整語氣,如在討論嚴肅話題時采用更為沉穩(wěn)的聲音。用戶還可以根據(jù)個人喜好調(diào)節(jié)Gemini的語速,這一功能與現(xiàn)有的ChatGPT語音模式頗為相似。更令人驚喜的是,當你請求Gemini以特定角色或歷史人物的視角講述故事時,它甚至能模仿相應的口音,讓敘述更加引人入勝。






