近期,支付寶應用內悄然上線了一項創新的AI功能——“探一下”,該功能位于“掃一掃”頁面的下方,用戶只需簡單切換即可體驗。這一新功能標志著支付寶在AI應用領域的又一次深入探索。

“探一下”不同于傳統的視覺搜索應用,如識物、搜題等,其核心亮點在于“探索”。用戶可以通過該功能,不僅識圖辨物,還能探知識、探靈感、探文本,仿佛隨身攜帶的一本“視覺百科全書”。例如,在參觀畫展時,只需打開“探一下”對準畫作,畫作背后的故事、歷史背景和藝術風格便一目了然;在踏青賞花時,對準花朵,不僅能識別出名稱和科屬,還能獲取相關的文化和園藝知識。

“探一下”還具備識別同款商品、提供藥物使用指南、翻譯外文菜單等功能,并能鏈接到支付寶豐富的商業生態,提供用車、醫療等服務,使用場景廣泛而便捷。在探靈感功能中,該功能還能根據場景靈活配文,無論是幽默還是治愈風格的文案,都能輕松生成,特別適合想曬圖卻苦惱于文案創作的用戶。

這些實用且有趣的功能背后,是視覺搜索產品在GenAI(生成式AI)時代范式轉變的縮影。傳統基于判別式方案的視覺搜索正在被多模態大模型驅動的AI視覺搜索方案所取代,并逐漸走向規模化應用。在海外,Google Lens憑借GenAI技術已成為谷歌增長最快的查詢類型之一,每月視覺搜索調用量超過200億次。而支付寶憑借龐大的用戶群體和商業生態圈,以及深厚的技術積累,“探一下”有望成為國內對標乃至超越Google Lens的視覺搜索產品。

視覺搜索賽道的競爭日益激烈,用戶對于視覺搜索的理解和分析能力提出了更高要求。傳統的視覺搜索產品大多停留在“識你所見”的層面,復雜場景下的表現并不理想。而“探一下”則采用了多模態大模型全圖理解+open-set多主體檢測的技術鏈路,能夠識別特定場景中的多個主體,并借助大模型的理解力和知識力,提供更深度和廣度的分析解讀,從而滿足用戶對于圖片背后更多信息的需求。







