亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.430618.com 】，免友鏈快審服務（50元/站），

點擊這里在線咨詢客服

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > 網站運營 >正文

視頻解析工具Video-ChatGPT上線可用文本描述視頻內容

發布時間：2023-05-29 16:08:00 作者：網友整理

（ChinaZ.com）5月29日消息:雖然像Runway ML這樣的公司在將文本轉換為視頻方面取得了長足的進步，但 VideoChatGPT卻另辟蹊徑，賦予語言模型分析視頻的能力。Video-ChatGPT 可以用文本描述視頻的內容，例如，通過突出顯示不尋常的元素來解釋為什么剪輯可能很有趣。

開發人員通過一段長頸鹿從跳水板上跳入水中的視頻來演示這一點。Video-ChatGPT 指出:“這并不常見，因為長頸鹿并不擅長雜技或潛水。”

鏈接到開源語言模型的預訓練視頻編碼器

研究人員將 Video-ChatGPT 的設計描述為簡單且易于擴展。它使用預訓練的視頻編碼器，并將其與預訓練然后微調的語言模型相結合。

QQ截圖20230529160513.jpg

盡管名稱如此，阿布扎比穆罕默德·本·扎耶德人工智能大學的項目并未使用 OpenAI 技術。相反，研究人員嵌入了一個線性層，將視頻編碼器連接到語言模型。

除了要求特定任務的用戶提示外，語言模型還會使用定義其角色和一般工作的系統命令進行提示。

人機增強數據集

研究人員結合使用人工注釋和半自動化方法來生成高質量數據，以微調 Vicuna 模型。這些數據的范圍從詳細描述到創造性任務和訪談，涵蓋了各種不同的概念。

總的來說，該數據集包含大約86，000個高質量的問答，一些由人類注釋，一些由 GPT 模型注釋，一些由圖像分析系統的上下文注釋。

QQ截圖20230529160526.jpg

Video-ChatGPT 的核心是其結合視頻理解和文本生成的能力。它在視頻推理、創造力和對時間和空間的理解方面的能力已經過廣泛測試。

多模態人工智能未來

在最近文本生成取得重大進展之后，OpenAI 和谷歌等公司正在轉向多模態模型。Bard 理解并可以對圖像做出反應，并在其正式發布時展示了這些能力。

從圖像到移動圖像將是下一個合乎邏輯的步驟。谷歌已經宣布開發一款將于今年晚些時候發布的帶有 Project Gemini 的大型多模式 AI 模型。

分享到：

標簽：Video-ChatGPT AI頭條

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

51998
網站
12
小程序
1030137
文章
747
會員

趕快注冊賬號，推廣您的網站吧！

文章分類

熱門網站

各百科-專業百科問答知識名網站 m.geelcn.com
免費軟件,綠色軟件園,手機軟件下載,熱門游戲下載中心-中當網 m.deelcn.com
魔扣科技 www.430618.com
體育新聞_國際體育資訊_全球體育賽事-中名網 www.feelcn.com/tiyu/tiyuxinwen/
食品安全_健康飲食_舌尖上的安全-中名網 www.feelcn.com/shenghuo/shipinanquan/
中合網 www.heelcn.com
中當網 www.deelcn.com
魔扣網站維護代運營 www.430618.com/tg
中合網-健康養生知識科普名站 m.heelcn.com
各百科 www.geelcn.com

最新入駐小程序

數獨大挑戰

數獨大挑戰2018-06-03

數獨一種數學游戲，玩家需要根據9

答題星

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試

全階人生考試2018-06-03

各種考試題，題庫，初中，高中，大學四六

運動步數有氧達人

運動步數有氧達人2018-06-03

記錄運動步數，積累氧氣值。還可偷

每日養生app

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定

熱門文章