在科技界的浩瀚星空中,一顆名為DeepSeek的新星正以前所未有的光芒照亮了整個硅谷與華爾街。近日,這家被譽為“國產AI之光”的企業再次震撼全球,不僅讓美股科技板塊風聲鶴唳,更是在1月28日乘勝追擊,發布了其最新的開源多模態AI模型——Janus-Pro。
DeepSeek的這一舉動,顯然給業界巨頭帶來了不小的壓力。OpenAI的聯合創始人兼CEO Sam Altman罕見地在社交媒體上連續發文,對DeepSeek的新模型R1給予了高度評價,稱其為“令人印象深刻的模型”,并預告OpenAI也將推出更強大的模型,堅持其既定的技術發展路線。

據DeepSeek公布的數據,其新開源的Janus-Pro-7B模型在Geneval和DPG-Bench兩大基準測試中,性能超越了OpenAI的DALL-E 3和Stable Diffusion。這一消息迅速點燃了業界的熱情,網友們紛紛在社交平臺上分享各種創意梗圖,其中一張更是將GPT-5打上了大紅叉,而在巨鯨圖案上赫然印上了DeepSeek的logo。

早在之前,DeepSeek憑借其R1模型的高性能和成本效益,已經贏得了“國產AI價格屠夫”的稱號,讓整個硅谷為之震動,也讓業界開始質疑美國科技巨頭在AI基礎設施上的巨額投入是否必要。隨著DeepSeek影響力的迅速擴大,它已登頂中美等多國App Store免費榜。
DeepSeek的沖擊波也席卷了美股市場。英偉達股價昨日暴跌17%,市值蒸發近6000億美元(折合人民幣約4.35萬億元),其創始人兼CEO黃仁勛的財富一夜之間縮水201億美元(約合人民幣1458億元)。同時,臺積電的市值也蒸發了1508億美元(約合人民幣1.09萬億元)。DeepSeek作為“AI界拼多多”,這一刀“砍”掉了英偉達和臺積電超5萬億元的市值,堪稱奇跡。
美股科技股和芯片股均受到重創,納斯達克100指數下跌3.1%,標普500指數下跌1.5%,微軟、谷歌母公司Alphabet、博通、臺積電、ASML等科技巨頭紛紛下跌。而一向對AI競賽保持謹慎態度的蘋果,卻在這場風暴中逆勢上漲3.2%,重返全球市值第一的寶座。
DeepSeek的崛起也引起了全球主流媒體的廣泛關注,多家外媒的頭版都報道了這一事件,這在科技界并不多見。
隨著DeepSeek以驚人的速度不斷開源高質量新模型,其在全球科技圈引發的轟動效應還在持續擴大。新發布的Janus-Pro模型有1B和7B兩款,能夠生成高質量的AI圖像,且一如既往地開源、免費、可商用。13頁的技術報告也已經公開。
據技術報告介紹,Janus-Pro是前作Janus的升級版,結合了優化的訓練策略、擴展的訓練數據,并擴展到更大的模型尺寸,在多模態理解和文本到圖像的指令遵循能力方面都取得了顯著進步,同時也增強了文生圖的穩定性。網友們已經在社交平臺上分享了對Janus-Pro-7B的體驗,總體評價是信息理解基本準確,生成圖像完整,但在局部細節上有所欠缺。

Janus-Pro的技術解讀顯示,該模型遵循自回歸框架,解耦了多模態理解和視覺生成的視覺編碼,采用獨立的編碼方法將原始輸入轉換為特征,然后由統一的自回歸Transformer進行處理。實驗使用最大支持序列長度為4096的DeepSeek大模型作為基礎,通過改進訓練策略和數據比例,實現了更高效的訓練和整體性能的提升。
盡管Janus-Pro在多模態理解和文生圖指令遵循能力上取得了顯著進步,但仍存在一定的局限性,如輸入分辨率限制為384 × 384,可能影響其在細粒度任務中的性能。對于文生圖,低分辨率加上視覺tokenizer帶來的重建損失,導致圖像雖然具有豐富的語義內容,但缺乏精細的細節。不過,技術報告指出,提高圖像分辨率有望緩解這些問題。






