亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

明敏 蕭簫 發自 凹非寺

量子位 | 公眾號 QbitAI

科大訊飛版ChatGPT產品,提前交卷了!

就在昨夜,訊飛驟然向開發者提供了內測通道,取名為 訊飛星火認知大模型對外開啟內測。

還有個神奇的英文名字Spark Desk,據說有“火花桌面智能助手”的意思。

訊飛這波操作,多少有點“反向跳票”的意思,因為早在今年2月初,科大訊飛就被曝加緊開發中國版ChatGPT。隨后國內大模型關注度陡增后,科大訊飛率先給出了deadline:5月6日上線產品。

萬萬沒想到,距離正式發布還有10天,他們毫無征兆地開啟了內測邀請。

從目前已經獲得內測的網友評價來看,有一些人認為效果“超出預期”,但也有人反饋只是“中規中矩”。整體來看,表達效果不錯的反饋占多數。

獲得內測資格的方式也有點意思,是AI打電話給確認的 :

當然,科大訊飛大模型能力究竟如何,最好還是能實測后再說。

所以第一時間拿到內測邀請的我們,也連夜完成了測試。詳情如下:

淺測訊飛大模型

登錄進去后,首先看到的是訊飛星火認知大模型的自我介紹:

我能學習和理解人類的語言,進行多輪對話、回答問題和高效地幫助人們獲取知識和靈感。

老樣子,還是從 語文、數學、代碼和邏輯幾方面,測測訊飛星火認知大模型的綜合能力。

那么我們就先從 語文能力測起。

考慮到現在弱智吧已經成為ChatGPT時代下的Benchmark了,所以先測試大家想看的環節。

結合下科大訊飛的特點,我們拋給訊飛星火了一個 地獄地域笑話。

沒想到,它是懂安徽人的 。

我們去了圖片ID水印,可能導致截圖文字不清楚(還望大家理解)

再來一個腦筋急轉彎試試。

訊飛星火的回答非常一本正經:首先表示“玉皇大帝是否存在這個事情不是我AI可以下結論的”,這個問題驢唇不對馬嘴,玉皇大帝住哪的設定和現代科學沒有關系。

但你要非要我說點啥,我只能說或許玉皇大帝可能在地球上空吧。

不過這段回答里也有個小bug,即在東亞宗教信仰里天界包括天堂和神界(?)

實際上,在一些弱智吧問題里,訊飛星火的表現往往是懂了但沒完全懂。

比如它知道焚書坑儒的事,但是又解釋不清楚衍生出來的地獄笑話。

不過在基本語文能力上,訊飛星火的表現還是值得關注的。

比如給出第一句,補充寫一首魯迅風格的詩歌:

提的要求它都基本滿足了,不過紫菜湯為啥曾是漁民的希望?是我理解不了AI的深意了。

換成周杰倫的風格呢?

表現也還不錯,馬上替換了后三句的內容。懷念童年也是周董歌里經常出現的主題了。

古文中的 對對子,它也能對仗比較工整,表達意思上也沒出什么問題。

我們給的上聯是:福慧雙修須及物。

再試試成語接龍:

如果它接錯了,提醒下能改正回來,也表現出了一定的 多輪對話能力:

創作的洋蔥新聞,也確實有那感覺了~

續寫的恐怖故事也有點水平:

那么再看看 數學能力?

基本的加減法、雞兔同籠應對起來都很輕松了。

不過在高數方面還是有點困難,讓它求解:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

即便在我們提醒它算錯了情況下,修正起來也比較困難(正確答案為-6)。

OK,接下來就輪到 代碼能力了。

我們給的要求是:幫我寫一個計算器程序。

確實完成了一個四則運算的簡單計算器,甚至還有命令行操作界面:

除了有一個小bug(函數外不能return)外,簡單修改后可以運行。

另外對于Python/ target=_blank class=infotextkey>Python縮進的空格與tab之爭,這只AI是個空格黨。

這里貼上代碼塊,大伙兒可以試試:

#coding=utf-8

#量子位注:AI沒生成這句,根據不同運行環境可能需要加一下

# 定義函數,實現加法運算

defadd(x, y):

returnx + y

# 定義函數,實現減法運算

defsubtract(x, y):

returnx - y

# 定義函數,實現乘法運算

defmultiply(x, y):

returnx * y

# 定義函數,實現除法運算

defdivide(x, y):

ify == 0:

print( "除數不能為零!")

return

else:

returnx / y

# 主程序

print( "歡迎使用計算器!請選擇需要進行的操作:")

print( "1. 加法")

print( "2. 減法")

print( "3. 乘法")

print( "4. 除法")

choice = input( "請輸入操作編號(1/2/3/4):")

num1 = float(input( "請輸入第一個數字:"))

num2 = float(input( "請輸入第二個數字:"))

ifchoice == '1':

print(num1, "+", num2, "=", add(num1, num2))

elifchoice == '2':

print(num1, "-", num2, "=", subtract(num1, num2))

elifchoice == '3':

print(num1, "*", num2, "=", multiply(num1, num2))

elifchoice == '4':

ifnum2 == 0:

print( "除數不能為零!")

# return (量子位注:這里有bug,注釋掉就可)

else:

print(num1, "/", num2, "=", divide(num1, num2))

else:

print( "非法輸入!")

生成表格能力也是有的,同時可以按照要求修改表格:

分析基本邏輯問題也OK:

而且我們感覺訊飛星火的回答,總是很正經,對于腦洞大開的問題也是淡定的“總分總式”回答。

當然也被繞到過溝里,回答出了“賈母找人搬機器”的瞎話:

以上就是我們對訊飛星火的一個淺淺測試。

能力水平已經看到了,而大模型本身讓人好奇的,還有它的技術細節~

提前扒扒它的“模型底細”

畢竟訊飛大模型還沒正式發布,所以我們試著先從它自己這里“探探口風”。

看看能不能通過問相關問題,提前摸出一些關于它的資料來。

先是 名字由來。訊飛星火認知大模型給出了技術向、公司向和文化向三個方面的回答,有議論文內味了:

再仔細追問一下為什么“星火”和“心宿”有關,好家伙,話題逐漸占星學了起來:

這里我們調戲一下大模型,問問科大訊飛CEO是否喜歡占星學

回到正題。那么,訊飛星火認知大模型的訓練數據來源、模型參數量、聯網狀態如何?

首先是關于模型 訓練數據的來源。看起來資料還比較豐富,目前也還在不斷更新中:

所以,訊飛大模型是否和ChatGPT一樣,用了RLHF呢?它自己的回答竟然是沒有:

那么接下來,是關于 模型參數量的問題,這里訊飛大模型回答得也比較模糊。

而且,給出的模型參數量竟然只有數億個?(要知道,GPT-2模型參數量都有15億)

最后,是關于模型 能否聯網的問題。

看起來,它還不會實時聯網,關于網易和暴雪的新聞只能追溯到幾年前的消息:

用戶也不能通過指令直接讓它訪問某個網站,查詢特定信息,應該是加了某些限制:

不過有意思的是,它還是聲稱自己需要聯網工作,以訪問特定信息數據:

據訊飛星火認知大模型介紹,目前它的訓練數據還在繼續更新。

換而言之,就是還在繼續迭代,估計在正式發布前還會更新一版模型。

目前來看,科大訊飛的這個訊飛星火認知大模型,表現已算不錯。

而且要知道,訊飛原計劃給出的交卷時間是 5月6日,現在突然發布內測,相當于不僅沒跳票,還“反向跳票”了一波。

這樣來看,除了科大訊飛在這NLP和認知智能方面確實有很深的技術積累以外,也說明,訊飛的技術和工程團隊實戰能力值得關注一波——不僅能打硬仗,而且“說到做到”。

現在距離正式發布還有10天,你期待訊飛的大模型迭代出什么新效果?

— 

分享到:
標簽:ChatGPT
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定