ChatGPT拉開了大語言題庫和生成式AI產(chǎn)業(yè)蓬勃發(fā)展的序幕。據(jù)預(yù)測,到2026年,全球生成式AI計(jì)算市場規(guī)模將達(dá)到109.9億美元。全世界教育科技公司扎堆接入GPT-4,大語言題庫在教育領(lǐng)域中將獲得更加廣闊的應(yīng)用前景和豐富的應(yīng)用場景。
杭州景聯(lián)文科技是AI基礎(chǔ)數(shù)據(jù)行業(yè)的頭部企業(yè),推出巨量高質(zhì)量教育數(shù)據(jù)庫,題量總計(jì)3億道,試卷總量180萬套。所有數(shù)據(jù)均經(jīng)過嚴(yán)格的挑題、錄入、排查、篩重、解答、復(fù)核、校稿程序。
該數(shù)據(jù)庫所有題目均提供word可編輯版本、json格式。基于LaTeX算法保證公式轉(zhuǎn)寫準(zhǔn)確性和可讀性,包括各種常見的數(shù)學(xué)符號和表達(dá)式。
K12題庫,覆蓋從小學(xué)到高中數(shù)學(xué)、語文、英語、科學(xué)、道德與法治、物理、化學(xué)、生物、地理、政治、歷史、信息技術(shù)、通用技術(shù)等全部學(xué)科;
大學(xué)題庫,覆蓋大學(xué)英語、政治、法學(xué)、經(jīng)濟(jì)學(xué)、醫(yī)學(xué)等學(xué)科;
職業(yè)題庫,覆蓋職業(yè)教育所有相關(guān)學(xué)科,公考、金融類,工程類,醫(yī)學(xué)類等。
題庫共計(jì)覆蓋全國各地區(qū)300多個教材版本,包括人教版、北師大版、教科版、蘇教版、魯教版、冀教版等主流版本。
收錄近14年以來中考高試題試卷,覆蓋率高達(dá)95%,各地區(qū)名校試卷和模擬試卷收錄總量達(dá)20萬份。
試題屬性包含學(xué)科、章節(jié)、知識點(diǎn)、題型、難度系數(shù)(不少于5種維度)、題類(中考題/常考題/易錯題/壓軸題等)、真題次數(shù)、試題來源(所屬地區(qū))、能力、解析等十余類;
試卷屬性包含學(xué)科、教材版本、年份、地區(qū)、學(xué)校、年級、學(xué)期、試卷類型、來源、分值、難度系數(shù)、考試時間、命題人等十余類;所有學(xué)科考點(diǎn)覆蓋率100%。
試題解析均獲得授權(quán),100%原創(chuàng)解析,解析維度包括專題分類、分析過程、考點(diǎn)解析、解答過程、教師點(diǎn)評等。
景聯(lián)文科技專業(yè)的題目數(shù)據(jù)庫,不僅注重理解數(shù)據(jù)庫設(shè)計(jì)原理,還強(qiáng)化數(shù)據(jù)庫設(shè)計(jì)技術(shù)。運(yùn)用關(guān)系型數(shù)據(jù)庫管理模板和非關(guān)系型數(shù)據(jù)庫(NoSQL)結(jié)合來處理和存儲海量的題庫數(shù)據(jù),利用大數(shù)據(jù)處理框架Hadoop和Spark進(jìn)行高效的數(shù)據(jù)分析和處理,以支持大模型進(jìn)行高效復(fù)雜的數(shù)據(jù)庫操作。
景聯(lián)文科技將該題庫進(jìn)行部分開源,共開源10萬道教育題庫供更多的企業(yè)體驗(yàn)、反饋。期望能為國內(nèi)的大模型應(yīng)用研發(fā)企業(yè)提供領(lǐng)先優(yōu)勢,搶占戰(zhàn)略制高點(diǎn)。
免費(fèi)獲取請咨詢景聯(lián)文科技官網(wǎng)。
景聯(lián)文科技|數(shù)據(jù)采集|數(shù)據(jù)標(biāo)注
助力人工智能技術(shù),賦能傳統(tǒng)產(chǎn)業(yè)智能化轉(zhuǎn)型升級