使用sklearn中的貝葉斯算法建立藥品分類任務準備分類的訓練數據數據分詞預處理將數據拆分為訓練集和測試集構建分類器模型評估調用分類器進行分類預測

發布時間：2023-07-03 11:54:28 作者：網友整理

準備分類的訓練數據

第一列為：輸入

第二列為：輸出

藥品分類數據

數據分詞預處理

import jieba
cutname=lambda x : ' '.join(jieba.lcut(x))
data['藥品名稱']=data['藥品名稱'].Apply(cutname)

將數據拆分為訓練集和測試集

x_train,x_test,y_train,y_test=train_test_split(data.藥品名稱,data.藥品類型,test_size=0.3)

構建分類器

# 向量化（vectorizer） => 轉換器（transformer） => 分類器（classifier）
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB #貝葉斯
text_clf = Pipeline([     ('vect', CountVectorizer()),
     ('tfidf', TfidfTransformer()),
     ('clf', MultinomialNB()),
 ])text_clf.fit(x_train, y_train)#訓練

模型評估

print(classification_report(y_test,text_clf.predict(x_test)))
predicted = text_clf.predict(x_test)np.mean(predicted == y_test)

模型評估

對原料藥和保健藥品分類效果比較差

模型評估

調用分類器進行分類預測

text_clf.predict(['阿莫西林'])

阿莫西林藥品分類

分享到：

標簽：算法貝葉斯

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

51998
網站
12
小程序
1030137
文章
747
會員

趕快注冊賬號，推廣您的網站吧！

文章分類

熱門網站

各百科-專業百科問答知識名網站 m.geelcn.com
免費軟件,綠色軟件園,手機軟件下載,熱門游戲下載中心-中當網 m.deelcn.com
魔扣科技 www.430618.com
體育新聞_國際體育資訊_全球體育賽事-中名網 www.feelcn.com/tiyu/tiyuxinwen/
食品安全_健康飲食_舌尖上的安全-中名網 www.feelcn.com/shenghuo/shipinanquan/
中合網 www.heelcn.com
中當網 www.deelcn.com
魔扣網站維護代運營 www.430618.com/tg
中合網-健康養生知識科普名站 m.heelcn.com
各百科 www.geelcn.com

數獨大挑戰2018-06-03

數獨一種數學游戲，玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題，題庫，初中，高中，大學四六

運動步數有氧達人2018-06-03

記錄運動步數，積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定