本文介紹了刪除POS標(biāo)簽器的標(biāo)簽的處理方法,對(duì)大家解決問(wèn)題具有一定的參考價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)吧!
問(wèn)題描述
可以去掉句子中的標(biāo)簽嗎?你可以通過(guò)掃描文件并找到標(biāo)簽并刪除它們來(lái)實(shí)現(xiàn)這一點(diǎn),但由于標(biāo)簽很多(一些型號(hào)有30+,一些型號(hào)大約有48-50,它們基本上遵循penn treebank pos tags),有沒(méi)有一種快速而甜蜜的方法來(lái)更有效地刪除標(biāo)簽?
我確實(shí)檢查了API,但沒(méi)有這樣的方法來(lái)移除標(biāo)簽。
推薦答案
沒(méi)有為此專(zhuān)門(mén)構(gòu)建的內(nèi)容,但由于輸出既包括單詞又包括其標(biāo)記,我不確定為什么需要再次掃描原始文檔。難道不能通過(guò)刪除最后一個(gè)標(biāo)記分隔符(‘/’或其他字符)直到空格來(lái)刪除標(biāo)記嗎?或者,它可以更簡(jiǎn)單地使用
-outputFormat tsv
然后,您將獲得兩列輸出,其中單詞在第一列,標(biāo)記在第二列,完成后只需保留第一列。
這篇關(guān)于刪除POS標(biāo)簽器的標(biāo)簽的文章就介紹到這了,希望我們推薦的答案對(duì)大家有所幫助,