亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.430618.com 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

導(dǎo)讀

圖像識(shí)別領(lǐng)域有幾個(gè)最熱門的方向,其中就包含了OCR(Optical Character Recognition,光學(xué)字符識(shí)別)百度阿里騰訊都有自己的OCR收費(fèi)服務(wù)。隨著目前數(shù)據(jù)量越來越大,以及硬件性能的提升,OCR的應(yīng)用也越來越成熟,像身份證識(shí)別火車票識(shí)別發(fā)票識(shí)別出租票識(shí)別等等。相信大家也體驗(yàn)過一些,今天給大家介紹一個(gè)好用的開源OCR應(yīng)用EasyOCR,而且還包含多種語言,識(shí)別效果也還不錯(cuò),目前在git上已有8K顆星

git地址:https://github.com/JaidedAI/EasyOCR

EasyOCR

  • 介紹

EasyOCR目前能夠支持58種語言,其中有中文(簡體和繁體)日語泰語韓語等,支持的語言列表如下

一個(gè)超好用的開源OCR

EasyOCR支持的語言類型

  • 模型架構(gòu)
一個(gè)超好用的開源OCR

 

EasyOCR的模型主要分為兩個(gè),基于CRAFT的文字檢測(cè)模型和基于ResNet+LSTM+CTC的識(shí)別模型

  • demo

官方也提供了一些效果實(shí)例,如下,對(duì)于這種比較標(biāo)準(zhǔn)的印刷文字以及路牌識(shí)別效果還是不錯(cuò)

一個(gè)超好用的開源OCR

 

第三方基于easyOCR提供了幾個(gè)demo地址,大家可以試試自己的數(shù)據(jù)看看效果:

  1. https://colab.fan/easyocr
  2. https://hub.Docker.com/r/challisa/easyocr
  3. https://easyocrgpu-wook-2.endpoint.ainize.ai/

我利用第三個(gè)接口(第一個(gè)接口無法訪問,docker還沒測(cè)試),我從網(wǎng)頁上隨便截取了一段文字來測(cè)試一下,效果如下

一個(gè)超好用的開源OCR

 

文字基本上能識(shí)別出來,不過標(biāo)點(diǎn)符號(hào)的識(shí)別不是那么的準(zhǔn)確,我在自己的電腦上按照git上配置了一下環(huán)境,識(shí)別效果要比上面好不少,效果如下

一個(gè)超好用的開源OCR

 

順便測(cè)試了一下火車票的識(shí)別效果

一個(gè)超好用的開源OCR

 


一個(gè)超好用的開源OCR

 

火車票的識(shí)別效果還是要差一些,估計(jì)是訓(xùn)練的時(shí)候缺少這樣的數(shù)據(jù)

EasyOCR的安裝

EasyOCR依賴pytorch的環(huán)境,需要先安裝pytorch,這個(gè)安裝教程大家參考torch的官方安裝教程,在安裝好torch之后大家就可以通過pip直接來安裝EasyOCR

  • pip安裝
pip install easyocr
  • git安裝最新版本
pip install git+git://github.com/jaidedai/easyocr.git
  • 模型準(zhǔn)備

在安裝完之后,需要先下載好預(yù)訓(xùn)練模型,模型下載地址請(qǐng)參考git,下載好模型之后,將模型拷貝到~/.EasyOCR/model目錄下,如果找不到路徑請(qǐng)自行創(chuàng)建目錄或者執(zhí)行下面的語句(執(zhí)行之后會(huì)自動(dòng)創(chuàng)建目錄),測(cè)試代碼如下

import easyocr
reader = easyocr.Reader(['ch_sim','en']) 
print(result)
  • 不足之處

經(jīng)過測(cè)試,目前開源的模型在非印刷文字,例如火車票發(fā)票、身份證等識(shí)別效果不是很理想,估計(jì)主要還是缺少這方面的訓(xùn)練數(shù)據(jù)導(dǎo)致的,基于CRAFT的文字檢測(cè)模型對(duì)于曲線文字(例如印章等)的檢測(cè)效果很差。

分享到:
標(biāo)簽:開源 OCR
用戶無頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績?cè)u(píng)定