清華紫光OCR軟件功能
清華紫光OCR支持Windows環(huán)境下的GB、BIG5、JIS和Shift-JIS等多種內(nèi)碼。在印刷體漢字識別中還加入了MMX優(yōu)化技術(shù),使識別速度得到了很大提高。我們用它識別一頁A4大小的印刷體中英文混排的純文本文件,只用了幾秒鐘。而且識別率非常高,只有極個別的字出現(xiàn)了差錯。
在這個版本中新增了表格識別功能。選擇了識別表格的選項后,它會自動將表格的框線先識別出來,再對表格中的文字進(jìn)行識別。文字全部識別出來之后會將文字按原樣恢復(fù)到表格中。在這項測試中識別率也很不錯。但是在測試中我們的工程師發(fā)現(xiàn),當(dāng)文字與表格的框線距離較近時,它的識別效果就沒有那么理想了。
如果用戶想對一個圖文混排的文件進(jìn)行識別,則清華紫光OCR還具有版面自動分析功能。它自動對掃描的版面進(jìn)行分析,把應(yīng)識別的文字區(qū)域劃分出來,之后進(jìn)行識別。對于被劃分區(qū)域內(nèi)的文字有很高的識別率,而且速度同樣很快。不過遺憾的是,在這個版本中沒有提供版面自動恢復(fù)的功能,因此如果想把文件恢復(fù)成原來的版面,則還需要重新手動排版。
它的導(dǎo)出功能可以將帶有表格的文當(dāng)導(dǎo)出成為RTF格式的文件,從而允許用戶在Word等應(yīng)用程序中繼續(xù)進(jìn)行編輯。它還可以將掃描進(jìn)來的圖像格式轉(zhuǎn)換成TIFF、BMP或PCZ等格式,具有很大的靈活性。
它的批量識別功能可以讓用戶一次把多頁文稿全部掃描之后再進(jìn)行識別,避免了掃描一頁識別一頁帶來的麻煩。這一版本最多可實現(xiàn)10000頁的批量識別。
該版本還增加了一項非常實用的功能,就是手寫體的識別。有了這一功能,許多以前手寫的信件或文件就可以掃描到計算機(jī)中,識別出來后用電子文檔的方式進(jìn)行保存了。
不過目前的手寫體識別功能還不夠完全成熟,它對書寫有很高的要求,如每個字之間要有一定的間隔,不能有連筆的情況等。盡管如此,手寫體識別這一功能還是能夠在一定程度上減輕文字錄入工作的負(fù)擔(dān)。
該OCR還具有自學(xué)習(xí)功能,當(dāng)遇到有生僻字時,可以通過鍵盤輸入進(jìn)行學(xué)習(xí)。有了這一功能,用戶就可以自由地添加一些本來不“認(rèn)識”的字,大大拓寬了中文OCR系統(tǒng)的識別字符集。
清華紫光這一款專業(yè)版的OCR軟件,不僅可以對純文本文件進(jìn)行識別,而且可以進(jìn)行復(fù)雜的圖文混排和圖表文檔的識別,最大限度地把人們從繁雜的文字再錄入的工作中解脫出來。
清華紫光OCR軟件特色
1、識別率高、速度快:對于被劃分區(qū)域內(nèi)的文字有很高的識別率,而且速度同樣很快。
2、導(dǎo)出功能:可以將帶有表格的文當(dāng)導(dǎo)出成為RTF格式的文件,從而允許用戶在Word等應(yīng)用程序中繼續(xù)進(jìn)行編輯。
3、版面自動分析:對圖文混排的文件具有版面自動分析功能,它自動對掃描的版面進(jìn)行分析,把應(yīng)識別的文字區(qū)域劃分出來,之后進(jìn)行識別。
4、轉(zhuǎn)換圖像格式:將掃描進(jìn)來的圖像格式轉(zhuǎn)換成TIFF、BMP或PCZ等格式,具有很大的靈活性。
5、批量識別:可以讓用戶一次把多頁文稿全部掃描之后再進(jìn)行識別,避免了掃描一頁識別一頁帶來的麻煩,這一版本最多可實現(xiàn)10000頁的批量識別。
6、手寫體識別:手寫的信件或文件就可以掃描到計算機(jī)中,識別出來后用電子文檔的方式進(jìn)行保存。
7、自學(xué)習(xí):當(dāng)遇到有生僻字時,可以通過鍵盤輸入進(jìn)行學(xué)習(xí),用戶就可以自由地添加一些本來不“認(rèn)識”的字,大大拓寬了中文OCR系統(tǒng)的識別字符集。
8、漢字和英文混排、日文和英文混排、韓文和英文混排同時識別。
9、是唯一可以識別2萬多漢字的多體文字識別系統(tǒng),漢字識別國內(nèi)最優(yōu)。
10、支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內(nèi)碼,適合全球各個地區(qū)使用。TH-OCR還具有自學(xué)習(xí)功能,不論什么生僻字,都可以通過鍵盤輸入進(jìn)行學(xué)習(xí),大大拓寬了OCR系統(tǒng)的識別字符集。
清華紫光OCR使用方法
1.文件->打開,選擇要識別的文件,可以是tif、bmp、jpg格式的
2.命令->識別,會自動識別的
3.識別完成后,軟件左邊的樹狀欄里會有圖像文件名,用鼠標(biāo)點開哪個加號,就是識別后的文本文件
4.單擊它,軟件右邊上方是識別后的文本,下方是被識別的圖像文件
5.這時用鍵盤移動光標(biāo),就能查看圖像和對應(yīng)文本,并能直接改動文本
6.二值圖像就是只有黑白兩色的圖像,用windows自帶的畫圖軟件就能做出來
7.先用畫圖打開圖像,圖像->屬性,將顏色改成黑白,再存盤就得到二值圖像了
清華紫光OCR更新日志
1.修復(fù)若干bug;
2.優(yōu)化細(xì)節(jié)問題;
華軍小編推薦:
清華紫光OCR這款軟件完全傻瓜式操作,超級簡單,另外小編還推薦2345看圖王軟件、Free Photo Viewer、親寶寶PC助手、ACDSee v5.0.1.0006、廣聯(lián)達(dá)PDF快速看圖等相關(guān)軟件下載使用。
您的評論需要經(jīng)過審核才能顯示
有用
有用
有用