1、選擇適當(dāng)?shù)姆直媛?/span>
分辨率太高,會(huì)加長(zhǎng)掃描所用時(shí)間,并且會(huì)因?yàn)橐恍┓俏淖值募?xì)節(jié)被捕獲反而造成識(shí)別不正確,分辨率太低,OCR軟件因?yàn)樾畔⒘坎蛔悖矔?huì)造成識(shí)別率不高。一般大多普通五號(hào)印刷體選擇黑白模式下300dpi進(jìn)行掃描比較合適,當(dāng)然,如果所掃描的字體較大或較小,則可相應(yīng)降低或提高掃描分辨率。
2、選擇適當(dāng)?shù)牧炼?/span>
選擇適當(dāng)?shù)牧炼瓤墒箳呙柙屣@得黑白分明,掃描亮度的設(shè)定以掃描所得圖像中漢字的筆劃較細(xì)但不斷開(kāi)為佳,如果掃描所得的漢字輪廓?dú)埲陛^多,應(yīng)該增加亮度,如果有一些黑點(diǎn)或黑斑,則應(yīng)減小亮度。
3、放正欲掃描的原稿
雖然一些OCR軟件允許文稿有一定的傾斜,還可以通過(guò)識(shí)別軟件進(jìn)行傾斜校正,但這種校正效果并不是很令人滿(mǎn)意的。
4、做好版面分析
在版面分析中選擇與原稿相符的版面類(lèi)型,對(duì)一些復(fù)雜的版面,劃分合理的塊來(lái)進(jìn)行識(shí)別,這樣也能有效地提高識(shí)別正確率。
5、不斷完善用戶(hù)自定義庫(kù)
對(duì)個(gè)別掃描效果清晰,但OCR卻識(shí)別錯(cuò)誤的字,可以加到用戶(hù)自定義庫(kù)中,這樣下次就不會(huì)犯同樣的錯(cuò)誤,慢慢地識(shí)別正確率也會(huì)得到提高。
對(duì)掃描的圖片,我們還可以通過(guò)PHOTOSHOP等圖像處理軟件進(jìn)行處理,這樣你就可以得到令自己滿(mǎn)意的掃描圖片了。