對比數(shù)據(jù)庫:當(dāng)輸入文字算完特征后,不管是用統(tǒng)計或結(jié)構(gòu)的特征,都須有一比對數(shù)據(jù)庫或特征數(shù)據(jù)庫來進(jìn)行比對,數(shù)據(jù)庫的內(nèi)容應(yīng)包含所有欲識別的字集文字,根據(jù)與輸入文字一樣的特征抽取方法所得的特征群組。對比識別這是可充分發(fā)揮數(shù)算理論的一個模塊,根據(jù)不同的特征特性,選用不同的數(shù)學(xué)距離函數(shù),較有名的比對方法有,歐式空間的比對方法、松弛比對法(Relaxation)、動態(tài)程序比對法(Dynamic Programming,DP),以及類神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫建立及比對、HMM(Hidden Markov Model)…等的方法,為了使識別的結(jié)果更穩(wěn)定,也有所謂的專家系統(tǒng)(Experts System)被提出,利用各種特征比對方法的相異互補(bǔ)性,使識別出的結(jié)果,其信心度特別的高。

字詞后處理:由于OCR的識別率并無法達(dá)到,或想加強(qiáng)比對的正確性及信心值,一些除錯或甚至幫忙更正的功能,也成為OCR系統(tǒng)中必要的一個模塊。字詞后處理就是一例,利用比對后的識別文字與其可能的相似候選字群中,根據(jù)前后的識別文字找出合乎邏輯的詞,做更正的功能。字詞數(shù)據(jù)庫:為字詞后處理所建立的詞庫。OCR后的關(guān)卡,在此之前,使用者可能只是拿支鼠標(biāo),跟著軟件設(shè)計的節(jié)奏操作或僅是觀看,而在此有可能須特別花使用者的精神及時間,去更正甚至找尋可能是OCR出錯的地方。

一個好的OCR軟件,除了有一個穩(wěn)定的影像處理及識別核心,以降低錯誤率外,人工校正的操作流程及其功能,亦影響OCR的處理效率,因此,文字影像與識別文字的對照,及其屏幕信息擺放的位置、還有每一識別文字的候選字功能、拒認(rèn)字的功能、及字詞后處理后特意標(biāo)示出可能有問題的字詞,都是為使用者設(shè)計盡量少使用鍵盤的一種功能,當(dāng)然,不是說系統(tǒng)沒顯示出的文字就一定正確,就像完全由鍵盤輸入的工作人員也會有出錯的時候,這時要重新校正一次或能允許些許的錯,就完全看使用單位的需求了。結(jié)果輸出

白條、黑條的寬度不同,相應(yīng)的電信號持續(xù)時間長短也不同.但是,由光電轉(zhuǎn)換器輸出的與條形碼的條和空相應(yīng)的電信號一般僅10mV左右,不能直接使用,因而先要將光電轉(zhuǎn)換器輸出的電信號送放大器放大.放大后的電信號仍然是一個模擬電信號,為了避免由條形碼中的疵點(diǎn)和污點(diǎn)導(dǎo)致錯誤信號,在放大電路后需加一電路,把模擬信號轉(zhuǎn)換成數(shù)字電信號,以便計算機(jī)系統(tǒng)能準(zhǔn)確判讀。