閱讀475 字體下載    go 字體新聞


手寫數字體自動識別技術的研究現狀

更新時間:2019-07-15 16:43:11

手寫數字體自動識別其實就是我們手寫出來的數字通過計算機優化自動識別出來,它也是我們光學字符識別技術中的一項。我們國內的大多學者其實已經對自動識別技術有一些較為深入的研究,由此可見,我們國內對手寫數字識別技術非常的看重,且該技術具有非常重要的意義。現在市麵上最多的是聯機識別的服務,就是主要通過攝像或手寫板,計算機聯機在攝像或手寫板進行書寫,再通過字體下載書寫出來的筆跡或落筆情況的像素空間的位置進行自動識別,這個技術是已經較為成熟的情況,那麼我們現在主要是針對脫機手寫數字體自動識別技術進行研究,它所涉及到的圖像處理、統計、模式識別等等。現在這個技術是已經有非常廣泛的應用了,比如是銀行票據和文本信息處理等,這個技術還有很多的不足之處,因為數字的筆畫和字型的不同,可能會導致識別錯誤。本文就以脫機手寫數字體識別為主,對其所存在的問題和優點、缺點進行分別闡述。 
  一、預處理 
  預處理是我們的手寫數字體識別的必不可少的一部分,它其實主要就是在字符圖像中降噪、壓縮多餘信息,以此提高我們的自動識別率和係統的識別速度。首先:我們為了將圖像中筆劃進行清晰的展示,需要將我們的圖像顏色進行灰度化處理,沒有其他的顏色顯示,隻是調整亮度,通過常用的加權平均法,然後將圖像的亮度進行處理。然後,將我們得到的圖像進行二值化,二值化中我們不常用的是動態閥值法,因為它主要是根據像元的領域特征來自己適應的改變閥值,領域灰度變化太快,計算時間長,很麻煩。我們在圖像的采集中,拍攝的時候光照情況和我們的拍攝環境是會影響到圖像的展示,同時圖像的本身可能也會存在有損壞的情況,圖像的質量無法得到保證。為了得到高質量的圖像保證,提高係統的識別率,我們就需要采取相應的措施,增強圖像的主要方式是頻率域法和空間域法。我們常用的是空間域法,因為它非常的簡單易操作,速度快,同時處理效果也非常好;但不是頻率域法效果不好,它主要是因為太麻煩,操作的效率低,所以是非常不實用。 
  我們的圖像在采集時都是隨機選擇的,沒有一個統一的角度,所以在獲取的圖像,它的傾斜角度是不確定的,即使是有傾斜角度校正的情況,但是識別出來的效果卻是不一樣的,傾斜校正也就是將圖像的傾斜角度按照一定的角度、方向進行旋轉,我們常常使用的傾斜校正算法是:投影法、近鄰法,Hough變換法等等。我們一般現在使用的是基於小波變換與霍夫變換的圖像傾斜校正的算法:先是我們的原始圖像,進行灰度化得到灰度圖像;然後使用動態閥值得到二值圖像;通過小波變換,就有圖像整體概貌的形態了;再通過邊緣檢測,得出邊緣直線信息,最後再通過霍夫變換就有傾斜角度,最後的最後我們的圖像就校正成功了。 
  二、特征提取 
  特征提取是非常關鍵的,我們的圖像處理中需要保證有足夠的信息量,以此來得到圖像的較高識別率。我們的手寫數字特征常見的是結構特征和統計特征的,結構特征顧名思義就是主要在數字的結構本質上的特點;常用的特征提取是主要有:首先是粗網格,通過數字書寫的不同區域的黑色像素點的個數,計算出黑色像素占比。不管有沒有降噪,它注重的是整體的分布情況,使用中會自動抑製噪聲,圖像的識別率高。然後是18維特征,主要是在粗網格的基礎上二次改進,還有主元素分析法。 
  三、模式分類識別 
  模式分類識別是圖像特征提取後,將特征空間來劃分,脫機手寫數字識別可以分成單分類和多分類集成。我們使用字體下載網較多的還是多分類集成服務,也是現代社會的主流。我們的主流手寫體數字分類器有:基於距離的分類器:相對來說它的概念簡單,操作易上手,對小成本和低維等情況搓搓有餘,但是缺點也很明顯,就是太過絕對的代表點,容易出錯;人工神經網絡分類;支持向量機:它主要是針對的機器學習和模式識別問題;孿生支持向量機:還有待改進。 
  四、結束語 
  隨著現代社會的信息技術發展,手寫數字識別是已經廣泛應用了,且在該領域已經有非常重大的成果。本文就手寫數字識別服務中的預處理、特征提取、模式分類識別等,簡述它們的優點和缺點情況,通過以上的分析情況來看,讓讀者對手寫數字體自動識別技術有進一步的了解,希望有助於以後的手寫數字體自動識別技術的更進一步的研究。 

  上一個:go 公共藝術中的字體設計
  下一個:go 傳統文化在環境藝術設計中的融合