OCR識別的技術(shù)流程解析1-創(chuàng)新互聯(lián)

一、 OCR識別預處理：灰度化（如果是彩色圖像）、降噪、二值化、字符切分以及歸一化這些子步驟。經(jīng)過二值化后，圖像只剩下兩種顏色，即黑和白，其中一個是圖像背景，另一個顏色就是要識別的文字了；降噪在這個階段非常重要，降噪算法的好壞對特征提取的影響很大。字符切分則是將圖像中的文字分割成單個文字——識別的時候是一個字一個字識別的。如果文字行有傾斜的話往往還要進行傾斜校正。歸一化則是將單個的文字圖像規(guī)整到同樣的尺寸，在同一個規(guī)格下，才能應用統(tǒng)一的算法。

創(chuàng)新互聯(lián)專注于企業(yè)網(wǎng)絡(luò)營銷推廣、網(wǎng)站重做改版、茂名網(wǎng)站定制設(shè)計、自適應品牌網(wǎng)站建設(shè)、成都h5網(wǎng)站建設(shè)、商城開發(fā)、集團公司官網(wǎng)建設(shè)、成都外貿(mào)網(wǎng)站制作、高端網(wǎng)站制作、響應式網(wǎng)頁設(shè)計等建站業(yè)務(wù)，價格優(yōu)惠性價比高，為茂名等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。

OCR識別的技術(shù)流程解析1

二、特征提取和降維：特征是用來識別文字的關(guān)鍵信息，每個不同的文字都能通過特征來和其他文字進行區(qū)分。對于數(shù)字和英文字母來說，這個特征提取是比較容易的，因為數(shù)字只有10個，英文字母只有52個，都是小字符集。對于漢字來說，特征提取比較困難，因為首先漢字是大字符集，國標中光是最常用的第一級漢字就有3755個；第二個漢字結(jié)構(gòu)復雜，形近字多。在確定了使用何種特征后，視情況而定，還有可能要進行特征降維，這種情況就是如果特征的維數(shù)太高（特征一般用一個向量表示，維數(shù)即該向量的分量數(shù)），分類器的效率會受到很大的影響，為了提高識別速率，往往就要進行降維，這個過程也很重要，既要降低維數(shù)吧，又得使得減少維數(shù)后的特征向量還保留了足夠的信息量（以區(qū)分不同的文字）。

OCR識別的技術(shù)流程解析1

三、分類器設(shè)計、訓練和實際識別：分類器是用來進行識別的，就是對于第二步，對一個文字圖像，提取出特征給分類器，分類器就對其進行分類，告訴你這個特征該識別成哪個文字。在進行實際識別前，往往還要對分類器進行訓練，這是一個監(jiān)督學習的案例。

四、 OCR識別后處理：后處理是用來對分類結(jié)果進行優(yōu)化的，第一，分類器的分類有時候不一定是完全正確的，比如對漢字的識別，由于漢字中形近字的存在，很容易將一個字識別成其形近字。后處理中可以去解決這個問題，比如通過語言模型來進行校正——如果分類器將“在哪里”識別成“存哪里”，通過語言模型會發(fā)現(xiàn)“存哪里”是錯誤的，然后進行校正。第二， OCR識別圖像往往是有大量文字的，而且這些文字存在排版、字體大小等復雜情況，后處理中可以嘗試去對識別結(jié)果進行格式化，比如按照圖像中的排版排列。

本文標題：OCR識別的技術(shù)流程解析1-創(chuàng)新互聯(lián)
文章位置：http://chinadenli.net/article18/doshgp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站內(nèi)鏈、企業(yè)網(wǎng)站制作、網(wǎng)站改版、App設(shè)計、網(wǎng)站營銷、移動網(wǎng)站建設(shè)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

OCR識別的技術(shù)流程解析1-創(chuàng)新互聯(lián)