Re: [無用常識] 關於認證圖的解碼 - 相關係數

看板HOT_Game (熱門遊戲)作者 (星羽)時間18年前 (2007/06/23 18:11), 編輯推噓1(102)
留言3則, 1人參與, 最新討論串3/3 (看更多)
※ 引述《secrob (錯失)》之銘言: : 終極的方法是,圖型識別,大概可以分幾步 : 1. 取得文字部分 : 可先算出圖片的histogram,理論上會分成幾群,每一群代表 : 一個字母、背景或做為雜訊的線,接著再分別對那幾群做dilation後, : 算出每群的左上角和右下角,如果長寬比很奇怪,例如某群的左上和右 : 下剛好是整張圖,則知道那群顏色為背景,如果是那些雜訊線,則長寬 : 比會差很大,如果是字母,則比例會接近1:1。 : 2. 前處理 : 接下來把那幾個認定為文字的那幾群做二值化,也就是背景變 : 為黑,前景為白,只要找到一個threshold即可,前提是前景和背景色 : 彩差多一點會比較好 灰階影像無法這樣辨認(死 利用視覺造成的文字無法這樣處理,如點出來的以及利用一堆雜線構成圖跟文的 : 3. 特徵截取 : 把一個找到的圖用線性代數的方法找其特徵值,PCA or LDA : or...但最好要有很多的圖來做訓練,把一些扭曲的字母都送進去做 : 訓練是最好的,但這裡要用人工切很多文字出來,如果是LDA則還要做 : 分類,需要大量人力 此處同意,但是文字切割除非自動化,否則人力不可及(一更新你就掛了) : 4. 辨識 : 經由特徵截取後會是一個較低維的數據,把這些數據送到 : 高斯Gaussian模型或高斯混合模型(GMM)中訓練,因為有二十六個字 : 母,因此只需要訓練二十六個model即可。 只有22個字母,不過字母假設去除位移,還包含傾斜、模糊、旋轉,會造成同樣的東西 無法去訓練或歸納出一個模組 : 5. 語意分析 : 一般來說市面上的文字辨識會根據上下文來做自然語言語 : 意分析以提高正確率,但我們這裡每個字母間沒什麼意義,但是 : 有一個很棒的利用點 - 母音和子音,因為這個很單純,所以就直接 : 假設母子母子或子母子母,例如有三個字 : 第一次 : 第一個字送 aeiouy 的model進去求機率,機率高者為辨識結果 : 第二個字送 子音  的model進去求機率,機率高者為辨識結果 : ... : 第二次 : 第一個字送 子音 的model.... :  第二個字送 aeiouy的model.... : ... : 到最後再把第一次和第二次機率高者視為辨識結果 這個不懂(囧 : ========================================= : 以上皆為嘴泡,且是直覺的做法,實際可能還有很多問題 這個我同意XD 因為我也在嘴砲(菸 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.134.32.95

06/23 18:15, , 1F
5在這邊無用
06/23 18:15, 1F

06/23 18:16, , 2F
然後他12 就是 文字切割除自動化
06/23 18:16, 2F

06/23 18:16, , 3F
3, 4 is very very difficult
06/23 18:16, 3F
文章代碼(AID): #16VF6vHW (HOT_Game)
文章代碼(AID): #16VF6vHW (HOT_Game)