TW399188B - Method and apparatus for recognizing patterns - Google Patents
Method and apparatus for recognizing patterns Download PDFInfo
- Publication number
- TW399188B TW399188B TW087102143A TW87102143A TW399188B TW 399188 B TW399188 B TW 399188B TW 087102143 A TW087102143 A TW 087102143A TW 87102143 A TW87102143 A TW 87102143A TW 399188 B TW399188 B TW 399188B
- Authority
- TW
- Taiwan
- Prior art keywords
- vector
- special
- pattern
- module
- identification
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 51
- 239000013598 vector Substances 0.000 claims abstract description 451
- 238000003909 pattern recognition Methods 0.000 claims abstract description 74
- 238000000605 extraction Methods 0.000 claims abstract description 54
- 230000004044 response Effects 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 112
- 238000012549 training Methods 0.000 claims description 106
- 238000006243 chemical reaction Methods 0.000 claims description 103
- 230000009466 transformation Effects 0.000 claims description 75
- 230000006870 function Effects 0.000 claims description 46
- 230000000875 corresponding effect Effects 0.000 claims description 38
- 230000002079 cooperative effect Effects 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 13
- 241000894007 species Species 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012567 pattern recognition method Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 claims 1
- 241000406668 Loxodonta cyclotis Species 0.000 claims 1
- 239000000470 constituent Substances 0.000 claims 1
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 50
- 230000001149 cognitive effect Effects 0.000 description 30
- 230000008569 process Effects 0.000 description 26
- 238000012360 testing method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 9
- 230000003042 antagnostic effect Effects 0.000 description 7
- 230000019771 cognition Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 241000269333 Caudata Species 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 240000002853 Nelumbo nucifera Species 0.000 description 2
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 2
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 241000272168 Laridae Species 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 239000002893 slag Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
經濟部中央標準局員工消費合作社印製 A7 B7__—__ 五、發明説明(1 ) · 尤發明之菊城 本發明傺關於一種圖型辨識裝置及一圖型辨識方法, 且特別是集合不同辨識模組以改善辨識正確性的一種圖蛩 辨識方法。 龙發明夕背兽 對涉及圖型辨識的資訊處理之需求目前是大的並快速 增大中;圖型辨識被使用在如以電腦實施的影像處理、本 ..文處理、及語音處理之應用中;結果,在圖型辨識技術上 的改進是極需要的。 圖型辨識偽處理藉其如一影像、手寫、或印刷字體或 一語音的一實體現象被轉換成代表該現象的一電子信號, 一決定被做於在該現象屬於的種類中之多數可能種類之一 ,且産生指示該被決定種類的一密碼;例如,在字體辨識 中,如字”A”的一未知印刷字體可被一電子掃瞄器所掃瞄 ;該掃瞄器産生代表含有代表該未知字體的數千位元組之 一陣列的一圖型的一電子圖型信號;然後該圔型信號被分 析以決定在對應字體A-Z的種類集合中該未知字體屬於那 一個種類;然後産生識别此種類如該未知字體之種類的一 密碼;例如,代表字A的ASCII密碼33可被産生。 圔型辨識處理較佳藉使甩從該圖型信號抽出的圔型特 徵而非使用原始的圔型信號而被實施;處理從該圔型信號 抽出的特徽是較佳的因為這些特徽經常被處理得比該原始 圔型信號更快、更正確和更廉價;如果含有極大量之資訊 的圔型信號被處理,則有時特徵被抽取,且該特徽必須被 •_ — 4 — _ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閱讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 Α7 Β7 五、發明説明(2 ) 處理;圖型辨識之一目的在藉代表使用從該圖型信號抽取 的特徽之該等圔型而壓縮該資訊;當然,該特擻必須以不 損害該圖型辨識處理辨識該圔型的能力之一方式而從該圖 型信號被抽取。 —圔型P之特徵f通常被特徽成分x(p; 10)的一有限數目 Μ之一集合{»〇;1〇)3=1,2,3,...,11}所定義;特徵亡可觸知 地和量性地代表該圖型之特質;結果,因為特激f僳被其 之第π項成分是特歡成分x(P;ra)的一 Μ度空間向量所代表, 故特徵f之向量代表是特徽向量X(P) = (x(P;l),x(P;2),... ,Χ(Ρ;Β)Γ ;引數P指出待徽向量X(P)是圖型P之特徽向量 ;上標t註明向量換位。 既使該等特徵成分是量性的,它們可被量化和使用; 如果圔型P受到各種變形,則特徽成分Χ(Ρ;Π)之數值 改變;結果,特徵向量χ(ρ)改變;然而,只要變形的圔型 屬於它原來的種類,該圖型辨識處理必須辨識它如屬於該 種類。 被特定如傺屬於一特殊種類圔型之代表性或如傺該種 類之一特徽之代表性之一特殊圖型被稱為該種類之參考圔 型;該特定圖型之特徵向量被稱為該種類之參考向量;如 對該種類之一替代使用一特殊圖型如該參考圔型的,藉平 均屬於該種類的圔型而獲得的假設圖型可被使用如該參考 圖型,耳如此假設圔型之特徵向量可被使用如該種類之參 考向量。 在圖型辨識中,一未知圔型Ρ被接收且一圔型辨識處 -R- 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) -裝. ,1Τ 經濟部中央標準局員工消費合作社印製 Α7 Β7 五、發明説明(3 ) ' 理被實施;該圖型可決定是否該未知圖型是相似於一已知 圖塑q,或決定該未知圔型屬於那一痼種類;圖型辨識在 辨識圖式、字髏、字象、影像、和語音上是重要的;關於 圖型辨識和圔型辨識問題之一般資訊可在參考i,卡索那 •卡逹,Ed.的”圔型辨識和它的應用》可羅納公司(19?8) (在日本)和參考2,希德米處歐嘎瓦,Ed.的”在圔型辨 識和瞭解的新發展一挑戰”典旭約后初信嘎凱( 1992)( 在日本)中找到。 其中該等未知圔型是字體圖型的圔型辨識之例子將在 下逑在瞭解到在該描述中設下的原理可容易地施用於其它 形式的圔型辨識,如影像辨識和語音辨識;字體圔型偽代 表字母、數目、漢字及類似者的圖型;代表一字體的一圖 型從現在起被參照如字體圔型;字體圔型之可能特徵成分 之例子包括: 該字體之長寬比例, 水平線之數目, 迴路之數目, 是否重簦在該字體上之各方格是黑或白的, 在一特定方向有一直線的交叉點之數目,及 該字體圔型之一傅立葉轉換的轉換傺數。 如上所列的一集合特徵成分被使用以構成特徵向量使 得結果的特激向量可最佳地代表在該字髏集合中的字體; 各特徵成分之動態範圍被選取以改善稍後被描逑的圖型辨 識之正確性;當需要時該特徽成分可藉使用標準離散而正 —*" — 本紙張尺度適用中國國家標準(CNS ) A4規格(210Χ:297公釐) >;---,—----裝— (請先閱讀背面之注意事項再填寫本頁) 訂 1^ 經濟部中央標準局負工消費合作社印製 A7 B7 五、發明説明(4 ) 常化。 圖型辨識産生對受制於圔型辨識的各宇體圖型的一種 類名稱;種類密碼代表讀取、意義、或該字體圖型之密碼 ;例如,字體” 所屬的種類之種類名稱可以是”種類A” ; 如上注意的,屬於該種類的一特定字體圖型被選為該種類 之參考圔型;替代地,藉平均屬於一種類的多數字體圖型 所得的一假設圔型可被用為該參考圖型;該參考圔型之特 歡向量被採用為該種類之參考向量。 在圖型辨識之中心傺具有決定代表屬於種類A的字體” A”之所有未知字體圖型的目標之一辨識處理器,不管該字 體圖型是否被變形,且甚者,如此字體圔型不屬於非種類 A的種類。 在字體圔型觀察和讀取後被一字體辨識裝置實施的處 理通常被分成實施字體圔型預處理、特徽抽取、及辨識的 一条列之處理模組;各處理模組可主要藉使用一電腦而實 施並被實施一特定集合之操作的電腦所實現;包括字體圔 型之觀察的所有處理模組影饗被該辨識模組産生的結果。 用以増大字體辨識之正確性的策略為最大化辨識比例 並將誤辨識比例減至零;該辨識比例為應屬於被正確地辨 識如屬於該種類的各種類之字體圖型的分數;該誤辨識比 例為不靥於被誤辨識如屬於該種類的各種類之字體圖型的 分數;特別是,許多應用強烈要求不發生誤辨識,亦卽, 例如不屬於種類A的字體画型必須不被安置於種類A。 各輸入圖型可被視為一對應理想圖型之一捲曲或一修 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閱讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(5 ) ' 正;如此修正可被視為在該修正降低該圖型辨識裝置辨識 該圖型之能力的感凳上之預處理之一反形式;此負性預處 理必須為當試圔改善用於字髏圖型的一圖型辨識裝置之表 現時被考慮的目標因子之一。 改善一圔型辨識裝置之辨識正確性的已知方法具有加 上的回授控制函數,如基於辨識結果而調整被各處理模組 實施的處理;並對被辨識模組實施昀處理做了各種改變。 參照於上逑的字體圔型預處理包括正常化一輸入字體 圔型之尺寸、傾斜、位置、及線密度,以及如污點和抓痕 的噪音之去除。 參照於上逑的特歡抽取分析一輸入字體圔型以決定代 表被該宇體圔型所代表的字體外形和其它特徴的特徽成分 之數值;該字體圔型之特徵向量從該等特徽成分而構成; 特徽成分之數目典型上是數百個之等级,例如380或500, 但可大至數千;産生一字體圔型之特徵向量之一方法為假 設地將該字體圔型重昼以一 64x64棚格且然後決定是否各 方格被該字體圖型之一劃所镇充;如果該方格被填充,則 數值1被置於該方格;否則,數值〇被設置;各方格可被視 為一特徽成分,且其之元件是〇和1的一 4,096度空間的特 擻向量被産生如該字體圖型之特徽向量。 在另一例子中,在字體辨識中的另一有效特徽是例如 在該劃(在字母A中的2)中端點之數目、迺路之數目(在 字母A中的1)、彎曲黏之數目(在字母A中的1)、分支點 之數目(在字母A中的2)、交叉點之數目(在字母A中的0 一 Pt — 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) - ,裝 訂 \J^. (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 Α7 Β7 五、發明説明(6 ) )、及它們位置之一集合;然後,與一所需辨識正確性一 致的特擻成分之最小可能數目被選取,且有維度之對應數 目的一特徵向量被構成;雖然增大該特徽向量之維度數目 傾向於增大辨識正確性,増大維度數目也增大所需的處理 時間和記憶髏容量。 . 在參照於上述辨識模組中,從各輸入字體圖型抽取的 該特徽向量被匹配於在該種類集合中的各種類之參考向·章 以決定該輸入字體圖型所屬之種類;在字體辨識處理開始 前該參考向量被決定並處存在一辨識字典中;該參考向量 是特定於該未知字體所靨的字體集合並於在其中字體辨識 被實施的特殊方式;該辨識字典包括一集合參考向量,對 在該種類集合中各種類的至少一参考向量;辨識模組經常 使用一相似函數或一距離函數作為一辨識函數以決定該未 知字體圖型所屬的種類;在字體圔型和參考圖型間的距離 可被視為在如被該參考圖型所代表的字體圖型和該種類間 的距離;特別是,在該字體圚型之特徽向量和該參考圔型 之參考向量間的距離可被視為在該字體圔型和該種類間的 距離。 當該辨識模組使用一距離函數時,童测在字體圖型間 距離之一方法被定義,且在輸入宇體圖型和各種類間的距 離被量測;一般上,該距離越短,該等字體圔型越相似; 其之特徽向量在某一種類之參考向量之一固定距離中的一 輸入字體圖型可被說是屬於該種類;替代的,一字體圖型 可被説是屬於最近參考特徽向量所屬的種類。 -5- 本紙張尺度適用中國國家標準(CNS ) A4規格(210Χ297公釐) Ξ-----;---------:ΐτ—------- (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(7 ) ‘ 當該輸入字體之特徵向量如在上述例子中被定義時, 辨識模組計算在其之元件是1和〇的4,096度空間特徵向量 中的漢明距離(相互不同元件之數目);一輸入字體被説 是屬於其之參考向量傺在從該輸入字髏之被抽取特徵向量 的一漢明距離100中的種類。 漢明距離在從該輸入字體圔型所抽取的特徽向量和在 該種類集合中所有種類之參考向量間被計算;對其該漢明 距離是最短的種類被決定是該輸入字體圖型所屬.的種類。 在一輸入字體圔型被說是屬於其之參考向量從該輸入 字體圖型之特徵向量是最短距離的種類前額外的條件可被 加上;如此額外條件之例子傺該最短漢明距離必須小於一 第一臨界值,且在該最短漢明距離和第二最短漢明距離間 的增量必須大於一第二臨界值。 在一高度正確字體辨識處理之其它例子中,該辨識模 集合可使用決定一歐幾里得距離的一距離函數、決定一加 權歐幾里得距離的一距離函數、或一二項式辨認函數作為 它的辨識函數;已知到如此辨識函數之辨識正確性可藉使 用一訓練處理而被增大以改善該辨認函數和字髏辨識字典 ;被發明者在”藉認知距離函數的手印數量辨識”,!1!^!^· of THE IEICE, Vol. J-7S-D-11, No.9, PP.1851-59 (參 考3)中所描述的藉辨認分析的認知(LDA)考慮到藉訓練 該辨認處理的字體圖型之變形;此參考以一些細節額外地 描述傳統的字體辨識處理,故撿視此參考提供一良好基礎 以較佳瞭解下面所逑之發明。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 1---Γ,----------IT------ (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 ____BZ_;__ 五、發明説明(8 ) * _ 藉辨認分析的認知使用費雪的線性辨認分析.;LDA方 法之部分現在將使用不同於在下面所討論的參考3中所使 用的字象表示的字象表示而被描逑;在藉辨認分析的認知 中,給一加權歐幾里得距離的一距離函數被訓練並儲存在 該辨識字典中;特別是,該距離函數之加權向量和常數項 與該參考向量被認知。 一已知輸入字體圖型P被輸入該辨識裝置作為一訓練 圖型並首先受到傳統處理和特徵抽取以獲得特徵向量X (P) = (χ(Ρ;1),χ(Ρ;2),...,χ(ρ;π),‘..,χ(ρ;1〇)、 在種類集合{Κ}中的各種類Κ之該參考向量R(K) = (r(K; 1),Γ(Κ;2),...,Γ(Κ;Β),...,ι:〇ί;Η))* 被給予,且在輸入 字體圖型Χ(Ρ)和在該種類集合中各種類之參考向量R(K)間 的加權歐幾里得距離D(p,K)被計算;該加權歐幾里得距離 使用下式被計算: Μ D(p5K) = D(X(p),R(K))=Z α> (Κ; m) (χ (ρ; ra) - r (Κ; ι))a (1) 為了精確,D(p,K)給予距之平方,在此它簡稱為距離。 在此,ω(Κ;ιπ)是第a項加橹因子並是加權向量W(K) = ( ω (Κ;1),ω (K;2),...,<y (K;m),...,〇) (ΚΙ))* 之一元件 ;字體辨識字典L({iU)儲存需要實施辨識操作的參數;典 型的參數包括該參考特徽向量K(K)和該加權向暈W(K) ; ίΚ} 指示種類Κ是一構.件且該輸入字髏可屬於的整集合種類; 在匹配操作中,該參考宇典提供用於在該種類集合中各種 類的一參考向量;結果,關於種類集合{Κ}的辨識字典被 指定如L({K})。 本紙張尺度通用中國國家標準(CNS)A4規格(2i〇x297公瘙IΓ_ πίν- -- i* fm t— nv —^ϋ mfΛ·^1^1 (請先閲讀背面之注意事項再填寫本頁). 訂- 經濟部中央標準局員工消費合作社印製 A7 B7 -五、發明説明(9 ) • . - 雖然距離函數之上逑格式被使用以決定用於在該種類 集合中的所有種類的加權歐幾里得距離,在該距離函數中 所用的參數被設定於對各種類的特定數值;在被LDA之認 知後的距離函數不同於基於滿足該距離公式的一般定義的 一傳統距離函數;基於LDA的辨識函數増大在圖型間的差 異。 . 在If面的描述中,瀚入字體圖型P實際屬於的種類將 被K(p)指定;在基於LDA的圔型辨識操作中,該認知操作 藉使用訓練圖型,亦即種類已知的字體圖型而實施;在各 輸入字體圖型和各種類間的修正歐幾里得距離D(p,K)為在 該種類集合中的各種類K被決定;該辨識模組決定輸入字 髏圖型P屬於種類iU(p)其之決定的修正歐幾里得距離D(p, K)為最小;然而,在某些情況中,被決定的種類1U(p)將 不同於輸入字體圖型P實際所屬的種類K(p);在此情形中 ,該輸入字體圖型被.誤辨識;在其它的情況中,在距離D( p, K)和D(p, K)間的増量一方面在输入字髏圖型和種類K*間 和另一方面和種類Ka間是小的;種類Kt不同於種類Ka ;對 此種字體圔型,辨識結果K(p)不能以一高度自信説是正確 的;被不正確地安置或不能以一高度自信說屬於一種類的 一字體圔型可以下列方式之一被特性化: (1) 實際靥於不同於種類Κ的一種類但該辨識模組誤 辨識為屬於種類Κ的一宇體圔型將被稱為屬於種類Κ的一錯 誤字體P〇e。 (2) 實際屬於不同於種類K的一種類但該辨識模組近 本紙張尺度適用中國國家標準(CNS ) A4規格(210X:297公釐) 卜---.-------J裝II (請先閱讀背面之注意事項再填寫本頁.)
、1T ii^·. 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(10 ) ' 於誤辨識為屬於種類K的一字體圔型將被稱為屬於種類κ的 —近似錯誤字體ρβη。 項目P〇e*P〇nS在被發明參考3中所使用的項目,參 照於上並描述構成種類K的對抗圔型集合的兩型式之對抗 圔型Por·;在LDA中,該加權向量和常數項與該參考向量被 認知使得所有對抗圔型Por被保持從種類K的至少一最小距 離;該認知處理可對所有種類或只對那些誤辨識最容易發 生的種類而實施。 種類K之該對抗圖型集合被Ω r(K)指定且種類K之在種 類圖型集合被Ω。(1〇指定;種類K之在種類圔型集合包含 有被定義為屬於種類K的訓練圔型;該認知處理決定傺數 {a(m);n^l至M}、{b(si);iB = l至M}、及g使得這些偽數做成 被下面方程式所給的辨認函數Ρ(Χ(Ρ),β(Κ)),當_練圖型 是在種類圖型集合Ω“Κ)之一構件時其是負的且當該訓練 圖型是對抗圖型集合Ω r(K)之一構件時其是正的;在此處 理中,屬於種類K之在種類圖型集合的訓練圖型之特徽向 量之平均值被使用在種類K之參考向量R(K)中;該辨認函 數使用下式而計算·' Μ F(X(p),R(R)) = Za(m)(x(p;ffl)-r(K;i))a m= 1 Μ + Σ b(m)(x(p;m)-r(K;m))2 + c(K) (2) 因為辨認函數F(/(_p),R(K〉)對在種類圖型集合β e(K) 是負的,F(X(p),J?(K)) = c<0。 辨認函數FU(P),R00)然後被因子Y加權且結果被加
於在上面方程式(1)中定義的原始距離;因此,距離D(X(P -13- ’ 本紙張尺度適用中國國家標準(CNS ) A4規格(2丨OX 297公釐) (請先閱讀背面之注意事項再填寫本頁)
A7 B7 五、發明説明(11) ' ),R(K))變為如下式所定義的新距離G(X(P),R(K)) ί 8(X(p),R(R))=G(p,K)=D(X(p),R(K))+YF(X(p),R(K))
M =Σ (ω (Κ;β) + Δ ω (K; m)) { (κ (p; m) -(r (K; m)+ Δ r (K; π))}2 + d(K) (3) 在方程式(3)中的加權因子Y是一正的數目且被實驗地 決定;加權因子之數值被選取以最大化越過在種類集合 中的所有種類的辨識正確性;該等測試使用公菜獲取的字 體資料庫或獨立編輯的字體資料庫;經常,該認知操作藉 使用在該字體資料庫中一部分之宇體圖型而實施且該字體 圔型之剩餘者被使用以驗證該認知操作之結果。 如實施該認知操作之一結果的,加櫂向量、參考向量 、及常數項以有被加的常數項d(K)之格式被認知;該新參 考向量和加權向量分別被指定如: Τ(Κ) = (γ(Κ;1) + Δ r(K;l)_____ (γ(8;Μ) + Δ γ(Κ;Μ))* (4) 及 U(K) = (<y (Κ;1) + Δ ω (Κ; 1),., (ω (Κ;Μ) + Δ ω (KjH))* (5) 常數項d(K)、加權向量U(K)、及參考向量Τ(Κ)被儲存 在該辨識字典中;次者,使用G(X(p),R(K))並包括該常數 項的辨認被實施,且從此辨認致出的新近産生的對抗圖型 被加於各種類之該對抗圖型集合且該認知處理被重覆。 在上述的例子中,因為在從該等原始的特擻向量之型 式中該等特徽向量和辨認函數並未改變,故該認知處理之 範疇被限於一部分之辨識處理;此部分包括該辨識字典之 内容。 組成多重不同辨識處理以改善字體辨識正確性的圖型 本紙張尺度適用中國國家標準(CNS ) A4规格(21〇X297公釐) --.------γ j 燊-- (請先閱讀背面之注意事項再填寫本頁) 、-° -ί 經濟部中央標隼局員工消費合作社印製 經濟部中央標準局員工消費合作社印製 A7 . ___B7___ 五、發明説明(12 ) ’ 辨識方法為已知;特別是,使用從該圔型抽取的不同特徵 的辨識處理之組合為已知;該待徵可能不同於它們的型式 和在它們中特徵成分之數目;更甚者,使用不同辨認函數 的辨識處理之組合已被嘗試了;辨識處理之各個可能的組 合在改善辨識正確性是有效的;然而,使用多重辨識處理 之傳統方法簡單地組合至少兩値獨立發展的辨識處理;並 没f指出如設計一辨識處理以高度正確性辨識不被其它的 辨識處理所辨識的字體之更有效的量測已被取用了;結果 ,限制在從使用兩傳統辨識處理之一組合致使的辨識正確 性中的改善。 所需要的是一圖型辨識裝置和方法,其中辨識正確性 藉積組使特性被設計的兩Μ辨識處理而改善,使得不能以 高信賴度被該等辨識處理之一所辨識的那些圔型以最高可 能正確性被其它辨識處理所辨識。 也需要的是一圔型辨識裝置和方法,其中兩値辨識處 理以最小化正確地被單獨操作的辨識處理之一所辨識但被 一起操作的辨識處理所誤辨識的圖型百分比之一方式而被 積組。 最後,所需的是一圔型辨識裝置和方法,其中兩個辨 識處理被積組且其中被該等被積組辨識處理的認知可易於 實施。 本發ΒΒ :>總结 本發明提供一圔型辨識裝置其包含一輸入部段、一特 徽抽取模組、一特徵轉換模組、包括一辨識字典的一辨識 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X2S»7公釐) (請先閱讀背面之注意事項再填寫本頁) 一裝. .1Τ 經濟部中央標準局員工消費合作社印策 ^ A7 B7 ** 一 ·- 五、發明説明(13) ' 部段以及一分類器;該輸入部段接收包括屬於構成一種類 集合的多個種類之一的一圖型之輸入圖型;該特徽抽取模 組將該圖型之特戡表達為一特徽向量;該特戡轉換模組使 用轉換向量矩陣以轉換至少部分之特徽向Μ以産生對應於 各種類的一至少部分地轉換的特徽向量;該辨識字典儲存 用於各種類的匹配資訊和第一轉換匹配資訊;該第一轉換 匹配資訊己藉使用該等轉換向量矩陣而被轉換;該辨識部 段藉實施在至少從一方面對應於各種類的至少部分地轉換 的特徽向量所導出的至少一匹配向量與在另一方面的匹配 資訊和該第一轉換匹配資訊之間的一匹配操作而産生用於 各種類的至少一不同數值;該分類器反應於該至少一不同 數值而辨別該圔型所屬的種類。 一實施例額外地包含一可靠性決定模組,該特歡轉換 模組轉換所有的特徵向量以産生對應於各種類的一轉換的 特徵向量,旦該辨識部段包括第一辨識模組和一第二辨識 模組;該第一辨識模組對各種類藉實施在該匹配資訊和從 該特徵向量導出的一第一匹配向量間的一匹配操作而產生 一第一不同數值;該第二辨識模組對各種類藉實施在該第 一轉換匹配資訊和對應於各種類從該第一轉換特擻向量導 出的一第二匹配向量間的一匹配操作而産生一第二不同數 值;該可靠性決定模組接收用於各種類的該第一不同數值 並指出何時基於用於各種類之該第一不同數值的圔型辨識 將為可靠;該分類器反應於只用於各種類的第一不同數值 或用於各種類的第一不同數值和第二不同數值而辨別該圖 -_ — 1 R — __________ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) . 、 裝 、ΤΓ (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(14 ) 型所屬的種類;該分類器只反應於該第一不同數值辨別何 時該可靠性決定模組指出基於該第一不同數值的圔型辨識 將為可靠。 本發明也提供用以辨識圖型的一種方法,其中輸人圖 型被接收且該圖型之特徵被表逹如一特擻向量;該等輸入 圔型包括屬於構成一種類集合的多痼種類之一的一圔型; 該特徽向量之一最小部分藉使用轉換向量矩陣而被轉換以 産生對應於各種類的一至少部分地轉換的特徵向量;一匹 配操作在従一方面對應於各種類的至少部分地轉換的特徽 向量所導出的一匹配向量,與另一方面對各種類的匹配資 訊和轉換匹配資訊間被形成;該匹配操作産生用於各種類 的至少一不同數值;該轉換的匹配資訊傷已藉使用該轉換 向量矩陣而被轉換的匹配資訊;最後,該圖型所屬的種類 反應於至少一不同數值而被辨別。 - 該轉換向量矩陣包括用於U)屬於該種類集合的一種 類、或(b)包含屬於該種類集合的多數種類的一種類子集 合之一轉換向量矩陣;該轉換向量矩陣可藉接收其之對應 種類被定義並將訓練圔型之特徽表達如特徵向量的訓練圔 型而被産生;該訓練圔型對應地所屬的種類藉實施在從該 等特徵向量而導出的第一匹配向量和該匹配資訊間的一匹 配操作而被辨別.;該訓鍊圔型被辨別為所羼的種類被與該 對應定義的種類作比較以分別對(a)該種類、或(b)該種類 子集合定義一對抗圔型集合;一平均向量從被定義為分別 屬於(a)該種類、或〇〇該種類子集合的所有訓練圖型之特 __ ._-17- ._ 本紙張尺度適用中國國家標準(CNS ) A4規格(2H)X297公釐) 裝 訂 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局負工消費合作社印掣 A7 _ B7 _ 五、發明説明(15 ) ‘ 徵向量被決定;一不同向量對屬於該對抗圖型集合的各訓 練圖型藉使用該平均向量而被計算;該等不同向量之一自 動相關矩陣被計算;最後,該自動相闋矩陣之特性向量被 採用為分別構成該轉換向量矩陣(a)該種類、或(b)該種類 子集合的轉換向量。 對屬於該轉換集合的一種類的該轉換的辨識資訊可藉 接收其之對應種類被定義且將訓練圖型之待徵表逹為特徽 向量的訓練圖型而被産生;該等訓練圔型對應地所屬的種 類藉實施在從該特徵向量導出的一第一匹配向量和該匹配 資訊間的一匹配操作而被辨別;該等訓練圔型被辨別為所 屬的種類與對應定義的種類作比較以對該種類定義一對抗 圖型集合;該等訓練圔型之特徵向量藉使用對(a)該種類 、或(b)該種類所屬的一種類子集合的轉換向量矩陣而被 轉換以産生對應轉換的特徵向量;該種類子集合包含屬於 該種類集合的多個種類;一辨認分析藉使用該轉換的特徽 向量而被實施以産生一辨認函數;一修正的不同數值在該 等訓練圖型和各種類間藉使用該辨認函數而被計算;該等 訓練圔型分別所屬的種類反應於對各種類的修正的不同數 值而被再辨別;該等訓練圔型被辨別為所屬的種類反應於 該等修正的不同數值與該對應的定義種類作再比較以決定 額外的圖型是否被誤辨識為屬於該種類,·當沒有額外的圖 型被誤辨識時該轉換的辨識資訊藉使用該辨認函數而産生 ;否則,該額外的圔型被包括在該種類之對抗圔型集合中 ,且該辨認分析之賁施、修正的不同數值之計算、種類之 本紙張尺度適用中國國家標準(CNS ) Μ規格(210X297公釐) ^---,-----}.裝-- (請先閱讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 Α7 Β7 五、發明説明(16 ) ’ 再辨認和再比較操作被重覆直到没有額外圖型被誤辨識為 止。 圖式篛蜇説明 第一圔傺根據本發明的一圔型辨識裝置之一第一實施 例之一方塊圖; 第二圖像陳示如何被該圔型辨識裝置所使用的轉換向 、量矩陣被産生的一流程圔; 第三圖偽陳示如何被使用以在該等轉換的特徵向量上 實施圔型辨識的辨識字典被産生的一流程圔; 第四圖僳根據本發明的一圔型辨識裝置之一第二實施 例之一方塊圖·· 第五圖傺根據本發明的一圔型辨識裝置之一第三實施 例之一方塊圔; 第六圖葆根據本發明的一圖型辨識裝置之一第四實施 例之一方塊圖; 第t圔偽根據本發明的一圖型辨識裝置的併入一實施 例之一圔型辨識設置之一方塊圖。 太發明_細銳昍 在下面的描逑中,術語”差異數值”將被瞭解包含下面 之參數,及任何其它參數或量化茌雨向量間的相似點或不 相似點:一距離函數之距離數值、一相似函數之數值、一 二次辨識函數之數值、一辨識函數之數值、另一辨識函數 之數值、或如此函數之一組合之數值;在LDA中平方數值 之數值偽一差異數值之另一例。 本紙張尺度適用中國國家標準(CNS ) A4規格(210Χ:297公釐) ;---.-----)¾------1T----- (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(Π ) 在根據本發明之圔型辨識裝置和方法中,兩不同辨識 模組決定在特性化輸入字體圔型的一匹配向量和在儲存在 該辨識字典中的種類集合中的各種類之參考向量間的一差 異數值;因為特歡向量不需要未改變的從該輸入圖型抽取 而可能受到一特徽轉換旦額外地或替代地可使它們維度之 數目被縮減,故在此掲露中特徽化該等輸入圖型之向量被 稱為匹配向,0 根據本發明的圔型辨識裝置之實際實施例不被使用以 實施使用訓練圔型的認知處理;取代地,如此一實際實施 例之一模式被模擬且該認知處理藉使用該模式而實施;在 該認知處理之終點,被該認知處理所産生的結果被傳送到 該裝置之實際實施例作為在真實圖型辨識中之使用;在本 發明之下面描述中,除非它將否則是混淆的,該圔型辨識 裝置之實際實施例和此裝置之模式是不區分的。 根據本發明之圖型辨識裝置包括分別配備有第一和第. 二辨識字典的第一和第二辨識模組;該圔型辨識裝置可實 施一字體辨識操作或一認知操作在其中之辨識字典被最佳 化;在簧施該認知操作中,該圖型辨識裝置首先從屬於一 所予種類的一訓練圖型抽取一特擻向量並藉將該第一辨識 字典匹配於關於該特徵向量的一第一匹配向量而獲得一第 一差異數值;然後該第二辨識模組藉將該第二辨識字典匹 配於鷗於該特徽向量的一第二匹配向量而産生一第二差異 數值;該第二匹配向量包括藉使用轉換向量矩陣而轉換至 少一部分之該特徽向量所獲得的一轉換的特徵向量;最後 --- —· ? ft — 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閱讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(IS ) ' ,該訓練圖型之種類從該第一和第二差異數值被決定。 該圔型辨識裝置使用上述處理以實施一圖型辨識操作 ,·在此中,一未知輸入圔型取代訓練圖型被處理。 在該認知操作中,該圖型辨識裝置額外地從(1)從該 等種類之至少一個第一差異數值而決定的對抗圖型和(2) 屬於該種類的訓練圖型而決定特性向量;又,該圖型辨識 裝置實施上述處理直到在含有屬於在該種類集合中有的 種類的訓練圔型的訓練圔型集合中的所有訓練圔型之種類 已被決定為止;次者,該圖型辨識裝置決定在該訓練圖型 集合上所實施的圖型辨識之辨識正確性;此藉將該訓練圖 型真實所羼的該等種類比較於從該第一和第二差異數值所 決定的種類而被決定;最後,該第二辨識宇典以被設計增 大辨識正確性之一方式而被修正,並且在該訓練圖型集合 中的所有訓練圖型之種類被再決定和該辨識正確性被再決 定。 在本發明之一實施例中,該第一匹配向量包括從各訓 練圔型抽取的特徽向量之所有特徵成分,且該第二匹配向 量包括藉轉換包括從該訓練圖型抽取的特徽向量之所有特 徽成分的一向量所獲得的一轉換的特徵向童。 在本發明之另一實施例中,該第一匹配向量包含從該 訓練圔型抽取的特徴向量之第一群特徵成分;該第二匹配 向量可包括藉轉換含有從該訓練圖型抽取的特徽向量之不 同於該第一群之一第二群的一向量所獲得的一轉換的特徵 向量。 .妙.- ._ —71 — 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) K---^-----裝-- (請先閱讀背面之注意事項再填寫本頁)
、tT d. 經濟部中央標準局一貝工消費合作社印製 A7 B7 五:發明説明(19 ) 當被需要以保存需要以提供該圔型辨識裝置的計算源 時,該第一匹配向量可具有一縮減數目之維度並可含有從 該訓練圖型抽取的特徽向量之一第一群特徽成分。 因為根據本發明之圔型辨識裝置和方法通常以一電腦 或數位信號處理器而物化,本發明可額外地以如一磁碟或 快閃記億體的一記億髏裝置被物化,在其上存有被設計以 ..指導該電腦實施上逑處理的程式。 根據本發明物化該圖型辨識裝置和能夠根據本發明而 實施該圖型辨識方法的一圔型辨識糸統之一例含有與一終 端機連通的認知中心;該終端機儲存該辨識字典和該轉換 向量矩陣並實施決定輸入字體圔型之種類的函數;該終端 機在該辨識字典和該轉換向量矩陣上作此決定;反應於在 此終端機所産生的一對抗圔型之一通知,該圖型辨識裝置 被設計使得該認知中心更新該辨識字典且該終端機更新該 • · 轉換向量矩陣。 該辨識条統可以一電腦或數位信號處理器而被物化, 其有能夠反應於在訓練圔型中之改變和在誤辨識率中之增 大,並自動地基於在辨識正確性上之改變而學習之簡易再 認知之功能。 根據本發明的圔型辨識裝置之一變化可在一連績安排 中具有多重辨識單元;各辨識單元包含一辨識字典和一辨 識模組;至少一辨識單元接受該輸入圖型;至少一辨識單 元接收.另一辨識單元之輸出並産生朝向另一辨識單元的一 輸出;至少一辨識單元接收關於該輸入圔型之特激向量的 —? ?— 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) ^、-----------tT—.——.— (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 玉、發明説明(20 ). 匹配向量並藉使用轉換向量矩陣而轉換被該特徵向量所代 表的特徵;·至少一辨識單元將它的輸出推向該辨識模組; 該辨識模組決定各輸入圔型之種類;各轉換向量矩陣基於 被連接於用於該轉換向量矩陣的輸入端的該辨識單元所決 定的對抗圖型而被決定;在此結構中,各辨識單元可信賴 地辨識該辨識單元先前的辨識單元有困難辨識的圔型;此 方式,圖型辨識裝置.的多重辨識單元之辨識正確性可更被 改善。 第一圔傺根據本發明的一圖型辨識裝置之一第一實施 例1G0之一方塊圔;該圖型辨識裝置包括含有圖型輸入模 組104和預處理模組10&之画型輸入部段102、特徵抽取模 組1G8、第一辨識模組110、可靠性決定模組112、特徵轉 換模組114、第二辨識模組11S和分類器118;被各儸這些 模組所實施的處理將被詳細描述如次。 各輸入圖型P被形成部分之疆型輸入部段102的圖型輸 入模組104所接收;該圖型輸入模組將該圖型傳到標稱化 該圔型之尺寸、位置、旋轉等等的預處理模組106;該預 ά理模組將標稱過的圔型傳到從該將被使用以辨識該圖型 的特徽抽取該圖型之特徵抽取模組108;該特徽抽取模組 將從圖型Ρ抽取的特徽表達為特徽向量Χ(Ρ)。 第一辨識模組110採用特徽向量Χ(Ρ)作為對画型Ρ的匹 配向量;該第一辨識模組實施在圖型Ρ和參考向量R(K)之 匹配向量與構成種類集合{K}的各種類K之加權向量W (K)間 的一第一匹配操作·;該等參考向量和加權向量被儲存在第 ____ 本紙張尺度適用中國國家標準(CMS ) A4規格(210X297公釐) 卜---..-----------1T------ • /·. (請先閲讀背面之注意事項再填寫本頁) .經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(21 ) —辨識字典120中;被該第一辨識模組實施的匹配操作産 生在該輸入圔型之匹配向量和對各種類的参考向量間的一 第一差異數值;各第一差異數值量化在該輸入圖型和該對 應種類間的差異。 第一辨識模組no將對在種類集合{K}中的各種類的該 第一差異數值推向可靠性決定模組112和分類器118 ;基於 •對在該種類集合中的種類之該第一差異數值,該可靠性決 定模組産生其之狀態指出是否基於該第一差異數值的圖型 辨識將是可靠的一輸出信號;例如,該可靠性決定模組可 決定在該第一差異數值之最小者和該第一差異數值之次一 最小者間的增量;然後該可靠性決定模組將該可靠性數值 與一預決定臨界值作比較以決定它的輸出信號之狀態。 如果該可靠性數值大於或不小於該預定的臨界值,則 可靠性決定模組112決定基於被第一辨識模組110産生的該 第一差異數值的圖型辨識將為可靠的;在此情形中,該可 靠性決定模組産生它的輸出信號在一高可靠性(HIGH)的 狀態;該可靠性決定模組將輸出信號傳到分類器118、特 徵轉換模組103及第二辨識模組11S;反應於在HIGH狀態的 可靠性模組輸出信號,該分類器辨別在種類集合{K}中的 種類為其該第一差異數值為最小並輸出指示此種類如該輸 入圖型之種類的一密碼;更甚者,該輸出信號之HIGH狀態 禁止特徽轉換模組103和第二辨識模組116之操作。 如果該可靠性結果小於該預定的臨界值,則可靠性決 定模組112決定基於被第一辨識模組110産生的該第一差異 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁)
經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(22 ) · 數值的圖型辨識將為不可靠的;在此情形中,該可靠性決 定模組産生它的輸出信號在一低可靠性(LOW )的狀態; 反應於在LOW狀態的可靠性模組輸出信號,特徽轉換模組 114和第二辨識模組116實施額外的處理以産生一第二差異. 數值,且該分類器反應於該第一和第二差異數值兩者而決 定該輸入圖型之種類;此增大被該分類器産生的辨識結果 的可靠性。. 特徽轉換模組114接收來自特徵抽取模組108的該輸入 圔型之特徽向量並暫時地儲存它;當該可靠性決定模組112 •産生它的輸出信號在L0»狀態時,該特徽轉換模組將一轉 換施用於輸入圔型P之特徽向量X (P);該轉換藉使用對在 種類集合{K}中的各種類K的轉換向量矩陣多(K)而被實施 ;轉換向量矩陣决(K)之産生將以參考第二圖被描逑於下 ;使用在該種類集合中各種類K之轉換向量矩陣0 (K)而轉 換特擻向量X(P)産生對在該種類集合中的各種類的轉換的 #徽向量Y(P;K)。 轉換的特徵向量Υ(Ρ;Κ)之第Β項狀態成分Y(p;K;m)以 下式供給: Y(p;K;m) = X(p) φ (K;ia) (δ) 在此必為種類Κ之轉換向量矩陣必(Κ)之第m項轉換向 量;該轉換模組將對各種類的轉換的特擻向量Y(P;K)推向 第二辨識模組116。 第二辨識模組116採用輸入圖型Ρ之轉換的特徽向量Υ( Ρ; 10和從轉換模組114接收的種類Κ作為對種類Κ的圖型Ρ之 . ____ ' 本紙張尺度適用中國國家標準(CNS ) A4規格(21 OX 297公釐) (請先閲讀背面之注意事項再填寫本頁)
、1T 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(23 ) ’ 匹配向量;該第二辨識模組實施在其在此辨識處理中為匹 配向量的各轉換的特徵向量和對應於轉換向量矩陣$(K) 的轉換辨識字典LUK}) 122之頁數(Κ))間的一第 二匹配操作;該轉換的辨識字典藉使用例如L D A而被産生 ;該頁數L({K} ; 0 (K))儲存轉換的參考向量RU (K))、轉 換的加權向量(K))、及當需要時在對應於被對該種類 的轉換向量矩陣4 (Κ)之轉換的種類集合{Κ}中之各種類Κ 之常數項d(多(Κ));對匹配於種類Κ的輸人圔型ρ在對種類 K之圔型P之轉換的特徽向量Y(P;K)和轉換的參考向量R(沴 (Κ))、轉換的加權向量Τ(多(Κ))、及當需要時儲存在該參 考字典之頁數Ι·({Κ};必(Κ))中的種類Κ之常數項dU (Κ)) 間被實施。 使用對儲存在對應於各種類K之轉換向量矩陣0 (K)的 轉換辨識字典L({K}) 122之頁數L({K};<6 (K))中的各種類 的轉換參考向量和轉換加權向量,第二辨識模組11δ産生 在對如該匹配向量的種類Κ之輸入圔型ρ之轉換的特徽向量 Υ(Ρ;Κ)和在種類集合{Κ}中之各種類之轉換的参考向量R( 必(K))間的一第二差異數值;該第二辨識模組將對在該種 類集合中之各種類的該第二差異數值推向分類器118 ;轉 換的辨識字典L({K} ; 0 (K))頁數之結構將被描逑如下。 當可靠性決定模組112之輸出信號在它的LOW狀態時, 指出只基於被第一辨識模組110産生的該第一差異數值的 圔型辨識將不可靠,在決定該輸入圖型之種類前分類器118 修正對各種類的該第一差異數值;對各種類,分類器以一 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先"讀背面之注意事項再填寫本頁)
經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(24 ) 恆定乘數乘以對各種類被第二辨識模組116決定的該第二 差異數值,並將結果加於對該種類從該第一辨識模組接收 的該第一差異數值以産生一修正的差異數值;然後該分類 器辨別在種類集合{K}中的種類,為其該修正的差異數值 為最小並提供指出此種類如該輸入圔型之種類的一密碼。 在分類器113中被使用以乘以該第二差異數值的乘數 為實驗地被選取以增大越過所有種類的辨識正確性;如一 字體圔型資料庫的一公眾可獲得圖型資料庫被使用以訓練 並測試根據本發明之圔型辨識裝置;一些在該資料庫中的 字體圔型被使用為訓練圖型且其餘者被使用為測試圖型; 例如,在該資料_中五分之四的字體圔型可被使用為訓練 圖型,且其餘者可被使用為測試圖型;最大化整個辨識正 確性的乘數被選取;更甚者,額外於該公眾可獲得字髏資 料庫的一獨立编輯之字體資料庫可被使用以在高於平均辨 識正確性被需要之處的字體集合之一特定區增大字體辨識 之正確性;更有甚者,記錄的字體圔型之一完全集合可被 使用為訓練圔型;然而,如果一部分之該記錄的字體圖型 被使用為訓練圔型且其餘者為測試圔型,則該圔型辨識裝 置之辨識表現之穩定性和強健性可更可靠地被評估;同時 是有效地去交換用為訓練圔型的記錄的字體圔型和用為測 試圔型者。 雖然特徵轉換模組114和第二辨識模組11S被陳示為反 應於可靠性決定模組112之輸出信號而操作,這不是很重 要;該特勤轉換模組和該第二辨識模組可産生對各輸入圔 本紙張尺度適用中國國家標準(〇^)八4規格'(210父297公嫠) (請先閲讀背面之注意事項再填寫本頁) 訂 A7 B7 五、發明説明(25 ) · 型的第二差異數值;在此情形中,該可靠性決定模組之輸 出信號的HIGH狀態引起分類器11S忽視該第二差異數值, 並只反應於該第一差異數值而決定該輸入圔型之種類。 第二圖傺說明被實施以産生對在字體集合{K}中各種 類K的轉換向量矩陣4 (K)的處理之一流程圔;此處理可以 在此掲露中描逑之該圖型辨識裝置之實施例中被實施,或 可獨立地被實施;在較後倩形中,處理之結果被載入該圖 型辨識裝置中;首先,在步驟10中,一集合之訓練圖型被 輸入;各訓練圔型所屬的種類被定義;在步驟12中,一預 備圔型辨識操作在該等訓練圔型上被實施;此操作可藉使 用輸入模組102、特徽抽取模組108、 第一辨識模組110、 可靠性決定模組112及在第一圖中所示之該圖型辨識裝置 之實施例之分類器118而被實施;對各訓練圖型p,該預備 圖型辨識操作産生在該訓練圖型和對在種類集合{10中的 各種類K的該參考特徽向量間的一差異數值、該訓練圔型 之種類之一決定及該種類決定之可靠性之決定。 經濟部中央標準局員工消費合作社印製 (請先閲讀背面之注意事項再填寫本頁) .在步驟14中,被在步驟12中實施的該預備圔型辨識所 産生的辨識結果被評估以産生對各種類的一對抗圖型集合 ;兩種型式之圔型被安置於各種類之該對抗圔型集合;對 應於種類K的辨識結果之評估將現在被描述。 安置於種類K之該對抗圔型集合的第一型式之圔型是 一圔型其之被定義的種類不是種類K,但在步驟12中實施 的該預備圖型辨識操作被誤辨識為屬於種類K;此型式之 對抗圔型將被稱為在種類K之對抗圔型集合中的一錯誤圔 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 經濟部中央標率局員工消費合作社印製 A7 B7 五、發明説明(26) . 型 P“K)。 安置於種類Κ之該對抗圔型集合的第二型式之圔型是 一圔型其之被定義的種類不是種類Κ,但在步驟12中實施 的該預備圖型辨識操作被誤辨識為屬於種類Κ;如果種類Κ 是有該第二最小的差異數值的種類,且在該最小的差異數 值和該第二最小的差異數值間的増量是小的,則一圔型被 近於誤辨識為屬於種類Κ ;此型式之對抗圔型將被稱為在 種類Κ之對抗圖型集合中的一近似失誤圔型pn(K);該近似 失誤圖型被可靠性決定模組112所辨別。 該錯誤圔型pe(K)藉將該預備圔型辨識操作安置於種 類K的各訓練圔型與該訓練圔型之被定義的種類作比較而 被辨別;安置於種類K且其之被定義的種類不是種類K的一 訓練圔型被辨別為一錯誤圖型。 該近似失誤圔型pe (K)以下面方式被辨別;對於其之 被定義的種類不是種類K的該訓練圖型,該增量在該訓練 圔型和種類K間的差異數值與該訓練圖型和該預備圖型辨 識操作所安置該訓練儷型的種類間的差異數值之間被決定 ;次者,一固定數目之訓練圖型從其之增量小於一臨界值 的該等訓練圖型間被選取;在實施此選取中,該訓練圖型 以最小者開始以它們增量之順序被選取。 較佳地,錯誤圔型和近似失誤圔型兩者構成種類K之 該對抗圖型集合Λ (K);替代地,該近似失誤圖型可被省 略使得該對抗圔型集合只包含錯誤圔型;然而,測試證明 在該對抗圔型集合中包括近似失誤圔型産生較佳結果;特 本紙張尺度適用中國國彖標準(CNS ) Α4規格(210Χ297公釐Ρ (請先閲讀背面之注意事項再填寫本頁) ;装· 訂 經^部中央標準局員工消費合作社印製 A7 B7 五、發明説明(27 ) ' 別是,當只有少數錯誤圖型時包括該近似失誤圖型之效果 産生一相當的改善。 在步驟1S中,被定義為屬於種類K的所有訓練圖型之 特歡向量被平均以産生種類K之平均向量Rvu(K)。 在步驟18中,在該對抗圖型集合中各對抗圖型的特徽 向量從種類K之平均向量Rm(K)被減去以産生對該對抗圔型 的一差異向量。 ., 在步驟20中,在步驟1S中産生的該等差異向量之自動 相關矩陣被決定;此如下被做: 在種類K之該對抗圔型集合中的第η項對抗圖型pr, η的 特擻向量為X(K;r;n);在步驟18中決定對該對抗圖型的差 異向量為Ξ (K;r;n),其中: 三(K;r;n)=X(K;r;n)-Rm(K) 差異向量Ξ (K;r;n)之自動矩陣Q(K;r)被下式所給:
N Σ 三(Κ;Γ;η)Ξ (Κ,τ;!!)* η= 1 Q(K;r)=- (7) N(K;r) 在此H(K;r)為在該對抗圖型集合中對抗圖型之總數, 且從1到Η之加總為越過該對抗圖型集合之一加總,且t註 明差異向量之換位。 在步驟22中,自動相關矩陣Q(K;r)之特性向量必(K;a) 被決定並採用以形成對種類K的轉換向量矩陣;構成舞種 類K之轉換向量矩陣的轉換向量之最大數目等於該等特戡 向量之維度Η之數目;該轉換向量矩陣之第m項轉換向量是 有第a項最大特性值的自動相關矩陣之特性向量。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) !--->-----)k.------IT------ (請先鬩讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 —....... -- — — 五、發明説明(28 ) ’ 在步驟18中計算的差異向量代表在該對抗圖型集合中 各對抗圔型和種類K之平均向量間的差異;自動相關矩陣 Q(K;r)之特性向量被視為在種類K和對抗圖型間的差異之 一正交擴充;結果,自動相關矩陣Q(K;r)之特性向量正確 地反映在種類K和對抗圖型間的差異之主要成分;在自動 相關矩陣Q(K;r)之特性向量上的輸入特徵向量之軌跡被發 現在從該對抗圔型集合分離種類K之在種類圔型集合上晕 極有效的。 在步驟24中,一測試被實施以決定是否一轉換向量矩 陣已對在種類集合{K}中各種類K被産生;如果結果是YES ,執行則終止;如果結果是NO,執行回到步驟14使得對在 該種類集合中另一種類該轉換向量矩陣可被産生。 在決定镡類K之該轉換向量矩陣之一替換方法中,種 類K之在種類圔型集合之協方差矩陣S(K)額外於該種類之 平均向量地被決定;該在種類圔型集合包括其之被定義的 種類是種類K的訓練圔型;然後,在種類K之該對抗圔型集 合之自動相關矩陣Q(K;r)已在步驟20中被計算後,它被該 在種類圔型集合之協方差矩陣之反者相乘以産生矩陣S(K) 〃Q(K;r);最後,在步驟22中,矩陣SOO^QCK;!:)之特性 向量被決定並採用以形成對種類K的轉換向量矩陣4 (K)。 自動相關矩陣Q(K;r)之一特性向量定義一軸沿著其在 該軸上各對抗圔型之差異向量之一軌跡之越過所有對抗圖 型取用的平方的平均是一最大值;相對的,矩陣S〇〇〃g( K;r)之一特性向量定義一軸沿著其在該軸上各對抗圔型之 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) L--->-----裝-- (請先閲讀背面之注意事項再填寫本頁)
<1T 經濟部中央標準局員工消費合作社印製 A7 . B7 五、發明説明(29 ) . 差異向量之一軌跡之越過所有對抗圔型取用的平方的平均 增大,且沿著其當該種類之在種類圔型集合被投射時散佈 是相當的小;在從該對抗圔型集合分離種類K之在種類圖 型集合上這也被考盧是極有效的。 在步驟22中實施的採用處理中,有最大的特性值的特 性向量被採用為該轉換向量矩陣之一轉換向量;另外,具 有_漸小特性值之一數目之特性向.量額外地被選取;被選取 的特性向量之數目決定該轉換向量矩陣之複雜度和使用該 轉換向量矩陣實施的處理之複雜度;因此,有需要只選取 特性值是重要的那些特性向量;被選取的特性值之數目為 在有最大特性值的特性向量和從最大特性值到一所要的待 性值的特性值之加總大於所有特性值之總和的例如〇 . 9的 一預定分數的一所要持性值之特性向量間的特性向量之數 目;替代地,特性向量之數目可實驗地被決定。 在上逑中,對各種類被決定的待性向量被採用為構成 被使用以轉換該等輸入圖型之特徽向量的對應轉換向量矩 陣的轉換向量;替代地,該特徽向量轉換可使用從構成種 類子集合{K}’的一所要數目種類之對抗圔型集合的一超集 合而産生的轉換向量矩陣;被如此轉換向量矩陣影響的轉 換考慮到多重種類。 ' 種類子集合{K}’包含一所要數目之種類;種類被選取 以藉以它們錯誤圔型之數目和它們對抗圖型集合之順序而 分等在種類集合{K}中所有的種類而包含在種類子集合{ΚΓ 中,而優先傺給予錯誤圔型之數目;該所需數目之種類然 _-..3.2. ~----- 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) :---,-----------ΐτ------- (請先聞讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(30 ) 後從分等终點的大數目之錯誤圔型/大對抗圖型集合而被 取用以構成種類子集合{K}’;選擇地,種類子集合{K}’可 被做得和種類集合{K}同延伸。 然後,在類似步驟20的一步驟中,種類子集合{K}’之 差異向量之自動相關矩陣Q({K}’;r)使用方程式(8)而計算 ,其傺基於給予在種類子集合{K}’中的種類K之差異向量 三(K;r;n)之自動相闢矩陣Q(K;r)的方程式(?):
{K}N Σ Σ Ξ (K;r;n)Ξ (Κ;Γ;η)* k=ln=l Q({K},;〇=-
W Σ N(K;r) k = 1 {K} (8) Σ H(K;r)Q(K;r) k=l {K} Σ N(K;r) 1 在此,從1到{K}之加_總註明該等項目橫過在構成種類 子集合{K}’的種類集合{K}中的部些種類而被相加。 在類似步驟22的一步驟中,種類子集合{K}’之差異向 量之自動相關矩陣Q({K}’;r)的第η項特性向量於 被決定並採用為對種類子集合{K}’的轉換向量矩陣0 ({K}’ )的第b項轉換向量。 在一替代相似於上逑者中,屬於種類子集合丨K} ’的謂 練圔型之平均協方差矩陣s({K})被找出且轉換向量4 ({K}’ 被SUKD-IUK}’;]:)之特性向童所取代;此提供和如 上述的藉以SUHU;]:)之特性向量取代特性向量多(K;m) 所提供的相同效果。 第三圔陳示用以産生轉換的辨識字典LUK};必(K))的 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐Υ l··--,-----裝—— (請先閱讀背面之注意事項再填寫本頁) 、11 經濟部中央標準局員工消費合作社印製 A7 B7__ 五、發明説明(31 ) ' 處理之一流程圔;其中0 (K)被4 ({K} ’)取代的相同處理 可被使用以産生轉換的辨識字典L({K};4({K厂));此處 理可在此掲露中所述的該圖型辨識裝置之實施例中被實施 ,或可獨立地被實施;在較後情形中,一適合的儲存或傳 輸媒體被使用以將被該處理産生的結果載入該圔型辨識裝 置中。 在第三圔中所示之轉換辨識字典産生處理中,步驟1〇 至14偽相同於在參照於第二圖而上述的轉換向量矩陣産生 裝置中的步驟10至14,並不再詳細描逑;在該預備圖型辨 識步驟12中被誤辨識或近似誤辨識為屬於各種類的訓練圔 型被辨別為在步驟14中的種類的對抗圔型集合Λ (k)。 在步驟30中,被定義為屬於各種類的所有訓練圔型之 特徵向量藉使用該種類之轉換向量矩陣4 (K)而被轉換。 在步驟32中,一辨認分析在該在種類_型集合和各種 .類之對抗圖型集合間被實施;在該辨認分析中使用的變數 為藉使用該種類之轉換向量矩陣</>(K)而被轉換的特徽向 量;該辨認分析導出最佳地分離該對抗圔型集合和該種類 之在種類圔型集合的一辨認函數;該辨認分析可藉使用在 參考3被發明者設下的程序而被賁施。 在步驟34中,對在步驟32中各種類被決定的該辨認函 數之.數值被一常數所乘且結果被加於對在步驟12中各訓練 圔型被決定的各種類之差異數值以産生一修正的距離數值。 在步驟36中,各個訓練圖型之種類然後藉使用在步驟 34中産生的該修正的距離數值而被決定。 ___._-3Α- '_ 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ297公釐) (請先聞讀背面之注意事項再填寫本頁) '裝. 、1Τ 經濟部中央標準局員工消費合作社印製 A7 . B7___ 五、發明説明(32 ) ' 在步驟38中,在步驟36中對各訓練圔型被産生的圖型 辨識結果被評估,且一測試被實施以決定是否在步驟32、 34和36中實施的處理已導致新的誤辨識圖型;新的誤辨識 圖型為已非該種類之對抗圔型集合之成員的錯誤圔型;如 果此測試之結果是NO ,則執行推前到步驟40 ;如果此測試 之結果是YES,且新的誤辨識圖型已被産生,則執行傳到 步驟42,此處各種類之新的誤辨_圔型被加於該種類之對 抗圖型集合;然後執行轉回步驟32,且包含步驟32、34、 36、38和42的迴路重覆直到在步驟38中的測試結果是N0為 止。 在步驟40中,被轉換的辨識字典藉使用在步驟32之最 後重覆中産生的辨認函數而被産生。 當種類K之轉換的特徽向量Y(K;p)之平均向量iim(多(K) )之第π項成分被1^(遠(K);id)指定時,種類K之辨認函數F( y(K;p),RmU (K)))被下式所給: F(Y(K;p),Rra(0 (K))) Μ =Σ a(i) (y(p;m)-rm(^ (K);m))a π= 1
M + Σ a(n) (y(p;m)-rm(<A (K);n))a + c(^ (K)) 0=1 M f b(m) ia =Σ a(i) I y (p; o)-rm(<& (K);®))-- m= 1 < 2 a (a) M b(n)s + Σ - + (R)) 其之a (in)為第m項 :¾¾的 加權向量、.其之(K);B〇 -1)(1!1)/(23(1!1))為第]11項成分的參考向量、及具有2 1)(!11)8/ (4a(m)) + c(0 (K))數值的常數項被儲存如在該轉換的辨識 字典中的種類Κ辨識字典;根據此程序,當與在步驟12中 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ297公渣~: _ (請先閲讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(33) 所用的辨認函數組合時,一辨認函數可被決定以最大化辨 認正確性。 本發明者已發現在重覆認知過程中,辨識正確性起初 增大,但認知效應逐漸減小且辨識正確性可能實際上減小 ;當任一下面情況達到時此事實被使用以自勤地阻停該認 知處理: (1) 辨識正確性達到一特定數值;或 (2) 認知處理之一增加重覆並不改善辨識正確性。 當第二評準被採用時,在該認知處理之重覆開始前該 .辨識字典之内容和對各種類的轉換向量矩陣被儲存在記憶 體中待用;根據本發明的圖型辨識裝置可包括通知使用者 認知重覆已停止且顯示所達到的辨識率和所實施的認知處 理之重覆數目的一顯示器。 在上面處理中,對抗圔型可被自動地編輯;種類和字 體圔型被獲得為訓練圔型和测試圔型;錯誤圖型和近似失 誤圖型被抽取;在此時,該等錯誤圖型如上逑的被自動地 決定;如果近似失誤圔型之最大數目被特定,該近似失誤 圔型被自動地決定;替代地,只有當錯誤圖型之數目小於 預定數目時近似失誤圔型之一預定數目才被選取。 當需要時包括該等測試圖型的訓練圖型根據如上逑而 實施在一電腦上的本發明被給予該辨識条統並被自動地認 知;結果,根據本發明的該辨識条統具有一簡單實施並可 藉以根據應用的訓練圔型提供給它而容易地諏適於一所給 的應用。 _ .. . -36- ____ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) --------Ο 裝------訂------Λ—J^. (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 A7 . B7 ---— _;—-—------ 五、發明説明(34 ) 第四圔傺根據本發明的一圖型辨識裝置之一第二實施 例130之一方塊圖;在此中,對應於上逑參照於第一圔的 第一實施例之元件的元件被相同的參考编號所指出而不再 詳逑;在此實施例中,輸入部段.10 2將預處理的輸入圖型 饋於特徵抽取模組108,其係一第一特擻抽取模組,並也 到第二特歡抽取模組132;該第一特徵抽取模組從各輸入 圔型抽取一第一待徽向量;該第一特徴向量受制於被第一 辨識模組.110和可靠性決定模組112所實施的操作;該第二 特徽抽取模組相似於該第一特徽抽取模組,但從各預處理 輸入圖型抽取不同的特徽成分以産生一第二特徽向量。 特徽轉換模組134相似於上逑的特徵轉換模組Π4而操 作以藉使用對在種類集合{1U中各種類的轉換向量矩陣多( K)而轉換被第二特徽抽取模組132産生的各第h特徵向量 ;第二辨識模組136相似於第二辨識模組116而操作以藉使 用轉換的辨識字典138而實施在該轉換的第二特徵向量上 的一辨識處理;對各輸入僵型,該第二辨識模組産生在該 輸入圖型和在種類集合{K}中各種類間的一差異數值。 當該可靠性決定模組輸出信號是在它的HIGH狀態時分 類器118僅使用被第一辨識模組110所産生的第一差異數值 而決定各輸入圔型之種類,並當該可靠性決定模組輸出信 號是在它的LOW狀態時分類器118藉使用被第一辨識模組Π0 . 所産生的第一差異數值和被第二辨識模組116所産生的第 二差異數值而決定各輸入圔型之種類。 第二特徽抽取模組132、特徽轉換模組134及第二辨識 _;_ -_ . - 3 7 - _ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) ---,-----裝-- (請先閱讀背面之注意事項再填寫本頁)
、1T 經濟部中央樣準局員工消費合作社印製 A7 B7 五、發明説明(35 ) · . 模組136被陳示反應於可靠性決定模組112之输出信號而操 作使得它們只對該可靠性決定模組決定的那些輸入圔型集 中地産生第二差異數值,基於被第一辨識模組110産生的 該第一差異數值的圖型辨識將為不可靠;替代地,這些模 • .. 組可産生對每一輸入圖型的第二差異數值;在此情形中, 當該可靠性決定模組輸出信號之狀態是在它的HIGH狀態時 ,分類器忽視被該第二辨識模組産生的該第二差異擊值並 只反應於被該第一辨識模組産生的該第一差異數值而決定 輸入圖型之種類。 第二實施例在特徵轉換模組134操作在被第二特徽抽 取模組132産生的該第二特徽向量上而非在被特擻抽取模 組108産生的特徵向量上,並且該第一和第二特徵抽取模 組從該預處理的輸入圔型抽取不同集合之特擻上,而不同 於第一實施例;第二辨識模組136可藉致能它以操作在一 較小集合的特徽上而被簡化;基於藉使用其之種類為已知 的測試圔型而決定辨識正確性的測試,.如上逑的,依據於 給予較好的辨識正確性的,第二實施例或第一實施例可被 正常地,第一特徵向量和第二特徽向量並不具有共同 的特徽成分;然而,當此將清楚地改善辨識正確性時它們 可具有共同特徽成分;在上逑的第一和第二實施例中,第 一辨識模組11G被描述如藉使用基於被辨認分析的認知的 一辨識函數而操作;然而,此非重要,且其它辨識函數可 替代地被使用。^ I* —— __________ —— -3ft- ....... ______„ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閱讀背面之注意事項再填寫本頁) -裝. 訂 經濟部中央標準局員工消費合作社印製 Α7 Β7 五、發明説明(36 ) 在參照第一圔的上逑之圔型辨識裝置之實施例中,轉 換在特徵轉換模組114中的特徵向量的轉換向量矩陣φ (K) 可以參照於第二圖的上逑之轉換向量矩陣4 ({K}’)而取代 ;如果這被做了,在第二辨識模組11S中使用的轉換辨識 字典I1({Kh炎(K))122也被轉換辨識字典L({K};0 ({K}’)) 所取代;相對改變可被做於在第四圖中所示的第二實施例 之第二辨識模組136中所用的特徽轉換模組134和轉換辨識 字典138;在此兩個情況中,轉換向量矩陣必({Κ}’)如上 述藉使用種類子集合{Κ}’之對抗圖型集合而被決定;種類 子集合{Κ}’之對抗圔型集合包含構成種類子集合{Κ}’之所 有種類之對抗圖型集合;在轉換辨識字典L({I〇;多({Κ}’)) 中,在種類集合{K}中的各種類K之參考向量藉使用轉換向 量矩陣4 ({K}’)而被轉換以産生對該種類的轉換的參考向 量;當種類子集合{K}’只包含一種類時,{ΚΓ變成{K}。 當在種類集合{K}或在種類子集合{K}’中只有一種類 時,{K}和{ΚΓ可在上述解釋被設為K;種類子集合U}’可 包括和在種類集合{K}中所有一樣多的種類。 特徵轉換模組114、134可被操作使得它産生對屬於藉 使用轉換向量矩陣4 ({K}’)而轉換輸入圖型之特徽向量的 種類子集合{K}’的各個種類的一轉換的特歡向量;在此情 形中,該特徵轉換模組額外地産生對屬於藉使用各値剩餘 種類的轉換向量矩陣而轉換輸入圖型之特徽向量的 種類集合{Κ}的剩餘種類的轉換的特徽向量;替代地,轉 換模組114、134可被操作使得它産生對屬於使用轉換向量 !、J 裝 I 訂 (請先閲讀背面之注意事項再填寫本頁) 1 H _____________ 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ297公釐) 經濟部中央標準局員工消費合作社印掣 A7 B7 五、發明説明(37 ) .‘ 矩陴以轉換輸入圖型之特歡向量的種類集合{K} 的各個種類的一轉換的特徽向量;操作的較前模式容易地 改善辨識正確性,但傾向於對操作速度和記億體容量具有 較後者為大的需求。 在根據本發明的圔型辨識裝置之第一實施例上的一變 化,第一辨識模組110和可靠性決定模組112被省略;被特 徽抽取模組108所抽$的各抽取的特徴向量X(p)不改變地 被輸入特徽轉換模組114,且該分類器只在被第二辨識模 組116産生的差異數值之基礎上決定輸入圔型之種類。 在根據本發明參照於第四圔的上逑圔型辨識裝置之第 二實施例上的一變化,坷靠性決定模組112被省略,第二 特徽抽取模組132、特擻轉換模組134和第二辨識模組136 在每一輸入圖型上操作,且分類器118藉使用被第一辨識 模組110産生的第一差異數值和被被第二辨識模組136産生 的第二差異數值兩者而決定每一輸入圔型之種類.。 第五圔陳示根據本發明的圖型辨識裝置之一第三實施 例;相對於上逑參照於第一圖的第一實施例的此實施例之 元件使用相同參考编號被指出且不再詳述;在此實施例中 ,特徽抽取模組從各個預處理的輸入圖型抽取一第一特徽 向量和一第二待徽向量;在被特徵向量組合模組14S組合 前該兩特徽向量被獨立地處理;當它實施有辨識宇典的匹 配操作時辨識模組148採用該組合的特徽向量為該匹配向 量。 特徵抽取模組142從各預處理的輸入圔型抽取兩組特 广 ~ 4 0 -_ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) ---^--------J 裝-- (請先閱讀背面之注意事項再填寫本頁)
、1T 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(38 ) ’ 徵並將各組待徵表逹為一特徽向量;該特徵抽取模組將第 一特擻向量SU (P)送到維度縮減模組144並將第二特歡向量 X3(P)送到特徽轉換模組114。 維度縮減模組藉使用例如已知的卡胡稜一羅福擴張而 縮減第一特歡向量l(P)的維度數目,並將縮減維度的特 徵向量Zt (p)送到特徵向量組合模組148 ;該維度縮減模組 可被省略,在此情況,Z^phXjp)。 當第一特徽向量Xt(P)之維度數目被縮減時,結果的 維度縮減的特徴向量h (p)之第Hi項成分Zi (P;m)被下式所 給:
Zi(p;m)=Xi(ρ)φ ($;π) (9) 在此4 ($;m)偽一第in度維度縮減的向量其可使用在被此實 施例實施的認知處理中所用的所有訓練圔型之協方差矩陣 之特性向量;其它已知的維度縮減技術可替代地被使用; 在向量0 ($;m)中的$字象指出所有訓練圔型都被使用。 特擻轉換模組Π4藉使用轉換向量矩陣多(Zi;{K厂)而 轉換第二特徵向量XS(P)之特徽;轉換向量矩陣(Zi;{K}’ )指出藉使用從該等訓練圔型抽取的維度縮減的特徽向量 乙(P)而實施圖型辨識而被産生的一轉換向量矩陣並基於 種類子集合iiU’之對抗圔型集合。 使用轉換向量矩陣4 ([;{!〇’)而轉換第二特擻向量 X2(P)之結果為轉換的特徵向量h(P;Zi; {K}’)。 轉換的特徵向量YJZi; {K}’)之第a項成分Ydpjd {K } ’ ;π)被下式所給: _-AT -_ 本紙張尺度適用中國國家標準(CNS ) A4規格(21 OX297公釐) (請先閲讀背面之注意事項再填离本頁) 一裝· 訂 經濟部中央標準局員工消費合作社印掣 A7 - _B7__ 五、發明説明.(39) ’ yt(ρ;Ζι;{K}·;m)=X2(p)^ (Zi;{K}*;m) 在此Φ (Zi;{K厂;π)為轉換向量矩陣0 (Z1;{K厂)之第m項 轉換向量。 特徽向量組合模組146抽取維度縮減的特徵向量Zt(p) 和轉換的特徴向量h (Z, ; {K} ’)的所有成分以産生組合的 特徵向量(UZdL);替代地,此模組可藉從維度縮減模組 144和特徵轉換模組114所接收的向量只油取特定成分而産 生該組合的特徵向量;該特徽向量組合模組將組合的特徽 向量C(Zt 饋送到辨識模組148。 辨識模組148採用組合的特徵向量(UZ^Yi)作為它的 匹配向量並實施在該匹配向量和組合的辨識字典150間的 一匹配操作;被辨識模組148簧施的處理類似於上述参照 於第一圖的被第一辨識模組110所實施者並産生對各種類 的一差異數值;辨識模組148將該差異數值推向分類器152 ;然後該分類器藉辨別對應於從該辨識模組接收的差異數 值之最小者之種類而決定輸入圖型之種類。
在此實施例中所用的組合的辨識字典150可藉施用使 用從各訓練圖型導出的一組合的特徽向量C(Zi ; )之LDA 而被産生;更甚者,雖然維度縮減被施用以縮減該第一特 徵向量之維度數目,轉換向量矩陣4(Zi;{K}’)被首先實 施使用封維度縮減的特敏向量匕^)最佳化的一辨識字典 之一辨識處理而被決定;基於使用此字典的辨識結果,對 抗圔型集合被编輯,且轉換向量矩陣4 (Zi ;{K}’)以和上 述轉換向量矩陣4 ({K}’)相同方式被找出。 --:--..4-2~---—~ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) 〔裝·
、1T 經濟部中央標準局員工消費合作社印製 A7 __Β7_ —--------—-:-- 五、發明説明(40 ) ‘ . 此實施例具有一改善的辨識正確性和一快速辨識處理 時間,而不需要一大的組合的辨識字典。 在此實施例中,該第一特擻向董可和該第二特徵向量 相同。_ 第..六圔陳示根據本發明的圖型辨識裝置之一第四實施 例160;對應於上述參照於第一和四圖的第一和第二實施 例之此實施例之元件使用相同的參考编號被指出並在此將 不再描述。 在第六圔中所示的圔型辨識裝置中,在第一圔中所示 的圔型辨識裝置1〇〇以增加第二可靠性決定模組162,及在 第西圔中所示的第二實施例之特徴抽取模組132、 特徵轉 換模組134以及辨識模組138而被修正;在第四實施例中, 這些元件被稱為第二特戡抽取模組132、第二特徵轉換模 組134及第三辨識模組136;該第三辨識模組包括第二轉換 的辨識字典138。 第二可靠性決定模組162和第一特徽轉換模組114和第 二辨識模組116—起反應於第一可靠性決定模組112之輸出 信號之LOW狀態而操作;此輸出信號之LOW狀態指出基於被 第一辨識模組110産生的第一差異數值的圔型辨識不是可 靠的。 第二可靠性決定模組162接收被第一辨識模組112和第 二辨識模組11S産生的差異數值;該第二可靠性決定模組 相似於第一可靠性決定模組112地操作以決定基於被該第 一和第二辨識模組産生的差異數值的圖型辨識可靠性,並 卷 ,·* -—___-Aft- '_ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) !——,-----— I (請先閱讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(41 ) ' 産生其之狀態指出如此圖型辨識操作之可靠性的一輸出信 號;該第二可靠性決定模組之輸出信號如一控制信號地被 饋送到第二特徵抽取模組132、第二特擻轉換模組134、第 三辨識模組136及分類器164。 第二特徵抽取模組132接收來自圔型輸入部段102的預 處理的圔型,從該輸入圖型抽取一集合之特徵並將該抽由 的特徽表達為一第二特擻向量;被第二特徵抽取模組抽取 的特徵不同於被第一特徽抽取模組108從該輸入圔型抽取 的特擻;該第二特徽抽取模組將各第二特徽向量傳到該第 二特徽轉換模組,其轉換該第二特徽向量,並將結果轉換 的第二特擻向量傳到第三辨識模組13.6。 第三辨識模組136採用該轉換的第二特歡向量作為一 匹配向量,並實施在該匹配向量和第二轉換的辨識字典138 間的一匹配操作;該匹配操作産生對各種類的一第三差異 數值.;該第三辨識模組將該等第三差異數值饋送到分類器 164。
分類器164分別反應於第一可靠性決定模組112和第二 可靠性決定模組162之該第一和第二輸出信號而操作,以 決定使用從第一辨識模組110、第二辨識模組116及第三辨 識模組13S所接收的該等差異數值之輸入圔型之種類;當 該等第一可靠性決定模組輸出信號在它的HIGH狀態時,該 分類器從只被該第一辨識模組産生的第一差異數值而決定 輸入圔型之種類;當該第一可靠性決定模組輸出信號在它 的LOW狀態且該等第二可靠性決定模組輸出信號在它的HIGH ___ . -AA-_;_ 本紙張尺度適用中國國家標準(CNS ) A4規格(ilOX297公釐〉 (請先閱讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 Α7 Β7 五、發明説明(42 ) ’ 狀態時,該分類器從被該第一辨識模組産生的第一差異數 值和從被該第二辨識模組産生的第二差異數值而決定輸入 圖型之種類*·當該等第一和第二可靠性決定模組輸出信號 兩者都在它們的LOW .狀態時,該分類器從被該第一辨識模 組産生的第一差異數值、被該第二辨識模組産生的第二差 異數值和從被該第三辨識模組産生的第三差異數值而決定 _入圖型之種類。 在上述特徽向量轉換中所用的轉換向量矩陣和辨識字 ) 典可藉使用上述産生如此轉換向量矩陣和辨識字典的方法 而被産生;例如,在特徵轉換模組114和134中所用的轉換 向Μ矩陣可從藉在使用第一辨識模組110的訓練圔型上實 施一圖型辨識操作所産生的對抗圔型集合而被決定;辨識 字典120、122及13S可被決定使得辨識率對較佳地多到在 其中該等辨識字典被分別設置的第一辨識模組110、第二 辨識模組116和第三辨識模組136之輸出的所有訓練圔型之 最大值;決定該轉換向量矩陣是受制於比決定該辨識字典 更多的變數;例如,在特徽轉換模組114和134中所用的轉 換向量矩陣可從藉在使用第一辨識模組110的訓練圔型上 實施一圔型辨識操作所産生的對抗圔型集合而被決定;替 代地,在第二特徽轉換模組134中所用的轉換向量矩陣可 從藉在使用第一辨識模組110和第二辨識模組116的訓鍊圖 型上實施一圔型辨識操作所産生的對抗圖型集合而被決定。 在剛述的實施例上的一第一變化中,第二特擻抽取模 組132被省略,且被第一特徽抽取模組108産生的特徽向量 -4R- .__ 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ297公釐) .(請先閱讀背面之注意事項再填寫本頁)
經濟部中央標準局員工消費合作社印製 A7 _____B7_ 真、發明説明(43 ) 被輸入到第二特徵轉換模組134;在一第二變化中,該第 二特徽抽取模.組和該第二待徽轉換模組被省略,且被第一 特擻轉換模組114産生的轉換的被直接輸入到第三辨識模 組 136。 被一特徵抽取模組、一特徵轉換模組、或一特歡抽取 模組和一特徽轉換模組前行的一辨識模組之連績安排可被 視為一辨識單元;在第六圔中所示的實施例中,包括有包 括第三辨識模組136的一辨識單元昀三痼辨識單元被串置 ;在此實施例上的變化可具有位近於圔型輸入部段1Q2之 上游且額外地或替代地近於分類器下游的額外的辨識單元 ;從該輸入圖型導出的預處理的圖型可依據於一或更多辨 識單元之辨識結果而被輸入到多重辨識單元。 在剛述的變化中,輸入圔型和藉線性地轉換代表各輸 入圔型的特徽向量而導出的向量被輸入到該辨識單元,該 辨識單元産生一辨識結果,其可為該輸入圔型之種類的一 指示或對該輸入圖型的一組差異數值,且該分類器最後從 該等辨識單元之輸出決定該輸入圖型之種類;因此,被該 辨識單元所用的轉換向量矩陣基於從一上游辨識單元所獲 的對抗圖型集合而被決定;各辨識單元之辨識字典被設定 以最大化,或至少相當地增大在訓練圔型上被上到包含該 辨識單元的部分圔型辨識裝置所實施的圔型辨識之辨識正 確性。 第七圖傺一典型圖型辨識糸統200之一方塊圔;該糸 統包含認知中心202和一或更多終端機,其之一典型者被 • . — 4 fi — -------- 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先聞讀背面之注意事項再填寫本頁) 袭.
、1T 經濟、部中央標準局員工消費合作社印製 Α7 Β7 五、發明説明(44 ) 陳示在204,被通信連繫或可傳輸儲存媒體20S所連繫。 認知中心2 0 2使用建入或外部連接的資源以蓮作處理 訓練圔型之集合212以産生轉換向量矩陣之集合214和辨識 字典216的控制/訓練軟體210 ;在該轉.換向量矩陣和該辨 識字典己被認知中心202産生後,它們使用可然後被送到 終端機204的一適合儲存媒體而被儲存;該終端機可以是 •實際上實施在暫時儲存在一儲存媒體中的未知圖型上的圔 型辨識的一光學字髏辨識(OCR )裝置;替代地,該轉換 向量矩陣和該辨識字典可藉使用通信連繫206而被送到終 端機204 ;如果被使用的通信連繫是雙向的,該認知中心 可接收被該終端機提供的錯誤圔型,並可使用該等錯誤圔 型以更新該轉換向量矩陣和該辨識字典;認知中心202可 包括可顯示如辨識正確性的信息的一顯示器(未陳示); 該糸統可包括通過其可輸入指令和資料的一輸入裝置(未 -陳示)。 終端機204藉使用建入或外部連接的資源以蓮作控制 /訓練軟體22 0 ;使用圖型輸入模組222的各圖型輸入被轉 換向量矩陣224所轉換並被匹配於辨識字典226以決定該圖 型之種類。 因為可能需要實質的電腦資源以産生轉換向量矩陣2 14 和辨識字典216,相當的範赙存在以選取在一方面該電腦 之表現和成本間且另一方面在轉換向量矩陣和辨識字典之 尺寸間的最佳平衡點;任一裝置可實施訓練和辨識兩者。 根據上述之本發明,當一第一辨識模組和一第二辨識 . .-47- ___ 本紙張尺度適用中國國家標準(CNS ) A4規格(210Χ2;97公釐) (請先閱讀背面之注意事項再填寫本頁) -5
經濟部中央標準局員工消費合作社印製 A7 B7 五、發明説明(45 ) 模組被有效地組合時,有效地從在該第一辨識模組中的種 類之對抗圔形集合分離各種類之在種類圖型集合的第一向 量被找出;該第二辨識模組建立致能儘可能多的被要被正 確地辨識的該第一辨識模組所誤辨識的圖型之一辨識字典 ;該第二辨識模組使用投射在該等第一向量上作為特徵向 量的該等特徵向量之數值;藉著有效地組合兩値辨識模組 ,本發明顯著地改善辨識正確性。 更甚者,根據本發明的圔塱辨識裝置和方法可簡單地 藉實施使用適合型式之訓練圖型的認知處理而容易地被調 適以實施在不同型式圖型上的圔型辨識。 在此中掲露的圔型辨識裝置之實施例可藉使用如加法 器和乘法器的專用硬體而被構建;在一較佳實施例中,該 圔型辨識裝置以被一微處理器(未陳示)或數位信號處理 器所執行的一電腦程式所物化;同時請注意到,在基於電 腦和基於DSP的實施例中,圔型辨識裝置之各種模組可能 是短壽的,並可能當各種圔型辨識和認知處理被實施中其 可存和不存在;並非所有模組需要在該電腦或DSP中同時 存在。 在該較佳賁施例中,包括一圔型辨識程式的一電腦實 施上逑所有的處理•·此掲露提供在該技藝中有普通技術者 充分的資訊以使用一高階(例如,C或C+ + )或低階程式語 言而编寫一適合的圔型辨識程式;據此,自我表列之程式 被省略;該圖型辨識程式可被輸入電腦,在其上它藉實施 在如一組軟碟、一 CD-ROM、一 DVD-ROM的一適合可觸的表 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) -衣 _
、1T A7 B7 五、發明説明(46 ) ' 達媒體而蓮作,或可被一適合的資料連繫而傳輸到如此電 腦。 雖然此掲露詳細地描述本發明之說明實施例,請瞭解 到,本發明並不受限於所述之精確實施例,且各種修正可 在被所附之申請專利範圍所定義的本發明之範畴中被實施 元件绲猇對暗丢 100第一實施例 104、222圔型輸入模組 106預處理模組 102圖型輸入部段 108特徽抽取模組 112可靠性決定模組 114、134特徽轉換模組 116、136第二辨識模組 118、152、164 分類器 122轉換辨識字典 110第一辨識模組 io、12、14、16、18、20、22、24、30、32、34、36、38 、40、42步驟 (請先閲讀背面之注意事項再填寫本頁) 訂 經濟部中央標準局員工消費合作社印製 130第二實施例 132第二特徽抽取模組 204終端機 138被轉換的辨識字典 140第三實施例 146特徵向量組合模組 148辨識模組 142特徽抽取模組 144維度縮減模組 160第四實施例 1S2第二可靠性決定模組 200圖型辨識条統 202認知中心 206通信鏈路 212訓練圖型集合 214、224轉換向量矩陣集合 150、216、226辨識字典 210、220控制/訓練軟體 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -4^
Claims (1)
- 經濟部中央標準局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範園 · 1 . 一種圔型辨識裝置,其包含有: 接收多値輸入圖型的一輸入部段,該等輸入圖型 包括屬於構成一種類集合的多個種類之一的一圔型; 將該圖型之特徽表達成一第一特徵向量的一第一 特徽抽取模組; 一第一特徵轉換模組,其使用轉換向量矩陣以轉 換至少部分之該第一特徵向量以産生對應於各該種類 之一至少部分被轉換第一特徵向量; 包括儲存供各該種類用的匹配資訊和第一被轉換 匹配資訊之一辨識字典的一辨識部段,該第一被轉換 匹配資訊已使用該等轉換向量矩陣予以轉換,且該辨 識宇典藉由在下列之間實施一匹配操作而針對各該種 類産生至少一差異值: 該匹配資訊和該第一被轉換匹配資訊,及 至少從對應於各該種類的該至少部分被轉換. 第一特徵向量導出的至少一匹配向量;及 響應於該至少一差異值而辨別該圔型所屬的該等 種類中之該一種類的一分類器。 2.依據申請專利範圍第1項之圖型辨識裝置,其中: 該第一特徽轉換模組轉換所有的第一特歡向量以 産生對應於各該種類的一第一被轉換的特數向量; 該辨識部段包括: 針對各該種類藉由在該匹配資訊和從該第一 特徵向量導出的一第一匹配向量間實施一匹配操 -50- 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) i. 訂 經濟部中央標準局負工消費合作社印製 A8 B8 C8 D8 々、申請專利範圍 . 作而産生一第一差異值的一第一辨識模組,及 針對各該種類藉由在該第一被轉換匹配資訊 和從對應於各該種類之該第一被轉換特徽向量導 出的一第二匹配向量間實施一匹配操作而産生一 第二差異值的一第二辨識模組; 該裝置額外地包含一可靠性決定槙組,該可靠性 模組接收針對各該種類的該第一差異值並指出何時基 於針對各該種類的該第一差異值的圔型辨識將為可信 賴;以及 該分類器響應於下列而辨別該圔型所屬的該等種 類中之該一種類: 當該可靠性決定模組指出基於針對各該種類 的該第一差異值的圔型辨識將為可信賴時,只響 應於針對各該種類的該第一差異值,及 否則,即響應於針對各該種類的該第一差異 值和該第二差異值。 3.依據申請專利範圍第2項之圔型辨識裝置,其中: 該圖型辨識裝置額外地包含將該圖型之特徽表逹 成一第二特徵向量的一第二特徽抽取模組,該第二特 徽抽取模組被插置在該輸入部段和該第一特激轉換模 組間;以及 該第一特徵轉換模組轉換該第二特徴向量以産生 該等被轉換特徴向量。 4,依據申請專利範圍第2項之圖型辨識裝置,其中: _- ___ -51- 本紙張X·度適用中國國象標準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) :裝. 、tr- 經濟部中央標準局貝工消費合作社印製 A8 B8 . C8 D8 六'申請專利範圍 該裝置額外地包含有: 接收針對各該種類的該等第一和第二差異值 並指出何時基於針對各該種類的該等第一和第二 差異值的圖型辨識將為可靠的一第二可靠性決定 模組, 將該圖型之特徵表達成一第二特徵向量的一 第二特徽抽取模組,及. 使用第二轉換向量矩陣以轉換該第二特徵向 量以産生對應於各該種類的一第二被轉換特徵向 量的一第二特徽轉換模組; 該辨識字典額外地儲存針對各該種類的第二被轉 換匹配資訊,該第二被轉換匹配資訊以藉使用該等第 二轉換向量矩陣予以轉換; 〆 · 該辨識部段包括藉由在該第二被轉換匹配資訊和 從對應於各該種類的該第二被轉換特徵向量導出的一 _ I 第三匹配向量間實施一匹配操作而産生針對各該種類 之一第三差異值的一第三辨識模組;以及 該分類器響應於下列而辨別該圔型所屬的該等種 類中之該一種類: 當該第一可靠性決定模組指出基於針對各該 種類的該第一差異值的圔型辨識將為可信賴時, 只響應於真對各種類的該第一差異值, 當該第二可靠性決定模組指出基於針對各該 種類的該等第一和第二差異值的圖型辨識將為可 .J* ——__________________ __"52"_ - 本紙張尺度適用中國國家標準(CNS ) Α4規格(21 ΟΧ297公釐) ---------裝------訂------ / (請先閲讀背面之注意事項再填寫本頁) 經濟部中央操準局員工消費合作社印製 A8 ' B8 C8 D8 六、申請專利範圍 .’ 信賴時,只響應於針對各該種類的該等第一和第 二差異值,及 否則,即響應於針對各種類的該第一、第二 和第三差異值。 5,依據申請專利範圍第2項之圖型辨識裝置,其中: 該第一特徵抽取模組和該笫一辨識模組之一連續 安排構成一第一辨識單元; 該第一特徽轉換模組和該第二辨識模組之一連續 安排集中地構成一第二辨識單元;以及 該圖型辨識裝置額外地包含包括下列之一連續安 排的一額外辨識單元: 一特徽抽取模組和一特徽轉換模組中之至少 一個,及 一辨識模組,其包括被最佳化以辨識未可靠 地被該等第一和第二辨識單元所辨識之一些圔型 的一被轉換辨識字典。 6. 依據申請專利範圍第3、4或5項之圖型辨識裝置, 其中; 由該第一特歡抽取模組産生的該第一特徽向量表 達該圔型之一第一組特徽;以及 由該第二特徵抽取模組産生的該第二特徽向量表 逹該圔型之一第二組特激。 7. 依據申請專利範圍第6項之圖型辨識裝置,其中該等 第一組特徽和該等第二組待徵部分重叠。 ____-53-_ 本紙張尺度適用中國國家標準(CNS ) A4g ( 210X297公釐) ~ I---1-----)i— (請先閱讀背面之注意事項再填寫本頁) 、11- 經濟部中央標準局員工消費合作社印製 A8 ^ B8 C8 D8 - 六、申請專利範園 8. 依據申請專利範圍第1項之圔型辨識裝置,其中: 該第一特戡抽取模組將該圔型之一第一組特徵表 逹成該第一特激向量,並額外地將該圔型之一第二組 特徽表達成一第二特徽向量;. 該第一特戡轉換模組轉換該第一特徵向量之全部 以産生對應於各該種類的一第一被轉換特徽向量;以 及 該裝置額外地包含一特徽向量組合模組,其組合 該第二特徵向量和對應於各該種類的該第一被轉換特 徵向量,以産生對應於各該種類的該至少部分被轉換 第一特徽向量,該特徽向量組合模組被插置在該第一 特徵抽取模組和該辨識部段間。 9. 依據申請專利範圍第8項之圖型辨識裝置,其中: 該第二特戡向量具有多個維度; - 該裝置額外地包含縮減該第二特徽向量之維度數 目以産生一維度縮減第二特徽向量的一維度縮減棋組 ,該維度縮減模組被插置在該第一待徽抽取模組和該 特徽向量組合模組間;以及 該特徽向量組合模組組合該維度縮減第二特徵向 量和對應於各該種類的該第一被轉換特徵向量,以産 生對應於各該種類的該至少部分被轉換特徽向量。 ..1 0 ,依據申請專利範圍第9項之圖型辨識裝置,其中該 特徽向量組合模組藉抽取下列之至少一個子集合而 産生該被組合的特徴向量: .* *54- 本紙張歧適用中國國家標準(CNS )八4祕(210X297公釐) --------—裝-- (請先聞讀背面之注意事項再填寫本頁) 、,τ- 經濟部中央標準局負工消費合作社印製 ' A8 B8 fc8 D8 六、申請專利範圍 ’ 該維度縮減的第二特徽向量,及 對應於各該種類的該第一被轉換特徵向量 1 1 .依據申請專利範圍第1、2、3、4、5、8、9 或1 0項之任一之圔型辨識裝置,其中: 該轉換向量矩陣包括響應於由被誤辨識為屬於 構成一種類子集合的多個該等種類之多値對抗圖型 組成的一對抗圔型集合而産生的一轉換向量矩陣; .以及 響應於該轉換向量矩陣而産生的該至少部分被 轉換第一特徵向量傺共同於該等種類中構成該種類 子集合的該等種類。 12.—種圖型辨識方法,該方法包含有; 接收包括羼於構成一種類集合的多個種類之一 的一圔型的輸入圔型; 將該圔型之多個特徽表達成一特徵向量; 使用轉換向量矩陣轉換至少部分之該特徽 向量以産生對應於各該種類的一至少部分被轉換的 特徽向量; 在下列間實施一匹配操作: 匹配資訊和針對各該種類的被轉換匹配資 訊,該被轉換匹配資訊偽使用該等轉換向量矩 陣而被轉換的匹配資訊,及 從對應於各該種類的該至少部分被轉換的 特徽向量導出的一匹配向量, _________-5R- -_. 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) (請先鬩讀背面之注意事項再填寫本頁) 一裝· 訂 經濟部中央榇準局員工消費合作社印製 A8 B8 C8 D8 六、申請專利範圍 ’ 以産生針對各該種類的至少一差異值;以及 ' 響應於該至少一差異值而辨別該圖型所屬的該 等種類中之該一種類。 1 3.依據申請專利範圍第1 2項之方法,其中該等轉換 向量矩陣包括針對(a)屬於該種類集合的一種類、 及00含有屬於該種類集合的多値該等種類之一種 類子集合二者中之一者的一轉換向量矩陣,該轉換 向量矩陣偽由下列所産生: 接收其之痼別種類被定義的訓練圔型並將該等 訓練圔型之多個特歡表達成多痼第一特徽向量; 藉由在從該等第一特徵向量導出的多個第一匹 配向量和該匹配資訊間實施一匹配操作,而辨別該 等訓練圔型分別所靥的種類; 將該等訓練圖型被辨別為所屬的該等種類與該 >,> 等個別的被定義種類作比較,以定義對(a)該種類 、和(b)該種類子集合二者中之一個別者的一對抗 圔型集合; 從被定義為屬於U)該種類、和(b)該種類子集 合二者中之該一個別者的所有該等訓練圔型之該等 特徵向量而決定一平均向量; 針對屬於該對抗圔型集合的各該訓練圖型使用 該平均向量計算一差異向量; 計算該等差異向量之一自動相關矩陣;以及 採用該自動相關矩陣之一些特性向量作為構成 _. ___"..5 fi-____ 1 — 本紙張尺度適用中國國家樣準(CNS ) A4規格(210 X 297公釐) (請先閲讀背面之注意事項再填寫本頁) '裝· 訂 A'BCD 經濟部中央擦準局員工消費合作社印製 々、申請專利範圍 針對(a)該種類、和(b)該種類子集合二者中之該一 個別者的該轉換向量矩陣的一些轉換向量。 1 4 .依據申請專利範圍第13項之方法,其中: 該自動相闊矩陣之該等待性向量具有値別的特 性值;且 採用特性向量包括: 加總該自動相關矩陣之所有該等特性向量 的該等特性值以産生一第一加總值,及 ' 以漸降特性值之順序採用該等特性向量作 .為所採用的特性向量,並加總該等被採用的特 性向量之該等特性值以産生一第二加總值,直 到該第二加總值超過該第一加總值之一預定分 數為止。 15*依據申請專利範圍第13項之方法,其中: 該方法額外地包含: 從被定義為屬於該種類的所有訓練圔型之 該等特徴向量計算一協方差矩陣,及 以該自動相關矩陣乘該協方差矩陣以産生 一乘積矩陣;以及 在採用特性向量時,該乘積矩陣之特性向量被 揉用以取代該自動相關矩陣之特性向量而作為該轉 換向量矩陣之該等轉換向量。 16.依據申請專利範圍第12、 13、 14或15項之 方法,其中針對屬於該種類集合的一種類之該被轉 ---· -R7- 本紙張Xjt適用中國國象標準(CNS ) A4規格(210X297公釐) I-------.1^— (請先閲讀背面之注意事項再填寫本頁) ΐτ -IU. A8 B8 C8 D8 六、申請專利範圍 換辨識資訊係被下列所産生: 接收其之個別種類被定義的訓練圔型,並將該 等訓練圔型之一些特徽表達成特徴向量; 藉由在從該第一特徽向最導出的一第一匹配向 量和該匹配資訊間實施一匹配操作,而辨別該等訓 練圖型分別所屬的種類; 將該等訓練圔型被辨別為所屬的該等種類與該 等個別的被定義種類作比較,以定義針對該種類的 一對抗圔型集合; 使用針對(a)該種類和(b)該種類所屬的一種類 子集合二者中之一者的該轉換向量矩陣轉換該等訓 練圖型之該等特徵向量,該種類子集合包含屬於該 種類集合的多個種類,以産生値別的被轉換的特徽 向量; 使用該等被轉換特徵向量實施一辨認分析以産 生一辨認函數; 使用該辨認函數計算針對各該種類的一修正差 異值; 經濟部中央標準局員工消費合作社印製 (請先閱讀背面之注意事項再填寫本頁) 響應於針對各該種類的該修正差異值而再辨別 該等訓練圔型分別所屬的種類; 響應於該等新的差異值而重新將該等訓練圔型 被辨剠為所屬的該等種類與該等値別被定義種類作 比較,以決定是否有額外的圖型被誤辨識為屬於該 種類;以及 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -58- ABCD 經濟部中央標準局員工消費合作社印製 六、申請專利範園 當沒有額外的圔型被誤辨識時使用該辨認函數 産生該被轉換辨識資訊,以及否則即包括該等額外 圖型在該種類之該對抗圔型集合中,並重覆該辨認 分析實施、修正差異值計算、種類再辨別和再比較 操作,直到沒有額外的圖型被誤辨識為止。 17.依據申請專利範圍第12項之方法,其中: 該方法額外地包含: 在針對各該種類的該匹配資訊和從該特徵 向量導出的一第一匹配向量間實施一匹配操作 以産生針對各該種類的一第一差異值; 響應於該等第一差異值,産生指出何時基 於該等第一差異值的圔型辨識將為可靠的一可 靠性指示; 饗應於針對各該種類的該第一差異值之一 總和、與當該可靠性指示指出基於該等第一差 異值的圖型辨識將不可靠時針對各該種類的該 第二差異值之一倍數,該等種類中為該圔型所 屬的該一種類即被辨識;以及 該倍數係由下列所決定: 將該乘數設定於一起始數值, 接收其之痼別種類被定義的一些訓練’ 圔型, 對該等訓練圖型執行該表達、第一匹 配操作實施、可靠性指示産生操作,以把 -—...... . ~ 5 9 ~ 本紙張尺度逋用中國國家標準(CNS ) A4規格(210 X 297公釐) II —^ 4 裝 I I I I 訂—— m)^ (請先閱讀背面之注意事項#填寫本頁) ABCD 六、申請專利範圍 其可靠性指示指出基於該等第一差異值的 圖型辨識將不可靠於作為被辨別的訓練圔 型之該等訓練圖型辨別為已辨別的訓練圔 型, 對該等已辨別訓練圔型之該等特歡向 量實施轉換操作,及 對該等已辨別訓練圔型實施下面序列 ,直到該乘數具有對應於一最大辨識正確 性的一數值為止: 實施該第二匹配和辨別操作; 將該等已辨別訓練圔型被辨別為 所屬的該等種類與該等個別的被定義 種類作比較,以決定一辨識正確性; 及 改變該乘數。 --I------------ΐτ------}球 (請先閱讀背面之注意事項再填寫本頁) 經 濟 央 標 务 員 工 消 費 合 作 本紙張尺度適用中國國家操準(CNS ) A4規格(210X297公釐^
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03020297A JP4039708B2 (ja) | 1997-02-14 | 1997-02-14 | パターン認識方法およびパターン認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW399188B true TW399188B (en) | 2000-07-21 |
Family
ID=12297165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW087102143A TW399188B (en) | 1997-02-14 | 1998-04-16 | Method and apparatus for recognizing patterns |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP0960381B1 (zh) |
JP (1) | JP4039708B2 (zh) |
KR (1) | KR100494261B1 (zh) |
CN (1) | CN1247615A (zh) |
DE (1) | DE69805280T2 (zh) |
TW (1) | TW399188B (zh) |
WO (1) | WO1998036372A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
RU2160467C1 (ru) * | 1999-07-08 | 2000-12-10 | Яхно Владимир Григорьевич | Способ адаптивного распознавания информационных образов и система для его осуществления |
JP2002099916A (ja) | 2000-09-25 | 2002-04-05 | Olympus Optical Co Ltd | パターン分類方法及びその装置、コンピュータにより読み取り可能な記憶媒体 |
JP2003099777A (ja) * | 2001-09-21 | 2003-04-04 | Victor Co Of Japan Ltd | 顔画像検索装置 |
US7031530B2 (en) * | 2001-11-27 | 2006-04-18 | Lockheed Martin Corporation | Compound classifier for pattern recognition applications |
CN100421127C (zh) * | 2002-07-16 | 2008-09-24 | 日本电气株式会社 | 模式特征提取方法及用于执行该方法的设备 |
DE602004023228D1 (de) * | 2003-12-16 | 2009-10-29 | Canon Kk | Musteridentifikationsverfahren, vorrichtung und programm |
EP1883040A1 (en) * | 2006-07-28 | 2008-01-30 | IEE International Electronics & Engineering S.A.R.L. | Pattern classification method |
JP4820830B2 (ja) * | 2008-02-15 | 2011-11-24 | 株式会社東芝 | パターン認識装置、パターン認識プログラム及びパターン認識方法 |
JP6080580B2 (ja) * | 2013-02-07 | 2017-02-15 | 三菱電機株式会社 | パターン認識装置 |
JP5892275B2 (ja) * | 2015-02-26 | 2016-03-23 | カシオ計算機株式会社 | 多クラス識別器生成装置、データ識別装置、多クラス識別器生成方法、データ識別方法、及びプログラム |
CN107533671B (zh) * | 2015-05-11 | 2021-02-23 | 株式会社东芝 | 模式识别装置、模式识别方法以及记录介质 |
JP2018112839A (ja) | 2017-01-10 | 2018-07-19 | 富士通株式会社 | 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法 |
CN110325998B (zh) * | 2017-02-24 | 2024-03-12 | 瑞典爱立信有限公司 | 使用机器学习对实例进行分类 |
JP2020533702A (ja) * | 2017-09-13 | 2020-11-19 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 対象者識別システム及び方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2690027B2 (ja) * | 1994-10-05 | 1997-12-10 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | パターン認識方法及び装置 |
-
1997
- 1997-02-14 JP JP03020297A patent/JP4039708B2/ja not_active Expired - Fee Related
-
1998
- 1998-02-13 EP EP98906332A patent/EP0960381B1/en not_active Expired - Lifetime
- 1998-02-13 CN CN98802531A patent/CN1247615A/zh active Pending
- 1998-02-13 WO PCT/US1998/002660 patent/WO1998036372A1/en active IP Right Grant
- 1998-02-13 KR KR10-1999-7007381A patent/KR100494261B1/ko not_active IP Right Cessation
- 1998-02-13 DE DE69805280T patent/DE69805280T2/de not_active Expired - Lifetime
- 1998-04-16 TW TW087102143A patent/TW399188B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JPH10240930A (ja) | 1998-09-11 |
KR100494261B1 (ko) | 2005-06-13 |
JP4039708B2 (ja) | 2008-01-30 |
DE69805280D1 (de) | 2002-06-13 |
WO1998036372A1 (en) | 1998-08-20 |
KR20000071094A (ko) | 2000-11-25 |
CN1247615A (zh) | 2000-03-15 |
DE69805280T2 (de) | 2002-10-02 |
EP0960381A1 (en) | 1999-12-01 |
EP0960381B1 (en) | 2002-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6671404B1 (en) | Method and apparatus for recognizing patterns | |
TW399188B (en) | Method and apparatus for recognizing patterns | |
JP4504702B2 (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
US6208971B1 (en) | Method and apparatus for command recognition using data-driven semantic inference | |
JP2006252333A (ja) | データ処理方法、データ処理装置およびそのプログラム | |
JP4393720B2 (ja) | パターン認識装置および方法 | |
CN111309893A (zh) | 基于源问题生成相似问题的方法和装置 | |
EP2191396B1 (en) | An apparatus for preparing a display document for analysis | |
JP5365065B2 (ja) | 辞書作成装置 | |
US8340428B2 (en) | Unsupervised writer style adaptation for handwritten word spotting | |
JP4935905B2 (ja) | 文字認識処理方法及び装置 | |
Subrahmonia et al. | Writer dependent recognition of on-line unconstrained handwriting | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
JP5353482B2 (ja) | パターン認識用辞書生成装置、パターン認識装置、及びパターン認識用辞書生成方法 | |
US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
JP5683287B2 (ja) | パターン認識装置及びパターン認識方法 | |
JP3930174B2 (ja) | 文字認識方法および文字認識装置 | |
JP4226942B2 (ja) | アクセント位置推定方法、装置およびプログラム | |
JP3278829B2 (ja) | オンライン手書き文字切り出し方法および装置 | |
JP3925011B2 (ja) | パターン認識装置及び認識方法 | |
JP7367139B2 (ja) | データ検索方法及びシステム | |
Rodrıguez et al. | Score normalization for HMM-based word spotting using a universal background model | |
Nathan et al. | Parameter tying in writer-dependent recognition of on-line handwriting | |
JP2024082054A (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP4330296B2 (ja) | 文字認識装置、文字認識信頼度判定方法、その実行プログラムおよびそれを記憶した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |