JP2982075B2 - 文字切出し方法 - Google Patents

文字切出し方法

Info

Publication number
JP2982075B2
JP2982075B2 JP2094239A JP9423990A JP2982075B2 JP 2982075 B2 JP2982075 B2 JP 2982075B2 JP 2094239 A JP2094239 A JP 2094239A JP 9423990 A JP9423990 A JP 9423990A JP 2982075 B2 JP2982075 B2 JP 2982075B2
Authority
JP
Japan
Prior art keywords
character
pattern
block
chunk
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2094239A
Other languages
English (en)
Other versions
JPH03291779A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2094239A priority Critical patent/JP2982075B2/ja
Publication of JPH03291779A publication Critical patent/JPH03291779A/ja
Application granted granted Critical
Publication of JP2982075B2 publication Critical patent/JP2982075B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置における文字切出し方法に係
り、特にマルチサイズや不定ピッチの日本語処理にも適
用可能な文字切出し方法に関する。
〔従来の技術〕
行画像の垂直射影をとったり黒画素の連結を追跡する
ことにより文字塊(文字素)を抽出し、その文字塊を統
合して1文字とみなせるパターンを文字パターン候補と
して切出し、それぞれの認識を行い、各文字パターン候
補の認識結果の確からしさの評価値を比較することによ
り最も確からしい文字パターン候補を文字パターンとし
て確定する文字切出し方法が考案されている。
このような認識結果をフィードバックする文字切出し
方法は、行画像の垂直射影を利用したり黒画素の連結を
追跡したりして単純に文字切出し位置を決定する方法に
比べ本質的に切出し精度を上げることが可能であり、特
に、マルチサイズや不定ピッチの日本語文章に対しても
高精度の文字切出しを期待できる。
〔発明が解決しようとする課題〕
しかし、例えば偏と旁に分離する文字の場合、偏の部
分、旁の部分及びその統合した本来の文字パターンがそ
れぞれ文字パターン候補として対等に評価されるので、
偏または旁に対応する単純なパターンが文字パターンと
して選ばれ文字の分離切出し(“語”が“言”と“吾”
への分離)が起こることがあるという問題がある。
なお、このような分離切出しの防止のために有効な手
段としては、注目する文字パターン候補の部分パターン
よりなる他の文字パターン候補が1個以上ある場合に、
他の文字パターン候補の一つでも注目文字パターン候補
より確からしさが低いときには、注目文字パターン候補
を文字パターンに選ぶように改良した文字切出し方法
(特願平1−293450号)が既に考案されている。
例えば“機”の場合、その部分パターンである“木”
と“幾”及び本来の“機”がそれぞれ文字パターン候補
となる。その認識結果の文字としての確からしさは、パ
ターンが単純な“木”が最も高くなる可能性があるが、
他方の部分パターンである“幾”の確からしさは“機”
の確からしさより低くなる。したがって、この改良方法
によれば、統合パターンである本来の“機”が文字パタ
ーンとして選ばれ、分離切出しが防止される。
しかし、この改良方法によっても、マルチサイズ不定
ピッチの日本語文章、特に半角サイズの文字が混在した
日本語文章の処理においては分離切出しの防止が不完全
になる場合があった。
本発明の目的は、分離切出しをより完全に防止でき、
半角サイズ文字が混在するようなマルチサイズ・不定ピ
ッチの日本語文章に対し高精度の文字切出しが可能な文
字切出し方法を提供することにある。
〔課題を解決するための手段〕
本発明は、行画像より文字塊を切出し、文字塊を組合
せた文字パターン候補の認識を行い、認識結果の確から
しさを評価することにより文字パターン候補から文字パ
ターンを選択するが、文字塊が重複した複数の文字パタ
ーン候補に関しては、その文字塊の前後の間隔を比較
し、この比較結果に応じて、確かさの評価に用いる評価
値の種類及び評価による文字パターンの選択方法を切り
替えるものである。
〔作 用〕
同一の文字塊を含むパターン候補が現われた場合に、
例えば、その文字塊(注目文字塊)と次の文字塊との間
隔が前の文字塊との間隔から適当な一定値を差し引いた
値より大きいときに、注目文字塊が単独の文字パターン
である可能性が高いケースと判定し、そうでないときに
注目文字塊と次の文字塊との統合パターンが文字である
可能性が高いケースと判定する。
そして、前者のケースでは例えば、注目文字塊の単独
パターンと次の文字塊との統合パターンだけを評価対象
とし、評価値として辞書との距離を総輪郭数で除した値
を用い、評価値が小さいほうのパターンを文字パターン
として選択する方法とし、後者のケースでは例えば、評
価値として辞書の距離を用い、前記特願平1−293450号
の文字切出し方法と同様の文字パターン選択方法とすれ
ば、前記特願平1−293450号の文字切出し方法で生じた
ような分離切出しを防止し、より正確な文字切出しが可
能である。
〔実施例〕
第1図は本発明の一実施例を示すブロック図である。
スキャナ等の2値画像入力部100より文書画像を読取
り、その2値画像データをイメージメモリ101に格納す
る。
行切出し部102において、その文書画像より、例えば
水平射影(横書き文書では横方向の射影)をとることに
よって行画像(文字列画像)を切出す。
文字塊切出し部103において、行画像に対し垂直射影
をとったり黒画素の連結を追跡することにより文字塊
(文字素)を切り出す。この文字塊は、その自体が単独
で文字パターンであるか、あるいは文字の部分パターン
である。
文字パターン生成部104においては、文字塊切出し部1
03からの文字塊の切出し情報に従い、文字塊を組合せて
1文字の大きさと看做し得る文字パターン候補を生成
し、各文字パターン候補についての文字塊の組合せの情
報を組合せ情報テーブル105に格納する。なお、単独の
文字塊が文字パターン候補となる場合も当然にある。ま
た文字パターン生成部104は、文字パターン候補の前後
のピッチを計算し、それをピッチ情報テーブル106に格
納する。
認識部107において、生成されたすべての文字パター
ン候補を文字パターンとして扱い、それぞれについて特
徴抽出及び辞書108とのマッチングを行い、認識結果
(文字コード)及び辞書との距離、並びに文字パターン
候補の総輪郭数を認識情報メモリ109に格納する。
評価値算出部110において、認識情報メモリ109より各
文字パターン候補の距離と総輪郭数を読み出し、 E=距離/総輪郭数 を算出して評価値メモリ111に格納する。
なお、後述の如く、このE値は認識結果の確からしさ
の一つの評価値であるが、後述のように、文字候補パタ
ーンの前後のピッチに関連して距離Dの値が評価値とし
て用いられることがある。すなわち、ピッチに関速して
2種類の評価値の一方を選択して評価に用いる。なお、
総輪郭数で除算するのは、パターンが複雑になるほど距
離が大きくなる傾向があるので、それを補正することを
目的としている。
文字パターン選択部112において、組合せ情報テーブ
ル105、ピッチ情報テーブル106、認識情報メモリ109及
び評価値メモリ111を参照し、文字としての確からしさ
が高い文字候補パターンを選択し、その認識結果を出力
する。ただし、文字塊が重複した文字パターン候補の評
価に関しては、前後のピッチに関連して、用いる評価値
の種類を選択するとともに、評価により文字パターンを
選択する方法(評価方法)を切り替える。この文字パタ
ーン選択法は2種類ある。
第2図を用い、より具体的に処理内容を説明する。
処理 2値画像入力部100によって文書の2値画像データを
入力し、行切出し部102によって水平射影をとり、射影
値が一定値を越える区間を行として切出す。
処理〜 文字塊切出し部103において、例えば行画像について
垂直射影をとり、射影値が一定値を越える区間を文字塊
として切出し、あるいは黒画素の連結を追跡し、連結し
た黒画素の塊を文字塊として切出し、切出し情報を文字
パターン生成部104に順次与える。
文字パターン生成部104において、文字塊切出し情報
より、行における最小文字間隔と最大文字幅を求める。
最小文字間隔は、例えば全角文字塊と全角文字塊との間
隔の中の最小値を2で除した値とする。ここで全角文字
塊とは、明らかに全角と看做される文字塊であって、例
えば、 文字塊幅≧行高さ×2/3 を満足するものとする。また最大文字幅は、例えば行内
の文字塊の幅を最大値とする。
次に文字パターン生成部104は、間隔が最小文字間隔
以下の文字塊を統合する。ただし、統合後の幅が最大文
字幅を越えないようにする。
例えば第3図に示す入力文字列(行画像)の場合、文
字塊1〜7が切り出されるが、間隔すなわちピッチcが
最小文字間隔以下で、かつ統合後の幅が最大文字幅以下
であるならば文字塊4,5が統合されることになる。
文字パターン生成部104は、この統合後の文字塊を左
から右へ(行頭から行末へ)順に組合せ、幅が最大文字
幅以下のものを文字パターン候補として登録し、各文字
パターン候補を構成する文字塊の番号を組合せ情報テー
ブル105に登録する。単独の文字塊も文字パターン候補
となる。
第3図に示した例では、I〜IXの9パターンが文字候
補パターンとして登録される。III〜VIIの文字パターン
候補は文字塊が重複している。
また文字パターン生成部104は、各文字パターン候補
を構成している文字塊とそれに近接する文字パターンと
の間隔を前後とも計算し、ピッチ情報テーブル106に登
録する。第3図の例において、文字塊3では間隔a,bが
算出され、また文字塊4では間隔b,cが算出される。
処理 認識部107において、すべての文字パターン候補につ
いて特徴を抽出して辞書108とのマッチングを行い、認
識結果の文字コード、辞書との距離Dとともにパターン
の総輪郭数を認識情報メモリ109に格納する。
処理 評価値算出部110は、認識情報メモリ109より各文字パ
ターン候補に関する距離Dと総輪郭数を読出し、前記E
の値を計算して結果を評価値メモリ11に格納する。前述
のように、評価値としては、このE値が通常は用いられ
るが、距離Dの値が用いられることもある。いずれの値
であっても、小さいほど文字としての確かさが高いこと
を意味する。
処理〜 文字パターン選択部112において、行頭より文字パタ
ーン候補に対し並び順に実行する処理である。
文字塊の重複がない文字パターン候補については、文
字パターンとして確定し、認識情報メモリ109に格納さ
れている認識結果(文字コード)を出力する。
同一の文字塊を含む複数の文字パターン候補に関して
は、ピッチ情報テーブル106より、注目した文字塊の前
の間隔pfと後の間隔pbを読出し、 pf>pb−const の条件の判定を行い、その判定結果によって2種類の処
理方法のうちの一つを選択する。
ただしconstは一定値であるが、これは予め定められ
た定数あるいは1行内の文字ピッチから統計的に求めら
れる値である。
まず、上記判定条件が満たされた場合について説明す
る。この場合、→または→という処理の流れと
なる。すなわち、注目している文字塊が単独の文字パタ
ーンとして成り立つ可能性が大きいとして、その注目文
字塊の単独パターンである文字パターン候補と、次の文
字塊と統合された文字パターン候補のみに関し、それぞ
れのE値を評価値として用い比較し、その値が小さいほ
うのパターンを文字パターンとして選択し、その認識結
果(文字コード)を出力する。選択されなかった他方の
パターンは棄却する。
例えば、第3図に示した例において、第4図に示すデ
ータが得られたとする。文字塊3の後間隔aと前間隔b
との間では前記判定条件が満たされる(b>a−cons
t)。したがって、文字パターン候補III,IVに関して、
それぞれの評価値であるE値すなわちE(s),E(u)
が比較される。第4図から分かるように、E(s)=7
0,E(u)=80であるから、値の小さい文字パターン候
補IIIすなわち文字塊3の単独パターンが文字パターン
として選択され、その認識結果が出力される。
因みに前記特願平1−293450号の文字切出し方法によ
れば、文字パターン候補IVと、その部分パターンである
文字パターン候補III,Vが評価の対象となり、部分パタ
ーンである文字パターン候補III,Vの評価値(E値)の
最大値が135で、文字パターン候補IVの評価値80より大
きい(確からしさが低い)ので、選択されるべき文字パ
ターン候補IIIが選択されずに、統合パターンである文
字パターン候補IVが文字パターンとして選択されてしま
うという間違いが起こる。本発明によれば、この間違い
を防止できる。
次に前記判定条件が満たされない場合について説明す
る。→→または→という処理の流れになる。
この場合、注目する文字塊と次の文字塊を統合したパ
ターンが文字パターンとして成り立つ可能性が大きいと
して、前記特願平1−293450号の方法と同様に、部分パ
ターンの一つでも評価値が統合パターンの評価値より大
きければ(確かさが低ければ)、統合パターンを選択す
る。ただし、統合されたパターンのほうが総輪郭数が多
いため、距離を総輪郭数で除したE値は、統合パターン
のほうが小さくなりがちであるので、評価値としてE値
でなく距離Dの値を用いる。
第3図に示した例において、文字塊4の前間隔cと後
間隔bは c≦b−const であるので、評価値すなわち距離Dによる評価は、分離
パターンである文字パターン候補V,VIIの距離D(s1),
D(s2)の最大値D(s)と、統合パターンである文字
パターン候補VIの距離D(u)との間で行う。第4図に
より、D(s)=D(s2)=130であって、D(u)=8
0より大きいので、統合パターンである文字パターン候
補VIが文字パターンとして選択され、その認識結果が出
力される。
もし、D(s)<D(u)であれば、分離パターンが
文字パターンとして選択され、その認識結果が出力され
る。
以上の処理により、第4図に示した例の場合には、文
字パターン候補I,II,III,VI,VIII,IXがそれぞれ文字と
して切り出される。
〔発明の効果〕
以上の説明から明らかな如く、本発明によれば、マル
チサイズ、不定ピッチの日本語文章においても、半角サ
イズの文字や偏と旁等の部分に分離する文字の正確な切
出しが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
処理のフローチャート、第3図は文字切出しの一例の説
明図、第4図は第3図の例における文字パターンとその
データとを対応させて示す図である。 100……2値画像入力部、101……イメージメモリ、102
……行切出し部、103……文字塊切出し部、104……文字
パターン生成部、105……組合せ情報テーブル、106……
ピッチ情報テーブル、107……認識部、108……辞書、10
9……認識情報メモリ、110……評価値算出部、111……
評価値メモリ、112……パターン選択部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】行画像より文字塊を切出し、文字塊を組合
    せた文字パターン候補の認識を行い、認識結果の確から
    しさを評価することにより文字パターン候補から文字パ
    ターンを選択する文字切出し方法において、 文字塊が重複した複数の文字パターン候補に関して、そ
    の文字塊(注目文字塊)の前後の間隔を比較し、 注目文字塊と次の文字塊との間隔が前の文字塊との間隔
    から所定値を引いた値より大きいときは、注目文字塊の
    単独パターンと次の文字塊との統合パターンを評価対象
    として文字パターンの選択を行い、 注目文字塊と次の文字塊との間隔が前の文字塊との間隔
    から所定値を引いた値より大きくないときは、注目文字
    塊の単独パターン、次の文字塊の単独パターン及びこれ
    ら文字塊の統合パターンを評価対象として文字パターン
    の選択を行う、 ことを特徴とする文字切出し方法。
JP2094239A 1990-04-10 1990-04-10 文字切出し方法 Expired - Lifetime JP2982075B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2094239A JP2982075B2 (ja) 1990-04-10 1990-04-10 文字切出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2094239A JP2982075B2 (ja) 1990-04-10 1990-04-10 文字切出し方法

Publications (2)

Publication Number Publication Date
JPH03291779A JPH03291779A (ja) 1991-12-20
JP2982075B2 true JP2982075B2 (ja) 1999-11-22

Family

ID=14104757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2094239A Expired - Lifetime JP2982075B2 (ja) 1990-04-10 1990-04-10 文字切出し方法

Country Status (1)

Country Link
JP (1) JP2982075B2 (ja)

Also Published As

Publication number Publication date
JPH03291779A (ja) 1991-12-20

Similar Documents

Publication Publication Date Title
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
CN104008384A (zh) 字符识别方法和字符识别装置
JPH08166970A (ja) コード化したワードトークンを使用して文書画像をハイライトで強調する方法
JPS6077279A (ja) 文字イメ−ジ切出し方法
JP2982075B2 (ja) 文字切出し方法
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JP3157530B2 (ja) 文字切り出し方法
JP2851102B2 (ja) 文字切出し方法
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP2895115B2 (ja) 文字切出し方法
JP3093397B2 (ja) 文字認識方法
JPH09274645A (ja) 文字認識方法および装置
JP5213338B2 (ja) 文字認識装置、文字認識方法、コンピュータプログラム
JP3848792B2 (ja) 文字列認識方法及び記録媒体
JPH04335487A (ja) 文字認識装置の文字切り出し方法
JP3220226B2 (ja) 文字列方向判別方法
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JPS6111886A (ja) 文字認識方式
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP3665435B2 (ja) 文字認識装置および文字認識方法
JPH01191992A (ja) 文字認識装置
JPS60138689A (ja) 文字認識方法
JPH0581477A (ja) 文字切出し方法
JPH0535917A (ja) 文字切り出し方法
KR20180117844A (ko) 한글 폰트 획 오류를 고속 자동 검사하는 방법

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 11