JPH05342415A - 類似文字判定方式 - Google Patents

類似文字判定方式

Info

Publication number
JPH05342415A
JPH05342415A JP4150189A JP15018992A JPH05342415A JP H05342415 A JPH05342415 A JP H05342415A JP 4150189 A JP4150189 A JP 4150189A JP 15018992 A JP15018992 A JP 15018992A JP H05342415 A JPH05342415 A JP H05342415A
Authority
JP
Japan
Prior art keywords
character
similar
character string
characters
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4150189A
Other languages
English (en)
Inventor
Yoichi Kobayashi
陽一 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NAGANO NIPPON DENKI SOFTWARE KK
NEC Software Nagano Ltd
Original Assignee
NAGANO NIPPON DENKI SOFTWARE KK
NEC Software Nagano Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NAGANO NIPPON DENKI SOFTWARE KK, NEC Software Nagano Ltd filed Critical NAGANO NIPPON DENKI SOFTWARE KK
Priority to JP4150189A priority Critical patent/JPH05342415A/ja
Publication of JPH05342415A publication Critical patent/JPH05342415A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】類似文字の判定を正確にし、文字認識結果の精
度を向上させる。 【構成】文字認識装置11から得られた文字列は文字列
記憶手段12に格納される。類似文字検出手段13は、
この文字列の先頭から類似文字を検出する。キー検索手
段14は類似文字の両隣の文字から右と左の2方向に順
次文字列を検索していく。検索は類似文字以外の英字お
よび数字、またはスペースが現れるまで続けられる。次
に、キー検索手段14で行った検索範囲の類似文字に付
いて、文字変換手段15は類似文字の左右の文字種類を
キーとして判定を行い、必要があれば文字列記憶手段1
2における類似文字の変換を行う。変換を行うための条
件は、変換条件記憶手段16に記憶されている。変換さ
れた文字列記憶手段12における文字列は、結果17と
して出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、英数字活字認識システ
ムに関し、特に類似文字判定方式に関する。
【0002】
【従来の技術】従来、活字一般文書における類似文字
“小文字エル”、“1(イチ)”、“O(オー)”、
“0(ゼロ)”は、形状的な特徴が非常に類似している
ため、パターン認識を利用した方法のみではこれらの文
字を精度よく認識するのは不可能に近かった。そこで、
パターン認識の後処理として、認識結果中の類似文字に
対してその文字が文字列として妥当であるかを判定し、
必要があれば変換するなどしていた。ここで、図5を用
いて従来の類似文字判定方式を説明する。
【0003】図5において、まず認識結果の文字列21
から類似文字22と両隣の文字23を検出する。類似文
字は数字の1,0と英字の小文字エル,O(オー)の2
種類に分けられる。次に、類似文字が妥当であるか判定
する。類似文字と両隣の文字種類が異なる場合、例えば
数字の類似文字0(ゼロ)の両隣の文字が英字である場
合や、英小文字エルの両隣の文字が数字である場合、そ
の類似文字は文字列として妥当と考えられない。そのた
めこのような場合では、類似文字が両隣の文字種類と同
一となるような変換を行う。即ちこの例の場合は、1→
小文字エル、O→0(ゼロ)のように変換する。その結
果求められたのが文字列24である。
【0004】
【発明が解決しようとする課題】上述した従来の類似文
字判定方式は、類似文字が2文字以上続いてしまった
り、単語中に記号が混入している場合は判定が出来な
い。一般的にこれらの文字は文字列中に多数存在する可
能性があるため、処理の効果がかなり限定されるという
欠点があった。
【0005】本発明の目的は、従来のこの様な欠点を除
去し、類似文字が文字列上のどの様な位置にあっても効
果的な判定が可能な方式を提供することにある。
【0006】
【課題を解決するための手段】第1の発明は、類似文字
判定方式において、文字認識装置から得られた文字列を
格納する文字列記憶手段と、前記文字列の先頭から類似
文字を検出する類似文字検出手段と、検出された前記類
似文字の両隣の文字から右と左の2方向に予め定められ
たスペースを含む文字種類が現れるまで順次文字列を検
索するキー検索手段と、前記左右2方向に前記文字種類
が現れた時点で前記検索範囲における類似文字を変換方
法に従って予め定められた文字に変換する文字変換手段
と、前記左右2方向の前記文字種類の組み合わせにより
前記類似文字の前記変換方法を定義した変換条件記憶手
段とを備えたことを特徴とする。
【0007】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0008】図1は本発明の一実施例を示すブロック図
である。
【0009】文字認識装置11から得られた文字列は文
字列記憶手段12に格納される。この文字列に対して類
似文字検出手段13が、文字列の先頭から類似文字を検
出していく。類似文字が検出された場合、キー検索手段
14が類似文字の両隣の文字から右と左の2方向に順次
文字列を検索していく。検索は類似文字以外の英字およ
び数字、またはスペースが現れるまで続けられる。左右
2方向の検索が終了した時点で、類似文字の右側と左側
の文字種類が決定する。次に、キー検索手段14で行っ
た検索範囲の類似文字に付いて、文字変換手段15は類
似文字の左右の文字種類をキーとして判定を行い、必要
があれば類似文字の変換を行う。変換を行うための条件
は、変換条件記憶手段16に記憶されており、その記憶
された内容を参照して文字列記憶手段12に記憶された
文字列を変換する。同時に、再び類似文字検索手段13
に制御が戻され、検索範囲の次の文字から同様の手順を
繰り返すことにより、文字列記憶手段12に記憶されて
いる文字列全体について類似文字の判定及び変換を行
う。判定及び変換された文字列記憶手段12における文
字列は、結果17として出力される。
【0010】次に、図2を用いて類似文字判定方式の具
体的処理を説明する。
【0011】図2の31は文字列記憶手段12に記憶さ
れている文字列で、この文字列の先頭から類似文字検出
手段13が、類似文字が現れるまで検索(矢印S1)を
行う。この時検出された類似文字が“1”32である。
次に、類似文字“1”32の左右の文字列に対し、キー
検索手段14が検索を行う(図2の矢印SL,SR)。
この検索は、類似文字以外の英字と数字およびスペース
が現れるまで各方向について続けられる。検索の結果
“スペースとg”34が求められたとする。この類似文
字の左右の文字種類の組合せが文字変換手段15の判定
処理におけるキーとなる。この例の場合は、スペースと
アルファベット(英字)の組合せとなる。
【0012】上述した方法により求まった文字種類の組
合せと、SLからSRまでの検索範囲を用い、文字変換
手段15は検索範囲の最初の文字から再び類似文字の検
査を行う。これは類似文字間に記号などが入っている場
合があるからである。類似文字が検出されると図3に示
す変換条件に基づいて変換を行う。この例の場合、文字
種類の組合せはスペースと英字なので、番号1の変換を
行い、その結果図2の文字列31における文字“10”
33は、“英小文字エル,オー”35に変換される。
【0013】一方、上述した検索範囲の次の文字列先頭
(図2のS2以降)から再び類似文字検出手段13によ
る類似文字の検索以降の手順を繰り返す。
【0014】図4は、上述の処理のフローチャートであ
る。最初に文字列の先頭の文字に着目する(ステップ5
1)。その文字が類似文字か否かを調べ(ステップ5
3)、類似文字でない場合は順番に文字を検索してい
く。類似文字を場合、その文字の左右2方向に検索を行
う(ステップ55)。検索は、対象の文字が類似文字以
外の英字および数字、またはスペースになるまで行われ
る(ステップ56)。左右2方向の検索が終了した結果
(ステッフ54)、類似文字の左右の文字種類と、判定
を行うべき範囲が決定する。範囲が決定したら、記号な
どが入っている場合があるため、再び検索を行った範囲
の文字列に対して検索を行う(ステップ58)。検索し
た文字が類似文字の場合、ステップ54で求めた左右の
文字種類を条件として、類似文字の変換を行う(ステッ
プ60)。判定を行った範囲をスキップして(ステップ
61)、ステップ51から文字列の最後まで繰り返す。
【0015】
【発明の効果】以上説明したように、本発明は類似文字
の左右の文字種類に応じた類似文字の変換方法を変換条
件記憶手段に記憶させておき、この変換方法に従って変
換するようにしたことにより、類似文字が連続したり、
類似文字が記号で分離されていても、類似文字の判定は
正確になり、文字認識結果の精度が向上する効果があ
る。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】本実施例における動作説明図である。
【図3】本実施例における変換条件記憶手段の内容を示
す図である。
【図4】本実施例の動作の一例を示す流れ図である。
【図5】従来技術の動作説明図である。
【符号の説明】
11 文字認識装置 12 文字列記憶手段 13 類似文字検出手段 14 キー検索手段 15 文字変換手段 16 変換条件記憶手段 17 結果 21 文字列 22 類似文字 23 両隣の文字 24 文字列 31 文字列 32 “1” 33 文字“10” 34 “スペースとg” 35 “英小文字エル,オー”

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】類似文字判定方式において、文字認識装置
    から得られた文字列を格納する文字列記憶手段と、前記
    文字列の先頭から類似文字を検出する類似文字検出手段
    と、検出された前記類似文字の両隣の文字から右と左の
    2方向に予め定められたスペースを含む文字種類が現れ
    るまで順次文字列を検索するキー検索手段と、前記左右
    2方向に前記文字種類が現れた時点で前記検索範囲にお
    ける類似文字を変換方法に従って予め定められた文字に
    変換する文字変換手段と、前記左右2方向の前記文字種
    類の組み合わせにより前記類似文字の前記変換方法を定
    義した変換条件記憶手段とを備えたことを特徴とする類
    似文字判定方式。
JP4150189A 1992-06-10 1992-06-10 類似文字判定方式 Withdrawn JPH05342415A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4150189A JPH05342415A (ja) 1992-06-10 1992-06-10 類似文字判定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4150189A JPH05342415A (ja) 1992-06-10 1992-06-10 類似文字判定方式

Publications (1)

Publication Number Publication Date
JPH05342415A true JPH05342415A (ja) 1993-12-24

Family

ID=15491464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4150189A Withdrawn JPH05342415A (ja) 1992-06-10 1992-06-10 類似文字判定方式

Country Status (1)

Country Link
JP (1) JPH05342415A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108918A (ja) * 2001-09-29 2003-04-11 Toshiba Corp 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108918A (ja) * 2001-09-29 2003-04-11 Toshiba Corp 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法

Similar Documents

Publication Publication Date Title
US5051886A (en) System for character stream search using finite state automaton technique
JP3689455B2 (ja) 情報処理方法及び装置
JPH0869476A (ja) 検索システム
JP3230641B2 (ja) 文字列検索装置
JPH05342415A (ja) 類似文字判定方式
JPH0713666A (ja) データ処理装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH08272813A (ja) ファイリング装置
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JP3071745B2 (ja) 文字認識結果の後処理方法
JP4318223B2 (ja) 文書校正装置およびプログラム記憶媒体
JPH08180064A (ja) 文書検索方法及び文書ファイリング装置
JP2951486B2 (ja) 漢字変換装置
JP3666909B2 (ja) 文字認識装置及び方法
JPH04279973A (ja) 文字列比較方式
JP2590698B2 (ja) 文字列データ検索装置
JPH10240736A (ja) 形態素解析装置
JP2645023B2 (ja) 文字列検索装置及び文字列検索方法
JPH0757059A (ja) 文字認識装置
JP2835065B2 (ja) 文字列検索方法
JP2537991B2 (ja) 文字入力装置および方法
JPH04215183A (ja) キーワード検索方法
JP3087699B2 (ja) 定型情報簡易入力システム及び定型情報簡易入力方法
JPS62285189A (ja) 文字認識後処理方式
JPH07121665A (ja) 文字認識辞書の構成方法及び検索方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990831