JPH10261049A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH10261049A
JPH10261049A JP6413997A JP6413997A JPH10261049A JP H10261049 A JPH10261049 A JP H10261049A JP 6413997 A JP6413997 A JP 6413997A JP 6413997 A JP6413997 A JP 6413997A JP H10261049 A JPH10261049 A JP H10261049A
Authority
JP
Japan
Prior art keywords
character
voiced
characters
point
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6413997A
Other languages
English (en)
Other versions
JP3548372B2 (ja
Inventor
東善 ▲裴▼
Touzen Hai
Yasuhiro Ura
康裕 浦
Seiji Takahashi
清治 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6413997A priority Critical patent/JP3548372B2/ja
Publication of JPH10261049A publication Critical patent/JPH10261049A/ja
Application granted granted Critical
Publication of JP3548372B2 publication Critical patent/JP3548372B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 文字認識装置に関し,濁点や半濁点と文字が
同じ枠に書かれた場合にも,正しく知識処理することを
目的とする。 【解決手段】 濁点および半濁点をそれぞれ1文字とし
て1つの文字記入枠に記入された帳票の文字を読み取る
文字読み取り部と,文字列の意味を表す単語を保持する
知識辞書と,知識辞書を参照して読み取られた文字列の
意味を表す単語を認識する知識処理部とを備え,知識辞
書は濁点および半濁点をそれぞれ1文字として扱うもの
である文字認識装置において,知識処理部は,濁点もし
くは半濁点とそのかかる文字とを一体にみなして1文字
に統合する統合部を備え,知識辞書に含まれる濁点およ
び半濁点をそれぞれの濁点および半濁点がかかる文字と
統合して1文字とみなして知識処理をする構成をもつ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,帳票に記入された
文字を認識する文字認識装置に関する。特に,帳票に記
入する文字領域が指定され,濁点,半濁点を一文字とし
て記入する帳票の文字認識装置に関するものである。
【0002】
【従来の技術】従来使用されている文字認識装置は,半
角文字の読み取りと全角文字の読み取りは,別であり,
また文字を記入するルールも半角文字のカナでは,濁点
や半濁点をそのかかる文字とは別の文字枠に記入するの
が普通である。これはEBCDICコード(半角コー
ド)に濁点,半濁点のついたカナコードがないことによ
る。
【0003】図12により従来の技術を説明する。図1
2において,111は帳票に記入された手書き文字等の
文字を表し,ヤマダを帳票に記入した例を示す。第1の
枠にヤ,第2の枠にマが記入され,第3の枠のダはタと
濁点を同一枠に誤記入したものである。111’は正し
く記入された例であり,第3の枠にタ,第4の枠に濁点
を記入したものである。
【0004】112は,記入文字を1文字ずつ文字認識
した結果である。1文字毎の文字認識は,帳票に記入さ
れた文字を画像データとして読み取り,1文字を切出
し,切り出された1文字毎の特徴を抽出し,文字毎に特
徴をもつ文字認識辞書120と比較し,一文字毎に文字
認識をする。112はそのようにして得られた結果であ
り,第1の枠の文字をヤ,第2の枠の文字をマ,第3の
枠の文字を1文字のダと文字認識したことを示す(文字
認識辞書は濁点,半濁点付きの文字の特徴を持ち,それ
らを1文字として文字認識することができる,例えば,
タと濁点「゛」が同じ枠に記入されている場合には1文
字のダに文字認識する)。
【0005】113は知識処理であって,1文字ずつの
文字認識結果112について知識辞書114を参照し
て,文字認識された文字列の意味を表す単語を検索する
ものである。図12の例の場合,記入文字111の入力
領域が姓名の記入領域であることから,文字認識結果1
12の意味は姓名についてのものであると判断し,姓名
についての知識辞書114を参照して,文字認識された
文字列の姓名を認識する。
【0006】114は知識辞書であって,文字列の表す
意味の抽象概念毎に,意味を表す単語を保持するもので
あり,図12は姓名を文字数毎に保持するものを示す
(3文字の姓名としてヤマノ等,4文字の姓名としてヤ
マタ゛等をもつことを示す)。知識辞書は,半角文字に
対しては,例えば,タと濁点「゛」はそれぞれ1文字と
みなし,タ゛のように2文字にみる。1文字の濁点付き
のダはもたない。
【0007】117は出力処理であって,知識処理の認
識結果を出力するものである。120は文字認識辞書で
あり,一文字毎に特徴をもつものである。121は文字
毎に特徴をもつことを表す。
【0008】図12の場合,タと濁点が同一の枠に記入
されていることから,文字認識装置は,記入された文字
を1文字の濁点付きのダと判定し,文字認識結果はヤ,
マ,ダの三文字であると判断する。そこで,文字認識装
置は,記入された領域が姓名についての領域であること
から3文字のヤマダについて姓名の知識辞書114を参
照する。そして,その知識辞書のヤマノ,ヤマタ等の3
文字の単語を文字認識結果112と比較するが,3文字
の姓名辞書にはヤマダは存在しないので,正しい結果
(ヤマダ)を出力することができない。
【0009】
【発明が解決しようとする課題】一文字の記入領域が枠
等で定められた帳票に対して,一般の利用者が記入する
場合,濁点や半濁点とそれにかかる文字は同じ枠に書く
のが自然である。従って,文字認識装置で指定される記
入文字のルールは守られないことが多い。そして,この
ように誤記入された文字は知識辞書の単語にないので知
識処理が全く効かなくなり,正しい文字認識結果を出力
することができない。
【0010】さらに,図12の111’のように,正し
く記入された場合にも,半角表示ではヤ,マ,タ, ゛
のようにタと濁点「゛」を別の文字として扱い4文字と
して表示する。そのため,表示された認識結果の修正等
でカーソル操作をする場合に操作が煩わしいという問題
があった。
【0011】本発明は,濁点や半濁点と文字が同じ枠に
書かれた場合にも,正しく知識処理できる文字認識装置
を提供することを目的とする。また,認識結果を修正す
る等の場合にも操作を能率良く行うことのできる文字認
識装置を提供することを目的とする。
【0012】
【課題を解決するための手段】本発明は,濁点および半
濁点をそれぞれ1文字として1つの文字記入枠に記入さ
れた帳票の文字を読み取る文字読み取り部と,文字列の
意味を表す単語を保持する知識辞書と,知識辞書を参照
して読み取られた文字列の意味を表す単語を認識する知
識処理部とを備え,知識辞書は濁点および半濁点をそれ
ぞれ1文字として扱うものである文字認識装置におい
て,知識処理部は,濁点もしくは半濁点とそのかかる文
字とを一体にみなして1文字に統合する統合部を備え,
知識辞書に含まれる濁点および半濁点をそれぞれの濁点
および半濁点がかかる文字と統合して1文字とみなして
知識処理をするようにした。
【0013】図1は本発明の基本構成を示す。図1にお
いて,1は文字認識部であって,文字の記入領域が定め
られた帳票等に記入された文字,例えば1文字毎の文字
認識結果である(文字認識結果の文字数をnとする)。
【0014】2は知識処理部であって,文字認識部1の
文字認識結果について知識辞書10を参照してその意味
を判断する知識処理を行い,1文字毎の文字認識結果の
文字列の意味を認識するものである。
【0015】3は文字認識部1の認識した文字認識結果
の表す意味の表わす概念(姓名,住所等)を判定する処
理である。4は文字認識部1の文字認識結果の文字列の
文字数を判定する処理である。5は文字列の意味を表す
単語をもつ知識辞書10からn文字の単語を検索して獲
得する処理である。
【0016】6は文字列の意味を表す単語をもつ知識辞
書10から(n+1)文字の文字列の単語,(n+2)
文字の文字列の単語,・・・,2n文字のn文字の単語
を検索して獲得する処理である。
【0017】7は濁点,半濁点を統合する処理であっ
て,濁点および半濁点とそれがかかる文字を一文字に統
合する処理である。例えば,知識辞書から得られた4文
字のヤマタ゛のタと濁点「゛」を一文字に統合してダと
みなして3文字にする処理である。
【0018】8は文字認識された認識文字列,と知識辞
書から獲得したn文字,および(n+1)文字〜2n文
字のうちで統合した結果がn文字となった文字列を比較
する処理である。
【0019】10は知識辞書である。11は出力部であ
って,知識処理の結果得られた意味をもつ認識結果を出
力するものである。
【0020】図2は本発明の基本構成の動作説明図であ
る。図2において,20は帳票にタと濁点「゛」を同じ
枠に誤記入された文字列ヤマダを1文字ずつ文字認識し
て得られた結果のヤマダである(タと濁点「゛」を1文
字として認識したことを示す)。
【0021】知識処理部2において,27は統合部であ
って,姓名についての知識辞書10の4文字のヤマタ゛
22を統合して3文字のヤマダ28にしたことを示す。
【0022】知識辞書10において,22は4文字の姓
名のヤマタ゛を表す。23は3文字の姓名ヤマキを表
す。
【0023】出力部8において,31は知識処理して得
られた認識結果のヤマダである。入力文字(文字認識結
果)がヤマダである場合を例として,図1の本発明の基
本構成の動作を説明する(図2を参照する)。
【0024】1文字毎の文字認識結果としてヤマダ20
が得られ,その記入領域の文字列の表す意味の抽象概念
は姓名を表すものであるとする。知識処理部2は,文字
認識結果が姓名についてのものであり,文字列の文字数
が3文字であることから,姓名の知識辞書10により,
3文字の姓名ヤマキ等の単語を検索して獲得する。
【0025】さらに,文字認識結果が3文字であること
から,4文字からその2倍の6文字までの文字列の単語
を知識辞書10から獲得する。例えば,4文字のヤマタ
゛22等である。
【0026】4文字から6文字の文字列の単語に対し
て,統合部27は濁点,半濁点を統合し,例えば,濁点
を1文字に数えた4文字のヤマタ゛はタと濁点「゛」を
1文字に統合して3文字のヤマダとする。知識処理部2
において,1文字毎の文字認識結果ヤマダ20と知識辞
書10から獲得された3文字(ヤマキ等)および統合し
て3文字とされた単語(ヤマダ等)を比較する。そし
て,例えば,距離計算等でその類似関係を調べ,もっと
も類似する単語(もっとも距離の近いもの等),図2の
場合,ヤマダ31を知識処理に基づく認識結果として出
力部11に出力する。
【0027】本発明によれば,濁点や半濁点とそれにか
かる文字は同じ枠に書かれた場合にも,知識処理におい
て正しい認識結果を得ることができる。さらに,認識結
果を表示する場合にも,表示する文字に対して濁点およ
び半濁点を統合して1文字として取り扱えるように処理
をする(この点の詳細については後述する)。
【0028】
【発明の実施の形態】図3は本発明の文字認識装置のブ
ロック図である。図3において,40は帳票であって,
文字の記入領域および記入領域にその内容を表す意味が
決められているものである(例えば,姓名,名前,住所
等の記入領域が定められている)。
【0029】41は文字読み取り部であって,帳票に書
いた手書き文字等の文字をスキャナーで読み取り光電変
換するものである。42は特徴抽出部であって,文字読
み取り部41で得られた帳票の画像データをもとに,1
文字を切出し,1文字毎の文字認識に必要な特徴を抽出
するものである。
【0030】43は照合部であって,特徴抽出部42で
得られた特徴と文字認識辞書44の辞書に記憶されてい
る特徴を比較し,1文字毎に文字認識するものである。
44は文字認識辞書であって,文字毎にその特徴を記憶
するものである。
【0031】45は知識処理部であって,1文字ずつの
文字認識結果について,その文字の表す意味の抽象概念
(姓名,住所等)を判定し,その文字列の意味を表す単
語をもつ知識辞書46を参照して,文字認識結果の文字
列のもつ意味を認識するものである。
【0032】46は知識辞書であって,単語の表す意味
の抽象的概念,例えば住所,姓名,名前,企業名,一般
名称(学校,図書館等)毎にその抽象概念に含まれる単
語を保持するものである。
【0033】47は表示部であって,知識処理部45の
認識結果を出力するディスプレイ等である。48は修正
部であって,知識処理の認識結果の確認,修正等をする
ものである。
【0034】49は入力部であって,ユーザによる確
認,修正データ等を入力するものである。図3の構成の
動作を説明する。
【0035】文字読み取り部41は帳票を画像として読
み取る。特徴抽出部42はその画像データをもとに,1
文字毎に文字を切取り,特徴を抽出する。そして照合部
43は文字認識辞書44を参照し,1文字毎に特徴を比
較し,類似する文字を求める。そして,その類似文字に
類似度に応じて順位を付け,知識処理部45に与える。
【0036】知識処理部45は,照合部43で得られた
文字認識結果に従い,その文字列の意味(住所,氏名,
企業名等の属性)を判定する。そして,その意味を表す
単語をもつ知識辞書46を参照する。その際,知識辞書
46に含まれる単語のうち濁点,半濁点等をもつ単語は
統合して単語数を縮約し,文字認識結果の候補順位等を
考慮して文字認識結果の文字列の単語の意味を表す単語
を認識する(本発明の知識処理について図6で詳しく説
明する)。そして,得られた認識結果を表示部47に転
送する(出力する認識結果は,知識処理で得られた認識
結果が第1順位のもののみ,あるいは複数を順位を付け
て出力する等必要に応じて選択される)。
【0037】表示部47は,知識処理部45で得られた
認識結果を候補順位をつけて画面に表示する。ユーザ
は,表示部47に表示された認識結果に従って,入力部
49により,認識結果の確認,あるいは修正データを入
力する。修正部48は確認もしくは修正等のデータをも
とに,認識結果の確認,修正等の処理をする。
【0038】図4は本発明の知識辞書の実施例であり,
カタカナで姓名を表す単語を保持する辞書を示す。51
は辞書に登録されている単語の文字数nおよび単語の記
憶領域へのポインタをもつ領域である。
【0039】52は文字数毎に姓名を保持する領域であ
る。n=1の登録単語(姓名)はなし,n=2の登録単
語はウラ,n=3の登録単語はササキ,イマイ等,n=
4はヤマタ゛,アオシマ,タカハシ等である。
【0040】図5は本発明の知識処理部の実施例のブロ
ック構成図である。図5において,知識処理部2におい
て,61は文字数判定部であって,1文字毎の文字認識
結果を受入れ,その文字列の文字数nを判定するもので
ある。
【0041】61’は文字列の表す意味の抽象概念判定
部であって,入力された文字列の表す意味の抽象概念
(住所,姓名,名前,企業名,一般名称等)を判定する
ものである。
【0042】62は知識辞書参照部であって,文字認識
結果の文字列の文字数,その意味の抽象概念に従って,
その抽象概念の単語をもつ知識辞書10のn文字および
(n+1)文字〜2n文字の単語を検索して求めるもの
である。
【0043】63はテーブル1であって,知識辞書10
を検索して求めたn文字の単語および統合部65により
n文字に統合された濁点,半濁点をもつ単語を保持する
ものである。
【0044】64はテーブル2であって,知識辞書10
を検索して求めた(n+1)文字〜2n文字の単語を保
持するものである。65は統合部であって,テーブル2
(64)に保持された(n+1)文字〜2n文字の単語
のうち,濁点,半濁点をもつ単語についてその濁点,半
濁点とそれがかかる文字を1文字に統合する処理を行う
ものである。
【0045】66は類似性判断部であって,一文字毎の
文字認識結果とテーブル1(63)に保持されたn文字
の単語および濁点,半濁点を統合してn文字とされた単
語との類似判断をするものである。類似性の判断は,例
えば,一文字毎の文字認識結果の文字とテーブル1(6
3)に記憶された文字との距離計算をする等で求める
(この点については図6で具体的に説明する)。
【0046】知識辞書10において,71は姓名辞書で
あって,氏名の姓を表す単語を文字数毎に保持するもの
である。
【0047】72は名前辞書であって,氏名の名前を表
す単語を文字数毎に保持するものである。73は住所辞
書であって,住所を表す地名等の単語を文字数毎に保持
するものである。
【0048】74は企業名辞書である。75は一般名称
辞書である。図6は本発明の知識処理による文字認識の
説明図である。1文字毎の文字認識結果の第1候補がヤ
マダ,第2候補がイヌグ,第3候補がアスタである場合
を例として示す。図6 (a)はテーブル1(63)から取
り出された姓名ヤマダと文字認識結果を比較して距離計
算をする場合を示し,図6 (b)はテーブル1(63)か
ら取り出された姓名がヤマダの場合の距離計算方法を示
す。
【0049】図6 (a)において,63はテーブル1であ
る。64はテーブル2である。
【0050】65は統合部である。66は類似性判断部
である。71は知識辞書のn文字の姓名を表す辞書であ
る。
【0051】71’は知識辞書の(n+1)文字〜2n
文字の姓名を表す辞書である。82はテーブル1(6
3)から取り出された文字列と文字認識結果91の文字
列を比較して求められた距離である(距離の計算方法は
後述する)。
【0052】91は一文字毎の文字認識結果を表し,第
1候補がヤマダ,第2候補がイヌグ,第3候補がアスタ
であることを例として示す。図6 (a)の場合について説
明する。
【0053】知識辞書71,71’からテーブル1(6
3)に取り出す単語の獲得方法について説明する。文字
認識結果91が3文字であるので,文字認識結果91の
第1候補の第1文字ヤを第1文字とする3文字の単語を
全て取り出し,テーブル1(63)に格納する。次に文
字認識結果91の第2候補の第1文字イを第1文字とす
る3文字の単語を全て取り出し,テーブル1(63)に
格納する。さらに,文字認識結果91の第3候補の第1
文字アを第1文字とする3文字の単語を全て取り出し,
テーブル1(63)に格納する。
【0054】次に,文字認識結果91が3文字であるの
で,文字列の数が4文字,5文字,6文字の単語につい
て同様に全て取り出し,テーブル2(64)に格納す
る。例えば,4文字の場合,第1文字がヤである4文字
の単語,第1文字がイである4文字の単語,第1文字が
アである4文字の単語を全て取り出し,テーブル2(6
4)に格納する。この操作を5文字,6文字の単語につ
いても繰り返し,テーブル2(64)に格納する。
【0055】次に統合部65はテーブル2(64)に格
納された単語について,濁点,半濁点を統合処理する。
そして統合処理で3文字となった単語(ヤマダ等)をテ
ーブル1(63)に移動する。
【0056】類似性判断部66は,このようにしてテー
ブル1(63)に格納された3文字の単語および統合し
て3文字となった単語について文字認識結果と比較し距
離を求める。
【0057】テーブル1(63)から3文字の姓名ヤマ
ダが取り出されたとする。類似性判断部66はテーブル
1(63)に格納さされた第1文字マと一致する文字認
識結果の第1文字を探す。その結果第1候補マと一致し
ているので,第1文字の距離をゼロとする。次にアマダ
81の第2文字マと一致する文字認識結果の第2文字を
求める。その結果第1候補のマと一致するので,第2文
字の距離をゼロとする。次にヤマダ81の第3文字ダと
一致する文字認識結果の第3文字を求める。その結果第
1候補のダと一致するので距離を0とする。そして,ヤ
マダ81の各文字の距離の和0を総合距離として求め
る。
【0058】図6 (b)に示すように,テーブル1(6
3)にアマダが取り出された場合の距離は次のように求
める。まず,テーブル1(63)から獲得した単語と文
字認識結果の第1文字どうしを比較する。アマダの第1
文字のアは第3候補の第1文字アと一致するのでその距
離を2とする。次に第2文字どうしを比較する。アマダ
の第2文字のマは第1候補と一致するのでその距離をゼ
ロとする。次に第3文字どうしを比較する。その結果,
アマダの第3文字ダは第1候補と一致するので距離を2
とする。従って,アマダの総合距離は2である。
【0059】このように,テーブル1(63)に格納さ
れた単語について全て距離を計算し,総合距離の最小の
ものを知識処理の認識結果の第1候補として出力し,以
下距離の小さい順に候補順位をつけて出力する。第1候
補のみ結果として出力しても良い。
【0060】ユーザは出力部のディスプレイに表示され
た知識処理の認識結果を見て,確認し,修正する必要が
あれば必要な修正データを入力して,認識結果を修正す
る。図7は本発明の知識処理部の実施例のフローチャー
トである。
【0061】図示のステップ番号に従って図5の構成の
動作を説明する(図5を参照する)。 S1 文字数判定部61は,候補数kohoを設定する
(図6の場合koho=3)。
【0062】S2 文字数判定部61は,入力文字数n
を設定する(図6の場合n=3)。 S3,S4 i=1からkohoまでループする。ルー
プにおいて,入力文字の第1番目の第i候補の文字をS
とした時,Sで始まる長さnの単語を全て辞書から取り
出し,テーブル1(table1)に入れる。図6の場
合,文字認識結果の第1候補のヤマダの第1文字がヤで
あるので,ヤから始まる3文字の単語(姓名)を全て取
り出す。次に,その第2候補イマダの第1文字がイであ
るので,イで始まる3文字の単語を全て取り出す。同様
に,その第3候補アスタの第1文字がアであるので,ア
で始まる3文字の全ての単語を検索して求める。
【0063】S5,S6 k=n+1からk=2nまで
ループする。また,そのループにおいてi=1からi=
kohoまでループする。 S7 ループの過程において,入力(文字認識結果)の
第1文字の第i候補の文字をSとしたとき,Sで始まる
長さkの単語を全て辞書中から取り出しテーブル2に保
持する。例えば,n=3であるので,4文字の単語につ
いて,文字認識結果の第1候補の第1文字ヤを第1文字
とする4文字の単語をテーブル2に格納する。次に文字
認識結果の第2候補の第1文字マを第1文字とする4文
字の単語をテーブル2に格納する。さらに,第3候補の
第1文字アを第1文字とする4文字の単語をテーブル2
に格納する。同様に,5文字,6文字の単語についても
それぞれ,ヤ,イ,アを第1文字とする単語を全て求
め,テーブル2(64)に格納する。
【0064】S8 統合部はテーブル2を検索し,濁
点,半濁点を統合した結果が長さn文字になる単語をテ
ーブル1に追加する(例えば,4文字のヤマタ゛のタと
濁点「゛」を統合して3文字とし,テーブル1(63)
に追加する)。
【0065】S9 テーブル1に保持された全ての単語
について入力文字候補と照合し,距離計算をし,最も距
離の小さい単語を知識処理の認識結果として出力する。
図8は本発明の文字認識装置の表示方法の実施例であ
る。
【0066】図8 (a)は本発明の知識処理の認識結果の
表示方法の例を示す。図8 (a)は,知識処理の認識結果
がノザキの場合の表示である。半角フォントには,濁点
付きの文字フォントはないので,本発明により濁点を統
合して3文字で認識しても,表示はタと濁点゛をそれぞ
れ半角1文字で表示する。例えば,ノザキを表示する時
は,図示のように濁点を1文字として4文字で表示す
る。従来,このような表示を第1文字のノから第4文字
のキまでカーソルを移動する場合には,濁点も1文字と
みて,4回のカーソル移動操作をする必要があった。本
発明は,半角文字の表示の場合に濁点,半濁点を統合し
て1文字とし,統合した部分を1回のカーソル操作で行
うようにした。
【0067】92は第1文字ノにカーソルがある状態で
ある。93は第2文字サと濁点「゛」を統合してサと濁
点「゛」の下にカーソルがある状態である。94は第4
文字キにカーソルがある状態である。第1文字のノから
第4文字のキまでカーソル移動するのに3回のカーソル
処理で行うことが可能である。また,サと濁点「゛」を
消去もしくは変更するような場合にも,一回の操作で行
うことができる。
【0068】図8は (b)は本発明の半角文字の表示制御
のブロック図である。図8 (b)において,95は知識処
理の認識結果であって,タと濁点「゛」を統合してヤマ
ダ(3文字)を認識したものである。
【0069】96は表示制御部であって,表示制御を行
うものである。97は表示統合処理部であって,半角文
字の濁点,半濁点を統合する処理をするものである。
【0070】98は表示用半角文字のフォント保持部で
ある。99はディスプレイである。ヤマダ95のような
濁点を含む半角文字の認識結果が入力された時,表示制
御部96は,表示用半角文字のフォント保持部98から
半角文字のヤ,マ,タ,濁点「゛」を取り出す。そし
て,表示統合処理部97はタと゛を1文字で扱うように
統合処理し,カーソル操作,文字の削除,変更等を一回
の操作で行う。
【0071】図9は本発明の認識結果の表示制御部のフ
ローチャートの実施例1である。 S1 認識結果を入力する。 S2 認識結果の文字は半角文字か,あるいはそうでな
いかを判定する。全角文字であれば,S5で全角文字の
表示処理をする。半角文字であれば,S3に進む。
【0072】S3 濁点,半濁点があるか判定する。濁
点,半濁点がなければS5で半角文字の表示処理をす
る。濁点,半濁点があれば,濁点,半濁点を1文字とし
て扱うように統合処理をし,S5で統合した濁点,半濁
点をその前の半角文字に統合して1文字として扱って表
示処理をする。
【0073】図10は本発明の認識結果の表示制御部の
フローチャートの実施例2である。濁点,半濁点をとも
なう半角文字は,濁点,半濁点付きの全角文字で扱うよ
うにしたものである。
【0074】S1 認識結果を入力する。 S2 半角文字かあるいはそうでないかを判定する。半
角文字でなければS5で全角文字の表示処理をする。半
角文字であればS3の処理をする。
【0075】S3 濁点,半濁点はあるか判定する。濁
点,半濁点がなければS5で半角文字の表示処理をす
る。濁点,半濁点があればS4の処理をする。 S4 濁点,半濁点のある文字を全角文字で扱うように
し,S5で濁点,半濁点付きの全角文字の表示処理をす
る。
【0076】図10のフローチャートの方法で表示す
る,濁点,半濁点のない前後の半角文字に比べて濁点,
半濁点付きの全角文字は大きく不自然になるので,目立
たなくするためにその濁点,半濁点付きの全角文字は,
大きさの小さいフォントを使用するようにしたものであ
る。
【0077】S1 認識結果を入力する。 S2 半角文字か,あるいはそうでないかを判定する。
半角文字でなければS4で全角文字の表示処理をする。
半角文字であればS3の処理をする。
【0078】S3 濁点,半濁点はあるか判定する。濁
点,半濁点がなければS4で半角文字の表示処理をす
る。濁点,半濁点があればS4の処理をする。 S4 濁点,半濁点付きの文字を1文字に統合する。
【0079】S5 統合した文字を濁点,半濁点のある
小さい全角文字で表示をする。
【0080】
【発明の効果】本発明によれば,濁点や半濁点と文字が
同じ枠に書かれた場合にも,知識処理により正しい認識
結果を得ることが可能になる。また,濁点,半濁点をと
もなう半角文字の表示も1文字として扱うことができる
ので,認識結果の修正,変更等を能率的に行うことがで
きる。
【図面の簡単な説明】
【図1】本発明の基本構成を示す図である。
【図2】本発明の基本構成の動作説明図である。
【図3】本発明の文字認識装置のブロック図である。
【図4】知識辞書の実施例を示す図である。
【図5】知識処理部の実施例のブロック構成図である。
【図6】本発明の知識処理の動作説明図である。
【図7】本発明の知識処理部の実施例のフローチャート
を示す図である。
【図8】本発明の知識処理の認識結果の表示方法の実施
例を示す図である。
【図9】本発明の表示制御部のフローチャートの実施例
1を示す図である。
【図10】本発明の表示制御部のフローチャートの実施
例2を示す図である。
【図11】本発明の表示制御部のフローチャートの実施
例3を示す図である。
【図12】従来技術の説明図である。
【符号の説明】
1:文字認識部 2:知識処理部 10:知識辞書 11:出力部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】濁点および半濁点をそれぞれ1文字として
    1つの文字記入枠に記入された帳票の文字を読み取る文
    字読み取り部と,文字列の意味を表す単語を保持する知
    識辞書と,知識辞書を参照して読み取られた文字列の意
    味を表す単語を認識する知識処理部とを備え,知識辞書
    は濁点および半濁点をそれぞれ1文字として扱うもので
    ある文字認識装置において,該知識処理部は,濁点もし
    くは半濁点とそのかかる文字とを一体にみなして1文字
    に統合する統合部を備え,該知識辞書に含まれる濁点お
    よび半濁点をそれぞれの濁点および半濁点がかかる文字
    と統合して1文字とみなして知識処理をすることを特徴
    とする文字認識装置。
  2. 【請求項2】 帳票に記入された文字の1文字毎の特徴
    を抽出する特徴抽出部と,1文字毎に文字の特徴をもつ
    文字認識辞書と,抽出された1文字毎の特徴を文字認識
    辞書と比較して文字認識する照合部とを備え,文字認識
    辞書は1文字に切り出された濁点もしくは半濁点付きの
    文字を1文字に見る特徴を持つものであり,1文字毎の
    文字認識においては,濁点もしくは半濁点とそのかかる
    文字が同一記入枠に書かれた文字も濁点もしくは半濁点
    付きの1文字として文字認識するものであることを特徴
    とする請求項1に記載の文字認識装置。
  3. 【請求項3】 濁点,半濁点およびそのかかる文字が半
    角文字であることを特徴とする請求項1もしくは2に記
    載の文字認識装置。
  4. 【請求項4】 濁点もしくは半濁点をともなう半角文字
    の認識結果の文字表示において,濁点もしくは半濁点を
    ともなう文字に対して 濁点もしくは半濁点とそのかか
    る文字を統合して1文字とみなして表示処理することを
    特徴とする請求項1に記載の文字認識装置。
  5. 【請求項5】 濁点もしくは半濁点をともなう半角文字
    の認識結果の文字表示において,濁点もしくは半濁点を
    ともなう文字に対して濁点もしくは半濁点とそのかかる
    文字を統合して1文字とみなし,その文字を濁点もしく
    は半濁点付き全角文字で表示することを特徴とする請求
    項1に記載の文字認識装置。
  6. 【請求項6】 濁点もしくは半濁点付き全角文字を他の
    文字より小さい文字で表示することを特徴とする請求項
    5に記載の文字認識装置。
JP6413997A 1997-03-18 1997-03-18 文字認識装置 Expired - Fee Related JP3548372B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6413997A JP3548372B2 (ja) 1997-03-18 1997-03-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6413997A JP3548372B2 (ja) 1997-03-18 1997-03-18 文字認識装置

Publications (2)

Publication Number Publication Date
JPH10261049A true JPH10261049A (ja) 1998-09-29
JP3548372B2 JP3548372B2 (ja) 2004-07-28

Family

ID=13249455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6413997A Expired - Fee Related JP3548372B2 (ja) 1997-03-18 1997-03-18 文字認識装置

Country Status (1)

Country Link
JP (1) JP3548372B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093621A (ja) * 2007-09-21 2009-04-30 Toppan Printing Co Ltd ゲノム配列における回文構造検出システム
CN111081102A (zh) * 2019-07-29 2020-04-28 广东小天才科技有限公司 一种听写结果的检测方法及学习设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093621A (ja) * 2007-09-21 2009-04-30 Toppan Printing Co Ltd ゲノム配列における回文構造検出システム
CN111081102A (zh) * 2019-07-29 2020-04-28 广东小天才科技有限公司 一种听写结果的检测方法及学习设备

Also Published As

Publication number Publication date
JP3548372B2 (ja) 2004-07-28

Similar Documents

Publication Publication Date Title
EP0844583B1 (en) Method and apparatus for character recognition
JP4570509B2 (ja) 読み生成装置、読み生成方法及びコンピュータプログラム
JP3548372B2 (ja) 文字認識装置
JP2007122660A (ja) 文書データ処理装置および文書データ処理プログラム
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP3958722B2 (ja) イメージデータ文書検索システム
JP2010003000A (ja) 項目判定システムおよび項目判定プログラム
JPH10232871A (ja) 検索装置
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
US20240037129A1 (en) Search device, search method, and recording medium
JP3470927B2 (ja) 自然語解析方法及び装置
JP2000090193A (ja) 文字認識装置および項目分類方法
JP3071745B2 (ja) 文字認識結果の後処理方法
JPS61122781A (ja) 音声ワ−ドプロセツサ
JP3210842B2 (ja) 情報処理装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JP3241854B2 (ja) 単語スペル自動補正装置
JP2776069B2 (ja) 文章検査装置
JP2000099635A (ja) 文字列予測装置及び文字列予測方法
JPH06332934A (ja) 電子辞書引き装置
JP2002014981A (ja) 文書ファイリング装置
JPH10293811A (ja) 文書認識装置及び方法並びにプログラム記憶媒体
JPH0546607A (ja) 文書読み上げ装置
JP2669437B2 (ja) 文字種変換方法および装置
JP3118880B2 (ja) 日本語文章処理装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040416

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080423

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100423

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100423

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees