JPH06111079A - 単語読み取り装置 - Google Patents

単語読み取り装置

Info

Publication number
JPH06111079A
JPH06111079A JP4261130A JP26113092A JPH06111079A JP H06111079 A JPH06111079 A JP H06111079A JP 4261130 A JP4261130 A JP 4261130A JP 26113092 A JP26113092 A JP 26113092A JP H06111079 A JPH06111079 A JP H06111079A
Authority
JP
Japan
Prior art keywords
word
character
image data
shape
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4261130A
Other languages
English (en)
Inventor
Osamu Nakamura
修 中村
Masami Oguro
雅己 小黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4261130A priority Critical patent/JPH06111079A/ja
Publication of JPH06111079A publication Critical patent/JPH06111079A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 単語読み取り装置において、文字認識結果と
して得られる第1位単語候補の信頼性を向上させ、手書
き入力文字に対する認識精度を向上させる。 【構成】 入力イメージデータから、一方で文字認識手
段101、単語照合手段102により単語候補を得、単
語形状知識検索手段104により予め獲得した単語形状
知識を検索してその単語候補の形状特徴を得る。また他
方で、単語形状特徴抽出手段103により、入力イメー
ジデータから単語形状特徴を抽出して、通常の1文字イ
メージデータの切り出し時の誤りや、それに起因する文
字認識誤り等の曖昧性のない抽出を行う。この両者の類
似度を類似度評価手段105で評価し、その評価結果に
基づき単語順位補正手段106により単語候補の順位を
決定する。これにより、文字認識と単語照合で得られる
単語候補を入力イメージデータの形状特徴に照らし合わ
せて、より確からしい第1位単語候補を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字イメージデータから
文字コードへ変換する文字認識の後処理を行う装置に関
し、特に文字認識結果を文字イメージデータから抽出し
た形状特徴で評価することによって、より確からしい単
語候補として文字認識結果の補正を行う単語読み取り装
置に関するものである。
【0002】
【従来の技術】計算機システムにデータを入力する手段
として、文字認識技術を応用した装置が開発されてお
り、キーボードからのデータ入力に比べ操作が簡単に行
え、データ入力を迅速に行える等の理由から次第に普及
しつつある。この種の装置は、スキャナ等から入力した
イメージデータ(微小な画素データの集合)中の文字イ
メージデータをJISやシフトJIS等の文字コードに
変換する機能を有し、主に、書式の定まった伝票等の文
書入力に使用されている。現状の文字認識技術レベルで
は、特に手書き文字に対する認識率(第1位文字コード
が正しい割合)が100%に至っておらず、記入単位が
予め登録可能な単語の場合には、文字認識結果、すなわ
ち、文字候補に対する単語照合が重要である。単語照合
により、各文字位置から得られる文字候補の組み合わせ
の内、実際に存在する組み合わせのみを選択出力するこ
とが可能で、多少の文字認識誤りは補正され、最終的に
文字認識率の向上が期待できる。なお、上記単語照合の
技術に関しては、例えば仲林他著の「用語曖昧検索を用
いた手書き文字列入力方式」(昭和62年度人工知能知
能学会全国大会予稿集、8−7,P.P435−438
(1987年))に述べられている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
単語照合方法の大部分が、文字認識結果として得られた
文字候補を手掛かりに、これら文字候補を最も多く含む
単語候補を出力する等の方法によって実現されているた
め、記入文字の品質が低い場合や、その他何らかの原因
によって正解文字候補が文字認識結果に包含される率が
低い場合等には、第1位単語候補の信頼性が低下すると
いう問題があった。
【0004】本発明は上記問題点を解決するためになさ
れたもので、その目的は、文字認識結果として得られた
第1位単語候補の信頼性を向上させ、手書き入力文字に
対する認識精度を向上させる単語読み取り装置を提供す
ることにある。
【0005】
【課題を解決するための手段】上述の目的を達成するた
め、本発明の単語読み取り装置においては、文字列イメ
ージデータを文字コード列に変換する文字読み取り装置
において、該文字列イメージデータを入力する手段と、
該入力された文字列イメージデータ中の文字部分に対応
する文字イメージデータから文字コードの序列および各
文字コードの確からしさ表す文字得点とを得る文字認識
手段と、前記文字コード序列および前記文字得点から対
応する単語候補および該単語候補の確からしさを表す単
語得点とを得る単語照合手段と、前記入力された文字列
イメージデータから文字および単語としての形状に関す
る特徴を抽出する手段と、予め獲得した単語に関する形
状知識を保持し前記単語候補の形状特徴を検索する手段
と、該検索手段で得た単語候補の形状特徴と前記抽出す
る手段で得た単語形状特徴とからそれらの間の類似度を
評価する手段と、該類似度の評価結果に基づき前記単語
候補の序列の並べ替えを行う手段とを備えた構成とす
る。
【0006】
【作用】本発明の単語読み取り装置においては、入力イ
メージデータから文字および単語としての形状に関する
特徴を直接抽出して通常の1文字イメージデータの切り
出し時の誤りや、それに起因する文字認識誤り等の曖昧
性のない抽出を行い、他方では、単語認識を行って単語
候補を得、これに対応する単語形状特徴を予め獲得した
単語に関する形状知識を検索して得、この両者の類似度
を評価し、その類似度の評価結果に基づき単語候補の序
列の並べ替えを行うことにより、入力イメージデータの
形状に照らし合わせて、より確からしい第1位単語候補
を得る。これにより、単語単位に記入された手書き文字
に対する認識精度を向上させ、計算機システムへのデー
タ投入の効率を向上させる。
【0007】
【実施例】以下、図面を用いて本発明の実施例を詳細に
説明する。
【0008】図1は、本発明の一実施例に係わる文字読
み取り装置の構成を示すブロック図である。尚、図1で
は、伝票等の記入欄単位に単語候補を得る処理を想定し
た機能ブロック構成を示している。図1において、10
1は、図略のスキャナ等のイメージデータ入力手段より
入力された入力情報である記入欄単位のイメージデータ
107から文字部分の切り出しを行い、各文字イメージ
データに対応するJISやシフトJIS等の文字コード
108を、各文字コードの確からしさとしての文字得点
とともに出力する文字認識手段である。102は、上記
の文字フォント108をキーとして、内部に保持する単
語辞書を検索し、上記の文字得点に基づく順位(序列)
付けを行って、単語候補を単語辞書の単語番号109で
出力する単語照合手段である。103は、後に、上記単
語候補との突き合わせのために、入力イメージデータか
ら形状に関する特徴111を抽出する単語形状特徴抽出
手段である。尚、単語形状特徴抽出手段103について
は、後に図2を用いて詳細に説明する。104は、単語
候補の単語番号109を検索キーとして、予め作成して
おく単語形状知識を検索し、単語候補に該当する形状特
徴110を出力する単語形状知識検索手段である。尚、
単語形状知識検索手段104については、後に図3およ
び図4を用いて詳細に説明する。105は、上記の検索
によって得た単語候補の形状特徴110と、単語形状特
徴抽出手段103によって得た入力イメージデータ10
7の単語形状特徴111との類似度を求める類似度評価
手段である。106は、類似度評価手段105の類似度
評価結果112に基づき、最終的に単語候補の順位を補
正することにより決定し、より確かな単語候補113を
出力する単語候補順位補正手段である。
【0009】図1に示した本発明による実施例の機能ブ
ロック構成によれば、1記入欄に相当する単語単位のイ
メージデータから、文字認識および単語照合によって得
られる単語候補に対して、入力イメージデータから直接
抽出する単語形状特徴の視点から確からしさを評価する
ことで、正解となるべき単語候補を精度良く出力可能な
単語読み取り装置を実現できる。
【0010】次に、図2を用いて、単語形状特徴抽出手
段103を詳細に説明する。単語の形状特徴としては、
イメージデータから抽出可能な種々の特徴を使用するこ
とが可能と考えられるが、以降は、文字列部分イメージ
データに関する、縦横比、画素分布、四隅形状パター
ン、および周辺端点数の4種の形状特徴を例に説明を進
めることとする。単語形状特徴抽出手段103へ入力さ
れるイメージデータ107は、1記入欄に相当するイメ
ージデータである。201は、入力されたイメージデー
タ107から文字列に相当する部分を矩形領域として切
り出し、文字間の余白を削除した後に、例えば、文字の
縦方向の既定サイズに合うように拡大または縮小を施す
単語形状正規化部である。単語形状正規化部201によ
って、既定サイズに拡大または縮小されたイメージデー
タ206は、以降の202〜205の各部へ送られる。
【0011】202は、文字列部分のイメージデータに
ついて縦横比を求める縦横比計算部である。203は、
文字を構成する画素の分布を求める画素分布計測部であ
る。画素分布を求めるには、文字列の始端から終端の範
囲において、文字の記入方向に座標を想定し、各座標に
おける縦方向の画素数を計数する等の方法が考えられ
る。204は、文字列に相当するイメージデータの四隅
の形状パタンを識別する四隅形状パタン抽出部である。
形状パタンとしては、各種の形状を用いることが可能だ
か、例えば、四隅の限定範囲内において、空白が大、
角、縦/横/斜めの線分の端点、部分円、点等が考えら
れる。205は、文字列部分イメージデータの外郭部分
について線分の端点個数を計数する周辺端点計測部であ
る。これら202〜205の各部で求められた縦横比、
画素分布、四隅形状パタン、および周辺端点数の4種の
単語形状特徴111は、図1の類似度評価手段105に
入力される。
【0012】図2に示した単語形状特徴抽出手段103
においては、単語単位のイメージデータから直接形状特
徴の抽出を行うので、通常の文字認識処理で行われる1
文字イメージデータの切り出し時の誤り、また、これに
起因する文字認識誤り等の曖昧性のない特徴の抽出を実
現できる。
【0013】次に、図3および図4を用いて、単語形状
知識検索手段104を詳細に説明する。図3は単語形状
知識の検索の原理を説明するための図である。301
は、予め獲得しておく単語形状知識であって、単語照合
時に用いる単語辞書中の各単語に対して、前記の単語形
状特徴抽出手段103で抽出する特徴と同種の特徴を抽
出したテーブルである。単語照合の結果として得られる
単語候補の、単語辞書内における位置、すなわち、単語
番号109をキーとして、上記テーブルを検索し、単語
候補に対応する単語形状特徴110を得る。
【0014】図4は、単語辞書中の各単語に対応する単
語形状特徴を獲得する方法の原理を説明するための図で
ある。図4では、単語として姓を扱う場合の例を示して
いる。図4において、401は、単語照合に用いる単語
辞書を作成するためのソースデータを表し、姓に相当す
る文字フォント列の羅列である。402は、文字認識時
に用いる文字辞書のためのフォントデータである。文字
形状特徴抽出403は、後に単語形状特徴を抽出するた
めに、文字辞書フォントデータ402の各文字408を
対象に、前記の単語形状特徴手段103が抽出する特徴
と同種の形状特徴を抽出する処理ステップである。文字
形状特徴抽出403の処理ステップは、各文字の形状特
徴の抽出結果409を文字形状特徴404に保持する。
文字形状特徴抽出403で実行する特徴抽出には各種の
方法が考えられるが、例えば、文字フォントから疑似的
にイメージデータを生成し、このイメージデータを対象
として形状特徴の抽出を行う方法を用いることができ
る。文字形状特徴検索405は、単語辞書ソースデータ
401中の各単語に含まれる各文字フォント407をキ
ーとして、文字形状特徴404の検索410を行う処理
ステップである。単語形状特徴抽出406は、文字形状
特徴検索405の処理ステップから与えられる用語ソー
スデータ中の文字フォントに関する形状特徴411を統
合して単語形状特徴301を生成する処理ステップであ
る。文字形状特徴411の統合による抽出結果412と
しての単語形状特徴301の生成は、例えば次のように
実現することができる。まず、縦横比については、各単
語に含まれる文字の個数から容易に算出可能である。画
素分布についても、各文字の画素分布を単語の記入方向
に結合することで容易に算出可能である。四隅形状パタ
ンについては、各単語の先頭文字の左端形状パタンと、
終端文字の右端形状パタンとから各単語に対応する四隅
形状パタンを得ることができる。最後に周辺端点につい
ては、各単語に含まれる全文字の周辺端点の総和を求め
ることにより得ることができる。
【0015】図5は、本発明に基づく単語読み取り装置
の動作の流れを具体例により説明するための図である。
図5において、501は入力イメージデータ(図1の1
07に相当)、502は単語候補(図1の109に相
当)、503は単語候補502の単語形状特徴(図1の
110に相当)、504は入力イメージデータ501か
ら抽出された単語形状特徴(図1の111に相当)、5
05は類似度評価結果(図1の112に相当)、506
は類似度に基づく順位補正後の単語候補(図1の113
に相当)である。以下、図5のデータの流れに沿って、
動作を簡単に説明する。まず、‘中村’と手書きされた
イメージデータに対して、文字認識および単語照合を実
行することで、単語候補502が得られる。ここでは、
説明を簡単にするため、3個の単語候補‘仲林’、‘仲
村’、‘中村’が得られたとしている。次に、これら単
語候補502をキーとして単語形状知識の検索を行い、
その結果として、単語形状特徴503を得る。また一
方、入力イメージデータ501から直接、単語形状特徴
の抽出を実行し、単語形状特徴504を得る。次いで、
503と504の両単語形状特徴間の類似度を評価し、
類似度505を得る。図5の例では、類似度が、単語候
補‘仲林’、‘仲村’、‘中村’のそれぞれについて、
ya,yb,ycであったとし、これらの大小関係が、
yc>ya>ybであったとする。尚、類似度は、より
大きな値が、より類似していることを表すものとする。
最後に、これら類似度に基づく単語候補順位の補正を行
い、最終的に、正解単語候補である‘中村’が第1位単
語候補として得られる。
【0016】
【発明の効果】以上、詳細に説明したように、本発明に
よれば、入力イメージデータから文字および単語として
の形状に関する特徴を直接抽出して通常の1文字イメー
ジデータの切り出し時の誤りや、それに起因する文字認
識誤り等の曖昧性のない抽出を行い、予め獲得した単語
に関する形状知識に基づき類似度を評価し、該類似度の
評価結果に基づき単語候補の序列の並べ替えを行うこと
により、入力イメージデータの形状に照らし合わせてよ
り確からしい第1位単語候補を得ることが可能な単語読
み取り装置を実現できるという顕著な効果を奏するもの
である。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる単語読み取り装置の
構成を説明するブロック図
【図2】上記実施例における単語形状特徴抽出手段の機
能ブロック構成を説明するブロック図
【図3】上記実施例における単語形状知識の検索の原理
を説明する図
【図4】上記実施例における単語辞書中の各単語に対応
する単語形状特徴を獲得する方法の原理を説明する図
【図5】上記実施例による単語読み取り装置の動作の流
れを具体的により説明する図
【符号の説明】
101…文字認識手段 102…単語照合手段 103…単語形状特徴抽出手段 104…単語形状認識検索手段 105…類似度評価手段 106…単語候補順位補正手段 201…単語形状正規化部 202…縦横比計算部 203…画素分布計測部 204…四隅形状パタン抽出部 205…周辺端点計測部 301…単語形状特徴テーブル 401…単語辞書ソースデータ 402…文字辞書フォントデータ 403…単語形状特徴抽出の処理ステップ 404…文字形状特徴 405…文字形状特徴検索の処理ステップ 406…単語形状特徴抽出の処理ステップ 501…入力イメージデータ 502…単語候補 503…単語形状特徴 504…単語形状特徴 505…類似度評価結果 506…順位補正後の単語候補

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字列イメージデータを文字コード列に
    変換する文字読み取り装置において、該文字列イメージ
    データを入力する手段と、該入力された文字列イメージ
    データ中の文字部分に対応する文字イメージデータから
    文字コードの序列および各文字コードの確からしさ表す
    文字得点とを得る文字認識手段と、前記文字コード序列
    および前記文字得点から対応する単語候補および該単語
    候補の確からしさを表す単語得点とを得る単語照合手段
    と、前記入力された文字列イメージデータから文字およ
    び単語としての形状に関する特徴を抽出する手段と、予
    め獲得した単語に関する形状知識を保持し前記単語候補
    の形状特徴を検索する手段と、該検索手段で得た単語候
    補の形状特徴と前記抽出する手段で得た単語形状特徴と
    からそれらの間の類似度を評価する手段と、該類似度の
    評価結果に基づき前記単語候補の序列の並べ替えを行う
    手段とを備えたことを特徴とする単語読み取り装置。
JP4261130A 1992-09-30 1992-09-30 単語読み取り装置 Pending JPH06111079A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4261130A JPH06111079A (ja) 1992-09-30 1992-09-30 単語読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4261130A JPH06111079A (ja) 1992-09-30 1992-09-30 単語読み取り装置

Publications (1)

Publication Number Publication Date
JPH06111079A true JPH06111079A (ja) 1994-04-22

Family

ID=17357516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4261130A Pending JPH06111079A (ja) 1992-09-30 1992-09-30 単語読み取り装置

Country Status (1)

Country Link
JP (1) JPH06111079A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030588A (ja) * 2001-07-11 2003-01-31 Toshiba Corp 単語認識方法
WO2008111399A1 (ja) * 2007-03-14 2008-09-18 Kabushiki Kaisha Toshiba 単語認識方法および単語認識プログラム
JP2013246721A (ja) * 2012-05-28 2013-12-09 Nippon Telegr & Teleph Corp <Ntt> 文字列認識装置、文字列認識プログラム、及び記録媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030588A (ja) * 2001-07-11 2003-01-31 Toshiba Corp 単語認識方法
WO2008111399A1 (ja) * 2007-03-14 2008-09-18 Kabushiki Kaisha Toshiba 単語認識方法および単語認識プログラム
JP2008226030A (ja) * 2007-03-14 2008-09-25 Toshiba Corp 単語認識方法および単語認識プログラム
KR101016544B1 (ko) * 2007-03-14 2011-02-24 가부시끼가이샤 도시바 단어 인식 방법 및 기록 매체
JP4672692B2 (ja) * 2007-03-14 2011-04-20 株式会社東芝 単語認識システムおよび単語認識プログラム
US8208685B2 (en) 2007-03-14 2012-06-26 Kabushiki Kaisha Toshiba Word recognition method and word recognition program
JP2013246721A (ja) * 2012-05-28 2013-12-09 Nippon Telegr & Teleph Corp <Ntt> 文字列認識装置、文字列認識プログラム、及び記録媒体

Similar Documents

Publication Publication Date Title
KR100292098B1 (ko) 문자 인식 장치 및 방법
JP3452774B2 (ja) 文字認識方法
JP2713622B2 (ja) 表形式文書読取装置
US6944344B2 (en) Document search and retrieval apparatus, recording medium and program
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP2008171379A (ja) 画像文書処理装置、画像文書処理方法、プログラム、及び記録媒体
CN1106620C (zh) 信息处理方法和设备
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JPH06111079A (ja) 単語読み取り装置
JP3727995B2 (ja) 文書処理方法及び装置
Lu et al. Word searching in document images using word portion matching
JP2681663B2 (ja) 日本文訂正候補文字抽出方法
JP2009020567A (ja) 文書検索装置
JPH07319880A (ja) キーワード抽出・検索装置
JP3233803B2 (ja) 難読漢字検索装置
JP2000259847A (ja) 情報検索方法、装置および記録媒体
JP2009110204A (ja) 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム
JPH113401A (ja) 情報処理装置及びその方法
JP4584507B2 (ja) 住所認識装置、記録媒体及びプログラム
JP3507720B2 (ja) オンライン手書き文字認識装置及びコンピュータ読み取り可能な記録媒体
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP2671984B2 (ja) 情報認識装置
JP3666909B2 (ja) 文字認識装置及び方法
JP2004005761A (ja) キーワード抽出・検索装置
JP3151866B2 (ja) 英文字認識方法