JPH0351982A - 文字列認識方式 - Google Patents

文字列認識方式

Info

Publication number
JPH0351982A
JPH0351982A JP1187695A JP18769589A JPH0351982A JP H0351982 A JPH0351982 A JP H0351982A JP 1187695 A JP1187695 A JP 1187695A JP 18769589 A JP18769589 A JP 18769589A JP H0351982 A JPH0351982 A JP H0351982A
Authority
JP
Japan
Prior art keywords
character string
character
image
reference pattern
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1187695A
Other languages
English (en)
Inventor
Atsushi Tsukumo
津雲 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1187695A priority Critical patent/JPH0351982A/ja
Publication of JPH0351982A publication Critical patent/JPH0351982A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字列認識方式に関する。
(従来の技術) 情報処理システムの発展に伴い、高度な情報入力手段の
要望が高まっており、その一つの形態として文字認識装
置(OCR:OpticalCharacter  R
eader)が利用されている.しかし、現在使用され
ているOCRでは手書き文字を読む場合には予め定めら
れた枠の中に一文字ずつ書くという制約が一般的であり
、このような制約を取り除き、より使いやすいOCRの
実現が望まれている。この要望を実現する方式として、
文字切り出しと文字認識を同時に実行する方式、二値図
形の連結性を用いた矩形の分離と・各矩形の認識情報と
を用いる方式および文字列方向を音声認識における時間
軸と同様に扱う方式が提案されている. (発明が解決しようとする課題) 例えば、文献r文字切り出し能力を伴う文字認識の一手
法」、佐瀬・辻、昭和62年電子情報通信学会総合全国
大会講演論文集、No.1506で提案されているよう
な、文字切り出しと文字認識とを同時に実行する文字列
認識方式は、文字を構戒するストロークを追跡している
ので、文字のつぶれが生じた場合には以降のストローク
追跡が不安定になり、認識性能に影響するという問題点
がある. また、文献「手書き日本語文書からの文字切り出し方式
」、依田・他、昭和61年電子通信学会音声研究会資料
SP86−3 5、で提案されているような、二値図形
の連結性を用いた矩形の分離と各矩形の認識情報とを用
いた文字列認識のための文字切り出し方式においては、
依然接触文字の問題は解決されていない. 更に、文字列の方向を音声認識における音声パターンの
時間軸の方向と同様に収り扱うことによって単語単位で
文字列の認識を行う方式においても、文字列の傾きに対
して認識が著しく不安定になるという問題点が生じる.
この問題は印刷された文字列が通常の画像入力装置で得
られる画像の場合には傾き補正で対応できるが、手書き
文字列の場合あるいはハンドスキャナー装置で入力した
文字列画像のように傾きが一様でない場合には解決手段
が示されていない. (課題を解決するための手段) 前述の課題を解決するために本発明の文字列認識方式は
、二次元格子状の配列として与えられる文字列画像を格
納する文字列画像記憶手段と、前記文字列画像記憶手段
から文字列画像を読み込み、文字列の位置ずれを補正し
た正朋化画像を出力する文字列正規化手段と、前記文字
列正規化手段から出力された正規化画像を入力し、一次
元系列として前記文字列の特徴を抽出し、出力する文字
列特徴抽出手段と、認識対象の個々の文字列の一次元系
列の特徴系列を参照パターンとして格納している参照パ
ターン記憶手段と、前記文字列特徴抽出手段から出力さ
れる文字列特徴を入力パターンとして読み込み、前記参
照パターン記憶手段から個々の文字列用参照パターンを
読み込み、前記入力パターンと前記個々の参照パターン
との間でDPマッチングを行うことによって、前記入力
パターンの前記個々の認識対象文字列に対する相違度を
計算するDPマッチング計算手段と、該DPマッチング
計算手段で得られた各相違度の値から認識結果を出力す
る分類手段を具備する.(作用) 次に図面を参照して本発明の原理、作用について詳細に
説明する.以下の説明では縦書きの文字列を用いて説明
するが、横書き文字列についても同様の原理が適用でき
る. 第2図は縦書きの文字列の例が示されている.この例で
は、互いに接触する文字対の「崎」と「市」および「宮
」と「前Jを含み、文字列の方向も不安定である.この
文字列を第3図のように補正することができれば、縦軸
方向への伸縮整合の安定性が向上する.仲IaM合とし
ては、例えば文献、音響学会誌、27,9.Pρ.48
3−500(昭和46年)、迫江・千葉「動的計画法を
利用した音声の時間正規化に基づく連続単語認識」で紹
介されているDPマッチング法が有効であることが知ら
れている. 第3図の正規化画像から得られる特徴系列をf(J)、
字種kの参照パターンを示す特徴系列をSl”(J)と
し、Jを縦軸方向を示す変数とすると、DPマッナング
法は以下に示す漸化式(1)、(2)、(3)によって
実現できる.d l” (1.1)・II f(1)−
S ”’ (1)I+     ・・・(1)D ;0 (H,N) (3) ただし、f<J>では1≦J≦M,S′k’  (J)
では1≦J≦Nとする。
この計算法によって接触文字の有無によらない仲a整合
が可能となる.また、第3図のような位置の補正された
画像は、例えば特願昭622346325や特願昭63
−48167で開示されている方式で容易に実現できる
. 横書き文字列に対しても同様に横書き文字列用の参照パ
ターンを用意することによって単語単位の認識が行える
ことは明らかである. (実施例) 次に本発明について図面を参照しなから説明する. 第1図は本発明の一実株例の構成を示すブロック部であ
る. 文字列画像記憶手段1は、文字列画像を格納する通常の
記憶手段である.文字列正規化手段2は、文字列画像記
憶手段1から文字列画像信号10を読み込み、文字の位
置が補正された正規化文字列画像信号20を出力する.
この文字位置補正は前掲特願昭62−23/16325
や特願昭6348167に開示されている方式で実現で
きる。
文字列特徴抽出手段3は、正規化文字列画像信号20を
入力し、第4図に示すような短冊状の領域内で画像の特
徴f(J)をj@次求め、系列特徴信号30として出力
する.参照パターン記憶千段4は、各単語を示す文字列
の系列特徴を格納する通常の記憶手段である,DPマッ
チング計算手段5は、系列特徴信号30と参照パターン
信号40を読み込み、DPマッチングを行って相違度計
算を行い、入力文字列と各参照パターンとの相違度信号
50を出力するもので、前述の昭和46年の音響学会誌
で発表された文献「動的計画法を利用した音声の時間正
規化に基づく連続単語認識」に開示されている方式で実
現できる. 分類手段6は、相違度信号50を入力し、各相違度を比
較して認識結果を決定するものでパターン認識の従来技
術で容易に実現できる.上記構成において、DPマッチ
ング計算手段5で得られた相違度に基づいて、入力文字
列の認識が行われる. (発明の効果) 以上のように本発明によれば、文字列画像の列が歪んで
いても、あるいは接触文字があっても単語単位で認識可
能な文字列認識方式を提供することができ、文字認識の
性能向上に大きく役立つ。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は文字列の一例を示す図、第3図は第2図に示す文
字列の文字位置を補正した正規化文字列を示す図、第4
図は文字列の特徴系列を示すための図である. 1・・・文字列画像記憶手段、2・・・文字列正規化手
段、3・・・文字列特徴抽出手段、4・・・参照パター
ン記憶手段、5・・・DPマッチング計算手段、6・・
・分類手段.

Claims (1)

    【特許請求の範囲】
  1. 二次元格子状の配列として与えられる文字列画像を格納
    する文字列画像記憶手段と、前記文字列画像記憶手段か
    ら文字列画像を読み込み、文字列の位置ずれを補正した
    正規化画像を出力する文字列正規化手段と、前記文字列
    正規化手段から出力された正規化画像を入力し、一次元
    系列として前記文字列の特徴を抽出し、出力する文字列
    特徴抽出手段と、認識対象の個々の文字列の一次元系列
    の特徴系列を参照パターンとして格納している参照パタ
    ーン記憶手段と、前記文字列特徴抽出手段から出力され
    る文字列特徴を入力パターンとして読み込み、前記参照
    パターン記憶手段から個々の文字列用参照パターンを読
    み込み、前記入力パターンと前記個々の参照パターンと
    の間でDPマッチングを行うことによって、前記入力パ
    ターンの前記個々の認識対象文字列に対する相違度を計
    算するDPマッチング計算手段と、該DPマッチング計
    算手段で得られた各相違度の値から認識結果を出力する
    分類手段を具備することを特徴とする文字列認識方式。
JP1187695A 1989-07-19 1989-07-19 文字列認識方式 Pending JPH0351982A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1187695A JPH0351982A (ja) 1989-07-19 1989-07-19 文字列認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1187695A JPH0351982A (ja) 1989-07-19 1989-07-19 文字列認識方式

Publications (1)

Publication Number Publication Date
JPH0351982A true JPH0351982A (ja) 1991-03-06

Family

ID=16210537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1187695A Pending JPH0351982A (ja) 1989-07-19 1989-07-19 文字列認識方式

Country Status (1)

Country Link
JP (1) JPH0351982A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793553A (ja) * 1993-09-22 1995-04-07 Nec Corp インクジェットプリンタ用印字検査装置
US6859556B2 (en) 1998-10-29 2005-02-22 Fujitsu Limited Word recognizing apparatus for dynamically generating feature amount of word and method thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793553A (ja) * 1993-09-22 1995-04-07 Nec Corp インクジェットプリンタ用印字検査装置
US6859556B2 (en) 1998-10-29 2005-02-22 Fujitsu Limited Word recognizing apparatus for dynamically generating feature amount of word and method thereof

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
Baró et al. Traffic sign recognition using evolutionary adaboost detection and forest-ECOC classification
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP3260979B2 (ja) 文字認識方法
Tang et al. HRCenterNet: An anchorless approach to Chinese character segmentation in historical documents
Dai et al. Scene text detection based on enhanced multi-channels MSER and a fast text grouping process
JPH0430070B2 (ja)
JPH0351982A (ja) 文字列認識方式
JPH11272800A (ja) 文字認識装置
JP2751865B2 (ja) 文字列認識装置
JP3113769B2 (ja) 文字認識装置
JP4011859B2 (ja) 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム
Slavin et al. Matching Digital Copies of Documents Based on OCR
JP3173363B2 (ja) Ocrのメンテナンス方法及び装置
JPH051512B2 (ja)
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2843167B2 (ja) パターン読取装置
JP2963474B2 (ja) 類似文字識別方法
JP3142950B2 (ja) 線分認識方式
JP2925303B2 (ja) 画像処理方法及び装置
JP2917396B2 (ja) 文字認識方式
JPH04276888A (ja) 文字読取装置
JP2985243B2 (ja) 文字認識方法
CN115879462A (zh) 无需细粒度检测的场景文本提取方法、系统
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템