JP4810853B2 - Character image cutting device, character image cutting method and program - Google Patents
Character image cutting device, character image cutting method and program Download PDFInfo
- Publication number
- JP4810853B2 JP4810853B2 JP2005093260A JP2005093260A JP4810853B2 JP 4810853 B2 JP4810853 B2 JP 4810853B2 JP 2005093260 A JP2005093260 A JP 2005093260A JP 2005093260 A JP2005093260 A JP 2005093260A JP 4810853 B2 JP4810853 B2 JP 4810853B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- character image
- shape characteristic
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
本発明は、文字認識処理に用いられる文字画像の切り出し技術に関する。 The present invention relates to a character image clipping technique used for character recognition processing.
文字を示す画像データから抽出した特徴点と、予めデータベースに登録してある文字の特徴点とを比較することにより、画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成する技術がある。 By comparing the feature points extracted from the image data indicating characters with the feature points of characters registered in advance in the database, the characters indicated by the image data are recognized, and text data indicating the recognized characters is generated. There is technology.
上記のような文字認識処理において、画像データが複数の文字を示す場合、その画像データから各々の文字を示す画像データを切り出すことが必要となる。すなわち、画像データに含まれる連続したオン画素群のいずれが1つの文字を構成するものであるかを特定する必要がある。そのような文字画像の切り出し技術を開示したものとして、例えば特許文献1および2がある。
上記の特許文献1および2に開示の技術による場合、画像データにより示される文字の縦横比が所定の範囲内に納まっている場合において、各々の文字を示す画像データが正しく切り出される可能性が高い。しかしながら、手書き文字の形状特性は書き手によってまちまちであるため、従来技術による場合、全ての書き手による文字に関して高い精度で各々の文字を示す画像データを正しく切り出すことは困難である。
In the case of the techniques disclosed in
上述の事情に鑑み、本発明は異なる書き手による手書き文字に関し、当該手書き文字を示す画像データから、常に高い精度で正しく各々の文字を示す画像データを切り出す手段を提供することを目的とする。 In view of the above circumstances, the present invention relates to handwritten characters by different writers, and an object thereof is to provide means for cutting out image data indicating each character correctly and with high accuracy from image data indicating the handwritten character.
上述の課題を解決するため、本発明は、各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する画像データ取得手段と、前記第1画像データにより示される画像のうち所定の升目領域に配置されている各升目内の部分を1文字を示す文字画像として認識する第1文字画像認識手段と、前記第1文字画像認識手段により認識された文字画像の形状特性を特定する形状特性特定手段と、前記形状特性特定手段により特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識手段と、前記第2文字画像認識手段により認識された文字画像を示す画像データを出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。 In order to solve the above-described problems, the present invention provides image data acquisition means for acquiring first image data indicating an image and second image data indicating a second image, and an image indicated by the first image data. shape characteristics of the recognized character image and the first character image recognition means for recognizing a portion of the respective squares are arranged in a predetermined square area as a character image indicating a character, by the first character image recognition unit of And a second character image for recognizing a part of the image indicated by the second image data as a character image indicating one character, using the shape characteristic specified by the shape characteristic specifying unit. There is provided a character image cutting device comprising: a recognizing unit; and an output unit that outputs image data indicating a character image recognized by the second character image recognizing unit.
好ましい態様において、前記文字画像切出装置は前記第1文字画像認識手段により認識された文字画像毎に文字の構成部を示す構成部画像を切り出して該構成部画像に外接する外接図形を特定し、該外接図形を用いて当該文字画像を複数の種別のいずれかに分類する第1分類手段と、前記第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、取り出した画像に外接する外接図形を特定し、該外接図形を用いて当該文字画像の候補を前記複数の種別のいずれかに分類する第2分類手段とをさらに備え、前記形状特性特定手段は、前記第1分類手段が特定した外接図形の形状特性を特定し、前記第2文字画像認識手段は、前記第2分類手段により取り出された文字画像の候補の外接図形の形状特性と、前記形状特性特定手段により特定された形状特性であって、前記第2分類手段により当該文字画像の候補が分類された種別と同じ種別に前記第1分類手段により分類された文字画像の構成部画像に外接する外接図形の形状特性とを比較することにより、当該文字画像の候補を1文字を示す文字画像として認識するか否かを決定するように構成されてもよい。 In a preferred aspect, the character image cutting device cuts out a component image showing a character component for each character image recognized by the first character image recognition means, and identifies a circumscribed figure circumscribing the component image. A first classification unit that classifies the character image into any of a plurality of types using the circumscribed figure, and extracts a part of the image indicated by the second image data as a character image candidate indicating one character, A second classifying unit that identifies a circumscribed figure circumscribing the extracted image, and classifies the character image candidate into one of the plurality of types using the circumscribed figure, and the shape characteristic identifying unit includes: identify the shape characteristics of the circumscribed figure is the first classifying means was identified, the second character image recognition means, a shape characteristic of a circumscribed figure of the character image candidates extracted by the second classifying means, the type A specified shape characteristics by characteristic identifying unit, circumscribing the component image of the classified character image by the first classifying means into the same category as the type candidate of the character image is classified by the second classification means It may be configured to determine whether or not the character image candidate is recognized as a character image indicating one character by comparing the shape characteristics of the circumscribed figure to be recognized.
また、他の好ましい態様において、前記文字画像切出装置の前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の縦横比もしくは当該文字画像を構成する複数の部分の各々の縦横比を前記形状特性として特定するように構成されてもよい。 In another preferable aspect, the shape characteristic specifying unit of the character image cutting device includes an aspect ratio of the character image recognized by the first character image recognizing unit or each of a plurality of portions constituting the character image. The aspect ratio may be specified as the shape characteristic.
また、他の好ましい態様において、前記文字画像切出装置の前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の傾斜度もしくは当該文字画像を構成する複数の部分の各々の傾斜度を前記形状特性として特定するように構成されてもよい。 In another preferable aspect, the shape characteristic specifying unit of the character image cutting device includes a slope of the character image recognized by the first character image recognition unit or each of a plurality of portions constituting the character image. The inclination may be specified as the shape characteristic.
また、他の好ましい態様において、前記文字画像切出装置は標準的な文字の形状特性もしくは標準的な文字の構成部の形状特性を示す標準形状特性データを記憶する記憶手段と、画像により示される文字を認識する文字認識手段とを備え、前記第2文字画像認識手段は、第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、前記文字認識手段は、前記第2文字画像認識手段により取り出された文字画像により示されると推定される文字を認識し、前記第2文字画像認識手段は、前記記憶手段に記憶されている標準形状特性データのうち、前記文字認識手段により認識された文字、前記文字認識手段により認識された文字と類似した形状を有する文字および文字の構成部であって前記文字認識手段により認識された文字と類似した形状を有する構成部の少なくとも1に関する標準形状特性データにより示される形状特性に対し、前記形状特性特定手段により特定された形状特性に応じた補正を加えたものと、前記文字画像の候補の形状特性とを比較することにより、前記文字画像の候補を1文字を示す文字画像として認識するか否かを決定するように構成されてもよい。 In another preferred embodiment, the character image cutting device is represented by an image and storage means for storing standard shape characteristic data indicating a standard character shape characteristic or a standard character shape characteristic. A character recognizing unit for recognizing a character, wherein the second character image recognizing unit takes out a part of an image indicated by the second image data as a character image candidate indicating one character, and the character recognizing unit Recognizing a character presumed to be indicated by the character image extracted by the second character image recognizing means, wherein the second character image recognizing means includes the character of the standard shape characteristic data stored in the storage means; A character recognized by the recognition means, a character having a shape similar to the character recognized by the character recognition means, and a constituent part of the character, and recognized by the character recognition means. A correction made in accordance with the shape characteristic specified by the shape characteristic specifying means with respect to the shape characteristic indicated by the standard shape characteristic data relating to at least one of the constituent parts having a shape similar to the formed character, and the character It may be configured to determine whether or not the character image candidate is recognized as a character image indicating one character by comparing the shape characteristics of the image candidate.
また、本発明は、上記いずれかに記載の前記文字画像切出装置において行われる文字画像切出方法を提供する。さらに本発明は、上記いずれかに記載の前記文字画像切出装置が行う処理と同様の処理をコンピュータに実行させることを特徴とするプログラムを提供する。 Moreover, this invention provides the character image cutting method performed in the said character image cutting device in any one of the said. Furthermore, the present invention provides a program that causes a computer to execute a process similar to the process performed by any one of the character image cutting apparatuses described above.
本発明によれば、升目のない領域に書かれた手書き文字を示す画像から各々の文字を示す画像が切り出される際に、同じ書き手によって升目に書かれた手書き文字の形状特性が用いられる。その結果、各々の文字を示す画像の切り出しが高い精度で正しく行われる。 According to the present invention, when an image showing each character is cut out from an image showing a handwritten character written in a seamless area, the shape characteristic of the handwritten character written by the same writer is used. As a result, the image showing each character is correctly cut out with high accuracy.
[1.第1実施形態]
図1は本発明の第1実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、複数の文字を示す画像データから各々の文字を示す画像データを切り出して送信する文字画像切出装置10と、紙面に書かれた図形や文字を光学的に読み取ってそれらの図形や文字を白黒で示す画像データを文字画像切出装置10に送信するスキャナ11と、文字画像切出装置10から送信される画像データに対し文字認識処理を行い認識した文字を示すテキストデータを生成する文字認識装置12を備えている。
[1. First Embodiment]
FIG. 1 is a block diagram showing a configuration of a
図2は、スキャナ11により読み取り処理の行われる記入用紙を例示した図である。図2に示されるように、記入用紙には升目により各々の文字が書かれるべき領域が指定された氏名欄および住所欄と、升目が付されていない自由記入欄が含まれている。これらの記入欄には、書き手により手書きの文字列が記入されている。スキャナ11は記入用紙に記載されている図形および文字を示す画像データを生成し、生成した画像データを文字画像切出装置10に送信する。
FIG. 2 is a diagram illustrating an entry form on which a reading process is performed by the
文字画像切出装置10は、文字画像切出装置10の構成部を制御する制御部101と、制御部101による各種処理を指示するプログラムおよび各種データを記憶するとともに制御部101のワークエリアとして用いられる記憶部102を備えている。以下、図3および図4を参照しつつ、制御部101により行われる処理を説明する。
The character
制御部101は、スキャナ11から画像データを受信する画像データ入力部1011を備えている。画像データ入力部1011はスキャナ11から受信した画像データを記憶部102に画像データ1021として記憶する(ステップS1)。画像データ1021は、平面上に等間隔で配置された画素に対応する画素データの集合であり、各画素データは黒を示すオン画素データもしくは白を示すオフ画素データのいずれかである。
The
制御部101は、画像データ1021により示される画像から各々の升目が占める領域(以下、「升目領域」と呼ぶ)および自由記入欄の占める領域(以下、「自由記入欄領域」と呼ぶ)を特定する領域特定部1012を備えている。領域特定部1012は、例えば画像データ1021に対し細線化処理を行った後、特徴点の抽出処理を行う。特徴点とは、例えば細線化処理後のオン画素の端点、交点、屈曲点等を意味する。領域特定部1012はそのように抽出した特徴点から直線部分を特定し、特定した直線部分により囲まれる領域を、升目領域もしくは自由記入欄領域として認識する。領域特定部1012は認識した各々の升目領域および自由記入欄領域を示す領域データ1022を記憶部102に記憶する(ステップS2)。
The
制御部101は、升目領域に含まれる画像を取り出す第1文字画像認識部1013を備えている。第1文字画像認識部1013は、画像データ1021から、領域データ1022により示される升目領域の各々に含まれる画素データ群を取り出し、取り出したオン画素データ群を、1文字を示す画像(以下、「文字画像」と呼ぶ)を示す画像データ(以下、「文字画像データ」と呼ぶ)として認識する(ステップS3)。
The
制御部101は、文字画像の縦横比および傾斜度を特定する形状特性特定部1014を備えている。第1文字画像認識部1013は文字画像データを形状特性特定部1014に引き渡す。形状特性特定部1014は第1文字画像認識部1013から文字画像データを受け取ると、水平方向に伸びる上底および下底を有し、文字画像データにより示される文字画像に外接する平行四辺形を特定する。文字画像に外接する平行四辺形が複数存在する場合、形状特性特定部1014は、例えば各々の平行四辺形のうち面積が最も小さいものを選択する。図5は升目領域に書かれた文字画像の各々に対し、形状特性特定部1014により特定された平行四辺形が外接している様子を示した図である。
The
形状特性特定部1014は、各々の文字画像に外接する平行四辺形の高さxの上底(もしくは下底)の長さyに対する比(x/y)の平均値を、升目領域に書かれた文字画像群の縦横比として算出する。また、形状特性特定部1014は、各々の文字画像に外接する平行四辺形の左側(もしくは右側)の辺の垂直方向に対する角度の平均値を、升目領域に書かれた文字画像群の傾斜度として算出する。形状特性特定部1014は算出した縦横比および傾斜度を示すデータを、形状特性データ1023として記憶部102に記憶する(ステップS4)。
The shape
制御部101は、自由記入欄領域に含まれる画像から各行の文字列を示す画像(以下、「行画像」と呼ぶ)を切り出す行画像認識部1015を備えている。行画像認識部1015は、まず画像データ1021から、領域データ1022により示される自由記入欄領域に含まれるオン画素データを取り出し、取り出した画素データの水平方向の分布を垂直方向に走査し、水平方向のオン画素データが所定の閾値を超える垂直方向の範囲を特定する。そのように特定された範囲に含まれる画素データ群は行画像を示す画像データ(以下、「行画像データ」と呼ぶ)である(ステップS5)。
The
制御部101は、行画像から各々の文字を示す文字画像を取り出す第2文字画像認識部1016を備えている。行画像認識部1015は、行画像データを第2文字画像認識部1016に引き渡す。第2文字画像認識部1016は行画像データを受け取ると、受け取った行画像データにより示される行画像に含まれるオン画素のうち最も左に位置するものを起点画素とし、起点画素に連続するオン画素群を取り出す。以下、このように取り出されたオン画素群を「第1セグメント」と呼ぶ(ステップS6)。
The
続いて、第2文字画像認識部1016は第1セグメントに外接する平行四辺形を、形状特性特定部1014が升目領域内の文字画像に対し行う場合と同様の方法で特定し、特定した平行四辺形の縦横比および傾斜度を算出する(ステップS7)。第2文字画像認識部1016は、算出した縦横比の形状特性データ1023により示される縦横比に対する比率および算出した傾斜度の形状特性データ1023により示される傾斜度に対する比率が、いずれも所定の範囲内(例えば0.8〜1.2)に含まれているか否かを判定する。以下、この判定を「形状特性判定」と呼ぶ(ステップS8)。
Subsequently, the second character
第2文字画像認識部1016は、第1セグメントに関する形状特性判定において肯定的な結果を得た場合(ステップS8:Yes)、第1セグメントに外接する平行四辺形の内側領域の画像が1文字を示す文字画像であると判断し、その文字画像を示す画像データに識別ラベルを付して文字画像データとして記憶部102に記憶する(ステップS9)。識別ラベルは、例えば(1,1)のように2つの要素を持つ配列であり、第1の要素は行画像の番号、すなわち行番号を示し、第2の要素は行画像における文字画像の番号、すなわち行頭からの文字番号を示す。なお、以下の説明において、セグメントに外接する平行四辺形の内側領域の画像を「セグメント領域画像」のように呼ぶ。
When the second character
一方、第2文字画像認識部1016は、第1セグメントに関する形状特性判定において否定的な結果を得た場合(ステップS8:No)、第1セグメント領域画像は1文字を示す文字画像ではなく、1文字を構成する構成部を示す画像であると仮定し、行画像に含まれるオン画素のうち、第1セグメントより右側に位置しかつ最も左に位置するものを起点画素とし、起点画素に連続するオン画素群を取り出す。以下、このように取り出されたオン画素群を「第2セグメント」と呼ぶ(ステップS10)。
On the other hand, when the second character
第2文字画像認識部1016は、第1セグメントと第2セグメントの両方を含むオン画素群(以下、「連結セグメント」と呼ぶ)に対し、形状特性判定を行う(ステップS11)。第2文字画像認識部1016は連結セグメントに関する形状特性判定において肯定的な結果を得た場合(ステップS11:Yes)、連結セグメント領域画像が1文字を示す文字画像であると判断し、その文字画像を示す画像データに識別ラベルを付して文字画像データとして記憶部102に記憶する(ステップS12)。
The second character
一方、第2文字画像認識部1016は、連結セグメントに関する形状特性判定において否定的な結果を得た場合(ステップS11:No)、例えば、第1セグメントと連結セグメントのうち、それらの縦横比が形状特性データ1023により示される縦横比により近いものを選択し、選択したセグメントに関するセグメント領域画像を1文字を示す文字画像であると判断し、その文字画像を示す画像データに識別ラベルを付して文字画像データとして記憶部102に記憶する(ステップS13)。
On the other hand, if the second character
第2文字画像認識部1016は上記のように行画像の一部を文字画像として切り出すと、切り出した文字画像を行画像から除外した後(ステップS14)、行画像から文字画像を切り出す処理(ステップS6〜S14)を、全てのオン画素が行画像から除外されるまで繰り返す(ステップS15)。
When part of the line image is cut out as a character image as described above, the second character
第2文字画像認識部1016は、行画像認識部1015により複数の行画像が取り出された場合には、残りの全ての行画像に対し上述した文字画像の切り出し処理(ステップS6〜S15)を繰り返す(ステップS16)。第2文字画像認識部1016により切り出された文字画像を示す文字画像データは順次記憶部102に記憶される。図1においてそれらの文字画像データは文字画像データ群1024として示されている。
When a plurality of line images are extracted by the line
制御部101は、文字画像データを文字認識装置12に送信する画像データ出力部1017を備えている。第2文字画像認識部1016は、全ての行画像に関し文字画像の切り出し処理を完了すると、画像データ出力部1017に画像データの送信を指示する。その指示に応じて、画像データ出力部1017は記憶部102に記憶されている文字画像データ群1024に含まれる文字画像データを、識別ラベルの順序に従って順次、文字認識装置12に送信する(ステップS17)。
The
文字認識装置12は、文字画像切出装置10から文字画像データを受信すると、受信した文字画像データにより示される画像に対し文字認識処理を行い、その画像により示される文字を示す文字データを生成する。
When the
図6は、文字画像切出装置10により、行画像から正しく文字画像が切り出される様子を例示した図である。例えば、横長の字を書く癖のある書き手である田中太郎により自由記入欄に「今日明日」という文字が書かれた場合(図6(a))、従来技術によれば「明」の字が「日」と「月」として切り出される可能性が高かったが(図6(a−1))、文字画像切出装置10によれば正しく「明」として切り出される可能性が高い(図6(a−2))。
FIG. 6 is a diagram illustrating a state in which a character image is correctly cut out from a line image by the character
同様に、縦長の字を書く癖のある書き手である山田次郎により自由記入欄に「除虫工房」という文字が書かれた場合(図6(b))、従来技術によれば「虫」および「工」の字が「虹」として切り出される可能性が高かったが(図6(b−1))、文字画像切出装置10によれば正しく「虫」および「工」として切り出される可能性が高い(図6(b−2))。
Similarly, when Jiro Yamada, a writer with a habit of writing vertically long letters, writes the word “Insect repellent workshop” in the free entry field (FIG. 6B), according to the prior art, “insect” and Although there is a high possibility that the character “Kaku” is cut out as “rainbow” (FIG. 6B-1), according to the character
さらに、傾斜の強い字を書く癖のある書き手である鈴木花子により自由記入欄に「春夏秋冬」という文字が書かれた場合(図6(c))、例えばオン画素の垂直方向の分布によりセグメントの切り出しを行う従来技術によれば文字の切り出しが出来ない可能性が高かったが(図6(c−1))、文字画像切出装置10によれば正しく各々の文字が切り出される可能性が高い(図6(c−2))。
Furthermore, when Hanako Suzuki, a writer with a habit of writing strongly inclined characters, writes “Spring / Summer / Autumn / Winter” in the free entry field (FIG. 6C), for example, due to the vertical distribution of on-pixels. According to the conventional technique for segmenting, there is a high possibility that characters cannot be segmented (FIG. 6 (c-1)). However, according to the character
上記のように、文字画像切出装置10は升目領域に書かれた文字画像の形状特性に基づき、自由記入欄に書かれた文字画像の切り出しを行うため、切り出された文字画像が正しく1文字を示す画像である可能性が高い。従って、文字画像切出装置10により生成された文字画像データを用いて行われる文字認識装置12による文字認識の結果は精度の高いものとなる。
As described above, the character
ところで、上記の説明において文字画像切出装置10は画像認識処理により升目領域および自由記入欄領域を特定するものとして説明したが、予め升目領域および自由記入欄領域を示す領域データを記憶部102に記憶しておくようにしてもよい。また、記入用紙が複数種類あるような場合、文字画像切出装置10に予め複数の領域データを記憶させておき、記入用紙に応じた領域データに従い領域の認識を行わせるようにしてもよい。その場合、例えば記入用紙の所定箇所に記入用紙の識別子を記載しておき、また文字画像切出装置10の記憶部102に識別子と領域データとを対応付けて格納する領域DB(データベース)を準備しておく。そして、文字画像切出装置10は画像データ1021に含まれる識別子を文字認識処理により認識し、認識した識別子に対応する領域データを領域DBから検索して用いるようにすればよい。
In the above description, the character
また、上記の説明において文字画像切出装置10は画像の形状特性として画像に外接する平行四辺形の縦横比および傾斜度を用いるものとしたが、文字画像切出装置10が文字画像の切り出しの判断基準として用いる形状特性は他に様々なものが考えられる。例えば、画像に外接する矩形の縦横比を形状特性として用いてもよいし、画像に外接する台形の上底と下底の比等を形状特性として用いてもよい。
In the above description, the character
また、上記の説明において第2文字画像認識部1016は起点画素から連続するオン画素群を選択することにより第1セグメントおよび第2セグメントを取り出すものとしたが、第1セグメントおよび第2セグメントを取り出す方法は他に様々なものが考えられる。例えば、行画像に含まれるオン画素の垂直方向の分布を水平方向に走査し、その分布が所定の閾値を超える範囲を第1セグメントもしくは第2セグメントの範囲として特定してもよい。
In the above description, the second character
また、上記の説明において第2文字画像認識部1016はまず第1セグメントに関する形状特性判定を行い、その判定で否定的な結果を得ると連結セグメントに関する形状特性判定を行い、その判定で否定的な結果を得ると第1セグメント領域画像もしくは連結セグメント領域画像を文字画像として選択するものとして説明した。しかしながら、第2文字画像認識部1016がいずれのセグメント領域画像をどのような判定により文字画像と認識するかは様々に変更可能である。例えば、第1セグメントの横方向の長さが所定の長さを超えている場合には、連結セグメントの形状特性判定を行うことなく第1セグメント領域画像を文字画像として取り出すようにしたり、連結セグメントに関する形状特性判定の結果が否定的である場合であっても連結セグメントの横方向の長さが所定の長さに達していない場合には連結セグメントのさらに右側に位置するセグメントを連結した新たな連結セグメントに関し形状特性判定を行うようにしたりしてもよい。
In the above description, the second character
[2.第2実施形態]
図7は本発明の第2実施形態にかかる文字認識システム2の構成を示したブロック図である。文字認識システム2においては、文字画像の切り出しの精度を高めるために、文字を構成する構成部の配置による種別に応じた形状特性が用いられる。文字認識システム2の構成および動作は多くの点で文字認識システム1のそれらと共通しているため、図7において、文字認識システム1の構成部に対応する構成部には図1において用いられたものと同じ符号が付されている。
[2. Second Embodiment]
FIG. 7 is a block diagram showing the configuration of the
文字認識システム2は、文字認識システム1の文字画像切出装置10の代わりに、文字画像切出装置20を備えている。文字画像切出装置20の制御部101は、文字画像切出装置10の制御部101が備える全ての構成部に加え、第1文字画像認識部1013により認識された文字画像により示される文字を種別ごとに分類する第1分類部2011と、第2文字画像認識部1016により取り出されたセグメントにより示される文字を種別ごとに分類する第2分類部2012を備えている。
The
図8および図9は、文字画像切出装置20の制御部101により行われる処理を示すフロー図である。文字画像切出装置20の制御部101は、まず文字画像切出装置10の制御部101により行われる場合と同様に、スキャナ11から画像データを受信し(ステップS1)、升目領域および自由記入欄領域を特定し(ステップS2)、升目領域の文字画像を取り出し(ステップS3)、升目領域に含まれる文字画像の形状特性の特定、すなわち各文字画像の縦横比および傾斜度の平均値の算出を行う(ステップS4)。
8 and 9 are flowcharts showing processing performed by the
続いて、制御部101は文字画像の各々により示される文字を種別ごとに分類する(ステップS201)。具体的には、まず第1文字画像認識部1013は升目領域から取り出した文字画像を示す文字画像データを第1分類部2011に引き渡す。第1分類部2011は受け取った文字画像データにより示される文字画像に含まれる任意のオン画素を起点画素とし、起点画素に連続するオン画素群を特定する。第1分類部2011はそのように特定したオン画素群を文字の構成部を示す画像(以下、「構成部画像」と呼ぶ)として切り出し、文字画像からそれらのオン画素群を除外する。第1分類部2011は文字画像からオン画素がなくなるまで、構成部画像の切り出し処理を繰り返す。
Subsequently, the
第1分類部2011は上記のように構成部画像の切り出し処理を1つの文字画像について完了すると、切り出した構成部画像が文字画像において占める領域に基づき、文字画像により示される文字を複数の種別のいずれかに分類する。図10は、文字認識システム2による分類に用いられる種別を示した図である。種別番号「1」で識別される種別(以下、種別「1」のように呼ぶ)は、1つの構成部で構成される文字の種別を示している。また、例えば種別「2」は、偏(へん)と旁(つくり)で構成される文字の種別を示している。
When the
第1分類部2011は、切り出した構成部画像の各々に外接する矩形もしくは矩形の組合せ(例えばL字の多角形)を特定する。以下、そのように特定された図形を「外接図形」と呼ぶ。続いて、第1分類部2011は占有領域(図10の斜線部)を示す図形に対し、文字画像のサイズおよび傾斜度に応じた拡大・縮小および変形を加える。第1分類部2011は、外接図形と変形後の占有領域の図形との重複部分の面積を、各々の種別について算出する。第1分類部2011はそのように算出した面積が最も広い種別を、文字画像により示される文字の種別と判断する。
The
ただし、第1分類部2011が文字を分類する方法は重複部分の面積に基づくものに限られない。例えば、第1分類部2011は文字画像の特徴点を抽出し、各種別の占有領域の斜線部で示される図形の特徴点と比較することにより、文字画像により示される文字がいずれの種別に属するかを判断するようにしてもよい。
However, the method by which the
第1分類部2011は上記のように文字画像をいずれかの種別に分類すると、外接図形を示す画像データと、文字画像が分類された種別を示す種別番号を形状特性特定部1014に引き渡す。形状特性特定部1014は第1分類部2011から画像データおよび種別番号を受け取ると、受け取った画像データにより示される外接図形の形状特性を算出し、その結果を示すデータを第1分類部2011から受け取った種別番号とともに一時的に記憶部102に記憶する。
When the
ここで、外接図形の形状特性は種別により異なる。例えば、種別「2」の場合、文字全体の縦横比、偏の縦横比および旁の縦横比等が形状特性として用いられる。例えば、繞(にょう)と旁からなる種別「3」の場合、文字全体の縦横比、繞の縦、横および幅の比、旁の縦横比が形状特性として用いられる。 Here, the shape characteristics of the circumscribed figure differ depending on the type. For example, in the case of the type “2”, the aspect ratio of the entire character, the aspect ratio of the partial character, the aspect ratio of the font, and the like are used as the shape characteristics. For example, in the case of the type “3” consisting of 繞 and 旁, the aspect ratio of the entire character, the heel length, the width and width ratio, and the heel aspect ratio are used as shape characteristics.
第1分類部2011は第1文字画像認識部1013により認識された全ての文字画像に関し上記の分類処理を繰り返し、形状特性特定部1014は第1分類部2011により分類された全ての文字画像に関し上記の形状特性の特定処理を繰り返す。形状特性特定部1014は、全ての文字画像に関する形状特性の特定処理を終えると、記憶部102に一時的に記憶されている各々の文字画像の外接図形の形状特性を示すデータを、ともに記憶されている種別番号ごとに平均して、その結果を種別形状特性データ2021として記憶部102に記憶する(ステップS202)。図11は、種別形状特性データ2021の内容を例示した図である。
The
上記のように形状特性特定部1014により種別形状特性データ2021が記憶部102に記憶されると、文字画像切出装置20の制御部101は文字画像切出装置10の制御部101により行われる場合と同様に、自由記入欄領域から行画像を切り出し(ステップS5)、行画像から第1セグメントを取り出し(ステップS6)、第1セグメントの形状特性を特定し(ステップS7)、第1セグメントに関する形状特性判定を行う(ステップS8)。
When the type shape
第1セグメントに関する形状特性判定において肯定的な結果が得られた場合(ステップS8:Yes)、制御部101は第1セグメント領域画像を文字画像として切り出す(ステップS9)。一方、第1セグメントに関する形状特性判定において否定的な結果が得られた場合(ステップS8:No)、制御部101は行画像から第2セグメントを取り出し(ステップS10)、連結セグメントに関する形状特性判定を行う。ただし、文字画像切出装置20の制御部101は、文字画像切出装置10の制御部101が行う場合と異なり、連結セグメントに関する形状特性判定において形状特性データ1023の代わりに種別形状特性データ2021を用いる。
When a positive result is obtained in the shape characteristic determination regarding the first segment (step S8: Yes), the
すなわち、第2分類部2012は、ステップS201において第1分類部2011が行ったものと同様の分類処理を連結セグメント領域画像に対して行う。第2分類部2012により連結セグメント領域画像について特定される種別は、連結セグメント領域画像が1文字を示す画像であると仮定した場合における、その1文字の種別を示している。
That is, the
第2文字画像認識部1016は、連結セグメント領域画像に対し特定された種別に基づき、ステップS202において形状特性特定部1014が行ったものと同様の方法で、連結セグメント領域画像の外接図形の形状特性を示すデータを生成する。続いて第2文字画像認識部1016は、種別形状特性データ2021から、連結セグメント領域画像に対し特定された種別に対応するデータを取り出し、連結セグメント領域画像の外接図形の形状特性の、種別形状特性データ2021から取り出したデータにより示される形状特性に対する比率が、いずれも所定の範囲内(例えば0.8〜1.2)に含まれているか否かを判定する(ステップS203)。
Based on the type specified for the connected segment region image, the second character
文字画像切出装置20の制御部101は、その後、文字画像切出装置10の制御部101により行われる場合と同様に、ステップS203の結果等に応じて連結セグメント領域画像もしくは第1セグメント領域画像を文字画像として切り出す(ステップS12、S13)。制御部101は上記のように文字画像を切り出すと、切り出した文字画像を行画像から除外し(ステップS14)、行画像の残りのオン画素について文字画像の切り出し処理を繰り返す(ステップS15)。さらに、制御部101は全ての行画像について文字画像の切り出し処理を繰り返す(ステップS16)。切り出された文字画像を示す文字画像データは、その後、文字画像切出装置20から文字認識装置12に送信され(ステップS17)、文字認識処理に利用される。
After that, the
上記のように、文字認識システム2によれば、升目領域に書かれた文字全体の形状特性のみでなく、文字の構成部の形状特性が文字画像の切り出しにおいて用いられる。そのため、より高い精度で、正しく1文字を示す画像が切り出される。
As described above, according to the
[3.第3実施形態]
図12は本発明の第3実施形態にかかる文字認識システム3の構成を示したブロック図である。文字認識システム3においては、文字画像の切り出しの精度を高めるために、予め記憶された標準的な文字もしくは文字の構成部に関する形状特性と、切り出された画像の形状特性との比較が行われる。その際、標準的な文字等の形状特性には、升目領域に書かれた文字の形状特性に応じた補正が加えられるため、高い精度の文字画像の切り出しが実現される。
[3. Third Embodiment]
FIG. 12 is a block diagram showing the configuration of the
文字認識システム3の構成および動作は多くの点で文字認識システム1のそれらと共通しているため、以下、文字認識システム3が文字認識システム1と異なる点のみを説明する。また、図12において、文字認識システム1の構成部に対応する構成部には図1において用いられたものと同じ符号が付されている。
Since the configuration and operation of the
文字認識システム3は、文字認識システム1の文字画像切出装置10の代わりに、文字画像切出装置30を備えている。文字画像切出装置30の制御部101は、文字画像切出装置10の制御部101が備える全ての構成部に加え、第2文字画像認識部1016により取り出された第1セグメント領域画像および第2セグメント領域画像に対し文字認識処理を行う文字認識部3011を備えている。
The
また、文字画像切出装置30の記憶部102には、標準的な文字もしくは文字の構成部の形状特性を示す標準形状特性データを、それらの形状および文字における占有領域により分類して格納した標準形状特性DB3021が記憶されている。
In addition, the
図13は、標準形状特性DB3021の内容を例示した図である。標準形状特性DB3021は、文字もしくは文字の構成部(以下、「文字/構成部」と呼ぶ)の各々に対応する標準形状特性データを複数含んでいる。標準形状特性データは、文字/構成部が文字認識処理において認識される可能性の高い文字を示す「認識文字」、文字/構成部が文字の中で占有する領域を示す「占有領域」、文字/構成部の内容を示す「文字/構成部」、文字/構成部の形状特性を示す「形状特性」の各項目を含んでいる。ただし、以下の説明において「形状特性」は文字/構成部に外接する矩形の縦横比であるものとする。
FIG. 13 is a diagram illustrating the contents of the standard
標準形状特性DB3021において、標準形状特性データはまず「認識文字」により分類され、さらに「占有領域」により分類されている。例えば、図13において、第1行の標準形状特性データは、1文字の「人」についてのデータであり、その縦横比が「1.0」であることを示している。また、第2行の標準形状特性データは、1文字の「ト」についてのデータであり、その縦横比が「1.3」であることを示している。
In the standard
第1行および第2行のデータはともに「認識文字」が「人」であることから、「文字/構成部」で示される「人」および「ト」の文字は、ともに文字認識処理において「人」と認識される可能性が高いことを示している。第2行のような標準形状特性データは、「ト」が「人」と誤って認識された場合であっても、正しく文字画像の切り出しを行うために標準形状特性DB3021に含まれている。
Since the “recognized character” is “person” in both the data on the first line and the second line, the characters “person” and “g” indicated by “character / component” are both “character” in the character recognition process. This indicates that there is a high possibility of being recognized as a “person”. The standard shape characteristic data as in the second row is included in the standard
図14および図15は、文字画像切出装置30の制御部101により行われる処理を示すフロー図である。文字画像切出装置30の制御部101は、まず文字画像切出装置10の制御部101と同様に、ステップS1〜S7の処理を行う。ただし、文字画像切出装置30において第1セグメントは単に「セグメント」と呼ばれる。
14 and 15 are flowcharts showing processing performed by the
続いて、制御部101の文字認識部3011は、セグメント領域画像に対し文字認識処理を行い、その結果を示すテキストデータを第2文字画像認識部1016に引き渡す(ステップS301)。第2文字画像認識部1016は、標準形状特性DB3021から、「認識文字」のデータが文字認識部3011から受け取ったデータと一致する標準形状特性データを抽出する(ステップS302)。そのように抽出された標準形状特性データは、セグメント領域画像により示される文字もしくは構成部の候補を示すデータである。
Subsequently, the
続いて、第2文字画像認識部1016はステップS4において形状特性特定部1014により生成され記憶部102に記憶されている形状特性データ1023に応じて、ステップS302において抽出した標準形状特性データの「形状特性」欄のデータを補正する。例えば、標準的な文字の縦横比の平均値が1.0であり、形状特性データ1023により示される手書き文字の縦横比が1.2である場合、第2文字画像認識部1016は「形状特性」欄のデータに1.2(=1.2/1.0)を乗じることにより、それらの値を補正する(ステップS303)。
Subsequently, the second character
続いて、第2文字画像認識部1016はステップS303において補正した標準的な文字/構成部の形状特性の、ステップS7において特定したセグメント領域画像の形状特性に対する比率を算出し、その比率が所定の範囲内(例えば0.8〜1.2)に含まれている文字/構成部を抽出する(ステップS304)。
Subsequently, the second character
ところで、文字画像切出装置30においては、セグメント領域画像が文字認識部3011により文字の構成部として認識されることがあるため、第2文字画像認識部1016はステップS304において抽出した文字/構成部のいずれかを文字画像として選択するために、後続のセグメント領域画像について、同様に候補となる文字/構成部の抽出処理(ステップS301〜S304)を行う必要がある。従って、第2文字画像認識部1016はこの場合、ステップS304の結果を一時的に記憶部102に記憶する。このように、いずれの文字/構成部であるかの判定が保留されるセグメント領域画像を、以下、「未確定セグメント領域画像」と呼ぶ。
By the way, in the character
第2文字画像認識部1016は、ステップS304の処理に続き、先行する未確定セグメント領域画像の有無を判定する(ステップS305)。この場合、先行する未確定セグメント領域画像はないので(ステップS305:No)、第2文字画像認識部1016は続いて行画像にオン画素が残っているか否かを判定する(ステップS15)。この場合、通常、第2文字画像認識部1016はステップS15の判定において肯定的な結果を得て(ステップS15:Yes)、ステップS6の処理に戻る。
Following the process of step S304, the second character
第2文字画像認識部1016はその後、先に述べたように、後続のセグメント領域画像について候補となる文字/構成部の抽出処理(ステップS301〜S304)を行う。その後、第2文字画像認識部1016は未確定セグメント領域画像の有無を判定するが(ステップS305)、この場合、第2文字画像認識部1016は肯定的な結果を得る(ステップS305:Yes)。第2文字画像認識部1016は、先行する未確定セグメント領域画像についての候補となる文字/構成部と、それに後続するセグメント領域画像についての候補となる文字/構成部の組合せのうち、最適なものを選択する。
Thereafter, as described above, second character
具体的には、例えば先行する未確定セグメント領域画像についての候補に文字の左側を占有領域とする構成部が含まれ、後続するセグメント領域画像についての候補に文字の右側を占有領域とする構成部が含まれるような場合、第2文字画像認識部1016はそれらのセグメント領域画像を連結した連結セグメント領域画像を文字画像として切り出す。また、例えば後続するセグメント領域画像についての候補に、文字全体および文字の左側を占有領域とする構成部しか含まれていないような場合、第2文字画像認識部1016は先行する未確定セグメント領域画像を文字画像として切り出し、後続するセグメント領域画像を未確定セグメント領域画像として記憶部102に一時的に記憶する。
Specifically, for example, a configuration unit that includes the left side of a character as an occupied region in a candidate for a preceding undefined segment region image, and a configuration unit that uses a right side of a character as a candidate for a subsequent segment region image Is included, the second character
なお、複数の可能な組合せが存在する場合には、例えば、第2文字画像認識部1016は各々のセグメント領域画像の形状特性の、補正後の標準文字/構成部の形状特性に対する比率の平均値を算出して、その平均値が最も1に近いものを最適な組合せとして選択する。ただし、最適な組合せを選択する方法はこれに限られない。
When there are a plurality of possible combinations, for example, the second character
第2文字画像認識部1016は、上記のようにいずれかのセグメント領域画像を文字画像として切り出すと、切り出した文字画像を文字画像データ群1024として記憶部102に記憶した後(ステップS306)、行画像から切り出したセグメント領域画像を除外する(ステップS14)。続いて、第2文字画像認識部1016は行画像にオン画素が残っているか否かを判定し(ステップS307)、その判定の結果が肯定的であれば(ステップS307:Yes)、さらに後続のセグメント領域画像について候補となる文字/構成部の抽出処理および文字画像の書き出し処理(ステップS301〜S307)を繰り返す。
When any of the segment area images is cut out as a character image as described above, the second character
第2文字画像認識部1016は、行画像の末尾に位置するセグメント領域画像について候補となる文字/構成部の抽出処理および文字画像の書き出し処理(ステップS301〜S306)を行った後(ステップS307:No)、未確定セグメント領域画像の有無を判定する(ステップS308)。未確定セグメント領域画像がある場合(ステップS308:Yes)、それは行末のセグメント領域画像であるため、第2文字画像認識部1016はそのセグメント領域画像を文字画像として切り出す(ステップS309)。
The second character
その後、第2文字画像認識部1016は後続の行画像に関し、ステップS6〜S309の処理を繰り返す(ステップS16)。上記のようにして第2文字画像認識部1016により切り出された文字画像を示す文字画像データは、その後、文字画像切出装置30から文字認識装置12に送信され(ステップS17)、文字認識処理に利用される。
Thereafter, the second character
上記のように、文字認識システム3によれば、升目領域に書かれた文字の形状特性に応じて、標準的な文字および文字の構成部の形状特性に補正が施され、補正の施された形状特性に基づき、行画像から取り出されたセグメント領域画像を文字画像として切り出すべきか、文字の構成部として扱うかの判断が行われる。さらに、類似形状の形状特性も文字画像の切り出しの判断において考慮される。そのため、高い精度で、正しく1文字を示す画像が切り出される。
As described above, according to the
ところで、上述した文字画像切出装置10ないし文字画像切出装置30は、いずれも専用のハードウェアにより実現されてもよいし、汎用的なPC(Personal Computer)にアプリケーションプログラムに従った処理を実行させることにより実現されてもよい。
By the way, each of the character
また、上述した実施形態においては、本発明にかかる文字認識システムを文字画像切出装置とそれに接続されたスキャナおよび文字認識装置により実現するものとして説明したが、それらの構成要素の配置は任意に変更可能である。例えば、文字認識装置12を文字画像切出装置10と同じ筐体内に配置したり、スキャナの筐体内に文字画像切出装置を設けたり、文字画像切出装置とスキャナおよび文字画像切出装置と文字認識装置をネットワークを介して相互に接続するようにしてもよい。
In the above-described embodiment, the character recognition system according to the present invention has been described as being realized by the character image cutting device, the scanner connected thereto, and the character recognition device. However, the arrangement of these components is arbitrary. It can be changed. For example, the
また、上述した実施形態においては、文字画像切出装置に対し、スキャナから文字列を示す画像データが入力されるものとして説明したが、例えば表示部と一体化されたペンタブレットを備えるタブレットPCを文字画像切出装置に接続し、ユーザによるペンタブレットに対する筆記動作に応じて生成される画像データをタブレットPCから文字画像切出装置に入力させるようにしてもよい。 In the above-described embodiment, the image data indicating the character string is input from the scanner to the character image cutting device. However, for example, a tablet PC including a pen tablet integrated with a display unit is used. It may be connected to the character image cutting device, and image data generated in response to a writing operation on the pen tablet by the user may be input from the tablet PC to the character image cutting device.
また、上述した実施形態においては、升目領域の画像の形状特性と、自由記入欄領域から取り出されたセグメント領域画像の形状特性とが比較され、その比較の結果に基づきセグメント領域画像を文字画像として切り出すか否かが判定されるものとして説明した。しかしながら、例えば升目領域の画像の形状特性に応じた形状のセグメントを自由記入欄領域から取り出し、取り出したセグメントに含まれるオン画素に連続するオン画素をセグメントに取り込む等の方法により、文字画像の切り出しを行うようにしてもよい。 In the above-described embodiment, the shape characteristics of the grid area image are compared with the shape characteristics of the segment area image extracted from the free entry field area, and the segment area image is converted into a character image based on the comparison result. It has been described that it is determined whether or not to cut out. However, for example, by extracting a segment having a shape corresponding to the shape characteristics of the image in the grid area from the free entry field area, and extracting the on pixel continuous with the on pixel included in the extracted segment into the segment, etc. May be performed.
また、上述した実施形態においては、手書き文字は横書きであるものとして説明したが、縦書き等の手書き文字にも本発明にかかる文字認識システムが利用可能であることは言うまでもない。 In the above-described embodiment, the handwritten character is described as horizontally written, but it goes without saying that the character recognition system according to the present invention can be used for handwritten characters such as vertically written.
1・2・3…文字認識システム、10・20・30…文字画像切出装置、11…スキャナ、12…文字認識装置、101…制御部、102…記憶部、1011…画像データ入力部、1012…領域特定部、1013…第1文字画像認識部、1014…形状特性特定部、1015…行画像認識部、1016…第2文字画像認識部、1017…画像データ出力部、1021…画像データ、1022…領域データ、1023…形状特性データ、1024…文字画像データ群、2011…第1分類部、2012…第2分類部、2021…種別形状特性データ、3011…文字認識部、3021…標準形状特性DB
DESCRIPTION OF
Claims (7)
前記第1画像データにより示される画像のうち所定の升目領域に配置されている各升目内の部分を1文字を示す文字画像として認識する第1文字画像認識手段と、
前記第1文字画像認識手段により認識された文字画像の形状特性を特定する形状特性特定手段と、
前記形状特性特定手段により特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識手段と、
前記第2文字画像認識手段により認識された文字画像を示す画像データを出力する出力手段と
を備えることを特徴とする文字画像切出装置。 Image data acquisition means for acquiring first image data indicating each image and second image data indicating a second image;
First character image recognizing means for recognizing a portion in each cell arranged in a predetermined cell area of the image indicated by the first image data as a character image indicating one character;
Shape characteristic specifying means for specifying the shape characteristic of the character image recognized by the first character image recognition means;
Second character image recognition means for recognizing a part of an image indicated by the second image data as a character image indicating one character using the shape characteristic specified by the shape characteristic specifying means;
An output means for outputting image data indicating the character image recognized by the second character image recognition means.
前記第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、取り出した画像に外接する外接図形を特定し、該外接図形を用いて当該文字画像の候補を前記複数の種別のいずれかに分類する第2分類手段と
をさらに備え、
前記形状特性特定手段は、前記第1分類手段が特定した外接図形の形状特性を特定し、
前記第2文字画像認識手段は、前記第2分類手段により取り出された文字画像の候補の外接図形の形状特性と、前記形状特性特定手段により特定された形状特性であって、前記第2分類手段により当該文字画像の候補が分類された種別と同じ種別に前記第1分類手段により分類された文字画像の構成部画像に外接する外接図形の形状特性とを比較することにより、当該文字画像の候補を1文字を示す文字画像として認識するか否かを決定する
ことを特徴とする請求項1に記載の文字画像切出装置。 For each character image recognized by the first character image recognition means , a component image indicating a component of the character is cut out to identify a circumscribed figure circumscribing the component image, and the character image is defined using the circumscribed graphic. A first classification means for classifying into any of a plurality of types;
A part of the image indicated by the second image data is extracted as a candidate character image indicating one character, a circumscribed figure circumscribing the extracted image is specified, and the plurality of character image candidates are selected using the circumscribed figure. And a second classification means for classifying into any of the following types,
The shape characteristic specifying means specifies the shape characteristic of the circumscribed figure specified by the first classification means,
The second character image recognition means includes a shape characteristic of a circumscribed figure of a character image candidate extracted by the second classification means, and a shape characteristic specified by the shape characteristic specification means, wherein the second classification means By comparing the shape characteristics of the circumscribed figure circumscribing the component image of the character image classified by the first classification means into the same type as the classification of the candidate character image by It is determined whether it recognizes as a character image which shows 1 character. The character image cutting device of Claim 1 characterized by the above-mentioned.
ことを特徴とする請求項1に記載の文字画像切出装置。 The shape characteristic specifying means specifies the aspect ratio of the character image recognized by the first character image recognition means or the aspect ratio of each of a plurality of parts constituting the character image as the shape characteristic. The character image cutting device according to claim 1.
ことを特徴とする請求項1に記載の文字画像切出装置。 The shape characteristic specifying means specifies, as the shape characteristic, the inclination of the character image recognized by the first character image recognition means or the inclination of each of a plurality of parts constituting the character image. The character image cutting device according to claim 1.
画像により示される文字を認識する文字認識手段と
を備え、
前記第2文字画像認識手段は、第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、
前記文字認識手段は、前記第2文字画像認識手段により取り出された文字画像により示されると推定される文字を認識し、
前記第2文字画像認識手段は、前記記憶手段に記憶されている標準形状特性データのうち、前記文字認識手段により認識された文字、前記文字認識手段により認識された文字と類似した形状を有する文字および文字の構成部であって前記文字認識手段により認識された文字と類似した形状を有する構成部の少なくとも1に関する標準形状特性データにより示される形状特性に対し、前記形状特性特定手段により特定された形状特性に応じた補正を加えたものと、前記文字画像の候補の形状特性とを比較することにより、前記文字画像の候補を1文字を示す文字画像として認識するか否かを決定する
ことを特徴とする請求項1に記載の文字画像切出装置。 Storage means for storing standard shape characteristic data indicating standard character shape characteristics or shape characteristics of standard character components;
Character recognition means for recognizing the character indicated by the image,
The second character image recognition means takes out a part of the image indicated by the second image data as a character image candidate indicating one character,
The character recognition means recognizes a character presumed to be indicated by the character image taken out by the second character image recognition means;
The second character image recognizing unit includes a character recognized by the character recognizing unit and a character having a shape similar to the character recognized by the character recognizing unit among the standard shape characteristic data stored in the storage unit. And the shape characteristic specified by the shape characteristic specifying means with respect to the shape characteristic indicated by the standard shape characteristic data relating to at least one of the constituent parts of the character that are similar to the character recognized by the character recognition means Determining whether or not the character image candidate is recognized as a character image representing one character by comparing the shape characteristic of the character image candidate with a shape characteristic correction. The character image cutting device according to claim 1, wherein
前記第1画像データにより示される画像のうち所定の升目領域に配置されている各升目内の部分を1文字を示す文字画像として認識する第1文字画像認識過程と、
前記第1文字画像認識過程において認識された文字画像の形状特性を特定する形状特性特定過程と、
前記形状特性特定過程において特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識過程と、
前記第2文字画像認識過程において認識された文字画像を示す画像データを出力する出力過程と
を備えることを特徴とする文字画像切出方法。 An image data acquisition process for acquiring first image data representing each image and second image data representing a second image;
A first character image recognition process for recognizing a portion of each cell arranged in a predetermined cell area of the image indicated by the first image data as a character image indicating one character;
A shape characteristic specifying process for specifying a shape characteristic of the character image recognized in the first character image recognition process;
A second character image recognition process for recognizing a part of an image indicated by the second image data as a character image indicating one character using the shape characteristic specified in the shape characteristic specifying process;
An output process for outputting image data indicating the character image recognized in the second character image recognition process.
前記第1画像データにより示される画像のうち所定の升目領域に配置されている各升目内の部分を1文字を示す文字画像として認識する処理と、
認識した文字画像の形状特性を特定する処理と、
特定した形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する処理と、
文字画像として認識した前記第2画像データにより示される画像の一部を示す画像データを出力する処理と
をコンピュータに実行させることを特徴とするプログラム。 Processing to obtain first image data representing each image and second image data representing a second image;
A process of recognizing a portion in each cell arranged in a predetermined cell area of the image indicated by the first image data as a character image indicating one character;
Processing to identify the shape characteristics of the recognized character image;
A process of recognizing a part of an image indicated by the second image data as a character image indicating one character using the specified shape characteristic;
A program for causing a computer to execute a process of outputting image data indicating a part of an image indicated by the second image data recognized as a character image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005093260A JP4810853B2 (en) | 2005-03-28 | 2005-03-28 | Character image cutting device, character image cutting method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005093260A JP4810853B2 (en) | 2005-03-28 | 2005-03-28 | Character image cutting device, character image cutting method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006277149A JP2006277149A (en) | 2006-10-12 |
JP4810853B2 true JP4810853B2 (en) | 2011-11-09 |
Family
ID=37211873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005093260A Expired - Fee Related JP4810853B2 (en) | 2005-03-28 | 2005-03-28 | Character image cutting device, character image cutting method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4810853B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186781A (en) * | 2011-12-31 | 2013-07-03 | 北京新媒传信科技有限公司 | Text recognition method |
JP2015225094A (en) * | 2014-05-26 | 2015-12-14 | 大日本印刷株式会社 | Explanation moving image distribution system |
CN107609560A (en) * | 2017-09-27 | 2018-01-19 | 北京小米移动软件有限公司 | Character recognition method and device |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03225578A (en) * | 1990-01-31 | 1991-10-04 | Toshiba Corp | Method for detecting and segmenting character |
JPH04299485A (en) * | 1991-03-28 | 1992-10-22 | Nec Corp | Character string recognizing method and its device |
JPH05147187A (en) * | 1991-11-28 | 1993-06-15 | Gunze Ltd | Screen plate tester |
JP2000090200A (en) * | 1998-09-10 | 2000-03-31 | Ricoh Co Ltd | Method and device for character recognition and recording medium |
JP4087191B2 (en) * | 2002-08-16 | 2008-05-21 | 株式会社リコー | Image processing apparatus, image processing method, and image processing program |
-
2005
- 2005-03-28 JP JP2005093260A patent/JP4810853B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006277149A (en) | 2006-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6687401B2 (en) | Pattern recognizing apparatus and method | |
US6970601B1 (en) | Form search apparatus and method | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
EP2569930B1 (en) | Segmentation of a word bitmap into individual characters or glyphs during an ocr process | |
US7970213B1 (en) | Method and system for improving the recognition of text in an image | |
JP3294995B2 (en) | Form reader | |
US20110280481A1 (en) | User correction of errors arising in a textual document undergoing optical character recognition (ocr) process | |
JPS61267177A (en) | Retrieving system for document picture information | |
JPH0713995A (en) | Automatic determination device of feature of text | |
JP3485020B2 (en) | Character recognition method and apparatus, and storage medium | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
JP5906788B2 (en) | Character cutout method, and character recognition apparatus and program using this method | |
JP2007058882A (en) | Pattern-recognition apparatus | |
JP2002015280A (en) | Device and method for image recognition, and computer- readable recording medium with recorded image recognizing program | |
JP4810853B2 (en) | Character image cutting device, character image cutting method and program | |
JP4347675B2 (en) | Form OCR program, method and apparatus | |
JP4176175B2 (en) | Pattern recognition device | |
US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition | |
JPH11259597A (en) | Format recognition device and character reader | |
JP4117648B2 (en) | Form, form processing method, form processing program, recording medium recording form processing program, and form processing apparatus | |
JP3276555B2 (en) | Format recognition device and character reader | |
JP2020119291A (en) | Information processing device and program | |
CN115131806B (en) | Method and system for identifying OCR (optical character recognition) image information of various certificates based on deep learning | |
JP2007026470A (en) | Pattern recognition device | |
JPH0689330A (en) | Image filing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4810853 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140902 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |