JPS6077274A

JPS6077274A - 文字認識方法

Info

Publication number: JPS6077274A
Application number: JP59171017A
Authority: JP
Inventors: グレゴリー・マーチン・ベツドナー; ジヨージ・バーナード・フライヤー; マンスリ・セルヴアブライ・ナラシマ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1983-09-29
Filing date: 1984-08-18
Publication date: 1985-05-01
Also published as: JPH0432430B2; DE3484890D1; US4611346A; EP0138079B1; CA1208784A; EP0138079A2; EP0138079A3

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は、区別的発音筒が付加される可能性のある文字
または記号を、光学式文字認識装置を用いて認識するた
めの文字認識方法に関する。

「従来技術］人間の伝達手段である言語は、アルファベットに構成す
る記号のセラ１へを使用している２、こうした記号のう
ちあるものは、区別的発音筒と呼ばれる符号を付加する
ことによって変更される場合がある。区別的発音筒はそ
の言語の規則に従って所望の位置に付加される。こうし
た区別的発音筒は、例えば記号すなわち基本文字に付加
されてその発音を変更することもある。

日本の表音文字であるカタカナは、こうしたタイプのア
ルファベラ１−である。本発明を記述するために、カタ
カナを例として用いるが、本発明はもちろんこれに限定
されるものではない。

文字認識装置は、従来区別的発音筒を有する文字と区別
的発音筒を有しない文字との差異を認識するための特別
の手段が必要であると考えられてきた。米国特許第３７
１０３２１号はそうした例を示すものである。この例で
は、中央、水平行領域がアルファベラ１−の主要文字す
なわち基本記号を有している。こうした主要文字のうち
あるものはその−に１部領域または下部領域に区別的発
音性を伴う場合がある。主要文字を垂直走査しその文字
が区別的発音性を有しているということがわかると、次
の主要文字の垂直走査を一時中断して区別的発音性を有
する文字の」二部または下部（場合によって異なる）の
区別的発音符頭域の走査を準備する。その後、主要文字
の走査を続行しながら、上部または下部の区別的発音性
を識別するための特別な論理が付勢されて、区別的発音
符頭域が走査される。

日本のアルファベットであるカタカナおよびひらがなの
うち、カタカナは、文字認識装置によって日本語をデー
タ処理装置に入力する為の通常の手段となっている。カ
タカナ音は、母音Ａ（ア）、■　（イ）、Ｕ（つ）、Ｅ
（１）、およびＯ（オ）と５子音に、Ｓ、Ｔ、Ｎ、Ｉ−
Ｔ、Ｍ、Ｙ、Ｒ１およびＷを組合せて一音節を形成する
。ただしＹｌ、ＹＥ、ＷＩ、ＷＵ、およびＷＥの組合せ
は除外する。Ａ、■、Ｕ、Ｅ、○、およびＮはこれ自体
で発音され、これらはまたカタカナに含まれる。見本記
号のあるものの発音は、区別的発音性（ｎ’。

濁点、°　；半濁点）を基本記号のすぐ右」二に付加す
ることによって変更されることもある。さらに長音記号
（−）を基本記号の後に付記することによってその発音
が変更される場合もある。２つの区別的発音性および長
音記号を基本記号に組合せることによってカタカナは全
部で７２文字に拡張される。区別的発音性が付加された
カタカナ文字すなわち濁音文字および半濁音文字を総称
してここでは特に゛′修飾文字″と呼び、区別的発音性
が付加されていないカタカナ文字を“非修飾文字″と呼
ぶことにする。

カタカナは文字の数が多いので、手動によるデータ処理
装置への入力は、時間がかかり、面倒であり、かつ非経
済的である。従来から１手書きカタカナ文字を自動的に
読み取る光学式文字認識（ＯＣＲ）機械が開発されてき
た。しかしながら、修飾文字が複雑であること、および
、区別的発音性の位置が基本記号に近接すること、とい
う理由から、こうしたＯＣＲ機械は、区別的発音性が基
本記号から明確に分離するように区別的発音符自身の文
字空間に分離した符号としてそれを書き込むようにしな
ければならない。従って、ＯＣＲ［械は４６個の基本的
な非修飾文字と、分離しかつ独立した２つの区別的発音
性しか読み取ることができず、区別的発音性が本来の形
式（右」二に近接）に従って（Ｊ加された２５個の修飾
文字を読み取ることはできない。従って、こうしたＯ　
ＣＲ機械の場合は、カタカナの通常の規則とは異なる特
別の規則を用いた一Ｈ式を使用しなければならない。

ところで、本来の形式に従って修飾文字を認識する従来
技術もあるが、そうした従来の文字認識技術は、文書か
ら読み取った未知文字イメージと、標準的な大ぎさを有
する既知の文字イメージとを比較して、その大きさを規
格化するという操作を行う。修飾文字は、一般的に、非
修飾文字よりも大きい場合が多いので、修飾文字は規格
化により相対的に小さくなる。区別的発音性は１通゛ト
（′、基本文字よりも小さいので、規格化によってその
解像度が落ちる。従って区別的発音性の認識の信頼性が
低くなる。

［発明が解決しようとする問題点コ従来技術は、区別的発音性が本来の書式に基づいて書か
れた文字の認識の信頼性という点で問題があった。

本発明はこの問題を解決するものである。

［問題点を解決するための手段］本発明は、未知の文字およびそれに付加される区別的発
音性を高信頼に識別する方法を提供するものである。本
発明は、カタカナ文字において、区別的発音性が本来の
近接した形式で書かれている場合、又は通常のＯＣＲ機
械の要求する制限のもとて基本文字と分離して書かれて
いるような場合のいずれにも用いることができる。本発
明により、７２個のすべてのカタカナ文字および２つの
区別的発音性（独立した記号として基本文字と分離して
いる）を、特別な規則を必要とせず、認識することがで
きる。カタカナの規則に基づし）で一般的に書かれた文
字の認識が可能となるように光学式文字認識の能力を拡
張することができる。さらに、本発明は、新たな映像事
前処理技術、包含的ピッ１へコーディング、特殊な区別
的発音性の大ぎさｉｌｌ！ｌ定、認識結果の一意的符号
化、および区別的発音性を含む文字のための事後処理検
証を有していてもよい。

未知文字（区別的発音性を伴う文字を含んでし１てもよ
い）認識のためのデータ処理方法は、区別的発音性を含
む場合がある未知文字のイメージデータを記憶するステ
ップを有する。記憶されたイメージデータから、所定の
局所的な領域のデータを抽出する。この局所的な領域は
、区別的発音性の存在すべき場所に対応している。こう
して抽出された区別的発音筒イメージデータと、記憶さ
れている未知文字のイメージデータの少なくとも一部と
を検査してその文字を認識する。例えば、カタカナの場
合、区別的発音性はその文字の右上側に位置している。

従ってカタカナの場合は、未知文字の右上側に対応する
領域のイメージデータが抽出され、認識のための検査が
行われる。詳述すれば、抽出されたイメージデータを、
さらに、その領域内で右り隅に位置調整し、＠査過程お
よび認識過程の間は規格化しないでおく。一方、未知文
字のイメージデータは規格化されて、カタカナ文字認識
のための検査が行われる。

次に、イメージデータの映像事前処理について述べる。

区別的発音性が付加された文字は、通常、その文字にそ
れが付加されない場合に比べて幅が広い。この差異を利
用して、初めに、修飾文字と非修飾文字とを区分する。

１行の未知文字全体が２それらを読む方向と平行に走査
される。そうして１行の未知文字に対する水平方向のプ
ロファイルが生成される。生成されたプロファイルデー
タに対して論理的な検査を行い、そのプロファイルを、
次のようにして、未知文字（区別的発音性を含む）を表
わす個々のセグメントに区分する。文字と文字とのすき
間（分離領域と呼ぶ）を″切出し点″によって調べる。

分離領域が存在すると予想される所に″切出し点″を持
っていき、そこに分離領域が存在するかどうかを調べる
。″切出し点″が予想された分離領域に入っていれば、
その切出しは確定する（すなわち文字と文字との区分が
行われる）。分離領域が存すると予想される所に″切出
し点″を移動させても、そこで水平方向のプロファイル
が連続していれば（すなわちそこに分離領域が存在しな
い；隣接する文字が重なり合っているような場合）、″
切出し点″の位置を次のように調整する。″切出し点″
の位置を右方向に所定の距離だけ進行させる。この所定
の距離の範囲内でプロファイルが不連続になれば（すな
わちその範囲内で″切出し点″が分離領域に入れば）、
その場所で切出しが確定する。このようにして当該文字
の範囲を拡張して当該文字を切出す（拡張部分に区別的
発音性が存在する可能性があるため）。所定の距離まで
“切出し点″を進行させてもその間にプロファイルが不
連続にならない場合は（すなわちその範囲内で″切出し
点”が分離領域に入らない場合は）、今度は、逆に、″
切出し点″を初めの位置から左方向へ所定の距離だけ後
退させる。切出しを拡張する場合と同様にして、この後
退させた所定の範囲内でプロファイルが不連続になれば
、その場所で切出しが確定する。以上のようにして、カ
タカナの場合は、それが通常の書式で書かれていても（
区別的発音性が隣接）、また、従来のＯＣＲ機械の規則
に基づいて書かれていても（区別的発音性が分離）、そ
の文字を認識することができる。

文字の幅および高さをパラメータに用いて、水平方向お
よび垂直方向（またはいずれか一方）のプロファイルを
測定しその相対的な大きさを解析することにより、初め
に、修飾文字と非修飾文字を区別する。カタカナの場合
は、文字全体（区別的発音性を含む）の水平方向の幅の
差異に基づいて、修飾文字と非修飾文字を区別する。従
来、文字の高さおよび幅の符号化には、排他的ビットコ
ーディングが用いられてきた。排他的ピッ１〜コーティ
ングは、本発明で用いる包含的ビットコーディングより
も劣る。排他的ビットコーディングは、各々の特定の値
（すなわち高さおよび幅の範囲）に対して一意的な１つ
のピントをセラ１〜する。１つのビットを検査して、特
定の高さまたは幅を有する全ての文字と、その特定の値
よりも大きいかまたは小さい値を有する他の全ての文字
と、が区別できる。カタカナの修飾文字を識別するには
、特定の高さまたは幅よりも小さい全ての文字（非修飾
文字）と、特定の高さまたは幅よりも大きい全ての文字
（修飾文字）とを区別することが要求される。排他的ビ
ットコーディングを用いれば、この識〉１１１のために
複数のピッ１−を検査しなければならない。包含的ピッ
１−コーディングの場合は、文字の大きさに合わせて連
続するピッ１〜ストリンクをセツトシ、その文字の大き
さが少なくとも、セットされた各ピッＩ−と同じたけの
大きさであるということを示すようにしておく。こうし
て］つのピッ１−を検査するだけで、特定の高さまたは
幅よりも人きい全での文字と、この値以下の全ての文字
を区別することができる。従って、一般的に、区別的発
音性を有する幅の広いかつ高さの高い文字（修飾文字）
と、区別的発音性を含まない文字（非修飾文字）を区別
することができる。

カタカナ文字の認識結果の符号化に関して、ｌ」本工業
規格ＪＩＳでは、４６個の双本カタカナ記号、および２
個の区別的発音性（濁点および半濁点）に対して、それ
ぞれに一意的な」バイ１−のコートポイントが割り当て
られている。２つの区別的発音性のためのコートポイン
１〜は、区別的発音性が独立した記号として独自の文字
領域に存在するということを示してはいるが、独立した
記号として書かれた区別的発音性と、本来の書式に従っ
て基本文字に隣接して書かれた区別的発音性と、を区別
することはない。従って、新たに２つのコードポイン１
−を割り当てることによって、基本文字が区別的発音性
を含むということを表わすようにしてもよい。

修飾文字の事後処理検証に関して説明する。区別的発音
性が認識された場合は、ある手順が用いられる。カタカ
ナの場合は、先行文字の認識結果が検査されて、その先
行文字が濁点を付加し得る２０個の文字であるか、また
は、半濁点を付加し得る５個の文字であるかどうかを検
証する。検証の結果、いずれの文字でもなければ、先行
文字および区別的発音性（またはいずれか一方）は無効
ゾ字として拒否することができる。

［実施例］第１図について説明する。第１図は実７］＆例における
各処理の流れを表わす図である。走査器５の構成および
動作は通常のものである。走査器５は、区別的発音性を
含む未ｌｆ、目の文字が示された文書６を、それらを読
む方向に対して並行に走査する。

第１図は一行の文字７を水平に走査している様子を表わ
している。走査器５は文書６または走査機構を移動させ
て文書全体の高さを検査し、適切な幅が視界に入るよう
に選んで文書全体の幅を検査する。走査データが生成さ
れるとそれは事前処理される。事前処理は、文字行のプ
ロファイル登生成しそのプロファイルを個々の文字のセ
グメントに分割し、それによって文字イメージデータを
得るという処理である。修飾文字を分類するために、文
字イメージデータから区別的発音性の存在ずへき場所に
対応する所定の位置にある領域を抽出する。そうして抽
出されたイメージデータおよび文字イメージデータを検
査して、各々、区別的発音性および文字を認識する。こ
うしてｉｌｌもって認識された文字が次に事後処理検証
手順を経て、言語規則に基づいて区別的発音性を付加す
る可能性のある文字（清音文字という）に区別的発音性
が付加されていることを検証する。

第２図について説明する。第２図は区＞１目的発音符を
有する文字（修飾文字）と区別的発音性を有しない文字
（非修飾文字）を含むカタカナの例を示す。カタカナ文
字、ＨＥ（へ）、■　（イ）、ＷΔ　（ワ）、Ｎ（ン）
、ＫＵ（り）、およびＩぐＡ（う）は区別的発音性を有
しない文字（非修飾文字）である。カタカナ文字ＢＵ（
ブ）は右上に区別的発音性（ＩＩ：濁点）を有し、カタ
カナ文字ＰＥ（ぺ）は右上に区別的発音性（°；半濁点
）を有する。［３Ｕ（ブ）およびＰＥ（ぺ）は修飾文字
である。走査器５から得られる水平方向の走査線データ
をＯＲ機能で論理的に組合せて、走査された、文字行に
対する水平方向のプロファイルを生成する。水平方向の
プロファイルは、走査方向に１１′？ける文字の幅Ｓお
よび文字と文字との＋＋ＪＩの空白を表わす。

次に動作について説明する。光学式走査器は文書の文字
イメージを表わす情報を生成する。この情報は、通常、
文書の暗部骨および明部分（従って文書に書かれた文字
）を表わす一連の２値走査線データである。走査器は連
続的に水平方向を走査する。各々走査の間に、走査器は
論理値ｕ　Ｏ＋＋（ブランクを表わす）および論理値”
Ｍ’（走査線に沿−）で文字イメージか存在することを
表わす）を生成する。文字方向のプロファイルを生成す
る方法の」−）として、当該文字行に対応する所定数の
水平走査線のデータを、走査される文１１・の絵素位置
に対応する位置を有するレジスタに順次にロードすると
いう方法がある。はじめにレジスタをりｔＪアして（す
なわち全て論理値Ｉｆ　Ｏｎにする）、水平走査線のデ
ータを連続的にレジスタに入れると、それらのデータの
論理和か得られる。走査線データが論理値ＩＩ　Ｉ　＋
＋ならば、対応するレジスタのビットは論理値ＩＩ　１
−　＋＋にセラ１〜され、文字イメージの外形全体が走
査された後にレジスタがクリアされるまでは論理値ＩＩ
　Ｉ　＋＋か維持される。絵素位置がブランクの場合は
、レジスタは論理値ＩＩ　０７１のままである。走査線
データが全てレジスタに入ると、どの水平位置に文字デ
ータが存在するかということが示される。この文字デー
タが水平方向のプロファイルを表わしている。

第２図の］Ｏに示すような文字の水平方向のプロファイ
ルは、一連の、黒セグメント（論理値ＬＬ　］　Ｉ＋　
）および空白（論理値”　Ｏ”　）として現われる。黒
セグメンｌ〜１工は、文字および区別的発音筒を表わす
イメージデータの幅に対応している。

空白］２は、文字と文字とのすき間に対応している。

水］１方向のプロファイルは、次に、区別的発音筒を含
む各々の未知の文字を表オ）すセグメン１へに分割され
る６所与のピンチ（文字と文字との間隔）または、ピッ
チの計算値（通常の手法を用いて決定してもよい）に基
づいて、文字の初期切出しが行われる。論理的検査を実
行して、初期切出し点が、文字と文字とのすき間の領域
に人っているかどうかを判定する。第４Ａ図に示すよう
に、初期切出し点２０が、隣り合う文字の水平方向のプ
ロファイル・セグメン１−２２、および２３の間の実際
の分離領域２１内に入っていれば、その初期切出し点は
文字と文字とを分離するものとして確定する。

初期切出し点が実際の分離領域に入らない場合は（すな
わち文字と文字が重なり合っているか、または、区別的
発音筒が次の文字領域まで伸びている場合は）、第４Ｂ
図に示すように、右方向に初期切出し点を所定量（例え
ば１．．５ｍｍ）まで進行させながら水平方向のプロフ
ァイルを検査する。

所定量の範囲内で切出し点が分離領域に入れば、その時
点で切出し点が文字と文字とを分離するものとして確定
する。この様子は第４Ｂ図の破線で示した。第２図に示
すように、修飾文字ＢＵ（ブ）およびＰＥ（ぺ）は、水
平方向のプロファイル・セグメン１へが通常考えられる
よりも長い可能性のある文字の例である。これらは、第
４Ｂ図に示すように切出し点を延長させる手法を適用し
て切出すことができる。

第４Ｃ図に示すように、初期切出し点を右方向に進行さ
せても、それが実際の分離領域に入らない場合（矢印１
）は、初期切出し点を左方向に所定量（例えば１．５ｍ
ｍ）まで後退させながら水平方向のプロファイルを検査
する（矢印２）。所定量の範囲内で切出し点が分離領域
に入れば、その時点で切出し点が文字と文字とを分離す
るものとして確定する。この様子は第４Ｃ図の破線で示
した。

第４１Ｄ図に示すように、初期切出し点を進行させても
（矢印１）後退させても（矢印２）、実際の分離領域に
入らない場合は、初期切出し点が文字と文字とを分離す
るものとして確定する（矢印３）。これは、第２図の文
字Ｎ（ン）およびＫＵ（り）に示すように、隣接する文
字が重なり合う場合に適用できる。

第３図は、第４八図ないし第４１）図に説明した欠字と
文字との区切りを確立するための事前処理を表オ）す流
れ図である。

こうした切出しの手法を用いれば、カタカナの（＋’４
飾文字を書く場合に通常用いられる言語規則に従って、
基本文字が区別的全音符を包含（右肩に隣接）していて
もよい。走査器から得られるデータを適切に操作するか
、または、走査器の方向を変えることによって、垂直方
向の文字のプロファイルを使用するようにしてもよいし
、また垂直方向および水゛ト方向の両方のプロファイル
を使用するようにしてもよい。

前述のＪ：うに、区別的全音符を有する文字はそれを有
しない文字に比べて一般に高さ、幅とも大きい。第５図
は、水平方向の文字のプロファイルの幅（これは実際の
文字幅と比例関係にある）に対する文字発生頻度を表わ
す図であり、図は修飾文字が一般に長い幅を有すること
を示している。

従って、非修飾文字と修飾文字を区別するために文字の
幅をパラメータにとることは妥当であると考えられる。

水平方向のプロファイルを区分することによって文字イ
メージデータが分けられると、第６図に示すように、修
飾文字の識別を開始する。第６図においては、文字の大
きさを符号化し、水平方向の文字のプロファイルの幅の
差異に基づいて修飾文字と非修飾文字を区別する。次に
、区別的全音符が存在すると予想される場所に対応する
領域を。

文字イメージデータから抽出してその位置調整を行う。

抽出されたイメージデータおよび記憶されたイメージデ
ータは、次に、未知文字識別のために文字認識論理に送
られる。

文字の大きさを符号化するために、実施例では包含的ビ
ットコーディングを用いて、区別的全音符を含む文字の
高さおよび幅を論理的に記憶する。

次に示す表−１は、これを説明するための表である。

】ワーｌｊ（＋６ビツ１−）が絵素幅６４の文字空間製
表オ〕している。１ピツ１〜は絵素４つ分の幅に対応す
る。従来は排他的ビートコーディングを用いて１つのデ
ィジットをセットして各文字の幅を表わしていた。１つ
のビットを検査するので、特定の幅を有する文字は全て
、特定の値よりも大きいかまたは小さい他の全ての文字
と区別することができるが、特定の値よりも大きな値を
有する文字を認識するには、多数の検査が必要である。

包含的ピッ１〜コーデイングを用いれば、特定の幅以丁
の全てのビットは全て同じ論理状態（すなわち論理値Ｌ
Ｌ　Ｉ　Ｉ＋　）にセットされる。例を挙げると、文字
幅が絵素３８個分とすれば、その文字に係る包含的ビッ
トコーディングに基づいたワードは　″　１　コ　ｊ　
１　１１１１　１１００　００００”である。これが排
他的ビットコーディングならば、“００００　００００
　０１００　００００”となる。実施例では、幅の広い
（または高さの高い）文字と幅の狭い文字とを区別する
には、包含的ビットコーディングにより符号化されたワ
ードの１ピツ）・を検査するだけでよい。前述の例に当
てはめれば、包含的ピッ１〜コーデイングに基づいたワ
ードのビット１０を検査するだけで、絵素幅４゜より大
なる文字と絵素幅４０以下の文字とを全て区別すること
ができる。排他的ビン１〜コーデイングに基づいたワー
ドを検査して同じ結果を得るには、各ワードごとに最低
７ビツトを検査しなければならない。

包含的ピッ１〜コーデイングは認識論理の自動設計にも
有利である。自動膜Ｈ］プログラムは、通常、統計的決
定アルゴリズムを使用している。統計的決定アルゴリズ
ムは、最小エラー規準に基づいて文字の異なる２つの分
類を区別するために１つのビットを選択するものである
。包含的ビットコーディングはそうしたアルゴリズムに
とって最適の情報を与える。

次に第７図および第８図について説明する。

カタカナ文字の場合は、区別的発音筒は文字イメージの
右ｊ二部に位置する。第７図の破線で示すように、修飾
文字の抽出部３０（または窓）が定義される。この局所
的な領域内のデータは抽出部バッファに置かれる。良好
な実施例では、抽出部は」二１６本の走査線に含まれる
文字イメージデータの右端の］３絵素（すなわち１．６
ｍｍＸ２．１１ｎ　Ｉｎ　）から成る。抽出部３０の大
きさは区別的発音筒を識別するのに十分な情報量を有し
、これによってマイクロプロセッサは効率的にデータを
処理することかもき、かつ、基本文字の認識手順とも互
換性があるので、最シイな大きさであると考えられる。

抽出部３０の位置は、修飾文字の基本文字部分または非
修飾文字の線分との干渉が最少になるように選択されて
いる。抽出部３０の位置を固定すれば、節１）１で効率
よくしかも信頼性の高い抽出処理ができる。カタカナ以
外の他のアルファベラ１−では、抽出部の大ぎさおよび
位置は必要に応して変更してもよい。カタカナの場合は
、抽出部３０の１一端および右端をそれぞれ基本文字の
最上部および最右端にしておけばよいであろう。

良好な実施例では、抽出部３０内のイメージデータが抽
出部バッファに置かれる場合は、イメージデータはその
右上隅にさらに位置調整されて、正規化されない形式で
記憶される。この位置調整の様子を第８図に示す。こう
して１区別的発音符が抽出部３０の右上隅に位置するの
で、区別的発音筒の存在を容易にか・つ信頼性高く認識
でき、さらに、認識論理に要する記憶も少なくてすむ。

抽出部３ｏ内のイメージデータのうちで基本文字に対応
する部分は不必要なものである。

抽出部バッファにあるイメージデータを用いて、区別的
発音筒の特徴の存在の有無を判定することもできる。こ
の判定はツリータイプ検知構造によって実現できる。こ
れは、例えば、修飾文字と非修飾文字との区別、濁点と
半濁点との区別登行うものである。

通常の文字認識技術は、標準的な大きさを有する既知文
字イメージとの比較のために、未知文字イメージの大き
さを規格化（すなわち縮少）するという操作を有してい
る。区別的発音筒は、通常、基本文字よりも小さいので
、規格化によってその解像度が落ちる場合がある。本実
施例では、この情報を維持するために、規格化されてい
ない元の修飾文字のイメージデータから区別的発音性を
抽出して、規格化されていない状態でこれを検査する。

しかしＪン木文字は大きいので、そのイメージデータは
規格化されるのが普通である。次に、未知文字の規格化
されたイメージデータ、規格化さＪしていない区別的発
音性のイメージデータ、および任意の区別的発音符特徴
を用いて、最終的な文字認識が行われる。

文字認識に続いて、先行文字が識別された区別的発音性
を付加し得るものであるかどうかを検証することが要求
される場合もある。第９図は、この事後処理検証手順を
表オ〕す流れ図である。

第９図において、区別的発音性が存在するならば、先行
文字の認識結果を調べて、その先行文字が、濁点を付加
し得る２０個の清音文字（力行。

（を行、夕行、ハ行）のうちの１つであるか、または、
半円点をイー１加し得る５個の清音文字（へ行）のうち
の１つであるかどうかを検査する。認識された先行文字
が妥当な清音文字でない場合は、１以」二の拒否コード
を生成する。

従来のＯＣＲ機械は日本工業規格、Ｉ　Ｉ　Ｓに基づい
て動作する。Ｊ　Ｉ　Ｓでは、４６個のカタカナ文字の
各々に、１６進の一意的なバイトが割り当てられており
、濁点および半濁点にもそれぞれ１６進の一意的なバイ
ト”ＢＥ”および“Ｂ　Ｆ”が割り当てられている。こ
うした−Ｍ：的なハイ１−によって区別的発音性が認別
される。区別的発音性は、基本文字とは別個の記号とし
て、独自の文字領域に書かれる。実施例では、さらに２
つのコートポイントを割り当てて隣接する手書−きの区
別的発音性を識別する一方５．Ｊ　Ｉ　Ｓに基づく区別
的発音性の記号を用いる、既存のＯ（、Ｒ装置との互換
性も維持している。具体的に言うと、隣接濁点には１１
７　Ｆ　Ｉ＋、隣接半濁点にはＩＩ　４　］、　ｕが割
り当てられている。

［発明の効果］以上に説明した方法により、区別的発音性を有する文字
を、信頼性高く、認識することが可能となる。

【図面の簡単な説明】

第１図は実施例における各処理の流れを表わす１メ１、
第２図はカタカナ文字の一例とその水平方向のプロファ
イルを表わす図、第３図は切出し点を確定するための事
前処理手順を表わす流れ図、第４八図ないし第１］　ｌ
’）図は切出し点の確定の様イを３１体的［こ表わす図
、第５図は文字の水ｉ１１方向のプロファイルの幅と、
文字の発生頻度との関係を表わす１ン１、第６図は修飾
文字識別の手順を表わす回、第７図は修飾文字のイメー
ジデータと抽出される領域の関係を表わす図、第８図は
抽出された領域内のイメージデータを位置調整した様子
を表わす図、第９図は３１１後処離検証毛順を表わす図
である。出願人　インターナショナル・ビジネス・マシーンズ・
コーポレーション代理人　弁理士　頓　宮　孝　− （外１名）第３図第２図文字の水平方向の１０フフイ「の輻第５庖事前処理Ｊり文字認識へ第６図、７図　第８図

Claims

【特許請求の範囲】既知文字セラ１〜から、区別的発音筒が付加された文字
を含む未知文字を認識するための文字認識方法であって
、前記区別的発音筒を含む場合のある未知文字のイメージ
データを記憶し、該記憶された未知文字のイメージデータから、前記区別
的発音筒が存すると予想される場所に対応した所定位置
の領域に在るイメージデータを抽出し、前記記憶された未知文字のイメージデータの少なくとも
一部分と、前記抽出された区別的発音筒のイメージデー
タと、を検査して、前記未知文字、