JP3058706B2 - 住所カナの漢字変換方法 - Google Patents

住所カナの漢字変換方法

Info

Publication number
JP3058706B2
JP3058706B2 JP3072277A JP7227791A JP3058706B2 JP 3058706 B2 JP3058706 B2 JP 3058706B2 JP 3072277 A JP3072277 A JP 3072277A JP 7227791 A JP7227791 A JP 7227791A JP 3058706 B2 JP3058706 B2 JP 3058706B2
Authority
JP
Japan
Prior art keywords
kana
data
kanji
level
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3072277A
Other languages
English (en)
Other versions
JPH04283852A (ja
Inventor
ゆかり 佐藤
恒文 進藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3072277A priority Critical patent/JP3058706B2/ja
Publication of JPH04283852A publication Critical patent/JPH04283852A/ja
Application granted granted Critical
Publication of JP3058706B2 publication Critical patent/JP3058706B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、住所カナを漢字に変換
する方法に関し、特に、住所(居所を含む)の字レベル
の漢字が複数の読み方をもつ場合における字レベルの入
力カナを正しく漢字に変換する住所カナの漢字変換方法
に関する。
【0002】
【従来の技術】従来、たとえば保険会社等では帳票に住
所、氏名を記載する場合、住所を漢字で記載し、氏名を
カナやカナ付き漢字で記載していた。この帳票をANK
文字に加えて手書きの漢字の認識が行なえる光学式文字
読取装置(以下、OCR装置という。)で読取る。その
読取った住所の漢字データをカナデータに変換する場
合、変換装置でその読取った漢字データと記憶装置に格
納してある漢字辞書(漢字とそのカナとが対となって登
録されている。)ファイルの登録漢字との単語照合を行
なう。ここで単語照合とは、都道府県名のレベル(第1
レベルという。)と市、区等の地名レベル(第2レベル
という。)と町、村等の地名レベル(第3レベル、ここ
では特に字レベル(番地レベルの、その上の地名レベル
即ち住所の最後の地名レベルに相当する。)という。)
に分けてレベル毎の地名を1単語として扱い、各単語毎
に照合を行なうことをいう。
【0003】単語照合により一致したとき、その登録漢
字に対してのカナデータを漢字辞書ファイルより取出し
てカナデータを生成していた。しかし、このように、住
所の手書き漢字から正しいカナデータに変換すること
は、正解率が悪く、かつ単語照合に時間がかかってい
た。一方、帳票に記載した氏名については、カナ書きの
部分は、手書き漢字OCR装置による氏名のカナデータ
の認識率(正解率)が高く、しかも照合に時間がかから
ないという利点があった。そこで、ユーザからの希望に
より、帳票の住所もカナ書きにさせることにし、住所の
単語照合によりカナデータから漢字データを生成する機
能(住所のカナ漢字変換)を変換装置に追加することに
した。この場合、カナは、漢字のように複雑な字体でな
いため手書き漢字OCR装置からのカナの認識結果であ
る読取データは、漢字のときよりも正確であるため、変
換装置よりカナ漢字変換されて出力される漢字データ
は、正常に変換されたものとして処理を行なっていた。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の住所カナの漢字変換方法では、次のような問題
があった。手書き漢字OCR装置にて読取られた入力カ
ナデータが、記憶装置の辞書ファイルに登録されている
カナデータと全く同じ場合のみ、漢字データに変換する
ことができ、住所の地名漢字がどちらの読み方でも適用
する場合(例、町→「チョウ」、又は「マチ」)でも、
辞書ファイルに登録されたカナと異なれば、全てエラー
として扱い、漢字データに変換できなかった。なお、実
際の辞書内では「ョ」は大文字の「ヨ」となり、また濁
点は電報文のように1文字分となるが、本書では、説明
の都合上、通常の記載方法としている。本発明の目的
は、このような従来の問題点に鑑み、住所の字レベルの
地名に限り、その地名の漢字に適用する複数の読み方が
ある場合、字辞書ファイルに登録されたカナデータと異
なった入力カナデータに対して、正しいカナデータ(字
辞書ファイルに登録されたカナデータと同じカナデー
タ)に修正し、正しい漢字データに変換することができ
るようにした住所カナの漢字変換方法を提供することに
ある。
【0005】
【課題を解決するための手段】本発明は、住所の字レベ
ルにおける地名の1単語の入力カナデータを記憶手段に
設けた字辞書ファイルのカナデータと単語照合し、一致
したときそのカナデータに対しての漢字データを前記字
辞書ファイルより取出すようにした住所カナの漢字変換
方法において、前記入力カナデータと同じカナデータが
前記字辞書ファイルにないとき、前記入力カナデータに
相当する漢字に通用する別の読み方があるかを調べ、別
の読み方があれば、前記入力カナデータをその別の読み
方によるカナデータに修正し、その修正したカナデータ
と前記字辞書ファイルのカナデータとの単語照合を行な
い、一致したとき、そのカナデータに対しての漢字デー
タを前記字辞書ファイルより取り出すようにしたもので
ある。
【0006】
【作用】入力カナデータと同じカナデータが字辞書ファ
イルにないとき、入力カナデータに相当に漢字に適用す
る別の読み方があるかを調べ、別の読み方があれば、入
力カナデータをその別の読み方によるカナデータに修正
し、その修正したカナデータと字辞書ファイルのカナデ
ータとの照合を行ない、一致したときそのカナデータに
対しての漢字データを字辞書ファイルより取出す。故
に、住所の字レベルの地名に限り、入力カナを正しい漢
字データに変換することができる。
【0007】
【実施例】次に本発明の実施例について説明する。図3
は本発明に係るOCRシステムの一実施例を示すブロッ
ク図である。同図において、1はANKの文字認識に加
えて手書き漢字の文字認識の行なえるOCR装置(以
下、手書き漢字OCR装置という。)であって、この手
書き漢字OCR装置1は、読取媒体としての帳票の漢字
及びカナ等を読取って文字認識を行ない、その読取デー
タ(認識データ)を制御部2に渡す。2は、メモリ2−
1を内蔵する制御部であって、この制御部2に手書き漢
字OCR装置1、入力装置としてのキーボード(KBと
いう)3、表示装置(CRTという。)4およびハード
ディスク(HDという。)5が接続されている。制御部
2はこれらの手書き漢字OCR装置1、CRT4、およ
びハードディスク5等を統括制御するものである。
【0008】ここで、CRT4は、入力データを表示し
たり、手書き漢字OCR装置1からの読取データを表示
したり等するものである。また、ハードディスク5に
は、辞書ファイル特に住所の地名の単語照合用辞書ファ
イル(地名のカナとそのカナの漢字が登録されてい
る。)等が格納されている。
【0009】住所の地名の単語照合用辞書ファイルに
は、都道府県名レベルのファイル(第1レベルファイル
という。)と区、市、郡等の地名レベルのファイル(第
2レベルファイルという。)と町、村等の地名レベルの
ファイル(第3レベルファイル、又は字レベルファイル
という。)がある。第2レベルファイルは第1レベルの
各都道府県別に分類されて設けられている。第3レベル
ファイルは更に第2レベルの該当する各市、区、郡別に
分類されて設けられている。なお、本発明は、(字レベ
ルファイル)に関係し、特にこの(字レベルファイル)
を以下、字辞書ファイルという。また、6は変換装置で
あって、この変換装置6は、入力カナデータを漢字デー
タに変換したり、漢字データをカナデータに変換したり
等するものである。変換装置6は、制御部2とキーボー
ド3とCRT4とハードディスク5等から構成される。
また、7は読取媒体としてのたとえば帳票を読取り、そ
の読取った読取データ(認識データ)と辞書ファイルの
データとの照合を行ない、たとえば読取データであるカ
ナデータ(又は漢字データ)を漢字データ(又はカナデ
ータ)に変換したりするOCR装置である。このOCR
装置7は、キーボード3からの入力データと辞書ファイ
ルのデータとの照合を行ない、入力データをカナデータ
又は漢字データ等に変換することもできるものである。
【0010】次に、本発明に係る単語照合の処理概要を
図2を用いて説明する。なお、図2は、本発明に係る単
語照合の処理概要を説明する説明図である。読取媒体と
しての帳票11(カナ書きの住所地が図示の如くカナで
記載されている)を手書き漢字OCR装置1に入力す
る。又はキーボード3にて図示の如く住所地をカナ入力
する。制御部2は、手書き漢字OCR装置1からの読取
データやキーボード3による入力カナデータを、制御部
2のメモリ2−1に格納させる。次に制御部2は、単語
照合(住所カナの漢字変換)を行なう。この単語照合に
ついて以下説明する。カナデータはスペースで区切られ
ているので、制御部2はスペースで区切られたカナを1
つの単語としてメモリ2−1より取出す。図示の例で
は、「トウキョウト」、「ミナトク」、「シバウラ」が
それぞれ1つの単位を構成する。次に制御部2は、住所
の地名の第1レベルから第3レベルへと順に1単語ずつ
取出して照合を行なう。図示の例では、制御部2はま
ず、メモリ2−1より「トウキョウト」を取出し、これ
とハードディスク5の単語照合用辞書ファイルの第1レ
ベルファイルの都道府県名との照合を行ない、一致すれ
ばその「トウキョウト」の漢字「東京都」を第1レベル
ファイルより取出しメモリ2−1に格納する。次に、制
御部2は、メモリ2−1より「ミナトク」を取出し、こ
の「ミナトク」と、第2レベルファイルの区名、市名等
との照合を行ない、一致すればその「ミナトク」の漢字
「港区」を第2レベルファイルより取出しメモリ2−1
に格納する。更に、制御部2は、メモリ2−1より「シ
バウラ」を取出し、この「シバウラ」と、字辞書ファイ
ルの町名、村名等の照合を行ない、一致すれば、その
「シバウラ」の漢字「芝浦」を取出しメモリ2−1に格
納する。このようにして「東京都港区芝浦」という住所
地の漢字に変換される。
【0011】次に本発明の実施例を図1のフローチャー
トを用いて説明する。なお、図1は本発明の一実施例を
示すフローチャートである。また、具体例として図4を
参照しながら図1を説明する。図4はカナデータの修正
例を示す説明図である。まずカナデータを入力する(ス
テップS1)。ここでは、読取媒体としての帳票(住所
地名がカナ書きされている)を手書き漢字OCR装置1
に入力する。又は、キーボード3にてオペレータが住所
地をカナ入力する。手書き漢字OCR装置1で読取られ
たカナデータ(認識データ)は、制御部2へ供給され
る。制御部2はこのカナデータをメモリ2−1に格納す
る。またキーボード3からのカナ入力も制御部2のメモ
リ2−1に格納される。
【0012】ここで、メモリ2−1に格納されたカナデ
ータは図2で説明したように、第1レベルの地名と第2
レベルの地名の間、第2レベルの地名と第3レベル(字
レベル)の地名の間は、スペースで区切られており、ス
ペースで区切られたカナを1つの単語として扱う。図4
の例では、第2レベルの地名と第3レベルの地名の間は
スペースとなっている。制御部2は、メモリ2−1に格
納した住所地のカナデータより1単語のカナデータを取
り出す(ステップS2)。なお、メモリ2−1より取出
された1単語のカナデータを入力カナという。ここで、
メモリ2−1から1単語のカナデータを取出す場合、第
1レベルの方から第3レベルの方に向かって順番に取出
すものとする。従って制御部2は、第1レベルの地名が
なければ、第2レベルの地名をメモリ2−1より取出す
ものとする。
【0013】次に、制御部2は、入力カナが字レベルか
否かを調べる(ステップS3)。字レベルでなければ従
来通りの処理を行なう(ステップS4)。即ち、制御部
2は、字レベルでない場合、まず入力カナとハードディ
スク5の第1レベルファイルのカナと単語照合を行な
い、一致すれば、そのカナの漢字(都道府県名)を第1
レベルファイルより取出す。入力カナと第1レベルファ
イルのカナとが一致しない場合、制御部2は入力カナと
第2レベルファイルのカナと単語照合を行ない、一致す
ればそのカナの漢字(市、区等の地名)を第2レベルフ
ァイルより取出す。なお、図4の例では、「カワゴエ
シ」はこの場合に該当するが、発明に関係しないので図
4では説明を省略してある。制御部2は、ハードディス
ク5より取出された地名の漢字データをメモリ2−1に
格納させる。また、実際には、第1レベル、第2レベル
の地名は、字レベルの地名よりも数が少なく、一般に問
題は生じない。ステップ4で従来通りの処理を終える
と、次の1単語のカナデータをメモリ2−1より取出し
(ステップS5、S6)、再び字レベルでなければ、上
述したと同様に従来通りの処理を行なう(ステップS
4)。
【0014】次に、制御部2はメモリ2−1より1単語
のカナデータを取出す(ステップS5、S6)。制御部
2は字レベルであれば、入力カナとハードディスク5の
字辞書ファイルのカナとの単語照合(マッチング)を行
ない、単語照合の結果、一致すれば(入力カナと同じカ
ナが字辞書ファイルにあれば)、そのカナに対しての漢
字データを字辞書ファイルより取出し、漢字データを生
成する(ステップS7、S13)。この漢字データはメ
モリ2−1に格納される。もし、ステップS7におい
て、入力カナと字辞書ファイルのカナとが一致しなけれ
ば(入力カナと同じカナが字辞書ファイルになけれ
ば)、制御部2は、入力カナに相当する漢字に、別の通
用する読み方(文字)があるかをハードディスク5の辞
書ファイルより調べ(ステップS8、S9)、無ければ
エラーとして漢字データの生成は行なわない。また、制
御部2は、入力カナに相当する漢字に別の通用する読み
方(文字)があれば、入力カナを別の読み方の文字に修
正して、再度、その修正したカナと字辞書ファイルのカ
ナとの単語照合(マッチング)を行なう(ステップS1
0、S11)。制御部2は単語照合の結果、一致すれば
(修正したカナが字辞書ファイルにあれば)、そのカナ
に対しての漢字データを字辞書ファイルより取出し漢字
データを生成する(ステップS12、S13)。もし、
修正したカナと同じカナが字辞書ファイルに無ければ、
エラーとして漢字データ生成を行なわない。
【0015】図4の例では、「サイワイマチ」が字辞書
ファイルにないので、たとえば「マチ」に相当する漢字
に別の通用する読み方(文字)があるかをハードディス
ク5に別に設けた単語照合プログラムの中で作成したテ
ーブルより探し、「マチ」を「チョウ」とし、修正カナ
「サイワイチョウ」と字辞書ファイルとの照合(マッチ
ング)を行なう(ステップS7〜S11)。その照合の
結果、修正カナが字辞書ファイルにあったので、そのカ
ナに対しての漢字データ「幸町」を字辞書ファイルより
取出して漢字データ「幸町」を図示の如く生成する(ス
テップS12、S13)。以上の説明から判るように、
住所の字レベルの地名に限り、その地名の漢字に適用す
る複数の読み方(文字)がある場合、字辞書ファイルに
登録されたカナデータと異なった入力カナデータに対し
て、正しいカナデータ(字辞書ファイルに登録されたカ
ナデータと同じカナデータ)に修正し、その正しいカナ
データに対しての漢字データを字辞書ファイルより取出
すことができる。従って入力カナが字辞書ファイルのカ
ナと異なっていても、入力カナを正しいカナに修正し、
正しい漢字データに変換することができる。本発明は本
実施例に限定されることなく、本発明の要旨を逸脱しな
い範囲で種々の応用および変形が考えられる。
【0016】
【発明の効果】上述したように本発明によれば、住所の
字レベルの地名に限り、その地名の漢字に適用する複数
の読み方(文字)がある場合、字辞書ファイルに登録さ
れたカナデータと異なった入力カナデータを正しいカナ
に修正し、正しい漢字データに変換することができる等
の効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例を示すフローチャートであ
る。
【図2】本発明に係る単語照合の処理概要の説明図であ
る。
【図3】本発明に係るOCR装置の一実施例を示すブロ
ック図である。
【図4】カナデータ修正例を示す説明図である。
【符号の説明】
1 手書き漢字OCR装置 2 制御部 2−1 メモリ 3 キーボード 4 CRT 5 ハードディスク 6 変換装置 7 OCRシステム
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭57−90782(JP,A) 特開 平3−62187(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/27 G06K 9/72

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 住所の字レベルにおける地名の1単語の
    入力カナデータを記憶手段に設けた字辞書ファイルのカ
    ナデータと単語照合し、一致したときそのカナデータに
    対しての漢字データを前記字辞書ファイルより取出すよ
    うにした住所カナの漢字変換方法において、前記入力カ
    ナデータと同じカナデータが前記字辞書ファイルにない
    とき、前記入力カナデータに相当する漢字に通用する別
    の読み方があるかを調べ、別の読み方があれば、前記入
    力カナデータをその別の読み方によるカナデータに修正
    し、その修正したカナデータと前記字辞書ファイルのカ
    ナデータとの単語照合を行ない、一致したとき、そのカ
    ナデータに対しての漢字データを前記字辞書ファイルよ
    り取り出すようにしたことを特徴とする住所カナの漢字
    変換方法。
JP3072277A 1991-03-12 1991-03-12 住所カナの漢字変換方法 Expired - Fee Related JP3058706B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3072277A JP3058706B2 (ja) 1991-03-12 1991-03-12 住所カナの漢字変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3072277A JP3058706B2 (ja) 1991-03-12 1991-03-12 住所カナの漢字変換方法

Publications (2)

Publication Number Publication Date
JPH04283852A JPH04283852A (ja) 1992-10-08
JP3058706B2 true JP3058706B2 (ja) 2000-07-04

Family

ID=13484632

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3072277A Expired - Fee Related JP3058706B2 (ja) 1991-03-12 1991-03-12 住所カナの漢字変換方法

Country Status (1)

Country Link
JP (1) JP3058706B2 (ja)

Also Published As

Publication number Publication date
JPH04283852A (ja) 1992-10-08

Similar Documents

Publication Publication Date Title
JP3058706B2 (ja) 住所カナの漢字変換方法
JPH05258099A (ja) 文字認識処理装置
US9443139B1 (en) Methods and apparatus for identifying labels and/or information associated with a label and/or using identified information
JPH0934984A (ja) 文字認識装置
CN112417851B (zh) 文本纠错分词方法、系统及电子设备
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JP2942375B2 (ja) 文字読取装置
JPS6251866A (ja) 電子フアイルシステム
JPH04283853A (ja) カナ−漢字変換方法
JP3419425B2 (ja) 認識文字補正装置
JP2865443B2 (ja) カナ氏名もしくはカナ法人名表記の漢字変換装置
JP3548372B2 (ja) 文字認識装置
JP3251704B2 (ja) 認識処理装置
JPH0267684A (ja) 校正支援方法
JPH09293107A (ja) 文書処理装置
JPH09138835A (ja) 文字認識装置
JP3163859B2 (ja) 運転免許証認識装置及び運転免許証認識方法
JP4754889B2 (ja) 文字列抽出方法および装置
JPS6385887A (ja) 文字認識システム
KR20230067375A (ko) 특정 서브젝트에 대한 다중 문서 집합의 요약정보 획득 방법 및 이를 이용한 서버
JP2003248794A (ja) 帳票情報処理装置、帳票情報処理システムおよびプログラム
JPS5998237A (ja) 文字入力方式
JPH1040401A (ja) 戸籍データ作成における書式解析方法
JP2986255B2 (ja) 文字認識装置
JPH04256193A (ja) 認識文字の単語登録処理方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees