WO2021049070A1

WO2021049070A1 - 文字候補提案装置、手書文字識別システム、手書文字識別方法およびプログラム

Info

Publication number: WO2021049070A1
Application number: PCT/JP2020/011553
Authority: WO
Inventors: 淳北見
Original assignee: 株式会社日立システムズ
Priority date: 2019-09-09
Filing date: 2020-03-16
Publication date: 2021-03-18
Also published as: TWI766360B; KR20210032380A; TW202115603A; JP7297610B2; JP2023110102A; JP7490861B2; KR102465524B1; TW202234289A; KR102572500B1; JP2021043570A; TWI795292B; KR20220153096A; CN112789624A

Abstract

類似する文字列候補をより適切に提案する技術を提供する。　文字候補提案装置であって、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理部と、受信した文字と外観が類似する文字の候補を、類似文字記憶部と照合することで特定し、外観が類似する文字の候補の組み合わせのうち実存文字記憶部に記憶された実存する文字列と照合する照合処理部と、照合処理部による照合の結果ヒットした外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理部と、を備える。

Description

文字候補提案装置、手書文字識別システム、手書文字識別方法およびプログラム

　本発明は、文字候補提案装置、手書文字識別システム、手書文字識別方法およびプログラムに関するものである。本発明は2019年9月9日に出願された日本国特許の出願番号2019-163641の優先権を主張し、文献の参照による織り込みが認められる指定国については、その出願に記載された内容は参照により本出願に織り込まれる。

　特許文献１には、「情報処理装置は、画像データから文字列を抽出する文字抽出部２２４と、入力文字に対応する１または２以上の変換候補文字を含む変換候補リストを作成するリスト作成部２４４と、前記変換候補リストに含まれる前記１または２以上の変換候補文字と、前記文字抽出部によって抽出された文字列との比較に基づいて、変換先の文字を特定する特定部２４８と、前記特定部によって特定された前記変換先の文字を含む表示画面を生成する表示制御部２５２と、を備える」ことについて記載されている。

特開２０１８－１６３４１３号公報

　上記技術は、文字の候補を提示できるが、文字の認識を誤ると、適切な結果を得ることが難しい。

　本発明の目的は、類似する文字列候補をより適切に提案する技術を提供することにある。

　本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下のとおりである。本発明の一態様に係る情報処理装置は、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理部と、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理部と、を備える。

　また例えば、上記の文字候補提案装置は、前記候補文字を出力後、前記受託処理部が受信した前記文字のいずれかと類似する文字を受け付けると、前記類似文字記憶部に記憶されていない類似関係であれば前記類似文字記憶部に記憶させる類似文字登録処理部、を備えるものであってもよい。

　また例えば、上記の文字候補提案装置は、前記実存文字記憶部には、実存する人名の文字列が格納されており、前記受託処理部は、案出する前記文字候補として人名の案出を受託し、前記候補文字送信処理部は、前記外観が類似する文字の候補の組み合わせを人名の候補文字として出力するものであってもよい。

　また例えば、上記の文字候補提案装置であって、前記実存する人名の文字列は、姓と名が区分されており、受信した前記文字を姓と名に区分して前記照合処理部に照合させる姓名判別処理部、を備えるものであってもよい。

　また例えば、上記の文字候補提案装置であって、前記姓名判別処理部は、受信した前記文字について姓と名を区切る位置を変化させて姓と名に区分した組み合わせを特定し、各組み合わせの姓と名の両方について、前記照合処理部による照合の結果ヒットを得られた場合に前記候補文字とする、ことを特徴とするものであってもよい。

　また例えば、上記の文字候補提案装置であって、前記候補文字送信処理部は、前記候補文字を、出現頻度に応じて整列して出力する、ことを特徴とするものであってもよい。

　また例えば、上記の文字候補提案装置であって、前記受託処理部が受信する前記文字は、手書き文字を読み取って認識した文字である、ことを特徴とするものであってもよい。

　また、本発明の別の態様にかかる手書文字識別システムは、文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムであって、前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識部と、前記文字認識部により認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理部と、前記文字候補提案装置から出力された文字候補を表示する目視確認処理部と、を備え、前記文字候補提案装置は、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理部と、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理部と、を備える、ことを特徴とする。

　また、本発明の別の態様にかかる手書文字識別方法は、文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムによる手書文字識別方法であって、前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識ステップと、前記文字認識ステップにおいて認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理ステップと、前記文字候補提案装置から出力された文字候補を表示する目視確認処理ステップと、を実行し、前記文字候補提案装置は、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、を備え、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理ステップと、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理ステップと、を実行することを特徴とする。

　また、本発明の別の態様にかかるプログラムは、コンピュータに、手書文字の識別を支援させる処理を行わせるプログラムであって、前記コンピュータは、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、処理部と、を備え、前記処理部に、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理ステップと、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理ステップと、を実施させることを特徴とする。

　本発明によると、文章の内容を適切に評価できる技術を提供することができる。

　上記した以外の課題、構成および効果は、以下の実施形態の説明により明らかにされる。

実施形態に係る手書文字識別システムの概要を例示するブロック図である。手書文字識別システムの構成の例を示す図である。受領データ記憶部のデータ構造例を示す図である。名字記憶部のデータ構造例を示す図である。名前記憶部のデータ構造例を示す図である。類似文字記憶部のデータ構造例を示す図である。候補文字記憶部のデータ構造例を示す図である。文字記憶部のデータ構造例を示す図である。画像記憶部のデータ構造例を示す図である。文字候補提案装置のハードウェア構成例を示す図である。手書文字認識の全体処理フローの例を示す図である。姓名区分照合処理のフローの例を示す図である。候補文字受領処理のフローの例を示す図である。類似文字登録処理のフローの例を示す図である。候補提示画面の例を示す図である。名字候補提示例を示す図である。

　以下に、本発明の一態様に係る実施形態を適用した手書文字識別システム１について、図面を参照して説明する。以下の実施の形態においては便宜上その必要があるときは、複数のセクションまたは実施の形態に分割して説明するが、特に明示した場合を除き、それらはお互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。

　また、以下の実施の形態において、要素の数等（個数、数値、量、範囲等を含む）に言及する場合、特に明示した場合および原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよい。

　さらに、以下の実施の形態において、その構成要素（要素ステップ等も含む）は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。

　同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは特に明示した場合および原理的に明らかにそうではないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。このことは、上記数値および範囲についても同様である。

　また、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。

　図１は、本実施形態に係る手書文字識別システムの概要を例示するブロック図である。手書文字識別システム１は、利用者が業務端末２００を用いてブラウザ等を介して文字候補提案装置１００に接続して利用するが、これに限られず、文字候補提案装置１００の各機能がアプリケーションソフトウェアとして業務端末２００に搭載されるものであってもよい。

　なお、業務端末２００から文字候補提案装置１００に接続する際には、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、インターネット、携帯電話網等、あるいはこれらが複合した通信網であるネットワーク５０を介して接続される。当該ネットワークは、携帯電話通信網等の無線通信網上のＶＰＮ（Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）等であってもよい。

　手書文字識別システム１の応用例を挙げると、手書文字識別システム１は、所定の書面（例えば、保険の申込書や銀行口座の開設申込書等、氏名を所定の様式に従って手書きで入力する書面）の取り扱いを伴う業務システム等がある。

　その際には、利用者は、所定の書面の所定の欄に氏名を手書きで書き込むことが想定されるが、大量の書面を事務処理するためには、コンピュータ処理による大量の情報処理を介した方が効率性の面でメリットが大きいため、一般的には氏名等の手書きの記述はＯＣＲ（Ｏｐｔｉｃａｌ　Ｃｈａｒａｃｔｅｒ　Ｒｅｃｏｇｎｉｔｉｏｎ）によりデジタル化されることが多い。

　ここで、紙文書の文字データ電子化技術は向上しているが、誤読や不読が一定の割合で生じ、あらゆる手書き文字を完全に認識可能な技術は存在しない。そのため、最終的に人の目視による文字一致確認を行っているが、この目視作業は文書の文字データ電子化コストの削減を阻害する要因の一つとなっている。具体的には、氏名を読み取りした場合、名字、名前等の氏名に関するデータベースと照合して文字の認識率の向上を図る仕組みが取り入れられているが、読み取りが難しい文字や紛らわしい文字もあり、誤読が発生しているか目視で確認するコストが依然としてかかる。

　つまり、読取した文字に誤読が含まれる場合、例えば正しい名字「川本」をＯＣＲ等の文字認識エンジンが「小木」と誤読した場合、誤である「小木」に対して各データベースとの照合を行うため、正である「川本」の候補順位が劣後、または候補洩れする可能性がある。

　また、名字部分と名前部分の記入欄が各々明確にしないで氏名をフルネームとして記入する書式を用いる場合には、正しい名字の識別がなされなければ誤読の発生にすら気づかない場合もある。例えば「小山田伸」（おやまだしん）というフルネームの「田」を「由」と誤読すると、名字を「小山」（こやま）と認識し、「由」から始まる「由伸」（よしのぶ）等の名前を候補としてしまう可能性がある。

　これらを鑑み、本願はＯＣＲ等の文字認識エンジンで読取った文字が誤であることも前提に、名字と名前に関するＤＢとの照合に加えて、過去においてＯＣＲ等の文字認識エンジンで誤読の多かった文字の情報を記録した類似文字と照合する。これにより、誤読の発生しやすい文字を含んだ読取文字の候補の範囲を適切に広げ、劣後または候補洩れの可能性のある文字も候補とするとともに、名字と名前の判別処理を行ったうえで、候補文字の選別を行う。また、この類似文字は、文字の目視確認作業を通じて常に新しい類似文字情報が蓄積されうるものとすることで、文字認識の精度向上をねらう。

　本実施形態に係る業務端末２００は、そのような所定の書面をデジタル化する業務に用いられる端末である。読取装置３００は、スキャナーや撮像装置等であり、業務端末２００からの指示に応じて所定の書面を画像等により読み取り、読み取った手書文字画像を業務端末２００に受け渡す。

　当該業務では、業務端末２００は、手書文字画像を受け取ると、ＯＣＲによりデジタル化して文字列情報へと変換し、変換した文字列を文字候補提案装置１００に送信して文字候補提案装置１００から案出された候補文字を受け取る。そして、業務端末２００は、候補文字を選択的に表示し、利用者に選択された候補文字をデジタル化情報として利用する。

　なお、読取装置３００は、スキャナーに限られるものではなく、カメラ付き携帯電話端末、カメラ付きタブレット端末等の画像をデータとして読込み可能な機器であってもかまわず、ネットワーク５０を介して業務端末２００と通信可能に接続される構成であってもよい。

　また、読取装置３００は必須の装置ではなく、文字候補提案装置１００または業務端末２００がネットワーク５０を介して他の装置から既に読取った画像データや文字認識を行ったデータを受信し、文字候補を提案するものであってもよい。

　図２は、手書文字識別システムの構成の例を示す図である。文字候補提案装置１００は、記憶部１１０と、処理部１２０と、通信部１３０と、が互いにバス等で通信可能に接続される。

　記憶部１１０には、受領データ記憶部１１１と、実存文字記憶部１１２と、類似文字記憶部１１５と、候補文字記憶部１１６と、が含まれる。実存文字記憶部１１２には、実存する人名や固有名詞等の文字列が格納される。例えば、実存文字記憶部１１２には、名字記憶部１１３と、名前記憶部１１４と、が含まれる。例えば、日本人の名字は、３０万種類以上あるといわれており、その実在が確認されている名字が名字記憶部１１３に格納される。

　図３は、受領データ記憶部のデータ構造例を示す図である。受領データ記憶部１１１には、受託日１１１Ａと、依頼企業ＩＤ１１１Ｂと、文書番号１１１Ｃと、文字識別番号１１１Ｄと、認識文字コード１１１Ｅと、が含まれる。受託日１１１Ａは、業務端末２００から文字候補提案の依頼を受託した日を特定する情報である。依頼企業ＩＤ１１１Ｂは、文字候補提案を依頼した企業を特定する情報である。文書番号１１１Ｃは、文字候補提案の依頼対象となった文書（文書の画像データ）を特定する情報である。文字識別番号１１１Ｄは、認識対象の文書に含まれる個々の文字を特定する情報である。認識文字コード１１１Ｅは、個々の文字を外観から認識した結果得られた文字の文字コードである。

　図４は、名字記憶部のデータ構造例を示す図である。名字記憶部１１３には、名字識別子１１３Ａと、名字１１３Ｂと、文字数１１３Ｃと、出現頻度１１３Ｄと、が含まれる。名字識別子１１３Ａは、名字を他の名字から識別する情報である。名字１１３Ｂは、名字の表記情報である。文字数１１３Ｃは、名字の表記上の文字数である。出現頻度１１３Ｄは、名字の総体の中での出現頻度である。

　図５は、名前記憶部のデータ構造例を示す図である。名前記憶部１１４には、名前識別子１１４Ａと、名前１１４Ｂと、文字数１１４Ｃと、出現頻度１１４Ｄと、が含まれる。名前識別子１１４Ａは、名前を他の名前から識別する情報である。名前１１４Ｂは、名前の表記情報である。文字数１１４Ｃは、名前の表記上の文字数である。出現頻度１１４Ｄは、名前の総体の中での出現頻度である。

　図６は、類似文字記憶部のデータ構造例を示す図である。類似文字記憶部１１５には、文字コード１１５Ａと、類似文字コード１１５Ｂと、出現頻度１１５Ｃと、記憶日１１５Ｄと、が含まれる。文字コード１１５Ａは、互いに類似関係にある文字のうち基準とする文字のコードである。類似文字コード１１５Ｂは、文字コード１１５Ａで特定される文字と外観上類似する文字のコードである。出現頻度１１５Ｃは、文字の使用において類似関係として出現する頻度である。記憶日１１５Ｄは、類似関係として記憶された日を特定する情報である。

　図７は、候補文字記憶部のデータ構造例を示す図である。候補文字記憶部１１６には、文字識別番号１１６Ａと、候補文字コード１１６Ｂと、が含まれる。文字識別番号１１６Ａは、認識対象の文書に含まれる個々の文字を特定する情報である。候補文字コード１１６Ｂは、ＯＣＲで認識された文字とは異なる文字候補であって、類似し、かつ実存する文字のコードである。

　処理部１２０には、受託処理部１２１と、姓名判別処理部１２２と、照合処理部１２３と、類似文字登録処理部１２４と、候補文字送信処理部１２５と、が含まれる。

　受託処理部１２１は、業務端末２００からの文字候補の提案依頼を受託する。姓名判別処理部１２２は、複数の文字列の文字候補の提案を受けた場合に、姓名の区分位置を一文字ずつ変化させて区切った姓と名の組み合わせを特定し姓名として成立するか否か判別する。照合処理部１２３は、実存文字記憶部１１２と照合して、実存する文字候補であるか否かを判定する。類似文字登録処理部１２４は、未登録の類似関係として業務端末２００から報告された文字を、類似文字記憶部１１５に登録する。候補文字送信処理部１２５は、照合処理部１２３による照合の結果ヒットした外観が類似する文字の候補の組み合わせを候補文字として出力する。具体的には、候補文字送信処理部１２５は、候補文字記憶部１１６に格納された候補を業務端末２００に出力（送信）することで案出を実現する。通信部１３０は、ネットワーク５０を介して他の装置と通信を行う。

　業務端末２００は、記憶部２１０と、処理部２２０と、通信部２３０と、が互いにバス等で通信可能に接続される。

　記憶部２１０には、文字記憶部２１１と、候補文字記憶部２１２と、画像記憶部２１３と、が含まれる。

　図８は、文字記憶部のデータ構造例を示す図である。文字記憶部２１１には、画像データ番号２１１Ａと、読取日２１１Ｂと、文字識別番号２１１Ｃと、画像２１１Ｄと、が含まれる。

　画像データ番号２１１Ａは、読取装置３００が読み取った文字列の画像を特定する情報である。読取日２１１Ｂは、読取装置３００が文書を読み取った日を特定する情報である。文字識別番号２１１Ｃは、認識対象の文書に含まれる個々の文字を特定する情報である。画像２１１Ｄは、文字識別番号２１１Ｃで特定される文字単独の画像データ（読取装置３００が読み取った画像の一部）を特定する情報である。

　図９は、画像記憶部のデータ構造例を示す図である。画像記憶部２１３には、画像データ番号２１３Ａと、文書番号２１３Ｂと、読取日２１３Ｃと、画像２１３Ｄと、が含まれる。

　画像データ番号２１３Ａは、読取装置３００が読み取った文字列の画像を特定する情報である。文書番号２１３Ｂは、文字候補提案の依頼対象となった文書（文書の画像データ）を特定する情報である。読取日２１３Ｃは、読取装置３００が文書を読み取った日を特定する情報である。画像２１３Ｄは、読取装置３００が読み取った画像を特定する情報である。

　処理部２２０には、文字認識部２２１と、委託処理部２２２と、目視確認処理部２２３と、類似文字報告処理部２２４と、が含まれる。文字認識部２２１は、いわゆるＯＣＲのエンジンであり、読取装置３００から取得した手書文字画像を解析して文字を認識する。

　委託処理部２２２は、文字認識部２２１による誤読に起因する手戻りや手続の誤りを排除するために、文字候補提案装置１００に精度の高い候補文字の提案を委託する。

　目視確認処理部２２３は、文字候補提案装置１００から出力された文字候補のそれぞれを目視で確認できるように選択的に表示し、利用者から候補のいずれかの選択を受け付ける。

　類似文字報告処理部２２４は、利用者が類似する文字であると認識した文字の入力を受け付けて、文字候補提案装置１００に類似文字として登録するよう報告する。

　通信部２３０は、ネットワーク５０を介して他の装置と通信を行う。

　その他に、業務端末２００は、図示しないが、利用者からの入力を受け付ける入力部と、画面や帳票等の各種出力情報を出力する出力部と、を備える。例えば、入力部は、タイピングやタッチ、フリック入力等の各種の接触入力、あるいは音声入力、または視線入力等の各種の入力を受け付ける。

　図１０は、文字候補提案装置１００のハードウェア構成例を示す図である。文字候補提案装置１００は、いわゆるサーバー装置、ワークステーション、パーソナルコンピュータ、スマートフォンあるいはタブレット端末の筐体により実現されるハードウェア構成を備える。文字候補提案装置１００は、演算装置１０１と、主記憶装置１０２と、補助記憶装置１０３と、通信装置１０４と、各装置をつなぐバス１０７と、を備える。業務端末２００についても、同様である。また他に、業務端末２００は、タッチパネルやキーボード、マイク、ディスプレイ等の入出力装置を備える。

　演算装置１０１は、例えばＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などの演算装置である。

　主記憶装置１０２は、例えばＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などのメモリ装置である。

　補助記憶装置１０３は、デジタル情報を記憶可能な、いわゆるハードディスク（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）やＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）あるいはフラッシュメモリなどの不揮発性記憶装置である。

　通信装置１０４は、ネットワークカード等の有線通信装置、あるいは無線通信装置である。

　上記した文字候補提案装置１００の受託処理部１２１と、姓名判別処理部１２２と、照合処理部１２３と、類似文字登録処理部１２４と、候補文字送信処理部１２５とは、演算装置１０１に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置１０２、補助記憶装置１０３または図示しないＲＯＭ装置内に記憶され、実行にあたって主記憶装置１０２上にロードされ、演算装置１０１により実行される。

　また、文字候補提案装置１００の記憶部１１０は、主記憶装置１０２及び補助記憶装置１０３により実現される。また、通信部１３０は、通信装置１０４により実現される。以上が、文字候補提案装置１００のハードウェア構成例である。

　文字候補提案装置１００の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、１つの構成要素がさらに多くの処理を実行するように分類することもできる。

　また、各処理部（受託処理部１２１と、姓名判別処理部１２２と、照合処理部１２３と、類似文字登録処理部１２４と、候補文字送信処理部１２５）は、それぞれの機能を実現する専用のハードウェア（ＡＳＩＣ、ＧＰＵなど）により構築されてもよい。また、各処理部の処理が一つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。

　次に、本実施形態における手書文字識別システム１の動作を説明する。

　図１１は、手書文字認識の全体処理フローの例を示す図である。手書文字認識処理は、用者が業務端末２００から開始を指示することにより起動される。

　まず、業務端末２００は、読取装置３００に文書の画像データの読取を要求する（ステップＳ１０）。具体的には、文字認識部２２１は、読取装置３００にスキャンあるいは撮影の開始を指示する。

　読取装置３００は、業務端末２００からの要求を受けて、当該文書の画像を読みとり、画像データを作成して業務端末２００宛に応答する（ステップＳ１１）。

　業務端末２００の文字認識部２２１は、読取装置３００から画像データを受領し、画像記憶部２１３に記憶し、ＯＣＲエンジンにて文字認識処理を実行する（ステップＳ１２）。そして、認識した文字データを文字記憶部２１１に格納する（ステップＳ１３）。なお、このＯＣＲエンジンは、業務端末２００が接続可能なネットワーク上に置かれているＰＣ端末、サーバー端末等に実装され、業務端末２００から文字認識処理を指示することで実行する構成であってもよい。

　そして、業務端末２００では、認識した文字を委託処理部２２２が文字候補提案装置１００に対して送信し、文字候補の提案処理を委託する（ステップＳ１４）。

　そして、文字候補提案装置１００の受託処理部１２１は、業務端末２００から認識した文字を受領して受領データ記憶部１１１に格納する（ステップＳ１５）。

　そして、照合処理部１２３が、受領した文字データを、実存文字記憶部１１２と、類似文字記憶部１１５と照合する（ステップＳ１６）。

　そして、照合処理部１２３が、候補文字を選別し、候補文字記憶部１１６に格納する（ステップＳ１７）。

　そして、候補文字送信処理部１２５が、候補文字を業務端末２００あてに送信する（ステップＳ１８）。

　業務端末２００の委託処理部２２２は、候補文字を受領し、候補文字記憶部２１２に格納する（ステップＳ１９）。

　そして、目視確認処理部２２３は、候補文字と画像記憶部の画像とを対比する画面を出力する（ステップＳ２０）。より具体的には、例えば、当該画面には、読取装置３００により読み取った手書文字画像と、その候補文字が選択入力可能なように複数表示される。

　利用者から類似文字の登録指示を受け付けると、類似文字報告処理部２２４は、候補文字以外に単文字で類似する文字があれば入力を受け付け、文字候補提案装置１００へ応答する（ステップＳ２１）。

　文字候補提案装置１００の類似文字登録処理部１２４は、類似文字を受領し、類似文字記憶部１１５に未格納の場合には、格納する（ステップＳ２２）。

　以上が、手書文字認識の全体処理フローの例である。手書文字認識の全体処理によれば、類似する文字列候補をより適切に提案することができる。

　図１２は、姓名区分照合処理のフローの例を示す図である。姓名区分照合処理は、手書文字認識の全体処理フローの中のステップＳ１６～Ｓ１８の処理を一連として行う処理の例である。

　まず、姓名判別処理部１２２は、総文字数ｎを特定する（ステップＳ１６０１）。例えば、「小山田伸」の氏名が候補提示の対象となる文字列である場合には、姓名判別処理部１２２は、「小」「山」「田」「伸」の各漢字を一文字として、総文字数ｎを「４」と特定する。

　そして、姓名判別処理部１２２は、先頭からｄ（ｄは１以上ｎ未満、初期値１）文字を名字として、残りの文字を名前とするように分解する（ステップＳ１６０２）。

　照合処理部１２３は、名字を構成する文字を一字ずつ分解して類似文字記憶部１１５と照合し、類似する文字の組み合わせを名字記憶部１１３と照合して実在する名字候補を選出する（ステップＳ１６０３）。

　そして、姓名判別処理部１２２は、類似文字記憶部１１５に該当した名字候補が無かったか否か判定する（ステップＳ１６０４）。名字候補が無かった場合（ステップＳ１６０４にて「Ｙｅｓ」の場合）には、姓名判別処理部１２２は、制御を後述するステップＳ１６１１へ進める。

　名字候補があった場合（ステップＳ１６０４にて「Ｎｏ」の場合）には、姓名判別処理部１２２は、当該名字候補には名字記憶部１１３に１つでも該当するものがあったか否か判定する（ステップＳ１６０５）。名字記憶部１１３に該当するものが無かった場合（ステップＳ１６０５にて「Ｎｏ」の場合）には、姓名判別処理部１２２は、制御を後述するステップＳ１６１１へ進める。

　名字候補に名字記憶部１１３に該当する名字があった場合（ステップＳ１６０５にて「Ｙｅｓ」の場合）には、姓名判別処理部１２２は、選出した全ての名字候補を一時保管する（ステップＳ１６０６）。

　そして、照合処理部１２３は、名前を構成する文字を一字ずつ分解して類似文字記憶部１１５と照合し、類似する文字の組み合わせを名前記憶部１１４と照合して実在する名前候補を選出する（ステップＳ１６０７）。

　そして、姓名判別処理部１２２は、類似文字記憶部１１５に該当した名前候補が無かったか否か判定する（ステップＳ１６０８）。名前候補が無かった場合（ステップＳ１６０８にて「Ｙｅｓ」の場合）には、姓名判別処理部１２２は、制御を後述するステップＳ１６１１へ進める。

　名前候補があった場合（ステップＳ１６０８にて「Ｎｏ」の場合）には、姓名判別処理部１２２は、当該名前候補には名前記憶部１１４に１つでも該当するものがあったか否か判定する（ステップＳ１６０９）。名前記憶部１１４に該当するものが無かった場合（ステップＳ１６０９にて「Ｎｏ」の場合）には、姓名判別処理部１２２は、制御を後述するステップＳ１６１１へ進める。

　名前候補に名前記憶部１１４に該当する名前があった場合（ステップＳ１６０９にて「Ｙｅｓ」の場合）には、姓名判別処理部１２２は、選出した全ての名前候補を一時保管する（ステップＳ１６１０）。

　そして、姓名判別処理部１２２は、名字の文字数ｄをインクリメント（＋１）する（ステップＳ１６１１）。

　そして、姓名判別処理部１２２は、名字の文字数ｄが総文字数ｎと一致するか否か判定する（ステップＳ１６１２）。一致しない場合（ステップＳ１６１２にて「Ｎｏ」の場合）には、姓名判別処理部１２２は、制御をステップＳ１６０２に戻す。

　名字の文字数ｄが総文字数ｎと一致する場合（ステップＳ１６１２にて「Ｙｅｓ」の場合）には、姓名判別処理部１２２は、一時保管した名字候補および名前候補（名字長＋名前長が総文字数ｎと一致するもの）の組があるか否か、すなわち結果としてヒットした姓名の組み合わせがあったか否か判定する（ステップＳ１６１３）。

　一時保管した名字候補および名前候補（名字長＋名前長が総文字数ｎと一致するもの）の組がない場合（ステップＳ１６１３にて「Ｎｏ」の場合）には、候補文字送信処理部１２５は、業務端末２００に対して、判別不能を通知する（ステップＳ１６１４）。

　一時保管した名字候補および名前候補（名字長＋名前長が総文字数ｎと一致するもの）の組がある場合（ステップＳ１６１３にて「Ｙｅｓ」の場合）には、候補文字送信処理部１２５は、業務端末２００に対して、文字候補を送信する（ステップＳ１８０１）。その際、候補文字送信処理部１２５は、一時保管した名字候補および名前候補の組ごとに、出現頻度の順に応じて整列させて送信する。すなわち、候補文字送信処理部１２５は、出現頻度の高い文字から構成されている名字候補および名前候補の順に送信する。

　以上が、姓名区分照合処理のフローの例である。姓名区分照合処理によれば、一以上の文字からなる氏名について、姓名の区分位置を変えてそれぞれの類似文字を当てはめ、実存する候補を特定することができる。例えば、上記の「小山田伸」の氏名の場合、「田」と「由」が類似文字であり、二文字の名字「小山」と残り部分の名前「由伸」とする候補と、三文字の名字「小山田」と残り部分の名前「伸」とする候補と、を含む候補文字を特定できる。

　図１３は、候補文字受領処理のフローの例を示す図である。候補文字受領処理は、手書文字認識の全体処理フローの中のステップＳ１９～Ｓ２１の処理を一連として行う処理の例である。

　まず、委託処理部２２２は、受領した候補文字を候補文字記憶部２１２に記憶させる（ステップＳ１９１）。

　そして、目視確認処理部２２３は、候補文字と手書文字画像を確認表示する（ステップＳ２０１）。この確認表示の画面例については、後述する。

　そして、目視確認処理部２２３は、候補文字の選択入力を受け付ける（ステップＳ２０２）。これにより、手書文字のデジタル化を確定する。

　また、類似文字報告処理部２２４は、新しい類似文字の入力があるか否か判定する（ステップＳ２１１）。新しい類似文字の入力がない場合（ステップＳ２１１にて「Ｎｏ」の場合）には、類似文字報告処理部２２４は、候補文字受領処理を終了させる。

　新しい類似文字の入力がある場合（ステップＳ２１１にて「Ｙｅｓ」の場合）には、類似文字報告処理部２２４は、文字候補提案装置１００に対して新たな類似文字となる情報を送信する（ステップＳ２１２）。

　以上が、候補文字受領処理のフローの例である。候補文字受領処理によれば、文字候補提案装置１００から候補文字を受領して、手書文字と対比しながら候補を選択入力可能となる。また、類似文字に気づいた場合に、文字候補提案装置１００へ報告し、新たに類似文字として登録するよう依頼することができる。

　図１４は、類似文字登録処理のフローの例を示す図である。類似文字登録処理は、候補文字受領処理において類似文字となる情報が業務端末２００から文字候補提案装置１００に送信された場合に、文字候補提案装置１００にて開始される。

　まず、類似文字登録処理部１２４は、受領した類似文字の情報が、類似文字記憶部１１５に既に記憶されているか否か判定する（ステップＳ２２０１）。

　受領した類似文字の情報が、類似文字記憶部１１５に既に記憶されていない場合（ステップＳ２２０１にて「Ｎｏ」の場合）には、類似文字登録処理部１２４は、類似文字の組み合わせを一対一に特定する（類似関係にある文字を一対一の組み合わせに分解する）（ステップＳ２２０２）。

　そして、類似文字登録処理部１２４は、互いに類似する文字の両方について、それぞれ互いを類似として類似文字記憶部１１５に格納する（ステップＳ２２０３）。

　受領した類似文字の情報が、類似文字記憶部１１５に既に記憶されている場合（ステップＳ２２０１にて「Ｙｅｓ」の場合）には、類似文字登録処理部１２４は、業務端末２００に、登録済みである旨を通知する（ステップＳ２２０４）。

　そして、類似文字登録処理部１２４は、互いに類似する文字の両方について、それぞれ互いの出現頻度を所定量増加させる（ステップＳ２２０５）。

　以上が、類似文字登録処理のフローの例である。類似文字登録処理によれば、業務端末２００から登録するよう依頼のあった類似文字が新たな関係であれば類似として登録し、既に登録済みのものであった場合には出現頻度を高めることができる。

　図１５は、候補提示画面の例を示す図である。候補提示画面４００は、手書文字認識全体処理フローのステップＳ２０、候補文字受領処理のステップＳ２０１にて出力される画面である。目視確認を行う元データ（読取装置３００で読み取った手書文字画像）が、元データ表示域４０１に表示され、目視確認を行う対象である候補文字は、名字候補表示域４０２と、名前候補表示域４０３に表示される。名字候補表示域４０２と、名前候補表示域４０３には、文字候補提案装置１００が最も出現率が高い候補として提案した候補文字が表示される。名字候補決定ボタン４０４は、入力を受け付けると、名字候補表示域４０２に示された名字を確定させる。名前候補決定ボタン４０５は、入力を受け付けると、名前候補表示域４０３に示された名前を確定させる。

　次候補以降の候補文字は、各々、名字次候補表示域４０６と、名前次候補表示域４０７と、に出現頻度順に整列されて選択可能にリスト表示される。名字次候補表示域４０６と、名前次候補表示域４０７とは、リストした文字の選択を受け付ける。名字次候補決定ボタン４０８は、入力を受け付けると、名字次候補表示域４０６にて選択された名字を確定させる。名前次候補決定ボタン４０９は、入力を受け付けると、名前次候補表示域４０７にて選択された名前を確定させる。

　類似文字登録域４１０および類似文字登録域４１１は、それぞれ文字の入力を受け付ける。登録ボタン４１２は、入力を受け付けると、類似文字登録域４１０および類似文字登録域４１１に入力された文字を類似関係にある文字として受け付け、文字候補提案装置１００への登録処理を開始させる。すなわち、目視確認の結果、目視作業担当者（利用者）が新たな類似文字として登録の必要性を感じる文字がある場合、類似文字登録域４１０および類似文字登録域４１１に当該文字を入力し、登録ボタン４１２を選択することで登録が可能となる。また、必要に応じて、戻るボタン４１３、次画面ボタン４１４への入力を受け付けると、前後の業務画面へ遷移する。

　図１６は、名字候補提示例を示す図である。本実施形態を適用した手書文字識別システム１では、読取装置３００および文字認識部２２１が誤読した場合でも、提示される候補に正解となる文字が含まれる可能性が高くなるが、このことを具体的に示す。

　正解となる「川本」（a）の名字を、ＯＣＲ等の文字認識エンジンが「小木」（ｂ）と誤読した場合、誤読である「小木」（ｂ）に対して実存する名字との照合を行うと、本来の正解となる「川本」（a）の文字候補の順位が劣後、または候補漏れが生じる可能性がある。

　誤読である「小木」（ｂ）を、「小」（ｃ）と「木」（ｄ）に文字を分解し、各々を類似文字記憶部１１５と照合し、それぞれ出現頻度の高い順に類似文字を特定する（ｅ、ｆ）。続いて、出現頻度の高い文字同士を合成した名字と、名字記憶部１１３とを照合することによって、候補文字（ｇ）を選別して整列させる。これにより、誤読があった場合も、類似文字記憶部１１５との照合を実行することで、正解である「川本」（a）の劣後、または候補漏れを避けるとともに、文字認識率の向上が期待できる。

　以上が、実施形態に係る手書文字識別システムの例である。該実施形態に係る手書文字識別システムの例によれば、手書文字を読み取った画像について、類似する文字列候補をより適切に提案することができるため、利用者は提示された候補から選択するだけで円滑に手書文字の読取業務を行うことができる。

　また、上記実施形態の例では、手書文字の対象として氏名を例示したが、これに限られず、照合する実存文字記憶部１１２を差し替えることによって、住所等、あらゆる他の文字データについても適用が可能である。

　また、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品のような複数の部分に分けられて適用されるようにしてもよい。

　以上、本発明について、実施形態を中心に説明した。

１・・・手書文字識別システム、５０・・・ネットワーク、１００・・・文字候補提案装置、１１０・・・記憶部、１１１・・・受領データ記憶部、１１２・・・実存文字記憶部、１１３・・・名字記憶部、１１４・・・名前記憶部、１１５・・・類似文字記憶部、１１６・・・候補文字記憶部、１２０・・・処理部、１２１・・・受託処理部、１２２・・・姓名判別処理部、１２３・・・照合処理部、１２４・・・類似文字登録処理部、１２５・・・候補文字送信処理部、１３０・・・通信部、２００・・・業務端末、２１０・・・記憶部、２１１・・・文字記憶部、２１２・・・候補文字記憶部、２１３・・・画像記憶部、２２０・・・処理部、２２１・・・文字認識部、２２２・・・委託処理部、２２３・・・目視確認処理部、２２４・・・類似文字報告処理部、２３０・・・通信部、３００・・・読取装置。

Claims

　文字の外観の類似関係を記憶する類似文字記憶部と、
　実存する文字列を記憶する実存文字記憶部と、
　一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理部と、
　受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、
　前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理部と、
　を備えることを特徴とする文字候補提案装置。
　請求項１に記載の文字候補提案装置であって、
　前記候補文字を出力後、前記受託処理部が受信した前記文字のいずれかと類似する文字を受け付けると、前記類似文字記憶部に記憶されていない類似関係であれば前記類似文字記憶部に記憶させる類似文字登録処理部、
　を備えることを特徴とする文字候補提案装置。
　請求項１に記載の文字候補提案装置であって、
　前記実存文字記憶部には、実存する人名の文字列が格納されており、
　前記受託処理部は、案出する前記文字候補として人名の案出を受託し、
　前記候補文字送信処理部は、前記外観が類似する文字の候補の組み合わせを人名の候補文字として出力する、
　ことを特徴とする文字候補提案装置。
　請求項３に記載の文字候補提案装置であって、
　前記実存する人名の文字列は、姓と名が区分されており、
　受信した前記文字を姓と名に区分して前記照合処理部に照合させる姓名判別処理部、
　を備えることを特徴とする文字候補提案装置。
　請求項４に記載の文字候補提案装置であって、
　前記姓名判別処理部は、受信した前記文字について姓と名を区切る位置を変化させて姓と名に区分した組み合わせを特定し、各組み合わせの姓と名の両方について、前記照合処理部による照合の結果ヒットを得られた場合に前記候補文字とする、
　ことを特徴とする文字候補提案装置。
　請求項５に記載の文字候補提案装置であって、
　前記候補文字送信処理部は、前記候補文字を、出現頻度に応じて整列して出力する、
　ことを特徴とする文字候補提案装置。
　請求項１に記載の文字候補提案装置であって、
　前記受託処理部が受信する前記文字は、手書き文字を読み取って認識した文字である、
　ことを特徴とする文字候補提案装置。
　文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムであって、
　前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識部と、
　前記文字認識部により認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理部と、
　前記文字候補提案装置から出力された文字候補を表示する目視確認処理部と、を備え、
　前記文字候補提案装置は、
　文字の外観の類似関係を記憶する類似文字記憶部と、
　実存する文字列を記憶する実存文字記憶部と、
　一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理部と、
　受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、
　前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理部と、
　を備える、
　ことを特徴とする手書文字識別システム。
　文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムによる手書文字識別方法であって、
　前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識ステップと、
　前記文字認識ステップにおいて認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理ステップと、
　前記文字候補提案装置から出力された文字候補を表示する目視確認処理ステップと、を実行し、
　前記文字候補提案装置は、
　文字の外観の類似関係を記憶する類似文字記憶部と、
　実存する文字列を記憶する実存文字記憶部と、を備え、
　一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理ステップと、
　受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、
　前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理ステップと、
　を実行することを特徴とする手書文字識別方法。
　コンピュータに、手書文字の識別を支援させる処理を行わせるプログラムであって、
　前記コンピュータは、
　文字の外観の類似関係を記憶する類似文字記憶部と、
　実存する文字列を記憶する実存文字記憶部と、処理部と、を備え、
　前記処理部に、
　一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理ステップと、
　受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、
　前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理ステップと、
　を実施させることを特徴とするプログラム。