JP7112261B2

JP7112261B2 - 光学式読取装置、該光学式読取装置を用いる光学式読取方法、及びコンピュータプログラム

Info

Publication number: JP7112261B2
Application number: JP2018118910A
Authority: JP
Inventors: 郁生山田; 秀祐大木
Original assignee: Keyence Corp
Current assignee: Keyence Corp
Priority date: 2018-06-22
Filing date: 2018-06-22
Publication date: 2022-08-03
Anticipated expiration: 2038-06-22
Also published as: JP2019220080A

Description

本発明は、様々な種別の文字が不均一に混在する文字列を、高い精度で光学的に読み取ることが可能な光学式読取装置、該光学式読取装置を用いる光学式読取方法、及びコンピュータプログラムに関する。

従来、ＯＣＲ等を用いて、記載された文字を認識してデータ処理する技術が多々開発されている。文字認識技術としては、例えば照合辞書（マスターデータ）に事前に登録されている文字の画像と、撮像された画像との一致度を算出し、一致度が最も高い文字を認識文字として出力している。

ＯＣＲに用いられる文字列読取方法の１つが、直線上にある画素を利用するラインスキャンである。ラインスキャンでは、直線上の画素を順次スキャンしていくので、直線上ではなく例えば円弧上に配置された文字等を高い精度で認識することは困難となる。

一方、各文字を構成する連結要素を１つのブロブとして認識し、複数のブロブを連結することで文字列を認識するブロブスキャンもよく用いられる（特許文献１参照）。ブロブスキャンでは、円弧上に配置された文字等であっても高い精度で認識することができる。しかし、印字ブレや撮像ブレが生じた場合に起きやすい、一部が接触した接触文字等は誤認識する確率が高い。

それぞれの文字列読取方法には、一長一短がある。したがって、ユーザは、読取対象となる文字列の特徴を事前に把握しておき、文字列の特徴に応じた読取方法を選択することが好ましい。

特開２０１２－２１２２３１号公報

光学式読取装置を用いる場合、その用途は多種多様であり、読取対象となる文字列の特徴を事前に特定することは困難である。例えばハンディタイプ（携帯型）の光学式読取装置を用いる場合には、いろいろな形・種類の物に付された文字列が読取対象となることから、その文字列の大きさやレイアウトは多種多様である。このような事情に鑑み、例えば、ラインスキャン及びブロブスキャンの両方を実行し、早く結果が出た方の読取結果を出力し、両方の読取結果からユーザに選択させる等の方法も知られている。

しかし、読取時間が短い方を選択する場合、適切な読取結果が出力されているという保証がない、という問題点があった。また、読取結果の選択をユーザに任せた場合、ユーザに煩雑さを強いることになり、使い勝手の悪さにつながるという問題点も残されている。

本発明は斯かる事情に鑑みてなされたものであり、より高い精度で文字列を読み取るとともに、ユーザの使い勝手を向上させることが可能な光学式読取装置、該光学式読取装置を用いる光学式読取方法、及びコンピュータプログラムを提供することを目的とする。

上記目的を達成するために第１発明に係る光学式読取装置は、光学的に文字列を読み取る光学式読取装置において、読取対象となる文字列を撮像する撮像手段と、該撮像手段で撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字の高さ方向における画素階調の投影波形に基づき文字ごとに分離して、文字列の読取を実行する第１読取手段と、前記撮像手段で撮像された画像から文字の存在が想定される文字候補領域を複数抽出し、抽出された複数の文字候補領域を連結して、文字列の読取を実行する第２読取手段と、前記第１読取手段により抽出される前記文字列候補領域内の文字列の高さ方向の範囲を特定することにより、該文字列候補領域内の文字列が直線的に配置されている度合いに応じた第１信頼度を算出し、前記第２読取手段により抽出される前記複数の文字候補領域の均一性に基づいて、該複数の文字候補領域の連結しやすさの度合いに応じた第２信頼度を算出する信頼度算出手段と、前記信頼度算出手段により算出された前記第１信頼度及び前記第２信頼度に基づいて、いずれかの読取結果を選択する読取結果選択手段と、選択された読取結果を出力する出力手段とを備えることを特徴とする。

また、第２発明に係る光学式読取装置は、第１発明において、前記信頼度算出手段は、前記複数の文字候補領域の面積のバラツキの程度、及び／又は前記複数の文字候補領域のコントラストのバラツキの程度に基づいて、前記第２信頼度を算出することが好ましい。

また、第３発明に係る光学式読取装置は、第１又は第２発明において、前記第１読取手段と前記第２読取手段とを並行して実行させることが好ましい。

また、第４発明に係る光学式読取装置は、第１乃至第３発明のいずれか１つにおいて、前記読取結果選択手段により選択された読取結果と選択されなかった読取結果との両方を識別することが可能に表示する読取結果表示手段を備えることが好ましい。

また、第５発明に係る光学式読取装置は、第４発明において、前記読取結果表示手段に両方の読取結果が表示されている状態で、いずれかの読取結果の選択を受け付ける選択受付手段を備えることが好ましい。

次に、上記目的を達成するために第６発明に係る光学式読取方法は、光学的に文字列を読み取る光学式読取装置を用いた光学式で実行することが可能な光学式読取方法において、前記光学式読取装置は、読取対象となる文字列を撮像する第１の工程と、該第１の工程において撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字の高さ方向における画素階調の投影波形に基づき文字ごとに分離して、文字列の読取を実行する第２の工程と、前記第１の工程において撮像された画像から文字の存在が想定される文字候補領域を複数抽出し、抽出された複数の文字候補領域を連結して、文字列の読取を実行する第３の工程と、前記第１の工程において抽出される前記文字列候補領域内の文字列の高さ方向の範囲を特定することにより、該文字列候補領域内の文字列が直線的に配置されている度合いに応じた第１信頼度を算出し、前記第２の工程において抽出される前記複数の文字候補領域の均一性に基づいて、該複数の文字候補領域の連結しやすさの度合いに応じた第２信頼度を算出する第３の工程と、前該第３の工程において算出された前記第１信頼度及び前記第２信頼度に基づいて、いずれかの読取結果を選択する第４の工程と、選択された読取結果を出力する第５の工程とを含むことを特徴とする。

次に、上記目的を達成するために第７発明に係るコンピュータプログラムは、光学的に文字列を読み取る光学式読取装置で実行することが可能なコンピュータプログラムにおいて、前記光学式読取装置を、読取対象となる文字列を撮像する撮像手段、該撮像手段で撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字の高さ方向における画素階調の投影波形に基づき文字ごとに分離して、文字列の読取を実行する第１読取手段、前記撮像手段で撮像された画像から文字の存在が想定される文字候補領域を複数抽出し、抽出された複数の文字候補領域を連結して、文字列の読取を実行する第２読取手段、前記第１読取手段により抽出される前記文字列候補領域内の文字列の高さ方向の範囲を特定することにより、該文字列候補領域内の文字列が直線的に配置されている度合いに応じた第１信頼度を算出し、前記第２読取手段により抽出される前記複数の文字候補領域の均一性に基づいて、該複数の文字候補領域の連結しやすさの度合いに応じた第２信頼度を算出する信頼度算出手段、前記信頼度算出手段により算出された前記第１信頼度及び前記第２信頼度に基づいて、いずれかの読取結果を選択する読取結果選択手段、及び選択された読取結果を出力する出力手段として機能させることを特徴とする。

第１発明、第６発明及び第７発明では、読取対象となる文字列を撮像し、撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字の高さ方向における画素階調の投影波形に基づき文字ごとに分離して、文字列の読取を実行する。一方、撮像された画像から文字の存在が想定される文字候補領域を複数抽出し、抽出された複数の文字候補領域を連結して、文字列の読取を実行する。抽出される前記文字列候補領域内の文字列の高さ方向の範囲を特定することにより、該文字列候補領域内の文字列が直線状に配置された度合いに応じた第１信頼度を算出し、抽出される前記複数の文字候補領域の均一性に基づいて、該複数の文字候補領域の連結しやすさの度合いに応じた第２信頼度を算出する。算出された前記第１信頼度及び前記第２信頼度に基づいて、いずれかの読取結果を選択し、選択された読取結果を出力する。これにより、必ずしもユーザが選択することなく、文字列の種別や配置（例えば円弧配置文字、接触文字等）がどのようなものであっても、より高い精度で読取結果を出力することが可能となる。また、ユーザの使い勝手を向上させることもできる。

第２発明では、前記信頼度算出手段は、前記複数の文字候補領域の面積のバラツキの程度、及び／又は前記複数の文字候補領域のコントラストのバラツキの程度に基づいて、前記第２信頼度を算出することが好ましい。これにより、文字列の種別や配置に応じてより正確に信頼度を算出することができ、適切な読取方法で読み取られた読取結果を出力することが可能となる。

第３発明では、第１読取手段と第２読取手段とを並行して実行させることが好ましい。読取結果を得るまでの時間を短縮することができ、読取応答性が向上するからである。

第４発明では、選択された読取結果と選択されなかった読取結果との両方を識別することが可能に表示する。これにより、ユーザが、読取結果の妥当性を視覚を通じて確実に検証することができる。

第５発明では、両方の読取結果が表示されている状態でいずれかの読取結果の選択を受け付ける。これにより、ユーザの判断に合わせて読取結果を変更することができ、使い勝手が向上する。

本発明によれば、必ずしもユーザが選択することなく、より高い精度で読取結果を出力するとともに、ユーザの使い勝手を向上させることが可能となる。

本発明の実施の形態に係るハンディターミナルの外観構成を示す模式図である。本発明の実施の形態に係るハンディターミナルの、ＣＰＵ等の制御部を用いた場合の構成を示すブロック図である。本発明の実施の形態に係るハンディターミナルの文字列の認識処理手順を示すフローチャートである。本発明の実施の形態に係るハンディターミナルの機能ブロック図である。本発明の実施の形態に係るハンディターミナルの第１信頼度の第１のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第１信頼度の第２のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第１信頼度の第３のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第２信頼度の第１のパラメータの算出のための二値化処理後の画像の例示図である。本発明の実施の形態に係るハンディターミナルの第２信頼度の第２のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第２信頼度の第３のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの表示部に表示される選択受付画面の例示図である。文字列候補領域内の読取対象となる第一の文字列の例示図である。本発明の実施の形態に係るハンディターミナルの第１信頼度の第１のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第１信頼度の第２のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第１信頼度の第３のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第２信頼度の第２のパラメータの算出方法の例示図である。文字列候補領域内の読取対象となる第二の文字列の例示図である。本発明の実施の形態に係るハンディターミナルの第１信頼度の第２のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第２信頼度の第２のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルの第２信頼度の第３のパラメータの算出方法の例示図である。本発明の実施の形態に係るハンディターミナルのＣＰＵの処理手順を示すフローチャートである。

以下、本発明の実施の形態に係る光学式読取装置について、図面に基づいて具体的に説明する。本実施の形態では、光学式読取装置として、ＣＰＵを内蔵したハンディターミナルを採用する場合を例に挙げて説明する。

図１は、本発明の実施の形態に係るハンディターミナルの外観構成を示す模式図である。図１に示すように、ハンディターミナル１００は、略方形である筐体１０の外形を一方向に延長した板状である。筐体１０の先端部分又は背面部分には、読取対象であるシンボルの光学的読取を行うための読取部（図示せず：第１読取手段及び第２読取手段を兼ねている）が設けられている。読取部は、バーコードを読み取るスキャンモジュール、二次元コードを読み取るカメラモジュール等で構成される。

筐体１０の上面には、ディスプレイ部（表示部）３０と、キー配置部４０とが設けられている。筐体１０の一端側にディスプレイ部３０が、ディスプレイ部３０と反対側の他端側にキー配置部４０が、それぞれ設けられている。

筐体１０は、ディスプレイ部３０を備える表示部分ＤＡと、キー配置部４０を備える把持部分ＨＡとで構成されており、ユーザは、把持部分ＨＡを手で把持して、表示部分ＤＡに設けられたディスプレイ部３０の表示内容を参照しながら、把持部分ＨＡの表面側に配置されたキー配置部４０の各操作キー４６を操作する。筐体１０は、平面視において表示部分ＤＡを幅広とし、把持部分ＨＡを幅狭とする一方、側面視においては、把持部分ＨＡが厚くなるようにしてある。これにより、把持部分ＨＡを持ちやすくしている。

ディスプレイ部３０は、筐体１０の一面側に設けられており、読取対象のシンボルをカメラ部で撮像した画像、シンボルを復号化した情報、その他の設定情報といった各種の情報を表示する。ディスプレイ部３０は、例えば液晶ディスプレイ（ＬＣＤ）、有機ＥＬ等で構成されている。また、ディスプレイ部３０は、タッチパネルとして構成されていても良い。

キー配置部４０には、各種の操作を行うテンキーや電源キー４４、ファンクションキー４５といった複数の操作キー４６が並べられている。キー配置部４０に配置された各入力デバイスは、各種の入力操作を受け付けるキー入力部を構成している。また、ディスプレイ部３０のタッチパネルも、キー入力部として機能している。

また、ハンディターミナル１００は、携帯性を担保するべく、駆動電力を供給するためのバッテリ（図示せず）を備えている。また、撮像する位置を特定するための照準光を照射する照準光照射部、及び撮像部は、筐体１０の背面側に設けられている。

図２は、本発明の実施の形態に係るハンディターミナル１００の、ＣＰＵ等の制御部を用いた場合の構成を示すブロック図である。図２に示すように、本実施の形態に係るハンディターミナル１００は、少なくとも動作を制御する制御プログラムを実行するＣＰＵ（制御部）１０１、ＲＡＭ２０、ＲＯＭ２１、表示部（ディスプレイ部）３０、操作部（キー配置部）４０、通信インタフェース５０、撮像部６０を備えている。

ＣＰＵ１０１は、内部バス等を介してハンディターミナル１００の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、ＲＯＭ２１に記憶されているコンピュータプログラム２００に従って、種々のソフトウェア的機能を実行する。ＲＡＭ２０は、ＳＲＡＭ、ＳＤＲＡＭ等の揮発性メモリで構成され、コンピュータプログラム２００の実行時にロードモジュールが展開され、コンピュータプログラム２００の実行時に発生する一時的なデータ等を記憶する。

ＲＯＭ２１には、ファームウェア２１１、デコーダ２１２、文字認識辞書２１３も記憶されている。ファームウェア２１１は、接続されている各ハードウェアの動作を制御するドライバソフトウェア等のプログラム群である。デコーダ２１２は、例えばＱＲコード（登録商標）やバーコードをデコードする。文字認識辞書２１３は、撮像された画像を、テキストデータに変換するための辞書である。

通信インタフェース５０は内部バスに接続されており、インターネット、ＬＡＮ、ＷＡＮ等の外部のネットワーク網に接続されることにより、外部のコンピュータ等とデータ送受信を行うことが可能となっている。操作部（キー配置部）４０は、キー入力により操作のための入力を受け付ける。

撮像部６０は、カメラ６１と照準光照射部６２とで構成されている。カメラ６１は、ＶＶＤカメラ等、撮像対象を撮像できる撮像手段であれば特に限定されるものではない。また、照準光照射部６２は、撮像位置を視認できるよう撮像された画像の水平方向に延伸する直線状の光、あるいは水平方向と垂直方向の十字を形成する光等を照射する。

本実施の形態に係るハンディターミナル１００の文字列の認識処理手順は以下のとおりである。図３は、本発明の実施の形態に係るハンディターミナル１００の文字列の認識処理手順を示すフローチャートである。

図３において、本実施の形態に係るハンディターミナル１００のＣＰＵ１０１は、文字列の読取が成功したか否かを判断する（ステップＳ３０１）。「読取が成功する」とは、何らかの文字列を認識したと判定できる状態を意味する。読取が成功した後、認識した文字列をそのまま記憶する、認識した文字列にマスターデータとの照合処理を実施する等の追加処理が考えられる。ＣＰＵ１０１が、文字列の読取に失敗したと判断した場合（ステップＳ３０１：ＮＯ）、ＣＰＵ１０１は、読取に失敗した旨を通知する（ステップＳ３０２）。

ＣＰＵ１０１が、文字列の読取に成功したと判断した場合（ステップＳ３０１：ＹＥＳ）、ＣＰＵ１０１は、読取文字列のマスターデータと照合して（ステップＳ３０３）、照合に成功したか否かを判断する（ステップＳ３０４）。「照合に成功する」とは、マスターデータに一致する文字が存在することを意味する。

ＣＰＵ１０１が、照合に失敗したと判断した場合（ステップＳ３０４：ＮＯ）、ＣＰＵ１０１は、照合に失敗した旨を通知する（ステップＳ３０５）。ＣＰＵ１０１が、照合に成功したと判断した場合（ステップＳ３０４：ＹＥＳ）、ＣＰＵ１０１は、照合に成功した旨を通知する（ステップＳ３０６）。この状態で、ハンディターミナル１００による読取が正常に終了したことになる。

照合処理としては、様々なバリエーションが考えられる。例えば文字列が一致しているか否かを照合する場合、マスターデータとして文字列を記憶しておき、読み取った文字列と一致する文字列がマスターデータに存在すれば、照合に成功したと判断することができる。

また、マスターデータとして日付情報、例えば「２０１４／０２／２０」等を記憶しておき、読取文字列が日付として一致しているか否かを照合しても良い。この場合、単なる文字列としてではなく、日付情報として解釈しているので、例えば読取文字列が「１４．２．２０」であっても、日付として「２０１４／０２／２０」であると解釈するように設定しておくことで、マスターデータと一致するとして照合に成功したと判断することができる。

さらに、マスターデータとして日付情報の範囲、例えば「２０１４／０２／２０～２０１４／０３／２０」等を記憶しておき、読取文字列が、この範囲内の日付として一致しているか否かを照合しても良い。この場合、読取文字列が「１４．２．２５」であっても、日付としてはマスターデータに記憶してある範囲内であることから、照合に成功したと判断することができる。

図４は、本発明の実施の形態に係るハンディターミナル１００の機能ブロック図である。本実施の形態に係るハンディターミナル１００の撮像手段４０１は、読取対象となる文字列、あるいはＱＲコード（登録商標）、バーコード等を撮像する。

第１読取手段４０２は、撮像手段４０１で撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字ごとに分離して文字列の読取を実行する。いわゆるラインスキャンを実行することになる。

第１読取手段４０２では、ラインスキャンを実行するので、直線状に配置されている文字列については、高い精度で読み取ることができる。その一方で、直線状に配置されていない文字列については読取精度が低下する。

第２読取手段４０３は、撮像手段４０１で撮像された画像から文字列を構成する複数の文字それぞれの文字候補領域を抽出し、抽出された複数の文字候補領域を連結して文字列の読取を実行する。いわゆるブロブスキャンを実行することになる。

第２読取手段４０３では、ブロブスキャンを実行するので、文字が存在すると想定される一定の領域（ブロブ）内に存在する文字を高い精度で読み取ることができる。その一方で、文字同士が接触している等、文字認識の対象となるブロブの外接矩形サイズが適切であるか否かが判断できない場合には、読取精度が低下する。

信頼度算出手段４０４は、信頼度として、第１読取手段４０２で読み取った、文字列候補領域から文字ごとに分離した文字列の読取結果の信頼度を示す第１信頼度、及び第２読取手段４０３で読み取った、複数の文字候補領域を連結した文字列の読取結果の信頼度を示す第２信頼度を算出する。

信頼度算出手段４０４は、第１信頼度算出手段４０５及び第２信頼度算出手段４０６を備えている。第１信頼度算出手段４０５は、第１読取手段４０２における文字列候補領域の抽出しやすさの度合いに対応するパラメータである第１信頼度を算出する。

ラインスキャンに基づく第１信頼度Ｘは、以下に説明する３つのパラメータの相乗平均として算出される。図５は、本発明の実施の形態に係るハンディターミナル１００の第１信頼度Ｘの第１のパラメータＸａの算出方法の例示図である。

第１のパラメータＸａは、文字列を含む文字列候補領域の横方向の階調の投影波形に基づいて急峻に階調が立ち上がるエッジ位置を特定することにより、文字列の高さ方向の範囲の検出のしやすさを示すパラメータである。なお、以下の処理では、信頼度スコアの上限値Ｓ＿ｍａｘを１．０とし、各画素の階調の範囲を０（黒）～２５５（白）の２５６階調とする。

図５（ａ）は、文字列候補領域５１内の文字列「ＡＢＣＤＥ」を、図５（ｂ）は、文字列候補領域５１の横方向の階調の投影波形を、それぞれ示している。図５（ｂ）からもわかるように、文字列の上部境界の投影波形のエッジ強度をＥ＿ｕｐｐｅｒ、文字列の下部境界の投影波形のエッジ強度をＥ＿ｌｏｗｅｒとすると、文字列の上部境界のエッジ評価値ＳＥ＿ｕｐｐｅｒは、（式１）のように算出される。

ＳＥ＿ｕｐｐｅｒ＝ｍｉｎ（Ｅ＿ｕｐｐｅｒ／Ｅ＿ｍａｘ，Ｓ＿ｍａｘ）
・・・（式１）

なお、ｍｉｎ（Ａ，Ｂ）は、ＡとＢとの小さいほうを出力する関数であり、Ｅ＿ｍａｘはエッジ評価値が最大値１．０となる投影波形のエッジ強度（＝１００）である。

同様に、文字列の下部境界のエッジ評価値ＳＥ＿ｌｏｗｅｒは、（式２）のように算出される。

ＳＥ＿ｌｏｗｅｒ＝ｍｉｎ（Ｅ＿ｌｏｗｅｒ／Ｅ＿ｍａｘ，Ｓ＿ｍａｘ）
・・・（式２）

そして、第１のパラメータＸａは、算出した文字列の上部境界のエッジ評価値ＳＥ＿ｕｐｐｅｒと、文字列の下部境界のエッジ評価値ＳＥ＿ｌｏｗｅｒとの相乗平均として、（式３）のように算出される。

Ｘａ＝ｓｑｒｔ（２，ＳＥ＿ｕｐｐｅｒ＊ＳＥ＿ｌｏｗｅｒ）・・・（式３）

なお、（式３）において、ｓｑｒｔ（Ａ、Ｂ）は、ＢのＡ乗根を算出する関数である。

図６は、本発明の実施の形態に係るハンディターミナル１００の第１信頼度Ｘの第２のパラメータＸｂの算出方法の例示図である。第２のパラメータＸｂは、文字列を含む文字列候補領域の縦方向の階調の投影波形に基づいて急峻に階調が立ち上がるエッジ位置を特定することにより、文字間隔の均一性に基づく検出のしやすさを示すパラメータである。

図６（ａ）は、文字列候補領域５１内の文字列「ＡＢＣＤＥ」を、図６（ｂ）は、文字列候補領域５１の縦方向の階調の投影波形を、それぞれ示している。図６（ｂ）からもわかるように、文字列の文字間隔Ｗ（１）～Ｗ（４）は、それぞれ隣接する文字と文字との間隔を意味しており、図６の例では５文字であるので文字間隔は４つとなる。

そして、文字間隔の平均値Ｗ＿ｍｅａｎは、（式４）のように算出される。なお、以下の式において、ｎは２以上の整数とする。

Ｗ＿ｍｅａｎ＝｛Ｗ（１）＋Ｗ（２）＋…＋Ｗ（ｎ－１）｝／（ｎ－１）
・・・（式４）

そして、それぞれの隣接する文字の文字間隔の評価値ＳＷ（ｉ）は、（式５）のように算出することができる。なお、（式５）において、ａｂｓ（Ａ）は、Ａの絶対値を出力する関数である。

ＳＷ（ｉ）＝ｍａｘ｛Ｓ＿ｍａｘ－ａｂｓ（Ｗ（ｉ）－Ｗ＿ｍｅａｎ
／Ｗ＿ｍｅａｎ，０｝・・・（式５）

第２のパラメータＸｂは、文字間隔の評価値ＳＷ（ｉ）の相乗平均として算出すれば良い。したがって、（式６）のように算出することができる。

Ｘｂ＝ｓｑｒｔ｛ｎ－１，ＳＷ（１）＊ＳＷ（２）＊…＊ＳＷ（ｎ－１）｝
・・・（式６）

以上の処理により、文字列候補領域５１内において、文字の高さ方向の範囲、文字の左右方向の範囲を特定することができるので、文字ごとに文字候補領域として抽出することができる。図７は、本発明の実施の形態に係るハンディターミナル１００の第１信頼度Ｘの第３のパラメータＸｃの算出方法の例示図である。

図７に示すように、文字列候補領域５１内において、文字の高さ方向の範囲が決まり、文字の左右方向の範囲が決まるので、文字ごとに矩形領域を抽出することができる。抽出された矩形領域が、文字ごとの文字候補領域である。したがって、文字候補領域ごとに文字認識を実行し、認識された文字の確からしさを文字認識の評価値として第３のパラメータＸｃを算出することができる。

具体的には、認識文字ごとのモデル画像とのマッチング処理を実行し、文字候補領域ごとの文字認識の確からしさの評価値をＳＲ（ｉ）として求める。なお、評価値ＳＲ（ｉ）は０～１．０の範囲内の数値である。

そして、評価値ＳＲ（ｉ）を用いて、（式７）のように第３のパラメータＸｃを相乗平均として算出することができる。

Ｘｃ＝ｓｑｒｔ｛ｎ，ＳＲ（１）＊ＳＲ（２）＊…＊ＳＲ（ｎ）｝・・・（式７）

第１信頼度Ｘについて、第１のパラメータＸａ、第２のパラメータＸｂ、第３のパラメータＸｃが、それぞれ算出されたので、これら３つのパラメータの相乗平均として第１信頼度Ｘを算出することができる。すなわち、第１信頼度Ｘは、（式８）で算出することができる。

Ｘ＝ｓｑｒｔ（３，Ｘａ＊Ｘｂ＊Ｘｃ）・・・（式８）

次に、第２信頼度算出手段４０６は、第２読取手段４０３における文字候補領域の連結しやすさの度合いに対応するパラメータである第２信頼度を算出する。「文字候補領域の連結のしやすさ」とは、同じ文字列の正しい文字を選択可能か否かという観点からの評価指標を意味している。

文字候補領域を連結しやすい場合とは、例えば矩形領域である複数の文字候補領域それぞれのサイズが近いとき、複数の文字候補領域内のそれぞれのコントラストが近いとき、等である。また、周囲に連結対象となる文字候補領域が存在しない場合には、文字候補領域を連結しにくいと評価する。以下で述べる第２信頼度のパラメータも、上述した評価に基づいて評価値を算出している。

ブロブスキャンに基づく第２信頼度Ｙも、以下に説明する３つのパラメータの相乗平均として算出される。第１のパラメータＹａは、文字連結成分と文字の背景画像との輝度差を用いて評価値を算出する。具体的には、文字列を含む画像を二値化処理して、文字列として連結可能な連結成分を抽出する。図８は、本発明の実施の形態に係るハンディターミナル１００の第２信頼度Ｙの第１のパラメータＹａの算出のための二値化処理後の画像の例示図である。

図８に示すように、文字列候補領域５１内について二値化処理を実行することで、文字画素が連結成分として表示されている。ｉ番目の連結成分画素の階調平均と、その周辺の背景画素の階調平均との差分をＣ（ｉ）とすると、平均輝度差Ｃ＿ｍｅａｎは、（式９）のように算出することができる。

Ｃ＿ｍｅａｎ＝｛Ｃ（１）＋Ｃ（２）＋…＋Ｃ（ｎ）｝／ｎ）・・・（式９）

算出した平均輝度差Ｃ＿ｍｅａｎを用いることで、文字ごとの輝度差評価値ＳＣ（ｉ）を（式１０）のように算出することができる。

ＳＣ（ｉ）＝ｍａｘ｛Ｓ＿ｍａｘ－ａｂｓ（Ｃ（ｉ）－Ｃ＿ｍｅａｎ）
／Ｃ＿ｍｅａｎ，０｝・・・（式１０）

したがって、第１のパラメータＹａは、（式１１）によりＳＣ（ｉ）のｎ乗根として算出することができる。

Ｙａ＝ｓｑｒｔ｛ｎ，ＳＣ（１）＊ＳＣ（２）＊…＊ＳＣ（ｎ）｝・・・（式１１）

ただし、文字候補領域を特定するだけで、まだこの時点では文字候補領域を連結まではしていないので、第２のパラメータＹｂを算出する工程で文字候補領域を連結した後に第１のパラメータＹａは算出することになる。

次に、連結成分の外接矩形を求めて、幅、高さ、面積等の特徴量、代表座標等に基づいて文字候補領域を連結して文字列候補領域を構成する。第２のパラメータＹｂは、文字候補領域を連結する信頼度として、外接矩形の面積の均一性に基づいた評価値を算出する。

図９は、本発明の実施の形態に係るハンディターミナル１００の第２信頼度Ｙの第２のパラメータＹｂの算出方法の例示図である。図９に示すように、文字列候補領域５１内において、連結成分である各文字の外接矩形９１乃至９５を求める。そして、ｉ番目の外接矩形（文字候補領域）の面積をＡ（ｉ）とし、平均面積Ａ＿ｍｅａｎを（式１２）のように算出する。

Ａ＿ｍｅａｎ＝｛Ａ（１）＋Ａ（２）＋…＋Ａ（ｎ）｝／ｎ）・・・（式１２）

そして、ｉ番目の外接矩形（文字候補領域）の面積の均一性に基づく評価値ＳＡ（ｉ）を（式１３）のように算出する。

ＳＡ（ｉ）＝ｍａｘ｛Ｓ＿ｍａｘ－ａｂｓ（Ａ（ｉ）－Ａ＿ｍｅａｎ）
／Ａ＿ｍｅａｎ，０｝・・・（式１３）

したがって、第２のパラメータＹｂは、（式１４）のように算出することができる。

Ｙｂ＝ｓｑｒｔ｛ｎ，ＳＡ（１）＊ＳＡ（２）＊…＊ＳＡ（ｎ）｝・・・（式１４）

図１０は、本発明の実施の形態に係るハンディターミナル１００の第２信頼度Ｙの第３のパラメータＹｃの算出方法の例示図である。図１０に示すように、図９の文字候補領域９１乃至９５を連結することで文字列候補領域５１が形成されるので、文字列に対して文字ごとの文字認識を実行し、認識された文字の確からしさを文字認識の評価値Ｙｃとして算出することができる。

具体的には、認識文字ごとにモデル画像とのマッチング処理を実行し、文字候補領域ごとの文字認識の確からしさの評価値をＳＲ（ｉ）として求める。なお、評価値ＳＲ（ｉ）は０～１．０の範囲内の数値である。

そして、評価値ＳＲ（ｉ）を用いて、（式１５）のように第３のパラメータＹｃを相乗平均として算出することができる。

Ｙｃ＝ｓｑｒｔ｛ｎ，ＳＲ（１）＊ＳＲ（２）＊…＊ＳＲ（ｎ）｝・・・（式１５）

第２信頼度Ｙについて、第１のパラメータＹａ、第２のパラメータＹｂ、第３のパラメータＹｃが、それぞれ求まったので、相乗平均として第２信頼度Ｙを（式１６）のように算出することができる。

Ｙ＝ｓｑｒｔ（３，Ｙａ＊Ｙｂ＊Ｙｃ）・・・（式１６）

図４に戻って、読取結果選択手段４０７は、算出された第１信頼度Ｘ及び第２信頼度Ｙに基づいて、いずれかの読取結果を選択する。具体的には、上述した第１信頼度Ｘと第２信頼度Ｙとを比較して、より信頼度の高い読取結果を選択することになる。

具体的には、第１信頼度Ｘの方が第２信頼度Ｙよりも高い場合、ラインスキャンを実行した文字列の認識結果を選択し、第１信頼度Ｘの方が第２信頼度Ｙよりも低い場合、ブロブスキャンを実行した文字列の認識結果を選択する。出力手段４０８は、選択された読取結果を出力する。出力としては、表示部３０へ表示出力しても良いし、通信インタフェース５０を介してデータ通信可能に接続されている外部コンピュータへデータ出力しても良い。

また、本実施の形態に係るハンディターミナル１００は、読取結果表示手段４０９及び選択受付手段４１０を備えていても良い。読取結果表示手段４０９は、読取結果選択手段４０７により選択された読取結果と選択されなかった読取結果との両方を、互いに識別することが可能な状態で、表示部３０に表示する。

選択受付手段４１０は、読取結果表示手段４０９で両方の読取結果が表示されている状態で、いずれかの読取結果の選択を受け付ける。これにより、ユーザの判断と信頼度に基づくハンディターミナル１００の判断とが相違する場合であっても、ユーザの判断に合わせて読取結果を変更することができ、使い勝手を向上させることができる。

図１１は、本発明の実施の形態に係るハンディターミナル１００の表示部３０に表示される選択受付画面の例示図である。図１１に示すように、ラインスキャンでの読取結果及びブロブスキャンでの読取結果が、読取結果表示領域１１１に表示される。ユーザは、いずれかをカーソル操作で反転表示させる。選択文字列表示領域１１２には、反転表示されている読取結果が表示される。

ユーザが最終的に選択する文字列が、選択文字列表示領域１１２に表示されていれば、カーソル操作等で確定ボタン１１３を選択する。これにより、図１１の例では、ラインスキャンでの読取結果である文字列「ＡＢＣＤＥ」の選択を受け付ける。

上述した実施の形態に係るハンディターミナル１００での実際の動作について例示する。図１２は、文字列候補領域５１内の読取対象となる第一の文字列の例示図である。図１２に示すように、文字列「ＡＢＣＤＥ」は下弦の円弧状に配置されている。

ハンディターミナル１００の第１信頼度算出手段４０５及び第２信頼度算出手段４０６により、それぞれラインスキャンを実行した場合の第１信頼度Ｘ及びブロブスキャンを実行した場合の第２信頼度Ｙを算出し、比較する処理について以下に例示する。

図１３は、本発明の実施の形態に係るハンディターミナル１００の第１信頼度Ｘの第１のパラメータＸａの算出方法の例示図である。図１３（ａ）は、文字列候補領域５１内の文字列「ＡＢＣＤＥ」を、図１３（ｂ）は、文字列候補領域５１の横方向の階調の投影波形を、それぞれ示している。

第１のパラメータＸａは、文字列を含む文字列候補領域５１の横方向の階調の投影波形に基づいて急峻に階調が立ち上がるエッジ位置を特定することにより、文字列の高さ方向の範囲の検出のしやすさを示すパラメータであるので、階調の立ち上がりの急峻さにより信頼度が増減する。

図１３（ｂ）からもわかるように、文字列が下弦の円弧状に配置されているので、直線状に配置されているときと比べて、文字列の上部境界の投影波形のエッジ強度をＥ＿ｕｐｐｅｒ、文字列の下部境界の投影波形のエッジ強度をＥ＿ｌｏｗｅｒは、ともに文字列が直線状に配置されている場合よりは急峻さに欠ける。例えばＥ＿ｕｐｐｅｒ＝２０、Ｅ＿ｌｏｗｅｒ＝１５（Ｅ＿ｍａｘ＝１００）とすると、文字列の上部境界のエッジ評価値ＳＥ＿ｕｐｐｅｒは（式１）により‘０．２’、文字列の下部境界のエッジ評価値ＳＥ＿ｌｏｗｅｒは（式２）により‘０．１５’と算出される。

第１のパラメータＸａは、算出した文字列の上部境界のエッジ評価値ＳＥ＿ｕｐｐｅｒと、文字列の下部境界のエッジ評価値ＳＥ＿ｌｏｗｅｒとの相乗平均として、（式３）により、‘０．１７’と算出される。

図１４は、本発明の実施の形態に係るハンディターミナル１００の第１信頼度Ｘの第２のパラメータＸｂの算出方法の例示図である。図１４（ａ）は、文字列候補領域５１内の文字列「ＡＢＣＤＥ」を、図１４（ｂ）は、文字列候補領域５１の縦方向の階調の投影波形を、それぞれ示している。

第２のパラメータＸｂは、文字列を含む文字列候補領域５１の縦方向の階調の投影波形に基づいて階調が立ち上がるエッジ位置を特定することにより、文字間隔の均一性に基づく検出のしやすさを示すパラメータであるので、エッジ強度の大小により文字間隔を誤認等の可能性、すなわち信頼度が増減する。

図１４（ｂ）の例では、文字列が下弦の円弧状に配置されていることから、３番目の文字「Ｃ」のエッジ強度が小さくなる。したがって、本来であれば４つ存在するはずの文字列の文字間隔を３つと判断し、文字間隔Ｗ（１）＝５０、Ｗ（２）＝１５０、Ｗ（３）＝５０と算出されている。

算出された文字間隔Ｗ（１）～Ｗ（３）に基づいて、文字列の文字間隔の平均値Ｗ＿ｍｅａｎは、（式４）によりＷ＿ｍｅａｎ＝８３．３と算出されるので、文字間隔ごとの評価値ＳＷ（１）～ＳＷ（３）は、（式５）により算出される。すなわち、ＳＷ（１）＝０．６０、ＳＷ（２）＝０．２０、ＳＷ（３）＝０．６０と算出されるので、第２のパラメータＸｂは、文字間隔の評価値ＳＷ（１）～ＳＷ（３）の相乗平均として、（式６）により‘０．４２’と算出される。

そして、下弦の円弧状に配置されている文字列の文字ごとに文字候補領域を特定する。ただし、文字「Ｃ」については、エッジ強度が小さいため、文字候補領域を特定することができない。図１５は、本発明の実施の形態に係るハンディターミナル１００の第１信頼度Ｘの第３のパラメータＸｃの算出方法の例示図である。

図１５に示すように、文字列候補領域５１内において、文字「Ａ」、「Ｄ」、「Ｅ」については認識精度は高いものの、文字「Ｂ」については「Ｒ」に誤認する可能性が、文字「Ｃ」に至っては読み取れない可能性が高い。

認識文字ごとにモデル画像とのマッチング処理を実行し、文字候補領域ごとの文字認識の確からしさの評価値ＳＲは、ＳＲ（１）＝０．６、ＳＲ（２）＝０．９、ＳＲ（３）＝０．２、ＳＲ（４）＝０．３となり、第３のパラメータＸｃは、（式７）により‘０．４２’と算出される。

第１信頼度Ｘについて、第１のパラメータＸａ、第２のパラメータＸｂ、第３のパラメータＸｃが、それぞれ算出されたので、これら３つのパラメータの相乗平均として第１信頼度Ｘを算出することができる。すなわち、第１信頼度Ｘは、（式８）により‘０．３１’と算出される。

次に、第２信頼度Ｙを算出する。読取対象となる第一の文字列は、図１２に示す、文字列「ＡＢＣＤＥ」が下弦の円弧状に配置されている文字列である。

第２信頼度Ｙの第１のパラメータＹａは、文字連結成分と文字の背景画像との輝度差を用いて評価値を算出している。ブロブスキャンを実行するので、文字列が直線状に配置されていようが、円弧状に配置されていようが、算出結果に差はほとんどない。

すなわち、文字ごとの階調平均と、文字周辺の背景画素の階調平均との輝度差Ｃは、文字ごとにＣ（１）＝１００、Ｃ（２）＝１２０、Ｃ（３）＝１１０、Ｃ（４）＝９０、Ｃ（５）＝１１０となり、平均輝度差Ｃ＿ｍｅａｎは、（式９）により‘１０６’と算出される。

算出された平均輝度差Ｃ＿ｍｅａｎを用いることで、文字ごとの輝度差評価値ＳＣ（１）～ＳＣ（５）が（式１０）により算出される。すなわち、ＳＣ（１）＝０．９４、ＳＣ（２）＝０．８７、ＳＣ（３）＝０．９６、ＳＣ（４）＝０．８５、ＳＣ（５）＝０．９６と算出される。

第１のパラメータＹａは、（式１１）によりＳＣ（１）～ＳＣ（５）の５乗根として算出することができ、Ｙａ＝０．９２と算出される。

次に、第２のパラメータＹｂは、文字候補領域を連結する第２信頼度として、外接矩形の面積の均一性に基づいた評価値を算出するので、連結成分である文字のサイズや文字の連結方向が大きく乖離しない限り、第２のパラメータＹｂは小さくならない。

図１６は、本発明の実施の形態に係るハンディターミナル１００の第２信頼度Ｙの第２のパラメータＹｂの算出方法の例示図である。図１６に示すように、文字列候補領域５１内において、連結成分である各文字の外接矩形（文字候補領域）９１乃至９５を求める。

次に、それぞれの外接矩形９１乃至９５の面積Ａ（ｉ）を算出する。具体的には、Ａ（１）＝１０００、Ａ（２）＝８００、Ａ（３）＝９００、Ａ（４）＝９００、Ａ（５）＝８００と算出される。したがって、平均面積Ａ＿ｍｅａｎは（式１２）により算出され、平均面積Ａ＿ｍｅａｎ＝８８０と算出される。

そして、外接矩形（文字候補領域）９１乃至９５の面積の均一性に基づく評価値ＳＡ（ｉ）は、（式１３）により算出される。具体的に、ＳＡ（１）＝０．８６、ＳＡ（２）＝０．９１、ＳＡ（３）＝０．９８、ＳＡ（４）＝０．９８、ＳＡ（５）＝０．９１と算出される。

したがって、第２のパラメータＹｂは、（式１４）により算出され、第２のパラメータＹｂ＝０．９３と算出される。

また、第２信頼度Ｙの第３のパラメータＹｃについては、文字候補領域が適切に文字を囲んだ領域となっているので、第３のパラメータＹｃは小さくはならない。すなわち、文字候補領域ごとの文字認識の確からしさの評価値ＳＲ（１）～ＳＲ（５）は、すべて‘１．０’となり、相乗平均として算出される第３のパラメータＹｃ＝１．０となる。

最後に、第２信頼度Ｙについて、第１のパラメータＹａ、第２のパラメータＹｂ、第３のパラメータＹｃが、それぞれ算出されたので、これら３つのパラメータの相乗平均として第２信頼度Ｙを算出することができる。すなわち、第２信頼度Ｙは、（式１６）により‘０．９５’と算出される。

上述のように、第１信頼度Ｘ＝０．３１、第２信頼度Ｙ＝０．９５と算出されるので、第１信頼度の方が第２信頼度よりも小さくなる。したがって、第２信頼度Ｙの算出の根拠となったブロブスキャンの読取結果が選択され、表示部３０に表示される。

同様に、接触文字を読み取る場合についても例示する。図１７は、文字列候補領域内の読取対象となる第二の文字列の例示図である。図１７に示すように、文字列「ＡＢＣＤＥ」は直線状に配置されているが、文字「Ａ」、「Ｂ」、「Ｃ」が互いに接触し、少し離れて文字「Ｄ」、「Ｅ」が互いに接触している。

まず、第１信頼度Ｘの第１のパラメータＸａについては、一直線上に配置されていることから信頼度が低下する要因がない。したがって、例えばＥ＿ｕｐｐｅｒ＝１５０、Ｅ＿ｌｏｗｅｒ＝２００（Ｅ＿ｍａｘ＝１００）とすると、文字列の上部境界のエッジ評価値ＳＥ＿ｕｐｐｅｒは（式１）により‘１．０’、文字列の下部境界のエッジ評価値ＳＥ＿ｌｏｗｅｒは（式２）により‘１．０’と算出される。

第１のパラメータＸａは、算出した文字列の上部境界のエッジ評価値ＳＥ＿ｕｐｐｅｒと、文字列の下部境界のエッジ評価値ＳＥ＿ｌｏｗｅｒとの相乗平均として、（式３）により、‘１．０’と算出される。

図１８は、本発明の実施の形態に係るハンディターミナル１００の第１信頼度Ｘの第２のパラメータＸｂの算出方法の例示図である。図１８（ａ）は、文字列候補領域５１内の接触文字を含む文字列「ＡＢＣＤＥ」を、図１８（ｂ）は、文字列候補領域５１の縦方向の階調の投影波形を、それぞれ示している。

図１８（ｂ）の例では、文字列が互いに接触しているものの、エッジ強度に基づいて文字を分割することはできる。文字「Ｃ」と「Ｄ」との間のみ文字間隔が大きいだけで、文字間隔Ｗ（１）＝５０、Ｗ（２）＝５０、Ｗ（３）＝７０、Ｗ（４）＝５０と算出されている。

算出された文字間隔Ｗ（１）～Ｗ（４）に基づいて、文字列の文字間隔の平均値Ｗ＿ｍｅａｎは、（式４）によりＷ＿ｍｅａｎ＝５５と算出されるので、文字間隔ごとの評価値ＳＷ（１）～ＳＷ（４）は、（式５）により算出される。すなわち、ＳＷ（１）＝０．９１、ＳＷ（２）＝０．９１、ＳＷ（３）＝０．７３、ＳＷ（４）＝０．９１と算出されるので、第２のパラメータＸｂは、文字間隔の評価値ＳＷ（１）～ＳＷ（４）の相乗平均として、（式６）により‘０．８６’と算出される。

そして、接触文字を含む文字列の文字ごとに文字候補領域を特定する。互いに接触している部分はあるものの、文字候補領域が適切に文字を囲んだ領域となっているので、第３のパラメータＸｃは小さくはならない。すなわち、文字候補領域ごとの文字認識の確からしさの評価値ＳＲ（１）～ＳＲ（５）は、すべて‘１．０’となり、相乗平均として算出される第３のパラメータＸｃ＝１．０となる。

第１信頼度Ｘについて、第１のパラメータＸａ、第２のパラメータＸｂ、第３のパラメータＸｃが、それぞれ算出されたので、これら３つのパラメータの相乗平均として第１信頼度Ｘを算出することができる。すなわち、第１信頼度Ｘは、（式８）により‘０．９５’と算出される。

次に、第２信頼度Ｙを算出する。読取対象となる第二の文字列は、図１７に示す、文字列「ＡＢＣＤＥ」は直線状に配置されているが、文字「Ａ」、「Ｂ」、「Ｃ」が互いに接触し、少し離れて文字「Ｄ」、「Ｅ」が互いに接触している文字列である。

ただし、文字「Ａ」、「Ｂ」、「Ｃ」が互いに接触しているので、これらの文字候補領域が１つの文字候補領域として連結され、文字「Ｄ」、「Ｅ」が互いに接触しているので、これらの文字候補領域が１つの文字候補領域として連結される。したがって、連結された文字候補領域ごとの階調平均と、連結された文字候補領域周辺の背景画素の階調平均との輝度差Ｃは、連結された文字候補領域ごとにＣ（１）＝１００、Ｃ（２）＝１１０となり、平均輝度差Ｃ＿ｍｅａｎは、（式９）により‘１０５’と算出される。

算出された平均輝度差Ｃ＿ｍｅａｎを用いることで、文字ごとの輝度差評価値ＳＣ（１）、ＳＣ（２）が（式１０）により算出される。すなわち、ＳＣ（１）＝０．９５、ＳＣ（２）＝０．９５と算出される。

第１のパラメータＹａは、（式１１）によりＳＣ（１）、ＳＣ（２）の二乗根として算出することができ、Ｙａ＝０．９５と算出される。

次に、第２のパラメータＹｂは、文字候補領域を連結する第２信頼度として、外接矩形の面積の均一性に基づいた評価値を算出する。連結された文字候補領域の幅が大きく乖離しているので、第２のパラメータＹｂは小さくなる。

図１９は、本発明の実施の形態に係るハンディターミナル１００の第２信頼度Ｙの第２のパラメータＹｂの算出方法の例示図である。文字列候補領域５１内において、連結された文字候補領域の外接矩形を求める。図１９の例では２つの文字候補領域となる。

次に、それぞれの外接矩形（文字候補領域）の面積Ａ（１）、Ａ（２）を算出する。具体的には、Ａ（１）＝３０００、Ａ（２）＝１８００と算出される。したがって、平均面積Ａ＿ｍｅａｎは（式１２）により算出され、平均面積Ａ＿ｍｅａｎ＝２４００と算出される。

そして、外接矩形（文字候補領域）の面積の均一性に基づく評価値ＳＡ（１）、ＳＡ（２）は、（式１３）により算出される。具体的に、ＳＡ（１）＝０．７５、ＳＡ（２）＝０．７５と算出される。

したがって、第２のパラメータＹｂは、（式１４）により算出され、第２のパラメータＹｂ＝０．７５と算出される。

また、第２信頼度Ｙの第３のパラメータＹｃについては、文字の形状によっては読取精度が低下し小さくなる。一方、文字の形状によっては読取精度が低下しない場合もある。本実施の形態では、読取精度が低下すると仮定する。図２０は、本発明の実施の形態に係るハンディターミナル１００の第２信頼度Ｙの第３のパラメータＹｃの算出方法の例示図である。

図２０に示すように、文字列候補領域５１内において、連結された文字列「ＡＢＣ」、「ＤＥ」の認識精度は低い。認識文字ごとにモデル画像とのマッチング処理を実行し、文字候補領域ごとの文字認識の確からしさの評価値ＳＲは、ＳＲ（１）＝０．８、ＳＲ（２）＝０．８となり、相乗平均として算出される第３のパラメータＹｃは、（式１５）により‘０．８’と算出される。

最後に、第２信頼度Ｙについて、第１のパラメータＹａ、第２のパラメータＹｂ、第３のパラメータＹｃが、それぞれ算出されたので、これら３つのパラメータの相乗平均として第２信頼度Ｙを算出することができる。すなわち、第２信頼度Ｙは、（式１６）により‘０．８３’と算出される。

上述のように、第１信頼度Ｘ＝０．９５、第２信頼度Ｙ＝０．８３と算出されるので、第１信頼度の方が第２信頼度よりも大きくなる。したがって、第１信頼度Ｘの算出の根拠となったラインスキャンの読取結果が選択され、表示部３０に表示される。

図２１は、本発明の実施の形態に係るハンディターミナル１００のＣＰＵ１０１の処理手順を示すフローチャートである。ハンディターミナル１００のＣＰＵ１０１は、読取対象となる文字列、あるいはＱＲコード（登録商標）、バーコード等を撮像する（ステップＳ２１０１）。

ＣＰＵ１０１は、撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字ごとに分離して文字列の読取を実行する（ステップＳ２１０２）。いわゆるラインスキャンを実行する。

ＣＰＵ１０１は、撮像された画像から文字列を構成する文字ごとの文字候補領域を抽出し、抽出された複数の文字候補領域を連結して文字列の読取を実行する（ステップＳ２１０４）。いわゆるブロブスキャンを実行する。

ＣＰＵ１０１は、信頼度として、ラインスキャンで読み取った、文字列候補領域から文字ごとに分離した文字列の読取結果の信頼度を示す第１信頼度Ｘを算出する（ステップＳ２１０３）。同様に、ＣＰＵ１０１は、ブロブスキャンで読み取った、複数の文字候補領域を連結した文字列の読取結果の信頼度を示す第２信頼度Ｙを算出する（ステップＳ２１０５）。

ＣＰＵ１０１は、算出された第１信頼度Ｘと第２信頼度Ｙとを比較し、第１信頼度Ｘの方が第２信頼度Ｙより大きいか否かを判断する（ステップＳ２１０６）。ＣＰＵ１０１が、第１信頼度Ｘの方が第２信頼度Ｙより大きいと判断した場合（ステップＳ２１０６：ＹＥＳ）、ＣＰＵ１０１は、ラインスキャンでの読取結果を選択する（ステップＳ２１０７）。

ＣＰＵ１０１が、第１信頼度Ｘの方が第２信頼度Ｙ以下であると判断した場合（ステップＳ２１０６：ＮＯ）、ＣＰＵ１０１は、ブロブスキャンでの読取結果を選択する（ステップＳ２１０８）。ＣＰＵ１０１は、選択された読取結果を出力する（ステップＳ２１０９）。

以上のように実施の形態によれば、必ずしもユーザが選択することなく、より高い精度で読取結果を出力するとともに、ユーザの使い勝手を向上させることが可能となる。

なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。例えば上述した実施例では、第１信頼度Ｘの算出及び第２信頼度Ｙの算出を並行して実行しているが、特にこれに限定されるものではなく、第１信頼度Ｘを算出してから第２信頼度Ｙを算出しても良いし、その逆であっても良い。

また、上記実施例では、第１信頼度Ｘと第２信頼度Ｙとを単純比較する例を示しているが、本発明は特にこれに限定されるものではなく、個々のパラメータの大小に着目するようにしてもよい。例えば、上述した第１のパラメータＸａ、第２のパラメータＸｂ、第３のパラメータＸｃのいずれかが、予め定めた閾値を超えている場合には、ＣＰＵ１０１はラインスキャンでの読取結果を選択するように設定したり、上述した第１のパラメータＹａ、第２のパラメータＹｂ、第３のパラメータＹｃのいずれかが、予め定めた閾値を超えている場合には、ＣＰＵ１０１はブロブスキャンでの読取結果を選択するよう設定したりしてもよい。

他にも例えば、上述した第１のパラメータＸａ、第２のパラメータＸｂ、第３のパラメータＸｃのうち最も大きなパラメータ値と、上述した第１のパラメータＹａ、第２のパラメータＹｂ、第３のパラメータＹｃのうち最も大きなパラメータ値とを比較するようにしてもよいし、比較対象とするパラメータの優先順位を定め、優先順位の高いパラメータのパラメータ値のみを比較してもよく、種々の比較方法が考えられる。

また、上記実施例では、撮像された画像から文字列を読み取る場合について説明しているが、バーコードやＱＲコード（登録商標）などの各種コード読取装置にも適用することが可能であることは言うまでもない。

２０ＲＡＭ
２１ＲＯＭ
３０表示部（ディスプレイ部）
４０操作部（キー配置部）
６０撮像部
６１カメラ
６２照準光照射部
１００ハンディターミナル
１０１ＣＰＵ

Claims

光学的に文字列を読み取る光学式読取装置において、
読取対象となる文字列を撮像する撮像手段と、
該撮像手段で撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字の高さ方向における画素階調の投影波形に基づき文字ごとに分離して、文字列の読取を実行する第１読取手段と、
前記撮像手段で撮像された画像から文字の存在が想定される文字候補領域を複数抽出し、抽出された複数の文字候補領域を連結して、文字列の読取を実行する第２読取手段と、
前記第１読取手段により抽出される前記文字列候補領域内の文字列の高さ方向の範囲を特定することにより、該文字列候補領域内の文字列が直線的に配置されている度合いに応じた第１信頼度を算出し、前記第２読取手段により抽出される前記複数の文字候補領域の均一性に基づいて、該複数の文字候補領域の連結しやすさの度合いに応じた第２信頼度を算出する信頼度算出手段と、
前記信頼度算出手段により算出された前記第１信頼度及び前記第２信頼度に基づいて、いずれかの読取結果を選択する読取結果選択手段と、
選択された読取結果を出力する出力手段と
を備えることを特徴とする光学式読取装置。
前記信頼度算出手段は、前記複数の文字候補領域の面積のバラツキの程度、及び／又は前記複数の文字候補領域のコントラストのバラツキの程度に基づいて、前記第２信頼度を算出することを特徴とする請求項１に記載の光学式読取装置。
前記第１読取手段と前記第２読取手段とを並行して実行させることを特徴とする請求項１又は２に記載の光学式読取装置。
前記読取結果選択手段により選択された読取結果と選択されなかった読取結果との両方を識別することが可能に表示する読取結果表示手段を備えることを特徴とする請求項１乃至３のいずれか一項に記載の光学式読取装置。
前記読取結果表示手段に両方の読取結果が表示されている状態で、いずれかの読取結果の選択を受け付ける選択受付手段を備えることを特徴とする請求項４に記載の光学式読取装置。
光学的に文字列を読み取る光学式読取装置を用いた光学式で実行することが可能な光学式読取方法において、
前記光学式読取装置は、
読取対象となる文字列を撮像する第１の工程と、
該第１の工程において撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字の高さ方向における画素階調の投影波形に基づき文字ごとに分離して、文字列の読取を実行する第２の工程と、
前記第１の工程において撮像された画像から文字の存在が想定される文字候補領域を複数抽出し、抽出された複数の文字候補領域を連結して、文字列の読取を実行する第３の工程と、
前記第１の工程において抽出される前記文字列候補領域内の文字列の高さ方向の範囲を特定することにより、該文字列候補領域内の文字列が直線的に配置されている度合いに応じた第１信頼度を算出し、前記第２の工程において抽出される前記複数の文字候補領域の均一性に基づいて、該複数の文字候補領域の連結しやすさの度合いに応じた第２信頼度を算出する第３の工程と、
前該第３の工程において算出された前記第１信頼度及び前記第２信頼度に基づいて、いずれかの読取結果を選択する第４の工程と、
選択された読取結果を出力する第５の工程と
を含むことを特徴とする光学式読取方法。
光学的に文字列を読み取る光学式読取装置で実行することが可能なコンピュータプログラムにおいて、
前記光学式読取装置を、
読取対象となる文字列を撮像する撮像手段、
該撮像手段で撮像された画像から文字列候補領域を抽出し、抽出された文字列候補領域から文字の高さ方向における画素階調の投影波形に基づき文字ごとに分離して、文字列の読取を実行する第１読取手段、
前記撮像手段で撮像された画像から文字の存在が想定される文字候補領域を複数抽出し、抽出された複数の文字候補領域を連結して、文字列の読取を実行する第２読取手段、
前記第１読取手段により抽出される前記文字列候補領域内の文字列の高さ方向の範囲を特定することにより、該文字列候補領域内の文字列が直線的に配置されている度合いに応じた第１信頼度を算出し、前記第２読取手段により抽出される前記複数の文字候補領域の均一性に基づいて、該複数の文字候補領域の連結しやすさの度合いに応じた第２信頼度を算出する信頼度算出手段、
前記信頼度算出手段により算出された前記第１信頼度及び前記第２信頼度に基づいて、いずれかの読取結果を選択する読取結果選択手段、及び
選択された読取結果を出力する出力手段
として機能させることを特徴とするコンピュータプログラム。