JP5223739B2 - Portable character recognition device, character recognition program, and character recognition method - Google Patents

Portable character recognition device, character recognition program, and character recognition method Download PDF

Info

Publication number
JP5223739B2
JP5223739B2 JP2009061750A JP2009061750A JP5223739B2 JP 5223739 B2 JP5223739 B2 JP 5223739B2 JP 2009061750 A JP2009061750 A JP 2009061750A JP 2009061750 A JP2009061750 A JP 2009061750A JP 5223739 B2 JP5223739 B2 JP 5223739B2
Authority
JP
Japan
Prior art keywords
character
recognized
misidentified
information
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009061750A
Other languages
Japanese (ja)
Other versions
JP2010218041A (en
Inventor
知禎 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2009061750A priority Critical patent/JP5223739B2/en
Publication of JP2010218041A publication Critical patent/JP2010218041A/en
Application granted granted Critical
Publication of JP5223739B2 publication Critical patent/JP5223739B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Telephone Function (AREA)

Description

この発明は、例えば画像データに含まれている文字を認識するような携帯式の文字認識装置、文字認識プログラム、及び文字認識方法に関する。   The present invention relates to a portable character recognition apparatus, a character recognition program, and a character recognition method that recognize characters included in image data, for example.

従来から、名刺読取や翻訳リーダーなど様々な文字認識を利用したアプリケーションがある。
一般に、利用者はこれらのアプリケーションを利用する場合、認識したい対象の文字を画像として取得して、取得した画像の中から文字を認識する。
Conventionally, there are applications using various character recognition such as business card reading and translation readers.
In general, when using these applications, a user acquires a target character to be recognized as an image and recognizes the character from the acquired image.

より正確に文字認識を行うために、利用者は、予め対象言語を設定するとともに、画像を取得するためのライトやマクロレンズ使用の有無やズーム度合いなどのカメラ撮影モードを調整して、文字認識するために適した画像を取得するための設定をする。   In order to perform character recognition more accurately, the user sets the target language in advance and adjusts the camera shooting mode such as whether to use the light and macro lens to acquire images and the degree of zooming to recognize characters. Make settings to obtain images suitable for

ところで、一般に、利用者は、場所(位置)に応じて、おおよそ決まった目的で同じアプリケーションを使用することが多く、よって、対象言語やカメラ撮影モードについて同様の設定をすることが多いと考えられる。   By the way, in general, a user often uses the same application for a roughly determined purpose according to a place (position), and therefore, it is considered that a user often makes similar settings for a target language and a camera shooting mode. .

例えば、日本人の利用者が出張や旅行で中国に行き、レストランでメニューに何と書いてあるかを確認する際に、対象言語を中国語に設定して、例えばライトは点灯でマクロレンズを使用するカメラ撮影モードにし、認識したい文字列の大きさがアプリケーションで求められる所定の範囲内の大きさになるようにズーム度合いを調整する。   For example, when a Japanese user goes to China on a business trip or trip and checks what is written on the menu at a restaurant, the target language is set to Chinese, for example, the light is on and a macro lens is used The camera shooting mode is set, and the zoom degree is adjusted so that the size of the character string to be recognized is within a predetermined range required by the application.

繰り返し同じ場所(位置)に出張や旅行に行き、例えば「前回行ったときにおいしかったから」といった理由で同じレストランに行き、同じアプリケーションを再度使用する際、利用者は同様の設定をする必要がある。   Repeatedly go to the same place (location) for business trips and trips, for example, “I was delicious when I went last time”, the same restaurant, the user needs to make the same settings when using the same application again .

また、空港などの公共施設において、案内板に何と書いてあるかを確認する際に、利用者は対象言語を中国語に設定して、例えばライトは点灯せずマクロモードも使用しないカメラ撮影モードにし、認識したい文字列の大きさがアプリケーションで求められる所定の範囲内の大きさになるようにズーム度合いを調整する。同様に、繰り返し同じ場所(位置)に行き、同じアプリケーションを再度使用する際に、利用者は同様の設定をする必要がある。   Also, in public facilities such as airports, when checking what is written on the information board, the user sets the target language to Chinese, for example, the camera shooting mode that does not turn on the light and does not use the macro mode Then, the zoom degree is adjusted so that the size of the character string to be recognized is within a predetermined range required by the application. Similarly, when the user repeatedly goes to the same place (position) and uses the same application again, the user needs to make the same setting.

上述したように、一般に、利用者は、対象言語やカメラ撮影モードについて、場所(位置)に応じておおよそ決まった設定をすることが多いと考えられるが、利用者は、アプリケーションを使用しようとするたびに、同様の面倒な手間をかけて同じ設定をする必要があった。   As described above, in general, it is considered that the user often sets the target language and the camera shooting mode roughly according to the location (position), but the user intends to use the application. Each time, it was necessary to make the same setting with the same troublesome work.

そのような状況において、GPS装置を用いて現在位置を取得し、位置情報に基づいて文字認識に関する設定を行う装置が提案されている(特許文献1、2参照)。   In such a situation, there has been proposed an apparatus that acquires a current position using a GPS device and performs settings related to character recognition based on position information (see Patent Documents 1 and 2).

特許文献1の携帯端末は、アプリケーションへの文字入力のための文字認識において、GPS装置を用いて現在位置を取得し、現在位置から読み取る文字の文字種を設定する装置である。この装置は、GPS装置で取得された現在位置に基づいて文字種が自動的に設定されるため、利用者による操作を軽減することができる。   The portable terminal of Patent Literature 1 is a device that acquires a current position using a GPS device and sets the character type of a character to be read from the current position in character recognition for character input to an application. In this device, since the character type is automatically set based on the current position acquired by the GPS device, the operation by the user can be reduced.

特許文献2の翻訳装置は、GPS装置を用いて現在位置を取得し、現在位置で使用されている文字種を文字認識において優先させる装置である。この装置は、GPS装置で取得された現在位置に基づいて特定された文字種が優先的に認識しやすくなるため、認識精度を向上させることができる。   The translation device of Patent Document 2 is a device that acquires a current position using a GPS device and prioritizes character types used at the current position in character recognition. This device can improve the recognition accuracy because the character type specified based on the current position acquired by the GPS device is easily recognized preferentially.

これらの装置は、取得した画像から文字認識処理する際のソフトウェア上の設定をおこなうものであり、明確に取得された画像に対しては効果的に文字認識を処理することができる。   These apparatuses perform settings on software when character recognition processing is performed from an acquired image, and can effectively perform character recognition on an image that has been clearly acquired.

しかしながら、これらの装置は明確な画像を取得するためのライトやマクロレンズ使用の有無やズーム度合いなどのカメラ撮影モード、いわゆる、ハードウェア上の設定に関する手間が全く軽減されない。   However, these devices do not reduce the trouble associated with camera shooting modes such as the presence / absence of the use of lights and macro lenses and the degree of zoom, so-called hardware settings, for obtaining a clear image.

また、このハードウェア上の設定は、認識精度にも大きく影響を与えるものである。このため上述の装置は、例えば、同じ場所(位置)で以前使用した際にはマクロレンズを使用する設定にしていたにもかかわらず、その設定をしなかったために、以前は良く認識できていたものが認識できなくなってしまったりするという問題があった。   In addition, the setting on the hardware greatly affects the recognition accuracy. For this reason, for example, the above-mentioned device was recognized well before because it was not set even though it was set to use a macro lens when used in the same place (position) before. There was a problem that things could not be recognized.

このように文字認識処理は、取得された画像の精度に大きく影響を受ける。このため、取得画像に大きな影響を与えるカメラ撮影モードなどのハードウェア上の設定は重要である。そして、上述の装置は利用者にとって面倒な設定作業を要していた。   Thus, the character recognition process is greatly affected by the accuracy of the acquired image. For this reason, settings on hardware such as a camera shooting mode that greatly affects an acquired image are important. In addition, the above-described apparatus requires troublesome setting work for the user.

特開2005−141520号公報JP 2005-141520 A 特開2006−302091号公報JP 2006-302091 A

この発明は、上述した問題に鑑み、手軽な操作で正確な文字認識を実現する携帯式文字認識装置、文字認識プログラム、及び文字認識方法を提供し、利用者の満足度を向上させることを目的としている。   SUMMARY OF THE INVENTION In view of the above-described problems, the present invention provides a portable character recognition device, a character recognition program, and a character recognition method that realize accurate character recognition with a simple operation, and aims to improve user satisfaction. It is said.

この発明は、文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、画像データを取得し、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、位置情報を取得する位置情報取得手段とを備えた携帯式文字認識装置であって、前記文字認識手段が画像取得して文字認識する際に設定された設定条件情報と、前記文字認識手段によって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶手段と、前記文字認識手段によって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認手段と、前記関連情報記憶手段に記憶された位置で前記文字認識手段が文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して前記文字認識手段に設定する条件設定手段とを備え、取得した前記画像データから前記文字認識手段によって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付け、変更文字に変更する認識文字変更手段と、前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として前記位置情報と関連づけて記憶する誤認文字変更情報記憶手段とを備え、前記記憶位置確認手段によって確認され、前記関連情報記憶手段に記憶された位置で前記文字認識手段が認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認手段と、該誤認文字確認手段によって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正手段を備えたことを特徴とする。 The present invention obtains matching data storage means for storing matching data for character recognition, character recognition means for acquiring image data and recognizing characters in the image data based on the matching data, and position information. A portable character recognition device comprising position information acquisition means, wherein the character recognition means sets image information obtained when an image is acquired and character recognition, and the position of the character recognized by the character recognition means Related information storage means for storing position information in association with each other, storage position confirmation means for confirming whether or not the position for character recognition by the character recognition means is stored in the related information storage means, and stored in the related information storage means When the character recognizing means recognizes a character at a certain position, the setting condition information associated with the position information is read out to recognize the character And a condition setting means for setting the stage, accepting a change operation to change from the acquired image data to the character correct character recognition in which was false character erroneously in recognized character recognized by the recognition means, changing the change character Recognizing character changing means, misidentified character information, and changed character information that has been changed, and misidentified character change information storage means for storing the character information in association with the position information as misidentified character change information. Misidentified character confirmation means for confirming whether the recognized character recognized by the character recognition means at the position stored in the related information storage means is stored as misidentified character information in the misidentified character change information storage means; It has been confirmed by the character confirmation means that the recognized character matches the misidentified character stored in the misidentified character change information storage means. The case, characterized by comprising a character correction means for correcting the change characters on the basis of the mistaken character modification information.

前記マッチングデータは、文字の特徴を示す特徴データで構成するなど、文字認識のマッチングに用いるデータで構成することができる。
前記記憶手段は、ハードディスクや不揮発性メモリなど、データを記憶する手段で構成することができる。
The matching data may be constituted by data used for character recognition matching, such as feature data indicating character characteristics.
The storage means can be constituted by means for storing data, such as a hard disk or a nonvolatile memory.

前記画像データは、カラー画像やグレースケール画像やモノクロ2階調画像など、適宜の画像のデータとすることができる。
前記位置情報を取得する位置情報取得手段は、GPS装置や、定点からの無線通信を受信して位置を特定する装置等ができる。
The image data may be appropriate image data such as a color image, a gray scale image, or a monochrome two-tone image.
The position information acquisition means for acquiring the position information can be a GPS device, a device that receives wireless communication from a fixed point, and specifies a position.

前記文字認識手段は、例えば、CCDカメラやCMOSカメラなどの撮像手段、あるいは、このような撮像手段で撮像した画像のデータを該撮像手段から受信するUSB(Universal Serial Bus)やLAN(Local Area Network)などの通信インターフェースを介して取得された文字画像から特徴データを抽出し、特徴データをマッチングデータの特徴データとマッチングし、どの文字かを認識する手段とすることができる。   The character recognition means is, for example, an image pickup means such as a CCD camera or a CMOS camera, or a USB (Universal Serial Bus) or LAN (Local Area Network) that receives image data taken by such an image pickup means from the image pickup means. The feature data is extracted from the character image acquired through the communication interface such as), and the feature data is matched with the feature data of the matching data to recognize which character.

前記設定条件情報は、前記文字認識手段が画像取得して文字認識する際に設定する設定条件であり、認識する文字の文字種等のソフトウェア上の設定条件、画像を取得するための撮像手段に関し、ライトやマクロレンズ使用の有無やズーム度合いなどのカメラ撮影モード、いわゆる、ハードウェア上の設定条件とで構成することができる。   The setting condition information is a setting condition that is set when the character recognition unit acquires an image and recognizes a character, and relates to a setting condition on software such as a character type of a character to be recognized, and an imaging unit for acquiring an image. It can be configured with camera shooting modes such as whether or not a light or macro lens is used and the zoom level, so-called hardware setting conditions.

前記携帯式文字認識装置は、撮像手段と制御手段と記憶手段とを備えた携帯電話機やPDA(Personal Digital Assistants)やノート型のパーソナルコンピュータなどの情報処理端末で構成するなど、適宜の装置で構成することができる。   The portable character recognition device is constituted by an appropriate device such as a cellular phone provided with an imaging means, a control means, and a storage means, or an information processing terminal such as a PDA (Personal Digital Assistants) or a notebook personal computer. can do.

前記認識文字は、文字認識手段によって撮像した画像データ中の文字画像から認識した文字であり、例えばひらがな、カタカナ、漢字、またはこれらの複数など、予め定めた適宜の文字とすることができる。The recognized character is a character recognized from a character image in the image data captured by the character recognition means, and may be a predetermined appropriate character such as hiragana, katakana, kanji, or a plurality of these.

前記誤認文字は、文字認識手段によって撮像した画像データ中の文字画像から認識した認識文字のうち誤認識した文字であり、前記変更文字は、誤認文字を正しく変更した文字である。The misidentified character is a character misrecognized among the recognized characters recognized from the character image in the image data captured by the character recognizing means, and the changed character is a character obtained by correctly changing the misidentified character.

この発明により、画像データに対して手軽な操作で正確な文字認識を実現することができ、利用者の満足度を向上させることができる。   According to the present invention, accurate character recognition can be realized with a simple operation on image data, and user satisfaction can be improved.

詳しくは、文字認識した際に設定した設定条件情報を位置情報取得手段で取得した位置情報と関連付けて記憶しているため、再度、同じ場所(位置)で文字認識する際に、同じ設定条件を読み出して設定できる。したがって、手間を掛けて同じ条件を設定せずとも、前回と同条件で文字認識を実施することができる。   Specifically, since the setting condition information set at the time of character recognition is stored in association with the position information acquired by the position information acquisition means, the same setting condition is set again when character recognition is performed again at the same location (position). Can be set by reading. Therefore, character recognition can be performed under the same conditions as the previous time without setting the same conditions.

なお、位置情報取得手段によって取得した位置情報に基づいて判定される同じ場所(位置)は、所定の範囲であれば同じ場所(位置)と判定する概念とすることができ、また所定の範囲については任意で設定する構成であってもよい。   Note that the same location (position) determined based on the location information acquired by the location information acquisition means can be determined to be the same location (position) within a predetermined range. May be set arbitrarily.

また、以前に誤認文字を変更文字に変更した場所(位置)において、誤認文字と同じ文字を認識した場合に、認識した文字を変更文字に補正することができる。したがって、再度、同じ場所(位置)で誤認文字と同じ文字を認識した場合に、変更操作することなく変更後の正しい文字に補正することができ、利用者の利便性が向上する。 Further , when the same character as the misidentified character is recognized at a location (position) where the misidentified character has been changed to the changed character before, the recognized character can be corrected to the changed character. Therefore, when the same character as the misidentified character is recognized again at the same place (position), it can be corrected to the correct character after the change without performing a change operation, and the convenience for the user is improved.

また、この発明の態様として、前記文字補正手段を、前記文字認識手段が認識する認識文字の前記誤認文字に対するマッチング信頼度が第1の所定範囲にあり、かつ、前記変更文字に対するマッチング信頼度が第2の所定範囲にある場合に、前記文字認識手段が認識した認識文字を前記変更文字に補正する構成とすることができる。   Further, as an aspect of the present invention, the character correction unit has a matching reliability with respect to the misidentified character of the recognized character recognized by the character recognition unit within a first predetermined range, and a matching reliability with respect to the changed character. In the second predetermined range, the recognized character recognized by the character recognition means can be corrected to the changed character.

これにより、誤認文字と同じ文字を認識した場合に、正しく変更文字に補正する補正の精度を向上し、正確な文字認識を実行することができる。
詳しくは、以前に誤認文字を変更文字に変更した場所(位置)において、誤認文字と近似するとして判定できる文字である、前記誤認文字に対するマッチング信頼度が第1の所定範囲にある文字を認識した場合であって、認識文字が変更文字と近似するとして判定できる文字である、前記変更文字に対するマッチング信頼度が第2の所定範囲にある文字を認識した場合において、認識文字を変更文字に補正する。
Thereby, when the same character as a misidentified character is recognized, the accuracy of the correction for correcting the character correctly is improved, and accurate character recognition can be executed.
Specifically, at a place (position) where a misidentified character has been changed to a changed character previously, a character whose matching reliability for the misidentified character is within the first predetermined range, which is a character that can be determined to be approximate to the misidentified character, is recognized. In the case where a recognized character is a character that can be determined to be approximate to the changed character, and a character whose matching reliability for the changed character is within the second predetermined range is recognized, the recognized character is corrected to the changed character. .

したがって、以前に一旦誤認されたが正しく変更された認識文字と同様に、誤認文字と変更文字の両方にある程度近似する認識文字を補正することができ、誤認文字と変更文字のいずれかにのみ近似する認識文字を補正する場合と比較して、認識文字を正確に変更文字に補正することができ、文字の認識精度を向上することができる。   Therefore, it is possible to correct a recognized character that approximates to some extent both a misidentified character and a modified character, as well as a recognized character that has been previously misidentified but changed correctly, and only approximates either the misidentified character or the modified character. Compared with the case where the recognized character to be corrected is corrected, the recognized character can be accurately corrected to the changed character, and the character recognition accuracy can be improved.

また、この発明の態様として、前記認識文字変更手段によって前記誤認文字を前記変更文字に変更した際の前記文字認識手段が認識した認識文字の前記誤認文字に対する第1マッチング信頼度と、前記変更文字に対する第2マッチング信頼度とを記憶するマッチング信頼度記憶手段を備え、前記第1の所定範囲を、前記第1マッチング信頼度を中心とする所定範囲に設定し、前記第2の所定範囲を、前記第2マッチング信頼度を中心とする所定範囲に設定することができる。   Further, as an aspect of the present invention, a first matching reliability of the recognized character recognized by the character recognition unit when the recognized character is changed to the changed character by the recognized character changing unit, and the changed character Matching reliability storage means for storing a second matching reliability for the first matching range, the first predetermined range is set to a predetermined range centered on the first matching reliability, and the second predetermined range is The second matching reliability can be set within a predetermined range.

これにより、誤認文字と同じ文字を認識した場合に、正しく変更文字に補正する補正の精度をより向上し、より正確な文字認識を実行することができる。
詳しくは、以前に認識した認識文字と誤認文字とのマッチング信頼度、及び認識文字と変更文字とのマッチング信頼度に基づいて所定の範囲を設定できるため、一旦誤認されたが正しく変更された誤認文字の変更実績に基づく認識文字の補正を実現することができる。
As a result, when the same character as the misidentified character is recognized, the accuracy of correction to correct the changed character correctly can be further improved, and more accurate character recognition can be performed.
Specifically, since a predetermined range can be set based on the matching reliability between the previously recognized recognized character and the misidentified character, and the matching reliability between the recognized character and the changed character, the misidentification that was once misidentified but correctly changed Correction of the recognized character based on the character change record can be realized.

また、この発明の態様として、前記位置取得手段を、GPS装置で構成することができる。
これにより、正確な位置情報を、広範囲にわたって取得できる。したがって、例えば海外で文字認識する場合であっても、正確に位置を把握して文字認識できるため、利用者の利便性をさらに向上することができる。
As an aspect of the present invention, the position acquisition means can be configured by a GPS device.
Thereby, accurate position information can be acquired over a wide range. Therefore, for example, even when characters are recognized overseas, it is possible to accurately recognize the position and recognize the characters, thereby further improving the convenience for the user.

またこの発明は、文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、画像データを取得して、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、位置情報を取得する位置情報取得手段とを備えた携帯端末に実行させる文字認識プログラムであって、前記文字認識手段が、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップにおいて、画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて関連情報記憶手段に記憶する関連情報記憶ステップと、前記文字認識ステップによって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認ステップと、前記関連情報記憶手段に記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを携帯端末に実行させ、取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを携帯端末に実行させるとともに、前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認ステップと、該誤認文字確認ステップによって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを携帯端末に実行させることを特徴とする。 Further, the present invention provides a matching data storage means for storing matching data for character recognition, a character recognition means for acquiring image data and recognizing characters in the image data based on the matching data, and position information. A character recognition program to be executed by a portable terminal comprising position information acquisition means for acquiring, wherein the character recognition means recognizes characters in the image data based on the matching data, and image acquisition is performed. The related information storage step for storing the setting condition information set when the character is recognized and the position information of the position recognized by the character recognition step in the related information storage means, and the character recognition step. A storage position confirmation step for confirming whether a character recognition position is stored in the related information storage means. And flop, when character recognition with the related information stored in the storage means position, to execute a condition setting step of setting the same condition by reading the setting condition information associated with the positional information to the mobile terminal, A change operation accepting step for accepting a change operation for changing a misrecognized character that was erroneously recognized in the recognized character recognized by the character recognizing step from the acquired image data to a correct character, and changing the misrecognized character based on the accepted change operation Recognized character change information storage step of storing in the recognized character change information storage means in association with the position information as misidentified character change information as the recognized character change step, the recognized character change step to change to characters, and the changed character information changed To the mobile terminal, and at the position confirmed in the storage position confirmation step The step of confirming whether or not the recognized character is stored as the misidentified character information in the misidentified character change information storage means, and the recognized character is stored in the misidentified character change information storage means by the misidentified character confirmation step. When it is confirmed that the character matches the misidentified character, the portable terminal is caused to execute a character correction step for correcting the character to be changed based on the misidentified character change information .

前記文字認識プログラムは、メモリ、チップ、またはハードディスクなど、適宜の記憶媒体に記憶することができる。   The character recognition program can be stored in an appropriate storage medium such as a memory, a chip, or a hard disk.

この発明により、携帯端末に文字認識プログラムをインストールすれば、画像データに対して手軽な操作で、正確な文字認識を実現することができる。   According to the present invention, if a character recognition program is installed in a portable terminal, accurate character recognition can be realized with a simple operation on image data.

詳しくは、文字認識した際に設定した設定条件情報を位置情報取得手段で取得した位置情報と関連付けて記憶しているため、再度、同じ場所(位置)において、文字認識プログラムをインストールした携帯端末で文字認識する際に、同じ設定条件を読み出して設定できる。したがって、手間を掛けて同じ条件を設定せずとも、前回と同条件で文字認識を実施することができる。   Specifically, since the setting condition information set at the time of character recognition is stored in association with the position information acquired by the position information acquisition means, the mobile terminal installed with the character recognition program is again installed at the same location (position). When recognizing characters, the same setting conditions can be read and set. Therefore, character recognition can be performed under the same conditions as the previous time without setting the same conditions.

また、以前に誤認文字を変更文字に変更した場所(位置)において、携帯端末で誤認文字と同じ文字を再度認識した場合に、認識した文字を変更文字に補正することができる。したがって、再度、同じ場所(位置)で誤認文字と同じ文字を認識した場合に、変更操作することなく変更後の正しい文字に補正することができ、利用者の利便性が向上する。 In addition , when the same character as the misidentified character is re-recognized by the mobile terminal at the location (position) where the misidentified character is changed to the changed character before, the recognized character can be corrected to the changed character. Therefore, when the same character as the misidentified character is recognized again at the same place (position), it can be corrected to the correct character after the change without performing a change operation, and the convenience for the user is improved.

また、この発明は、画像データを取得して、マッチングデータ記憶手段に記憶された文字認識用のマッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップと、位置情報を取得する位置情報取得ステップとを実行する文字認識方法であって、前記文字認識ステップにおいて、画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶ステップと、前記文字認識ステップによって文字認識する位置が記憶されているか確認する記憶位置確認ステップと、記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを実行し、取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを実行するとともに、前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が誤認文字情報として記憶されているか確認する誤認文字確認ステップと、該誤認文字確認ステップによって前記認識文字が記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを実行することを特徴とする。 The present invention also provides a character recognition step for acquiring image data and recognizing characters in the image data based on matching data for character recognition stored in the matching data storage means, and a position for acquiring position information. A character recognition method for executing an information acquisition step, wherein the character recognition step includes setting condition information set when an image is acquired and the character is recognized, and the position information of the position where the character is recognized by the character recognition step. Associated information storage step, a storage position confirmation step for confirming whether or not a character recognition position is stored in the character recognition step, and a character recognition at the stored position. wherein the running and condition setting step, and acquisition by reading the setting condition information which is set to the same conditions A change operation accepting step for accepting a change operation for changing a misrecognized character, which was erroneously recognized in the recognized character recognized by the character recognition step from the image data, to a correct character, and changing the misidentified character to a changed character based on the accepted change operation. A recognized character changing step, and a misidentified character change information storage step of storing the misidentified character information and the changed changed character information as misidentified character change information in association with the position information in the misidentified character change information storage means. And a step of confirming whether the recognized character recognized at the position confirmed in the storage position confirmation step is stored as misidentified character information, and the recognized character stored in the misidentified character confirmation step. When it is confirmed that it matches the misidentified character, it is based on the misidentified character change information. And executes the character correction step of correcting the change characters Te.

これにより、画像データに対して手軽な操作で正確な文字認識を実行することができる。   Thus, accurate character recognition can be performed on the image data with a simple operation.

詳しくは、文字認識した際に設定した設定条件情報を位置情報と関連付けて記憶しているため、再度、同じ場所(位置)において、文字認識する際に、同じ設定条件を読み出して設定できる。したがって、手間を掛けて同じ条件を設定せずとも、前回と同条件で文字認識を実施することができる。   Specifically, since the setting condition information set at the time of character recognition is stored in association with the position information, the same setting condition can be read and set again at the same place (position) when the character is recognized. Therefore, character recognition can be performed under the same conditions as the previous time without setting the same conditions.

また、以前に誤認文字を変更文字に変更した場所(位置)において、誤認文字と同じ文字を認識した場合に、認識した文字を変更文字に補正することができる。したがって、再度、同じ場所(位置)で誤認文字と同じ文字を認識した場合に、変更操作することなく変更後の正しい文字に補正することができ、利用者の利便性が向上する。 Further , when the same character as the misidentified character is recognized at a location (position) where the misidentified character has been changed to the changed character before, the recognized character can be corrected to the changed character. Therefore, when the same character as the misidentified character is recognized again at the same place (position), it can be corrected to the correct character after the change without performing a change operation, and the convenience for the user is improved.

この発明により、手軽な操作で正確な文字認識を実現する携帯式文字認識装置、文字認識プログラム、及び文字認識方法を提供し、利用者の満足度を向上させることができる。   According to the present invention, a portable character recognition device, a character recognition program, and a character recognition method that realize accurate character recognition with a simple operation can be provided, and the satisfaction of the user can be improved.

携帯端末の斜視図。The perspective view of a portable terminal. 携帯端末の構成を示すブロック図。The block diagram which shows the structure of a portable terminal. 辞書データ及び関連情報記憶データの構成を説明する説明図。Explanatory drawing explaining the structure of dictionary data and related information storage data. 文字認識プログラムによる文字認識処理のフローチャート。The flowchart of the character recognition process by a character recognition program. 文字認識に関する設定画面や認識文字の説明図。Explanatory drawing of the setting screen about character recognition and a recognition character.

この発明の一実施形態を以下図面と共に説明する。   An embodiment of the present invention will be described below with reference to the drawings.

図1は、携帯端末1の斜視図を示し、図2は、携帯端末1の構成のブロック図を示し、図3は辞書データ及び関連情報記憶データの構成を説明する説明図を示す。   FIG. 1 is a perspective view of the mobile terminal 1, FIG. 2 is a block diagram of the configuration of the mobile terminal 1, and FIG. 3 is an explanatory diagram for explaining the configuration of dictionary data and related information storage data.

携帯端末1は、図1,図2に示すように、画像入力部3、操作部5、画面表示部7及びGPS部9が設けられている。画像入力部3は、画像を撮像するデジタルカメラであり、操作部5は、押下操作されるボタンであり、画面表示部7は、画像を表示する液晶ディスプレイあるいは有機ELディスプレイである。   As shown in FIGS. 1 and 2, the mobile terminal 1 includes an image input unit 3, an operation unit 5, a screen display unit 7, and a GPS unit 9. The image input unit 3 is a digital camera that captures an image, the operation unit 5 is a button that is pressed, and the screen display unit 7 is a liquid crystal display or an organic EL display that displays an image.

図2に示すように、携帯端末1は、画像入力部3、操作部5、画面表示部7及びGPS部9に加えて、CPU11、ROM12、及びRAM13が、バス16に接続して設けられている。   As shown in FIG. 2, the mobile terminal 1 includes a CPU 11, a ROM 12, and a RAM 13 connected to a bus 16 in addition to an image input unit 3, an operation unit 5, a screen display unit 7, and a GPS unit 9. Yes.

画像入力部3は、CCDカメラまたはCMOSカメラなどのデジタルカメラであり、バス16に接続されている。画像入力部3が撮像して得た撮像画像は、デジタル画像データとしてCPU11に送信される。なお、画像入力部3は、CPU11から撮像信号を受けて撮像を開始する。
操作部5は、バス16に接続されている。この操作部5は、利用者に押下操作された押下信号を、バス16を介してCPU11に送信する。
The image input unit 3 is a digital camera such as a CCD camera or a CMOS camera, and is connected to the bus 16. A captured image obtained by the image input unit 3 is transmitted to the CPU 11 as digital image data. Note that the image input unit 3 receives an imaging signal from the CPU 11 and starts imaging.
The operation unit 5 is connected to the bus 16. The operation unit 5 transmits a pressing signal pressed by the user to the CPU 11 via the bus 16.

画面表示部7はバス16に接続されており、CPU11から画像データが送られてくると、この画像データの画像を言語設定画面7a、カメラ撮影モード設定画面7bあるいは誤認文字変更画面7cのように表示する。
GPS部9は、図示省略する3以上のGPS衛星からの電波信号を受信し、受信した複数の電波信号に基づいて携帯端末1の位置を算出することができる。
The screen display unit 7 is connected to the bus 16, and when image data is sent from the CPU 11, an image of the image data is displayed as a language setting screen 7a, a camera shooting mode setting screen 7b, or a misidentified character change screen 7c. indicate.
The GPS unit 9 can receive radio signals from three or more GPS satellites (not shown), and can calculate the position of the mobile terminal 1 based on the received radio signals.

CPU11は、ROM12に記憶されたプログラムに従ってRAM13を一時記憶領域に使用して各種動作を行うプロセッサであり、各部を制御する制御機能21と、文字認識機能22を有している。   The CPU 11 is a processor that performs various operations using the RAM 13 as a temporary storage area in accordance with a program stored in the ROM 12, and has a control function 21 that controls each unit and a character recognition function 22.

この文字認識機能22は、文字列抽出処理部31、文字抽出処理部32、文字認識処理部33、認識信頼度判定処理部34、及び認識結果補正処理部35を有している。   The character recognition function 22 includes a character string extraction processing unit 31, a character extraction processing unit 32, a character recognition processing unit 33, a recognition reliability determination processing unit 34, and a recognition result correction processing unit 35.

文字列抽出処理部31は、画像データから文字列を抽出する処理を実行する。この文字列の抽出は、例えば画像データを2値化して射影データを取得し、この射影データから文字列と余白を区別する等、適宜の方法により実行する。具体的には、文字画像に対して画素行別の黒画素数から上下方向のヒストグラムを算出し、所定数以上の黒画素の行が連続している範囲を文字列とするなど適宜の方法により実行する。   The character string extraction processing unit 31 executes processing for extracting a character string from image data. The extraction of the character string is executed by an appropriate method such as binarizing the image data to obtain projection data and distinguishing the character string and the margin from the projection data. Specifically, a vertical histogram is calculated from the number of black pixels for each pixel row for a character image, and a range in which a predetermined number or more of black pixel rows are continuous is used as a character string. Run.

文字抽出処理部32は、前記文字列から文字を抽出する処理を実行する。例えば、この文字の抽出は、横書き文字に対して画素列別の黒画素数から左右方向のヒストグラムを算出し、所定数以上の黒画素が連続している範囲を1文字とする、あるいは縦書き文字に対して画素行別の黒画素数から上下方向のヒストグラムを算出し、所定数以上の黒画素が連続している範囲を1文字とするなど、適宜の方法により実行する。   The character extraction processing unit 32 executes processing for extracting characters from the character string. For example, in this character extraction, a horizontal histogram is calculated from the number of black pixels for each pixel column for horizontally written characters, and a range in which a predetermined number or more of black pixels are continuous is defined as one character or written vertically A vertical histogram is calculated from the number of black pixels for each pixel row for a character, and a range in which a predetermined number or more of black pixels are continuous is defined as one character.

文字認識処理部33は、マッチング用辞書データ24のマッチング情報を用いてどの文字のマッチング情報と一致あるいは近似するか判定することで文字を認識する処理と共に、マッチング信頼度を求める処理を実行する。   The character recognition processing unit 33 performs processing for recognizing characters by determining which character matching information matches or approximates using the matching information of the matching dictionary data 24 and processing for obtaining matching reliability.

認識信頼度判定処理部34は、文字認識処理部33で求めたマッチング信頼度(認識信頼度)が所定範囲を超えているか否か判定する処理を実行する。
認識結果補正処理部35は、誤認された文字を正しく変更された変更文字に補正する処理を実行する。
The recognition reliability determination processing unit 34 executes processing for determining whether or not the matching reliability (recognition reliability) obtained by the character recognition processing unit 33 exceeds a predetermined range.
The recognition result correction processing unit 35 executes a process of correcting an erroneously recognized character to a changed character that has been correctly changed.

ROM12は、文字認識プログラム23、及びマッチング用辞書データ24、並びに、後述するマッチング信頼度を判定する所定範囲を定める所定許容値αや、同じ位置と判定するためのエリア情報等の文字認識処理に必要な情報を記憶している。   The ROM 12 performs character recognition processing such as a character recognition program 23, matching dictionary data 24, a predetermined allowable value α that defines a predetermined range for determining matching reliability, which will be described later, and area information for determining the same position. Necessary information is stored.

マッチング用辞書データ24は、図3(A)に示すように、文字コード、及びマッチング情報によって構成されるとともに、言語ごとにマッチング用辞書データ24a,24bが存在する。   As shown in FIG. 3A, the matching dictionary data 24 includes a character code and matching information, and matching dictionary data 24a and 24b exist for each language.

文字コードは、例えばShift−JISなどの適宜の方式の文字コードである。
マッチング情報は、文字の特徴データを文字別に記憶している。
The character code is a character code of an appropriate method such as Shift-JIS, for example.
The matching information stores character feature data for each character.

RAM13は、CPU11が各種制御や演算に使用するデータを一時記憶すると共に、画像メモリ41に文字列画像などの画像を記憶している。さらには、図3(B)に示すように、誤認文字を正しい変更文字に変更した実績に関連する関連情報記憶データ42を記憶している。   The RAM 13 temporarily stores data used by the CPU 11 for various controls and calculations, and stores an image such as a character string image in the image memory 41. Furthermore, as shown in FIG. 3B, related information storage data 42 related to the result of changing the misidentified character to the correct changed character is stored.

詳しくは、一旦誤認された誤認文字を正しい変更文字に変更した変更実績に関連する情報である関連情報記憶データ42には、図3(B)の変更情報管理テーブル42aに示すように、変更処理を行った位置の位置情報、対象言語、カメラ撮影モード、及び変更文字情報等で構成している。   Specifically, as shown in the change information management table 42a in FIG. 3 (B), the change processing is performed in the related information storage data 42, which is information related to the change record obtained by changing a misperformed character to a correct changed character. It is composed of the position information of the position where the image is performed, the target language, the camera shooting mode, and the changed character information.

上記位置情報は、GPS部9によって取得した位置情報であり、例えば経緯度や座標値による位置情報とすることができる。
上記対象言語は、後述するように、文字認識する際に、利用者によって設定された言語である。
The position information is position information acquired by the GPS unit 9 and can be position information based on longitude and latitude or coordinate values, for example.
The target language is a language set by the user when characters are recognized, as will be described later.

上記カメラ撮影モードは、正しい変更文字に変更した誤認文字を画像入力部3で撮像した際の画像入力部3の設定であり、ライトの使用の有無、マクロレンズの使用の有無、及びズームの使用の有無で構成している。   The camera shooting mode is a setting of the image input unit 3 when the image input unit 3 captures a misidentified character that has been changed to a correct change character. Whether the light is used, whether the macro lens is used, and how the zoom is used. It consists of the presence or absence of.

上記変更文字情報は、誤認文字のコード、画像入力部3で撮像した文字画像のうちの対象文字部分の誤認文字に対するマッチング信頼度(以下において第1マッチング信頼度という)と、誤認文字を利用者によって正しく変更された変更文字のコード、画像入力部3で撮像した画像のうちの対象文字部分の変更文字に対するマッチング信頼度(以下において第2マッチング信頼度という)とで構成している。   The changed character information includes the misidentified character code, the matching reliability (hereinafter referred to as the first matching reliability) for the misidentified character of the target character portion of the character image captured by the image input unit 3, and the misidentified character as the user. And a matching reliability (hereinafter referred to as a second matching reliability) for the changed character of the target character portion in the image captured by the image input unit 3.

なお、RAM13は不揮発性メモリで構成しているため、携帯端末1の電源をoffにした場合であっても、関連情報記憶データ42は消えることなく記憶することができる。   Since the RAM 13 is composed of a non-volatile memory, the related information storage data 42 can be stored without disappearing even when the power of the mobile terminal 1 is turned off.

なお、携帯端末1には、無線通信を行う通信アンテナ、音声出力を行うスピーカ、及び集音を行うマイク等も設けられている。これにより、携帯電話機として利用できるように構成されている。   Note that the mobile terminal 1 is also provided with a communication antenna for performing wireless communication, a speaker for outputting sound, a microphone for collecting sound, and the like. Thereby, it is comprised so that it can utilize as a mobile telephone.

また、図2に仮想線で示すように、CPU11とROM12は、1つのチップ15に搭載して電子部品として構成してもよい。この場合、チップ15を携帯端末1に備えれば、簡単に文字認識機能を追加することができる。   Further, as indicated by virtual lines in FIG. 2, the CPU 11 and the ROM 12 may be mounted on one chip 15 and configured as electronic components. In this case, if the chip 15 is provided in the portable terminal 1, a character recognition function can be easily added.

次に、図4及び図5とともに、携帯端末1における文字認識について説明する。
図4は、携帯端末1のCPU11が文字認識プログラム23に従って実行する文字認識処理のフローチャートであり、図5は文字認識するための設定画面や認識文字についての説明図である。
Next, the character recognition in the portable terminal 1 is demonstrated with FIG.4 and FIG.5.
4 is a flowchart of character recognition processing executed by the CPU 11 of the mobile terminal 1 in accordance with the character recognition program 23. FIG. 5 is an explanatory diagram of a setting screen for recognizing characters and recognized characters.

なお、以下の説明においては、例えば、出張で中国に行き、レストランでメニューに何と書いてあるかを確認するために、中国語を読み取り日本語に翻訳するような翻訳アプリケーションを使用する場合を考えてみる。   In the following explanation, for example, consider a case where a translation application that reads Chinese and translates into Japanese is used to check what is written on the menu at a restaurant while traveling to China. Try.

具体的には、例えば、図5(c)の誤認文字変更画面7cに示すような少し変わったフォントの文字で書かれた中国のレストランで「香辣鹿肉」という品目について意味を調べようとした場合の翻訳アプリケーションにおける文字認識処理について説明する。   More specifically, for example, an attempt was made to examine the meaning of an item “Kaori venison” in a Chinese restaurant written in a slightly different font character as shown in the misidentified character change screen 7c in FIG. A character recognition process in the translation application will be described.

まず、利用者によって携帯端末1の翻訳アプリケーションが起動されると、CPU11は、GPS部9によって現在位置情報を取得する(ステップS1)。そしてCPU11は、取得した現在位置の位置情報が関連情報記憶データ42に記憶された位置であるか確認する(ステップS2)。
なお、現在位置の位置情報と、関連情報記憶データ42に記憶された位置とが同じ場所(位置)であるかの判定は、ROM12に記憶するエリア情報に基づき、関連情報記憶データ42に記憶された位置を含む所定の範囲内に現在位置の位置情報が含まれるか否かを判定する構成である。
First, when the translation application of the portable terminal 1 is started by the user, the CPU 11 acquires current position information by the GPS unit 9 (step S1). And CPU11 confirms whether the positional information on the acquired present position is the position memorize | stored in the relevant information storage data 42 (step S2).
Note that whether the position information of the current position and the position stored in the related information storage data 42 are the same place (position) is stored in the related information storage data 42 based on the area information stored in the ROM 12. In this configuration, it is determined whether or not the position information of the current position is included in a predetermined range including the determined position.

携帯端末1を持って初めて訪れる場所(位置)であったり、以前訪れたことがあったが翻訳アプリケーションにおける文字認識処理で誤認された文字を変更した実績のない、関連情報記憶データ42に記憶されていない位置の場合(ステップS2:No)、CPU11は、認識可能な言語を選択許容する言語設定画面7aを画面表示部7(図5(a)参照)に表示する。   It is stored in the related information storage data 42 that is a place (position) that is visited for the first time with the portable terminal 1 or that has been visited before but has no record of changing a character that was mistakenly recognized by the character recognition process in the translation application. When the position is not (step S2: No), the CPU 11 displays a language setting screen 7a for allowing and selecting a recognizable language on the screen display unit 7 (see FIG. 5A).

この言語設定画面7aには、複数の言語のいずれかを選択するチェックボックス71aをそれぞれの言語に対して備えた選択可能言語一覧表示部71、前画面に戻るための戻るボタン72、確定ボタン73、及びサブメニューを表示するためのサブメニューボタン74を備えている。   The language setting screen 7a includes a selectable language list display unit 71 having a check box 71a for selecting one of a plurality of languages for each language, a return button 72 for returning to the previous screen, and a confirmation button 73. , And a submenu button 74 for displaying a submenu.

この言語設定画面7aにおいて、利用者によってチェックボックス71aにチェックが入力され確定ボタン73が押下されると、CPU11は、ROM12に記憶するマッチング用辞書データ24のうち、該当する言語のマッチング用辞書データ24を読み出して、対象言語を設定する(ステップS3)。   When the user inputs a check in the check box 71a and presses the confirm button 73 on the language setting screen 7a, the CPU 11 matches the matching dictionary data of the corresponding language among the matching dictionary data 24 stored in the ROM 12. 24 is read and the target language is set (step S3).

上述したように、中国語のメニューを日本語に翻訳する本実施例においては、図5(a)に示すように、中国語のチェックボックス71aにチェックが入力され確定ボタン73が押下されると、CPU11はマッチング用辞書データ(中国語版)24bをROM12から読み出して、言語設定を完了する。   As described above, in this embodiment in which the Chinese menu is translated into Japanese, as shown in FIG. 5A, when a check is input to the Chinese check box 71a and the confirm button 73 is pressed. The CPU 11 reads the matching dictionary data (Chinese version) 24b from the ROM 12, and completes the language setting.

言語設定が完了したCPU11は、認証対象の文字を含む画像を画像入力部3(カメラ)によって明確に撮影するための撮影モードを設定するカメラ撮影モード設定画面7bを画面表示部7(図5(b)参照)に表示する。   When the language setting is completed, the CPU 11 displays a camera shooting mode setting screen 7b for setting a shooting mode for clearly shooting an image including characters to be authenticated by the image input unit 3 (camera). b) see).

このカメラ撮影モード設定画面7bには画像を撮影するためのライトの使用を設定するライト設定部75、マクロレンズの使用を設定するマクロレンズ設定部76、ズームを設定するためのズーム設定部77、戻るボタン72、確定ボタン73、及びサブメニューボタン74を備えている。   The camera shooting mode setting screen 7b includes a light setting unit 75 for setting use of a light for shooting an image, a macro lens setting unit 76 for setting use of a macro lens, a zoom setting unit 77 for setting zoom, A return button 72, a confirm button 73, and a submenu button 74 are provided.

ライト設定部75には使用の有無を設定するためのチェックボックス75aを有無のそれぞれに備えており、同様にマクロレンズ設定部76においても有無のそれぞれにチェックボックス76aを備えている。
ズーム設定部77には、画面表示部7における左右方向にスライドして、望遠(T)と広角(W)とのズーム量を調整するスライドバー77aを備えている。
The light setting unit 75 includes check boxes 75a for setting whether or not to use, and similarly, the macro lens setting unit 76 includes check boxes 76a for the presence or absence.
The zoom setting unit 77 includes a slide bar 77a that slides in the left-right direction on the screen display unit 7 to adjust the zoom amount between telephoto (T) and wide-angle (W).

このカメラ撮影モード設定画面7bにおいて、利用者によってチェックボックス75a,76aにチェックが入力されるとともに、スライドバー77aを適切な位置に調整され、確定ボタン73が押下されると、CPU11は、選択されたカメラ撮影モードを設定する(ステップS4)。   In the camera shooting mode setting screen 7b, when the user inputs a check in the check boxes 75a and 76a, adjusts the slide bar 77a to an appropriate position, and presses the confirm button 73, the CPU 11 is selected. The camera shooting mode is set (step S4).

このように設定することで、画像入力部3によって明確な文字画像を撮影し、対象言語の文字認識が可能な状態となるため、携帯端末1を文字認証する対象の文字部分に向けた利用者によってシャッターボタン(図示省略する)が押下されると、CPU11は、画像入力部3による画像撮影を実行して文字画像を取得する(ステップS5)。   By setting in this way, a clear character image is photographed by the image input unit 3 and character recognition of the target language is possible. Therefore, the user who is directed to the character portion to be subjected to character authentication of the portable terminal 1 When the shutter button (not shown) is pressed by the CPU 11, the CPU 11 performs image shooting by the image input unit 3 and acquires a character image (step S 5).

画像入力部3によって文字画像を取得したCPU11は、文字列抽出処理部31による文字列抽出処理を実行し、文字画像から文字列を抽出するとともに(ステップS6)、抽出された抽出文字列について、文字認識処理部33により文字認識処理を実行し(ステップS7)、その文字認識処理結果を画面表示部7に表示する(図5(c)参照、ステップS8)。   CPU11 which acquired the character image by the image input part 3 performs the character string extraction process by the character string extraction process part 31, and while extracting a character string from a character image (step S6), about the extracted extracted character string, Character recognition processing is executed by the character recognition processing unit 33 (step S7), and the character recognition processing result is displayed on the screen display unit 7 (see FIG. 5C, step S8).

この文字認識処理では、文字抽出処理部32により文字列から抽出した各文字について、マッチング用辞書データ24を用いて文字認識を実行する。
なお、文字抽出処理部32による文字抽出は、文字と文字の境界を抽出する処理に相当する。例えば、文字列画像について、文字部分が黒になるように2値化され、文字列に垂直方向に黒画素が射影され、その射影データの切れ目を文字と文字の境界の候補とする。
In this character recognition processing, character recognition is executed using the matching dictionary data 24 for each character extracted from the character string by the character extraction processing unit 32.
Note that character extraction by the character extraction processing unit 32 corresponds to processing for extracting a boundary between characters. For example, the character string image is binarized so that the character portion is black, black pixels are projected in the vertical direction on the character string, and the projected data break is set as a candidate for the boundary between the character and the character.

そして、この文字認識処理では、文字認識処理部33により抽出された各文字に対して、マッチング用辞書データ24のうち、対象文字とのマッチング信頼度の高い文字を認証文字82aとして算出する。このときのマッチング信頼度が上述の第1マッチング信頼度となる。   In this character recognition processing, for each character extracted by the character recognition processing unit 33, a character having high matching reliability with the target character in the matching dictionary data 24 is calculated as the authentication character 82a. The matching reliability at this time is the first matching reliability described above.

文字認識処理の結果を表示する誤認文字変更画面7cには、文字表示部80、戻るボタン72、確定ボタン73、及びサブメニューボタン74を備えている。
文字表示部80は、文字画像81aを表示する文字画像表示部81と、認識した文字列である認識文字列82aを表示する認識文字列表示部82と、認識文字列82aの各認識文字82bに対する変更候補文字83aを選択可能に表示する変更文字選択ウィンドウ83とを備えている。
The misrecognized character change screen 7c displaying the result of the character recognition process includes a character display unit 80, a return button 72, a confirmation button 73, and a submenu button 74.
The character display unit 80 displays a character image display unit 81 that displays a character image 81a, a recognized character string display unit 82 that displays a recognized character string 82a that is a recognized character string, and each recognized character 82b of the recognized character string 82a. A change character selection window 83 that displays the change candidate characters 83a in a selectable manner is provided.

この誤認文字変更画面7cにおいて、文字画像表示部81に表示された文字画像81aと同じ認識文字82bで構成される認識文字列82aが認識文字列表示部82に表示されると、すべての文字が正しく認識されているため(ステップS9:No)、利用者によって確定ボタン73が押下されることで、CPU11は「香辣鹿肉」という文字画像81aから認識された「香辣鹿肉」という認識文字82bを確定し、この文字認識処理を終了し、引き続き認識した認識文字列82aに対する翻訳処理を実行する。   When the recognized character string 82a composed of the same recognized characters 82b as the character image 81a displayed on the character image display unit 81 is displayed on the recognized character string display unit 82 on the misidentified character change screen 7c, all characters are displayed. Since it is correctly recognized (step S9: No), when the user presses the confirmation button 73, the CPU 11 recognizes the recognized character 82b “Kaori venison” recognized from the character image 81a “Kaori venison”. The character recognition process is terminated, and the translation process for the recognized character string 82a is executed.

逆に、文字画像81aに対して、間違って認識された文字(以下において「誤認文字82c」という)がある場合、誤認文字82cの変更候補文字83aを変更文字選択ウィンドウ83に表示する(ステップS9:Yes)。   On the other hand, if there is a character recognized in error (hereinafter referred to as “misidentified character 82c”) in the character image 81a, the change candidate character 83a of the misidentified character 82c is displayed in the modified character selection window 83 (step S9). : Yes).

詳しくは、図5(c)に示すように、「香辣鹿肉」という文字画像81aに対して、「香辣鹿月」という認識文字列82aが表示された場合、「香辣鹿肉」という認識文字列82aのうち「香」、「辣」、「鹿」の認識文字82bは正しく認識され、「肉」が「月」という誤認文字82cとして誤認識されていることとなる。   Specifically, as shown in FIG. 5 (c), when a recognition character string 82a "Kokuka deer" is displayed for the character image 81a "Koroku deer", a recognition character "Koroshi deer" is displayed. In the column 82a, the recognized characters 82b of “incense”, “mochi”, and “deer” are correctly recognized, and “meat” is erroneously recognized as the misidentified character 82c “month”.

このように、認識文字列82aにおいて誤認文字82cがある場合、誤認文字82cである「月」が利用者によって選択されると、CPU11は誤認文字82cである「月」の変更候補文字83aを変更文字選択ウィンドウ83に表示する。
なお、変更文字選択ウィンドウ83で表示される変更候補文字83aは、上述のステップS7で算出されたマッチング信頼度が高い文字を表示する。
As described above, when there is a misidentified character 82c in the recognized character string 82a, when the user selects the "month" that is the misidentified character 82c, the CPU 11 changes the change candidate character 83a of "month" that is the misidentified character 82c. It is displayed in the character selection window 83.
The change candidate character 83a displayed in the changed character selection window 83 displays a character with high matching reliability calculated in step S7 described above.

そして、変更候補文字83aの中から正しい変更文字83bである「肉」が選択され、確定ボタン73が押下されると、CPU11は「香辣鹿肉」という文字画像81aから認識された「香辣鹿肉」という認識文字82bを確定する(ステップS10)。   Then, when “meat” which is the correct change character 83b is selected from the change candidate characters 83a and the confirm button 73 is pressed, the CPU 11 recognizes “Kaori venison” recognized from the character image 81a “Kaori venison”. "Is recognized (step S10).

CPU11は、ステップS7で算出され、文字画像81aにおける誤認文字82cとして誤認された被誤認部分81bの変更文字83bに対するマッチング信頼度を読み出して、上述したように第2マッチング信頼度とする(ステップS11)。なお、CPU11が、文字画像81aにおける被誤認部分81bと変更文字83bとのマッチング信頼度を改めて算出する構成であってもよい。   CPU11 reads the matching reliability with respect to the change character 83b of the misrecognized part 81b calculated as step S7 and misidentified as the misrecognized character 82c in the character image 81a, and makes it 2nd matching reliability as mentioned above (step S11). ). The CPU 11 may calculate the matching reliability between the misidentified portion 81b and the changed character 83b in the character image 81a.

さらに、CPU11は認識文字82bを変更文字83bに変更した情報を関連情報記憶データ42に登録して(ステップS12)、この文字認識処理を終了し、引き続き認識した認識文字列82aに対する翻訳処理を実行する。   Further, the CPU 11 registers the information obtained by changing the recognized character 82b to the changed character 83b in the related information storage data 42 (step S12), ends this character recognition processing, and subsequently executes the translation processing for the recognized recognized character string 82a. To do.

なお、ステップS12で、登録する内容は、図4(b)に示すように、ステップS1で取得した位置情報、ステップS3で設定した対象言語、ステップS4で設定したカメラ撮影モードの設定内容、及び変更文字情報等を変更情報管理テーブル42aに記憶する。   As shown in FIG. 4B, the contents to be registered in step S12 include the position information acquired in step S1, the target language set in step S3, the camera shooting mode setting contents set in step S4, and The changed character information and the like are stored in the changed information management table 42a.

変更情報管理テーブル42aに記憶する変更文字情報は、誤認された誤認文字82cの文字コードと、ステップS7で算出した文字画像81aのうち被誤認部分81bと誤認文字82cとの第1マッチング信頼度と、ステップS10で変更した変更文字83bの文字コードと、ステップS11で読み出した被誤認部分81bの変更文字83bに対する第2マッチング信頼度とを登録する。   The changed character information stored in the changed information management table 42a includes the character code of the erroneously recognized character 82c and the first matching reliability between the misidentified portion 81b and the erroneously recognized character 82c in the character image 81a calculated in step S7. The character code of the changed character 83b changed in step S10 and the second matching reliability for the changed character 83b of the misidentified portion 81b read out in step S11 are registered.

他方、ステップS1で取得した位置情報が関連情報記憶データ42に記憶された位置である場合(ステップS2:Yes)、CPU11は、関連情報記憶データ42に記憶された設定言語を読み出して設定する(ステップS13)とともに、関連情報記憶データ42に記憶されたカメラ撮影モードの設定内容を設定する(ステップS14)。   On the other hand, when the position information acquired in step S1 is the position stored in the related information storage data 42 (step S2: Yes), the CPU 11 reads and sets the setting language stored in the related information storage data 42 ( At the same time as step S13), the setting details of the camera shooting mode stored in the related information storage data 42 are set (step S14).

この状態で、関連情報記憶データ42に記憶した以前の文字認識の際の設定条件と同条件で、画像入力部3による画像撮影して文字認識可能な状態となるため、CPU11は、上述のステップS5〜S7と同様に、画像入力部3による文字画像の取得、文字列抽出処理部31による文字列抽出処理、及び文字認識処理部33による文字認識処理を実行する(ステップS15)。なお、この文字認識処理における対象文字とのマッチング信頼度を「第3マッチング信頼度」とする。   In this state, the image is captured by the image input unit 3 under the same condition as the previous character recognition setting condition stored in the related information storage data 42, so that the character can be recognized. Similar to S5 to S7, a character image is acquired by the image input unit 3, a character string extraction process by the character string extraction processing unit 31, and a character recognition process by the character recognition processing unit 33 is executed (step S15). Note that the matching reliability with the target character in the character recognition process is referred to as “third matching reliability”.

そして、文字認識処理の結果、認識文字列82aのうち、誤認文字として関連情報記憶データ42に記憶された認識文字82bがあるかCPU11は判定する(ステップS16)。
CPU11によって、文字認識処理の結果の認識文字82bには、誤認文字として関連情報記憶データ42に記憶された誤認文字82cは無いと判定された場合(ステップS16:No)、ステップS8に移行する。
Then, as a result of the character recognition process, the CPU 11 determines whether there is a recognized character 82b stored in the related information storage data 42 as a misidentified character in the recognized character string 82a (step S16).
When the CPU 11 determines that the recognized character 82b as a result of the character recognition process does not include the misidentified character 82c stored in the related information storage data 42 as the misidentified character (step S16: No), the process proceeds to step S8.

他方、文字認識処理の結果の認識文字82bには、誤認文字として関連情報記憶データ42に記憶された誤認文字82cがあると判定された場合(ステップS16:Yes)、CPU11は、ステップS15で算出した第3マッチング信頼度が、ステップS7で算出した第1マッチング信頼度を中心値として所定許容値α1を有する第1の所定範囲内であるか認識信頼度判定処理部34によって判定し、第3マッチング信頼度が第1の所定範囲内にないと判定された場合(ステップS17:No)、ステップS8に移行する。   On the other hand, when it is determined that the recognized character 82b as a result of the character recognition process includes the misidentified character 82c stored in the related information storage data 42 as the misidentified character (step S16: Yes), the CPU 11 calculates in step S15. The recognized reliability determination processing unit 34 determines whether the third matching reliability is within a first predetermined range having a predetermined allowable value α1 with the first matching reliability calculated in step S7 as a central value. When it is determined that the matching reliability is not within the first predetermined range (step S17: No), the process proceeds to step S8.

第3マッチング信頼度が第1の所定範囲内である場合(ステップS17:Yes)、CPU11は、関連情報記憶データ42に誤認文字として記憶されていると判定された誤認文字82cと、関連情報記憶データ42に記憶された変更文字83bとのマッチング信頼度を算出する(ステップS18)。
なお、このときのマッチング信頼度を「第4マッチング信頼度」とする。
When the third matching reliability is within the first predetermined range (step S17: Yes), the CPU 11 determines that the misrecognized character 82c is stored as the misrecognized character in the related information storage data 42, and the related information storage. The matching reliability with the changed character 83b stored in the data 42 is calculated (step S18).
The matching reliability at this time is referred to as “fourth matching reliability”.

そして、CPU11は、第4マッチング信頼度が、ステップS11で算出した第2マッチング信頼度を中心値として所定許容値α2を有する第2の所定範囲内であるか認識信頼度判定処理部34によって判定し、第4マッチング信頼度が第2の所定範囲内にないと判定された場合(ステップS19:No)、ステップS8に移行する。   Then, the CPU 11 determines whether the fourth matching reliability is within the second predetermined range having the predetermined allowable value α2 with the second matching reliability calculated in step S11 as a central value by the recognition reliability determination processing unit 34. If it is determined that the fourth matching reliability is not within the second predetermined range (step S19: No), the process proceeds to step S8.

第4マッチング信頼度が第2の所定範囲内である場合(ステップS19:Yes)、CPU11は、関連情報記憶データ42に誤認文字として記憶されていると判定された誤認文字82cを、認識結果補正処理部35により関連情報記憶データ42に記憶された変更文字83bに補正する(ステップS20)。   When the fourth matching reliability is within the second predetermined range (step S19: Yes), the CPU 11 corrects the recognition result 82c for the misidentified character 82c determined to be stored as the misidentified character in the related information storage data 42. The processing unit 35 corrects the changed character 83b stored in the related information storage data 42 (step S20).

さらに、CPU11は、認識文字列82aのうち残る認識文字82bにおいて、関連情報記憶データ42に誤認文字として記憶された認識文字があるか判定し、残っていない場合(ステップS21:No)、ステップS8に移行するとともに、残っている場合(ステップS22:Yes)はステップS17に戻る。   Furthermore, the CPU 11 determines whether or not there is a recognized character stored as a misidentified character in the related information storage data 42 in the remaining recognized character 82b in the recognized character string 82a, and if it does not remain (step S21: No), step S8. If it remains (step S22: Yes), the process returns to step S17.

このように、携帯端末1のCPU11は、上述のフローチャートに基づいて画像入力部3によって取得した文字画像から正確に文字を認識して、認識した認識文字列82aに対する翻訳処理を実行することができる。   As described above, the CPU 11 of the mobile terminal 1 can accurately recognize the character from the character image acquired by the image input unit 3 based on the above-described flowchart, and can execute the translation process on the recognized recognized character string 82a. .

なお、上記文字認識処理を行う携帯端末1を用いることによって、手軽な操作で明確な画像を取得するとともに、正確な文字認識を実現することができる。また、以前に誤認文字82cを変更文字83bに変更した場所(位置)において、誤認文字82cと同じ認識文字82bを認識した場合に、変更文字選択ウィンドウ83等で操作することなく変更文字83bに補正することができ、利用者の利便性が向上する。   In addition, by using the portable terminal 1 that performs the character recognition process, it is possible to acquire a clear image with a simple operation and to realize accurate character recognition. Further, when the same recognized character 82b as the misidentified character 82c is recognized at the position (position) where the misidentified character 82c has been changed to the changed character 83b before, the character is corrected to the changed character 83b without operating the changed character selection window 83 or the like. This improves user convenience.

具体的には、繰り返し同じ場所(位置)に出張に行くと、例えば「前回行ったときにおいしかったから」といった理由で繰り返し同じレストランに行ったり、また、繰り返し同じ公共施設を利用したりすることが考えられる。   Specifically, if you repeatedly go to the same place (location) on a business trip, you may go to the same restaurant repeatedly, for example, because it was delicious the last time you went, or repeatedly use the same public facilities Conceivable.

そのような場合、上記フローチャートに示すとおり、ある場所(位置)で初めて文字認識処理を実行する際に設定した対象言語やカメラ撮影モードが、再度同じ場所(位置)に行って文字認識する際に、位置情報を取得するGPS部9と連動して自動的に設定されるため、面倒な手間を繰り返す必要がなくなる。   In such a case, as shown in the flowchart above, when the target language or camera shooting mode set when the character recognition process is executed for the first time at a certain place (position) goes to the same place (position) again and the character is recognized. Since it is automatically set in conjunction with the GPS unit 9 for acquiring position information, it is not necessary to repeat troublesome labor.

これにより、特に海外へ出張や旅行に行った際など、同じ場所(位置)で以前使用した際にはマクロレンズを使用する設定にしていたにもかかわらず、その設定をしなかったために、以前は良く認識できていたものが認識できなくなってしまったりするようなことがなくなる。   As a result, the macro lens was set to be used when it was previously used at the same location (position), such as when traveling on a business trip or traveling abroad, but it was not set. Can no longer recognize what was well recognized.

また、変更文字83bに変更処理した誤認文字82cについて、同じ場所(位置)で同じ文字画像81aから文字を認識する場合に、同様に誤認識する可能性が非常に高い。しかし、上記文字認識処理を行う携帯端末1では、再度同様の変更操作をせずとも、GPS部9と連動し、関連情報記憶データ42に記憶する関連情報に基づいて自動的に変更されるため、利用者の利便性が向上する。
なお、同じ場所(位置)で同じ文字を認識する場合の誤認識の可能性は対応されていない特別なフォントの場合により可能性が高くなる。
In addition, regarding the misrecognized character 82c changed to the changed character 83b, when a character is recognized from the same character image 81a at the same place (position), there is a very high possibility that it is erroneously recognized. However, since the mobile terminal 1 that performs the character recognition process is automatically changed based on the related information stored in the related information storage data 42 in conjunction with the GPS unit 9 without performing the same changing operation again. , User convenience is improved.
Note that the possibility of misrecognition when recognizing the same character at the same location (position) is more likely in the case of a special font that is not supported.

例えば、上述の実施例における文字画像81a(図5(c)参照)のように、少し変わったフォントの文字で書かれた「肉」という文字の左側が「月」という文字の左側に似ていたために「月」に誤認識され、正しい「肉」に変更する必要があった。   For example, as shown in the character image 81a in the above-described embodiment (see FIG. 5C), the left side of the character “meat” written with characters of a slightly different font is similar to the left side of the character “month”. For this reason, it was mistakenly recognized as “Moon” and had to be changed to the correct “Meat”.

なお、メニュー中の文字フォントは、おおよそ統一されているのが一般的であり、このレストランでは、「肉」という文字について文字認識すると同様の誤認識が生じる。しかし、場所(位置)毎に誤認文字82cと変更文字83bとが関連情報記憶データ42に記憶されているため、面倒な変更操作をせずとも正しい変更文字83bとして文字認識することができる。   Note that the character fonts in the menu are generally uniform, and in this restaurant, the same misrecognition occurs when the character “meat” is recognized. However, since the misrecognized character 82c and the changed character 83b are stored in the related information storage data 42 for each place (position), the character can be recognized as the correct changed character 83b without a troublesome change operation.

なお、文字認識処理における認識性能の向上を図るための対策として、その認識できなかった文字を用いてマッチング用辞書に学習させることが考えられる。
この方法によれば、一般に、学習によって、マッチング用辞書が記憶する文字の形状が、対応フォントと認識できなかった文字のフォントの形状との間のものとなるため、特に、対応フォントと認識できなかった文字のフォントの形状の違いが大きいと、これまで認識精度が良好だった文字に対する認識精度を悪くしてしまうおそれがある。すなわち、学習することで、他の場所(位置)でアプリケーションを使用した際に、前回来たときは認識精度が良好だった文字が、あまり認識できなくなってしまうことが考えられる。
As a measure for improving the recognition performance in the character recognition process, it is conceivable to use a character that could not be recognized to cause the matching dictionary to learn.
According to this method, in general, the character shape stored in the matching dictionary by learning is between the corresponding font and the character font that could not be recognized. If there is a large difference in the font shape of a character that has not been received, there is a risk that the recognition accuracy for a character that has had good recognition accuracy will deteriorate. That is, by learning, when an application is used in another place (position), it is conceivable that characters that had good recognition accuracy when they came last time cannot be recognized much.

これに対し、上述の文字認証処理においては、ステップS15で算出された第3マッチング信頼度が、位置情報とともに関連情報記憶データ42に記憶された誤認文字82cの第1マッチング信頼度を中心値とする第1の所定範囲に入り、ステップS18で算出された第4マッチング信頼度が、位置情報とともに関連情報記憶データ42に記憶された変更文字83bに対する第2マッチング信頼度を中心値とする第2の所定範囲に入る場合に、以前に同じ場所(位置)で行った変更処理の実績に基づいて精度良く誤認文字82cを変更文字83bに補正することができる。   On the other hand, in the above-described character authentication process, the third matching reliability calculated in step S15 is based on the first matching reliability of the misidentified character 82c stored in the related information storage data 42 together with the position information as a central value. The second matching reliability calculated in step S18 and the second matching reliability for the changed character 83b stored in the related information storage data 42 together with the position information is a second value centered on the first predetermined range. In the predetermined range, it is possible to accurately correct the misidentified character 82c to the changed character 83b based on the results of the change processing previously performed at the same place (position).

したがって、前回来たときは認識精度が良好だった文字が、あまり認識できなくなってしまうといった不具合が生じることなく、一旦、誤認されたが正しく変更文字83bに変更された誤認文字82cの変更実績に基づく補正を実行し、精度のよい文字認識を行うことができる。   Therefore, when the last time it came, characters that had good recognition accuracy would not be recognized so much, and there was no inconvenience that the erroneously recognized characters 82c that were once mistakenly changed to the changed characters 83b were changed. Based on this, it is possible to perform accurate character recognition.

なお、上記実施例においては、携帯端末1による文字認識処理で誤認された文字を変更した場合に、位置情報、対象言語、カメラ撮影モードの設定内容、及び変更文字情報を関連情報記憶データ42に記憶する構成であったが、文字認識処理を実行するたびに、位置情報、対象言語及びカメラ撮影モードを関連情報記憶データ42に記憶させてもよい。   In the above embodiment, when a character mistakenly recognized by the character recognition process by the mobile terminal 1 is changed, the position information, the target language, the setting content of the camera shooting mode, and the changed character information are stored in the related information storage data 42. However, the position information, the target language, and the camera shooting mode may be stored in the related information storage data 42 each time the character recognition process is executed.

この場合、ステップS3で対象言語を設定し、ステップS4でカメラ撮影モードを設定した後、ステップS1で取得した位置情報とともに対象言語及びカメラ撮影モードを関連情報記憶データ42に記憶させる。
これにより、例えば、携帯端末1による文字認識処理で誤認された文字を変更しなかった場合であっても、関連情報記憶データ42に記憶する位置情報と同じ場所(位置)では同じ設定をすることができる。
In this case, after setting the target language in step S3 and setting the camera shooting mode in step S4, the target language and the camera shooting mode are stored in the related information storage data 42 together with the position information acquired in step S1.
Thereby, for example, even when the character misidentified in the character recognition processing by the mobile terminal 1 is not changed, the same setting is made at the same location (position) as the location information stored in the related information storage data 42. Can do.

なお、このように構成した場合、関連情報記憶データ42に記憶する情報量が多くなり、誤認文字82cの補正のための変更文字情報の抽出が遅くなるおそれがある。したがって、文字認識処理を実行するたび記憶する位置情報、対象言語及びカメラ撮影モードを管理する管理テーブルと、誤認文字82cを変更した際の実績として、位置情報及び変更文字情報とは異なる管理テーブルで管理することが好ましい。   In addition, when comprised in this way, the information amount memorize | stored in the relevant information storage data 42 increases, and there exists a possibility that extraction of the change character information for correction | amendment of the misidentified character 82c may become slow. Therefore, the management table for managing the position information, the target language, and the camera shooting mode stored each time the character recognition process is executed, and the management table different from the position information and the changed character information as the results when the misidentified character 82c is changed. It is preferable to manage.

この発明の構成と、上述の実施形態との対応において、
この発明のマッチングデータは、マッチング用辞書データ24に対応し、
以下同様に、
画像データは、文字画像81aに対応し、
マッチングデータ記憶手段は、ROM12に対応し、
文字認識手段及び文字認識ステップは、ステップS5〜S7及びS15に対応し、
位置情報取得手段及びGPS装置は、GPS部9に対応し、
携帯式文字認識装置及び携帯端末は、携帯端末1に対応し、
設定条件情報は、変更情報管理テーブル42aに格納する対象言語及びカメラ撮影モードに対応し、
関連情報記憶手段及び関連情報記憶ステップは、ステップS12に対応し、
記憶位置確認手段及び記憶位置確認ステップは、ステップS2に対応し、
条件設定手段及び条件設定ステップは、ステップS13及びS14に対応し、
認識文字変更手段並びに、変更操作受付けステップ及び認識文字変更ステップは、ステップS10に対応し、
誤認文字変更情報は、変更情報管理テーブル42aに格納する変更文字情報に対応し、
誤認文字変更情報記憶手段及び誤認文字変更情報記憶ステップは、ステップS12に対応し、
誤認文字確認手段及び誤認文字確認ステップは、ステップS16に対応し、
文字補正手段及び文字補正ステップは、ステップS20に対応するが、
この発明は、上述の実施形態の構成のみに限定されるものではなく、多くの実施の形態を得ることができる。
In correspondence between the configuration of the present invention and the above-described embodiment,
The matching data of the present invention corresponds to the matching dictionary data 24,
Similarly,
The image data corresponds to the character image 81a,
The matching data storage means corresponds to the ROM 12,
The character recognition means and the character recognition step correspond to steps S5 to S7 and S15,
The position information acquisition means and the GPS device correspond to the GPS unit 9,
The portable character recognition device and the portable terminal correspond to the portable terminal 1,
The setting condition information corresponds to the target language and camera shooting mode stored in the change information management table 42a.
The related information storage means and the related information storage step correspond to step S12,
The storage position confirmation means and the storage position confirmation step correspond to step S2,
The condition setting means and the condition setting step correspond to steps S13 and S14,
The recognized character changing means, the change operation accepting step and the recognized character changing step correspond to step S10,
The misidentified character change information corresponds to the changed character information stored in the change information management table 42a,
The misidentified character change information storage means and the misidentified character change information storage step correspond to step S12,
The erroneous character confirmation means and the erroneous character confirmation step correspond to step S16,
The character correction means and the character correction step correspond to step S20.
The present invention is not limited only to the configuration of the above-described embodiment, and many embodiments can be obtained.

1…携帯端末
9…GPS部
12…ROM
23…文字認識プログラム
24…マッチング用辞書データ
24b…マッチング用辞書データ(中国語版)
42a…変更情報管理テーブル
81a…文字画像
82c…誤認文字
82b…認識文字
83b…変更文字
1 ... mobile terminal 9 ... GPS unit 12 ... ROM
23 ... Character recognition program 24 ... Matching dictionary data 24b ... Matching dictionary data (Chinese version)
42a ... changed information management table 81a ... character image 82c ... misidentified character 82b ... recognized character 83b ... changed character

Claims (6)

文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、
画像データを取得し、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、
位置情報を取得する位置情報取得手段とを備えた携帯式文字認識装置であって、
前記文字認識手段が画像取得して文字認識する際に設定された設定条件情報と、前記文字認識手段によって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶手段と、
前記文字認識手段によって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認手段と、
前記関連情報記憶手段に記憶された位置で前記文字認識手段が文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して前記文字認識手段に設定する条件設定手段とを備え
取得した前記画像データから前記文字認識手段によって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付け、変更文字に変更する認識文字変更手段と、
前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として前記位置情報と関連づけて記憶する誤認文字変更情報記憶手段とを備え、
前記記憶位置確認手段によって確認され、前記関連情報記憶手段に記憶された位置で前記文字認識手段が認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認手段と、
該誤認文字確認手段によって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正手段を備えた
携帯式文字認識装置。
Matching data storage means for storing matching data for character recognition;
Character recognition means for acquiring image data and recognizing characters in the image data based on the matching data;
A portable character recognition device comprising position information acquisition means for acquiring position information,
Related information storage means for storing the setting condition information set when the character recognition means obtains an image and character recognition and the position information of the position recognized by the character recognition means in association with each other;
A storage position confirmation means for confirming whether or not the position for character recognition by the character recognition means is stored in the related information storage means;
A condition setting unit that reads the setting condition information associated with the position information and sets the character recognition unit when the character recognition unit recognizes a character at the position stored in the related information storage unit ;
A recognition character changing unit that accepts a change operation to change a misrecognized character that was erroneously recognized in the recognized character recognized by the character recognizing unit from the acquired image data to a correct character;
A misidentified character change information storage means for storing the misidentified character information and the changed modified character information as misidentified character change information in association with the position information;
A misidentification that confirms whether the recognized character recognized by the character recognition unit at the position stored in the related information storage unit and stored in the related information storage unit is stored as misidentified character information in the misidentified character change information storage unit. Character verification means;
Character correcting means for correcting to the changed character based on the misidentified character change information when the recognized character confirmation means confirms that the recognized character matches the misidentified character stored in the misidentified character change information storage means. A portable character recognition device.
前記文字補正手段を、
前記文字認識手段が認識する認識文字の前記誤認文字に対するマッチング信頼度が第1の所定範囲にあり、かつ、前記変更文字に対するマッチング信頼度が第2の所定範囲にある場合に、前記文字認識手段が認識した認識文字を前記変更文字に補正する構成とした
請求項1に記載の携帯式文字認識装置。
The character correcting means;
The character recognition means when the matching reliability of the recognized character recognized by the character recognition means with respect to the misidentified character is within a first predetermined range and the matching reliability with respect to the changed character is within a second predetermined range. The portable character recognition device according to claim 1, wherein the recognized character recognized by the character is corrected to the changed character.
前記認識文字変更手段によって前記誤認文字を前記変更文字に変更した際の前記文字認識手段が認識した認識文字の前記誤認文字に対する第1マッチング信頼度と、前記変更文字に対する第2マッチング信頼度とを記憶するマッチング信頼度記憶手段を備え、
前記第1の所定範囲を、前記第1マッチング信頼度を中心とする所定範囲に設定し、
前記第2の所定範囲を、前記第2マッチング信頼度を中心とする所定範囲に設定した
請求項に記載の携帯式文字認識装置。
A first matching reliability for the misrecognized character of the recognized character recognized by the character recognizing unit when the misrecognized character is changed to the changed character by the recognized character changing unit, and a second matching reliability for the changed character. A matching reliability storage means for storing,
Setting the first predetermined range to a predetermined range centered on the first matching reliability;
Mobile character recognition apparatus according to the second predetermined range, to claim 2 which is set to a predetermined range around the second matching reliability.
前記位置取得手段を、GPS装置で構成した
請求項1からのうちいずれかに記載の携帯式文字認識装置。
The portable character recognition device according to any one of claims 1 to 3 , wherein the position acquisition means is configured by a GPS device.
文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、
画像データを取得して、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、
位置情報を取得する位置情報取得手段とを備えた携帯端末に実行させる文字認識プログラムであって、
前記文字認識手段が、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップにおいて、
画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて関連情報記憶手段に記憶する関連情報記憶ステップと、
前記文字認識ステップによって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認ステップと、
前記関連情報記憶手段に記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを携帯端末に実行させ
取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、
受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、
前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを携帯端末に実行させるとともに、
前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認ステップと、
該誤認文字確認ステップによって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを携帯端末に実行させる
文字認識プログラム。
Matching data storage means for storing matching data for character recognition;
Character recognition means for obtaining image data and recognizing characters in the image data based on the matching data;
A character recognition program to be executed by a mobile terminal provided with position information acquisition means for acquiring position information,
In the character recognition step, wherein the character recognition means recognizes characters in the image data based on the matching data.
A related information storage step of associating and storing in the related information storage means the setting condition information set at the time of image acquisition and character recognition, and the position information of the position recognized by the character recognition step;
A storage position confirmation step for confirming whether or not a position for character recognition by the character recognition step is stored in the related information storage means;
When recognizing characters at the position stored in the related information storage unit, the portable terminal is caused to execute a condition setting step of reading the setting condition information associated with the position information and setting the same condition .
A change operation accepting step for accepting a change operation for changing a misrecognized character that was erroneously recognized in the recognized character recognized by the character recognizing step from the acquired image data to a correct character;
A recognized character changing step for changing a misidentified character to a changed character based on the received change operation;
While causing the portable terminal to execute a misidentified character change information storage step of storing the misidentified character information and the changed modified character information as misidentified character change information in association with the position information and storing the misidentified character change information in the storage unit,
A misidentified character confirmation step for confirming whether the recognized character recognized at the position confirmed in the storage position confirmation step is stored as misidentified character information in the misidentified character change information storage means;
A character correction step for correcting to the changed character based on the misidentified character change information when it is confirmed that the recognized character matches the misidentified character stored in the misidentified character change information storage means in the misidentified character confirmation step. A character recognition program that runs on a mobile device .
画像データを取得して、マッチングデータ記憶手段に記憶された文字認識用のマッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップと、
位置情報を取得する位置情報取得ステップとを実行する文字認識方法であって、
前記文字認識ステップにおいて、
画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶ステップと、
前記文字認識ステップによって文字認識する位置が記憶されているか確認する記憶位置確認ステップと、
記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを実行し、
取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、
受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、
前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを実行するとともに、
前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が誤認文字情報として記憶されているか確認する誤認文字確認ステップと、
該誤認文字確認ステップによって前記認識文字が記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを実行する
文字認識方法。
A character recognition step of acquiring image data and recognizing characters in the image data based on matching data for character recognition stored in the matching data storage means;
A character recognition method for executing a position information acquisition step of acquiring position information,
In the character recognition step,
A related information storage step for storing the setting condition information set when the image is acquired and the character is recognized and the position information of the position where the character is recognized in the character recognition step in association with each other;
A storage position confirmation step for confirming whether a character recognition position is stored in the character recognition step;
A condition setting step of reading the setting condition information associated with the position information and setting the same condition when recognizing characters at the stored position ;
A change operation accepting step for accepting a change operation for changing a misrecognized character that was erroneously recognized in the recognized character recognized by the character recognizing step from the acquired image data to a correct character;
A recognized character changing step for changing a misidentified character to a changed character based on the received change operation;
Performing the misidentified character change information storage step of storing the misidentified character information and the changed modified character information as misidentified character change information in association with the position information and storing in the misidentified character change information storage means;
A misidentified character confirmation step for confirming whether the recognized character recognized at the position confirmed in the storage position confirmation step is stored as misidentified character information;
A character correction step for correcting the changed character to the changed character based on the misidentified character change information when the recognized character is confirmed to match the stored recognized character by the step of checking the recognized character. Recognition method.
JP2009061750A 2009-03-13 2009-03-13 Portable character recognition device, character recognition program, and character recognition method Active JP5223739B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009061750A JP5223739B2 (en) 2009-03-13 2009-03-13 Portable character recognition device, character recognition program, and character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009061750A JP5223739B2 (en) 2009-03-13 2009-03-13 Portable character recognition device, character recognition program, and character recognition method

Publications (2)

Publication Number Publication Date
JP2010218041A JP2010218041A (en) 2010-09-30
JP5223739B2 true JP5223739B2 (en) 2013-06-26

Family

ID=42976860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009061750A Active JP5223739B2 (en) 2009-03-13 2009-03-13 Portable character recognition device, character recognition program, and character recognition method

Country Status (1)

Country Link
JP (1) JP5223739B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6171167B2 (en) * 2012-12-28 2017-08-02 日本電産サンキョー株式会社 Character recognition device, character recognition method, and character recognition program
CN115170785B (en) * 2021-11-22 2023-05-09 荣耀终端有限公司 Character recognition method for image, electronic device and storage medium

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03240183A (en) * 1990-02-16 1991-10-25 Nippon Telegr & Teleph Corp <Ntt> Automatic correction system for recognized character
JP3455643B2 (en) * 1997-02-18 2003-10-14 株式会社東芝 Method of updating learning dictionary in character recognition device and character recognition device
JP2002209262A (en) * 2001-01-09 2002-07-26 Casio Comput Co Ltd Mobile communication unit
JP2003178067A (en) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp Portable terminal-type image processing system, portable terminal, and server
JP2005012318A (en) * 2003-06-17 2005-01-13 Nec Access Technica Ltd Mobile phone with positional information acquisition function
JP5150035B2 (en) * 2004-09-16 2013-02-20 Necカシオモバイルコミュニケーションズ株式会社 Mobile terminal, information processing method, and information processing program
JP2007004486A (en) * 2005-06-23 2007-01-11 Nec Saitama Ltd Information distribution system
JP2008250818A (en) * 2007-03-30 2008-10-16 Omron Corp Program for portable terminal device and portable terminal device

Also Published As

Publication number Publication date
JP2010218041A (en) 2010-09-30

Similar Documents

Publication Publication Date Title
US11170248B2 (en) Video capture in data capture scenario
US12019675B2 (en) Recognizing text in image data
KR101199747B1 (en) Word recognition method and recording medium of program recognition word and information process device
US9589198B2 (en) Camera based method for text input and keyword detection
US9785627B2 (en) Automated form fill-in via form retrieval
JP4995554B2 (en) Retrieval method of personal information using knowledge base for optical character recognition correction
JP5896245B2 (en) How to crop a text image
JP6244892B2 (en) Word detection for optical character recognition that is invariant to local scaling, rotation, and display position of characters in a document
US8340426B2 (en) Apparatus and method for recognizing characters
JP5146190B2 (en) Character recognition device, character recognition program, and character recognition method
CN107451127B (en) Word translation method and system based on image and mobile device
JP2010217996A (en) Character recognition device, character recognition program, and character recognition method
CN115641594A (en) OCR technology-based identification card recognition method, storage medium and device
US8773733B2 (en) Image capture device for extracting textual information
JP6253354B2 (en) Form reading device, program, and form reading system
JP2006209599A (en) Portable terminal, character reading method, and character reading program
US8768058B2 (en) System for extracting text from a plurality of captured images of a document
US8908970B2 (en) Textual information extraction method using multiple images
JP5223739B2 (en) Portable character recognition device, character recognition program, and character recognition method
CN112749769A (en) Graphic code detection method and device, computer equipment and storage medium
CN107369130A (en) A kind of image processing method and terminal
JP2012226085A (en) Electronic apparatus, control method and control program
JP6705984B2 (en) Information processing apparatus, processing method thereof, and program
JP2020046734A (en) Information processing device and program
CN114708598A (en) Answer sheet identification method and device, storage medium and electronic equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130225

R150 Certificate of patent or registration of utility model

Ref document number: 5223739

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3