JP2005141520A - Method for setting character recognizing parameter in portable terminal and portable terminal - Google Patents

Method for setting character recognizing parameter in portable terminal and portable terminal Download PDF

Info

Publication number
JP2005141520A
JP2005141520A JP2003377731A JP2003377731A JP2005141520A JP 2005141520 A JP2005141520 A JP 2005141520A JP 2003377731 A JP2003377731 A JP 2003377731A JP 2003377731 A JP2003377731 A JP 2003377731A JP 2005141520 A JP2005141520 A JP 2005141520A
Authority
JP
Japan
Prior art keywords
character recognition
parameter
input
character
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003377731A
Other languages
Japanese (ja)
Inventor
Eisuke Asano
英輔 浅野
Hisao Ogata
日佐男 緒方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003377731A priority Critical patent/JP2005141520A/en
Publication of JP2005141520A publication Critical patent/JP2005141520A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To support mail and Internet connection, applications on WEB, and inputs such as registration, and to simplify the operation of a portable terminal. <P>SOLUTION: A parameter such as a character type or character line extracting parameter required for character recognition is automatically set in accordance with a driven application by using an OCR input as an input means to the application without cares by the user. Consequently time and labor for manually selecting an item to be inputted (recognized) can be eliminated and highly accurate character recognition processing can be realized. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、画像入力手段、具体的にはカメラを持った携帯端末または携帯電話等において、撮影した画像中の文字列を選択し文字認識する技術に関する。   The present invention relates to a technique for selecting and recognizing characters by selecting a character string in a photographed image using an image input means, specifically, a mobile terminal or a mobile phone having a camera.

従来、カメラから撮影した電話番号、URL、メールアドレス等のイメージデータを文字認識して、認識結果を入力とすることで文字入力の支援を行い、操作を簡便にすることが提案されている(例えば、特許文献1等参照)。   Conventionally, it has been proposed that character recognition is performed on image data such as a telephone number, a URL, and an e-mail address taken from a camera, and that the recognition result is used as an input to support character input and simplify the operation ( For example, see Patent Document 1).

また、インターネットに接続する際のURL入力方法として、バーコードや二次元バーコード、OCR等を用いる方法が提案されている(例えば、特許文献2等参照)。   As a URL input method for connecting to the Internet, a method using a barcode, a two-dimensional barcode, OCR, or the like has been proposed (see, for example, Patent Document 2).

特開2002−152696号公報(第3項〜第6項、第7図)JP 2002-152696 A (3rd to 6th terms, FIG. 7)

特開2003−198674号公報(第4項、第3図)Japanese Patent Laid-Open No. 2003-198674 (term 4, FIG. 3)

前者のOCRアプリケーションによる文字認識処理においては、例えば電話番号やURL、メールアドレス等の入力したい項目を利用者が選択した後にカメラで撮影し、文字認識処理を実施する。しかし、認識対象を手入力で選択する必要があり、多数の認識対象から該当する認識対象を選択するには手間がかかるという問題がある。   In the character recognition processing by the former OCR application, for example, after the user selects an item to be input such as a telephone number, URL, mail address, etc., a photograph is taken with a camera and character recognition processing is performed. However, there is a problem that it is necessary to manually select a recognition target, and it takes time to select a corresponding recognition target from a large number of recognition targets.

また、後者においては、起動中のアプリケーションの情報、例えばURLをOCR入力する場合、認識する文字の種類は英字、数字、記号に限定されるが、これらの情報を文字認識処理に利用しないため、カメラ撮影環境や認識対象文字によっては認識精度に大きなばらつきが生じ、OCR入力が全く機能しないことが考えられる。   In the latter case, when an OCR is input for information on an active application, for example, a URL, the types of characters to be recognized are limited to letters, numbers, and symbols. However, since these pieces of information are not used for character recognition processing, Depending on the camera shooting environment and characters to be recognized, the recognition accuracy may vary greatly, and OCR input may not function at all.

また、現在WEB上での申込や登録が可能となり、これらをサポートするWEBサイトが増加している。しかし、申込や登録の入力フォームは複数の入力項目があるため、現状では携帯端末によるOCR入力をサポートするに至っておらず、全て手入力で行わざるを得ない状況である。   In addition, applications and registration on the WEB are now possible, and the number of WEB sites that support these is increasing. However, since there are a plurality of input items in the application or registration input form, at present, OCR input by a mobile terminal has not been supported, and all of them must be manually input.

本発明は、かかる課題を解決するためになされたものであり、携帯端末によるメールやインターネット接続、WEB上での申込、登録等の入力を支援し、操作を簡便にすることを目的とする。   SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems, and an object of the present invention is to support the input of e-mail, Internet connection, application on the WEB, registration, and the like by a mobile terminal, and simplify the operation.

上記課題を解決するために、画像を入力する画像入力部(又はカメラ、撮像部)と、この入力部によって入力した画像データを表示する表示部と、利用者がボタンなどの入力操作する操作部と、画像内の文字を認識する文字認識部と、全体を制御する制御部を備えた携帯情報端末あるいは携帯電話において、翻訳アプリ、ブラウザ等のアプリケーションへの入力手段としてOCR入力を利用し、起動しているアプリケーションに応じて文字種や文字行抽出用パラメータ等の文字認識に必要となるパラメータを利用者が意識することなく自動で設定する方法を提案する。   In order to solve the above problems, an image input unit (or a camera or an imaging unit) for inputting an image, a display unit for displaying image data input by the input unit, and an operation unit for a user to perform input operations such as buttons And using a character recognition unit that recognizes characters in the image and a mobile information terminal or mobile phone having a control unit for controlling the whole, using an OCR input as an input means to an application such as a translation application or a browser, We propose a method for automatically setting parameters necessary for character recognition, such as character types and character line extraction parameters, without the user being aware of it according to the application being used.

携帯端末によるメールやインターネット接続、WEB上での申込、登録等の入力を支援し、操作を簡便にすることが可能となる。   It is possible to support the input of e-mail, Internet connection, application on the WEB, registration, and the like by a portable terminal, and the operation can be simplified.

以下、本発明の実施形態を図1から図5を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to FIGS. 1 to 5.

図1は本実施形態に係る画像入力手段をもつ携帯端末あるいは携帯電話100(又は単に携帯端末、携帯装置とも言う)の概略を示す構成図である。
名刺や雑誌、あるいは看板などの文字認識対象の画像が画像入力部110から入力され、文字認識部150において行候補の抽出を行い、文字行の候補(画像)を表示部120に表示する。利用者が操作部130を操作することで抽出した文字行候補から認識対象となる文字行を選択し、選択した文字行を認識部150において文字認識する。
FIG. 1 is a configuration diagram illustrating an outline of a mobile terminal or mobile phone 100 (or simply referred to as a mobile terminal or a mobile device) having an image input unit according to the present embodiment.
A character recognition target image such as a business card, a magazine, or a signboard is input from the image input unit 110, line candidates are extracted by the character recognition unit 150, and character line candidates (images) are displayed on the display unit 120. A user selects a character line to be recognized from character line candidates extracted by operating the operation unit 130, and the recognition unit 150 recognizes the selected character line.

文字認識部150は、起動中のアプリケーションに応じて文字認識用のパラメータを設定する文字認識パラメータ設定部151、画像入力部110により得られたイメージデータに対して、認識対象となる文字行を抽出する文字行抽出部152、抽出した文字行データから文字らしい矩形に分割する文字切出し部153、切出した文字矩形に対して1文字単位の文字認識を実施し文字コードに変換する文字識別部154、文字識別結果を予め具備している単語辞書もしくは表記辞書と照合し、照合結果を文字認識結果とする知識照合部155から構成される。   The character recognition unit 150 extracts a character line to be recognized from the image data obtained by the character recognition parameter setting unit 151 and the image input unit 110 that set parameters for character recognition according to the running application. A character line extraction unit 152 that performs character recognition from the extracted character line data into character-like rectangles, a character identification unit 154 that performs character recognition on a character rectangle basis and converts the character rectangles into character codes, It comprises a knowledge collation unit 155 that collates a character dictionary with a word dictionary or a notation dictionary provided in advance and uses the collation result as a character recognition result.

また、本実施例ではGPS(Global Positioning System)160を備えて自端末の位置情報を入手可能な構成としているが、本願発明上、必ずしも必須の要素ではない。   In the present embodiment, the GPS (Global Positioning System) 160 is provided to obtain the location information of the terminal itself, but this is not necessarily an essential element in the present invention.

なお、文字認識部150、操作部130、画像入力部110、表示部120などの各部、各ユニットの制御は、CPU、メモリ等から構成される制御部140によってその機能が制御される。尚、上述及び以下に説明する各部は、手段、機構、ユニットとも表現でき、基本的にソフトウェア又はハード、又はソフトウェアとハードとの結合によって処理、制御される機能である。なお、撮影、取得、入力などされた画像は、後述する文字認識に用いるように、制御部等のメモリ又は携帯端末に備わるメモリカードに記憶しておくような態様が望ましい。   The functions of each unit and unit such as the character recognition unit 150, the operation unit 130, the image input unit 110, and the display unit 120 are controlled by a control unit 140 including a CPU, a memory, and the like. Each unit described above and below can be expressed as means, mechanism, and unit, and is basically a function that is processed and controlled by software or hardware, or a combination of software and hardware. It should be noted that it is desirable that an image captured, acquired, input, or the like is stored in a memory such as a control unit or a memory card provided in a portable terminal so as to be used for character recognition described later.

図2は図1の携帯端末を使用した基本的な文字認識部150の文字行抽出から認識結果を得るまでの主な文字認識処理を説明する図である。以下に示す処理、制御は制御部、制御手段140によって主に行われるが説明を省略する。
利用者は、携帯情報端末あるいは携帯電話100が具備するCCDやイメージセンサ等の画像入力手段110を用いて、文字認識対象となる名刺や雑誌、あるいは看板などの画像を撮影し、取込んだディジタル画像200に対して文字行抽出部152により文字行210を抽出し、表示部120に表示する。利用者は表示した文字行210から、認識対象文字行を操作部130で選択する。認識対象文字行220に対して、文字切出し部153では1文字毎に切り出し、文字識別部154では各文字の文字識別処理を実行し、文字認識ネットワーク230を生成する。文字認識ネットワーク230は、文字識別の候補文字をネットワーク表現しメモリに格納したものである。文字認識ネットワーク230には、間違った文字識別の候補文字(図面の「|」「/」など)や、認識対象文字列の前後に不要な文字列(図面の「T」「e」「直」など)が含まれる場合がある。そこで、文字認識ネットワーク230と、予め具備する表記辞書240との照合を知識照合部155で行い、表記と照合が一致した箇所の文字列を抽出することで、正しい認識結果250を簡単に、短時間な処理で得ることができる。
FIG. 2 is a diagram for explaining main character recognition processing from the character line extraction of the basic character recognition unit 150 using the portable terminal of FIG. 1 to obtaining a recognition result. The processing and control described below are mainly performed by the control unit and control unit 140, but the description is omitted.
A user uses an image input means 110 such as a CCD or an image sensor provided in the portable information terminal or the cellular phone 100 to shoot an image of a business card, magazine, or signboard that is a character recognition target, A character line 210 is extracted from the image 200 by the character line extraction unit 152 and displayed on the display unit 120. The user uses the operation unit 130 to select a recognition target character line from the displayed character line 210. The character cutout unit 153 cuts out the recognition target character line 220 for each character, and the character identification unit 154 executes character recognition processing for each character to generate the character recognition network 230. The character recognition network 230 is a network representation of candidate characters for character identification and stored in a memory. The character recognition network 230 includes incorrect character identification candidate characters (such as “|” and “/” in the drawing) and unnecessary character strings (“T”, “e”, and “direct” in the drawing) before and after the character string to be recognized. Etc.) may be included. Therefore, collation between the character recognition network 230 and the notation dictionary 240 provided in advance is performed by the knowledge collation unit 155, and a character string at a position where the notation and the collation match is extracted, so that the correct recognition result 250 can be easily and quickly shortened. It can be obtained with time-consuming processing.

また図2は、表記辞書240として電話番号の複数の表記パターンを予め記憶しておく例を示し、この表記辞書と上記抽出した文字列とを照合し、そのうち1つの表記241と一致した電話番号部分のみを認識結果文字列231として抽出した例も示している。なお、上記では表記辞書を用いて説明したが、単語辞書を用いて照合処理を行うことも可能である。   FIG. 2 shows an example in which a plurality of phone number notation patterns are stored in advance as the notation dictionary 240. The notation dictionary is compared with the extracted character string, and a phone number that matches one of the notations 241 is shown. An example in which only a portion is extracted as a recognition result character string 231 is also shown. In the above description, the description dictionary is used, but it is also possible to perform collation processing using a word dictionary.

そして最終的に認識できた認識結果250は携帯端末の制御部140等にあるメモリに記憶、そして表示部120に表示され、利用者がその後に操作する内容に併せて、文字のテキストベースによる編集が可能となる。   The finally recognized recognition result 250 is stored in a memory in the control unit 140 of the portable terminal, and is displayed on the display unit 120, and the text-based editing of characters is performed in accordance with the content that the user subsequently operates. Is possible.

図3はアプリケーション起動から実行までの処理を説明する図である。   FIG. 3 is a diagram for explaining processing from application activation to execution.

利用者は、携帯電話100の表示部120に表示したアプリケーション300を操作部130により選択、確定し、起動する(ステップS100)。アプリケーションの例としては、メールアプリ、ブラウザ、翻訳アプリ、テキストエディタ等が挙げられる。
次に利用者は、入力モードを操作部130により選択する(ステップS200)。入力モード310には、直接(手)入力、リストから選択、OCR入力、バーコード入力、二次元バーコード入力、GPS入力等が考えられる。入力項目は、メールアプリの場合はメールアドレスを、ブラウザの場合はURLを指すといったように、各アプリケーション実行時に入力が必要となるものである。
利用者が選択した入力モードに応じて画像入力の有無(ステップS300)、GPS入力の有無(ステップS700)を制御部140が決定する。例えば、直接入力やリストから選択する場合は、利用者が入力項目を操作部130を使用し入力もしくは選択(ステップS900)するため画像入力やGPS入力の必要はない。一方、OCR入力やバーコード入力の場合は、イメージデータを入力補助に使用するため画像入力部110による画像入力(ステップS400)が必要である。また、GPS入力の場合はGPS160が必要となる。GPS入力の場合は認識処理を行うことはなく、GPS160から得られた位置情報を入力情報として利用し、入力項目に設定する(ステップS800)。例えば、行き先案内を支援する路線案内アプリにおいて現在の駅名を入力項目に設定する場合、GPS160から得られた所在地を基に自動で駅名を検索、設定するといったことが考えられる。
The user selects, confirms and activates the application 300 displayed on the display unit 120 of the mobile phone 100 using the operation unit 130 (step S100). Examples of applications include a mail application, a browser, a translation application, a text editor, and the like.
Next, the user selects an input mode using the operation unit 130 (step S200). As the input mode 310, direct (hand) input, selection from a list, OCR input, barcode input, two-dimensional barcode input, GPS input, and the like are conceivable. The input item needs to be input when each application is executed, such as an email address in the case of a mail application and a URL in the case of a browser.
The controller 140 determines the presence / absence of image input (step S300) and the presence / absence of GPS input (step S700) according to the input mode selected by the user. For example, when selecting directly from a list or selecting from a list, the user inputs or selects an input item using the operation unit 130 (step S900), so there is no need for image input or GPS input. On the other hand, in the case of OCR input or barcode input, image input (step S400) by the image input unit 110 is necessary in order to use image data for input assistance. In the case of GPS input, GPS 160 is required. In the case of GPS input, recognition processing is not performed, and position information obtained from the GPS 160 is used as input information and set as an input item (step S800). For example, when setting the current station name as an input item in a route guidance application that supports destination guidance, it is conceivable that the station name is automatically searched and set based on the location obtained from the GPS 160.

画像入力部110により得られたイメージデータに対して認識処理(ステップS500)を行う。入力がOCR入力の場合は文字認識部150において文字認識処理を、バーコード入力の場合はバーコード認識処理を行う。認識結果を入力項目に設定する(ステップS600)。もし、認識結果に誤りがあれば利用者が操作部130を使用し、修正する必要がある。また、画像入力部110を用いて再度認識させることも可能である。   A recognition process (step S500) is performed on the image data obtained by the image input unit 110. If the input is OCR input, the character recognition unit 150 performs character recognition processing, and if the input is barcode input, performs barcode recognition processing. The recognition result is set as an input item (step S600). If there is an error in the recognition result, the user must use the operation unit 130 to correct it. It is also possible to make it recognize again using the image input unit 110.

入力項目の設定が終了すると、起動アプリケーションに応じた処理を実行する(ステップS1000)。例えば、メールアプリの場合は画像入力手段110により入力したメールアドレスにメールを送信、電話帳にメールアドレスを登録するといったことが考えられる。また、翻訳アプリの場合は、認識した単語を翻訳し、結果を表示部120に表示することが考えられる。   When the input item setting is completed, processing corresponding to the activated application is executed (step S1000). For example, in the case of a mail application, it is conceivable to send a mail to the mail address input by the image input means 110 and register the mail address in the phone book. In the case of a translation application, it is conceivable to translate the recognized word and display the result on the display unit 120.

図4は文字認識部150における文字認識パラメータ設定部151の処理を説明する図であり、携帯端末単独による文字認識パラメータ設定方法を説明する。   FIG. 4 is a diagram for explaining processing of the character recognition parameter setting unit 151 in the character recognition unit 150, and describes a character recognition parameter setting method using a portable terminal alone.

制御部140は、利用者が選択した入力モードがOCR入力か否かをチェックし(ステップS501)、OCR入力でない場合は何もしない。OCR入力の場合、アプリケーションに応じて文字認識用パラメータである文字行パラメータの設定(S502)、文字種パラメータの設定(S503)、知識辞書パラメータの設定(S504)を行う。   The control unit 140 checks whether or not the input mode selected by the user is OCR input (step S501), and does nothing if it is not OCR input. In the case of OCR input, character line parameters (S502), character type parameters (S503), and knowledge dictionary parameters (S504) are set according to the application.

文字行パラメータとは、文字行抽出部152に使用するパラメータであり、抽出する文字行の最大幅/高さ、最小幅/高さ等のパラメータを指す。文字種パラメータとは、文字識別部153に使用するパラメータであり、数字、英字、漢字等の字種を指す。知識辞書パラメータとは、知識照合部154に使用するパラメータであり、英単語、URL等の単語辞書を指す。   The character line parameters are parameters used for the character line extraction unit 152, and indicate parameters such as the maximum width / height and minimum width / height of the character line to be extracted. The character type parameter is a parameter used for the character identification unit 153 and indicates a character type such as a number, an alphabetic character, or a Chinese character. The knowledge dictionary parameter is a parameter used for the knowledge matching unit 154, and indicates a word dictionary such as English words and URLs.

例えば、起動中のアプリケーションが英単語翻訳アプリの場合、文字行抽出パラメータは短い文字行を抽出するのに最適な英単語抽出用パラメータに設定される。文字種パラメータは英単語に使用する英字と一部の記号の文字種に設定される。また、知識辞書パラメータは英単語用知識辞書に設定される。   For example, when the active application is an English word translation application, the character line extraction parameter is set to an optimum English word extraction parameter for extracting a short character line. The character type parameter is set to the character type of English characters and some symbols used for English words. The knowledge dictionary parameter is set in the knowledge dictionary for English words.

このように「起動アプリケーション−文字認識パラメータテーブル」として、下記のようなテーブルを予め設定しておくことで、起動中のアプリケーションに応じた文字認識パラメータの自動設定が可能となる。
アプリケーション :英単語翻訳
文字行パラメータ :単語抽出用パラメータ(幅:x、高さ:y、etc)
文字種パラメータ :英字+記号(「−」、「' 」、etc)
知識辞書パラメータ:英単語
また、GPS160を併用することでも文字認識用パラメータの設定が可能である。例えば、海外で翻訳アプリを使用する場合において、GPS160から得られた所在地に応じて、文字種パラメータを英語、フランス語、ドイツ語、中国語といったように自動で切り替えるとことが可能となる。さらに、翻訳アプリの翻訳言語も上記と同様にGPSから得られた所在地に応じて切り替えることが可能となる。
Thus, by setting the following table in advance as the “activation application-character recognition parameter table”, it is possible to automatically set the character recognition parameters according to the application being activated.
Application: English word translation Character line parameters: Word extraction parameters (width: x, height: y, etc)
Character type parameter: Alphabet + symbol ("-", "'", etc)
Knowledge dictionary parameters: English words Character recognition parameters can also be set by using GPS 160 together. For example, when a translation application is used overseas, the character type parameter can be automatically switched to English, French, German, Chinese, etc. according to the location obtained from the GPS 160. Further, the translation language of the translation application can be switched according to the location obtained from the GPS as described above.

上記で設定した文字認識用パラメータを基に、文字行抽出処理、文字切出し処理、文字識別処理、知識照合処理等の文字認識処理(ステップS505)を行う。   Based on the character recognition parameters set above, character recognition processing (step S505) such as character line extraction processing, character extraction processing, character identification processing, and knowledge matching processing is performed.

図5はWEBを利用した文字認識パラメータ設定処理を説明する図であり、通信を介した文字認識パラメータ設定方法を説明する。   FIG. 5 is a diagram for explaining a character recognition parameter setting process using WEB, and a character recognition parameter setting method through communication.

あるWEB上で公開しているプレゼント応募用紙欄(氏名欄、住所欄)の入力に携帯端末のOCR入力を使用する例を挙げて説明する。   An example will be described in which the OCR input of a portable terminal is used for inputting a present application form field (name field, address field) published on a certain WEB.

利用者は、携帯電話100の表示部120に表示したアプリケーション300を操作部130により選択した後に、ブラウザを起動し(ステップS1000)、指定のWEBサイトにアクセスする(ステップS2000)。アクセスしたWEBサイト上で公開しているプレゼント応募用紙欄に入力する際に、前記で説明したように利用者が入力モード310を選択し、制御部140がOCR入力か否かをチェックする(ステップS3000)。OCR入力でない場合は、直接入力もしくはバーコード入力や二次元バーコード入力等の入力手段により入力する(ステップS4000)。OCR入力の場合は、応募用紙フォームをWEBサイトからダウンロードする(ステップS5000)。応募用紙フォームとは、何の項目をどの順番で入力するかの情報であり、例えば、1番目に氏名を、2番目に住所を入力するといった情報である。   The user selects the application 300 displayed on the display unit 120 of the mobile phone 100 using the operation unit 130, and then activates the browser (step S1000) and accesses the designated WEB site (step S2000). When inputting in the present application form field published on the accessed WEB site, the user selects the input mode 310 as described above, and the control unit 140 checks whether or not the input is an OCR input (step S100). S3000). If it is not OCR input, it is input directly or by input means such as barcode input or two-dimensional barcode input (step S4000). In the case of OCR input, the application form is downloaded from the WEB site (step S5000). The application form is information on what items are input in which order, for example, information such as inputting a name first and an address second.

次に、入力の必要がある項目が存在するか否かをチェックし(ステップS6000)、入力項目の設定が必要であれば、その項目に該当する箇所を画像入力部110を用いてイメージデータを取得する(ステップS7000)。得られたイメージデータに対して、文字認識部150により文字認識処理(ステップS8000)を行う。この時、応募用紙フォームから認識する項目が既にわかっているため、この情報を基に文字認識パラメータ設定部151が文字認識用パラメータを設定する。例えば、応募用紙フォームから1番目に入力する項目は氏名であることがわかっているので、氏名認識用のパラメータを設定する。前記の携帯端末単独による文字認識パラメータ設定方法と異なるのは、文字認識パラメータを起動中のアプリケーションではなく、入力項目の属性に対応づけていることである。   Next, it is checked whether or not there is an item that needs to be input (step S6000). If the input item needs to be set, the image input unit 110 is used to input the image data to the location corresponding to the item. Obtain (step S7000). Character recognition processing (step S8000) is performed on the obtained image data by the character recognition unit 150. At this time, since the items recognized from the application form are already known, the character recognition parameter setting unit 151 sets the parameters for character recognition based on this information. For example, since it is known that the first item to be entered from the application form is a name, a parameter for name recognition is set. The difference from the character recognition parameter setting method by the mobile terminal alone is that the character recognition parameter is associated with the attribute of the input item, not the active application.

このように「入力属性−文字認識パラメータテーブル」として、下記のようなテーブルを予め設定しておくことで、入力属性に応じた文字認識パラメータの自動設定が可能となる。
入力属性 :氏名
文字行パラメータ :氏名抽出用パラメータ(幅:α、高さ:β、etc)
文字種パラメータ :漢字+カタカナ+ひらがな
知識辞書パラメータ:氏名
認識結果を入力項目に設定する(ステップS9000)。もし、認識結果に誤りがあれば利用者が操作部130を使用し、修正する必要がある。また、画像入力部110を用いて再度認識させることも可能である。
As described above, by setting the following table in advance as the “input attribute-character recognition parameter table”, it is possible to automatically set the character recognition parameter in accordance with the input attribute.
Input attribute: Name Character line parameter: Name extraction parameter (width: α, height: β, etc)
Character type parameter: Kanji + Katakana + Hiragana Knowledge dictionary parameter: Name The recognition result is set as an input item (step S9000). If there is an error in the recognition result, the user must use the operation unit 130 to correct it. It is also possible to make it recognize again using the image input unit 110.

前記処理を応募用紙フォームに記してある入力項目数だけ繰り返し、入力項目がなくなった時点で、全ての入力項目が設定済みである応募用紙を操作部130を使用して利用者がWEBサイトに送信し(ステップS10000)、応募を完了する。   The above process is repeated for the number of input items indicated on the application form, and when there are no more input items, the user sends the application form with all input items set to the WEB site using the operation unit 130. (Step S10000) and the application is completed.

以上のように、利用者が意識することなく、WEBサイトから得られる情報を基に文字認識パラメータを自動で設定するので、読み取りたい項目を手入力する必要はなく かつ 高精度な文字認識処理の実現が可能となり、入力操作を大幅にを簡便することが可能となる。   As described above, the character recognition parameters are automatically set based on information obtained from the WEB site without the user's awareness, so there is no need to manually input items to be read and high-precision character recognition processing. This can be realized, and the input operation can be greatly simplified.

実施例としてのカメラ付き携帯電話の概略構成を示す説明図である。It is explanatory drawing which shows schematic structure of the mobile phone with a camera as an Example. 携帯端末による文字認識処理のフローチャートである。It is a flowchart of the character recognition process by a portable terminal. アプリケーション起動/実行までのフローチャートである。It is a flowchart until application activation / execution. 文字認識パラメータ設定処理のフローチャートである。It is a flowchart of a character recognition parameter setting process. WEBを利用した文字認識パラメータ設定処理のフローチャートである。It is a flowchart of the character recognition parameter setting process using WEB.

符号の説明Explanation of symbols

100…携帯端末(携帯電話)、110…画像入力部、120…表示部、130…操作部、140…制御部、150…文字認識部、151…文字認識パラメータ設定部、152…文字行抽出部、153…文字切出し部、154…文字識別部、155…知識照合部、200…入力画像、210…抽出文字行、220…認識対象文字行、230…文字認識ネットワーク、231…照合の対象となる文字行、240…表記辞書、241…照合の対象となる表記、250…認識結果、300…アプリケーション選択画面、310…入力モード選択画面
DESCRIPTION OF SYMBOLS 100 ... Mobile terminal (mobile phone), 110 ... Image input part, 120 ... Display part, 130 ... Operation part, 140 ... Control part, 150 ... Character recognition part, 151 ... Character recognition parameter setting part, 152 ... Character line extraction part 153 ... Character extraction unit, 154 ... Character identification unit, 155 ... Knowledge verification unit, 200 ... Input image, 210 ... Extracted character line, 220 ... Recognized character line, 230 ... Character recognition network, 231 ... Target for verification Character line, 240 ... notation dictionary, 241 ... notation to be verified, 250 ... recognition result, 300 ... application selection screen, 310 ... input mode selection screen

Claims (8)

画像を入力する画像入力部と、
前記入力された画像を表示する表示部と、
前記入力された画像に含まれる文字データを認識する文字認識部と、
前記各部を制御する制御部と
を有する携帯端末であって、
前記制御部は起動中のアプリケーションに応じて文字認識処理用パラメータを自動で設定することを特徴とする携帯端末。
An image input unit for inputting an image;
A display unit for displaying the input image;
A character recognition unit for recognizing character data included in the input image;
A portable terminal having a control unit for controlling each unit,
The mobile terminal according to claim 1, wherein the control unit automatically sets a parameter for character recognition processing according to a running application.
請求項1に記載の携帯端末であって、
前記制御部はWEBサイトからダウンロードした入力フォームに基いて、文字認識用パラメータを自動で設定することを特徴とする携帯端末。
The mobile terminal according to claim 1,
The control unit automatically sets a parameter for character recognition based on an input form downloaded from a WEB site.
請求項1または2に記載の携帯端末であって、
前記制御部はWEBサイトからダウンロードした入力フォームに基いて、対象とする文字認識項目及び認識する順序を自動で設定することを特徴とする携帯端末。
The mobile terminal according to claim 1 or 2,
The mobile terminal according to claim 1, wherein the control unit automatically sets a target character recognition item and a recognition order based on an input form downloaded from a WEB site.
請求項1から3に記載の携帯端末であって、
位置情報を取得するGPSをさらに有し、
前記制御部は前記GPSから得られる位置情報に基いて文字認識用パラメータを自動で設定することを特徴とする携帯端末。
The mobile terminal according to claim 1, wherein
It further has a GPS for acquiring location information,
The portable terminal according to claim 1, wherein the control unit automatically sets a parameter for character recognition based on position information obtained from the GPS.
携帯端末に入力された画像データの文字認識用パラメータの設定方法であって、
アプリケーションを起動するステップと、
画像を入力するステップと、
前記アプリケーションの種別に応じて文字認識処理用パラメータを自動で設定するステップと、
からなることを特徴とするとを特徴とする携帯端末における文字認識用パラメータの設定方法。
A method for setting a character recognition parameter for image data input to a mobile terminal,
Launching the application; and
Inputting an image;
Automatically setting a parameter for character recognition processing according to the type of the application;
A method for setting a parameter for character recognition in a portable terminal characterized by comprising:
請求項5に記載の携帯端末における文字認識用パラメータの設定方法であって、
前記文字認識処理用パラメータを自動で設定するステップは、WEBサイトからダウンロードした入力フォームに基いて、文字認識用パラメータを自動で設定することを特徴とする携帯端末における文字認識用パラメータの設定方法。
A method for setting a parameter for character recognition in the mobile terminal according to claim 5,
The step of automatically setting the character recognition processing parameter sets the character recognition parameter automatically based on an input form downloaded from a WEB site.
請求項5または6に記載の携帯端末における文字認識用パラメータの設定方法であって、
前記文字認識処理用パラメータを自動で設定するステップは、WEBサイトからダウンロードした入力フォームに基いて、対象とする文字認識項目及び認識する順序を自動で設定することを特徴とする携帯端末における文字認識用パラメータの設定方法。
A method for setting a parameter for character recognition in a mobile terminal according to claim 5 or 6,
The step of automatically setting the parameter for character recognition processing includes automatically setting a target character recognition item and a recognition order based on an input form downloaded from a WEB site. How to set parameters for use.
請求項5から7に記載の携帯端末における文字認識用パラメータの設定方法であって、
前記文字認識処理用パラメータを自動で設定するステップは、GPSにより位置情報を取得するステップをさらに有し、該GPSから得られる位置情報に基いて文字認識用パラメータを自動で設定することを特徴とする携帯端末における文字認識用パラメータの設定方法。
A method for setting a parameter for character recognition in the mobile terminal according to claim 5,
The step of automatically setting the parameter for character recognition processing further includes the step of acquiring position information by GPS, and automatically setting the parameter for character recognition based on the position information obtained from the GPS. To set parameter for character recognition in portable terminal.
JP2003377731A 2003-11-07 2003-11-07 Method for setting character recognizing parameter in portable terminal and portable terminal Pending JP2005141520A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003377731A JP2005141520A (en) 2003-11-07 2003-11-07 Method for setting character recognizing parameter in portable terminal and portable terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003377731A JP2005141520A (en) 2003-11-07 2003-11-07 Method for setting character recognizing parameter in portable terminal and portable terminal

Publications (1)

Publication Number Publication Date
JP2005141520A true JP2005141520A (en) 2005-06-02

Family

ID=34688333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003377731A Pending JP2005141520A (en) 2003-11-07 2003-11-07 Method for setting character recognizing parameter in portable terminal and portable terminal

Country Status (1)

Country Link
JP (1) JP2005141520A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164253A (en) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> Video character recognition system, video character recognition method, program, and recording medium
JP2014102848A (en) * 2014-01-08 2014-06-05 Ricoh Co Ltd Image processing system, image processing method, device, parameter specification method, program, and recording medium
JP2021140808A (en) * 2019-11-07 2021-09-16 株式会社リコー Image forming device, method for controlling browser, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164253A (en) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> Video character recognition system, video character recognition method, program, and recording medium
JP2014102848A (en) * 2014-01-08 2014-06-05 Ricoh Co Ltd Image processing system, image processing method, device, parameter specification method, program, and recording medium
JP2021140808A (en) * 2019-11-07 2021-09-16 株式会社リコー Image forming device, method for controlling browser, and program
JP7156446B2 (en) 2019-11-07 2022-10-19 株式会社リコー Server, system, control method and program

Similar Documents

Publication Publication Date Title
JP4995554B2 (en) Retrieval method of personal information using knowledge base for optical character recognition correction
US7305435B2 (en) Internet access via smartphone camera
EP2383970B1 (en) Camera based method for text input and keyword detection
US8340426B2 (en) Apparatus and method for recognizing characters
KR20140030361A (en) Apparatus and method for recognizing a character in terminal equipment
KR20110076750A (en) Word recognition method and recording medium of program recognition word and information process device
KR20030021120A (en) Mobile device and transmission system
CN108256523B (en) Identification method and device based on mobile terminal and computer readable storage medium
JP6531738B2 (en) Image processing device
US7697722B2 (en) Portable terminal and character reading method using a portable terminal
JP4443194B2 (en) Processing object selection method in portable terminal character recognition and portable terminal
JP2007025980A (en) Information system, information method, server device, information device, and information designation program
JP6253354B2 (en) Form reading device, program, and form reading system
JP4597644B2 (en) Character recognition device, program and recording medium
JP2005141520A (en) Method for setting character recognizing parameter in portable terminal and portable terminal
JP4576211B2 (en) Document information retrieval system
JP2008282094A (en) Character recognition processing apparatus
CN104252475A (en) Method and device for positioning text messages in picture
JP4474231B2 (en) Document link information acquisition system
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2008040910A (en) Character string determining device, character string determining method, character string determination program and computer readable recording medium
JP2003152829A (en) Communication apparatus
JP6408055B2 (en) Information processing apparatus, method, and program
JP2005346627A (en) Data name determination device
JP4431335B2 (en) String reader

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060315

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060509

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060821

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090421

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090908