JP2000348142A - Character recognizing device, method therefor and recording medium for recording program executing the method - Google Patents

Character recognizing device, method therefor and recording medium for recording program executing the method

Info

Publication number
JP2000348142A
JP2000348142A JP11160404A JP16040499A JP2000348142A JP 2000348142 A JP2000348142 A JP 2000348142A JP 11160404 A JP11160404 A JP 11160404A JP 16040499 A JP16040499 A JP 16040499A JP 2000348142 A JP2000348142 A JP 2000348142A
Authority
JP
Japan
Prior art keywords
character
word
image
information
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11160404A
Other languages
Japanese (ja)
Inventor
Mai Araki
麻衣 荒木
Haruhiko Kojima
治彦 児島
Hidekatsu Kuwano
秀豪 桑野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11160404A priority Critical patent/JP2000348142A/en
Publication of JP2000348142A publication Critical patent/JP2000348142A/en
Pending legal-status Critical Current

Links

Landscapes

  • Position Fixing By Use Of Radio Waves (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To realize quick word collation of high precision at the time of recognizing a character string included in a picture of a signboard or the like. SOLUTION: A picture including character information like an enterprise name, a telephone number, or a personal name is inputted (2), and character pictures are segmented from the inputted picture, and segmented character pictures are recognized to output a recognition result character code string (3 to 5). Position information of the place where the picture was inputted is acquired (6), and the range of information in a word dictionary 1 used for word collation is narrowed down on the basis of acquired position information (7). Narrowed-down information in the word dictionary 1 is used to collate words in the word dictionary 1 with the recognition result character code string (8), and a word of which the number of characters coinciding with the recognition result characters is largest as the word collation result is outputted as the character recognition result (9).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は,屋外において入力
された情景画像中の企業名や電話番号,個人名等を認識
するための効果的な単語照合を行う文字認識技術に関す
るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition technology for performing effective word matching for recognizing a company name, a telephone number, a personal name and the like in a scene image input outdoors.

【0002】[0002]

【従来の技術】看板などの屋外の対象に対しては,高い
文字認識精度が期待できないため,従来の単語照合方法
では,単語照合を行っても一意に絞り込むのが困難であ
った。そのため,例えば,「荒木,宮本,鈴木,中村,
杉村,“複数情報の統合による看板文字認識”,199
8信学会ソ大会D−12−25」,特願平10−222
913号(文字認識装置)のように,複数文字列の文字
認識結果を統合することによって単語照合を行うものが
提案されているが,単語辞書の規模が大きい場合には,
絞り込みが困難となってしまう場合が生じる。
2. Description of the Related Art Since a high character recognition accuracy cannot be expected for an outdoor object such as a signboard, it is difficult to uniquely narrow down the words by the conventional word matching method. Therefore, for example, "Araki, Miyamoto, Suzuki, Nakamura,
Sugimura, "Signboard Character Recognition by Integration of Multiple Information", 199
8 IEICE D-12-25 ", Japanese Patent Application No. 10-222.
No. 913 (character recognition device) has been proposed that performs word matching by integrating the character recognition results of multiple character strings. However, when the size of a word dictionary is large,
In some cases, narrowing down becomes difficult.

【0003】[0003]

【発明が解決しようとする課題】そのため,低い精度の
文字認識結果を用いた場合の単語照合処理の効果を上げ
るためには,誤認識文字による誤照合文字列を減少させ
るために,単語辞書の絞り込みが必要である。
Therefore, in order to improve the effect of the word matching process when using a low-accuracy character recognition result, in order to reduce the number of erroneous matching character strings due to erroneously recognized characters, a word dictionary is required. It is necessary to narrow down.

【0004】本発明は上記事情に鑑みてなされたもの
で,その目的とするところは,位置情報が含まれる単語
辞書と,画像を取得した場所についての位置情報を利用
することにより,低品質な文字認識結果に対する効果的
な単語照合方法を実現し,精度良く正解単語を得る文字
認識装置を提供することにある。
The present invention has been made in view of the above circumstances, and has as its object the use of a word dictionary including position information and position information on a place where an image has been acquired, thereby realizing low quality. An object of the present invention is to provide a character recognition device that realizes an effective word matching method for character recognition results and obtains correct words with high accuracy.

【0005】[0005]

【課題を解決するための手段】上記の課題を解決するた
めに,本発明は,位置情報の利用に着目し,位置情報と
結び付けられた単語辞書を用いることで単語照合に使用
する単語辞書の範囲を絞り込み,単語照合精度を向上さ
せる。
SUMMARY OF THE INVENTION In order to solve the above problems, the present invention focuses on the use of location information, and uses a word dictionary linked to the location information to form a word dictionary used for word matching. Narrow the range and improve word matching accuracy.

【0006】そのための手段として,企業名や電話番
号,個人名と住所とが対になって格納されている単語辞
書と,企業名や電話番号を含む画像を入力する画像入力
部と,入力された画像から文字列領域を切り出す文字列
切り出し部と,全文字列ついて,一文字ずつの文字画像
領域を求めて文字画像を切り出す文字切り出し部と,切
り出された文字画像の認識を行って認識結果文字コ―ド
列を出力する文字認識部と,画像が入力された場所の位
置情報をPHS(Personal Handyphone System)やGP
S(Global Positioning System)を用いて取得する位置
情報取得部と,取得された位置情報を基に単語辞書内の
位置情報で絞り込みを行い,単語照合に使用する単語辞
書の部分を選択する単語辞書選択部と,文字認識部によ
り得られた文字コード列と,単語辞書選択部により得ら
れた単語辞書との間で単語照合を行う単語照合部と,単
語照合部により得られた結果の中でもっとも一致文字数
の多い結果を出力する出力部とから構成されることを特
徴とする。
As means for this, a word dictionary in which company names, telephone numbers, personal names and addresses are stored in pairs, and an image input section for inputting images containing company names and telephone numbers, are provided. A character string cutout unit that cuts out a character string area from the extracted image, a character cutout unit that cuts out a character image for each character string in a character image area for all character strings, and a recognition result character that performs recognition of the cutout character image. A character recognition unit that outputs a code sequence, and position information of a place where an image is input are stored in a PHS (Personal Handyphone System) or GP.
A position information acquisition unit that acquires using the S (Global Positioning System), and a word dictionary that narrows down the position information in the word dictionary based on the acquired position information and selects a part of the word dictionary used for word matching A word matching unit that performs word matching between a selecting unit, a character code string obtained by a character recognizing unit, and a word dictionary obtained by a word dictionary selecting unit, and a result obtained by the word matching unit. And an output unit for outputting a result having the largest number of matching characters.

【0007】本発明の作用は以下のとおりである。本発
明では,位置情報を利用して単語辞書の選択を行うこと
により,より少ない単語辞書と文字認識結果との照合を
行うことで,誤照合を減少させることが可能となる。ま
た,同じ名前の企業名や個人名が存在した場合や,市外
局番の書かれていない電話番号を認識しようとした場合
でも,位置情報の利用によって正解を得ることが可能と
なる。
The operation of the present invention is as follows. According to the present invention, by selecting a word dictionary using position information, it is possible to reduce erroneous matching by comparing less word dictionaries with character recognition results. In addition, even when a company name or an individual name having the same name exists, or when an attempt is made to recognize a telephone number without an area code, a correct answer can be obtained by using the location information.

【0008】[0008]

【発明の実施の形態】図1は,本発明の実施の形態に係
る文字認識装置の全体概要を示すブロック図である。本
実施の形態の文字認識装置は,単語辞書1,画像入力部
2,文字列切り出し部3,文字切り出し部4,文字認識
部5,位置情報取得部6,単語辞書選択部7,単語照合
部8,出力部9から構成されている。
FIG. 1 is a block diagram showing an overall outline of a character recognition device according to an embodiment of the present invention. The character recognition device according to the present embodiment includes a word dictionary 1, an image input unit 2, a character string cutout unit 3, a character cutout unit 4, a character recognition unit 5, a position information acquisition unit 6, a word dictionary selection unit 7, a word collation unit. And an output unit 9.

【0009】単語辞書1には,企業名と住所,電話番号
と住所,あるいは個人名と住所などが対になって格納さ
れている。単語辞書1としては例えばタウンページ等の
電話帳データベースを用いることが考えられる。
The word dictionary 1 stores a company name and an address, a telephone number and an address, or a personal name and an address in pairs. As the word dictionary 1, for example, a telephone directory database such as a town page may be used.

【0010】画像入力部2では,企業名や電話番号,個
人名を含む画像の入力を行う。これは,例えば看板や駅
看板,ポスター等のプレート型の文字情報を含む画像で
ある。文字列切り出し部3では,画像入力部2で入力さ
れた画像から,文字列画像を切り出す。文字サイズの変
動が小さく,縦あるいは横一列に並んだ文字のかたまり
を一文字列として切り出す。ここでは,例えば駅看板な
ら看板中に書かれた広告主名,電話番号,住所等の文字
列が,ポスターならポスターのタイトルや連絡先等の複
数行にまたがる文字列がすべて切り出されることにな
る。
The image input unit 2 inputs an image including a company name, a telephone number, and a personal name. This is an image including plate-type character information such as a signboard, a station signboard, and a poster. The character string cutout unit 3 cuts out a character string image from the image input by the image input unit 2. A chunk of characters arranged in a vertical or horizontal line with small variations in character size is cut out as one character string. Here, for example, a character string such as an advertiser name, telephone number, address, etc. written on a signboard for a station sign, and a character string extending over multiple lines such as a poster title and contact information for a poster are all cut out. .

【0011】文字切り出し部4では,文字列切り出し部
3で切り出された文字列画像のすべてについて,1文字
分ずつ文字画像を切り出し,文字サイズの算出を行う。
この文字切り出し部4により,背景とのコントラストな
どによって切り出された文字列画像の矩形領域から,さ
らに1文字単位の文字画像が切り出されることになる。
次に,文字認識部5では,全文字列について,切り出さ
れた各文字画像の認識を行い,認識結果文字コード列を
出力する。
The character cutout unit 4 cuts out character images one by one for each of the character string images cut out by the character string cutout unit 3, and calculates the character size.
The character cutout unit 4 further cuts out a character image in units of one character from the rectangular area of the character string image cut out based on the contrast with the background or the like.
Next, the character recognizing unit 5 recognizes each of the cut-out character images for all the character strings, and outputs a recognition result character code string.

【0012】文字列切り出し部3,文字切り出し部4お
よび文字認識部5で使用する方法としては,例えば,文
字線とその背景の濃度コントラストが高い,文字の外接
矩形が正方形に近いものが多いなどの文字の普遍的な性
質を利用することによって,雑音が多く条件の変化の激
しい情景画像から文字を抽出,認識する方法が提案され
ている(大谷淳,塩昭夫,“情景画像からの文字パター
ン抽出と認識”,電子情報通信学会論文誌D Vol.J71-D
No.6 pp.1037-1047)。
As a method used in the character string extracting section 3, the character extracting section 4, and the character recognizing section 5, for example, the density contrast between the character line and its background is high, and the circumscribed rectangle of the character is often close to a square. A method of extracting and recognizing characters from scene images with noisy conditions and drastic changes in conditions by using the universal properties of characters has been proposed (Jun Otani, Akio Shio, "Character Patterns from Scene Images" Extraction and recognition ”, IEICE Transactions D Vol.J71-D
No.6 pp.1037-1047).

【0013】なお,文字列切り出し部3を省略して,画
像入力部2により入力した情景画像からダイレクトに文
字を切り出してもよい。これには,例えばエッジの特徴
を利用した手法(桑野,倉掛,小高,“映像データ検索
のためのテロップ文字抽出法”,信学技報PMRU96,
93-103, pp.39-46)を適用することができる。
The character string cutout unit 3 may be omitted, and characters may be cut out directly from the scene image input by the image input unit 2. This includes, for example, methods using edge features (Kuwano, Kurakake, Odaka, “Ticker character extraction method for video data search”, IEICE Technical Report PMRU96,
93-103, pp.39-46) can be applied.

【0014】位置情報取得部6では,画像入力がなされ
た地点の位置情報を,PHSあるいはGPS等を用いて
取得する。位置情報には誤差が含まれるため,その誤差
の最大値も検出しておく。また,位置情報としては緯度
経度情報が取得される。
The position information acquiring section 6 acquires the position information of the point where the image is input by using PHS or GPS. Since the position information includes an error, the maximum value of the error is also detected. In addition, latitude and longitude information is acquired as position information.

【0015】次に単語辞書選択部7では,位置情報取得
部6により取得された位置情報およびその誤差の範囲を
利用して,単語辞書1の中で照合に使用する部分の選択
を行う。これにより,単語照合に使用するレコードの数
を,多数のレコードの中から数十件,あるいは数百件の
レコードに絞り込むことが可能となる。
Next, the word dictionary selecting section 7 selects a portion to be used for collation in the word dictionary 1 using the position information acquired by the position information acquiring section 6 and the range of the error. As a result, the number of records used for word matching can be narrowed down to tens or hundreds of records from many records.

【0016】単語辞書1の選択は,例えば単語辞書1内
の住所情報を緯度経度情報に変換したものと,位置情報
取得部6で検出された緯度経度情報を用いて,誤差を含
めた緯度経度の範囲に収まる範囲の辞書の選択を行うと
いった方法が考えられる。例えばインターネット版のタ
ウンページ・データベースには,緯度経度情報が付与さ
れているので(島健一,高橋克巳,三浦信幸,“インタ
ーネット版マルチメディア電話帳の構築”,オンライン
プロシーディングス Japan World Wide Web Conference
'95(1995)),それを単語辞書1として利用することに
より,緯度経度情報を用いた単語辞書情報の絞り込みを
行うこともできる。
The word dictionary 1 is selected, for example, by converting address information in the word dictionary 1 into latitude / longitude information and using the latitude / longitude information detected by the position information acquisition unit 6 to obtain a latitude / longitude including an error. For example, there is a method of selecting a dictionary in a range falling within the range. For example, the Internet version of the town page database is provided with latitude and longitude information (Kenichi Shima, Katsumi Takahashi, Nobuyuki Miura, "Building an Internet Multimedia Phonebook", Online Proceedings Japan World Wide Web Conference
'95 (1995)), by using it as the word dictionary 1, it is possible to narrow down the word dictionary information using the latitude and longitude information.

【0017】単語照合部8では,文字認識部5で得られ
た文字コード列と,単語辞書選択部7で得られた単語辞
書とを用いて単語照合を行い,一致文字数をカウントす
る。例えば,認識対象が一文字列の看板の場合には,単
語辞書の企業名との単語照合を行う。また,複数の文字
列が存在する認識対象の場合には,複数の文字列と複数
のレコードとの間で単語照合を行うため,すべての組み
合わせにおいて総当たりで単語照合を行い,一致文字数
が最大となる組み合わせを求める。あるいは,書式解析
等を利用して単語照合を行う文字列の認識結果を選択
し,その一致文字数を算出してもよい。
The word matching section 8 performs word matching using the character code string obtained by the character recognition section 5 and the word dictionary obtained by the word dictionary selection section 7 and counts the number of matching characters. For example, when the recognition target is a signboard of one character string, word matching with a company name in a word dictionary is performed. In addition, in the case of a recognition target having a plurality of character strings, word matching is performed between the plurality of character strings and a plurality of records. Find the combination Alternatively, a recognition result of a character string to be subjected to word matching using format analysis or the like may be selected, and the number of matching characters may be calculated.

【0018】ここで,単語照合を行う文字列の選択方法
としては,「荒木,宮本,鈴木,中村,杉村,“複数情
報の統合による看板文字認識”,1998信学会ソ大会
D−12−25」において提案されている看板の特徴を
利用した方法を用いることができる。また,単語照合方
法としては,例えば「北村正,仲林清,大光明直孝,中
村修,“単語知識を利用した手書き文字列処理方式”,
NTTR&D,39,3,pp429-436 (1990)」に
おいて提案されている文字切り出し誤りによるずれを許
容する手法を用いることができる。
Here, as a method of selecting a character string to be subjected to word collation, "Araki, Miyamoto, Suzuki, Nakamura, Sugimura," Signboard Character Recognition by Integrating Multiple Information ", 1998 IEICE Society Conference D-12-25. ], A method utilizing the features of a signboard can be used. As word matching methods, for example, "Tadashi Kitamura, Kiyoshi Nakabayashi, Akitaka Omitsu, Osamu Nakamura," Handwritten character string processing method using word knowledge ",
NTTR & D, 39, 3, pp 429-436 (1990) ”can be used to allow a shift due to a character extraction error.

【0019】出力部9では,単語照合部8でカウントさ
れた一致文字数が最も多いレコ一ドを,単語照合結果と
して出力する。例えば企業名を出力し,インターネット
等の検索エンジンに入力することで,その企業に関する
情報を取得することが可能となる。また,電話番号や住
所情報をアンド条件で付与することにより,さらに取得
したい情報に絞り込むことが可能となる。
The output unit 9 outputs a record having the largest number of matching characters counted by the word matching unit 8 as a word matching result. For example, by outputting a company name and inputting it to a search engine such as the Internet, information about the company can be obtained. Also, by giving the telephone number and the address information under the AND condition, it is possible to further narrow down the information to be acquired.

【0020】このように構成した文字認識の動作および
作用を説明する。図2は,図1に示した文字認識装置の
動作を示すフローチャートである。
The operation and operation of the thus configured character recognition will be described. FIG. 2 is a flowchart showing the operation of the character recognition device shown in FIG.

【0021】まず,ステップ20において企業名や電話
番号,住所,個人名等の書かれた文字画像を読み込み,
ステップ21で文字列の切り出しを行う。ステップ22
では切り出された文字列画像から,一文字ずつの文字画
像を切り出し,ステップ23で文字認識を行う。
First, in step 20, a character image in which a company name, a telephone number, an address, a personal name and the like are written is read.
In step 21, a character string is cut out. Step 22
Then, a character image of each character is extracted from the extracted character string image, and character recognition is performed in step 23.

【0022】入力された画像から文字列を切り出す際の
イメージを図3に示す。画像入力部2は,例えば図3に
示すカメラ画像11のように,看板なら看板1枚,ポス
ターならポスター1枚が入るように撮影されてキャプチ
ャされた画像を入力する。文字列切り出し部3は,この
ようなカメラ画像11から,背景とのコントラストなど
によって文字の塊である矩形領域を文字列として切り出
す。これによって,図3のカメラ画像11から2つの文
字列12−1,12−2が切り出されることになる。
FIG. 3 shows an image of extracting a character string from an input image. The image input unit 2 inputs an image captured and captured such that one signboard is inserted for a signboard and one poster is inserted for a poster, as in a camera image 11 shown in FIG. 3, for example. The character string cutout unit 3 cuts out a rectangular area, which is a lump of characters, as a character string from such a camera image 11 by contrast with the background or the like. As a result, two character strings 12-1 and 12-2 are cut out from the camera image 11 in FIG.

【0023】文字切り出し部4は,2つの文字列12−
1,12−2の各々について1文字ずつの文字単位に分
離し,この分離した文字画像13を文字認識部5に渡
す。文字認識部5では,パターンマッチングなどにより
文字認識を行う。この結果,各文字列の認識結果14−
1,14−2が得られる。
The character extracting section 4 includes two character strings 12-
Each of the characters 1 and 12-2 is separated into one character unit, and the separated character image 13 is passed to the character recognition unit 5. The character recognition unit 5 performs character recognition by pattern matching or the like. As a result, the recognition result 14-
1, 14-2 are obtained.

【0024】上記処理において,文字列切り出し部3の
処理を省略し,図3(B)に示すように,カメラ画像1
1からダイレクトに文字画像15を抽出し,それを文字
認識部5で認識するようにしてもよい。
In the above processing, the processing of the character string cutout unit 3 is omitted, and as shown in FIG.
Alternatively, the character image 15 may be directly extracted from 1 and may be recognized by the character recognition unit 5.

【0025】図2のステップ24では,文字画像を読み
込んだ地点の位置情報を取得し,ステップ25では,前
のステップ24で取得された位置情報をもとに単語辞書
1の選択を行う。ここで,単語辞書1の選択とは,単語
辞書1の中で使用するレコードを選択することを意味す
る。なお,単語辞書1が複数ある場合には,位置情報に
基づいて適当な単語辞書1を選択することも含まれる。
In step 24 of FIG. 2, the position information of the point where the character image is read is obtained. In step 25, the word dictionary 1 is selected based on the position information obtained in the previous step 24. Here, selecting the word dictionary 1 means selecting a record to be used in the word dictionary 1. When there are a plurality of word dictionaries 1, selecting an appropriate word dictionary 1 based on the position information is also included.

【0026】例えば,図4(A)に示すような企業名,
電話番号,住所,緯度経度情報を持つ単語辞書1があっ
た場合,単語辞書選択部7は,位置情報取得部6により
PHSやGPSを用いて画像の撮影時に取得した緯度経
度情報から,位置計測の誤差に含まれる範囲内の緯度経
度情報を持つレコードに絞り込みを行い,絞り込まれた
辞書31を得る。
For example, a company name as shown in FIG.
When there is the word dictionary 1 having the telephone number, the address, and the latitude / longitude information, the word dictionary selection unit 7 performs the position measurement from the latitude / longitude information acquired at the time of capturing the image using the PHS or GPS by the position information acquisition unit 6. Are narrowed down to records having latitude / longitude information within a range included in the error, and a narrowed dictionary 31 is obtained.

【0027】単語辞書1のレコードが緯度経度情報を持
たない場合には,図4(B)に示すように住所と緯度経
度情報の対応情報を持つ住所情報データベース(DB)
32を用い,これによって位置情報取得部6により取得
した緯度経度情報を住所情報に変換し,変換後の住所情
報を用いて単語辞書1の絞り込みを行う。
If the record of the word dictionary 1 does not have the latitude and longitude information, as shown in FIG. 4B, an address information database (DB) having correspondence information between the address and the latitude and longitude information
32, the latitude / longitude information acquired by the position information acquisition unit 6 is converted into address information, and the word dictionary 1 is narrowed down using the converted address information.

【0028】これによって,例えばタウンページ・デー
タベース全体には,横須賀市を例に挙げると,2万5千
件のレコードが収められているが,位置情報によって1
00件とか数十件に単語照合する辞書サイズを小さくす
ることができ,高速化と高精度化を図ることができる。
Thus, for example, the entire town page database contains 25,000 records in the case of Yokosuka City, for example.
It is possible to reduce the size of a dictionary for performing word matching on 00 or several tens of cases, thereby achieving high speed and high accuracy.

【0029】ステップ26では,選択された単語辞書1
(絞り込まれた辞書31)と,ステップ23において得
られた文字コード列を用いた単語照合を行い,レコード
ごとの単語照合結果となる一致文字数を算出しておく。
最後に,ステップ27で単語照合結果の一致文字数が多
いものを最尤候補として出力して処理を終了する。
In step 26, the selected word dictionary 1
Word matching is performed using (the narrowed-down dictionary 31) and the character code string obtained in step 23, and the number of matching characters as the word matching result for each record is calculated.
Finally, in step 27, a word matching result having a large number of matching characters is output as the maximum likelihood candidate, and the process ends.

【0030】図5は,この単語照合の例を説明するため
の図である。例えば, M1 :“荒木歯科” M2 :“TEL:12−3456” M3 :“営業時間:月〜土 AM10時〜PM15時” の3行の文字列M1〜M3が書かれた看板の画像から切
り出された文字列画像を,文字認識部5により認識した
結果,認識結果文字列として次のC1〜C3が得られた
とする。
FIG. 5 is a diagram for explaining an example of this word collation. For example, M 1: "Araki dental" M 2: "TEL: 12-3456 " M 3: " Opening hours: Monday to Saturday at AM10 o'clock ~PM15" three lines of string M1~M3 is a sign that was written It is assumed that as a result of recognizing the character string image cut out from the image by the character recognizing unit 5, the following C1 to C3 are obtained as recognition result character strings.

【0031】C1 :“荒本歯科” C2 :“TFI:17−8456” C3 :“官業時門:日−土 AM0時〜PM15時” 一方,この看板の画像を撮影した場所の位置情報をもと
に絞り込まれた辞書31が,図5(B)に示すように,
レコードR1 〜R4 であったとすると,単語照合部8
は,認識結果文字列C1 〜C3 と,辞書31中の各レコ
ードに含まれる企業名,電話番号,住所とのすべての組
み合わせを照合する。
C 1 : “Aramoto dentistry” C 2 : “TFI: 17-8456” C 3 : “Government time: Sunday-Saturday AM0 to PM15: 00” On the other hand, the position of the place where the image of this signboard was taken The dictionary 31 narrowed down based on the information, as shown in FIG.
Assuming that the records are R 1 to R 4 , the word matching unit 8
Collates the recognition result string C 1 -C 3, company names in each record in the dictionary 31, a telephone number, all the combinations of the addresses.

【0032】すなわち,単語辞書選択部7において選択
したレコードR1 〜R4 のそれぞれについて,以下のよ
うに一致文字数を算出する。 企業名とC1 ,電話番号とC2 ,住所とC3 を照合
し,一致文字数の合計を算出する。 企業名とC1 ,電話番号とC3 ,住所とC2 を照合
し,一致文字数の合計を算出する。 企業名とC2 ,電話番号とC1 ,住所とC3 を照合
し,一致文字数の合計を算出する。 ……。
That is, the number of matching characters is calculated for each of the records R 1 to R 4 selected by the word dictionary selecting section 7 as follows. Company name and the C 1, phone number and C 2, matches the address and C 3, to calculate the sum of the matched characters. Company name and the C 1, phone number and C 3, matches the address and C 2, to calculate the sum of the matched characters. The company name is compared with C 2 , the telephone number with C 1 , and the address with C 3, and the total number of matching characters is calculated. ......

【0033】このようにすべての組み合わせで単語照合
を行い,その一致文字数の合計が最大となった組み合わ
せの単語照合結果を,そのレコードの単語照合結果とす
る。これを式で表すと,レコードR1 の単語照合結果
は,図5(C)に示すようになる。
As described above, word matching is performed for all combinations, and the word matching result of the combination having the largest total number of matching characters is defined as the word matching result of the record. Expressing this by the formula, word collating result record R 1 is as shown in FIG. 5 (C).

【0034】Max(N11とC1 の一致文字数+N12
2 の一致文字数+N13とC3 の一致文字数,N11とC
1 の一致文字数+N12とC3 の一致文字数+N13とC2
の一致文字数,N11とC2 の一致文字数+N12とC1
一致文字数+N13とC3 の一致文字数,…………)=n
1 レコードR2 の単語照合結果n2 ,レコードR3 の単語
照合結果n3 ,レコードR4 の単語照合結果n4 も同様
に算出する。
[0034] Max (N 11 and matched characters + N 12 and matched characters + number of matched characters of N 13 and C 3 of the C 2 of C 1, N 11 and C
Number of matched characters + N 13 of the first matched characters + N 12 and C 3 and C 2
Number of matched characters, match the number of characters N 11 and matched characters + N 13 and C 3 of matched characters + N 12 and C 1 to C 2, ............) = n of
1 record R 2 words matching result n 2, word collating result n 3 records R 3, it is also calculated similarly word collating result n 4 records R 4.

【0035】最終的な看板の単語照合結果は,図5
(D)に示すように,n1 ,n2 ,n3,n4 の中で最
大であるもののレコードである。これを単語照合結果と
して,出力部9により出力する。企業名だけを出力して
もよく,また電話番号と住所も合わせて出力するように
してもよい。
The final word matching result of the signboard is shown in FIG.
As shown in (D), this is the record of the largest among n 1 , n 2 , n 3 and n 4 . This is output by the output unit 9 as a word matching result. Only the company name may be output, or the telephone number and the address may be output together.

【0036】以上の実施の形態の説明から明らかなよう
に,本発明は,一般に高精度な文字認識結果を得るのが
難しい看板等の文字列を精度高く特定するために,位置
情報を使用し,高速高精度な単語照合を実現するもので
ある。これにより,チェーン店など,位置情報がなけれ
ば一つに特定できないものが,特定できるようになる。
したがって,従来の膨大な辞書による単語照合よりもさ
らに高精度な単語照合が可能となる。また,単に文字認
識するだけではなく,ユーザが見た対象を特定すること
になるので,その結果を用いた効率のよい情報検索の支
援が可能になる。
As is clear from the above description of the embodiment, the present invention uses position information in order to specify a character string of a signboard or the like in which it is generally difficult to obtain a highly accurate character recognition result. , Realizing high-speed and high-precision word matching. As a result, items that cannot be uniquely identified without location information, such as chain stores, can be identified.
Therefore, word matching can be performed with higher accuracy than conventional word matching using a huge dictionary. In addition, not only character recognition, but also the target that the user has seen is specified, so that efficient information retrieval support using the result can be performed.

【0037】[0037]

【発明の効果】以上説明したように,本発明によれば,
文字認識と位置情報とを統合することによって,単に文
字認識のみを用いた場合と比較して出力,表示される情
報を有効に絞り込むことが可能になる。したがって,表
示情報を手掛りとした利用者による情報検索を効率よく
支援することができる。
As described above, according to the present invention,
By integrating the character recognition and the position information, it is possible to effectively narrow down the information to be output and displayed as compared with the case where only character recognition is used. Therefore, it is possible to efficiently support the information search by the user using the display information as a clue.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態の全体概要を示すブロック
図である。
FIG. 1 is a block diagram showing an overall outline of an embodiment of the present invention.

【図2】本発明の実施の形態に係る動作を示すフローチ
ャートである。
FIG. 2 is a flowchart showing an operation according to the embodiment of the present invention.

【図3】入力された画像から文字列を切り出す際の処理
を説明する図である。
FIG. 3 is a diagram illustrating a process for extracting a character string from an input image.

【図4】単語辞書の選択を説明する図である。FIG. 4 is a diagram illustrating selection of a word dictionary.

【図5】単語照合を説明する図である。FIG. 5 is a diagram illustrating word matching.

【符号の説明】[Explanation of symbols]

1 単語辞書 2 画像入力部 3 文字列切り出し部 4 文字切り出し部 5 文字認識部 6 位置情報取得部 7 単語辞書選択部 8 単語照合部 9 出力部 DESCRIPTION OF SYMBOLS 1 Word dictionary 2 Image input part 3 Character string extraction part 4 Character extraction part 5 Character recognition part 6 Position information acquisition part 7 Word dictionary selection part 8 Word collation part 9 Output part

───────────────────────────────────────────────────── フロントページの続き (72)発明者 桑野 秀豪 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5B064 BA01 EA19 5J062 AA01 BB00 CC07 GG02 5K024 AA79 CC11 GG01 GG10 5K036 KK09 9A001 BB03 BB04 FF03 HH20 HH22 HH28 JJ19 JJ25 JJ78 KK37 KK42 LL02  ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Hidego Kuwano 3-19-2 Nishi-Shinjuku, Shinjuku-ku, Tokyo F-term within Nippon Telegraph and Telephone Corporation (reference) 5B064 BA01 EA19 5J062 AA01 BB00 CC07 GG02 5K024 AA79 CC11 GG01 GG10 5K036 KK09 9A001 BB03 BB04 FF03 HH20 HH22 HH28 JJ19 JJ25 JJ78 KK37 KK42 LL02

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 企業名,電話番号または個人名等の文字
情報を含む画像を入力する画像入力部と,上記画像入力
部により入力された画像の中から文字画像を切り出し,
切り出された文字画像を認識して認識結果文字コード列
を出力する認識部とを備える文字認識装置において,上
記画像入力部により画像が入力される際の位置情報を取
得する位置情報取得部と,上記位置情報取得部により取
得された位置情報をもとに単語照合に用いる単語辞書の
情報を絞り込む単語辞書選択部と,上記単語辞書選択部
により絞り込まれた単語辞書の情報を用いて上記認識部
により出力された文字コード列との単語照合を行う単語
照合部と,上記単語照合部により得られた単語照合結果
の中で一致文字数が最も多い単語を文字認識結果として
出力する出力部とを備えることを特徴とする文字認識装
置。
An image input unit for inputting an image including character information such as a company name, a telephone number or a personal name; and a character image cut out from the image input by the image input unit.
A character recognition device including a recognition unit that recognizes the cut-out character image and outputs a recognition result character code string; a position information acquisition unit that acquires position information when an image is input by the image input unit; A word dictionary selection unit for narrowing down word dictionary information used for word matching based on the position information obtained by the position information obtaining unit; and a recognition unit using the word dictionary information narrowed down by the word dictionary selection unit. A word matching unit that performs word matching with the character code string output by the above, and an output unit that outputs, as a character recognition result, a word having the largest number of matching characters among the word matching results obtained by the word matching unit. A character recognition device characterized in that:
【請求項2】 企業名,電話番号または個人名等の文字
情報を含む画像を入力するステップと,入力された画像
の中から文字画像を切り出し,切り出された文字画像を
認識して認識結果文字コード列を出力するステップと,
上記画像が入力される際の位置情報を取得するステップ
と,取得された位置情報をもとに単語照合に用いる単語
辞書の情報を絞り込むステップと,絞り込まれた単語辞
書の情報を用いて,単語辞書中の単語と上記認識結果文
字コード列との単語照合を行うステップと,上記単語照
合結果の中で一致文字数が最も多い単語を文字認識結果
として出力するステップとを有することを特徴とする文
字認識方法。
2. A step of inputting an image including character information such as a company name, a telephone number or a personal name, cutting out a character image from the input image, recognizing the cut-out character image, and recognizing a character as a recognition result. Outputting a code sequence;
A step of acquiring position information when the image is input; a step of narrowing down information in a word dictionary used for word matching based on the acquired position information; A character characterized by comprising a step of performing word matching between a word in a dictionary and the above-mentioned recognition result character code string, and a step of outputting, as a character recognition result, a word having the largest number of matching characters in the above word matching result. Recognition method.
【請求項3】 企業名,電話番号または個人名等の文字
情報を含む画像を入力する処理と,入力された画像の中
から文字画像を切り出し,切り出された文字画像を認識
して認識結果文字コード列を出力する処理と,上記画像
が入力される際の位置情報を取得する処理と,取得され
た位置情報をもとに単語照合に用いる単語辞書の情報を
絞り込む処理と,絞り込まれた単語辞書の情報を用い
て,単語辞書中の単語と上記認識結果文字コード列との
単語照合を行う処理と,上記単語照合結果の中で一致文
字数が最も多い単語を文字認識結果として出力する処理
とを,計算機に実行させるプログラムを記録したことを
特徴とする文字認識方法を実行するプログラムを記録し
た記録媒体。
3. A process of inputting an image including character information such as a company name, a telephone number or a personal name, cutting out a character image from the input image, recognizing the cut-out character image, and recognizing a character as a recognition result. A process of outputting a code sequence, a process of acquiring position information when the image is input, a process of narrowing down information in a word dictionary used for word matching based on the acquired position information, A process of performing word matching between a word in a word dictionary and the above-described recognition result character code string using dictionary information, a process of outputting a word having the largest number of matching characters in the above-described word matching result as a character recognition result, Recording a program for executing a character recognition method, characterized by recording a program for causing a computer to execute the method.
JP11160404A 1999-06-08 1999-06-08 Character recognizing device, method therefor and recording medium for recording program executing the method Pending JP2000348142A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11160404A JP2000348142A (en) 1999-06-08 1999-06-08 Character recognizing device, method therefor and recording medium for recording program executing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11160404A JP2000348142A (en) 1999-06-08 1999-06-08 Character recognizing device, method therefor and recording medium for recording program executing the method

Publications (1)

Publication Number Publication Date
JP2000348142A true JP2000348142A (en) 2000-12-15

Family

ID=15714216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11160404A Pending JP2000348142A (en) 1999-06-08 1999-06-08 Character recognizing device, method therefor and recording medium for recording program executing the method

Country Status (1)

Country Link
JP (1) JP2000348142A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185101A (en) * 2004-12-27 2006-07-13 Aisin Aw Co Ltd Image recognition device and method, and navigation system
WO2008107997A1 (en) * 2007-03-08 2008-09-12 Fujitsu Limited Slip category identifying program, slip category identifying method and slip category identifying device
CN100530217C (en) * 2005-01-21 2009-08-19 日立欧姆龙金融系统有限公司 Word identifier
CN101866417A (en) * 2010-06-18 2010-10-20 西安电子科技大学 Method for identifying handwritten Uigur characters
CN101976333A (en) * 2010-11-18 2011-02-16 上海合合信息科技发展有限公司 Method for automatically distinguishing first-generation identity card from second-generation identity card
JP2011090681A (en) * 2010-10-25 2011-05-06 Aisin Aw Co Ltd Image recognition device and method, and navigation apparatus
CN103765440A (en) * 2011-08-29 2014-04-30 高通股份有限公司 Camera OCR with context information
WO2015178073A1 (en) * 2014-05-20 2015-11-26 ソニー株式会社 Information processing device, management device, information processing method, and program
CN117809322A (en) * 2023-12-12 2024-04-02 江苏京创先进电子科技有限公司 Dicing saw and blade model detection method, device and assembly thereof

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185101A (en) * 2004-12-27 2006-07-13 Aisin Aw Co Ltd Image recognition device and method, and navigation system
JP4648697B2 (en) * 2004-12-27 2011-03-09 アイシン・エィ・ダブリュ株式会社 Image recognition apparatus and method, and navigation apparatus
CN100530217C (en) * 2005-01-21 2009-08-19 日立欧姆龙金融系统有限公司 Word identifier
JPWO2008107997A1 (en) * 2007-03-08 2010-06-10 富士通株式会社 Form type identification program, form type identification method, and form type identification device
WO2008107997A1 (en) * 2007-03-08 2008-09-12 Fujitsu Limited Slip category identifying program, slip category identifying method and slip category identifying device
US8275792B2 (en) 2007-03-08 2012-09-25 Fujitsu Limited Document type identifying method and document type identifying apparatus
CN101866417A (en) * 2010-06-18 2010-10-20 西安电子科技大学 Method for identifying handwritten Uigur characters
JP2011090681A (en) * 2010-10-25 2011-05-06 Aisin Aw Co Ltd Image recognition device and method, and navigation apparatus
CN101976333A (en) * 2010-11-18 2011-02-16 上海合合信息科技发展有限公司 Method for automatically distinguishing first-generation identity card from second-generation identity card
CN103765440A (en) * 2011-08-29 2014-04-30 高通股份有限公司 Camera OCR with context information
JP2014529822A (en) * 2011-08-29 2014-11-13 クアルコム,インコーポレイテッド Camera OCR using context information
US9082035B2 (en) 2011-08-29 2015-07-14 Qualcomm Incorporated Camera OCR with context information
WO2015178073A1 (en) * 2014-05-20 2015-11-26 ソニー株式会社 Information processing device, management device, information processing method, and program
CN117809322A (en) * 2023-12-12 2024-04-02 江苏京创先进电子科技有限公司 Dicing saw and blade model detection method, device and assembly thereof

Similar Documents

Publication Publication Date Title
US6671684B1 (en) Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
US8577882B2 (en) Method and system for searching multilingual documents
US7908141B2 (en) Extracting and utilizing metadata to improve accuracy in speech to text conversions
CN110502694B (en) Lawyer recommendation method based on big data analysis and related equipment
US20090144056A1 (en) Method and computer program product for generating recognition error correction information
US7451090B2 (en) Information processing device and information processing method
JPH0695629A (en) Automated system and method for acquisition, control and playback for presentation
CN107330040B (en) Learning question searching method and system
CN102855317A (en) Multimode indexing method and system based on demonstration video
Tsai et al. Using cell phone pictures of sheet music to retrieve MIDI passages
JP2000348142A (en) Character recognizing device, method therefor and recording medium for recording program executing the method
CN112926300A (en) Image searching method, image searching device and terminal equipment
CN114625918A (en) Video recommendation method, device, equipment, storage medium and program product
CN115203474A (en) Automatic database classification and extraction technology
CN113301382B (en) Video processing method, device, medium, and program product
CN111522992A (en) Method, device and equipment for putting questions into storage and storage medium
CN115438223B (en) Video processing method, device, electronic equipment and storage medium
CN116450868A (en) Information visual retrieval method and system
KR101783872B1 (en) Video Search System and Method thereof
JP2002171481A (en) Video processing apparatus
CN114155841A (en) Voice recognition method, device, equipment and storage medium
JPH08272811A (en) Document management method and device therefor
KR101911613B1 (en) Method and apparatus for person indexing based on the overlay text of the news interview video
JP2002014973A (en) Video retrieving system and method, and recording medium with video retrieving program recorded thereon
CN110717091B (en) Entry data expansion method and device based on face recognition