JP2000067159A - 景観画像中文字読み取り方法及び実施装置ならびにその方法を記録した記録媒体 - Google Patents

景観画像中文字読み取り方法及び実施装置ならびにその方法を記録した記録媒体

Info

Publication number
JP2000067159A
JP2000067159A JP10232978A JP23297898A JP2000067159A JP 2000067159 A JP2000067159 A JP 2000067159A JP 10232978 A JP10232978 A JP 10232978A JP 23297898 A JP23297898 A JP 23297898A JP 2000067159 A JP2000067159 A JP 2000067159A
Authority
JP
Japan
Prior art keywords
character
data
camera
character area
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10232978A
Other languages
English (en)
Other versions
JP3479601B2 (ja
Inventor
Motohiro Machida
基宏 町田
Akira Suzuki
章 鈴木
Nobuo Miyamoto
信夫 宮本
Osamu Nakamura
修 中村
Toshiaki Sugimura
利明 杉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP23297898A priority Critical patent/JP3479601B2/ja
Publication of JP2000067159A publication Critical patent/JP2000067159A/ja
Application granted granted Critical
Publication of JP3479601B2 publication Critical patent/JP3479601B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 複数のカメラを能動的に制御し、かつその機
能を様々な利用場面に容易に適用できる景観画像中文字
読み取り手法を提供する。 【解決手段】 複数のカメラ101で撮影した景観画像
から抽出した文字領域情報から文字領域を拡大するため
のカメラ制御値を算出し、カメラを制御し拡大した文字
領域を生成し、この画像を三次元的な傾斜による歪み・
回転を補正して2値化し、文字領域から切り出した文字
パタンを認識して候補文字の文字列を出力し、データベ
ース103の文字と照合し最も似ている検索結果を出力
し、動作シーケンスに従ってカメラを制御し、動作シー
ケンスを格納し、データベースに画像データ、カメラ制
御値データ、文字領域位置・大きさデータ、文字パタン
データ、認識結果データ、DB照合結果データ及び処理
状況データを、複数カメラを制御する複数の制御装置1
02の共有データとして蓄積し管理する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、景観画像中文字読
み取り方法及び装置ならびにその方法の処理手順を記録
した記録媒体に関し、特に、景観画像中の文字を読み取
る景観画像中文字読み取り技術の分野において、複数台
のカメラ等の映像入力装置を能動的に制御することで、
小さすぎて読めない文字や、反射や遮蔽などで読めない
文字の読み取りを可能とし、かつ読み取り精度を向上さ
せ、かつ複数台のカメラの動作シーケンスを操作者が容
易に設定可能な手段を実現するための技術に適用して有
効な技術に関するものである。
【0002】
【従来の技術】景観画像中の文字を読み取る従来技術
は、看板の文字読み取りや自動車のナンバープレートの
読み取りに用いられている。これらのアプリケーション
では、読み取り対象が小さく文字のパタンが潰れてしま
った場合や、画角を最大に広げても対象全部が一枚の画
像に入らない場合などには読み取れない。また、従来の
技術では利用目的が単一で、他の利用目的には転用が困
難であった。
【0003】そこで、視線方向と画角を外部からの信号
により制御可能なカメラを使用し、予め操作者が設定し
たカメラ視線方向と画角を用いてカメラを制御する機
能、及び画像中から読み取った文字領域の情報を用いた
当該文字領域を適性サイズに拡大するためのカメラの視
線制御と画角を自動計算し、かつその値を用いて能動的
にカメラ制御する機能を有することにより、かつ動作シ
ーケンスを操作者が容易に定義し格納する機能を有する
ことで、様々な利用場面に容易に適用できる手段が提案
されている。(参考:「景観画像中文字読み取り方法お
よびその装置およびその方法を記録した記憶媒体(特願
平10−8159)」,「対象物適応型カメラ視線制御
による景観内文字領域抽出法」信学会全国大会D−12
−211(1988))。
【0004】
【発明が解決しようとする課題】しかしながら、景観画
像中の文字には、障害物による遮蔽や、反射等の問題で
文字が読み取れない場合が存在している。そのためには
カメラ自体を移動させるか、あるいは複数台の別視線方
向を有するカメラを用いて、対象物を読み取る必要があ
る。しかし、そのためには複数カメラを制御するための
装置、または方式が必要であり、また他の利用目的への
転用が難しい問題があった。
【0005】本発明の目的は、複数のカメラを能動的に
制御し、かつその機能を様々な利用場面に容易に適用で
きる技術を提供することにある。
【0006】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述及び添付図面によって明らか
にする。
【0007】
【課題を解決するための手段】本願において開示される
発明のうち代表的なものの概要を簡単に説明すれば以下
のとおりである。
【0008】(1)複数のカメラで撮影された景観画像
から文字の含まれる文字領域を抽出し、この抽出された
文字領域の情報から当該文字領域を拡大するためのカメ
ラ制御値を算出し、この算出されたカメラ制御値により
カメラを制御し拡大された文字領域を生成し、この生成
された文字領域の画像を三次元的な傾斜による歪みを補
正し、回転を補正して2値化し、前記生成された文字領
域から切り出した文字パタンを認識して候補文字の文字
列を出力し、この文字列の候補文字の集合をデータベー
スに記録されている文字と照合し最も似ている検索結果
を出力し、動作シーケンスに従ってカメラを制御し、前
記動作シーケンスを格納する景観画像中の文字を読み取
る景観画像中文字読み取り方法であって、ネットワーク
を介して接続された前記データベースに、画像データ、
カメラ制御値データ、文字領域位置・大きさデータ、文
字パタンデータ、認識結果データ、DB照合結果データ
及び処理状況データを、複数カメラを制御する複数の制
御装置の共有データとして蓄積し、この共有データを入
出力して管理する。
【0009】(2)複数のカメラで撮影された景観画像
から文字の含まれる文字領域を抽出する手順と、この抽
出された文字領域の情報から当該文字領域を拡大するた
めのカメラ制御値を算出する手順と、この算出されたカ
メラ制御値によりカメラを制御し拡大された文字領域を
生成する手順と、この生成された文字領域の画像を三次
元的な傾斜による歪みを補正し、回転を補正して2値化
する手順と、前記抽出された文字領域から切り出した文
字パタンを認識して候補文字の文字列を出力する手順
と、この文字列の候補文字の集合をデータベースと照合
し最も似ている検索結果を出力する手順と、動作シーケ
ンスに従ってカメラを制御する手順と、前記動作シーケ
ンスを格納する景観画像中の文字を読み取る手順を有す
る景観画像中文字読み取り方法の処理手順をコンピュー
タに実行させるためのプログラムを記録したコンピュー
タ読みとり可能な記録媒体であって、ネットワークを介
して接続された共有データベースに、画像データ、カメ
ラ制御値データ、文字領域位置・大きさデータ、文字パ
タンデータ、認識結果データ、DB照合結果データ及び
処理状況データを、複数カメラを制御する複数の制御装
置の共有データとして蓄積する手順と、この蓄積された
共有データを入出力して管理する手順をコンピュータに
実行させるためのプログラムを記録したコンピュータ読
みとり可能な記録媒体である。
【0010】(3)複数カメラを制御する複数の制御装
置に、景観画像から文字の含まれる文字領域を抽出する
手段と、前記抽出された文字領域の情報から該文字領域
を拡大するためのカメラ制御値の算出手段と、前記算出
されたカメラ制御値によりカメラを制御し拡大された文
字領域を生成する手段と、この生成された文字領域の画
像を三次元的な傾斜による歪みを補正し、回転を補正し
て2値化する手段と、前記切り出した文字パタンを認識
して候補文字の文字列を出力する認識手段と、前記文字
列の候補文字の集合をデータベースと照合し最も似てい
る検索結果を出力する手段と、動作シーケンスに従って
前記手段を制御する手段と、前記動作シーケンスを格納
する手段とを具備した景観画像中の文字を読み取る景観
画像中文字読み取り装置であって、ネットワークを介し
て接続された共有データベースに、画像データ、カメラ
制御値データ、文字領域位置・大きさデータ、文字パタ
ンデータ、認識結果データ、DB照合結果データ及び処
理状況データを複数カメラを制御する複数の制御装置の
共有データとして蓄積する手段と、この蓄積された共有
データを入出力して管理する入出力する手段を具備す
る。
【0011】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態(実施例)を詳細に説明する。
【0012】なお、実施形態(実施例)を説明するため
の全図において、同一機能を有するものは同一符号を付
け、その繰り返しの説明は省略する。
【0013】図1は本発明の一実施形態における景観画
像中文字読み取り装置の概略全体構成を示す図である。
この景観画像中文字読み取り装置は、図1に示すよう
に、2台以上のカメラ101、各カメラに対応して各々
を制御する制御装置(例えば、パーソナルコンピュータ
を用いる)102、各制御装置102からネットワーク
を介して接続された共有データベース(記憶装置)10
3から構成される。カメラ101は、制御装置102か
らの信号により画角、視線方向が制御される。制御装置
102は図2で、共有データ103は図3で詳細に説明
する。
【0014】各カメラ101と制御装置102は同じ動
作機能を有するが、制御装置102に事前に格納された
動作シーケンスにより役割が決められている。104は
広角の範囲から対象物を抽出するカメラシステム、10
5は抽出された対象物を認識するカメラシステム、10
6は認識処理が失敗した対象物を再度認識するカメラシ
ステムである。尚、制御装置102は、1台でも複数台
設定されていても同じ処理を行うものとする。
【0015】図2は制御装置102の内部構成を示した
ものである。カメラ制御部201は、カメラ制御値格納
部210に格納されたカメラ視線制御用の値(パン値、
チルト値、ズーム値)を参照し、参照した値を当該カメ
ラ制御用に適した値に変換(キャリブレーションを実
施)し、カメラ制御信号をカメラ101に送信すること
でカメラ制御を行う。命令解釈・実行部202は、命令
記述ファイル204に記述された実行命令を読み取り、
記述に従って実行部での処理を行う。
【0016】画像バッファ203は、カメラ101に入
力された画像、実行部で行われる領域抽出、画像補正、
文字切り出し、で生成された画像が格納される。命令記
述ファイル204は、制御部で実行される命令の手順が
記述されている。文字領域位置・大きさ格納部205
は、文字領域抽出処理にて得られた位置及びその大きさ
が格納される。
【0017】文字パタン格納部206には、文字切り出
しにて得られた文字パタンが格納される。認識結果格納
部207は、文字認識にて得られた認識結果が格納され
る。DB照合結果格納部208は、DB照合により得ら
れた結果が格納される。処理状況格納部209は、命令
解釈・実行部202で行われた状況及び状態が格納され
る。
【0018】カメラ制御値格納部210は、文字領域抽
出から算出されたカメラ制御値、またはデータ入出力部
から得られたカメラ制御値を格納する。シーン切り替え
フラグ211は、解釈・実行部で行われた状況に従い命
令記述ファイルに記述された契機でシーンが切り替わっ
た際のそのシーンフラグを格納する。
【0019】データ入出力部212は、画像バッファ2
03、文字領域位置・大きさ格納部205、文字パタン
格納部206、認識結果格納部207、DB照合結果格
納部208、処理状況格納部209、及びカメラ制御値
格納部210と共有データベース103との間でデータ
入出力を実行する。
【0020】図3は本実施例における共有データベース
(記憶装置)103の内部構成を示したものである。画
像バッファ301は、各制御装置102の画像バッファ
203と、データ入出力部212を介してデータの入出
力を行い、共有データを格納する。
【0021】文字領域位置大きさ格納部302は、各制
御装置の文字領域位置・大きさ格納部205と、データ
入出力部212を介してデータの入出力を行い、共有デ
ータを格納する。文字パタン格納部303は、各制御装
置の文字パタン格納部206と、データ入出力部212
を介してデータの入出力を行い、共有データを格納す
る。
【0022】処理状況格納部304は、各制御装置の処
理状況格納部209と、データ入出力部212を介して
データの入出力を行い、共有データを格納する。カメラ
制御値格納部305は、各制御装置のカメラ制御値格納
部210と、データ入出力部212を介してデータの入
出力を行い、共有データを格納する。認識結果格納部3
06は、各制御部の認識結果格納部207と、データ入
出力部212を介してデータの入出力を行い、共有デー
タを格納する。DB照合結果格納部307は、各制御装
置のDB照合結果格納部208と、データ入出力部21
2を介してデータの入出力を行い、共有データを格納す
る。
【0023】図4は本実施形態における実行処理の流れ
を示したものである。カメラ401は、情景画像からデ
ータ画像を画像バッファ203に入力する。文字領域抽
出手段402は、得られたデータ画像からある条件(例
えば、均一なRGB値が特定の大きさの矩形で存在する
領域)を満たす領域を文字領域として抽出し、その位置
及び大きさを文字領域位置・大きさ格納部205に格納
する手段である。
【0024】画像補正変換手段403は、得られた文字
領域抽出結果から、傾斜補正及び回転補正を実施し、2
値化処理を実施した結果を再び画像バッファ203に格
納する手段である。文字切り出し手段404は、得られ
た2値化データから文字切り出し(例えば、黒画素の存
在領域が矩形である領域を文字として切り出す)を行
い、切り出したパタンを画像バッファ203または、文
字パタン格納部206に格納する手段である。
【0025】文字認識手段405は、得られた文字パタ
ンを認識し、認識結果を認識結果格納部207に格納す
る手段である。DB照合手段406は、得られた複数個
の認識結果をDBに存在する単語等の情報を参照し最も
似ている候補を照合結果としてDB照合結果格納部30
7に格納する手段である。(参考:「対象物適応型カメ
ラ視線制御による景観内文字領域抽出法」信学会全国大
会D−12−211(1988))。
【0026】図5は広角用カメラシステム104の制御
装置の処理の流れ501を示すフロー図、図6は認識用
カメラシステム105の制御装置の処理の流れ502を
示すフロー図、図7は再度認識(リトライ)用カメラシ
ステム106の処理の流れ503を示すフロー図であ
る。尚、制御装置102は、1台でも複数台設定されて
いても同じ処理を行うものとする。
【0027】図5に示すように、広角用カメラシステム
104の制御装置の処理フロー501は、カメラ入力ス
テップ504で、景観中の認識対象物を含むデータ画像
をカメラ入力する。文字領域抽出ステップ505で、入
力されたデータ画像に対し文字領域抽出処理を行い、文
字領域位置・大きさを算出する。そして、領域抽出結果
出力ステップ506で、共有データとして認識結果格納
部306に算出結果を出力する。前記ステップ504,
505,506の処理については、後で図8を用いて説
明する。広角カメラ処理終了状況出力ステップ507
で、共有データでの処理状況格納部304に広角カメラ
処理が終了したという情報を出力する。リトライ認識処
理が終了したか否かを判断する処理ステップ508で、
共有データでの処理状況格納部304にリトライ認識処
理状況を参照し終了状況が出力されたか否かを判断す
る。
【0028】図6に示すように、認識用カメラシステム
105の制御装置の処理フロー502は、ステップ50
9で、変数Aに値0を代入する。ステップ510で、共
有データでの処理状況格納部304に広角カメラ処理が
終了したという情報が出力された否かを判断する。ステ
ップ511で、変数Aが、任意の定数B(ただし、B>
0となる整数)より小さいか否かを判断する。ステップ
512で、共有データでの文字領域位置・大きさ格納部
302を随時参照し、担当する領域抽出結果が出力され
たか否かを判断する。尚、前記処理フロー502を行う
認識用カメラシステム105が複数台存在する場合に
は、各装置が担当する抽出結果データを事前に装置ごと
に一定の規則(例えば、制御装置Bが3台の場合には、
データ番号が3nは制御装置Bの1、3n+1は制御装
置Bの2、3n+2は制御装置Bの3の担当。ただしn
は自然数とする。)で決めてあるものとする。
【0029】ステップ513で、変数Aに1を加えた値
を変数Aとして代入する。オブジェクト(Object)認識
ステップ514で、担当した文字領域抽出結果に対し、
Object認識処理を実行する。Object認識ステップ514
の詳細については、後で図9を用いて説明する。
【0030】結果出力ステップ515で、Object認識ス
テップ514の結果を共有データのDB照合結果格納部
307に出力する。ステップ516で、結果出力処理5
15が行われたか否かを判断する。ステップ517で、
共有データの文字領域位置・大きさ格納部302処理状
況格納部から担当した領域抽出情報を削除する処理を示
す。ステップ518で、共有データでの処理状況格納部
304に認識用カメラ処理が終了したという情報を出力
する。
【0031】図7に示すように、ステップ519で、共
有データでの処理状況格納部304に認識用カメラ処理
が終了したという情報が出力されたか否かを判断する。
ステップ520で、共有データでの処理状況格納部30
4にリトライ認識用カメラ処理が終了したという情報を
出力する処理を示す。尚、リトライ認識用カメラ処理5
03を行うリトライ認識用カメラシステム106が複数
台数存在する場合には、各装置が担当する抽出結果デー
タを事前に装置ごとに一定の規則(例えば、制御装置C
が3台の場合には、データ番号が3nは制御装置Cの
1、3n+1は制御装置Cの2、3n+2は制御装置C
の3である。ただしnは自然数とする。)で決めてある
ものとする。
【0032】図8は図5のカメラ入力ステップ504、
文字領域抽出ステップ505、領域抽出結果出力ステッ
プ506の処理を摸式的に示した図である。図8におい
て、データ画像601は、カメラ入力ステップ504に
よって得られた読み取り対象物が点在しているデータ画
像である。文字領域601,602,603,604
は、文字領域抽出ステップ505により抽出された文字
領域である。文字領域抽出結果605は、領域抽出結果
出力ステップ506が文字領域位置・大きさ格納部20
5、または共有データ文字領域位置・大きさ格納部30
2に出力する文字領域抽出結果の一例である。文字領域
抽出結果605には、カメラ制御のために必要となる画
角や視線方向に関する算出結果や、抽出された領域の各
種情報が格納される。
【0033】図9はObject認識ステップ514の処理の
流れを示すフロー図である。図9に示すように、領域抽
出結果入力ステップ701で、データ入出力部212に
より共有データでの文字領域位置・大きさ格納部302
から文字領域位置・大きさ格納部205に文字領域抽出
結果605が入力される。カメラ制御ステップ702で
カメラ制御部201にてカメラ制御値格納部210に格
納されたカメラ視線制御用の値(パン値、チルト値、ズ
ーム値)を参照し、参照した値を該カメラ制御用に適し
た値に変換(キャリブレーションを実施)しカメラ制御
信号をカメラに送信することでカメラ制御を行う。
【0034】カメラ入力ステップ703で、情景画像か
らデータ画像を画像バッファ203に入力する。文字領
域抽出ステップ704は、文字領域抽出手段402で行
われる処理である。画像補正変換ステップ705は、画
像補正変換手段403で行われる処理である。文字切り
出しステップ706は、文字切り出し手段404にて行
われる処理である。文字認識ステップ707は、文字認
識手段405にて行われる処理である。DB照合ステッ
プ708は、DB照合手段406で行われる処理であ
る。これらの処理手段は公知のものを用いる。
【0035】以上、本発明者によってなされた発明を、
前記実施例に基づき具体的に説明したが、本発明は、前
記実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能であることは勿論であ
る。
【0036】
【発明の効果】以上、説明したように、本発明によれ
ば、複数のカメラを能動的に制御し、かつその機能を様
々な利用場面に容易に適用させることが可能となり、障
害物による遮蔽や反射等の問題で文字が読み取れない場
合でも、別視線からのカメラから対象物を読み取ること
により、文字を読み取ることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態(実施例)における景観画
像中読み取り装置の概略全体構成を示すブロック構成図
である。
【図2】本実施形態における制御装置の概略内部構成を
示すブロック構成図である。
【図3】本実施形態における共有データベースの内部構
成を示すブロック構成図である。
【図4】本実施形態における実行処理の流れを示すフロ
ー図である。
【図5】本実施形態における広角カメラシステムの処理
の流れを示すフロー図である。
【図6】本実施形態における認識用カメラシステムの処
理の流れを示すフロー図である。
【図7】本実施形態におけるリトライ用認識カメラシス
テムの処理の流れを示すフロー図である。
【図8】本実施形態における文字領域抽出の実施例と抽
出結果を示す図である。
【図9】本実施形態におけるObject認識における処理の
流れを示すフロー図である。
【符号の説明】
101…カメラ、102…制御装置、103…共有デー
タベース(記憶装置)、104…広角用カメラシステ
ム、105…認識用カメラシステム、106…再度認識
(リトライ)用カメラシステム、201…カメラ制御
部、202…命令解釈・実行部、203…画像バッフ
ァ、204…命令記述ファイル、205…文字領域位置
・大きさ格納部、206…文字パタン格納部、207…
認識結果格納部、208…DB照合結果格納部、209
…処理状況格納部、210…カメラ制御値格納部、21
1…シーン切り替えフラグ、212…データ入出力部、
301…画像バッファ、302…文字領域位置・大きさ
格納部、303…文字パタン格納部、304…処理状況
格納部、305…カメラ制御値格納部、306…認識結
果格納部、307…DB照合結果格納部、401…カメ
ラ、402…文字領域抽出手段、403…画像補正変換
手段、404…文字切り出し手段、405…文字認識手
段、406…DB照合手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮本 信夫 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 中村 修 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 杉村 利明 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5B029 BB02 CC28 CC29 EE04 EE05 5C054 DA09 EH00 FC01 FC05 FC12 FD01 GB12 GD09 HA00 HA26

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数のカメラで撮影された景観画像から
    文字の含まれる文字領域を抽出し、この抽出された文字
    領域の情報から当該文字領域を拡大するためのカメラ制
    御値を算出し、この算出されたカメラ制御値によりカメ
    ラを制御し拡大された文字領域を生成し、この生成され
    た文字領域の画像を三次元的な傾斜による歪みを補正
    し、回転を補正して2値化し、前記生成された文字領域
    から切り出した文字パタンを認識して候補文字の文字列
    を出力し、この文字列の候補文字の集合をデータベース
    に記録されている文字と照合し最も似ている検索結果を
    出力し、動作シーケンスに従ってカメラを制御し、前記
    動作シーケンスを格納する景観画像中の文字を読み取る
    景観画像中文字読み取り方法であって、ネットワークを
    介して接続された前記データベースに、画像データ、カ
    メラ制御値データ、文字領域位置・大きさデータ、文字
    パタンデータ、認識結果データ、DB照合結果データ及
    び処理状況データを、複数カメラを制御する複数の制御
    装置の共有データとして蓄積し、この共有データを入出
    力して管理することを特徴とする景観画像中文字読み取
    り方法。
  2. 【請求項2】 複数のカメラで撮影された景観画像から
    文字の含まれる文字領域を抽出する手順と、この抽出さ
    れた文字領域の情報から当該文字領域を拡大するための
    カメラ制御値を算出し、この算出されたカメラ制御値に
    よりカメラを制御し拡大された文字領域を生成し、この
    生成された文字領域の画像を三次元的な傾斜による歪み
    を補正し、回転を補正して2値化する手順と、前記生成
    された文字領域から切り出した文字パタンを認識して候
    補文字の文字列を出力する手順と、この文字列の候補文
    字の集合をデータベースに記録されている文字と照合し
    最も似ている検索結果を出力する手順と、動作シーケン
    スに従ってカメラを制御する手順と、前記動作シーケン
    スを格納する景観画像中の文字を読み取る手順を有する
    景観画像中文字読み取り方法の処理手順をコンピュータ
    に実行させるためのプログラムを記録したコンピュータ
    読みとり可能な記録媒体であって、ネットワークを介し
    て接続された前記データベースに、画像データ、カメラ
    制御値データ、文字領域位置・大きさデータ、文字パタ
    ンデータ、認識結果データ、DB照合結果データ及び処
    理状況データを、複数カメラを制御する複数の制御装置
    の共有データとして蓄積する手順と、この蓄積された共
    有データを入出力して管理する手順をコンピュータに実
    行させるためのプログラムを記録したコンピュータ読み
    とり可能な記録媒体。
  3. 【請求項3】 複数カメラを制御する複数の制御装置
    に、景観画像から文字の含まれる文字領域を抽出する手
    段と、前記抽出された文字領域の情報から該文字領域を
    拡大するためのカメラ制御値の算出手段と、前記算出さ
    れたカメラ制御値によりカメラを制御し拡大された文字
    領域を生成する手段と、該生成された文字領域の画像を
    三次元的な傾斜による歪みを補正し回転を補正し2値化
    する手段と、前記切り出した文字パタンを認識して候補
    文字の文字列を出力する認識手段と、前記文字列の候補
    文字の集合をデータベースに記録されている文字と照合
    し最も似ている検索結果を出力する手段と、動作シーケ
    ンスに従って前記手段を制御する手段と、前記動作シー
    ケンスを格納する手段とを具備する景観画像中の文字を
    読み取る装置であって、ネットワークを介して接続され
    た前記データベースに、画像データ、カメラ制御値デー
    タ、文字領域位置・大きさデータ、文字パタンデータ、
    認識結果データ、DB照合結果データ及び処理状況デー
    タを複数カメラを制御する複数の制御装置の共有データ
    として蓄積する手段と、この蓄積された共有データを入
    出力して管理する手段を具備することを特徴とする景観
    画像中文字読み取り装置。
JP23297898A 1998-08-19 1998-08-19 景観画像中文字読み取り方法及び実施装置ならびにその方法を記録した記録媒体 Expired - Fee Related JP3479601B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23297898A JP3479601B2 (ja) 1998-08-19 1998-08-19 景観画像中文字読み取り方法及び実施装置ならびにその方法を記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23297898A JP3479601B2 (ja) 1998-08-19 1998-08-19 景観画像中文字読み取り方法及び実施装置ならびにその方法を記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2000067159A true JP2000067159A (ja) 2000-03-03
JP3479601B2 JP3479601B2 (ja) 2003-12-15

Family

ID=16947884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23297898A Expired - Fee Related JP3479601B2 (ja) 1998-08-19 1998-08-19 景観画像中文字読み取り方法及び実施装置ならびにその方法を記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3479601B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100977713B1 (ko) 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
US10579859B2 (en) 2017-03-15 2020-03-03 Kabushiki Kaisha Toshiba Image processing apparatus, image processing system, image processing method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100977713B1 (ko) 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
US10579859B2 (en) 2017-03-15 2020-03-03 Kabushiki Kaisha Toshiba Image processing apparatus, image processing system, image processing method, and program

Also Published As

Publication number Publication date
JP3479601B2 (ja) 2003-12-15

Similar Documents

Publication Publication Date Title
KR20230013243A (ko) 프레임에서 타겟 오브젝트를 위한 고정된 크기 유지
US8126219B2 (en) Image processing apparatus, image processing method, and imaging apparatus
US20100182480A1 (en) Image processing apparatus, image matching method, and computer-readable recording medium
JP5235691B2 (ja) 情報処理装置及び情報処理方法
JP2015104016A (ja) 被写体検出装置、撮像装置、被写体検出装置の制御方法、被写体検出装置の制御プログラムおよび記憶媒体
CN112689221B (zh) 录音方法、录音装置、电子设备及计算机可读存储介质
US20200320332A1 (en) System and method for object detection
CN111031348A (zh) 一种视频加扰方法、装置、服务器和存储介质
US20200320331A1 (en) System and method for object recognition using local binarization
CN111723713B (zh) 一种基于光流法的视频关键帧提取方法及系统
KR20190120106A (ko) 동영상의 대표 이미지를 결정하는 방법 및 그 방법을 처리하는 전자 장치
EP3885934A1 (en) Video search method and apparatus, computer device, and storage medium
JP6862596B1 (ja) 映像解析装置、広域監視システム及びカメラの選定方法
CN113312949B (zh) 视频数据处理方法、视频数据处理装置和电子设备
KR102196749B1 (ko) 가중치 특징점을 이용한 이미지 정합 방법 및 그 시스템
JP2000067159A (ja) 景観画像中文字読み取り方法及び実施装置ならびにその方法を記録した記録媒体
JPH09130714A (ja) 画像情報抽出装置および方法
WO2022057773A1 (zh) 图像存储的方法、装置、计算机设备和存储介质
CN112487943B (zh) 关键帧去重的方法、装置和电子设备
CN115022549A (zh) 拍摄构图方法、装置、计算机设备和存储介质
KR102239564B1 (ko) 행정구역별 오브젝트 인식방법 및 그 시스템
KR20180089589A (ko) 가상 특징점을 이용한 이미지 정합 방법 및 그 시스템
JP2002358316A (ja) 画像処理装置及びその方法、プログラム
CN113034369B (zh) 一种基于多摄像头的图像生成方法、装置和计算机设备
KR102502034B1 (ko) 영상의 비 식별 처리 객체를 검색하는 방법 및 시스템

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081003

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091003

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101003

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees