JP4135556B2 - 映像認識装置 - Google Patents

映像認識装置 Download PDF

Info

Publication number
JP4135556B2
JP4135556B2 JP2003138086A JP2003138086A JP4135556B2 JP 4135556 B2 JP4135556 B2 JP 4135556B2 JP 2003138086 A JP2003138086 A JP 2003138086A JP 2003138086 A JP2003138086 A JP 2003138086A JP 4135556 B2 JP4135556 B2 JP 4135556B2
Authority
JP
Japan
Prior art keywords
article
camera
moving body
posture
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003138086A
Other languages
English (en)
Other versions
JP2004338889A (ja
Inventor
功 田澤
史子 紅山
俊夫 守屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003138086A priority Critical patent/JP4135556B2/ja
Publication of JP2004338889A publication Critical patent/JP2004338889A/ja
Application granted granted Critical
Publication of JP4135556B2 publication Critical patent/JP4135556B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、移動体に搭載されたカメラの映像を解析して物品に関する情報収集、管理を行うための映像認識装置に関する。
【0002】
【従来の技術】
従来、例えば図書館等では、書籍管理のために図書の目録を使用している。目録は電子データとして蓄積され、コンピュータを使用した検索や管理が容易に行えるようになっている(例えば下記非特許文献1等参照)。
【0003】
【非特許文献1】
永田治樹、“図書館目録の現状と将来:メタデータとOPAC”、情報の科学と技術、Vol.46、No.3、pp.106-113、1996.
【0004】
【発明が解決しようとする課題】
書籍等の管理業務では、上記従来技術による目録の電子データの管理以外に、その情報と書籍の実際の状況の整合性を確認するために、人手で書籍そのものを確認するという作業が必要である。この作業は、作業者の大きな負担となる。
【0005】
そこで、本発明では、移動体に搭載されたカメラの映像を解析して物品の情報収集や管理を自動的に実行するための映像認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記目的を達成するために、本発明では以下の手段を設ける。
(1)移動体は走行のための駆動装置を備え、カメラは移動体の上部に姿勢制御が可能なように設置されており、移動体およびカメラの姿勢を計測する姿勢計測手段と、移動体の駆動装置の回転数および回転角を取得することにより移動体の位置および速度を算出する駆動系状態計測手段と、一時刻前の移動体の位置、姿勢、速度の変更量に基づいて、移動体の位置、姿勢、速度情報を定する移動体パラメータ推定手段と、推定した移動体の位置、姿勢、速度を用いて、移動体が予め設定された運動を行うよう移動体の位置、姿勢、速度の変更量を決定し、移動体の運動を制御する移動体制御手段と、一時刻前のカメラの姿勢、ズーム値の変更量、および推定した移動体の位置および姿勢に基づいて、カメラの位置、姿勢、ズーム値情報を定するカメラパラメータ推定手段と、推定したカメラの位置、姿勢、ズーム値を用いて、カメラの姿勢およびズーム値の変更量を決定し、カメラを制御して所望の映像を取得する撮影手段と、取得した所望の映像の幾何変換を行い、映像上で前記物品を特徴づける文字や記号が存在する面の回転および歪を補正する映像補正手段と、補正により得られた映像データから物品を特徴づける文字や記号を認識する認識手段と、物品の所望の映像上での位置、および推定したカメラの位置、姿勢、ズーム値を用いて物品の位置を推定する位置推定手段を備えた装置を構成する。
(2)情報提示手段を備え、物品を格納する領域の地図上での物品の位置情報、物品の格納された棚等の場所での物品の詳細な位置情報、および物品の色や形状等が識別可能な映像を提示する。
(3)情報管理手段を備え、記号認識手段および位置推定手段で検出された物品の情報を用いて、物品の管理情報を更新する。
(4)領域情報推定手段を備え、撮影された映像を用いて物品を格納する領域における空き領域を推定する。
【0007】
【発明の実施の形態】
本発明は、移動体に搭載されたカメラの映像を解析して物品の情報収集や管理を自動的に実行するための映像認識装置に関する。具体的には、下記の方法を実施するソフトウェア、またはハードウェアを作成することにより実現できる。
【0008】
図1は、本実施例における映像認識装置の構成図である。本装置は、センサ群101から104、移動ロボット110、計算機120、コンソール130、および外部記憶装置140から構成される。
【0009】
センサとしては、カメラ101、音響センサ102、駆動系状態計測用センサ103、および姿勢計測用センサ104a,104bを使用する。カメラ数、音響センサ数は1以上とする。カメラ101の焦点距離、姿勢等のパラメータはあらかじめ校正し、それをカメラパラメータの初期値とする。音響センサ102としては、音波を発信して反射波を観測することにより距離計測が可能であるアクティブソナーを使用する。駆動系状態計測用センサ103としてはロータリエンコーダやタコジェネレータを使用し、姿勢計測用センサ104としてはジャイロ等を使用する。
【0010】
移動ロボット110にはコントローラ111が内蔵されている。コントローラ111では、移動ロボットに搭載の音響センサ102の観測データの取得や、駆動装置112(車輪)の状態計測、および制御を行う。
【0011】
計算機120では、カメラ101の映像データの取得および画像処理、カメラ101や移動ロボット110の制御量の算出を行う。カメラ101の映像データの受信、移動ロボット110の状態パラメータの受信、および制御コマンドの送信には、無線もしくは有線の通信手段を使用する。
【0012】
コンソール130では、カメラ映像の表示、移動ロボット110の状態等の表示、収集した物品情報の表示、および各種パラメータの設定等を行う。
【0013】
外部記憶装置140には、物品の管理データ、物品を格納する領域の地図データ等が格納されている。
【0014】
図2は、映像認識装置における処理のブロック図である。以下、各処理について説明する。なお、以下では、図3に示すように移動ロボット110を書棚301付近に移動させて、書棚の書籍302を撮影し、その映像より認識される書籍のタイトルから所望の書籍を探索する状況を仮定する。
【0015】
映像入力部211では、カメラ101の映像データを取得する。このデータに対してA/D変換等の前処理を行い、処理後の映像データを出力する。
【0016】
図4に映像入力部211で得られる映像データの例を示す。同じ書籍を撮影した場合でも、カメラ101や移動ロボット110の位置、姿勢により、異なる映像データが得られる。
【0017】
姿勢計測部212では、姿勢計測用センサ104a,104bによりカメラ101および移動体110の姿勢を計測する。
【0018】
駆動系状態計測部221では、駆動装置112の状態、すなわち回転数および回転角を取得する。これらのデータから移動ロボット110の位置、速度、および角度(進行方向)を算出する。ここで、位置および角度は移動ロボット110の初期位置を基準とした値として得られる。
【0019】
移動体パラメータ推定部222では、後述の移動体制御部223で1時刻前に算出された状態パラメータ(移動体110の位置、姿勢、速度)の変更量に基づいて、移動体110の状態パラメータを更新する。また、姿勢計測部212、駆動系状態計測部221で得られた移動体110の位置、姿勢データを用いて状態パラメータを補正する。
【0020】
カメラパラメータ推定部213では、後述のカメラ制御部214で1時刻前に算出されたカメラパラメータ(カメラ101の位置、姿勢、焦点距離(ズーム値))の変更量、および移動体パラメータ推定部222で算出された移動ロボット110の状態パラメータに基づいて、カメラパラメータを更新する。また、姿勢計測部212で計測した姿勢データや、時系列の複数の映像データを使用して推定した焦点距離、位置、姿勢データを用いてカメラパラメータを補正する。複数の映像データを使用したパラメータの推定方法としては、下記文献2等に記載の方法を使用することができる。
【0021】
文献2:服部進ら、“ターゲット場の多重撮影による基準点のないCCDカメラキャリブレーション”、信学論D-II、Vol.82、No.9、pp.1391-1400、1999.
カメラ制御部214では、映像撮影部211で取得した映像データ、およびカメラパラメータ推定部213で算出したカメラパラメータに基づいて、カメラ101により所望の映像が得られるように、カメラパラメータの変更量(制御量)の算出、および制御コマンドの決定を行う。ここで、所望の映像とは、例えば書棚301の書籍302にピントが合っている映像等を意味する。算出した制御量および制御コマンドに基づいて、カメラの焦点距離および姿勢を制御する。
【0022】
移動体制御部223では、移動体パラメータ推定部222で算出した移動ロボット110の状態パラメータに基づいて、移動ロボット110が所望の行動をとるように、変更量(制御量)の算出、および制御コマンドの決定を行う。ここで、所望の行動は、(a)設定された距離になるまで書棚301に接近する、(b)接近後書棚301と平行に移動する、などのようにあらかじめ設定しておく。算出した制御量および制御コマンドに基づいて、駆動装置の回転数および回転角を算出し、駆動装置を制御する。
【0023】
記号認識部231では、映像データから物品を特徴づける記号や文字を認識する。ここでの処理は、映像補正処理、記号領域抽出処理および記号認識処理の3つに大別される。映像補正処理では、映像データの幾何変換を行い、物品上で記号や文字等が存在する面の回転や歪を補正する。本処理では、異なる条件で撮影した映像データを一定の条件で撮影した(例えば、書籍に正対した状態で撮影した)映像データに変換する。本処理は必要に応じて実行する。記号領域抽出処理では、映像データの中から認識対象となる記号や文字列の存在する領域を切り出す。記号や文字が複数存在する場合には、各記号、文字の切り出しも行う。記号認識処理では、切り出した記号や文字の特徴を解析して、その記号や文字の表す内容を認識する。認識の際には、外部記憶装置140内のデータと照合する。これらの具体的な方法としては、下記文献3等に記載の各種方法を使用することができる。
【0024】
文献3:”信学技報(PRMU96-180〜191)”、電子情報通信学会、1997.
図5に画像401について映像補正処理を実行した例を示す。この例では、本処理により書籍のタイトルの回転を補正し、書籍の正面から撮影した映像に変換している。図6に画像501について記号領域抽出処理を実行した例を示す。この例に示すように、本処理により書籍のタイトル領域602のみが抽出される。また、各文字の切り出しも同時に行う。この抽出データを用いて、記号認識処理により各タイトルを認識する。
【0025】
位置推定部232では、記号認識部231で抽出した物品のカメラ映像上の位置、およびカメラパラメータ推定部213で推定されたカメラパラメータを使用して、その物品の実空間内における位置を算出する。具体的には、その物品が撮影された複数の映像を使用して、各映像を撮影したカメラ位置とそのカメラ映像上の物品の検出位置を結ぶ直線の交点を算出する。本方法については、各映像上の検出位置に推定誤差がある場合等も含めて下記文献4に記載されている。
【0026】
文献4:高木幹雄、下田陽久、“画像解析ハンドブック”、東京大学出版会、1991.
物品の位置は3次元の座標値として得られる。この座標と書棚の位置の対応を外部記憶装置140にあらかじめ格納しておくことにより、どの書棚の、どの位置に、どの書籍があるのかという情報を得ることができる。
【0027】
情報管理部233では、記号認識部231で抽出した物品の情報と位置推定部232で推定したその物品の位置情報を用いて、外部記憶装置140内の物品に関する管理情報を更新する。
【0028】
情報表示部234では、地図上での物品の位置情報、物品の格納された棚等の場所でのより詳細な位置情報、および物品の色や形状等が識別可能な映像を提示する。
【0029】
図7に書籍の位置の推定結果をコンソール130上に表示した例を示す。図702には、各書棚703、移動ロボット110の位置704、書籍の位置705が表示され、その書籍の置かれた書棚を地図上で確認することができる。図706には、各書棚707、書籍の位置708が表示され、その書棚における書籍の位置を確認することができる。
【0030】
上記記号認識部231では、物品を特徴づける記号や文字を認識し、物品そのものを検出する。それに対して、広域の領域を撮影した映像を使用することにより、物品を格納するための領域の空きを推定することも可能である。具体的な方法としては、記号認識部231、位置推定部232における物品の検出結果(物品の個数および位置)と、外部記憶装置140に格納された物品の情報(大きさ等)から空き領域を推定する。その他、上記文献4等に記載の、映像中のオブジェクトの分類手法等を使用することができる。
【0031】
図8に広域の領域を撮影した映像の例を示す。このような映像から、書棚および書籍の領域802,803を推定することにより、書棚301内の空き領域804,805を推定する。
【0032】
以上のように、移動ロボットを自動走行させて映像を撮影し、その映像から物品を特徴づける記号や文字を認識することにより、物品の情報収集および管理を自動的に実行することができる。
【0033】
【発明の効果】
本発明によれば、移動体にカメラを搭載して、その運動を自動制御しながら映像を撮影し、その映像を使用して物品を特徴づける記号や文字を認識することにより、物品の情報収集や管理を自動的に実行する映像認識装置を提供することができる。
【図面の簡単な説明】
【図1】映像認識装置の構成図。
【図2】映像認識装置における処理のブロック図。
【図3】移動ロボットによる撮影状況の例。
【図4】映像撮影部で得られる映像データの例。
【図5】映像補正処理後の映像データの例。
【図6】記号領域抽出処理後の映像データの例。
【図7】物品位置推定結果の表示例。
【図8】広域映像の例。
【符号の説明】
101…カメラ、102…音響センサ、103…駆動系状態計測用センサ、104a,104b…姿勢計測用センサ、110…移動ロボット、111…コントローラ、112…駆動装置、120…計算機、130…コンソール、140…外部記憶装置、301…書棚、302…書籍、401…カメラ映像、501…映像補正処理後の映像、601…映像中の文字の検出結果、701…コンソールにおける情報提示例、801…広域映像の例。

Claims (4)

  1. 移動に搭載されたカメラの映像を解析して物品の情報を収集、管理する装置であり、
    前記移動体は走行のための駆動装置を備え、
    前記カメラは前記移動体の上部に姿勢制御が可能なように設置され、
    前記移動体および前記カメラの姿勢を計測する姿勢計測手段と、
    前記移動体の前記駆動装置の回転数および回転角を取得することにより前記移動体の位置および速度を算出する駆動系状態計測手段と、
    一時刻前の前記移動体の位置、姿勢、速度の変更量に基づいて、前記移動体の位置、姿勢、速度情報を定する移動体パラメータ推定手段と、
    推定した前記移動体の位置、姿勢、速度を用いて、前記移動体が予め設定された運動を行うよう前記移動体の位置、姿勢、速度の変更量を決定し、前記移動体の運動を制御する移動体制御手段と、
    一時刻前の前記カメラの姿勢、ズーム値の変更量、および推定した前記移動体の位置および姿勢に基づいて、前記カメラの位置、姿勢、ズーム値情報を定するカメラパラメータ推定手段と、
    推定した前記カメラの位置、姿勢、ズーム値を用いて、前記カメラの姿勢およびズーム値の変更量を決定し、前記カメラを制御して所望の映像を取得する撮影手段と、
    取得した前記所望の映像の幾何変換を行い、前記映像上で前記物品を特徴づける文字や記号が存在する面の回転および歪を補正する映像補正手段と、
    補正により得られた映像データから前記物品を特徴づける文字や記号を認識する認識手段と、
    前記物品の前記所望の映像上での位置、および推定した前記カメラの位置、姿勢、ズーム値を用いて前記物品の位置を推定する位置推定手段と
    を備えることを特徴とする映像認識装置。
  2. 請求項1において、
    前記物品を格納する領域の地図上での前記物品の位置情報、前記物品が格納された棚等の場所での前記物品の位置情報、および前記物品の色や形状等が識別可能な映像を提示する情報提示手段
    を備えることを特徴とする映像認識装置。
  3. 請求項1において、
    前記認識手段および前記位置推定手段で検出された前記物品の情報を用いて、前記物品の管理情報を更新する情報管理手段
    を備えることを特徴とする映像認識装置。
  4. 請求項1において、
    撮影された前記所望の映像を用いて、
    前記物品を格納する領域における未使用領域の大きさを推定する領域情報推定手段を備えることを特徴とする映像認識装置。
JP2003138086A 2003-05-16 2003-05-16 映像認識装置 Expired - Fee Related JP4135556B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003138086A JP4135556B2 (ja) 2003-05-16 2003-05-16 映像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003138086A JP4135556B2 (ja) 2003-05-16 2003-05-16 映像認識装置

Publications (2)

Publication Number Publication Date
JP2004338889A JP2004338889A (ja) 2004-12-02
JP4135556B2 true JP4135556B2 (ja) 2008-08-20

Family

ID=33527554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003138086A Expired - Fee Related JP4135556B2 (ja) 2003-05-16 2003-05-16 映像認識装置

Country Status (1)

Country Link
JP (1) JP4135556B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4677613B2 (ja) * 2006-05-08 2011-04-27 コニカミノルタセンシング株式会社 三次元形状測定システム
JP5140889B2 (ja) * 2006-08-10 2013-02-13 サンリツオートメイション株式会社 ゆらぎ補正による画像表示方法及びその方法を用いた動体リモートコントロールシステム
JP5891143B2 (ja) * 2012-08-24 2016-03-22 富士フイルム株式会社 物品マスターテーブル作成装置および方法並びにプログラム
JP5547267B2 (ja) * 2012-12-11 2014-07-09 株式会社ビジュアルジャパン 書籍の背表紙画像取得装置及び取得方法
WO2015107623A1 (ja) * 2014-01-15 2015-07-23 パイオニア株式会社 管理システム及び位置特定方法
CN103950032B (zh) * 2014-04-14 2016-01-13 上海大学 一种仓库管理辅助机器人
WO2016113836A1 (ja) * 2015-01-13 2016-07-21 株式会社日立製作所 マニプレータ制御方法、システム、およびマニプレータ
WO2017033254A1 (ja) * 2015-08-24 2017-03-02 株式会社日立製作所 移動ロボット運用システム、移動ロボット、及び対象物取り出し方法
KR101756700B1 (ko) * 2015-10-30 2017-07-12 재단법인대구경북과학기술원 스마트 서재 관리 장치 및 그 방법
JP6605711B2 (ja) * 2016-04-05 2019-11-13 株式会社日立物流 計測システム及び計測方法
KR102216498B1 (ko) 2016-05-19 2021-02-17 심베 로보틱스 인코포레이션 상점의 선반 상의 제품의 배치를 추적하기 위한 방법
KR101878239B1 (ko) * 2017-03-22 2018-07-13 경남대학교 산학협력단 모바일 로봇 기반의 도서 관리 시스템
CN108482935A (zh) * 2018-05-11 2018-09-04 西安航空学院 三爪式图书馆自动取书装置
JP2019205111A (ja) * 2018-05-25 2019-11-28 セイコーエプソン株式会社 画像処理装置、ロボット、及び、ロボットシステム
CN112861850B (zh) * 2021-01-07 2024-02-23 北京三缘聚科技有限公司 一种实现移动终端近距离提取文字的方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2593499B2 (ja) * 1987-12-29 1997-03-26 川崎製鉄株式会社 クレーンの位置検出並びに制御装置
JPH1035827A (ja) * 1996-07-16 1998-02-10 Murata Mach Ltd 自動倉庫システム
JP3290423B2 (ja) * 1999-04-30 2002-06-10 日本ファイリング株式会社 図書保管管理装置
JP2001088912A (ja) * 1999-09-20 2001-04-03 Fujitsu General Ltd 画像認識による棚卸管理方法及び棚卸システム
JP2002247441A (ja) * 2001-02-22 2002-08-30 Oyo Keisoku Kenkyusho:Kk 被写体認識方法及びそれを用いた自動撮影カメラ装置

Also Published As

Publication number Publication date
JP2004338889A (ja) 2004-12-02

Similar Documents

Publication Publication Date Title
JP4135556B2 (ja) 映像認識装置
US11392146B2 (en) Method for detecting target object, detection apparatus and robot
JP3834297B2 (ja) 画像処理装置
JP4488804B2 (ja) ステレオ画像の関連付け方法及び3次元データ作成装置
KR101738569B1 (ko) 제스쳐 인식 방법 및 시스템
US20180190014A1 (en) Collaborative multi sensor system for site exploitation
JP2008506953A5 (ja)
US20160086343A1 (en) Contour line measurement apparatus and robot system
CN112288742A (zh) 用于超声探头的导航方法、装置、存储介质以及电子设备
EP1394743A3 (en) Device for detecting position/orientation of object from stereo images
JP2008275391A (ja) 位置姿勢計測装置及び位置姿勢計測方法
JP2007278845A (ja) 画像処理装置及びその処理方法
CN110084842B (zh) 一种机器人云台伺服二次对准方法及装置
CN110926330A (zh) 图像处理装置和图像处理方法
KR101469099B1 (ko) 사람 객체 추적을 통한 자동 카메라 보정 방법
JP2020197978A (ja) 物体検出装置、物体把持システム、物体検出方法及び物体検出プログラム
KR101896827B1 (ko) 사용자 자세 추정 장치 및 방법
JP4085671B2 (ja) データ処理方法、データ処理プログラムおよび記録媒体
JP2004030445A (ja) 移動ロボットの自己位置推定方法及びシステム、並びにプログラム
KR101735325B1 (ko) 점군 정합 장치
US20180293751A1 (en) Measuring apparatus and corresponding measuring method
JP2005241323A (ja) 撮像システム及び校正方法
CN111699453A (zh) 可移动平台的控制方法、装置、设备及存储介质
CN115239811A (zh) 一种基于双目视觉检测的定位方法、系统、计算机及存储介质
CN113228117A (zh) 创作装置、创作方法和创作程序

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051219

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080526

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees