JP2016194835A - 情報抽出方法、情報抽出プログラム及び情報抽出装置 - Google Patents
情報抽出方法、情報抽出プログラム及び情報抽出装置 Download PDFInfo
- Publication number
- JP2016194835A JP2016194835A JP2015074648A JP2015074648A JP2016194835A JP 2016194835 A JP2016194835 A JP 2016194835A JP 2015074648 A JP2015074648 A JP 2015074648A JP 2015074648 A JP2015074648 A JP 2015074648A JP 2016194835 A JP2016194835 A JP 2016194835A
- Authority
- JP
- Japan
- Prior art keywords
- information
- image
- unit
- information extraction
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【課題】対象物上の情報のうち、所望の情報を抽出することができる情報抽出方法を提供する。
【解決手段】撮像装置により対象物を撮像して撮像画像を取得し、前記対象物上の指定された第1の位置を算出し、前記撮像画像のうち前記第1の位置に対応する部分から第1情報を抽出し、抽出した前記第1情報を投影装置により投影し、投影された前記第1情報上の指定された第2の位置を算出し、前記第1情報のうち前記第2の位置に対応する部分から第2情報を抽出する。
【選択図】図1
【解決手段】撮像装置により対象物を撮像して撮像画像を取得し、前記対象物上の指定された第1の位置を算出し、前記撮像画像のうち前記第1の位置に対応する部分から第1情報を抽出し、抽出した前記第1情報を投影装置により投影し、投影された前記第1情報上の指定された第2の位置を算出し、前記第1情報のうち前記第2の位置に対応する部分から第2情報を抽出する。
【選択図】図1
Description
本発明は、情報抽出方法、情報抽出プログラム及び情報抽出装置に関する。
作業面に焦点が合わされたカメラ/プロジェクタにより、テキストとイメージを含む原文書から新しい文書を作成する対話式複写装置が知られている。このような対話式複写装置は、ユーザの指の動作により原文書上のテキストやイメージなどの情報が選択されると、選択された情報をカメラにより取り込み、取り込んだ情報をプロジェクタにより投影する。更に、対話式複写装置は、ユーザの指の動作により投影情報の位置調節が行われると、位置調節の結果を反映させた情報を含む新たな文書を作成する。
しかしながら、従来技術では、ユーザの指でテキストやイメージなどの情報の選択が行われるため、選択動作時に選択対象が指(手)により隠れてしまったり、ユーザが選択を希望する文字列の隣の文字や上下の文字も誤って選択されてしまうといった問題がある。
一つの側面では、所望の情報の抽出を支援する情報抽出方法、情報抽出プログラム及び情報抽出装置を提供することを目的とする。
一つの側面では、所望の情報の抽出を支援する情報抽出方法、情報抽出プログラム及び情報抽出装置を提供することを目的とする。
情報抽出方法の一観点では、撮像装置により対象物を撮像して撮像画像を取得し、前記対象物上の指定された第1の位置を算出し、前記撮像画像のうち前記第1の位置に対応する部分から第1情報を抽出し、抽出した前記第1情報を投影装置により投影し、投影された前記第1情報上の指定された第2の位置を算出し、前記第1情報のうち前記第2の位置に対応する部分から第2情報を抽出する。
一実施形態によれば、所望の情報を抽出することができる。
以下に、本発明に係る情報抽出方法、情報抽出プログラム及び情報抽出装置の実施形態の例を、図面に基づいて詳細に説明する。
(第1実施形態)
[情報抽出システムの構成]
図1は、本発明の第1実施形態に係る情報抽出システム100の全体の構成の一例を示す図である。図1に示すように、情報抽出システム100は、制御装置10、第1撮像装置11、投影装置12を備える。制御装置10は、第1撮像装置11及び投影装置12と通信可能に有線又は無線で接続される。第1撮像装置11としては、例えば、CMOS(Complementary Metal Oxide Semiconductor)カメラを用いても良い。図1の一点鎖線で囲まれた領域は、第1撮像装置11の撮像範囲13を示す。なお、作業台14は、第1撮像装置11を支持する支持アーム(不図示)と連結されているが、第1撮像装置とは別個の部材であっても良い。
[情報抽出システムの構成]
図1は、本発明の第1実施形態に係る情報抽出システム100の全体の構成の一例を示す図である。図1に示すように、情報抽出システム100は、制御装置10、第1撮像装置11、投影装置12を備える。制御装置10は、第1撮像装置11及び投影装置12と通信可能に有線又は無線で接続される。第1撮像装置11としては、例えば、CMOS(Complementary Metal Oxide Semiconductor)カメラを用いても良い。図1の一点鎖線で囲まれた領域は、第1撮像装置11の撮像範囲13を示す。なお、作業台14は、第1撮像装置11を支持する支持アーム(不図示)と連結されているが、第1撮像装置とは別個の部材であっても良い。
また、第1撮像装置11による撮像画像については、例えば、図1に示すように、作業台14上の撮像範囲13の左下の頂点を原点とし、横方向をX軸、縦方向をY軸とするXY座標系が定義される。
図2は、第1実施形態に係る制御装置10の構成を示す図である。図2に示すように、制御装置10は、制御部200、記憶部201を備える。更に、制御部200は、撮像制御部21、転送部22、検出部23、算出部24、判定部25、第1抽出部26、第2抽出部27、投影制御部28等の処理部を備える。
制御部200は、制御装置10を制御するデバイスである。制御部200としては、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等の電子回路を用いても良い。制御部200は、記憶部201に記憶されている各種の処理が規定されたプログラムを読み出し、読み出したプログラムを実行することで、撮像制御部21、転送部22、検出部23、算出部24、判定部25、第1抽出部26、第2抽出部27、投影制御部28等の処理部に対応する各種の処理を実行しても良い。なお、各種の処理を専用のハードウェアを用いて実現しても良い。
撮像制御部21は、所定のフレームレートで周期的に撮像を行うように第1撮像装置11を制御する。フレームレートは、例えば、ユーザが入力動作のために作業台14上で指を移動させた場合に、移動に追従して指が写るようなレートとすることができる。例えば、フレームレートは、24fps(frame per second)、30fps、60fpsなどが挙げられるが、これらに限られるものではない。第1撮像装置11により撮像された撮像画像は、一時的に記憶部201に記憶される。
転送部22は、各装置間及び制御装置10内の各部間のデータ転送処理を行う。例えば、第1撮像装置11により撮像された対象物15(例えば、雑誌、新聞)の撮像画像を記憶部201に転送して記憶させる処理、及び制御部200により行われた演算結果のデータや加工処理後のデータを記憶部201や投影装置12に転送する処理を行う。
検出部23は、第1撮像装置11により撮像され記憶部201に記憶された撮像画像に基づき、撮像画像に写り込んだ指示画像(例えば、ユーザの指、指示棒等の何らかの対象を指し示すものの画像)を検出する。例えば、指示画像の検出は、記憶部201に予め記憶されている指示画像の色情報及び/又は形状情報に基づき行われる。
具体的には、検出部23は、第1撮像装置11により撮像された撮像画像から各画素の色情報を抽出する。続いて、検出部23は、抽出した色情報と記憶部201に予め記憶された指示画像の色情報とを比較して、抽出した色情報が予め記憶された指示画像の色情報の所定の範囲内である領域を、指示画像の候補領域として検出する。
更に、検出部23は、検出された候補領域の形状から形状情報を抽出し、抽出した形状情報と予め記憶部201に記憶された指示画像の形状情報との一致度を算出する。続いて、検出部23は、形状情報の一致度が所定値以上である場合に、検出した指示画像の候補領域に、指示画像が存在すると判定する。
なお、色情報は、指示画像として想定される物の色の範囲を含んでも良い。この色の範囲は、例えば、HSV(色相(Hue)、彩度(Saturation)、明度(Value))表色系における色相と彩度により定義される。形状情報は、指示画像(例えば、手)の外形の特徴点を含む。
算出部24は、検出部23により撮像画像から指示画像が検出される毎に、XY座標系おける、撮像画像から指示画像の代表点の2次元位置(x,y)を算出する。指示画像として指を用いる場合、代表点として、例えば指先を用いても良い。
なお、算出部24は最初の指示位置(第1の位置)を算出する第1算出部、及び次の指示位置(第2の位置)を算出する第2算出部として機能する。
判定部25は、算出部24により算出された指示画像の代表点の時系列の2次元位置(x,y)に基づき、ユーザの入力動作(停止動作、スライド動作等)を判定する。例えば、対象物上のA点において、一定時間(例えば3秒)以上、指示画像の代表点が停止した場合、判定部25は、停止動作(対象物上のA点を指定する動作)が行われたと判定する。さらに、指示画像の代表点が対象物上のA点からB点まで移動した場合、判定部25は、対象物上のA点からB点までのスライド動作(A点とB点とを頂点とする矩形領域の指定動作)が行われたと判定する。
第1抽出部26は、判定部25により所定の停止動作(例えば、対象物15上の第1の位置において、一定時間(例えば3秒)指示画像が停止)が判定された場合に、算出部24により算出された指示画像の代表点の2次元位置から対象物15上の第1の位置の周辺領域41(図4B参照)を確定する。なお、停止動作は0秒とし、指定に応じてリアルタイムに周辺領域41を確定しても良い。更に、第1抽出部26は、第1撮像装置11の撮像画像から周辺領域41に対応する画像(以下、周辺画像42(図4C参照)とする)を抽出する。抽出された周辺画像42は、周辺画像42の範囲情報と共に記憶部201に記憶される。ここで、周辺画像42の範囲情報は、例えば、XY座標系における周辺画像42の座標範囲(例えば、X1〜X2,Y1〜Y2)とすることができる。
周辺領域41の範囲は、ユーザが任意に設定することができる。例えば、ユーザは、対象物に表記された所定の行上において停止動作が判定された場合に、第1抽出部26が、その行の上下2、3行分(又は2cm、3cm)を含む領域を周辺領域41として確定するように設定しても良い。
第2抽出部27は、判定部25により所定の選択動作(例えば、スライド動作)が判定された場合に、撮像画像から、選択動作により選択された領域(以下、選択領域43(図4E参照))に対応する画像(以下、選択画像とする)を抽出する。例えば、第2抽出部27は、選択動作により指定された第2の位置に基づき、第1の撮像装置の撮像画像から選択画像を抽出する。選択画像は、記憶部201に記憶される。
なお、周辺画像42と共に記憶されている範囲情報に基づき、周辺画像上の点はXY座標系の座標で特定される。その為、第2抽出部27は、周辺画像42からも選択画像を抽出することができる。
投影制御部28は、投影装置12により周辺画像42などの画像を投影する処理を行う。例えば、投影制御部28は、XY座標系における投影する位置、大きさ、色彩を調整する。
記憶部201は、例えばハードディスク、SSD(Solid State Drive)、光ディスクなどの不揮発性の記憶装置である。なお、記憶部201は、例えばRAM(Random Access Memory)、フラッシュメモリ、NVSRAM(Non Volatile Static Random Access Memory)などのデータを書き換え可能な半導体メモリであっても良い。
また、記憶部201は、例えば制御部200で実行されるOS(Operating System)、各種プログラム、及び各種データを記憶する。
[情報抽出の処理手順]
次に、第1実施形態に係る上記情報抽出システムを用いた情報抽出方法について、図3〜図5を参照して説明する。図3は、第1実施形態に係る情報抽出方法の情報抽出の処理手順を示すフローチャートである。図4A〜4Eは、第1実施形態に係る情報抽出方法を示す図である。図5は、図4Dと同じ手順における他の方法を示す図である。
次に、第1実施形態に係る上記情報抽出システムを用いた情報抽出方法について、図3〜図5を参照して説明する。図3は、第1実施形態に係る情報抽出方法の情報抽出の処理手順を示すフローチャートである。図4A〜4Eは、第1実施形態に係る情報抽出方法を示す図である。図5は、図4Dと同じ手順における他の方法を示す図である。
第1実施形態に係る情報抽出方法として、図4Aに示すように、複数の文字列が記載された対象物15(例えば文書)から特定の文字列40(例えばURL)のみを選択し抽出を行う場合を一例に挙げる。
以下、装置間及び制御装置10内の各部間のデータ通信は、転送部22により行われることを前提として説明を省略する。
まず、ユーザは、図1に示すように、抽出したい文字列40(図4A参照)が記載された対象物15を、作業台14上の、第1撮像装置11の撮像範囲13内に載置する。
撮像制御部21は、第1撮像装置11により、例えばフレームレート24fpsで対象物15を撮像することで、時系列の撮像画像を取得する(S101)。撮像画像は一時的に記憶部201に記憶される。
ここで、図4Bに示すように、ユーザが、抽出したい文字列40の記載箇所において、所定の停止動作Tを行ったとする。例えば、停止動作Tは、対象物15上で、抽出したい文字列40の位置を指で指定し、その後3秒間そのまま停止する動作とする。
続いて、検出部23は、第1撮像装置11により撮像された撮像画像に基づき、撮像画像に写り込んだ指示画像としての指の有無を判断する。(S102)。
ここで、指が検出された場合(S102のYes)、算出部24は、時系列の撮像画像から指先の時系列のXY座標系における第2次元位置を算出する(S103)。一方、指が検出されなかった場合は(S102のNo)、検出部23は、再度撮像された撮像画像から指の有無を判断する(S102)。
次に、判定部25は、算出部24により算出された時系列の指先の2次元位置情報に基づき、停止動作T(指先が3秒以上同じ座標に位置すること)が行われたかどうか判定する(S104)。
ここで、停止動作Tが行われたと判定された場合(S104のYes)、第1抽出部26は、算出部24により算出された指先の2次元位置の周辺領域41を確定する(S105)。更に、第1抽出部26は、確定した周辺領域41に対応する周辺画像42を、第1撮像装置11により撮像された撮像画像から抽出する(S106)。抽出された周辺画像42は、周辺画像42の範囲情報と共に記憶部201に記憶される。停止動作Tが行われたと判定されなかった場合(S104のNo)、判定部25は、再度時系列の指先の2次元位置情報に基づき、停止動作Tが行われたかどうか判定する(S104)。
次に、投影制御部28は、投影装置12を用いて、第1抽出部26が抽出した周辺画像42を、作業台14上に投影する(S107)。この場合、投影制御部28は、XY座標系における2次元位置を指定して周辺画像42の投影位置を制御する。例えば、図4Cに示すように、対象物15に並べて周辺画像42を投影しても良い。
ここで、図4Dに示すように、ユーザが対象物15上で、抽出したい文字列40を、指のスライド動作Sにより選択したとする。なお、ユーザは、周辺画像42の投影像上で指のスライド動作Sによる選択を行なっても良い。
すると、検出部23は、第1撮像装置11により撮像された撮像画像に基づき、撮像画像に写り込んだ指示画像としての指の有無を判断する(S108)。
ここで、指が検出された場合(S108のYes)、算出部24は、時系列の撮像画像から指先の時系列のXY座標系における2次元位置を算出する(S109)。一方、指が検出されなかった場合(S108のNo)、検出部23は、再度撮像された撮像画像から、指示画像としての指の有無を判断する(S108)。
次に、判定部25は、算出部24により算出された時系列の指先の2次元位置情報に基づき、スライド動作Sが行われたかどうかを判定する(S110)。
ここで、スライド動作Sが行われたと判定された場合(S110のYes)、第2抽出部27は、算出部24により算出された指先の2次元位置に基づき、スライド動作Sにより選択された対象物15上の選択領域43を確定する(S111)。一方、スライド動作が行われたと判定されなかった場合(S110のNo)、判定部25は、再度算出部24により算出された時系列の指先の2次元位置情報に基づき、スライド動作Sが行われたかどうかを判定する(S110)。
更に、第2抽出部27は、第1撮像装置11の撮像画像から、確定した選択領域43に対応する画像、すなわち選択画像を抽出する(S112)。抽出された選択画像は記憶部201に記憶される。
以上の手順により、情報抽出システム100は、対象物15から所望の文字列40を画像データとして、抽出することができる。なお、第2抽出部27は、周辺画像42から選択画像を抽出しても良い。本実施形態によれば、周辺画像42を対象物15に並べて投影するため、ユーザは、例えば、選択時に指により隠れてしまう文字を周辺画像42で視認しながら選択を行うことができる。
また、第1実施形態のスライド動作Sによる選択時において、図5に示すように、情報抽出システム100が検出している選択範囲50を、周辺画像42の投影画像上で識別可能に表示しても良い。例えば、選択範囲50を、その周囲とは異なる色で表示しても良い。これにより、ユーザは、例えば文字列の選択中に、情報抽出システム100が検出している選択範囲50を視認することができる。もし不要な部分が選択されている場合は、ユーザは適宜選択をやり直すことができる。
図6は、本実施形態に係る情報抽出システム100の構成の変形例を示す図である。第1実施形態において、情報抽出システム100が1つの第1撮像装置11を備える場合を説明してきたが、これに限られるものでははく、図6に示すように、情報抽出システム100が、第1撮像装置11及び第2撮像装置16を備えても良い。
図6の二点鎖線で囲まれた領域は、第2撮像装置16の撮像範囲17を示す。第1撮像装置11の撮像範囲13及び第2撮像装置16の撮像範囲17は共通する撮像範囲を含めば良く、第1撮像装置11及び第2撮像装置16は其々の撮像範囲が同一となるように配置されても良い。
また、撮像制御部21は、第1撮像装置11、第2撮像装置16による撮像タイミングを同期させる制御をしても良い。それにより、各種の処理において制御部200が行う演算をより簡易化することが可能である。
この変形例によれば、制御部200は、指示画像の2次元位置に高さ方向を含めた3次元位置も算出することができる。なお、3次元位置は、例えば座標系に加えて、作業台14の鉛直方向をZ軸として規定される。
指示画像の3次元位置の算出方法としては、ステレオ視による方法がある。この場合、算出部24は、第1撮像装置11及び第2撮像装置16の其々により撮像された撮像画像より指示画像の代表点の2次元位置(x,y)を其々算出する。例えば、算出部24は、第1撮像装置11により撮像された撮像画像に写り込んだ指示画像の代表点の2次元位置(x1,y1)、第2撮像装置16により撮像された撮像画像に写り込んだ指示画像の代表点の2次元位置(x2,y2)を算出する。そして、代表点の2次元位置(x1,y1)、(x2,y2)を基に三角測量の原理で代表点のz座標を算出する。
指示画像の3次元位置については、判定部25による入力動作の判定に用いられる。例えば、判定部25による判定の処理は、指示画像の代表点のz座標が対象物15のz座標と一致した場合(又は、対象物15の高さの近傍となった場合)にのみ、すなわち指示画像の代表点の高さが対象物15の高さに一致した場合にのみ、各種入力動作と判定するようにしても良い。この場合、指示画像の各種入力動作に伴う対象物15の遥か上方での指示画像の移動が誤って各種入力動作と判定されることを防ぐことができる。
なお、この変形例は、後に説明する第2実施形態及び第3実施形態にも適用することができる。
(第2実施形態)
第2実施形態に係る制御装置10Aは、更に拡大部29を含む。なお、第1実施形態と同様の構成については同一の参照符号を付し説明を省略する。
第2実施形態に係る制御装置10Aは、更に拡大部29を含む。なお、第1実施形態と同様の構成については同一の参照符号を付し説明を省略する。
図7は、第2実施形態に係る制御装置10Aの構成を示す図である。制御装置10Aは、制御部200A、記憶部201を備える。更に、制御部200Aは、撮像制御部21、転送部22、検出部23、算出部24、判定部25、第1抽出部26、第2抽出部27、投影制御部28に加えて、更に拡大部29等の処理部を備える。
拡大部29は、第1抽出部26により抽出された周辺画像42を拡大した画像(以下、拡大画像80(図9A参照)とする)を作成する。拡大倍率は、ユーザが自由に設定できるようにしても良い。例えば、拡大部29は、指定されたA点の周辺画像42をユーザによって設定された2倍に拡大した拡大画像80を作成する。この場合、拡大部29は、周辺画像42の座標範囲を変更し、変更後の範囲について拡大画像80を作成しても良い。図4Cでは、対象物15に含まれる一列の文字全体が周辺画像42に表示されているが、図9Aでは、対象物15に含まれる一列の文字の全体でなく、左寄りの一部の範囲について拡大表示されている。なお、拡大倍率は、予め設定された所定の設定値、1.5倍、2倍、3倍、A4サイズ/A5サイズ倍等としても良い。
第2抽出部27は、拡大部29により作成され、投影された拡大画像80に対して、選択動作がなされると、選択動作により指定された位置に対応する選択画像を拡大画像80から抽出しても良い。
投影制御部28は、投影装置12によりXY座標系の2次元位置を指定して拡大画像80の投影を制御する。
[情報抽出の処理手順]
第2実施形態に係る情報抽出方法は、更に拡大部29の処理を含む。図7〜図9Cを参照して、第2実施形態に係る情報抽出方法について説明する。なお、第1実施形態と同様の構成については同一の参照符号を付し説明を省略する。
第2実施形態に係る情報抽出方法は、更に拡大部29の処理を含む。図7〜図9Cを参照して、第2実施形態に係る情報抽出方法について説明する。なお、第1実施形態と同様の構成については同一の参照符号を付し説明を省略する。
図8は、第2実施形態に係る情報抽出方法の情報抽出の処理手順を示すフローチャートである。図9A〜図9Cは、第2実施形態に係る情報抽出方法を示す図である。
第1実施形態と同様にして、図4Aに示すように、複数の文字列が記載された対象物15(例えば文書)から特定の文字列40(例えばURL)のみを選択し抽出を行う場合を一例に挙げる。
以下、装置間及び制御装置10A内の各部間のデータ通信は、転送部22により行われることを前提として説明を省略する。
まず、ユーザは、図1に示すように、抽出したい文字列40が記載された対象物15を、作業台14上の、第1撮像装置11の撮像範囲13内に載置する。
撮像制御部21は、第1撮像装置11により、例えばフレームレート24fpsで対象物15を撮像することで、時系列の撮像画像を取得する(S101)。撮像画像は一時的に記憶部201に記憶される。
撮像制御部21は、第1撮像装置11により、例えばフレームレート24fpsで対象物15を撮像することで、時系列の撮像画像を取得する(S101)。撮像画像は一時的に記憶部201に記憶される。
ここで、図4Bに示すように、ユーザが、抽出したい文字列40の記載箇所において、所定の停止動作Tを行ったとする。例えば、停止動作Tは、対象物15上で、抽出したい文字列40の位置を指で指定し、その後3秒間そのまま停止する動作とする。
続いて、検出部23は、第1撮像装置11により撮像された撮像画像に基づき、撮像画像に写り込んだ指示画像としての指の有無を判断する。(S102)。
ここで、指が検出された場合(S102のYes)、算出部24は、時系列の撮像画像から指先の時系列のXY座標系における2次元位置を算出する(S103)。一方、指が検出されなかった場合は(S102のNo)、検出部23は、再度撮像された撮像画像から指の有無を判断する(S102)。
次に、判定部25は、算出部24により算出された時系列の指先の2次元位置情報に基づき、停止動作T(指先が3秒以上同じ座標に位置すること)が行われたかどうか判定する(S104)。
ここで、停止動作Tが行われたと判定された場合(S104のYes)、第1抽出部26は、算出部24により算出された指先の2次元位置の周辺領域41を確定する(S105)。更に、第1抽出部26は、確定した周辺領域41に対応する周辺画像42を、第1撮像装置11の撮像画像から抽出する(S106)。抽出された周辺画像42は、周辺画像42の範囲情報と共に記憶部201に記憶される。
停止動作Tが行われたと判定されなかった場合(S104のNo)、判定部25は、再度時系列の指先の2次元位置情報に基づき、停止動作Tが行われたかどうか判定する(S104)。
次に、拡大部29は、抽出された周辺画像42を拡大した(例えば2倍)拡大画像80を作成する(S120)。
次に、投影制御部28は、投影装置12を用いて、作業台14上に拡大部29が作成した拡大画像80を投影する(S121)。この場合、投影制御部28は、XY座標系における2次元位置を指定して拡大画像80の投影位置を制御する。例えば、図9Aに示すように、対象物15に並べて拡大画像80を投影しても良い。
ここで、図9Bに示すように、ユーザが拡大画像80の投影像上で、抽出したい文字列40を、指のスライド動作Sにより選択したとする。なお、ユーザは、対象物15上で指のスライド動作Sによる選択を行なっても良い。
すると、検出部23は、第1撮像装置11により撮像された撮像画像に基づき、撮像画像に写り込んだ指示画像としての指の有無を判断する(S108)。
ここで、指が検出された場合(S108のYes)、算出部24は、時系列の撮像画像から指先の時系列のXY座標系における2次元位置を算出する(S109)。一方、指が検出されなかった場合(S108のNo)、検出部23は、再度撮像された撮像画像から、指示画像としての指の有無を判断する(S108)。
次に、判定部25は、算出部24により算出された時系列の指先の2次元位置情報に基づき、スライド動作Sが行われたかどうかを判定する(S110)。
ここで、スライド動作Sが行われたと判定された場合(S110のYes)、第2抽出部27は、算出部24により算出された指先の2次元位置に基づき、スライド動作Sにより選択された拡大画像80上の選択領域43を確定する(S111)。一方、スライド動作が行われたと判定されなかった場合(S110のNo)、判定部25は、再度時系列の指先の2次元位置情報に基づき、スライド動作Sが行われたかどうかを判定する(S110)。
更に、第2抽出部27は、拡大画像80から、確定した選択領域43に対応する画像データを、選択画像として抽出する(S112)。抽出された選択画像は記憶部201に記憶される。以上の手順により、情報抽出システム100は、対象物15から所望の文字列40を画像データとして、抽出することができる。
第2実施形態に係る情報抽出方法によれば、周辺画像42を拡大した拡大画像80を対象物15に並べて投影するため、ユーザは周辺領域41を視認しやすい。従って、ユーザは、例えば文字サイズが小さい文書や行間の狭い文書においても、より正確に所望の範囲を選択することが可能である。なお、拡大画像80を対象物15の右側に投影すれば、ユーザが右手で拡大画像80の投影像上で選択作業する際に、対象物15を参照しやすくなる。
また、第2実施形態に係る拡大部29は、ユーザが設定した倍率で周辺画像42を拡大し拡大画像80を作成する。しかし、本実施形態は、これに限られるものではない。例えば、制御装置10Aは、対象物上の文字サイズ、文字間隔、行間隔などを認識し、それらに応じた拡大倍率を自動設定しても良い。
更に、第2実施形態に係る情報抽出方法において、投影制御部28が、第2抽出部27により抽出された画像データを、投影装置12により投影する処理を最後に加えても良い。それにより、ユーザが抽出された画像データが所望のものであるか確認することができる。
(第3実施形態)
第3実施形態に係る情報抽出システムは、更に変換部30を含む。なお、第1実施形態と同様の構成については同一の参照符号を付し説明を省略する。
第3実施形態に係る情報抽出システムは、更に変換部30を含む。なお、第1実施形態と同様の構成については同一の参照符号を付し説明を省略する。
図10は、第3実施形態に係る制御装置10Bの構成を示す図である。制御装置10Bは、制御部200B、記憶部201を備える。更に、制御部200Bは、撮像制御部21、転送部22、検出部23、算出部24、判定部25、第1抽出部26、第2抽出部27B、投影制御部28、拡大部29Bに加えて、更に変換部30等の処理部を備える。
変換部30は、周辺画像42を対象とし、周辺画像42に含まれる文字の画像データを文字認識処理し、文字情報に変換する。文字認識処理としては、例えばOCR(Optical Character Reader)技術を用いても良い。文字情報としては、例えばASCIIなどの文字コードを用いても良い。
拡大部29Bは、変換部30により周辺画像42から変換された文字情報に基づいて、周辺領域に含まれる文字列の上下左右の文字間隔を拡大した拡大画像110(図12A参照)を作成する。なお、対象物15上に表記された文字又は行間などの大きさは、XY座標系における文字の外形又は行間の2次元位置により認識することができる。
第2抽出部27Bは、変換部30により周辺画像42から変換された文字情報から、ユーザにより選択された第2の位置に対応する選択データを抽出する。より具体的には、第2抽出部27Bは、第2の位置に対応する拡大画像110上の点を特定し、周辺画像42から変換された文字情報のうち特定された点に対応する文字情報を選択データとして抽出する。
[情報抽出の処理手順]
第3実施形態に係る情報抽出方法は、更に変換部30の処理を含む。図10〜図13を参照して、第3実施形態に係る情報抽出方法について説明する。なお、第2実施形態と同様の構成については同一の参照符号を付し説明を省略する。図11は、第3実施形態に係る情報抽出方法の情報抽出の処理手順を示すフローチャートである。図12A〜図12Cは、第3実施形態に係る情報抽出方法の手順を示す図である。図13は、図12Aと同じ手順における他の方法を示す図である。
第3実施形態に係る情報抽出方法は、更に変換部30の処理を含む。図10〜図13を参照して、第3実施形態に係る情報抽出方法について説明する。なお、第2実施形態と同様の構成については同一の参照符号を付し説明を省略する。図11は、第3実施形態に係る情報抽出方法の情報抽出の処理手順を示すフローチャートである。図12A〜図12Cは、第3実施形態に係る情報抽出方法の手順を示す図である。図13は、図12Aと同じ手順における他の方法を示す図である。
第2実施形態と同様に、図4Aに示すように、複数の文字列が記載された対象物15(例えば文書)から特定の文字列40(例えばURL)のみを選択し抽出を行う場合を一例に挙げる。
以下、装置間及び制御装置10B内の各部間のデータ通信は、転送部22により行われることを前提として説明を省略する。
まず、ユーザは、図1に示すように、抽出したい文字列40が記載された対象物15を、作業台14上の、第1撮像装置11の撮像範囲13内に載置する。
撮像制御部21は、第1撮像装置11により、例えばフレームレート24fpsで対象物15を撮像することで、時系列の撮像画像を取得する(S101)。撮像画像は一時的に記憶部201に記憶される。
ここで、図4Bに示すように、ユーザが、抽出したい文字列40の記載箇所において、所定の停止動作Tを行ったとする。例えば、停止動作Tは、対象物15上で、抽出したい文字列40の位置を指で指定し、その後3秒間そのまま停止する動作とする。
続いて、検出部23は、第1撮像装置11により撮像された撮像画像に基づき、撮像画像に写り込んだ指示画像としての指の有無を判断する。(S102)。
ここで、指が検出された場合(S102のYes)、算出部24は、時系列の撮像画像から指先の時系列のXY座標系における2次元位置を算出する(S103)。一方、指が検出されなかった場合は(S102のNo)、検出部23は、再度撮像された撮像画像から指の有無を判断する(S102)。
次に、判定部25は、算出部24により算出された時系列の指先の2次元位置情報に基づき、停止動作Tが行われたかどうか判定する(S104)。
ここで、停止動作Tが行われたと判定された場合(S104のYes)、第1抽出部26は、算出部24により算出された指先のXY座標系における2次元位置の周辺領域41を確定する(S105)。更に、第1抽出部26は、確定した周辺領域41に対応する周辺画像42を、第1撮像装置11の撮像画像から抽出する(S106)。抽出された周辺画像42は、周辺画像42の範囲情報と共に記憶部201に記憶される。停止動作Tが行われたと判定されなかった場合(S104のNo)、判定部25は、再度時系列の指先の2次元位置情報に基づき、停止動作Tが行われたかどうか判定する(S104)。
次に、変換部30は、抽出された周辺画像42を、文字認識処理し、文字情報に変換する(S130)。
次に、変換部30は、抽出された周辺画像42を、文字認識処理し、文字情報に変換する(S130)。
続いて、拡大部29Bは、周辺画像42から変換した文字情報に基づき、周辺領域41に含まれる文字列の文字のサイズを変更せずに、上下左右の文字間隔を拡大した拡大画像110を作成する(S131)。
次に、投影制御部28は、投影装置12を用いて、作業台14上に拡大部29Bが作成した拡大画像110を投影する(S121)。この場合、投影制御部28は、XY座標系における2次元位置を指定して拡大画像110の投影位置を制御する。例えば、図12Aに示すように、対象物15に並べて拡大画像110を投影しても良い。但し、本実施形態は、これに限定されるものでなく、例えば投影制御部28は、対象物15上に拡大画像110を投影しても良い。
ここで、図12Bに示すように、ユーザが拡大画像110の投影像上で、抽出したい文字列40を、指のスライド動作Sにより選択したとする。なお、ユーザは、対象物15上で指のスライド動作Sによる選択を行なっても良い。
すると、検出部23は、第1撮像装置11により撮像された撮像画像に基づき、撮像画像に写り込んだ指示画像としての指の有無を判断する(S108)。
ここで、指が検出された場合(S108のYes)、算出部24は、時系列の撮像画像から指先の時系列のXY座標系における2次元位置を算出する(S109)。一方、指が検出されなかった場合(S108のNo)、検出部23は、再度撮像された撮像画像から、指示画像としての指の有無を判断する(S108)。
次に、判定部25は、算出部24により算出された時系列の指先の2次元位置情報に基づき、スライド動作Sが行われたかどうかを判定する(S110)。
ここで、スライド動作Sが行われたと判定された場合(S110のYes)、第2抽出部27Bは、算出部24により算出された指先のXY座標系における2次元位置に基づき、スライド動作Sにより選択された拡大画像110上の選択領域43を確定する(S111)。一方、スライド動作が行われたと判定されなかった場合(S110のNo)、判定部25は、再度時系列の指先の2次元位置情報に基づき、スライド動作Sが行われたかどうかを判定する(S110)。
更に、第2抽出部27Bは、周辺画像42から変換した文字情報のうち、確定した選択領域43に対応する文字情報を、選択データとして抽出する(S132)。抽出された選択データは記憶部201に記憶される。以上の手順により、情報抽出システム100は、対象物15から所望の文字列40を文字情報として、抽出することができる。
第3実施形態に係る拡大部29Bは、文字情報に基づき拡大画像110を作成するため、例えば、行間隔のみを拡大するなどの他の条件によっても拡大画像を作成できる。
更に、第3実施形態によれば、情報抽出システム100は、対象物15上に表記されている文字列から、ユーザが求める文字列を文字情報として抽出することが可能である。その為、ユーザは、抽出した選択データを他の情報処理装置において文字情報として容易に使用することができる。
第3実施形態において、図13に示すように、投影制御部28は、拡大画像110を対象物15上に重ねて投影しても良い。この場合、スライド動作により選択を行う際に、ユーザは、拡大画像110の投影像上に指を移動することを省くことができる。但し、対象物15上に拡大画像110を重ねて投影する場合、対象物15に記載された文字と拡大画像110の投影像の文字が重なり判別が困難になることがある。その場合、拡大画像110の背景色と文字色の少なくともいずれかを変更しても良い。
ここで、背景色と文字色の変更については、例えば、拡大画像110の背景色は対象物15や投影面の色の影響を受けにくい黒や対象物15の文字色としても良い。また、拡大画像110の文字色は、変更後の背景色が黒の場合は白とし、変更後の背景色が対象物15の文字色の場合はその補色とするのが好ましい。
なお、第3実施形態に係る変換部30は、周辺画像42を対象とし、周辺画像42に含まれる文字の画像データを文字認識処理し、文字情報に変換している。しかし、本実施形態は、これに限定されるものではない。例えば、変換部30は、撮像画像を対象とし、撮像画像に含まれる文字の画像データを文字認識処理し、文字情報に変換しても良い。この場合、続いて拡大部29Bは、撮像画像により変換した文字情報のうち、周辺画像42に含まれる文字に対応する文字情報を抽出して、周辺領域41に含まれる文字列の文字のサイズを変更せずに、周辺領域41に含まれる文字列の上下左右の文字間隔を拡大した拡大画像110を作成することができる。
また、第3実施形態に係る第2抽出部27Bは、変換部30により周辺画像42から変換された文字情報のうち、ユーザにより選択された選択領域43に対応する文字情報を抽出している。しかし、本実施形態は、これに限定されるものではない。例えば、第2抽出部27Bは、第2実施形態と同様に、撮像画像又は周辺画像42から、ユーザにより選択された選択領域43に対応する選択画像を抽出しても良い。この場合、変換部30は、抽出された選択画像に含まれる文字の画像データを文字認識処理し、文字情報に変換しても良い。
[制御装置のハードウェア構成]
図14は、制御装置10、10A、10Bのハードウェア構成の一例を示す図である。コンピュータ1000は、本発明に係る情報抽出プログラムに基づき、各実施形態で説明した情報抽出を実行し、制御装置10として機能する。
図14は、制御装置10、10A、10Bのハードウェア構成の一例を示す図である。コンピュータ1000は、本発明に係る情報抽出プログラムに基づき、各実施形態で説明した情報抽出を実行し、制御装置10として機能する。
コンピュータ1000はCPU(Central Processing Unit)1001、ROM(Read Only Memory)1002、RAM(Random Access Memory)1003、HDD(Hard Disk Drive)1004を有しており、各部はバス1005を介して相互に接続されている。そしてCPU1001による管理下で相互にデータの送受を行うことができる。
CPU1001は、制御装置10の動作制御を司る中央処理装置である。そして、CPU1001が、情報抽出プログラムをHDD1004から読み出して実行することで、CPU1001は、撮像制御部21、転送部22、検出部23、算出部24、判定部25、第1抽出部26、第2抽出部27(27B)、投影制御部28、拡大部29(29B)、変換部30として機能するようになる。なお、情報抽出プログラムはCPU1001とアクセス可能なROM1002またはRAM1003に格納されていても良い。
HDD1004は、CPU1001の管理下で記憶部201として機能する。つまり、HDD1004は、OSや各種データを記憶する。プログラム同様、各種データはCPU1001とアクセス可能なROM1002またはRAM1003に格納されても良い。
また、情報抽出の過程で生成される指示画像の位置などの情報は、記憶部201として機能するRAM1003に、一時的に記憶される。つまり、記憶部201のデータは、HDD1004や、ROM1002またはRAM1003などに格納される。
なお、上記した情報抽出プログラムについては、必ずしも最初から記憶部201に記憶されていることを要しない。制御装置10が読取装置を備え、情報抽出プログラムを、コンピュータが読み取り可能な記録媒体から読み込んでも良い。
コンピュータが読み取り可能な記録媒体については、フレキシブルディスク(FD)、CD−ROM(Compact Disc − Read Only Memory)、DVD(Digital Versatile Disc)、光磁気ディクス、ICカードなどである。
更に、制御装置10は通信装置を備えても良い。通信装置によりインターネットを介して情報抽出プログラムを取得するようにしても良い。また、通信装置によりインターネットを介して各種情報を取得し、各実施形態に係る情報抽出により得た抽出データと組み合わせて、新たなデータを作成することも可能である。
なお、本発明は、上述した各実施形態に記載した構成に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変更することが可能である。例えば、実施形態においては文字列を抽出する例を取り上げたが、対象物上の図形、写真などにも本発明の情報抽出方法を適用できる。
100:情報抽出システム
10、10A、10B:制御装置
11:第1撮像装置
12:投影装置
13、17:撮像範囲
14:作業台
15:対象物
16:第2撮像装置
200、200A、200B:制御部
201:記憶部
21:撮像制御部
22:転送部
23:検出部
24:算出部
25:判定部
26:第1抽出部
27、27B:第2抽出部
28:投影制御部
29、29B:拡大部
30:変換部
40:文字列
41:周辺領域
42:周辺画像
43:選択領域
50:選択範囲
80、110:拡大画像
T:停止動作
S:スライド動作
10、10A、10B:制御装置
11:第1撮像装置
12:投影装置
13、17:撮像範囲
14:作業台
15:対象物
16:第2撮像装置
200、200A、200B:制御部
201:記憶部
21:撮像制御部
22:転送部
23:検出部
24:算出部
25:判定部
26:第1抽出部
27、27B:第2抽出部
28:投影制御部
29、29B:拡大部
30:変換部
40:文字列
41:周辺領域
42:周辺画像
43:選択領域
50:選択範囲
80、110:拡大画像
T:停止動作
S:スライド動作
Claims (7)
- 撮像装置により対象物を撮像して撮像画像を取得し、
前記対象物上の指定された第1の位置を算出し、
前記撮像画像のうち前記第1の位置に対応する部分から第1情報を抽出し、
抽出した前記第1情報を投影装置により投影し、
投影された前記第1情報上の指定された第2の位置を算出し、
前記第1情報のうち前記第2の位置に対応する部分から第2情報を抽出する、
ことを特徴とする情報抽出方法。 - 撮像装置により対象物を撮像して撮像画像を取得し、
前記対象物上の指定された第1の位置を算出し、
前記撮像画像のうち前記第1の位置に対応する部分から第1情報を抽出し、
抽出した前記第1情報を投影装置により投影し、
前記対象物上の指定された第2の位置を算出し、
抽出した前記第1情報に、前記第1情報のうち前記第2の位置に対応する部分に印を付し、
前記印を付した前記第1情報を前記投影装置により投影し、
前記第1情報のうち前記第2の位置に対応する部分から第2情報を抽出する、
ことを特徴とする情報抽出方法。 - 前記第1情報の投影において、前記対象物上の前記第1情報のサイズよりも前記第1情報のサイズを大きく投影することを特徴とする請求項1又は2に記載の情報抽出方法。
- 前記第1情報の投影において、前記対象物上の前記第1情報のうち文字のサイズを変更せずに、文字間を大きく投影することを特徴とする請求項1又は2に記載の情報抽出方法。
- 前記第2情報の抽出において、文字情報を抽出することを特徴とする請求項1乃至4のいずれか1項に記載の情報抽出方法。
- コンピュータに、
撮像装置により対象物を撮像して撮像画像を取得し、
前記対象物上の指定された第1の位置を算出し、
前記撮像画像のうち前記第1の位置に対応する部分から第1情報を抽出し、
抽出した前記第1情報を投影装置により投影し、
投影された前記第1情報上の指定された第2の位置を算出し、
前記第1情報のうち前記第2の位置に対応する部分から第2情報を抽出する、
処理を実行させることを特徴とする情報抽出プログラム。 - 撮像装置により対象物を撮像して撮像画像を取得する撮像制御部と、
前記対象物上の指定された第1の位置を算出する第1算出部と、
前記撮像画像のうち前記第1の位置に対応する部分から第1情報を抽出する第1抽出部と、
抽出した前記第1情報を投影装置により投影する投影制御部と、
投影された前記第1情報上の指定された第2の位置を算出する第2算出部と、
前記第1情報のうち前記第2の位置に対応する部分から第2情報を抽出する第2抽出部と、
を有することを特徴とする情報抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015074648A JP2016194835A (ja) | 2015-03-31 | 2015-03-31 | 情報抽出方法、情報抽出プログラム及び情報抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015074648A JP2016194835A (ja) | 2015-03-31 | 2015-03-31 | 情報抽出方法、情報抽出プログラム及び情報抽出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016194835A true JP2016194835A (ja) | 2016-11-17 |
Family
ID=57323706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015074648A Pending JP2016194835A (ja) | 2015-03-31 | 2015-03-31 | 情報抽出方法、情報抽出プログラム及び情報抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016194835A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6329687B1 (ja) * | 2017-12-08 | 2018-05-23 | 株式会社フォトロン | テロップ編集装置及びテロップ編集プログラム |
-
2015
- 2015-03-31 JP JP2015074648A patent/JP2016194835A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6329687B1 (ja) * | 2017-12-08 | 2018-05-23 | 株式会社フォトロン | テロップ編集装置及びテロップ編集プログラム |
JP2019105867A (ja) * | 2017-12-08 | 2019-06-27 | 株式会社フォトロン | テロップ編集装置及びテロップ編集プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101603017B1 (ko) | 제스처 인식 장치 및 제스처 인식 장치의 제어 방법 | |
JP6417702B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP5456159B2 (ja) | 背景から前景の頭頂部を分離するための方法および装置 | |
JP6201379B2 (ja) | 位置算出システム、位置算出プログラム、および、位置算出方法 | |
JP6723814B2 (ja) | 情報処理装置、その制御方法、プログラム、及び記憶媒体 | |
JP4710734B2 (ja) | ポインティング装置、ポインティング位置検出方法及びプログラム | |
KR102236616B1 (ko) | 정보 처리 장치, 그의 제어 방법, 및 기억 매체 | |
JP6028589B2 (ja) | 入力プログラム、入力装置および入力方法 | |
EP2639743A2 (en) | Image processing device, image processing program, and image processing method | |
JP2007233871A (ja) | 画像処理装置、コンピュータの制御方法及びプログラム | |
JP5887264B2 (ja) | 物体認識装置、方法、プログラム、および該ソフトウェアを格納したコンピュータ可読媒体 | |
JP2014063265A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP4501701B2 (ja) | 撮影装置、撮影装置の画像処理方法及びプログラム | |
JP6229554B2 (ja) | 検出装置および検出方法 | |
US20200402266A1 (en) | Information processing device, information processing system, and non-transitory computer-readable medium storing information processing program | |
KR20150003573A (ko) | 영상 패턴 검출 방법 및 그 장치 | |
JP2016194835A (ja) | 情報抽出方法、情報抽出プログラム及び情報抽出装置 | |
JP2018048890A (ja) | 姿勢推定システム、姿勢推定装置、及び距離画像カメラ | |
US10990802B2 (en) | Imaging apparatus providing out focusing and method for controlling the same | |
JP4972013B2 (ja) | 情報提示装置、情報提示方法、情報提示プログラムおよびそのプログラムを記録した記録媒体 | |
JP6694907B2 (ja) | 判定装置、判定方法及び判定プログラム | |
WO2019225595A1 (ja) | 辞書学習装置、情報処理装置、辞書学習方法およびプログラム記憶媒体 | |
JP6790396B2 (ja) | 情報処理装置、情報処理システム、サービス処理実行制御方法及びプログラム | |
JP2016051191A (ja) | 画像処理方法 | |
JP6639257B2 (ja) | 情報処理装置及びその制御方法 |