JP3749810B2 - 映像情報入力装置 - Google Patents

映像情報入力装置 Download PDF

Info

Publication number
JP3749810B2
JP3749810B2 JP34038999A JP34038999A JP3749810B2 JP 3749810 B2 JP3749810 B2 JP 3749810B2 JP 34038999 A JP34038999 A JP 34038999A JP 34038999 A JP34038999 A JP 34038999A JP 3749810 B2 JP3749810 B2 JP 3749810B2
Authority
JP
Japan
Prior art keywords
image
unit
target
camera
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34038999A
Other languages
English (en)
Other versions
JP2001155140A (ja
Inventor
朝一 上野
和則 安藤
勲 古川
洋一 山川
俊史 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP34038999A priority Critical patent/JP3749810B2/ja
Publication of JP2001155140A publication Critical patent/JP2001155140A/ja
Application granted granted Critical
Publication of JP3749810B2 publication Critical patent/JP3749810B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Scanning Arrangements (AREA)
  • Studio Devices (AREA)
  • Image Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、映像情報入力技術および情報処理技術に関し、特に、利用者が手持ち操作にて簡便に映像や静止画等の情報を情報処理装置に取り込んだり、取り込んだ画像情報にて利用者が情報処理装置の機能を簡単に呼び出すためのユーザインタフェース技術等に適用して有効な技術に関する。
【0002】
【従来の技術】
たとえば、カメラ付きペン型入力装置に関わる従来の技術として、ACM PRESS発行,HUMAN FACTORS IN COMPUTING SYSTEMS、CHI 95 CONFERENCE COMPANION、256頁から257頁に記載のMEMO−PENがある。MEMO−PENとは、小型カメラをペンの軸に埋め込み、ペン先ごしにペン先の近傍を連続撮影することで、筆跡を記録するものである。MEMO−PENのカメラが撮影する範囲は、筆跡の方向が判別するために必要なごく狭い領域に限られている。
【0003】
MEMO−PENでは、ペン軸にカメラが埋め込まれているため、利用者が手で持つ場所よりも先端の近くに光学系を配置しないと、利用者の手によってカメラの視野を妨げられてしまう。このため、視野角が広い光学系を用いたとしても、光学系を対象物(紙)から離せる距離に限度があるため、カメラの視野を広く取れないという問題がある。また、利用者が自然にペンを保持した状態では、ペン軸が垂直から大きく傾くのが普通であるため、ペン軸に埋め込まれたカメラで撮影された画像は、対象を斜めから見たものになってしまう。
【0004】
MEMO−PENの機能は、利用者がMEMO−PENで書いた筆跡を記録しておき、後に何らかの情報処理装置の助けをかりて、筆跡を再生したり、文字認識したりすることである。すなわち、筆跡データを収集している最中、換言すれば利用者がMEMO−PENを利用している最中には、このカメラ付きペン型入力装置を用いて、情報処理装置の機能を呼び出すといったユーザインタフェースが実行されることはない。したがって、入力中の処理対象(筆跡)に対して適用する処理の種類を、ペンによって指定したりすることはない。さらに、MEMO−PENの場合は、ペン先と筆跡の位置は常に一致しているため、入力対象(筆跡)とペン先の位置関係を調整したりする必要はない。
【0005】
また、カメラ付きペン型入力装置に関わる従来の技術として、ACM PRESS発行,HUMAN FACTORS IN COMPUTING SYSTEMS、CHI 97 CONFERENCE PROCEEDINGS、327頁から334頁に記載のPaperLink というシステムがある。PaperLink では、利用者が処理対象を入力するための装置として、小型カメラを装着したペン型の入力装置を用いる。小型カメラは、利用者が自然にペンを保持した状態で、真上から対象(紙面)を見下ろすような位置に設置されている。カメラの視野は、ペン先付近の数cm四方を撮影できるように設定されている。撮影されたペン先付近の画像は、情報処理装置に入力され、その内容に応じて色々な処理が実行される。入力した対象が既知のものであれば、それに応じた所定の処理が実行される。例えば、所定のファイルを開いて利用者に提示したり、所定のプログラムが実行を開始したりする。また、入力した対象が未知のものであれば、一時的に保存され、後に実行されるコマンドへの引数として使用されたりする。
【0006】
さらに、他の従来技術として、Arai,T.,Aust,D.,Hudson,S,E “PaperLink:A Technique for Hyperlinking from Real Paper to Electronic Content” Proceedings of CHI’97,327−334,1997.等の文献に記載されたビデオペンが知られている。
【0007】
このビデオペンでは、ペン先が引き込み可能なカラーマーカペンのペン軸の途中に固定部材を介してビデオカメラを取り付け角度可変に斜めに固定し、カラーマーカペンのペン先を紙面に置いた筆記姿勢において、紙面上のペン先の近傍の画像を、ビデオカメラが利用者からみて斜め前方から撮影する構成としたものである。
【0008】
また、カラーマーカペンのペン先は、ペン軸内に設けられたロッドを介してマイクロスイッチに連動する構成となっており、紙面にペン先を押しつけてペン軸内に押し込むことでマイクロスイッチを作動させ、ビデオカメラが撮影するペン先近傍の紙面画像を静止画としてパーソナルコンピュータ等に出力するものである。
【0009】
【発明が解決しようとする課題】
上述の従来技術のビデオペンでは、マイクロスイッチを作動させるためにペン先をペン軸内に押し込む動作が必要なため、ペン軸の途中に固定されたビデオカメラは、この押し込み動作時に紙面に対して上下動し、焦点位置が変化するため入力画像の画質が低下する、という技術的課題がある。
【0010】
さらに、ビデオカメラはペン先近傍の紙面の画像を紙面に対して斜め方向から撮影するため、得られた画像が歪みを持ち、マイクロスイッチの作動を契機に入力された静止画の画像認識等によるペーパーリンク操作等において補正が必要になる、という他の技術的課題もある。
【0011】
さらに、ビデオペンは、ペン先近傍の紙面に焦点位置が固定されており、紙面以外の人物や風景等の画像は入力できず、これらの人物や風景等の画像入力には別のビデオカメラが必要になる、という技術的課題もある。
【0012】
本発明の目的は、ペーパーリンク操作等において高い画質で静止画を入力することが可能な映像情報入力装置を提供することにある。
【0013】
本発明の他の目的は、入力画像に対して補正が不要で、当該入力画像に基づく画像認識の精度を向上させることが可能な映像情報入力装置を提供することにある。
【0014】
本発明の他の目的は、直近から遠方までの広い焦点範囲での多様な画像情報の入力が可能な映像情報入力装置を提供することにある。
【0015】
本発明の他の目的は、紙面上の文字やパターン等の情報に連動した多様な情報処理が可能な映像情報入力装置を提供することにある。
【0016】
【課題を解決するための手段】
本発明は、対象物の映像を入力するカメラ部と、カメラ部に接続された把持部と、入力装置の動作を制御するスイッチと、把持部に基端部が支持され先端部が対象物に当接されることによって対象物とカメラ部との距離を設定する焦点スティックと、を含む映像情報入力装置を提供する。
【0017】
また、対象物の映像を入力するカメラ部と、カメラ部に接続された把持部と、入力装置の動作を制御するスイッチと、把持部に基端部が支持され先端部が対象物に当接されることによって対象物とカメラ部との距離を設定する焦点スティックとを含み、カメラ部および把持部の各々の軸は交差し、カメラ部の軸を把持部の軸に重ね合わせる方向に測った交差角が鋭角をなしている映像情報入力装置を提供する。
【0018】
また、対象物の映像を入力するカメラ部と、カメラ部に接続された把持部と、入力装置の動作を制御するスイッチと、基端部が把持部に支持され先端部が対象物に当接されることによって対象物とカメラ部との距離を設定する焦点スティックとを含み、カメラ部および把持部の各々の軸は交差し、カメラ部の軸を把持部の軸に重ね合わせる方向に測った第1の交差角が鋭角をなし、カメラ部および焦点スティックの各々の軸は交差し、カメラ部の軸を焦点スティックの軸に重ね合わせる方向に測った第2の交差角が鋭角をなし、第1の交差角は第2の交差角よりも大きい映像情報入力装置を提供する。
【0019】
また、本発明は、情報処理装置と、汎用シリアルインタフェースを介して情報処理部に接続され、対象物の映像を入力するカメラ部と、カメラ部に接続された把持部と、入力装置の動作を制御するスイッチとを含み、カメラ部は、紙面上の文字やパターンを撮り込むリンク・スティック・モードと、人物の顔等の近景を撮り込む近景モードと、風景等の遠景を撮り込む遠景モードと、のいずれでも動作可能な映像情報入力装置と、を含む情報処理システムを提供する。
【0020】
また、上述の情報処理システムにおいて、情報処理装置は、映像情報入力装置から、スイッチの作動情報と取り込まれた静止画像情報から文字やパターンを認識し、文字やパターンの認識結果に対応した特定の動作を行うソフトウェアを備えた情報処理システムを提供する。
【0021】
より具体的には、一例として、USB(Universal Serial Bus)等の汎用シリアルインタフェースを備えたCCDカメラ本体に、カメラレンズと紙面の焦点を一定に保てる専用のスティックと、文字やパターンをディジタルの静止画像として取り込むキャプチャ操作の実行契機等を与えるシャッターボタンを設け、紙面上の文字やパターンを撮る際は、スティックの先端を紙面に当て、レンズ光軸方向が紙面に垂直になる様に把持部を手で持つ。
【0022】
そして撮り込んだ文字やパターンをキャプチャする際は、シャッタボタンを押す。この際、レンズの焦点モードをダイヤル式の焦点合わせリングを使用してリンクスティックモードにしておく。
【0023】
次に、近景(人の顔を撮る)を撮る際は、レンズの焦点モードを近景にし、専用の焦点スティックは不要となるので、CCDカメラ本体に収納する。またカメラ本体を付属の専用のスタンドに納め立てて使用することもできる。
【0024】
遠景を撮る際は、レンズの焦点モードを遠景にし、その他は近景時と同様に使用する。このことにより、従来は紙面の文字やパターンの取り込みから近景/遠景の取り込みに際して、各々毎にスキャナやビデオカメラ等を専用に用意することなく、CCDカメラ装置だけで、多様な画像撮り込みができる。
【0025】
また、焦点スティックを介して紙面上にCCDカメラ装置を固定した状態で静止画取り込みのシャッタボタン操作が行われるので、CCDカメラ装置の高さ位置が紙面に対して変化せず、安定に高い画質の静止画を取り込むことができる。
【0026】
さらに、CCDカメラ装置の光軸方向を紙面に垂直に設定でき、取り込んだ静止画の補正等の必要もなくなる。
【0027】
また、このような映像情報入力装置をパーソナルコンピュータ等の情報処理装置に接続した構成の情報処理システムでは、映像情報入力装置にて取り込まれた紙面上の文字やパターン等に基づいて、情報処理装置に情報検索やコマンドを自動実行させる等のペーパーリンク操作を簡便に実現することが可能になる。
【0028】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照しながら詳細に説明する。
【0029】
(実施の形態1)
図1は、本発明の一実施の形態である映像情報入力装置の構成の一例を示す側面図であり、図2は、その正面図、図3は、その平面図、図4は、その使用状態の一例を示す説明図、図5は、スタンドに載置した状態の斜視図である。
【0030】
本実施の形態の映像情報入力装置100は、たとえばCCDカメラ等で構成されるカメラ部10と、このカメラ部10に一端が一体に接続された把持部20と、把持部20に一端が回動自在に支持され、当該把持部20の内部に折り畳み収納可能な焦点スティック30と、スイッチ40と、把持部20の他端部に接続されたUSB等のインタフェースケーブル50とからなる。
【0031】
カメラ部10は、その内部にCCD等の撮像素子を内蔵したカメラ本体11と、撮像素子に対して入力光を集光させるレンズ12、および外部から回動されることでレンズ12の撮像素子に対する光軸方向の位置を調整する焦点合わせリング13からなる。
【0032】
この焦点合わせリング13は、本実施の形態の場合、3段階に回動位置が設定可能であり、レンズ12を撮像素子から最も遠くに設定し、焦点スティック30を当接させることによって距離が一定値に設定される直近の紙面90等の位置に焦点を合わせるリンク・スティック・モードと、レンズ12を撮像素子に最も近づけて遠い風景等に焦点を合わせる遠景モードと、その中間で、近傍の人物等に焦点を合わせる近景モード、の三つのモードが設定可能である。
【0033】
ここで、本実施の形態の映像情報入力装置100に特徴的な各部の位置関係の一例について説明する。
【0034】
本実施の形態の映像情報入力装置100では、カメラ部10の中心軸(光軸)方向に対して、把持部20の軸方向は、光軸を把持部20の軸方向に重ね合わせる方向に測った交差角度θ1(図1)は鋭角となっている。
【0035】
また、把持部20から引き出されて使用状態の焦点スティック30の軸方向は、カメラ部10の中心軸(光軸)方向に対して、光軸を焦点スティック30の軸方向に重ね合わせる方向に測った交差角度θ2(図1)は鋭角となっている。かつ、θ1とθ2の関係は、θ1>θ2である。すなわち、本実施の形態の場合、90度>θ1>θ2である。
【0036】
これにより、把持部20を、利用者の手91が、筆記具を把持する姿勢で自然に保持した時、カメラ部10は、レンズ12(焦点合わせリング13)を下向きにして紙面90に対して正対する姿勢となる。また、焦点スティック30の先端部は、上述のリンク・スティック・モードにて、後述のようにカメラ部10による撮影範囲の視野内の下端中央部に写り、画像切り出し範囲等のポインタとなる。
【0037】
これにより、カメラ部10は紙面90に正対して映像を取り込むことができ、後述のペーパーリンク動作等の画像認識において、傾斜画像を補正する等の余分な出力が不要になるとともに、正対画像による認識率の向上等を実現できる。
【0038】
一方、スイッチ40は、カメラ部10と把持部20の交差部位において、焦点スティック30の取り付け位置と反対側に、真上に設定されている。また、このスイッチ40の作動方向(押し込み方向)は、カメラ部10の光軸と平行な方向である。
【0039】
これにより、把持部20を利用者の手91が、筆記具を把持する姿勢で自然に保持した時、図4に例示されるように、利用者の手91の第二指(人差し指)がスイッチ40の真上に自然に乗る状態となる。この状態は、操作者の利き腕に関係なく実現される。さらに、スイッチ40の動作方向は焦点スティック30を紙面90に押しつける方向に一致するので、スイッチ40を作動させる際にカメラ部10が光軸方向および光軸に交差する方向等に動くことがなく、焦点ブレによる静止画の画質低下の懸念がなく、高画質の静止画を取り込むことができ、後述のペーパーリンク動作等の画像認識において認識率の向上等を実現できる。
【0040】
次に、本実施の形態の映像情報入力装置100の作用の一例について説明する。
【0041】
準備として、図4に示すように、把持部20に繋がっているインタフェースケーブル50のコネクタ51(たとえばUSBのAタイプ)をパソコン本体等の情報処理装置102のUSBコネクタ等のコネクタ部102aに接続する。
【0042】
まず、紙面上の文字やパターンを撮り込む際の実施形態について説明する。
【0043】
映像情報入力装置100の把持部20を図4に示すように、手で持つ。折畳み式の焦点スティック30を把持部20から引き出す。次に焦点合わせリング13をリンクスティックモードに合わせる。紙面90に焦点スティック30の先端部を当て、カメラ部10の光軸が紙面90に垂直になるようにする。撮り込みたい文字やパターンが撮れたらスイッチ40を押し、キャプチャする。
【0044】
図6に、このリンク・スティック・モードにてカメラ部10から取り込まれるカメラ映像の撮像範囲の一例を示す。リンク・スティック・モードでは、紙面90からレンズ12までの焦点距離Mは、たとえば37.5mmである。画角は、縦30mm、横40mmであり、各々の方向の解像度が、縦240ドット、横320ドットの静止画が得られる。また、画角の下端中央部には、焦点スティック30のスティック先端30aの画像が映り込む。スティック先端30aの画像の画面内への縦方向の映り込み長さdは、たとえば6〜7.5mmである。
【0045】
次に近景(自分の顔等)を撮り込む際の実施形態について説明する。
【0046】
近景を撮る際は、カメラ部10の焦点合わせリング13(レンズ12)の焦点モードを近景モードに合わせ、焦点スティック30は不要となるので、把持部20に収納する。また、必要に応じて、映像情報入力装置100の把持部20を図5に例示されるように、付属の専用のカメラスタンド60に納め、机上等に立てて使用することもできる。
【0047】
風景等の遠景を撮る際は、焦点合わせリング13(レンズ12)の焦点モードを遠景モードにし、その他は近景モード時と同様に使用する。
【0048】
このように、従来は紙面の文字やパターンの取り込み、および近景/遠景の取り込みには2種類の入力デバイス(スキャナ/CCDカメラ等)を必要としていたが、本実施の形態の映像情報入力装置100では、当該映像情報入力装置100だけで、全ての多様な画像撮り込み操作ができる。
【0049】
図7に、本実施の形態の映像情報入力装置100における制御系の構成の一例を示す。
【0050】
図7おいて、71はCCD等の撮像素子、72は、撮像素子71にクロック等の信号を入力してを駆動するドライバ、73は撮像素子71の輝度やコントラスト等の撮像特性を制御する輝度/コントラスト調整部、74はコントロール部であり、撮像素子71から入力される画像信号を、所定の規格の映像信号に変換する操作や、全体の制御を行う。また、コントロール部74は、リンク・スティック・モード、近景モード、遠景モードの各々において、異なるフォーマットの映像信号規格を用いることができる。
【0051】
ROM/RAMコントロール部75はROM76およびRAM77のアクセス制御を行う。
【0052】
ROM76はフラッシュメモリ等で構成され、たとえば、撮像素子71の動作制御に用いられる制御情報や、USB等の汎用シリアルインタフェースの企画で、接続デバイスの識別等に必要とされるディスクリプタ等の製品情報が格納される。
【0053】
RAM77は、コントロール部74による各種操作の作業領域として用いられるとともに、たとえば、撮像素子71から輝度/コントラスト調整部73を経て到来する画像データの変換処理等におけるバッファリング用のFIFO(先入れ/先出しメモリ)として用いられる。
【0054】
78はハードウェアシャッタスイッチであり、スイッチ40の押下を検出してコントロール部74に伝達する動作を行う。なお、コントロール部74は、ハードウェアシャッタスイッチ78からの検出出力を、たとえば1ビットのスイッチON/OFFデータとして、所定の規格の映像信号フォーマットの末尾に付加して出力する動作を行う。このスイッチON/OFFデータをパーソナルコンピュータ等の情報処理装置側で参照することで、スイッチ40の押下の契機を知って、静止画の切り出し等の動作を行う。
【0055】
80はインタフェース制御部であり、たとえばUSB等の汎用シリアルインタフェース制御を行う。このインタフェース制御部80には、インタフェースケーブル50が接続される。
【0056】
79は電源回路であり、インタフェースケーブル50を介して外部から供給される電力を、上述の各動作部位に分配供給する動作を行う。
【0057】
上述の図7の各構成要素は、たとえば図示しない一つまたは複数のLSI等にまとめて実装され、カメラ部10および把持部20の各々の内部に分散または集中して実装される。
【0058】
上述の説明では、リンク・スティック・モード、近景/遠景モードの各モードの切替を焦点合わせリング13の手動操作で行う場合を示したが、焦点スティック30の把持部20からの引き出し操作に連動させて自動化することも可能である。
【0059】
以下、その一例を示す。すなわち、図8に例示されるように、把持部20に回動自在に接続される焦点スティック30の回動端部30bに、スイッチ作動片30cを設けるとともに、焦点スティック30の引き出し位置において、スイッチ作動片30cが当接されるモータ駆動スイッチ81を設ける。また、焦点合わせリング13には、当該焦点合わせリング13を正逆方向に回動させるリング駆動モータ部82を設ける。
【0060】
そして、スイッチ作動片30cによる焦点スティック30の引き出し操作(すなわちリンク・スティック・モード設定操作)の検出を契機に、リング駆動モータ部82作動させて、焦点合わせリング13を自動的にリンク・スティック・モードの位置に回動させる動作、および焦点スティック30の引き込み操作(すなわちリンク・スティック・モード以外の設定操作)の検出を契機に、リング駆動モータ部82作動させて、焦点合わせリング13を自動的にリンク・スティック・モード以外のの位置に回動させる動作、を行う。
【0061】
図9に、上述のモード連動動作を実現するための構成要素を、前述の図7に追加して示す。
【0062】
また、焦点合わせリング13の動作のみならず、スイッチ40(ハードウェアシャッタスイッチ78)の動作をモードに連動させて制御することもできる。その構成例を図10のブロック図に示す。
【0063】
すなわち、図10に例示されるように、図9のブロック図におけるハードウェアシャッタスイッチ78と、コントロール部74の間に、モータ駆動スイッチ81の作動状態に応じて、ハードウェアシャッタスイッチ78からコントロール部74へのスイッチ40の作動検出信号の入力を遮断するハードウェアシャッタスイッチON/OFF回路83を設ける。また、ハードウェアシャッタスイッチON/OFF回路83は、遮断信号83aをコントロール部74に入力してハードウェアシャッタスイッチ78が無効状態であることを知らせる。
【0064】
そして、モータ駆動スイッチ81がOFF、すなわち近景/遠景モードの時は、ハードウェアシャッタスイッチ78からコントロール部74へのスイッチ40の作動検出信号の入力を遮断状態とし、逆に、リンク・スティック・モードでは、接続状態とする制御を自動的に行う。
【0065】
近景/遠景モードの時は焦点スティック30を用いないので、把持部20を手持ちした状態でスイッチ40を作動させると手ブレが発生しやすいので、その場合に、スイッチ40の動作を無効にしておくことが有効となる。この設定状態は、遮断信号83aにてコントロール部74が把握できるので、本映像情報入力装置100が接続されている外部の情報処理装置側で、ソフトウェア的に静止画の切り出しタイミングを制御する。
【0066】
以上のように、本実施の形態の映像情報入力装置100によれば、CCDカメラ等のカメラ本体11に設けられ、レンズ12の可変焦点を可能にするダイヤル式の焦点合わせリング13と、折畳み式の焦点スティック30及びH/Wシャッターボタンとして機能するスイッチ40を備えた構成とすることで、紙面90上の文字やパターンのキャプチャから、近景/遠景の撮り込みまで幅広く映像を撮り込むことができる。また、本実施の形態の映像情報入力装置100が1台で従来のCCDカメラ装置とスキャナ装置の2台分の機能を実現できることから、コスト低減、設置面積低減等に有効である。
【0067】
(実施の形態2)
次に、上述の本発明の映像情報入力装置100を周辺機器として備えた情報処理システムの一例について説明する。
【0068】
本実施の形態では、一例として、図11に例示されるように、液晶ディスプレイ等のディスプレイ101を備えたパーソナルコンピュータ等の情報処理装置102に、USB等の汎用シリアルインタフェース対応のインタフェースケーブル50を介して映像情報入力装置100を接続した構成の情報処理システムについて説明する。
【0069】
図12は、本発明を実施するための全体構成の一例で、情報処理装置102の内構成を具体的に図示したものである。以下で、それぞれの構成要素の動作を説明する。
【0070】
(1)ビデオペンインタフェース2101
利用者が焦点スティック30で、入力したい対象を指示し、スイッチ40をONにする。ビデオペンインタフェース2101は、スイッチ40がONになったことを検出すると、映像情報入力装置100からの画像を1フレーム取り込んで、二値化部2102に渡す。二値化部2102に渡される画像は、例えば横320ドット,縦240ドット,一画素あたり24ビットの色数をもつカラー画像である。
【0071】
(2)二値化部2102
二値化部2102は、入力された画像を二値画像に変換し、その結果である二値画像を対象抽出部2104に渡す。図13は、二値化部2102から対象抽出部2104に渡される二値画像の一例である。
【0072】
(3)対象抽出部2104
対象抽出部2104は、二値化部2102から渡された二値画像から、処理対象を抽出する部分である。渡された二値画像には、対象以外に色々なものが写り込んでいる。例えば、スティック先端30aも写り込んでいるし、対象の近くに書かれていたものも写り込んでいるであろう。対象抽出部2104の役割は、渡された二値画像から対象だけを抜き出し、その画像を傾き補正部2105に渡すことである。
【0073】
利用者が対象を指し示す際の好みは、指差補正バッファ2112に格納されている。指差補正バッファ2112の内容は、例えば図14に示すような値の組、すなわち対象最小距離2301と標準傾き2302の組である。対象最小距離2301は、利用者が標準パターン1901を指示した際に、スティック先端30aを対象からどれくらい離したかを基準にして求められる。対象最小距離2301は、
例えば図15中の線分Dの長さ(ドット数)と定めることができる。また、標準傾き2302は、利用者がどれだけカメラ部10を傾けているかを表す値であり、例えば図15中の傾きAの大きさと定めることができる。対象最小距離2301の初期値は例えば20、標準傾き2302の初期値は例えば0である。
【0074】
図15の場合、対象最小距離2301は18ドット、標準傾き2302は32度である。
【0075】
対象抽出部2104が二値画像から対象を抽出する処理は、図16を用いて説明する。なお、以下の説明では、画像中の座標系は左上が原点である。また、説明に出てくる定数は、CAMXが画像中でのスティック先端30aのX座標、CAMYは同じくY座標、Dは対象最小距離2301である。CAMX,CAMYは、焦点スティック30とカメラ部10の位置関係が既知であるため、あらかじめ求めておける値であり、Dは上述のように指差補正バッファ2112から読み出せる値である。
【0076】
まず対象抽出部2104は、スティック先端30aの座標(CAMX,CAMY)からDだけ上の点S(CAMX,CAMY−D)から、上に向かって対象の画素を探して行く。すなわち、図16の中の線分Lに沿って、対象の画素を探して行く。
【0077】
この段階で、対象に属すると思われる画素が一つも見つからなければ、対象抽出は失敗である。ここで見つかった対象の画素は、対象領域として記憶される。
【0078】
次に対象抽出部2104は、対象領域の近傍を調べ、対象領域から所定の距離以内にある画素を新たに対象領域に取り込んで行く。所定の距離とは例えば10ドットである。この処理に伴い、対象領域は徐々に拡張されて行く。対象抽出部2104は、それ以上取り込める画素がなくなった時点で、この拡張処理を終える。この拡張処理が終わった時点で、対象領域として記憶されていた画素の集まりを、利用者が指示した対象であると判定する。
【0079】
対象抽出部2104が対象を抽出し終えた時点で、抽出された対象領域と、スティック先端30aが映り込んでいる領域を比較し、両者が重なり部分を持つ場合は、利用者が対象とスティック先端30aを重ねてしまったものと判定できる。例えば、図16のような場合である。したがってこのような場合は、利用者に指し方教示画面を提示し、正しい対象指定方法を教示する。また、対象抽出に連続して失敗した場合にも、利用者に指し方教示画面を提示し、正しい対象指定方法を教示する。
【0080】
例えば、図13に示した二値画像に上記の方法を適用すると、図17のようなパターンが対象として抽出される。この抽出結果の画像は、傾き補正部2105に渡される。
【0081】
(4)傾き補正部2105
傾き補正部2105は、対象抽出部2104から渡された対象の画像から、対象の傾きを計算し、それを補正するためのものである。
【0082】
まず傾き補正部2105は、受け取った対象の主軸の傾きを計算する。図18中の角度Rが主軸の傾きであり、この例の場合は−28度である。これは、カメラ部10で撮影された画像中での対象の傾きである。
【0083】
次に傾き補正部2105は、上で計算した主軸の傾きと、指差補正バッファ2112中の標準傾きの値を元に、対象が書かれていた紙に対する対象の傾きを計算する。この傾きのことを、以下の説明では実傾きと呼ぶことにする。具体的には、画像中での対象の傾きと、標準傾きの値を足しあわせたものが、実傾きとなる。本実施例の場合は、画像中での対象の傾きが−28度で標準傾きは32度であるから、そこから求められる実傾きの値は4度である。
【0084】
実傾きが0に近い範囲、例えば−45度から45度の間にある場合は、傾き補正部2105は対象が横長であったものと判定し、画像中での主軸の傾きが0になるように、対象の画像を回転させる。したがって先に上げた例の場合は、画像を−28度だけ回転させることになる。回転された後の対象の画像を図19に示す。逆に、実傾きが上記以外であった場合は、傾き補正部2105は対象が縦長であったものと判定し、画像中での主軸の傾きが90度になるように、対象の画像を回転させる。
【0085】
傾き補正部2105は、以上の処理が終わり、傾きが補正された対象の画像を、特徴抽出部2106に渡す。また、傾きが補正された対象の画像を、対象保持部に格納する。対象保持部に、画像を保持する場合、既に保持されていた画像があれば、それは破棄される。
【0086】
(5)特徴抽出部2106
特徴抽出部2106は、傾き補正部2105から送られてきた対象の画像から、特徴量を抽出するためのものである。特徴量とは、例えば対象が含む画素数,外挿矩形の大きさ,重心位置、などである。それらの特徴量は、後に対象を識別するために使用される。特徴量の一例を、図20に示す。対象画素数PIX−NUM,対象外挿幅BOX−WIDTH,対象外挿高さBOX−HEIGHT,重心X座標COG−X,重心Y座標COG−Yなどが特徴量を構成している。それらの値はいずれも整数値である。
【0087】
特徴抽出部2106により抽出された特徴量は、対象認識部2107に渡される。
【0088】
(6)対象認識部2107
対象認識部2107は、特徴抽出部2106から渡された特徴量を使って、現在処理中の対象が既に登録されているものか否かを判定する部分である。
【0089】
対象認識部2107は、パターン辞書2113に登録されている複数の特徴量と、特徴抽出部2106から渡された特徴量を比較し、近い特徴量があるかどうかを調べる。パターン辞書2113は、図21に示すように、それに含まれる項目数を保持する辞書項目数領域と、0個以上のパターン辞書項目からなる。さらにパターン辞書項目は、特徴量を保持する特徴量領域と、対象識別番号領域からなる。本実施例では、対象識別番号領域に格納される対象識別番号として、自然数値(1,2,3,…)を用いるものとする。
【0090】
対象認識部2107は、パターン辞書2113から、入力の特徴量と近い特徴量を持つパターン辞書項目を探し出し、その項目の対象識別番号領域に格納されていた対象識別番号を動作実行部2108に渡す。入力の特徴量と近い特徴量を持つ登録パターンが見つからなかった時は、対象認識部2107は対象識別番号として−1を動作実行部2108に渡す。
【0091】
(7)動作実行部
動作実行部2108は、対象認識部2107から渡された対象識別番号に基づき、所定の処理を実行する部分である。以下で、その処理内容を説明する。
【0092】
対象識別番号が−1であった場合、すなわち入力対象が、既に登録されたパターンではなかった場合、動作実行部2108は、対象保持部に格納されている対象画像を読み出し、それをパターンバッファ2109に格納する。この際、パターンバッファ2109に既に格納されていた画像があれば、新たに格納される画像はその右側に追加されるものとする。パターンバッファ2109に蓄積された対象パターンは、後の処理で使用されるまで保持される。
【0093】
また、対象識別番号が−1であった場合、すなわち入力対象が、既に登録されたパターンではなかった場合は何もしない。
【0094】
処理テーブルは、図22に示すように、それに含まれる項目数を保持する処理項目数領域と、0個以上の処理指定項目からなる。動作実行部2108は、処理テーブルを使って、対応する処理を調べ、それを実行する。
【0095】
一方、対象認識部2107から渡された対象識別番号が−1で無かった場合、すなわち入力パターンが既に登録されているパターンであった場合、動作実行部2108は、その対象識別番号にどのような動作が対応付けられているかを動作テーブルを使って調べ、その動作を実行する。
【0096】
動作テーブルは、図23に示すように、それに含まれる項目数を保持する動作項目数領域と、0個以上の動作指定項目からなる。動作指定項目は、対象識別番号を保持する対象番号領域と、その対象が検出された時に実行すべき動作を保持する動作領域からなる。
【0097】
動作実行部2108は、対象認識部2107から与えられた対象識別番号と同じ番号を持つ動作指定項目が動作テーブル中にあるか調べ、あればその動作指定項目の動作領域を読み出して実行する。
【0098】
動作実行部2108が実行できる動作には、例えばOPEN動作がある。動作実行部2108が実行すべき動作がOPENであった場合、動作実行部2108はまず、パターンバッファ2109に格納されているパターンを、ある決められた名前のパターン画像ファイル(例えば" patterns.bmp" など)に格納する。次に、動作名OPENに続いて格納されているファイル名またはプログラム名を参照し、そのファイルを開いたりプログラムを起動したりする。
【0099】
動作実行部2108により起動されたプログラムは、パターン画像ファイルを読み込んで、任意の処理に利用することができる。例えば、パターン画像ファイルに格納されている画像を、文字列とみなして文字認識を試みたりできる。また、動作実行部2108により起動されたプログラムは、情報処理装置102の任意の機能を利用できる。例えば、情報処理装置102に組み込まれている百科事典プログラムの機能を呼び出したり、地図プログラムの機能を呼び出したりできる。
【0100】
上記を組み合わせば、動作実行部2108から起動されるプログラムとして、パターンバッファ2109の内容を文字認識し、それを百科事典プログラムに渡して調べた意味を表示させる、といったようなプログラムを実現することができる。
【0101】
図24は、本発明を実施するための情報処理装置102のディスプレイ101に表示される画面の一例である。利用者が映像情報入力装置100で入力した画像は、処理過程表示領域に表示される。処理過程表示領域には、入力された画像を処理して行く過程も表示される。処理過程表示領域の右側は、システムメッセージ領域である。ここには、情報処理装置102から利用者へのメッセージが表示される。画面の下側には、パターンバッファ領域がある。パターンバッファ領域には、利用者が映像情報入力装置100で指し示した処理対象で、情報処理装置102が一時的に保存しているものが表示される。
【0102】
以上本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0103】
【発明の効果】
本発明の映像情報入力装置によれば、ペーパーリンク操作等において高い画質で静止画を入力することができる、という効果が得られる。
【0104】
本発明の映像情報入力装置によれば、入力画像に対して補正が不要で、当該入力画像に基づく画像認識の精度を向上させることができる、という効果が得られる。
【0105】
本発明の映像情報入力装置によれば、直近から遠方までの広い焦点範囲での多様な画像情報の入力ができる、という効果が得られる。
【0106】
本発明の映像情報入力装置によれば、紙面上の文字やパターン等の情報に連動した多様な情報処理ができる、という効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施の形態である映像情報入力装置の構成の一例を示す側面図である。
【図2】本発明の一実施の形態である映像情報入力装置の正面図である。
【図3】本発明の一実施の形態である映像情報入力装置の平面図である。
【図4】本発明の一実施の形態である映像情報入力装置の使用状態の一例を示す説明図である。
【図5】本発明の一実施の形態である映像情報入力装置をスタンドに載置した状態の斜視図である。
【図6】本発明の一実施の形態である映像情報入力装置のカメラ映像の撮像範囲の一例を示す説明図である。
【図7】本発明の一実施の形態である映像情報入力装置における制御系の構成の一例を示すブロック図である。
【図8】本発明の一実施の形態である映像情報入力装置の変形例を示す概念図である。
【図9】本発明の一実施の形態である映像情報入力装置の変形例における制御系の構成の一例を示すブロック図である。
【図10】本発明の一実施の形態である映像情報入力装置の変形例における制御系の構成の一例を示すブロック図である。
【図11】本発明の一実施の形態である情報処理システムの構成の一例を示す概念図である。
【図12】情報処理装置の内部構成である。
【図13】二値画像の一例横長の対象を入力した場合の例である。
【図14】指差補正のための値の組みである。
【図15】指差補正データを説明する図である。
【図16】対象抽出を説明する図である。
【図17】抽出された対象の画像の一例である。
【図18】傾き補正を説明する図である。
【図19】傾き補正後の対象の画像の一例である。
【図20】特徴量の例である。
【図21】パターン辞書の構造の一例を示す図である。
【図22】処理テーブルの構造の一例を示す図である。
【図23】動作テーブルの構造の一例を示す図である。
【図24】情報処理装置の表示画面の一例である。
【符号の説明】
10…カメラ部、11…カメラ本体、12…レンズ、13…焦点合わせリング、20…把持部、30…焦点スティック、30a…スティック先端、30b…回動端部、30c…スイッチ作動片、40…スイッチ、50…インタフェースケーブル、51…コネクタ、60…カメラスタンド、71…撮像素子、72…ドライバ、73…輝度/コントラスト調整部、74…コントロール部、75…ROM/RAMコントロール部、76…ROM、77…RAM、78…ハードウェアシャッタスイッチ、79…電源回路、80…インタフェース制御部、81…モータ駆動スイッチ、82…リング駆動モータ部、83…ハードウェアシャッタスイッチON/OFF回路、83a…遮断信号、90…紙面、91…操作者の手、100…映像情報入力装置、101…ディスプレイ、102…情報処理装置、102a…コネクタ部、θ1…交差角度、θ2…交差角度。

Claims (1)

  1. 対象物の映像を入力するカメラ部と、前記カメラ部に接続された把持部と、スイッチと、基端部が前記把持部に支持され先端部が前記対象物に当接されることによって前記対象物と前記カメラ部との距離を設定する焦点スティックとを含み、
    前記カメラ部および前記把持部の各々の軸は交差し、前記カメラ部の前記軸を前記把持部の前記軸に重ね合わせる方向に測った第1の交差角が鋭角をなし、
    前記カメラ部および前記焦点スティックの各々の軸は交差し、前記カメラ部の前記軸を前記焦点スティックの前記軸に重ね合わせる方向に測った第2の交差角が鋭角をなし、
    前記第1の交差角は前記第2の交差角よりも大きいことを特徴とする映像情報入力装置。
JP34038999A 1999-11-30 1999-11-30 映像情報入力装置 Expired - Fee Related JP3749810B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34038999A JP3749810B2 (ja) 1999-11-30 1999-11-30 映像情報入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34038999A JP3749810B2 (ja) 1999-11-30 1999-11-30 映像情報入力装置

Publications (2)

Publication Number Publication Date
JP2001155140A JP2001155140A (ja) 2001-06-08
JP3749810B2 true JP3749810B2 (ja) 2006-03-01

Family

ID=18336491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34038999A Expired - Fee Related JP3749810B2 (ja) 1999-11-30 1999-11-30 映像情報入力装置

Country Status (1)

Country Link
JP (1) JP3749810B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102022772B1 (ko) * 2017-09-25 2019-09-18 이준택 문자 인식용 영상 획득

Also Published As

Publication number Publication date
JP2001155140A (ja) 2001-06-08

Similar Documents

Publication Publication Date Title
CN107026973B (zh) 图像处理装置、图像处理方法与摄影辅助器材
US9712745B2 (en) Method and apparatus for operating camera function in portable terminal
US7176881B2 (en) Presentation system, material presenting device, and photographing device for presentation
JP3462986B2 (ja) カメラ付きペン型入力装置
KR20020052217A (ko) 이미지 센서를 이용한 전자 기기
JP6390799B2 (ja) 入力装置、入力方法、及びプログラム
EP0626636A2 (en) Information processing system
US20010030668A1 (en) Method and system for interacting with a display
JP2008129775A (ja) 表示制御装置、表示装置、表示制御方法
JP6344530B2 (ja) 入力装置、入力方法、及びプログラム
JP2000298544A (ja) 入出力装置と入出力方法
JP2014098941A (ja) 画像認識装置および操作判定方法
JP2011180712A (ja) 投写型映像表示装置
JP2011211493A (ja) 撮像装置、表示方法及びプログラム
WO2017147748A1 (zh) 一种可穿戴式系统的手势控制方法以及可穿戴式系统
JPH0757103A (ja) 情報処理装置
WO2018150569A1 (ja) ジェスチャー認識装置、ジェスチャー認識方法、ジェスチャー認識装置を備えたプロジェクタおよび映像信号供給装置
JP4871226B2 (ja) 認識装置および認識方法
JP3749810B2 (ja) 映像情報入力装置
JP3851601B2 (ja) 携帯端末装置
JP2023033559A (ja) 情報処理装置、表示制御方法、及びプログラム
JP2002049455A (ja) 入力インタフェース装置、及び該装置を具備する携帯情報装置
CN107193513B (zh) 终端装置、数据处理系统和数据处理方法
JP2007310789A (ja) インタフェースデバイス
JP2007323126A (ja) 入力装置及び入力操作方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051205

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees