JP3521187B2

JP3521187B2 - 固体撮像装置

Info

Publication number: JP3521187B2
Application number: JP2000005740A
Authority: JP
Inventors: 俊一沼崎; 美和子土井; 明森下; 直子梅木; 浩樹三浦
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1996-10-18
Filing date: 2000-01-06
Publication date: 2004-04-19
Anticipated expiration: 2017-10-17
Also published as: JP2000222097A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、物体による反射光
を獲得し入力情報を抽出する固体撮像装置に関する。

【０００２】

【従来の技術】コンピュータへの入力デバイスとして、
マウスが圧倒的に使われている。しかし、マウスで操作
できることは、カーソルの移動と、メニューの選択など
であり、あくまでも２次元のポインティングデバイスと
しての役目に過ぎない。マウスで扱えるのは、２次元の
情報であり、３次元空間のなかの物体など奥行きがある
ものを選択することは難しい。

【０００３】また、アニメーションを作成する場合、キ
ャラクタの動きをつけるのに、マウスのような入力デバ
イスでは、自然な動きをつけることが難しかった。

【０００４】最近、３次元空間でのポインティングの難
点を補うために、３次元ポインティングデバイスが開発
されている。例えば、図８０のような３次元ポインティ
ングデバイスは、中央の丸い部分の前方を押す、中央を
押す、後方を押す、丸い部分の全体を持ち上げる、全体
を右に回す、左に回すというように、６通りの操作が可
能であり、６自由度ある。この６自由度を割り振ること
で、３次元空間内のカーソルの位置（ｘ，ｙ，ｚ）と向
き（ｘ軸，ｙ軸，ｚ軸）制御したり、あるいは、３次元
空間に対する視点位置（ｘ，ｙ，ｚ）と向き（ｘ軸，ｙ
軸，ｚ軸）を制御できる。

【０００５】しかし、実際に操作すると、思うようにカ
ーソルや視点の制御ができないという問題がある。例え
ば、左右に回そうとすると、前方あるいは後方を押して
しまい、思わぬ方向にカーソルが動いたり、視点が動い
たりしてしまう。

【０００６】このような３次元ポインティングデバイス
に対して、手振りや身ぶりを使って入力するデバイスも
開発されている。データグローブやデータスーツ、サイ
バーグローブと呼ばれるものである。これらは、例え
ば、データグローブは手袋状のデバイスで、表面に光フ
ァイバが走っている。光ファイバは、指の関節まで通っ
ており、指を曲げることにより、光の導通が変わる。こ
の光の導通を計測することで、各指の関節がどの程度曲
がっているかがわかる。手自体の３次元空間内の位置
は、手の甲についている磁気センサによって計測するよ
うになっている。人差し指をたてれば、前進するという
ように、身ぶりとそれに対応する指示を決めておけば、
データグローブを使って、３次元空間内を種々に視点を
変えて、ちょうど、歩き回るようにする（ウオークスル
ーという）ことができる。

【０００７】しかし、このような３次元ポインティング
デバイスにも問題点がいくつかある。まず、価格が高価
であり、家庭用などに使用することは難しい。指の関節
の角度を計測しているので、例えば、人差し指だけのば
し、他の指は、曲げた状態を前進指示と定義したとす
る。実際に指を伸ばすといっても、人差し指の第２関節
の角度が１８０度に完全になっていることは少ないの
で、遊びの部分を作らないと、指をのばしきったとき以
外は、のばしていると認識することができない。

【０００８】また、データーグローブを装着するので、
自然な操作が阻害され、装着するたびに、手の開いた状
態と閉じた状態において、光の導通状態を校正せねばな
らないので、手軽に使用することができない。また、光
ファイバを使っているため、継続的に使っていると、フ
ァイバが断絶するなど消耗品に近いという問題がある。

【０００９】また、このように、高価で、手間がかかる
デバイスである割には、手袋の大きさが、ぴったり合っ
ていないと、使っているうちにずれたりして校正した値
からずれるために、細かな手振りを認識することは難し
い。

【００１０】このように、いろいろな問題があるため
に、データグローブは、ＶＲ（バーチャルリアリティ、
仮想現実感）技術のトリガーとなったデバイスであった
にもかかわらず、当初の期待ほど、普及しておらず、ま
た、低価格化もなされておらず、使い勝手の点で問題が
多い。

【００１１】これに対し、データグローブのような特殊
な装置を装着することなく、手振りや身ぶりを入力しよ
うとする試みが、いくつかなされている。例えば、ビデ
オ映像などの動画像を解析して、手の形を認識するよう
な研究がなされている。

【００１２】しかし、これらでは、背景画像から目的と
する画像、手振りの認識の場合には、手のみを切り出す
ことが難しいという問題がある。例えば、色を使って切
り出す場合を考えてみる。手の色は肌色であるので、肌
色の部分のみを切り出すような方式が考えられるが、背
景にベージュ色の洋服や、壁があったりすると、肌色を
識別することができない。

【００１３】また、調整を行って、ベージュと肌色を区
別できるようにしても、照明が変われば、色調が変化し
てしまうために、定常的に切り出すことは困難である。

【００１４】このような問題から逃れるために、背景に
ブルーマットをおくというように、背景画像に制限を置
き、切り出しを容易にする方策も採られている。あるい
は、指先に背景からの切り出しが容易になるような色を
つける、あるいは色のついた指輪をはめるというような
方策も採られている。

【００１５】しかし、このような制限は現実的でなく、
実験的には使われているが、実用化されるにいたってい
ない。

【００１６】また、以上のような切り出しなどのビデオ
の画像認識処理は、非常に演算量が多い。このため、現
状のパーソナルコンピュータでは、秒３０枚発生する画
像を処理しきれないのが実状である。従って、ビデオ映
像の処理によるモーションキャプチャなどをやるのは、
リアルタイムでは無理である。

【００１７】レンジファインダと呼ばれる、距離画像を
入力する装置がある。その代表的な原理として、スポッ
ト光あるいはスリット光を対象物体に照射し、その反射
光の受光位置から三角測量の原理で求めるものである。
２次元的な距離情報を求めるために、スポット光あるい
はスリット光を機械的に走査している。この装置は非常
に高精度な距離画像を生成することができるが、その反
面、装置の構成が大掛かりになり、高コストになる。ま
た入力に時間がかかり、実時間で処理を行わせるのは困
難である。

【００１８】また、手や身体の一部に色マーカーや発光
部を取り付け、画像によりそれらを検出し、手・身体の
形、動きなどを捉える装置もあり、一部実用化されてい
る。しかし使用者の利便性を考えると、操作の度に装置
を装着しなくてはならないというのは大きなデメリット
であり、応用範囲を非常に制約する。また、データグロ
ーブの例に見られるように、装置を手などの可動部に装
着して使用する装置は耐久性が問題になりやすい。

【００１９】次に、以上のような入力デバイスとは別
に、カメラ技術の従来技術についての問題点を述べる。
従来のカメラ技術では、背景に対して、キャラクタの合
成（クロマキー）を行うには、あらかじめ、ブルーバッ
クでキャラクタを撮影して、キャラクタの切り出しを容
易にする必要があった。このため、ブルーバックで撮影
ができるスタジオなど、撮影場所に制限があった。ある
いは、ブルーバックでない状態で撮影した映像から、キ
ャラクタを切り出すには、コマごとに、キャラクタの切
り出し範囲を人手で編集せねばならないので、非常な手
間がかかっていた。

【００２０】同様に、キャラクタを３次元空間の中に生
成するには、あらかじめ３次元のモデルをつくってお
き、そこにキャラクタの写真を貼り付ける（テクスチャ
マッピング）をおこなうような方式をとっている。

【００２１】しかし、３次元モデルの生成、および、テ
クスチャマッピングには手間がかかり、映画制作など経
費がかかってもよい用途以外では、ほとんど使えなかっ
た。

【００２２】

【発明が解決しようとする課題】このように従来では、
容易に特定のキャラクタだけを切り出すことができなか
った。

【００２３】

【００２４】

【００２５】

【課題を解決するための手段】上記課題を解決するため
に、基板上に、受光手段と、この受光手段で検出された
信号を増幅する増幅手段と、セルを選択する選択手段
と、前記受光手段をリセットするリセット手段とを有す
る単位セルを行列２次元状に配列してなる固体撮像装置
において、前記単位セルは前記受光手段で受けた光量に
応じた信号を保存する記憶手段を少なくとも２つ以上有
し、前記基板は前記少なくとも２つの記憶手段に記憶さ
せた信号の差を検出する差分検出手段を有することを特
徴とする。

【００２６】また、前記受光手段はフォトダイオードで
構成され、前記増幅手段は増幅トランジスタで構成さ
れ、前記リセット手段はリセットトランジスタで構成さ
れ、前記少なくとも２つの記憶手段はコンデンサで構成
されるもので、前記フォトダイオードは前記増幅トラン
ジスタのゲートで接続され、前記少なくとも２つのコン
デンサはそれぞれの一方の電極が前記増幅トランジスタ
に接続され、他方の電極が接地されることを特徴とす
る。

【００２７】

【発明の実施の形態】（実施例１）＜実施例１の概略説
明＞図１は、本発明の第１の実施例の構成例である。本
実施例はまた、本発明によって実現される種々の具体的
実施例の代表的な上位概念も表している。

【００２８】本構成は、発光手段１０１、反射光抽出手
段１０２、特徴情報生成手段１０３、タイミング信号生
成手段１０４とから成る。発光手段１０１はタイミング
信号生成手段１０４によって生成されるタイミング信号
に従って時間的に強度変動する光を発光する。この光は
発光手段前方にある対称物体に照射される。反射光抽出
手段１０２は、この発光手段１０１が発した光の対象物
体による反射光を抽出する。これはさらに好適には、反
射光の空間的な強度分布を抽出する。この反射光の空間
的な強度分布は画像として捉えることが出来るので、以
下では反射光画像と呼ぶ。

【００２９】反射光抽出手段１０２は、光の量を検出す
る受光部を持つが、受光部は一般的に、発光手段の光の
対象物体による反射光だけでなく、照明光や太陽光など
の外光も同時に受光する。そこで反射光抽出手段１０２
は、発光手段が発光しているときに受光した光の量と、
発光手段が発光していないときに受光した光の量の差を
とることによって、発光手段からの光の対象物体による
反射光の成分だけを取り出す。つまり、発光手段１０１
を制御する信号を生成するタイミング信号生成手段１０
４によって、反射光抽出手段１０２もまた制御されるこ
とを表す。

【００３０】特徴情報生成手段１０３は、反射光画像よ
りさまざまな特徴情報を抽出する。この特徴情報あるい
は特徴情報の抽出方法は様々考えられる。例えば、手の
反射光画像の特徴情報から、ジェスチャーやポインティ
ングなどの情報を得て、これによりコンピュータなどの
操作を行うことができる。また対象物体の立体情報を抽
出し、利用することもできる。図１に描かれている特徴
情報生成手段は、必ずしも必要ではなく、例えば反射光
抽出手段で得られた反射光画像そのものを入力したり利
用したりすることもできる。

【００３１】＜実施例１の詳細な説明＞次に、実施例１
のより具体的な構成について詳しく述べる。図２は、実
施例１のより具体的な構成例である。発光手段１０５よ
り発光された光は、対象物体１０６に反射して、レンズ
等の受光光学系１０７により、反射光抽出手段１０８の
受光面上に結像する。

【００３２】反射光抽出手段１０８は、この反射光の強
度分布、すなわち反射光画像を検出する。反射光抽出手
段１０８は、第１の受光手段１０９、第２の受光手段１
１０および差分演算部１１１から成る。第１の受光手段
１０９と第２の受光手段１１０は、異なるタイミングで
受光を行う。そして第１の受光手段が受光しているとき
に発光手段が発光し、第２の受光手段が受光していると
きには発光手段は発光しないように、タイミング制御手
段１１２がこれらの動作タイミングを制御する。これに
より第１の受光手段は発光手段からの光の物体による反
射光とそれ以外の太陽光、照明光などの外光を受光す
る。一方、第２の受光手段は外光のみを受光する。両者
が受光するタイミングは異なっているが近いので、この
間における外光の変動は無視できる。

【００３３】従って、第１の受光手段で受光した像と第
２の受光手段で受光した像の差分をとれば、これは発光
手段の光の物体による反射光の成分だけが抽出される。
差分演算部１１１が第１の受光手段１０９と第２の受光
手段１１０で受光した像の差を計算して出力する。反射
光抽出手段１０８については、さらに詳細な構成につい
て後述する。

【００３４】反射光抽出手段１０８は反射光画像の各画
素の反射光量をシーケンシャルに出力する。反射光抽出
手段１０８からの出力はアンプ１１３によって増幅さ
れ、Ａ／Ｄ変換器１１４によってデジタルデータに変換
された後、メモリ１１５に蓄えられる。しかるべきタイ
ミングでこのメモリ１１５より蓄積されたデータが読み
出され、特徴情報生成手段１１６において処理される。
これら全体の制御をタイミング制御手段１１２が行う。

【００３５】発光手段１０５は人間の目に見えない、近
赤外光を発光する。光が見えないため、眩しさを感じず
に済む。また、受光光学系には図示しないが、近赤外光
通過フィルタが設けてある。このフィルタは、発光波長
である近赤外光を通過し、可視光、遠赤外光を遮断す
る。従って、外光の多くをカットしている。

【００３６】物体からの反射光は、物体の距離が大きく
なるにつれ大幅に減少する。物体の表面が一様に光を散
乱する場合、反射光画像１画素あたりの受光量は物体ま
での距離の２乗に反比例して小さくなる。従って、本入
力装置の前に物体を置いたとき、背景からの反射光はほ
ぼ無視できるくらいに小さくなり、物体のみからの反射
光画像を得ることが出来る。

【００３７】例えば、入力装置の前に手を持ってきた場
合、その手からの反射光画像が得られる。この時、反射
光画像の各画素値は、その画素に対応する単位受光部で
受光した反射光の量を表す。反射光量は、物体の性質
（光を鏡面反射する、散乱する、吸収する、など）、物
体面の向き、物体の距離、などに影響されるが、物体全
体が一様に光を散乱する物体である場合、その反射光量
は物体までの距離と密接な関係を持つ。手などはこのよ
うな性質を持つため、手を差し出した場合の反射光画像
は、手の距離、手の傾き（部分的に距離が異なる）、な
どを反映する。従ってこれらの特徴情報を抽出すること
によって、様々な情報の入力・生成が可能になる。

【００３８】立体形状を抽出したい場合には、距離情報
を高い分解能で求められることが望ましい。このような
場合、アンプとして対数アンプを用いると望ましい。受
光部の受光量は物体までの距離の２乗に反比例するが、
対数アンプを用いると、その出力は、距離に反比例する
ようになる。このようにすることで、ダイナミックレン
ジを有効に使うことができる。

【００３９】＜反射光抽出手段の詳細な説明＞図３は、
反射光抽出手段の構成の一例をさらに詳細にあらわした
ものである。反射光抽出手段は反射光の強度分布を捉え
るために複数の単位受光部から成っており、ひとつの単
位受光部と反射光画像の一画素が対応している。この図
では簡単のため２×２画素の構成で示す。点線で囲まれ
た部分１１７が一画素分であり、一画素分の概略構成を
図４に示す。先の例との対応を取ると、第１の受光手段
の一画素分と第２の受光手段の一画素分で、１つの単位
受光部を構成している。

【００４０】１つの単位受光部は１つの光電変換部１１
８と、２つの電荷蓄積部１１９、１２０を持っている。
光電変換部１１８と電荷蓄積部１１９、１２０の間には
いくつかのゲートがあり、このゲートの制御によって光
電変換部で発生した電荷を、いずれの電荷蓄積部に導く
かを選択できるようになっている。このゲートの制御信
号と発光部の発光制御信号を同期させる。

【００４１】ここで、受光手段と、この受光手段で検出
された信号を増幅する増幅手段１２５と、セルを選択す
る選択手段１２５５と、前記受光手段をリセットするリ
セット手段１２４とを有する単位セルを行列２次元状に
配列し、受光手段はフォトダイオードで構成され、増幅
手段１２５は増幅トランジスタで構成され、リセット手
段はリセットトランジスタで構成され、少なくとも２つ
の記憶手段である電荷蓄積部はコンデンサで構成され、
フォトダイオードは増幅トランジスタのゲートで接続さ
れ、前記少なくとも２つのコンデンサはそれぞれの一方
の電極が増幅トランジスタに接続され、他方の電極が接
地される。

【００４２】受光部におけるゲートなどの制御信号と発
光制御信号、および光の強さの時間的変化を図５に示
す。発光制御パルス１２８は発光手段を制御する信号で
ある。ここではパルス発光を行う。発光制御パルスのレ
ベルがＨＩＧＨのとき発光手段が発光し、ＬＯＷのとき
は発光しない。この発光制御信号に対し、実際の光は発
光素子の時間応答によってなまり、１２９のように変化
する。受光部には、ＳＡＭＰＬＥ１（１３１）、ＳＡＭ
ＰＬＥ２（１３２）、ＴＲＡＮＳＦＥＲ、ＲＥＳＥＴ
（１３０）の制御信号が与えられる。ＴＲＡＮＳＦＥＲ
は、光電変換部で発生した電荷を次段に転送するための
ゲートを制御する信号であり、この信号がＨＩＧＨのと
き、光電変換部に蓄積された電荷が転送される。電荷蓄
積後、出力部へ電荷転送するときは、このゲートが閉
じ、光電変換部で発生した電荷が出力ゲートへ流れない
ようにする。

【００４３】ＲＥＳＥＴ１３０はリセット制御信号であ
る。ＴＲＡＮＳＦＥＲがＨＩＧＨの時、ＲＥＳＥＴがＨ
ＩＧＨになると、リセットゲート１２４が開き、光電変
換部にたまっていた電荷は、トランスファー・ゲート１
２１、リセット・ゲート１２４を経て、排出される。Ｓ
ＡＭＰＬＥ１、ＳＡＭＰＬＥ２の２つの制御信号は、２
つの電荷蓄積部１１９、１２０に、光電変換部１１８か
らの電荷を導くためのゲート１２２、１２３を制御する
信号である。これらの制御信号の変化と、単位受光部の
動作を次に説明する。

【００４４】電荷蓄積期間においては、トランスファー
・ゲート１２１は開き続けている。まず、リセット・ゲ
ート１２４を開くことにより、光電変換部１１８とサン
プル・ゲート１２２、１２３の間にたまった不要電荷を
排出する。リセット・ゲート１２４を閉じることで、光
電変換部とサンプル・ゲートの間に、光電変換されてで
きた電荷が蓄積されはじめる。一定時間の後、第１のサ
ンプル・ゲート１２２が開くと、蓄積されていた電荷
が、第１の電荷蓄積部１１９に転送される。

【００４５】従って、ＲＥＳＥＴ１３０がＬＯＷになっ
てから、ＳＡＭＰＬＥ１（１３１）がＬＯＷになるまで
の蓄積期間１に光電変換された電荷が、第１の電荷蓄積
部１１９に蓄積される。第１のサンプル・ゲート１２２
が閉じた後、再びリセット・ゲート１２４を開いて不要
電荷を排出した後、リセット・ゲートを閉じ、一定時間
の後に今度は第２のサンプル・ゲート１２３を開き、第
２の電荷蓄積部１２０に、光電変換で生成された電荷を
転送する。この時も同様に、ＲＥＳＥＴがＬＯＷになっ
てからＳＡＭＰＬＥ２がＬＯＷになるまでの蓄積期間２
に光電変換された電荷が第２の電荷蓄積部に蓄積され
る。このとき蓄積期間１と蓄積期間２は同じ長さの時間
である。

【００４６】ここで、電荷蓄積期間１においては、発光
手段１０５が発光しており、電荷蓄積期間２において
は、発光手段は発光しない。このことにより、第１の電
荷蓄積部１１９には、発光手段からの光が物体に反射し
た光と、照明光、太陽光などの外光の両方によって生成
された電荷が蓄積され、一方、第２の電荷蓄積部１２０
には外光のみによって生成された電荷が蓄積される。電
荷蓄積期間１と電荷蓄積期間２は時間的に近いので、こ
の間での外光の大きさの変動は十分に小さいと考えてよ
い。

【００４７】従って、第１の電荷蓄積部と第２の電荷蓄
積部の、電荷量の差が、発光手段からの光が物体に反射
した光で発生した電荷量であるとみなしてよい。

【００４８】上記、ＳＡＭＰＬＥ１、ＳＡＭＰＬＥ２、
ＲＥＳＥＴ、ＴＲＡＮＳＦＥＲは、すべての単位受光部
に同じ信号が与えられるため、すべての単位受光部にお
いて、同期的に電荷の蓄積が行われる。このことは、１
フレーム分の反射光画像を得るために１度の発光だけで
済むことを示している。従って、発光のための電力を小
さくすることができる。また、発光手段として用いるこ
とのできるＬＥＤは、発光パルスのＤＵＴＹ比が小さい
ほど（１つのパルス幅に比べて、パルスとパルスの間隔
が長いほど）、瞬間的には強く発光できる性質を持つた
め、発光電力を効率的に利用することができる。

【００４９】電荷蓄積後、電荷の取り出しを行う。まず
Ｖ系選択回路１３５で１行を選択する。各行の単位受光
部から、第１の電荷蓄積部と第２の電荷蓄積部に蓄積さ
れた電荷が順に取り出され、差分回路１３３の中でその
差分が取り出される。Ｈ系シフトレジスタで列を選択す
ることで、取り出す。

【００５０】＜実施例１の変形例１＞本実施例において
は、電荷の取り出し時には、シフトレジスタで取り出し
セルのアドレスを指定するため、出力の順番が決まって
いる（シーケンシャルな出力）が、任意のアドレスを生
成できるようにすればランダムアクセスが可能になる。
このようにすると、受光部全体のうち、一部分だけを取
り出すことができ、センサの動作周波数を低下させる、
あるいは、反射光画像のフレームレートを上げることが
できるなどの効果がある。例えば画像の一部しか占めな
いような小さな物体を検出して、その動きを追跡させる
ような場合は、あるフレームでの位置の周辺だけで探索
すればよいため、画像の一部だけを取り出すだけで良
い。

【００５１】＜実施例１の変形例２＞また、発光源とし
て、近赤外光を用いたが、必ずしもこれに限定しない。
人の目に眩しくない条件でなら（例えば、発光量がそれ
ほど大きくない、人の目に直接入らない向きを向いてい
る、など）、可視光であっても良い。あるいは、光に限
らず、電磁波、超音波などを用いることも可能である。

【００５２】近赤外光通過フィルタも、外光の影響を考
えなくてよいなどの条件下であれば省くこともできる。

【００５３】ところで、通常の撮像用のＣＣＤイメージ
センサを用いても、これに類することを実現することも
できるが、その性能、あるいはコストパフォーマンスに
おいて本構成の方が優れている。

【００５４】例えば、ＣＣＤイメージセンサと光源を用
いることもできる。しかし、ＣＣＤは１／６０秒毎に１
回の撮像しかできない（フィールド単位）。従って、は
じめの１／６０秒で、発光部を発光させ、次の１／６０
秒で発光部を消灯させ、その差分をとっても、１／６０
秒の時間差があると、外光の大きさが変動してしまい、
差分＝反射光量とならなくなってしまう。蛍光灯などは
１／１００秒の周期でその強さが変動しているので、こ
のようなことが起こってしまう。ＣＣＤイメージセンサ
を使った通常の撮像においても、撮像周期と、外光の変
動周期のずれに起因して、画面の明るさがちらつく現象
がおきることがあり、これはフリッカと呼ばれている。

【００５５】本構成においては、発光時間と消灯時間の
差が１／１００００秒程度、あるいはそれ以下まで小さ
くすることができるので、外光の変動の影響を受けなく
て済む。ＣＣＤイメージセンサによる撮像の場合、フリ
ッカを防ぐために、電荷蓄積時間を１／１００秒と蛍光
灯の周期と一致させる方法が取られることがあるが、発
光部と同期させる場合においても、電荷蓄積時間を１／
１００秒にする、あるいはＣＣＤの駆動信号を変えてし
まい、１フィールドを１／１００秒にしてしまう、とい
うような方法により、外光の影響を抑えることもでき
る。この場合は別の問題が発生する。対象物体である手
が動いている場合、発光時の撮像と消灯時の撮像におい
て手の位置が微妙にずれてしまう。この状態で差分を取
ってしまうと、特に物体（手）のエッジ部分において、
反射光画像が大きく乱れてしまう。

【００５６】また、構成のコンパクトさでも大きく異な
る。ＣＣＤを用いる場合、少なくとも、Ａ／Ｄ変換器
と、１フレーム分のデータを蓄えるメモリ、差分画像を
求める演算回路が必要である。またＣＣＤを用いる場合
には、ドライバーＩＣを別に用意する必要がある。一
方、本構成では、ＣＭＯＳセンサベースに作られるの
で、ドライバーを同一チップ内に収めてしまうことがで
きる。

【００５７】また、センサ内で発光時、非発光時の差を
とれるので、差分演算回路は不要である。また、Ａ／Ｄ
変換部やメモリ、制御部まで１チップ内に収めてしまう
こともできるので、非常に低コスト化できる。

【００５８】ここまでの説明では、物体の反射光画像を
入力するところまでの構成を述べた。ここまでの構成で
も十分新規性があり、製品として構成できる。しかし、
実際の利用形態としては、入力された反射光画像に何ら
かの加工を施して、使用者の目的に合った使い方をする
ことが多い。例えば、手の反射光画像を入力することに
より、ポインティングやジェスチャー入力を行うことが
出来る。

【００５９】このために反射光画像から有用な情報を抽
出するのが、特徴情報生成手段である。ここで、さまざ
まな特徴量を抽出したり、加工したり、そこから別の情
報を生成したりしている。

【００６０】反射光画像の加工の仕方の代表例は、距離
情報の抽出と、領域抽出である。先にも述べたように、
物体が一様で均質な散乱面を持つ物体であれば、反射光
画像は距離画像と見なすことができる。従って、物体の
立体形状を抽出することができる。物体が手であれば、
手のひらの傾きなどが検出できる。手のひらの傾きは部
分的な距離の違いとして現れる。また、手を移動させた
ときに画素値が変われば、距離が移動したと見ることが
できる。また、背景のように遠い物体からの反射光はほ
とんどないため、反射光画像からあるしきい値以上の領
域を切り出すという処理で、物体の形状を簡単に切り出
すことができる。例えば、物体が手であれば、そのシル
エット像を切り出すのは極めて容易である。距離情報を
用いる場合でも、一度しきい値によって領域抽出をして
おいてから、その領域内の距離情報を用いる、という場
合が多い。

【００６１】＜実施例１の効果＞第１の実施例によれ
ば、手などの反射画像を容易にかつ実時間で獲得でき
る。これは、従来の画像処理で最も難しく、画像処理の
応用の障壁になっていた対象物の画像の切り出しの処理
を不要とするものである。従って、本実施例により、従
来実用化が困難であった種々の画像処理を容易でかつ安
定、かつ安価なコストでの提供を可能とするものであ
り、産業／家庭／娯楽など広範囲の市場に大きな変革を
もたらすものである。

【００６２】（実施例２）以下では、特徴情報生成手段
に特徴を持ついくつかの実施例について説明する。対象
物体として手を用いた場合、非接触で手の位置・形の情
報を捉えることができるので、人から機械への入力手段
として用いることができる。従来、マウスやトラックボ
ールなどのポインティングデバイスと呼ばれる装置を用
いて行っていたポインティング操作（位置を入力する操
作）を、手の動きだけで非接触で行うことができる。第
２の実施例として、非接触ポインティングを実現するた
めの装置について説明する。

【００６３】まず非接触なポインティングに用いる例を
説明する。手の形状が容易に検出できるため、非接触の
ポインティングデバイスとして利用することができる。
携帯情報機器などに好適なポインティング手段を提供す
る。ユーザは指を伸ばした状態で入力装置の前に手を差
し出して動かす。これは非常に自然な動作である。この
とき反射光画像は図６左のようになる。この反射光画像
から画像処理によって指先位置を検出し、ポインティン
グに利用する。

【００６４】伸ばした指部分は上向きの棒状物体となっ
ているから、この先端の座標を画像処理で求めることは
それほど難しくない。しかし、単純に棒状先端の座標を
求めるだけでは、反射光画像の解像度の精度でしか指先
位置を求めることは出来ない。

【００６５】一般に反射光抽出手段は、必要とされる画
素数が少ないほど低コストで作ることができる。粗い反
射光画像から高精度に指先位置が求められれば、低コス
トに非接触ポインティング装置を作ることができる。指
先端の座標ではなくて、図７の×印２０８の位置を画素
以上の分解像で求め、これを特徴点としてポインティン
グに用いる。これは指先の一部分の（像の）重心であ
る。この重心を粗い反射受光画像からどのように抽出す
るかを説明する。

【００６６】この反射光画像の画素値に注目してみる。
先に、画素値は距離情報に換算できると述べた。しか
し、反射光画像の解像度が粗い場合、手の周辺部におい
てはこの考えは必ずしも当てはまらない。いま、反射光
画像の画素と、対象空間の関係が図８のようになってい
ると考える。ここで、図８の１マスからの反射光が反射
光画像のひとつの画素の画素値に対応する。この図か
ら、マス２１１からの反射光に比べてマス２１２からの
反射光は半分程度であることが分かる。同じ距離に対象
が存在していても、そのマスを対象が占める割合によっ
て、反射光量が変わる。

【００６７】つまり、ここでは、反射光量の減りかた
が、手のエッジの位置を反映する。ここで、指の位置が
わずかに移動したと考えてみる。すると、マスに占める
指の割合が変化するので、画素値がわずかに変化する。
反射光画像が粗くても、画素値がある程度の精度で求め
られ、これを用いることにより、画像以上の解像度でポ
インティング位置を求めることが出来る。伸ばした指の
幅が２〜３画素分程度あればかなり良好にポインティン
グ精度が出せることが実験的に分かっている。粗い画像
から高い精度の指先位置を求める方法について以下で詳
しく説明する。

【００６８】第２の実施例を実現するための特徴情報生
成手段の構成例を図９に示す。特徴情報生成手段は、棒
状物体検出部２１３、棒状物体先端切り出し部２１４お
よび重心検出部２１５から構成される。

【００６９】棒状物体検出部２１３では、縦方向に伸び
た棒状の物体、すなわち操作者の手の中で上方に伸びた
指（例えば人差し指）を検出する。

【００７０】次に、棒状物体先端切り出し部２１４で
は、縦方向に伸びた棒状の物体（人差し指）の上部先端
を切り出し、後の重心検出部２１５でその切り出した部
分の重心を求める。この時、画素単位で切り出してしま
うと、画素が粗いため切り出し部分の画素値合計が大き
く変動してしまい、検出された重心の精度が悪くなる
（これについては後述する）。従って、棒状物体先端切
り出し部２１３では、切り出し部分の画素値合計がある
条件を満足するように一部画素値を修正しながら切り出
す。

【００７１】重心検出部２１５は上記棒状物体先端切り
出し部２１４で切り出された先端部分の重心を計算す
る。この計算された重心を、指先位置とする。

【００７２】さらに各部について詳しく説明する。ま
ず、棒状物体検出部２１３について述べる。ここでは、
使用者が操作をするために指を出したとき、指示する指
（通常は人差し指）が、反射受光画像の上方向に伸びて
いる、と仮定している。従って、この仮定に合わない形
状で手を出すと（例えば、グーで差すなど）正常に検出
できない恐れはある。

【００７３】まず、反射受光画像２０１を、上方から水
平方向にスキャンしていく。指先が、反射受光画像の上
端になければ、通常は上の方は、１ライン全ての画素が
ほぼ０に近い画素値を持つ（２０２〜２０３）。水平方
向の１ラインの中で、部分的に画素値が大きくなるとこ
ろがあった場合（２０４）、その位置とラインを覚えて
おく。これを数ライン繰り返し（２０５〜２０７）、部
分的に画素値が大きくなるところが数ラインの中で一致
すれば、そこに縦方向に伸びた棒状の物体（例えば、人
差し指）があると判定できる。そして、伸ばした指があ
りそうな所を、大きめに囲う。この部分画像について、
さらに以下の処理を行う。

【００７４】ここからは、棒状物体先端切り出し部２１
４での処理である。図１０の２１６がもともとの反射受
光画像であり、２１７は棒状物体検出部２１３で、この
中に指先があると判定された部分画像である。

【００７５】一番左上の画素値をＰ（１，１）とし右上
をＰ（ｎ，１）、左下をＰ（１，ｎ）、右下をＰ（ｎ，
ｎ）とする。ここで、あるしきい値ＴＨを設定してお
き、

【数１】となるような、ｋ、ａを求める。次にａを用いて、Ｐ
（１，ｋ）〜Ｐ（ｎ，ｋ）の画素値を修正する。すなわ
ち、古い画素値をＰ’（１，ｋ）〜Ｐ’（ｎ，ｋ）とし
たとき、

【数２】とする。この修正されたＰ（１，ｋ）〜Ｐ（ｎ，ｋ）を
含む、Ｐ（１，１）〜Ｐ（ｎ，ｋ）が切り出された部分
２１８となる。２１８の上部３行は２１７の上部３行と
同じであり、２１８の最下行（太い枠で囲まれたとこ
ろ）は２１７の４行目のそれぞれの画素値にａを乗じて
修正されているので、色が薄くなっている。

【００７６】次に重心検出部２１５において、切り出さ
れたＰ（１，１）〜Ｐ（ｎ，ｋ）を使って、重心（ｘ
ｘ，ｙｙ）は次の式を満たすように決定される。

【数３】

【数４】ここで求められた（ｘｘ，ｙｙ）は、図８の伸ばした指
のうち上方からある長さだけ切り取ったもの（切り取る
長さがしきい値ＴＨと関連する）の像の重心とほぼ一致
する。ここでは通常のＴＶ画像に比べて画素が粗いた
め、切り取る長さを一定に保つのと同じ効果を出すため
に、上記のような修正を行っている。ここでは、各画素
の値Ｐ（ｘ，ｙ）が精度良く求まるほど、（ｘｘ，ｙ
ｙ）の値も精度良く求められる。

【００７７】ここで、Ｐ（１，ｋ）〜Ｐ（ｎ，ｋ）の値
を上のように修正した理由を述べる。もし、Ｐ（１，
ｋ）〜Ｐ（ｎ，ｋ）の値を修正しないで、（ｘｘ，ｙ
ｙ）を計算した場合を図１１を用いて考察する。ここ
で、仮に水平ラインで一部だけ大きい画素値が現れると
ころから、３画素分下がったところまで（斜線部分）を
用いた重心計算で指位置を決定すると、指が図１１
（ａ）から図１１（ｂ）のように移動したとき、指の位
置変化に比べて、（ｘｘ，ｙｙ）の位置の変化が大きく
なってしまう。

【００７８】逆に図１１（ｃ）から図１１（ｄ）のよう
に変化すると、指の位置変化に比べて（ｘｘ，ｙｙ）の
位置の変化が小さくなってしまう。つまり、実際の指の
位置と計算された（ｘｘ，ｙｙ）の値に、線形性がなく
なってしまう。

【００７９】上述のように、まず重心を計算するときの
全画素の画素値の合計が一定になるように補正をしてか
ら重心の計算をすれば、指の動きと重心の動きは滑らか
に連動する。伸ばした指の幅が２〜３画素分程度あれば
十分なポインティング精度が出せると前述したが、逆に
指の幅が一画素に満たない場合は、十分な精度が出な
い。これは図１２の場合であるが、指先がわずかに動い
ても重心のｘ座標が変化しないことがある。つまり、実
際の指の位置と（ｘｘ，ｙｙ）の値に線形性がなくなっ
てしまう。

【００８０】次に、デジタル信号処理部における処理の
流れを図１３〜図１５に示したフローチャートを用いて
説明する。ここでは、上で述べたよりもやや細かい工夫
が施されているところもあるが、それらも含めて以下で
説明する。このフローチャートをそのままプログラムに
すれば、デジタル信号処理部をソフトウエアで実現する
ことができる。もちろん、ハードウエアで構成すること
も可能であるし、ソフトウエア、ハードウエア両方で構
成されることもあり得る。

【００８１】また、この場合ソフトウエアはＦＤ等の記
録媒体に記録されてなり、配布できるような状態になっ
ていることもある。

【００８２】図１３は棒状物体検出部の処理を表してい
る。ここでは既に述べたように、反射受光画像を水平方
向にスキャンしながら、部分的に画素値が大きくなると
ころを見つけ、これが複数ラインで、近い位置に現れる
と、棒状物体があると判断する。この部分的に画素値が
大きくなるところ（以下で部分画素列と呼ぶ）、および
部分画素列の複数の集まりで、まだ棒状物体とは判断さ
れてはいないが棒状物体になる可能性のあるものを棒状
物体候補と呼ぶ。水平方向にスキャンしていくと、棒状
物体候補が見つかり、スキャンが進むにつれその中から
棒状物体が検出される。

【００８３】具体的には、まずこの棒状物体候補の情報
を格納しておく構造体を複数用意する（２２０）。ここ
では構造体名はｉｎｆｏＳｔｉｃｋ［ｎ］とする
（［ｎ］がついているのは複数あるから）。複数用意す
るのは、棒状物体候補は必ずしも１つではなく複数現れ
る可能性もあるからである。この構造体は５つのメンバ
ーを持ち、そのうち２つは配列である。図１５の２３５
にも示すように、メンバーは、ｙｓｔａｒｔ：棒状物体が始まったラインのｙ座標、ｘｓｔａｒｔ［ｉ］：棒状物体候補の上からｉライン目
（最上段は０ライン）の部分画素列の始まりのｘ座標、ｘｅｎｄ［ｉ］：棒状物体候補の上からｉライン目（最
上段は０ライン）の部分画素列の終わりのｘ座標、ｌｅｎｇｔｈ：棒状物体候補の縦方向の長さ（部分画素
列の数）、ｓｔａｔｕｓ：現在の状態（ＳＴＩＣＫ、ＮＯＳＴＩＣ
Ｋ、ＥＸＴＥＮＤＥＤの３つの値を取る。詳細は後
述。）、をそれぞれ表す。始まりのｘ座標、終わりのｘ座標は、
複数のラインにそれぞれあるので、これらは配列となっ
ている。

【００８４】以下で処理を説明していくが、わかりやす
いように図１５を併用しながら述べる。２３４は反射受
光画像を表しており、各画素の色の濃さは画素値の大き
さを表している。また上部と左部の数字はそれぞれｘ座
標、ｙ座標を示している。２３５には前述の構造体の概
要を表す。右側の２３６〜２３８は処理の途中での構造
体の内容である。

【００８５】水平ラインをスキャンしていき、条件を満
たす（ここでは、画素値がｓ以上の画素が、ｃ個以上連
続しない）部分画素列が見つかると（２２１）、これま
での棒状物体候補に統合するか（２２６）、新規に棒状
物体候補にする（２２５）。１番始めに見つかった部分
画素列は必ず新規棒状物体候補になる。例えば、図１５
では、ｙ＝３のラインをスキャンしているときに、始め
て部分画素列が見つかり、これを新規棒状物体候補とし
て登録する（２３６）。このラインのｙ座標、すなわち
３をｉｎｆｏＳｔｉｃｋ［０］．ｙｓｔａｒｔに入れ
る。部分画素列の長さは１なので、ｉｎｆｏＳｔｉｃｋ
［０］．ｘｓｔａｒｔ［０］、ｉｎｆｏＳｔｉｃｋ
［０］．ｘｅｎｄ［０］ともに６を代入する。新規なの
で、ｉｎｆｏＳｔｉｃｋ［０］．ｌｅｎｇｔｈは１と
し、ｉｎｆｏＳｔｉｃｋ［０］．ｓｔａｔｕｓにはＥＸ
ＴＥＮＤＥＤを格納する（新規登録でもＥＸＴＥＮＤＥ
Ｄを使う。理由は後述する）。

【００８６】ｙ＝４のラインのスキャンで見つかった部
分画素列は今度は、既にある棒状物体候補とつながる。
つながるかどうかの判断は、棒状物体候補の最後のライ
ンの部分画素列と新たな部分画素列のｘ方向の位置関係
で決める。この場合はｉｎｆｏＳｔｉｃｋ［０］．ｘｓｔａｒｔ［０］＝６ｉｎｆｏＳｔｉｃｋ［０］．ｘｅｎｄ［０］＝６であり、新たな部分画素列のｘ座標は５〜７なので、こ
れらはつながっていると判断する。すると、新たな部分
画素列につながっていると判断された棒状物体候補の情
報を更新する（２３７）。

【００８７】新たな部分画素列の（ｘ方向の）位置を下
式で代入し、ｉｎｆｏＳｔｉｃｋ［０］．ｘｓｔａｒｔ［１］＝５ｉｎｆｏＳｔｉｃｋ［０］．ｘｅｎｄ［１］＝７棒状物体候補の長さを１増やす。ｉｎｆｏＳｔｉｃｋ［０］．ｌｅｎｇｔｈ＝２さらに、ｙ＝５のラインで見つかった部分画素列を先の
棒状物体候補にさらにつなげると、２３８のようにな
る。ここでｄを３とすると、２２７の条件式が成り立
ち、棒状物体が決定され、次の処理へ移る（２２８）。
この条件が満たされるまで繰り返され、条件が満たされ
る前に１画面分のスキャンが終了してしまったら、棒状
物体は検出できなかったことになる。

【００８８】上の説明では、ｉｎｆｏＳｔｉｃｋ
［ｎ］．ｓｔａｔｕｓの使い方の説明が不十分なので、
次にこれについて説明する。これは、ＳＴＩＣＫ、ＮＯ
ＳＴＩＣＫ、ＥＸＴＥＮＤＥＤの３つの値を取りうる。
ＮＯＳＴＩＣＫは、その構造体が棒状物体候補でないこ
とを表す（つまり、一番はじめは全ての構造体のｓｔａ
ｔｕｓメンバーはＮＯＳＴＩＣＫになっている）。

【００８９】ＳＴＩＣＫはその構造体が棒状物体候補で
あることを表す。ＥＸＴＥＮＤＥＤの場合も棒状物体候
補であるがこの値の用い方は少し異なる。新たな水平ラ
インのスキャンを始めるとき、全ての棒状物体候補はＳ
ＴＩＣＫを持つ。１ラインのスキャンの中で新たに見つ
けられた部分画素列とつながった棒状物体候補はＥＸＴ
ＥＮＤＥＤに変わる。１ラインのスキャンが終了したと
き、まだＳＴＩＣＫになったままの棒状物体候補は、そ
のライン上のどの部分画素列ともつながっていないこと
になり、棒状物体候補でなくなったと考える。

【００９０】従って、１ラインのスキャンが終わると、
ＳＴＩＣＫになったままの棒状物体候補はＮＯＳＴＩＣ
Ｋに変え、ＥＸＴＥＮＤＥＤを持つ棒状物体候補だけに
再びＳＴＩＣＫを与える。この処理により図１６の２３
９のように、浮いた部分画素列（ノイズである場合も考
えられる）は、いったんは棒状物体候補としてｉｎｆｏ
Ｓｔｉｃｋ［０］に登録されるが（３４）、画素列がと
ぎれた時点で棒状物体候補から外される（３５、実際に
は２２２の処理で削除される）。本来の指先部分はｉｎ
ｆｏＳｔｉｃｋ［１］で登録されている。棒状物体候補
から外すためにｓｔａｔｕｓをＮＯＳＴＩＣＫに変えて
いるだけである。

【００９１】これで次のスキャン時の２２４での判断時
には、ＳＴＩＣＫを持つ構造体だけを見るので、ＮＯＳ
ＴＩＣＫになった構造体は無視される。またこのように
一度使われた構造体も、ＮＯＳＴＩＣＫになれば、再び
新規棒状物体の登録に用いることができメモリを節約で
きる。このような処理を行うことでノイズから受ける影
響を少なくすることができる。

【００９２】２２４においては、ＳＴＩＣＫを持つ構造
体に対してだけ、つながるかどうかの判断を行う。ま
た、新規棒状物体候補を登録するときにはＮＯＳＴＩＣ
Ｋを持つ構造体を探し、そこに新しい情報を格納する。

【００９３】図１４は棒状物体先端切り出し部、および
重心検出部の処理を表す。図１３の２２７での条件が満
たされると、図１４の２２９に処理が移る。２３０で
は、棒状物体の先端を切り出すためのパラメータＴＨを
求めている。このしきい値は固定でも良いが、２３０の
ように棒状物体の先端部の大きさや画素値によって決め
ても良い。ここで挙げた式を用いると、指の太さが違っ
たり、距離が違ったりして、画素値が変動しても、切り
出した先端部の縦横方向の長さの差がそれ程大きくなら
ない。棒の太さ（１ラインの画素値合計。０ライン目は
先端なので太さを表さないことが多いので計算から除
く）と一画素の最大値との比を求めて、ＴＨ（切り出し
部分の全画素値合計）と最大画素値の比がこれの２乗に
なるようにしている。これ以外の計算方法でＴＨを求め
ることも可能である。

【００９４】２３１では、２３０で求められたＴＨを用
いて、［数１］で述べたａ、ｋを求める。［数１］では
矩形領域で計算しているが、ここでは、各ラインの部分
画素列だけを用いて計算している。これにより、矩形内
の棒状物体と関係のないところにノイズがあるような場
合の影響を小さくできる（例えば図１７のように指が斜
め方向を向いているとき、２４４のようなノイズの影響
を受けない）。２３１で求めたａをｋライン目の各画素
値に乗ずる。２３０から２３２までの処理が棒状物体先
端切り出し部である。ａ、ｋと修正された画素値を用い
て、２３３において重心を計算する。

【００９５】基本的には、ｋライン目までの部分画素列
の中の、各画素値とｘ座標の積を全て足してＴＨ（これ
は各画素値の合計に等しい）で割ったものが重心のｘ座
標であり、各画素値とｙ座標の積を全て足してＴＨ（こ
れは各画素値の合計に等しい）で割ったものが重心のｙ
座標である。ここでは、ｘｓｕｍ［ｉ］が分かっている
ので、これにｙ座標（ｉｎｆｏＳｔｉｃｋ［ｎ］．ｙｓ
ｔａｒｔ＋ｉ）を掛けたものの積をＴＨで割って重心の
ｙ座標を求めている（もちろん、ｘｓｕｍ［ｋ］は修正
された画素値で再計算される）。ｘｐｓｕｍ［ｉ］はｉ
ライン目の部分画素列の各画素値とそのｘ座標の積を全
て足したものであり、２３３に示した式で重心のｘ座標
が求められる。

【００９６】これまでは、指先をセンサ受光系の光軸に
垂直な方向に伸ばしたときの画像と、その処理方法につ
いて述べた。実際の使用においては指をセンサの光軸方
向に向けることも少なくない。次に、センサに向かって
のされた指先の位置を求める方法について述べる。

【００９７】光軸方向に（センサに向かって）指を伸ば
した場合の反射光画像は図１８のようになる。指先に相
当する部分の画素値が急激に大きくなっている。この図
でも、色が黒いほど画素値が大きいとする。ここで、画
素値の極大点だけを見つけて、これをポインティング位
置としてもよい。このための演算処理は非常に簡単であ
る。しかし、この方法だと、画像の解像度以上の精度で
指先位置を求めることはできない。先の上方へ（光軸方
向に垂直な方向へ）指を伸ばした場合と同様に、画像の
解像度以上で指先位置を求める方法について述べる。

【００９８】まず、画素値が最も大きい点を見つける。
これは画素値の比較だけなので簡単にできる。そして、
この画素の近傍小領域をΓとしたとき、指先位置の座標
を次式で決定する。

【数５】これは、小領域における画素の重心と考えてよい。近傍
小領域Γとしては、３×３とか５×５とかの矩形領域に
設定するのが一般的であるが、これに限らない。もちろ
ん矩形でなくてもよい。このような式を用いることによ
って、画素の最大点だけでなくその周辺の画素を考慮す
ることになる。指先位置が微妙に変化した状態を考えて
みる（図１９（ａ）→図１９（ｂ））。太線で囲まれた
部分が小領域Γである。変化が微少であるので、最大点
２４６の座標は変わらない。

【００９９】しかし、その周辺画素の画素値が、例えば
一方の側が周辺画素の値が少し大きくなり（２４７）、
もう一方が少し小さくなる（２４８）、というように変
化する。この変化は上式を用いることによって反映さ
れ、×印で示した重心位置がわずかに変化しているよう
に、反射光画像の解像度以上の指先位置検出が可能とな
る。

【０１００】この位置を計算する式は、上に示したもの
に限らない。例えば次式のようなものも使える。

【数６】ここで、Ｐｍｉｎは小領域Γにおける、最小画素値であ
る。これによる効果は次のようなものである。

【０１０１】指先が動いて反射光画像の一部分が図２０
（ａ）〜（ｃ）のように変化したとする。太線で囲まれ
た領域が小領域Γである。小領域の中の×印は［数５］
によって計算された重心位置である。

【０１０２】図２０（ａ）から図２０（ｂ）の変化にお
いては、指先が少し向かって右の方へ動いている。これ
にしたがって画素２４９の値が少し小さくなり、画素２
５０の値が少し大きくなった。重心位置（×印）は、や
や右方向に移動した。この場合には指の移動に従って重
心位置も変化している。

【０１０３】図２０（ｂ）から図２０（ｃ）の変化にお
いては、最大画素の座標が変わるので、小領域Γの位置
が変わっている。いま最大画素位置が変わる直前直後の
状態を考えてみる。この時、図２０（ｂ）における、画
素２４９と画素２５０はその値はほとんど同じである。

【０１０４】それにもかかわらず［数５］を用いた場合
は、その周りの画素の重みで、重心位置は画素２４９と
２５０の中点よりも、中心側（左側）にずれる。

【０１０５】一方、最大画素位置が変わった直後も、画
素２４９と２５０の値はほとんど同じであるが、やはり
周りの画素の重みで、重心位置は中心側（右側）にずれ
る。このことは、最大画素位置が変わる前後において、
重心位置が滑らかに移動しないことを表す。

【０１０６】別の言い方をすると、画素２４９と２５０
のちょうど中点のあたりをポイントすることが難しいと
いうことになる。［数６］を用いた場合は、小領域内の
全画素からその小領域内の最小画素値を引いているた
め、周辺画素による影響が少なく、最大画素位置が変化
する直前直後においては、重心位置は、この２つの点の
中点付近に存在するようになる。

【０１０７】ポインティング位置計算においてどちらの
式を用いるかは、一画素の占める領域の大きさと指の大
きさの関係、求められるポインティング位置の精度、な
どによって決定される。一画素の占める領域が小さい場
合（反射光画像の解像度が比較的高いとき）、あるいは
要求精度が低い場合は、重心計算はそれほど重要ではな
い。

【０１０８】また、ポインティング位置にヒステリシス
特性を持たせることによって、より良好にポインティン
グが行えるようにすることも出来る。例えば、小数点以
下第２位を四捨五入して０．１画素単位で（この画素は
反射光画像の画素）ポインティング位置を求める場合、
１０．０５近くの座標値が得られる場合、四捨五入によ
って１０．０と１０．１の値が不安定に交互に現れてし
まう。

【０１０９】カーソルを表示したときはそのカーソルが
ばたついてしまう。計算された座標値の変化が小さい場
合は、大きくなるときは少数点以下第２位が０．０７を
越えたとき、０．１増加させ、小さくなっているときは
少数点以下第２位が０．０３を割ったとき、０．１減少
させる、といったヒステリシス特性を持たせることによ
って、不安定にポインティング座標が求められてしまう
のを防ぐことが出来る。

【０１１０】小領域内の画素値の最大値が、指先の距離
を反映しているので、これを用いて３次元ポインティン
グを行うことが可能である。また先の例のように、指で
押すという動作を奥行き方向の動きとして捕らえれば、
クリックを実現することが出来る。

【０１１１】以上で、指が上方（受光系の光軸と垂直な
方向）に伸びているときと手前（受光系の方）に伸びて
いるときの２つの場合について、指先位置を反射光画像
の解像度より高い精度で検出する方法について説明し
た。実際の使用においては、指の伸びる方向はどちらか
に決められないことが多い。使う人によって指を伸ばす
向きが異なるし、また同じ人が使っていても場合によっ
て向きが変わってしまうことはよくある。

【０１１２】従って、いま指がどちらに向かって伸びて
いるのかを判断して、それに応じた検出方法を用いるこ
とによって、どちらの方向を指が向いていても指先位置
を安定して求められるようになる。

【０１１３】以上で求められた指先位置を使って、画面
のカーソルを制御する。指先位置と画面内のカーソル位
置を対応づけておけば、指を差し出したときその場所に
対応した場所にカーソルが表示される。また指を動かせ
ばカーソルも動く。指を引っ込めれば、カーソルは消え
る。ただこれだけでは、マウスのボタンに対応するもの
がない。

【０１１４】マウスのボタンを押す（クリックする）代
わりにここでは、カーソルを静止させる。図２１の構成
でこれらを実現することができる。指先位置検出手段２
５１はこれまでに説明してきたように、反射光画像の解
像度より高い精度で指先の位置を求める。カーソル位置
決定手段２５２は、この指位置をもとにカーソルを表示
する位置を決定する。一番単純な方法は、指先位置とカ
ーソル位置を１対１に対応させるものである。

【０１１５】しかし、求められた指先位置には、ノイズ
が含まれていたり、人の手の微少な振動が含まれるの
で、単純に指先位置からカーソル位置を一意に決めてし
まうと、カーソルが微少に振動してしまう。微少振動し
ない程度に量子化してしまうこともできるが、その場合
精度が落ちてしまう。過去数フレームにおける指先位置
を用いて、ローパスフィルタをかけると、微少な振動が
抑えられる。

【０１１６】例えば、最新の指先位置を（ｘ０，ｙ０）
として、ｎフレーム前の指先位置を（ｘｎ，ｙｎ）とす
ると、

【数７】によって、カーソル位置（ｘ，ｙ）を決定する。ここで
ｋは何フレーム前までの指先位置を考慮に入れるかを表
し、これが大きすぎると、指の動きに対してカーソルの
動きが遅れて反応するようになる。またａｉは過去の各
位置に対する重みづけである。

【０１１７】また、ある時点でカーソル位置を決定した
後、新しい位置が元の位置からある決められた距離以上
離れるまでは、元の位置を静止させたままにしておく、
という処理も考えられる。これによって、微少な変動が
あってもカーソル位置は全く変化せず、指を大きく動か
したときだけカーソルが動く。

【０１１８】また、微少に変動するときは動く方向が定
まらないことを利用して、同一方向にある回数以上動く
まではカーソルを静止させておき、それ以上同じ方向に
変化したら、カーソル位置を更新する、という方法もあ
る。

【０１１９】カーソル表示部２５３は、カーソル位置決
定手段２５２によって決められたカーソル位置に従っ
て、画面上にカーソルを表示する。カーソル静止状態検
出手段は、カーソル位置の時間的な変化を監視してお
り、決められた時間以上静止状態にある（あるいは動き
が少ない）ことを検出したら、クリック信号２５５を発
生させる。この構成により、指先でカーソルを動かし、
静止させることによってクリック動作をさせることがで
きる。

【０１２０】マウスなどを用いる場合は、クリック動作
はボタンを押すなどして操作者が明示的に行う。しか
し、カーソルを静止させることによりクリック信号が発
生するようにすると、操作者が気付かない間にクリック
していることもある。このことが不都合を生じる場合も
ある。カーソル表示部がクリック信号の発生を監視して
いて、クリック信号があったときカーソルの形状を変化
させるようにすると、操作者にクリックが起こったこと
をフィードバックすることができる。

【０１２１】プルダウンメニューの中から１つを選択す
る作業を考えてみる。まず指を差し出すことでカーソル
が現れるので、まず操作者は指を動かして、カーソルを
メニューの項目の所へ動かす。カーソルをメニュー項目
の上に移動させて一定時間静止させると、プルダウンメ
ニューが現れる。ここでさらに指を下方に動かすと、メ
ニューを反転させながらカーソルが動く。希望のメニュ
ーの所でまたカーソルを静止させると、そのメニューコ
マンドが起動される。マウスなどを用いるときはマウス
を操作していないときは常にカーソルは静止しているた
め、この方法では誤操作が多いように一見思えるかもし
れない。

【０１２２】しかし、本実施例においては、指を差し出
してないときはカーソルは現れていないし、指を出すと
きは「あのメニューを選択しよう」等目的を持っている
ため、目標の場所にカーソルが到達する前にカーソルが
静止することはあまりない。従って、本実施例において
は、カーソルを静止させることでクリック動作を代用す
ることは自然である。

【０１２３】上の例では指先の画像から、その先端部分
を切り出し、その重心を求めただけであった。これによ
り２次元的なポインティング、例えば、コンピュータ画
面上のポインティングが実現できた。ここでは、さらに
奥行き方向の動き（受光系に近づく／遠ざかる）を反映
した特徴量を捕らえ、２次元情報＋αあるいは３次元情
報を入力することができる。

【０１２４】例えば、奥行き方向の動きを監視してお
き、ボタンを押すように、「少し近づいて少し戻る」と
いう動きを検出した場合に、マウスのクリックに対応す
る信号を発生させることができる。これにより、指でカ
ーソルを動かし、「押す」動作をすることで、メニュー
を選択をさせたりすることができる。また、厳密に指ま
での距離を入力することはできないが、相対的に「近づ
いた」「遠ざかった」という検出はできるので、表示で
のフィードバックと組み合わせれば３次元位置情報を入
力することができる。

【０１２５】指が上方に伸びている場合、指が奥行き方
向に動くと、指からの反射光を受光している受光素子の
受光量が増減する。また１つの受光素子の出力だけでな
く、指の占める画素の数も増える。近づいてくると、伸
ばした指の幅が、例えば1.5画素分→２画素分というよ
うに大きくなる。先の実施例で、棒状物体検出をする際
に、水平ラインを走査し、同じ位置に部分画素があるラ
インが続いたとき、棒状物体があると判定した。ここで
１ラインでの部分画素の画素値合計が距離に対応する量
として利用できる。

【０１２６】指が手前に伸びている場合は、前述の小領
域Γの中の画素値合計が、距離に対応する量として用い
ることができる。

【０１２７】また、距離情報を抽出するだけでなく、適
切な小領域の大きさを決定するための情報として利用す
ることができる。例えば、小領域Γに対して、指先が大
きすぎる場合、小領域Γの中のすべての画素が同じ程度
に高い値を持つ。このような場合、最大点の候補がたく
さんあり、最大点位置が安定的に求まらないため、小領
域を大きくする。

【０１２８】また、このような場合、最大点を単純に小
領域Γの中心にするのではなく、ある値以上の画素の固
まりの中心をΓの中心と一致させ、ある値よりも小さい
画素が周辺に入る程度にΓのサイズを大きくする。

【０１２９】「押す」だけでなく、様々な指先のジェス
チャーをコマンドとして利用することも効果的である。
図２２の構成により、操作者の指の動きを認識して入力
情報として利用することができる。例えばあるアイコン
の上にカーソルを移動させて、チェックマークの形
「〓」に指を動かすと、そのアイコンに関連づけられた
コマンドが起動する、円を描くとその中のオブジェクト
が選択される等、といった具合に利用することができ
る。カーソルまたは指先位置動き検出手段２５６が、指
先あるいはカーソルの動きを監視しており、あらかじめ
登録された動きが合った場合にそれに対応するコマンド
やクリック信号２５７を出力する。

【０１３０】カーソル位置とボタンの状態とを関連づけ
て、入力情報とする実施例について説明する。例えば、
指を動かしてカーソルをあるメニューの上に動かしたと
ころで、ボタンを押すとメニューが選択される、また
は、あるアイコンの上でボタンを押したまま、さらに指
を動かすとアイコンを移動できるなど、マウスのボタン
の同じように用いてクリックやドラッグなどの操作がで
きるようになる。ボタンは操作者の画面を差している手
と反対の手で押しやすい所に配置されているのが望まし
い。

【０１３１】これにより、指を静止させたり、「押す」
動作をさせるよりは、高速にクリック操作などをするこ
とができる。また、操作したという確実な実感を操作者
に与えることもできる。これは、両手が自由に使えるよ
うな場合に有効である。逆に腕時計型の超小型携帯情報
機器を左腕に装着して右手でカーソル操作したり、小型
の携帯端末を左手に持って右手でカーソル操作するよう
な場合は、片手でクリック操作ができる方が望ましい。（実施例２の効果）第２の実施例によれば、装着物なし
にポインティングが行えるので、ユーザへの負担を大き
く軽減できる。

【０１３２】（実施例３）第３の実施例は手振りなどを
簡易に認識するジェスチャカメラとそれを３次元空間で
のポインティングデバイスとして応用した場合の実施例
である。以下、図面に沿って本実施例の動作について説
明する。

【０１３３】図２３は図１の特徴情報生成手段の第３の
実施例における概略構成を示したものである。反射光抽
出手段が抽出した距離情報を、例えば、図２４のよう
に、Ｎ×Ｎの行列の形式で記憶する距離画像記憶手段３
３１と、形状記憶手段３３２に記憶された形状解釈規則
をもとに、距離画像記憶手段３３１に記憶された距離行
列の形状を解釈する形状解釈手段３３２とから構成され
ている。

【０１３４】図２５は、図２３の構成での、特徴情報生
成手段における形状認識処理の流れを示す。

【０１３５】まず、反射光抽出手段１０２で、抽出され
た距離画像は、例えば、２５６階調で距離画像記憶手段
３３１に書き込まれる（ステップ４０１）。

【０１３６】書き込まれた距離画像は、例えば、図２４
のようなＮ×Ｎ（Ｎは例えば、１６）の行列として、形
状解釈手段３３３に読み込まれる（ステップ４０２）。

【０１３７】形状解釈手段３３３では、あらかじめ設定
されている閾値を元に、読みとった閾値に達しているセ
ルのみを距離行列より、抽出する処理を行う（ステップ
４０３）。さらに、ステップ４０４でのマッチングに必
要な処理もここで行う。マッチングの手法にはいろいろ
ある。例えば、画像からベクトルを抽出するベクトル化
とか形状モデルに基づいた形状の変形状態の抽出とか、
走査線上の距離値に基づいたスペクトル解析などであ
る。

【０１３８】ここでは、説明を容易にするために、形状
を矩形に分割し、その矩形をもとに、マッチングを行う
方法で、動作を説明する。

【０１３９】例えば、図２４（ａ），図２４（ｂ），図
２４（ｃ）はそれぞれ、人差し指を上向きに、右向き
に、斜め上向きに向けた時の距離画像である。この距離
画像に対し、最も強度の強いセル（図中では、色が濃い
ほど強度が強い）の中点を結んで、矩形を作る。その結
果は、図２４（ａ），図２４（ｂ），図２４（ｃ）に対
して、それぞれ図２４（ｄ），図２４（ｅ），図２４
（ｆ）のようになる。

【０１４０】その結果、作成された正規化された距離行
列をもとに、ここでは例えば、図２４（ｄ），図２４
（ｅ），図２４（ｆ）のように、矩形に切り出され、ス
テップ４０４にて、形状記憶手段３３２に記憶されてい
る形状とのマッチングを行う。

【０１４１】図２６は形状記憶手段３３２に記憶されて
いる形状解釈規則の一例である。例えば、図２４
（ａ）、図２４（ｂ），図２４（ｃ）では、矩形は一つ
であるので、最初の規則１にマッチする。規則１のマッ
チング結果は、ポインティングであるので、次にポイン
ティング規則に対して、マッチングを行う。ポインティ
ング規則では、まず縦横チェックを行う。

【０１４２】図２４（ａ）では、縦／横が１より大きい
という規則にマッチする。その結果、傾きチェック２に
行く。傾きチェック２では、傾きがほぼ０であり、距離
の近い部分（色の濃い部分）が上方にある、つまり、重
心が上にあるので、最初の規則にマッチし、その結果、
上方に旋回という指示という結果になる。適合した形状
があれば、その形状に対応した指示を出力する（ステッ
プ４０５）。

【０１４３】もし、適合する形状がなければ、閾値を変
更して（ステップ４０６）、再度、マッチング処理をや
り直す。

【０１４４】３次元空間でのポインティングデバイスと
して用いる場合には、奥行き座標が必要である。図２７
は、３次元ポインティングデバイスとして、指を用いる
ときの距離行列を示している。図２７（ａ）は、人差し
指がのび、他の指は曲がっている状態図２７（ａ）と図
２７（ｂ）は手振りとしては、同一であるが、最も近傍
の部分の距離が図２７（ａ）より図２７（ｂ）の方が近
づいている。図２６の形状解釈規則から、図２７
（ａ），図２７（ｂ）ともに、規則１にマッチし、さら
に、縦横チェックで、縦／横はほとんど１であるので、
最初の規則にマッチする。ここで、オブジェクト選定／
前進となっている。

【０１４５】２次元空間では、画面に向かって、さらに
前進することはできないので、オブジェクト選定が指示
となる。オブジェクト選定は、例えば、図２７（ａ）か
ら図２７（ｂ）への遷移時間が一定以上であれば、カー
ソルがあるオブジェクトが選定されたと解釈する。

【０１４６】３次元空間の場合は、奥行き方向への前進
が可能であるので、オブジェクト選定あるいは、前進が
指示となる。オブジェクト選定の場合は、２次元の場合
と同様に、図２７（ａ）から図２７（ｂ）への遷移時間
で判定する。

【０１４７】一方、前進の場合には、図２７（ａ）から
図２７（ｂ）で、距離が近づいているので、前進速度を
速くするなどの調整を行うことがきでる。あるいは、図
２７（ａ）の状態では、実際の前進は行わず、次の手振
りが図２７（ｂ）であったときに、その近づいた距離分
だけ前進するようにする。そのようにすれば、実際に視
点が指先にあるように、視点を制御できるので、自然な
操作を行える。

【０１４８】（実施例３の効果）従来は、データグロー
ブなど特殊な装置を装着しないと実現できなかった手振
りの認識を容易に実現できる。また、従来の画像処理で
は、手の画像の切り出しが難しく認識が難しかったが、
本装置によれば、切り出しが不要であるので、手振りの
認識精度が上がるだけでなく、処理速度も大幅にアップ
する。処理は秒３０回以上の処理が可能であることが、
実験的に確認されている。これは、応答速度が理想とさ
れるヒューマンインタフェースの条件である０．１秒を
切っている。したがって、真に自然な操作を容易に行う
ことができるので、その効果は、絶大である。

【０１４９】（実施例３の変形例１）図２６の形状解釈
規則は、あくまでも一例にすぎず、種々の変形が可能で
ある。また、マッチングも簡単のために、矩形に分割す
る方法を示しているが、これも一例にすぎない。マッチ
ング方法にあわせて、形状解釈規則も変わる。また、形
状解釈の結果も対象となるアプリケーションにあわせて
変わる。

【０１５０】また、実施例中で説明のために用いている
距離行列は１６×１６であるが、これも、この配列に限
定されるものではない。稠密に受光素子を配置できれ
ば、例えば、６４×６４，あるいは２５６×２５６とい
うような配列も可能である。行列の精度が高くなること
に従い、マッチング方法も、形状解釈規則も変化するこ
とはいうまでもない。

【０１５１】（実施例３の変形例２）また、実施例で
は、手振り認識を３次元空間での指示など計算機への入
力手段として、紹介しているが、必ずしも、これに限定
されるものではない。例えば、テレビや照明器具などの
電源入／切の指示手段として利用することも可能であ
る。そのような場合、本来指示でないものまで、誤って
認識する恐れがある。誤って指示されることを防ぐため
に、複数の形状の組み合わせにより、指示入力とする。
例えば、手を開いた状態と閉じた状態を交互に行うなど
である。

【０１５２】例えば、図２８（ａ），図２８（ｂ），図
２８（ｃ）は、二本指、握り拳、五本指での手振りの時
の距離画像の例である。この図２８（ａ），図２８
（ｂ），図２８（ｃ）をこの順でやると、例えば、電源
がはいり、逆に図２８（ｃ），図２８（ｂ），図２８
（ａ）とやると電源が切れるというようにしておく。こ
のようにしておけば、本装置の前で、手や人間が動いた
りしても、誤って認識して、電源が切れたりすることを
防ぐことができる。

【０１５３】この様に複数のジェスチャの組み合わせで
指示を与える場合の形状解釈手段３の形状解釈規則は例
えば、図２９のようになる。ここでは、簡単のために電
源の入／切の場合に特化した解釈を想定している。矩形
の数だけでは、１本指なのか、握り拳なのかの判断は付
かない。ここでは、面積が閾値αを大幅に越えたときに
握り拳であると判定している。

【０１５４】このように複数のジェスチャを組み合わせ
ることにより、特別な道具を必要とせず、かつ誤動作な
く、照明器具の電源のオン／オフなどの操作を容易にか
つ自然に実現することができる。また、照明器具やＴＶ
などの家電機器のスイッチのオン／オフ以外にも、銀行
のキャッシュディスペンサ（ＡＴＭ）や、駅の自動券売
機などの入力デバイスとしての応用も可能である。

【０１５５】（実施例３の変形例３）実施例３では、手
の形状を解釈する場合を説明しているが、必ずしも、こ
れに限定されるものではない。例えば、顔の向きを認識
して、視点情報を制御することも可能である。

【０１５６】図３０は、画面に対して、顔の向き（つま
り視点の向き）が変化する場合の概略を示すため、画面
と画面に対している人間と、画面の中にある３次元物体
（円柱、四角錐、球）を真上から見た図である。視点
１、２、３は画面に対して、人の顔が向いている向きを
示している。

【０１５７】視点１は画面に対して、正面に向いてい
る。視点２は画面に対して、右向き（左頬が画面に近く
なるような向き）になっている。視点３は画面に対し
て、左向き（右頬が画面に近くなるような向き）になっ
ている。実際に、これらの視点から見える３次元物体
は、図３１のようになる。つまり、視点１では、３つの
物体がすべて見えているが、視点２では、左端にある円
柱がかけている。これに対し、視点３では、右端にある
球が全く見えない状態である。

【０１５８】このような視点の変更を行うのに、指を使
ってやる方法もある。たとえば、指を画面に対して、垂
直に向けた状態（図２７（ａ））を、視点１の指示とす
る、指を画面に対して、右に向けた状態（図２４
（ｂ））を、視点２の指示とする、というようにであ
る。このような手により視点を制御するときの問題は、
現実世界の視点の制御と大きく操作性が異なるという点
である。

【０１５９】現実世界では、右を向けば、右の方にある
物体を見、左に向けば左の方の物体を見ることができる
というように、顔の向きで視点を制御している（誰も制
御するなどと大袈裟なことをしているとは、認識してい
ないが）。指は見えている物体のなかの特定のものを指
示するときに使用するのであって、視点を変えたりする
のに使っていない。この点、従来のＶＲ技術で用いる、
データグローブやスペースマウスなどは自然な操作感を
実現できないという問題があった。

【０１６０】この実施例３の変形例３は、その自然な操
作感を実現するものである。図３２は顔の向きを本画像
入力生成装置によって取得したときの距離画像の例であ
る。図３２（ａ）は視点１の顔が正面を向いている状
態、図３２（ｂ）は視点２の顔が右を向いている状態、
図３２（ｃ）が顔が左を向いている状態である。図３２
（ｄ），図３２（ｅ），図３２（ｆ）はそれぞれから矩
形を切り出した図である。

【０１６１】ここでは、顔全体にあたる矩形と、鼻にあ
たる矩形を切り出すために、最も遠いセル（濃度の薄い
セル、顔全体にあたる）と、最も近いセル（濃度の濃い
セル、鼻にあたる）、およびその上方に一手段だけある
距離の遠いセル（濃度の薄いセル、目にあたる）を用い
て、３つの矩形を作りだしている。

【０１６２】図３３は、動体視差のための形状解釈規則
の一例である。ここでは、簡単のために、顔の向きの認
識だけに特化した解釈規則の一例を示している。規則１
は、顔と鼻にあたる２つの矩形が切り出されているかを
チェックしている。ない場合は、規則２で、ここでは特
に何の処理も行わない（ＮＵＬＬ）。

【０１６３】２つの矩形があった場合には、顔チェック
の規則で、大きい矩形が遠くにあり、小さい矩形が近く
にあるという関係になっているかをチェックする。なっ
ていなければ、顔以外のものが写っていると解釈して、
ここでは特に何の処理も行わない（ＮＵＬＬ）。２つの
矩形が正しい関係にあったとき、初めて、視点方向の算
出を行う。算出式は以下のようである。

【数８】Ｌが０の場合は、左向き９０度で鼻が一番左端にきてい
るという解釈なので、ここでは、−９０度となる。正面
を向いているときは、ＬとＲは等しいので、分子は０に
なり、視点方向は０度になる。ＬがＲより大きければ、
それだけ右向きになっていく。Ｒ＝０で９０度となり。
鼻が一番右にきている状態であり、顔が完全に右向きに
なっている。

【０１６４】この変形例では、左右の視点移動について
述べたが、同様にして、上からのぞき込んだような視点
や下から見上げるような視点制御も可能である。この場
合は、顔に対する鼻の上下の位置をとればよい。

【０１６５】以上のような解釈により、顔の向きに応じ
た視点変更が可能になり、自然な操作が実現できる。本
画像入力生成装置が小型になれば、携帯情報機器の入力
デバイスととして用いることができる。この様な場合に
は、顔に対して、携帯情報端末の位置を変更することが
できる（図３４）。

【０１６６】顔を動かす代わりに端末の方を手で動かし
ても、視点１、２、３の顔の向きは図３２のようになる
ので、図３１にあるような、視点制御を行うことができ
る。上下方向に関しても同様である。このようにすれ
ば、真の動体視差が実現できる。つまり、ユーザはあた
かも大きな３次元空間を携帯情報端末の画面というウイ
ンドウを通してみるという、真に直接的な操作感を実現
できる。

【０１６７】（実施例４）第３の実施例は、形状を認識
することで、計算機に対する指示に変換するものであ
る。電源をいれたり、切ったりなどの操作をするには便
利である。しかし、アニメーションでキャラクタに動き
をつけたり、動く速さを変えたりするような操作をする
には残念ながら不向きである。形状の認識だけでやろう
とすると、例えば、速さを調整するスライダーなどを操
作する形式になり、直接に動きを制御することができな
い。

【０１６８】この実施例４はこの問題を解決するため
に、動き（モーション）の入力ができるようにしたもの
である。以下、図面に沿って本発明の動作について説明
する。図３５は第４の実施例における特徴情報生成手段
の概略構成図である。図２３の形状解釈手段３３３の代
わりに、画像変化抽出手段３４３が、形状記憶手段３３
２の代わりに比較位置記憶手段３４２がある形になって
いる。

【０１６９】比較位置手段３４２には、動きベクトルを
算出するために、比較したい現在より以前の位置、例え
ば、Ｍフレーム前の重心点、あるいは最近点など画像変
化抽出手段３４３により算出された位置を格納してい
る。

【０１７０】画像変化抽出手段３４３は、距離行列を解
析して、例えば、重心点、最近点などの変化などによ
り、動きベクトルを抽出するものである。重心点や最近
点などの算出に関しては、手振りの微動による誤差をＭ
フレーム分の平均をとることで相殺する。つまり、第ｉ
番目のフレームにおける重心点（Ｘｎ，Ｙｎ）は、

【数９】その処理の流れは、図３６のようになっている。まず、
処理に先立って、ステップ９０１で、比較位置記憶手段
３４２の内容を初期化して、空にする。次に、距離画像
を記憶に格納する（ステップ９０２）。この距離行列を
読み出し（ステップ９０３）、例えば、重心点を算出す
る（ステップ９０４）。重心点の算出は例えば以下のよ
うにする。

【０１７１】第１回目は、重心点（Ｘｎ−１，Ｙｎ−
１）が比較位置記憶手段３４２に記憶されていないので
（ステップ９０５）、まず、比較位置記憶手段３４２に
格納する（ステップ９０７）。

【０１７２】次に重心点（Ｘｎ，Ｙｎ）を算出したとき
には、比較位置記憶手段３４２には、Ｍフレーム前の
（Ｘｎ−１，Ｙｎ−１）が記憶されている。（Ｘｎ−
１，Ｙｎ−１）から（Ｘｎ，Ｙｎ）までに変化するのに
要した時間はＭ・１／３０＝Ｍ／３０秒である。従っ
て、変化分（（Ｘｎ，Ｙｎ）−（Ｘｎ−１，Ｙｎ−
１））をこの時間で割ったものが動きベクトルなる。そ
の結果は、以下のようである。

【数１０】抽出された動きベクトルを使って、アニメーションに動
きをつける例を説明する。図３７の左側の人形のキャラ
クタの例えば、両手の位置を動かすと右側のようにな
る。動きベクトルｖの値が大きければ、動きが速くなる
ので、人形の手の動きが大きくなり、激しい動きとな
る。逆に値が小さければ、動きは遅くなり、ゆるやかな
動きになる。

【０１７３】上の例では、画像変化抽出手段３４３が動
きベクトルを算出する例を述べたが、必ずしもこれに限
定される訳ではない。これ以外に、動きベクトルから、
振れ幅のみ、あるいは速度のみ、さらには角度を算出す
ることも可能である。この場合は、たとえば、図３６の
処理の流れのステップ９０６をステップ９０８、あるい
はステップ９０９、９１０でおきかえればよい。

【０１７４】たとえば、Ｘ方向の変化量を振れ幅として
抽出し、Ｙ方向の動きを速度として、図３８にあるよう
に、振れ幅で人形の位置を制御し、速度で人形の動く速
さを制御するということも可能である。あるいは、指の
振り角により、人形の首振りの角度を制御することも可
能である。この場合には、単に重心を取るだけでは、正
確に重心がとれない。

【０１７５】つまり、図３９（ａ）にあるように、ｔ時
のときの指と、そこから振った（ｔ＋１）時の時の指で
は、指の支点がずれるので、角度は実際の角度のより大
きくなってしまう。多少、実際の指のふれよりも大袈裟
な動作になってもよい場合には、この振り角をそのまま
使うのでも問題ない。が、細かい動きなどをつけたいと
きには、不便である。

【０１７６】これを防ぐためには、図３９（ｂ）にある
ようにｔ時の指と（ｔ＋１）時の指の支点を一致させ、
その上で、重心を算出せねばならない。具体的には、ｔ
時の指の支点を（Ｘｓｔ，Ｙｓｔ）、重心を（Ｘｂｔ，
Ｙｂｔ）とし、（ｔ＋１）時の指の支点（Ｘｓｔ＋１，
Ｙｓｔ＋１）、重心（Ｘｂｔ＋１，Ｙｂｔ＋１）とす
る。ｔ時の指の支点で、（ｔ＋１）時の指の支点と重心
を補正したものをそれぞれ（Ｘ’ｓｔ＋１，Ｙ’ｓｔ＋
１），（Ｘ’ｂｔ＋１，Ｙ’ｂｔ＋１）とすると、次の
ようになる。

【数１１】これらを使って振り角を求めると、次のようになる。

【数１２】このようにして求めた振り角を使えば、例えば図４０の
ように、腕の肘から下の部分と脚の膝から下の部分を、
この振り角で振り、歩くモーションを任意につけること
が可能となる。あるいは図４１のへびのキャラクタの口
をこの振り角で動かすと、口がぱくぱく動かすことが可
能である。指の振り方を変化させれば、せりふにあわせ
て口をぱくぱくさせ、しゃべっている感じを容易に出せ
る。

【０１７７】また、直接ユーザが自分の口をぱくぱく動
作させてヘビのキャラクタの口を動かすことも可能であ
る。例えば、図４２（ａ），図４２（ｂ），図４２
（ｃ）は画像生成装置に向かって口を動かしたところで
ある。図４２（ａ）と図４２（ｃ）は、口を開けたとこ
ろ、図４２（ｂ）は閉じたところである。口の開いた長
さｍは図４２（ａ）、図４２（ｂ）、図４２（ｃ）から
求める。口の長さは平均的な値（例えばβとする）を用
いて、振り角を以下のように求める。

【数１３】これを使ってヘビの口を動かす。あるいは、口を開いた
長さｍをそのままヘビの口の開閉に用いる方法も可能で
ある。

【０１７８】（実施例４の効果）従来の操作では、動き
をコントロールするスライダを操作するというように間
接的な操作であったので、経験の少ないユーザにとって
は自分の思いとおりの動きをつけることがはなはだ困難
であった。これに対し、本実施例によれば、ユーザはア
ニメーションのキャラクタをみながら身ぶりをすると、
その身ぶりにそってキャラクタが動くという、完全に直
接的な操作を行うことができるので、その効果は絶大で
ある。

【０１７９】（実施例４の変形例１）図３０では重心点
の抽出を例に処理の流れを説明しているが、これに必ず
しも縛られるものではない。最近点や、距離画像中であ
る距離以下で、Ｘ方向で最も上位にある点、あるいはＹ
方向で、最も右にある点などの、種々の点をとることが
可能である。

【０１８０】さらに画像変化抽出手段は実施例２に示し
たように１種類だけの変化を抽出するだけでなく、複数
の種類の変化を抽出することが可能である。例えば、重
心点と面積を抽出したとする。面積は距離行列から、あ
る閾値以上のセルの個数を数え上げることが得られる。
その際、誤差を小さくするために、Ｍフレーム分の平均
を取るようにする。重心点により、両手の変位を与え、
面積により、キャラクタ全体の大きさを指示するように
しておく。すると、手を開いたり結んだりしながら位置
を変化させると、キャラクタの大きさが変化しつつ両手
を動かすと言うアニメーションが実現できる。

【０１８１】このように、本装置によれば、距離情報の
他の情報（例えば、面積など）を使って、認識の精度を
上げ、低価格、高速で、かつ自然な操作性を実現するこ
とが可能である。また、これにより、キャラクタに対す
る複数の指示をなんら難しい操作を覚えることなく、実
現できる。

【０１８２】実施例３あるいは実施例４において、指や
手、あるいは顔を使った操作について紹介しているが、
これらの操作に限定されるものではない。例えば、両手
を使って、左手の動きはキャラクタの左手、あるいは左
足の部分、キャラクタの動きは人形の右手、右足の部分
に割り付け、ちょうど、人形の振り付け師が人形に動作
を振り付けるように操ることも可能である。あるいは影
絵で犬の形をつくって動かす身ぶりにより、キャラクタ
に動きをつけることも可能である。

【０１８３】また、実施例４では、２次元のアニメーシ
ョンのキャラクタに対する操作を例に説明しているが、
必ずしもこれに限定されるものではない。例えば、重心
点で奥行き座標までとれば、３次元のアニメーションの
キャラクタに対し、操作することも可能である。あるい
は、幼児のリズム感の教育などに用いる場合には、Ｘ方
向のみの変異分をとり、それよりキャラクタの頭を動か
すようにすれば、幼児は容易に自らのリズムを目でみて
確認できる。また、実施例３のように、幼児の手の動き
にあわせて、キャラクタに動きをつけて目に見える形式
にする以外に、音を発生させるなど、ＣＧ以外の他のメ
ディアへのパラメータとして用いることも可能である。

【０１８４】さらに実施例４では、身ぶりだけでモーシ
ョンをつける実現例であるが、他の入力デバイスとの併
用も可能である。例えば、右手の動きにあわせて対象の
物体を回転させているときに、現在位置で一時対象物体
の動きをホールドして、右手の動きをもう一度もとに戻
して、さらにホールドさせた位置から回転させたいとい
うような場合がある。このような時にホールドを指示し
たり、解除したりするのに、ホールド指示のメニューボ
タンを左手で押すことにより実現できる。あるいは、あ
るモーションをつけたときにその一連のモーションを保
存したいときに記憶を指示するメニューボタンを押すと
いう操作で実現できる。

【０１８５】このように、本装置によれば、簡単なメニ
ューボタンでは容易に実現できないようなモーション付
けなどの操作と、単純にメニューボタンを押せばよい操
作とを、ユーザに違和感なく並行して行うことができ、
その効果は大きい。

【０１８６】（実施例４の変形例２）図４３は実施例４
の別の変形例の概略構成図である。図３５の構成では、
動きベクトルなど画像の変化分のみを抽出して、アニメ
ーションのキャラクタに動きをつけるのに用いていた。
一方、図２３の構成では、距離画像を静止画として認識
して、身ぶりの解釈を行って、その結果を指示として用
いていた。

【０１８７】これに対し、図４３は、多くのパラメータ
を距離画像から抽出して、複雑なキャラクタの動きを制
御するパラメータに割り当てられるようにするものであ
る。そのために、画像変化抽出手段３４３と、形状解釈
手段３３３の双方が組み込まれた構成になっている。も
ちろん、画像変化抽出手段３４３のみで、複数のパラメ
ータ抽出できるので、形状解釈手段３３３が必ずしも含
まれる必要はない。同様に形状解釈手段３においても、
身ぶりの認識結果以外にも、面積や重心の値を抽出でき
るので、これだけでも複数のパラメータを抽出できるの
で、必ずしも、画像変化抽出手段３４３が含まれる必要
もない。

【０１８８】パラメータマッチング手段３４４は、形状
解釈手段３３３や画像変化抽出手段３４３により抽出さ
れた複数のパラメータを、キャラクタの動きの制御のど
の部分に適用するかを決定するものである。一方、キャ
ラクタ制御手段３４５はパラメータマッチング手段３４
４により割り付けられたパラメータに従って、実際に、
キャラクタの動きの計算を行う部分である。その結果を
描画するのが、描画手段３４６である。

【０１８９】パラメータマッチング手段３４４では、ユ
ーザの学習を容易にするため、ニューラルネットワーク
やＧＡ（Genetic Algorithm ）などの種々の最適化手法
を用いて、パラメータの割り付けを制御することが可能
である。あるいは、パラメータごとにどの部分に適用す
るのか、あらかじめパラメータマッチング手段３４４が
決めておく方法も可能である。例えば、図４１のヘビの
キャラクタを例に取れば、面積はヘビの大きさ、速度は
ヘビの尻尾をふる速さ、指の位置はヘビの位置というよ
うにである。

【０１９０】さらに、パラメータの変化の大きさに応じ
て、どの部分に適用するか決めておくことも可能であ
る。まず、最初に手を動かしてみて、最も変化の激しい
パラメータをヘビの尻尾の速さ、変化の少ないパラメー
タをヘビの大きさというように決める。次に手を動かす
ときには、最初のキャリブレーションにより決定された
パラメータに従う。

【０１９１】この変形例２によれば、ユーザは実際に指
や手を動かし、それに応じてキャラクタが変化するのを
見ながら、キャラクタへの動作付けを簡単に習得できる
だけでなく、複雑な動きをつけることが可能となる。ま
た、ここでは、アニメーションのキャラクタのモーショ
ン付けへの適用を中心の述べているが、必ずしも、これ
に限定されるものではない。アニメーション以外には、
音楽の演奏や、画像への特殊効果づけなどに適用するこ
とも可能である。例えば、手の左右の振りでリズム、手
のジェスチャにより奏でる音程を制御して、音楽を演奏
することもできる。

【０１９２】あるいは、手の左右の振りで、画像のワイ
プの速さ、手の回転にあわせて文字を回転させるなど
の、プレゼンテーションにおける特殊表示効果を制御す
ることも可能である。このような種々のアプリケーショ
ンへの適用が可能であり、ここに記述した実施例に限定
されるものではない。また、図４４は、図４３の構成に
おけるＧＵＩ（グラフィカル・ユーザ・インタフェー
ス）の画面の一例を示したものである。このＧＵＩで
は、ジェスチャを限定したいときに、画面の下に並んで
いるアイコンから、限定したいジェスチャを選択するよ
うになっている。

【０１９３】例えば、最も左にあるアイコンは、指先を
動かすことでＸ軸方向の動きをつけられることを示して
いる。同様にその右にあるアイコンは、指先を動かすこ
とで、Ｙ軸方向の動きをつけられる。その右のアイコン
は、Ｚ軸方向の動きをつけられる。これに対し、右から
２番目のアイコンは、「グー」「チョキ」「パー」の３
つの形状が重なっている。

【０１９４】これは、このアイコンを選択するとこの３
つのジェスチャを認識できるように形状規則手段３３２
に格納されている規則が切り替わり、それに応じた解釈
を形状解釈手段３３３がおこなえることを示している。
同様に最も右側のアイコンは「グー」「パー」の２つの
形状が重なっており、この２つの形状に特化して認識す
るようになる。

【０１９５】図４４では、重なった状態でのアイコンが
表示されているが、これらのアイコンは必ずしも静止し
ている状態である必要はない、例えば、「グー」「チョ
キ」「パー」の３つの形状が次々に表示され、アニメー
ション的に表示し、この３つの形状を認識できることを
示したり、あるいは指が左右に動いて、Ｘ軸方向の動き
をとれることを示したりすることも可能である。

【０１９６】また、これらのアイコンを複数選択するこ
とで、限定の幅を広げることも可能である。このとき、
組み合わせた認識ができない場合には、例えば、あるア
イコンを選んだときに選択できないアイコンは、フェー
ドアウトし、選択しようとしても、選択できなくなる。
図４５では、右から２番目の「グー」「チョキ」「パ
ー」のアイコンを選択すると、それに組み合わせて、一
番右の「グー」「パー」のアイコンが選択できないの
で、このアイコンがフェードアウトして表示されてい
る。

【０１９７】また、図４３のようなＧＵＩの構成になっ
ていると、ユーザがあらたな身ぶりを登録した場合も、
その新しい身ぶりはアイコンとなって、表示することが
できる。そのときにアイコンに表示されるのは、距離画
像を簡略化したものである。従って、別のユーザでも、
そのアイコン表示をみて、新たなアイコンの身ぶりをま
ねして、新たなアイコンを使ってみることが容易に行え
る。つまり、図４３のようなＧＵＩにより、ユーザ間で
容易にモーションをつけるための知識を容易に共有し、
容易に学習できるので、その効果は絶大である。

【０１９８】（実施例５）動画像圧縮技術は急速に進展
しているが、まだまだ携帯型の端末装置で、良好に動画
像を表示することは難しい。有用な情報だけ伝送して、
表示できるようにすれば、通信コストを下げ、かつ携帯
端末の低消費電力化、低価格化が可能となる。

【０１９９】このためには、例えば、ＴＶ電話において
は、双方の顔だけ切り出して送るようにしたい。また、
電子会議の議事録などにおいて、クローズアップされた
発言者の顔だけ注目して、検索を行いたいということが
生じる。実施例５は、このような画像から、特定の対象
のみを切り出すためのクロマキーカメラの実現例につい
て説明するものである。図４６は、実施例５の概略構成
図である。

【０２００】実施例３，４と同じく、反射画像を記憶す
る距離画像記憶手段３３１がある（ここでは、距離は必
ずしも記憶する必要がなく、各セルごとに受光すれば
「１」、受光しなければ「０」を設定することで作成さ
れる反射行列でも十分である）。これと並列に、ビデオ
など、ＣＣＤカメラとして使われている可視光の受光素
子アレイ３５１と、それを記憶する画像記憶手段３５２
がある。画像記憶手段３５２に記憶されている画像情報
と、距離画像記憶手段３３１に記憶されている距離画像
を比較し、特定の画像のみを切り出す切り出し手段３５
３と、切り出された画像を記憶する切り出し画像記憶手
段３５４とから構成されている。

【０２０１】図４６では、可視光の受光手段３５１が反
射光抽出手段２とは並列であるが、実装上は、必ずしも
これに限定されるものではない。例えば、図４７のよう
に、同一の受光素子アレイのなかに、あるものは近赤外
の受光素子であり、あるものは可視光の受光素子である
というように配置して、受光レンズを共有し、小型化、
軽量化を図ることも十分可能である。図４８は、切り出
し手段３５３にて行われる切り出し処理の概要を示した
ものである。図４８で、原画像というのが、可視受光ア
レイ３５１で受光した画像である。画像記憶手段３５２
には、これが記憶される。

【０２０２】一方のマスクが反射光抽出手段２により受
光された反射画像である。これが反射行列として、距離
画像記憶手段３３１に記憶されている。切り出し手段３
５３は、原画像とマスクを重ね合わせ、重ねあった部分
だけを残すことで、図４８の最下段にあるような切り出
し画像を得ることができる。この切り出し画像は切り出
し画像記憶手段３５４に記憶される。

【０２０３】反射光抽出手段２および可視光受光アレイ
３５１での受光を完全に並行して行うと、毎秒３０回の
受光をおこなう（通常のビデオのフレームレートが３０
枚／秒）。切り出し手段３５３での切り出し速度が十分
早ければ、毎秒３０回の更新が可能である。その場合
は、受光した度に、つまり毎秒３０回、画像記憶手段３
５２と距離画像記憶手段３３１に記憶された画像も更新
するようにすればよいので、画像記憶手段３５２と距離
画像記憶手段３３１記憶容量は小さくてよい。

【０２０４】一方、切り出し速度が十分早くなければ、
画像記憶手段３５２と、距離画像記憶手段３３１には、
直前のフレーム分の画像、あるいは距離画像を記憶する
ためのバッファが必要となるが、このバッファに記憶さ
れた前のフレーム分と現在のフレーム分とを加算平均し
たものを対象に切り出し処理を行うことで、単に速度を
補うだけでなく、Ｓ／Ｎ比の向上もはかれる。

【０２０５】次に切り出された画像の利用方法について
のべる。例えば、電子会議などの会議録システムでは、
現状は図４６の画像記憶手段３５２に記憶された動画像
をビデオテープなどに録画するか、あるいは、ＭＰＥＧ
２などで圧縮して記録する方法がとられている。しか
し、これらの方法では、発言者以外の画像など、議事録
としてさほど重要でない動画情報までも記録することに
なり、無駄に記録することになるだけでなく、発言内容
を重視して再生するなどの効率のよい再生ができない。

【０２０６】これに対し、本実施例によれば、発言者な
どの特定部分だけを切り出すことができる（図４８の切
り出し画像が、発言者に相当する）。その切り出し画像
を記録することにより、記録容量を大幅に（数分の１か
ら数十分の１）削減できるだけでなく、無駄のない再生
を行うことができる。その場合の概略構成は、例えば、
図４９のようになる。切り出し画像（圧縮）記録手段３
５５は、切り出し画像をそのままビデオ信号として記録
するか、あるいはＭＰＥＧ２エンコーダなどにより、圧
縮して記録する。

【０２０７】あるいは、切り出し画像を記憶するかわり
に転送することもできる。この場合も、従来余分に送っ
ていた背景画像を省略できるので、伝送量を大幅に削減
できる。この場合の概略構成は、例えば、図５０のよう
になる。（圧縮）送信手段３５６は、切り出し画像をそ
のままビデオ信号として送信するか、あるいはＭＰＥＧ
２エンコーダなどにより、圧縮して送信する。切り出さ
れた画像をもちいれば、例えば、図５１のように別の背
景と重ねあわせるなどのクロマキーを非常に簡単に行う
ことができる。その場合の構成は例えば、図５２のよう
になる。

【０２０８】画像合成手段３５７は、背景画像記憶手段
３５８などの蓄えられた、例えば、図５１の左上の地図
のような背景画像に対し、別途入力された位置に切り出
し画像を図５１の下にあるように合成して、出力する。
背景画像が圧縮されて記憶されている場合には、画像合
成手段２１で、復号（デコード）を行った上で合成す
る。もちろん、あらかじめ記録されている切り出し画像
を用いた合成も可能である。また、複数の切り出し画像
を用いた合成も可能である。

【０２０９】（実施例５の効果）従来は動画像から特定
の部分だけを切り取るには、人手で切り出す部分を特定
するなどの作業を行わねばならず、大変な労力をかけて
いたが、本実施例によれば、キャラクタ部分などのマス
クを反射行列により、容易に作り出すことができるの
で、従来の労力を大幅に削減することができるので、そ
の効果は絶大である。

【０２１０】また、電子会議などにおいて、発言者の顔
などをインデックスとして利用するような会議録システ
ムへの応用などにより、検索に必要な情報の入力作業も
大幅に軽減することができる。

【０２１１】（実施例５の変形例）本実施例では、反射
光抽出手段２と可視光の受光アレイ３５１とが同時に受
光するようになっているが、必ずしも、これに限定され
るものではない。例えば、図５３のように、切り替え手
段３５９により、切り替えて受光することも可能であ
る。切り替え周期が６０Hzであれば、可視光と近赤外で
それぞれ３０Hzで受光できる。

【０２１２】また、図４７では、可視光の受光アレイ３
５１の中に、近赤外の受光アレイ１が並ぶ配置になって
いるが、これに、必ずしも、限定されるものではない。
例えば、将来の技術革新により、加電圧を変化させるこ
とで、可視光を受光するか、近赤外を受光するかを制御
できる素子が開発されることもある。このような素子を
使うことにより、図５３の切り替え手段３５９で、加電
圧を切り替えることにより、実現することも可能であ
る。

【０２１３】さらに、図５３のような構成で切り出した
画像を合成するときに、図５１に示したように、合成す
るキャラクタは一つに限定されるものではない。例え
ば、別に切り出しておいた複数の切り出し画像を背景画
像に重ね合わせることも可能である。このとき、複数の
切り出し画像に異なる奥行き座標（Ｚ値）を与えて合成
することも可能である。このようにすると、簡単に奥行
きのある映像を作り出すことが可能となる。このとき、
与えられた奥行き座標にあわせて、透視変換（無限遠に
消失点がある）である（Ｘ／Ｚ，Ｙ／Ｚ，１／Ｚ）を施
す。これにより、奥になるほど小さい画像になるので、
さらに奥行き感のある映像とすることが非常に簡単にで
きる。

【０２１４】（実施例６）キャラクタを３次元のモデル
として作成するには、いくつかの方法がある。一つは、
粘土などでキャラクタのモデルを作り、それを３次元デ
ィジタイザと呼ばれる３次元座標値を入力するデバイス
で、表面の主要ポイントをなぞっていく方法である。こ
の方法は、精緻なモデルができるので、映画やＣＭな
ど、非リアルタイムの高画質の映像を用いる分野でよく
用いられている。３次元モデルにする対象が大型の場合
には、３次元ディジタイザで、表面のポイントを一つ一
つ入力していくのは、大変なので、レンジファインダと
いうレーザ光をあて、その反射から距離を計測するデバ
イスを用いることもある。

【０２１５】また、別の方法では、３次元ＣＡＤなどを
使い、モデルを作り込んでいく。この方法は、比較的曲
面の少ない機械機構や建築物などを作るのに適してい
る。どちらの方法にしても、現実感（本物らしさ）を出
すために、作成した３次元のモデルに、キャラクタの材
質感などだすための、写真を貼り付ける（テクスチャマ
ッピング）という作業をおこなう。テクスチャマッピン
グは正方形の模様（テクスチャ）を貼りつける３次元物
体の（曲）面に合わせる２次元的な座標変換である。よ
く使われるモデリングソフトウェアでは、貼りつける面
とそこに貼りつけるテクスチャを指定する必要がある。

【０２１６】このような手間は、臨場感をだすために欠
かせないが、煩雑であるのも事実である。特に、子ども
などが家庭でアニメーションを作って楽しむといった用
途には、負荷が大きすぎて向いていない。３次元モデル
を作り、さらにテクスチャをはるという作業をより簡単
にできるようにするものが、この実施例６である。

【０２１７】図５４は、第６の実施例の概略構成図であ
る。図４６の構成とほとんど同じであるが、切り出し画
像記憶手段３５４の代わりに、切り出した画像とＺ値を
対応させて記憶するＺ値画像記憶手段３６１と、Ｚ値を
比較して描画のための処理を行う描画手段３６２とが付
加された構成になっている。図５５は、Ｚ値を比較し
て、描画を行うときの原理を説明するものである。図５
５（ａ）と図５５（ｂ）の図は、Ｚ値画像記憶手段３６
１に記憶されているＺ値画像の一例である。第５の実施
例中の図４６の構成図の切り出し画像記憶手段３５４に
記憶されている図４８のような切り出し画像と、第３の
実施例の図２３の構成図中の距離画像記憶手段３３１に
記憶されている図２４（ａ）のような距離画像とを重ね
合わせた画像になっている。つまり、一つの画素に対し
て、ＲＧＢの色の情報と、奥行き情報であるＺ値とをも
っている。

【０２１８】図５５のＺ値画像は、説明のため、モノク
ロ画像にしてある。また、説明を容易にするため、図５
５（ａ）のＺ値は１、図５５（ｂ）のＺ値は２とする
（その値がそれぞれの画素に書き込まれているが、ここ
では、簡単のため、すべて同一であるとして、値を一つ
だけ記してある）。図５５（ａ）の図と図５５（ｂ）の
図を合成するときを説明する。色の濃い方が、距離が近
い、つまり、Ｚ値が小さいことになる。

【０２１９】まず、合成に際しては図５５（ａ）図をそ
のまま書き込む。次に図５５（ｂ）図を書きこんでい
く。（６，６），（６，７），（６，８），（７，
６），（７，７）には、図５５（ａ）図のみしかないの
で、そのまま残る。（７，８）には、図５５（ｂ）図も
画像があるが、すでに書き込まれているＺ値は図５５
（ａ）の１に対して、図５５（ｂ）のＺ値は２であり、
図５５（ｂ）の方が、遠くにあることがわかるので書き
込みを行わない。以下同様にして、Ｚ値を比較して、Ｚ
値が小さい方（つまり、距離が小さい方）だけ残すこと
で、陰面処理を行うことができる。同様の処理で、例え
ば、図５６のように、切り出した画像をＺ値をもとに合
成することで、奥行きのある画像を簡単に作り出すこと
ができる。

【０２２０】（実施例６の効果）本実施例によれば、従
来のように３次元モデルを入力して、さらにテクスチャ
をはる面を指定するなどの手間がいらずに、写真をとる
感覚で、簡単に、テクスチャマッピングを行った３次元
モデルを作成することができる。従って、従来の方式で
は、プロあるいはかなり技術のあるユーザでないと、ア
ニメーションを作成したりできなかったが、本実施例に
よれば、容易にだれもが、３次元モデルによるアニメー
ションを気軽に楽しめるようになる。

【０２２１】（実施例６の変形例１）実施例６では、Ｚ
値を使って、そのまま画像を書き込むことで奥行きのあ
る映像を作っていたが、必ずしもこれに限定されるもの
ではない。例えば、（ｘ，ｙ，ｚ）の座標値を頂点座標
とするポリゴン（多角形）を生成し、３次元モデルを作
り、そこに切り出した画像をマッピングすることも可能
である。

【０２２２】（実施例６の変形例２）実施例６では、複
数の映像を切り出すことが難しい。これを解決するの
が、この変形例２である。その構成は図５７のようにな
る。図５７では、切り出すときのＺ値の範囲を切り出し
範囲決定手段３６３により、制御することにより、複数
の対象を切り出すことができる。

【０２２３】例えば、図５８（ａ）のように、複数の対
象が重なった形で距離画像が得られたとする。切り出し
範囲決定手段３６３は、まず切り出しの中心Ｚ値を複数
決定する。切り出し範囲決定手段３６３は、図５８
（ａ）の距離のヒストグラムをとる。その結果、図５８
（ｂ）のようなヒストグラム（頻度分布）が得られる。
ヒストグラムの分布（山がどこにあるか）をもとに、切
り出しの中心Ｚ値を決定する。ここでは、ヒストグラム
の山が２つあるので、そこから、２つの中心Ｚ値Ｚｃ
１，Ｚｃ２が決まる。切り出しは、この中心Ｚ値に対
し、ある程度の幅（例えば、γ）を持たせて、Ｚｃ１±
γ，Ｚｃ２±γで切り出しを行う。

【０２２４】その結果が、図５８（ｃ），図５８（ｄ）
になる。この切り出された、距離画像に対応する部分の
切り出し画像を切り出す。図５８（ｃ）では、切り出さ
れた領域が２つに分かれているので、これを図５８
（ｃ）に描いてあるようにつなげて、閉曲線になるよう
につなげて、一つの対象としてまとめる。しかし、つな
がった部分（前に別の対象があいとぎれた部分）の切り
出し画像は、隠れているので、切り出せない。このた
め、すでに切り出した画像を元に補間した画像を生成
し、これを切り出しが像として補間して用いる。

【０２２５】切り出し後のＺ値画像に対しては、それぞ
れのＺ値をもとに、実施例４と同様に描画を行うこと
で、隠面処理を行い、奥行きのある合成ができる。以上
のように、第２の変形例によれば、複数の対象も切り分
けて抽出し、簡単に奥行きのある映像を生成できるの
で、家庭で子どもなどが楽しみながら、新しい映像（ア
ート）の生成ができるので、その効果は大きい。

【０２２６】＜補正手段の必要性＞反射光画像の各画素
は反射光の強さを表しているが、反射光の強さは物体ま
での距離の２乗に反比例する。したがって、非線型な変
換手段を用いることによって、反射光画像から距離画像
を生成することができる。ただし、ここで言う距離画像
にはある程度の誤差が含まれる。これは、実際には、同
じ距離にある物体でもその表面の向きやその反射特性が
影響し、必ずしも同じ反射光が戻ってこないからであ
る。しかし大まかな距離画像は得られる。ここでは物体
による距離画像の誤差は無視する。

【０２２７】理想的な反射光画像が得られていれば、非
線型な変換手段によって良好な距離画像を得ることがで
きる。しかし、実際にはさまざまな要因により理想的な
反射光画像が得られない。そのため、反射光画像を正し
く補正するための手段が必要となる。あるいは、非線型
変換と補正をあわせて行なう手段（これも以降では広い
意味で補正手段と呼ぶ）が必要となる。以降でこれらの
補正手段について詳しく述べる。

【０２２８】＜撮像レンズの影響＞まず、反射光画像が
歪む原因について述べる。まず撮像レンズの影響があ
る。撮像レンズは物体からの反射光をセンサ面上に結像
させるためのものであるが、一般的に、その明るさが光
の入射方向によって変わるという特性を持っている。一
般に、光軸方向は明るく、周辺に向かうほど暗くなる。
つまり同じ方向から同じだけの反射光が返ってきても、
画像の中心部の方が周辺部に比べて明るくなる。

【０２２９】＜発光むら＞また、発光手段による発光む
らも距離画像の誤差となる。照明は一般的には完全に均
一とはならず照射された面上での照度にはむらがある。
このことは平らな拡散面に当てた光の反射光画像を取得
しても平面にならないことを表す。

【０２３０】＜センサの感度むら＞また、反射光画像を
撮像するためのイメージセンサによる撮像むらがある。
イメージセンサは一般的に光を電荷に変える手段、それ
を蓄積する手段、転送のための手段、必要に応じて増幅
手段などを備えたセルが２次元的に配列されている。セ
ルの特性は必ずしも一致しておらず、個々にばらつきが
ある。これらによっても距離画像の誤差が生ずる。以上
述べたようなさまざまな要因により、取得した反射光画
像に歪みが生じ、それより再構成した距離画像にも誤差
が生ずる。そのために画像の補正が必要となる。

【０２３１】＜反射光から距離値への変換＞図５９は非
線型変換手段７２２を用いて反射光画像を距離画像に変
換するための構成例である。反射光画像生成手段は、タ
イミング制御手段７２０から出力される制御信号にした
がって動作し、反射光画像を表す信号を出力する。これ
は発光手段も含める。これはアナログ信号である。非線
型変換手段は、入力電圧によって増幅率が異なる非線型
アンプである。理想的には入力電圧Ｖｉと出力電圧Ｖｏ
の関係が、

【数１４】（ｋは定数）であるものが望ましい。実際にはこのよう
な特性を持つ非線型アンプを作るのは難しいので、これ
を近似した特性を持つ非線型アンプや対数アンプなどを
用いても良い。非線型変換手段から出力される信号をＡ
／Ｄ変換することによって、デジタル化された距離画像
が得られる。非線型変換手段は、必ずしもアナログ変換
でなくても良い。Ａ／Ｄ変換した後に、デジタル信号で
非線型変換を行なっても良い。図６０はこの構成を表し
ている。反射光画像生成手段７２１から出力される信号
はＡ／Ｄ変換器７２４でデジタルデータに変換され、デ
ジタル化された反射光画像になってから、補正手段７２
５で距離画像に変換する。

【０２３２】補正手段では画像の座標よって異なる補正
パラメータを使うため、座標の情報をタイミング信号７
２３から得る。この場合、ＲＯＭのアドレス信号に入力
を与え、出力を変換後の値として取り出すようにすれ
ば、任意の特性を与えられるため、［数１４］の特性を
満足させられる。しかし［数１４］の変換は、入力信号
が大きいとき変換精度が悪くなるため、最終的な出力よ
り多いビット数でＡ／Ｄ変換するのが望ましい。デジタ
ル化してから非線型変換する場合は、後述するように、
反射光画像の補正手段と組み合わせてしまうことができ
る。また図示しないが、Ａ／Ｄ変換した画像データを一
旦メモリに格納してから、補正手段がメモリにアクセス
して補正作業を行なうという形もありうる。

【０２３３】＜２段階の変換＞図６１は２段階の変換手
段を用いて、反射光画像の歪みを補正しつつ距離画像に
変換するための構成例である。まず反射光画像生成手段
７２１の出力を非線型変換手段７２６により距離の情報
に変換する。これをＡ／Ｄ変換した後、補正手段７２７
により正確な距離画像に変換する。反射光画像の歪みの
補正は、２次元画像として補正する必要があるため、デ
ジタル画像に変換してから行った方が良い。

【０２３４】このように２段階の変換手段を用いると以
下のようなメリットがある。図６０のように反射光から
距離値への変換を、デジタル化した後に行うと、Ａ／Ｄ
変換器のビット数が多く必要になってしまう。反射光か
ら距離値へ変換する非線型変換手段の理想的な特性は図
６２のような曲線である。これをデジタル化したあとの
画像で行うと、入力信号が大きいときの変換精度が悪く
なることが分かる。これを防ぐためには最終的に必要な
ビット数より多いビット数でＡ／Ｄ変換する必要があ
る。Ａ／Ｄ変換する前にこの非線型変換手段を使い、距
離値に変換しておくことでＡ／Ｄ変換器のビット数は少
なくて済む。またＡ／Ｄ変換前での非線型変換手段は、
その特性は大まかで良い。

【０２３５】つまり［数１４］のような特性を完全に満
たす必要が無い。それは、変換後に反射光画像の歪みを
補正するときに、非線型変換手段で変換しきれなかった
誤差を吸収するように補正してしまえば良いからであ
る。歪みの補正をするときに、非線型変換手段の誤差の
補正を同時に行うことによる難しさやコストアップは無
い。逆に、アナログ信号レベルでの非線型変換手段に高
い精度が要求されないことで、コストダウンを図ること
ができる。またこれは、反射光画像生成手段が、反射光
の強さに対して、非線型な出力信号を出すように構成し
ても良い。この場合も本特許の権利範囲に含まれる。

【０２３６】＜補正の構成詳細−フルテーブル＞次に、
補正手段の詳細について述べる。図６３、図６５は、補
正手段をより具体的にした構成を表す。図６３は、入力
と出力を１対１対応させた補正テーブル７２８を持つ場
合である。画素数が６４×６４＝４０９６画素だとする
と、この座標は１２ｂｉｔで表現できる。出力データを
８ｂｉｔとすると、２０ｂｉｔのアドレス入力を持つメ
モリを使うことにより、任意の画素の、任意の値に対し
て出力値を決めることができる。出力値を８ｂｉｔとす
れば、これは高々１ＭＢｙｔｅのメモリを使って実現で
きる。図６４は、テーブルデータの例である。列に１２
ｂｉｔで表される座標を割り当て、行に８ｂｉｔで表さ
れる入力値を割り当てる。マトリクスの交点が出力値を
表す。

【０２３７】＜補正の構成詳細−線形補間＞図６５は、
いくつかのポイントのみをテーブルとする例の構成図で
ある。図６６には、この構成図で使用するテーブルデー
タの例を示す。２５６階調の入力値を８階調ごとに区切
り出力値をテーブル化している。テーブルに無い値が入
力されたときには、近傍両側の２つのテーブル値から線
形補間によって出力値を計算する。例えば、テーブルは
以下のように定義されている。

【数１５】テーブルに無い入力値は以下の式で表せる。

【数１６】この時の出力値は以下の式で算出される。

【数１７】この方法を取ると、図６３の場合の構成に比べ、補正テ
ーブルを格納するメモリ容量は、８分の１で済む。

【０２３８】＜空間的に離散＞画像上で近い点は補正デ
ータも似ている。したがって、全ての座標についての補
正データを持たず、間引いた座標点についてのみ補正デ
ータを持たせ、その間の点の補正データは、近傍の点か
ら計算で求める、という方法を取っても良い。こうする
ことによって、さらに補正データを格納するメモリ容量
を減らすことができる。

【０２３９】＜ＨＷかＳＷか＞補正手段をソフトウエア
で実行した場合は、若干構成が異なることがある。図６
４はその一例である。画像データ蓄積手段７３１は、図
示しないＡ／Ｄ変換器で変換された反射光画像を補正せ
ずにいったん蓄積する。画像データ転送手段７３２は、
画像データ蓄積手段が蓄積した画像データを、補正がそ
の上で実行されるコンピュータなどへ転送される。これ
は具体的には、反射光画像生成手段７２１が含まれるハ
ードウエア上にあるインタフェース回路であり、またコ
ンピュータ上でデータを受け取る働きをする、デバイス
ドライバである。

【０２４０】補正演算部７２９はコンピュータ上でソフ
トウエアで実行される。補正データもコンピュータ上の
補正テーブル７３０に格納されている。この場合は、補
正演算部は、画像データを受け取るわけであるが、この
画像データは座標情報も含んでいるので、論理的には図
６５のように出力データを座標情報とともに受け取って
いるのと等価である。

【０２４１】＜補正データの作成方法＞次に、補正デー
タを作成する方法について述べる。図６８は、補正デー
タを自動的に作る装置の構成を示したものである。反射
画像生成手段７２１は既に述べたものと同じである。制
御手段７３５は既に述べたタイミング制御手段の働きの
ほかに、参照物体可動手段７３３を制御する。参照物体
可動手段はこの物体位置制御信号にしたがって、参照物
体７３４を動かす。参照物体は平板で撮像レンズの光軸
と垂直になるような形で、撮像部との距離が変わるよう
に動かされる。手の形を捉えるための補正データを作成
するためには、手の表面となるべく同等の反射特性を持
つ参照物体を用いるのが望ましい。

【０２４２】また、タイミング制御手段は、補正データ
算出部７３７に現在の参照物体の距離の情報を、補正デ
ータ蓄積部７３６に座標信号を与える。補正データ算出
部は、反射光画像と、現在の参照物体の距離の情報か
ら、補正データを生成する。算出された補正データは、
補正データ蓄積部に蓄えられるが、このときタイミング
制御手段から与えられる座標情報とともに格納される。
あるいは、座標情報はタイミング制御手段から補正デー
タ算出部へ送られ、補正データ算出部が補正データを座
標情報とともに格納しても良い。

【０２４３】更に詳細な処理の手順を説明する。まず入
力すべき距離の範囲を２５６に等分し、参照物体と反射
光画像生成手段の間の距離を、この２５６段階に移動さ
せる。各段階で、数枚の反射光画像をキャプチャし、平
均化して１枚の反射光画像を作る。これを各距離で繰り
返し、全部で２５６枚の反射光画像を作る。これで各画
素について２５６点の出力と距離の関係が得られた。こ
れをもとにして、補正データを作成する。全ての出力値
（補正手段の入力）に対し、補正値をすべてテーブルと
して持つ場合は、これらのデータからテーブルを作成す
る。離散的に補正値を持たせる場合は、選られた出力と
距離の関係を区切りごとに線分近似し、その交点を補正
データとして格納する。

【０２４４】例えば、図６９下に示す曲線は、参照物体
を移動させながら得た、出力と距離の関係、図６９上の
折れ線は近似された線分、その折れ点が補正データであ
る。離散的に補正データを持つ場合は、均等な間隔で補
正データを持っても良いし、近似しやすいように補正デ
ータ間の間隔を不揃いにしても良い。例えば、カーブの
きついところは補正データを持つ点の間隔を狭くし、直
線に近いところは間隔を広くする。このグラフで、出力
値が頭打ちになっているのは、出力を８ｂｉｔ（０〜２
５５）と仮定しているため、それ以上遠い距離が表せな
いからである。

【０２４５】＜補正データをユーザに作成させる方法＞
上記述べたような補正のためのデータは、あらかじめ作
っておいて、製品に含まれる形で提供されるのが望まし
いが、ユーザが購入後にも再び補正データを作成する必
要が出てくる場合もある。例えば、使用する環境の変動
によって補正データが十分に合わなくなってくる可能性
もある。またＬＥＤの故障や、ＬＥＤ，センサの特性の
経年変化などもその要因となる。あるいははじめから、
ユーザに補正データを作らせるようにしておくこともで
きる。

【０２４６】このような場合、補正データをユーザの操
作によって作れるような仕組みを作っておく必要があ
る。これを可能にするような装置の構成例を図７０に示
す。ユーザへの指示手段７３８以外の構成要素は図６８
のそれとほぼ同じである。ユーザへの指示手段は、決め
られた距離に参照用の物体を置くように指示する。ユー
ザはその指示に従って作業するだけで、補正用のデータ
が作られる。補正用のデータの作成方法は上述とほぼ同
じである。ただし、人手で作業させるためあまり細かい
間隔で多くの回数繰り返えす操作は適さない。また、置
かれる参照物体の位置や向きは必ずしも精度良く置かれ
ていないので、適当な誤差を見込んで計算することが重
要である。図７１はユーザへの指示手段が、画面上に出
すダイアログボックスの例である。

【０２４７】＜レンズの光軸ずれを補正するツールをつ
けて、ユーザに行わせる＞ユーザに補正データを作成さ
せた場合、その補正データの信頼性はやや劣る。という
のも、ユーザは指定された位置に参照板を置くわけであ
るが、この位置や向きが必ずしも正確ではないからであ
る。このような場合、補正するものをモデル化しやすい
要因のみに絞り、不正確さを吸収するという手段もあ
る。反射光画像から再構成した距離画像を歪ませる大き
な原因の一つが、撮像レンズの周辺光量低下である。こ
れは光軸から離れるほど明るさが暗くなることである。
つまり平面を置いても周辺からの反射光が中心に比べて
小さくなるということである。実際にはこれに、周辺の
方が距離が大きくなることによる更なる低下が加わる。

【０２４８】センサの感度むらなどや発光むらが許容範
囲以下であれば、上述のレンズの光量低下（距離の違い
による低下も含む）のみを補正すれば良い。レンズのス
ペックは既に分かっているわけであるから、どのくらい
周辺光量が低下するかという特性は既に分かっている。
光軸がイメージセンサの中心を通るという仮定のもとで
は、この特性を逆計算すれば補正データが容易に得られ
る。

【０２４９】しかし、光軸が必ずしもイメージセンサの
中心を通っているとは限らない。これは主に、センサチ
ップをセンサパッケージにマウントする際の取り付け位
置の誤差による。しかし、光軸がイメージセンサの中心
を通る仮定での補正データを、位置ずれの分だけシフト
すれば、正しい補正ができる。図７２は、この考え方を
表している。棒グラフは補正する前の生のデータであ
る。下の方にある曲線グラフは補正データを表す。ここ
では生のデータに乗ずる値とした。マーカー付きの線グ
ラフは、補正された後のデータを表す。画像データは２
次元であるが、この図では、簡単のため１方向（ｘ方
向、あるいはｙ方向）のみで表している。

【０２５０】上図は、レンズの光軸がセンサの中心を通
っている場合に、平面からの反射光を画像化したもので
ある。中心をピークに周辺の方がなだらかにパワーが減
少している。この状態において、図のような補正データ
を乗ずると、マーカー付き線グラフのように、データ値
が等しくなり、平面を表現できるようになる。中図は、
レンズの光軸がセンサの中心からずれている場合に、上
図と同じ補正データを乗じた場合である。補正された後
のデータが平らになっていないことが分かる。下図は、
補正後のデータが平らになるように、この補正データを
左右にずらした場合である。

【０２５１】このように、レンズの周辺光量の落ち込み
が支配的な場合は、レンズ光軸とセンサ中心の位置が合
っている場合の補正モデルを用意しておき、それをずら
しながら、一番平らになる場所を見つければ良い。この
補正データを作る時の動作をフローチャートで図７３に
示す。このフローチャートでは、補正データを作った
後、ユーザに参照版を平行に動かすように指示してい
る。動かすことで、多くの距離で取った参照物体の反射
光画像が得られ、それらに対し補正を行なった画像を作
ることにより、補正データが適切かどうか判断すること
ができる。

【０２５２】補正データが適切であるかどうかは自動的
に判断させても構わないが、補正後の距離画像をユーザ
に見せることによって、正しく補正されているかどうか
ユーザに判断させても良い。なお、ここではユーザに補
正データを作らせる場合で述べたが、参照物体移動手段
を用いて自動的に補正データを生成させる場合でも、こ
の補正モデルを使う手法は有効である。

【０２５３】（実施例７）ここでは、これまでに説明し
てきた情報入力装置を備えたシステムとしての実施例を
説明する。図７４は、本発明による情報入力装置を備え
たコンピュータである。これは一般にノートパソコンと
呼ばれる、本体、キーボード、ディスプレイが一体とな
った、持ち運びか可能なコンピュータである。

【０２５４】操作者から見てキーボードの向こう側に本
入力装置の発光部７０１とセンサ部７０２を配し、手前
ななめ上方に受光光学系の光軸が向くようにする（図に
おいて操作者の手全体が照らされている、点線で囲まれ
た円が照らされる範囲）。これにより、キーボードを操
作している手の人差し指を、少し上に持ち上げ、動かす
ことでポインティングやジェスチャ入力を行うことが出
来る。キーボード入力とポインティングやジェスチャ入
力をほとんど手の位置の動き無しで行えるため、使い勝
手が著しく向上する。ボタンを用意しておいてこれとポ
インティングやジェスチャ入力を併用してもよい。画面
上のアイコンを選択したり動かしたりするためのクリッ
クやドラッグという操作をこのボタンで行うことができ
る。

【０２５５】また、ジェスチャ入力においてタイミング
トリガを入力したい場合にボタンを使うことも便利であ
る。ボタンを押したときにだけこの情報入力装置が動作
するようにすることもできる。すなわち、ポインティン
グやジェスチャ入力したいときはボタンを押しながら手
を動かして入力する。こうすることにより、ポインティ
ングやジェスチャ入力を行う意思がないのに操作領域に
指が入ってしまい誤動作するのを防ぐことができる。

【０２５６】これは、ポインティングの場合に特に有効
で、キーボードを使用しているときに誤ってポインティ
ングしてしまう恐れが無いので、操作領域をキーボード
のホームポジションのごく近いところに設定し、最小限
の手の動きで（例えば、右手の人差し指だけを少し上に
向けるだけで）ポインティングできるようにすることも
できる。またボタンが押されたときだけ、発光部が発光
するので、消費電力を節約することもできる。

【０２５７】ノートパソコンのような場合、このボタン
をキーボードのキーで代用することもできる。例えば、
スペースバーを使った場合、通常はスペースの入力とし
て働くようにしておき、指を差してカーソル表示させて
いるときにスペースキーが押された場合は、クリック、
ドラッグとして働くようにする。キーボードと併用する
場合、キーボードと本情報入力装置との位置関係が重要
である場合がある。図７５は、本情報入力装置を備えた
キーボードである。やはり先のノートパソコンの例と同
様に、発光部７０３と受光部７０４とを備え、手をホー
ムポジションから上方に持ち上げると、光が手にあたる
ような位置関係になっている。ここでも点線で囲まれた
範囲が照らされる。

【０２５８】必ずしも全てに必要ではないが、この図で
は、ポインティングやジェスチャ入力のときに併用でき
るキー７０５が付いている。キーボードをこれと交換す
れば、快適な環境で、キーボード入力とポインティング
やジェスチャ入力を併用することができる。左利きの人
でも使いやすいように、併用できるキーを左右に配して
もよい。また、図７６は本情報入力装置を備えたディス
プレイである。操作する手と画面の位置関係が重要であ
るときにはこのデバイスが便利である。ディスプレイの
上方に発光部７０６と受光部７０７が付いている。光と
受光系の向きはやや下向きで、点線の円で表された範囲
に照らされる。

【０２５９】これは操作者がだいたい画面と同じかやや
低い位置に手を持ってくるのが操作しやすいからであ
る。この図では上部に入力装置が付いていたが、ディス
プレイ下部や側部にあってもよい。また左右両方に１つ
ずつついていれば、両手で同時に入力できる環境を作る
こともできる。図７７は壁に埋め込まれたディスプレイ
とともに本入力装置を構成したものである。本情報入力
装置７０８は埋め込み型のディスプレイ７０９に取り付
けて、あるいはディスプレイの近くに設置して利用す
る。または、埋め込み型ディスプレイと一体化してい
る。ディスプレイの上にある箱状のきょう体の中に、少
なくとも、発光部と受光部が入っている。特徴情報生成
手段はこの箱の中に入っている場合もあり、ディスプレ
イ本体の中に入っている場合もあるし、別の形で置かれ
る場合もある。この発光部、受光部の入ったきょう体
は、その向きが調整できるようになっているとさらに好
ましい。

【０２６０】ここでは点線の円の範囲に発光され、この
中で操作者が手７１０を動かすことでディスプレイに表
示されているオブジェクト７１１を操作している。この
ような実施形態は、博物館や駅などの公共の場での、情
報提示、入力端末などに適している。また、ホームオー
トメーションなどにおける操作部として、壁に埋め込ま
れた小型のディスプレイと本情報入力装置で好適な環境
を提供することができる。この入力装置を備えた他の携
帯情報機器のイメージを載せる。図７８は片手で持てる
小型携帯情報機器である。本入力装置は外側には発光、
受光できるだけの窓があればよいので、スペースを有効
に使える。ここでは、７１２が発光部、受光部の窓であ
る。窓の前で指７１３を動かせば、画面内のカーソル７
１４の位置を制御できる。窓がこれだけ小さいので、残
りのスペースを大きな表示部７１５として使える。

【０２６１】図７９は、本入力装置が付いた腕時計型の
超小型携帯情報機器である。やはり指７１６の動きでカ
ーソル７１７を制御することができる。７１８、７１９
が発光部、受光部の窓である。これだけ本体が小さいと
もはやペンを格納するスペースさえなく、本入力装置に
よる入力の好適さは言うまでもないことである。また、
目と表示装置の間からずらしたところに操作空間を配置
すれば、指によって表示が見にくくなるということもな
い。携帯機器などに搭載することを考えた場合、機器の
省電力化を図る必要がある。このシステムはかなり光を
発光しているため、発光電流を抑えることが省電力化に
つながる。このために、発光タイミング、発光量を制御
して省電力化を図ることができる。

【０２６２】例えば、装置の前に物体が無いことは、反
射光画像の画素値が全て０に近くなることで検出でき
る。物体が無いことが検出されたとき、あるいは物体が
無いことが検出されてから定められた時間が経過したと
き、発光の間隔を長くする。例えば１／３０秒に１回発
光していたものを１／１０秒に１回にする。このことで
発光電力を１／３に落とすことが出来る。

【０２６３】再び物体が前に現れたときには、反射光画
像に現れる変化で検出できるので、再び１／３０秒に１
回の発光に戻す。実際にカーソルを移動させているとき
は、秒３０回検出する場合と、秒１０回検出する場合と
では、カーソルの動きの滑らかさから明らかに違いが分
かる。しかし、手を出してからカーソルが現れるまでの
時間は、多少の遅れがあっても気にならない。

【０２６４】発光のタイミングではなく、発光量を制御
することで省電力化することも出来る。指先の位置を高
い精度で検出するために必要な発光量に比べて、前に物
体があるか否かを判断するだけに必要な発光量ははるか
に小さい。従って、前に物体がないことが検出されたと
きに、発光量が小さくなるよう制御し、物体が再び現れ
るかをチェックする。物体が再び現れたことが検出され
たら、発光量をもとに戻す。発光タイミングと発光量の
制御を同時に行ってもよい。この場合にはさらに大きな
省電力効果が期待できる。またこの省電力効果について
もポインティングを行うときのみに限らず、いかに示す
種々の形態についても適用でき、その効果を発揮するこ
とが出来る。

【０２６５】

【発明の効果】本発明により、従来困難であった切り出
し処理を容易に提供することができる。

【図面の簡単な説明】

【図１】本願発明の一実施例である実施例１の構成図で
ある。

【図２】本願発明の一実施例である実施例１のより具体
的な構成図である。

【図３】本願発明の一実施例である反射光抽出手段の詳
細な構成図である。

【図４】本願発明の一実施例である単位受光部の構成図
である。

【図５】本願発明の一実施例である反射光抽出手段を制
御する信号を示す図である。

【図６】本願発明の一実施例である反射光画像と棒状物
体検出の様子を表す図である。

【図７】本願発明の一実施例である指先における反射光
画像を示す図である。

【図８】本願発明の一実施例である反射光画像の画素値
について説明する図である。

【図９】本願発明の一実施例である指先位置を求める特
徴情報生成手段の構成図である。

【図１０】本願発明の一実施例である棒状物体先端切り
出し部の処理を説明する図である。

【図１１】本願発明の一実施例である画素値の修正を行
う理由を説明する図である。

【図１２】本願発明の一実施例である適切な画素の大き
さを説明する図である。

【図１３】本願発明の一実施例である棒状物体検出のア
ルゴリズムを示す図である。

【図１４】本願発明の一実施例である棒状物体先端切り
出しと重心検出のアルゴリズムを示す図である。

【図１５】本願発明の一実施例である棒状物体検出で用
いる構造体の説明をするための図である。

【図１６】本願発明の一実施例である棒状物体検出にお
ける耐ノイズ性を説明する図である。

【図１７】本願発明の一実施例である指に近い位置での
ノイズの影響を抑える処理を説明する図である。

【図１８】本願発明の一実施例である手前に指を伸ばし
たときの反射光画像を示す図である。

【図１９】本願発明の一実施例である指先の微少な動き
を検出できることを説明する図である。

【図２０】本願発明の一実施例である周辺画素が指先位
置に与える影響を説明する図である。

【図２１】本願発明の一実施例であるカーソルを静止さ
せることによってクリック信号を生成させるための構成
図である。

【図２２】本願発明の一実施例である指先の動きでクリ
ック信号やコマンドを発生できるようにするための構成
図である。

【図２３】本願発明の一実施例である実施例３の概略構
成図である。

【図２４】本願発明の一実施例である実施例３中の距離
画像の一例を示す図である。

【図２５】本願発明の一実施例である図２３の実施例の
形状解釈手段の処理の流れの一例を示す図である。

【図２６】本願発明の一実施例である図２３の実施例の
形状解釈規則の一例を示す図である。

【図２７】本願発明の一実施例である実施例３中の距離
画像の一例を示す図である。

【図２８】本願発明の一実施例である実施例３の変形例
１の距離画像の一例を示す図である。

【図２９】本願発明の一実施例である実施例３の変形例
１の形状解釈規則の一例を示す図である。

【図３０】本願発明の一実施例である実施例３の変形例
２の視点制御の概略図である。

【図３１】本願発明の一実施例である実施例３の変形例
２の画面表示の一例を示す図である。

【図３２】本願発明の一実施例である実施例３の変形例
２の距離画像の一例を示す図である。

【図３３】本願発明の一実施例である実施例３の変形例
２の形状解釈記憶の一例を示す図である。

【図３４】本願発明の一実施例である実施例３の変形例
２の別の視点制御の概略図である。

【図３５】本願発明の一実施例である実施例４の概略構
成図である。

【図３６】本願発明の一実施例である図３５の実施例の
画像変化抽出手段の処理の流れの一例を示す図である。

【図３７】本願発明の一実施例である実施例４のキャラ
クタのモーションコントロールの一例を示す図である。

【図３８】本願発明の一実施例である実施例４のキャラ
クタのモーションコントロールの別の一例を示す図であ
る。

【図３９】本願発明の一実施例である実施例４の指の動
きの概略図である。

【図４０】本願発明の一実施例である図３９の指の動き
に対応するキャラクタのモーションコントロールの一例
を示す図である。

【図４１】本願発明の一実施例である図３９の指の動き
に対応するキャラクタのモーションコントロールの別の
一例を示す図である。

【図４２】本願発明の一実施例である実施例４の口の動
きをとらえた距離画像の一例を示す図である。

【図４３】本願発明の一実施例である実施例４の変形例
の概略構成図である。

【図４４】本願発明の一実施例である実施例４のＧＵＩ
の一例を示す図である。

【図４５】本願発明の一実施例である実施例４のＧＵＩ
の別の一例を示す図である。

【図４６】本願発明の一実施例である実施例５の概略構
成図である。

【図４７】本願発明の一実施例である図４６中の近赤外
受光手段と可視光受光手段の概略構成図である。

【図４８】本願発明の一実施例である実施例５の処理の
概略図である。

【図４９】本願発明の一実施例である実施例５の別の概
略構成図である。

【図５０】本願発明の一実施例である実施例５の別の概
略構成図である。

【図５１】本願発明の一実施例である図５０中の画像合
成手段の処理の概略図である。

【図５２】本願発明の一実施例である実施例５の別の概
略構成図である。

【図５３】本願発明の一実施例である実施例５の変形例
の概略構成図である。

【図５４】本願発明の一実施例である実施例６の概略構
成図である。

【図５５】本願発明の一実施例である実施例６のＺ値に
よる隠面処理の説明のための図である。

【図５６】本願発明の一実施例である実施例６の隠面処
理の例を示す図である。

【図５７】本願発明の一実施例である実施例６の変形例
の概略構成図である。

【図５８】本願発明の一実施例である実施例６の変形例
中の距離画像と処理過程の一例を示す図である。

【図５９】本願発明の一実施例である反射光の強さを距
離値に変換するための構成例を示す図である。

【図６０】本願発明の一実施例であるＡ／Ｄ変換後に距
離値に変換する構成例を示す図である。

【図６１】本願発明の一実施例であるＡ／Ｄ前に非線型
変換を行ない、Ａ／Ｄ後に反射光の歪みを補正する構成
例を示す図である。

【図６２】本願発明の一実施例である非線型変換の理想
的な特性例を示す図である。

【図６３】本願発明の一実施例である補正テーブルを使
って、距離値に変換する例を示す図である。

【図６４】本願発明の一実施例である補正テーブルの例
を示す図である。

【図６５】本願発明の一実施例である間引いた補正テー
ブルを使って、距離値に変換する例を示す図である。

【図６６】本願発明の一実施例である間引いた補正テー
ブルの例を示す図である。

【図６７】本願発明の一実施例であるソフトウエアで補
正処理を行う例を示す図である。

【図６８】本願発明の一実施例である自動的に補正デー
タを生成するための構成例を示す図である。

【図６９】本願発明の一実施例である間引いた補正テー
ブルによる補正を表す図である。

【図７０】本願発明の一実施例であるユーザに補正デー
タを作成させるための構成例を示す図である。

【図７１】本願発明の一実施例であるユーザへの指示画
面の例を示す図である。

【図７２】本願発明の一実施例である補正モデルを使っ
た場合の補正方法を説明する図である。

【図７３】本願発明の一実施例であるユーザに補正デー
タを作成させるときのフローチャートを示す図である。

【図７４】本願発明の一実施例である情報入力装置を備
えたコンピュータを示す図である。

【図７５】本願発明の一実施例である情報入力装置を備
えたキーボードを示す図である。

【図７６】本願発明の一実施例である情報入力装置を備
えたディスプレイを示す図である。

【図７７】本願発明の一実施例である情報入力装置と埋
め込み型ディスプレイで構成した入力環境を示す図であ
る。

【図７８】本願発明の一実施例である情報入力装置を備
えた小型の携帯情報機器を示す図である。

【図７９】本願発明の一実施例である情報入力装置を備
えた腕時計型の超小型携帯情報機器を示す図である。

【図８０】従来の３次元ポインティングデバイスの例を
示す図である。

【符号の説明】

１０１…発光手段１０２…反射光抽出手段１０３…特徴情報生成手段１０４…タイミング信号生成手段１０７…受光光学系１０９…第１の受光手段１１０…第２の受光手段１１１…差分演算部１３３…差分回路１３５…Ｖ系選択回路１３６…Ｈ系シフトレジスタ１１８…光電変換部１１９…第１の電荷蓄積部１２０…第２の電荷蓄積部１２１…トランスファー・ゲート１２２…第１のサンプル・ゲート１２３…第２のサンプル・ゲート１２４…リセット・ゲート１２５…出力ゲート１２８…発光制御パルス１３０…リセット信号１３１…第１のサンプル・ゲートの制御信号１３２…第２のサンプル・ゲートの制御信号２０１…反射光画像２１１…指が占めている画素２１２…指が半分程度占めている画素２１３…棒状物体検出部２１４…棒状物体先端切り出し部２１５…重心検出部２１８…切り出された棒状物体先端部２５１…指先位置検出手段２５２…カーソル位置決定手段２５４…カーソル静止状態検出手段２５６…カーソルまたは指先位置動き検出手段３３１…距離画像記憶手段３３２…形状記憶手段３４３…画像変化抽出手段３４２…比較位置記憶手段３４４…パラメータマッピング制御手段３４５…キャラクタ制御手段３４６…描画手段３５１…可視光受光手段３５２…画像記憶手段３５３…切り出し手段３５４…切り出し画像記憶手段３５５…切り出し画像（圧縮）記録手段３５６…（圧縮）送信手段３５７…画像合成手段３５８…背景画像記憶手段３５９…切り替え手段３６１…Ｚ値画像記憶手段３６２…描画手段３６３…切り出し範囲決定手段７０１…発光部７０２…センサ部７０３…発光部７０４…受光部７０５…キー７０６…発光部７０７…受光部７０８…入力装置７０９…ディスプレイ７１０…手７１１…オブジェクト７１２…発光部の窓７１３…指７１４…カーソル７１５…表示部７１６…指７１７…カーソル７１８…発光部の窓７１９…受光部の窓７２０…タイミング制御手段７２１…反射光画像生成手段７２２…非線型変換手段７２５…補正手段７２８…補正テーブル７２９…補正演算部７３３…参照物体可動手段７３４…参照物体７３５…制御手段７３６…補正データ蓄積部７３７…補正データ演算部７３８…ユーザへの指示手段

───────────────────────────────────────────────────── フロントページの続き (72)発明者梅木直子神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内 (72)発明者三浦浩樹神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内 (56)参考文献特開平６−205299（ＪＰ，Ａ) 特開平５−227487（ＪＰ，Ａ) 特開昭63−233312（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04N 5/30 - 5/335 G06F 3/00 680 G06F 3/03 330 G06T 1/00 400 G01B 11/00

Claims

(57)【特許請求の範囲】

【請求項１】基板上に、受光手段と、この受光手段で
検出された信号を増幅する増幅手段と、セルを選択する
選択手段と、前記受光手段をリセットするリセット手段
と、タイミング制御手段とを有する単位セルを行列２次
元状に配列してなる固体撮像装置において、前記単位セルは、前記タイミング制御手段の制御信号に
より発光手段の発光時に前記受光手段で受けた光量に応
じた信号を保存する第１の記憶手段と、前記タイミング
制御手段の制御信号により発光手段の非発光時に前記受
光手段で受けた光量に応じた信号を保存する第２の記憶
手段と有し、前記基板は前記２つの記憶手段に記憶させ
た信号の差を検出する差分検出手段を有することを特徴
とする固体撮像装置。
【請求項２】前記受光手段はフォトダイオードで構成
され、前記増幅手段は増幅トランジスタで構成され、前
記リセット手段はリセットトランジスタで構成され、前
記２つの記憶手段はコンデンサで構成されるもので、前
記フォトダイオードは前記増幅トランジスタのゲートで
接続され、前記２つのコンデンサはそれぞれの一方の電
極が前記増幅トランジスタに接続され、他方の電極が接
地されることを特徴とする請求項１記載の固体撮像装
置。