JP3493532B2 - 物体説明装置および物体説明方法 - Google Patents

物体説明装置および物体説明方法

Info

Publication number
JP3493532B2
JP3493532B2 JP11503495A JP11503495A JP3493532B2 JP 3493532 B2 JP3493532 B2 JP 3493532B2 JP 11503495 A JP11503495 A JP 11503495A JP 11503495 A JP11503495 A JP 11503495A JP 3493532 B2 JP3493532 B2 JP 3493532B2
Authority
JP
Japan
Prior art keywords
name
attributes
input
extracted
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11503495A
Other languages
English (en)
Other versions
JPH08272946A (ja
Inventor
徹 藤井
雅人 川出
秀一 江島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP11503495A priority Critical patent/JP3493532B2/ja
Publication of JPH08272946A publication Critical patent/JPH08272946A/ja
Application granted granted Critical
Publication of JP3493532B2 publication Critical patent/JP3493532B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、カメラ等で認識した
物体を言語情報によって説明する物体説明装置および物
体説明方法に関する。
【0002】
【従来の技術】カメラ等で撮像した画像から物体を抽出
して認識し、その物体を言語情報で出力するような装置
が考えられている。このような装置において、物体の説
明を行うのに最も容易な方法は、予め各物体の名前を登
録しておいて、カメラ等で撮像した画像内から物体を切
り出していって認識し、その認識した物体が登録された
物体と一致する場合に、一致した物体の内容を言語情報
として出力すればよい。例えば、「机の上に何がありま
すか?」と装置に対して指示した場合、装置は、まずこ
の質問の内容の意味解析を行って机の位置を画像内から
切り出し、次に机を基準として画像内の所定範囲に存在
する物体を切り出して認識する。そして、その物体が登
録されている物体と一致している時にその物体名を取り
出して「何々があります」と回答する。机の上に電話が
ある場合には、「電話があります」と回答する。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな物体説明装置では、世の中に存在し得る全ての物体
を登録することが不可能であるために、実際の使用に際
して適切な回答を行うことができない問題がある。例え
ば、「机の上に何がありますか?」といった質問に対し
て、机の上にごみ箱があり、ごみ箱が予め想定されてい
なくて登録されていない場合には、「何かがあります」
と回答することぐらいしかできない。従って、ユーザー
が机の上に何かがあることはわかってもそれが何である
か全く知ることができない。
【0004】本発明の目的は、上記のような場合に、即
ち、登録外の物体が存在する場合には、その物体の説明
を登録済の物体の名前や特徴を組み合わせた表現で説明
することにより上記の問題点を解決する物体説明装置お
よび方法を提供することにある。
【0005】
【課題を解決するための手段】本発明は、物体を検出す
るセンサ手段と、複数の物体について、物体の名前とこ
の物体の色、大きさなどの複数の属性の特徴量とを含む
物体データを予め記憶する特徴量記憶手段と、前記セン
サ手段の検出データから特定の範囲内に存在する物体の
複数の属性についてその特徴量をそれぞれ抽出する抽出
手段と、前記抽出手段で抽出した複数の属性の特徴量に
基づいて前記特徴量記憶手段を検索し、属性毎にその特
徴量が対応する物体を取り出し、属性毎に取り出した物
体が全て一致している場合には該物体の名前を出力し、
属性毎に取り出した物体が全て一致していない場合には
それらの物体の名前又は属性を組み合わせたメッセージ
を生成し出力する物体説明手段と、を備えたことを特徴
としている。
【0006】また、入力された指示内容を解析する指示
内容解析手段を更に備え、前記抽出手段はその解析した
内容に含まれる物体を基準物体として該基準物体を前記
センサ手段の検出データから抽出するとともに、前記特
定の範囲をこの基準物体の位置を基準して設定すること
を特徴とする。
【0007】前記指示内容解析手段は、音声が入力され
る音声入力手段と、該音声入力手段に入力された音声か
ら前記指示内容を解析する手段を含むことを特徴とす
る。また、前記センサ手段は物体の特徴を抽出出来るも
のであれば良いが、例えば、これを画像を検出するカメ
ラとすることが出来る。このカメラは使用者の頭部等の
身体へ固定可能である。
【0008】 また、前記物体説明手段は、前記物体の
名前や複数の物体の名前又は属性を組合せたメッセージ
を音声出力する。
【0009】 さらに、前記物体説明手段は、複数の
体の名前と属性とを組み合わせて出力する時に、該組合
せに属性が接近していることを表す、「近い」「ぐら
い」などの表現を加えたメッセージを生成する。
【0010】
【0011】また、前記基準物体の抽出が出来なかった
ときには、その旨を警報出力し、抽出した特徴量に対応
する物体か複数個ある場合にはその数も出力するように
している。
【0012】さらに、本発明は、以下の構成をとるもの
である。
【0013】 音声入力を受け入れ、入力された音声入
力から、予め基準物体名と検索範囲の記憶されている指
示登録データに基づいて指示内容を解析して検索範囲W
を出力する指示認識装置と、カメラ等により認識された
物体の画像が入力され、該入力画像から、予め色、大き
さなどの複数の属性の特徴量が物体名毎に記憶されてい
る基準物体登録データに基づいて、候補となる基準物体
の名前および位置を抽出し基準位置データWbとして出
力する部分、および前記入力画像から、予め複数の属性
特徴量が物体名毎に記憶されている測定物体登録デー
タに基づいて、属性毎にその特徴量が対応する測定物体
の名前および位置を抽出し、物体内容Eとして出力する
部分を含む入力計測装置と、前記指示認識装置および入
力計測装置の情報を受け取って、前記検索範囲内に存在
する測定物体の物体内容を前記物体内容Eから抽出して
対象物体内容を獲得し、該対象物体内容の複数の属性の
測定物体名が全て一致しているときにはその測定物体名
を音声出力に変換し、一部でも一致していなければ対象
物体内容の複数の属性又は各属性に対応する複数の測定
物体名を組み合わせたメッセージを生成し、このメッセ
ージを音声出力に変換する回答合成装置と、を備えてな
る物体説明装置。
【0014】
【作用】本発明では、カメラ等のセンサ手段によって物
体を検出すると、その物体の検出データから物体の複数
の属性についてその特徴量を抽出する。属性とは、
「色」や「大きさ」などであり、属性の特徴量とは例え
ば「色」が赤色であったり、「大きさ」が50cm2
100cm2 の範囲にあることをいう。続いて、この抽
出した特徴量に基づいて、特徴量記憶手段を検索し、
数の属性の特徴量が全て所定の判定基準からみて同じと
みなせる物体がある場合には、その物体の名前を出力
し、複数の属性の特徴量が全て所定の判定基準からみて
同じとみなせる物体がない場合には、属性毎にその特徴
量に近い特徴量を持つ物体を取り出し、これらの物体の
名前又は属性を組み合わせたメッセージを生成し出力す
る。従って、例えば、電話に近い色のごみ箱があって、
ごみ箱が登録されていない場合には、「電話に近い色
で、植木鉢ぐらいの大きさのものがあります」とごみ箱
の説明を行う。また、電話の色が灰色として登録されて
いる場合、「灰色に近い色で、植木鉢ぐらいの大きさの
ものがあります」や、物体の名前を使わない場合には、
「灰色に近い色で、中程度の大きさのものがあります」
などの説明を行うことも出来る。なお、この場合、電話
と植木鉢については登録されている。
【0015】物体説明を行う時には、カメラ等で撮像し
た画像内に認識できる物体を順次認識したものから説明
するようにしてもよいが、ユーザーが指示を行って、こ
の指示に対する回答によって物体を説明することもでき
る。この場合には、マイクロフォン等の音声入力部を含
む指示内容解析手段によって、入力された指示内容を解
析し、その解析した内容に含まれる物体を基準物体とし
てまず認識する。そしてその物体の位置を基準として特
定の範囲を設定し、その特定の範囲内に存在する物体を
説明する。
【0016】センサ手段としては、カメラ等が考えられ
るがさらに物体の特徴を認識できるものであればよいた
めにこのカメラ等に代えて超音波センサ等を使用するこ
とも可能である。カメラは、使用者の身体の一部、例え
ば頭部に固定出来るように、頭部固定手段を備えるよう
にすれば、使用者が向きを変えれば、それに応じて撮像
画像も変わって来る。したがって、使用者の向きに応じ
て物体説明が行われる。
【0017】出力は言語情報として出力するが、通常、
この場合音声出力を行うスピーカを使用することができ
る。しかし、これに限らず表示装置などに出力するよう
にすることも可能である。
【0018】上記物体説明手段は、登録前の物体を説明
する時に、「電話の色で植木鉢の大きさのものがありま
す」と説明するようにしてもよいが、この説明に対し
「近い」「ぐらい」の表現を加えることによって、「電
話に近い色で植木鉢ぐらいの大きさのものがあります」
と表現するようにしてもよい。
【0019】また、属性としては、「色」「大きさ」が
典型的であるが、この他、さらにモーメントや縦横比、
円形度などを使用することができる。また、基準物体が
検出出来なかったときには、「机がありません」(この
場合基準物体は机)等の出力を行うようにすることで、
何も出力されない状態になるのを回避出来る。さらに、
抽出した同じ特徴量を持つ物体が複数個ある場合に、そ
の数も出力することで、1回の出力でそれらの複数の物
体の説明を行える。例えば、電話が机の上に2個ある場
合、「机の上に電話が2個あります」と説明すること
で、同じ説明を2回繰り返される冗長を避けられる。
【0020】
【実施例】図1は、本発明の実施例の物体説明装置のブ
ロック図を示している。また、図2は同装置の動作を示
すフローチャートである。
【0021】図の1はマイクロホンで、このマイクロホ
ンから音声が入力される。音声入力Siは指示認識装置
2に導かれる。指示認識装置2は、マイクロホン1に音
声が入力されたことを認識して起動信号Tを生成して、
後述の入力計測装置4に出力する。また、入力された音
声入力の指示を解析しどのような指示がされたかを認識
する。さらに、指示に対応する検索範囲を後述の回答合
成装置5に出力する。音声入力の指示の解析では、指示
登録データ11を参照して、音声入力に対応する基準物
体名、X/Y幅、X/Y重心オフセットを、説明すべき
物体の検索範囲Wとして回答合成装置5に出力する。図
3は、指示登録データ11を示している。図に示すよう
に、音声入力に対して基準物体名、その基準物体のX方
向の幅(X幅)とY方向の幅(Y幅)と、X方向の重心
およびY方向の重心オフセットを記憶する。ここで、指
示認識装置2から出力される検索範囲Wとは、基準物体
を基準とした画像上での相対的な範囲のことである。基
準物体は、例えば、机、壁、床などの必ず存在する物体
とする。また、基準物体名は検索範囲の基準となる基準
物体名であり、X/Y幅は検索範囲の縦/横幅、X/Y
重心オフセットは、検索範囲の重心と基準物体の重心の
偏差である。従って、基準物体の重心位置がわかれば、
上記X/Y重心オフセットと、検索範囲の縦/横幅のX
/Y幅を得ることにより、画面上の絶対検索範囲を知る
ことができる。図4は、検索範囲のイメージ図を示して
いる。図において、指示は基準物体からの相対位置で行
われ、その範囲内に存在する物体を説明するものとすれ
ば、同図に示す例では、「机の上に何がありますか?」
とした時、基準物体名が机であって、その上方に、検索
範囲が設定されることを示している。なお、マイクから
の音声入力の指示を解析するときに、音声入力に対応す
る基準物体名が指示登録データ中に存在しないときに
は、警告登録データ15を使って、警告メッセージを出
力する。例えば、音声入力が「机の上に何があります
か」の場合に、指示登録データ中に基準物体として机が
存在しない場合、警告メッセージは、「机はありませ
ん」となる。
【0022】 前記入力計測装置4は、指示認識装置2
から起動信号Tが入力されると、その時のカメラ3から
の画像入力を解析して、画像入力内の基準物体およびそ
の他の物体(測定物体)の部分を切り出す(抽出す
る)。続いて、基準物体の基準位置を重心を求めること
により獲得し、さらに測定物体がどのような特徴を持っ
ているかの情報である物体内容を測定する。最後に、決
定した基準位置および物体内容を回答合成装置5に送
る。なお、入力手段は、物体の特徴を獲得できればよい
ので、超音波映像などを測定する手段であってもよい。
また、指示認識装置においての指示は、マイクロホン
等の音声入力部に代えてキーボード等の入力部、その他
の手段から行われるようにしてもよい。
【0023】画像入力内の基準物体および測定物体の部
分の切り出しは、全ての画像について、図5の基準物体
登録データおよび測定物体登録データの色範囲の属性欄
を使用して行う。即ち、
【数1】
【0024】前記基準物体登録データおよび測定物体登
録データは、基準物体についてはm個の物体名、測定物
体についてはp個の測定物体名がそれぞれ予め登録され
ている。上記〔数1〕では、全ての画素について基準物
体名または測定物体名を割り当てていく動作を行い、a
の部分では基準物体名を、残るbの部分では測定物体名
を割り当てていく。なお、この例では、物体の切り出し
を色範囲によって行ったが、物体の切り出しを行う他の
方法があれば、その方法で行うことも可能である。図5
(B)の測定物体登録データには、色範囲と大きさ範囲
の各属性の欄に、測定物体特徴名の欄が設けられている
が、これは、この欄および測定物体名の欄に「茶」
「緑」といった概念を入れることを可能にするためであ
る。このような「茶」「緑」という概念を入れるとき、
大きさ範囲の上限、下限を0にしておく。このようにす
ると、例えば、登録した物体に緑のものがなかった場合
に、概念を入れておいて物体の説明に抜けがないように
することが出来る。
【0025】同一の測定物体候補(この実施例では、測
定物体と同じ色のもの)が画像入力内に複数存在する場
合は、画素の連結性を見る必要がある。この画素の連結
性を見る方法を以下に示す。まず、すべての画素のla
bel番号を0にする。次に図8のlabeling手
順のイメージ図に示すように、最初の画素列から検索し
ていき、ある測定物体名の画素が存在している画素列を
見つけたら、横方向の始点〜終点の間の画素に、lab
el番号を割り当てる。このlabel番号の割当て
は、以下の条件で行う。 1)始点〜終点の間の画素の上位置の画素に、目的の測
定物体名の画素が存在していない場合は、今までの最大
のlabel番号をインクリメントして、今までとは別
のlabel番号を割り当てる。 2)始点〜終点の間の画素の上位置の画素に、目的の測
定物体名の画素が存在している場合は、 2─1)label番号が1種類の場合、上位置の画素
のlabel番号を割当て、 2─2)label番号が2種類以上の場合、上位置の
画素の最小のlabel番号を割り当てる。また、現在
処理している列以前の画素の中で、この割り当てたla
bel番号以外の画素を、全てこの割り当てたlabe
l番号に変更する。
【0026】以上の処理を、全ての測定物体候補につい
て、繰り返し実行する。こうして、画像入力内に測定物
体候補が存在する状況により、図9の測定物体更新デー
タを作成する。この作成の際、例えば、ある測定物体が
画像入力内に存在しない場合何もしないが、ある測定物
体が画像入力内に1つだけ存在する場合には、その測定
物体の測定物体登録データの内容を測定物体更新データ
としてコピーし、そのときのlabel番号を代入す
る。また、ある測定物体が画像入力内に2つ以上存在す
る場合、label番号の種類だけ、測定物体の測定物
体登録データの内容を測定物体更新データとしてコピー
し、label番号を代入する。この作業を繰り返すこ
とにより、図9の測定物体更新データを作成する。
【0027】前記基準物体の基準位置Wbとは、基準物
体名とその重心位置のことであって、図4に示す絶対検
索範囲を確定するための情報である。また、測定物体が
どのような特徴を持っているかを表す情報の物体内容と
は、測定物体の各属性の特徴量が予め登録されている物
体の中で一番近い測定物体名と、その測定物体の重心位
置とを表す情報である。ここで、基準位置および物体内
容の重心位置は、各画素の物体名に従って下記〔数2〕
に従って算出する。
【数2】
【0028】上記式において、c,eにおいて基準物体
の重心が求められる、d,fにおいて測定物体の重心が
求められる。なお、gにおいては、測定物体更新データ
のうち存在しない測定物体に対して“−1”の重心位置
を与え、回答合成装置27において考慮されないように
している。
【0029】 なお、前述のように、測定物体更新デー
タの測定物体名には、通常は、「電話」、「植木鉢」な
どの視覚的に形状を把握することのできる物体名を登録
するが、これとともに、「茶」「緑」といった概念を登
録することもできる(測定物体特徴名の欄にもこの
「茶」「緑」が登録される)。この様な場合には、測定
物体登録データのうちの大きさ範囲の属性の特徴量を上
限、下限とも0しておく。このようにしておくことに
より、例えば、登録した場合に緑のものがなかった場
合、「緑に近い色で植木鉢ぐらいの大きさのものがあり
ます」といった説明ができるようになる。
【0030】ここで、測定物体の各属性の特徴量が予め
登録されている物体のどれに近いかを判定し、その近い
物体名を測定物体名として割りつけていく処理は、図9
の測定物体更新データを使用して行う。
【0031】本実施例では、属性「色」に対する判定
は、上記〔数1〕〔数2〕において既に物体の切り出し
によって行っているために、残りの属性「大きさ」によ
る判定を以下の〔数3〕によって行う。
【数3】
【0032】 上記〔数3〕の実行によって、各属性毎
の測定物体名、即ち「色」の属性と「大きさ」の属性毎
の測定物体名を得られる。ここでは、属性として色およ
び大きさを取っているが、物体の特徴をとらえるものを
さらに付け加えることも可能である。また、測定物体特
徴名とは、測定物体の該当する特徴量の状態の名前で、
「電話」の色の特徴量の測定物体特徴名は「灰」とな
る。一方、大きさのように、相対的な情報が重要で、絶
対的な「大きい」「小さい」という表現では大きさの感
じがつかみにくいような場合、「植木鉢」の大きさの特
徴量の測定物体特徴名を、測定物体名と同じ「植木鉢」
としてもよい。なお、入力計測装置4から出力される基
準位置は、実際には図10に示すm個の配列データであ
る。また、〔数3〕で求めた各属性に対応する測定物体
名、測定物体特徴名を入れて作成した図11の配列デー
タが物体内容Eとして回答合成装置5に出力される。
【0033】 回答合成装置5は、指示認識装置2から
検索範囲W、入力計測装置4から基準位置Wbおよび物
体内容Eを受け取り、まず、検索範囲W内の基準物体名
の基準位置が算出できたかどうか(画像入力内に存在し
ているかどうか)を調べる。画像入力内に存在していな
かった場合には、基準物体が存在しないことを警告メッ
セージとして出力する。警告メッセージは、上記検索範
囲W内の基準物体名と図12の警告登録データとを照合
し、一致した音声出力を選択する。例えば、「机の上に
何がありますか」といった質問に対して、机がない場合
は、「机がありません」という警告メッセージを出力す
る。また、存在していた場合には、基準位置と検索範囲
から、検索範囲の絶対位置である絶対検索範囲を算出す
る。次に、物体内容の重心が絶対検索範囲内にあるもの
を対象物体内容として抜き出す。この状態は図7に示さ
れる。即ち、絶対検索範囲内に重心の存在する測定物体
が対象物体として選択され、この対象物体の物体内容E
が対象物体内容として抽出される。最後に、上記対象物
体内容を各属性の測定物体名が全て一致している場合に
は、その測定物体名を音声出力に変換し、全て一致して
いない場合には、対象物体内容の各属性、測定物体名、
測定物体特徴名を合成して音声出力に変換する。そし
て、音声出力をスピーカ6から出力する。なお、出力手
段は物体の説明が伝わればよいので、音声に代えて画面
出力などの別の方法によって出力することも可能であ
る。
【0034】前記絶対検索範囲は、説明しようとする物
体の検索範囲を示すものであって、入力された指示から
選択された検索範囲の基準物体名に対応する基準位置
と、検索範囲のX/Y幅およびX/Y重心オフセットか
ら算出することができる。この算出方法を下記〔数4〕
に示す。
【数4】
【0035】その後、物体内容の重心位置が算出した絶
対検索範囲内にあるものを選択して、対象物体内容とす
る。
【数5】
【0036】また、対象物体内容から音声出力への変換
は、対象物体内容の各属性の物体名と図6の回答登録デ
ータとを照合し、全て一致した音声出力を選択する。従
って、上記の実施例では、回答登録データの色の測定物
体名と大きさの測定物体名が一致していれば、音声出力
を「XXXがあります」という内容にし、一致していな
ければ、「XXXに近い色で、YYYぐらいの大きさの
ものがあります」という内容にすればよい。
【0037】音声出力の例を示すと次のようになる。い
ずれも、「机の上に何がありますか」の質問に対する音
声出力である。 1)図13の例のように、電話が机の上にあって、植木
鉢が机の左下にある場合。なお、測定物体として電話が
登録されている。 音声出力→「電話があります」 2)図14の例のように、ゴミ箱が机の上にあって、植
木鉢が机の左下にある場合。なお、測定物体としてゴミ
箱が登録されていない。この場合、対象物体内容の色の
測定物体名が「電話」、測定物体特徴名が「灰」で、大
きさの測定物体名および測定物体特徴名が「植木鉢」と
なる。 音声出力→「灰色に近い色で、植木鉢ぐらいの大きさの
ものがあります」 3)図7の例のように、電話とゴミ箱が机の上にあっ
て、植木鉢が机の左下にある場合。なお、測定物体とし
てゴミ箱が登録されていない。 音声出力→「電話があります」「灰色に近い色で、植木
鉢ぐらいの大きさのものがあります」 4)対象物体内容の色の測定物体名および測定物体特徴
名が「緑」という概念で、大きさの測定物体名および測
定物体特徴名がない場合。 音声出力→「緑に近い色のものがあります」 本実施例では、図6に示すように、これらの属性毎の測
定物体名、測定物体特徴名と、音声出力の組み合わせが
予め登録されているため、音声出力の内容は、属性毎の
測定物体名の組み合わせがわかればよい。
【0038】なお、音声出力には、「近い」や「ぐら
い」の表現を加えることによって、より正確な表現とな
るようにしているが、「近い」や「ぐらい」の表現をは
ずすことも可能である。また、既述のように測定物体登
録データに「緑」のような概念の測定物体を登録してお
くことによって、「緑に近い色のものがあります」とい
う内容の出力を行うこともできるようになる。また、図
6では、色の測定物体名と大きさの測定物体名の組合せ
に対する音声出力を予めテーブルで示しているが、この
回答登録データの容量をより小さくするために、測定物
体名の組合せに従って、出力音声を合成するように構成
することも可能である。このような場合には、文章の形
や単語のつなぎ目などに最適なものを選択する必要があ
るために、条件分岐で処理を実行することになる。さら
に、音声出力で、全く同じものが複数ある場合、その数
を音声出力に挿入して、一回の音声出力にすることも容
易に実現出来る。例えば、「電話があります」という音
声出力が2つある場合、回答合成装置5がその状態を検
出し、「電話が2つあります」という音声出力に置き換
えて、音声出力を1回で済ませることが出来る。また、
図15に示すように、マイクロホン1、カメラ3および
スピーカ6を一体化し、これらを使用者の頭部にヘッド
バンド20により固定することで、使用者の頭部の向き
に応じてカメラ3による撮像範囲を自由に変更すること
が出来る。このように構成することにより、物体説明を
行うことの出来る範囲を広く出来、しかも使用者の視線
に応じた範囲の説明を行うことが出来る。
【0039】
【発明の効果】以上説明したように、本発明では、登録
済の物体である場合には、その物体の名前を直接出力
し、登録外の物体である場合には、登録済の物体の名前
と属性とを組み合わせた表現で出力するようにしたこと
によって、登録外の物体が存在する場合に「何かがあり
ます」や「何があるかわかりません」のような出力を避
けて、「XXXに近い色で、YYYに近い大きさのもの
があります」のような出力を行うことができるために、
物体の説明に対して柔軟性を持たせることができる。こ
の場合、指示内容解析手段を設けることにより、基準物
体に対する特定の範囲内の物体の説明を行わせるように
できるために、例えば、基準物体として机を指定した場
合、その机の上に何があるか回答することを指示するこ
とができ、質問に対する物体の説明を行うこともできる
ようになる。また、物体の説明を音声によって行うこと
によって可視出力が困難な環境においての出力が可能で
あり、また、属性が接近していることを表す、「近い」
「ぐらい」などの表現を加えて出力することにより、よ
り本物に近い説明を行うことができる。
【0040】また、カメラ等の入力手段を使用者の頭部
等、身体の一部に固定する手段を設けることにより、使
用者の向く位置の物体説明を行わせることが出来、非常
に実用的となる。さらに、上記基準物体が存在しないと
きには、その旨の警報を行うために、何も出力しないと
いう状況になるのを防止出来る。さらに、音声出力で、
全く同じものが複数ある場合、その数を音声出力に挿入
して、一回の音声出力にすることも容易に実現出来、冗
長な出力がなくなる利点がある。
【図面の簡単な説明】
【図1】本発明の物体説明装置のブロック図である。
【図2】上記物体説明装置の動作を示すフローチャート
である。
【図3】上記物体説明装置に使用する指示登録データの
データ構造を示す図である。
【図4】上記物体説明装置において検索範囲を示すイメ
ージ図である。
【図5】(A),(B)上記物体説明装置の基準物体登
録データ、測定物体登録データのデータ構造を示す図で
ある。
【図6】上記物体説明装置の回答登録データのデータ構
造を示す図である。
【図7】上記物体説明装置において物体を切り出す時の
イメージ図である。
【図8】labeling手順のイメージ図である。
【図9】測定物体更新データのデータ構造を示す図であ
る。
【図10】基準位置データのデータ構造を示す図であ
る。
【図11】物体内容データのデータ構造を示す図であ
る。
【図12】警告登録データのデータ構造を示す図であ
る。
【図13】上記物体説明装置において物体を切り出す時
のイメージ図(他の例)である。
【図14】上記物体説明装置において物体を切り出す時
のイメージ図(他の例)である。
【図15】上記物体説明装置の入力部および出力部の構
成を示す図である。
【符号の説明】
1 マイクロホン 2 指示認識装置 3 カメラ 4 入力計測装置 5 回答合成装置 6 スピーカ 11 指示登録データ 12 基準物体登録データ 13 計測物体登録データ 14 回答登録データ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−231630(JP,A) 特開 平6−76065(JP,A) 特開 平6−36183(JP,A) 特開 平6−301726(JP,A) 特開 平2−98988(JP,A) 増井重弘ほか,風景画の画像理解,第 9回ファジィシステムシンポジウム講演 論文集,日本,第9回ファジィシステム シンポジウム実行委員会,1993年 5月 19日,725−728 福山義幸ほか,機能言語理論による物 語の画像理解に関する一考察,第9回フ ァジィシステムシンポジウム講演論文 集,日本,第9回ファジィシステムシン ポジウム実行委員会,1993年 5月19 日,733−736 増井重弘ほか,ファジィ理論を用いた 風景画の画像理解,日本ファジィ学会 誌,日本,日本ファジィ学会,1994年10 月15日,Vol.6,No.5,1000− 1011 廣田薫ほか,実時間動画理解システム におけるファジィフレームによる知識表 現,第19回知能システムシンポジウム, 日本,1994年 3月23日,SY0002/94 /0000−0053,53−56 (58)調査した分野(Int.Cl.7,DB名) G06T 1/00 280 G06T 7/00 300 G06T 1/00 G06N 7/02 JICSTファイル(JOIS)

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 物体を検出するセンサ手段と、 複数の物体について、物体の名前とこの物体の色、大き
    さなどの複数の属性の特徴量とを含む物体データを予め
    記憶する特徴量記憶手段と、 前記センサ手段の検出データから特定の範囲内に存在す
    る物体の複数の属性についてその特徴量をそれぞれ抽出
    する抽出手段と、 前記抽出手段で抽出した複数の属性の特徴量に基づいて
    前記特徴量記憶手段を検索し、属性毎にその特徴量が対
    応する物体を取り出し、属性毎に取り出した物体が全て
    一致している場合には該物体の名前を出力し、属性毎に
    取り出した物体が全て一致していない場合にはそれらの
    物体の名前又は属性を組み合わせたメッセージを生成し
    出力する物体説明手段と、を備えてなる物体説明装置。
  2. 【請求項2】 入力された指示内容を解析する指示内容
    解析手段を更に備え、前記抽出手段はその解析した内容
    に含まれる物体を基準物体として該基準物体を前記セン
    サ手段の検出データから抽出するとともに、前記特定の
    範囲をこの基準物体の位置を基準として設定することを
    特徴とする、請求項1記載の物体説明装置。
  3. 【請求項3】 前記指示内容解析手段は、音声が入力さ
    れる音声入力手段と、該音声入力手段に入力された音声
    から前記指示内容を解析する手段を含むことを特徴とす
    る、請求項2記載の物体説明装置。
  4. 【請求項4】 前記センサ手段は物体の画像を検出する
    カメラであることを特徴とする、請求項1〜3のいずれ
    かに記載の物体説明装置。
  5. 【請求項5】 前記カメラは、物体説明装置本体の使用
    者の身体への固定部材を備えることを特徴とする、請求
    項4記載の物体説明装置。
  6. 【請求項6】 前記物体説明手段は、前記物体の名前や
    複数の物体の名前又は属性を組合せたメッセージを音声
    出力する請求項1〜5のいずれかに記載の物体説明装
    置。
  7. 【請求項7】 前記物体説明手段は、複数の物体の名前
    と属性とを組み合わせて出力する時に、該組合せに属性
    が接近していることを表す、「近い」「ぐらい」などの
    表現を加えたメッセージを生成することを特徴とする、
    請求項1〜6のいずれかに記載の物体説明装置。
  8. 【請求項8】 前記抽出手段が基準物体を抽出出来なか
    ったときに、その旨を警報出力する手段を備えたことを
    特徴とする請求項2〜3のいずれかに記載の物体説明装
    置。
  9. 【請求項9】 前記物体説明手段は、前記抽出手段によ
    り抽出した特徴量に対応する物体が複数個ある場合に、
    その数も出力することを特徴とする、請求項1〜のい
    ずれかに記載の物体説明装置。
  10. 【請求項10】 音声入力を受け入れ、入力された音声
    入力から、予め基準物体名と検索範囲の記憶されている
    指示登録データに基づいて指示内容を解析して検索範囲
    Wを出力する指示認識装置と、 カメラ等により認識された物体の画像が入力され、該入
    力画像から、予め色、大きさなどの複数の属性の特徴量
    物体名毎に記憶されている基準物体登録データに基づ
    いて、候補となる基準物体の名前および位置を抽出し基
    準位置データWbとして出力する部分、および前記入力
    画像から、予め複数の属性の特徴量が物体名毎に記憶さ
    れている測定物体登録データに基づいて、属性毎にその
    特徴量が対応する測定物体の名前および位置を抽出し、
    物体内容Eとして出力する部分を含む入力計測装置と、 前記指示認識装置および入力計測装置の情報を受け取っ
    て、前記検索範囲内に存在する測定物体の物体内容を前
    記物体内容Eから抽出して対象物体内容を獲得し、該対
    象物体内容の複数の属性の測定物体名が全て一致してい
    るときにはその測定物体名を音声出力に変換し、一部で
    も一致していなければ対象物体内容の複数の属性又は
    属性に対応する複数の測定物体名を組み合わせたメッセ
    ージを生成し、このメッセージを音声出力に変換する回
    答合成装置と、を備えてなる物体説明装置。
  11. 【請求項11】 センサ手段によって物体を検出し、該
    センサ手段の検出データから特定の範囲内に存在する物
    について、色、大きさなどの複数の属性の特徴量を抽
    出し、該抽出手段で抽出した複数の属性の特徴量に基づ
    いて、複数の物体について、物体の名前とこの物体の
    色、大きさなどの複数の属性の特徴量とを含む物体デー
    タを予め記憶する特徴量記憶手段を検索し、属性毎にそ
    の特徴量が対応する物体を取り出し、属性毎に取り出し
    た物体が全て一致している場合には該物体の名前を出力
    し、属性毎に取り出した物体が全て一致していない場合
    にはそれらの物体の名前又は属性を組み合わせたメッセ
    ージを生成し出力することを特徴とする、物体説明方
    法。
  12. 【請求項12】 入力された指示内容を解析し、その解
    析した内容に含まれる物体を基準物体として前記センサ
    手段で検出した検出データから抽出するとともに、前記
    特定の範囲をこの基準物体の位置を基準として設定する
    ことを特徴とする、請求項11記載の物体説明方法。
JP11503495A 1995-01-31 1995-03-20 物体説明装置および物体説明方法 Expired - Fee Related JP3493532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11503495A JP3493532B2 (ja) 1995-01-31 1995-03-20 物体説明装置および物体説明方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP1364995 1995-01-31
JP7-13649 1995-01-31
JP11503495A JP3493532B2 (ja) 1995-01-31 1995-03-20 物体説明装置および物体説明方法

Publications (2)

Publication Number Publication Date
JPH08272946A JPH08272946A (ja) 1996-10-18
JP3493532B2 true JP3493532B2 (ja) 2004-02-03

Family

ID=26349477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11503495A Expired - Fee Related JP3493532B2 (ja) 1995-01-31 1995-03-20 物体説明装置および物体説明方法

Country Status (1)

Country Link
JP (1) JP3493532B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5554804B2 (ja) * 1998-06-23 2014-07-23 雅信 鯨田 風景中の物体等のユーザーによる発見又は認識を支援するシステム
US7356830B1 (en) * 1999-07-09 2008-04-08 Koninklijke Philips Electronics N.V. Method and apparatus for linking a video segment to another segment or information source
JP2015049372A (ja) * 2013-09-02 2015-03-16 有限会社Bruce Interface 外国語学習支援装置及び外国語学習支援プログラム
JP2017098866A (ja) * 2015-11-27 2017-06-01 京セラ株式会社 電子機器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
増井重弘ほか,ファジィ理論を用いた風景画の画像理解,日本ファジィ学会誌,日本,日本ファジィ学会,1994年10月15日,Vol.6,No.5,1000−1011
増井重弘ほか,風景画の画像理解,第9回ファジィシステムシンポジウム講演論文集,日本,第9回ファジィシステムシンポジウム実行委員会,1993年 5月19日,725−728
廣田薫ほか,実時間動画理解システムにおけるファジィフレームによる知識表現,第19回知能システムシンポジウム,日本,1994年 3月23日,SY0002/94/0000−0053,53−56
福山義幸ほか,機能言語理論による物語の画像理解に関する一考察,第9回ファジィシステムシンポジウム講演論文集,日本,第9回ファジィシステムシンポジウム実行委員会,1993年 5月19日,733−736

Also Published As

Publication number Publication date
JPH08272946A (ja) 1996-10-18

Similar Documents

Publication Publication Date Title
US6396954B1 (en) Apparatus and method for recognition and apparatus and method for learning
KR100373666B1 (ko) 정보 처리 장치 및 정보 처리 장치를 사용한 보행자용내비게이션 시스템
US9405986B2 (en) Apparatus and method for recognizing objects using filter information
WO2005066882A1 (ja) 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム
US8121353B2 (en) Apparatus, system and method for mapping information
US20080059199A1 (en) In-vehicle apparatus
US20060195574A1 (en) Server, server system, client server control method and storage medium therefor
US8824805B2 (en) Regional information extraction method, region information output method and apparatus for the same
US20190087736A1 (en) Information processing apparatus, artificial intelligence selection method, and artificial intelligence selection program
JP2005100274A (ja) 情報提供システム、情報検索装置及び情報提供方法
US5893901A (en) Text to voice apparatus accessing multiple gazetteers dependent upon vehicular position
JP3493532B2 (ja) 物体説明装置および物体説明方法
JPH05334373A (ja) 電話案内装置
KR101840597B1 (ko) 복수의 사용자들이 모이기 위한 장소를 추천하는 어플리케이션의 동작 방법
JP3898440B2 (ja) 情報提供システム
JPH11203295A (ja) 情報提供装置および方法
CN110225455B (zh) 智能救援系统的用户精准定位方法及智能救援系统
JP2001134595A (ja) 地理情報システム
JP2011154172A (ja) 地図情報システム、端末装置、サーバ装置およびプログラム
KR20100077505A (ko) 로봇 및 그 제어 방법
WO2019098036A1 (ja) 情報処理装置、情報処理端末、および情報処理方法
CN110609885A (zh) 一种对话处理方法、设备及计算机可读存储介质
KR20070099947A (ko) 명함을 이용한 목적지 검색 기능을 가지는 내비게이션단말기 및 그 방법
EP4131057A1 (en) Information processing device and information processing method
CN113838464B (zh) 一种智能语音交互系统、方法及介质

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081121

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081121

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091121

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees