JPWO2013035670A1 - 物体検索システムおよび物体検索方法 - Google Patents
物体検索システムおよび物体検索方法 Download PDFInfo
- Publication number
- JPWO2013035670A1 JPWO2013035670A1 JP2013532584A JP2013532584A JPWO2013035670A1 JP WO2013035670 A1 JPWO2013035670 A1 JP WO2013035670A1 JP 2013532584 A JP2013532584 A JP 2013532584A JP 2013532584 A JP2013532584 A JP 2013532584A JP WO2013035670 A1 JPWO2013035670 A1 JP WO2013035670A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- database
- search system
- object search
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、本発明の実施の形態1による物体検索システムにおける構成の一例を示す説明図、図2は、図1の物体検索システムに設けられた対話インタフェース装置の一例を示すブロック図、図3は、図2の対話インタフェース装置に設けられた記憶装置に格納されている対話制御プログラムにおける動作の一例を示すフローチャート、図4は、図2の対話インタフェース装置に設けられた記憶装置に格納される色特徴表現データベースにおけるデータ内容の一例を示す説明図、図5は、図2の対話インタフェース装置に設けられた記憶装置に格納される大きさ特徴表現データベースにおけるデータ内容の一例を示す説明図、図6は、図2の対話インタフェース装置に設けられた記憶装置に格納される形状特徴表現データベースにおけるデータ内容の一例を示す説明図、図7は、図2の対話インタフェース装置に設けられた記憶装置に格納される画像データベースのデータ構造、および格納されるデータ内容の一例を示す説明図、図8は、図2の対話インタフェース装置に設けられた記憶装置に格納されている環境設置型カメラ画像データベースにおけるデータ構造、および格納されるデータ内容の一例を示す説明図、図9は、図2の対話インタフェース装置に設けられた記憶装置に格納されている音声認識プログラムにおける動作の一例を示すフローチャート、図10は、図2の対話インタフェース装置に設けられた記憶装置に格納される音声認識辞書の一例を示す概念図である。
本発明の第1の概要は、画像を取得する第1のカメラ(環境設置型カメラ20a〜20c)と、音声対話により物体を検索する対話インタフェース(対話インタフェース10)とを備えた物体検索システム(物体検索システム1)であって、前記対話インタフェースは、前記第1のカメラが取得した画像を格納する第1のデータベース(環境設置型カメラ画像データベース137)と、物体の画像と前記画像に関連するキーワードリストとが格納された第2のデータベース(画像データベース136)と、音声入力された物体名に基づいて、前記第2のデータベースから前記物体名に関連する画像を抽出し、前記第2のデータベースから抽出した前記画像と類似度の高い画像を前記第1のデータベースから検索して抽出する制御部(対話制御プログラム131)とを有するものである。
本実施の形態1において、物体検索システム1は、オフィスなどの実空間に存在する物体を、音声対話によって検索するシステムである。物体検索システム1は、図1に示すように、対話インタフェース装置10、環境設置型カメラ20a〜20c、およびネットワーク30から構成されている。
図2は、対話インタフェース装置10の一例を示すブロック図である。
図3は、記憶装置13に格納されている対話制御プログラム131における動作の一例を示すフローチャートである。
図7は、記憶装置13に格納される画像データベース136のデータ構造、および格納されるデータ内容の一例を示す説明図である。
キー画像抽出サブルーチンの処理は、画像データベース136のキーワードリストに対象となるキーワードが含まれるエントリを、該画像データベース136から検索し、そのエントリの画像を抽出することによってキー画像群を得る。
図8は、環境設置型カメラ画像データベース137におけるデータ構造、および格納されるデータ内容の一例を示す説明図である。
また、対話制御プログラム131における検索画像抽出サブルーチンの処理例について説明する。
〈絞り込み方法決定サブルーチンの処理〉
続いて、対話制御プログラム131における絞り込み方法決定サブルーチンの処理例について説明する。
図9は、音声認識プログラム132における動作の一例を示すフローチャートである。
図10は、記憶装置13に格納される音声認識辞書138の一例を示す概念図である。
辞書作成プログラムは、図10において示す音声認識辞書138のうち、検索依頼部分の物体名に相当する部分を構築する。以下に、2通りの方法を示す。
図11は、本発明の実施の形態2による対話インタフェース装置の一例を示す説明図、図12は、図11の対話インタフェース装置に設けられた記憶装置に格納された対話制御プログラムにおける動作の一例を示すフローチャート、図13は、図11の対話インタフェース装置に設けられた記憶装置に格納された利用者識別データベースのデータ構造、および格納されるデータ内容の一例を示す説明図、図14は、図11の対話インタフェース装置に設けられた記憶装置に格納された利用者データベースのデータ構造のデータ構造、および格納されるデータ内容の一例を示した説明図である。
本実施の形態2においては、物体検索システム1(図1)が後述する利用者データベース156を用いて物体検索を行う例について説明する。物体検索システム1は、前記実施の形態1の図1と同様に、対話インタフェース装置10、環境設置型カメラ20a〜20c、およびネットワーク30から構成されている。
図12は、対話制御プログラム131における動作の一例を示すフローチャートである。
10 対話インタフェース装置
30 ネットワーク
11 バス
13 記憶装置
14 ネットワークインタフェース
15 マイク部
16 スピーカ部
17 カメラ部
18 移動装置
20a 環境設置型カメラ
20b 環境設置型カメラ
20c 環境設置型カメラ
131 対話制御プログラム
132 音声認識プログラム
133 辞書作成プログラム
134 環境画像取得プログラム
136 画像データベース
137 環境設置型カメラ画像データベース
138 音声認識辞書
139 音声認識音響モデル
155 利用者識別データベース
156 利用者データベース
Claims (15)
- 画像を取得する第1のカメラと、音声対話により物体を検索する対話インタフェースとを備えた物体検索システムであって、
前記対話インタフェースは、
前記第1のカメラが取得した画像を格納する第1のデータベースと、
物体の画像と前記画像に関連するキーワードリストとが格納された第2のデータベースと、
音声入力された物体名に基づいて、前記第2のデータベースから前記物体名に関連する画像を抽出し、前記第2のデータベースから抽出した前記画像と類似度の高い画像を前記第1のデータベースから検索して抽出する制御部とを有することを特徴とする物体検索システム。 - 請求項1記載の物体検索システムにおいて、
前記対話インタフェースは、
音声を取得するマイクと、
前記マイクが取得した音声を認識する音声認識部とを有し、
前記制御部は、
前記マイクが取得した音声を前記音声認識部が認識することにより、前記物体名を得ることを特徴とする物体検索システム。 - 請求項2記載の物体検索システムにおいて、
前記音声認識部における音声認識の言語モデルは、
前記第2のデータベースに格納された物体名を用いることを特徴とする物体検索システム。 - 請求項1記載の物体検索システムにおいて、
前記第1のデータベースは、
前記第1のカメラが取得した画像と、前記画像に関連する画像情報とが格納され、
前記制御部は、
前記第1のデータベースから、類似度の高い画像を検索して抽出した際に、前記第1のデータベースの画像情報に含まれる撮影位置の情報を出力することを特徴とする物体検索システム。 - 請求項1記載の物体検索システムにおいて、
前記対話インタフェースは、
利用者を識別する利用者識別子と前記利用者識別子と関連付けされた語彙、およびその語彙の特徴のリストからなる利用者情報とを格納する第3のデータベースと、
前記第3のデータベースから該当する前記利用者識別子と関連付けされた利用者情報を抽出する利用者認識部とを有し、
前記制御部は、
前記利用者認識部が抽出した前記利用者情報に含まれる特徴に則した類似度を決定し、その類似度に基づいて、前記第1のデータベースから抽出した画像を抽出することを特徴とする物体検索システム。 - 請求項5記載の物体検索システムにおいて、
前記対話インタフェースは、
画像を取得する第2のカメラと、
顔画像、および前記顔画像に関連付けされた利用者識別子を格納した第4のデータベースと、をさらに有し、
前記利用者認識部は、
前記第2のカメラが取得した画像から顔領域を検出し、前記第4のデータベースを検索し、前記顔画像に関連付けされた前記利用者識別子を抽出することを特徴とする物体検索システム。 - 請求項1記載の物体検索システムにおいて、
前記制御部は、
インターネットをクローリングしてhtmlページを取得し、前記htmlページから、物体の画像、および前記画像のキーワードを取得し、前記第2のデータベースに格納することを特徴とする物体検索システム。 - 請求項1記載の物体検索システムにおいて、
前記制御部は、
前記第1のデータベースから抽出した類似度の高い画像が複数ある場合に、検索する物体の特徴表現に基づいて、複数の前記画像から類似度の高い画像を抽出することを特徴とする物体検索システム。 - 請求項8記載の物体検索システムにおいて、
前記制御部が用いる特徴表現は、物体の色、大きさ、または形の少なくとも1つであることを特徴とする物体検索システム。 - 請求項8記載の物体検索システムにおいて、
前記制御部は、
前記第1のデータベースから抽出した類似度の高い画像が複数ある場合に、複数の前記画像を前記特徴表現に基づき特徴空間に配置し、特徴空間内での分布の形状に応じて物体の特徴の種類を決定することを特徴とする物体検索システム。 - 請求項1記載の物体検索システムにおいて、
前記対話インタフェースは、
前記対話インタフェースを移動させる移動手段を有し、前記対話インタフェースを任意の位置に移動可能であることを特徴とする物体検索システム。 - 請求項11記載の物体検索システムにおいて、
前記移動手段は、
前記第1のデータベースから、類似度の高い画像を検索して抽出した際に、前記第1のデータベースの画像情報に含まれる撮影位置の情報に基づいて、前記対話インタフェースを移動させることを特徴とする物体検索システム。 - 請求項11記載の物体検索システムにおいて、
前記対話インタフェースは、
前記第1のカメラを有する構成からなることを特徴とする物体検索システム。 - 画像を取得する第1のカメラと、音声対話により物体を検索する対話インタフェースとを備えた物体検索システムにより、物体を検索する物体検索方法であって、
前記第1のカメラが取得した画像を第1のデータベースに格納するステップと、
物体の画像と前記画像に関連するキーワードリストとを第2のデータベースに格納するステップと、
入力された音声を認識して得られた物体名に基づいて、前記対話インタフェースが前記第2のデータベースから前記物体名に関連する画像を抽出し、前記第2のデータベースから抽出した前記画像と類似度の高い画像を前記第1のデータベースから検索して抽出するステップとを有することを特徴とする物体検索方法。 - 請求項13記載の物体検索方法において、
前記第1のカメラが取得した画像を前記第1のデータベースに格納する際に、前記画像に関連する画像情報を対応付けして格納し、
前記画像と類似度の高い画像を前記第1のデータベースから検索して抽出する際に、前記第1のデータベースの画像情報に含まれる撮影位置の情報を出力し、
前記音声を認識する際における音声認識の言語モデルは、
前記第2のデータベースに格納された物体名を用いることを特徴とする物体検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013532584A JP5844375B2 (ja) | 2011-09-09 | 2012-09-03 | 物体検索システムおよび物体検索方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011196617 | 2011-09-09 | ||
JP2011196617 | 2011-09-09 | ||
PCT/JP2012/072363 WO2013035670A1 (ja) | 2011-09-09 | 2012-09-03 | 物体検索システムおよび物体検索方法 |
JP2013532584A JP5844375B2 (ja) | 2011-09-09 | 2012-09-03 | 物体検索システムおよび物体検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013035670A1 true JPWO2013035670A1 (ja) | 2015-03-23 |
JP5844375B2 JP5844375B2 (ja) | 2016-01-13 |
Family
ID=47832115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013532584A Expired - Fee Related JP5844375B2 (ja) | 2011-09-09 | 2012-09-03 | 物体検索システムおよび物体検索方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5844375B2 (ja) |
WO (1) | WO2013035670A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013594A (ja) * | 2019-09-03 | 2020-01-23 | 株式会社メルカリ | 情報処理方法、プログラム、及び情報処理装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017016296A (ja) * | 2015-06-30 | 2017-01-19 | シャープ株式会社 | 画像表示装置 |
JP6943192B2 (ja) * | 2018-01-24 | 2021-09-29 | 沖電気工業株式会社 | 家電機器および場所検索システム |
US20220083596A1 (en) * | 2019-01-17 | 2022-03-17 | Sony Group Corporation | Information processing apparatus and information processing method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002101315A (ja) * | 2000-09-22 | 2002-04-05 | Ricoh Co Ltd | リモコン装置および遠隔制御方法 |
WO2010044204A1 (ja) * | 2008-10-15 | 2010-04-22 | パナソニック株式会社 | 光投射装置 |
WO2010073905A1 (ja) * | 2008-12-25 | 2010-07-01 | シャープ株式会社 | 動画像視聴装置 |
-
2012
- 2012-09-03 WO PCT/JP2012/072363 patent/WO2013035670A1/ja active Application Filing
- 2012-09-03 JP JP2013532584A patent/JP5844375B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002101315A (ja) * | 2000-09-22 | 2002-04-05 | Ricoh Co Ltd | リモコン装置および遠隔制御方法 |
WO2010044204A1 (ja) * | 2008-10-15 | 2010-04-22 | パナソニック株式会社 | 光投射装置 |
WO2010073905A1 (ja) * | 2008-12-25 | 2010-07-01 | シャープ株式会社 | 動画像視聴装置 |
Non-Patent Citations (2)
Title |
---|
NELSON, R. C.: "Tracking Objects using Recognition", IN INTERNATIONAL CONFERENCE ON PATTERN RECOGNTION, JPN7012004512, 2002, pages 1 - 14, ISSN: 0003016671 * |
NGUYEN THI HOANG LIEN: "低価格カメラを使った探し物支援システム", 情報処理学会第71回(平成21年)全国大会講演論文集(2), JPN6012057816, 10 March 2009 (2009-03-10), JP, pages 2 - 11, ISSN: 0003016670 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013594A (ja) * | 2019-09-03 | 2020-01-23 | 株式会社メルカリ | 情報処理方法、プログラム、及び情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5844375B2 (ja) | 2016-01-13 |
WO2013035670A1 (ja) | 2013-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102081925B1 (ko) | 디스플레이 디바이스 및 스피치 검색 방법 | |
CN106875941B (zh) | 一种服务机器人的语音语义识别方法 | |
CN107330120B (zh) | 询问应答方法、询问应答装置及计算机可读存储介质 | |
KR20200046117A (ko) | 공동 오디오-비디오 얼굴 애니메이션 시스템 | |
US20170011742A1 (en) | Device and method for understanding user intent | |
CN110415679B (zh) | 语音纠错方法、装置、设备和存储介质 | |
CN109920415A (zh) | 基于语音识别的人机问答方法、装置、设备和存储介质 | |
CN109947971B (zh) | 图像检索方法、装置、电子设备及存储介质 | |
CN110910903B (zh) | 语音情绪识别方法、装置、设备及计算机可读存储介质 | |
KR20210052036A (ko) | 복수 의도어 획득을 위한 합성곱 신경망을 가진 장치 및 그 방법 | |
US20210110815A1 (en) | Method and apparatus for determining semantic meaning of pronoun | |
JP5844375B2 (ja) | 物体検索システムおよび物体検索方法 | |
EP3980991B1 (en) | System and method for recognizing user's speech | |
KR20210020656A (ko) | 인공 지능을 이용한 음성 인식 방법 및 그 장치 | |
CN112465144A (zh) | 基于有限知识的多模态示范意图生成方法及装置 | |
CN107424612A (zh) | 处理方法、装置和机器可读介质 | |
CN107170447B (zh) | 声音处理系统以及声音处理方法 | |
KR20220109238A (ko) | 사용자의 발화 입력에 관련된 추천 문장을 제공하는 디바이스 및 방법 | |
KR20210042520A (ko) | 전자 장치 및 이의 제어 방법 | |
WO2003102816A1 (fr) | Systeme fournisseur de donnees | |
JP2020204711A (ja) | 登録システム | |
US11657805B2 (en) | Dynamic context-based routing of speech processing | |
US11289091B2 (en) | Contextual voice-based presentation assistance | |
CN114299295A (zh) | 一种数据处理方法及相关装置 | |
CN109920408B (zh) | 基于语音识别的字典项设置方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150303 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150417 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150907 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20150914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5844375 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |