JP2018147145A - コミュニケーションロボット、制御方法および制御プログラム - Google Patents
コミュニケーションロボット、制御方法および制御プログラム Download PDFInfo
- Publication number
- JP2018147145A JP2018147145A JP2017040189A JP2017040189A JP2018147145A JP 2018147145 A JP2018147145 A JP 2018147145A JP 2017040189 A JP2017040189 A JP 2017040189A JP 2017040189 A JP2017040189 A JP 2017040189A JP 2018147145 A JP2018147145 A JP 2018147145A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- topic
- sentence
- input image
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims description 18
- 239000013598 vector Substances 0.000 claims abstract description 111
- 230000006835 compression Effects 0.000 claims abstract description 14
- 238000007906 compression Methods 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 5
- 239000000470 constituent Substances 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 3
- 230000007717 exclusion Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- WABPQHHGFIMREM-UHFFFAOYSA-N lead(0) Chemical compound [Pb] WABPQHHGFIMREM-UHFFFAOYSA-N 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000036421 sense of balance Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Abstract
Description
第4の発明は、各々が画像データと発話文データとを含む複数のデータセットから、同時発生確率の高い単語の特徴ベクトルをN次元に圧縮したトピックパラメータおよび発話コンテンツ中の各発話文の特徴ベクトルをN次元に圧縮した発話用インデックスを利用して、発話コンテンツから発話文を選択して発話する、コミュニケーションロボットのコンピュータが入力された画像から抽出した単語の特徴ベクトルをトピックパラメータを用いてN次元に圧縮した入力画像ベクトルを生成する入力画像ベクトル生成ステップ、発話用インデックスと入力画像ベクトルとの類似度に応じて発話コンテンツから発話文を選択する選択ステップ、および選択された発話文を出力する発話ステップを実行する、コミュニケーションロボットの制御方法である。
図1に示すロボット10を、肩に装着して人がたとえば散歩に出る。ステップS41では、CPU24は、カメラ22からの画像データをカメラインタフェース34を通して取得する。そして、ステップS43で、プログラム領域36の画像解析プログラム36d(たとえば、Google Cloud Vision:https//cloud.google.com/vision/)を用いて、その画像データからすべての構成要素を抽出して、特徴ベクトルV_sightを生成する。
20 …スピーカ
22 …カメラ
24 …CPU
30 …メモリ
36 …プログラム領域
38 …データ領域
Claims (5)
- 複数の発話文を発話コンテンツとして登録する発話コンテンツ登録部、
各々が画像データと発話文データとを含む複数のデータセットから、同時発生確率の高い単語の特徴ベクトルをN次元に圧縮したトピックラメータを登録するトピックパラメータ登録部、
前記発話コンテンツ中の各発話文の特徴ベクトルをN次元に圧縮した発話用インデックスを登録する発話用インデックス登録部、
入力された画像から抽出した単語の特徴ベクトルをN次元に圧縮した入力画像ベクトルを生成する入力画像ベクトル生成部、
前記発話用インデックスと前記入力画像ベクトルとの類似度に応じて前記発話コンテンツから発話文を選択する選択部、および
前記選択された発話文を出力する発話部を備える、コミュニケーションロボット。 - カメラをさらに備え、前記画像は前記カメラが撮影した画像である、請求項1記載のコミュニケーションロボット。
- 前記発話用インデックス登録部および入力画像ベクトル生成部は、それぞれ前記トピックパラメータを用いてN次元圧縮を行う、請求項1または2記載のコミュニケーションロボット。
- 各々が画像データと発話文データとを含む複数のデータセットから、同時発生確率の高い単語の特徴ベクトルをN次元に圧縮したトピックパラメータおよび発話コンテンツ中の各発話文の特徴ベクトルをN次元に圧縮した発話用インデックスを利用して、発話コンテンツから発話文を選択して発話する、コミュニケーションロボットのコンピュータが、
入力された画像から抽出した単語の特徴ベクトルを前記トピックパラメータを用いてN次元に圧縮した入力画像ベクトルを生成する入力画像ベクトル生成ステップ、
前記発話用インデックスと前記入力画像ベクトルとの類似度に応じて前記発話コンテンツから発話文を選択する選択ステップ、および
前記選択された発話文を出力する発話ステップを実行する、コミュニケーションロボットの制御方法。 - 各々が画像データと発話文データとを含む複数のデータセットから、同時発生確率の高い単語の特徴ベクトルをN次元に圧縮したトピックパラメータおよび発話コンテンツ中の各発話文の特徴ベクトルをN次元に圧縮した発話用インデックスを利用して、発話コンテンツから発話文を選択して発話する、コミュニケーションロボットのコンピュータによって実行される制御プログラムであって、
前記制御プログラムは、前記コンピュータを
入力された画像から抽出した単語の特徴ベクトルを前記トピックパラメータを用いてN次元に圧縮した入力画像ベクトルを生成する入力画像ベクトル生成部、
前記発話用インデックスと前記入力画像ベクトルとの類似度に応じて前記発話コンテンツから発話文を選択する選択部、および
前記選択された発話文を出力する発話部
として機能させる、コミュニケーションロボットの制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017040189A JP6798698B2 (ja) | 2017-03-03 | 2017-03-03 | コミュニケーションロボット、制御方法および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017040189A JP6798698B2 (ja) | 2017-03-03 | 2017-03-03 | コミュニケーションロボット、制御方法および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018147145A true JP2018147145A (ja) | 2018-09-20 |
JP6798698B2 JP6798698B2 (ja) | 2020-12-09 |
Family
ID=63591287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017040189A Active JP6798698B2 (ja) | 2017-03-03 | 2017-03-03 | コミュニケーションロボット、制御方法および制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6798698B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188780A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
JP2004193932A (ja) * | 2002-12-11 | 2004-07-08 | Matsushita Electric Ind Co Ltd | ロボットと、それを首周辺部に固定する機構を備えたネックコミュニケーション装置 |
CN101187990A (zh) * | 2007-12-14 | 2008-05-28 | 华南理工大学 | 一种会话机器人系统 |
JP2009037050A (ja) * | 2007-08-02 | 2009-02-19 | Toyota Motor Corp | 対話装置と対話用プログラム |
JP2015148842A (ja) * | 2014-02-04 | 2015-08-20 | 株式会社東芝 | 対話装置、方法およびプログラム |
-
2017
- 2017-03-03 JP JP2017040189A patent/JP6798698B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188780A (ja) * | 1999-12-28 | 2001-07-10 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
JP2004193932A (ja) * | 2002-12-11 | 2004-07-08 | Matsushita Electric Ind Co Ltd | ロボットと、それを首周辺部に固定する機構を備えたネックコミュニケーション装置 |
JP2009037050A (ja) * | 2007-08-02 | 2009-02-19 | Toyota Motor Corp | 対話装置と対話用プログラム |
CN101187990A (zh) * | 2007-12-14 | 2008-05-28 | 华南理工大学 | 一种会话机器人系统 |
JP2015148842A (ja) * | 2014-02-04 | 2015-08-20 | 株式会社東芝 | 対話装置、方法およびプログラム |
Non-Patent Citations (1)
Title |
---|
石黒 勝彦、外1名: "パターン認識研究者のためのトピックモデリング概観", 電子情報通信学会技術研究報告, vol. 第115巻,第388号, JPN6017041653, 14 December 2015 (2015-12-14), JP, pages 13 - 24, ISSN: 0004364717 * |
Also Published As
Publication number | Publication date |
---|---|
JP6798698B2 (ja) | 2020-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dube et al. | SegMap: Segment-based mapping and localization using data-driven descriptors | |
Kanade et al. | First-person vision | |
Burger et al. | Two-handed gesture recognition and fusion with speech to command a robot | |
Aditya et al. | From images to sentences through scene description graphs using commonsense reasoning and knowledge | |
Wazalwar et al. | Interpretation of sign language into English using NLP techniques | |
US20220292752A1 (en) | Method and device for synthesizing motion sequence of virtual object | |
CN112738556B (zh) | 视频处理方法及装置 | |
Tapu et al. | A computer vision-based perception system for visually impaired | |
Camgöz et al. | Sign language recognition for assisting the deaf in hospitals | |
Zraqou et al. | Real-time objects recognition approach for assisting blind people | |
Sharma et al. | Visual speech recognition using optical flow and hidden Markov model | |
Annapoorani et al. | Blind-Sight: Object Detection with Voice Feedback | |
CN108305629B (zh) | 一种场景学习内容获取方法、装置、学习设备及存储介质 | |
Dewan et al. | A deep learning pipeline for Indian dance style classification | |
JP6798698B2 (ja) | コミュニケーションロボット、制御方法および制御プログラム | |
Ziaei et al. | Prof-Life-Log: Audio Environment Detection for Naturalistic Audio Streams. | |
Choe et al. | Semantic video event search for surveillance video | |
Mustafa et al. | Intelligent Glasses for Visually Impaired People | |
Shirkey et al. | An image mining system for gender classification & age prediction based on facial features | |
Mocanu et al. | An obstacle categorization system for visually impaired people | |
Khalifa et al. | Hand motion modeling for psychology analysis in job interview using optical flow-history motion image: OF-HMI | |
Roy | Learning from multimodal observations | |
Subramanian et al. | Autonomous Obstacle and Object Detection for Visually Impaired With Audio Aid | |
Emanuel et al. | Feasibility study of scripting Indonesian traditional dance motion in XML format | |
Shrawankar et al. | Framing sentences from sign language symbols using NLP |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201013 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201014 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6798698 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |