JP2019211754A - ヒューマンマシンインタラクションに使用される方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 - Google Patents
ヒューマンマシンインタラクションに使用される方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP2019211754A JP2019211754A JP2019043632A JP2019043632A JP2019211754A JP 2019211754 A JP2019211754 A JP 2019211754A JP 2019043632 A JP2019043632 A JP 2019043632A JP 2019043632 A JP2019043632 A JP 2019043632A JP 2019211754 A JP2019211754 A JP 2019211754A
- Authority
- JP
- Japan
- Prior art keywords
- user
- feedback
- preset
- machine interaction
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000008451 emotion Effects 0.000 claims abstract description 71
- 238000013507 mapping Methods 0.000 claims abstract description 20
- 230000005236 sound signal Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 7
- 230000002996 emotional effect Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000000994 depressogenic effect Effects 0.000 description 6
- 239000003086 colorant Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 206010027940 Mood altered Diseases 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000881 depressing effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006397 emotional response Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Child & Adolescent Psychology (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (18)
- クラウドでユーザからの音声命令に使用される単語を識別するステップと、
前記単語と、感情と、フィードバックとの間の予め設定されたマッピングに基づいて、前記音声命令に含まれる感情、及び前記ユーザに提供される、前記感情に適応する前記フィードバックを決定するステップと、
前記フィードバックを前記ユーザに提供するステップと、を含むことを特徴とするヒューマンマシンインタラクションに使用される方法 - ユーザからの音声命令に使用される単語を識別するステップは、
前記音声命令を含むオーディオ信号を取得するステップと、
前記音声命令をテキスト情報に変換するステップと、
前記テキスト情報から前記単語を抽出するステップと、を含むことを特徴とする請求項1に記載の方法。 - 前記フィードバックを前記ユーザに提供するステップは、
予め設定された色彩を前記ユーザに表示するステップと、
予め設定された音声を前記ユーザに再生するステップと、
予め設定されたビデオを前記ユーザに再生するステップと、
前記ユーザが使用している機器の温度を変化させるステップとのうち、少なくとも一つを含むことを特徴とする請求項1に記載の方法。 - 前記予め設定されたマッピングは、単語、感情及びフィードバックの履歴情報に基づいて訓練して取得されることを特徴とする請求項1に記載の方法。
- クラウドにユーザからの音声命令を含むオーディオ信号を送信するステップと、
前記クラウドから情報を受信し、前記情報は、前記ユーザに提供されるフィードバックを指示し、前記フィードバックが前記音声命令に含まれる感情に適応するステップと、
前記ユーザに前記フィードバックを提供するステップと、を含むことを特徴とするヒューマンマシンインタラクションに使用される方法。 - 前記ユーザに前記フィードバックを提供するステップは、
予め設定された色彩を前記ユーザに表示するステップと、
予め設定された音声を前記ユーザに再生するステップと、
予め設定されたビデオを前記ユーザに再生するステップと、
前記ユーザが使用している機器の温度を変化させるステップとのうち、少なくとも一つを含むことを特徴とする請求項5に記載の方法。 - 前記情報は、前記ユーザに再生される、予め設定された音声を示すテキスト情報を含み、前記ユーザに前記フィードバックを提供するステップは、
前記テキスト情報を前記予め設定された音声に変換するステップを含むことを特徴とする請求項5に記載の方法。 - クラウドでユーザからの音声命令に使用される単語を識別するように構成される識別モジュールと、
前記単語と、感情と、フィードバックとの間の予め設定されたマッピングに基づいて、前記音声命令に含まれる感情、及び前記ユーザに提供される、前記感情に適応する前記フィードバックを決定するように構成される決定モジュールと、
前記フィードバックを前記ユーザに提供するように構成される提供モジュールと、を含むことを特徴とするヒューマンマシンインタラクションに使用される装置。 - 前記識別モジュールは、
前記音声命令を含むオーディオ信号を取得するように構成される取得モジュールと、
前記音声命令をテキスト情報に変換するように構成される変換モジュールと、
前記テキスト情報から前記単語を抽出するように構成される抽出モジュールと、を含む、
ことを特徴とする請求項8に記載の装置。 - 前記提供モジュールは、さらに、
予め設定された色彩を前記ユーザに表示することと、
予め設定された音声を前記ユーザに再生することと、
予め設定されたビデオを前記ユーザに再生することと、
前記ユーザが使用している機器の温度を変化させることとのうち、少なくとも一つを行うように構成されることを特徴とする請求項8に記載の装置。 - 前記予め設定されたマッピングは、単語、感情及びフィードバックの履歴情報に基づいて訓練して取得されることを特徴とする請求項8に記載の装置。
- クラウドにユーザからの音声命令を含むオーディオ信号を送信するように構成される送信モジュールと、
前記クラウドから情報を受信し、前記情報は、前記ユーザに提供されるフィードバックを指示し、前記フィードバックが前記音声命令に含まれる感情に適応するように構成される受信モジュールと、
前記ユーザに前記フィードバックを提供するように構成されるフィードバックモジュールと、を含むことを特徴とするヒューマンマシンインタラクションに使用される装置。 - 前記フィードバックモジュールは、さらに、
予め設定された色彩を前記ユーザに表示することと、
予め設定された音声を前記ユーザに再生することと、
予め設定されたビデオを前記ユーザに再生することと、
前記装置の温度を変化させることとのうち、少なくとも一つを行うように構成されることを特徴とする請求項12に記載の装置。 - 前記情報は、前記ユーザに再生される予め設定された音声を示すテキスト情報を含み、前記フィードバックモジュールは、
前記テキスト情報を前記予め設定された音声に変換するように構成される変換モジュールを含むことを特徴とする請求項12に記載の装置。 - 一つ又は複数のプロセッサと、
一つ又は複数のプログラムを記憶するための記憶装置と、を含む電子機器であって、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサによって実行される場合、前記一つ又は複数のプロセッサが請求項1から4のいずれかに記載の方法を実現することを特徴とする電子機器。 - 一つ又は複数のプロセッサと、
一つ又は複数のプログラムを記憶するための記憶装置と、を含む電子機器であって、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサによって実行される場合、前記一つ又は複数のプロセッサが請求項5から7のいずれかに記載の方法を実現する、
ことを特徴とする電子機器。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行される場合、請求項1から4のいずれかに記載の方法を実現することを特徴とするコンピュータ読み取り可能な記憶媒体。
- コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行される場合、請求項5から7のいずれかに記載の方法を実現することを特徴とするコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810564314.2A CN108877794A (zh) | 2018-06-04 | 2018-06-04 | 用于人机交互的方法、装置、电子设备和计算机可读存储介质 |
CN201810564314.2 | 2018-06-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019211754A true JP2019211754A (ja) | 2019-12-12 |
JP6810764B2 JP6810764B2 (ja) | 2021-01-06 |
Family
ID=64335954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019043632A Active JP6810764B2 (ja) | 2018-06-04 | 2019-03-11 | ヒューマンマシンインタラクションに使用される方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20190371319A1 (ja) |
JP (1) | JP6810764B2 (ja) |
CN (1) | CN108877794A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109697290B (zh) * | 2018-12-29 | 2023-07-25 | 咪咕数字传媒有限公司 | 一种信息处理方法、设备及计算机存储介质 |
CN110060682B (zh) * | 2019-04-28 | 2021-10-22 | Oppo广东移动通信有限公司 | 音箱控制方法和装置 |
CN110197659A (zh) * | 2019-04-29 | 2019-09-03 | 华为技术有限公司 | 基于用户画像的反馈方法、装置及系统 |
CN110187862A (zh) * | 2019-05-29 | 2019-08-30 | 北京达佳互联信息技术有限公司 | 语音消息显示方法、装置、终端及存储介质 |
CN110600002B (zh) * | 2019-09-18 | 2022-04-22 | 北京声智科技有限公司 | 语音合成方法、装置及电子设备 |
KR20210046334A (ko) * | 2019-10-18 | 2021-04-28 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003132085A (ja) * | 2001-10-19 | 2003-05-09 | Pioneer Electronic Corp | 情報選択装置及び方法、情報選択再生装置並びに情報選択のためのコンピュータプログラム |
KR20090046003A (ko) * | 2007-11-05 | 2009-05-11 | 주식회사 마이크로로봇 | 로봇 완구 장치 |
JP2014003593A (ja) * | 2012-06-19 | 2014-01-09 | International Business Maschines Corporation | 表情及び声の感情の認識及びフィードバック |
JP2016014967A (ja) * | 2014-07-01 | 2016-01-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 情報管理方法 |
CN107450367A (zh) * | 2017-08-11 | 2017-12-08 | 上海思依暄机器人科技股份有限公司 | 一种语音透传方法、装置及机器人 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992715A (zh) * | 2015-05-18 | 2015-10-21 | 百度在线网络技术(北京)有限公司 | 一种智能设备的界面切换方法及系统 |
CN105807933B (zh) * | 2016-03-18 | 2019-02-12 | 北京光年无限科技有限公司 | 一种用于智能机器人的人机交互方法及装置 |
CN105895087B (zh) * | 2016-03-24 | 2020-02-07 | 海信集团有限公司 | 一种语音识别方法及装置 |
CN106531162A (zh) * | 2016-10-28 | 2017-03-22 | 北京光年无限科技有限公司 | 一种用于智能机器人的人机交互方法及装置 |
-
2018
- 2018-06-04 CN CN201810564314.2A patent/CN108877794A/zh active Pending
-
2019
- 2019-02-20 US US16/281,076 patent/US20190371319A1/en not_active Abandoned
- 2019-03-11 JP JP2019043632A patent/JP6810764B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003132085A (ja) * | 2001-10-19 | 2003-05-09 | Pioneer Electronic Corp | 情報選択装置及び方法、情報選択再生装置並びに情報選択のためのコンピュータプログラム |
KR20090046003A (ko) * | 2007-11-05 | 2009-05-11 | 주식회사 마이크로로봇 | 로봇 완구 장치 |
JP2014003593A (ja) * | 2012-06-19 | 2014-01-09 | International Business Maschines Corporation | 表情及び声の感情の認識及びフィードバック |
JP2016014967A (ja) * | 2014-07-01 | 2016-01-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 情報管理方法 |
CN107450367A (zh) * | 2017-08-11 | 2017-12-08 | 上海思依暄机器人科技股份有限公司 | 一种语音透传方法、装置及机器人 |
Non-Patent Citations (1)
Title |
---|
秋山 史門 他: ""ThermOn− 温冷覚呈示による音楽の情動性拡張メディアインタフェース"", インタラクション2013 情報処理学会 シンポジウムシリーズ VOL.2013 NO.1 [CD−R, JPN6020046567, 19 April 2013 (2013-04-19), pages 356 - 360, ISSN: 0004399287 * |
Also Published As
Publication number | Publication date |
---|---|
JP6810764B2 (ja) | 2021-01-06 |
CN108877794A (zh) | 2018-11-23 |
US20190371319A1 (en) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6810764B2 (ja) | ヒューマンマシンインタラクションに使用される方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 | |
US11302302B2 (en) | Method, apparatus, device and storage medium for switching voice role | |
CN108000526B (zh) | 用于智能机器人的对话交互方法及系统 | |
CN109410927B (zh) | 离线命令词与云端解析结合的语音识别方法、装置和系统 | |
CN110598576B (zh) | 一种手语交互方法、装置及计算机介质 | |
CN106959839A (zh) | 一种人机交互装置及方法 | |
AU2016277548A1 (en) | A smart home control method based on emotion recognition and the system thereof | |
RU2653283C2 (ru) | Способ диалога между машиной, такой как гуманоидный робот, и собеседником-человеком, компьютерный программный продукт и гуманоидный робот для осуществления такого способа | |
CN104488027A (zh) | 声音处理系统以及终端装置 | |
US10783884B2 (en) | Electronic device-awakening method and apparatus, device and computer-readable storage medium | |
CN105723360A (zh) | 利用情感调节改进自然语言交互 | |
CN103116576A (zh) | 一种语音手势交互翻译装置及其控制方法 | |
US11062708B2 (en) | Method and apparatus for dialoguing based on a mood of a user | |
JP2018008316A (ja) | 学習型ロボット、学習型ロボットシステム、及び学習型ロボット用プログラム | |
CN108052250A (zh) | 基于多模态交互的虚拟偶像演绎数据处理方法及系统 | |
CN203149569U (zh) | 一种语音手势交互翻译装置 | |
CN112735423B (zh) | 语音交互方法、装置、电子设备及存储介质 | |
CN113793398A (zh) | 基于语音交互的绘画方法与装置、存储介质和电子设备 | |
CN109343695A (zh) | 基于虚拟人行为标准的交互方法及系统 | |
CN111105776A (zh) | 有声播放装置及其播放方法 | |
CN113205569B (zh) | 图像绘制方法及装置、计算机可读介质和电子设备 | |
CN205451551U (zh) | 一种语音识别驱动的增强现实人机交互视频语言学习系统 | |
CN109460548A (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
CN105303909B (zh) | 一种基于振动学习英文的方法、装置和系统 | |
JP2021117371A (ja) | 情報処理装置、情報処理方法および情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6810764 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |