JP2019090945A - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP2019090945A JP2019090945A JP2017220157A JP2017220157A JP2019090945A JP 2019090945 A JP2019090945 A JP 2019090945A JP 2017220157 A JP2017220157 A JP 2017220157A JP 2017220157 A JP2017220157 A JP 2017220157A JP 2019090945 A JP2019090945 A JP 2019090945A
- Authority
- JP
- Japan
- Prior art keywords
- response
- voice
- unit
- output
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 54
- 230000004044 response Effects 0.000 claims abstract description 118
- 238000004891 communication Methods 0.000 claims description 42
- 230000001934 delay Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Manipulator (AREA)
Abstract
Description
Claims (5)
- ユーザにより発話された音声の音声データを取得する取得部と、
前記音声データの取得完了から、前記音声が音声認識された音声認識結果に基づいて生成された応答の出力開始までの時間に応じて相槌のタイミングを決定する決定部と、
前記決定されたタイミングで前記相槌を出力し、前記応答を出力する出力部と、
を備えることを特徴とする情報処理装置。 - 前記音声データの取得完了から前記応答の出力開始までに要する時間は、前記音声データのサイズ、または、前記音声認識結果のデータサイズに基づいて決定されることを特徴とする請求項1に記載の情報処理装置。
- 前記決定部は、前記音声データの取得から前記相槌の出力までの時間が、前記相槌の出力から前記応答の出力までの時間より短くなるように、前記相槌のタイミングを決定することを特徴とする請求項1または2に記載の情報処理装置。
- 前記決定部は、前記音声データのサイズ、または、前記音声認識結果のデータサイズが大きいほど、前記相槌のタイミングを遅くすることを特徴とする請求項1から3のいずれかに記載の情報処理装置。
- ユーザにより発話された音声の音声データを取得する取得部と、
前記音声が音声認識された音声認識結果を、当該音声認識結果をもとに前記音声に対する応答を作成するサーバ装置に送信し、前記サーバ装置から前記応答を取得する通信部と、
前記通信部が前記音声認識結果を前記サーバ装置に送信した場合に、前記音声データの取得完了から前記応答の出力開始までの時間に応じて相槌のタイミングを決定する決定部と、
前記決定部にて決定されたタイミングで前記相槌を出力してから、前記応答を出力する出力部と、
を備えることを特徴とする情報処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017220157A JP6904225B2 (ja) | 2017-11-15 | 2017-11-15 | 情報処理装置 |
US16/179,012 US10896677B2 (en) | 2017-11-15 | 2018-11-02 | Voice interaction system that generates interjection words |
CN201811307472.6A CN109785830B (zh) | 2017-11-15 | 2018-11-05 | 信息处理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017220157A JP6904225B2 (ja) | 2017-11-15 | 2017-11-15 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019090945A true JP2019090945A (ja) | 2019-06-13 |
JP6904225B2 JP6904225B2 (ja) | 2021-07-14 |
Family
ID=66433518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017220157A Active JP6904225B2 (ja) | 2017-11-15 | 2017-11-15 | 情報処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10896677B2 (ja) |
JP (1) | JP6904225B2 (ja) |
CN (1) | CN109785830B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021530794A (ja) | 2018-07-17 | 2021-11-11 | アイ・ティー スピークス エル・エル・シーiT SpeeX LLC | インテリジェントアシスタントおよび産業機械とのやり取りのための方法、システム、および、コンピュータプログラム製品 |
CN111429899A (zh) * | 2020-02-27 | 2020-07-17 | 深圳壹账通智能科技有限公司 | 基于人工智能的语音响应处理方法、装置、设备及介质 |
JP7314102B2 (ja) * | 2020-07-09 | 2023-07-25 | Tvs Regza株式会社 | 制御信号生成回路、受信装置、システム、生成方法、およびプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004151527A (ja) * | 2002-10-31 | 2004-05-27 | Mitsubishi Electric Corp | 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム |
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP2017021125A (ja) * | 2015-07-09 | 2017-01-26 | ヤマハ株式会社 | 音声対話装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
JP4992925B2 (ja) * | 2009-03-23 | 2012-08-08 | トヨタ自動車株式会社 | 音声対話装置及びプログラム |
CN103339623B (zh) * | 2010-09-08 | 2018-05-25 | 纽昂斯通讯公司 | 涉及因特网搜索的方法和设备 |
EP3399521B1 (en) * | 2013-05-31 | 2020-04-15 | Yamaha Corporation | Technology for responding to remarks using speech synthesis |
JP2017107078A (ja) * | 2015-12-10 | 2017-06-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、音声対話装置及び音声対話プログラム |
-
2017
- 2017-11-15 JP JP2017220157A patent/JP6904225B2/ja active Active
-
2018
- 2018-11-02 US US16/179,012 patent/US10896677B2/en active Active
- 2018-11-05 CN CN201811307472.6A patent/CN109785830B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004151527A (ja) * | 2002-10-31 | 2004-05-27 | Mitsubishi Electric Corp | 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム |
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP2017021125A (ja) * | 2015-07-09 | 2017-01-26 | ヤマハ株式会社 | 音声対話装置 |
Non-Patent Citations (1)
Title |
---|
西村良太,中川聖一: "応答タイミングを考慮した音声対話システムとその評価", 情報処理学会研究報告, vol. Vol.2009-SLP-77,No.22, JPN6016050139, 15 August 2009 (2009-08-15), pages 1 - 6, ISSN: 0004462267 * |
Also Published As
Publication number | Publication date |
---|---|
CN109785830A (zh) | 2019-05-21 |
US10896677B2 (en) | 2021-01-19 |
CN109785830B (zh) | 2023-09-12 |
JP6904225B2 (ja) | 2021-07-14 |
US20190147872A1 (en) | 2019-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5753869B2 (ja) | 音声認識端末およびコンピュータ端末を用いる音声認識方法 | |
US10891952B2 (en) | Speech recognition | |
US9583102B2 (en) | Method of controlling interactive system, method of controlling server, server, and interactive device | |
WO2014208231A1 (ja) | ローカルな音声認識を行なう音声認識クライアント装置 | |
US10192550B2 (en) | Conversational software agent | |
US10140988B2 (en) | Speech recognition | |
JP2017107078A (ja) | 音声対話方法、音声対話装置及び音声対話プログラム | |
JP2017535809A (ja) | サウンド検出モデルを生成するためのサウンドサンプル検証 | |
US20170256259A1 (en) | Speech Recognition | |
CN107871503A (zh) | 语音对话系统以及发声意图理解方法 | |
JP2010152119A (ja) | 応答生成装置及びプログラム | |
JP2014191029A (ja) | 音声認識システムおよび音声認識システムの制御方法 | |
JP2019090945A (ja) | 情報処理装置 | |
JP2019090942A (ja) | 情報処理装置、情報処理システム、情報処理方法、および情報処理プログラム | |
JP2018109663A (ja) | 音声処理装置、対話システム、端末装置、プログラム及び音声処理方法 | |
JP2018045202A (ja) | 音声対話システムおよび音声対話方法 | |
JP2007328283A (ja) | 対話装置、プログラム、及び対話方法 | |
US8355484B2 (en) | Methods and apparatus for masking latency in text-to-speech systems | |
JPWO2018135276A1 (ja) | 言動制御装置、ロボット、制御プログラムおよび言動制御装置の制御方法 | |
JP6468258B2 (ja) | 音声対話装置および音声対話方法 | |
JP6559417B2 (ja) | 情報処理装置、情報処理方法、対話システム、および制御プログラム | |
JP2015087649A (ja) | 発話制御装置、方法、発話システム、プログラム、及び発話装置 | |
JP2018081147A (ja) | コミュニケーション装置、サーバ、制御方法、および情報処理プログラム | |
JP7303091B2 (ja) | 制御装置、電子機器、制御装置の制御方法および制御プログラム | |
JP2017122930A (ja) | 発話制御装置、方法、発話システム、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210607 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6904225 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |