JP2021117296A - エージェントシステム、端末装置およびエージェントプログラム - Google Patents
エージェントシステム、端末装置およびエージェントプログラム Download PDFInfo
- Publication number
- JP2021117296A JP2021117296A JP2020009263A JP2020009263A JP2021117296A JP 2021117296 A JP2021117296 A JP 2021117296A JP 2020009263 A JP2020009263 A JP 2020009263A JP 2020009263 A JP2020009263 A JP 2020009263A JP 2021117296 A JP2021117296 A JP 2021117296A
- Authority
- JP
- Japan
- Prior art keywords
- user
- voice
- agent
- terminal device
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims description 28
- 230000004044 response Effects 0.000 claims description 11
- 238000012546 transfer Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 abstract description 23
- 230000002452 interceptive effect Effects 0.000 abstract 4
- 239000003795 chemical substances by application Substances 0.000 description 107
- 238000000034 method Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
Description
本実施形態に係るエージェントシステムおよび端末装置の構成について、図1および図2を参照しながら説明する。本実施形態に係るエージェントシステム、端末装置およびエージェントプログラムは、ユーザに対して、複数の音声対話エージェント(以下、「エージェント」という)のサービスを提供するためのものである。
車両10は、図2に示すように、車載装置11と、通信部12と、記憶部13と、を備えている。車載装置11は、例えば車両10に搭載されるカーナビゲーション装置である。車載装置11は、制御部111と、表示部(ディスプレイ)112と、ボタン113と、マイク114と、スピーカ115と、を備えている。
(1)「エージェントB、今日の天気を教えて」と発話
(2)ボタン113を押下して「今日の天気を教えて」と発話
(3)「エージェントA、エージェントB、今日の天気を教えて」と発話
第一VPAサーバ20は、制御部21と、通信部22と、記憶部23と、を備えている。通信部22および記憶部23の物理的な構成は、通信部12および記憶部13と同様である。
第二VPAサーバ30は、制御部31と、通信部32と、記憶部33と、を備えている。制御部31、通信部32および記憶部33の物理的な構成は、制御部21、通信部12および記憶部13と同様である。制御部31は、記憶部33に格納された音声対話エージェントのプログラムの実行を通じて、音声対話エージェントの機能を実現する。また、制御部31は、記憶部33に格納されたプログラムの実行を通じて、音声認識部311として機能する。
本実施形態に係るエージェントシステム1および端末装置が実行する音声対話方法の処理手順について、図3を参照しながら説明する。以下では、ユーザが特定のエージェントを介してその他のエージェントを呼び出す場合の音声対話方法について説明する。また、図3では、説明の便宜上、ユーザが発話するステップについても、音声対話方法のフローチャート内に図示している。
10 車両
11 車載装置
111 制御部
111a 表示制御部
111b 音声認識部
112 表示部
113 ボタン
114 マイク
115 スピーカ
12 通信部
13 記憶部
20 第一VPAサーバ
21 制御部
211 音声認識部
22 通信部
23 記憶部
30 第二VPAサーバ
31 制御部
311 音声認識部
32 通信部
33 記憶部
NW ネットワーク
Claims (20)
- ハードウェアを有する第一のプロセッサであって、ユーザの発話音声を認識し、前記ユーザの発話音声に含まれる指示が、複数の音声対話エージェントのうちのどの音声対話エージェントへの指示であるのかを判定し、
判定した音声対話エージェントの機能を実現するエージェントサーバに対して、前記ユーザの発話音声を転送する第一のプロセッサを備える端末装置と、
ハードウェアを有する第二のプロセッサであって、前記端末装置から転送された前記ユーザの発話音声を認識し、その認識結果を前記端末装置に出力する第二のプロセッサを備えるエージェントサーバと、
を備えるエージェントシステム。 - 前記第二のプロセッサは、前記端末装置から転送された前記ユーザの発話音声を認識し、その認識結果に基づく処理を行い、前記処理に関する応答データを前記端末装置に出力する、
請求項1に記載のエージェントシステム。 - 前記第一のプロセッサは、前記エージェントサーバに対して、前記ユーザの発話音声に代えて、前記ユーザの発話音声の認識結果を出力し、
前記第二のプロセッサは、前記端末装置から転送された前記ユーザの発話音声の認識結果に基づく処理を行い、前記処理に関する応答データを前記端末装置に出力する、
請求項1に記載のエージェントシステム。 - 前記端末装置は、ディスプレイを備え、
前記第一のプロセッサは、前記ユーザの発話音声に含まれる指示が、複数の音声対話エージェントのうちのどの音声対話エージェントへの指示であるのかを判定した際に、判定した音声対話エージェントの名称を前記ディスプレイに表示させる、
請求項1から請求項3のいずれか一項に記載のエージェントシステム。 - 前記第二のプロセッサは、
前記ユーザとの対話内容を前記ユーザの嗜好情報として記憶部に蓄積し、
前記端末装置から転送された前記ユーザの発話音声の認識結果に基づく処理を行う際に、前記ユーザの嗜好情報を考慮した処理を行う、
請求項3に記載のエージェントシステム。 - 前記第一のプロセッサは、
前記ユーザの発話音声をテキストデータに変換し、
前記テキストデータに、音声対話エージェントを特定するフレーズが含まれる場合、その音声対話エージェントへの指示であると判定する、
請求項1から請求項5のいずれか一項に記載のエージェントシステム。 - 前記ユーザの発話音声は、音声対話エージェントを特定するフレーズと、前記音声対話エージェントに対する指示とを含む、
請求項1から請求項6のいずれか一項に記載のエージェントシステム。 - 前記端末装置は、発話の際に前記ユーザが押下するボタンを備える、
請求項7に記載のエージェントシステム。 - 前記端末装置は、車両に搭載されている車載装置である、
請求項1から請求項8のいずれか一項に記載のエージェントシステム。 - 前記端末装置は、前記ユーザが所持する情報端末装置である、
請求項1から請求項8のいずれか一項に記載のエージェントシステム。 - ハードウェアを有するプロセッサを備え、
前記プロセッサは、
ユーザの発話音声を認識し、前記ユーザの発話音声に含まれる指示が、複数の音声対話エージェントのうちのどの音声対話エージェントへの指示であるのかを判定し、
判定した音声対話エージェントの機能を実現するエージェントサーバに対して、前記ユーザの発話音声を転送し、
前記エージェントサーバから、前記ユーザの発話音声の認識結果を取得する、
端末装置。 - 前記プロセッサは、
前記エージェントサーバに対して、前記ユーザの発話音声に代えて、前記ユーザの発話音声の認識結果を出力し、
前記エージェントサーバから、前記ユーザの発話音声の認識結果に基づく処理に関する応答データを取得する、
請求項11に記載の端末装置。 - ディスプレイを備え、
前記プロセッサは、前記ユーザの発話音声に含まれる指示が、複数の音声対話エージェントのうちのどの音声対話エージェントへの指示であるのかを判定した際に、判定した音声対話エージェントの名称を前記ディスプレイに表示させる、
請求項11または請求項12に記載の端末装置。 - 前記プロセッサは、
前記ユーザの発話音声をテキストデータに変換し、
前記テキストデータに、音声対話エージェントを特定するフレーズが含まれる場合、その音声対話エージェントへの指示であると判定する、
請求項11から請求項13のいずれか一項に記載の端末装置。 - 前記ユーザの発話音声は、音声対話エージェントを特定するフレーズと、前記音声対話エージェントに対する指示とを含む、
請求項11から請求項14のいずれか一項に記載の端末装置。 - 発話の際に前記ユーザが押下するボタンを備える、
請求項15に記載の端末装置。 - 車両に搭載されている車載装置である、
請求項11から請求項16のいずれか一項に記載の端末装置。 - 前記ユーザが所持する情報端末装置である、
請求項11から請求項16のいずれか一項に記載の端末装置。 - ハードウェアを有するプロセッサに、
ユーザの発話音声を認識し、前記ユーザの発話音声に含まれる指示が、複数の音声対話エージェントのうちのどの音声対話エージェントへの指示であるのかを判定し、
判定した音声対話エージェントの機能を実現するエージェントサーバに対して、前記ユーザの発話音声を転送する、
ことを実行させるエージェントプログラム。 - 前記プロセッサに、
前記エージェントサーバに対して、前記ユーザの発話音声に代えて、前記ユーザの発話音声の認識結果を出力し、
前記エージェントサーバから、前記ユーザの発話音声の認識結果に基づく処理に関する応答データを取得する、
ことを実行させる請求項19に記載のエージェントプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020009263A JP2021117296A (ja) | 2020-01-23 | 2020-01-23 | エージェントシステム、端末装置およびエージェントプログラム |
US17/101,492 US20210233538A1 (en) | 2020-01-23 | 2020-11-23 | Agent system, terminal device, and computer readable recording medium |
DE102020131203.2A DE102020131203A1 (de) | 2020-01-23 | 2020-11-25 | Agentensystem, Endgerät und Agentenprogramm |
CN202110068902.9A CN113160830A (zh) | 2020-01-23 | 2021-01-19 | 代理系统、终端装置及记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020009263A JP2021117296A (ja) | 2020-01-23 | 2020-01-23 | エージェントシステム、端末装置およびエージェントプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021117296A true JP2021117296A (ja) | 2021-08-10 |
Family
ID=76753617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020009263A Pending JP2021117296A (ja) | 2020-01-23 | 2020-01-23 | エージェントシステム、端末装置およびエージェントプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210233538A1 (ja) |
JP (1) | JP2021117296A (ja) |
CN (1) | CN113160830A (ja) |
DE (1) | DE102020131203A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021117301A (ja) * | 2020-01-23 | 2021-08-10 | トヨタ自動車株式会社 | エージェントシステム、端末装置およびエージェントプログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002116797A (ja) * | 2000-10-11 | 2002-04-19 | Canon Inc | 音声処理装置、音声処理方法及び記憶媒体 |
WO2005076258A1 (ja) * | 2004-02-03 | 2005-08-18 | Matsushita Electric Industrial Co., Ltd. | ユーザ適応型装置およびその制御方法 |
JP2008058465A (ja) * | 2006-08-30 | 2008-03-13 | Toshiba Corp | インタフェース装置及びインタフェース処理方法 |
WO2014020835A1 (ja) * | 2012-07-31 | 2014-02-06 | 日本電気株式会社 | エージェント制御システム、方法およびプログラム |
WO2017134935A1 (ja) * | 2016-02-03 | 2017-08-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US20180204569A1 (en) * | 2017-01-17 | 2018-07-19 | Ford Global Technologies, Llc | Voice Assistant Tracking And Activation |
US20180293484A1 (en) * | 2017-04-11 | 2018-10-11 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
JP2018181330A (ja) * | 2017-04-13 | 2018-11-15 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | 複数のインテリジェントパーソナルアシスタントサービスに対する管理レイヤ |
JP2018189984A (ja) * | 2013-06-19 | 2018-11-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、及び、音声対話エージェントサーバ |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7324947B2 (en) * | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
-
2020
- 2020-01-23 JP JP2020009263A patent/JP2021117296A/ja active Pending
- 2020-11-23 US US17/101,492 patent/US20210233538A1/en not_active Abandoned
- 2020-11-25 DE DE102020131203.2A patent/DE102020131203A1/de not_active Ceased
-
2021
- 2021-01-19 CN CN202110068902.9A patent/CN113160830A/zh not_active Withdrawn
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002116797A (ja) * | 2000-10-11 | 2002-04-19 | Canon Inc | 音声処理装置、音声処理方法及び記憶媒体 |
WO2005076258A1 (ja) * | 2004-02-03 | 2005-08-18 | Matsushita Electric Industrial Co., Ltd. | ユーザ適応型装置およびその制御方法 |
JP2008058465A (ja) * | 2006-08-30 | 2008-03-13 | Toshiba Corp | インタフェース装置及びインタフェース処理方法 |
WO2014020835A1 (ja) * | 2012-07-31 | 2014-02-06 | 日本電気株式会社 | エージェント制御システム、方法およびプログラム |
JP2018189984A (ja) * | 2013-06-19 | 2018-11-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、及び、音声対話エージェントサーバ |
WO2017134935A1 (ja) * | 2016-02-03 | 2017-08-10 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US20180204569A1 (en) * | 2017-01-17 | 2018-07-19 | Ford Global Technologies, Llc | Voice Assistant Tracking And Activation |
US20180293484A1 (en) * | 2017-04-11 | 2018-10-11 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
JP2018181330A (ja) * | 2017-04-13 | 2018-11-15 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | 複数のインテリジェントパーソナルアシスタントサービスに対する管理レイヤ |
Also Published As
Publication number | Publication date |
---|---|
DE102020131203A1 (de) | 2021-07-29 |
CN113160830A (zh) | 2021-07-23 |
US20210233538A1 (en) | 2021-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676601B2 (en) | Voice assistant tracking and activation | |
US10867596B2 (en) | Voice assistant system, server apparatus, device, voice assistant method therefor, and program to be executed by computer | |
US8775189B2 (en) | Control center for a voice controlled wireless communication device system | |
US9679562B2 (en) | Managing in vehicle speech interfaces to computer-based cloud services due recognized speech, based on context | |
US20120219142A1 (en) | Call transfer process and system | |
US20050288927A1 (en) | Quality of service call routing system using counselor and speech recognition engine and method thereof | |
US7555533B2 (en) | System for communicating information from a server via a mobile communication device | |
JP2016109897A (ja) | 電子機器、発話制御方法、およびプログラム | |
EP3855305A1 (en) | Agent system, agent server, and agent program | |
JP2021117296A (ja) | エージェントシステム、端末装置およびエージェントプログラム | |
JP7026004B2 (ja) | 会話補助装置、会話補助方法及びプログラム | |
CN113162964B (zh) | 代理系统、终端装置以及代理程序 | |
JP2015028566A (ja) | 応答制御システム、車載器、およびセンター | |
US11646034B2 (en) | Information processing system, information processing apparatus, and computer readable recording medium | |
Tchankue et al. | Are mobile in-car communication systems feasible? a usability study | |
JP2020113150A (ja) | 音声翻訳対話システム | |
US20210358495A1 (en) | Agent control device | |
JP7451033B2 (ja) | データ処理システム | |
JP2023006606A (ja) | 通話支援システムおよび通話支援装置 | |
CN113506571A (zh) | 控制方法、移动终端及存储介质 | |
KR20060098128A (ko) | 다단계 음성인식 기술을 이용한 음성인식 콜센터 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230516 |