JP2021117301A - エージェントシステム、端末装置およびエージェントプログラム - Google Patents
エージェントシステム、端末装置およびエージェントプログラム Download PDFInfo
- Publication number
- JP2021117301A JP2021117301A JP2020009343A JP2020009343A JP2021117301A JP 2021117301 A JP2021117301 A JP 2021117301A JP 2020009343 A JP2020009343 A JP 2020009343A JP 2020009343 A JP2020009343 A JP 2020009343A JP 2021117301 A JP2021117301 A JP 2021117301A
- Authority
- JP
- Japan
- Prior art keywords
- content
- server
- user
- agent
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 40
- 230000002452 interceptive effect Effects 0.000 abstract 1
- 239000003795 chemical substances by application Substances 0.000 description 79
- 238000004891 communication Methods 0.000 description 19
- 238000000034 method Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Telephonic Communication Services (AREA)
- Navigation (AREA)
Abstract
Description
本実施形態に係るエージェントシステムおよび端末装置の構成について、図1および図2を参照しながら説明する。本実施形態に係るエージェントシステム、端末装置およびエージェントプログラムは、ユーザに対して、複数の音声対話エージェント(以下、「エージェント」という)のサービスを提供するためのものである。
車両10は、図2に示すように、車載装置11と、通信部12と、記憶部13と、を備えている。車載装置11は、例えば車両10に搭載されるカーナビゲーション装置である。車載装置11は、制御部111と、表示部(ディスプレイ)112と、ボタン113と、マイク114と、スピーカ115と、を備えている。
(1)「エージェントB、今日の天気を教えて」と発話
(2)ボタン113を押下して「今日の天気を教えて」と発話
(3)「エージェントA、エージェントB、今日の天気を教えて」と発話
第一VPAサーバ20は、制御部21と、通信部22と、記憶部23と、を備えている。通信部22および記憶部23の物理的な構成は、通信部12および記憶部13と同様である。
第二VPAサーバ30は、制御部31と、通信部32と、記憶部33と、を備えている。制御部31、通信部32および記憶部33の物理的な構成は、制御部21、通信部12および記憶部13と同様である。制御部31は、記憶部33に格納された音声対話エージェントのプログラムの実行を通じて、音声対話エージェントの機能を実現する。また、制御部31は、記憶部33に格納されたプログラムの実行を通じて、音声認識部311として機能する。
第一サービスサーバ40は、コンテンツを管理するサーバ装置であり、第一VPAサーバ20または第二VPAサーバ30の制御に基づいて、車載装置11にコンテンツデータを出力する。第一サービスサーバ40は、制御部41と、通信部42と、記憶部43と、を備えている。制御部41、通信部42および記憶部43の物理的な構成は、制御部21、通信部12および記憶部13と同様である。
第二サービスサーバ50は、コンテンツを管理するサーバ装置であり、第一VPAサーバ20または第二VPAサーバ30の制御に基づいて、車載装置11にコンテンツデータを出力する。第二サービスサーバ50は、制御部51と、通信部52と、記憶部53と、を備えている。制御部51、通信部52および記憶部53の物理的な構成は、制御部21、通信部12および記憶部13と同様である。
本実施形態に係るエージェントシステム1および端末装置が実行する音声対話方法の処理手順について、図3を参照しながら説明する。以下では、「音楽のコンテンツよりも天気情報のコンテンツを優先して実行する」という競合処理方針のもとで複数のサービスを利用する場合の音声対話方法について説明する。また、図3では、説明の便宜上、ユーザが発話するステップについても、音声対話方法のフローチャート内に図示している。
10 車両
11 車載装置
111 制御部
111a 表示制御部
111b 音声認識部
111c 競合処理部
112 表示部
113 ボタン
114 マイク
115 スピーカ
12 通信部
13 記憶部
20 第一VPAサーバ
21 制御部
211 音声認識部
22 通信部
23 記憶部
30 第二VPAサーバ
31 制御部
311 音声認識部
32 通信部
33 記憶部
NW ネットワーク
Claims (20)
- ハードウェアを有する第一のプロセッサであって、ユーザの要求に応じて第一のコンテンツを端末装置に出力する第一のプロセッサを備える第一のサーバと、
ハードウェアを有する第二のプロセッサであって、前記ユーザの要求に応じて第二のコンテンツを端末装置に出力する第二のプロセッサを備える第二のサーバと、
ハードウェアを有する第三のプロセッサであって、前記第一のサーバから取得した前記第一のコンテンツの実行中に、前記ユーザから前記第二のコンテンツの実行が要求された場合、前記第二のサーバから前記第二のコンテンツを取得し、
予め設定される競合処理方針に基づいて、前記第一のコンテンツおよび前記第二のコンテンツの実行の可否を決定する第三のプロセッサを備える第三のサーバと、
を備えるエージェントシステム。 - 前記第三のプロセッサは、
前記第一のサーバから取得した前記第一のコンテンツの実行中に、前記ユーザから前記第二のコンテンツの実行が要求された場合、前記第二のサーバから前記第二のコンテンツを取得し、
前記競合処理方針に基づいて、前記第一のコンテンツおよび前記第二のコンテンツのいずれか一方を先に実行した後に、前記第一のコンテンツおよび前記第二のコンテンツのいずれか他方を実行する、
請求項1に記載のエージェントシステム。 - 前記競合処理方針は、コンテンツの種類ごとに実行の優先度を設けて決定されたものである、
請求項1または請求項2に記載のエージェントシステム。 - 前記第一のサーバは、
前記第一のコンテンツを管理する第一のサービスサーバと、
前記ユーザの発話音声を認識し、前記ユーザの発話音声に含まれる要求に応じて前記第一のサービスサーバから前記端末装置へと前記第一のコンテンツを出力させる第一のエージェントサーバと、
を備え、
前記第二のサーバは、
前記第二のコンテンツを管理する第二のサービスサーバと、
前記ユーザの発話音声を認識し、前記ユーザの発話音声に含まれる要求に応じて前記第二のサービスサーバから前記端末装置へと前記第二のコンテンツを出力させる第二のエージェントサーバと、
を備える、
請求項1から請求項3のいずれか一項に記載のエージェントシステム。 - 前記第一のプロセッサおよび前記第二のプロセッサは、前記ユーザの発話音声をテキストデータに変換することにより、前記ユーザの発話音声を認識する、
請求項4に記載のエージェントシステム。 - 前記ユーザの発話音声は、前記第一のエージェントサーバまたは前記第二のエージェントサーバに対応する音声対話エージェントを特定するフレーズと、前記音声対話エージェントに対する指示とを含む、
請求項4または請求項5に記載のエージェントシステム。 - 前記端末装置は、発話の際に前記ユーザが押下するボタンを備える、
請求項6に記載のエージェントシステム。 - 前記端末装置は、車両に搭載されている車載装置である、
請求項1から請求項7のいずれか一項に記載のエージェントシステム。 - 前記端末装置は、前記ユーザが所持する情報端末装置である、
請求項1から請求項7のいずれか一項に記載のエージェントシステム。 - ハードウェアを有するプロセッサを備え、
前記プロセッサは、
第一のサーバから取得した第一のコンテンツの実行中に、ユーザから第二のコンテンツの実行が要求された場合、第二のサーバから前記第二のコンテンツを取得し、
予め設定される競合処理方針に基づいて、前記第一のコンテンツおよび前記第二のコンテンツの実行の可否を決定する、
端末装置。 - 前記プロセッサは、
前記第一のサーバから取得した前記第一のコンテンツの実行中に、前記ユーザから前記第二のコンテンツの実行が要求された場合、前記第二のサーバから前記第二のコンテンツを取得し、
前記競合処理方針に基づいて、前記第一のコンテンツおよび前記第二のコンテンツのいずれか一方を先に実行した後に、前記第一のコンテンツおよび前記第二のコンテンツのいずれか他方を実行する、
請求項10に記載の端末装置。 - 前記競合処理方針は、コンテンツの種類ごとに実行の優先度を設けて決定されたものである、
請求項10または請求項11に記載の端末装置。 - 前記ユーザの発話音声は、前記第一のサーバまたは前記第二のサーバに対応する音声対話エージェントを特定するフレーズと、前記音声対話エージェントに対する指示とを含む、
請求項10から請求項12のいずれか一項に記載の端末装置。 - 発話の際に前記ユーザが押下するボタンを備える、
請求項13に記載の端末装置。 - 車両に搭載されている車載装置である、
請求項10から請求項14のいずれか一項に記載の端末装置。 - 前記ユーザが所持する情報端末装置である、
請求項10から請求項14のいずれか一項に記載の端末装置。 - ハードウェアを有するプロセッサに、
第一のサーバから取得した第一のコンテンツの実行中に、ユーザから第二のコンテンツの実行が要求された場合、第二のサーバから前記第二のコンテンツを取得し、
予め設定される競合処理方針に基づいて、前記第一のコンテンツおよび前記第二のコンテンツの実行の可否を決定する、
ことを実行させるエージェントプログラム。 - 前記プロセッサに、
前記第一のサーバから取得した前記第一のコンテンツの実行中に、前記ユーザから前記第二のコンテンツの実行が要求された場合、前記第二のサーバから前記第二のコンテンツを取得し、
前記競合処理方針に基づいて、前記第一のコンテンツおよび前記第二のコンテンツのいずれか一方を先に実行した後に、前記第一のコンテンツおよび前記第二のコンテンツのいずれか他方を実行する、
ことを実行させる請求項17に記載のエージェントプログラム。 - 前記競合処理方針は、コンテンツの種類ごとに実行の優先度を設けて決定されたものである、
請求項17または請求項18に記載のエージェントプログラム。 - 前記ユーザの発話音声は、前記第一のサーバまたは前記第二のサーバに対応する音声対話エージェントを特定するフレーズと、前記音声対話エージェントに対する指示とを含む、
請求項17から請求項19のいずれか一項に記載のエージェントプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020009343A JP2021117301A (ja) | 2020-01-23 | 2020-01-23 | エージェントシステム、端末装置およびエージェントプログラム |
US17/109,200 US11587566B2 (en) | 2020-01-23 | 2020-12-02 | Agent system, terminal device, and computer readable recording medium using speech interaction for services |
CN202110012700.2A CN113162964B (zh) | 2020-01-23 | 2021-01-06 | 代理系统、终端装置以及代理程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020009343A JP2021117301A (ja) | 2020-01-23 | 2020-01-23 | エージェントシステム、端末装置およびエージェントプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021117301A true JP2021117301A (ja) | 2021-08-10 |
Family
ID=76878597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020009343A Pending JP2021117301A (ja) | 2020-01-23 | 2020-01-23 | エージェントシステム、端末装置およびエージェントプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11587566B2 (ja) |
JP (1) | JP2021117301A (ja) |
CN (1) | CN113162964B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102596436B1 (ko) * | 2018-02-20 | 2023-11-01 | 삼성전자주식회사 | 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009265278A (ja) * | 2008-04-23 | 2009-11-12 | Konica Minolta Business Technologies Inc | 音声出力管理システムおよび音声出力装置 |
JP2018189984A (ja) * | 2013-06-19 | 2018-11-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、及び、音声対話エージェントサーバ |
WO2019087546A1 (ja) * | 2017-10-30 | 2019-05-09 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP2019086535A (ja) * | 2017-11-01 | 2019-06-06 | ソフトバンク株式会社 | 送信制御装置及びプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1245299C (zh) * | 2001-09-25 | 2006-03-15 | 公信电子股份有限公司 | 单键控制语音指令的声控方法及其装置 |
JP5171392B2 (ja) * | 2008-05-27 | 2013-03-27 | オリンパス株式会社 | 通信システム、情報保有装置、および管理装置 |
US9110739B2 (en) * | 2011-06-07 | 2015-08-18 | Microsoft Technology Licensing, Llc | Subscribing to multiple resources through a common connection |
CN102831894B (zh) * | 2012-08-09 | 2014-07-09 | 华为终端有限公司 | 指令处理方法、装置和系统 |
KR102053820B1 (ko) * | 2013-07-02 | 2019-12-09 | 삼성전자주식회사 | 서버 및 그 제어방법과, 영상처리장치 및 그 제어방법 |
CN106982155A (zh) * | 2016-01-18 | 2017-07-25 | 中兴通讯股份有限公司 | 一种语音指令处理方法、装置及智能网关 |
CN107680591A (zh) * | 2017-09-21 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 基于车载终端的语音交互方法、装置及其设备 |
US10684871B2 (en) * | 2018-06-03 | 2020-06-16 | Apple Inc. | Multi-process model for cross-platform applications |
JP2021117302A (ja) * | 2020-01-23 | 2021-08-10 | トヨタ自動車株式会社 | エージェントシステム、エージェントサーバおよびエージェントプログラム |
JP2021117296A (ja) * | 2020-01-23 | 2021-08-10 | トヨタ自動車株式会社 | エージェントシステム、端末装置およびエージェントプログラム |
JP7264071B2 (ja) * | 2020-01-23 | 2023-04-25 | トヨタ自動車株式会社 | 情報処理システム、情報処理装置、及びプログラム |
-
2020
- 2020-01-23 JP JP2020009343A patent/JP2021117301A/ja active Pending
- 2020-12-02 US US17/109,200 patent/US11587566B2/en active Active
-
2021
- 2021-01-06 CN CN202110012700.2A patent/CN113162964B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009265278A (ja) * | 2008-04-23 | 2009-11-12 | Konica Minolta Business Technologies Inc | 音声出力管理システムおよび音声出力装置 |
JP2018189984A (ja) * | 2013-06-19 | 2018-11-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、及び、音声対話エージェントサーバ |
WO2019087546A1 (ja) * | 2017-10-30 | 2019-05-09 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP2019086535A (ja) * | 2017-11-01 | 2019-06-06 | ソフトバンク株式会社 | 送信制御装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN113162964A (zh) | 2021-07-23 |
US11587566B2 (en) | 2023-02-21 |
CN113162964B (zh) | 2024-03-19 |
US20210233527A1 (en) | 2021-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676601B2 (en) | Voice assistant tracking and activation | |
US11520471B1 (en) | Systems and methods for identifying a set of characters in a media file | |
US11356730B2 (en) | Systems and methods for routing content to an associated output device | |
KR102360589B1 (ko) | 관련 출력 디바이스에 컨텐츠를 라우팅하기 위한 시스템 및 방법 | |
US20030158731A1 (en) | Word training interface | |
US20170206059A1 (en) | Apparatus and method for voice recognition device in vehicle | |
EP3855305A1 (en) | Agent system, agent server, and agent program | |
US11721332B1 (en) | Modifying follow on actions based on user activity | |
CN113162964B (zh) | 代理系统、终端装置以及代理程序 | |
CN114995779A (zh) | 一种车载音频焦点的仲裁方法、仲裁装置及电子设备 | |
US11740865B2 (en) | Agent coordination device, agent coordination method and recording medium | |
CN113160824B (zh) | 信息处理系统 | |
JP2021117296A (ja) | エージェントシステム、端末装置およびエージェントプログラム | |
US11663035B2 (en) | Agent control device | |
JP2019028160A (ja) | 電子装置および情報端末システム | |
CN113157245A (zh) | 电子书呈现信息的播放交互方法、计算设备及存储介质 | |
JP7380416B2 (ja) | エージェント制御装置 | |
US9191742B1 (en) | Enhancing audio at a network-accessible computing platform | |
JP2024082829A (ja) | 情報処理装置、情報処理方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220107 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220125 |