JP6787269B2 - 音声認識システム及び音声認識方法 - Google Patents
音声認識システム及び音声認識方法 Download PDFInfo
- Publication number
- JP6787269B2 JP6787269B2 JP2017141765A JP2017141765A JP6787269B2 JP 6787269 B2 JP6787269 B2 JP 6787269B2 JP 2017141765 A JP2017141765 A JP 2017141765A JP 2017141765 A JP2017141765 A JP 2017141765A JP 6787269 B2 JP6787269 B2 JP 6787269B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- answer
- intention
- utterance
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000007423 decrease Effects 0.000 claims 1
- 230000002452 interceptive effect Effects 0.000 claims 1
- 230000004044 response Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009118 appropriate response Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/58—Arrangements for transferring received calls from one subscriber to another; Arrangements affording interim conversations between either the calling or the called party and a third party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42221—Conversation recording systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/18—Comparators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/39—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
- H04M3/4933—Directory assistance systems with operator assistance
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
Description
10 センタ
20 車両
21 DCM(Data Communication Module)
22 車載器
23 マイク
24 スピーカ
25 CAN(Controller Area Network)
30 オペレータ端末
40 コンテンツプロバイダ
50 ネットワーク
101、131 送受信部
102 呼接続制御部
103 音声認識部
104 意図理解部
105 対話回答生成部
106 音声合成部
107 切替え指示部
111 音声認識辞書
112 意図理解辞書
113 対話履歴記憶部
121、132 通話制御部
133 画面制御部
Claims (6)
- ユーザの発話音声データを音声認識する音声認識手段と、
前記発話音声データの音声認識結果に基づき、前記ユーザの発話の意図を理解する意図理解手段と、
を有する音声認識システムにおいて、
前記意図理解手段が理解した前記ユーザの発話の意図に基づいて、前記ユーザに対して対話回答生成手段が行う回答の信頼度を評価し、前記回答の信頼度が閾値以下の場合に、前記ユーザの通話先を制御する呼接続制御手段に対して、前記ユーザの通話先をオペレータ端末に切り替える指示を行う切替え指示手段
を有する音声認識システム。 - 前記切替え指示手段は、前記ユーザの通話先を前記オペレータ端末に切り替える指示を行う場合に、前記ユーザの発話と前記対話回答生成手段が行う回答との履歴情報を、前記オペレータ端末に送信し、前記オペレータ端末に表示させること
を特徴とする請求項1記載の音声認識システム。 - 前記切替え指示手段は、前記ユーザの発話の意図が、前記ユーザに対して前記対話回答生成手段が回答を行うことのできるユーザ要求として登録されていなければ、前記ユーザの通話先をオペレータ端末に切り替える指示を行うこと
を特徴とする請求項1又は2記載の音声認識システム。 - 前記切替え指示手段は、前記ユーザの発話の意図が、検索に関するユーザ要求として登録されていれば、検索結果の候補又は再検索の回数が多くなるほど、前記回答の信頼度を低くすること
を特徴とする請求項1乃至3何れか一項記載の音声認識システム。 - 前記意図理解手段が理解した前記ユーザの発話の意図に基づいて、前記ユーザに対して行う回答を生成する対話回答生成手段と、
前記ユーザに対して行う回答を音声合成する音声合成手段と、
を更に有する請求項1乃至4何れか一項記載の音声認識システム。 - ユーザの発話音声データを音声認識し、前記発話音声データの音声認識結果に基づき、前記ユーザの発話の意図を理解する音声認識システムが、
前記理解した前記ユーザの発話の意図に基づいて、前記ユーザに対して対話回答生成手段が行う回答の信頼度を評価する手順と、
前記回答の信頼度が閾値以下の場合に、前記ユーザの通話先を制御する呼接続制御手段に対して、前記ユーザの通話先をオペレータ端末に切り替える指示を行う手順と
を実行する音声認識方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141765A JP6787269B2 (ja) | 2017-07-21 | 2017-07-21 | 音声認識システム及び音声認識方法 |
US16/002,732 US10356245B2 (en) | 2017-07-21 | 2018-06-07 | Voice recognition system and voice recognition method |
CN201810769602.1A CN109285541B (zh) | 2017-07-21 | 2018-07-13 | 语音识别系统及语音识别方法 |
US16/432,362 US10863033B2 (en) | 2017-07-21 | 2019-06-05 | Voice recognition system and voice recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141765A JP6787269B2 (ja) | 2017-07-21 | 2017-07-21 | 音声認識システム及び音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019020683A JP2019020683A (ja) | 2019-02-07 |
JP6787269B2 true JP6787269B2 (ja) | 2020-11-18 |
Family
ID=65014248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017141765A Active JP6787269B2 (ja) | 2017-07-21 | 2017-07-21 | 音声認識システム及び音声認識方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US10356245B2 (ja) |
JP (1) | JP6787269B2 (ja) |
CN (1) | CN109285541B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019046267A (ja) * | 2017-09-04 | 2019-03-22 | トヨタ自動車株式会社 | 情報提供方法、情報提供システム、および情報提供装置 |
JP7340943B2 (ja) * | 2019-03-27 | 2023-09-08 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN114223188B (zh) | 2019-08-14 | 2024-04-26 | 利维帕尔森有限公司 | 用于管理交互邀请的系统和方法 |
JP6920773B1 (ja) * | 2019-09-27 | 2021-08-18 | Tradfit株式会社 | 情報提供方法、情報提供システム、情報提供装置及びコンピュータプログラム |
JP7287258B2 (ja) * | 2019-12-10 | 2023-06-06 | トヨタ自動車株式会社 | エージェント管理装置、プログラムおよびエージェント管理方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3530109B2 (ja) * | 1999-05-31 | 2004-05-24 | 日本電信電話株式会社 | 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体 |
JP3608449B2 (ja) | 1999-09-09 | 2005-01-12 | 日本電信電話株式会社 | 音声応答方法及び装置及び音声応答プログラムを格納した記憶媒体 |
CN1372660A (zh) * | 2000-03-09 | 2002-10-02 | 皇家菲利浦电子有限公司 | 与消费电子系统进行交互的方法 |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
US7844465B2 (en) * | 2004-11-30 | 2010-11-30 | Scansoft, Inc. | Random confirmation in speech based systems |
CN101111885A (zh) * | 2005-02-04 | 2008-01-23 | 株式会社查纳位资讯情报 | 使用抽出的声音数据生成应答声音的声音识别系统 |
JP4197344B2 (ja) * | 2006-02-20 | 2008-12-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声対話システム |
US7805305B2 (en) * | 2006-10-12 | 2010-09-28 | Nuance Communications, Inc. | Enhancement to Viterbi speech processing algorithm for hybrid speech models that conserves memory |
WO2010128560A1 (ja) * | 2009-05-08 | 2010-11-11 | パイオニア株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
KR20110072847A (ko) * | 2009-12-23 | 2011-06-29 | 삼성전자주식회사 | 열려진 사용자 의도 처리를 위한 대화관리 시스템 및 방법 |
JP5434731B2 (ja) | 2010-03-24 | 2014-03-05 | トヨタ自動車株式会社 | 音声認識システム及び自動検索システム |
JP6126870B2 (ja) * | 2013-03-01 | 2017-05-10 | 本田技研工業株式会社 | 音声対話システム及び音声対話方法 |
KR101759009B1 (ko) * | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
JP6221301B2 (ja) * | 2013-03-28 | 2017-11-01 | 富士通株式会社 | 音声処理装置、音声処理システムおよび音声処理方法 |
JP2015049337A (ja) * | 2013-08-30 | 2015-03-16 | 株式会社東芝 | 音声応答装置、音声応答プログラム及び音声応答方法 |
CN104598445B (zh) * | 2013-11-01 | 2019-05-10 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
JP6143883B2 (ja) * | 2013-11-29 | 2017-06-07 | 株式会社東芝 | 対話支援システム、方法、及びプログラム |
JP6351562B2 (ja) * | 2014-11-12 | 2018-07-04 | 株式会社アドバンスト・メディア | 情報処理システム、受付サーバ、情報処理方法及びプログラム |
US11829373B2 (en) * | 2015-02-20 | 2023-11-28 | Google Llc | Methods, systems, and media for presenting search results |
US10559303B2 (en) * | 2015-05-26 | 2020-02-11 | Nuance Communications, Inc. | Methods and apparatus for reducing latency in speech recognition applications |
-
2017
- 2017-07-21 JP JP2017141765A patent/JP6787269B2/ja active Active
-
2018
- 2018-06-07 US US16/002,732 patent/US10356245B2/en active Active
- 2018-07-13 CN CN201810769602.1A patent/CN109285541B/zh active Active
-
2019
- 2019-06-05 US US16/432,362 patent/US10863033B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20190028592A1 (en) | 2019-01-24 |
US10863033B2 (en) | 2020-12-08 |
CN109285541B (zh) | 2023-05-16 |
US20190289131A1 (en) | 2019-09-19 |
US10356245B2 (en) | 2019-07-16 |
JP2019020683A (ja) | 2019-02-07 |
CN109285541A (zh) | 2019-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6787269B2 (ja) | 音声認識システム及び音声認識方法 | |
US11869487B1 (en) | Allocation of local and remote resources for speech processing | |
US8618958B2 (en) | Navigation device | |
JP5958475B2 (ja) | 音声認識端末装置、音声認識システム、音声認識方法 | |
US8406938B2 (en) | Remote operator assistance for one or more user commands in a vehicle | |
US20200211560A1 (en) | Data Processing Device and Method for Performing Speech-Based Human Machine Interaction | |
US20080255852A1 (en) | Apparatuses and methods for voice command processing | |
JP2009300537A (ja) | 音声作動システム、音声作動方法および車載装置 | |
JP5244663B2 (ja) | 音声によってテキストを入力する音声認識処理方法及びシステム | |
US20140211669A1 (en) | Terminal to communicate data using voice command, and method and system thereof | |
CN101846525B (zh) | 导航信息处理、获取方法及装置 | |
JP2014062944A (ja) | 情報処理装置 | |
CN108810244B (zh) | 语音对话系统以及信息处理装置 | |
JP5698864B2 (ja) | ナビゲーション装置、サーバ、ナビゲーション方法及びプログラム | |
JP6226911B2 (ja) | サーバ装置、システム、音声認識機能を管理するための方法、および、情報通信端末を制御するためのプログラム | |
US20020026319A1 (en) | Service mediating apparatus | |
JP2017181667A (ja) | 音声認識装置および音声認識方法 | |
JP2005331608A (ja) | 情報処理装置および情報処理方法 | |
CN110033761B (zh) | 通信系统、通信方法以及计算机可读存储介质 | |
JP2009272984A (ja) | 通信制御装置 | |
JP2008277952A (ja) | 情報システム | |
EP1524778A1 (en) | Method for communicating information from a server to a user via a mobile communication device running a dialog script | |
KR20190074344A (ko) | 대화 시스템 및 대화 처리 방법 | |
JP7451033B2 (ja) | データ処理システム | |
KR102142338B1 (ko) | 인공지능 통신 장치 및 그 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201012 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6787269 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |