JP6787269B2 - 音声認識システム及び音声認識方法 - Google Patents
音声認識システム及び音声認識方法 Download PDFInfo
- Publication number
- JP6787269B2 JP6787269B2 JP2017141765A JP2017141765A JP6787269B2 JP 6787269 B2 JP6787269 B2 JP 6787269B2 JP 2017141765 A JP2017141765 A JP 2017141765A JP 2017141765 A JP2017141765 A JP 2017141765A JP 6787269 B2 JP6787269 B2 JP 6787269B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- answer
- intention
- utterance
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/58—Arrangements for transferring received calls from one subscriber to another; Arrangements affording interim conversations between either the calling or the called party and a third party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42221—Conversation recording systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/18—Comparators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/39—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
- H04M3/4933—Directory assistance systems with operator assistance
Description
10 センタ
20 車両
21 DCM(Data Communication Module)
22 車載器
23 マイク
24 スピーカ
25 CAN(Controller Area Network)
30 オペレータ端末
40 コンテンツプロバイダ
50 ネットワーク
101、131 送受信部
102 呼接続制御部
103 音声認識部
104 意図理解部
105 対話回答生成部
106 音声合成部
107 切替え指示部
111 音声認識辞書
112 意図理解辞書
113 対話履歴記憶部
121、132 通話制御部
133 画面制御部
Claims (6)
- ユーザの発話音声データを音声認識する音声認識手段と、
前記発話音声データの音声認識結果に基づき、前記ユーザの発話の意図を理解する意図理解手段と、
を有する音声認識システムにおいて、
前記意図理解手段が理解した前記ユーザの発話の意図に基づいて、前記ユーザに対して対話回答生成手段が行う回答の信頼度を評価し、前記回答の信頼度が閾値以下の場合に、前記ユーザの通話先を制御する呼接続制御手段に対して、前記ユーザの通話先をオペレータ端末に切り替える指示を行う切替え指示手段
を有する音声認識システム。 - 前記切替え指示手段は、前記ユーザの通話先を前記オペレータ端末に切り替える指示を行う場合に、前記ユーザの発話と前記対話回答生成手段が行う回答との履歴情報を、前記オペレータ端末に送信し、前記オペレータ端末に表示させること
を特徴とする請求項1記載の音声認識システム。 - 前記切替え指示手段は、前記ユーザの発話の意図が、前記ユーザに対して前記対話回答生成手段が回答を行うことのできるユーザ要求として登録されていなければ、前記ユーザの通話先をオペレータ端末に切り替える指示を行うこと
を特徴とする請求項1又は2記載の音声認識システム。 - 前記切替え指示手段は、前記ユーザの発話の意図が、検索に関するユーザ要求として登録されていれば、検索結果の候補又は再検索の回数が多くなるほど、前記回答の信頼度を低くすること
を特徴とする請求項1乃至3何れか一項記載の音声認識システム。 - 前記意図理解手段が理解した前記ユーザの発話の意図に基づいて、前記ユーザに対して行う回答を生成する対話回答生成手段と、
前記ユーザに対して行う回答を音声合成する音声合成手段と、
を更に有する請求項1乃至4何れか一項記載の音声認識システム。 - ユーザの発話音声データを音声認識し、前記発話音声データの音声認識結果に基づき、前記ユーザの発話の意図を理解する音声認識システムが、
前記理解した前記ユーザの発話の意図に基づいて、前記ユーザに対して対話回答生成手段が行う回答の信頼度を評価する手順と、
前記回答の信頼度が閾値以下の場合に、前記ユーザの通話先を制御する呼接続制御手段に対して、前記ユーザの通話先をオペレータ端末に切り替える指示を行う手順と
を実行する音声認識方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141765A JP6787269B2 (ja) | 2017-07-21 | 2017-07-21 | 音声認識システム及び音声認識方法 |
US16/002,732 US10356245B2 (en) | 2017-07-21 | 2018-06-07 | Voice recognition system and voice recognition method |
CN201810769602.1A CN109285541B (zh) | 2017-07-21 | 2018-07-13 | 语音识别系统及语音识别方法 |
US16/432,362 US10863033B2 (en) | 2017-07-21 | 2019-06-05 | Voice recognition system and voice recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141765A JP6787269B2 (ja) | 2017-07-21 | 2017-07-21 | 音声認識システム及び音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019020683A JP2019020683A (ja) | 2019-02-07 |
JP6787269B2 true JP6787269B2 (ja) | 2020-11-18 |
Family
ID=65014248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017141765A Active JP6787269B2 (ja) | 2017-07-21 | 2017-07-21 | 音声認識システム及び音声認識方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US10356245B2 (ja) |
JP (1) | JP6787269B2 (ja) |
CN (1) | CN109285541B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019046267A (ja) * | 2017-09-04 | 2019-03-22 | トヨタ自動車株式会社 | 情報提供方法、情報提供システム、および情報提供装置 |
JP7340943B2 (ja) * | 2019-03-27 | 2023-09-08 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
JP7358621B2 (ja) * | 2019-08-14 | 2023-10-10 | ライブパーソン, インコーポレイテッド | 対話勧誘を管理するためのシステムおよび方法 |
WO2021060391A1 (ja) * | 2019-09-27 | 2021-04-01 | Tradfit株式会社 | 情報提供方法、情報提供システム、情報提供装置及びコンピュータプログラム |
JP7287258B2 (ja) * | 2019-12-10 | 2023-06-06 | トヨタ自動車株式会社 | エージェント管理装置、プログラムおよびエージェント管理方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3530109B2 (ja) * | 1999-05-31 | 2004-05-24 | 日本電信電話株式会社 | 大規模情報データベースに対する音声対話型情報検索方法、装置および記録媒体 |
JP3608449B2 (ja) | 1999-09-09 | 2005-01-12 | 日本電信電話株式会社 | 音声応答方法及び装置及び音声応答プログラムを格納した記憶媒体 |
EP1190301A1 (en) * | 2000-03-09 | 2002-03-27 | Koninklijke Philips Electronics N.V. | Method of interacting with a consumer electronics system |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
US7844465B2 (en) * | 2004-11-30 | 2010-11-30 | Scansoft, Inc. | Random confirmation in speech based systems |
CN101111885A (zh) * | 2005-02-04 | 2008-01-23 | 株式会社查纳位资讯情报 | 使用抽出的声音数据生成应答声音的声音识别系统 |
JP4197344B2 (ja) * | 2006-02-20 | 2008-12-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声対話システム |
US7805305B2 (en) * | 2006-10-12 | 2010-09-28 | Nuance Communications, Inc. | Enhancement to Viterbi speech processing algorithm for hybrid speech models that conserves memory |
JPWO2010128560A1 (ja) * | 2009-05-08 | 2012-11-01 | パイオニア株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
KR20110072847A (ko) * | 2009-12-23 | 2011-06-29 | 삼성전자주식회사 | 열려진 사용자 의도 처리를 위한 대화관리 시스템 및 방법 |
JP5434731B2 (ja) | 2010-03-24 | 2014-03-05 | トヨタ自動車株式会社 | 音声認識システム及び自動検索システム |
JP6126870B2 (ja) * | 2013-03-01 | 2017-05-10 | 本田技研工業株式会社 | 音声対話システム及び音声対話方法 |
KR101759009B1 (ko) * | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
JP6221301B2 (ja) * | 2013-03-28 | 2017-11-01 | 富士通株式会社 | 音声処理装置、音声処理システムおよび音声処理方法 |
JP2015049337A (ja) * | 2013-08-30 | 2015-03-16 | 株式会社東芝 | 音声応答装置、音声応答プログラム及び音声応答方法 |
CN104598445B (zh) * | 2013-11-01 | 2019-05-10 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
WO2015079575A1 (ja) * | 2013-11-29 | 2015-06-04 | 株式会社 東芝 | 対話支援システム、方法、及びプログラム |
JP6351562B2 (ja) * | 2014-11-12 | 2018-07-04 | 株式会社アドバンスト・メディア | 情報処理システム、受付サーバ、情報処理方法及びプログラム |
US11829373B2 (en) * | 2015-02-20 | 2023-11-28 | Google Llc | Methods, systems, and media for presenting search results |
US10559303B2 (en) * | 2015-05-26 | 2020-02-11 | Nuance Communications, Inc. | Methods and apparatus for reducing latency in speech recognition applications |
-
2017
- 2017-07-21 JP JP2017141765A patent/JP6787269B2/ja active Active
-
2018
- 2018-06-07 US US16/002,732 patent/US10356245B2/en active Active
- 2018-07-13 CN CN201810769602.1A patent/CN109285541B/zh active Active
-
2019
- 2019-06-05 US US16/432,362 patent/US10863033B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN109285541A (zh) | 2019-01-29 |
JP2019020683A (ja) | 2019-02-07 |
US10863033B2 (en) | 2020-12-08 |
CN109285541B (zh) | 2023-05-16 |
US20190028592A1 (en) | 2019-01-24 |
US10356245B2 (en) | 2019-07-16 |
US20190289131A1 (en) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6787269B2 (ja) | 音声認識システム及び音声認識方法 | |
US11869487B1 (en) | Allocation of local and remote resources for speech processing | |
US8618958B2 (en) | Navigation device | |
US9159322B2 (en) | Services identification and initiation for a speech-based interface to a mobile device | |
JP5958475B2 (ja) | 音声認識端末装置、音声認識システム、音声認識方法 | |
US8406938B2 (en) | Remote operator assistance for one or more user commands in a vehicle | |
US20180211668A1 (en) | Reduced latency speech recognition system using multiple recognizers | |
US20200211560A1 (en) | Data Processing Device and Method for Performing Speech-Based Human Machine Interaction | |
JP2009300537A (ja) | 音声作動システム、音声作動方法および車載装置 | |
US20080255852A1 (en) | Apparatuses and methods for voice command processing | |
JP5244663B2 (ja) | 音声によってテキストを入力する音声認識処理方法及びシステム | |
US20140211669A1 (en) | Terminal to communicate data using voice command, and method and system thereof | |
CN101846525B (zh) | 导航信息处理、获取方法及装置 | |
JP2014062944A (ja) | 情報処理装置 | |
CN108810244B (zh) | 语音对话系统以及信息处理装置 | |
JP6226911B2 (ja) | サーバ装置、システム、音声認識機能を管理するための方法、および、情報通信端末を制御するためのプログラム | |
US20020026319A1 (en) | Service mediating apparatus | |
KR20150108470A (ko) | 메신저 서비스 시스템, 그 시스템에서의 상대방의 위치 및 시간 정보를 제공하기 위한 메신저 서비스 방법 및 장치 | |
JP2005331608A (ja) | 情報処理装置および情報処理方法 | |
CN110033761B (zh) | 通信系统、通信方法以及计算机可读存储介质 | |
JPWO2013132615A1 (ja) | ナビゲーション装置、サーバ、ナビゲーション方法及びプログラム | |
JP2009272984A (ja) | 通信制御装置 | |
JP2008277952A (ja) | 情報システム | |
EP1524778A1 (en) | Method for communicating information from a server to a user via a mobile communication device running a dialog script | |
JP2017181667A (ja) | 音声認識装置および音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201012 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6787269 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |