JP6143883B2 - 対話支援システム、方法、及びプログラム - Google Patents
対話支援システム、方法、及びプログラム Download PDFInfo
- Publication number
- JP6143883B2 JP6143883B2 JP2015550518A JP2015550518A JP6143883B2 JP 6143883 B2 JP6143883 B2 JP 6143883B2 JP 2015550518 A JP2015550518 A JP 2015550518A JP 2015550518 A JP2015550518 A JP 2015550518A JP 6143883 B2 JP6143883 B2 JP 6143883B2
- Authority
- JP
- Japan
- Prior art keywords
- intention
- user
- dialogue
- knowledge
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 64
- 230000008569 process Effects 0.000 claims description 46
- 230000009471 action Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 14
- 238000011156 evaluation Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 description 13
- 238000012790 confirmation Methods 0.000 description 9
- 235000012054 meals Nutrition 0.000 description 6
- 230000003993 interaction Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010129 solution processing Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
意図理解部102は、形態素や単語の意味クラスや単語の表記などの素性を用いて意図モデル記憶部109に記憶されている意図モデルを参照することにより、ユーザの意図を理解し、理解の確からしさを表す確信度及び理解した意図に対応付けられた対話処理を実行するための引数を得る。意図モデルは、多数の発話サンプルから意味クラス及び単語などを素性とした学習により予め生成される。意図モデルには、例えば、複数の意図候補が意味クラスと対応付けて記述されている。意図候補には、例えば、「ホテルの場所の確認」、「ホテルの予約」、「車のレンタル」などが含まれる。意図理解部102は、複数の意図候補の中から、テキスト中の単語の意味クラスに応じた意図を選択する。なお、ユーザの意図を理解する方法は、ここで説明した例に限定されない。
図9は、対話支援システム100が実行する対話支援処理の手順例を概略的に示している。図9のステップS901では、ユーザから音声が入力される。ステップS902では、音声認識部101は、入力された音声に対して音声認識を行う。例えば、音声認識部101は、入力された音声をテキストに変換し、テキスト中の単語ごとに単語確信度を決定する。ステップS903では、意図理解部102は、形態素解析及び固有表現抽出技術を用いて音声認識部101で得られたテキストを解析することによりユーザの意図を理解し、理解したユーザの意図、意図確信度、及び引数を含む情報を生成する。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶又は一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (8)
- ユーザが発した音声に対して音声認識を行い、前記音声に対応するテキスト、並びに、前記テキストに含まれる各単語について前記音声認識の確からしさを示す第1の確信度を得る音声認識部と、
前記テキストに基づいて前記ユーザの意図を理解し、理解の確からしさを示す第2の確信度を得る意図理解部と、
前記第1の確信度に基づいて、前記音声認識が誤っているか否かを判定し、前記第2の確信度に基づいて、前記理解が誤っているか否かを判定する確信度評価部と、
目的とアクションとの関係及び目的と対象との関係を示す目的知識を記憶する第1の記憶部と、
アクションと対象との関係を示す課題解決知識を記憶する第2の記憶部と、
前記理解が誤っていると判断された場合に、或いは、前記ユーザの意図に対応付けられた対話処理を実行するために使用する単語に対する前記音声認識が誤っていると判定された場合に、前記第1の確信度が高い単語について前記目的知識の前記目的を参照してアクション候補及び対象候補を別々に求め、前記課題解決知識を用いて前記アクション候補と前記対象候補を結びつけることにより、課題解決策を抽出する課題解決策抽出部と、
前記課題解決策に対応付けられた対話処理を実行する対話制御部と、
を具備する対話支援システム。 - 前記実行された対話処理に応じた応答文を生成する応答文生成部をさらに具備する請求項1に記載の対話支援システム。
- 前記ユーザが使用しているアプリケーション及び前記ユーザの位置を示す情報を記憶する第3の記憶部と、
前記情報に基づいて前記目的知識及び前記課題解決知識を絞り込むコンテキスト管理部と、
をさらに具備する請求項1に記載の対話支援システム。 - 前記第1の確信度が第1の閾値以上でありかつ前記第2の確信度が第2の閾値未満である場合に、前記ユーザの意図をチェックポイント意図として記憶する第4の記憶部をさらに具備し、
前記コンテキスト管理部は、前記チェックポイント意図に対応付けられた対話処理を実行可能であるか否かを判定する、請求項3に記載の対話支援システム。 - 前記ユーザの発話に関する発話履歴を記憶する第5の記憶部と、
前記発話履歴に基づいて前記目的知識及び前記課題解決知識を絞り込むコンテキスト管理部と、
をさらに具備する請求項1に記載の対話支援システム。 - 前記第1の確信度が第1の閾値以上でありかつ前記第2の確信度が第2の閾値未満である場合に、前記ユーザの意図をチェックポイント意図として記憶する第6の記憶部をさらに具備し、
前記コンテキスト管理部は、前記チェックポイント意図に対応付けられた対話処理を実行可能であるか否かを判定する、請求項5に記載の対話支援システム。 - ユーザが発した音声に対して音声認識を行い、前記音声に対応するテキスト、並びに、前記テキストに含まれる各単語について前記音声認識の確からしさを示す第1の確信度を得ることと、
前記テキストに基づいて前記ユーザの意図を理解し、理解の確からしさを示す第2の確信度を得ることと、
前記第1の確信度に基づいて、前記音声認識が誤っているか否かを判定し、前記第2の確信度に基づいて、前記理解が誤っているか否かを判定することと、
目的とアクションとの関係及び目的と対象との関係を示す目的知識を記憶する第1の記憶部を用意することと、
アクションと対象との関係を示す課題解決知識を記憶する第2の記憶部を用意することと、
前記理解が誤っていると判断された場合に、或いは、前記ユーザの意図に対応付けられた対話処理を実行するために使用する単語に対する前記音声認識が誤っていると判定された場合に、前記第1の確信度が高い単語について前記目的知識の前記目的を参照してアクション候補及び対象候補を別々に求め、前記課題解決知識を用いて前記アクション候補と前記対象候補を結びつけることにより、課題解決策を抽出することと、
前記課題解決策に対応付けられた対話処理を実行することと、
を具備する対話支援方法。 - コンピュータを、
ユーザが発した音声に対して音声認識を行い、前記音声に対応するテキスト、並びに、前記テキストに含まれる各単語について前記音声認識の確からしさを示す第1の確信度を得る音声認識手段と、
前記テキストに基づいて前記ユーザの意図を理解し、理解の確からしさを示す第2の確信度を得る意図理解手段と、
前記第1の確信度に基づいて、前記音声認識が誤っているか否かを判定し、前記第2の確信度に基づいて、前記理解が誤っているか否かを判定する確信度評価手段と、
前記理解が誤っていると判断された場合に、或いは、前記ユーザの意図に対応付けられた対話処理を実行するために使用する単語に対する前記音声認識が誤っていると判定された場合に、前記第1の確信度が高い単語について、目的とアクションとの関係及び目的と対象との関係を示す目的知識の前記目的を参照して、アクション候補及び対象候補を別々に求め、アクションと対象との関係を示す課題解決知識を用いて前記アクション候補と前記対象候補を結びつけることにより、課題解決策を抽出する課題解決策抽出手段と、
前記課題解決策に対応付けられた対話処理を実行する対話制御手段として機能させるための対話支援プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/082253 WO2015079575A1 (ja) | 2013-11-29 | 2013-11-29 | 対話支援システム、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015079575A1 JPWO2015079575A1 (ja) | 2017-03-16 |
JP6143883B2 true JP6143883B2 (ja) | 2017-06-07 |
Family
ID=53198560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015550518A Expired - Fee Related JP6143883B2 (ja) | 2013-11-29 | 2013-11-29 | 対話支援システム、方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6143883B2 (ja) |
WO (1) | WO2015079575A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109524009A (zh) * | 2018-12-13 | 2019-03-26 | 中国平安财产保险股份有限公司 | 基于语音识别的保单录入方法和相关装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6730226B2 (ja) * | 2016-09-16 | 2020-07-29 | 株式会社東芝 | 情報管理システム |
US10713233B2 (en) | 2016-09-16 | 2020-07-14 | Kabushiki Kaisha Toshiba | Information management system |
JP6787269B2 (ja) * | 2017-07-21 | 2020-11-18 | トヨタ自動車株式会社 | 音声認識システム及び音声認識方法 |
JP6857581B2 (ja) * | 2017-09-13 | 2021-04-14 | 株式会社日立製作所 | 成長型対話装置 |
KR102204740B1 (ko) | 2019-02-28 | 2021-01-19 | 네이버 주식회사 | 대화 시스템에서의 의도 불분명 질의를 처리하는 방법 및 시스템 |
CN110263180B (zh) * | 2019-06-13 | 2021-06-04 | 北京百度网讯科技有限公司 | 意图知识图谱生成方法、意图识别方法及装置 |
US11487945B2 (en) * | 2019-07-02 | 2022-11-01 | Servicenow, Inc. | Predictive similarity scoring subsystem in a natural language understanding (NLU) framework |
JP7471921B2 (ja) * | 2020-06-02 | 2024-04-22 | 株式会社日立製作所 | 音声対話装置、音声対話方法、および音声対話プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11306195A (ja) * | 1998-04-24 | 1999-11-05 | Mitsubishi Electric Corp | 情報検索システムおよび情報検索方法 |
JP2002108614A (ja) * | 2000-09-26 | 2002-04-12 | Toshiba Corp | 入力解釈装置、方法及び対話システム |
JP2002269146A (ja) * | 2001-03-08 | 2002-09-20 | Fujitsu Ltd | ワードスポッティング情報検索装置とワードスポッティング情報検索装置を実現するための方法及びプログラム |
-
2013
- 2013-11-29 JP JP2015550518A patent/JP6143883B2/ja not_active Expired - Fee Related
- 2013-11-29 WO PCT/JP2013/082253 patent/WO2015079575A1/ja active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109524009A (zh) * | 2018-12-13 | 2019-03-26 | 中国平安财产保险股份有限公司 | 基于语音识别的保单录入方法和相关装置 |
CN109524009B (zh) * | 2018-12-13 | 2024-04-09 | 中国平安财产保险股份有限公司 | 基于语音识别的保单录入方法和相关装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2015079575A1 (ja) | 2015-06-04 |
JPWO2015079575A1 (ja) | 2017-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6143883B2 (ja) | 対話支援システム、方法、及びプログラム | |
JP6942841B2 (ja) | ダイアログ・システムにおけるパラメータ収集および自動ダイアログ生成 | |
KR102313473B1 (ko) | 자동 어시스턴트를 위한 명령 번들 제안 제공 | |
US9275633B2 (en) | Crowd-sourcing pronunciation corrections in text-to-speech engines | |
KR102390940B1 (ko) | 음성 인식을 위한 컨텍스트 바이어싱 | |
JP6535349B2 (ja) | 以前の対話行為を使用する自然言語処理における文脈解釈 | |
US9449599B2 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
US11074909B2 (en) | Device for recognizing speech input from user and operating method thereof | |
US11797772B2 (en) | Word lattice augmentation for automatic speech recognition | |
US20110153322A1 (en) | Dialog management system and method for processing information-seeking dialogue | |
JP6726354B2 (ja) | 訂正済みタームを使用する音響モデルトレーニング | |
US9594744B2 (en) | Speech transcription including written text | |
CN113851120A (zh) | 开发者语音动作系统 | |
US11790891B2 (en) | Wake word selection assistance architectures and methods | |
JPWO2016151700A1 (ja) | 意図理解装置、方法およびプログラム | |
US20200219487A1 (en) | Information processing apparatus and information processing method | |
JP7400112B2 (ja) | 自動音声認識のための英数字列のバイアス付加 | |
US20150095024A1 (en) | Function execution instruction system, function execution instruction method, and function execution instruction program | |
KR20210060897A (ko) | 음성 처리 방법 및 장치 | |
Pan et al. | Automatically generating and improving voice command interface from operation sequences on smartphones | |
JP6275569B2 (ja) | 対話装置、方法およびプログラム | |
EP3005152B1 (en) | Systems and methods for adaptive proper name entity recognition and understanding | |
Bermuth et al. | Jaco: An offline running privacy-aware voice assistant | |
US20240202469A1 (en) | Auto-translation of customized assistant | |
JP2019191646A (ja) | 登録語管理装置、音声対話システム、登録語管理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170509 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6143883 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |