JP7000096B2 - 対話処理装置および対話処理システム - Google Patents
対話処理装置および対話処理システム Download PDFInfo
- Publication number
- JP7000096B2 JP7000096B2 JP2017187858A JP2017187858A JP7000096B2 JP 7000096 B2 JP7000096 B2 JP 7000096B2 JP 2017187858 A JP2017187858 A JP 2017187858A JP 2017187858 A JP2017187858 A JP 2017187858A JP 7000096 B2 JP7000096 B2 JP 7000096B2
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- item
- information
- candidate
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 352
- 230000004044 response Effects 0.000 claims description 41
- 239000000284 extract Substances 0.000 claims description 12
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 16
- 230000004308 accommodation Effects 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 2
- 230000000391 smoking effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/543—User-generated data transfer, e.g. clipboards, dynamic data exchange [DDE], object linking and embedding [OLE]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
本実施形態の対話処理装置は、ユーザが明確な目的をもって利用する目的達成型の対話処理装置であり、ユーザとの対話を通じて、その目的に応じた所定の動作を実行するための1又は複数の項目の情報を獲得する。例えば、目的が「商談記録」であれば、「訪問日時」、「訪問先」、「次回予定日」、「特記事項」などの各項目の情報を、ユーザとの対話を通じて獲得する。また、目的が「宿泊予約」であれば、「チェックイン予定日時」、「チェックアウト予定日時」、「宿泊人数」、「宿泊プラン」などの各項目の情報、目的がカーナビゲーションシステムの「経路探索」であれば、「目的地」、「有料道路利用の有無」などの各項目の情報が、それぞれ獲得すべき情報となる。なお、以下では獲得すべき情報が複数の項目の情報であるものとして説明するが、獲得すべき情報が1つの項目の情報であってもよい。
図1は、第1実施形態に係る対話処理装置10の機能的な構成例を示すブロック図である。本実施形態の対話処理装置10は、図1に示すように、対話制御部11と複数の項目別処理部12A,12B,12C,12D(以下、これらを特に区別しない場合は「項目別処理部12」と表記する)との組み合わせを、ユーザ50との間の対話処理を実現するための基本ユニットとして備える。この対話処理装置10は、スロットテーブル16の各スロットに入力する情報を獲得するために、ユーザ50との間の対話処理を行う。
なお、以上の説明では、項目別処理部12から送られた候補のスコアが第1閾値未満で、且つ、第2閾値以上の場合に、その候補が正しいか否かをユーザ50に問い合わせるための応答テキストを対話制御部11が作成するものとしたが、その候補を送った項目別処理部12が応答テキストを作成してもよい。この場合、項目別処理部12は、入力テキストから抽出した候補のスコアが第1閾値未満で、且つ、第2閾値以上の場合、その候補とスコアを対話制御部11に送る代わりに、その候補が正しいか否かを問い合わせる応答テキストを対話制御部11に送る。対話制御部11は、いずれかの項目別処理部12から応答テキストを受け取った場合、その応答テキスト、あるいは、音声合成処理によりその応答テキストから変換された合成音をユーザ50に対して出力する。
また、以上の説明では、スコアが第1閾値未満で、且つ、第2閾値以上の候補のみを対象として、その候補が正しいか否かをユーザ50に問い合わせるものとしたが、問い合わせの頻度をユーザ50が指定できるようにしてもよい。例えば、対話処理装置10の動作モードとして、「標準モード」と「確実モード」を設け、ユーザ50により「標準モード」が選択された場合は、上述の例と同様にスコアが第1閾値未満で、且つ、第2閾値以上の候補のみを対象として、その候補が正しいか否かをユーザ50に問い合わせるようにし、ユーザ50により「確実モード」が選択された場合は、スコアが第2閾値以上の全ての候補を対象として、その候補が正しいか否かをユーザ50に問い合わせるようにしてもよい。また、対話処理装置10の動作モードとしてさらに「簡易モード」を追加し、ユーザ50により「簡易モード」が選択された場合は、ユーザ50に対する問い合わせを行わずに、スコアが第1閾値未満で、且つ、第2閾値以上の候補を対応する項目の情報として確定するようにしてもよい。また、ユーザ50により「確実モード」が選択された場合は第1閾値の値を下げ、ユーザ50により「簡易モード」が選択された場合は第2閾値の値を上げるといったように、ユーザ50により選択された動作モードに応じてスコアに対する閾値を変化させる構成としてもよい。また、最後に入力された内容がこれでよいかを確認するモードや、選択したモードに関係なく、最終的に確定する内容に対して確認する仕組みを設けてもよい。
また、本実施形態の対話処理装置10は、スロットテーブル16の各スロット17に入力する情報を獲得するための複数の項目別処理部12だけでなく、ユーザ50との対話を円滑に進めるための対話処理部を備えた構成としてもよい。例えば、ユーザ50との対話処理の開始時に挨拶の応答を行う対話処理部を備えていてもよい。このような対話処理部は、項目別処理部12と同様の仕組みで構築することもできる。すなわち、例えば一問一答型の汎用処理部に対して、様々な挨拶のパターンを示す動作パラメータを与えることで、ユーザ50との対話処理の開始時に挨拶の応答を行う対話処理部を構築することができる。
次に、第2実施形態について説明する。本実施形態は、達成すべき目的が互いに異なる複数の対話処理装置10を組み合わせて、多目的型の対話処理システムを構築した例である。
なお、上述の各実施形態および変形例では、複数の項目別処理部12と対話制御部11との組み合わせにより対話処理装置10が構成され、複数の対話処理装置10と選択部40との組み合わせにより対話処理システム100が構成されるものとして説明したが、対話処理装置10や対話処理システム100の構成としては様々なバリエーションが考えられる。例えば、上述の項目別処理部12、対話処理装置10、対話処理システム100をそれぞれ部品(以下では、項目別処理部12を「小エージェント」、対話処理装置10を「中エージェント」、対話処理システム100を「大エージェント」とする)として捉え、これら小エージェント、中エージェント、大エージェントの様々な組み合わせにより、階層数も含め様々な構成とすることができる。
上述の第1実施形態に係る対話処理装置10や第2実施形態に係る対話処理システム100は、例えば、一般的なコンピュータを構成するハードウェアと、コンピュータで実行されるプログラム(ソフトウェア)との協働により実現することができる。例えば、コンピュータが所定のプログラムを実行することによって、上述の対話制御部11、項目別処理部12A~12D、更新部14、パラメータ調整部15などの対話処理装置10を構成する機能的な構成要素や、対話処理装置10A~10Cおよび選択部40などの対話処理システム100を構成する機能的な構成要素を実現することができる。また、コンピュータが備える大容量記憶装置を用いて、上述の対話履歴蓄積部13などを実現することができる。
11 対話制御部
12(12A,12B,12C,12D) 項目別処理部
13 対話履歴蓄積部
14 更新部
15 パラメータ調整部
20A 日時型汎用処理部
20B 選択肢型汎用処理部
20D 自由記述型汎用処理部
21(21A,21B,21D) 対話知識
22A,22B,22C,22D 項目名
23A,23B,23C,23D 動作パラメータ
40 選択部
100 対話処理システム
Claims (7)
- ユーザとの対話を通じて、所定の動作を実行するための1又は複数の項目の情報を獲得する対話処理装置であって、
前記1又は複数の項目に対応する1又は複数の項目別処理部と、
前記1又は複数の項目別処理部と連携してユーザとの対話を制御する対話制御部と、を備え、
前記対話制御部は、ユーザの入力に応じた入力情報を前記1又は複数の項目別処理部の各々に送り、
前記1又は複数の項目別処理部の各々は、前記対話制御部から受け取った前記入力情報から自身が獲得すべき情報の候補を抽出して、抽出した候補を該候補が獲得すべき情報であることの確からしさの度合いを示す情報とともに前記対話制御部に送り、
前記対話制御部は、前記1又は複数の項目別処理部の各々から受け取った候補のうち、前記確からしさの度合いが第1基準を満たす候補を、該候補を送った項目別処理部に対応する項目の情報として確定し、情報が未確定の項目があれば、該項目の情報を問い合わせる応答をユーザに対して出力し、
前記1又は複数の項目別処理部の各々は、獲得すべき情報の型に応じた対話知識に基づいて前記候補の抽出および前記確からしさの度合いを算出する基本ルールを有する汎用処理部に対して、対応する項目の項目名と自身の動作を決定付ける動作パラメータとが与えられることにより構築される
対話処理装置。 - 前記対話制御部は、前記1又は複数の項目別処理部のいずれかから前記確からしさの度合いが前記第1基準を満たさず、且つ、前記第1基準とは異なる第2基準を満たす候補を受け取った場合、該候補が正しいか否かを問い合わせる応答をユーザに対して出力する
請求項1に記載の対話処理装置。 - 前記対話制御部は、前記1又は複数の項目のうち、前記所定の動作を実行するために必要な情報が確定すると、確定した項目の情報に基づいて前記所定の動作を実行する
請求項1または2に記載の対話処理装置。 - ユーザとの対話の履歴を蓄積する対話履歴蓄積部と、
前記履歴に基づいて、前記1又は複数の項目別処理部のいずれかに対応する項目の情報として確定すべき情報を確定できなかった事象を検出し、該情報を該項目の情報として確定できるように、該項目に対応する項目別処理部の前記対話知識を更新する更新部と、をさらに備える
請求項1乃至3のいずれか一項に記載の対話処理装置。 - 前記対話制御部は、予め定められた動作モードが選択された場合であって、前記1又は複数の項目のうちのいずれかの項目の情報として確定すべき情報が前記入力情報に含まれると判断した場合、該項目に対応する項目別処理部から受け取った候補の前記確からしさの度合いが前記第1基準を満たさず、且つ、前記第1基準とは異なる第2基準を満たす場合であっても、該候補が正しいか否かを問い合わせる応答をユーザに対して出力せずに、該候補を該項目の情報として確定する
請求項1に記載の対話処理装置。 - ユーザの属性を取得して、取得した属性に応じて前記対話制御部がユーザとの対話を制御する制御パラメータを調整するパラメータ調整部をさらに備える
請求項1乃至5のいずれか一項に記載の対話処理装置。 - 請求項1乃至6のいずれか一項に記載の対話処理装置であって、前記所定の動作が互いに異なる複数の前記対話処理装置と、
前記入力情報に基づいてユーザが目的とする前記所定の動作を判断し、該所定の動作に対応する前記対話処理装置を選択する選択部と、
を備える対話処理システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017187858A JP7000096B2 (ja) | 2017-09-28 | 2017-09-28 | 対話処理装置および対話処理システム |
PCT/JP2018/035497 WO2019065647A1 (ja) | 2017-09-28 | 2018-09-25 | 対話処理装置および対話処理システム |
CN201880058572.1A CN111095237B (zh) | 2017-09-28 | 2018-09-25 | 对话处理装置及对话处理系统 |
US16/811,197 US10896074B2 (en) | 2017-09-28 | 2020-03-06 | Interactive processing device and interactive processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017187858A JP7000096B2 (ja) | 2017-09-28 | 2017-09-28 | 対話処理装置および対話処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019061620A JP2019061620A (ja) | 2019-04-18 |
JP7000096B2 true JP7000096B2 (ja) | 2022-01-19 |
Family
ID=65901392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017187858A Active JP7000096B2 (ja) | 2017-09-28 | 2017-09-28 | 対話処理装置および対話処理システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10896074B2 (ja) |
JP (1) | JP7000096B2 (ja) |
CN (1) | CN111095237B (ja) |
WO (1) | WO2019065647A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443355B (zh) * | 2019-08-06 | 2021-11-16 | 思必驰科技股份有限公司 | 应用于复合对话任务的对话方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004045900A (ja) | 2002-07-12 | 2004-02-12 | Toyota Central Res & Dev Lab Inc | 音声対話装置及びプログラム |
WO2007088877A1 (ja) | 2006-01-31 | 2007-08-09 | Honda Motor Co., Ltd. | 会話システムおよび会話ソフトウェア |
JP2008506156A (ja) | 2004-07-06 | 2008-02-28 | ボクシィファイ, インコーポレイテッド | マルチスロット対話システムおよび方法 |
JP2013542484A (ja) | 2010-08-30 | 2013-11-21 | 本田技研工業株式会社 | 対話システムにおける思考追跡および行動選択 |
US20140136212A1 (en) | 2012-11-14 | 2014-05-15 | Electronics And Telecommunications Research Institute | Spoken dialog system based on dual dialog management using hierarchical dialog task library |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007264198A (ja) | 2006-03-28 | 2007-10-11 | Toshiba Corp | 対話装置、対話方法、対話システム、コンピュータプログラム及び対話シナリオ生成装置 |
JP6604542B2 (ja) * | 2015-04-02 | 2019-11-13 | パナソニックIpマネジメント株式会社 | 対話方法、対話プログラム及び対話システム |
-
2017
- 2017-09-28 JP JP2017187858A patent/JP7000096B2/ja active Active
-
2018
- 2018-09-25 WO PCT/JP2018/035497 patent/WO2019065647A1/ja active Application Filing
- 2018-09-25 CN CN201880058572.1A patent/CN111095237B/zh active Active
-
2020
- 2020-03-06 US US16/811,197 patent/US10896074B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004045900A (ja) | 2002-07-12 | 2004-02-12 | Toyota Central Res & Dev Lab Inc | 音声対話装置及びプログラム |
JP2008506156A (ja) | 2004-07-06 | 2008-02-28 | ボクシィファイ, インコーポレイテッド | マルチスロット対話システムおよび方法 |
WO2007088877A1 (ja) | 2006-01-31 | 2007-08-09 | Honda Motor Co., Ltd. | 会話システムおよび会話ソフトウェア |
JP2013542484A (ja) | 2010-08-30 | 2013-11-21 | 本田技研工業株式会社 | 対話システムにおける思考追跡および行動選択 |
US20140136212A1 (en) | 2012-11-14 | 2014-05-15 | Electronics And Telecommunications Research Institute | Spoken dialog system based on dual dialog management using hierarchical dialog task library |
Non-Patent Citations (2)
Title |
---|
上野 晋一、外1名,ユーザと状況のモデルを用いたプランニングを行う音声対話システム,第40回 言語・音声理解と対話処理研究会資料,日本,社団法人人工知能学会,2004年03月05日,p.65-72 |
長森 誠、他4名,マルチドメイン音声対話システムの構築手法,情報処理学会研究報告,日本,社団法人情報処理学会,2000年06月02日,第2000巻,第53号,p.83-89 |
Also Published As
Publication number | Publication date |
---|---|
US20200210253A1 (en) | 2020-07-02 |
JP2019061620A (ja) | 2019-04-18 |
US10896074B2 (en) | 2021-01-19 |
CN111095237B (zh) | 2023-10-13 |
CN111095237A (zh) | 2020-05-01 |
WO2019065647A1 (ja) | 2019-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105895103B (zh) | 一种语音识别方法及装置 | |
JP5831951B2 (ja) | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム | |
JP2019159309A (ja) | 音声対話の満足度の確定方法及び装置 | |
CN102549652B (zh) | 信息检索装置 | |
US20190139537A1 (en) | Dialogue system and dialogue method | |
JP2020505643A (ja) | 音声認識方法、電子機器、及びコンピュータ記憶媒体 | |
JP6762819B2 (ja) | 入力支援装置およびプログラム | |
KR20200067238A (ko) | 화상처리장치, 그 제어 방법, 및 기억매체 | |
TWI656500B (zh) | 嚮導配對系統、嚮導配對方法以及電腦可讀取記憶媒體 | |
JP7058574B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2019012439A (ja) | 生成装置、生成方法及び生成プログラム | |
JP2018194902A (ja) | 生成装置、生成方法および生成プログラム | |
JP7096199B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7000096B2 (ja) | 対話処理装置および対話処理システム | |
JP6275569B2 (ja) | 対話装置、方法およびプログラム | |
JP3542578B2 (ja) | 音声認識装置及びその方法、プログラム | |
JP3903993B2 (ja) | 文章の感情認識装置及び文章の感情認識方法ならびにそのプログラム | |
CN110634480B (zh) | 语音对话系统与模型创建装置及其方法 | |
JP2014232145A (ja) | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム | |
JP2017161644A (ja) | 音声処理システムおよび音声処理方法 | |
JP2004348552A (ja) | 音声文書検索装置および方法およびプログラム | |
KR20230029158A (ko) | 쇼핑몰 배너 문장 자동 제작 방법 | |
US20200402506A1 (en) | Response device, response method, and storage medium | |
JP5565632B2 (ja) | 地図情報出力装置、およびプログラム | |
JP2009282835A (ja) | 音声検索装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7000096 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |