JP2019106054A - 対話システム - Google Patents
対話システム Download PDFInfo
- Publication number
- JP2019106054A JP2019106054A JP2017238764A JP2017238764A JP2019106054A JP 2019106054 A JP2019106054 A JP 2019106054A JP 2017238764 A JP2017238764 A JP 2017238764A JP 2017238764 A JP2017238764 A JP 2017238764A JP 2019106054 A JP2019106054 A JP 2019106054A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- weight
- slot
- dialogue
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
Abstract
Description
本願明細書と各図において、既に説明したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
図1に示すように、対話システム110は、取得部10及び処理部20を含む。取得部10は、情報を取得する。処理部20は、その情報の処理を行う。
図2は、第1実施形態に係る対話システムの動作を例示する模式図である。
文章TX1において、対話システム110は、ユーザUSの希望を尋ねる。この質問に対して、ユーザUSは、文章TX2において、希望する料理の種類を発声する。文章TX1及びTX2による情報の授受により、対話システム110は、料理の種類に関するユーザUSの意図を理解する。文章TX1及びTX2のように、対話システム110及びユーザUSの一方から他方に向けて情報が提供され、対話システム110及びユーザUSの他方から一方に向けて情報が提供される一連の流れを「ターン」と言う。
この意図を受けて、対話システム110は、川崎駅の中にあるレストランを検索する。例えば、複数のレストランが見つかった場合、対話システム110は、文章TX7において、1つレストランの名前をユーザUSに伝える(提案する)。例えば、ユーザUSは、文章TX8において、この提案を受け入れることを対話システム110に伝える。
一方、文章TX6では、「料理の種類」に関する希望が取り消される。このため、文章TX6を取得した後では、対話状態の「料理の種類」に関する部分については、「None(希望なし)」となり、対話状態の「場所」に関する部分については、「川崎駅の中」を維持することが望ましい。
対話システム110は、推定の際に、予め設定された「分類」と、その「分類」に含まれる「言葉」を参照する。この「分類」は、スロットと呼ばれる。この「言葉」は、スロットパラメータまたはバリューと呼ばれる。図3は、レストランに関する複数のスロットS1〜Smを例示する。それぞれのスロットには、複数のバリューが設定される。例えば、料理の種類に関するスロットS1は、和食のバリューV11、中華料理のバリューV12、イタリア料理のバリューV13などを含む。場所に関するスロットS2は、川崎駅のバリューV21、東京駅のバリューV22、新宿駅のバリューV23などを含む。それぞれのバリューには、特徴量が設定されている。対話システム110は、複数のスロットS1〜Smを参照し、ユーザUSが意図しているバリューを推定して、そのバリューに関する応答文を生成する。
取得部10は、ユーザUSによって入力された文章を取得する(ステップSt1)。文章は、例えば、ユーザUSによって入力される。文章は、例えば、音情報(音声情報)及び文字情報の少なくともいずれかで表される。音声が入力され、その音声情報から導出された文字情報が、取得部10により取得されても良い。文章は、GUI(Graphical User Interface)部品へのタッチなどの操作情報に基づいても良い。取得部10は、例えば、キーボード、マイクロフォン、及びタッチパネルの少なくともいずれかを含む。
対話システム110は、例えば、第1記憶部31、第2記憶部32、第3記憶部33、第4記憶部34、第1モデル記憶部41、及び第2モデル記憶部42をさらに含む。
第2記憶部32は、複数のスロットと、それぞれのスロットに含まれる複数のスロットパラメータと、を記憶する。
好ましくない一例として、[文章に「和食」が含まれていたら「料理の種類」のスロットに関する重みパラメータを1にする]というルールが設定される。この場合、「トルコ料理」などの他のスロットパラメータが文章に含まれている場合に、「料理の種類」のスロットに関する重みパラメータを1にできない。一方で、[「○○を食べたい」があったら「料理の種類」のスロットに関する重みパラメータを1にする]というルールでは、○○が和食またはトルコ料理であれば重みパラメータを1にできる。
または、対話状態の推定までを一つのRNNとして構築しても良い。この場合、対話状態を示すラベルが付与された文章を用いた教師付き学習が事前に実施される。
上述した対話システム110によれば、以下の処理を実行可能である。
図6は、第1実施形態に係る対話システムの動作を例示するフローチャートである。
第2重み付け量は、第1意図量と、第1文章に係わる第2重みと、に基づいて算出される。第4重み付け量は、第2意図量と、第1文章に係わる第4重みと、に基づいて算出される。第4重みは、例えば、第3重みと異なる。第4重み付け量は、例えば、第2意図量と第4重みとの積に基づく値である。処理部20は、第2重み付け量及び第4重み付け量を、第1記憶部31に記憶する(ステップSt26)。
図7は、第1実施形態に係る対話システムの動作を例示するフローチャートである。
図8は、ユーザUSが食事を望む場合の1つの例を示す。第1実施形態に係る対話システム110によれば、図8に示す例をより適切に処理できる。
例えば、文章TX14では、「料理の種類」のスロットパラメータへの言及は無い。従って、文章TX14に対応するベクトルと、「料理の種類」に含まれる各スロットパラメータのベクトルと、の間の類似度は小さくなる。文章TX16では、「料理の種類」の「中華料理」のスロットパラメータを否定している。従って、文章TX16に対応するベクトルと「中華料理」のスロットパラメータのベクトルとの間の類似度は高くなる。しかし、文章TX16は、中華料理を否定しているため、類似度は低い。例えば、言及が無い場合と否定の場合に応じて、重みパラメータを変化させることで、文章TX14を取得したときに第2優先度を低下させず、文章TX16を取得したときに第2優先度を大きく低下させることができる。この結果、対話システム110は、ユーザUSが、和食を希望していることを適切に推定できる。
ステップSt40及びSt41は、図4に示したフローチャートのステップSt1及びSt2と同様に実行される。抽出部23は、入力された文章から複数の重みパラメータを抽出する(ステップSt42)。複数の重みパラメータは、それぞれ、過去の複数の対話状態にどの程度注目すべきかを表す。例えば、推定部24による対話状態の推定に第1履歴〜第N履歴が用いられる場合、N個の重みパラメータが抽出される。複数の重みパラメータのそれぞれは、例えば、「1」または「0」で表わされる。例えば、「1」は、その履歴に注目すべきことを表し、「0」は、その履歴に注目しないことを表す。複数の重みパラメータのそれぞれは、注目すべき度合いを表す0以上1以下の実数値であっても良い。または、複数の重みパラメータのそれぞれは、注目すべき度合いを表すベクトルであっても良い。
図10に示す例では、4ターン目の文章TX28で、話題(ユーザUSの希望)が転換し、以前の話題に戻っている。すなわち、ユーザUSは、文章TX28で、話題を1ターン目の文章TX22で言及した中華料理に戻している。
図11は、第1実施形態に係る対話システムの動作を例示するフローチャートである。
図12に示した対話システム120は、抽出部23を含んでいない。この場合、重みは、例えば、取得された文章におけるスロットへの言及の有無または言及の度合いに基づいて決定される。
取得部10は、ユーザによって入力された文章を取得する(ステップSt71)。処理部20は、取得部10によって取得された文章を解析する(ステップSt72)。これにより、文章に含まれるユーザの意図が推定される。処理部20は、文章に基づいて重みを決定する(ステップSt73)。さらに、処理部20は、過去の対話状態を参照する(ステップSt74)。
図14に示す例では、文章TX31〜TX34を含む1ターン目および2ターン目の対話により、例えば、「料理の種類」については、「中華料理」の確率が1となる。「場所」については、「川崎駅」の確率が1となる。その後の文章TX35において、ユーザUSは、和食を希望している。より具体的には、この文章TX35は、ユーザUSが中華料理では無く和食を希望する意図を含む。対話システム120によれば、文章TX35の取得に基づき、「和食」の確率を「中華料理」の確率よりも高めることができる。この結果、対話システム120は、川崎駅の中の和食のレストランを検索し、その検索結果を文章TX36においてユーザUSに伝える。
対話システム210は、ユーザによって入力された文章だけでなく、直前に対話システム210が提供した情報(質問)も用いて処理を行う。
対話制御部27は、システム応答を決定し(ステップSt80)、システム応答をシステム応答取得部26及び出力部50に送る。例えば、対話が開始した直後は、「いらっしゃいませ。ご用件をお伺いします」がシステム応答である。その後は、対話状態に基づきシステム応答が決定される。この応答制御には、例えば、事前に作成されたルールまたは事前に学習されたモデルが用いられる。
対話システム210によれば、システム応答取得部26が、システム応答を取得する。これにより、重みパラメータを抽出する際に、「そう」が肯定を表していることが分かり、システム応答への重みを大きくできる。この結果、ユーザが和食を希望していると適切に推定できる。
上述した各実施形態に係る対話システムは、例えば、図15に示した対話装置310により実現される。対話装置310は、一例として、一般のコンピュータ(情報処理装置)と同様のハードウェア構成により実現される。対話装置310は、CPU(Central Processing Unit)311と、取得部312と、出力部313と、ROM(Read Only Memory)314と、RAM(Random Access Memory)315と、記憶部316と、通信装置317と、バス318とを含む。各部は、バス318により接続される。
Claims (12)
- 第1文章を取得する取得部と、
第1対話状態の第1スロットに関する第1特徴量と、前記第1文章に係わる第1重みと、に基づく第1重み付け量を参照し、
前記第1文章に含まれる第1意図の前記第1スロットに関する第1意図量と、前記第1重みと異なり、前記第1文章に係わる第2重みと、に基づく第2重み付け量を参照し、
前記第1重み付け量および前記第2重み付け量を用いて、前記第1対話状態の後の第2対話状態の前記第1スロットに関する第2特徴量を出力する、
処理部と、
を備えた対話システム。 - 前記第1重みは、前記第1文章における前記第1スロットへの言及の第1度合いに係わる請求項1記載の対話システム。
- 前記第1度合いが第1状態のとき、前記第1重みは前記第2重みよりも大きく、
前記第1度合いが第2状態のとき、前記第2重みは前記第1重みよりも大きく、
前記第1状態における前記第1度合いは、前記第2状態における前記第1度合いよりも小さい請求項2記載の対話システム。 - 前記第1スロットは、複数の第1スロットパラメータを含み、
前記処理部は、前記第1文章に対応する第1ベクトルと、前記複数の第1スロットパラメータのそれぞれのベクトルと、の類似度に基づいて前記第1意図量を算出する請求項1〜3のいずれか1つに記載の対話システム。 - 前記第1重み付け量は、前記第1特徴量と前記第1重みとの積に基づき
前記第2重み付け量は、前記第1意図量と前記第2重みとの積に基づく請求項1〜4のいずれか1つに記載の対話システム。 - 前記第2特徴量は、前記第1重み付け量と前記第2重み付け量との和に基づく請求項1〜5のいずれか1つに記載の対話システム。
- 前記処理部は、さらに、
前記第1対話状態の第2スロットに関する第3特徴量と、前記第1文章に係わる第3重みと、に基づく第3重み付け量を参照し、
前記第1意図の前記第2スロットに関する第2意図量と、前記第3重みと異なり、前記第1文章に係わる第4重みと、に基づく第4重み付け量を参照し、
前記第3重み付け量および前記第4重み付け量を用いて、前記第2対話状態の前記第2スロットに関する第4特徴量を出力する、
請求項1〜6のいずれか1つに記載の対話システム。 - 前記取得部は、前記第1文章の取得の後に第2文章をさらに取得し、
前記処理部は、さらに、
前記第2特徴量と、前記第2文章に係わる第5重みと、に基づく第5重み付け量を参照し、
前記第2文章に含まれる第2意図の前記第1スロットに関する第2意図量と、前記第5重みと異なり、前記第2文章に係わる第6重みと、に基づく第6重み付け量を参照し、
前記第5重み付け量および前記第6重み付け量を用いて、前記第2対話状態の後の第3対話状態の前記第1スロットに関する第5特徴量を出力する、
請求項1〜7のいずれか1つに記載の対話システム。 - 前記処理部は、
前記第1特徴量と、前記第5重みおよび前記第6重みと異なり、前記第2文章に拘わる第7重みと、に基づく第7重み付け量をさらに参照し、
前記第5重み付け量、前記第6重み付け量、及び第7重み付け量を用いて前記第5特徴量を出力する、
請求項8記載の対話システム。 - 第1対象及び第2対象を希望する第1文章を取得すると、前記第1対象に対応する第1スロットパラメータの第1優先度及び前記第2対象に対応する第2スロットパラメータの第2優先度を高め、
前記第1文章の取得の後に前記第2対象を否定する第2文章を取得すると、前記第1優先度を前記第2優先度よりも高める、
処理部を備えた対話システム。 - 前記処理部は、前記第1文章を取得すると、前記第1優先度及び前記第2優先度を、第3対象に対応する第3スロットパラメータの第3優先度よりも高める請求項10記載の対話システム。
- 第1対象を希望する第1文章を取得すると、前記第1対象に対応する第1スロットパラメータの第1優先度を、第2対象に対応する第2スロットパラメータの第2優先度よりも高め、
前記第1文章の取得の後に前記第2対象を希望する第2文章を取得すると、前記第2優先度を前記第1優先度よりも高める、
処理部を備えた対話システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017238764A JP2019106054A (ja) | 2017-12-13 | 2017-12-13 | 対話システム |
CN201811008382.7A CN110019746B (zh) | 2017-12-13 | 2018-08-31 | 对话系统 |
US16/119,674 US11087753B2 (en) | 2017-12-13 | 2018-08-31 | Dialog system |
JP2021092863A JP7249378B2 (ja) | 2017-12-13 | 2021-06-02 | 対話装置、プログラム、及び対話方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017238764A JP2019106054A (ja) | 2017-12-13 | 2017-12-13 | 対話システム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021092863A Division JP7249378B2 (ja) | 2017-12-13 | 2021-06-02 | 対話装置、プログラム、及び対話方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019106054A true JP2019106054A (ja) | 2019-06-27 |
Family
ID=66697149
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017238764A Pending JP2019106054A (ja) | 2017-12-13 | 2017-12-13 | 対話システム |
JP2021092863A Active JP7249378B2 (ja) | 2017-12-13 | 2021-06-02 | 対話装置、プログラム、及び対話方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021092863A Active JP7249378B2 (ja) | 2017-12-13 | 2021-06-02 | 対話装置、プログラム、及び対話方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11087753B2 (ja) |
JP (2) | JP2019106054A (ja) |
CN (1) | CN110019746B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102567447B1 (ko) * | 2018-03-05 | 2023-08-16 | 구글 엘엘씨 | 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의 전환 |
KR102133825B1 (ko) * | 2018-06-22 | 2020-07-16 | 서강대학교 산학협력단 | 단어자질을 강화한 음성 대화 방법 및 시스템 |
US11971910B2 (en) * | 2018-10-22 | 2024-04-30 | International Business Machines Corporation | Topic navigation in interactive dialog systems |
KR102281581B1 (ko) * | 2019-07-17 | 2021-07-23 | 에스케이텔레콤 주식회사 | 목표지향 대화시스템에서의 대화상태 추적방법 및 장치 |
US11250216B2 (en) * | 2019-08-15 | 2022-02-15 | International Business Machines Corporation | Multiple parallel delineated topics of a conversation within the same virtual assistant |
US11636438B1 (en) | 2019-10-18 | 2023-04-25 | Meta Platforms Technologies, Llc | Generating smart reminders by assistant systems |
US11567788B1 (en) | 2019-10-18 | 2023-01-31 | Meta Platforms, Inc. | Generating proactive reminders for assistant systems |
CN110827831A (zh) * | 2019-11-15 | 2020-02-21 | 广州洪荒智能科技有限公司 | 基于人机交互的语音信息处理方法、装置、设备及介质 |
US11727926B1 (en) * | 2020-09-18 | 2023-08-15 | Amazon Technologies, Inc. | Systems and methods for noise reduction |
WO2023219261A1 (ko) * | 2022-05-09 | 2023-11-16 | 삼성전자주식회사 | 대화 컨텐츠를 기반으로 이벤트를 생성하는 전자 장치, 제어 방법 및 비일시적 컴퓨터 판독 가능 저장 매체 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004354787A (ja) * | 2003-05-30 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
JP2005301780A (ja) * | 2004-04-14 | 2005-10-27 | Sony Corp | 情報処理装置および情報処理方法、並びに、プログラム |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3716870B2 (ja) * | 1995-05-31 | 2005-11-16 | ソニー株式会社 | 音声認識装置および音声認識方法 |
US7346492B2 (en) * | 2001-01-24 | 2008-03-18 | Shaw Stroz Llc | System and method for computerized psychological content analysis of computer and media generated communications to produce communications management support, indications, and warnings of dangerous behavior, assessment of media images, and personnel selection support |
US8041570B2 (en) * | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
US20100076843A1 (en) * | 2006-02-28 | 2010-03-25 | Speaksoft, Inc. | Live-agent-enabled teis systems |
WO2008034111A2 (en) * | 2006-09-14 | 2008-03-20 | Google Inc. | Integrating voice-enabled local search and contact lists |
JP2010020273A (ja) * | 2007-12-07 | 2010-01-28 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
US8793119B2 (en) * | 2009-07-13 | 2014-07-29 | At&T Intellectual Property I, L.P. | System and method for generating manually designed and automatically optimized spoken dialog systems |
US9263058B2 (en) * | 2010-06-24 | 2016-02-16 | Honda Motor Co., Ltd. | Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system |
US9329832B2 (en) * | 2011-05-09 | 2016-05-03 | Robert Allen Blaisch | Voice internet system and method |
JP5967569B2 (ja) * | 2012-07-09 | 2016-08-10 | 国立研究開発法人情報通信研究機構 | 音声処理システム |
US9070366B1 (en) * | 2012-12-19 | 2015-06-30 | Amazon Technologies, Inc. | Architecture for multi-domain utterance processing |
WO2014109421A1 (ko) * | 2013-01-09 | 2014-07-17 | 엘지전자 주식회사 | 단말기 및 그 동작 제어 방법 |
US9231898B2 (en) * | 2013-02-08 | 2016-01-05 | Machine Zone, Inc. | Systems and methods for multi-user multi-lingual communications |
AU2014233517B2 (en) * | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
US9898789B2 (en) * | 2013-04-16 | 2018-02-20 | Palo Alto Research Center Incorporated | Method and a system for providing hosted services based on a generalized model of a health/wellness program |
US9589565B2 (en) * | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
WO2015075975A1 (ja) * | 2013-11-25 | 2015-05-28 | 三菱電機株式会社 | 対話制御装置及び対話制御方法 |
US9361589B2 (en) * | 2013-11-28 | 2016-06-07 | Akademia Gorniczo-Hutnicza Im. Stanislawa Staszira W. Krakowie | System and a method for providing a dialog with a user |
JP6235360B2 (ja) * | 2014-02-05 | 2017-11-22 | 株式会社東芝 | 発話文収集装置、方法、及びプログラム |
US9263042B1 (en) * | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
US20160034249A1 (en) * | 2014-07-31 | 2016-02-04 | Microsoft Technology Licensing Llc | Speechless interaction with a speech recognition device |
US9836452B2 (en) * | 2014-12-30 | 2017-12-05 | Microsoft Technology Licensing, Llc | Discriminating ambiguous expressions to enhance user experience |
JP6334815B2 (ja) * | 2015-03-20 | 2018-05-30 | 株式会社東芝 | 学習装置、方法、プログラムおよび音声対話システム |
WO2016157642A1 (ja) * | 2015-03-27 | 2016-10-06 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP6604542B2 (ja) * | 2015-04-02 | 2019-11-13 | パナソニックIpマネジメント株式会社 | 対話方法、対話プログラム及び対話システム |
US10229671B2 (en) * | 2015-12-02 | 2019-03-12 | GM Global Technology Operations LLC | Prioritized content loading for vehicle automatic speech recognition systems |
KR102447513B1 (ko) * | 2016-01-22 | 2022-09-27 | 한국전자통신연구원 | 점증적 대화지식 자가학습 기반 대화장치 및 그 방법 |
US9978367B2 (en) * | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
JP6391887B2 (ja) * | 2016-04-11 | 2018-09-19 | 三菱電機株式会社 | 応答生成装置、対話制御システムおよび応答生成方法 |
US10431205B2 (en) * | 2016-04-27 | 2019-10-01 | Conduent Business Services, Llc | Dialog device with dialog support generated using a mixture of language models combined using a recurrent neural network |
JP6671020B2 (ja) * | 2016-06-23 | 2020-03-25 | パナソニックIpマネジメント株式会社 | 対話行為推定方法、対話行為推定装置及びプログラム |
WO2018000278A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种基于状态机上下文敏感多轮对话管理系统及方法 |
US10451430B2 (en) * | 2016-07-26 | 2019-10-22 | International Business Machines Corporation | Navigation alerting using conversation analysis |
CN107704482A (zh) * | 2016-08-09 | 2018-02-16 | 松下知识产权经营株式会社 | 方法、装置以及程序 |
US11183170B2 (en) * | 2016-08-17 | 2021-11-23 | Sony Corporation | Interaction control apparatus and method |
US10403273B2 (en) * | 2016-09-09 | 2019-09-03 | Oath Inc. | Method and system for facilitating a guided dialog between a user and a conversational agent |
US9947319B1 (en) * | 2016-09-27 | 2018-04-17 | Google Llc | Forming chatbot output based on user state |
US10796217B2 (en) * | 2016-11-30 | 2020-10-06 | Microsoft Technology Licensing, Llc | Systems and methods for performing automated interviews |
US10636418B2 (en) * | 2017-03-22 | 2020-04-28 | Google Llc | Proactive incorporation of unsolicited content into human-to-computer dialogs |
US10224032B2 (en) * | 2017-04-19 | 2019-03-05 | International Business Machines Corporation | Determining an impact of a proposed dialog act using model-based textual analysis |
US10360908B2 (en) * | 2017-04-19 | 2019-07-23 | International Business Machines Corporation | Recommending a dialog act using model-based textual analysis |
US10453454B2 (en) * | 2017-10-26 | 2019-10-22 | Hitachi, Ltd. | Dialog system with self-learning natural language understanding |
-
2017
- 2017-12-13 JP JP2017238764A patent/JP2019106054A/ja active Pending
-
2018
- 2018-08-31 US US16/119,674 patent/US11087753B2/en active Active
- 2018-08-31 CN CN201811008382.7A patent/CN110019746B/zh active Active
-
2021
- 2021-06-02 JP JP2021092863A patent/JP7249378B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004354787A (ja) * | 2003-05-30 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
JP2005301780A (ja) * | 2004-04-14 | 2005-10-27 | Sony Corp | 情報処理装置および情報処理方法、並びに、プログラム |
Non-Patent Citations (2)
Title |
---|
杉山 聡 外2名: "対話履歴を利用した協調的応答生成", 言語処理学会第6回年次大会発表論文集, JPN6020021666, 7 March 2000 (2000-03-07), JP, pages 227 - 230, ISSN: 0004290193 * |
福井 教順 外3名: "補助シナリオを利用したマルチモーダル対話システムの検討", 第69回(平成19年)全国大会講演論文集(2) 人工知能と認知科学, JPN6020021664, 6 March 2007 (2007-03-06), JP, pages 2 - 409, ISSN: 0004455785 * |
Also Published As
Publication number | Publication date |
---|---|
JP2021131907A (ja) | 2021-09-09 |
US11087753B2 (en) | 2021-08-10 |
CN110019746B (zh) | 2023-10-10 |
US20190180743A1 (en) | 2019-06-13 |
JP7249378B2 (ja) | 2023-03-30 |
CN110019746A (zh) | 2019-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7249378B2 (ja) | 対話装置、プログラム、及び対話方法 | |
CN110111775B (zh) | 一种流式语音识别方法、装置、设备及存储介质 | |
Shi et al. | Contextual spoken language understanding using recurrent neural networks | |
CN108062954B (zh) | 语音识别方法和装置 | |
US20120130716A1 (en) | Speech recognition method for robot | |
US20200160863A1 (en) | Electronic apparatus for processing user utterance and controlling method thereof | |
US10224030B1 (en) | Dynamic gazetteers for personalized entity recognition | |
CN111161726B (zh) | 一种智能语音交互方法、设备、介质及系统 | |
CN111445898B (zh) | 语种识别方法、装置、电子设备和存储介质 | |
CN112673421A (zh) | 训练和/或使用语言选择模型以自动确定用于口头话语的话音辨识的语言 | |
JP6927318B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6370962B1 (ja) | 生成装置、生成方法および生成プログラム | |
CN110998719A (zh) | 信息处理设备和信息处理方法 | |
EP3980991B1 (en) | System and method for recognizing user's speech | |
CN115017919B (zh) | 用于支持训练数据快速构建和流程自定义的多场景对话系统及方法 | |
CN114416989A (zh) | 一种文本分类模型优化方法和装置 | |
CN110717027B (zh) | 多轮智能问答方法、系统以及控制器和介质 | |
CN115712657A (zh) | 基于元宇宙的用户需求挖掘方法及系统 | |
CN113051384A (zh) | 基于对话的用户画像抽取方法及相关装置 | |
KR20190094087A (ko) | 머신러닝 기반의 대화형 ai 에이전트 시스템과 연관된, 사용자 맞춤형 학습 모델을 포함하는 사용자 단말 및 사용자 맞춤형 학습 모델이 기록된 컴퓨터 판독가능 기록 매체 | |
CN113327575A (zh) | 一种语音合成方法、装置、计算机设备和存储介质 | |
CN112863496B (zh) | 一种语音端点检测方法以及装置 | |
CN115017914A (zh) | 语言处理方法、装置、电子设备以及存储介质 | |
CN112037772A (zh) | 基于多模态的响应义务检测方法、系统及装置 | |
CN113555021A (zh) | 用于对IoT设备执行动作的设备、方法及计算机程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200603 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200821 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210302 |