JP2023515254A - ヒューマンマシン対話のための音声機能ジャンプ方法、電子機器及び記憶媒体 - Google Patents
ヒューマンマシン対話のための音声機能ジャンプ方法、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP2023515254A JP2023515254A JP2022562335A JP2022562335A JP2023515254A JP 2023515254 A JP2023515254 A JP 2023515254A JP 2022562335 A JP2022562335 A JP 2022562335A JP 2022562335 A JP2022562335 A JP 2022562335A JP 2023515254 A JP2023515254 A JP 2023515254A
- Authority
- JP
- Japan
- Prior art keywords
- field
- dialogue
- human
- electronic device
- transition diagram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000010586 diagram Methods 0.000 claims abstract description 67
- 230000007704 transition Effects 0.000 claims abstract description 63
- 230000009191 jumping Effects 0.000 claims abstract description 26
- 230000006870 function Effects 0.000 claims description 61
- 238000004590 computer program Methods 0.000 claims description 9
- 230000007613 environmental effect Effects 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0638—Interactive procedures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
Description
電子機器に用いられるヒューマンマシン対話のための音声機能ジャンプ方法であって、
ユーザのヒューマンマシン対話の履歴データに基づいて予め分野遷移図を構築するステップと、
外部音声を受信するステップと、
外部音声がヒットする対話分野を確定するステップと、
ヒットする対話分野が分野遷移図における複数の対話分野の一つに属するか否かを判断し、属さない場合には外部音声を無視し、属する場合にはヒットした対話分野に対応する音声機能にジャンプするステップと、
を含み、
前記分野遷移図は、複数の対話分野を含む有向グラフである、
ことを特徴とするヒューマンマシン対話のための音声機能ジャンプ方法を提供する。
S10、電子機器は、ユーザのヒューマンマシン対話の履歴データに基づいて予め分野遷移図を構築し、分野遷移図は、複数の対話分野を含む有向グラフである。分野遷移図は、現在の分野状態に基づいて、次の分野を予測し、予測分野の信頼度を出力するために用いられる。
S20、電子機器は、外部音声を受信する。例示的に、電子機器は、マイクロフォンを介してユーザ音声を収集する。
S30、電子機器は、外部音声がヒットする対話分野を確定する。
S40、電子機器は、ヒットする対話分野が分野遷移図における複数の対話分野の一つに属するか否かを判断し、属さない場合には外部音声を無視し、属する場合にはヒットする対話分野に対応する音声機能にジャンプする。
ユーザ:会社までナビゲーションしてください。
機器:2つのルートが見つかりました。距離が最も近いルートと使用時間が最も少ないルートのうち、どちらをお選びになりますか。
ユーザ:使用時間が最も少ないルートです。
機器:ナビゲーションを開始します。
ユーザ:歌を聞きたいです。
機器:歌を再生します。
ユーザ:曲を変えてください。
ユーザ:明日の蘇州の天気はどうですか。
機器:明日、蘇州は晴れです......。
ユーザ:終了してください。
ユーザAは毎朝8時に自宅から会社まで車で移動し、車に乗り込んだ後に車載装置を起動させる。
ユーザA:会社までナビゲーションしてください。
機器:2つのルートが見つかりました。距離が最も近いルートと使用時間が最も少ないルートのうち、どちらをお選びになりますか。
この時、車上の放送音声は「周杰倫の歌」と識別される。
機器:周杰倫の歌を再生します。
上述の例のように、周囲の無関係な音(周杰倫の歌)が機器によって識別され、ユーザAの複数ラウンドの対話が中断され、このような状況は望ましくない。分野遷移図により、ユーザが毎日8時頃にナビゲーション機能を使用し、ナビゲーションの複数ラウンドのインタラクション中に他の対話分野に遷移しないことが発見されている。他の分野のセマンティックが出現する(且つ信頼度が高くない)と、その入力は誤操作と見なされ、システムによってシールドされるため、ノイズによる誤入力が減少する。
電子機器が現在環境情報を取得するステップと、
電子機器が現在環境情報に基づいてマッチングするサブ分野遷移図を確定するステップと、
をさらに含み、
電子機器は、前記ヒットする対話分野が前記分野遷移図における複数の対話分野の一つに属するか否かを判断する場合、ヒットする対話分野が、マッチングするサブ分野遷移図における複数の対話分野の1つに属するかどうかを判断する。
S201、電子機器は、外部音声を受信する前にサービスを提供する現在対話分野を確定し、現在対話分野は分野遷移図に属する。
S202、電子機器は、現在対話分野で完了した対話ラウンド数を確定する。
S203、完了した対話ラウンド数が、現在対話分野に配置された対話ラウンド数より少ない場合、電子機器は外部音声を無視する。
電子機器は、ヒットする対話分野に基づいて、対応するセマンティック情報信頼度を確定し、
セマンティック情報の信頼度が第一の設定閾値よりも大きい場合、ヒットする対話分野に対応する音声機能にジャンプする。
複数のセマンティック情報信頼値における複数の値が第二の設定閾値より大きく、且つ第一の設定閾値以下である場合、電子機器は分野遷移図のコンテキスト状態に基づいて次の分野状態を予測し、
複数の値に対応する複数の対話分野の中に、次の分野状態に対応する対話分野が存在する場合、次の分野状態に対応するセマンティック機能にジャンプし、
存在しない場合、複数の値のうちの最大値に対応する対話分野のセマンティック機能にジャンプする。
複数のセマンティック情報信頼値における最大値が第二の設定閾値以下である場合、電子機器は、外部音声の対話コンテキストに基づいて現在の対話シーンが高頻度インタラクションシーンであるか否かを確定する。対話コンテキストは、現在進行中の対話分野であってもよく、起動開始から現在分野への分野状態遷移パスである。高頻度インタラクションシーンである場合、電子機器は、高頻度インタラクションシーンに対応する分野遷移図に基づいて、外部音声に対応する音声機能をマッチングする。
ユーザ音声及びユーザ環境情報を取得するためのクライアント1と、
サービスリソースをディスパッチするためのアクセスサービスユニット2と、
オーディオを識別してnbest識別結果を得るための識別サービスユニット3と、
nbest識別結果に対して自然言語処理を行ってnbestセマンティック分野を得るためのNLPサービスユニット4と、
ユーザ環境情報、対話コンテキスト情報及びnbestセマンティック分野に基づいてヒット機能を確定するためのユーザ画像サービスユニット5と、
ヒットする機能にサービスして、ユーザの入力した音声に対応する最終対話結果を返すための対話サービスユニット6と、
が含まれる。
まず、ユーザが入力した音声を識別サービス(同時に環境情報を携帯してアクセスサービスにアップロードする)に送信し、識別サービスはnbest識別結果を返信する。
nbest識別結果はセマンティックサービスから別々に要求され、それに対してセマンティック解析を行い、セマンティック情報の信頼度に応じてそれぞれ処理を行う。
ユーザ環境情報、対話コンテキスト情報及び現在nbestセマンティック分野を携帯して、ユーザ画像サービスを要求する。
ユーザ画像サービスは分野遷移図状態に基づいて、ユーザ環境情報と合わせてヒットするセマンティック分野を計算する。
nbestセマンティック結果の信頼度において、threshold1より大きい信頼度があるか否かを判断する。例えば、threshold1の値の範囲が[0.9、1]であり、本実施例ではthreshold1の値は0.9である。
threshold1より大きい信頼度がある場合、信頼度が最も高いセマンティック分野をヒットする分野として選択し、当該セマンティック情報が正確であるとして、対話サービスを直接要求して応答を返す。
nbestセマンティック結果の信頼度がthreshold1より小さく、threshold2より大きく、且つnbestセマンティック結果が複数の分野であり、曖昧性の問題が存在する場合、分野遷移図のコンテキスト状態に基づいて、次の分野状態を予測する。nbest中のセマンティック分野にマッチングすれば当該分野を選択し、対話サービスを要求する。nbestにマッチングするセマンティックサービスがない場合、nbestセマンティック信頼度優先度に従ってセマンティック分野を選択する。例示的に、threshold2の値の範囲は[0.6、0.9]であり、本発明の実施例におけるthreshold2の値は0.7である。
nbestセマンティック結果の信頼度がthreshold2より小さい場合、当該インタラクションの対話コンテキストを発見し、分野遷移図の高頻度インタラクションパスをマッチングする。分野遷移図の予測結果がユーザ入力のセマンティック結果とマッチングしない場合、当該入力を破棄し、そうでなければ当該セマンティックの対話応答を返す。今回のインタラクション対話コンテキストが高頻度インタラクションパスではない場合、規則方法に従って、nbestセマンティック信頼度の優先度順にセマンティック分野を選択する。
Claims (9)
- 電子機器に用いられるヒューマンマシン対話のための音声機能ジャンプ方法であって、
前記電子機器がユーザのヒューマンマシン対話の履歴データに基づいて予め分野遷移図を構築するステップと、
前記電子機器が外部音声を受信するステップと、
前記電子機器が前記外部音声によってヒットする対話分野を確定するステップと、
前記電子機器が前記ヒットする対話分野が前記分野遷移図における複数の対話分野の一つに属するか否かを判断し、属さない場合には前記外部音声を無視し、属する場合には前記ヒットする対話分野に対応する音声機能にジャンプするステップと、
を含み、
前記分野遷移図は、複数の対話分野を含む有向グラフである、
ことを特徴とするヒューマンマシン対話のための音声機能ジャンプ方法。 - 前記分野遷移図における複数の対話分野のそれぞれには、対話ラウンド数が配置されており、
前記電子機器が、前記外部音声を受信する前にサービスを提供する現在対話分野を確定するステップと、
前記電子機器が前記現在対話分野で完了した対話ラウンド数を確定するステップと、
前記完了した対話ラウンド数が、前記現在対話分野に配置された対話ラウンド数より少ない場合、前記外部音声を無視するステップと、
を含み、
前記現在対話分野は前記分野遷移図に属する、
ことを特徴とする請求項1に記載のヒューマンマシン対話のための音声機能ジャンプ方法。 - 前記ヒットする対話分野が前記分野遷移図における複数の対話分野の一つに属するか否かを判断する前に、さらに、
前記電子機器が前記ヒットする対話分野に基づいて、対応するセマンティック情報信頼度を確定するステップと、
前記セマンティック情報信頼度が第一の設定閾値よりも大きい場合、前記ヒットする対話分野に対応する音声機能にジャンプするステップと、
を含むことを特徴とする請求項1に記載のヒューマンマシン対話のための音声機能ジャンプ方法。 - 前記ヒットする対話分野には複数の対話分野が含まれ、対応する前記セマンティック情報信頼度には複数のセマンティック情報信頼値が含まれており、
前記複数のセマンティック情報信頼値における複数の値が第二の設定閾値より大きく、且つ第一の設定閾値以下である場合、前記電子機器は前記分野遷移図のコンテキスト状態に基づいて次の分野状態を予測するステップと、
前記複数の値に対応する複数の対話分野の中に、前記次の分野状態に対応する対話分野が存在する場合、前記次の分野状態に対応するセマンティック機能にジャンプするステップと、
存在しない場合、前記複数の値のうちの最大値に対応する対話分野のセマンティック機能にジャンプするステップと、
を含むことを特徴とする請求項3に記載のヒューマンマシン対話のための音声機能ジャンプ方法。 - 前記複数のセマンティック情報信頼値における最大値が第二の設定閾値以下である場合、前記電子機器は、前記外部音声の対話コンテキストに基づいて現在の対話シーンが高頻度インタラクションシーンであるか否かを確定するステップと、
高頻度インタラクションシーンである場合、前記電子機器は、前記高頻度インタラクションシーンに対応する分野遷移図に基づいて、前記外部音声に対応する音声機能をマッチングするステップと、
をさらに含むことを特徴とする請求項4に記載のヒューマンマシン対話のための音声機能ジャンプ方法。 - 前記分野遷移図には複数のサブ分野遷移図が含まれており、前記複数のサブ分野遷移図は複数の異なる環境情報に対応し、
前記電子機器が現在環境情報を取得するステップと、
前記電子機器が前記現在環境情報に基づいてマッチングするサブ分野遷移図を確定するステップと、
をさらに含み、
前記電子機器は、前記ヒットする対話分野が前記分野遷移図における複数の対話分野の一つに属するか否かを判断する場合、前記ヒットする対話分野が、前記マッチングするサブ分野遷移図における複数の対話分野の1つに属するかどうかを判断する、
ことを特徴とする請求項1に記載のヒューマンマシン対話のための音声機能ジャンプ方法。 - 前記環境情報には、現在時間、現在位置、現在シーン及び現在天気のうちの少なくとも一つが含まれる、
ことを特徴とする請求項6に記載のヒューマンマシン対話のための音声機能ジャンプ方法。 - 少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含む電子機器であって、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、
請求項1~7のいずれか1項に記載のヒューマンマシン対話のための音声機能ジャンプ方法のステップが実行できるように、前記少なくとも1つのプロセッサによって前記命令を実行させることを特徴とする電子機器。 - コンピュータプログラムが記憶されている記憶媒体であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項1~7のいずれか1項に記載のヒューマンマシン対話のための音声機能ジャンプ方法のステップが実現できる、ことを特徴とする記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010296180.8A CN111506292B (zh) | 2020-04-15 | 2020-04-15 | 用于人机对话的语音技能跳转方法、电子设备及存储介质 |
CN202010296180.8 | 2020-04-15 | ||
PCT/CN2020/122477 WO2021208392A1 (zh) | 2020-04-15 | 2020-10-21 | 用于人机对话的语音技能跳转方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023515254A true JP2023515254A (ja) | 2023-04-12 |
JP7342286B2 JP7342286B2 (ja) | 2023-09-11 |
Family
ID=71872735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022562335A Active JP7342286B2 (ja) | 2020-04-15 | 2020-10-21 | ヒューマンマシン対話のための音声機能ジャンプ方法、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230352012A1 (ja) |
EP (1) | EP4137931A4 (ja) |
JP (1) | JP7342286B2 (ja) |
CN (1) | CN111506292B (ja) |
WO (1) | WO2021208392A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111506292B (zh) * | 2020-04-15 | 2021-06-15 | 思必驰科技股份有限公司 | 用于人机对话的语音技能跳转方法、电子设备及存储介质 |
CN111949178B (zh) * | 2020-08-13 | 2022-02-22 | 百度在线网络技术(北京)有限公司 | 技能切换方法、装置、设备以及存储介质 |
CN112069830B (zh) * | 2020-08-13 | 2024-05-28 | 腾讯科技(深圳)有限公司 | 一种智能会话方法及装置 |
CN112463939B (zh) * | 2020-11-12 | 2024-05-24 | 深圳市欢太科技有限公司 | 人机对话方法、系统、服务设备及计算机存储介质 |
CN114203178B (zh) * | 2021-12-10 | 2022-09-20 | 镁佳(北京)科技有限公司 | 一种智能语音系统拒识方法、装置及计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079397A (ja) * | 2005-09-16 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、対話プログラムおよび記録媒体 |
JP2018081444A (ja) * | 2016-11-15 | 2018-05-24 | ソフトバンク株式会社 | ユーザーサポートシステム、ユーザーサポートプログラム及びユーザーサポート方法 |
WO2019235190A1 (ja) * | 2018-06-06 | 2019-12-12 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び対話システム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9645703B2 (en) * | 2014-05-14 | 2017-05-09 | International Business Machines Corporation | Detection of communication topic change |
CN105845137B (zh) * | 2016-03-18 | 2019-08-23 | 中国科学院声学研究所 | 一种语音对话管理系统 |
CN106663129A (zh) * | 2016-06-29 | 2017-05-10 | 深圳狗尾草智能科技有限公司 | 一种基于状态机上下文敏感多轮对话管理系统及方法 |
US10268680B2 (en) * | 2016-12-30 | 2019-04-23 | Google Llc | Context-aware human-to-computer dialog |
US11004444B2 (en) * | 2017-09-08 | 2021-05-11 | Amazon Technologies, Inc. | Systems and methods for enhancing user experience by communicating transient errors |
CN107861951A (zh) * | 2017-11-17 | 2018-03-30 | 康成投资(中国)有限公司 | 智能客服中的会话主题识别方法 |
CN109086329B (zh) * | 2018-06-29 | 2021-01-05 | 出门问问信息科技有限公司 | 基于话题关键词引导的进行多轮对话方法及装置 |
CN109710129A (zh) * | 2018-12-20 | 2019-05-03 | 斑马网络技术有限公司 | 语音技能命令引导方法、装置、存储介质及电子设备 |
CN109815319A (zh) * | 2018-12-24 | 2019-05-28 | 联想(北京)有限公司 | 信息处理方法及信息处理装置 |
CN110223692B (zh) * | 2019-06-12 | 2021-08-13 | 思必驰科技股份有限公司 | 用于语音对话平台跨技能的多轮对话方法及系统 |
CN110570853A (zh) * | 2019-08-12 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 基于语音数据的意图识别方法和装置 |
CN110473537B (zh) * | 2019-08-22 | 2022-04-26 | 百度在线网络技术(北京)有限公司 | 语音技能的控制方法、装置、设备及存储介质 |
CN110674338B (zh) * | 2019-09-27 | 2022-11-01 | 百度在线网络技术(北京)有限公司 | 语音技能推荐方法、装置、设备及存储介质 |
CN111506292B (zh) * | 2020-04-15 | 2021-06-15 | 思必驰科技股份有限公司 | 用于人机对话的语音技能跳转方法、电子设备及存储介质 |
-
2020
- 2020-04-15 CN CN202010296180.8A patent/CN111506292B/zh active Active
- 2020-10-21 EP EP20931185.1A patent/EP4137931A4/en active Pending
- 2020-10-21 JP JP2022562335A patent/JP7342286B2/ja active Active
- 2020-10-21 WO PCT/CN2020/122477 patent/WO2021208392A1/zh unknown
- 2020-10-21 US US17/918,673 patent/US20230352012A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079397A (ja) * | 2005-09-16 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、対話プログラムおよび記録媒体 |
JP2018081444A (ja) * | 2016-11-15 | 2018-05-24 | ソフトバンク株式会社 | ユーザーサポートシステム、ユーザーサポートプログラム及びユーザーサポート方法 |
WO2019235190A1 (ja) * | 2018-06-06 | 2019-12-12 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び対話システム |
Also Published As
Publication number | Publication date |
---|---|
WO2021208392A1 (zh) | 2021-10-21 |
EP4137931A1 (en) | 2023-02-22 |
CN111506292A (zh) | 2020-08-07 |
CN111506292B (zh) | 2021-06-15 |
EP4137931A4 (en) | 2023-10-04 |
US20230352012A1 (en) | 2023-11-02 |
JP7342286B2 (ja) | 2023-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7342286B2 (ja) | ヒューマンマシン対話のための音声機能ジャンプ方法、電子機器及び記憶媒体 | |
CN108984157B (zh) | 用于语音对话平台的技能配置和调用方法及系统 | |
CN111049996B (zh) | 多场景语音识别方法及装置、和应用其的智能客服系统 | |
US9424611B2 (en) | User interface for managing questions and answers across multiple social media data sources | |
JP2021519472A (ja) | 対話システム間の知識共有方法、対話方法、知識共有装置、対話装置、電子機器及び記憶媒体 | |
CN110889039B (zh) | 一种在阅读应用中进行书籍推送的方法与设备 | |
JP7481475B2 (ja) | 対話テキストの機能領域確定方法及び装置 | |
CN110708588B (zh) | 弹幕显示方法、装置、终端及存储介质 | |
US9703841B1 (en) | Context-based notifications in multi-application based systems | |
JP2023506341A (ja) | 音声コマンド推奨を提供するためのシステムおよび方法 | |
JP6850321B2 (ja) | 情報を生成するための方法と装置 | |
JP6990728B2 (ja) | 音声スキルの起動方法、装置、デバイスおよび記憶媒体 | |
JP2023509868A (ja) | 能動的に対話の開始を提起するためのサーバ側処理方法及びサーバ、並びに能動的に対話の開始が提起できる音声インタラクションシステム | |
CN111063353B (zh) | 允许自定义语音交互内容的客户端处理方法及用户终端 | |
JP7436077B2 (ja) | スキルの音声ウェイクアップ方法および装置 | |
CN104572953A (zh) | 一种基于搜索结果页面触发音乐播放的方法及装置 | |
CN112182281B (zh) | 一种音频推荐方法、装置及存储介质 | |
CN111179973B (zh) | 语音合成质量评价方法及系统 | |
CN111949178B (zh) | 技能切换方法、装置、设备以及存储介质 | |
CN112786031B (zh) | 人机对话方法及系统 | |
CN108874975A (zh) | 搜索内容推荐方法、装置、终端设备及存储介质 | |
CN111339770B (zh) | 用于输出信息的方法和装置 | |
CN111356006B (zh) | 视频播放方法、装置、服务器及存储介质 | |
KR20220137733A (ko) | 비디오 그룹 패키지 개선을 위한 사용자 인터페이스 | |
CN113676761A (zh) | 一种多媒体资源播放方法、装置及主控设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230220 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230830 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7342286 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |