JP2018151631A - ドメイン曖昧性除去を含む音声対応システム - Google Patents
ドメイン曖昧性除去を含む音声対応システム Download PDFInfo
- Publication number
- JP2018151631A JP2018151631A JP2018043052A JP2018043052A JP2018151631A JP 2018151631 A JP2018151631 A JP 2018151631A JP 2018043052 A JP2018043052 A JP 2018043052A JP 2018043052 A JP2018043052 A JP 2018043052A JP 2018151631 A JP2018151631 A JP 2018151631A
- Authority
- JP
- Japan
- Prior art keywords
- domain
- user
- domains
- utterance
- interpretation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000014509 gene expression Effects 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 7
- 230000007613 environmental effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 230000009471 action Effects 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 12
- 238000005352 clarification Methods 0.000 description 10
- 230000000007 visual effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000004807 localization Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010411 cooking Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001486234 Sciota Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 210000002837 heart atrium Anatomy 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】システムは、ユーザから音声で発せられた発話を解釈し、要求された情報の提供または要求された動作の実行によって発話に応答する方法を実行する。発話は複数のドメインの文脈で解釈される。解釈が話し手の意図を正確に表わす度合いに基づき、各解釈に関連性スコアが割当てられる。関連性スコアが対応ドメインの閾値を下回る解釈は除外される。残りの解釈は、発話に最も関連するドメインの選択に基づいて選択される。ユーザは、最適なドメイン選択のために用いられ得る曖昧性除去情報を提供するように促され得る。発話表現とドメイン選択との過去の関連を記憶することにより、発話語句と関連ドメインとの間の相関の強さの測定が可能になる。この相関の強さの情報により、システムはユーザ入力を要求することなく、他の解釈を自動的に除外することができる。
【選択図】図1A
Description
本発明は、自然言語発話を処理する音声対応システムの分野の発明である。具体的には、本開示は、音声で発せられた質問の曖昧さを除去するように音声対話を取扱う。
人間によってなされた自然言語発話をコンピュータ処理システムが処理することがますます一般的になっている。例えば、ウェブ検索エンジンは自然言語テキスト入力を受付けて処理し、視覚的結果を提供する。このようなシステムは、一般的に、1つのブラウザウインドウで同時に多数の結果(例えば10個)を提供する。結果は画像およびテキストを含み得る。また、このようなシステムは、いくつかの広告を表示することもある。視覚的ヒューマンマシンインターフェースは、ユーザが比較的素早く消費可能な多くの情報を含む、豊富かつ多様な結果を提供することができる。
本発明のさまざまな実施形態は、より自然な会話型のユーザインターフェースを提供するシステムおよび方法である。それらは、可能性のある複数の主題分野(会話のドメイン)に関連して発話を解釈する。発話が複数のドメインで理にかなっている場合、システムは、ドメインのリスト、またはドメインを表わす単語を用いてユーザに応答し、次いで、どのドメインを意図したかを示すようにユーザに促す。例えば、「ポール・シモンはどこで生まれましたか?」という発話に応答して、いくつかの実施形態は、「音楽家のポール・シモンか政治家のポール・シモンのどちらですか?」と応答し得る。次の発話が音楽家(すなわち、音楽ドメイン)または政治家(すなわち、政治ドメイン)への関心を示す場合、システムはそれに従って結果を生成する。
用語および導入
発話は、音声で発せられた自然言語表現であり、テキストによる自然言語表現と対比される。
さまざまな実施形態は、コンピュータ読取可能媒体に記憶されたソフトウェアを実行するコンピュータを用いる。いくつかの実施形態は、単一のデバイスを含む。いくつかの実施形態は、ユーザに直接音声インターフェースを提供するクライアントにネットワークを介して結合されたサーバを含む。このような実施形態は、クライアントから発話を受信する。
データを収集し、ユーザが行なったドメイン選択に関する統計を計算することが有用な場合がある。いくつかの実施形態は、ある単語が発話中に存在するときにユーザが頻繁に選択するドメインを優先して、ドメインの関連性スコアを調整する。例えば「トヨタ・タコマ」という発話の曖昧さを除去するためのドメインのリストが提示されたときに、ユーザが自動車販売店または製造業者のウェブサイトよりも消費者レビューを選択する傾向にある場合、当該システムは、「トヨタ・タコマ」という用語が発話内に存在するときに、消費者レビューに関する文法ルールのスコアを高くする。結果として、当該システムは、ある発話とドメインとの間の強い相関関係を認定する。その強さが非常に大きい場合、当該システムは、ユーザに曖昧さの除去を要求する必要がない。なぜなら、ユーザの意図が明確であるからである。
いくつかの実施形態は、曖昧な発話の種類によって異なる方法で応答する。図4は、本発明の実施形態に係る、さまざまな応答を提供する方法を示す。
「ブライアン・ウィルソンは、2006にどこでプレイしましたか?」(これは、「ビーチ・ボーイズのブライアン・ウィルソンか、ジャイアンツおよびドジャーズのピッチャーのブライアン・ウィルソンのどちらですか?」という曖昧性除去の要求を受けるであろう。)
「トウガラシをどのくらいホット(hot)にしますか?」(「温度的な熱さか、ピリ辛さのどちらですか?」という曖昧性除去の要求を受けるであろう。)
候補ドメインの数が、ユーザが提示されたドメインのうちの1つを選択可能なようにユーザに対して適度に提示され得る数を超える場合、システムはステップ48に進む。例えば、システムは、「トヨタ・タコマ」のような発話を受信した後に、「より具体的にお願いします。」のように全般的な明確化を要求することによって、ユーザに応答し得る。いくつかのシステムは、例えば「『トヨタ・タコマ』に関して何を知りたいですか?」のような発話からの情報を利用する。他の例としては、「Turkey」という発話への応答があるだろう。「Turkey」という発話は、動物、レシピ、地理、歴史、ニュース、天気、およびスポーツのドメインのうちのすべてにおいて意味を持つため、これらのドメインで高スコアが割当てられ得る。
図5は、クライアント−サーバインターフェースを用いる実施形態を示す。ユーザ51はクライアント52に対して発話し、クライアント52はマイクロホンで発話を受信する。また、ユーザは、クライアントから音声で発せられた応答をスピーカを通して聞く。クライアント52は、インターネットなどのネットワーク53を介してサーバ54に情報伝達する。サーバは、さまざまなドメインの文法ルールに従って発話を処理する。
自動車におけるヒューマンマシンインターフェースの必要条件は、素人によって動作される場合であっても、機械のシステムが安全に動作する必要があるため、特に要求が厳しい。また、自動車は特に困難な環境も生じさせる。なぜなら自動車は、窓を開けた状態で反響するトンネルを通って他の騒々しい車両の近くを走行することもあるからである。しかしながら、他のいくつかの音声対応システムは如何なる方向からの音声も受信しなければならない1つのマイクロホンまたは密集した複数のマイクロホンを備える小型デバイスであるのに対して、自動車は発話を行なう人々を取囲んでいる。したがって、自動車は発話を受信するための取囲みマイクロホンを有しており、それらは離間距離によって騒音を打消し、複数の人々のうちのだれが話しているかを検出する。携帯電話は個人用であるため、多くの話し手のうちの1人を特定することは、困難ではあるが通常は問題にならない。
いくつかの実施形態では、ネットワークを介して接続されたクライアントおよびサーバが用いられ、ユーザはクライアントと対話するが、サーバが発話を処理してそれらの意味を解釈する。いくつかのサーバは、データセンタにおけるプロセッサのラックであり、多数のクライアントおよび多数のユーザからの発話を同時に処理可能である。いくつかの実施形態は、ユーザから直接発話を取込む同一のデバイス上で、すべての処理を局所的に行なう。
Claims (14)
- 音声対応システムのユーザに結果を提供する方法であって、
少なくとも1つのコンピュータを用いて、
複数のドメインに従って自然言語発話を解釈し、ドメイン毎に解釈および関連性スコアを作成するステップと、
各関連性スコアをそのドメインの閾値と比較し、閾値を上回る関連性スコアを有する候補ドメインのリストを決定するステップと、
前記候補ドメインのリストを前記ユーザに提示するステップと、
前記リストからドメインを選択するように前記ユーザに要求するステップと、
前記ユーザからのドメインの選択を受付けるステップと、
前記選択されたドメインでの前記発話の前記解釈に従って結果を作成するステップと、
前記結果を提供するステップとを含む、方法。 - 前記少なくとも1つのコンピュータを用いて、前記選択されたドメインを表わすカウンタの値をインクリメントするステップをさらに含む、請求項1に記載の方法。
- 前記候補ドメインは、前記カウンタの値に基づく順序で前記ユーザに提示される、請求項2に記載の方法。
- 前記少なくとも1つのコンピュータを用いて、最も最近選択された前記ドメインの指標を記憶するステップをさらに含む、請求項1から3のいずれか1項に記載の方法。
- 前記候補ドメインは、前記最も最近選択されたドメインの前記指標に基づく順序で前記ユーザに提示される、請求項4に記載の方法。
- 前記少なくとも1つのコンピュータを用いてレコードをデータベース内に記憶するステップをさらに含み、
前記レコードは、
前記自然言語発話の表現と、
前記発話についての前記ドメインの選択とを含む、請求項1から5のいずれか1項に記載の方法。 - 前記少なくとも1つのコンピュータを用いてレコードをデータベース内に記憶するステップをさらに含み、
前記レコードは、
前記選択されたドメインに従った前記発話の前記解釈と、
前記ドメインの選択とを含む、請求項1から6のいずれか1項に記載の方法。 - 音声対応システムのユーザに結果を提供する方法であって、
少なくとも1つのコンピュータを用いて、
複数のドメインに従って自然言語発話を解釈し、ドメイン毎に解釈および関連性スコアを作成するステップと、
各関連性スコアをそのドメインの閾値と比較し、閾値を上回る関連性スコアを有する候補ドメインの数を決定するステップと、
曖昧性除去のために前記ユーザに提示するのに適度なドメインの最大数よりも前記候補ドメインの数が大きいことに応答して、前記ユーザに明確化するように要求するステップとを含む、方法。 - 前記ユーザに提示するのに適度なドメインの最大数は、環境情報に基づくものである、請求項8に記載の方法。
- 音声対応システムのユーザに結果を提供する方法であって、
少なくとも1つのコンピュータを用いて、
複数のドメインに従って自然言語発話を解釈し、ドメイン毎に解釈および関連性スコアを作成するステップと、
各関連性スコアをそのドメインの閾値と比較し、閾値を上回る関連性スコアを有する候補ドメインのリストを決定するステップと、
前記リスト上のドメイン毎に、前記ドメインの前記解釈に従った結果を作成するステップと、
各結果を提供するステップとを含む、方法。 - 少なくとも1つのコンピュータに、請求項1から10のいずれか1項に記載の方法を実行させるコンピュータプログラム。
- 音声対応システムであって、
複数のドメインに従って自然言語発話を解釈すること、
前記自然言語発話が複数のドメインで理にかなっていると判定すること、
ユーザに曖昧性除去を要求すること、
前記ユーザからのドメインの選択を受付けること、および
前記発話を処理して所望の結果を提供することによって曖昧性除去を行なうための手段を備える、音声対応システム。 - 自動車プラットフォームであって、
ユーザから音声で発せられた発話を取込むことが可能な音声キャプチャモジュールと、
複数のドメインに従って前記発話を解釈し、ドメイン毎に関連性スコアを生成する音声認識モジュールと、
音声を生成可能な音声生成モジュールとを備え、
複数の関連性スコアの各々が対応の閾値を上回ったことに応答して、
前記音声生成モジュールは、
ドメインのリストを含む音声を生成し、
1つを選択することを前記ユーザに要求する、自動車プラットフォーム。 - 請求項11に係るプログラムを記憶するメモリと、
前記メモリに記憶された前記プログラムを実行するための少なくとも1つのプロセッサとを含む、コンピュータ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/456,354 | 2017-03-10 | ||
US15/456,354 US10229683B2 (en) | 2017-03-10 | 2017-03-10 | Speech-enabled system with domain disambiguation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018151631A true JP2018151631A (ja) | 2018-09-27 |
JP6852006B2 JP6852006B2 (ja) | 2021-03-31 |
Family
ID=63445567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018043052A Active JP6852006B2 (ja) | 2017-03-10 | 2018-03-09 | ドメイン曖昧性除去を含む音声対応システム |
Country Status (4)
Country | Link |
---|---|
US (2) | US10229683B2 (ja) |
JP (1) | JP6852006B2 (ja) |
CN (1) | CN108573702B (ja) |
HK (1) | HK1258311A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020138662A1 (ko) * | 2018-12-28 | 2020-07-02 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
JP2021022928A (ja) * | 2019-07-24 | 2021-02-18 | ネイバー コーポレーションNAVER Corporation | 人工知能基盤の自動応答方法およびシステム |
JP2021096293A (ja) * | 2019-12-13 | 2021-06-24 | Necプラットフォームズ株式会社 | 案内システム、案内システムの制御方法、およびプログラム |
JP2021140134A (ja) * | 2020-03-04 | 2021-09-16 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 音声を認識するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム |
JP2022538861A (ja) * | 2019-07-02 | 2022-09-06 | サービスナウ, インコーポレイテッド | 自然言語理解(nlu)フレームワークにおける探索鍵および探索空間の拡大のためのアーティファクトのピニング |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2994908T3 (da) * | 2013-05-07 | 2019-09-23 | Veveo Inc | Grænseflade til inkrementel taleinput med realtidsfeedback |
WO2015065380A1 (en) * | 2013-10-30 | 2015-05-07 | Hewlett-Packard Development Company, L.P. | Domain name and internet protocol address approved and disapproved membership inference |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
US10600406B1 (en) * | 2017-03-20 | 2020-03-24 | Amazon Technologies, Inc. | Intent re-ranker |
CN107193973B (zh) * | 2017-05-25 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 语义解析信息的领域识别方法及装置、设备及可读介质 |
US11043205B1 (en) * | 2017-06-27 | 2021-06-22 | Amazon Technologies, Inc. | Scoring of natural language processing hypotheses |
US10861455B2 (en) * | 2017-07-13 | 2020-12-08 | Microsoft Technology Licensing, Llc | Inference on date time constraint expressions |
WO2019027914A1 (en) * | 2017-07-31 | 2019-02-07 | Bose Corporation | CONVERSATIONAL AUDIO ASSISTANT |
CN109859749A (zh) * | 2017-11-30 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 一种语音信号识别方法和装置 |
US10741179B2 (en) * | 2018-03-06 | 2020-08-11 | Language Line Services, Inc. | Quality control configuration for machine interpretation sessions |
WO2019173045A1 (en) * | 2018-03-08 | 2019-09-12 | Frontive, Inc. | Methods and systems for speech signal processing |
CN110858481B (zh) * | 2018-08-07 | 2024-04-30 | 三星电子株式会社 | 用于处理用户语音话语的系统和用于操作该系统的方法 |
CN113168829A (zh) * | 2018-12-03 | 2021-07-23 | 谷歌有限责任公司 | 语音输入处理 |
JP7091295B2 (ja) * | 2019-09-06 | 2022-06-27 | 株式会社東芝 | 解析装置、解析方法及びプログラム |
KR20210033167A (ko) * | 2019-09-18 | 2021-03-26 | 삼성전자주식회사 | 전자장치 및 그 음성인식 제어방법 |
US12020696B2 (en) | 2019-10-21 | 2024-06-25 | Soundhound Ai Ip, Llc | Automatic synchronization for an offline virtual assistant |
JP7029434B2 (ja) * | 2019-10-23 | 2022-03-03 | サウンドハウンド,インコーポレイテッド | コンピュータによって実行される方法、サーバ装置、情報処理システム、プログラム、およびクライアント端末 |
RU2757264C2 (ru) | 2019-12-24 | 2021-10-12 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для обработки пользовательского разговорного речевого фрагмента |
CN111160002B (zh) * | 2019-12-27 | 2022-03-01 | 北京百度网讯科技有限公司 | 用于输出口语理解中解析异常信息的方法和装置 |
WO2021167654A1 (en) * | 2020-02-17 | 2021-08-26 | Cerence Operating Company | Coordinating electronic personal assistants |
US11568862B2 (en) * | 2020-09-29 | 2023-01-31 | Cisco Technology, Inc. | Natural language understanding model with context resolver |
US11587567B2 (en) * | 2021-03-21 | 2023-02-21 | International Business Machines Corporation | User utterance generation for counterfactual analysis and improved conversation flow |
WO2024039191A1 (ko) * | 2022-08-19 | 2024-02-22 | 삼성전자주식회사 | 전자 장치 및 사용자 발화 처리 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007088877A1 (ja) * | 2006-01-31 | 2007-08-09 | Honda Motor Co., Ltd. | 会話システムおよび会話ソフトウェア |
JP2009009170A (ja) * | 2005-10-24 | 2009-01-15 | Advanced Media Inc | 情報検索システム及びサーバ装置 |
JP2010078934A (ja) * | 2008-09-26 | 2010-04-08 | Brother Ind Ltd | 音声認識装置、音声認識方法、及び音声認識プログラム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6891932B2 (en) * | 2001-12-11 | 2005-05-10 | Cisco Technology, Inc. | System and methodology for voice activated access to multiple data sources and voice repositories in a single session |
US20060074836A1 (en) * | 2004-09-03 | 2006-04-06 | Biowisdom Limited | System and method for graphically displaying ontology data |
US20060074832A1 (en) * | 2004-09-03 | 2006-04-06 | Biowisdom Limited | System and method for utilizing an upper ontology in the creation of one or more multi-relational ontologies |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US8112257B2 (en) * | 2007-07-31 | 2012-02-07 | Sap Ag | Semantic extensions of business process modeling tools |
CN101398831B (zh) * | 2007-09-27 | 2013-08-21 | 日电(中国)有限公司 | 本体数据导入/导出方法及装置 |
US20100106552A1 (en) * | 2008-10-27 | 2010-04-29 | International Business Machines Corporation | On-demand access to technical skills |
WO2010107315A1 (en) * | 2009-03-19 | 2010-09-23 | Rijksuniversiteit Groningen | Texture based signal analysis and recognition |
US8478779B2 (en) | 2009-05-19 | 2013-07-02 | Microsoft Corporation | Disambiguating a search query based on a difference between composite domain-confidence factors |
US8214344B2 (en) * | 2010-03-16 | 2012-07-03 | Empire Technology Development Llc | Search engine inference based virtual assistance |
WO2012044892A2 (en) * | 2010-09-30 | 2012-04-05 | Verisign, Inc. | Domain name tokenization and alternative domain name generation |
US9953039B2 (en) * | 2011-07-19 | 2018-04-24 | Disney Enterprises, Inc. | Method and system for providing a compact graphical user interface for flexible filtering of data |
US9588580B2 (en) * | 2011-09-30 | 2017-03-07 | Dejoto Technologies Llc | System and method for single domain and multi-domain decision aid for product on the web |
US10176167B2 (en) * | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US9293141B2 (en) * | 2014-03-27 | 2016-03-22 | Storz Endoskop Produktions Gmbh | Multi-user voice control system for medical devices |
US10726831B2 (en) | 2014-05-20 | 2020-07-28 | Amazon Technologies, Inc. | Context interpretation in natural language processing using previous dialog acts |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10817672B2 (en) * | 2014-10-01 | 2020-10-27 | Nuance Communications, Inc. | Natural language understanding (NLU) processing based on user-specified interests |
US9508339B2 (en) * | 2015-01-30 | 2016-11-29 | Microsoft Technology Licensing, Llc | Updating language understanding classifier models for a digital personal assistant based on crowd-sourcing |
US10178107B2 (en) * | 2016-04-06 | 2019-01-08 | Cisco Technology, Inc. | Detection of malicious domains using recurring patterns in domain names |
CN106328147B (zh) * | 2016-08-31 | 2022-02-01 | 中国科学技术大学 | 语音识别方法和装置 |
-
2017
- 2017-03-10 US US15/456,354 patent/US10229683B2/en active Active
- 2017-12-18 CN CN201711362415.3A patent/CN108573702B/zh active Active
-
2018
- 2018-03-09 JP JP2018043052A patent/JP6852006B2/ja active Active
-
2019
- 2019-01-10 US US16/245,153 patent/US20190164553A1/en not_active Abandoned
- 2019-01-15 HK HK19100678.8A patent/HK1258311A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009009170A (ja) * | 2005-10-24 | 2009-01-15 | Advanced Media Inc | 情報検索システム及びサーバ装置 |
WO2007088877A1 (ja) * | 2006-01-31 | 2007-08-09 | Honda Motor Co., Ltd. | 会話システムおよび会話ソフトウェア |
JP2010078934A (ja) * | 2008-09-26 | 2010-04-08 | Brother Ind Ltd | 音声認識装置、音声認識方法、及び音声認識プログラム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020138662A1 (ko) * | 2018-12-28 | 2020-07-02 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US11948567B2 (en) | 2018-12-28 | 2024-04-02 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
JP2022538861A (ja) * | 2019-07-02 | 2022-09-06 | サービスナウ, インコーポレイテッド | 自然言語理解(nlu)フレームワークにおける探索鍵および探索空間の拡大のためのアーティファクトのピニング |
JP7383737B2 (ja) | 2019-07-02 | 2023-11-20 | サービスナウ, インコーポレイテッド | 自然言語理解(nlu)フレームワークにおける探索鍵および探索空間の拡大のためのアーティファクトのピニング |
JP2021022928A (ja) * | 2019-07-24 | 2021-02-18 | ネイバー コーポレーションNAVER Corporation | 人工知能基盤の自動応答方法およびシステム |
JP7113047B2 (ja) | 2019-07-24 | 2022-08-04 | ネイバー コーポレーション | 人工知能基盤の自動応答方法およびシステム |
JP2021096293A (ja) * | 2019-12-13 | 2021-06-24 | Necプラットフォームズ株式会社 | 案内システム、案内システムの制御方法、およびプログラム |
JP7132206B2 (ja) | 2019-12-13 | 2022-09-06 | Necプラットフォームズ株式会社 | 案内システム、案内システムの制御方法、およびプログラム |
JP2021140134A (ja) * | 2020-03-04 | 2021-09-16 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 音声を認識するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム |
JP7365985B2 (ja) | 2020-03-04 | 2023-10-20 | 阿波▲羅▼智▲聯▼(北京)科技有限公司 | 音声を認識するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN108573702A (zh) | 2018-09-25 |
US20180261216A1 (en) | 2018-09-13 |
HK1258311A1 (zh) | 2019-11-08 |
CN108573702B (zh) | 2023-05-26 |
US20190164553A1 (en) | 2019-05-30 |
US10229683B2 (en) | 2019-03-12 |
JP6852006B2 (ja) | 2021-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6852006B2 (ja) | ドメイン曖昧性除去を含む音声対応システム | |
CN109791767B (zh) | 用于语音识别的系统和方法 | |
US9558745B2 (en) | Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same | |
US11574637B1 (en) | Spoken language understanding models | |
US20220335953A1 (en) | Voice shortcut detection with speaker verification | |
CN113674742B (zh) | 人机交互方法、装置、设备以及存储介质 | |
US11776563B2 (en) | Textual echo cancellation | |
JP2024508033A (ja) | 対話中のテキスト-音声の瞬時学習 | |
US20220375469A1 (en) | Intelligent voice recognition method and apparatus | |
Loh et al. | Speech recognition interactive system for vehicle | |
CA2839285A1 (en) | Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same | |
US12033641B2 (en) | Voice shortcut detection with speaker verification | |
US11756533B2 (en) | Hot-word free pre-emption of automated assistant response presentation | |
US20240013782A1 (en) | History-Based ASR Mistake Corrections | |
US20190156834A1 (en) | Vehicle virtual assistance systems for taking notes during calls | |
CN116564297A (zh) | 语音控制的方法、装置、计算机设备以及存储介质 | |
JP2021018293A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190322 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200407 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200707 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6852006 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |