JP2016532146A5 - - Google Patents

Download PDF

Info

Publication number
JP2016532146A5
JP2016532146A5 JP2016525380A JP2016525380A JP2016532146A5 JP 2016532146 A5 JP2016532146 A5 JP 2016532146A5 JP 2016525380 A JP2016525380 A JP 2016525380A JP 2016525380 A JP2016525380 A JP 2016525380A JP 2016532146 A5 JP2016532146 A5 JP 2016532146A5
Authority
JP
Japan
Prior art keywords
keyword
electronic device
model
input sound
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016525380A
Other languages
English (en)
Other versions
JP2016532146A (ja
JP6373985B2 (ja
Filing date
Publication date
Priority claimed from US14/101,869 external-priority patent/US9786296B2/en
Application filed filed Critical
Publication of JP2016532146A publication Critical patent/JP2016532146A/ja
Publication of JP2016532146A5 publication Critical patent/JP2016532146A5/ja
Application granted granted Critical
Publication of JP6373985B2 publication Critical patent/JP6373985B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (30)

  1. 電子デバイスにおいて、複数のターゲットキーワードからなるリストを受信することと、前記リストが通信ネットワークを介して受信される、
    前記電子デバイスにおいて、前記複数のターゲットキーワードからなる前記リストから特定のターゲットキーワードを選択するユーザ入力を受信することと、
    前記ユーザ入力に応答して、
    前記通信ネットワークを介して、前記電子デバイスにおいて、キーワードデータファイルを受信することと、前記キーワードデータファイルは、前記特定のターゲットキーワードに関するキーワードモデルを含み、互換性情報を含む
    前記互換性情報に基づいて、前記キーワードデータファイルが前記電子デバイスのキーワード検出ユニットとの互換性があるかどうかを決定することと、
    前記キーワードデータファイルが前記キーワード検出ユニットとの互換性がないという決定に基づいて前記キーワードモデルの第2のバージョンを受信することと、
    記電子デバイスにおいて受信された入力音前記特定のターゲットキーワードを含むことを、前記キーワードモデルに基づいて検出したことに応答して前記電子デバイスの機能がアクティブ化されるように、前記電子デバイスにおいて、前記機能に前記特定のターゲットキーワードを割り当てることと
    を備える方法。
  2. 前記電子デバイスにおいて、応答音データを受信すること
    前記特定のターゲットキーワードが前記入力音に含まれるかどうかを検出することと、
    記入力音に前記特定のターゲットキーワードが含まれることを検出したことに応答して、前記応答音データに基づいて、前記電子デバイスにおいて応答音を出力することと
    をさらに備える、請求項1に記載の方法。
  3. 記キーワードデータファイルが前記キーワード検出ユニットとの互換性があるという決定に応答して、前記キーワードデータファイルから前記キーワードモデルを抽出し、前記キーワードモデルを記憶するこ
    をさらに備える、請求項1に記載の方法。
  4. 記キーワードモデルの前記第2のバージョンが前記キーワード検出ユニットとの互換性があ、前記キーワードモデルの前記第2のバージョンを記憶することとをさらに備える、請求項に記載の方法。
  5. 前記キーワードデータファイルが前記キーワード検出ユニットとの互換性がないという決定に応答して
    前記通信ネットワークを介してサーバに、前記電子デバイス、前記キーワード検出ユニット、または両方を記述している情報を送ることと、ここにおいて、前記サーバが前記情報に基づいて前記キーワードモデルの前記第2のバージョンを選択し、ここにおいて、前記キーワードモデルの前記第2のバージョンが前記キーワード検出ユニットとの互換性がある、
    前記サーバから前記キーワードモデルの前記第2のバージョンを受信することと、
    前記電子デバイスにおいて、前記キーワードモデルの前記第2のバージョンを記憶することと
    をさらに備える、請求項に記載の方法。
  6. 前記キーワードデータファイルが前記キーワード検出ユニットとの互換性がないという決定に応答して、前記キーワードモデルを前記第2のバージョンに変換することと、ここにおいて、前記キーワードモデルの前記第2のバージョンが前記キーワード検出ユニットとの互換性があ、前記キーワードモデルの前記第2のバージョンを記憶することとをさらに備える、請求項に記載の方法。
  7. 前記機能に前記特定のターゲットキーワードを割り当てることは、合成キーワードモデルを形成するために、前記キーワードモデルを、前記複数のターゲットキーワードからの第2の特定のターゲットキーワードに関連する少なくとも1つの他のキーワードモデルと合成することを備え、前記第2の特定のターゲットキーワードは、前記電子デバイスの少なくとも1つの他の機能に関連付けられる、請求項1に記載の方法。
  8. 前記電子デバイスにおいて前記入力音を受信することと、
    前記合成キーワードモデルに基づいて、前記特定のターゲットキーワード、前記第2の特定のターゲットキーワード、またはこれらの組合せが前記入力音に含まれるかどうかを、前記電子デバイスにおいて検出することと、
    前記特定のターゲットキーワードが前記入力音に含まれることを検出したことに応答して、前記機能を実行することと、
    記第2の特定のターゲットキーワードが前記入力音に含まれることを検出したことに応答して、前記少なくとも1つの他の機能を実行することと
    をさらに備える、請求項7に記載の方法。
  9. 前記キーワードデータファイルはアプリケーションファイルを含み、前記方法は、前記アプリケーションファイルから前記キーワードモデルを抽出することをさらに備え、ここにおいて前記特定のターゲットキーワードが割り当てられる前記機能は、アプリケーションファイルをアクティブ化することを含む、請求項1に記載の方法。
  10. 前記特定のターゲットキーワードに関連する音声トーンモデルを受信することをさらに備え、ここにおいて前記音声トーンモデルは、前記電子デバイスによって出力された音声の音声トーンを修正するように適合される、請求項1に記載の方法。
  11. 前記音声トーンモデルは、テキストから変換された音声の前記音声トーンを修正するように適合され、前記方法は、
    前記電子デバイスにおいて前記入力音を受信することと、
    前記キーワードモデルに基づいて前記入力音において前記特定のターゲットキーワードを検出することと、
    前記入力音に前記特定のターゲットキーワードが含まれることを検出したことに応答して、前記特定のターゲットキーワードに関連する前記音声トーンモデルに基づいて、前記テキストから変換された前記音声の前記音声トーンを修正することと
    をさらに備える、請求項10に記載の方法。
  12. 前記電子デバイスにおいて前記入力音を受信することと、
    前記キーワードモデルに基づいて前記入力音において前記特定のターゲットキーワードを検出することと、
    記特定のターゲットキーワードが前記入力音に含まれることを検出したことに応答して、前記機能をアクティブ化することと、ここにおいて、前記機能をアクティブ化することは、前記電子デバイスに前記機能を実行させる命令を実行することを備える、
    をさらに備える、請求項1に記載の方法。
  13. 前記機能は、音声アシスタントをアクティブ化すること、カメラをアクティブ化すること、音楽プレーヤをアクティブ化すること、ボイスレコーダをアクティブ化すること、写真を撮ること、記電子デバイスをロック解除すること、またはこれらの組合せを備える、請求項1に記載の方法。
  14. 前記機能に前記特定のターゲットキーワードを割り当てるより前に、前記電子デバイスのユーザインターフェースを介して前記機能の選択を受信することをさらに備える、請求項1に記載の方法。
  15. 複数のターゲットキーワードからなるリストから特定のターゲットキーワードを選択する入力を受信するためのユーザインターフェースユニットと、
    前記入力に応答して、通信ネットワークを介して、キーワードデータファイルを受信するように構成されたダウンロード管理ユニットと、前記キーワードデータファイルは、前記特定のターゲットキーワードのためのキーワードモデルを含み、互換性情報を含む、
    前記互換性情報に基づいて、前記キーワードデータファイルがキーワード検出ユニットとの互換性があるかどうかを決定するように構成された確認ユニットと、ここにおいて、前記ダウンロード管理ユニットは、前記キーワードデータファイルが前記キーワード検出ユニットとの互換性がないという決定に基づいて、前記キーワードモデルの第2のバージョンを受信するように構成される、
    子デバイスにおいて受信された入力音が前記特定のターゲットキーワードを含むことを、前記キーワードモデルに基づいて検出したことに応答して前記電子デバイスの機能がアクティブ化されるように、前記入力に応答して、前記機能に前記特定のターゲットキーワードを割り当てるように構成されたキーワード設定ユニットと
    を備える電子デバイス。
  16. 前記ダウンロード管理ユニットは、応答音データを受信するようにさらに構成され、前記応答音データは、前記入力音に前記特定のターゲットキーワードが含まれるという検出を示す応答音を生成するために使用される、請求項15に記載の電子デバイス。
  17. 前記入力音を受信するように構成された音センサーと、ここにおいて、前記キーワード検出ユニットは、前記キーワードモデルに基づいて前記入力音に前記特定のターゲットキーワードが含まれるかどうかを検出するように構成され
    前記入力音に前記特定のターゲットキーワードが含まれることを検出したことに応答して、前記特定のターゲットキーワードに関連する前記応答音データに基づいて前記応答音を生成するように構成された機能管理ユニットと
    をさらに備える、請求項16に記載の電子デバイス。
  18. 前記ダウンロード管理ユニットは、テキストから変換された音声の音声トーンを修正するように適合された音声トーンモデルを受信するようにさらに構成される、請求項15に記載の電子デバイス。
  19. 前記入力音を受信するように構成された音センサーと、
    前記キーワードモデルに基づいて前記入力音に前記特定のターゲットキーワードが含まれることを検出するように構成されたキーワード検出ユニットと、
    前記入力音における前記特定のターゲットキーワード出に応答して、前記音声トーンモデルに基づいて、前記テキストから変換された前記音声の前記音声トーンを修正するように構成されたテキスト音声(TTS変換ユニットと
    をさらに備える、請求項18に記載の電子デバイス。
  20. 前記キーワード設定ユニットは、合成キーワードモデルを形成するために、前記キーワードモデルを、第2の特定のターゲットキーワードに関連する少なくとも1つの他のキーワードモデルと合成するようにさらに構成され、ここにおいて前記第2の特定のターゲットキーワードは、前記電子デバイスの少なくとも1つの他の機能に関連付けられる、請求項15に記載の電子デバイス。
  21. 前記入力音を受信するように構成された音センサーと、
    前記合成キーワードモデルに基づいて前記入力音にキーワードが含まれるかどうかを検出するように構成されたキーワード検出ユニットと、
    前記合成キーワードモデルに基づいて前記入力音における前記特定のターゲットキーワード検出に応答して、前記機能をアクティブ化することと
    前記合成キーワードモデルに基づいて前記入力音における前記第2の特定のターゲットキーワード検出に応答して、前記少なくとも1つの他の機能をアクティブ化することと
    を行うように構成された機能管理ユニットと
    をさらに備える、請求項20に記載の電子デバイス。
  22. 前記ダウンロード管理ユニットは、前記通信ネットワークを介して、アプリケーションファイルを受信するように構成され、ここにおいて前記アプリケーションファイルは、前記キーワードデータファイルを含み、前記電子デバイスは、前記アプリケーションファイルから前記キーワードデータファイルを抽出するように構成された抽出ユニットをさらに備え、ここにおいて前記キーワード設定ユニットは、前記アプリケーションファイルに、前記キーワードモデルに基づいて前記入力音において前記特定のターゲットキーワードを検出したことに応答して前記アプリケーションをアクティブ化するために前記特定のターゲットキーワードを割り当てるように構成される、請求項15に記載の電子デバイス。
  23. 前記入力音を受信するように構成された音センサーと、
    前記キーワードモデルに基づいて前記入力音に前記特定のターゲットキーワードが含まれるかどうかを検出するように構成されたキーワード検出ユニットと、
    前記入力音に前記特定のターゲットキーワードが含まれることを検出したことに応答して、前記アプリケーションをアクティブ化するように構成された機能管理ユニットと
    をさらに備える、請求項22に記載の電子デバイス。
  24. 前記入力音を受信するように構成された音センサーと、
    前記キーワードモデルに基づいて前記入力音に前記特定のターゲットキーワードが含まれるかどうかを検出するように構成されたキーワード検出ユニットと、
    前記入力音に前記特定のターゲットキーワードが含まれることを検出したことに応答して前記機能を実行するように構成された機能管理ユニットと
    をさらに備える、請求項15に記載の電子デバイス。
  25. 複数のターゲットキーワードからなるリストから特定のターゲットキーワードを選択する入力を受信するための手段と、
    前記特定のターゲットキーワードに応答して、通信ネットワークを介して、キーワードデータファイルを受信するための手段と、前記キーワードデータファイルは、前記特定のターゲットキーワードに関するキーワードモデルを含み、互換性情報を含む
    前記互換性情報に基づいて、前記キーワードデータファイルが入力音においてキーワードを検出するための手段との互換性があるかどうかを決定するための手段と、ここにおいて、前記キーワードデータファイルを受信するための前記手段は、前記キーワードデータファイルが前記入力音においてキーワードを検出するための前記手段との互換性がないという決定に基づいて、前記キーワードモデルの第2のバージョンを受信するように構成される、
    子デバイスにおいて受信された前記入力音が前記特定のターゲットキーワードを含むことを、前記キーワードモデルに基づいて検出したことに応答して機能がアクティブ化されるように、前記入力に応答して前記機能に前記特定のターゲットキーワードを割り当てるための手段と
    を備える電子デバイス。
  26. 前記キーワードモデルを受信するための前記手段は、応答音データを受信するように構成され、キーワードを検出するための前記手段は、前記入力音に前記特定のターゲットキーワードが含まれるかどうかを決定するように構成され、前記電子デバイスは、
    前記入力音を受信するための手段と
    前記入力音に前記特定のターゲットキーワードが含まれることを検出したことに応答して、前記特定のターゲットキーワードに関連する前記応答音データに基づいて応答音を生成するための手段と
    をさらに備える、請求項25に記載の電子デバイス。
  27. 記キーワードデータファイルが、前記入力音においてキーワードを検出するための前記手段との互換性があるという決定に応答して、前記キーワードデータファイルから前記キーワードモデルを抽出するための手
    をさらに備える、請求項25に記載の電子デバイス。
  28. 前記キーワードモデルの前記第2のバージョン、キーワードを検出するための前記手段との互換性があり、前記キーワードモデルの前記第2のバージョンを記憶することをさらに備える、請求項27に記載の電子デバイス。
  29. 令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令が、
    電子デバイスにおいて、複数のターゲットキーワードからなるリストを受信することと、前記リストが通信ネットワークを介して受信される、
    前記複数のターゲットキーワードからなる前記リストから特定のターゲットキーワードを選択するユーザ入力を受信することと、
    前記ユーザ入力に応答して、
    前記通信ネットワークを介して、キーワードデータファイルを受信することと、前記キーワードデータファイルは、前記特定のターゲットキーワードに関するキーワードモデルを含み、互換性情報を含む、
    前記互換性情報に基づいて、前記キーワードデータファイルが前記電子デバイスとの互換性があるかどうかを決定することと、
    前記キーワードデータファイルがキーワード検出ユニットとの互換性がないという決定に基づいて前記キーワードモデルの第2のバージョンを受信することと、
    記電子デバイスにおいて受信された入力音が前記特定のターゲットキーワードを含むことを、前記キーワードモデルに基づいて検出したことに応答して前記電子デバイスの機能がアクティブ化されるように、前記電子デバイスにおいて、前記機能に前記特定のターゲットキーワードを割り当てることと
    をプロセッサに行わせる、非一時的コンピュータ可読記憶媒体。
  30. 前記キーワードモデルは、ユーザ固有ではなく、前記特定のターゲットキーワードの言語の音素のサブセットをモデル化するための情報を含む、請求項29に記載の非一時的コンピュータ可読記憶媒体。
JP2016525380A 2013-07-08 2014-07-02 音声動作式機能にキーワードモデルを割り当てるための方法および装置 Active JP6373985B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361843650P 2013-07-08 2013-07-08
US61/843,650 2013-07-08
US14/101,869 2013-12-10
US14/101,869 US9786296B2 (en) 2013-07-08 2013-12-10 Method and apparatus for assigning keyword model to voice operated function
PCT/US2014/045193 WO2015006116A1 (en) 2013-07-08 2014-07-02 Method and apparatus for assigning keyword model to voice operated function

Publications (3)

Publication Number Publication Date
JP2016532146A JP2016532146A (ja) 2016-10-13
JP2016532146A5 true JP2016532146A5 (ja) 2017-12-21
JP6373985B2 JP6373985B2 (ja) 2018-08-15

Family

ID=52133403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016525380A Active JP6373985B2 (ja) 2013-07-08 2014-07-02 音声動作式機能にキーワードモデルを割り当てるための方法および装置

Country Status (6)

Country Link
US (1) US9786296B2 (ja)
EP (1) EP3020040B1 (ja)
JP (1) JP6373985B2 (ja)
KR (1) KR101922782B1 (ja)
CN (1) CN105340006B (ja)
WO (1) WO2015006116A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10770075B2 (en) * 2014-04-21 2020-09-08 Qualcomm Incorporated Method and apparatus for activating application by speech input
CN105404625A (zh) * 2014-09-03 2016-03-16 富泰华工业(深圳)有限公司 应用程序的查找方法与系统
US9805714B2 (en) * 2016-03-22 2017-10-31 Asustek Computer Inc. Directional keyword verification method applicable to electronic device and electronic device using the same
CN105845125B (zh) * 2016-05-18 2019-05-03 百度在线网络技术(北京)有限公司 语音合成方法和语音合成装置
US10276161B2 (en) * 2016-12-27 2019-04-30 Google Llc Contextual hotwords
CN106898352B (zh) * 2017-02-27 2020-09-25 联想(北京)有限公司 语音控制方法及电子设备
CN110444199B (zh) * 2017-05-27 2022-01-07 腾讯科技(深圳)有限公司 一种语音关键词识别方法、装置、终端及服务器
CN109151155B (zh) * 2017-06-27 2021-03-23 北京搜狗科技发展有限公司 一种通信处理方法、装置及机器可读介质
CN107221332A (zh) * 2017-06-28 2017-09-29 上海与德通讯技术有限公司 机器人的交互方法及系统
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
JP6752870B2 (ja) * 2017-12-18 2020-09-09 ネイバー コーポレーションNAVER Corporation 複数のウェイクワードを利用して人工知能機器を制御する方法およびシステム
KR102079979B1 (ko) * 2017-12-28 2020-02-21 네이버 주식회사 인공지능 기기에서의 복수의 호출 용어를 이용한 서비스 제공 방법 및 그 시스템
KR102361458B1 (ko) * 2018-01-25 2022-02-10 삼성전자주식회사 사용자 발화 응답 방법 및 이를 지원하는 전자 장치
KR20190114321A (ko) 2018-03-29 2019-10-10 삼성전자주식회사 전자 장치 및 그 제어 방법
CN108665900B (zh) 2018-04-23 2020-03-03 百度在线网络技术(北京)有限公司 云端唤醒方法及系统、终端以及计算机可读存储介质
US11714955B2 (en) 2018-08-22 2023-08-01 Microstrategy Incorporated Dynamic document annotations
US11815936B2 (en) 2018-08-22 2023-11-14 Microstrategy Incorporated Providing contextually-relevant database content based on calendar data
US11682390B2 (en) * 2019-02-06 2023-06-20 Microstrategy Incorporated Interactive interface for analytics
KR20200099380A (ko) * 2019-02-14 2020-08-24 삼성전자주식회사 음성 인식 서비스를 제공하는 방법 및 그 전자 장치
CN112534771B (zh) * 2019-07-17 2024-04-19 谷歌有限责任公司 在基于声学的数字助理应用中验证触发关键字的系统和方法
KR102433964B1 (ko) * 2019-09-30 2022-08-22 주식회사 오투오 관계 설정을 이용한 실감형 인공지능기반 음성 비서시스템
KR20210044606A (ko) 2019-10-15 2021-04-23 삼성전자주식회사 웨이크업 모델 생성 방법 및 이를 위한 전자 장치
KR20210045241A (ko) 2019-10-16 2021-04-26 삼성전자주식회사 전자 장치 및 전자 장치의 음성 명령어 공유 방법
KR20210094251A (ko) * 2020-01-21 2021-07-29 삼성전자주식회사 디스플레이 장치 및 그 제어방법
CN115334030B (zh) * 2022-08-08 2023-09-19 阿里健康科技(中国)有限公司 语音消息显示方法及装置
WO2024072036A1 (ko) * 2022-09-30 2024-04-04 삼성전자 주식회사 음성인식 장치 및 음성인식 장치의 동작방법
US11790107B1 (en) 2022-11-03 2023-10-17 Vignet Incorporated Data sharing platform for researchers conducting clinical trials

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054082A (en) 1988-06-30 1991-10-01 Motorola, Inc. Method and apparatus for programming devices to recognize voice commands
JPH1078952A (ja) 1996-07-29 1998-03-24 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置
US6092192A (en) * 1998-01-16 2000-07-18 International Business Machines Corporation Apparatus and methods for providing repetitive enrollment in a plurality of biometric recognition systems based on an initial enrollment
US6128482A (en) * 1998-12-22 2000-10-03 General Motors Corporation Providing mobile application services with download of speaker independent voice model
US6442519B1 (en) 1999-11-10 2002-08-27 International Business Machines Corp. Speaker model adaptation via network of similar users
US7219058B1 (en) * 2000-10-13 2007-05-15 At&T Corp. System and method for processing speech recognition results
US6885735B2 (en) * 2001-03-29 2005-04-26 Intellisist, Llc System and method for transmitting voice input from a remote location over a wireless data channel
US20030005412A1 (en) * 2001-04-06 2003-01-02 Eanes James Thomas System for ontology-based creation of software agents from reusable components
US20030007609A1 (en) * 2001-07-03 2003-01-09 Yuen Michael S. Method and apparatus for development, deployment, and maintenance of a voice software application for distribution to one or more consumers
US6810378B2 (en) 2001-08-22 2004-10-26 Lucent Technologies Inc. Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech
US7054817B2 (en) * 2002-01-25 2006-05-30 Canon Europa N.V. User interface for speech model generation and testing
CN100339885C (zh) 2002-02-26 2007-09-26 Sap股份公司 智能个人助理
US7099825B1 (en) 2002-03-15 2006-08-29 Sprint Communications Company L.P. User mobility in a voice recognition environment
JP2004164466A (ja) * 2002-11-15 2004-06-10 Sony Corp 情報更新システム、情報処理装置および情報更新方法
US7603276B2 (en) 2002-11-21 2009-10-13 Panasonic Corporation Standard-model generation for speech recognition using a reference model
US7437294B1 (en) * 2003-11-21 2008-10-14 Sprint Spectrum L.P. Methods for selecting acoustic model for use in a voice command platform
CN101164102B (zh) 2005-02-03 2012-06-20 语音信号科技公司 自动扩展移动通信设备的话音词汇的方法和装置
US7706510B2 (en) 2005-03-16 2010-04-27 Research In Motion System and method for personalized text-to-voice synthesis
JP4843987B2 (ja) * 2005-04-05 2011-12-21 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US7949529B2 (en) * 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US7941316B2 (en) * 2005-10-28 2011-05-10 Microsoft Corporation Combined speech and alternate input modality to a mobile device
JP5208104B2 (ja) * 2006-05-12 2013-06-12 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えるための方法
US8234120B2 (en) * 2006-07-26 2012-07-31 Nuance Communications, Inc. Performing a safety analysis for user-defined voice commands to ensure that the voice commands do not cause speech recognition ambiguities
US7689417B2 (en) * 2006-09-04 2010-03-30 Fortemedia, Inc. Method, system and apparatus for improved voice recognition
US7831431B2 (en) * 2006-10-31 2010-11-09 Honda Motor Co., Ltd. Voice recognition updates via remote broadcast signal
US8886537B2 (en) 2007-03-20 2014-11-11 Nuance Communications, Inc. Method and system for text-to-speech synthesis with personalized voice
US20090132920A1 (en) * 2007-11-20 2009-05-21 Microsoft Corporation Community-based software application help system
JP5266761B2 (ja) * 2008-01-10 2013-08-21 日産自動車株式会社 情報案内システムおよびその認識辞書データベース更新方法
US8255224B2 (en) * 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US8626511B2 (en) * 2010-01-22 2014-01-07 Google Inc. Multi-dimensional disambiguation of voice commands
US8468012B2 (en) * 2010-05-26 2013-06-18 Google Inc. Acoustic model adaptation using geographic information
US9484018B2 (en) * 2010-11-23 2016-11-01 At&T Intellectual Property I, L.P. System and method for building and evaluating automatic speech recognition via an application programmer interface
JP5494468B2 (ja) * 2010-12-27 2014-05-14 富士通株式会社 状態検出装置、状態検出方法および状態検出のためのプログラム
US20140100847A1 (en) * 2011-07-05 2014-04-10 Mitsubishi Electric Corporation Voice recognition device and navigation device
US20130085753A1 (en) * 2011-09-30 2013-04-04 Google Inc. Hybrid Client/Server Speech Recognition In A Mobile Device
US9329751B2 (en) * 2011-10-07 2016-05-03 Predictive Analystics Solutions Pvt. Ltd. Method and a system to generate a user interface for analytical models
JP2013254483A (ja) * 2012-05-11 2013-12-19 Ricoh Co Ltd 情報処理装置、情報処理装置の制御プログラム、画像形成装置
US20150088523A1 (en) * 2012-09-10 2015-03-26 Google Inc. Systems and Methods for Designing Voice Applications
US8935167B2 (en) * 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
US8719229B1 (en) * 2012-10-12 2014-05-06 Autodesk, Inc. Cloud platform for managing design data
US10135968B2 (en) * 2013-04-15 2018-11-20 Nuance Communications, Inc. System and method for acoustic echo cancellation
WO2014188512A1 (ja) * 2013-05-21 2014-11-27 三菱電機株式会社 音声認識装置、認識結果表示装置および表示方法

Similar Documents

Publication Publication Date Title
JP2016532146A5 (ja)
KR102100389B1 (ko) 개인화된 엔티티 발음 학습
US9721563B2 (en) Name recognition system
JP6505117B2 (ja) 模写によるデジタル携帯情報端末の対話、および応答時のリッチなマルチメディア
US9542956B1 (en) Systems and methods for responding to human spoken audio
JP6236805B2 (ja) 発話コマンド認識システム
JP2018036868A (ja) 会議支援システム、会議支援装置、及び会議支援方法
WO2021083071A1 (zh) 语音转换、文件生成、播音、语音处理方法、设备及介质
JP2015528969A5 (ja)
RU2017121803A (ru) Масштабирование агентов цифровых персональных помощников по устройствам
CN103165131A (zh) 语音处理系统及语音处理方法
JP6655081B2 (ja) 電子デバイス、情報要求を増補する方法、および情報要求を増補するためのコンピュータ・プログラム製品
TW201239652A (en) Location-based conversational understanding
US9565301B2 (en) Apparatus and method for providing call log
JP2018054790A (ja) 音声対話システムおよび音声対話方法
KR102399420B1 (ko) 텍스트 독립 화자 인식
WO2019076120A1 (zh) 一种图像处理的方法、装置、存储介质及电子装置
US20140100852A1 (en) Dynamic speech augmentation of mobile applications
JP2015041081A5 (ja)
US9336763B1 (en) Computing device and method for processing music
KR101571746B1 (ko) 유사도판별장치 및 그 동작 방법
CN113515594A (zh) 意图识别方法、意图识别模型训练方法、装置及设备
Song et al. Speak: A toolkit using amazon mechanical turk to collect and validate speech audio recordings
TW201530535A (zh) 語音處理系統及語音處理方法
CN114822492B (zh) 语音合成方法及装置、电子设备、计算机可读存储介质