JP2021144250A5 - - Google Patents

Download PDF

Info

Publication number
JP2021144250A5
JP2021144250A5 JP2021103081A JP2021103081A JP2021144250A5 JP 2021144250 A5 JP2021144250 A5 JP 2021144250A5 JP 2021103081 A JP2021103081 A JP 2021103081A JP 2021103081 A JP2021103081 A JP 2021103081A JP 2021144250 A5 JP2021144250 A5 JP 2021144250A5
Authority
JP
Japan
Prior art keywords
time
user
determining
utterance
noise level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021103081A
Other languages
English (en)
Other versions
JP7159400B2 (ja
JP2021144250A (ja
Filing date
Publication date
Priority claimed from JP2019564454A external-priority patent/JP7119008B2/ja
Application filed filed Critical
Priority to JP2021103081A priority Critical patent/JP7159400B2/ja
Publication of JP2021144250A publication Critical patent/JP2021144250A/ja
Publication of JP2021144250A5 publication Critical patent/JP2021144250A5/ja
Application granted granted Critical
Publication of JP7159400B2 publication Critical patent/JP7159400B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (9)

  1. ユーザが発話を用いて入力を訂正することを意図したという明示的指示が前記発話の中にない場合、前記発話に基づいて、前記入力を訂正する方法であって、前記入力は、自動発話認識を使用して生成され、前記方法は、
    ユーザ入力デバイスを介して、第1の発話を受信することと、
    制御回路および自動発話認識を使用して、前記第1の発話に基づいて第1の入力を決定することと、
    データベースから、前記第1の入力に基づく検索結果を読み出すことと、
    前記制御回路を使用して、前記検索結果を表示のために生成することと、
    前記制御回路を使用して、前記検索結果が表示のために生成された第1の時間を決定することと、
    前記ユーザ入力デバイスを介して、前記第1の発話を受信することに続いて、第2の発話を受信することと、
    前記制御回路および自動発話認識を使用して、前記第2の発話に基づいて第2の入力を決定することと、
    前記制御回路を使用して、前記第2の発話が受信された第2の時間を決定することと、
    前記制御回路を使用して、前記第2の時間と前記第1の時間との間の時間差を計算することと、
    前記制御回路を使用して、前記第2の時間と前記第1の時間との間の前記時間差が閾値時間未満であるか否かを決定することと、
    前記制御回路を使用して、前記検索結果に関連付けられた入力が前記第1の時間と前記第2の時間との間に前記ユーザ入力デバイスを介して受信されなかったことを決定することと、
    前記時間差が前記閾値時間未満であることを決定すること、かつ、前記検索結果に関連付けられた入力が前記第1の時間と前記第2の時間との間に前記ユーザ入力デバイスを介して受信されなかったことを決定することに応答して、前記制御回路を使用して、前記第1の入力の一部を前記第2の入力の一部に置換することによって、前記第1の入力に基づいて訂正された入力を生成することと
    を含む、方法。
  2. 前記検索結果に関連付けられた入力が前記第1の時間と前記第2の時間との間に前記ユーザ入力デバイスを介して受信されなかったことを決定することは、前記検索結果をスクロールすること、前記検索結果の説明を読むこと、前記検索結果を開くこと、または、前記検索結果を再生することを行うための入力が前記第1の時間と前記第2の時間との間に前記ユーザ入力デバイスを介して受信されなかったことを決定することを含む、請求項1に記載の方法。
  3. 前記方法は、前記ユーザ入力デバイスを介して、前記第1の時間と前記第2の時間との間にユーザの顔の画像を捕捉することをさらに含み、
    前記訂正された入力を生成することは、前記制御回路を使用して、前記画像内の前記ユーザの顔が不満な感情に関連付けられていることを決定することにさらに基づく、請求項1に記載の方法。
  4. 前記方法は、
    前記ユーザ入力デバイスを介して、前記第1の発話が受信されている間にユーザの顔の第1の画像を捕捉することと、
    前記制御回路を使用して、前記第1の画像内の前記ユーザの顔の第1の相対サイズを決定することと、
    前記ユーザ入力デバイスを介して、前記第2の発話が受信されている間に前記ユーザの顔の第2の画像を捕捉することと、
    前記制御回路を使用して、前記第2の画像内の前記ユーザの顔の第2の相対サイズを決定することと、
    前記制御回路を使用して、前記ユーザの顔の前記第1の相対サイズと前記ユーザの顔の前記第2の相対サイズとの間の相対サイズ差と閾値相対サイズとを比較することと、
    前記ユーザの顔の前記第1の相対サイズと前記ユーザの顔の前記第2の相対サイズとの間の前記相対サイズ差と前記閾値相対サイズとを比較することに基づいて、前記制御回路を使用して、前記相対サイズ差が前記閾値相対サイズよりも大きいことを決定することと
    をさらに含み、
    前記訂正された入力を生成することは、前記制御回路を使用して、前記相対サイズ差が前記閾値相対サイズよりも大きいことを決定することにさらに基づく、請求項1に記載の方法。
  5. 前記方法は、
    前記制御回路を使用して、前記第2の時間と前記第1の時間との間の前記時間差ともう1つの閾値時間とを比較することと、
    前記第2の時間と前記第1の時間との間の前記時間差と前記もう1つの閾値時間とを比較することに基づいて、前記制御回路を使用して、前記第2の時間と前記第1の時間との間の前記時間差が前記もう1つの閾値時間よりも大きいことを決定することと
    をさらに含み、
    前記訂正された入力を生成することは、前記制御回路を使用して、前記第2の時間と前記第1の時間との間の前記時間差が前記もう1つの閾値時間よりも大きいことを決定することにさらに基づく、請求項1に記載の方法。
  6. 前記方法は、ユーザに関連付けられた複数の入力間の平均時間に基づいて、前記閾値時間を調節することをさらに含む、請求項1に記載の方法。
  7. 前記方法は、
    前記ユーザ入力デバイスを介して、基準環境雑音レベルを測定することと、
    前記ユーザ入力デバイスを介して、前記第1の発話が受信されている間の環境雑音レベルを測定することと、
    前記制御回路を使用して、前記第1の発話が受信されている間の前記環境雑音レベルと前記基準環境雑音レベルとの間の環境雑音レベル差と閾値環境雑音レベルとを比較することと、
    前記第1の発話が受信されている間の前記環境雑音レベルと前記基準環境雑音レベルとの間の前記環境雑音レベル差と前記閾値環境雑音レベルとを比較することに基づいて、前記制御回路を使用して、前記環境雑音レベル差が前記閾値環境雑音レベルよりも大きいことを決定することと
    をさらに含み、
    前記訂正された入力を生成することは、前記制御回路を使用して、前記環境雑音レベル差が前記閾値環境雑音レベルよりも大きいことを決定することにさらに基づく、請求項1に記載の方法。
  8. 前記第2の発話が受信された前記第2の時間を決定することは、前記ユーザ入力デバイスを介して、前記第1の時間に続く最も早い発音が受信された時間を測定することを含む、請求項1に記載の方法。
  9. 前記検索結果が表示のために生成された前記第1の時間を決定することは、前記制御回路を使用して、前記第1の時間に続いて、表示画面のピクセルに伝送される信号が最初に変化した時間を検出することを含む、請求項1に記載の方法。
JP2021103081A 2017-05-24 2021-06-22 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム Active JP7159400B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021103081A JP7159400B2 (ja) 2017-05-24 2021-06-22 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019564454A JP7119008B2 (ja) 2017-05-24 2017-05-24 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム
PCT/US2017/034229 WO2018217194A1 (en) 2017-05-24 2017-05-24 Methods and systems for correcting, based on speech, input generated using automatic speech recognition
JP2021103081A JP7159400B2 (ja) 2017-05-24 2021-06-22 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019564454A Division JP7119008B2 (ja) 2017-05-24 2017-05-24 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム

Publications (3)

Publication Number Publication Date
JP2021144250A JP2021144250A (ja) 2021-09-24
JP2021144250A5 true JP2021144250A5 (ja) 2022-08-23
JP7159400B2 JP7159400B2 (ja) 2022-10-24

Family

ID=59055274

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019564454A Active JP7119008B2 (ja) 2017-05-24 2017-05-24 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム
JP2021103081A Active JP7159400B2 (ja) 2017-05-24 2021-06-22 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2019564454A Active JP7119008B2 (ja) 2017-05-24 2017-05-24 自動発話認識を使用して生成された入力を発話に基づいて訂正する方法およびシステム

Country Status (7)

Country Link
US (2) US11521608B2 (ja)
EP (1) EP3631794A1 (ja)
JP (2) JP7119008B2 (ja)
KR (2) KR102428911B1 (ja)
CN (1) CN110663079A (ja)
CA (1) CA3002383A1 (ja)
WO (1) WO2018217194A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7131077B2 (ja) * 2018-05-24 2022-09-06 カシオ計算機株式会社 会話装置、ロボット、会話装置制御方法及びプログラム
US10831442B2 (en) * 2018-10-19 2020-11-10 International Business Machines Corporation Digital assistant user interface amalgamation
JP7411422B2 (ja) * 2019-03-27 2024-01-11 パナソニックホールディングス株式会社 音声入力方法、プログラム及び音声入力装置
US11277692B2 (en) 2019-03-27 2022-03-15 Panasonic Corporation Speech input method, recording medium, and speech input device
EP3790000A1 (en) * 2019-09-05 2021-03-10 SoundHound, Inc. System and method for detection and correction of a speech query
US11263198B2 (en) 2019-09-05 2022-03-01 Soundhound, Inc. System and method for detection and correction of a query
JP7363307B2 (ja) * 2019-09-30 2023-10-18 日本電気株式会社 音声チャットボットにおける認識結果の自動学習装置及び方法、並びにコンピュータプログラム及び記録媒体
US11721322B2 (en) * 2020-02-28 2023-08-08 Rovi Guides, Inc. Automated word correction in speech recognition systems
CN111326140B (zh) * 2020-03-12 2023-05-30 科大讯飞股份有限公司 语音识别结果判别方法、纠正方法、装置、设备及存储介质
US20220139373A1 (en) * 2020-07-08 2022-05-05 Google Llc Identification and utilization of misrecognitions in automatic speech recognition
KR102458830B1 (ko) * 2020-11-16 2022-10-26 주식회사 솔트룩스 사용자 중심의 음성 대화 시스템
US20220300560A1 (en) * 2021-03-18 2022-09-22 Amazon Technologies, Inc. Voice search refinement resolution
US11854544B1 (en) 2021-06-11 2023-12-26 Amazon Technologies, Inc. Entity resolution of product search filters
CN115841814A (zh) * 2021-09-18 2023-03-24 华为技术有限公司 语音交互方法及电子设备
US11657803B1 (en) * 2022-11-02 2023-05-23 Actionpower Corp. Method for speech recognition by using feedback information
CN115798465B (zh) * 2023-02-07 2023-04-07 天创光电工程有限公司 一种语音输入方法、系统及可读存储介质

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6239794B1 (en) 1994-08-31 2001-05-29 E Guide, Inc. Method and system for simultaneously displaying a television program and information about the program
US6564378B1 (en) 1997-12-08 2003-05-13 United Video Properties, Inc. Program guide system with browsing display
CN1867068A (zh) 1998-07-14 2006-11-22 联合视频制品公司 交互式电视节目导视系统及其方法
CA2730344C (en) 1998-07-17 2014-10-21 United Video Properties, Inc. Interactive television program guide system having multiple devices within a household
AR020608A1 (es) 1998-07-17 2002-05-22 United Video Properties Inc Un metodo y una disposicion para suministrar a un usuario acceso remoto a una guia de programacion interactiva por un enlace de acceso remoto
US7165098B1 (en) 1998-11-10 2007-01-16 United Video Properties, Inc. On-line schedule system with personalization features
EP1193686B1 (en) 2000-09-29 2003-05-21 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Method and device for analyzing a spoken sequence of numbers
KR101035073B1 (ko) 2001-02-21 2011-05-19 유나이티드 비디오 프로퍼티즈, 인크. 개인용 비디오 녹화 특징을 갖는 대화식 프로그램 가이드를위한 시스템 및 방법
JP3762327B2 (ja) * 2002-04-24 2006-04-05 株式会社東芝 音声認識方法および音声認識装置および音声認識プログラム
JP2005084253A (ja) * 2003-09-05 2005-03-31 Matsushita Electric Ind Co Ltd 音響処理装置、方法、プログラム及び記憶媒体
US20050182504A1 (en) 2004-02-18 2005-08-18 Bailey James L. Apparatus to produce karaoke accompaniment
JP4798601B2 (ja) * 2004-12-28 2011-10-19 株式会社国際電気通信基礎技術研究所 音声区間検出装置および音声区間検出プログラム
KR100819848B1 (ko) * 2005-12-08 2008-04-08 한국전자통신연구원 발화검증을 위한 임계치값 자동 갱신을 이용한 음성인식장치 및 방법
US20100153885A1 (en) 2005-12-29 2010-06-17 Rovi Technologies Corporation Systems and methods for interacting with advanced displays provided by an interactive media guidance application
JP5089955B2 (ja) * 2006-10-06 2012-12-05 三菱電機株式会社 音声対話装置
US20080134866A1 (en) 2006-12-12 2008-06-12 Brown Arnold E Filter for dynamic creation and use of instrumental musical tracks
GB2462399A (en) 2007-06-28 2010-02-10 Taptu Ltd Search result ranking
US20090006368A1 (en) 2007-06-29 2009-01-01 Microsoft Corporation Automatic Video Recommendation
US20090228273A1 (en) 2008-03-05 2009-09-10 Microsoft Corporation Handwriting-based user interface for correction of speech recognition errors
JP2010128015A (ja) * 2008-11-25 2010-06-10 Toyota Central R&D Labs Inc 音声認識の誤認識判定装置及び音声認識の誤認識判定プログラム
JP2011059194A (ja) * 2009-09-07 2011-03-24 Sharp Corp 制御装置、画像形成装置、画像形成装置の制御方法、プログラムおよび記録媒体
US9123339B1 (en) * 2010-11-23 2015-09-01 Google Inc. Speech recognition using repeated utterances
US8990241B2 (en) 2010-12-23 2015-03-24 Yahoo! Inc. System and method for recommending queries related to trending topics based on a received query
US8805751B2 (en) 2011-10-13 2014-08-12 Verizon Patent And Licensing Inc. User class based media content recommendation methods and systems
US8249876B1 (en) * 2012-01-03 2012-08-21 Google Inc. Method for providing alternative interpretations of a voice input to a user
EP2645364B1 (en) * 2012-03-29 2019-05-08 Honda Research Institute Europe GmbH Spoken dialog system using prominence
US20130294755A1 (en) 2012-05-03 2013-11-07 United Video Properties, Inc. Systems and methods for preventing access to a media asset segment during a fast-access playback operation
US20130347038A1 (en) 2012-06-21 2013-12-26 United Video Properties, Inc. Systems and methods for searching for media based on derived attributes
US8577671B1 (en) 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
WO2014025012A1 (ja) * 2012-08-10 2014-02-13 株式会社ホンダアクセス 音声認識方法及び音声認識装置
US9237386B2 (en) 2012-08-31 2016-01-12 Google Inc. Aiding discovery of program content by providing deeplinks into most interesting moments via social media
WO2014068788A1 (ja) * 2012-11-05 2014-05-08 三菱電機株式会社 音声認識装置
US9462342B2 (en) 2013-01-24 2016-10-04 Surewaves Mediatech Private Limited System and method for recommending on demand multimedia content based on event information
EP2994908B1 (en) 2013-05-07 2019-08-28 Veveo, Inc. Incremental speech input interface with real time feedback
US9712482B2 (en) 2014-02-18 2017-07-18 Veveo, Inc. Methods and systems for recommending concept clusters based on availability
US9715875B2 (en) * 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US20150382061A1 (en) 2014-06-30 2015-12-31 Sling Media, Inc. Spoiler mitigation methods and systems
WO2016020464A1 (en) 2014-08-05 2016-02-11 Piksel, Inc Context driven recommendation for content delivery and display system
US9514743B2 (en) 2014-08-29 2016-12-06 Google Inc. Query rewrite corrections
JP6284462B2 (ja) * 2014-09-22 2018-02-28 株式会社日立製作所 音声認識方法、及び音声認識装置
US10284916B2 (en) 2014-11-19 2019-05-07 Comcast Cable Communications, Llc Personalized menus and media content interface
JP6514503B2 (ja) * 2014-12-25 2019-05-15 クラリオン株式会社 意図推定装置、および意図推定システム
US9648386B2 (en) 2014-12-30 2017-05-09 Echostar Technologies L.L.C. Protection from spoilers
US10068023B2 (en) 2014-12-30 2018-09-04 Rovi Guides, Inc. Systems and methods for updating links between keywords associated with a trending topic
US11290783B2 (en) 2015-03-17 2022-03-29 Comcast Cable Communications, Llc Real-time recommendations for altering content output
JP6280074B2 (ja) * 2015-03-25 2018-02-14 日本電信電話株式会社 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム
EP3089159B1 (en) * 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
US20170069309A1 (en) * 2015-09-03 2017-03-09 Google Inc. Enhanced speech endpointing
US10339917B2 (en) * 2015-09-03 2019-07-02 Google Llc Enhanced speech endpointing
US10884503B2 (en) * 2015-12-07 2021-01-05 Sri International VPA with integrated object recognition and facial expression recognition
JP6751658B2 (ja) * 2016-11-15 2020-09-09 クラリオン株式会社 音声認識装置、音声認識システム
US10741175B2 (en) * 2016-11-30 2020-08-11 Lenovo (Singapore) Pte. Ltd. Systems and methods for natural language understanding using sensor input
US11475884B2 (en) * 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined

Similar Documents

Publication Publication Date Title
JP2021144250A5 (ja)
WO2018090538A1 (zh) 网球拍动作识别方法及装置
KR101734829B1 (ko) 지역성 말투를 구분하는 음성 데이터 인식 방법, 장치 및 서버
US20170213105A1 (en) Method and apparatus for event sampling of dynamic vision sensor on image formation
US10600189B1 (en) Optical flow techniques for event cameras
US9704279B2 (en) Image processing device, image processing method, program, and recording medium
WO2021008115A1 (zh) 获取稳定帧的方法、装置以及计算机可读介质
US9347828B1 (en) Method for detecting ambient light brightness and apparatus for achieving the method
WO2017177903A1 (zh) 一种实时手势检测的在线验证方法及系统
CN103488764A (zh) 个性化视频内容推荐方法和系统
KR102550964B1 (ko) 개인화 모델을 이용한 집중도 측정 장치 및 방법
WO2021109673A1 (zh) 基于场景识别的音画品质增强方法、系统和显示器
JP2008282089A (ja) 人物属性推定装置
CN104065872B (zh) 运动图像提取装置、运动图像提取方法和记录介质
CN101150666A (zh) 面部图像检测设备及其控制方法
CN112037788B (zh) 一种语音纠正融合方法
CN105279499A (zh) 年龄识别方法及装置
CN109922334A (zh) 一种视频质量的识别方法及系统
CN109243441B (zh) 调整语音采集距离的引导方法、装置、终端及存储介质
WO2019120025A1 (zh) 照片的调整方法、装置、存储介质及电子设备
CN115119043A (zh) 情境驱动式内容快倒的方法和系统
US20170269809A1 (en) Method for screen capture and electronic device
US20130265453A1 (en) Virtual Shutter Image Capture
KR20100099564A (ko) 디지털 영상 처리기에서 먼지 보정 장치 및 방법
KR20140114283A (ko) 정보 처리 장치