JP6616473B2 - ページを制御する方法および装置 - Google Patents
ページを制御する方法および装置 Download PDFInfo
- Publication number
- JP6616473B2 JP6616473B2 JP2018174154A JP2018174154A JP6616473B2 JP 6616473 B2 JP6616473 B2 JP 6616473B2 JP 2018174154 A JP2018174154 A JP 2018174154A JP 2018174154 A JP2018174154 A JP 2018174154A JP 6616473 B2 JP6616473 B2 JP 6616473B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- page
- recognition result
- matching
- content information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000004044 response Effects 0.000 claims description 43
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000004020 conductor Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Artificial Intelligence (AREA)
Description
第8の態様として、本発明は、コンピュータプログラムが記憶されており、前記プログラムがプロセッサによって実行されるときに、第2の態様に記載の方法が実現されるコンピュータ読み取り可能な記憶媒体を提供する。
Claims (22)
- ページを制御する方法であって、
端末から送信された音声情報と、表示されたページ内の少なくとも1つの要素の要素情報とを受信するステップであって、前記要素情報は、要素識別子と要素内容情報とを含む、ステップと、
前記音声情報が前記表示されたページを制御するためのものであると確定されたことに応じて、前記音声情報に対して音声認識を行って音声認識結果を取得するステップと、
前記音声認識結果と前記少なくとも1つの要素の要素内容情報とをマッチングするステップと、
前記音声認識結果と前記少なくとも1つの要素の要素内容情報とのマッチングが成功したことに応じて、ページ制御情報を生成し、前記ページ制御情報を前記端末に送信して、前記端末が前記ページ制御情報に基づいて前記表示されたページを制御するようにするステップであって、前記ページ制御情報は、実行待ち操作とターゲット要素の要素識別子とを含み、前記ターゲット要素は、実行待ち操作の対象となる要素である、ステップと、
を含むことを特徴とするページを制御する方法。 - 前記音声認識結果と前記少なくとも1つの要素の要素内容情報とをマッチングするステップは、
前記少なくとも1つの要素における各要素の要素内容情報に対して、前記音声認識結果と当該要素の要素内容情報との類似度を算出し、算出された類似度に基づいて、前記音声認識結果と当該要素のマッチングが成功するか否かを確定するステップを含むことを特徴とする請求項1に記載の方法。 - 前記音声認識結果と当該要素の要素内容情報との類似度を算出し、算出された類似度に基づいて、前記音声認識結果と当該要素のマッチングが成功するか否かを確定するステップは、
前記音声認識結果と当該要素の要素内容情報との間の第1の編集距離を算出するステップと、
前記第1の編集距離が予め設定された第1の閾値を超えるか否かを確定するステップと、
前記第1の編集距離が前記第1の閾値を超えないと確定されたことに応じて、前記音声認識結果と当該要素の要素内容情報とのマッチングが成功したと確定するステップと、
を含むことを特徴とする請求項2に記載の方法。 - 前記音声認識結果と当該要素の要素内容情報との類似度を算出し、算出された類似度に基づいて、前記音声認識結果と当該要素のマッチングが成功するか否かを確定するステップは、
前記第1の編集距離が前記第1の閾値を超えると確定されたことに応じて、前記音声認識結果に対応するピンインと、当該要素の要素内容情報に対応するピンインとの間の第2の編集距離を算出する、ステップと、
前記第2の編集距離が予め設定された第2の閾値を超えるか否かを確定するステップと、
前記第2の編集距離が前記第2の閾値を超えないと確定されたことに応じて、前記音声認識結果と当該要素とのマッチングが成功したと確定するステップと、
前記第2の編集距離が前記第2の閾値を超えると確定されたことに応じて、前記音声認識結果と当該要素のマッチングが不成功であると確定するステップと、
をさらに含むことを特徴とする請求項3に記載の方法。 - 前記要素情報は、表示されたページ内の要素の位置情報、表示されたページに対応するアプリケーションのアプリケーション名、および表示されたページに対応するアプリケーションのバージョン番号のうちの少なくとも1つをさらに含むことを特徴とする請求項1に記載の方法。
- 前記少なくとも1つの要素の要素情報は、ツリー構造で記憶され、
前記音声認識結果と前記少なくとも1つの要素の要素内容情報とをマッチングするステップは、
ツリー構造の各子ノードを走査するステップと、
各子ノードの表す要素の要素内容情報と前記音声認識結果とをマッチングするステップを含むことを特徴とする請求項1に記載の方法。 - 前記実行待ち操作は、クリック操作であることを特徴とする請求項1に記載の方法。
- ページを制御する方法であって、
ユーザから送信された音声情報の受信に応じて、前記音声情報と、表示されたページ内の少なくとも1つの要素の要素情報とをサーバに送信するステップであって、前記要素情報は、要素識別子と要素内容情報とを含む、ステップと、
前記サーバから送信されたページ制御情報を受信するステップであって、前記ページ制御情報は、前記サーバにより前記音声情報が前記表示されたページを制御するためのものであると確定された後に生成されたものであり、前記ページ制御情報は実行待ち操作とターゲット要素の要素識別子とを含み、前記ターゲット要素は実行待ち操作の対象となる要素である、ステップと、
前記ターゲット要素の要素識別子に基づいて、前記表示されたページ内の前記ターゲット要素の位置を確定し、確定された位置で前記実行待ち操作を実行するステップと、
を含むことを特徴とするページを制御する方法。 - ページを制御する装置であって、
端末から送信された音声情報と、表示されたページ内の少なくとも1つの要素の要素情報とを受信する受信ユニットであって、前記要素情報は、要素識別子と要素内容情報とを含む受信ユニットと、
前記音声情報が前記表示されたページを制御するためのものであると確定されたことに応じて、前記音声情報に対して音声認識を行って音声認識結果を取得する識別ユニットと、
前記音声認識結果と前記少なくとも1つの要素の要素内容情報とをマッチングするマッチングユニットと、
前記音声認識結果と前記少なくとも1つの要素の要素内容情報とのマッチングが成功したことに応じて、ページ制御情報を生成し、前記ページ制御情報を端末に送信して、前記端末が前記ページ制御情報に基づいて前記表示されたページを制御するようにする生成ユニットであって、前記ページ制御情報は、実行待ち操作とターゲット要素の要素識別子とを含み、前記ターゲット要素は、実行待ち操作の対象となる要素である、生成ユニットと、
を含むことを特徴とするページを制御する装置。 - 前記マッチングユニットは、
前記少なくとも1つの要素における各要素の要素内容情報に対して、前記音声認識結果と当該要素の要素内容情報との類似度を算出し、算出された類似度に基づいて、前記音声認識結果と当該要素のマッチングが成功するか否かを確定する計算ユニットを含むことを特徴とする請求項9に記載の装置。 - 前記計算ユニットは、第1の計算サブユニットを備え、
前記第1の計算サブユニットは、
前記音声認識結果と当該要素の要素内容情報との間の第1の編集距離を算出し、
前記第1の編集距離が予め設定された第1の閾値を超えるか否かを確定し、
前記第1の編集距離が前記第1の閾値を超えないと確定されたことに応じて、前記音声認識結果と当該要素の要素内容情報とのマッチングが成功したと確定することを特徴とする請求項10に記載の装置。 - 前記計算ユニットは、第2の計算サブユニットをさらに備え、
前記第2の計算サブユニットは、
前記第1の編集距離が前記第1の閾値を超えると確定されたことに応じて、前記音声認識結果に対応するピンインと、当該要素の要素内容情報に対応するピンインとの間の第2の編集距離を算出し、
前記第2の編集距離が予め設定された第2の閾値を超えるか否かを確定し、
前記第2の編集距離が前記第2の閾値を超えないと確定されたことに応じて、前記音声認識結果と当該要とのマッチングが成功したと確定し、
前記第2の編集距離が前記第2の閾値を超えると確定されたことに応じて、前記音声認識結果と当該要素のマッチングが不成功であると確定することを特徴とする請求項11に記載の装置。 - 前記要素情報は、表示されたページ内の要素の位置情報、表示されたページに対応するアプリケーションのアプリケーション名、および表示されたページに対応するアプリケーションのバージョン番号のうちの少なくとも1つをさらに含むことを特徴とする請求項9に記載の装置。
- 前記少なくとも1つの要素の要素情報は、ツリー構造で記憶され、
前記マッチングユニットは、
ツリー構造の各子ノードを走査し、
各子ノードの表す要素の要素内容情報と前記音声認識結果とをマッチングするようにさらに構成されていることを特徴とする請求項9に記載の装置。 - 前記実行待ち操作は、クリック操作であることを特徴とする請求項9に記載の装置。
- ページを制御する装置であって、
ユーザから送信された音声情報の受信に応じて、前記音声情報と、表示されたページ内の少なくとも1つの要素の要素情報とをサーバに送信する送信ユニットであって、前記要素情報は、要素識別子と要素内容情報とを含む、送信ユニットと、
前記サーバから送信されたページ制御情報を受信する情報受信ユニットであって、前記ページ制御情報は、前記サーバにより前記音声情報が前記表示されたページを制御するためのものであると確定された後に生成されたものであり、実行待ち操作とターゲット要素の要素識別子とを含み、前記ターゲット要素は、実行待ち操作の対象となる要素である、情報受信ユニットと、
前記ターゲット要素の要素識別子に基づいて、前記表示されたページ内の前記ターゲット要素の位置を確定し、確定された位置で前記実行待ち操作を実行する実行ユニットと、
を含むことを特徴とするページを制御する装置。 - 1つまたは複数のプロセッサと、
1つまたは複数のプログラムが記憶されている記憶装置と、を備え、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1〜7のいずれか一項に記載の方法を実装させることを特徴とするサーバ。 - コンピュータプログラムが記憶されており、
前記プログラムがプロセッサによって実行されるときに、請求項1〜7のいずれか一項に記載の方法が実現されることを特徴とするコンピュータ読み取り可能な記憶媒体。 - 1つまたは複数のプロセッサと、
1つまたは複数のプログラムが記憶されている記憶装置と、を備え、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項8に記載の方法を実装させることを特徴とする端末。 - コンピュータプログラムが記憶されており、
前記プログラムがプロセッサによって実行されるときに、請求項8に記載の方法が実現されることを特徴とするコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行されるときに、請求項1〜7のいずれか一項に記載の方法が実現されることを特徴とするコンピュータプログラム。
- プロセッサによって実行されるときに、請求項8に記載の方法が実現されることを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711126816.9A CN107919129A (zh) | 2017-11-15 | 2017-11-15 | 用于控制页面的方法和装置 |
CN201711126816.9 | 2017-11-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019091418A JP2019091418A (ja) | 2019-06-13 |
JP6616473B2 true JP6616473B2 (ja) | 2019-12-04 |
Family
ID=61896300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018174154A Active JP6616473B2 (ja) | 2017-11-15 | 2018-09-18 | ページを制御する方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11221822B2 (ja) |
JP (1) | JP6616473B2 (ja) |
CN (1) | CN107919129A (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11183182B2 (en) * | 2018-03-07 | 2021-11-23 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
KR20230051619A (ko) * | 2018-03-07 | 2023-04-18 | 구글 엘엘씨 | 사용자 지정 디바이스 액션들의 음성 기반 시작을 위한 시스템들 및 방법들 |
CN108829371B (zh) * | 2018-06-19 | 2022-02-22 | Oppo广东移动通信有限公司 | 界面控制方法、装置、存储介质及电子设备 |
CN110673886B (zh) * | 2018-07-03 | 2023-10-03 | 百度在线网络技术(北京)有限公司 | 用于生成热力图的方法和装置 |
CN109256124A (zh) * | 2018-09-28 | 2019-01-22 | 上海连尚网络科技有限公司 | 一种用于用户设备端的语音指令创建方法 |
CN109522083B (zh) * | 2018-11-27 | 2020-03-17 | 四川长虹电器股份有限公司 | 一种页面智能化响应交互系统及方法 |
CN115145529B (zh) * | 2019-08-09 | 2023-05-09 | 华为技术有限公司 | 语音控制设备的方法及电子设备 |
CN110515921B (zh) * | 2019-09-02 | 2021-11-02 | 江苏建筑职业技术学院 | 一种计算机人工智能信息筛选装置 |
US20210090558A1 (en) * | 2019-09-24 | 2021-03-25 | Audio Analytic Ltd | Controlling a user interface |
CN111367492B (zh) * | 2020-03-04 | 2023-07-18 | 深圳市腾讯信息技术有限公司 | 网页页面展示方法及装置、存储介质 |
CN113643697A (zh) * | 2020-04-23 | 2021-11-12 | 百度在线网络技术(北京)有限公司 | 一种语音控制方法、装置、电子设备及存储介质 |
CN111968637B (zh) * | 2020-08-11 | 2024-06-14 | 北京小米移动软件有限公司 | 终端设备的操作模式控制方法、装置、终端设备及介质 |
CN111966939A (zh) * | 2020-09-18 | 2020-11-20 | 北京百度网讯科技有限公司 | 页面跳转方法及装置 |
CN112114926B (zh) * | 2020-09-25 | 2024-08-09 | 阿波罗智联(北京)科技有限公司 | 基于语音识别的页面操作方法、装置、设备和介质 |
CN112689177B (zh) * | 2021-01-14 | 2023-11-03 | 海信电子科技(深圳)有限公司 | 一种实现快速交互的方法及显示设备 |
CN114968164A (zh) * | 2021-02-25 | 2022-08-30 | 阿里巴巴集团控股有限公司 | 语音处理方法、系统、装置和终端设备 |
CN113299293A (zh) * | 2021-05-25 | 2021-08-24 | 阿波罗智联(北京)科技有限公司 | 语音识别结果处理方法和装置、电子设备、计算机介质 |
CN113923295B (zh) * | 2021-11-17 | 2023-04-07 | Oppo广东移动通信有限公司 | 语音控制方法、装置、电子设备以及存储介质 |
CN116170646A (zh) * | 2021-11-25 | 2023-05-26 | 中移(杭州)信息技术有限公司 | 一种机顶盒的控制方法和系统,及存储介质 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091858A (ja) * | 2000-09-13 | 2002-03-29 | Sharp Corp | 情報提供装置、情報生成装置、それらを接続した情報提供システム、それらの方法およびそれらのプログラムを記録した記録媒体 |
JP2003140682A (ja) * | 2001-11-05 | 2003-05-16 | Alpine Electronics Inc | 音声認識装置及び音声辞書作成方法 |
JP3500383B1 (ja) * | 2002-09-13 | 2004-02-23 | コナミ株式会社 | ゲーム装置、ゲーム装置の制御方法及びプログラム |
JP2005084436A (ja) * | 2003-09-09 | 2005-03-31 | Advanced Telecommunication Research Institute International | 音声認識装置及びコンピュータプログラム |
JP2005322148A (ja) * | 2004-05-11 | 2005-11-17 | Mitsubishi Electric Corp | ブラウザ装置 |
US7590626B2 (en) * | 2006-10-30 | 2009-09-15 | Microsoft Corporation | Distributional similarity-based models for query correction |
JP4845118B2 (ja) * | 2006-11-20 | 2011-12-28 | 富士通株式会社 | 音声認識装置、音声認識方法、および、音声認識プログラム |
US8843376B2 (en) * | 2007-03-13 | 2014-09-23 | Nuance Communications, Inc. | Speech-enabled web content searching using a multimodal browser |
CN101376226B (zh) * | 2007-08-28 | 2011-08-24 | 鸿富锦精密工业(深圳)有限公司 | 滚圆治具 |
KR20120080069A (ko) * | 2011-01-06 | 2012-07-16 | 삼성전자주식회사 | 디스플레이 장치 및 그 음성 제어 방법 |
CN102831121B (zh) * | 2011-06-15 | 2015-07-08 | 阿里巴巴集团控股有限公司 | 一种网页信息抽取的方法和系统 |
CN102829930B (zh) * | 2012-07-11 | 2015-08-12 | 龚福岐 | 试漏机 |
US20140092904A1 (en) * | 2012-10-03 | 2014-04-03 | Research In Motion Limited | System and method for requesting content using an electronic device |
CN103914219B (zh) * | 2013-01-04 | 2017-07-11 | 深圳市金蝶天燕中间件股份有限公司 | 页面控制方法和系统 |
CN103106900B (zh) * | 2013-02-28 | 2016-05-04 | 用友网络科技股份有限公司 | 语音识别装置和语音识别方法 |
CN103474068B (zh) * | 2013-08-19 | 2016-08-10 | 科大讯飞股份有限公司 | 实现语音命令控制的方法、设备及系统 |
CN105869640B (zh) * | 2015-01-21 | 2019-12-31 | 上海墨百意信息科技有限公司 | 识别针对当前页面中的实体的语音控制指令的方法和装置 |
KR101652645B1 (ko) * | 2015-07-13 | 2016-08-30 | 김강민 | 사용자 참여형 광고 장치 및 이를 이용한 광고 방법 |
CN105161106A (zh) * | 2015-08-20 | 2015-12-16 | 深圳Tcl数字技术有限公司 | 智能终端的语音控制方法、装置及电视机系统 |
US10740384B2 (en) * | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
CN105224198A (zh) * | 2015-09-09 | 2016-01-06 | 魅族科技(中国)有限公司 | 一种页面控制方法、页面控制装置及终端 |
KR20170032114A (ko) * | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 음성 인식 장치 및 그의 제어방법 |
US10931713B1 (en) * | 2016-02-17 | 2021-02-23 | Cequence Security, Inc. | Passive detection of genuine web browsers based on security parameters |
JP2017191418A (ja) * | 2016-04-13 | 2017-10-19 | ホーチキ株式会社 | 防災監視設備の受信機 |
CN106792242B (zh) * | 2017-02-22 | 2020-10-09 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
US12026456B2 (en) * | 2017-08-07 | 2024-07-02 | Dolbey & Company, Inc. | Systems and methods for using optical character recognition with voice recognition commands |
-
2017
- 2017-11-15 CN CN201711126816.9A patent/CN107919129A/zh active Pending
- 2017-12-28 US US15/857,025 patent/US11221822B2/en active Active
-
2018
- 2018-09-18 JP JP2018174154A patent/JP6616473B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20190147861A1 (en) | 2019-05-16 |
CN107919129A (zh) | 2018-04-17 |
JP2019091418A (ja) | 2019-06-13 |
US11221822B2 (en) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6616473B2 (ja) | ページを制御する方法および装置 | |
US11487503B2 (en) | Interactive control method and device for voice and video communications | |
CN107210033B (zh) | 基于众包来更新用于数字个人助理的语言理解分类器模型 | |
US11011163B2 (en) | Method and apparatus for recognizing voice | |
JP7222008B2 (ja) | 動画クリップの検索方法及び装置 | |
CN109981787B (zh) | 用于展示信息的方法和装置 | |
EP3523718B1 (en) | Creating a cinematic storytelling experience using network-addressable devices | |
US20140304663A1 (en) | Gesture Interface | |
WO2019128829A1 (zh) | 动作执行方法、装置、存储介质及电子装置 | |
JP2019008771A (ja) | 情報入力方法 | |
CN110968362B (zh) | 应用运行方法、装置及存储介质 | |
WO2020181783A1 (zh) | 用于发送信息的方法和装置 | |
US12047624B2 (en) | Systems and methods for generating new content segments based on object name identification | |
US10997963B1 (en) | Voice based interaction based on context-based directives | |
US20240089169A1 (en) | Multi-device interface application | |
CN111539217B (zh) | 一种用于自然语言内容标题消歧的方法、设备和系统 | |
US11036468B2 (en) | Human-computer interface for navigating a presentation file | |
JP2021108095A (ja) | スピーチ理解における解析異常の情報を出力するための方法 | |
CN105009205A (zh) | 用于启用网络的设备上的语音识别输入的方法和系统 | |
CN112309387A (zh) | 用于处理信息的方法和装置 | |
CN108153574B (zh) | 应用程序处理方法、装置及电子设备 | |
CN107205229B (zh) | 用于在无线路由设备端发布信息的方法和装置 | |
CN110634478A (zh) | 用于处理语音信号的方法及装置 | |
CN110942306A (zh) | 数据处理方法、装置及电子设备 | |
KR20200129346A (ko) | 디스플레이 장치 및 이의 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180927 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181016 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6616473 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |