JP2021099887A - 音声認識によるページ操作方法、装置、機器、媒体及びプログラム - Google Patents
音声認識によるページ操作方法、装置、機器、媒体及びプログラム Download PDFInfo
- Publication number
- JP2021099887A JP2021099887A JP2021046331A JP2021046331A JP2021099887A JP 2021099887 A JP2021099887 A JP 2021099887A JP 2021046331 A JP2021046331 A JP 2021046331A JP 2021046331 A JP2021046331 A JP 2021046331A JP 2021099887 A JP2021099887 A JP 2021099887A
- Authority
- JP
- Japan
- Prior art keywords
- control element
- recognition result
- voice recognition
- pinyin
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Abstract
Description
Claims (15)
- 音声認識によるページ操作方法であって、前記ページは、少なくとも1つの制御エレメントを含み、前記方法は、
受信した音声を認識して、音声認識結果を得ることと、
制御エレメント毎に設置された中国語形式の文字的記述を取得することと、
前記少なくとも1つの制御エレメントから、文字的記述のピンインが前記音声認識結果のピンインとマッチした目標制御エレメントを特定することと、
前記目標制御エレメントに関連する制御操作を実行して前記音声認識結果を表示し、ただし、前記音声認識結果と前記目標制御エレメントの文字的記述とがマッチしない場合、前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示することと、を含む
ページ操作方法。 - 前記少なくとも1つの制御エレメントから、目標制御エレメントを特定することは、
前記音声認識結果をピンインに変換することと、
各制御エレメントの文字的記述をピンインに変換することと、
前記音声認識結果のピンインと各制御エレメントの文字的記述のピンインとをマッチングして、前記音声認識結果のピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することと、を含む
請求項1に記載の方法。 - 前記少なくとも1つの制御エレメントの中の各制御エレメントの文字的記述は、複数のサブ部分を含み、
前記音声認識結果のピンインと各制御エレメントの文字的記述のピンインとをマッチングすることは、前記音声認識結果のピンインと各制御エレメントの前記複数のサブ部分の中の各サブ部分のピンインとをマッチングすることを含み、
前記音声認識結果のピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することは、少なくとも1つのサブ部分のピンインが前記音声認識結果のピンインとマッチした制御エレメントを前記目標制御エレメントとして特定することを含む
請求項2に記載の方法。 - 前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示することは、前記音声認識結果を前記目標制御エレメントの文字的記述の中の前記少なくとも1つのサブ部分に置き換えて表示することを含む
請求項3に記載の方法。 - 前記音声認識結果のピンインと各制御エレメントの文字的記述のピンインとをマッチングすることは、前記音声認識結果の中のキーワードを特定し、前記キーワードのピンインと前記制御エレメントの文字的記述のピンインとをマッチングすることを含み、
前記音声認識結果のピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することは、前記キーワードのピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することを含む
請求項2に記載の方法。 - 前記音声認識結果の中のキーワードを特定することは、
前記音声認識結果の中の各単語の品詞を特定することと、
前記音声認識結果の中の名詞を前記キーワードとすることと、を含む
請求項5に記載の方法。 - 前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示することは、前記音声認識結果の中のキーワードを前記目標制御エレメントの文字的記述に置き換えて表示することを含む
請求項5に記載の方法。 - 前記音声認識結果のピンインと前記少なくとも1つの制御エレメントの中の各制御エレメントの文字的記述のピンインとがマッチしない場合、前記音声認識結果を語義解析して語義解析結果を得ることと、
前記音声認識結果に基づいて前記語義解析結果が対象としているアプリケーションプログラムを起動することと、をさらに含む
請求項1に記載の方法。 - 前記ページがタッチスクリーンに表示され、
前記方法は、
タッチスクリーンに前記ページ上の制御エレメントに対するタッチに応じて、前記タッチされた制御エレメントに関連する制御操作を実行することをさらに含む
請求項1〜8のいずれか一項に記載の方法。 - 前記ページは、ウェブページを含み、前記制御エレメントは、ウェブアドレスと、ピクチャと、アイコンと、文字との少なくとも1つを含み、前記目標制御エレメントに関連する制御操作は、ウェブアドレスと、ピクチャと、アイコンと、文字との少なくとも1つに関連するリンクアドレスにアクセスすることを含む
請求項1〜8のいずれか一項に記載の方法。 - 前記ページは、アプリケーションプログラムのインターフェースを含み、制御エレメントは、ピクチャと、アイコンと、文字との少なくとも1つを含み、前記目標制御エレメントに関連する制御操作は、ビデオを再生することと、オーディオを再生することと、リストを展示することとの少なくとも1つを含む
請求項1〜8のいずれか一項に記載の方法。 - 音声認識によるページ操作装置であって、前記ページは、少なくとも1つの制御エレメントを含み、
前記装置は、
受信した音声を認識して、音声認識結果を得る認識モジュールと、
制御エレメント毎に設置された中国語形式の文字的記述を取得する取得モジュールと、
前記少なくとも1つの制御エレメントから、文字的記述のピンインが前記音声認識結果のピンインとマッチした目標制御エレメントを特定する特定モジュールと、
前記目標制御エレメントに関連する制御操作を実行して前記音声認識結果を表示し、ただし、前記音声認識結果と前記目標制御エレメントの文字的記述とがマッチしない場合、前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示する表示モジュールと、を含む
ページ操作装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続するメモリとを含む電子機器であって、
前記メモリに、前記少なくとも1つのプロセッサによって実行され得る命令を記憶しており、前記命令が前記少なくとも1つのプロセッサによって実行されることによって、前記少なくとも1つのプロセッサが請求項1〜11のいずれか一項に記載の方法を実行することができる、
電子機器。 - コンピュータに請求項1〜11のいずれか一項に記載の方法を実行させるためのコンピュータ命令を記憶している不揮発性のコンピュータ読取可能な記憶媒体。
- 実行される際に、請求項1〜11のいずれか一項による方法を実現するコンピュータ命令を含むコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011028860.8 | 2020-09-25 | ||
CN202011028860.8A CN112114926A (zh) | 2020-09-25 | 2020-09-25 | 基于语音识别的页面操作方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021099887A true JP2021099887A (ja) | 2021-07-01 |
JP7242737B2 JP7242737B2 (ja) | 2023-03-20 |
Family
ID=73797022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021046331A Active JP7242737B2 (ja) | 2020-09-25 | 2021-03-19 | 音声認識によるページ操作方法、装置、機器、媒体及びプログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7242737B2 (ja) |
KR (1) | KR20210042853A (ja) |
CN (1) | CN112114926A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674743A (zh) * | 2021-08-20 | 2021-11-19 | 云知声(上海)智能科技有限公司 | 用于自然语言处理中asr结果替换处理设备及处理方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723082A (zh) * | 2021-08-30 | 2021-11-30 | 支付宝(杭州)信息技术有限公司 | 从文本中检测中文拼音的方法和装置 |
CN114049890A (zh) * | 2021-11-03 | 2022-02-15 | 杭州逗酷软件科技有限公司 | 语音控制方法、装置以及电子设备 |
CN113923295B (zh) * | 2021-11-17 | 2023-04-07 | Oppo广东移动通信有限公司 | 语音控制方法、装置、电子设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004226881A (ja) * | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2009128675A (ja) * | 2007-11-26 | 2009-06-11 | Toshiba Corp | 音声を認識する装置、方法およびプログラム |
JP2019091418A (ja) * | 2017-11-15 | 2019-06-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | ページを制御する方法および装置 |
JP2020056879A (ja) * | 2018-10-01 | 2020-04-09 | 株式会社Fam−Time | 情報提供システム及び方法 |
JP2020118955A (ja) * | 2019-01-18 | 2020-08-06 | アドビ インコーポレイテッド | 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166462B (zh) * | 2013-05-17 | 2017-07-21 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
CN107507615A (zh) * | 2017-08-29 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 界面智能交互控制方法、装置、系统及存储介质 |
CN109949814A (zh) * | 2017-12-20 | 2019-06-28 | 北京京东尚科信息技术有限公司 | 语音识别方法、系统、计算机系统及计算机可读存储介质 |
CN109145276A (zh) * | 2018-08-14 | 2019-01-04 | 杭州智语网络科技有限公司 | 一种基于拼音的语音转文字后的文本校正方法 |
CN111383631B (zh) * | 2018-12-11 | 2024-01-23 | 阿里巴巴集团控股有限公司 | 一种语音交互方法、装置及系统 |
CN111540353B (zh) * | 2020-04-16 | 2022-11-15 | 重庆农村商业银行股份有限公司 | 一种语义理解方法、装置、设备及存储介质 |
CN111611468B (zh) * | 2020-04-29 | 2023-08-25 | 百度在线网络技术(北京)有限公司 | 页面交互方法、装置和电子设备 |
CN111696557A (zh) * | 2020-06-23 | 2020-09-22 | 深圳壹账通智能科技有限公司 | 语音识别结果的校准方法、装置、设备及存储介质 |
-
2020
- 2020-09-25 CN CN202011028860.8A patent/CN112114926A/zh active Pending
-
2021
- 2021-03-19 JP JP2021046331A patent/JP7242737B2/ja active Active
- 2021-03-29 KR KR1020210040285A patent/KR20210042853A/ko not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004226881A (ja) * | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2009128675A (ja) * | 2007-11-26 | 2009-06-11 | Toshiba Corp | 音声を認識する装置、方法およびプログラム |
JP2019091418A (ja) * | 2017-11-15 | 2019-06-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | ページを制御する方法および装置 |
JP2020056879A (ja) * | 2018-10-01 | 2020-04-09 | 株式会社Fam−Time | 情報提供システム及び方法 |
JP2020118955A (ja) * | 2019-01-18 | 2020-08-06 | アドビ インコーポレイテッド | 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674743A (zh) * | 2021-08-20 | 2021-11-19 | 云知声(上海)智能科技有限公司 | 用于自然语言处理中asr结果替换处理设备及处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7242737B2 (ja) | 2023-03-20 |
KR20210042853A (ko) | 2021-04-20 |
CN112114926A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10394420B2 (en) | Computer-implemented method of generating a content recommendation interface | |
JP2021099887A (ja) | 音声認識によるページ操作方法、装置、機器、媒体及びプログラム | |
EP3414758B1 (en) | Method and electronic device for performing voice based actions | |
US11403468B2 (en) | Method and apparatus for generating vector representation of text, and related computer device | |
CN108369580B (zh) | 针对屏幕上项目选择的基于语言和域独立模型的方法 | |
KR102310648B1 (ko) | 상황 정보 탐색 및 내비게이션 기법 | |
JP2022033689A (ja) | ページのテーマを決定するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム | |
WO2008122243A1 (fr) | Procédé et système permettant d'appeler rapidement une commande de programme et système destiné à un procédé d'entrée | |
JP7228615B2 (ja) | 映画・テレビドラマの内容検索方法及び装置 | |
US11270669B2 (en) | Rendering method and apparatus, electronic device and storage medium | |
JP2021192290A (ja) | 機械翻訳モデルのトレーニング方法、装置及び電子機器 | |
US20170285932A1 (en) | Ink Input for Browser Navigation | |
EP3832492A1 (en) | Method and apparatus for recommending voice packet, electronic device, and storage medium | |
CN112839261B (zh) | 一种提升语音指令匹配度的方法及显示设备 | |
US20210096814A1 (en) | Speech control method, speech control device, electronic device, and readable storage medium | |
JP2022550609A (ja) | ミニプログラムの音声制御方法、機器及び記憶媒体 | |
JP7264957B2 (ja) | 音声インタラクション方法、装置、電子機器、コンピュータ読取可能な記憶媒体及びコンピュータプログラム | |
US11526259B2 (en) | Method and apparatus for determining extended reading content, device and storage medium | |
US20210342348A1 (en) | Method for parsing query, electronic device and readable storage medium | |
CN112885354A (zh) | 一种显示设备、服务器及基于语音的显示控制方法 | |
CN112689177B (zh) | 一种实现快速交互的方法及显示设备 | |
US20210109965A1 (en) | Method and apparatus for recommending speech packet, and storage medium | |
US20210337278A1 (en) | Playback control method and apparatus, and storage medium | |
CN113658598B (zh) | 一种显示设备的语音交互方法及显示设备 | |
US20230244958A1 (en) | Generation of conversational task completion structure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210319 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220920 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7242737 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |