JP7242737B2 - 音声認識によるページ操作方法、装置、機器、媒体及びプログラム - Google Patents
音声認識によるページ操作方法、装置、機器、媒体及びプログラム Download PDFInfo
- Publication number
- JP7242737B2 JP7242737B2 JP2021046331A JP2021046331A JP7242737B2 JP 7242737 B2 JP7242737 B2 JP 7242737B2 JP 2021046331 A JP2021046331 A JP 2021046331A JP 2021046331 A JP2021046331 A JP 2021046331A JP 7242737 B2 JP7242737 B2 JP 7242737B2
- Authority
- JP
- Japan
- Prior art keywords
- control element
- speech recognition
- recognition result
- pinyin
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Description
Claims (14)
- 音声認識によるページ操作方法であって、前記ページは、少なくとも1つの制御エレメントを含み、前記方法は、
受信した音声を認識して、音声認識結果を得ることと、
制御エレメント毎に設置された中国語形式の文字的記述を取得することと、
前記少なくとも1つの制御エレメントから、文字的記述のピンインが前記音声認識結果のピンインとマッチした目標制御エレメントを特定することと、
前記目標制御エレメントに関連する制御操作を実行して前記音声認識結果を表示し、ただし、前記音声認識結果と前記目標制御エレメントの文字的記述とがマッチしない場合、前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示することと、 前記音声認識結果のピンインと前記少なくとも1つの制御エレメントの中の各制御エレメントの文字的記述のピンインとがマッチしない場合、前記音声認識結果を語義解析して語義解析結果を得ることと、
前記音声認識結果に基づいて前記語義解析結果が対象としているアプリケーションプログラムを起動することとを含む
ページ操作方法。 - 前記少なくとも1つの制御エレメントから、目標制御エレメントを特定することは、
前記音声認識結果をピンインに変換することと、
各制御エレメントの文字的記述をピンインに変換することと、
前記音声認識結果のピンインと各制御エレメントの文字的記述のピンインとをマッチングして、前記音声認識結果のピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することと、を含む
請求項1に記載の方法。 - 前記少なくとも1つの制御エレメントの中の各制御エレメントの文字的記述は、複数のサブ部分を含み、
前記音声認識結果のピンインと各制御エレメントの文字的記述のピンインとをマッチングすることは、前記音声認識結果のピンインと各制御エレメントの前記複数のサブ部分の中の各サブ部分のピンインとをマッチングすることを含み、
前記音声認識結果のピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することは、少なくとも1つのサブ部分のピンインが前記音声認識結果のピンインとマッチした制御エレメントを前記目標制御エレメントとして特定することを含む
請求項2に記載の方法。 - 前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示することは、前記音声認識結果を前記目標制御エレメントの文字的記述の中の前記少なくとも1つのサブ部分に置き換えて表示することを含む
請求項3に記載の方法。 - 前記音声認識結果のピンインと各制御エレメントの文字的記述のピンインとをマッチングすることは、前記音声認識結果の中のキーワードを特定し、前記キーワードのピンインと前記制御エレメントの文字的記述のピンインとをマッチングすることを含み、
前記音声認識結果のピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することは、前記キーワードのピンインとマッチしたピンインを有する制御エレメントを目標制御エレメントとして特定することを含む
請求項2に記載の方法。 - 前記音声認識結果の中のキーワードを特定することは、
前記音声認識結果の中の各単語の品詞を特定することと、
前記音声認識結果の中の名詞を前記キーワードとすることと、を含む
請求項5に記載の方法。 - 前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示することは、前記音声認識結果の中のキーワードを前記目標制御エレメントの文字的記述に置き換えて表示することを含む
請求項5に記載の方法。 - 前記ページがタッチスクリーンに表示され、
前記方法は、
タッチスクリーンに前記ページ上の制御エレメントに対するタッチに応じて、前記タッチされた制御エレメントに関連する制御操作を実行することをさらに含む
請求項1~7の何れか1項に記載の方法。 - 前記ページは、ウェブページを含み、前記制御エレメントは、ウェブアドレスと、ピクチャと、アイコンと、文字との少なくとも1つを含み、前記目標制御エレメントに関連する制御操作は、ウェブアドレスと、ピクチャと、アイコンと、文字との少なくとも1つに関連するリンクアドレスにアクセスすることを含む
請求項1~7の何れか1項に記載の方法。 - 前記ページは、アプリケーションプログラムのインターフェースを含み、制御エレメントは、ピクチャと、アイコンと、文字との少なくとも1つを含み、前記目標制御エレメントに関連する制御操作は、ビデオを再生することと、オーディオを再生することと、リストを展示することとの少なくとも1つを含む
請求項1~7のいずれかに記載の方法。 - 音声認識によるページ操作装置であって、前記ページは、少なくとも1つの制御エレメントを含み、
前記装置は、
受信した音声を認識して、音声認識結果を得る認識モジュールと、
制御エレメント毎に設置された中国語形式の文字的記述を取得する取得モジュールと、
前記少なくとも1つの制御エレメントから、文字的記述のピンインが前記音声認識結果のピンインとマッチした目標制御エレメントを特定する特定モジュールと、
前記目標制御エレメントに関連する制御操作を実行して前記音声認識結果を表示し、ただし、前記音声認識結果と前記目標制御エレメントの文字的記述とがマッチしない場合、前記音声認識結果を前記目標制御エレメントの文字的記述に置き換えて表示し、前記音声認識結果のピンインと前記少なくとも1つの制御エレメントの中の各制御エレメントの文字的記述のピンインとがマッチしない場合、前記音声認識結果を語義解析して語義解析結果を取得し、前記音声認識結果に基づいて前記語義解析結果が対象としているアプリケーションプログラムを起動する表示モジュールと、を含む
ページ操作装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続するメモリとを含む電子機器であって、
前記メモリに、前記少なくとも1つのプロセッサによって実行され得る命令を記憶しており、前記命令が前記少なくとも1つのプロセッサによって実行されることによって、前記少なくとも1つのプロセッサが請求項1~10のいずれかに記載の方法を実行することができる、
電子機器。 - コンピュータに請求項1~10のいずれかに記載の方法を実行させるためのコンピュータ命令を記憶している不揮発性のコンピュータ読取可能な記憶媒体。
- 実行される際に、請求項1~10のいずれか一つ項による方法を実現するコンピュータ命令を含むコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011028860.8 | 2020-09-25 | ||
CN202011028860.8A CN112114926A (zh) | 2020-09-25 | 2020-09-25 | 基于语音识别的页面操作方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021099887A JP2021099887A (ja) | 2021-07-01 |
JP7242737B2 true JP7242737B2 (ja) | 2023-03-20 |
Family
ID=73797022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021046331A Active JP7242737B2 (ja) | 2020-09-25 | 2021-03-19 | 音声認識によるページ操作方法、装置、機器、媒体及びプログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7242737B2 (ja) |
KR (1) | KR20210042853A (ja) |
CN (1) | CN112114926A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674743A (zh) * | 2021-08-20 | 2021-11-19 | 云知声(上海)智能科技有限公司 | 用于自然语言处理中asr结果替换处理设备及处理方法 |
CN113723082A (zh) * | 2021-08-30 | 2021-11-30 | 支付宝(杭州)信息技术有限公司 | 从文本中检测中文拼音的方法和装置 |
CN114049890A (zh) * | 2021-11-03 | 2022-02-15 | 杭州逗酷软件科技有限公司 | 语音控制方法、装置以及电子设备 |
CN113923295B (zh) * | 2021-11-17 | 2023-04-07 | Oppo广东移动通信有限公司 | 语音控制方法、装置、电子设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004226881A (ja) | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2009128675A (ja) | 2007-11-26 | 2009-06-11 | Toshiba Corp | 音声を認識する装置、方法およびプログラム |
JP2019091418A (ja) | 2017-11-15 | 2019-06-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | ページを制御する方法および装置 |
JP2020056879A (ja) | 2018-10-01 | 2020-04-09 | 株式会社Fam−Time | 情報提供システム及び方法 |
JP2020118955A (ja) | 2019-01-18 | 2020-08-06 | アドビ インコーポレイテッド | 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166462B (zh) * | 2013-05-17 | 2017-07-21 | 北京搜狗科技发展有限公司 | 一种文字的输入方法和系统 |
CN107507615A (zh) * | 2017-08-29 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 界面智能交互控制方法、装置、系统及存储介质 |
CN109949814A (zh) * | 2017-12-20 | 2019-06-28 | 北京京东尚科信息技术有限公司 | 语音识别方法、系统、计算机系统及计算机可读存储介质 |
CN109145276A (zh) * | 2018-08-14 | 2019-01-04 | 杭州智语网络科技有限公司 | 一种基于拼音的语音转文字后的文本校正方法 |
CN111383631B (zh) * | 2018-12-11 | 2024-01-23 | 阿里巴巴集团控股有限公司 | 一种语音交互方法、装置及系统 |
CN111540353B (zh) * | 2020-04-16 | 2022-11-15 | 重庆农村商业银行股份有限公司 | 一种语义理解方法、装置、设备及存储介质 |
CN111611468B (zh) * | 2020-04-29 | 2023-08-25 | 百度在线网络技术(北京)有限公司 | 页面交互方法、装置和电子设备 |
CN111696557A (zh) * | 2020-06-23 | 2020-09-22 | 深圳壹账通智能科技有限公司 | 语音识别结果的校准方法、装置、设备及存储介质 |
-
2020
- 2020-09-25 CN CN202011028860.8A patent/CN112114926A/zh active Pending
-
2021
- 2021-03-19 JP JP2021046331A patent/JP7242737B2/ja active Active
- 2021-03-29 KR KR1020210040285A patent/KR20210042853A/ko not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004226881A (ja) | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2009128675A (ja) | 2007-11-26 | 2009-06-11 | Toshiba Corp | 音声を認識する装置、方法およびプログラム |
JP2019091418A (ja) | 2017-11-15 | 2019-06-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | ページを制御する方法および装置 |
JP2020056879A (ja) | 2018-10-01 | 2020-04-09 | 株式会社Fam−Time | 情報提供システム及び方法 |
JP2020118955A (ja) | 2019-01-18 | 2020-08-06 | アドビ インコーポレイテッド | 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング |
Also Published As
Publication number | Publication date |
---|---|
KR20210042853A (ko) | 2021-04-20 |
JP2021099887A (ja) | 2021-07-01 |
CN112114926A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7242737B2 (ja) | 音声認識によるページ操作方法、装置、機器、媒体及びプログラム | |
JP7317791B2 (ja) | エンティティ・リンキング方法、装置、機器、及び記憶媒体 | |
KR102532152B1 (ko) | 멀티 모달 콘텐츠 처리 방법, 장치, 기기 및 저장 매체 | |
JP7194150B2 (ja) | ドキュメントのベクトル化表現方法、ドキュメントのベクトル化表現装置及びコンピュータ機器 | |
CN108369580B (zh) | 针对屏幕上项目选择的基于语言和域独立模型的方法 | |
JP7111682B2 (ja) | 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング | |
EP3414758B1 (en) | Method and electronic device for performing voice based actions | |
JP6726354B2 (ja) | 訂正済みタームを使用する音響モデルトレーニング | |
US9671956B2 (en) | Presenting search term suggestions on graphical user interfaces | |
KR20210056961A (ko) | 의미 처리 방법, 장치, 전자 기기 및 매체 | |
CN111859994A (zh) | 机器翻译模型获取及文本翻译方法、装置及存储介质 | |
JP2015531109A (ja) | 自然動作入力を使用する文脈的クエリ調整 | |
JP2021192290A (ja) | 機械翻訳モデルのトレーニング方法、装置及び電子機器 | |
US20210390254A1 (en) | Method, Apparatus and Device for Recognizing Word Slot, and Storage Medium | |
JP7093825B2 (ja) | マンマシン対話方法、装置、及び機器 | |
JP7146961B2 (ja) | 音声パッケージの推薦方法、装置、電子機器および記憶媒体 | |
KR20210157342A (ko) | 언어 모델의 훈련 방법, 장치, 전자 기기 및 판독 가능 기록 매체 | |
US20210096814A1 (en) | Speech control method, speech control device, electronic device, and readable storage medium | |
JP2022008207A (ja) | トリプルサンプルの生成方法、装置、電子デバイス及び記憶媒体 | |
US20210342348A1 (en) | Method for parsing query, electronic device and readable storage medium | |
CN104850575B (zh) | 用于将语音集成到系统中的方法和系统 | |
JP7223112B2 (ja) | ナビゲーション放送の管理方法、装置および装置 | |
JP2003271389A (ja) | 自然言語によるソフトウェア・オブジェクトの操作方法及びそのためのプログラム | |
US10977009B1 (en) | Method and apparatus for automatic modification of applications from retrieved instructions | |
US10977015B1 (en) | Method and apparatus for automatic modification of applications from retrieved instructions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210319 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220920 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7242737 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |