JP7017598B2 - スマートデバイスのデータ処理方法、装置、機器及び記憶媒体 - Google Patents
スマートデバイスのデータ処理方法、装置、機器及び記憶媒体 Download PDFInfo
- Publication number
- JP7017598B2 JP7017598B2 JP2020069790A JP2020069790A JP7017598B2 JP 7017598 B2 JP7017598 B2 JP 7017598B2 JP 2020069790 A JP2020069790 A JP 2020069790A JP 2020069790 A JP2020069790 A JP 2020069790A JP 7017598 B2 JP7017598 B2 JP 7017598B2
- Authority
- JP
- Japan
- Prior art keywords
- voice information
- key
- smart device
- mobile terminal
- key voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/02—Terminal devices
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Description
図1は、本出願の第1の実施例に係るスマートデバイスのデータ処理方法のフローチャートである。本実施例は、スマートデバイスがユーザにインテリジェントなインタラクティブサービスを提供するプロセスにおいて、ユーザの音声情報をデータ処理する場合に適用される。特に、ユーザの音声情報を処理するプロセスにおいて、スマートデバイスがサーバとインタラクションを行う場合に適用される。当該方法は、本出願の実施例に係るスマートデバイスのデータ処理装置又はスマートデバイスによって実行することができ、当該装置は、ソフトウェア及び/又はハードウェア方式を採用して実現することができる。本出願の実施例におけるスマートデバイスは、スマートスピーカ、スマートテレビ、スマートウォッチなどのインテリジェントなインタラクティブサービスを提供することができる任意の電子機器であってよい。図1に示すように、本実施例に係るスマートデバイスのデータ処理方法は、以下のようなステップを含むことができる。
S101において、収集されたユーザ音声情報からキー音声情報を抽出する。
図2は、本出願の第2の実施例に係るスマートデバイスのデータ処理方法のフローチャートである。本実施例は、上記の実施例に基づいて、さらに最適化し、具体的には、どのように収集されたユーザ音声情報からキー音声情報を抽出するかを詳細に説明する。具体的には、図2に示すように、本実施例に係るスマートデバイスのデータ処理方法は、以下のようなステップを含むことができる。
S201では、収集されたユーザ音声情報にウェイクアップワードが存在すると認識された場合、収集されたユーザ音声情報からキー音声情報を抽出する。
図3Aは、本出願の第3の実施例に係るスマートデバイスのデータ処理方法のフローチャートである。図3Bは、本出願の第3の実施例に係るスマートデバイスのデータ処理プロセスの概略図である。本実施例は、上記の実施例に基づいて、さらに最適化し、スマートデバイスが異なるネットワーク環境にある場合、データ処理方法を行う好ましい実施例を提供する。具体的には、図3A~3Bに示すように、本実施例に係るスマートデバイスのデータ処理方法は、以下のようなステップを含むことができる。
S301では、収集されたユーザ音声情報からキー音声情報を抽出する。
図4は、本出願の第4の実施例に係るスマートデバイスのデータ処理装置の概略構成図である。当該装置は、本出願の任意の実施例に係るスマートデバイスのデータ処理方法を実行することができ、実行方法に対応する機能モジュール及び有益な効果を有する。選択可能に、当該装置は、ソフトウェア及び/又はハードウェアの方式を採用して実現することができ、スマートデバイスに統合することができる。図4に示すように、当該スマートデバイスのデータ処理装置400は、収集されたユーザ音声情報からキー音声情報を抽出するためのキー音声抽出モジュール401と、非ワイヤレスフィデリティWiFiネットワーク環境において、前記モバイル端末が前記キー音声情報をサーバに伝送し、前記サーバにより前記キー音声情報を処理した後にフィードバックされた処理結果を受信するように、前記キー音声情報をモバイル端末に伝送するための非WiFi伝送モジュール402と、前記モバイル端末から前記処理結果を取得して表示するための処理結果表示モジュール403と、を含むことができる。
本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
Claims (9)
- スマートデバイスのデータ処理方法であって、
収集されたユーザ音声情報からキー音声情報を抽出するステップと、
非ワイヤレスフィデリティWiFiネットワーク環境において、モバイル端末が前記キー音声情報をサーバに伝送し、前記サーバにより前記キー音声情報を処理した後に、フィードバックされた処理結果を受信するように、前記キー音声情報を前記モバイル端末に伝送するステップと、
前記モバイル端末から前記処理結果を取得して表示するステップと、を含み、
前記キー音声情報をモバイル端末に伝送するステップは、
ローカルブルートゥースモジュールの第1のチャンネルを使用して前記ローカルブルートゥースモジュールの第2のチャンネルをオフ状態からオン状態に切り替えるように制御するステップと、
前記キー音声情報を前記第2のチャンネルを介してモバイル端末に伝送するステップと、を含み、
前記第1のチャンネルの消費電力は、前記第2のチャンネルより低く、前記第1のチャンネルは、前記ローカルブルートゥースモジュールが起動された後に常時オン状態になることを特徴とする、スマートデバイスのデータ処理方法。 - 収集されたユーザ音声情報からキー音声情報を抽出するステップは、
収集されたユーザ音声情報にウェイクアップワードが存在すると認識された場合、前記収集されたユーザ音声情報からキー音声情報を抽出するステップを含むことを特徴とする、請求項1に記載のスマートデバイスのデータ処理方法。 - 収集されたユーザ音声情報からキー音声情報を抽出するステップは、
収集されたユーザ音声情報から前記ウェイクアップワードの後の音声情報をキー音声情報として切り出すステップを含むことを特徴とする、請求項2に記載のスマートデバイスのデータ処理方法。 - 収集されたユーザ音声情報からキー音声情報を抽出するステップは、
収集されたユーザ音声情報に対してノイズ低減処理及び/又は音声テキスト変換処理を行って、キー音声情報を取得するステップを含むことを特徴とする、請求項1に記載のスマートデバイスのデータ処理方法。 - 収集されたユーザ音声情報からキー音声情報を抽出した後、
WiFiネットワーク環境において、サーバにより前記キー音声情報を処理した後に処理結果をフィードバックするように、前記WiFiネットワークに基づいて前記キー音声情報を前記サーバに伝送するステップと、
前記WiFiネットワークに基づいて前記サーバから前記処理結果を取得して表示するステップと、をさらに含むことを特徴とする、請求項1に記載のスマートデバイスのデータ処理方法。 - スマートデバイスのデータ処理装置であって、
収集されたユーザ音声情報からキー音声情報を抽出するためのキー音声抽出モジュールと、
非ワイヤレスフィデリティWiFiネットワーク環境において、モバイル端末が前記キー音声情報をサーバに伝送し、前記サーバにより前記キー音声情報を処理した後に、フィードバックされた処理結果を受信するように、前記キー音声情報を前記モバイル端末に伝送するための非WiFi伝送モジュールと、
前記モバイル端末から前記処理結果を取得して表示するための処理結果表示モジュールと、を含み、
前記非WiFi伝送モジュールが、ローカルブルートゥースモジュールの第1のチャンネルを使用して前記ローカルブルートゥースモジュールの第2のチャンネルをオフ状態からオン状態に切り替えるように制御し、前記キー音声情報を前記第2のチャンネルを介してモバイル端末に伝送し、
前記第1のチャンネルの消費電力が前記第2のチャンネルより低く、前記第1のチャンネルが、前記ローカルブルートゥースモジュールが起動された後に常時オン状態になることを特徴とする、スマートデバイスのデータ処理装置。 - キー音声抽出モジュールは、
収集されたユーザ音声情報にウェイクアップワードが存在すると認識された場合、前記収集されたユーザ音声情報からキー音声情報を抽出することを特徴とする、請求項6に記載のスマートデバイスのデータ処理装置。 - 電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも一つのプロセッサによって実行される場合に、前記少なくとも一つのプロセッサが、請求項1から5のいずれかに記載のスマートデバイスのデータ処理方法を実行することを特徴とする、電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1から5のいずれかに記載のスマートデバイスのデータ処理方法を実行させることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910935399.5 | 2019-09-29 | ||
CN201910935399.5A CN110675873B (zh) | 2019-09-29 | 2019-09-29 | 智能设备的数据处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021057878A JP2021057878A (ja) | 2021-04-08 |
JP7017598B2 true JP7017598B2 (ja) | 2022-02-08 |
Family
ID=69080185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020069790A Active JP7017598B2 (ja) | 2019-09-29 | 2020-04-08 | スマートデバイスのデータ処理方法、装置、機器及び記憶媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11348583B2 (ja) |
JP (1) | JP7017598B2 (ja) |
CN (1) | CN110675873B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113495489A (zh) * | 2020-04-07 | 2021-10-12 | 深圳爱根斯通科技有限公司 | 自动化配置方法、装置、电子设备及存储介质 |
US11302327B2 (en) * | 2020-06-22 | 2022-04-12 | Bank Of America Corporation | Priori knowledge, canonical data forms, and preliminary entrentropy reduction for IVR |
CN112216279A (zh) * | 2020-09-29 | 2021-01-12 | 星络智能科技有限公司 | 语音传输方法、智能终端及计算机可读存储介质 |
CN114527711A (zh) * | 2021-11-08 | 2022-05-24 | 厦门阳光恩耐照明有限公司 | 一种基于本地语音的智能设备控制的方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10367540B1 (en) | 2018-02-20 | 2019-07-30 | Cypress Semiconductor Corporation | System and methods for low power consumption by a wireless sensor device |
JP2019159307A (ja) | 2018-03-14 | 2019-09-19 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 端末ブラケット及びファーフィールド音声対話システム |
CN110312235A (zh) | 2019-05-16 | 2019-10-08 | 深圳市豪恩声学股份有限公司 | 实时语音唤醒的音频设备、运行方法、装置及存储介质 |
US20200402513A1 (en) | 2019-06-19 | 2020-12-24 | Baidu Online Network Technology (Beijing) Co., Ltd. | Bluetooth speaker base, method and system for controlling thereof |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10390217B2 (en) * | 2016-12-27 | 2019-08-20 | Neutrino8, Inc. | Wireless configuration of wireless distribution system (WDS) Wi-Fi range extenders using non-Wi-Fi-wireless communication channels |
US10900800B2 (en) * | 2017-04-18 | 2021-01-26 | Garmin Switzerland Gmbh | Mobile application interface device for vehicle navigation assistance |
US20190114358A1 (en) * | 2017-10-12 | 2019-04-18 | J. J. Keller & Associates, Inc. | Method and system for retrieving regulatory information |
CN108833236A (zh) * | 2018-07-05 | 2018-11-16 | 西安蜂语信息科技有限公司 | 数据传输方法及装置 |
CN109451338A (zh) * | 2018-12-12 | 2019-03-08 | 央广视讯传媒股份有限公司 | 一种语音遥控电视的方法、装置、电子设备及可读介质 |
CN110223691A (zh) * | 2019-06-11 | 2019-09-10 | 苏州思必驰信息科技有限公司 | 语音唤醒识别的切换控制方法和装置 |
-
2019
- 2019-09-29 CN CN201910935399.5A patent/CN110675873B/zh active Active
-
2020
- 2020-04-08 JP JP2020069790A patent/JP7017598B2/ja active Active
- 2020-06-21 US US16/907,269 patent/US11348583B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10367540B1 (en) | 2018-02-20 | 2019-07-30 | Cypress Semiconductor Corporation | System and methods for low power consumption by a wireless sensor device |
JP2019159307A (ja) | 2018-03-14 | 2019-09-19 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 端末ブラケット及びファーフィールド音声対話システム |
CN110312235A (zh) | 2019-05-16 | 2019-10-08 | 深圳市豪恩声学股份有限公司 | 实时语音唤醒的音频设备、运行方法、装置及存储介质 |
US20200402513A1 (en) | 2019-06-19 | 2020-12-24 | Baidu Online Network Technology (Beijing) Co., Ltd. | Bluetooth speaker base, method and system for controlling thereof |
Also Published As
Publication number | Publication date |
---|---|
JP2021057878A (ja) | 2021-04-08 |
CN110675873A (zh) | 2020-01-10 |
US11348583B2 (en) | 2022-05-31 |
CN110675873B (zh) | 2023-02-07 |
US20210097994A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7017598B2 (ja) | スマートデバイスのデータ処理方法、装置、機器及び記憶媒体 | |
US11854570B2 (en) | Electronic device providing response to voice input, and method and computer readable medium thereof | |
KR102320708B1 (ko) | 영상 재생 방법, 장치, 전자 기기 및 판독 가능 저장 매체 | |
KR102331254B1 (ko) | 음성 인식 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체 | |
KR20220002750A (ko) | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 | |
KR102358012B1 (ko) | 음성 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체 | |
US11893988B2 (en) | Speech control method, electronic device, and storage medium | |
KR102358831B1 (ko) | 음성 인식 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체 | |
CN111862940A (zh) | 基于耳机实现的翻译方法、装置、系统、设备和存储介质 | |
CN108055617B (zh) | 一种麦克风的唤醒方法、装置、终端设备及存储介质 | |
JP2021196599A (ja) | 情報を出力するための方法および装置 | |
US20210149558A1 (en) | Method and apparatus for controlling terminal device, and non-transitory computer-readle storage medium | |
CN112230877A (zh) | 一种语音操作方法、装置、存储介质及电子设备 | |
CN111128201A (zh) | 交互方法、装置、系统、电子设备及存储介质 | |
US20210097991A1 (en) | Speech control method and apparatus, electronic device, and readable storage medium | |
JP2022024110A (ja) | 音声認識方法、装置、電子機器及び記憶媒体 | |
KR20200045851A (ko) | 음성 인식 서비스를 제공하는 전자 장치 및 시스템 | |
CN110517684B (zh) | 用于智能设备的控制方法、装置、智能设备及存储介质 | |
CN111638787A (zh) | 用于展示信息的方法和装置 | |
CN111045641B (zh) | 一种电子终端及语音识别方法 | |
CN111897916B (zh) | 语音指令识别方法、装置、终端设备及存储介质 | |
US20210097992A1 (en) | Speech control method and device, electronic device, and readable storage medium | |
CN117891517A (zh) | 一种显示设备及语音唤醒方法 | |
CN115802083A (zh) | 控制方法、装置、分体电视及可读存储介质 | |
CN111142832A (zh) | 一种输入识别方法、装置、存储介质及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210525 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20210531 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20210806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7017598 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |