JP2019128586A - 音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体 - Google Patents
音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP2019128586A JP2019128586A JP2018212652A JP2018212652A JP2019128586A JP 2019128586 A JP2019128586 A JP 2019128586A JP 2018212652 A JP2018212652 A JP 2018212652A JP 2018212652 A JP2018212652 A JP 2018212652A JP 2019128586 A JP2019128586 A JP 2019128586A
- Authority
- JP
- Japan
- Prior art keywords
- electronic device
- terminal device
- server
- communication module
- control command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000004891 communication Methods 0.000 claims abstract description 46
- 230000004044 response Effects 0.000 claims abstract description 27
- 238000000034 method Methods 0.000 claims description 25
- 230000001413 cellular effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000010267 cellular communication Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 6
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
- H04M1/72412—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72442—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for playing music files
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Otolaryngology (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (22)
- 音声情報を受信するように操作可能なマイクロフォンと、
サーバーに接続されるように操作可能であり、前記音声情報を前記サーバーに送信し、前記サーバーから前記音声情報に基づいて生成された制御命令を受信するように構成される第1の通信モジュールと、
端末装置に接続されるように操作可能であり、前記端末装置に前記制御命令を送信し、前記端末装置から前記制御命令に対するオーディオ応答を受信するように構成される第2の通信モジュールと、
前記オーディオ応答を再生するように操作可能なスピーカーと、を含む、電子機器。 - 前記電子機器はディスプレイがない装置であることを特徴とする請求項1に記載の電子機器。
- 前記制御命令が前記端末装置の操作システムに対する命令であることを特徴とする請求項1または2に記載の電子機器。
- 前記第2の通信モジュールの配置情報を記憶するように操作可能であり、前記端末装置が前記電子機器の所定の距離範囲にあると決定したことに応答して、前記配置情報を前記端末装置に送信することにより、前記電子機器と前記端末装置とをペアリングさせるように構成される近場通信モジュールを更に含むことを特徴とする請求項1又は2に記載の電子機器。
- 前記電子機器は、コントローラーを更に含み、
前記コントローラーは、前記電子機器と前記端末装置とがペアリングに成功したことに応答して、前記マイクロフォン、前記スピーカー及び前記第1の通信モジュールを起動するように構成されることを特徴とする請求項4に記載の電子機器。 - 前記端末装置に対して充電を行うように操作可能な無線充電モジュールを更に含むことを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
- 前記電子機器は、前記端末装置を搭載するためのベースであることを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
- 前記第2の通信モジュールは、ブルートゥース(登録商標)通信モジュールであることを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
- 前記第1の通信モジュールは、Wi−Fi通信モジュール又はセルラ通信モジュールであることを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
- 前記マイクロフォンがマイクロフォンアレイを形成することを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
- 電子機器で実現される音声処理方法であって、
ユーザから音声情報を受信したことに応答して、前記音声情報をサーバーに送信するステップと、
前記サーバーから前記音声情報に基づいて生成された制御命令を受信するステップと、
前記制御命令を端末装置に送信するステップと、
前記端末装置から前記制御命令に対するオーディオ応答を受信するステップと、
前記オーディオ応答を出力するステップと、を含む、音声処理方法。 - 前記サーバーから前記制御命令を受信するステップは、
前記サーバーから前記端末装置の操作システムに対する前記制御命令を受信するステップを含むことを特徴とする請求項11に記載の方法。 - 前記端末装置が前記電子機器の所定の距離範囲にあると決定したことに応答して、前記電子機器と前記端末装置とをペアリングさせるステップをさらに含むことを特徴とする請求項11又は12に記載の方法。
- 前記電子機器と前記端末装置とがペアリングに成功したことに応答して、
前記音声情報を受信するステップ、
前記音声情報を前記サーバーに送信するステップ、及び
前記オーディオ応答を出力するステップ、のうち少なくとも一つのステップを実行することをさらに含む、請求項13に記載の方法。 - 無線方式で前記端末装置に対して充電を行うステップをさらに含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。
- 前記電子機器は、前記端末装置を搭載するためのベースであることを特徴とする請求項11、12及び14のいずれかに記載の方法。
- 前記制御命令を前記端末装置に送信するステップは、ブルートゥース(登録商標)を介して前記制御命令を前記端末装置に送信するステップを含み、
前記端末装置から前記オーディオ応答を受信するステップは、ブルートゥース(登録商標)を介して前記端末装置から前記オーディオ応答を受信するステップを含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。 - 前記音声情報を前記サーバーに送信するステップは、
Wi−Fiまたはセルラネットワークで前記音声情報を前記サーバーに送信するステップを含み、
前記サーバーから前記制御命令を受信するステップは、
前記Wi−Fiまたは前記セルラネットワークで前記サーバーから前記制御命令を受信するステップを含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。 - 前記電子機器のマイクロフォンアレイを介して前記ユーザから前記音声情報を受信するステップをさらに含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。
- 前記電子機器は、ディスプレイがない装置であることを特徴とする請求項11、12及び14のいずれかに記載の方法。
- 1つ以上のプロセッサと、
1つ以上のプログラムを記憶するための記憶装置と、を含み、
前記1つ以上のプログラムが前記1つ以上のプロセッサにより実行される場合に、前記1つ以上のプロセッサが請求項11〜20のいずれかに記載の方法を実現する計算装置。 - コンピュータプログラムが記憶され、前記プログラムがプロセッサにより実行される場合に、請求項11〜20のいずれかに記載の方法を実現する、コンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810078330.0A CN108399917B (zh) | 2018-01-26 | 2018-01-26 | 语音处理方法、设备和计算机可读存储介质 |
CN201810078330.0 | 2018-01-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019128586A true JP2019128586A (ja) | 2019-08-01 |
JP6871891B2 JP6871891B2 (ja) | 2021-05-19 |
Family
ID=63095018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018212652A Active JP6871891B2 (ja) | 2018-01-26 | 2018-11-13 | 音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10957319B2 (ja) |
JP (1) | JP6871891B2 (ja) |
CN (1) | CN108399917B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271130B (zh) * | 2018-09-12 | 2021-12-17 | 网易(杭州)网络有限公司 | 音频播放方法、介质、装置和计算设备 |
CN109087642A (zh) * | 2018-09-25 | 2018-12-25 | 联想(北京)有限公司 | 一种底座及电子设备 |
US10650819B2 (en) | 2018-10-15 | 2020-05-12 | Midea Group Co., Ltd. | System and method for providing portable natural language processing interface across multiple appliances |
CN110278205B (zh) * | 2019-06-19 | 2021-05-28 | 百度在线网络技术(北京)有限公司 | 蓝牙音箱底座及其控制方法和系统 |
CN110286986A (zh) * | 2019-06-27 | 2019-09-27 | 新华网(北京)科技有限公司 | 信息处理方法、装置、电子设备及计算机可读存储介质 |
CN110557699B (zh) * | 2019-09-11 | 2021-09-07 | 百度在线网络技术(北京)有限公司 | 一种智能音箱交互方法、装置、设备及存储介质 |
CN111930334A (zh) * | 2020-07-10 | 2020-11-13 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN112269556A (zh) * | 2020-09-21 | 2021-01-26 | 北京达佳互联信息技术有限公司 | 信息展示方法、装置、系统、设备、服务器及存储介质 |
US20220284893A1 (en) * | 2021-03-05 | 2022-09-08 | Abl Ip Holding Llc | Wireless lighting control systems for intelligent luminaires |
CN115268821B (zh) * | 2022-06-22 | 2023-07-11 | 阿波罗智联(北京)科技有限公司 | 音频播放方法及装置、设备和介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9143861B2 (en) * | 2012-01-09 | 2015-09-22 | Imation Corp. | Wireless audio player and speaker system |
JP6015265B2 (ja) * | 2012-09-13 | 2016-10-26 | ヤマハ株式会社 | 近接通信システム |
JP5527831B2 (ja) * | 2012-09-28 | 2014-06-25 | Necインフロンティア株式会社 | 在席状況表示システム、電話装置、在席状況判別方法及び在席状況判別プログラム |
US20150185834A1 (en) * | 2013-12-26 | 2015-07-02 | Theodore Charles Wingrove | System and method for gaze tracking |
JP6468069B2 (ja) * | 2015-05-19 | 2019-02-13 | オンキヨー株式会社 | 電子機器制御システム、サーバー、及び、端末装置 |
JP6589458B2 (ja) * | 2015-08-19 | 2019-10-16 | ヤマハ株式会社 | オーディオ機器 |
CN105206275A (zh) * | 2015-08-31 | 2015-12-30 | 小米科技有限责任公司 | 一种设备控制方法、装置及终端 |
US10536567B2 (en) * | 2015-12-31 | 2020-01-14 | Shenzhen Royole Technologies Co., Ltd. | Terminal device and electronic device |
CN105825855A (zh) * | 2016-04-13 | 2016-08-03 | 联想(北京)有限公司 | 一种信息处理方法及主终端设备 |
US10491598B2 (en) * | 2016-06-30 | 2019-11-26 | Amazon Technologies, Inc. | Multi-factor authentication to access services |
CN205864405U (zh) * | 2016-07-01 | 2017-01-04 | 佛山市顺德区美的电热电器制造有限公司 | 穿戴式设备及具有其的控制系统 |
US10462545B2 (en) * | 2016-07-27 | 2019-10-29 | Amazon Technologies, Inc. | Voice activated electronic device |
KR20180062746A (ko) * | 2016-12-01 | 2018-06-11 | 삼성전자주식회사 | 음성 신호를 입력 또는 출력하는 램프 장치 및 상기 램프 장치의 구동 방법 |
CN107241689B (zh) * | 2017-06-21 | 2020-05-05 | 深圳市冠旭电子股份有限公司 | 一种耳机语音交互方法及其装置、终端设备 |
CN107241424A (zh) * | 2017-06-23 | 2017-10-10 | 芜湖恒天易开软件科技股份有限公司 | 语音播放系统和语音播放方法 |
CN107481721A (zh) * | 2017-08-16 | 2017-12-15 | 北京百度网讯科技有限公司 | 用于可穿戴电子设备的语音交互方法和可穿戴电子设备 |
-
2018
- 2018-01-26 CN CN201810078330.0A patent/CN108399917B/zh active Active
- 2018-11-13 JP JP2018212652A patent/JP6871891B2/ja active Active
- 2018-12-20 US US16/228,615 patent/US10957319B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN108399917A (zh) | 2018-08-14 |
US10957319B2 (en) | 2021-03-23 |
US20190237074A1 (en) | 2019-08-01 |
JP6871891B2 (ja) | 2021-05-19 |
CN108399917B (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6871891B2 (ja) | 音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体 | |
US20150358768A1 (en) | Intelligent device connection for wireless media in an ad hoc acoustic network | |
WO2017215512A1 (zh) | 音频流处理方法及相关设备 | |
WO2017059812A1 (zh) | 一种语音助手的扩展设备及其工作方法 | |
US20150358767A1 (en) | Intelligent device connection for wireless media in an ad hoc acoustic network | |
AU2013211541B2 (en) | Mobile apparatus and control method thereof | |
KR20140112900A (ko) | 블루루스 디바이스에서 통신 연결 방법 및 그 장치 | |
US10827455B1 (en) | Method and apparatus for sending a notification to a short-range wireless communication audio output device | |
CN109473097B (zh) | 一种智能语音设备及其控制方法 | |
CN104093216A (zh) | 一种无线数据传输的方法和装置 | |
CN112334978A (zh) | 支持个性化装置连接的电子装置及其方法 | |
CN105138319A (zh) | 事件提醒方法及装置 | |
WO2021237415A1 (zh) | 耳机配对、耳机控制方法、蓝牙耳机收纳装置及介质 | |
CN104112459A (zh) | 播放音频数据的方法和装置 | |
CN105101013A (zh) | 一种播放语音信号的方法和装置 | |
CN104767857A (zh) | 基于云名片的电话呼叫方法及装置 | |
CN105468236A (zh) | 消息提示方法、装置及终端 | |
CN107911777B (zh) | 一种耳返功能的处理方法、装置及移动终端 | |
CN106598540A (zh) | 音频播放方法及装置 | |
CN106208271B (zh) | 移动电源的管理方法及装置 | |
CN105430469A (zh) | 音视频数据的播放方法、装置、终端及服务器 | |
CN108206884A (zh) | 终端、终端发射通信信号的调整方法和电子设备 | |
JP2015002394A (ja) | 情報処理装置及びコンピュータプログラム | |
CN105072485A (zh) | 时延控制方法及装置 | |
CN107124512B (zh) | 音频播放模式的切换方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200407 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201127 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20201127 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20201208 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20201215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210413 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210416 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6871891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |