JP2019128586A - 音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体 - Google Patents

音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP2019128586A
JP2019128586A JP2018212652A JP2018212652A JP2019128586A JP 2019128586 A JP2019128586 A JP 2019128586A JP 2018212652 A JP2018212652 A JP 2018212652A JP 2018212652 A JP2018212652 A JP 2018212652A JP 2019128586 A JP2019128586 A JP 2019128586A
Authority
JP
Japan
Prior art keywords
electronic device
terminal device
server
communication module
control command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018212652A
Other languages
English (en)
Other versions
JP6871891B2 (ja
Inventor
カイファ チュ,
Kaihua Zhu
カイファ チュ,
ユアン ティアン,
Yuan Tian
ユアン ティアン,
シェジアン チェン,
Xuejian Zheng
シェジアン チェン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2019128586A publication Critical patent/JP2019128586A/ja
Application granted granted Critical
Publication of JP6871891B2 publication Critical patent/JP6871891B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72409User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
    • H04M1/72412User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72442User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for playing music files
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Otolaryngology (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】端末装置との相互操作を促進する電子機器を提供する。【解決手段】電子機器102は、音声情報を受信するためのマイクロフォン204を含む。第1の通信モジュール208は、サーバーに接続されるように操作可能であり、音声情報をサーバーに送信し、サーバーから音声情報に基づいて生成された制御命令を受信するように構成される。第2の通信モジュール210は、端末装置に接続されるように操作可能であり、端末装置に制御命令を送信し、端末装置から制御命令に対するオーディオ応答を受信するように構成される。スピーカー206は、オーディオ応答を再生するために用いられる。【選択図】図2

Description

本開示の実施例は、電子機器に関し、より具体的には、音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体に関する。
現在、市場では、ブルートゥース(登録商標)スピーカーボックスが沢山あるが、これらのブルートゥース(登録商標)スピーカーボックスは、モバイル装置(例えば、携帯電話和オーディオ再生装置など)におけるオーディオリソースを再生することができる。しかしながら、これらのブルートゥース(登録商標)スピーカーボックスは、ユーザとの音声インタラクションをサポートしない。また、いくつかのスマートスピーカーボックス製品が存在するが、これらのスマートスピーカーボックス製品は、ユーザとの音声インタラクションを行い、独立な制御中枢として用いることができる。しかしながら、これらのスマートスピーカーボックス製品は、ユーザが頻繁に使用する携帯電話をサポートせず、インタラクティブ性に乏しく、これらのスマートスピーカーボックス製品の使用頻度が低減する。
そこで、端末装置との相互操作を促進する電子機器が求められている。
本開示の実施例は、端末装置と併用するための電子機器及び関連方法に関する。
本開示の第一態様によれば、電子機器を提供する。当該電子機器は、音声情報を受信するように操作可能なマイクロフォンと、サーバーに接続されるように操作可能であり、音声情報をサーバーに送信し、サーバーから音声情報に基づいて生成された制御命令を受信するように構成される第1の通信モジュールと、端末装置に接続されるように操作可能であり、端末装置に制御命令を送信し、端末装置から制御命令に対するオーディオ応答を受信するように構成される第2の通信モジュールと、オーディオ応答を再生するように操作可能なスピーカーとを含む。
本開示の第二態様によれば、電子機器で実現される音声処理方法を提供する。当該方法は、ユーザから受信した音声情報を応答して、前記音声情報をサーバーに送信するステップと、前記サーバーから前記音声情報に基づいて生成された制御命令を受信するステップと、前記制御命令を端末装置に送信するステップと、前記端末装置から前記制御命令に対するオーディオ応答を受信するステップと、前記オーディオ応答を出力するステップとを含む。
本開示の第三態様によれば、計算装置を提供する。前記計算装置は、1つ以上のプロセッサと、1つ以上のプログラムを記憶するための記憶装置とを含み、前記1つ以上のプログラムが前記1つ以上のプロセッサにより実行される場合、前記1つ以上のプロセッサが第二態様に記載の方法を実現する。
本開示の第四態様によれば、コンピュータプログラムが記憶されるコンピュータ読み取り可能な記憶媒体を提供し、前記プログラムは、プロセッサにより実行される時、第二態様に記載の方法を実現する。
本開示の実施例によれば、本発明の内容は、簡略化された形式で概念の選択を説明するために提供され、それらは、以下の詳細な実施態様でさらに説明される。発明の内容は、本開示の重要な特徴または本質的な特徴を特定することを意図するものではなく、本開示の範囲を限定することも意図していない。
図面を参照して、本開示の例示的な実施例をより詳細に説明する。本開示の上記および他の目的、特徴および利点がより明らかになる。ここで、本開示の例示的な実施例では、同じ参照番号は、一般的に、同じ構成要素を表す。
本開示の複数の実施例を実現するための例示的な環境を示す模式図である。 本開示のいくつかの実施例に係る電子機器を示す模式的なブロック図である。 本開示のいくつかの実施例に係る端末装置とインタラクションする方法を示すフローチャートである。 本開示のいくつかの実施例に係る端末装置とのインタラクションを起動する方法を示すフローチャートである。
発明を実施するための態様
以下、図面を参照して本開示の好ましい実施例をより詳細に説明する。本開示の好ましい実施例が図面に示されているが、様々な形態で本開示を実施でき、本明細書に記載の実施例によって限定されるべきではないことを理解すべきである。むしろ、これらの実施例は、本開示をさらに明確し、本開示の範囲が当業者に完全に伝えられるように提供される。
本明細書で使用される「含む」という用語およびその変形は、開放式を示す。すなわち「含むが限定されない」を意味する。特に断らない限り、「または」という用語は「および/または」を意味する。「に基づく」という用語は、「少なくとも部分的に基づいて」を意味する。「1つの例示的実施例」および「1つの実施例」という用語は、「少なくとも1つの例示的な実施例」を意味する。「他の実施例」という用語は、「少なくとも1つの他の実施例」を意味する。「第1」、「第2」などの用語は、異なるまたは同一のものを指すことがある。他の明示的および暗黙的な定義も以下に含まれることがある。
図1は、本開示の複数の実施例を実施するための例示的な環境100を示す模式図である。図1に示すように、電子機器102は、サーバー104に接続され、サーバー104からデータを受信し、および/またはサーバー104にデータを送信するために用いられうる。例えば、電子機器102は、Wi−Fiまたはセルラネットワークなどの無線接続でサーバー104と接続することができる。或いは、電子機器102は、有線接続でサーバー104と接続し、サーバー104と通信することができる。
図1に示すように、電子機器102は、端末装置106に接続される。端末装置106は、様々なモバイルターミナル又は携帯装置、例えば、携帯電話、タブレット、携帯マルチメディア装置などであってもよい。例えば、電子機器102は、ブルートゥース(登録商標)、低電力ブルートゥース(登録商標)などで端末装置106に接続され、端末装置106からデータを受信し、および/または端末装置106にデータを送信するために用いられる。例えば、電子機器102は、スピーカーボックス、例えばスマートスピーカーボックスであってもよく、電子機器102は、端末装置106を支持するためのベースであってもよい。一実施例において、電子機器102は、端末装置106に対して無線充電を行うベースであってもよく、スマートスピーカーボックスの少なくとも一部の機能を実行することができる。しかしながら、ベース、スマートスピーカーボックスなどは、例として提供されるにすぎず、電子機器102が他の適切な形態で示されてもよいことを理解すべきである。
図2は、本開示のいくつかの実施例に係る電子機器102を示す模式的なブロック図である。図2における様々なモジュールは、例として示されるにすぎず、本開示の範囲を限定しなく、当業者であれば、図2におけるモジュールを追加、削除または変更することができることを理解すべきである。
図2に示すように、電子機器102は、マイクロフォン204を含んでもよい。マイクロフォン204は、複数のマイクロフォンからなるマイクロフォンアレイであってもよい。マイクロフォンアレイは、遠隔収音を実現することができる。例えば、ユーザは、マイクロフォンから遠く離れており、実環境では、大量のノイズ、マルチパス反射及び残響が存在する可能性がある。この場合に、マイクロフォンアレイは、音声情報をよりよくピックアップして、音声の識別率を向上させることができる。
図2に示すように、電子機器102は、第1の通信モジュール208を含み、第1の通信モジュール208は、サーバー104に接続されることができる。例えば、第1の通信モジュール208は、Wi−Fi通信モジュール又はセルラ通信モジュールであってもよい。電子機器102は、Wi−Fiまたはセルラネットワークなどの無線接続でサーバー104に接続されることができる。或いは、第1の通信モジュール208は、有線通信をサポートできる通信モジュールであってもよい。第1の通信モジュール208は、マイクロフォン204により受信または採集された音声情報をサーバー104に送信し、及びサーバー104から音声情報に基づいて生成された制御命令を受信することができる。
図2に示すように、電子機器102は、第2の通信モジュール210をさらに含んでもよく、第2の通信モジュール210は、端末装置106に接続され、端末装置106にサーバー106から受信した制御命令を送信することができる。第2の通信モジュール210は、端末装置106から当該制御命令に対するオーディオ応答を受信することができる。スピーカー206は、当該オーディオ応答を再生または出力することができる。具体的な実施例では、第2の通信モジュール210は、ブルートゥース(登録商標)通信モジュールである。
例えば、制御命令は、端末装置106の操作システムに対する命令である。従って、ユーザは、端末装置106の様々な機能、例えば、電話をかける、音楽を再生するといった機能を直接呼び出すことができる。この場合、ユーザは、インタラクションの前に、端末装置106を操作して相応するアプリケーションを立ち上げる必要がない。例えば、ユーザがある音楽を再生しようとする場合に、ユーザは、端末装置106における音楽再生プレーヤーを立ち上げなくても、命令の制御で音楽プレーヤーを開けて当該音楽を再生することができる。このような方式で、ユーザは、端末装置106を持たずとも、端末装置106の様々な機能を実現することができる。例えば、電子機器102は、端末装置106に対して充電できるベースである場合に、ユーザは、端末装置106を電子機器102に置いて端末装置106に対して充電を行う場合に、電子機器102で端末装置106に対して操作することができる。
いくつかの実施例において、電子機器102は、ディスプレイがない装置であってもよい。これにより、製造コストが比較的に低くなる。また、上述のとおり、電子機器102は、端末装置106を搭載するためのベースであってもよく、端末装置106に対して充電などを行う。
いくつかの実施例において、電子機器102は、近場通信モジュール212を含んでもよく、当該近場通信モジュール212は、第2の通信モジュール210の配置情報を記憶するように構成される。端末装置が電子機器の所定の距離範囲にあると決定した場合、近場通信モジュール212は、配置情報を端末装置106に送信して、電子機器102と端末装置106とをペアリングさせる。例えば、第2の通信モジュール210がブルートゥース(登録商標)通信モジュールである場合に、ブルートゥース(登録商標)を介して電子機器102と端末装置106とをペアリングさせる。
いくつかの実施例において、電子機器102は、コントローラー202をさらに含んでもよく、コントローラー202は、プロセッサ(例えば、汎用プロセッサ)または制御回路システムであってもよい。制御回路システムは特定集積回路(ASIC)であってもよく、フィールドプログラマブルゲートアレイ(FPGA)などのプログラマブル回路であってもよい。例えば、コントローラー202は、マイクロフォン204、スピーカー206、第1の通信モジュール208、第2の通信モジュール210、近場通信モジュール212及び無線充電モジュール214における1つ以上のモジュールのオン及びオフを制御することができる。いくつかの実施例で、電子機器102と端末装置106とがペアリングに成功した場合に、コントローラー202は、マイクロフォン204、スピーカー206及び第1の通信モジュール208をオンにすることができる。この場合に、ユーザは、マイクロフォン204により電子機器102に音声情報を入力することができ、第1の通信モジュール208は、サーバー104に接続することができる。
いくつかの実施例において、電子機器102は、無線充電モジュール214をさらに含んでもよく、無線充電モジュール214は、端末装置106に対して充電を行うように構成される。無線充電モジュール214は、端末装置106のバッテリー残量を検出することができ、検出したバッテリー残量が閾値に到達した場合に、充電機能を停止し、検出したバッテリー残量が閾値よりも小さい場合に、充電機能をオンにする。及び/または、電子機器102は、有線充電モジュール(図示しない)を含んでもよく、端末装置106に対して充電を行うために用いられる。電源216は、無線充電モジュール214に接続されてもよく、無線充電モジュール214に電力を提供する。
本開示の実施例によれば、ユーザは、スマートスピーカーボックスなどの電子機器とインタラクションすることにより、モバイルターミナルの制御システムに便利かつ迅速にアクセスし、システムを管理することができる。例えば、スマートスピーカーボックスは、近場通信機能及び無線充電機能を有する場合に、ユーザは、モバイルターミナルに対して充電を行うとともに、モバイルターミナルをブルートゥース(登録商標)でスピーカーボックスに便利かつ迅速に接続することができる。スピーカーボックスは、ブルートゥース(登録商標)でモバイルターミナルへの制御を受けて管理し、スピーカーボックスのマイクロフォンアレイ及びアンプマイクロフォンで、モバイルターミナルへの遠隔音声制御を実現することにより、スマートインタラクションスピーカーボックスとモバイルターミナルを便利かつ迅速に併用することを実現する。
図3は、本開示のいくつかの実施例に係る端末装置とインタラクションする方法300を示すフローチャートである。方法300は、図1または図2に示す電子機器102で実現することができる。電子機器102は、ディスプレイがない装置であってもよい。ブロック302では、電子機器102は、音声情報を受信する。例えば、電子機器102は、マイクロフォン204(例えば、マイクロフォンアレイ)で音声情報を受信することができる。例えば、音声情報は、「アリスに電話をかける」であってもよい。
ブロック304では、電子機器102は、音声情報をサーバー104に送信し。一実施例では、電子機器102は、Wi−Fiまたはセルラネットワークで音声情報をサーバー104に送信する。例えば、電子機器102は、第1の通信モジュール208で音声情報をサーバー104に送信することができる。サーバー104は、音声情報に対して識別するとともに、当該音声情報に関連する端末装置106への制御命令を生成して、それを電子機器102に送信することができる。
ブロック306では、電子機器102はサーバー104から制御命令を受信する。一実施例で、電子機器102は、Wi−Fiまたはセルラネットワークでサーバー104から制御命令を受信する。例えば、電子機器102は、第1の通信モジュール208でサーバー104から制御命令を受信することができる。例えば、制御命令は、端末装置106の操作システムに対する制御命令であってもよい。
ブロック308では、電子機器102は、制御命令を端末装置106に送信する。例えば、電子機器102は、第2の通信モジュール210で制御命令を端末装置106に送信することができる。上述のとおり、第2の通信モジュール210は、ブルートゥース(登録商標)通信モジュールであってもよい。制御命令は、端末装置106に対して操作を行い、例えば、ダイヤルアプリケーションを立ち上げ、アリスに電話する。この場合に、端末装置106は、電子機器102にオーディオ応答を送信することができる。例えば、電話をかける事例では、呼ばれたベルであってもよい。
ブロック310では、電子機器102は、端末装置106からオーディオ応答を受信する。例えば、電子機器は、第2の通信モジュール210により端末装置106からオーディオ応答を受信することができる。
ブロック312では、電子機器106は、オーディオ応答を出力する。例えば、電子機器106は、マイクロフォン(例えば、マイクロフォンアレイ)で当該オーディオ応答を再生または出力することができる。
いくつかの実施例では、無線方式で端末装置106に対して充電を行うことができる。例えば、電子機器102は、端末装置106を搭載するためのベースであってもよい。
図4は、本開示のいくつかの実施例に係る端末装置とのインタラクションを起動する方法400を示すフローチャートである。方法400は、電子機器102により実現することができる。ブロック402では、電子機器102は、端末装置が所定の距離範囲にあるか否かを検出する。例えば、電子機器102は、近場通信モジュール212で端末装置が所定の距離範囲にあるか否かを検出することができる。端末装置104が電子機器102の所定の距離範囲にあると決定した場合に、ブロック404で、電子機器102は、端末装置104に第2の通信モジュール210の配置情報を送信する。端末装置104は、当該配置情報を受信した後、電子機器102とペアリングすることができる。ブロック406で、電子機器102は、ペアリングに成功したか否かを判断する。ペアリングに成功した場合に、電子機器102は、ブロック408でマイクロフォン204、スピーカー208及び第1の通信モジュール208を起動する。この場合に、ユーザは、電子機器102で端末装置106とインタラクションし、例えば、音声情報を受信したり、音声情報をサーバーに送信したり、および/またはオーディオ応答を出力することができる。
本開示の実施例は、方法、装置、システムおよび/またはコンピュータ読み取り可能な記憶媒体に関し、当該コンピュータ読み取り可能な記憶媒体には、本開示の各態様を実行するためのコンピュータ読み取り可能なプログラム命令が搭載される。
図面におけるフローチャート及びブロック図は、本開示の複数の実施例に係るシステム、方法及びコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャート又はブロック図における各ブロックは、1つのモジュール、プログラムセグメント、又は命令の一部を代表してもよく、前記モジュール、プログラムセグメント、又は命令の一部は、規定されたロジック機能を達成するための1つ以上の実行可能な命令を含む。また、いくつかの代替実施態様として、ブロックに示された機能は、図面に示された順番と異なる順番で実行されてもよい。例えば、連続して示された2つのブロックは、関連する機能に応じて、実際にほぼ並行に実行されてもよく、逆の順番で実行されてもよい。また、ブロック図及び/又はフローチャートにおける各ブロックと、ブロック図及び/又はフローチャートにおけるブロックの組合せは、規定された機能又は操作を実行する、ハードウェアに基づく専用システムで実現されてもよく、あるいは、専用ハードウェアとコンピュータの命令との組合せで実行されてもよい。
以上、本開示の様々な実施例について説明してきたが、前述の説明は、例示的なものであって、包括的に記載されておらず、開示された実施例に限定されない。多くの修正および変更は、実施例の範囲および精神から逸脱しない限り、当業者にとって明らかであろう。本明細書で使用される用語の選択は、様々な実施例における原理の原理、実用的な適用、または技術の改良を最もよく説明すること、または当業者が本明細書に開示される様々な実施例を理解できるようにすることを意図する。

Claims (22)

  1. 音声情報を受信するように操作可能なマイクロフォンと、
    サーバーに接続されるように操作可能であり、前記音声情報を前記サーバーに送信し、前記サーバーから前記音声情報に基づいて生成された制御命令を受信するように構成される第1の通信モジュールと、
    端末装置に接続されるように操作可能であり、前記端末装置に前記制御命令を送信し、前記端末装置から前記制御命令に対するオーディオ応答を受信するように構成される第2の通信モジュールと、
    前記オーディオ応答を再生するように操作可能なスピーカーと、を含む、電子機器。
  2. 前記電子機器はディスプレイがない装置であることを特徴とする請求項1に記載の電子機器。
  3. 前記制御命令が前記端末装置の操作システムに対する命令であることを特徴とする請求項1または2に記載の電子機器。
  4. 前記第2の通信モジュールの配置情報を記憶するように操作可能であり、前記端末装置が前記電子機器の所定の距離範囲にあると決定したことに応答して、前記配置情報を前記端末装置に送信することにより、前記電子機器と前記端末装置とをペアリングさせるように構成される近場通信モジュールを更に含むことを特徴とする請求項1又は2に記載の電子機器。
  5. 前記電子機器は、コントローラーを更に含み、
    前記コントローラーは、前記電子機器と前記端末装置とがペアリングに成功したことに応答して、前記マイクロフォン、前記スピーカー及び前記第1の通信モジュールを起動するように構成されることを特徴とする請求項4に記載の電子機器。
  6. 前記端末装置に対して充電を行うように操作可能な無線充電モジュールを更に含むことを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
  7. 前記電子機器は、前記端末装置を搭載するためのベースであることを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
  8. 前記第2の通信モジュールは、ブルートゥース(登録商標)通信モジュールであることを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
  9. 前記第1の通信モジュールは、Wi−Fi通信モジュール又はセルラ通信モジュールであることを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
  10. 前記マイクロフォンがマイクロフォンアレイを形成することを特徴とする請求項1、2及び5のいずれかに記載の電子機器。
  11. 電子機器で実現される音声処理方法であって、
    ユーザから音声情報を受信したことに応答して、前記音声情報をサーバーに送信するステップと、
    前記サーバーから前記音声情報に基づいて生成された制御命令を受信するステップと、
    前記制御命令を端末装置に送信するステップと、
    前記端末装置から前記制御命令に対するオーディオ応答を受信するステップと、
    前記オーディオ応答を出力するステップと、を含む、音声処理方法。
  12. 前記サーバーから前記制御命令を受信するステップは、
    前記サーバーから前記端末装置の操作システムに対する前記制御命令を受信するステップを含むことを特徴とする請求項11に記載の方法。
  13. 前記端末装置が前記電子機器の所定の距離範囲にあると決定したことに応答して、前記電子機器と前記端末装置とをペアリングさせるステップをさらに含むことを特徴とする請求項11又は12に記載の方法。
  14. 前記電子機器と前記端末装置とがペアリングに成功したことに応答して、
    前記音声情報を受信するステップ、
    前記音声情報を前記サーバーに送信するステップ、及び
    前記オーディオ応答を出力するステップ、のうち少なくとも一つのステップを実行することをさらに含む、請求項13に記載の方法。
  15. 無線方式で前記端末装置に対して充電を行うステップをさらに含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。
  16. 前記電子機器は、前記端末装置を搭載するためのベースであることを特徴とする請求項11、12及び14のいずれかに記載の方法。
  17. 前記制御命令を前記端末装置に送信するステップは、ブルートゥース(登録商標)を介して前記制御命令を前記端末装置に送信するステップを含み、
    前記端末装置から前記オーディオ応答を受信するステップは、ブルートゥース(登録商標)を介して前記端末装置から前記オーディオ応答を受信するステップを含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。
  18. 前記音声情報を前記サーバーに送信するステップは、
    Wi−Fiまたはセルラネットワークで前記音声情報を前記サーバーに送信するステップを含み、
    前記サーバーから前記制御命令を受信するステップは、
    前記Wi−Fiまたは前記セルラネットワークで前記サーバーから前記制御命令を受信するステップを含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。
  19. 前記電子機器のマイクロフォンアレイを介して前記ユーザから前記音声情報を受信するステップをさらに含むことを特徴とする請求項11、12及び14のいずれかに記載の方法。
  20. 前記電子機器は、ディスプレイがない装置であることを特徴とする請求項11、12及び14のいずれかに記載の方法。
  21. 1つ以上のプロセッサと、
    1つ以上のプログラムを記憶するための記憶装置と、を含み、
    前記1つ以上のプログラムが前記1つ以上のプロセッサにより実行される場合に、前記1つ以上のプロセッサが請求項11〜20のいずれかに記載の方法を実現する計算装置。
  22. コンピュータプログラムが記憶され、前記プログラムがプロセッサにより実行される場合に、請求項11〜20のいずれかに記載の方法を実現する、コンピュータ読み取り可能な記憶媒体。
JP2018212652A 2018-01-26 2018-11-13 音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体 Active JP6871891B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810078330.0A CN108399917B (zh) 2018-01-26 2018-01-26 语音处理方法、设备和计算机可读存储介质
CN201810078330.0 2018-01-26

Publications (2)

Publication Number Publication Date
JP2019128586A true JP2019128586A (ja) 2019-08-01
JP6871891B2 JP6871891B2 (ja) 2021-05-19

Family

ID=63095018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018212652A Active JP6871891B2 (ja) 2018-01-26 2018-11-13 音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体

Country Status (3)

Country Link
US (1) US10957319B2 (ja)
JP (1) JP6871891B2 (ja)
CN (1) CN108399917B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271130B (zh) * 2018-09-12 2021-12-17 网易(杭州)网络有限公司 音频播放方法、介质、装置和计算设备
CN109087642A (zh) * 2018-09-25 2018-12-25 联想(北京)有限公司 一种底座及电子设备
US10650819B2 (en) 2018-10-15 2020-05-12 Midea Group Co., Ltd. System and method for providing portable natural language processing interface across multiple appliances
CN110278205B (zh) * 2019-06-19 2021-05-28 百度在线网络技术(北京)有限公司 蓝牙音箱底座及其控制方法和系统
CN110286986A (zh) * 2019-06-27 2019-09-27 新华网(北京)科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN110557699B (zh) * 2019-09-11 2021-09-07 百度在线网络技术(北京)有限公司 一种智能音箱交互方法、装置、设备及存储介质
CN111930334A (zh) * 2020-07-10 2020-11-13 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN112269556A (zh) * 2020-09-21 2021-01-26 北京达佳互联信息技术有限公司 信息展示方法、装置、系统、设备、服务器及存储介质
US20220284893A1 (en) * 2021-03-05 2022-09-08 Abl Ip Holding Llc Wireless lighting control systems for intelligent luminaires
CN115268821B (zh) * 2022-06-22 2023-07-11 阿波罗智联(北京)科技有限公司 音频播放方法及装置、设备和介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9143861B2 (en) * 2012-01-09 2015-09-22 Imation Corp. Wireless audio player and speaker system
JP6015265B2 (ja) * 2012-09-13 2016-10-26 ヤマハ株式会社 近接通信システム
JP5527831B2 (ja) * 2012-09-28 2014-06-25 Necインフロンティア株式会社 在席状況表示システム、電話装置、在席状況判別方法及び在席状況判別プログラム
US20150185834A1 (en) * 2013-12-26 2015-07-02 Theodore Charles Wingrove System and method for gaze tracking
JP6468069B2 (ja) * 2015-05-19 2019-02-13 オンキヨー株式会社 電子機器制御システム、サーバー、及び、端末装置
JP6589458B2 (ja) * 2015-08-19 2019-10-16 ヤマハ株式会社 オーディオ機器
CN105206275A (zh) * 2015-08-31 2015-12-30 小米科技有限责任公司 一种设备控制方法、装置及终端
US10536567B2 (en) * 2015-12-31 2020-01-14 Shenzhen Royole Technologies Co., Ltd. Terminal device and electronic device
CN105825855A (zh) * 2016-04-13 2016-08-03 联想(北京)有限公司 一种信息处理方法及主终端设备
US10491598B2 (en) * 2016-06-30 2019-11-26 Amazon Technologies, Inc. Multi-factor authentication to access services
CN205864405U (zh) * 2016-07-01 2017-01-04 佛山市顺德区美的电热电器制造有限公司 穿戴式设备及具有其的控制系统
US10462545B2 (en) * 2016-07-27 2019-10-29 Amazon Technologies, Inc. Voice activated electronic device
KR20180062746A (ko) * 2016-12-01 2018-06-11 삼성전자주식회사 음성 신호를 입력 또는 출력하는 램프 장치 및 상기 램프 장치의 구동 방법
CN107241689B (zh) * 2017-06-21 2020-05-05 深圳市冠旭电子股份有限公司 一种耳机语音交互方法及其装置、终端设备
CN107241424A (zh) * 2017-06-23 2017-10-10 芜湖恒天易开软件科技股份有限公司 语音播放系统和语音播放方法
CN107481721A (zh) * 2017-08-16 2017-12-15 北京百度网讯科技有限公司 用于可穿戴电子设备的语音交互方法和可穿戴电子设备

Also Published As

Publication number Publication date
CN108399917A (zh) 2018-08-14
US10957319B2 (en) 2021-03-23
US20190237074A1 (en) 2019-08-01
JP6871891B2 (ja) 2021-05-19
CN108399917B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
JP6871891B2 (ja) 音声処理方法、装置及びコンピュータ読み取り可能な記憶媒体
US20150358768A1 (en) Intelligent device connection for wireless media in an ad hoc acoustic network
WO2017215512A1 (zh) 音频流处理方法及相关设备
WO2017059812A1 (zh) 一种语音助手的扩展设备及其工作方法
US20150358767A1 (en) Intelligent device connection for wireless media in an ad hoc acoustic network
AU2013211541B2 (en) Mobile apparatus and control method thereof
KR20140112900A (ko) 블루루스 디바이스에서 통신 연결 방법 및 그 장치
US10827455B1 (en) Method and apparatus for sending a notification to a short-range wireless communication audio output device
CN109473097B (zh) 一种智能语音设备及其控制方法
CN104093216A (zh) 一种无线数据传输的方法和装置
CN112334978A (zh) 支持个性化装置连接的电子装置及其方法
CN105138319A (zh) 事件提醒方法及装置
WO2021237415A1 (zh) 耳机配对、耳机控制方法、蓝牙耳机收纳装置及介质
CN104112459A (zh) 播放音频数据的方法和装置
CN105101013A (zh) 一种播放语音信号的方法和装置
CN104767857A (zh) 基于云名片的电话呼叫方法及装置
CN105468236A (zh) 消息提示方法、装置及终端
CN107911777B (zh) 一种耳返功能的处理方法、装置及移动终端
CN106598540A (zh) 音频播放方法及装置
CN106208271B (zh) 移动电源的管理方法及装置
CN105430469A (zh) 音视频数据的播放方法、装置、终端及服务器
CN108206884A (zh) 终端、终端发射通信信号的调整方法和电子设备
JP2015002394A (ja) 情報処理装置及びコンピュータプログラム
CN105072485A (zh) 时延控制方法及装置
CN107124512B (zh) 音频播放模式的切换方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200407

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201127

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20201127

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20201208

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20201215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210416

R150 Certificate of patent or registration of utility model

Ref document number: 6871891

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250