JP2017539187A - スマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器 - Google Patents

スマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器 Download PDF

Info

Publication number
JP2017539187A
JP2017539187A JP2017547053A JP2017547053A JP2017539187A JP 2017539187 A JP2017539187 A JP 2017539187A JP 2017547053 A JP2017547053 A JP 2017547053A JP 2017547053 A JP2017547053 A JP 2017547053A JP 2017539187 A JP2017539187 A JP 2017539187A
Authority
JP
Japan
Prior art keywords
smart device
module
voice
smart
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017547053A
Other languages
English (en)
Other versions
JP6389014B2 (ja
Inventor
斯太 高
斯太 高
一 丁
一 丁
恩星 侯
恩星 侯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2017539187A publication Critical patent/JP2017539187A/ja
Application granted granted Critical
Publication of JP6389014B2 publication Critical patent/JP6389014B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/02Non-electrical signal transmission systems, e.g. optical systems using infrasonic, sonic or ultrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/72Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for transmitting results of analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4126The peripheral being portable, e.g. PDAs or mobile phones
    • H04N21/41265The peripheral being portable, e.g. PDAs or mobile phones having a remote control device for bidirectional communication between the remote control device and client device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/10Plc systems
    • G05B2219/16Plc to applications
    • G05B2219/163Domotique, domestic, home control, automation, smart, intelligent house
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2642Domotique, domestic, home control, automation, smart house
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/30User interface
    • G08C2201/31Voice input
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/90Additional features
    • G08C2201/91Remote control based on location and proximity
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/90Additional features
    • G08C2201/93Remote control using other portable devices, e.g. mobile phone, PDA, laptop
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Selective Calling Equipment (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)

Abstract

本開示は、スマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器に関する。当該方法は、複数のスマート機器のそれぞれから返信された音声データを受信するステップと、複数の前記音声データを処理して、最適化音声データを取得するステップと、前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップとを含む。本開示の実施例によれば、制御機器が異なる位置からの音声データを処理し、最適化音声データを取得し、当該最適化音声データに基づいて当該最適化音声データに対応するスマート機器を制御することで、スマート機器に対する音声制御を図り、スマート機器に対するユーザの制御へ利便性を与え、ユーザ体験が向上する。【選択図】図1

Description

相互参照
本発明は、出願番号が201510712870.6であり、出願日が2015年10月28日である中国特許出願を基に提出するものであり、当該中国特許出願の優先権を主張し、当該中国特許出願の全ての内容は、参照のため本願に援用される。
本開示は、スマートホーム技術分野に関し、特にスマート機器の音声制御方法、装置、制御機器およびスマート機器に関する。
現在の音声識別技術では、性能が一番良好な処理チップを採用して全指向性マイクロホンと協調し、理想的な状況において3メートルの識別距離に達することができる。通常は、大型会議室で会議室の異なる位置に複数のマイクロホンを設置し、各マイクロホンから収集されたサウンドを処理することで、良好な音声識別効果を実現させる。
関連技術では、家庭環境における音声識別について、上記効果を実現させるために、家具および電器のレイアウトに応じて、異なる位置で複数のマイクロホンを設置する必要があるため、コストが高い。
関連技術に存在する問題を克服するために、本開示は、スマート機器の音声制御方法、装置、制御機器およびスマート機器を提供する。
本開示の実施例の第1の態様によれば、スマート機器の音声制御方法を提供する。当該方法は、
複数のスマート機器のそれぞれから返信された音声データを受信するステップと、
複数の前記音声データを処理して、最適化音声データを取得するステップと、
前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップと、を含む。
好ましくは、前記複数のスマート機器のそれぞれから返信された音声データを受信するステップは、
異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するステップを含む。
好ましくは、前記異なる位置に存在する複数のスマート機器から返信された音声データを受信するステップの前に、前記方法は、さらに、
アプリケーションにバインディングされたスマート機器の基本情報を読み取るステップと、
前記基本情報に基づいて録音機能を有するスマート機器を特定するステップと、
録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップと、
特定された起動すべきスマート機器へ起動指令を送信して当該スマート機器を起動させるステップと、を含む。
好ましくは、前記録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップは、
録音機能を有するスマート機器のリストを表示するステップと、
前記リストに対するユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するステップと、を含む。
好ましくは、前記録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップは、
測位技術に基づいてユーザの位置を特定するステップと、
予め記憶された、前記録音機能を有するスマート機器のそれぞれの位置を検索するステップと、
前記ユーザの位置を含む所定範囲内に存在する録音機能を有するスマート機器を、起動すべきスマート機器として特定するステップと、を含む。
好ましくは、前記方法は、さらに、
前記所定範囲内に存在する録音機能を有するスマート機器の数が所定閾値を超えた場合、前記所定範囲内に存在する録音機能を有するスマート機器の過去使用データを読み取るステップと、
前記過去使用データに基づいて、起動すべきスマート機器を特定するステップと、を含む。
好ましくは、前記過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含む。
好ましくは、前記複数の前記音声データを処理して、最適化音声データを取得するステップは、
ビームフォーミング技術に基づいて、複数の前記音声データを処理して最適化音声データを取得するステップを含む。
好ましくは、前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップは、
赤外線リモコンが、前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、且つ、前記制御指令を前記赤外線エンコーダへ送信するように、前記最適化音声データを前記赤外線リモコンへ送信するステップを含む。
好ましくは、前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップは、
サーバが、前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記制御指令と前記最適化音声データにおける機器名とを赤外線リモコンへ送信して、且つ、前記赤外線リモコンが前記制御指令を前記機器名に対応する赤外線エンコーダへ送信するように、前記最適化音声データを前記サーバへ送信するステップを含む。
本開示の実施例の第2の態様によれば、スマート機器の音声制御方法を提供する。当該方法は、
音声データを採集するステップと、
制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するステップと、を含む。
好ましくは、前記音声データを採集する前に、前記方法は、
前記制御機器から送信された起動指令に応じて起動させるステップを含む。
本開示の実施例の第3の態様によれば、スマート機器の音声制御装置を提供する。当該装置は、受信モジュールと、処理モジュールと、制御モジュールと、を備え、
前記受信モジュールは、複数のスマート機器のそれぞれから返信された音声データを受信するように構成され、
前記処理モジュールは、前記受信モジュールによって受信された複数の前記音声データを処理し、最適化音声データを取得するように構成され、
前記制御モジュールは、前記処理モジュールによって取得された前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成される。
好ましくは、前記受信モジュールは、受信サブモジュールを備え、
前記受信サブモジュールは、異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するように構成される。
好ましくは、前記装置は、読取モジュールと、第1の特定モジュールと、第2の特定モジュールと、起動モジュールと、をさらに備え、
前記読取モジュールは、アプリケーションにバインディングされたスマート機器の基本情報を読み取るように構成され、
前記第1の特定モジュールは、前記読取モジュールによって読み取られた基本情報に基づいて録音機能を有するスマート機器を特定するように構成され、
前記第2の特定モジュールは、前記第1の特定モジュールによって特定された録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するように構成され、
前記起動モジュールは、前記第2の特定モジュールによって特定された起動すべきスマート機器へ起動指令を送信して前記スマート機器を起動させるように構成される。
好ましくは、前記第2の特定モジュールは、表示サブモジュールと、第1の特定サブモジュールと、を備え、
前記表示サブモジュールは、録音機能を有するスマート機器のリストを表示するように構成され、
前記第1の特定サブモジュールは、前記表示サブモジュールによって表示されたリストに対するユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するように構成される。
好ましくは、前記第2の特定モジュールは、測位サブモジュールと、検索サブモジュールと、第2の特定サブモジュールと、を備え、
前記測位サブモジュールは、測位技術に基づいてユーザの位置を特定するように構成され、
前記検索サブモジュールは、予め記憶された、前記録音機能を有するスマート機器のそれぞれの位置を検索するように構成され、
前記第2の特定サブモジュールは、前記測位サブモジュールによって測位されたユーザの位置を含む所定範囲内に存在する、録音機能を有するスマート機器を、起動すべきスマート機器として特定するように構成される。
好ましくは、前記第2の特定モジュールは、読取サブモジュールと、第3の特定サブモジュールと、をさらに備え、
前記読取サブモジュールは、前記第2の特定サブモジュールによって特定された前記スマート機器の数が所定閾値を超えた場合、前記所定範囲内に存在する録音機能を有するスマート機器の過去使用データを読み取るように構成され、
前記第3の特定サブモジュールは、前記読取サブモジュールによって読み取られた過去使用データに基づいて、起動すべきスマート機器を特定するように構成される。
好ましくは、前記読取サブモジュールによって読み取られた前記過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含む。
好ましくは、前記処理モジュールは、処理サブモジュールを備え、
前記処理サブモジュールは、ビームフォーミング技術に基づいて、前記受信モジュールによって受信された複数の前記音声データを処理して最適化音声データを取得するように構成される。
好ましくは、前記制御モジュールは、第1の送信サブモジュールを備え、
前記第1の送信サブモジュールは、赤外線リモコンが前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、且つ、前記制御指令を前記赤外線エンコーダへ送信するように、前記処理モジュールによって取得された前記最適化音声データを前記赤外線リモコンへ送信するように構成される。
好ましくは、前記制御モジュールは、第2の送信サブモジュールを備え、
前記第2の送信サブモジュールは、サーバが前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記制御指令と前記最適化音声データにおける機器名とを赤外線リモコンへ送信して、且つ、前記赤外線リモコンが前記制御指令を前記機器名に対応する赤外線エンコーダへ送信するように、前記処理モジュールによって取得された最適化音声データを前記サーバへ送信するように構成される。
本開示の実施例の第4の態様によれば、スマート機器の音声制御装置を提供する。当該装置は、採集モジュールと、送信モジュールと、を備え、
前記採集モジュールは、音声データを採集するように構成され、
前記送信モジュールは、制御機器が音声データに基づいて前記音声データに対応するスマート機器を制御するように、前記採集モジュールによって採集された前記音声データを前記制御機器へ送信するように構成される。
好ましくは、前記装置は、起動モジュールをさらに備え、
前記起動モジュールは、前記制御機器から送信された起動指令に応じて起動させるように構成される。
本開示の実施例の第5の態様によれば、制御機器を提供する。当該制御機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリと、を備え、前記プロセッサは、
複数のスマート機器のそれぞれから返信された音声データを受信し、
複数の前記音声データを処理して、最適化音声データを取得し、
前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成される。
本開示の実施例の第6の態様によれば、スマート機器を提供する。当該スマート機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリと、を備え、前記プロセッサは、
音声データを採集し、
制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するように構成される。
本開示の実施例による技術案は、以下の格別な作用効果を含むことができる。
本開示では、制御機器が異なる位置からの音声データを処理することで最適化音声データを取得し、当該最適化音声データに基づいて当該最適化音声データに対応するスマート機器を制御可能であるため、スマート機器に対する音声制御を図り、スマート機器に対するユーザの制御へ利便性を与え、ユーザ体験が向上する。
本開示では、制御機器が複数の位置に存在するスマート機器によって採集された音声データを受信し、異なる位置からの音声データを処理して最適化音声データを取得可能であるため、最適化音声データの品質を保証し、音声識別の正確度を保証して、スマート機器に対する音声制御を実現させる。
本開示では、制御機器が録音機能を有するスマート機器を先に特定し、そして録音機能を有するスマート機器のうち、起動すべきスマート機器を特定可能であるため、起動したスマート機器が録音できることを保証する。
本開示では、制御機器がユーザの選択に基づいて起動すべきスマート機器を特定可能であるため、ユーザの需要をより満足させ、ユーザ体験が向上する。
本開示では、制御機器がユーザに対して測位を行い、ユーザの位置に基づいて起動すべきスマート機器を特定可能であるため、起動すべきスマート機器がユーザの位置に近いことを保証でき、よりはっきりした音声データの採集を保証し、後続の最適化音声データの認識度を向上させ、スマート機器に対する正確制御を保証する。
本開示では、制御機器がさらにスマート機器の過去使用データを結合して起動すべきスマート機器を特定可能である。過去使用データがスマート機器の性能をある程度反映できるため、録音された音声データの品質を保証できる。
本開示では、制御機器が最適化音声データを赤外線リモートコントロールセンターへ送信可能である。赤外線リモートコントロールセンターがスマート機器に対する正確な音声制御を達成する。
本開示では、スマート機器は、採集された音声データを制御機器へ送信可能である。こうして、制御機器が音声データと他の位置に存在する複数のスマート機器によって採集された音声データとに基づいて音声データに対応するスマート機器を制御できるため、スマート機器に対する正確な音声制御を図り、ユーザ体験が向上する。
上述した一般的な記述および後続の詳細な記述は、単に例示的および解釈的なものであり、本発明を制限できるものでないと理解されるべきである。
ここでの図面は、明細書を構成する一部として見なされ、本開示に適した実施例を示し、かつ、明細書の文字記載とともに本開示の仕組みを解釈するために用いられる。
本開示の一実施例によるスマート機器の音声制御方法を示すフローチャートである。 本開示の一実施例による別のスマート機器の音声制御方法を示すフローチャートである。 本開示の一実施例による別のスマート機器の音声制御方法を示すフローチャートである。 本開示の一実施例によるスマート機器の音声制御応用場面を示す模式図である。 本開示の一実施例によるスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例によるスマート機器の音声制御装置のための構造模式図である。 本開示の一実施例によるスマート機器の音声制御装置のための構造模式図である。
次に、実施例を詳細に説明し、例示が図に示されている。以下の記述が図に係る場合、別途にて示さない限り、異なる図面における同じ符号は、同じまたは類似する要素を示す。以下の実施例に記述される実施形態は、本発明と一致する全ての実施形態を代表するとは限らない。逆に、それらは、添付の特許請求の範囲に記載されているように、本発明の一部の側面と一致する装置および方法の例に過ぎない。
本開示で使用される用語は、単に特定の実施例を記述するためのものに過ぎず、本発明を限定するものではない。本開示及び添付する特許請求の範囲で使用される単数形である「1種」、「前記」、及び「当該」も、他の意味を表すと明らかに記載しない限り、複数形を含む。さらに、この文章で使用される用語「および/または」とは、1つまたは複数の関連列挙項目の任意または全ての可能な組合せを含むことを言う、と理解されるべきである。
本開示では、用語である第1、第2、第3などを用いて各種情報を記述する可能性があるが、これらの情報はこれらの用語に限定されない、と理解されるべきである。これらの用語は、単に同一種類の情報を互いに区別ためのものに過ぎない。例えば、本発明の範囲を逸脱しない場合、第1の情報は第2の情報と称されても良く、類似的に、第2の情報は第1の情報と称されても良い。言語環境によって、例えば、ここで使用される言葉「若し」は、「…とき」や「…場合」または「…に応答して特定する」と解釈されても良い。
図1に示すように、図1は、一実施例によるスマート機器の音声制御方法を示すフローチャートである。当該方法は、端末等の制御機器に応用可能であり、以下のステップを含む。
ステップ101では、複数のスマート機器のそれぞれから返信された音声データを受信する。
本開示での端末は、インターネット機能を有する如何なるスマート端末であってもよい。例えば、具体的に、携帯電話、タブレットPC、PDA(Personal Digital Assistant、個人情報端末)等であってもよい。ただし、端末は、無線LANを介してルータにアクセスし、ルータを介してパブリックネットワーク上のサーバへアクセスすることができる。本開示での端末は、App(Application、アプリケーションプログラム)、例えばインテリジェントファミリーAppにより、音声データを受信してもよい。
本開示でのスマート機器は、スマート家電、ウェアラブル機器等を含む。スマート機器は、いずれも、家に設置されたルータを介して端末や制御センターと通信するための通信モジュール、例えばwifi(Wireless Fidelity、無線忠実度)モジュールを有する。ただし、制御センターは、各スマート機器を制御するための赤外線リモートコントロールセンターであってもよい。
ステップ102では、複数の音声データを処理して最適化音声データを取得する。
本開示のステップでは、ビームフォーミング技術を採用して複数の音声データを処理して最適化音声データを取得する。
ステップ103では、最適化音声データに基づいて音声データに対応するスマート機器を制御する。
上記実施例では、制御機器が異なる位置からの音声データを処理し、最適化音声データを取得し、当該最適化音声データに基づいて当該最適化音声データに対応するスマート機器を制御することで、スマート機器に対する音声制御を図り、最適化音声データが異なる位置からの音声データを処理して得られたものであるため、最適化音声データの品質を保証し、音声識別の正確度を保証して、スマート機器に対する音声制御を実現させる。
図2に示すように、図2は、一実施例による別のスマート機器の音声制御方法を示すフローチャートである。当該方法は、端末等の制御機器に応用可能であり、以下のステップを含む。
ステップ201では、アプリケーションにバインディングされたスマート機器の基本情報を読み取る。
ステップ202では、基本情報に基づいて録音機能を有するスマート機器を特定する。
本開示の実施例では、端末は、インテリジェントファミリーAppにより、音声データを受信してスマート機器を制御することができる。インテリジェントファミリーAppに複数のスマート機器が関連付けられ、各スマート機器の基本情報も記憶されている。端末は、基本情報を読み取ることで、どのスマート機器が録音機能を有するかを特定できる。
ステップ203では、録音機能を有するスマート機器のうち、起動すべきスマート機器を特定する。
本開示の実施例では、起動すべきスマート機器、即ち音声データを採集するスマート機器を端末が特定するする必要がある。
ある開示形態では、端末のインテリジェントファミリーAppは、バインディングされたスマート機器のうち録音機能を有する全てのスマート機器をユーザ選択に供されるために表示してもよい。ユーザは、その中の一部または全部を起動すべきスマート機器として選択してもよい。それから、端末は、ユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定する。
別の開示形態では、端末は、起動リストに追加すべきスマート機器を特定する。端末は、測位技術に基づいてユーザの位置を特定してから、予め記憶された各録音機能を有するスマート機器の位置を検索し、そして端末は、ユーザの位置を含む所定範囲内に位置する、録音機能を有するスマート機器を、起動すべきスマート機器として特定してもよい。
例えば、端末は、ユーザが応接間にいると測位できると、所定範囲に基づいて、ユーザの位置を中心に半径2メートルの円の範囲で、当該範囲内である録音機能を有するスマート機器を起動すべきスマート機器として特定する。
または、端末のAppには、各スマート機器の置き位置が記憶されている。例えば、機器1〜4が応接間に置かれ、機器5と6が主寝室に置かれ、機器7と8がゲストの寝室に置かれる。端末は、ユーザが応接間にいると特定すると、機器1〜4を起動すべきスマート機器として特定する。
そして、本開示の実施例の方式では、特定された所定範囲内に位置する録音機能を有するスマート機器の数が所定閾値(例えば、6)を超えた場合、所定範囲内に位置する録音機能を有するスマート機器の過去使用データを読み取ってから、過去使用データに基づいて、起動すべきスマート機器を特定する。当該過去使用データは、使用頻度、最近一回の使用時間、総使用時間のうちの1つまたは複数を含んでもよい。例えば、端末は、使用頻度に基づいてスマート機器を順番付け、使用頻度が最高となる4つのスマート機器を起動すべきスマート機器として特定してもよい。
ステップ204では、特定された起動すべきスマート機器へ起動指令を送信してスマート機器を起動させる。
本開示のステップでは、スマート機器を起動させたことは、当該スマート機器の録音機能を起動させたと理解してもよい。端末は、インテリジェントファミリーAppにより、起動すべきスマート機器を起動させてもよい。
ステップ205では、異なる位置の複数のスマート機器によって採集された音声データを受信する。
ステップ206では、ビームフォーミング技術に基づいて、複数の音声データを処理して最適化音声データを取得する。
本開示のステップでは、具体的な処理は、エコー消去、信号処理および強化処理等を含んでもよい。
ステップ207では、赤外線リモコンが最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、赤外線エンコーダへ制御指令を送信するように、最適化音声データを赤外線リモコンへ送信する。
本開示の実施例では、赤外線リモコンが最適化音声データにおける音声情報、例えば「起動テレビ」を抽出し、予め記憶されたデータから対応する制御指令を検索してもよい。また、最適化音声データには、さらに、機器名、例えば「テレビ」が含まれている。赤外線リモコンは、対応する赤外線エンコーダを検索し、制御指令を当該赤外線エンコーダへ送信可能であるため、スマート機器に対する音声制御を図る。
別の開示形態では、端末は、サーバが当該最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、制御指令と最適化音声データにおける機器名とを赤外線リモコンへ送信し、且つ、赤外線リモコンが制御指令を機器名に対応する赤外線エンコーダへ送信するように、当該最適化音声データをサーバへ送信してもよい。
上記実施例では、端末は、複数の方式で起動すべきスマート機器を特定してもよい。例えば、ユーザによって選択されたスマート機器をスマート機器として特定する。こうして、録音の満足度を向上させ、ユーザ体験を最適化する。
端末は、さらに、ユーザの位置を測位して起動すべきスマート機器を特定してもよい。こうして、ユーザに一番近いスマート機器を特定可能であり、録音の効果を向上させ、最適化音声データの品質および識別度を保証する。
図3に示すように、図3は、一実施例による別のスマート機器の音声制御方法を示すフローチャートである。当該方法は、端末等の制御機器に応用可能であり、以下のステップを含む。
ステップ301では、音声データを採集する。
本開示の実施例では、異なる位置に存在する録音機能を有する複数のスマート機器のそれぞれが異なる位置における音声データを採集する。スマート機器は、制御機器から送信された起動指令に基づいて起動することができる。
ステップ302では、制御機器が音声データと他の位置に存在する複数のスマート機器によって採集された音声データとに基づいて、音声データに対応するスマート機器を制御するように、当該音声データを制御機器へ送信する。
図1、2に示す実施例に合わせて、ある開示形態では、スマート機器は、音声データを制御機器、例えば端末へ送信してもよい。端末は、音声データに対してビームフォーミング処理を行って最適化音声データを取得し、最適化音声データを赤外線リモートコントロールセンターへ送信する。赤外線リモートコントロールセンターに赤外線エンコーダライブラリが記憶され、赤外線エンコーダライブラリに各スマート機器の名称および対応する赤外線エンコーダが記憶され、さらに音声情報および対応する制御指令が記憶されている。赤外線リモートコントロールセンターは、最適化音声データにおける音声情報を抽出して機器名を取得し、赤外線エンコーダライブラリで検索して機器名に対応する赤外線エンコーダを取得し、音声情報に基づいて対応する制御指令を検索し、当該制御指令をスマート機器の赤外線エンコーダへ送信することで、当該スマート機器に対する音声制御を達成する。
別の開示形態では、スマート機器が最適化音声データを端末へ送信した後、端末は、最適化音声データをサーバへ送信してもよい。サーバには、音声情報および対応する制御指令が記憶されている。サーバは、最適化音声データに基づいて音声情報を抽出し、検索により対応する制御指令を取得し、制御指令および機器名を赤外線リモコンへ送信する。リモコンは、機器名に基づいて対応する赤外線エンコーダを検索し、制御指令を対応する赤外線エンコーダへ送信することで、スマート機器に対する音声制御を達成する。
上記実施例では、端末が音声データを処理して最適化音声データを取得し、当該最適化音声データに基づいてスマート機器を制御するように、スマート機器は、採集された当該音声データを端末へ送信可能であるため、最適化音声データの品質および識別度が向上し、ユーザ体験が向上する。
図4に示すように、図4は、本開示の一実施例によるスマート機器の音声制御応用場面を示す模式図である。図4に示す場面では、制御機器であるスマートフォン、録音のためのスマート機器1、スマート機器2およびスマート機器3、並びに、制御の対象であるテレビを含み、スマートフォンには、インテリジェントファミリーAppがインストールされ、スマートフォンは、インテリジェントファミリーAppにより、バインディングされた各スマート機器を制御する。
スマートフォンは、測位技術に基づいてユーザの位置を特定し、予め記憶された各録音機能を有するスマート機器の位置を検索し、ユーザの位置を含む所定範囲(図4に示す円形範囲)内である、録音機能を有するスマート機器1、スマート機器2およびスマート機器3を、起動すべきスマート機器として特定し、そして起動すべき機器を起動させて録音を開始させ、異なる位置に存在するスマート機器1、スマート機器2およびスマート機器3で採集された音声データを受信し、受信した音声データに対してビームフォーミング処理を行って、最適化音声データ「起動テレビ」を取得する。スマートフォンは、赤外線リモートコントロールセンターが最適化音声データにおける機器名「テレビ」に基づいて、対応する赤外線エンコーダを検索し、最適化音声データに基づいて制御指令を検索し、制御指令を赤外線エンコーダへ送信してテレビに対する制御を実現させるように、当該最適化音声データを赤外線リモートコントロールセンターへ送信する。
図4に示す応用場面では、スマート機器の音声制御を実施する具体的な手順が上記図1〜3に対する記述を参照すればよいため、ここで繰り返し説明しない。
上記スマート機器の音声制御方法の実施例に対応し、本開示は、スマート機器の音声制御装置、並びに、それが適用する制御機器およびスマート機器の実施例をさらに提供する。
図5に示すように、図5は、本開示の一実施例によるスマート機器の音声制御装置を示すブロック図である。当該装置が受信モジュール510、処理モジュール520および制御モジュール530を備えてもよい。
ただし、受信モジュール510は、複数のスマート機器のそれぞれから返信された音声データを受信するように構成される。
処理モジュール520は、受信モジュール510によって受信された複数の音声データを処理して最適化音声データを取得するように構成される。
制御モジュール530は、処理モジュール520によって取得された最適化音声データに基づいて、音声データに対応するスマート機器を制御するように構成される。
上記実施例では、制御機器が異なる位置からの音声データを処理し、最適化音声データを取得し、当該最適化音声データに基づいて当該最適化音声データに対応するスマート機器を制御することで、スマート機器に対する音声制御を図り、スマート機器に対するユーザの制御へ利便性を与え、ユーザ体験が向上する。
図6に示すように、図6は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、受信モジュール510が受信サブモジュール511を備えてもよい。
受信サブモジュール511は、異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するように構成される。
上記実施例では、制御機器が複数の位置に存在するスマート機器によって採集された音声データを受信し、異なる位置からの音声データを処理して最適化音声データを取得可能であるため、最適化音声データの品質を保証し、音声識別の正確度を保証して、スマート機器に対する音声制御を実現させる。
図7に示すように、図7は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、当該装置が読取モジュール540、第1の特定モジュール550、第2の特定モジュール560および起動モジュール570をさらに備えてもよい。
読取モジュール540は、アプリケーションにバインディングされたスマート機器の基本情報を読み取るように構成される。
第1の特定モジュール550は、読取モジュール540によって読み取られた基本情報に基づいて、録音機能を有するスマート機器を特定するように構成される。
第2の特定モジュール560は、第1の特定モジュール550によって特定された録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するように構成される。
起動モジュール570は、第2の特定モジュール560によって特定された起動すべきスマート機器へ起動指令を送信してスマート機器を起動させるように構成される。
上記実施例では、制御機器は、録音機能を有するスマート機器を先に特定し、そして録音機能を有するスマート機器のうち、起動すべきスマート機器を特定可能であるため、起動したスマート機器が録音できることを保証する。
図8に示すように、図8は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図7に示す実施例に加えて、当該第2の特定モジュール560が表示サブモジュール561と、第1の特定サブモジュール562とを備えてもよい。
ただし、表示サブモジュール561は、録音機能を有するスマート機器のリストを表示するように構成される。
第1の特定サブモジュール562は、前記表示サブモジュール561によって表示されたリストでのユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するように構成される。
上記実施例では、制御機器がユーザの選択に基づいて起動すべきスマート機器を特定可能であるため、ユーザの需要をより満足させ、ユーザ体験が向上する。
図9に示すように、図9は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図7に示す実施例に加えて、第2の特定モジュール560が測位サブモジュール563、検索サブモジュール564および第2の特定サブモジュール565を備えてもよい。
測位サブモジュール563は、測位技術に基づいてユーザの位置を特定するように構成される。
検索サブモジュール564は、予め記憶された各録音機能を有するスマート機器の位置を検索するように構成される。
第2の特定サブモジュール565は、測位サブモジュール563によって測位されたユーザの位置を含む所定範囲内である、録音機能を有するスマート機器を、起動すべきスマート機器として特定するように構成される。
上記実施例では、制御機器がユーザに対して測位を行い、ユーザの位置に基づいて起動すべきスマート機器を特定可能であるため、起動すべきスマート機器がユーザの位置に近いことを保証でき、よりはっきりした音声データの採集を保証し、後続の最適化音声データの認識度を向上させ、スマート機器に対する正確制御を保証する。
図10に示すように、図10は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図9に示す実施例に加えて、第2の特定モジュール560が読取サブモジュール566と第3の特定サブモジュール567とをさらに備えてもよい。
読取サブモジュール566は、第2の特定サブモジュール565によって特定されたスマート機器の数が所定閾値を超えた場合、所定範囲内である、録音機能を有するスマート機器の過去使用データを読み取るように構成される。
第3の特定サブモジュール567は、読取サブモジュール566によって読み取られた過去使用データに基づいて、起動すべきスマート機器を特定するように構成される。
ただし、読取サブモジュール566によって読み取られた過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含む。
上記実施例では、制御機器がさらにスマート機器の過去使用データを結合して起動すべきスマート機器を特定可能であり、過去使用データがスマート機器の性能をある程度反映できるため、録音された音声データの品質を保証できる。
図11に示すように、図11は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、処理モジュール520が処理サブモジュール521を備えてもよい。
処理サブモジュール521は、ビームフォーミング技術に基づいて、受信モジュール510によって受信された複数の音声データを処理して最適化音声データを取得するように構成される。
上記実施例では、制御機器がビームフォーミング技術に基づいて複数の音声データを処理可能であるため、さらに音声識別の成功率が向上する。
図12に示すように、図12は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、制御モジュール530が第1の送信サブモジュール531を備えてもよい。
第1の送信サブモジュール531は、赤外線リモコンが最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、赤外線エンコーダへ制御指令を送信するように、処理モジュール520で得られた最適化音声データを赤外線リモコンへ送信するように構成される。
上記実施例では、制御機器が最適化音声データを赤外線リモートコントロールセンターへ送信可能であるため、赤外線リモートコントロールセンターがスマート機器に対する正確な音声制御を達成する。
図13に示すように、図13は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、制御モジュール530が第2の送信サブモジュール532を備えてもよい。
第2の送信サブモジュール532は、サーバが最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、制御指令と最適化音声データにおける機器名とを赤外線リモコンへ送信し、且つ、赤外線リモコンが制御指令を機器名に対応する赤外線エンコーダへ送信するように、処理モジュールで得られた最適化音声データをサーバへ送信するように構成される。
上記実施例では、制御機器が最適化音声データをサーバへ送信することができる。こうして、サーバおよび赤外線リモートコントロールセンターがスマート機器に対する正確な音声制御を達成する。
上記図5〜図13に示すスマート機器の音声制御装置の実施例は、制御機器に応用可能である。
図14に示すように、図14は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該装置は、スマート機器に応用可能であり、当該装置は、採集モジュール610と、送信モジュール620とを備えてもよい。
採集モジュール610は、音声データを採集するように構成される。
送信モジュール620は、制御機器が音声データに基づいて音声データに対応するスマート機器を制御するように、採集モジュール610で採集された音声データを制御機器へ送信するように構成される。
上記実施例では、スマート機器が採集された音声データを制御機器へ送信することができる。こうして、制御機器が音声データ、および他の位置に存在する複数のスマート機器によって採集された音声データに基づいて音声データに対応するスマート機器を制御することができるため、スマート機器に対する正確な音声制御を図り、ユーザ体験が向上する。
図15に示すように、図15は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図14に示す実施例に加えて、当該装置が起動モジュール630をさらに備えてもよい。
起動モジュール630は、制御機器から送信された起動指令に基づいて起動させるように構成される。
上記図14〜15に示すスマート機器の音声制御装置の実施例は、音声データを採集するためのスマート機器に応用可能である。
上記装置における各手段の機能および作用の実現手順の詳細は、上記方法における対応するステップの実現手順を参照すればよいため、ここで繰り返し説明しない。
装置実施例が基本的に方法実施例に対応するため、関連箇所は、方法実施例部分の説明を参照すればよい。以上に記載の装置実施例は、単なる模式的である。その中の分離部品として説明された手段は、物理的に離間してもよいし、しなくてもよい。手段として表示された部品は、物理モジュールであってもよいし、でなくてもよい。即ち、1箇所に位置してもよいし、複数のネットワークセルに分散してもよい。実際の必要に応じて、その中の一部または全部のモジュールを選択して本開示の目的を達成してもよい。当業者は、進歩性に値する労動をせずに、理解し実施可能である。
それ相応に、本開示は、制御機器をさらに提供する。前記制御機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリとを備え、前記プロセッサは、
複数のスマート機器のそれぞれから返信された音声データを受信し、
複数の前記音声データを処理して、最適化音声データを取得し、
前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成される。
それ相応に、本開示は、さらにスマート機器を提供する。前記スマート機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリとを備え、前記プロセッサは、
音声データを採集し、
制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するように構成される。
図16に示すように、図16は、本開示の一実施例によるスマート機器の音声制御装置1600のための構造模式図(制御機器側)である。例えば、装置1600は、ルーティング機能を有する携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信機器、ゲームコンソール、タブレット機器、医療設備、フィットネス機器、PDA等であってもよい。
図16を参照すると、装置1600は、以下の1つ又は複数のユニット、すなわち、処理ユニット1602、メモリ1604、電源ユニット1606、マルチメディアユニット1608、オーディオユニット1610、入力/出力(I/O)インターフェース1612、センサユニット1614及び通信ユニット1616を備えてもよい。
処理ユニット1602は通常、装置1600の全般操作、例えば、表示、電話発呼、データ通信、カメラ操作及び記録操作に関連する操作を制御する。処理ユニット1602は、上記方法のステップの全部又は一部を実行するように、指令を実行する1つ又は複数のプロセッサ1620を備えてもよい。また、処理ユニット1602は、処理ユニット1602と他のユニットとの間の相互作用を容易にするように、1つ又は複数のモジュールを備えてもよい。例えば、処理ユニット1602は、マルチメディアユニット1608と処理ユニット1602との間の相互作用を容易にするように、マルチメディアモジュールを備えてもよい。
メモリ1604は、装置1600での操作をサポートするために、各種別のデータを記憶するように構成される。これらのデータの例示は、装置1600で操作する如何なるアプリケーションプログラムまたは方法の指令、連絡先データ、電話帳データ、メッセージ、ピクチャ、映像などを含む。メモリ1604は、如何なる種別の揮発性もしくは不揮発性記憶デバイスまたはそれらの組合せ、例えば、静的ランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラマブル読み出し専用メモリ(EEPROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM)、プログラマブル読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクによって実現されてもよい。
電源ユニット1606は、装置1600のユニットのそれぞれに電力を供給する。電源ユニット1606は、電源管理システム、1つまたは複数の電源、並びに、装置1600用の電力を生成、管理および配分するに関する他のユニットを含んでもよい。
マルチメディアユニット1608は、前記装置1600とユーザとの間に1つの出力インターフェースを供給するスクリーンを備える。一部の実施例では、スクリーンは、液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでも良い。スクリーンは、タッチパネルを含む場合、ユーザからの入力信号を受信するように、タッチスクリーンとして実現されてもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャーを感知するように、1つまたは複数のタッチセンサを含む。前記タッチセンサは、タッチまたはスライド動作の境界を感知するだけではなく、前記タッチまたはスライド操作と関連する持続時間および圧力をさらに検出することができる。一部の実施例では、マルチメディアユニット1608は、1つのフロントカメラおよび/またはバックカメラを含む。装置1600が操作モード、例えば、撮像モードまたは映像モードにあるとき、フロントカメラおよび/またはバックカメラは、外部のマルチメディアデータを受信することができる。フロントカメラおよびバックカメラのそれぞれは、1つの固定の光学レンズシステムであってもよいし、焦点距離および光学ズーム能力を有するものであってもよい。
オーディオユニット1610は、オーディオ信号を出力および/または入力するように構成される。例えば、オーディオユニット1610は、マイク(MIC)を備え、装置1600が操作モード、例えば、発呼モード、記録モードおよび音声識別モードにあるとき、マイクは、外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は、さらに、メモリ1604に記憶される、または、通信ユニット1616を介して送信されることができる。一部の実施例では、オーディオユニット1610は、さらに、オーディオ信号を出力するためのスピーカをさらに含む。
I/Oインターフェース1612は、処理ユニット1602とペリフェラルインターフェースモジュールとの間でインターフェースを供給するものであり、前記ペリフェラルインターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームページボタン、ボリュームボタン、起動ボタンおよびロックボタンを含んでも良いが、それらに限定されない。
センサユニット1614は、様々な側面での状態推定を装置1600に供給するための1つまたは複数のセンサを含む。例えば、センサユニット1614は、装置1600のオン/オフ状態、ユニットの相対位置を検出することができ、例えば、前記ユニットは、装置1600のディスプレイおよびキーパッドである。センサユニット1614は、さらに、装置1600もしくは装置1600の1つのユニットの位置変更、ユーザと装置1600との接触の存在もしくは不存在、装置1600の方位または加速/減速および装置1600の温度変化をさらに検出することができる。センサユニット1614は、如何なる物理的接触もないとき、近辺にある物体の存在を検出するための近接センサを含んでもよい。センサユニット1614は、さらに、イメージングアプリケーションに使用される光センサ、例えばCMOSまたはCCD画像センサを含んでも良い。一部の実施例では、当該センサユニット1614は、さらに、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ、微波センサまたは温度センサを含んでも良い。
通信ユニット1616は、装置1600と他の機器間の無線または有線方式の通信が便利になるように構成される。装置1600は、通信規格に基づく無線ネットワーク、例えば、WiFi、2Gもしくは3G、またはそれらの組合せにアクセスすることができる。ある実施例では、通信ユニット1616は、外部ブロードキャスト管理システムからのブロードキャスト信号またはブロードキャスト関連情報をブロードキャストチャネルを介して受信する。ある実施例では、前記通信ユニット1616は、さらに、短距離通信を容易にするように、ニアフィールド通信(NFC)モジュールを含んでも良い。例えば、NFCモジュールでは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術および他の技術によって実現されてもよい。
実施例では、装置1600は、上記方法を実行するための1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子部品によって実現されてもよい。
実施例では、指令を含む非一時的コンピュータ読み取り可能な記憶媒体、例えば、指令を含むメモリ1604をさらに提供し、上記指令が装置1600のプロセッサ1620によって実行されることで上述した方法を実施させることができる。例えば、前記非一時的コンピュータ読み取り可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスクおよび光データ記憶機器などであっても良い。
図17に示すように、図17は、本開示の一実施例によるスマート機器の音声制御装置1700のための構造模式図(スマート機器側)である。例えば、装置1700は、ルーティング機能を有する携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信機器、ゲームコンソール、タブレット機器、医療設備、フィットネス機器、PDA等であってもよい。
図17を参照すると、装置1700は、以下の1つ又は複数のユニット、すなわち、処理ユニット1702、メモリ1704、電源ユニット1706、マルチメディアユニット1708、オーディオユニット1710、入力/出力(I/O)インターフェース1712、センサユニット1714及び通信ユニット1716を備えてもよい。
処理ユニット1702は通常、装置1700の全般操作、例えば、表示、電話発呼、データ通信、カメラ操作及び記録操作に関連する操作を制御する。処理ユニット1702は、上記方法のステップの全部又は一部を実行するように、指令を実行する1つ又は複数のプロセッサ1720を備えてもよい。また、処理ユニット1702は、処理ユニット1702と他のユニットとの間の相互作用を容易にするように、1つ又は複数のモジュールを備えてもよい。例えば、処理ユニット1702は、マルチメディアユニット1708と処理ユニット1702との間の相互作用を容易にするように、マルチメディアモジュールを備えてもよい。
メモリ1704は、装置1700での操作をサポートするために、各種別のデータを記憶するように構成される。これらのデータの例示は、装置1700で操作する如何なるアプリケーションプログラムまたは方法の指令、連絡先データ、電話帳データ、メッセージ、ピクチャ、映像などを含む。メモリ1704は、如何なる種別の揮発性もしくは不揮発性記憶デバイスまたはそれらの組合せ、例えば、静的ランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラマブル読み出し専用メモリ(EEPROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM)、プログラマブル読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクによって実現されてもよい。
電源ユニット1706は、装置1700のユニットのそれぞれに電力を供給する。電源ユニット1706は、電源管理システム、1つまたは複数の電源、並びに、装置1700用の電力を生成、管理および配分するに関する他のユニットを含んでもよい。
マルチメディアユニット1708は、前記装置1700とユーザとの間に1つの出力インターフェースを供給するスクリーンを備える。一部の実施例では、スクリーンは、液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでも良い。スクリーンは、タッチパネルを含む場合、ユーザからの入力信号を受信するように、タッチスクリーンとして実現されてもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャーを感知するように、1つまたは複数のタッチセンサを含む。前記タッチセンサは、タッチまたはスライド動作の境界を感知するだけではなく、前記タッチまたはスライド操作と関連する持続時間および圧力をさらに検出することができる。一部の実施例では、マルチメディアユニット1708は、1つのフロントカメラおよび/またはバックカメラを含む。装置1700が操作モード、例えば、撮像モードまたは映像モードにあるとき、フロントカメラおよび/またはバックカメラは、外部のマルチメディアデータを受信することができる。フロントカメラおよびバックカメラのそれぞれは、1つの固定の光学レンズシステムであってもよいし、焦点距離および光学ズーム能力を有するものであってもよい。
オーディオユニット1710は、オーディオ信号を出力および/または入力するように構成される。例えば、オーディオユニット1710は、マイク(MIC)を備え、装置1700が操作モード、例えば、発呼モード、記録モードおよび音声識別モードにあるとき、マイクは、外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は、さらに、メモリ1704に記憶される、または、通信ユニット1716を介して送信されることができる。一部の実施例では、オーディオユニット1710は、さらに、オーディオ信号を出力するためのスピーカをさらに含む。
I/Oインターフェース1712は、処理ユニット1702とペリフェラルインターフェースモジュールとの間でインターフェースを供給するものであり、前記ペリフェラルインターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームページボタン、ボリュームボタン、起動ボタンおよびロックボタンを含んでも良いが、それらに限定されない。
センサユニット1714は、様々な側面での状態推定を装置1700に供給するための1つまたは複数のセンサを含む。例えば、センサユニット1714は、装置1700のオン/オフ状態、ユニットの相対位置を検出することができ、例えば、前記ユニットは、装置1700のディスプレイおよびキーパッドである。センサユニット1714は、さらに、装置1700もしくは装置1700の1つのユニットの位置変更、ユーザと装置1700との接触の存在もしくは不存在、装置1700の方位または加速/減速および装置1700の温度変化をさらに検出することができる。センサユニット1714は、如何なる物理的接触もないとき、近辺にある物体の存在を検出するための近接センサを含んでもよい。センサユニット1714は、さらに、イメージングアプリケーションに使用される光センサ、例えばCMOSまたはCCD画像センサを含んでも良い。一部の実施例では、当該センサユニット1714は、さらに、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ、微波センサまたは温度センサを含んでも良い。
通信ユニット1716は、装置1700と他の機器間の無線または有線方式の通信が便利になるように構成される。装置1700は、通信規格に基づく無線ネットワーク、例えば、WiFi、2Gもしくは3G、またはそれらの組合せにアクセスすることができる。ある実施例では、通信ユニット1716は、外部ブロードキャスト管理システムからのブロードキャスト信号またはブロードキャスト関連情報をブロードキャストチャネルを介して受信する。ある実施例では、前記通信ユニット1716は、さらに、短距離通信を容易にするように、ニアフィールド通信(NFC)モジュールを含んでも良い。例えば、NFCモジュールでは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術および他の技術によって実現されてもよい。
実施例では、装置1700は、上記方法を実行するための1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子部品によって実現されてもよい。
実施例では、指令を含む非一時的コンピュータ読み取り可能な記憶媒体、例えば、指令を含むメモリ1704をさらに提供し、上記指令が装置1700のプロセッサ1720によって実行されることで上述した方法を実施させることができる。例えば、前記非一時的コンピュータ読み取り可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスクおよび光データ記憶機器などであっても良い。
当業者は、明細書を考慮し、ここに公開された開示を実践した後、本開示の他の実施案を容易に想到する。本願は、本開示の如何なる変形、用途または適応的変化もカバーすることを意図する。これらの変形、用途または適応的変化は、本開示の一般的な仕組みに従い、かつ、本開示に開示されていない当分野における公知常識または慣用技術手段を含む。明細書および実施例は単なる例示と見なされ、本開示の本当の範囲および思想は添付の特許請求の範囲によって与えられる。
以上で記載されたのが単なる本開示の好適な実施例に過ぎず、本開示を限定するものではない。本開示の精神および要旨を逸脱しない範囲でなされた如何なる補正、均等物との置換、改良なども、本開示の保護範囲内に含まれる。
相互参照
本発明は、出願番号が201510712870.6であり、出願日が2015年10月28日である中国特許出願を基に提出するものであり、当該中国特許出願の優先権を主張し、当該中国特許出願の全ての内容は、参照のため本願に援用される。
本開示は、スマートホーム技術分野に関し、特にスマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器に関する。
現在の音声識別技術では、性能が一番良好な処理チップを採用して全指向性マイクロホンと協調し、理想的な状況において3メートルの識別距離に達することができる。通常は、大型会議室で会議室の異なる位置に複数のマイクロホンを設置し、各マイクロホンから収集されたサウンドを処理することで、良好な音声識別効果を実現させる。
関連技術では、家庭環境における音声識別について、上記効果を実現させるために、家具および電器のレイアウトに応じて、異なる位置で複数のマイクロホンを設置する必要があるため、コストが高い。
関連技術に存在する問題を克服するために、本開示は、スマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器を提供する。
本開示の実施例の第1の態様によれば、スマート機器の音声制御方法を提供する。当該方法は、
複数のスマート機器のそれぞれから返信された音声データを受信するステップと、
複数の前記音声データを処理して、最適化音声データを取得するステップと、
前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップと、を含む。
好ましくは、前記複数のスマート機器のそれぞれから返信された音声データを受信するステップは、
異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するステップを含む。
好ましくは、前記異なる位置に存在する複数のスマート機器から返信された音声データを受信するステップの前に、前記方法は、さらに、
アプリケーションにバインディングされたスマート機器の基本情報を読み取るステップと、
前記基本情報に基づいて録音機能を有するスマート機器を特定するステップと、
録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップと、
特定された起動すべきスマート機器へ起動指令を送信して当該スマート機器を起動させるステップと、を含む。
好ましくは、前記録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップは、
録音機能を有するスマート機器のリストを表示するステップと、
前記リストに対するユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するステップと、を含む。
好ましくは、前記録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップは、
測位技術に基づいてユーザの位置を特定するステップと、
予め記憶された、前記録音機能を有するスマート機器のそれぞれの位置を検索するステップと、
前記ユーザの位置を含む所定範囲内に存在する録音機能を有するスマート機器を、起動すべきスマート機器として特定するステップと、を含む。
好ましくは、前記方法は、さらに、
前記所定範囲内に存在する録音機能を有するスマート機器の数が所定閾値を超えた場合、前記所定範囲内に存在する録音機能を有するスマート機器の過去使用データを読み取るステップと、
前記過去使用データに基づいて、起動すべきスマート機器を特定するステップと、を含む。
好ましくは、前記過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含む。
好ましくは、前記複数の前記音声データを処理して、最適化音声データを取得するステップは、
ビームフォーミング技術に基づいて、複数の前記音声データを処理して最適化音声データを取得するステップを含む。
好ましくは、前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップは、
赤外線リモコンが、前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、且つ、前記制御指令を前記赤外線エンコーダへ送信するように、前記最適化音声データを前記赤外線リモコンへ送信するステップを含む。
好ましくは、前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップは、
サーバが、前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記制御指令と前記最適化音声データにおける機器名とを赤外線リモコンへ送信して、且つ、前記赤外線リモコンが前記制御指令を前記機器名に対応する赤外線エンコーダへ送信するように、前記最適化音声データを前記サーバへ送信するステップを含む。
本開示の実施例の第2の態様によれば、スマート機器の音声制御方法を提供する。当該方法は、
音声データを採集するステップと、
制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するステップと、を含む。
好ましくは、前記音声データを採集する前に、前記方法は、
前記制御機器から送信された起動指令に応じて起動させるステップを含む。
本開示の実施例の第3の態様によれば、スマート機器の音声制御装置を提供する。当該装置は、受信モジュールと、処理モジュールと、制御モジュールと、を備え、
前記受信モジュールは、複数のスマート機器のそれぞれから返信された音声データを受信するように構成され、
前記処理モジュールは、前記受信モジュールによって受信された複数の前記音声データを処理し、最適化音声データを取得するように構成され、
前記制御モジュールは、前記処理モジュールによって取得された前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成される。
好ましくは、前記受信モジュールは、受信サブモジュールを備え、
前記受信サブモジュールは、異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するように構成される。
好ましくは、前記装置は、読取モジュールと、第1の特定モジュールと、第2の特定モジュールと、起動モジュールと、をさらに備え、
前記読取モジュールは、アプリケーションにバインディングされたスマート機器の基本情報を読み取るように構成され、
前記第1の特定モジュールは、前記読取モジュールによって読み取られた基本情報に基づいて録音機能を有するスマート機器を特定するように構成され、
前記第2の特定モジュールは、前記第1の特定モジュールによって特定された録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するように構成され、
前記起動モジュールは、前記第2の特定モジュールによって特定された起動すべきスマート機器へ起動指令を送信して前記スマート機器を起動させるように構成される。
好ましくは、前記第2の特定モジュールは、表示サブモジュールと、第1の特定サブモジュールと、を備え、
前記表示サブモジュールは、録音機能を有するスマート機器のリストを表示するように構成され、
前記第1の特定サブモジュールは、前記表示サブモジュールによって表示されたリストに対するユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するように構成される。
好ましくは、前記第2の特定モジュールは、測位サブモジュールと、検索サブモジュールと、第2の特定サブモジュールと、を備え、
前記測位サブモジュールは、測位技術に基づいてユーザの位置を特定するように構成され、
前記検索サブモジュールは、予め記憶された、前記録音機能を有するスマート機器のそれぞれの位置を検索するように構成され、
前記第2の特定サブモジュールは、前記測位サブモジュールによって測位されたユーザの位置を含む所定範囲内に存在する、録音機能を有するスマート機器を、起動すべきスマート機器として特定するように構成される。
好ましくは、前記第2の特定モジュールは、読取サブモジュールと、第3の特定サブモジュールと、をさらに備え、
前記読取サブモジュールは、前記第2の特定サブモジュールによって特定された前記スマート機器の数が所定閾値を超えた場合、前記所定範囲内に存在する録音機能を有するスマート機器の過去使用データを読み取るように構成され、
前記第3の特定サブモジュールは、前記読取サブモジュールによって読み取られた過去使用データに基づいて、起動すべきスマート機器を特定するように構成される。
好ましくは、前記読取サブモジュールによって読み取られた前記過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含む。
好ましくは、前記処理モジュールは、処理サブモジュールを備え、
前記処理サブモジュールは、ビームフォーミング技術に基づいて、前記受信モジュールによって受信された複数の前記音声データを処理して最適化音声データを取得するように構成される。
好ましくは、前記制御モジュールは、第1の送信サブモジュールを備え、
前記第1の送信サブモジュールは、赤外線リモコンが前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、且つ、前記制御指令を前記赤外線エンコーダへ送信するように、前記処理モジュールによって取得された前記最適化音声データを前記赤外線リモコンへ送信するように構成される。
好ましくは、前記制御モジュールは、第2の送信サブモジュールを備え、
前記第2の送信サブモジュールは、サーバが前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記制御指令と前記最適化音声データにおける機器名とを赤外線リモコンへ送信して、且つ、前記赤外線リモコンが前記制御指令を前記機器名に対応する赤外線エンコーダへ送信するように、前記処理モジュールによって取得された最適化音声データを前記サーバへ送信するように構成される。
本開示の実施例の第4の態様によれば、スマート機器の音声制御装置を提供する。当該装置は、採集モジュールと、送信モジュールと、を備え、
前記採集モジュールは、音声データを採集するように構成され、
前記送信モジュールは、制御機器が音声データに基づいて前記音声データに対応するスマート機器を制御するように、前記採集モジュールによって採集された前記音声データを前記制御機器へ送信するように構成される。
好ましくは、前記装置は、起動モジュールをさらに備え、
前記起動モジュールは、前記制御機器から送信された起動指令に応じて起動させるように構成される。
本開示の実施例の第5の態様によれば、制御機器を提供する。当該制御機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリと、を備え、前記プロセッサは、
複数のスマート機器のそれぞれから返信された音声データを受信し、
複数の前記音声データを処理して、最適化音声データを取得し、
前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成される。
本開示の実施例の第6の態様によれば、スマート機器を提供する。当該スマート機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリと、を備え、前記プロセッサは、
音声データを採集し、
制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するように構成される。
本開示の実施例の第7の態様によれば、プロセッサに実行されることにより、本開示の実施例の第1または第2の態様に記載の音声制御方法を実現するプログラムを提供する。
本開示の実施例の第8の態様によれば、本開示の実施例の第7の態様に記載のプログラムが記録された記録媒体を提供する。
本開示の実施例による技術案は、以下の格別な作用効果を含むことができる。
本開示では、制御機器が異なる位置からの音声データを処理することで最適化音声データを取得し、当該最適化音声データに基づいて当該最適化音声データに対応するスマート機器を制御可能であるため、スマート機器に対する音声制御を図り、スマート機器に対するユーザの制御へ利便性を与え、ユーザ体験が向上する。
本開示では、制御機器が複数の位置に存在するスマート機器によって採集された音声データを受信し、異なる位置からの音声データを処理して最適化音声データを取得可能であるため、最適化音声データの品質を保証し、音声識別の正確度を保証して、スマート機器に対する音声制御を実現させる。
本開示では、制御機器が録音機能を有するスマート機器を先に特定し、そして録音機能を有するスマート機器のうち、起動すべきスマート機器を特定可能であるため、起動したスマート機器が録音できることを保証する。
本開示では、制御機器がユーザの選択に基づいて起動すべきスマート機器を特定可能であるため、ユーザの需要をより満足させ、ユーザ体験が向上する。
本開示では、制御機器がユーザに対して測位を行い、ユーザの位置に基づいて起動すべきスマート機器を特定可能であるため、起動すべきスマート機器がユーザの位置に近いことを保証でき、よりはっきりした音声データの採集を保証し、後続の最適化音声データの認識度を向上させ、スマート機器に対する正確制御を保証する。
本開示では、制御機器がさらにスマート機器の過去使用データを結合して起動すべきスマート機器を特定可能である。過去使用データがスマート機器の性能をある程度反映できるため、録音された音声データの品質を保証できる。
本開示では、制御機器が最適化音声データを赤外線リモートコントロールセンターへ送信可能である。赤外線リモートコントロールセンターがスマート機器に対する正確な音声制御を達成する。
本開示では、スマート機器は、採集された音声データを制御機器へ送信可能である。こうして、制御機器が音声データと他の位置に存在する複数のスマート機器によって採集された音声データとに基づいて音声データに対応するスマート機器を制御できるため、スマート機器に対する正確な音声制御を図り、ユーザ体験が向上する。
上述した一般的な記述および後続の詳細な記述は、単に例示的および解釈的なものであり、本発明を制限できるものでないと理解されるべきである。
ここでの図面は、明細書を構成する一部として見なされ、本開示に適した実施例を示し、かつ、明細書の文字記載とともに本開示の仕組みを解釈するために用いられる。
本開示の一実施例によるスマート機器の音声制御方法を示すフローチャートである。 本開示の一実施例による別のスマート機器の音声制御方法を示すフローチャートである。 本開示の一実施例による別のスマート機器の音声制御方法を示すフローチャートである。 本開示の一実施例によるスマート機器の音声制御応用場面を示す模式図である。 本開示の一実施例によるスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。 本開示の一実施例によるスマート機器の音声制御装置のための構造模式図である。 本開示の一実施例によるスマート機器の音声制御装置のための構造模式図である。
次に、実施例を詳細に説明し、例示が図に示されている。以下の記述が図に係る場合、別途にて示さない限り、異なる図面における同じ符号は、同じまたは類似する要素を示す。以下の実施例に記述される実施形態は、本発明と一致する全ての実施形態を代表するとは限らない。逆に、それらは、添付の特許請求の範囲に記載されているように、本発明の一部の側面と一致する装置および方法の例に過ぎない。
本開示で使用される用語は、単に特定の実施例を記述するためのものに過ぎず、本発明を限定するものではない。本開示及び添付する特許請求の範囲で使用される単数形である「1種」、「前記」、及び「当該」も、他の意味を表すと明らかに記載しない限り、複数形を含む。さらに、この文章で使用される用語「および/または」とは、1つまたは複数の関連列挙項目の任意または全ての可能な組合せを含むことを言う、と理解されるべきである。
本開示では、用語である第1、第2、第3などを用いて各種情報を記述する可能性があるが、これらの情報はこれらの用語に限定されない、と理解されるべきである。これらの用語は、単に同一種類の情報を互いに区別ためのものに過ぎない。例えば、本発明の範囲を逸脱しない場合、第1の情報は第2の情報と称されても良く、類似的に、第2の情報は第1の情報と称されても良い。言語環境によって、例えば、ここで使用される言葉「若し」は、「…とき」や「…場合」または「…に応答して特定する」と解釈されても良い。
図1に示すように、図1は、一実施例によるスマート機器の音声制御方法を示すフローチャートである。当該方法は、端末等の制御機器に応用可能であり、以下のステップを含む。
ステップ101では、複数のスマート機器のそれぞれから返信された音声データを受信する。
本開示での端末は、インターネット機能を有する如何なるスマート端末であってもよい。例えば、具体的に、携帯電話、タブレットPC、PDA(PersonalDigital Assistant、個人情報端末)等であってもよい。ただし、端末は、無線LANを介してルータにアクセスし、ルータを介してパブリックネットワーク上のサーバへアクセスすることができる。本開示での端末は、App(Application、アプリケーションプログラム)、例えばインテリジェントファミリーAppにより、音声データを受信してもよい。
本開示でのスマート機器は、スマート家電、ウェアラブル機器等を含む。スマート機器は、いずれも、家に設置されたルータを介して端末や制御センターと通信するための通信モジュール、例えばwifi(WirelessFidelity、無線忠実度)モジュールを有する。ただし、制御センターは、各スマート機器を制御するための赤外線リモートコントロールセンターであってもよい。
ステップ102では、複数の音声データを処理して最適化音声データを取得する。
本開示のステップでは、ビームフォーミング技術を採用して複数の音声データを処理して最適化音声データを取得する。
ステップ103では、最適化音声データに基づいて音声データに対応するスマート機器を制御する。
上記実施例では、制御機器が異なる位置からの音声データを処理し、最適化音声データを取得し、当該最適化音声データに基づいて当該最適化音声データに対応するスマート機器を制御することで、スマート機器に対する音声制御を図り、最適化音声データが異なる位置からの音声データを処理して得られたものであるため、最適化音声データの品質を保証し、音声識別の正確度を保証して、スマート機器に対する音声制御を実現させる。
図2に示すように、図2は、一実施例による別のスマート機器の音声制御方法を示すフローチャートである。当該方法は、端末等の制御機器に応用可能であり、以下のステップを含む。
ステップ201では、アプリケーションにバインディングされたスマート機器の基本情報を読み取る。
ステップ202では、基本情報に基づいて録音機能を有するスマート機器を特定する。
本開示の実施例では、端末は、インテリジェントファミリーAppにより、音声データを受信してスマート機器を制御することができる。インテリジェントファミリーAppに複数のスマート機器が関連付けられ、各スマート機器の基本情報も記憶されている。端末は、基本情報を読み取ることで、どのスマート機器が録音機能を有するかを特定できる。
ステップ203では、録音機能を有するスマート機器のうち、起動すべきスマート機器を特定する。
本開示の実施例では、起動すべきスマート機器、即ち音声データを採集するスマート機器を端末が特定するする必要がある。
ある開示形態では、端末のインテリジェントファミリーAppは、バインディングされたスマート機器のうち録音機能を有する全てのスマート機器をユーザ選択に供されるために表示してもよい。ユーザは、その中の一部または全部を起動すべきスマート機器として選択してもよい。それから、端末は、ユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定する。
別の開示形態では、端末は、起動リストに追加すべきスマート機器を特定する。端末は、測位技術に基づいてユーザの位置を特定してから、予め記憶された各録音機能を有するスマート機器の位置を検索し、そして端末は、ユーザの位置を含む所定範囲内に位置する、録音機能を有するスマート機器を、起動すべきスマート機器として特定してもよい。
例えば、端末は、ユーザが応接間にいると測位できると、所定範囲に基づいて、ユーザの位置を中心に半径2メートルの円の範囲で、当該範囲内である録音機能を有するスマート機器を起動すべきスマート機器として特定する。
または、端末のAppには、各スマート機器の置き位置が記憶されている。例えば、機器1〜4が応接間に置かれ、機器5と6が主寝室に置かれ、機器7と8がゲストの寝室に置かれる。端末は、ユーザが応接間にいると特定すると、機器1〜4を起動すべきスマート機器として特定する。
そして、本開示の実施例の方式では、特定された所定範囲内に位置する録音機能を有するスマート機器の数が所定閾値(例えば、6)を超えた場合、所定範囲内に位置する録音機能を有するスマート機器の過去使用データを読み取ってから、過去使用データに基づいて、起動すべきスマート機器を特定する。当該過去使用データは、使用頻度、最近一回の使用時間、総使用時間のうちの1つまたは複数を含んでもよい。例えば、端末は、使用頻度に基づいてスマート機器を順番付け、使用頻度が最高となる4つのスマート機器を起動すべきスマート機器として特定してもよい。
ステップ204では、特定された起動すべきスマート機器へ起動指令を送信してスマート機器を起動させる。
本開示のステップでは、スマート機器を起動させたことは、当該スマート機器の録音機能を起動させたと理解してもよい。端末は、インテリジェントファミリーAppにより、起動すべきスマート機器を起動させてもよい。
ステップ205では、異なる位置の複数のスマート機器によって採集された音声データを受信する。
ステップ206では、ビームフォーミング技術に基づいて、複数の音声データを処理して最適化音声データを取得する。
本開示のステップでは、具体的な処理は、エコー消去、信号処理および強化処理等を含んでもよい。
ステップ207では、赤外線リモコンが最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、赤外線エンコーダへ制御指令を送信するように、最適化音声データを赤外線リモコンへ送信する。
本開示の実施例では、赤外線リモコンが最適化音声データにおける音声情報、例えば「起動テレビ」を抽出し、予め記憶されたデータから対応する制御指令を検索してもよい。また、最適化音声データには、さらに、機器名、例えば「テレビ」が含まれている。赤外線リモコンは、対応する赤外線エンコーダを検索し、制御指令を当該赤外線エンコーダへ送信可能であるため、スマート機器に対する音声制御を図る。
別の開示形態では、端末は、サーバが当該最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、制御指令と最適化音声データにおける機器名とを赤外線リモコンへ送信し、且つ、赤外線リモコンが制御指令を機器名に対応する赤外線エンコーダへ送信するように、当該最適化音声データをサーバへ送信してもよい。
上記実施例では、端末は、複数の方式で起動すべきスマート機器を特定してもよい。例えば、ユーザによって選択されたスマート機器をスマート機器として特定する。こうして、録音の満足度を向上させ、ユーザ体験を最適化する。
端末は、さらに、ユーザの位置を測位して起動すべきスマート機器を特定してもよい。こうして、ユーザに一番近いスマート機器を特定可能であり、録音の効果を向上させ、最適化音声データの品質および識別度を保証する。
図3に示すように、図3は、一実施例による別のスマート機器の音声制御方法を示すフローチャートである。当該方法は、端末等の制御機器に応用可能であり、以下のステップを含む。
ステップ301では、音声データを採集する。
本開示の実施例では、異なる位置に存在する録音機能を有する複数のスマート機器のそれぞれが異なる位置における音声データを採集する。スマート機器は、制御機器から送信された起動指令に基づいて起動することができる。
ステップ302では、制御機器が音声データと他の位置に存在する複数のスマート機器によって採集された音声データとに基づいて、音声データに対応するスマート機器を制御するように、当該音声データを制御機器へ送信する。
図1、2に示す実施例に合わせて、ある開示形態では、スマート機器は、音声データを制御機器、例えば端末へ送信してもよい。端末は、音声データに対してビームフォーミング処理を行って最適化音声データを取得し、最適化音声データを赤外線リモートコントロールセンターへ送信する。赤外線リモートコントロールセンターに赤外線エンコーダライブラリが記憶され、赤外線エンコーダライブラリに各スマート機器の名称および対応する赤外線エンコーダが記憶され、さらに音声情報および対応する制御指令が記憶されている。赤外線リモートコントロールセンターは、最適化音声データにおける音声情報を抽出して機器名を取得し、赤外線エンコーダライブラリで検索して機器名に対応する赤外線エンコーダを取得し、音声情報に基づいて対応する制御指令を検索し、当該制御指令をスマート機器の赤外線エンコーダへ送信することで、当該スマート機器に対する音声制御を達成する。
別の開示形態では、スマート機器が最適化音声データを端末へ送信した後、端末は、最適化音声データをサーバへ送信してもよい。サーバには、音声情報および対応する制御指令が記憶されている。サーバは、最適化音声データに基づいて音声情報を抽出し、検索により対応する制御指令を取得し、制御指令および機器名を赤外線リモコンへ送信する。リモコンは、機器名に基づいて対応する赤外線エンコーダを検索し、制御指令を対応する赤外線エンコーダへ送信することで、スマート機器に対する音声制御を達成する。
上記実施例では、端末が音声データを処理して最適化音声データを取得し、当該最適化音声データに基づいてスマート機器を制御するように、スマート機器は、採集された当該音声データを端末へ送信可能であるため、最適化音声データの品質および識別度が向上し、ユーザ体験が向上する。
図4に示すように、図4は、本開示の一実施例によるスマート機器の音声制御応用場面を示す模式図である。図4に示す場面では、制御機器であるスマートフォン、録音のためのスマート機器1、スマート機器2およびスマート機器3、並びに、制御の対象であるテレビを含み、スマートフォンには、インテリジェントファミリーAppがインストールされ、スマートフォンは、インテリジェントファミリーAppにより、バインディングされた各スマート機器を制御する。
スマートフォンは、測位技術に基づいてユーザの位置を特定し、予め記憶された各録音機能を有するスマート機器の位置を検索し、ユーザの位置を含む所定範囲(図4に示す円形範囲)内である、録音機能を有するスマート機器1、スマート機器2およびスマート機器3を、起動すべきスマート機器として特定し、そして起動すべき機器を起動させて録音を開始させ、異なる位置に存在するスマート機器1、スマート機器2およびスマート機器3で採集された音声データを受信し、受信した音声データに対してビームフォーミング処理を行って、最適化音声データ「起動テレビ」を取得する。スマートフォンは、赤外線リモートコントロールセンターが最適化音声データにおける機器名「テレビ」に基づいて、対応する赤外線エンコーダを検索し、最適化音声データに基づいて制御指令を検索し、制御指令を赤外線エンコーダへ送信してテレビに対する制御を実現させるように、当該最適化音声データを赤外線リモートコントロールセンターへ送信する。
図4に示す応用場面では、スマート機器の音声制御を実施する具体的な手順が上記図1〜3に対する記述を参照すればよいため、ここで繰り返し説明しない。
上記スマート機器の音声制御方法の実施例に対応し、本開示は、スマート機器の音声制御装置、並びに、それが適用する制御機器およびスマート機器の実施例をさらに提供する。
図5に示すように、図5は、本開示の一実施例によるスマート機器の音声制御装置を示すブロック図である。当該装置が受信モジュール510、処理モジュール520および制御モジュール530を備えてもよい。
ただし、受信モジュール510は、複数のスマート機器のそれぞれから返信された音声データを受信するように構成される。
処理モジュール520は、受信モジュール510によって受信された複数の音声データを処理して最適化音声データを取得するように構成される。
制御モジュール530は、処理モジュール520によって取得された最適化音声データに基づいて、音声データに対応するスマート機器を制御するように構成される。
上記実施例では、制御機器が異なる位置からの音声データを処理し、最適化音声データを取得し、当該最適化音声データに基づいて当該最適化音声データに対応するスマート機器を制御することで、スマート機器に対する音声制御を図り、スマート機器に対するユーザの制御へ利便性を与え、ユーザ体験が向上する。
図6に示すように、図6は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、受信モジュール510が受信サブモジュール511を備えてもよい。
受信サブモジュール511は、異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するように構成される。
上記実施例では、制御機器が複数の位置に存在するスマート機器によって採集された音声データを受信し、異なる位置からの音声データを処理して最適化音声データを取得可能であるため、最適化音声データの品質を保証し、音声識別の正確度を保証して、スマート機器に対する音声制御を実現させる。
図7に示すように、図7は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、当該装置が読取モジュール540、第1の特定モジュール550、第2の特定モジュール560および起動モジュール570をさらに備えてもよい。
読取モジュール540は、アプリケーションにバインディングされたスマート機器の基本情報を読み取るように構成される。
第1の特定モジュール550は、読取モジュール540によって読み取られた基本情報に基づいて、録音機能を有するスマート機器を特定するように構成される。
第2の特定モジュール560は、第1の特定モジュール550によって特定された録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するように構成される。
起動モジュール570は、第2の特定モジュール560によって特定された起動すべきスマート機器へ起動指令を送信してスマート機器を起動させるように構成される。
上記実施例では、制御機器は、録音機能を有するスマート機器を先に特定し、そして録音機能を有するスマート機器のうち、起動すべきスマート機器を特定可能であるため、起動したスマート機器が録音できることを保証する。
図8に示すように、図8は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図7に示す実施例に加えて、当該第2の特定モジュール560が表示サブモジュール561と、第1の特定サブモジュール562とを備えてもよい。
ただし、表示サブモジュール561は、録音機能を有するスマート機器のリストを表示するように構成される。
第1の特定サブモジュール562は、前記表示サブモジュール561によって表示されたリストでのユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するように構成される。
上記実施例では、制御機器がユーザの選択に基づいて起動すべきスマート機器を特定可能であるため、ユーザの需要をより満足させ、ユーザ体験が向上する。
図9に示すように、図9は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図7に示す実施例に加えて、第2の特定モジュール560が測位サブモジュール563、検索サブモジュール564および第2の特定サブモジュール565を備えてもよい。
測位サブモジュール563は、測位技術に基づいてユーザの位置を特定するように構成される。
検索サブモジュール564は、予め記憶された各録音機能を有するスマート機器の位置を検索するように構成される。
第2の特定サブモジュール565は、測位サブモジュール563によって測位されたユーザの位置を含む所定範囲内である、録音機能を有するスマート機器を、起動すべきスマート機器として特定するように構成される。
上記実施例では、制御機器がユーザに対して測位を行い、ユーザの位置に基づいて起動すべきスマート機器を特定可能であるため、起動すべきスマート機器がユーザの位置に近いことを保証でき、よりはっきりした音声データの採集を保証し、後続の最適化音声データの認識度を向上させ、スマート機器に対する正確制御を保証する。
図10に示すように、図10は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図9に示す実施例に加えて、第2の特定モジュール560が読取サブモジュール566と第3の特定サブモジュール567とをさらに備えてもよい。
読取サブモジュール566は、第2の特定サブモジュール565によって特定されたスマート機器の数が所定閾値を超えた場合、所定範囲内である、録音機能を有するスマート機器の過去使用データを読み取るように構成される。
第3の特定サブモジュール567は、読取サブモジュール566によって読み取られた過去使用データに基づいて、起動すべきスマート機器を特定するように構成される。
ただし、読取サブモジュール566によって読み取られた過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含む。
上記実施例では、制御機器がさらにスマート機器の過去使用データを結合して起動すべきスマート機器を特定可能であり、過去使用データがスマート機器の性能をある程度反映できるため、録音された音声データの品質を保証できる。
図11に示すように、図11は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、処理モジュール520が処理サブモジュール521を備えてもよい。
処理サブモジュール521は、ビームフォーミング技術に基づいて、受信モジュール510によって受信された複数の音声データを処理して最適化音声データを取得するように構成される。
上記実施例では、制御機器がビームフォーミング技術に基づいて複数の音声データを処理可能であるため、さらに音声識別の成功率が向上する。
図12に示すように、図12は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、制御モジュール530が第1の送信サブモジュール531を備えてもよい。
第1の送信サブモジュール531は、赤外線リモコンが最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、赤外線エンコーダへ制御指令を送信するように、処理モジュール520で得られた最適化音声データを赤外線リモコンへ送信するように構成される。
上記実施例では、制御機器が最適化音声データを赤外線リモートコントロールセンターへ送信可能であるため、赤外線リモートコントロールセンターがスマート機器に対する正確な音声制御を達成する。
図13に示すように、図13は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図5に示す実施例に加えて、制御モジュール530が第2の送信サブモジュール532を備えてもよい。
第2の送信サブモジュール532は、サーバが最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、制御指令と最適化音声データにおける機器名とを赤外線リモコンへ送信し、且つ、赤外線リモコンが制御指令を機器名に対応する赤外線エンコーダへ送信するように、処理モジュールで得られた最適化音声データをサーバへ送信するように構成される。
上記実施例では、制御機器が最適化音声データをサーバへ送信することができる。こうして、サーバおよび赤外線リモートコントロールセンターがスマート機器に対する正確な音声制御を達成する。
上記図5〜図13に示すスマート機器の音声制御装置の実施例は、制御機器に応用可能である。
図14に示すように、図14は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該装置は、スマート機器に応用可能であり、当該装置は、採集モジュール610と、送信モジュール620とを備えてもよい。
採集モジュール610は、音声データを採集するように構成される。
送信モジュール620は、制御機器が音声データに基づいて音声データに対応するスマート機器を制御するように、採集モジュール610で採集された音声データを制御機器へ送信するように構成される。
上記実施例では、スマート機器が採集された音声データを制御機器へ送信することができる。こうして、制御機器が音声データ、および他の位置に存在する複数のスマート機器によって採集された音声データに基づいて音声データに対応するスマート機器を制御することができるため、スマート機器に対する正確な音声制御を図り、ユーザ体験が向上する。
図15に示すように、図15は、本開示の一実施例による別のスマート機器の音声制御装置を示すブロック図である。当該実施例は、上記図14に示す実施例に加えて、当該装置が起動モジュール630をさらに備えてもよい。
起動モジュール630は、制御機器から送信された起動指令に基づいて起動させるように構成される。
上記図14〜15に示すスマート機器の音声制御装置の実施例は、音声データを採集するためのスマート機器に応用可能である。
上記装置における各手段の機能および作用の実現手順の詳細は、上記方法における対応するステップの実現手順を参照すればよいため、ここで繰り返し説明しない。
装置実施例が基本的に方法実施例に対応するため、関連箇所は、方法実施例部分の説明を参照すればよい。以上に記載の装置実施例は、単なる模式的である。その中の分離部品として説明された手段は、物理的に離間してもよいし、しなくてもよい。手段として表示された部品は、物理モジュールであってもよいし、でなくてもよい。即ち、1箇所に位置してもよいし、複数のネットワークセルに分散してもよい。実際の必要に応じて、その中の一部または全部のモジュールを選択して本開示の目的を達成してもよい。当業者は、進歩性に値する労動をせずに、理解し実施可能である。
それ相応に、本開示は、制御機器をさらに提供する。前記制御機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリとを備え、前記プロセッサは、
複数のスマート機器のそれぞれから返信された音声データを受信し、
複数の前記音声データを処理して、最適化音声データを取得し、
前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成される。
それ相応に、本開示は、さらにスマート機器を提供する。前記スマート機器は、プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリとを備え、前記プロセッサは、
音声データを採集し、
制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するように構成される。
図16に示すように、図16は、本開示の一実施例によるスマート機器の音声制御装置1600のための構造模式図(制御機器側)である。例えば、装置1600は、ルーティング機能を有する携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信機器、ゲームコンソール、タブレット機器、医療設備、フィットネス機器、PDA等であってもよい。
図16を参照すると、装置1600は、以下の1つ又は複数のユニット、すなわち、処理ユニット1602、メモリ1604、電源ユニット1606、マルチメディアユニット1608、オーディオユニット1610、入力/出力(I/O)インターフェース1612、センサユニット1614及び通信ユニット1616を備えてもよい。
処理ユニット1602は通常、装置1600の全般操作、例えば、表示、電話発呼、データ通信、カメラ操作及び記録操作に関連する操作を制御する。処理ユニット1602は、上記方法のステップの全部又は一部を実行するように、指令を実行する1つ又は複数のプロセッサ1620を備えてもよい。また、処理ユニット1602は、処理ユニット1602と他のユニットとの間の相互作用を容易にするように、1つ又は複数のモジュールを備えてもよい。例えば、処理ユニット1602は、マルチメディアユニット1608と処理ユニット1602との間の相互作用を容易にするように、マルチメディアモジュールを備えてもよい。
メモリ1604は、装置1600での操作をサポートするために、各種別のデータを記憶するように構成される。これらのデータの例示は、装置1600で操作する如何なるアプリケーションプログラムまたは方法の指令、連絡先データ、電話帳データ、メッセージ、ピクチャ、映像などを含む。メモリ1604は、如何なる種別の揮発性もしくは不揮発性記憶デバイスまたはそれらの組合せ、例えば、静的ランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラマブル読み出し専用メモリ(EEPROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM)、プログラマブル読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクによって実現されてもよい。
電源ユニット1606は、装置1600のユニットのそれぞれに電力を供給する。電源ユニット1606は、電源管理システム、1つまたは複数の電源、並びに、装置1600用の電力を生成、管理および配分するに関する他のユニットを含んでもよい。
マルチメディアユニット1608は、前記装置1600とユーザとの間に1つの出力インターフェースを供給するスクリーンを備える。一部の実施例では、スクリーンは、液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでも良い。スクリーンは、タッチパネルを含む場合、ユーザからの入力信号を受信するように、タッチスクリーンとして実現されてもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャーを感知するように、1つまたは複数のタッチセンサを含む。前記タッチセンサは、タッチまたはスライド動作の境界を感知するだけではなく、前記タッチまたはスライド操作と関連する持続時間および圧力をさらに検出することができる。一部の実施例では、マルチメディアユニット1608は、1つのフロントカメラおよび/またはバックカメラを含む。装置1600が操作モード、例えば、撮像モードまたは映像モードにあるとき、フロントカメラおよび/またはバックカメラは、外部のマルチメディアデータを受信することができる。フロントカメラおよびバックカメラのそれぞれは、1つの固定の光学レンズシステムであってもよいし、焦点距離および光学ズーム能力を有するものであってもよい。
オーディオユニット1610は、オーディオ信号を出力および/または入力するように構成される。例えば、オーディオユニット1610は、マイク(MIC)を備え、装置1600が操作モード、例えば、発呼モード、記録モードおよび音声識別モードにあるとき、マイクは、外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は、さらに、メモリ1604に記憶される、または、通信ユニット1616を介して送信されることができる。一部の実施例では、オーディオユニット1610は、さらに、オーディオ信号を出力するためのスピーカをさらに含む。
I/Oインターフェース1612は、処理ユニット1602とペリフェラルインターフェースモジュールとの間でインターフェースを供給するものであり、前記ペリフェラルインターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームページボタン、ボリュームボタン、起動ボタンおよびロックボタンを含んでも良いが、それらに限定されない。
センサユニット1614は、様々な側面での状態推定を装置1600に供給するための1つまたは複数のセンサを含む。例えば、センサユニット1614は、装置1600のオン/オフ状態、ユニットの相対位置を検出することができ、例えば、前記ユニットは、装置1600のディスプレイおよびキーパッドである。センサユニット1614は、さらに、装置1600もしくは装置1600の1つのユニットの位置変更、ユーザと装置1600との接触の存在もしくは不存在、装置1600の方位または加速/減速および装置1600の温度変化をさらに検出することができる。センサユニット1614は、如何なる物理的接触もないとき、近辺にある物体の存在を検出するための近接センサを含んでもよい。センサユニット1614は、さらに、イメージングアプリケーションに使用される光センサ、例えばCMOSまたはCCD画像センサを含んでも良い。一部の実施例では、当該センサユニット1614は、さらに、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ、微波センサまたは温度センサを含んでも良い。
通信ユニット1616は、装置1600と他の機器間の無線または有線方式の通信が便利になるように構成される。装置1600は、通信規格に基づく無線ネットワーク、例えば、WiFi、2Gもしくは3G、またはそれらの組合せにアクセスすることができる。ある実施例では、通信ユニット1616は、外部ブロードキャスト管理システムからのブロードキャスト信号またはブロードキャスト関連情報をブロードキャストチャネルを介して受信する。ある実施例では、前記通信ユニット1616は、さらに、短距離通信を容易にするように、ニアフィールド通信(NFC)モジュールを含んでも良い。例えば、NFCモジュールでは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術および他の技術によって実現されてもよい。
実施例では、装置1600は、上記方法を実行するための1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子部品によって実現されてもよい。
実施例では、指令を含む非一時的コンピュータ読み取り可能な記憶媒体、例えば、指令を含むメモリ1604をさらに提供し、上記指令が装置1600のプロセッサ1620によって実行されることで上述した方法を実施させることができる。例えば、前記非一時的コンピュータ読み取り可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスクおよび光データ記憶機器などであっても良い。
図17に示すように、図17は、本開示の一実施例によるスマート機器の音声制御装置1700のための構造模式図(スマート機器側)である。例えば、装置1700は、ルーティング機能を有する携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信機器、ゲームコンソール、タブレット機器、医療設備、フィットネス機器、PDA等であってもよい。
図17を参照すると、装置1700は、以下の1つ又は複数のユニット、すなわち、処理ユニット1702、メモリ1704、電源ユニット1706、マルチメディアユニット1708、オーディオユニット1710、入力/出力(I/O)インターフェース1712、センサユニット1714及び通信ユニット1716を備えてもよい。
処理ユニット1702は通常、装置1700の全般操作、例えば、表示、電話発呼、データ通信、カメラ操作及び記録操作に関連する操作を制御する。処理ユニット1702は、上記方法のステップの全部又は一部を実行するように、指令を実行する1つ又は複数のプロセッサ1720を備えてもよい。また、処理ユニット1702は、処理ユニット1702と他のユニットとの間の相互作用を容易にするように、1つ又は複数のモジュールを備えてもよい。例えば、処理ユニット1702は、マルチメディアユニット1708と処理ユニット1702との間の相互作用を容易にするように、マルチメディアモジュールを備えてもよい。
メモリ1704は、装置1700での操作をサポートするために、各種別のデータを記憶するように構成される。これらのデータの例示は、装置1700で操作する如何なるアプリケーションプログラムまたは方法の指令、連絡先データ、電話帳データ、メッセージ、ピクチャ、映像などを含む。メモリ1704は、如何なる種別の揮発性もしくは不揮発性記憶デバイスまたはそれらの組合せ、例えば、静的ランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラマブル読み出し専用メモリ(EEPROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM)、プログラマブル読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクによって実現されてもよい。
電源ユニット1706は、装置1700のユニットのそれぞれに電力を供給する。電源ユニット1706は、電源管理システム、1つまたは複数の電源、並びに、装置1700用の電力を生成、管理および配分するに関する他のユニットを含んでもよい。
マルチメディアユニット1708は、前記装置1700とユーザとの間に1つの出力インターフェースを供給するスクリーンを備える。一部の実施例では、スクリーンは、液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでも良い。スクリーンは、タッチパネルを含む場合、ユーザからの入力信号を受信するように、タッチスクリーンとして実現されてもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャーを感知するように、1つまたは複数のタッチセンサを含む。前記タッチセンサは、タッチまたはスライド動作の境界を感知するだけではなく、前記タッチまたはスライド操作と関連する持続時間および圧力をさらに検出することができる。一部の実施例では、マルチメディアユニット1708は、1つのフロントカメラおよび/またはバックカメラを含む。装置1700が操作モード、例えば、撮像モードまたは映像モードにあるとき、フロントカメラおよび/またはバックカメラは、外部のマルチメディアデータを受信することができる。フロントカメラおよびバックカメラのそれぞれは、1つの固定の光学レンズシステムであってもよいし、焦点距離および光学ズーム能力を有するものであってもよい。
オーディオユニット1710は、オーディオ信号を出力および/または入力するように構成される。例えば、オーディオユニット1710は、マイク(MIC)を備え、装置1700が操作モード、例えば、発呼モード、記録モードおよび音声識別モードにあるとき、マイクは、外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は、さらに、メモリ1704に記憶される、または、通信ユニット1716を介して送信されることができる。一部の実施例では、オーディオユニット1710は、さらに、オーディオ信号を出力するためのスピーカをさらに含む。
I/Oインターフェース1712は、処理ユニット1702とペリフェラルインターフェースモジュールとの間でインターフェースを供給するものであり、前記ペリフェラルインターフェースモジュールは、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームページボタン、ボリュームボタン、起動ボタンおよびロックボタンを含んでも良いが、それらに限定されない。
センサユニット1714は、様々な側面での状態推定を装置1700に供給するための1つまたは複数のセンサを含む。例えば、センサユニット1714は、装置1700のオン/オフ状態、ユニットの相対位置を検出することができ、例えば、前記ユニットは、装置1700のディスプレイおよびキーパッドである。センサユニット1714は、さらに、装置1700もしくは装置1700の1つのユニットの位置変更、ユーザと装置1700との接触の存在もしくは不存在、装置1700の方位または加速/減速および装置1700の温度変化をさらに検出することができる。センサユニット1714は、如何なる物理的接触もないとき、近辺にある物体の存在を検出するための近接センサを含んでもよい。センサユニット1714は、さらに、イメージングアプリケーションに使用される光センサ、例えばCMOSまたはCCD画像センサを含んでも良い。一部の実施例では、当該センサユニット1714は、さらに、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ、微波センサまたは温度センサを含んでも良い。
通信ユニット1716は、装置1700と他の機器間の無線または有線方式の通信が便利になるように構成される。装置1700は、通信規格に基づく無線ネットワーク、例えば、WiFi、2Gもしくは3G、またはそれらの組合せにアクセスすることができる。ある実施例では、通信ユニット1716は、外部ブロードキャスト管理システムからのブロードキャスト信号またはブロードキャスト関連情報をブロードキャストチャネルを介して受信する。ある実施例では、前記通信ユニット1716は、さらに、短距離通信を容易にするように、ニアフィールド通信(NFC)モジュールを含んでも良い。例えば、NFCモジュールでは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術および他の技術によって実現されてもよい。
実施例では、装置1700は、上記方法を実行するための1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子部品によって実現されてもよい。
実施例では、指令を含む非一時的コンピュータ読み取り可能な記憶媒体、例えば、指令を含むメモリ1704をさらに提供し、上記指令が装置1700のプロセッサ1720によって実行されることで上述した方法を実施させることができる。例えば、前記非一時的コンピュータ読み取り可能な記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD-ROM、磁気テープ、フロッピーディスクおよび光データ記憶機器などであっても良い。
当業者は、明細書を考慮し、ここに公開された開示を実践した後、本開示の他の実施案を容易に想到する。本願は、本開示の如何なる変形、用途または適応的変化もカバーすることを意図する。これらの変形、用途または適応的変化は、本開示の一般的な仕組みに従い、かつ、本開示に開示されていない当分野における公知常識または慣用技術手段を含む。明細書および実施例は単なる例示と見なされ、本開示の本当の範囲および思想は添付の特許請求の範囲によって与えられる。
以上で記載されたのが単なる本開示の好適な実施例に過ぎず、本開示を限定するものではない。本開示の精神および要旨を逸脱しない範囲でなされた如何なる補正、均等物との置換、改良なども、本開示の保護範囲内に含まれる。

Claims (26)

  1. 複数のスマート機器のそれぞれから返信された音声データを受信するステップと、
    複数の前記音声データを処理して、最適化音声データを取得するステップと、
    前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップと、を含むことを特徴とするスマート機器の音声制御方法。
  2. 前記複数のスマート機器のそれぞれから返信された音声データを受信するステップは、
    異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するステップを含むことを特徴とする請求項1に記載のスマート機器の音声制御方法。
  3. 異なる位置に存在する複数のスマート機器から返信された音声データを受信する前に、さらに、
    アプリケーションにバインディングされたスマート機器の基本情報を読み取るステップと、
    前記基本情報に基づいて録音機能を有するスマート機器を特定するステップと、
    録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップと、
    特定された起動すべきスマート機器へ起動指令を送信して当該スマート機器を起動させるステップと、を含むことを特徴とする請求項1に記載のスマート機器の音声制御方法。
  4. 前記録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップは、
    録音機能を有するスマート機器のリストを表示するステップと、
    前記リストに対するユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するステップと、を含むことを特徴とする請求項3に記載のスマート機器の音声制御方法。
  5. 前記録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するステップは、
    測位技術に基づいてユーザの位置を特定するステップと、
    予め記憶された、前記録音機能を有するスマート機器のそれぞれの位置を検索するステップと、
    前記ユーザの位置を含む所定範囲内に存在する、録音機能を有するスマート機器を、起動すべきスマート機器として特定するステップと、を含むことを特徴とする請求項3に記載のスマート機器の音声制御方法。
  6. 前記所定範囲内に存在する録音機能を有するスマート機器の数が所定閾値を超えた場合、前記所定範囲内に存在する録音機能を有するスマート機器の過去使用データを読み取るステップと、
    前記過去使用データに基づいて、起動すべきスマート機器を特定するステップと、をさらに含むことを特徴とする請求項5に記載のスマート機器の音声制御方法。
  7. 前記過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含むことを特徴とする請求項6に記載のスマート機器の音声制御方法。
  8. 複数の前記音声データを処理して、最適化音声データを取得するステップは、
    ビームフォーミング技術に基づいて、複数の前記音声データを処理して最適化音声データを取得するステップを含むことを特徴とする請求項1に記載のスマート機器の音声制御方法。
  9. 前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップは、
    赤外線リモコンが前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、且つ、前記制御指令を前記赤外線エンコーダへ送信するように、前記最適化音声データを前記赤外線リモコンへ送信するステップを含むことを特徴とする請求項1に記載のスマート機器の音声制御方法。
  10. 前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するステップは、
    サーバが前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記制御指令と前記最適化音声データにおける機器名とを赤外線リモコンへ送信して、且つ、前記赤外線リモコンが前記制御指令を前記機器名に対応する赤外線エンコーダへ送信するように、前記最適化音声データを前記サーバへ送信することを含むことを特徴とする請求項1に記載のスマート機器の音声制御方法。
  11. 音声データを採集するステップと、
    制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するステップと、を含むことを特徴とするスマート機器の音声制御方法。
  12. 前記音声データを採集するステップの前に、
    前記制御機器から送信された起動指令に応じて起動させるステップを含むことを特徴とする請求項11に記載のスマート機器の音声制御方法。
  13. 受信モジュールと、処理モジュールと、制御モジュールと、を備え、
    前記受信モジュールは、複数のスマート機器のそれぞれから返信された音声データを受信するように構成され、
    前記処理モジュールは、前記受信モジュールによって受信された複数の前記音声データを処理し、最適化音声データを取得するように構成され、
    前記制御モジュールは、前記処理モジュールによって取得された前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成されることを特徴とするスマート機器の音声制御装置。
  14. 前記受信モジュールは、受信サブモジュールを備え、
    前記受信サブモジュールは、異なる位置に存在する複数のスマート機器のそれぞれから返信された音声データを受信するように構成されることを特徴とする請求項13に記載のスマート機器の音声制御装置。
  15. 前記装置は、読取モジュールと、第1の特定モジュールと、第2の特定モジュールと、起動モジュールと、をさらに備え、
    前記読取モジュールは、アプリケーションにバインディングされたスマート機器の基本情報を読み取るように構成され、
    前記第1の特定モジュールは、前記読取モジュールによって読み取られた基本情報に基づいて録音機能を有するスマート機器を特定するように構成され、
    前記第2の特定モジュールは、前記第1の特定モジュールによって特定された録音機能を有するスマート機器のうち、起動すべきスマート機器を特定するように構成され、
    前記起動モジュールは、前記第2の特定モジュールによって特定された起動すべきスマート機器へ起動指令を送信して前記スマート機器を起動させるように構成されることを特徴とする請求項13に記載のスマート機器の音声制御装置。
  16. 前記第2の特定モジュールは、表示サブモジュールと、第1の特定サブモジュールと、を備え、
    前記表示サブモジュールは、録音機能を有するスマート機器のリストを表示するように構成され、
    前記第1の特定サブモジュールは、前記表示サブモジュールによって表示されたリストに対するユーザの選択操作に基づいて、ユーザによって選定されたスマート機器を録音機能を起動すべきスマート機器として特定するように構成されることを特徴とする請求項15に記載のスマート機器の音声制御装置。
  17. 前記第2の特定モジュールは、測位サブモジュールと、検索サブモジュールと、第2の特定サブモジュールと、を備え、
    前記測位サブモジュールは、測位技術に基づいてユーザの位置を特定するように構成され、
    前記検索サブモジュールは、予め記憶された、前記録音機能を有するスマート機器のそれぞれの位置を検索するように構成され、
    前記第2の特定サブモジュールは、前記測位サブモジュールによって測位されたユーザの位置を含む所定範囲内に存在する、録音機能を有するスマート機器を、起動すべきスマート機器として特定するように構成されることを特徴とする請求項15に記載のスマート機器の音声制御装置。
  18. 前記第2の特定モジュールは、読取サブモジュールと、第3の特定サブモジュールと、をさらに備え、
    前記読取サブモジュールは、前記第2の特定サブモジュールによって特定された前記スマート機器の数が所定閾値を超えた場合、前記所定範囲内に存在する録音機能を有するスマート機器の過去使用データを読み取るように構成され、
    前記第3の特定サブモジュールは、前記読取サブモジュールによって読み取られた過去使用データに基づいて、起動すべきスマート機器を特定するように構成されることを特徴とする請求項17に記載のスマート機器の音声制御装置。
  19. 前記読取サブモジュールによって読み取られた前記過去使用データは、使用頻度、最近一回の使用時間、および、総使用時間のうちの1つまたは複数を含むことを特徴とする請求項18に記載のスマート機器の音声制御装置。
  20. 前記処理モジュールは、処理サブモジュールを備え、
    前記処理サブモジュールは、ビームフォーミング技術に基づいて、前記受信モジュールによって受信された複数の前記音声データを処理して最適化音声データを取得するように構成されることを特徴とする請求項13に記載のスマート機器の音声制御装置。
  21. 前記制御モジュールは、第1の送信サブモジュールを備え、
    前記第1の送信サブモジュールは、赤外線リモコンが前記最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記最適化音声データにおける機器名に基づいて対応する赤外線エンコーダを検索し、且つ、前記制御指令を前記赤外線エンコーダへ送信するように、前記処理モジュールによって取得された前記最適化音声データを前記赤外線リモコンへ送信するように構成されることを特徴とする請求項13に記載のスマート機器の音声制御装置。
  22. 前記制御モジュールは、第2の送信サブモジュールを備え、
    前記第2の送信サブモジュールは、サーバが最適化音声データにおける音声情報に基づいて対応する制御指令を検索し、前記制御指令と前記最適化音声データにおける機器名とを赤外線リモコンへ送信し、且つ、前記赤外線リモコンが前記制御指令を前記機器名に対応する赤外線エンコーダへ送信するように、前記処理モジュールによって取得された前記最適化音声データを前記サーバへ送信するように構成されることを特徴とする請求項13に記載のスマート機器の音声制御装置。
  23. 採集モジュールと、送信モジュールと、を備え、
    前記採集モジュールは、音声データを採集するように構成され、
    前記送信モジュールは、制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記採集モジュールによって採集された音声データを前記制御機器へ送信するように構成されることを特徴とするスマート機器の音声制御装置。
  24. 起動モジュールをさらに備え、
    前記起動モジュールは、前記制御機器から送信された起動指令に応じて起動させるように構成されることを特徴とする請求項23に記載のスマート機器の音声制御装置。
  25. プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリと、を備え、
    前記プロセッサは、
    複数のスマート機器のそれぞれから返信された音声データを受信し、
    複数の前記音声データを処理して、最適化音声データを取得し、
    前記最適化音声データに基づいて前記音声データに対応するスマート機器を制御するように構成されることを特徴とする制御機器。
  26. プロセッサと、プロセッサの実行可能な指令を記憶するためのメモリと、を備え、
    前記プロセッサは、
    音声データを採集し、
    制御機器が前記音声データと他の位置に存在する複数のスマート機器によって採集された前記音声データとに基づいて前記音声データに対応するスマート機器を制御するように、前記音声データを前記制御機器へ送信するように構成されることを特徴とするスマート機器。



JP2017547053A 2015-10-28 2015-12-29 スマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器 Active JP6389014B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510712870.6A CN105242556A (zh) 2015-10-28 2015-10-28 智能设备的语音控制方法、装置、控制设备及智能设备
CN201510712870.6 2015-10-28
PCT/CN2015/099361 WO2017071070A1 (zh) 2015-10-28 2015-12-29 智能设备的语音控制方法、装置、控制设备及智能设备

Publications (2)

Publication Number Publication Date
JP2017539187A true JP2017539187A (ja) 2017-12-28
JP6389014B2 JP6389014B2 (ja) 2018-09-12

Family

ID=55040237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017547053A Active JP6389014B2 (ja) 2015-10-28 2015-12-29 スマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器

Country Status (8)

Country Link
US (1) US20170125035A1 (ja)
EP (1) EP3163569B1 (ja)
JP (1) JP6389014B2 (ja)
KR (1) KR101767203B1 (ja)
CN (1) CN105242556A (ja)
MX (1) MX359890B (ja)
RU (1) RU2647093C2 (ja)
WO (1) WO2017071070A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564944A (zh) * 2018-02-08 2018-09-21 百度在线网络技术(北京)有限公司 智能控制方法、系统、设备及存储介质
JP2019219886A (ja) * 2018-06-19 2019-12-26 ソフトバンク株式会社 情報処理装置、情報処理方法、情報処理プログラム

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10257256B2 (en) 2016-01-20 2019-04-09 Google Llc IOT interaction system
CN107105083A (zh) * 2016-02-22 2017-08-29 中兴通讯股份有限公司 一种录音方法、主终端、子终端和系统
WO2017173566A1 (zh) * 2016-04-05 2017-10-12 华为技术有限公司 一种语音控制方法、装置及系统
CN105825855A (zh) * 2016-04-13 2016-08-03 联想(北京)有限公司 一种信息处理方法及主终端设备
CN105788599B (zh) * 2016-04-14 2019-08-06 北京小米移动软件有限公司 语音处理方法、路由器及智能语音控制系统
CN107564515A (zh) * 2016-06-30 2018-01-09 广东美的制冷设备有限公司 基于多麦克风的语音控制方法和系统、麦克风及服务器
CN107622652B (zh) * 2016-07-15 2020-10-02 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统
CN107622767B (zh) * 2016-07-15 2020-10-02 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统
CN106385347A (zh) * 2016-09-09 2017-02-08 珠海格力电器股份有限公司 一种家电设备控制方法和装置
KR102573383B1 (ko) * 2016-11-01 2023-09-01 삼성전자주식회사 전자 장치 및 전자 장치 제어 방법
KR102542766B1 (ko) * 2016-11-17 2023-06-14 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법
CN106448658B (zh) * 2016-11-17 2019-09-20 海信集团有限公司 智能家居设备的语音控制方法及智能家居网关
CN106707788B (zh) * 2017-03-09 2019-05-28 上海电器科学研究院 一种智能家居语音控制识别系统与方法
US11231943B2 (en) * 2017-03-24 2022-01-25 Google Llc Smart setup of assistant services
US10353480B2 (en) * 2017-04-17 2019-07-16 Essential Products, Inc. Connecting assistant device to devices
US10176807B2 (en) 2017-04-17 2019-01-08 Essential Products, Inc. Voice setup instructions
US10355931B2 (en) 2017-04-17 2019-07-16 Essential Products, Inc. Troubleshooting voice-enabled home setup
CN107195316B (zh) * 2017-04-28 2019-11-08 北京声智科技有限公司 用于远场语音识别的训练数据准备系统及方法
CN107272607A (zh) * 2017-05-11 2017-10-20 上海斐讯数据通信技术有限公司 一种智能家居控制系统及方法
CN107479397A (zh) * 2017-09-25 2017-12-15 千寻位置网络有限公司 基于位置信息的智能家居语音控制系统及方法
CN107622771A (zh) * 2017-09-30 2018-01-23 广东美的制冷设备有限公司 家电设备及其控制方法、系统及计算机可读存储介质
CN107689904A (zh) * 2017-10-23 2018-02-13 深圳市敢为软件技术有限公司 语音控制方法、装置、物联网系统及可读存储介质
CN107863104A (zh) * 2017-11-17 2018-03-30 出门问问信息科技有限公司 一种语音控制方法及装置
JP6962158B2 (ja) 2017-12-01 2021-11-05 ヤマハ株式会社 機器制御システム、機器制御方法、及びプログラム
JP7192208B2 (ja) * 2017-12-01 2022-12-20 ヤマハ株式会社 機器制御システム、デバイス、プログラム、及び機器制御方法
CN117632482A (zh) 2017-12-08 2024-03-01 谷歌有限责任公司 数字语音助理计算设备当中的信号处理协调
US10971173B2 (en) 2017-12-08 2021-04-06 Google Llc Signal processing coordination among digital voice assistant computing devices
WO2019134106A1 (zh) * 2018-01-05 2019-07-11 深圳市沃特沃德股份有限公司 语音遥控装置
JP7067082B2 (ja) 2018-01-24 2022-05-16 ヤマハ株式会社 機器制御システム、機器制御方法、及びプログラム
CN108447485A (zh) * 2018-02-05 2018-08-24 上海闻泰电子科技有限公司 便携式电子设备及便携式电子设备的声控方法
CN108398887A (zh) * 2018-02-24 2018-08-14 郑州森源新能源科技有限公司 一种智能家居分布式语音控制方法及系统
US10755706B2 (en) * 2018-03-26 2020-08-25 Midea Group Co., Ltd. Voice-based user interface with dynamically switchable endpoints
CN108682414A (zh) * 2018-04-20 2018-10-19 深圳小祺智能科技有限公司 语音控制方法、语音系统、设备和存储介质
CN108919657B (zh) * 2018-06-21 2021-08-06 新华三技术有限公司 面板的自动配置方法、装置及面板
CN109151533A (zh) * 2018-08-30 2019-01-04 安徽声讯信息技术有限公司 一种基于手机语音控制电视机盒的控制系统及方法
CN109493865A (zh) * 2018-10-17 2019-03-19 北京车和家信息技术有限公司 信号处理方法、终端及车辆
KR102208536B1 (ko) * 2019-05-07 2021-01-27 서강대학교산학협력단 음성인식 장치 및 음성인식 장치의 동작방법
CN110233934B (zh) 2019-05-31 2021-02-09 北京小米移动软件有限公司 电子设备控制方法、装置及计算机可读存储介质
CN112558488B (zh) * 2019-09-10 2022-02-15 珠海格力电器股份有限公司 一种控制智能设备的方法及装置
CN110850736A (zh) * 2019-11-12 2020-02-28 北京声智科技有限公司 一种控制方法及系统
CN111739533A (zh) * 2020-07-28 2020-10-02 睿住科技有限公司 语音控制系统、方法与装置以及存储介质、语音设备
CN112596405B (zh) * 2020-12-17 2024-06-04 深圳市创维软件有限公司 家用电器的控制方法、装置、设备以及计算机可读存储介质
CN113241069B (zh) * 2021-04-15 2023-12-12 王维坤 一种提高语音交互成功率的方法
CN113012699B (zh) * 2021-05-07 2024-01-23 宇博科创(深圳)科技有限公司 基于离线语音的红外线遥控开关方法及系统
WO2023284562A1 (zh) * 2021-07-14 2023-01-19 海信视像科技股份有限公司 控制设备、家电设备以及控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191715A (ja) * 1993-11-15 1995-07-28 Internatl Business Mach Corp <Ibm> 位置従属の言語コマンドを実行する方法及びコンピュータ制御システム
WO2011055410A1 (ja) * 2009-11-06 2011-05-12 株式会社 東芝 音声認識装置
JP2011254464A (ja) * 2010-06-02 2011-12-15 Sony Corp 加工音声信号を決定する方法および携帯端末
JP2015015611A (ja) * 2013-07-05 2015-01-22 ホシデン株式会社 音響信号処理装置
CN104935615A (zh) * 2014-03-19 2015-09-23 重庆深蜀科技有限公司 实现语音控制家电设备的系统及方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6230138B1 (en) * 2000-06-28 2001-05-08 Visteon Global Technologies, Inc. Method and apparatus for controlling multiple speech engines in an in-vehicle speech recognition system
US7386443B1 (en) * 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US8068619B2 (en) * 2006-05-09 2011-11-29 Fortemedia, Inc. Method and apparatus for noise suppression in a small array microphone system
CN101740028A (zh) * 2009-11-20 2010-06-16 四川长虹电器股份有限公司 家电产品语音控制系统
CN102595281B (zh) * 2011-01-14 2016-04-13 通用汽车环球科技运作有限责任公司 统一标准的麦克风预处理系统和方法
DE102011012573B4 (de) * 2011-02-26 2021-09-16 Paragon Ag Sprachbedienvorrichtung für Kraftfahrzeuge und Verfahren zur Auswahl eines Mikrofons für den Betrieb einer Sprachbedienvorrichtung
RU125736U1 (ru) * 2012-03-05 2013-03-10 Дмитрий Иванович Шелефонтюк Устройство дистанционного управления объектами и контроля их состояния (варианты)
CN102647522A (zh) * 2012-04-07 2012-08-22 西北工业大学 基于手机平台的多功能通用遥控系统
WO2014064324A1 (en) * 2012-10-26 2014-05-01 Nokia Corporation Multi-device speech recognition
US9842489B2 (en) * 2013-02-14 2017-12-12 Google Llc Waking other devices for additional data
US9459994B2 (en) * 2013-02-20 2016-10-04 Kony, Inc. Mobile application testing systems and methods
US10255930B2 (en) * 2013-06-28 2019-04-09 Harman International Industries, Incorporated Wireless control of linked devices
CN104575511B (zh) * 2013-10-22 2019-05-10 陈卓 语音增强方法及装置
CN203786554U (zh) * 2014-04-28 2014-08-20 深圳市岸基科技有限公司 一种智能家居控制系统
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN104301526B (zh) * 2014-09-26 2017-04-12 小米科技有限责任公司 终端遥控方法、装置及设备
CN204390479U (zh) * 2015-03-04 2015-06-10 冠捷显示科技(厦门)有限公司 一种智能家用电器遥控装置
CN204719512U (zh) * 2015-05-08 2015-10-21 宁波云居智能家居科技有限公司 语音识别智能家居场景控制系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191715A (ja) * 1993-11-15 1995-07-28 Internatl Business Mach Corp <Ibm> 位置従属の言語コマンドを実行する方法及びコンピュータ制御システム
WO2011055410A1 (ja) * 2009-11-06 2011-05-12 株式会社 東芝 音声認識装置
JP2011254464A (ja) * 2010-06-02 2011-12-15 Sony Corp 加工音声信号を決定する方法および携帯端末
JP2015015611A (ja) * 2013-07-05 2015-01-22 ホシデン株式会社 音響信号処理装置
CN104935615A (zh) * 2014-03-19 2015-09-23 重庆深蜀科技有限公司 实现语音控制家电设备的系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564944A (zh) * 2018-02-08 2018-09-21 百度在线网络技术(北京)有限公司 智能控制方法、系统、设备及存储介质
JP2019219886A (ja) * 2018-06-19 2019-12-26 ソフトバンク株式会社 情報処理装置、情報処理方法、情報処理プログラム

Also Published As

Publication number Publication date
EP3163569B1 (en) 2022-04-06
MX2016004776A (es) 2017-07-14
CN105242556A (zh) 2016-01-13
US20170125035A1 (en) 2017-05-04
RU2647093C2 (ru) 2018-03-13
JP6389014B2 (ja) 2018-09-12
KR101767203B1 (ko) 2017-08-10
EP3163569A1 (en) 2017-05-03
RU2016114155A (ru) 2017-10-16
WO2017071070A1 (zh) 2017-05-04
MX359890B (es) 2018-10-15

Similar Documents

Publication Publication Date Title
JP6389014B2 (ja) スマート機器の音声制御方法、装置、プログラム、記録媒体、制御機器およびスマート機器
EP3065428B1 (en) Method and device for displaying wifi list
JP6117446B2 (ja) リアルタイム・ビデオの提供方法、リアルタイム・ビデオの提供装置、サーバ、端末装置、プログラム及び記録媒体
JP6427203B2 (ja) 無線アクセスポイントのアクセス方法、装置、プログラム及び記録媒体
US20180035169A1 (en) Method, apparatus, host terminal and system for processing live broadcasting information
JP6302599B2 (ja) スマートホームシステムにおけるスマート機器に対するグルーピング方法、グルーピング装置、プログラム及び記録媒体
EP3136793A1 (en) Method and apparatus for awakening electronic device
CN104038536B (zh) 插件通信方法和装置
JP6556832B2 (ja) 無線アクセスポイントの制御方法、装置、プログラムおよび記録媒体
CN105487389A (zh) 控制智能设备的方法和装置
KR20160077011A (ko) 스마트 홈 디바이스의 운전상태 조절 방법, 장치, 프로그램 및 기록매체
CN105487863A (zh) 基于场景的界面设置方法及装置
JP2017527928A (ja) テキスト入力方法、装置、プログラム及び記録媒体
RU2663709C2 (ru) Способ и устройство для обработки информации
US20170171706A1 (en) Device displaying method, apparatus, and storage medium
CN105404401A (zh) 输入处理方法、装置及设备
JP2017531218A (ja) インタフェース表示方法及び装置
CN105872573A (zh) 一种视频播放方法及装置
CN105242837B (zh) 应用页面获取方法及终端
US10826961B2 (en) Multimedia player device automatically performs an operation triggered by a portable electronic device
CN104811904A (zh) 联系人设置方法及装置
JP2017505963A (ja) 情報表示方法、装置、プログラム、及び記録媒体
US20180062934A1 (en) Method and apparatus for device identification
CN104836880A (zh) 联系人头像处理方法及装置
CN105682187B (zh) 图标显示方法及装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180815

R150 Certificate of patent or registration of utility model

Ref document number: 6389014

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250