JP2016502829A - 端末音声制御方法、装置、端末、およびプログラム - Google Patents

端末音声制御方法、装置、端末、およびプログラム Download PDF

Info

Publication number
JP2016502829A
JP2016502829A JP2015546845A JP2015546845A JP2016502829A JP 2016502829 A JP2016502829 A JP 2016502829A JP 2015546845 A JP2015546845 A JP 2015546845A JP 2015546845 A JP2015546845 A JP 2015546845A JP 2016502829 A JP2016502829 A JP 2016502829A
Authority
JP
Japan
Prior art keywords
voice
voice command
instruction information
terminal
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015546845A
Other languages
English (en)
Inventor
ワン、シヨン
チャン、ホンルイ
ツェン、ウェイジュン
ワン、チン
Original Assignee
▲華▼▲為▼▲終▼端有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ▲華▼▲為▼▲終▼端有限公司 filed Critical ▲華▼▲為▼▲終▼端有限公司
Publication of JP2016502829A publication Critical patent/JP2016502829A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/667Preventing unauthorised calls from a telephone set
    • H04M1/67Preventing unauthorised calls from a telephone set by electronic means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Abstract

本願発明の複数の実施形態は、端末音声制御方法を開示する。方法は、ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出する段階と、抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行する段階と、音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する段階とを備える本願発明の複数の実施形態における端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単となり、高セキュリティ性能がもたらされる。

Description

本願は、発明の名称が「TERMINAL VOICE CONTROL METHOD AND APPARETUS, AND TERMINAL」であり、中国特許庁に2013年11月15日に提出された中国特許出願第CN 201310574762.8号の優先権を主張する。同特許出願はその全体が本明細書において参照により組み込まれる。
本願発明は、端末技術の分野に関し、特に、端末音声制御方法および装置、並びに端末に関する。
科学および技術の発展と共に、スマートフォンは人々の生活において必需品となってきた。ユーザによる、スマートフォンの操作の実行を促すために、殆どのスマートフォンは現在、音声制御機能を有している。ユーザは携帯電話に対して音声命令を発することが出来、携帯電話は音声命令に対して応答を行う。しかし従来技術において、先述した解決法は、複数回、複数の異なる音声エンジンを別々に呼び出すことにより実装される。例えば、ユーザが所有者であるか否かをまず識別するために音声ウェークアップエンジンおよび声紋認識エンジンが用いられ、その後携帯電話がウェークアップさせられ、携帯電話はその後、ユーザの要求について問い合わせを行い、段階を追って複数の質問に答えるようユーザに指示する。ユーザが複数の質問に答えた後、携帯電話は、ユーザが複数の質問に答えたときにユーザにより発せられた音声命令を識別し、識別結果に従ってユーザの音声命令を実行する。
先述の音声制御法の欠点は、複数の音声命令が連続せず、ユーザに、段階を追って問い合わせ、複数の質問に答えるよう指示する必要があることとなり、次の段階は、ユーザが複数の質問に答え終えた後に開始され、各段階を実行するプロセスが煩わしくなり、ユーザにとって、携帯電話の音声制御機能を利用することが非常に不便になるということである。携帯電話が待機しているとき、携帯電話に対して命令を直接発することが出来ない。携帯電話の更なる操作が実行出来るようになる前に、携帯電話はウェークアップさせられる必要がある。
本願発明の複数の実施形態で提供される端末音声制御方法によると、複数のタスクを完了するよう端末を制御するために1つの音声命令が用いられ得る。
第1態様によると、本願発明の実施形態は、ユーザの音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出する段階と、抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行する段階と、上記音声照合が成功した後に、上記音声命令から処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階とを備える、端末音声制御方法を提供する。
第1態様を参照すると、第1態様の第1の可能な実施法において、上記音声照合が成功した後に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階は、上記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、上記端末スクリーンをアンロックし、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階と、上記音声照合が成功した後に、上記端末がスクリーンロック状態にないことを検出した場合に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階とを有する。
第1態様を参照すると、第1態様の第3の可能な実施法において、方法は、抽出によりウェークアップ指示情報が得られない場合に、上記ユーザの音声命令の受信を継続して待機する段階をさらに備える。
第1態様を参照すると、第1態様の第4の可能な実施法において、方法は、上記音声照合が失敗した場合に再照合を促し、照合回数が閾値を超えても上記照合がまだ失敗である場合に、上記ユーザの音声命令の受信を停止する段階をさらに備える。
第1態様を参照すると、第1態様の第5の可能な実施法において、上記音声照合が成功した後に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階は、上記ウェークアップ指示情報が上記音声命令から取り除き、上記音声命令の上記処理プロンプト情報を抽出し、上記処理指示情報をテキストに変換する段階と、上記テキストに従って上記処理プロンプト情報の意味を識別し、得られた上記意味に従って応答を行う段階とを有する。
第2態様によると、本願発明の実施形態は、ユーザの音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出するよう構成された受信ユニットと、抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行するよう構成された第1抽出ユニットと、上記音声照合が成功した後に、上記音声命令に含まれる処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第1処理ユニット段階とを備える、端末音声制御装置を提供する。
第2態様を参照すると、第2態様の第1の可能な実施法において、上記第1処理ユニットは、上記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、上記端末スクリーンをアンロックし、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第1実行モジュールと、上記音声照合が成功した後に、上記端末がスクリーンロック状態にないことを検出した場合に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第2実行モジュールとを有する。
第2態様を参照すると、第2態様の第3の可能な実施法において、装置は、抽出によりウェークアップ指示情報が得られない場合に、上記ユーザの音声命令の受信を継続して待機するよう構成された第2抽出ユニットをさらに備える。
第2態様を参照すると、第2態様の第4の可能な実施法において、装置は、上記音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても上記照合がまだ失敗である場合に、上記ユーザの音声命令の受信を停止するよう構成された第2処理ユニットをさらに備える。
第2態様を参照すると、第2態様の第5の可能な実施法において、上記第1処理ユニットは、上記ウェークアップ指示情報が上記音声命令から取り除き、上記音声命令の上記処理プロンプト情報を抽出し、上記処理指示情報をテキストに変換するよう構成された変換モジュールと、上記テキストに従って上記処理プロンプト情報の意味を識別し、得られた上記意味に従って応答を行うよう構成された応答モジュールとを有する。
第3態様によると、本願発明の実施形態は、オーディオモニタリングユニットと、プロセッサとを備え、上記オーディオモニタリングユニットは、ユーザにより発せられた音声命令を捉えるよう構成され、上記プロセッサは、上記ユーザの上記音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出し、抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行し、上記音声照合が成功した後に、上記音声命令から処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された、端末をさらに提供する。
本願発明の複数の実施形態における端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、利用が簡単であり、高セキュリティ性能である。
本願発明の複数の実施形態、または、従来技術の複数の技術的解決をより明らかに説明するべく、以下において簡単に、複数の実施形態または従来技術を説明するために必要である複数の添付の図面を紹介する。一見したところ、以下の説明において添付の図面は、本願発明のいくつかの実施形態を示し、当業者はさらに、創造努力を用いることなくこれらの添付の図面から他の複数の図面を導き出し得るようである。
本願発明の第1実施形態に係る端末音声制御方法のフローチャートである。
本願発明の第2実施形態に係る端末音声制御方法のフローチャートである。
本願発明の第3実施形態に係る端末音声制御方法のフローチャートである。
本願発明の第4実施形態に係る端末音声制御装置の概略構造図である。
本願発明の第5実施形態に係る端末音声制御装置の概略構造図である。
本願発明の第6実施形態に係る端末音声制御装置の概略構造図である。
本願発明の第7実施形態に係る端末の概略構造図である。
以下において、本願発明の複数の実施形態における添付の複数の図面を参照し、本願発明の複数の実施形態における複数の技術的解決を明らかに、かつ完全に説明する。一見したところ、説明される複数の実施形態は、本願発明の複数の実施形態のうち全てではなく、一部であるようである。本願発明の複数の実施形態に基づいて、当業者によって創造努力を用いずとも得られる他の全ての複数の実施形態は、本願発明の権利保護範囲に含まれる。
図1は、本願発明の第1実施形態に係る端末音声制御方法のフローチャートである。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。方法は詳細には以下のことを含む。
S101。ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出する。
詳細には、ユーザの音声命令は、ウェークアップ指示情報および処理指示情報を含む。ここでウェークアップ指示情報は、スクリーンロック状態にある端末をウェークアップするために用いられ、処理指示情報は、特定の動作を実行するよう端末に命令するために用いられる。
ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」などユーザにより事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
S102。抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行する。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
声紋認識(Voiceprint Recognition)とは、話者認識とも呼ばれ、これは、音声のあるセグメントを発する人の音声特徴に従って識別することを指すことを理解されるべきである。概して、声紋認識は2つの側面を含む。それらは、話者識別と話者判断であり、前者は数人のうち誰が音声のあるセグメントを発したのかを判断することであり、後者は、音声のあるセグメントが特定の人によって発せられたか否かを判断することである。本願発明の実施形態における声紋認識法は話者判断であり、つまり、音声のあるセグメントが、特定の事前設定された人によって発せられたか否かを識別する必要がある。
S103。音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
詳細には、音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理プロンプト情報が抽出され、処理プロンプト情報がテキストに変換され、処理指示情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図2は、本願発明の第2実施形態に係る端末音声制御方法のフローチャートである。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。方法は詳細には、以下のことを含む。
S201。ユーザの音声命令が受信されたときに、音声命令を識別する。
詳細には、ユーザの音声命令を識別するとは、ユーザの音声命令からウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」など事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
S202。抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行する。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
S203。音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、端末スクリーンをアンロックし、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
S204。音声照合が成功した後に、端末がスクリーンロック状態にないことを検出した場合に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
詳細には、端末がスクリーンロック状態にあることを検出した場合に、スクリーンロック状態にある端末は、まず音声命令のウェークアップ指示情報に従ってウェークアップされる必要があり、その後、他の段階が実行される。端末がスクリーンロック状態にない場合に、端末スクリーンを明るくする、または、端末スクリーンをアンロックする段階は実行される必要がなく、次の段階が直接実行される。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図3は、本願発明の第3実施形態に係る端末音声制御方法のフローチャートである。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。方法は詳細には以下のことを含む。
S301。ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出する。
詳細には、ユーザの音声命令は、ウェークアップ指示情報および処理指示情報を含む。ここでウェークアップ指示情報は、スクリーンロック状態にある端末をウェークアップするために用いられ、処理指示情報は、特定の動作を実行するよう端末に命令するために用いられる。
ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」など事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
S302。抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行する。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
S303。抽出によりウェークアップ指示情報が得られない場合に、ユーザの音声命令の受信を継続して待機する。
詳細には、抽出によりウェークアップ指示情報が得られない場合、端末は何ら処理を実行せず、ユーザの音声命令の受信を継続して待機する。
S304。音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
詳細には、音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理プロンプト情報が抽出され、処理指示情報がテキストに変換され、処理プロンプト情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
S305。音声照合が失敗した場合に再照合を促し、照合回数が閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信を停止する。
詳細には、照合回数が設定済閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信が停止され、ユーザは、手動でしか端末スクリーンを起動出来なく、これにより、端末の利用のセキュリティが確保される。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、利用が簡単であり、高セキュリティ性能である。
図4は、本願発明の第4実施形態に係る端末音声制御装置の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。装置1は詳細には、受信ユニット10、第1抽出ユニット20、および第1処理ユニット30を含む。
受信ユニット10は、ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出するよう構成される。
詳細には、ユーザの音声命令は、ウェークアップ指示情報および処理指示情報を含む。ここでウェークアップ指示情報は、スクリーンロック状態にある端末をウェークアップするために用いられ、処理指示情報は、特定の動作を実行するよう端末に命令するために用いられる。
ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」など事前設定されたウェークアップワードである事前設定されたウェークアップワードを含むか否かを検出することである。
第1抽出ユニット20は、抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行するよう構成される。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
第1処理ユニット30は、音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
第1処理ユニット30は、変換モジュール31と応答モジュール32とを含む。
変換モジュール31は、ウェークアップ指示情報を音声命令から取り除き、音声命令の処理プロンプト情報を抽出し、処理指示情報をテキストに変換するよう構成される。
応答モジュール32は、テキストに従って処理プロンプト情報の意味を識別し、得られた意味に従って応答を行うよう構成される。
詳細には、音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理プロンプト情報が抽出され、処理指示情報がテキストに変換され、処理プロンプト情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図5は、本願発明の第5実施形態に係る端末音声制御装置の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。装置2は、図4の装置1を最適化したものである。装置2の第1処理ユニット30は、第1実行モジュール33と第2実行モジュール34とを含む。
第1実行モジュール33は、音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、端末スクリーンをアンロックし、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
第2実行モジュール34は、音声照合が成功した後に、端末がスクリーンロック状態にないことを検出した場合に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
詳細には、端末がスクリーンロック状態にあることを検出された場合、端末スクリーンを明るくし、端末スクリーンをアンロックする段階が実行される必要があり、端末がスクリーンロック状態にない場合、端末スクリーンを明るくし、端末スクリーンをアンロックする段階が実行される必要がない。
加えて、音声命令の音声照合を実行するとは、声紋認識方法を用いて、音声命令を発したユーザが事前設定されたユーザであるか否かを照合することであり、これにより端末のセキュリティが向上させられる。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図6は、本願発明の第6実施形態に係る端末音声制御装置の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。装置3は、図4の装置1を最適化したものである。装置3はさらに、第2抽出ユニット40と第2処理ユニット50とを含む。
第2抽出ユニット40は、抽出によりウェークアップ指示情報が得られない場合に、ユーザの音声命令の受信を継続して待機するよう構成される。
第2処理ユニット50は、音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信を停止するよう構成される。
詳細には、音声照合回数が設定済閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信が停止され、ユーザは、手動でしか端末スクリーンを起動出来なく、これにより、端末の利用のセキュリティが確保される。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、利用が簡単であり、高セキュリティ性能である。
図7は、本願発明の第7実施形態に係る端末の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。端末4は詳細には、オーディオモニタリングユニット60とプロセッサ70とを含む。
オーディオモニタリングユニット60は、ユーザにより発せられた音声命令を捉えるよう構成される。
プロセッサ70は、ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出し、抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行し、音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
詳細には、ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」などユーザにより事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理プロンプト情報が抽出され、処理指示情報がテキストに変換され、処理プロンプト情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
確かに、本願発明の本実施形態の例示的な実施法において、オーディオモニタリングユニット60はマイクであり得る。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、利用が簡単であり、高セキュリティ性能である。
第1抽出ユニットおよび第2抽出ユニット、第1処理ユニットおよび第2処理ユニット、並びに第1実行モジュールおよび第2実行モジュールは、順序関係または数量単位を示唆するものではなく、異なる複数のモジュールまたは複数のユニットを区別するよう意図されていることが理解されるべきである。
当業者は、本願発明の様々な複数の態様、または様々な複数の態様の複数の可能な実施例がシステム、方法、またはコンピュータプログラムプロダクトにおいて詳細に実施され得ることを理解し得る。さらに、本願発明の様々な複数の態様、または様々な複数の態様の複数の可能な実施例は、コンピュータプログラムプロダクトの形態であり得、ここでコンピュータプログラムプロダクトとは、コンピュータ可読媒体に格納されるコンピュータ可読プログラムコードを指す。
コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であり得る。コンピュータ可読記憶媒体は、電子、磁気、光、電磁気、赤外線、または半導体システム、デバイス、または装置、若しくはこれらの何らかの適した組み合わせ、例えば、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROMまたはFLASH)、光ファイバ、コンパクトディスク読み取り専用メモリ(CD−ROM)を含むが、これらに限定されない。
コンピュータのプロセッサは、複数のフローチャートの各段階における、若しくは、複数の段階からなる組み合わせにおける特定の機能および動作がプロセッサにより実行され、複数のブロック図の各ブロックまたは複数のブロックからなる組み合わせにおける特定の機能および動作を実施するための装置を生成するよう、コンピュータ可読媒体に格納されるコンピュータ可読プログラムコードを読み取る。
コンピュータ可読プログラムコードは、全てがユーザコンピュータ単体で実行され得、または、その一部が、スタンドアロン型ソフトウェアパッケージとしてユーザコンピュータで実行され得、または、その一部が、その他の一部が遠隔コンピュータで実行される間にローカルコンピュータで実行され得、または全てが遠隔コンピュータまたはサーバで実行され得る。いくつかの代替的な実施解決法において、複数のフローチャートの各段階、または複数のブロック図の各ブロックにおける複数の特定の機能は、例示された順序で起こらないかもしれないことにも留意されるべきである。例えば、関与する機能に依存する、例示における2つの連続した段階、または2つのブロックが実際には実質的に同時に実行され得、これらのブロックは場合によっては反対の順序で実行され得る。
当業者が、本願発明の思想および態様から逸脱することなく本願発明の様々な複数の変形および変更を行いうることが明らかである。本願発明は、以下の複数の請求項またはそれらの複数の同等の技術により定義される保護範囲に含まれるという条件で、これらの複数の変形および複数の変更を網羅するよう意図されている。
本願は、発明の名称が「TERMINAL VOICE CONTROL METHOD AND APPARETUS, AND TERMINAL」であり、中国特許庁に2013年11月15日に提出された中国特許出願第CN 201310574762.8号の優先権を主張する。同特許出願はその全体が本明細書において参照により組み込まれる。
本願発明は、端末技術の分野に関し、特に、端末音声制御方法および装置、並びに端末に関する。
科学および技術の発展と共に、スマートフォンは人々の生活において必需品となってきた。ユーザによる、スマートフォンの操作の実行を促すために、殆どのスマートフォンは現在、音声制御機能を有している。ユーザは携帯電話に対して音声命令を発することが出来、携帯電話は音声命令に対して応答を行う。しかし従来技術において、先述した解決法は、複数回、複数の異なる音声エンジンを別々に呼び出すことにより実装される。例えば、ユーザが所有者であるか否かをまず識別するために音声ウェークアップエンジンおよび声紋認識エンジンが用いられ、その後携帯電話がウェークアップさせられ、携帯電話はその後、ユーザの要求について問い合わせを行い、段階を追って複数の質問に答えるようユーザに指示する。ユーザが複数の質問に答えた後、携帯電話は、ユーザが複数の質問に答えたときにユーザにより発せられた音声命令を識別し、識別結果に従ってユーザの音声命令を実行する。
先述の音声制御法の欠点は、複数の音声命令が連続せず、ユーザに、段階を追って問い合わせ、複数の質問に答えるよう指示する必要があることとなり、次の段階は、ユーザが複数の質問に答え終えた後に開始され、各段階を実行するプロセスが煩わしくなり、ユーザにとって、携帯電話の音声制御機能を利用することが非常に不便になるということである。携帯電話が待機しているとき、携帯電話に対して命令を直接発することが出来ない。携帯電話の更なる操作が実行出来るようになる前に、携帯電話はウェークアップさせられる必要がある。
本願発明の複数の実施形態で提供される端末音声制御方法によると、複数のタスクを完了するよう端末を制御するために1つの音声命令が用いられ得る。
第1態様によると、本願発明の実施形態は、ユーザの音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出する段階と、抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行する段階と、上記音声照合が成功した後に、上記音声命令から処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階とを備える、端末音声制御方法を提供する。
第1態様を参照すると、第1態様の第1の可能な実施法において、上記音声照合が成功した後に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階は、上記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、上記端末スクリーンをアンロックし、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階と、上記音声照合が成功した後に、上記端末がスクリーンロック状態にないことを検出した場合に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階とを有する。
第1態様を参照すると、第1態様の第の可能な実施法において、方法は、抽出によりウェークアップ指示情報が得られない場合に、上記ユーザの音声命令の受信を継続して待機する段階をさらに備える。
第1態様を参照すると、第1態様の第の可能な実施法において、方法は、上記音声照合が失敗した場合に再照合を促し、照合回数が閾値を超えても上記照合がまだ失敗である場合に、上記ユーザの音声命令の受信を停止する段階をさらに備える。
第1態様を参照すると、第1態様の第の可能な実施法において、上記音声照合が成功した後に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階は、上記ウェークアップ指示情報が上記音声命令から取り除かれた後に、上記音声命令の上記処理指示情報を抽出し、上記処理指示情報をテキストに変換する段階と、上記テキストに従って上記処理指示情報の意味を識別し、得られた上記意味に従って応答を行う段階とを有する。
第2態様によると、本願発明の実施形態は、ユーザの音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出するよう構成された受信ユニットと、抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行するよう構成された第1抽出ユニットと、上記音声照合が成功した後に、上記音声命令に含まれる処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第1処理ユニット段階とを備える、端末音声制御装置を提供する。
第2態様を参照すると、第2態様の第1の可能な実施法において、上記第1処理ユニットは、上記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、上記端末スクリーンをアンロックし、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第1実行モジュールと、上記音声照合が成功した後に、上記端末がスクリーンロック状態にないことを検出した場合に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第2実行モジュールとを有する。
第2態様を参照すると、第2態様の第の可能な実施法において、装置は、抽出によりウェークアップ指示情報が得られない場合に、上記ユーザの音声命令の受信を継続して待機するよう構成された第2抽出ユニットをさらに備える。
第2態様を参照すると、第2態様の第の可能な実施法において、装置は、上記音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても上記照合がまだ失敗である場合に、上記ユーザの音声命令の受信を停止するよう構成された第2処理ユニットをさらに備える。
第2態様を参照すると、第2態様の第の可能な実施法において、上記第1処理ユニットは、上記ウェークアップ指示情報が上記音声命令から取り除かれた後に上記音声命令の上記処理指示情報を抽出し、上記処理指示情報をテキストに変換するよう構成された変換モジュールと、上記テキストに従って上記処理指示情報の意味を識別し、得られた上記意味に従って応答を行うよう構成された応答モジュールとを有する。
第3態様によると、本願発明の実施形態は、オーディオモニタリングユニットと、プロセッサとを備え、上記オーディオモニタリングユニットは、ユーザにより発せられた音声命令を捉えるよう構成され、上記プロセッサは、上記ユーザの上記音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出し、抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行し、上記音声照合が成功した後に、上記音声命令から処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された、端末をさらに提供する。
本願発明の複数の実施形態における端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、同方法は利用が簡単であり、高セキュリティ性能をもたらす
本願発明の複数の実施形態、または、従来技術の複数の技術的解決をより明らかに説明するべく、以下において簡単に、複数の実施形態または従来技術を説明するために必要である複数の添付の図面を紹介する。一見したところ、以下の説明において添付の図面は、本願発明のいくつかの実施形態を示し、当業者はさらに、創造努力を用いることなくこれらの添付の図面から他の複数の図面を導き出し得るようである。
本願発明の第1実施形態に係る端末音声制御方法のフローチャートである。
本願発明の第2実施形態に係る端末音声制御方法のフローチャートである。
本願発明の第3実施形態に係る端末音声制御方法のフローチャートである。
本願発明の第4実施形態に係る端末音声制御装置の概略構造図である。
本願発明の第5実施形態に係る端末音声制御装置の概略構造図である。
本願発明の第6実施形態に係る端末音声制御装置の概略構造図である。
本願発明の第7実施形態に係る端末の概略構造図である。
以下において、本願発明の複数の実施形態における添付の複数の図面を参照し、本願発明の複数の実施形態における複数の技術的解決を明らかに、かつ完全に説明する。一見したところ、説明される複数の実施形態は、本願発明の複数の実施形態のうち全てではなく、一部であるようである。本願発明の複数の実施形態に基づいて、当業者によって創造努力を用いずとも得られる他の全ての複数の実施形態は、本願発明の権利保護範囲に含まれる。
図1は、本願発明の第1実施形態に係る端末音声制御方法のフローチャートである。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。方法は詳細には以下のことを含む。
S101。ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出する。
詳細には、ユーザの音声命令は、ウェークアップ指示情報および処理指示情報を含む。ここでウェークアップ指示情報は、スクリーンロック状態にある端末をウェークアップするために用いられ、処理指示情報は、特定の動作を実行するよう端末に命令するために用いられる。
ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」などユーザにより事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
S102。抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行する。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
声紋認識(Voiceprint Recognition)とは、話者認識とも呼ばれ、これは、音声のあるセグメントを発する人の音声特徴に従って識別することを指すことを理解されるべきである。概して、声紋認識は2つの側面を含む。それらは、話者識別と話者判断であり、前者は数人のうち誰が音声のあるセグメントを発したのかを判断することであり、後者は、音声のあるセグメントが特定の人によって発せられたか否かを判断することである。本願発明の実施形態における声紋認識法は話者判断であり、つまり、音声のあるセグメントが、特定の事前設定された人によって発せられたか否かを識別する必要がある。
S103。音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
詳細には、音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理指示情報が抽出され、処理指示情報がテキストに変換され、処理指示情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図2は、本願発明の第2実施形態に係る端末音声制御方法のフローチャートである。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。方法は詳細には、以下のことを含む。
S201。ユーザの音声命令が受信されたときに、音声命令を識別する。
詳細には、ユーザの音声命令を識別するとは、ユーザの音声命令からウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」など事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
S202。抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行する。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
S203。音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、端末スクリーンをアンロックし、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
S204。音声照合が成功した後に、端末がスクリーンロック状態にないことを検出した場合に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
詳細には、端末がスクリーンロック状態にあることを検出した場合に、スクリーンロック状態にある端末は、まず音声命令のウェークアップ指示情報に従ってウェークアップされる必要があり、その後、他の段階が実行される。端末がスクリーンロック状態にない場合に、端末スクリーンを明るくする、または、端末スクリーンをアンロックする段階は実行される必要がなく、次の段階が直接実行される。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図3は、本願発明の第3実施形態に係る端末音声制御方法のフローチャートである。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。方法は詳細には以下のことを含む。
S301。ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出する。
詳細には、ユーザの音声命令は、ウェークアップ指示情報および処理指示情報を含む。ここでウェークアップ指示情報は、スクリーンロック状態にある端末をウェークアップするために用いられ、処理指示情報は、特定の動作を実行するよう端末に命令するために用いられる。
ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」など事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
S302。抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行する。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
S303。抽出によりウェークアップ指示情報が得られない場合に、ユーザの音声命令の受信を継続して待機する。
詳細には、抽出によりウェークアップ指示情報が得られない場合、端末は何ら処理を実行せず、ユーザの音声命令の受信を継続して待機する。
S304。音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答する。
詳細には、音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理指示情報が抽出され、処理指示情報がテキストに変換され、処理指示情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
S305。音声照合が失敗した場合に再照合を促し、照合回数が閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信を停止する。
詳細には、照合回数が設定済閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信が停止され、ユーザは、手動でしか端末スクリーンを起動出来なく、これにより、端末の利用のセキュリティが確保される。
本願発明の本実施形態で提供される端末音声制御方法によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、同方法は利用が簡単であり、高セキュリティ性能をもたらす
図4は、本願発明の第4実施形態に係る端末音声制御装置の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。装置1は詳細には、受信ユニット10、第1抽出ユニット20、および第1処理ユニット30を含む。
受信ユニット10は、ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出するよう構成される。
詳細には、ユーザの音声命令は、ウェークアップ指示情報および処理指示情報を含む。ここでウェークアップ指示情報は、スクリーンロック状態にある端末をウェークアップするために用いられ、処理指示情報は、特定の動作を実行するよう端末に命令するために用いられる。
ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」など事前設定されたウェークアップワードである事前設定されたウェークアップワードを含むか否かを検出することである。
第1抽出ユニット20は、抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行するよう構成される。
詳細には、音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
第1処理ユニット30は、音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
第1処理ユニット30は、変換モジュール31と応答モジュール32とを含む。
変換モジュール31は、ウェークアップ指示情報を音声命令から取り除き、音声命令の処理指示情報を抽出し、処理指示情報をテキストに変換するよう構成される。
応答モジュール32は、テキストに従って処理指示情報の意味を識別し、得られた意味に従って応答を行うよう構成される。
詳細には、音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理指示情報が抽出され、処理指示情報がテキストに変換され、処理指示情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
本願発明の本実施形態で提供される端末音声制御装置によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図5は、本願発明の第5実施形態に係る端末音声制御装置の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。装置2は、図4の装置1を最適化したものである。装置2の第1処理ユニット30は、第1実行モジュール33と第2実行モジュール34とを含む。
第1実行モジュール33は、音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、端末スクリーンをアンロックし、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
第2実行モジュール34は、音声照合が成功した後に、端末がスクリーンロック状態にないことを検出した場合に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
詳細には、端末がスクリーンロック状態にあることを検出された場合、端末スクリーンを明るくし、端末スクリーンをアンロックする段階が実行される必要があり、端末がスクリーンロック状態にない場合、端末スクリーンを明るくし、端末スクリーンをアンロックする段階が実行される必要がない。
加えて、音声命令の音声照合を実行するとは、声紋認識方法を用いて、音声命令を発したユーザが事前設定されたユーザであるか否かをチェックすることであり、これにより端末のセキュリティが向上させられる。
本願発明の本実施形態で提供される端末音声制御装置によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、これにより利用が簡単になる。
図6は、本願発明の第6実施形態に係る端末音声制御装置の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。装置3は、図4の装置1を最適化したものである。装置3はさらに、第2抽出ユニット40と第2処理ユニット50とを含む。
第2抽出ユニット40は、抽出によりウェークアップ指示情報が得られない場合に、ユーザの音声命令の受信を継続して待機するよう構成される。
第2処理ユニット50は、音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信を停止するよう構成される。
詳細には、音声照合回数が設定済閾値を超えても照合がまだ失敗である場合に、ユーザの音声命令の受信が停止され、ユーザは、手動でしか端末スクリーンを起動出来なく、これにより、端末の利用のセキュリティが確保される。
本願発明の本実施形態で提供される端末音声制御装置によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、同方法は利用が簡単であり、高セキュリティ性能をもたらす
図7は、本願発明の第7実施形態に係る端末の概略構造図である。本願発明の本実施形態で説明される端末は、携帯電話、PDA、またはタブレットコンピュータなど電子デバイスを含む。端末4は詳細には、オーディオモニタリングユニット60とプロセッサ70とを含む。
オーディオモニタリングユニット60は、ユーザにより発せられた音声命令を捉えるよう構成される。
プロセッサ70は、ユーザの音声命令が受信されたときに、音声命令を識別し、音声命令からウェークアップ指示情報を抽出し、抽出によりウェークアップ指示情報が得られた場合に、音声命令の音声照合を実行し、音声照合が成功した後に、音声命令から処理指示情報を抽出し、処理指示情報に従ってユーザの音声命令に応答するよう構成される。
詳細には、ユーザの音声命令を識別するとは、ユーザの音声命令に含まれるウェークアップ指示情報を抽出するべく、ユーザの音声命令が、例えば、「やあ」または「こんにちは」などユーザにより事前設定されたワードである事前設定されたウェークアップワードを含むか否かを検出することである。
音声命令の音声照合を実行するとは、照合をパスしたユーザだけが端末を利用出来るように、およびさらに端末の音声操作を実行出来るように、音声命令を発したユーザが事前設定されたユーザであるか否かを判断すべく音声命令の音声の声紋認識を実行することであり、これにより、端末のセキュリティ性能が向上させられる。
音声照合が成功した後に、音声命令からウェークアップ指示情報が取り除かれ、音声命令の処理指示情報が抽出され、処理指示情報がテキストに変換され、処理指示情報の意味がテキストに従って識別され、得られた意味に従って応答が行われる。
確かに、本願発明の本実施形態の例示的な実施法において、オーディオモニタリングユニット60はマイクであり得る。
本願発明の本実施形態で提供される端末によると、ユーザは、複数回の音声インタラクションを要することなく、複数のタスクを完了するよう端末を制御するために1つの音声命令を用いればよく、同方法は利用が簡単であり、高セキュリティ性能をもたらす
第1抽出ユニットおよび第2抽出ユニット、第1処理ユニットおよび第2処理ユニット、並びに第1実行モジュールおよび第2実行モジュールは、順序関係または数量単位を示唆するものではなく、異なる複数のモジュールまたは複数のユニットを区別するよう意図されていることが理解されるべきである。
当業者は、本願発明の様々な複数の態様、または様々な複数の態様の複数の可能な実施例がシステム、方法、またはコンピュータプログラムプロダクトにおいて詳細に実施され得ることを理解し得る。さらに、本願発明の様々な複数の態様、または様々な複数の態様の複数の可能な実施例は、コンピュータプログラムプロダクトの形態であり得、ここでコンピュータプログラムプロダクトとは、コンピュータ可読媒体に格納されるコンピュータ可読プログラムコードを指す。
コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であり得る。コンピュータ可読記憶媒体は、電子、磁気、光、電磁気、赤外線、または半導体システム、デバイス、または装置、若しくはこれらの何らかの適した組み合わせ、例えば、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROMまたはFLASH)、光ファイバ、コンパクトディスク読み取り専用メモリ(CD−ROM)を含むが、これらに限定されない。
コンピュータのプロセッサは、複数のフローチャートの各段階における、若しくは、複数の段階からなる組み合わせにおける特定の機能および動作がプロセッサにより実行され、複数のブロック図の各ブロックまたは複数のブロックからなる組み合わせにおける特定の機能および動作を実施するための装置を生成するよう、コンピュータ可読媒体に格納されるコンピュータ可読プログラムコードを読み取る。
コンピュータ可読プログラムコードは、全てがユーザコンピュータ単体で実行され得、または、その一部が、スタンドアロン型ソフトウェアパッケージとしてユーザコンピュータで実行され得、または、その一部が、その他の一部が遠隔コンピュータで実行される間にローカルコンピュータで実行され得、または全てが遠隔コンピュータまたはサーバで実行され得る。いくつかの代替的な実施解決法において、複数のフローチャートの各段階、または複数のブロック図の各ブロックにおける複数の特定の機能は、例示された順序で起こらないかもしれないことにも留意されるべきである。例えば、関与する機能に依存する、例示における2つの連続した段階、または2つのブロックが実際には実質的に同時に実行され得、これらのブロックは場合によっては反対の順序で実行され得る。
当業者が、本願発明の思想および態様から逸脱することなく本願発明の様々な複数の変形および変更を行いうることが明らかである。本願発明は、以下の複数の請求項またはそれらの複数の同等の技術により定義される保護範囲に含まれるという条件で、これらの複数の変形および複数の変更を網羅するよう意図されている。
[項目1]
ユーザの音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出する段階と、
抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行する段階と、
上記音声照合が成功した後に、上記音声命令から処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階と
を備える、端末音声制御方法。
[項目2]
上記音声照合が成功した後に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階は、
上記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、上記端末スクリーンをアンロックし、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階と、
上記音声照合が成功した後に、上記端末がスクリーンロック状態にないことを検出した場合に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階と
を有する、項目1に記載の端末音声制御方法。
[項目3]
抽出によりウェークアップ指示情報が得られない場合に、上記ユーザの音声命令の受信を継続して待機する段階をさらに備える、項目1に記載の端末音声制御方法。
[項目4]
上記音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても上記照合がまだ失敗である場合に、上記ユーザの音声命令の受信を停止する段階をさらに備える、項目1に記載の端末音声制御方法。
[項目5]
上記音声照合が成功した後に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答する段階は、
上記ウェークアップ指示情報が上記音声命令から取り除かれた後に上記音声命令の上記処理プロンプト情報を抽出し、上記処理指示情報をテキストに変換する段階と、
上記テキストに従って上記処理プロンプト情報の意味を識別し、得られた上記意味に従って応答を行う段階と
を有する、項目1に記載の端末音声制御方法。
[項目6]
ユーザの音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出するよう構成された受信ユニットと、
抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行するよう構成された第1抽出ユニットと、
上記音声照合が成功した後に、上記音声命令から処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第1処理ユニット段階と
を備える、端末音声制御装置。
[項目7]
上記第1処理ユニットは、
上記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、上記端末スクリーンをアンロックし、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第1実行モジュールと、
上記音声照合が成功した後に、上記端末がスクリーンロック状態にないことを検出した場合に、上記音声命令から上記処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成された第2実行モジュールと
を有する、項目6に記載の端末音声制御装置。
[項目8]
抽出によりウェークアップ指示情報が得られない場合に、上記ユーザの音声命令の受信を継続して待機するよう構成された第2抽出ユニットをさらに備える、項目6に記載の端末音声制御装置。
[項目9]
上記音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても上記照合がまだ失敗である場合に、上記ユーザの音声命令の受信を停止するよう構成された第2処理ユニットをさらに備える、項目6に記載の端末音声制御装置。
[項目10]
上記第1処理ユニットは、
上記ウェークアップ指示情報が上記音声命令から取り除かれた後に上記音声命令の上記処理プロンプト情報を抽出し、上記処理指示情報をテキストに変換するよう構成された変換モジュールと、
上記テキストに従って上記処理プロンプト情報の意味を識別し、得られた上記意味に従って応答を行うよう構成された応答モジュールと
を有する、項目6に記載の端末音声制御装置。
[項目11]
オーディオモニタリングユニットと、
プロセッサと
を備え、
上記オーディオモニタリングユニットは、ユーザにより発せられた音声命令を捉えるよう構成され、
上記プロセッサは、
上記ユーザの上記音声命令が受信されたときに、上記音声命令を識別し、上記音声命令からウェークアップ指示情報を抽出し、
抽出により上記ウェークアップ指示情報が得られた場合に、上記音声命令の音声照合を実行し、
上記音声照合が成功した後に、上記音声命令から処理指示情報を抽出し、上記処理指示情報に従って上記ユーザの上記音声命令に応答するよう構成される、端末。

Claims (11)

  1. ユーザの音声命令が受信されたときに、前記音声命令を識別し、前記音声命令からウェークアップ指示情報を抽出する段階と、
    抽出により前記ウェークアップ指示情報が得られた場合に、前記音声命令の音声照合を実行する段階と、
    前記音声照合が成功した後に、前記音声命令から処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答する段階と
    を備える、端末音声制御方法。
  2. 前記音声照合が成功した後に、前記音声命令から前記処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答する段階は、
    前記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、前記端末スクリーンをアンロックし、前記音声命令から前記処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答する段階と、
    前記音声照合が成功した後に、前記端末がスクリーンロック状態にないことを検出した場合に、前記音声命令から前記処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答する段階と
    を有する、請求項1に記載の端末音声制御方法。
  3. 抽出によりウェークアップ指示情報が得られない場合に、前記ユーザの音声命令の受信を継続して待機する段階をさらに備える、請求項1に記載の端末音声制御方法。
  4. 前記音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても前記照合がまだ失敗である場合に、前記ユーザの音声命令の受信を停止する段階をさらに備える、請求項1に記載の端末音声制御方法。
  5. 前記音声照合が成功した後に、前記音声命令から前記処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答する段階は、
    前記ウェークアップ指示情報が前記音声命令から取り除かれた後に前記音声命令の前記処理プロンプト情報を抽出し、前記処理指示情報をテキストに変換する段階と、
    前記テキストに従って前記処理プロンプト情報の意味を識別し、得られた前記意味に従って応答を行う段階と
    を有する、請求項1に記載の端末音声制御方法。
  6. ユーザの音声命令が受信されたときに、前記音声命令を識別し、前記音声命令からウェークアップ指示情報を抽出するよう構成された受信ユニットと、
    抽出により前記ウェークアップ指示情報が得られた場合に、前記音声命令の音声照合を実行するよう構成された第1抽出ユニットと、
    前記音声照合が成功した後に、前記音声命令から処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答するよう構成された第1処理ユニット段階と
    を備える、端末音声制御装置。
  7. 前記第1処理ユニットは、
    前記音声照合が成功した後に、端末がスクリーンロック状態にあることを検出した場合に、端末スクリーンを明るくし、前記端末スクリーンをアンロックし、前記音声命令から前記処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答するよう構成された第1実行モジュールと、
    前記音声照合が成功した後に、前記端末がスクリーンロック状態にないことを検出した場合に、前記音声命令から前記処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答するよう構成された第2実行モジュールと
    を有する、請求項6に記載の端末音声制御装置。
  8. 抽出によりウェークアップ指示情報が得られない場合に、前記ユーザの音声命令の受信を継続して待機するよう構成された第2抽出ユニットをさらに備える、請求項6に記載の端末音声制御装置。
  9. 前記音声照合が失敗したときに再照合を促し、照合回数が閾値を超えても前記照合がまだ失敗である場合に、前記ユーザの音声命令の受信を停止するよう構成された第2処理ユニットをさらに備える、請求項6に記載の端末音声制御装置。
  10. 前記第1処理ユニットは、
    前記ウェークアップ指示情報が前記音声命令から取り除かれた後に前記音声命令の前記処理プロンプト情報を抽出し、前記処理指示情報をテキストに変換するよう構成された変換モジュールと、
    前記テキストに従って前記処理プロンプト情報の意味を識別し、得られた前記意味に従って応答を行うよう構成された応答モジュールと
    を有する、請求項6に記載の端末音声制御装置。
  11. オーディオモニタリングユニットと、
    プロセッサと
    を備え、
    前記オーディオモニタリングユニットは、ユーザにより発せられた音声命令を捉えるよう構成され、
    前記プロセッサは、
    前記ユーザの前記音声命令が受信されたときに、前記音声命令を識別し、前記音声命令からウェークアップ指示情報を抽出し、
    抽出により前記ウェークアップ指示情報が得られた場合に、前記音声命令の音声照合を実行し、
    前記音声照合が成功した後に、前記音声命令から処理指示情報を抽出し、前記処理指示情報に従って前記ユーザの前記音声命令に応答するよう構成される、端末。
JP2015546845A 2013-11-15 2014-08-01 端末音声制御方法、装置、端末、およびプログラム Pending JP2016502829A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310574762.8A CN103595869A (zh) 2013-11-15 2013-11-15 一种终端语音控制方法、装置及终端
CN201310574762.8 2013-11-15
PCT/CN2014/083507 WO2015070644A1 (zh) 2013-11-15 2014-08-01 一种终端语音控制方法、装置及终端

Publications (1)

Publication Number Publication Date
JP2016502829A true JP2016502829A (ja) 2016-01-28

Family

ID=50085841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015546845A Pending JP2016502829A (ja) 2013-11-15 2014-08-01 端末音声制御方法、装置、端末、およびプログラム

Country Status (5)

Country Link
US (1) US20150141079A1 (ja)
EP (1) EP2899955A4 (ja)
JP (1) JP2016502829A (ja)
CN (1) CN103595869A (ja)
WO (1) WO2015070644A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019054681A1 (ko) * 2017-09-13 2019-03-21 (주)파워보이스 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103871408B (zh) * 2012-12-14 2017-05-24 联想(北京)有限公司 一种语音识别方法及装置、电子设备
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN103956164A (zh) * 2014-05-20 2014-07-30 苏州思必驰信息科技有限公司 一种声音唤醒方法及系统
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
US20160049147A1 (en) * 2014-08-13 2016-02-18 Glen J. Anderson Distributed voice input processing based on power and sensing
CN104464723B (zh) * 2014-12-16 2018-03-20 科大讯飞股份有限公司 一种语音交互方法及系统
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
KR102346302B1 (ko) * 2015-02-16 2022-01-03 삼성전자 주식회사 전자 장치 및 음성 인식 기능 운용 방법
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
CN104702789A (zh) * 2015-03-11 2015-06-10 安徽声讯信息技术有限公司 具有语音控制功能的智能手机及其语音控制方法
CN104811551B (zh) * 2015-04-10 2018-07-20 广东欧珀移动通信有限公司 一种终端屏幕控制方法及终端
BR112017021673B1 (pt) * 2015-04-10 2023-02-14 Honor Device Co., Ltd Método de controle de voz, meio não-transitório legível por computador e terminal
CN105118505A (zh) * 2015-07-17 2015-12-02 北京乐动卓越科技有限公司 一种语音控制方法及系统
US10770067B1 (en) 2015-09-08 2020-09-08 Amazon Technologies, Inc. Dynamic voice search transitioning
US9928840B2 (en) * 2015-10-16 2018-03-27 Google Llc Hotword recognition
CN106815507A (zh) * 2015-11-30 2017-06-09 中兴通讯股份有限公司 语音唤醒实现方法、装置及终端
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105632486B (zh) * 2015-12-23 2019-12-17 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
EP3414759B1 (en) 2016-02-10 2020-07-01 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
CN105681579B (zh) * 2016-03-11 2020-01-10 Oppo广东移动通信有限公司 终端及其处于导航状态时的屏幕控制方法以及装置
CN105957526A (zh) * 2016-04-29 2016-09-21 福建海媚数码科技有限公司 一种语音唤醒系统及唤醒方法
CN105955698B (zh) * 2016-05-04 2021-09-24 深圳市凯立德科技股份有限公司 一种语音操控方法及装置
CN107369445A (zh) * 2016-05-11 2017-11-21 上海禹昌信息科技有限公司 同时支持语音唤醒以及语音控制智能终端的方法
EP3754653A1 (en) * 2016-06-15 2020-12-23 Cerence Operating Company Techniques for wake-up word recognition and related systems and methods
CN107621784A (zh) * 2016-07-14 2018-01-23 美的智慧家居科技有限公司 智能家居控制方法、装置及系统
CN106272481A (zh) * 2016-08-15 2017-01-04 北京光年无限科技有限公司 一种机器人服务的唤醒方法及装置
CN106328139A (zh) * 2016-09-14 2017-01-11 努比亚技术有限公司 一种语音交互的方法和系统
CN106504748A (zh) * 2016-10-08 2017-03-15 珠海格力电器股份有限公司 一种语音控制方法和装置
WO2018086033A1 (en) 2016-11-10 2018-05-17 Nuance Communications, Inc. Techniques for language independent wake-up word detection
CN108074581B (zh) * 2016-11-16 2021-05-07 深圳儒博智能科技有限公司 用于人机交互智能终端的控制系统
CN106782554B (zh) * 2016-12-19 2020-09-25 百度在线网络技术(北京)有限公司 基于人工智能的语音唤醒方法和装置
CN106856416B (zh) * 2016-12-27 2020-11-06 广东小天才科技有限公司 一种可穿戴设备的来电提醒方法及可穿戴设备
CN106686812B (zh) * 2016-12-28 2019-03-26 生迪智慧科技有限公司 Led灯复位方法及led灯
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
CN107704275B (zh) * 2017-09-04 2021-07-23 百度在线网络技术(北京)有限公司 智能设备唤醒方法、装置、服务器及智能设备
CN107544272B (zh) * 2017-09-18 2021-01-08 广东美的制冷设备有限公司 终端控制方法、装置及存储介质
CN107613124B (zh) * 2017-09-20 2020-10-02 深圳传音通讯有限公司 智能设备的解锁方法、智能设备及存储介质
GB201720418D0 (en) * 2017-11-13 2018-01-24 Cirrus Logic Int Semiconductor Ltd Audio peripheral device
CN108053535A (zh) * 2017-12-26 2018-05-18 重庆硕德信息技术有限公司 智能监控系统
CN108182943B (zh) * 2017-12-29 2021-03-26 北京奇艺世纪科技有限公司 一种智能设备控制方法、装置及智能设备
CN110321201A (zh) * 2018-03-29 2019-10-11 努比亚技术有限公司 一种后台程序处理方法、终端及计算机可读存储介质
CN108521515A (zh) * 2018-04-08 2018-09-11 联想(北京)有限公司 一种语音设备唤醒方法及电子设备
CN108735210A (zh) * 2018-05-08 2018-11-02 宇龙计算机通信科技(深圳)有限公司 一种语音控制方法及终端
CN110858467A (zh) * 2018-08-23 2020-03-03 比亚迪股份有限公司 显示屏控制系统及车辆
CN110971745A (zh) * 2018-09-28 2020-04-07 上海博泰悦臻电子设备制造有限公司 车辆、车载支架及其手持终端语音控制模式触发方法
CN108986815B (zh) * 2018-09-28 2021-11-16 联想(北京)有限公司 语音控制方法、装置及电子设备
CN111131601B (zh) * 2018-10-31 2021-08-27 华为技术有限公司 一种音频控制方法、电子设备、芯片及计算机存储介质
CN109325337A (zh) * 2018-11-05 2019-02-12 北京小米移动软件有限公司 解锁方法及装置
CN109410951A (zh) * 2018-11-21 2019-03-01 广州番禺巨大汽车音响设备有限公司 基于Alexa语音控制的音响控制方法、系统及音响设备
CN113301208A (zh) * 2019-01-03 2021-08-24 百度在线网络技术(北京)有限公司 语音指令的过滤方法和装置
CN109979467B (zh) * 2019-01-25 2021-02-23 出门问问信息科技有限公司 人声过滤方法、装置、设备及存储介质
CN110070863A (zh) * 2019-03-11 2019-07-30 华为技术有限公司 一种语音控制方法及装置
CN110362290A (zh) * 2019-06-29 2019-10-22 华为技术有限公司 一种语音控制方法及相关装置
KR20210009596A (ko) * 2019-07-17 2021-01-27 엘지전자 주식회사 지능적 음성 인식 방법, 음성 인식 장치 및 지능형 컴퓨팅 디바이스
CN110808053B (zh) * 2019-10-09 2022-05-03 深圳市声扬科技有限公司 一种驾驶员身份验证方法、装置及电子设备
CN110910882A (zh) * 2019-12-02 2020-03-24 苏州思必驰信息科技有限公司 一种哺乳工具及其控制方法
CN110992962B (zh) * 2019-12-04 2021-01-22 珠海格力电器股份有限公司 语音设备的唤醒调整方法、装置、语音设备及存储介质
CN111223490A (zh) * 2020-03-12 2020-06-02 Oppo广东移动通信有限公司 声纹唤醒方法及装置、设备、存储介质
CN111524528B (zh) * 2020-05-28 2022-10-21 Oppo广东移动通信有限公司 防录音检测的语音唤醒方法及装置
CN111785266A (zh) * 2020-05-28 2020-10-16 博泰车联网(南京)有限公司 一种语音交互方法及系统
CN112331197A (zh) * 2020-08-03 2021-02-05 北京京东尚科信息技术有限公司 电子设备的响应方法、响应装置、计算机系统及存储介质
CN112820273B (zh) * 2020-12-31 2022-12-02 青岛海尔科技有限公司 唤醒判别方法和装置、存储介质及电子设备
CN114648992A (zh) * 2022-03-28 2022-06-21 广州小鹏汽车科技有限公司 交互方法、车辆及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10290286A (ja) * 1997-04-17 1998-10-27 Sharp Corp 通信装置
JP2000165511A (ja) * 1998-11-26 2000-06-16 Nec Corp 携帯電話機および携帯電話機のダイヤルロック方法
JP2004120066A (ja) * 2002-09-24 2004-04-15 Matsushita Electric Ind Co Ltd 移動通信端末装置及びユーザ認証方法
JP2005283843A (ja) * 2004-03-29 2005-10-13 Nec Corp 電子機器、そのロック機能解除方法及びそのプログラム
JP2011048205A (ja) * 2009-08-27 2011-03-10 Kyocera Corp 電子機器
WO2013061783A1 (ja) * 2011-10-25 2013-05-02 京セラ株式会社 携帯端末およびロック制御方法
CN103198831A (zh) * 2013-04-10 2013-07-10 威盛电子股份有限公司 语音操控方法与移动终端装置
WO2013125916A1 (en) * 2012-02-24 2013-08-29 Samsung Electronics Co., Ltd. Method and apparatus for controlling lock/unlock state of terminal through voice recognition
US8543834B1 (en) * 2012-09-10 2013-09-24 Google Inc. Voice authentication and command

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102148899A (zh) * 2011-03-29 2011-08-10 广东欧珀移动通信有限公司 一种手机声控解锁方法
CN102546953A (zh) * 2012-02-07 2012-07-04 深圳市金立通信设备有限公司 一种全语音操控移动终端的系统及方法
KR20130133629A (ko) * 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
CN102750087A (zh) * 2012-05-31 2012-10-24 华为终端有限公司 控制语音识别功能的方法、装置和终端设备
US20140006825A1 (en) * 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
CN102932539B (zh) * 2012-10-22 2015-01-07 深圳市中兴移动通信有限公司 一种基于语音识别的终端及方法
CN103021413A (zh) * 2013-01-07 2013-04-03 北京播思软件技术有限公司 语音控制方法及装置
CN103269395B (zh) * 2013-04-22 2016-03-30 聚熵信息技术(上海)有限公司 基于锁屏状态下的语音控制方法及其装置
CN103309615A (zh) * 2013-06-21 2013-09-18 珠海市魅族科技有限公司 一种终端设备的控制方法和终端设备
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10290286A (ja) * 1997-04-17 1998-10-27 Sharp Corp 通信装置
JP2000165511A (ja) * 1998-11-26 2000-06-16 Nec Corp 携帯電話機および携帯電話機のダイヤルロック方法
JP2004120066A (ja) * 2002-09-24 2004-04-15 Matsushita Electric Ind Co Ltd 移動通信端末装置及びユーザ認証方法
JP2005283843A (ja) * 2004-03-29 2005-10-13 Nec Corp 電子機器、そのロック機能解除方法及びそのプログラム
JP2011048205A (ja) * 2009-08-27 2011-03-10 Kyocera Corp 電子機器
WO2013061783A1 (ja) * 2011-10-25 2013-05-02 京セラ株式会社 携帯端末およびロック制御方法
WO2013125916A1 (en) * 2012-02-24 2013-08-29 Samsung Electronics Co., Ltd. Method and apparatus for controlling lock/unlock state of terminal through voice recognition
JP2015509680A (ja) * 2012-02-24 2015-03-30 サムスン エレクトロニクス カンパニー リミテッド 音声認識を通じる端末機のロック/ロック解除状態を制御する方法及び装置
US8543834B1 (en) * 2012-09-10 2013-09-24 Google Inc. Voice authentication and command
CN103198831A (zh) * 2013-04-10 2013-07-10 威盛电子股份有限公司 语音操控方法与移动终端装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019054681A1 (ko) * 2017-09-13 2019-03-21 (주)파워보이스 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비
KR20190030081A (ko) * 2017-09-13 2019-03-21 (주)파워보이스 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비
KR102087202B1 (ko) * 2017-09-13 2020-03-10 (주)파워보이스 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비

Also Published As

Publication number Publication date
EP2899955A1 (en) 2015-07-29
WO2015070644A1 (zh) 2015-05-21
US20150141079A1 (en) 2015-05-21
EP2899955A4 (en) 2016-01-20
CN103595869A (zh) 2014-02-19

Similar Documents

Publication Publication Date Title
JP2016502829A (ja) 端末音声制御方法、装置、端末、およびプログラム
US11783825B2 (en) Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal
US9741343B1 (en) Voice interaction application selection
CN106653021B (zh) 语音唤醒的控制方法、装置及终端
TWI665584B (zh) 語音控制系統及方法
WO2017012511A1 (zh) 语音控制方法、装置及投影仪设备
CN107220532B (zh) 用于通过声音识别用户身份的方法及设备
WO2015074411A1 (zh) 一种终端解锁的方法、装置及终端
CN106250093A (zh) 先前捕捉的音频的检索机制
US9449163B2 (en) Electronic device and method for logging in application program of the electronic device
KR101909805B1 (ko) 지문 입력 정보의 처리 방법, 시스템 및 이동 단말기
EP3157003B1 (en) Terminal control method and device, voice control device and terminal
CN102868827A (zh) 一种利用语音命令控制手机应用程序启动的方法
US11178280B2 (en) Input during conversational session
CN105244025A (zh) 一种基于智能佩戴设备的语音识别方法及系统
CN103338311A (zh) 一种智能手机锁屏界面启动app的方法
CN111199733A (zh) 多级识别语音唤醒方法及装置、计算机存储介质及设备
CN110933345B (zh) 一种降低电视待机功耗的方法、电视机及存储介质
CN108093350B (zh) 麦克风的控制方法和麦克风
CN111862965A (zh) 唤醒处理方法、装置、智能音箱及电子设备
WO2021004236A1 (zh) 一种语音控制方法、系统、设备及计算机可读存储介质
WO2017024835A1 (zh) 语音识别方法及装置
US9894193B2 (en) Electronic device and voice controlling method
CN104503736A (zh) 一种信息提示方法及装置
CN103856642A (zh) 一种探测方法及系统

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160905

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170207