JP6811755B2

JP6811755B2 - 読話による音声ウェイクアップ方法、装置、設備及びコンピュータ可読媒体、プログラム

Info

Publication number: JP6811755B2
Application number: JP2018167824A
Authority: JP
Inventors: リヤーン・ガオ
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-01-22
Filing date: 2018-09-07
Publication date: 2021-01-13
Anticipated expiration: 2038-09-07
Also published as: CN108154140A; US10810413B2; US20190228212A1; JP2019128938A

Description

本発明は、音声ウェイクアップ技術分野に関し、特に読話による音声ウェイクアップ方法、装置、設備及びコンピュータ可読媒体、プログラムに関する。

音声認識能力の向上に伴い、ますます多くのスマート設備にも音声認識が応用されてきた。基本的に、従来のスマート設備の音声対話態様に使用されるのは音声ウェイクアップワードによる音声対話である。音声機能をウェイクアップする具体的な動作は、一般的に、一定のウェイクアップワード、例えば「度ちゃん、度ちゃん」、「Ａｌｅｘａ」等で音声対話設備をウェイクアップさせる。音声対話設備で認識を開始し、更にユーザーと音声対話を行う。

ところが、従来の音声ウェイクアップ態様は、音声対話をするたびにウェイクアップワードを一回言う必要がある。ウェイクアップワードを繰り返し言うと、ユーザーに悪い経験を与えてしまう。

従来技術における以上の技術的問題を解決又は緩和するために、本発明の実施例は読話による音声ウェイクアップ方法、装置、設備及びコンピュータ可読媒体を提供する。

第一態様において、本発明の実施例は読話による音声ウェイクアップ方法を提供し、
ユーザーの唇の変化画像を収集するステップと、
ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断するステップと、
ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップするステップと、を含む。

第一態様と合わせて、本発明の第一態様の第一実現形態において、ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断する前記ステップは、具体的に、唇の変化画像が唇の正面画像であるかどうかを判断し、ＹＥＳの場合、唇の変化画像がプリセット変化画像と同じであるかどうかを判断することを含む。

第一態様と合わせて、本発明の第一態様の第二実現形態において、前記プリセット変化画像は唇が閉鎖状態から開放状態まで変化する。

第一態様と合わせて、本発明の第一態様の第三実現形態において、ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップする前記ステップの後、更に、ユーザーの音声を受信して、前記音声が有効音声情報であるかどうかを判断し、ＹＥＳの場合、応答動作を実行し、ＮＯの場合、音声対話機能をオフにすることを含む。

第二態様において、本発明の実施例は読話による音声ウェイクアップ装置を提供し、
ユーザーの唇の変化画像を収集するための収集モジュールと、
ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断するための画像判断モジュールと、
ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップするためのウェイクアップモジュールと、を備える。

第二態様と合わせて、本発明の第二態様の第一実現形態において、前記画像判断モジュールは具体的に、唇の変化画像が唇の正面画像であるかどうかを判断することに用いられ、ＹＥＳの場合、唇の変化画像がプリセット変化画像と同じであるかどうかを判断する。

第二態様と合わせて、本発明の第二態様の第二実現形態において、前記プリセット変化画像は唇が閉鎖状態から開放状態まで変化する。

第二態様と合わせて、本発明の第二態様の第三実現形態において、更に音声判断モジュールを備え、前記音声判断モジュールはユーザーの音声を受信して、前記音声が有効音声情報であるかどうかを判断することに用いられ、ＹＥＳの場合、応答動作を実行し、ＮＯの場合、音声対話機能をオフにする。

前記装置の機能をハードウェアで実現してもよいし、ハードウェアで対応するソフトウェアを実行することで実現してもよい。前記ハードウェア又はソフトウェアは上記機能に対応する１つ又は複数のモジュールを含む。

可能な一設計において、読話による音声ウェイクアップ装置の構造はプロセッサ及びメモリを備え、前記メモリは読話による音声ウェイクアップ装置が上記第一態様における読話による音声ウェイクアップ方法を実行することをサポートするプログラムを記憶することに用いられ、前記プロセッサが前記メモリに記憶されるプログラムを実行するように配置される。前記読話による音声ウェイクアップ装置は読話による音声ウェイクアップ装置をほかの設備又は通信ネットワークと通信させるための通信インターフェースを更に備えてもよい。

第三態様において、本発明の実施例は、読話による音声ウェイクアップ装置に使用されるコンピュータソフトウェア命令を記憶することに用いられ、前記コンピュータソフトウェア命令が上記第一態様の読話による音声ウェイクアップ方法を実行するために関するプログラムを含むコンピュータ可読媒体を提供する。

上記技術案のうち一つの技術案は、本発明の実施例において明確なウェイクアップワードを言わずにスマート音声対話装置をウェイクアップさせることができ、それにより音声ウェイクアップを更にスマート化し、ユーザーと音声装置との対話に役立つという利点又は有益な効果を有する。

上記概説は明細書の目的のために説明されたが、何らかの形態で本発明を限定するものではない。上記例示的な態様、実施形態及び特徴に加えて、図面及び以下の詳細な説明を参照することによって、本発明のさらなる態様、実施形態及び特徴は分かりやすくなる。

図面では、特に断りがない限り、複数の図面に亘って同じ符号で同一又は類似する部材又は要素を示す。これらの図面は必ずしも一定の比例に応じて描かれているとは限らない。理解すべきなのは、これらの図面は本発明開示のいくつかの実施形態を描いているためのものであり、本発明の範囲を制限するためのものであると見なされるべきではない。

実施例１に係る読話による音声ウェイクアップ方法のフローチャートである。実施例１に係る唇閉鎖時の模式図である。実施例１に係る唇開放時の模式図である。実施例２に係る読話による音声ウェイクアップ方法のフローチャートである。実施例３に係る読話による音声ウェイクアップ装置の接続ブロック図である。実施例４に係る読話による音声ウェイクアップ装置の接続ブロック図である。実施例５に係る読話による音声ウェイクアップ設備の接続ブロック図である。

以下、ある例示的な実施例を簡単に説明する。当業者が認識できる通り、本発明の趣旨又は範囲を逸脱せずに、種々の異なる態様で説明された実施例を修正することができる。従って、図面及び説明が実質的に例示的なものであって、制限的なものではないと見なされている。

本発明の実施例の目的は、従来技術における、音声ウェイクアップを行う時にウェイクアップワードを一回言う必要があるという技術的問題を解決することである。本発明の実施例は主にジェスチャーで音声ウェイクアップを行い、これから、以下の実施例によって技術案をそれぞれ詳しく説明する。

実施例１

図１は本発明の実施例１に係る読話による音声ウェイクアップ方法のフローチャートである。本実施例１は読話による音声ウェイクアップ方法を提供し、以下のステップを含む。

Ｓ１１０では、ユーザーの唇の変化画像を収集する。

ユーザーがあるスマート設備に対して音声対話機能を起動する必要がある場合、スマート設備のカメラに面して直接話してもよく、この時、カメラによってユーザーの唇の画像をリアルタイムに収集することができる。

Ｓ１２０では、ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断する。

受信されたユーザーの唇の変化画像に基づいて判断し、プリセット変化画像と比較して、一致するかどうかを判断してもよい。また、ユーザーがほかの人と話す可能性があるため、この時、ユーザーがスマート設備に面して音声入力を行っているかどうかを判断する必要がある。従って、本実施例において、更に収集されたユーザーの唇の画像が唇の正面画像であるかどうかを判断する必要があり、ＹＥＳの場合、唇の変化画像がプリセット変化画像に一致するかどうかを更に判断する。

本実施例に記載の一致する唇の変化画像は必ずしも完全に同じであるとは限らず、同じ動作をすればよい。例えば、図２〜３はそれぞれ本実施例に係る唇閉鎖時及び唇開放時の模式図である。本実施例において、プリセット唇の変化画像は唇が閉鎖状態から開放状態まで変化してもよい。

Ｓ１３０では、ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップする。

この時、ユーザーの唇の変化画像がプリセット画像に一致する場合、ユーザーがスマート設備と音声通話をしたがると説明され、この時、スマート設備が音声対話機能をウェイクアップする。この場合、ユーザーが余計なウェイクアップ動作をしなくても、直接音声対話をすることができる。

実施例２

実施例１との相違点は、本実施例２において、音声対話機能をウェイクアップした後、更にユーザーの入力した音声情報が有効音声情報であるかどうかを判断することであり、具体案は以下のとおりである。

図４は本実施例２に係る読話による音声ウェイクアップ方法のフローチャートである。本実施例２における読話による音声ウェイクアップ方法は以下のステップを含む。

Ｓ２１０では、ユーザーの唇の変化画像を収集する。

Ｓ２２０では、ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断する。

受信されたユーザーの唇の変化画像に基づいて判断し、プリセット変化画像と比較して、一致するかどうかを判断してもよい。また、ユーザーがほかの人と話す可能性があるため、この時、ユーザーがスマート設備に面して音声入力を行っているかどうかを判断する必要がある。従って、本実施例において、更に収集されたユーザーの唇の画像が唇の正面画像であるかどうかを判断する必要があり、ＹＥＳの場合、唇の変化画像がプリセット変化画像に一致するかどうかを更に判断する。本実施例において、プリセット唇の変化画像は唇が閉鎖状態から開放状態まで変化してもよい。

Ｓ２３０では、ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップする。

Ｓ２４０では、ユーザーの音声を受信して、前記音声が有効音声情報であるかどうかを判断し、ＹＥＳの場合、応答動作を実行し、ＮＯの場合、音声対話機能をオフにする。

ユーザーの唇が閉鎖状態から開放状態に変える場合、音声対話機能をウェイクアップする。この時、更にユーザーが有効音声情報を入力したかどうかを検出する必要がある。ユーザーの唇が変化する時には必ずしも話したがるとは限らず、「あくびしたがる」又は「何か食べたがる」場合もある。このため、ユーザーが有効音声情報を入力していないと検出する場合、音声ウェイクアップ機能をオフにする。

本実施例２におけるステップＳ２１０〜Ｓ２３０は実施例１と同様であり、詳細な説明は省略する。

実施例３

本実施例３は実施例１に対応し、読話による音声ウェイクアップ装置を提供する。図５は本実施例３に係る読話による音声ウェイクアップ装置の接続ブロック図である。

本実施例３における読話による音声ウェイクアップ装置は、
ユーザーの唇の変化画像を収集するための収集モジュール１１０と、
ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断するための画像判断モジュール１２０と、
ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップするためのウェイクアップモジュール１３０と、を備える。

前記画像判断モジュール１２０は、具体的に、唇の変化画像が唇の正面画像であるかどうかを判断することに用いられ、ＹＥＳの場合、唇の変化画像がプリセット変化画像と同じであるかどうかを判断する。本実施例において、前記プリセット変化画像は唇が閉鎖状態から開放状態まで変化する。

本実施例３は実施例１の原理と同様であり、詳細な説明は省略する。

実施例４

本実施例４は実施例２に対応し、読話による音声ウェイクアップ装置を提供し、具体的に、以下のとおりである。

図６は本実施例４に係る読話による音声ウェイクアップ装置の接続ブロック図である。本発明の実施例４は読話による音声ウェイクアップ装置を提供し、
ユーザーの唇の変化画像を収集するための収集モジュール２１０と、
ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断するための画像判断モジュール２２０と、
ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップするためのウェイクアップモジュール２３０と、
ユーザーの音声を受信して、前記音声が有効音声情報であるかどうかを判断することに用いられ、ＹＥＳの場合、応答動作を実行し、ＮＯの場合、音声対話機能をオフにする音声判断モジュール２４０と、を備える。

前記画像判断モジュール２２０は、具体的に、唇の変化画像が唇の正面画像であるかどうかを判断することに用いられ、ＹＥＳの場合、唇の変化画像がプリセット変化画像と同じであるかどうかを判断する。本実施例において、前記プリセット変化画像は唇が閉鎖状態から開放状態まで変化する。

本実施例４の応用形態及び原理は実施例２と同様であり、詳細な説明は省略する。

実施例５

本発明の実施例５は読話による音声ウェイクアップ設備を提供し、図７に示すように、該設備は、メモリ３１０及びプロセッサ３２０を備え、メモリ３１０にプロセッサ３２０で実行できるコンピュータプログラムが記憶される。前記プロセッサ３２０が前記コンピュータプログラムを実行する時、上記実施例における読話による音声ウェイクアップ方法を実現する。前記メモリ３１０及びプロセッサ３２０の数が１つ又は複数であってもよい。

該設備は、更に、
外部設備と通信し、データの対話式伝送を行うための通信インターフェース３３０を備える。

メモリ３１０は高速ＲＡＭメモリを含んでもよいし、更に不揮発性メモリ（ｎｏｎ−ｖｏｌａｔｉｌｅｍｅｍｏｒｙ）、例えば少なくとも１つの磁気ディスク記憶装置を含んでもよい。

メモリ３１０、プロセッサ３２０及び通信インターフェース３３０が独立して実現される場合、メモリ３１０、プロセッサ３２０及び通信インターフェース３３０がバスを介して互いに接続されて相互間の通信を実現することができる。前記バスはインダストリ・スタンダード・アーキテクチャ（ＩＳＡ、ＩｎｄｕｓｔｒｙＳｔａｎｄａｒｄＡｒｃｈｉｔｅｃｔｕｒｅ）バス、ペリフェラル・コンポーネント・インターコネクト（ＰＣＩ、ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ）バス又は拡張インダストリ・スタンダード・アーキテクチャ（ＥＩＳＡ、ＥｘｔｅｎｄｅｄＩｎｄｕｓｔｒｙＳｔａｎｄａｒｄＡｒｃｈｉｔｅｃｔｕｒｅ）バス等であってもよい。前記バスをアドレスバス、データバス、制御バス等に分けてもよい。容易に示すために、図７に一本のみの太線で示すが、一本のみのバス又は１つのみのタイプのバスがあると示すことではない。

好ましくは、具体的に実現する時、メモリ３１０、プロセッサ３２０及び通信インターフェース３３０が一枚のチップに統合される場合、メモリ３１０、プロセッサ３２０及び通信インターフェース３３０が内部インターフェースを介して相互間の通信を実現することができる。

本明細書の説明において、参照用語「一実施例」、「いくつかの実施例」、「例」、「具体例」、又は「いくつかの例」等の説明とは該実施例又は例を参照しながら説明された具体的な特徴、構造、材料又は特徴が本発明の少なくとも１つの実施例又は例に含まれることを意味する。且つ、説明された具体的な特徴、構造、材料又は特徴はいずれか又は複数の実施例又は例で適切な態様で結合してもよい。また、矛盾しない限り、当業者は本明細書に説明された異なる実施例又は例及び異なる実施例又は例の特徴を結合する及び組み合わせることができる。

また、用語「第１」、「第２」は説明目的でのみ使用されており、相対重要性を指示又は示唆したり、指示した技術的特徴の数を黙示的に指示したりするものではない。従って、「第１」、「第２」を付けて定義された特徴は少なくとも１つの該特徴を明示的又は黙示的に含むと理解できる。本発明の説明において、「複数」は、特に断らない限り、２つ又は２つ以上を意味する。

当業者は、フローチャート又はここでほかの態様で説明された任意の過程又は方法についての説明が、特定の論理機能又は過程を実現するための１つ又はそれ以上のステップを含む実行可能命令コードのモジュール、セグメント又は一部を示すと理解されてもよく、且つ本発明の好適な実施形態の範囲はほかの実現を含み、図示又は検討された順序ではなく、関わる機能に応じて基本同時の態様又は逆順序で機能を実行してもよいことを理解すべきである。

フローチャートに示し又はここでほかの態様で説明された論理及び／又はステップは、例えば、論理機能を実現するための実行可能命令の順番付けリストであると見なされてもよく、具体的に任意のコンピュータ可読媒体で命令実行システム、装置又は設備（例えばコンピュータに基づくシステム、プロセッサを備えるシステム又は命令実行システム、装置又は設備から命令を取得して命令を実行することができるほかのシステム）に使用されてもよく、又はこれらの命令実行システム、装置又は設備と合わせて使用されてもよい。本明細書は、「コンピュータ可読媒体」がプログラムを包含、記憶、通信、伝播又は伝送することにより命令を実行するためのシステム、装置又は設備又はこれらの命令実行システム、装置又は設備を合わせて使用する任意の装置であってもよい。

本発明の実施例に記載のコンピュータ可読媒体はコンピュータ可読信号媒体又はコンピュータ可読記憶媒体又は上記２つの組み合わせであってもよい。コンピュータ可読記憶媒体のさらなる具体例は少なくとも（非網羅的リスト）１つ又は複数の配線を有する電気接続部（電子装置）、ポータブルコンピュータケース（磁気装置）、ランダムアクセスメモリ（ＲＡＭ）、リードオンリメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバー装置、及びポータブルリードオンリメモリ（ＣＤＲＯＭ）を含む。また、例えば用紙又はほかの媒体を光学的に走査し、次に編集、解釈し又は必要な時にほかの適切な態様で処理して電子態様で前記プログラムを取得し、次にそれをコンピュータメモリに記憶することができるため、コンピュータ可読記憶媒体は更にその上に前記プログラムを印刷できる用紙又はほかの適切な媒体であってもよい。

本発明の実施例において、コンピュータ可読プログラムコードを運ぶコンピュータ可読信号媒体がベースバンド、又は搬送波の一部として伝播するデータ信号に含まれてもよい。このような伝播するデータ信号は様々な形態を用いてもよく、電磁信号、光信号又は上記任意の適切な組み合わせを含むが、それらに限らない。コンピュータ可読信号媒体は更にコンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であってもよく、該コンピュータ可読媒体は命令実行システム、入力法又はデバイスに使用され又はそれと合わせて使用されるためのプログラムを送信、伝播又は伝送することができる。コンピュータ可読媒体に含まれるプログラムコードは任意の適切な媒体で伝送されてもよく、上記媒体は無線、電線、光ケーブル、無線周波数（ＲａｄｉｏＦｒｅｑｕｅｎｃｙ、ＲＦ）等、又は上記任意の適切な組み合わせを含むが、それらに限らない。

理解すべきなのは、本発明の各部分はハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせで実現されてもよい。上記実施形態において、複数のステップ又は方法はメモリに記憶されて適切な命令実行システムで実行するソフトウェア又はファームウェアにより実現されてもよい。例えば、ハードウェアにより実現される場合は、別の実施形態と同様に、データ信号に対して論理機能を実現するための論理ゲート回路を有する離散論理回路、適切な組み合わせ論理ゲート回路を有する特定用途向け統合回路、プログラマブルゲートアレイ（ＰＧＡ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）等の本分野で公知の技術のいずれか一項又はそれらの組み合わせにより実現されてもよい。

当業者は、上記実施例方法におけるステップの全部又は一部を実現するために、プログラムによって関連するハードウェアを命令することにより完了することができ、前記プログラムが一種のコンピュータ可読記憶媒体に記憶されてもよく、該プログラムが実行時に方法実施例における１つのステップ又はその組み合わせを含むと理解される。

また、本発明の各実施例における各機能ユニットが１つの処理モジュールに統合されてもよく、各ユニットが独立して物理的に存在してもよく、２つ又は２つ以上のユニットが１つのモジュールに統合されてもよい。上記統合されたモジュールはハードウェアの形で実現されてもよいし、ソフトウェア機能モジュールの形で実現されてもよい。前記統合されたモジュールはソフトウェア機能モジュールの形で実現されて独立した製品として販売又は使用される時、１つのコンピュータ可読記憶媒体に記憶されてもよい。前記記憶媒体はリードオンリメモリ、磁気ディスク又は光ディスク等であってもよい。

要するに、本発明の実施例は明確なウェイクアップワードを言わずにスマート音声対話設備をウェイクアップさせることができ、それにより音声ウェイクアップを更にスマート化し、ユーザーと音声設備との対話に役立つ。

以上の説明は本発明の具体的な実施形態であって、本発明の保護範囲はこれに限らず、当業者が本発明に開示された技術的範囲内に、容易に想到し得る種々の変更又は置換は、いずれも本発明の保護範囲内に含まれるべきである。従って、本発明の保護範囲は前記特許請求の保護範囲に準じる。

１１０収集モジュール
１２０画像判断モジュール
１３０ウェイクアップモジュール
２１０収集モジュール
２２０画像判断モジュール
２３０ウェイクアップモジュール
２４０音声判断モジュール
３１０メモリ
３２０プロセッサ
３３０通信インターフェース

Claims

読話による音声ウェイクアップ方法であって、
ユーザーの唇の変化画像を収集するステップと、
ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断するステップと、
ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップするステップと、
ユーザーの音声を受信して、前記音声が有効音声情報であるかどうかを判断し、前記音声が有効音声情報ではない場合、前記音声対話機能をオフにするステップと、
を含むことを特徴とする読話による音声ウェイクアップ方法。
ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断する前記ステップは、
唇の変化画像が唇の正面画像であるかどうかを判断することと、
ＹＥＳの場合、唇の変化画像がプリセット変化画像と同じであるかどうかを判断することと、を含むことを特徴とする請求項１に記載の読話による音声ウェイクアップ方法。
前記プリセット変化画像は唇が閉鎖状態から開放状態まで変化することを特徴とする請求項１に記載の読話による音声ウェイクアップ方法。
読話による音声ウェイクアップ装置であって、
ユーザーの唇の変化画像を収集するための収集モジュールと、
ユーザーの唇の変化画像がプリセット変化画像に一致するかどうかを判断するための画像判断モジュールと、
ユーザーの唇の変化画像がプリセット変化画像に一致する場合、音声対話機能をウェイクアップするためのウェイクアップモジュールと、
ユーザーの音声を受信して、前記音声が有効音声情報であるかどうかを判断し、前記音声が有効音声情報ではない場合、前記音声対話機能をオフにするための音声判断モジュールと、
を含むことを特徴とする読話による音声ウェイクアップ装置。
前記画像判断モジュールは唇の変化画像が唇の正面画像であるかどうかを判断することに用いられ、ＹＥＳの場合、唇の変化画像がプリセット変化画像と同じであるかどうかを判断することを特徴とする請求項４に記載の読話による音声ウェイクアップ装置。
前記プリセット変化画像は唇が閉鎖状態から開放状態まで変化することを特徴とする請求項４に記載の読話による音声ウェイクアップ装置。
読話による音声ウェイクアップ設備であって、
１つ又は複数のプロセッサと、
１つ又は複数のプログラムを記憶するための記憶装置と、を備え、
前記１つ又は複数のプログラムが前記１つ又は複数のプロセッサにより実行される場合、前記１つ又は複数のプロセッサに請求項１〜３のいずれか一項に記載の読話による音声ウェイクアップ方法を実現させることを特徴とする読話による音声ウェイクアップ設備。
コンピュータプログラムを記憶するコンピュータ可読媒体であって、
該プログラムがプロセッサにより実行される場合、請求項１〜３のいずれか一項に記載の読話による音声ウェイクアップ方法を実現することを特徴とするコンピュータ可読媒体。
コンピュータにおいて、プロセッサにより実行される場合、請求項１〜３のいずれか一項に記載の読話による音声ウェイクアップ方法を実現することを特徴とするプログラム。