JP7190982B2

JP7190982B2 - 音声ベースのメカニズムに基づくスマート表示装置のディスプレイ停止の方法及びシステム

Info

Publication number: JP7190982B2
Application number: JP2019127670A
Authority: JP
Inventors: ヤオ，シュチェン
Original assignee: Baidu USA LLC
Current assignee: Baidu USA LLC
Priority date: 2018-12-28
Filing date: 2019-07-09
Publication date: 2022-12-16
Anticipated expiration: 2039-07-09
Also published as: CN111383634B; KR102223268B1; US10817246B2; CN111383634A; JP2020109608A; KR20200083154A; US20200210139A1

Description

本発明の実施形態は、概してスマート表示装置に関する。本発明の実施形態は、より具体的に、音声ベースのメカニズムに基づいてスマート表示装置のディスプレイを停止させることに関する。

グーグルホーム（ＧｏｏｇｌｅＨｏｍｅ）スマートディスプレイまたはアマゾンエコーショー（ＡｍａｚｏｎＥｃｈｏＳｈｏｗ）のようなスマート表示装置は、情報をユーザに提示するための一体型ディスプレイまたはタッチスクリーンディスプレイを含む音声アシスタントスマートスピーカであってもよい。スマート表示装置のユーザからの音声コマンド、またはタッチスクリーンディスプレイを介したコマンドの物理的入力によって、スマートデバイスにコマンドおよび命令を発する。そして、スマート表示装置のディスプレイは、受信されたコマンドに基づいてディスプレイを介してユーザに情報を提示することができる。

本発明は、音声ベースのメカニズムに基づくスマート表示装置のディスプレイ停止の方法及びシステムを開示する。

本発明の一実施形態として、特徴に基づいてスマート表示装置を制御するためのコンピュータ実施方法を開示する。当該方法は、前記スマート表示装置に関連付けられる音声に対応する信号を音声キャプチャ装置から受信するステップと、機械学習モデルを実行する処理装置により、前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップと、前記解析により前記スマート表示装置の前記ディスプレイを停止すると判定されたことに応答して、前記スマート表示装置の前記ディスプレイを停止するステップと、を含む。

本発明の一実施形態として、命令が格納されている非一時的機械可読媒体を開示する。前記命令がプロセッサにより実行されると、前記プロセッサにスマート表示装置に関連付けられる音声に対応する信号を音声キャプチャ装置から受信するステップと、機械学習モデルにより、前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップと、前記解析により前記スマート表示装置の前記ディスプレイを停止すると判定されたことに応答して、前記スマート表示装置の前記ディスプレイを停止するステップと、を含む動作を実行させる。

本発明の一実施形態として、システムを開示する。当該システムは、
プロセッサと、命令を格納するために前記プロセッサに接続されるメモリとを備え、前記命令が前記プロセッサにより実行されると、前記プロセッサにスマート表示装置に関連付けられる音声に対応する信号を音声キャプチャ装置から受信するステップと、機械学習モデルを実行する処理装置により、前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップと、前記解析により前記スマート表示装置の前記ディスプレイを停止すると判定されたことに応答して、前記スマート表示装置の前記ディスプレイを停止するステップと、を含む動作を実行させる。

本発明の実施例は、図面の各図において限定的ではなく例示的な形態で示され、図面における類似の符号が類似の素子を示す。
一実施例に係るスマート表示装置のディスプレイコントローラの一例を示すブロック図である。一実施例に係るネットワーク構成を示すブロック図である。実施例に係るスマート表示装置のディスプレイを停止するか否かを判定するためにアルゴリズム制御モジュールに提供される特徴の一例を示す図である。一実施例に係るディスプレイのオフタイム平滑化のプロセスを示すフローチャートである。実施例に係る複数の音源からの受音角度を利用してスマート表示装置のディスプレイを停止するか否かを判定する一例を示す図である。一実施例に係る着信音（ｉｎｃｏｍｉｎｇｓｏｕｎｄ）に関連する信号の特徴に基づいてスマート表示装置のディスプレイを停止すると判定するプロセスを示すフローチャートである。一実施例に係るデータ処理システムを示すブロック図である。

以下に説明される詳細を参照しながら本発明の様々な実施例および態様を説明し、添付図面に前記様々な実施例を示す。以下の説明及び図面は、本発明を説明するためのものであり、本発明を限定するものではないことを理解されたい。本発明の様々な実施例を完全に把握するために、多数の特定の詳細を説明する。なお、本発明の実施例を簡潔的に説明するように、周知または従来技術の詳細について説明していない場合もある。

本明細書において、「一実施例」又は「実施例」とは、当該実施例を参照しながら説明された特定の特徴、構造又は特性が本発明の少なくとも１つの実施例に包含されてもよいことを意味する。「一実施例では」という表現は、本明細書の全体において全てが同一の実施例を指すとは限らない。

ところで、本発明の実施例は、音声ベースのメカニズムに基づいてスマート表示装置のディスプレイを停止するスマート表示装置を提供する。通常、スマート表示装置は、スマート表示装置の電源が入っている限り、そのディスプレイを停止しない。スマート表示装置は通常、ユーザが現場にいるか否かにかかわらず、ディスプレイ上に情報を連続的に表示する。しかしながら、場合によって、スマート表示装置のユーザは、スマート表示装置のディスプレイを停止する（例えば、オフにする）ことを望む場合がある。例えば、ユーザは、ディスプレイをオフにすることによってスマート表示装置の電力消費量を減らすことを望む可能性がある。別の例では、ユーザが家を出るか眠りにつくとき、ディスプレイをオフにしたい可能性がある。従って、デバイスのユーザは、「スクリーンオフ」などの音声コマンドを提供するか、またはスマート表示装置のタッチスクリーンを介してディスプレイを停止するための入力を提供することができる。スマート表示装置のディスプレイを停止するためのこれらの方法は、面倒で非効率的であり、特定の状況下では無効である可能性がある。

本発明のシステムの実施例および方法は、音声ベースのメカニズムに基づいてスマート表示装置のディスプレイを停止するか否かを判定することによって、その問題に対する解決策を提供する。スマート表示装置は、マイクロホンなどの音声キャプチャ装置を含むことができ、音声キャプチャ装置は、スマート表示装置の周囲環境から入ってくる音声をキャプチャして、キャプチャされた音声に対応する信号を生成することができる。音声キャプチャ装置は、着信音に対応する信号をスマート表示装置のディスプレイコントローラに提供する。

ディスプレイコントローラは、機械学習モデルを用いて信号の特徴を解析して、スマート表示装置のディスプレイを停止するか否かを判定する。ディスプレイコントローラによって解析可能な特徴の例は、音圧、音圧の変化、スマート表示装置に対する音源の角度、および信号に含まれる任意の音声活動を含むが、これらに限定されない。前記特徴は、スマート表示装置のディスプレイを停止するか否かを判定するように機械学習モデルへの入力として利用されてもよい。機械学習モデルが特徴の解析に基づいてディスプレイを停止すると判定した場合、ディスプレイコントローラはスマート表示装置のディスプレイを停止することができる。例えば、ディスプレイコントローラは、ディスプレイを停止する信号をディスプレイに送信することができる。

従って、機械学習モデルにおいて、音声キャプチャ装置によってキャプチャされた音声に対応する信号の特徴を使用することによって、スマート表示装置のディスプレイコントローラは、スマート表示装置のディスプレイをいつ停止するかをインテリジェントに判定することができ、これによりスマート表示装置の電力消費量が低減される。また、スマート表示装置のディスプレイをいつ停止するかをインテリジェントに判定することによって、ユーザはディスプレイを停止するための音声コマンドまたは物理的入力を提供する必要がなくなり、スマート表示装置のユーザーエクスペリエンスが向上される。

図１は、一実施例に係るスマート表示装置１００のディスプレイコントローラの一例を示すブロック図である。図１を参照すると、スマート表示装置１００は、音声キャプチャ装置１０５およびディスプレイ１５０に動作可能に接続されたディスプレイコントローラ１１０を含むが、これらに限定されない。ディスプレイコントローラ１１０は、ソフトウェア、ハードウェア、またはそれらの組み合わせで実現されてもよい。例えば、ディスプレイコントローラ１１０の構成要素の少なくとも一部は、メモリ（例えば、ダイナミックＲＡＭ（ＤＲＡＭ）などのランダムアクセスメモリ（ＲＡＭ）にロードされ、スマート表示装置１００（図示せず）の１つまたは複数のプロセッサ（例えば、中央処理装置（ＣＰＵ）または汎用処理装置（ＧＰＵ）などのマイクロプロセッサ）の処理ロジックによって実行されてもよい。ディスプレイ１５０は、ディスプレイコントローラ１１０から起動および停止するための信号を受信するように構成された任意の種類のディスプレイ（例えば、タッチスクリーンディスプレイ）であってもよい。

音声キャプチャ装置１０５は、着信音をキャプチャし、キャプチャされた音声に基づいて信号を生成し、その信号をディスプレイコントローラ１１０に送信するように構成されることができる。実施例では、音声キャプチャ装置１０５は、ディスプレイコントローラ１１０に動作可能に接続されるマイクロホンであってもよい。実施例では、音声キャプチャ装置１０５は、単一のマイクロホンであってもよい。いくつかの実施例では、音声キャプチャ装置１０５は、複数のマイクロホンであってもよい。例えば、音声キャプチャ装置１０５は、線形、三角形、正方形または円形のレイアウトで配置された２～８個のマイクロホンからなるマイクロホンアレイであってもよい。

ディスプレイコントローラ１１０は、音圧測定モジュール１１５を含んでもよい。音圧測定モジュール１１５は、送信された信号を利用して、音声キャプチャ装置１０５によって受信された音声の音圧を測定するように構成されることができる。実施例では、音圧測定モジュール１１５は、複数の期間にわたって音圧を測定することができる。実施例では、音圧測定モジュール１１５は、測定された複数の期間の音圧に関連する分布統計を確定することができる。例えば、音圧測定モジュール１１５は、複数の期間にわたる音圧値の平均値および／または標準偏差を確定することができる。

ディスプレイコントローラ１１０は、音圧差モジュール１２０を含むことができる。音圧差モジュール１２０は、音声キャプチャ装置１０５によって受信された現在の音圧レベルと、以前に確定された音圧レベルとの間の差を確定するように構成されることができる。実施例では、音圧差モジュール１２０は、現在の音圧レベルと、音圧測定モジュール１１５によって以前に測定された音圧レベルとの間の差を確定することができる。例えば、音圧差モジュール１２０は、現在の音圧レベルと、前述したように音圧測定モジュール１１５によって測定された期間内にわたる音圧の平均値との間の差を確定することができる。

ディスプレイコントローラ１１０は、受音角度確定モジュール１２５をさらに含むことができる。受音角度確定モジュール１２５は、音声キャプチャ装置１０５によって受信された音声の音源の音声キャプチャ装置１０５に対する角度を確定するように構成されることができる。例えば、実施例では、音声キャプチャ装置１０５は、複数のマイクロホンを含んでいてもよい。複数のマイクロホンからの音声に対応する受信信号を互いに比較して、複数のマイクロホンに対する音源の角度を確定することができる。

ディスプレイコントローラ１１０は、音声活動モジュール１３０を含むことができる。音声活動モジュール１３０は、受信信号に基づいて、着信音が音声活動を含むか否かを判定するように構成されることができる。例えば、音声活動モジュール１３０は、受信信号がスマート表示装置１００に対する音声コマンドを含むか否かを判定することができる。実施例では、音声活動モジュール１３０は、受信信号に音声活動が含まれている可能性に対応する信頼スコアを確定することができる。例えば、音声活動モジュール１３０は、受信信号に音声活動が含まれている可能性に対応する０．０～１．０の範囲の信頼スコアを確定することができ、ここでは、０．０は、受信信号に音声活動が含まれている可能性が最も低いことを表し、１．０は、受信信号に音声活動が含まれている可能性が最も高いことを表すことができる。

いくつかの実施例では、音声活動モジュール１３０は、着信音に関連する一組のユーザのうちの特定のユーザを識別するように構成されてもよい。当該一組のユーザのうちの各ユーザは、その後に各ユーザからの音声コマンドを識別するように、音声活動モジュール１３０によって利用されるべき１つまたは複数の音声サンプルを提供することができる。例えば、ユーザＡがスマート表示装置１００に後続の音声コマンドを提供すると、音声活動モジュール１３０は、音声サンプルを使用して音声コマンドを識別し、音声コマンドがユーザＡによって提供されたと判定することができる。

実施例では、音圧測定モジュール１１５、音圧差モジュール１２０、受音角度確定モジュール１２５、および／または音声活動モジュール１３０は並行して動作することができる。いくつかの実施例では、音圧測定モジュール１１５、音圧差モジュール１２０、受音角度確定モジュール１２５、および／または音声活動モジュール１３０は、順次に動作することができる。例えば、音圧差モジュール１２０はデータを受音角度確定モジュール１２５に提供し、受音角度確定モジュール１２５はデータを音声活動モジュール１３０に提供することができる。

ディスプレイコントローラ１１０は、画面状態モジュール１４０を含んでもよい。画面状態モジュール１４０は、ディスプレイ１５０の出力を起動（例えば、オンに）するか、または停止（例えば、オフに）するかを指示するように構成されてもよい。ディスプレイコントローラ１１０は、オフタイム平滑化モジュール１４５をさらに含んでもよい。オフタイム平滑化モジュール１４５は、ディスプレイ１５０の起動および／または停止の頻度を決定するように構成されてもよい。

ディスプレイコントローラ１１０は、アルゴリズム制御モジュール１３５を更に含んでもよい。アルゴリズム制御モジュール１３５は、音圧測定モジュール１１５、音圧差モジュール１２０、受音角度確定モジュール１２５、および／または音声活動モジュール１３０からデータを受信することができる。アルゴリズム制御モジュール１３５は、受信されたデータに基づいて、スマート表示装置１００のディスプレイ１５０を起動および／または停止するか否かを判定するように構成されてもよい。実施例では、アルゴリズム制御モジュール１３５は、機械学習モデルを利用して、ディスプレイ１５０を起動および／または停止するか否かを判定し、信頼スコアを確定することが可能である。実施例では、図２で更に詳細に説明するように、リモートサーバから機械学習モデルを受信することができる。アルゴリズム制御モジュール１３５によって利用可能な機械学習モデルの一例としては、線形モデル、非線形モデル、浅層モデルおよび深層モデルを含むが、それらに限定されない。アルゴリズム制御モジュール１３５がディスプレイ１５０の起動／停止を決定すると、ディスプレイコントローラ１１０は、ディスプレイ１５０に信号を送信し、上記決定に基づいてディスプレイ１５０を停止することができる。

図２は、一実施例に係るネットワーク構成２００を示すブロック図である。図２を参照すると、ネットワーク構成２００は、ネットワーク２４０を介してサーバ２２０に通信可能に接続されたスマート表示装置２１０を含む。スマート表示装置２１０は、図１で記述したようにスマート表示装置１００に対応することができる。サーバ２２０は、任意のサーバであってもよく、１つまたは複数の処理装置（図示せず）を含むことができる。サーバ２２０は、データストア（ｄａｔａｓｔｏｒｅ）２３０に動作可能に接続されていてもよい。データストア２３０は、データを格納可能な永続性記憶装置であってもよい。永続性記憶装置は、ローカル記憶ユニットまたはリモート記憶ユニットであってもよい。永続性記憶装置は、磁気記憶ユニット、光記憶ユニット、固体記憶ユニット、電子記憶ユニット（メインメモリ）、または同様の記憶ユニットであってもよい。永続性記憶装置は、モノリシック／単一のデバイスまたは分散デバイスのセットであってもよい。実施例では、サーバ２２０およびデータストア２３０はクラウドベースのプラットフォームの構成要素であってもよい。

ネットワーク２４０は、公衆ネットワーク（例えばインターネット）、プライベートネットワーク（例えばローカルエリアネットワーク（ＬＡＮ）またはワイドエリアネットワーク（ＷＡＮ））、またはそれらの組み合わせであってもよい。一実施例では、ネットワーク２４０は、有線またはワイヤレスインフラストラクチャを含んでもよい。インフラストラクチャは、１つまたは複数のワイヤレス通信システムによって提供されてもよく、例えば、ネットワーク２４０に接続されたワイヤレスフィデリティ（ＷｉＦｉ）ホットスポットおよび／または様々なデータ処理装置、通信塔（例えばセルタワー）などを使用して実施可能なワイヤレスキャリアシステムなどが挙げられる。

サーバ２２０の処理装置の処理ロジックは、スマート表示装置２１０のアルゴリズム制御モジュール（例えば、図１のアルゴリズム制御モジュール１３５）によって利用される機械学習モデルを訓練するように構成されることができる。スマート表示装置に関連付けられていないサンプルデータ（例えば、以前に１つまたは複数の異なるスマート表示装置から取得されたデータ）は、機械学習モデルの訓練事例集合（ｔｒａｉｎｉｎｇｓｅｔ）として使用可能である。サーバ２２０の処理ロジックは、サンプルデータを使用して機械学習モデルを実行することができる。機械学習モデルの出力を解析することによって機械学習モデルが通常に機能しているか否かを判定することができる。処理ロジックによって機械学習モデルが訓練された後、ネットワーク２４０を介してスマート表示装置２１０に機械学習モデルを提供してもよい。

いくつかの実施例では、機械学習モデルが受信された後、スマート表示装置２１０のアルゴリズム制御モジュールは、機械学習モデルと、音声キャプチャ装置によって送信された信号に関連する特徴とを利用して、スマート表示装置のディスプレイを起動／停止するか否かを判定することができる。実施例では、前記判定は、スマート表示装置２１０のユーザのプライバシーを保護するために、サーバ２２０に画像に関連する特徴をネットワーク２４０を介して提供せずに、スマート表示装置２１０の処理ロジックによって行われることに留意されたい。

図３は、実施例に係る、スマート表示装置のディスプレイを停止するか否かを判定するためにアルゴリズム制御モジュールに提供される特徴の一例を示す例示３００である。上述したように、音声キャプチャ装置から受信された１つまたは複数の信号に関連する特徴を、アルゴリズム制御モジュール１３５に提供することができる。アルゴリズム制御モジュール１３５は、前記特徴を機械学習モデルへの入力として使用可能であり、機械学習モデルはスマート表示装置のディスプレイ１５０を停止するか否かを判定することができる。各特徴は、機械学習モデルによるディスプレイ１５０を停止するか否かについての判定に影響を与えることが可能である。

ブロック３０５では、ディスプレイコントローラは、前述のように、受信信号の音圧を測定することができる。アルゴリズム制御モジュール１３５は、信号の音圧を利用してディスプレイ１５０を停止するか否かを判定することができる。例えば、音圧がスマート表示装置の周囲の活動を示す閾値量を超える場合、アルゴリズム制御モジュール１３５がディスプレイ１５０を停止すると判定する確率は減少する可能性がある。実施例では、ディスプレイコントローラは、ある期間にわたる受信信号に対して、平均値および標準偏差などの分布統計を確定することができる。例えば、ディスプレイコントローラは、前の夜の間に平均音圧が５０デシベル（ｄＢ）、標準偏差が３ｄＢであり、前の日の間に平均音圧が７０ｄＢ、標準偏差が６ｄＢであり、直前の１０分間に平均音圧が６５ｄＢ、標準偏差が４ｄＢで、直前の１時間に平均音圧が６５ｄＢ、標準偏差が５ｄＢでしたことを確定することができる。いくつかの実施例では、ディスプレイコントローラは、スマート表示装置のディスプレイ１５０を停止するか否かを判定するために分布統計を利用することが可能である。例えば、現在の音圧が平均値の確定された標準偏差を超えた場合、ディスプレイコントローラがディスプレイ１５０を停止すると判定する確率は減少する可能性がある。

ブロック３１０では、ディスプレイコントローラは、音声キャプチャ装置から受信された信号の音圧レベルと以前の信号の音圧レベルとの音圧差を確定することができる。アルゴリズム制御モジュール１３５は、音圧レベルの差を利用してディスプレイ１５０を停止するか否かを判定することができる。例えば、現在の音圧レベルと以前の音圧レベルとの間の差が閾値を超える場合、アルゴリズム制御モジュール１３５がディスプレイ１５０を停止すると判定する確率は減少する可能性がある。しかしながら、現在の音圧レベルと以前の音圧レベルとの間の差が閾値を下回る場合、アルゴリズム制御モジュール１３５がディスプレイ１５０を停止すると判定する確率は増加する可能性がある。

ブロック３１５では、ディスプレイコントローラは、音声キャプチャ装置から受信された信号の受音角度を確定することができる。受音角度は、音声キャプチャ装置またはスマート表示装置に対する音源の角度に対応することができる。アルゴリズム制御モジュール１３５は、受音角度を利用して、ディスプレイ１５０を停止するか否かを判定することができる。例えば、受音角度によって音源がスマート表示装置の前方にあることが示された場合、アルゴリズム制御モジュール１３５がディスプレイ１５０を停止すると判定する確率は低下する可能性がある。しかしながら、受音角度によって音源がスマート表示装置の後方にあることが示された場合、アルゴリズム制御モジュール１３５がディスプレイ１５０を停止すると判定する確率は増加する可能性がある。受音角度を利用してディスプレイ１５０を停止するか否かを判定することに関するさらなる詳細は、以下の図５で説明される。

ブロック３２０では、ディスプレイコントローラは、受信信号内の音声活動を識別することができる。アルゴリズム制御モジュール１３５は、信号内の音声活動を利用して、ディスプレイ１５０を停止するか否かを判定することができる。従って、受信信号が音声活動を含む場合、アルゴリズム制御モジュール１３５がディスプレイ１５０を停止すると判定する確率は低下する可能性がある。しかしながら、受信信号が音声活動を含まない場合、アルゴリズム制御モジュール１３５がディスプレイ１５０を停止すると判定する確率は増加する可能性がある。

なお、例示３００はディスプレイ１５０を停止するか否かを判定するための、ブロック３０５、ブロック３１０、ブロック３１５、およびブロック３２０における特徴を含むが、実施例では、ディスプレイ１５０を停止するか否かを判定するために、より多くのまたはより少ない特徴を利用することが可能である。

図４は、一実施例に係るディスプレイのオフタイム平滑化のプロセス４００を示すフローチャートである。プロセス４００は、処理ロジックにより実行可能であり、処理ロジックはソフトウェア、ハードウェア、またはそれらの組み合わせを含んでもよい。例えば、プロセス４００の１つまたは複数の動作は、図１のディスプレイコントローラ１１０のオフタイム平滑化モジュール１４５によって実行されることができる。

図４を参照すると、動作４０１において、前述したように、着信音に対応する受信信号の特徴に基づいて、処理ロジックはスマート表示装置のディスプレイを停止すると判定する。動作４０２において、処理ロジックはスマート表示装置のディスプレイを停止する。

動作４０３において、処理ロジックは、動作４０２におけるディスプレイの停止閾値時間内にディスプレイが起動されたか否かを判定する。例えば、処理ロジックは、動作４０２におけるディスプレイの停止後の５分の閾値時間内にディスプレイがユーザによって起動されたか否かを判定することができる。閾値時間内にディスプレイを起動したユーザは、処理ロジックが不適切な時間にディスプレイを停止したと判定したことを指示することができる。従って、不適切な時間にディスプレイが停止されるのを防止するために、動作４０４では、ディスプレイが閾値時間内に起動された場合、処理ロジックは、その後にディスプレイを停止しないと判定する。実施例では、処理ロジックは、その後しばらくの間、ディスプレイを停止しないと判定してもよい。例えば、処理ロジックは、その後の１時間内にディスプレイを停止しないと判定してもよい。

ディスプレイが閾値時間内に起動されていない場合、動作４０５において、処理ロジックは、その後にディスプレイを停止すると判定する。いくつかの実施例では、プロセス４００で記述したような判定に関連するデータは、アルゴリズム制御モジュール１３５に提供されてもよい。当該データは、上述したように、スマート表示装置のディスプレイを停止するか否かを判定するために機械学習モデルによって利用されることが可能である。

図５は、実施例に係る複数の音源からの受音角度を利用してスマート表示装置のディスプレイを停止するか否かを判定する一例を示す例示５００である。前述したように、１つまたは複数の音源に関連する受音角度は、受音角度確定モジュール１２５によって確定することができ、アルゴリズム制御モジュール１３５に提供することができる。アルゴリズム制御モジュール１３５は、受音角度を機械学習モデルへの入力として使用可能であり、機械学習モデルはスマート表示装置のディスプレイ１５０を停止するか否かを判定することができる。

例示５００はスマート表示装置５１０を含み、スマート表示装置５１０は図１のスマート表示装置１００に対応することができる。スマート表示装置５１０は、図５の上部に向う表示方向を有するディスプレイ（図示せず）を含む。ディスプレイは、スマート表示装置５１０のディスプレイが見える角度範囲に対応する視野角５２０を有してもよい。実施例では、特定の音源に対して判定された受音角度が視野角５２０内にあると確定された場合、スマート表示装置５１０のディスプレイコントローラ（図示せず）がディスプレイを停止すると判定する確率は減少する可能性がある。

例示５００は、音源５１５、静的音源５２５、および音声活動源５３０を更に含むことができる。音源５１５、静的音源５２５、および音声活動源５３０のそれぞれは、前述したように音声キャプチャ装置によって受信される音声を生成することができる。

図５を参照すると、スマート表示装置５１０は、音源５１５から着信音を受信し、音源５１５に関連する受音角度を確定することができる。図５において、音源５１５は視野角５２０外に位置している。音源５１５が視野角５２０外に位置しているので、スマート表示装置５１０のディスプレイコントローラがディスプレイを停止すると判定する確率は高くなる可能性がある。

スマート表示装置５１０は、静的音源５２５から着信音を受信し、静的音源５２５に関連する受音角度を確定することができる。図５において、静的音源５２５は視野角５２０内に位置している。静的音源５２５が視野角５２０内に位置しているので、スマート表示装置５１０のディスプレイコントローラがディスプレイを停止すると判定する確率は低くなる可能性がある。しかしながら、ディスプレイコントローラは、ある期間にわたって、静的音源５２５からの受音角度が比較的一定に維持されると確定することができる。静的音源５２５からの受音角度が一定に維持されることは、静的音源５２５によって生成された音声がユーザの活動に対応しない可能性があることを示し得るが、テレビ、ラジオまたは他の同様の装置などの他の何らかの物体の結果であってもよい。従って、いくつかの実施例では、静的音源５２５からの受音角度がある期間にわたって比較的一定のままであると識別されると、ディスプレイコントローラは、スマート表示装置５１０のディスプレイを停止するか否かを判定するときに、静的音源５２５からの着信音を無視する傾向がある可能である。

スマート表示装置５１０は、音声活動源５３０から着信音を受信することができる。図５では、音声活動源５３０は視野角５２０内に位置している。音声活動源５３０が視野角５２０内に位置しているので、音声活動源５３０がスマート表示装置５１０を使用している可能性が高いことを示し、スマート表示装置５１０のディスプレイコントローラがディスプレイを停止すると判定する確率は低くなる可能性がある。実施例では、信頼度を利用することができる。例えば、音声活動源５３０が０．１の関連する信頼度（例えば、低い音声活動の可能性）を有する場合、高い信頼度（例えば、高い音声活動の可能性）を有する音声活動源に比して、スマート表示装置５１０のディスプレイコントローラがディスプレイを停止すると判定する確率は低くなる可能性がある。いくつかの実施例では、視野角５２０内の音声活動源５３０の位置もディスプレイコントローラによって確定されることができる。例えば、音声活動源５３０がスマート表示装置５１０の直前に位置している場合、ディスプレイコントローラがディスプレイを停止すると判定する確率は低くなる可能性がある。しかしながら、音声活動源５３０が視野角５２０の外周に位置している場合、ディスプレイコントローラがディスプレイを停止すると判定する確率は高くなる可能性がある。

図６は、一実施例に係る着信音に関連する信号の特徴に基づいてスマート表示装置のディスプレイを停止すると判定するプロセス６００を示すフローチャートである。プロセス６００は、処理ロジックにより実行可能であり、処理ロジックはソフトウェア、ハードウェア、またはそれらの組み合わせを含んでもよい。例えば、プロセス６００は、図１のディスプレイコントローラ１１０により実行されることが可能である。図６を参照すると、動作６０１において、処理ロジックは、スマート表示装置に関連付けられる音声に対応する信号を音声キャプチャ装置から受信する。動作６０２において、機械学習モデルを実行する処理ロジックは、音声キャプチャ装置から受信された信号の特徴を解析して、スマート表示装置のディスプレイを停止するか否かを判定する。動作６０３において、処理ロジックは、解析によりディスプレイを停止すると判定されたことに応答して、スマート表示装置のディスプレイを停止する。

図７は、本発明の一実施例と組み合わせて使用可能なデータ処理システムを例示的に示すブロック図である。例えば、システム１５００は、上述したような前記プロセス又は方法のいずれかを実行するデータ処理システムのいずれか（例えば、上述した、クライアント装置若しくはサーバ、または上述した図１のスマート表示装置１００など）を表すことができる。

システム１５００は、いくつかの異なる構成要素を含んでもよい。これらの構成要素は、集積回路（ＩＣ）、集積回路の一部、ディスクリート型電子デバイス、または回路基板（例えば、コンピュータシステムのマザーボード若しくはアドインカード）に適するその他のモジュールとして実現されることができ、または、他の形態でコンピュータシステムのシャーシ内に組み込まれた構成要素として実現されることができる。

なお、システム１５００は、コンピュータシステムのいくつかの構成要素の高レベルビューを示すことを意図している。しかしながら、一部の実施形態において付加的構成要素が存在してもよく、また、その他の実施形態において示された構成要素を異なる配置にすることが可能であることを理解されたい。システム１５００は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、サーバ、携帯電話、メディアプレーヤ、パーソナルデジタルアシスタント（ＰＤＡ）、スマートウォッチ、パーソナルコミュニケーター、ゲーム装置、ネットワークルーター若しくはハブ、無線アクセスポイント（ＡＰ）若しくはリピーター、セット・トップボックス、またはそれらの組み合わせを表すことができる。また、単一の機械またはシステムのみが示されたが、「機械」または「システム」という用語は、本明細書で説明されるいずれか１種または複数種の方法を実現するための、単独で又は共同で１つ（又は複数）の命令セットを実行する機械またはシステムのいずれかの組み合わせも含まれることを理解されたい。

一実施例では、システム１５００は、バスまたはインターコネクト１５１０を介して接続される、プロセッサ１５０１、メモリ１５０３および装置１５０５～１５０８を含む。プロセッサ１５０１は、単一のプロセッサコアまたは複数のプロセッサコアが含まれる単一のプロセッサまたは複数のプロセッサを表すことが可能である。プロセッサ１５０１は、マイクロプロセッサ、中央処理装置（ＣＰＵ）などのような、１つまたは複数の汎用プロセッサを表すことが可能である。より具体的には、プロセッサ１５０１は、複雑命令セットコンピューティング（ＣＩＳＣ）マイクロプロセッサ、縮小命令セットコンピューティング（ＲＩＳＣ）マイクロプロセッサ、超長命令語（ＶＬＩＷ）マイクロプロセッサ、またはその他の命令セットを実行するプロセッサ、または命令セットの組み合わせを実行するプロセッサであってもよい。プロセッサ１５０１は更に１つまたは複数の専用プロセッサであってもよい。例えば、特定用途向け集積回路（ＡＳＩＣ）、セルラー若しくはベースバンドプロセッサ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、デジタルシグナルプロセッサ（ＤＳＰ）、ネットワークプロセッサ、グラフィックプロセッサ、通信プロセッサ、暗号化プロセッサ、コプロセッサ、組込みプロセッサ、または命令を処理可能な任意の他の種類のロジックが挙げられる。

プロセッサ１５０１は、超低電圧プロセッサのような低電力マルチコアプロセッサソケットであってもよく、前記システムの様々な構成要素と通信するための主処理ユニットおよび中央ハブとして機能することができる。このようなプロセッサは、システムオンチップ（ＳｏＣ）として実装されてもよい。プロセッサ１５０１は、本明細書で説明される動作およびステップを実行するための命令を実行するように構成される。システム１５００は、更に任意選択グラフィックサブシステム１５０４と通信するグラフィックインターフェースを含むことができ、グラフィックサブシステム１５０４は、ディスプレイコントローラ、グラフィックプロセッサ、および／または表示装置を含むことができる。

プロセッサ１５０１は、メモリ１５０３と通信することができ、メモリ１５０３は、一実施例では、所定量のシステムメモリを提供するための複数のメモリ装置によって実現されることができる。メモリ１５０３は、１つまたは複数の揮発性記憶（またはメモリ）装置を含んでもよい。例えば、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックＲＡＭ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）、またはその他の種類の記憶装置が挙げられる。メモリ１５０３は、プロセッサ１５０１またはその他の任意の装置により実行される命令シーケンスを含む情報を格納することができる。例えば、様々なオペレーティングシステム、デバイスドライバ、ファームウェア（例えば、ベーシックインプット／アウトプットシステム若しくはＢＩＯＳ）、および／またはアプリケーションの実行可能なコードおよび／またはデータは、メモリ１５０３にロードされ、プロセッサ１５０１により実行されることができる。オペレーティングシステムは、例えば、Ｍｉｃｒｏｓｏｆｔ（登録商標）社のＷｉｎｄｏｗｓ（登録商標）オペレーティングシステム、アップル社のＭａｃＯＳ（登録商標）／ｉＯＳ（登録商標）、Ｇｏｏｇｌｅ（登録商標）社のＡｎｄｒｏｉｄ（登録商標）、ＬＩＮＵＸ、ＵＮＩＸ、またはその他のリアルタイム若しくは組込みオペレーティングシステムのような、任意の種類のオペレーティングシステム（例えば、ＶｘＷｏｒｋｓ）であってもよい。

システム１５００は、例えば、ネットワークインターフェース装置１５０５、任意選択入力装置１５０６、及びその他の任意選択Ｉ／Ｏ装置１５０７を含む装置１５０５～１５０８のようなＩ／Ｏ装置を更に含んでもよい。ネットワークインターフェース装置１５０５は、無線送受信機および／またはネットワークインターフェースカード（ＮＩＣ）を含んでもよい。前記無線送受信機は、ＷｉＦｉ送受信機、赤外線送受信機、ブルートゥース送受信機、ＷｉＭａｘ送受信機、無線携帯電話送受信機、衛星送受信機（例えば、全地球測位システム（ＧＰＳ）送受信機）、またはその他の無線周波数（ＲＦ）送受信機、またはそれらの組み合わせであってもよい。ＮＩＣは、イーサネットカードであってもよい。

入力装置１５０６は、マウス、タッチパネル、タッチスクリーン（表示装置１５０４と統合されてもよい）、ポインター装置（例えば、スタイラス）、および／またはキーボード（例えば、物理キーボードまたはタッチスクリーンの一部として表示された仮想キーボード）を含んでもよい。例えば、入力装置１５０６は、タッチスクリーンに接続されるタッチスクリーンコントローラを含んでもよい。タッチスクリーンおよびタッチスクリーンコントローラは、例えば、様々なタッチ感応技術（コンデンサ、抵抗、赤外線、および表面弾性波の技術を含むが、それらに限定されない）のいずれか、並びにその他の近接センサアレイ、または、タッチスクリーンと接触する１つまたは複数の点を確定するためのその他の素子を用いて、それらの接触、移動または中断を検出することができる。

Ｉ／Ｏ装置１５０７は音声装置を含んでもよい。音声装置は、音声認識、音声複製、デジタル記録および／または電話機能のような音声サポートの機能を促進するために、スピーカおよび／またはマイクロホンを含んでもよい。その他のＩ／Ｏ装置１５０７は、更に、ユニバーサルシリアルバス（ＵＳＢ）ポート、パラレルポート、シリアルポート、プリンタ、ネットワークインターフェース、バスブリッジ（例えば、ＰＣＩ－ＰＣＩブリッジ）、センサ（例えば、加速度計、ジャイロスコープ、磁力計、光センサ、コンパス、近接センサなどのモーションセンサ）、またはそれらの組み合わせを含んでもよい。装置１５０７は、結像処理サブシステム（例えば、カメラ）を更に含んでもよい。結像処理サブシステムは、写真およびビデオ断片の記録のようなカメラ機能を促進するための、電荷結合素子（ＣＣＤ）または相補型金属酸化物半導体（ＣＭＯＳ）光学センサのような光学センサを含んでもよい。特定のセンサは、センサハブ（図示せず）を介してインターコネクト１５１０に接続されることができ、キーボードまたはサーマルセンサのようなその他の装置はシステム１５００の具体的な配置または設計により、組込みコントローラ（図示せず）により制御されることも可能である。

データ、アプリケーション、１つまたは複数のオペレーティングシステムなどの情報の永続性記憶を提供するために、プロセッサ１５０１には、大容量記憶装置（図示せず）が接続されることも可能である。様々な実施例では、より薄くてより軽量なシステム設計を可能にしながら、システムの応答性を向上するために、このような大容量記憶装置は、ソリッドステートデバイス（ＳＳＤ）によって実現されることが可能である。しかしながら、その他の実施例では、大容量記憶装置は、主にハードディスクドライブ（ＨＤＤ）を使用して実現されることができ、より小さい容量のＳＳＤ記憶装置をＳＳＤキャッシュとして機能することで、停電イベントの間にコンテキスト状態及び他のそのような情報の不揮発性記憶を可能にし、それによりシステム動作が再開するときに通電を速く実現することができる。また、フラッシュデバイスは、例えば、シリアルペリフェラルインターフェース（ＳＰＩ）を介してプロセッサ１５０１に接続されてもよい。このようなフラッシュデバイスは、システムのベーシックインプット／アウトプットシステム（ＢＩＯＳ）およびその他のファームウェアを含むシステムソフトウェアの不揮発性記憶のために機能することができる。

記憶装置１５０８は、コンピュータアクセス可能な記憶媒体１５０９（機械可読記憶媒体またはコンピュータ可読媒体ともいう）を含むことができ、前記コンピュータアクセス可能な記憶媒体１５０９には、本明細書で記載されたいずれか１種または複数種の方法若しくは機能を具現化する１つまたは複数の命令セット若しくはソフトウェア（例えば、モジュール、ユニットおよび／またはロジック１５２８）が格納されている。処理モジュール／ユニット／ロジック１５２８は、前記構成要素のいずれか（例えば、上述したディスプレイコントローラ１１０）を表すことができる。処理モジュール／ユニット／ロジック１５２８は、更に、データ処理システム１５００、メモリ１５０３、およびプロセッサ１５０１による実行中に、メモリ１５０３内および／またはプロセッサ１５０１内に完全的にまたは少なくとも部分的に存在してもよく、データ処理システム１５００、メモリ１５０３およびプロセッサ１５０１も機械アクセス可能な記憶媒体を構成する。処理モジュール／ユニット／ロジック１５２８は、更に、ネットワークを介してネットワークインターフェース装置１５０５を経由して送受信されることが可能である。

コンピュータ可読記憶媒体１５０９は、以上に説明されたいくつかのソフトウェア機能を永続的に格納するために用いることができる。コンピュータ可読記憶媒体１５０９は、例示的な実施例において単一の媒体として示されるが、「コンピュータ可読記憶媒体」という用語は、１つまたは複数の命令セットが格納される単一の媒体または複数の媒体（例えば、集中型または分散型データベース、および／または関連するキャッシュとサーバ）を含むと解釈されるものとする。「コンピュータ可読記憶媒体」という用語は、更に、命令セットを格納または符号化できる任意の媒体を含むと解釈されるものであり、命令セットは機械により実行され、本発明のいずれか１種又は複数種の方法を機械に実行させるためのものである。それゆえに、「コンピュータ可読記憶媒体」という用語は、ソリッドステートメモリ、光学媒体および磁気媒体、またはその他の任意の非一時的機械可読媒体を含むが、それらに限定されないと解釈されるものとする。

本明細書に記載の処理モジュール／ユニット／ロジック１５２８、構成要素およびその他の特徴は、ディスクリートハードウェア構成要素として実現されてもよく、またはＡＳＩＣＳ、ＦＰＧＡ、ＤＳＰまたは類似の装置のようなハードウェア構成要素の機能に統合されてもよい。更に、処理モジュール／ユニット／ロジック１５２８は、ハードウェア装置におけるファームウェアまたは機能性回路として実現されてもよい。更に、処理モジュール／ユニット／ロジック１５２８は、ハードウェア装置とソフトウェア構成要素の任意の組み合わせで実現されてもよい。

なお、システム１５００は、データ処理システムの様々な構成要素を有するものとして示されているが、構成要素を相互接続する任意の特定のアーキテクチャまたは方式を表すことを意図するものではなく、そのような詳細は、本発明の実施例とは密接な関係がない。また、より少ない構成要素またはより多くの構成要素を有するネットワークコンピュータ、ハンドヘルドコンピュータ、携帯電話、サーバおよび／またはその他のデータ処理システムは、本発明の実施例と共に使用することも可能であることを理解されたい。

上述した具体的な説明の一部は、既に、コンピュータメモリにおけるデータビットに対する演算のアルゴリズムと記号表現により示された。これらのアルゴリズムの説明および表現は、データ処理分野における当業者によって使用される、それらの作業実質を所属分野の他の当業者に最も効果的に伝達する方法である。本明細書では、一般的に、アルゴリズムは、所望の結果につながるセルフコンシステントシーケンスと考えられる。これらの動作は、物理量の物理的処置が必要なものである。

しかしながら、念頭に置くべきなのは、これらの用語および類似の用語の全ては、適切な物理量に関連付けられるものであり、これらの量を標識しやすくするためのものに過ぎない。以上の説明で他に明示的に記載されていない限り、本明細書の全体にわたって理解すべきなのは、用語（例えば、添付された特許請求の範囲に記載のもの）による説明とは、コンピュータシステムまたは類似の電子式コンピューティングデバイスの動作若しくはプロセスを指し、コンピュータシステムまたは電子式コンピューティングデバイスは、コンピュータシステムのレジスタおよびメモリにおける物理（電子）量として示されたデータを制御するとともに、データをコンピュータシステムメモリ、レジスタまたはこのようなその他の情報を記憶、伝送または表示する装置において同様に物理量として示された別のデータに変換する。

図に示される技術は、１つまたは複数の電子装置に格納され実行されるコードおよびデータを使用して実施することができる。そのような電子装置は、コンピュータ可読媒体（例えば、非一時的コンピュータ可読記憶媒体（例えば、磁気ディスク、光ディスク、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ装置、相変化メモリ）および一時的コンピュータ可読伝送媒体（例えば、電子、光学、音響学、または搬送波、赤外線信号、デジタル信号などの他の形態の伝搬信号など）を使用して、コードおよびデータを（内部におよび／またはネットワークを介して他の電子装置に）格納および通信する。

上述した図面において説明されたプロセスまたは方法は、ハードウェア（例えば、回路、専用ロジックなど）、ファームウェア、ソフトウェア（例えば、非一時的コンピュータ可読媒体に具現化されるもの）、またはそれらの組み合わせを含む処理ロジックにより実行されることができる。プロセスまたは方法は、以上で特定の順序に応じて説明されたが、記述した動作の一部が異なる順序で実行されてもよいことを理解されたい。また、一部の動作は、順番ではなく並行して実行されてもよい。

上述した明細書において、本発明の実施例は、既にその具体的な例示的な実施例を参照しながら記載された。明らかなように、添付された特許請求の範囲に記載された本発明のより広い趣旨および範囲を逸脱しない限り、本発明に対して様々な変更を行うことができる。それゆえに、本明細書および図面は、限定的な意味でなく、例示的な意味で理解されるべきである。

Claims

特徴に基づいてスマート表示装置を制御するためのコンピュータ実施方法であって、
前記スマート表示装置に関連付けられる音声に対応する信号を音声キャプチャ装置から受信するステップと、
前記スマート表示装置のディスプレイがオン状態である場合、機械学習モデルを実行する処理装置により、前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップであって、前記特徴は、前記信号に関連する音圧である、ステップと、
前記解析により前記スマート表示装置の前記ディスプレイを停止すると判定されたことに応答して、前記スマート表示装置の前記ディスプレイをオン状態から停止するステップと、を含み、
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
現在の前記信号に関連する音圧と、前記スマート表示装置に関連する前の複数の期間にわたる音圧との間の差を確定して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップを含む、
コンピュータ実施方法。
前記スマート表示装置に関連付けられていない二次データを使用して、リモートサーバで前記機械学習モデルを訓練する請求項１に記載の方法。
前記複数の特徴は、前記信号に関連する受音角度、及び前記信号に関連する音声活動のうちの少なくとも１つをさらに含む請求項１に記載の方法。
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
前記複数の期間にわたる音圧に関連する平均値および標準偏差を確定することをさらに含む請求項３に記載の方法。
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
前記スマート表示装置に対する前記音声の音源の角度を確定することをさらに含む請求項３に記載の方法。
前記方法は、
受信された信号に基づいて、複数のユーザから前記音声に関連するユーザを識別するステップを更に含む請求項１に記載の方法。
命令が格納されている非一時的機械可読媒体であって、
前記命令がプロセッサにより実行されると、前記プロセッサに
スマート表示装置に関連付けられる音声に対応する信号を音声キャプチャ装置から受信するステップと、
前記スマート表示装置のディスプレイがオン状態である場合、機械学習モデルにより、前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップであって、前記特徴は、前記信号に関連する音圧である、ステップと、
前記解析により前記スマート表示装置の前記ディスプレイを停止すると判定されたことに応答して、前記スマート表示装置の前記ディスプレイをオン状態から停止するステップと、を含む動作を実行させ、
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
現在の前記信号に関連する音圧と、前記スマート表示装置に関連する前の複数の期間にわたる音圧との間の差を確定して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップを含む、非一時的機械可読媒体。
前記スマート表示装置に関連付けられていない二次データを使用して、リモートサーバで前記機械学習モデルを訓練する請求項７に記載の非一時的機械可読媒体。
前記複数の特徴は、前記信号に関連する受音角度、及び前記信号に関連する音声活動のうちの少なくとも１つをさらに含む請求項７に記載の非一時的機械可読媒体。
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
前記複数の期間にわたる音圧に関連する平均値および標準偏差を確定することをさらに含む請求項９に記載の非一時的機械可読媒体。
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
前記スマート表示装置に対する前記音声の音源の角度を確定することを含む請求項９に記載の非一時的機械可読媒体。
前記動作は、受信された信号に基づいて、複数のユーザから前記音声に関連するユーザを識別するステップを更に含む請求項７に記載の非一時的機械可読媒体。
システムであって、
プロセッサと、
命令を格納するために前記プロセッサに接続されるメモリとを備え、
前記命令が前記プロセッサにより実行されると、前記プロセッサに
スマート表示装置に関連付けられる音声に対応する信号を音声キャプチャ装置から受信するステップと、
前記スマート表示装置のディスプレイがオン状態である場合、機械学習モデルを実行する処理装置により、前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップであって、前記特徴は、前記信号に関連する音圧である、ステップと、
前記解析により前記スマート表示装置の前記ディスプレイを停止すると判定されたことに応答して、前記スマート表示装置の前記ディスプレイをオン状態から停止するステップと、を含む動作を実行させ、
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
現在の前記信号に関連する音圧と、前記スマート表示装置に関連する以前の複数の期間にわたる音圧との間の差を確定して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップを含む、システム。
前記スマート表示装置に関連付けられていない二次データを使用してリモートサーバで前記機械学習モデルを訓練する請求項１３に記載のシステム。
前記複数の特徴は、前記信号に関連する受音角度、及び前記信号に関連する音声活動のうちの少なくとも１つをさらに含む請求項１３に記載のシステム。
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
前記複数の期間にわたる音圧に関連する平均値および標準偏差を確定することをさらに含む請求項１５に記載のシステム。
前記音声キャプチャ装置から受信された前記信号の複数の特徴を解析して、前記スマート表示装置のディスプレイを停止するか否かを判定するステップは、
前記スマート表示装置に対する前記音声の音源の角度を確定することを含む請求項１５に記載のシステム。
プロセッサにより実行されると、請求項１ないし請求項６のいずれか一項に記載の方法を実現させるコンピュータプログラム。