JP6851565B2 - Device control device, device control system, device control method, and device control program - Google Patents
Device control device, device control system, device control method, and device control program Download PDFInfo
- Publication number
- JP6851565B2 JP6851565B2 JP2020569220A JP2020569220A JP6851565B2 JP 6851565 B2 JP6851565 B2 JP 6851565B2 JP 2020569220 A JP2020569220 A JP 2020569220A JP 2020569220 A JP2020569220 A JP 2020569220A JP 6851565 B2 JP6851565 B2 JP 6851565B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- information
- command
- device control
- environment information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 65
- 238000004458 analytical method Methods 0.000 claims description 69
- 230000008569 process Effects 0.000 claims description 48
- 230000006870 function Effects 0.000 description 23
- 239000000284 extract Substances 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000002650 habitual effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Selective Calling Equipment (AREA)
Description
本発明は、機器制御装置、機器制御システム、機器制御方法、及び機器制御プログラムに関する。 The present invention relates to a device control device, a device control system, a device control method, and a device control program.
ユーザが発声する音声コマンドが示す語句とその語句に対応する対象機器の動作とが関連付けされている情報である音声操作情報を予め記憶し、この音声操作情報を参照することによって、ユーザが発声した音声コマンドを対象機器に対する操作コマンドとして認識する機器制御装置が知られている。また、機器制御装置に音声操作情報を登録する方法として、ユーザの操作を記憶し、記憶されている操作からなる操作履歴情報を参照して、操作頻度が高い操作に対応する音声コマンドを生成及び登録する方法が提案されている(例えば、特許文献1を参照)。 The voice operation information, which is the information associated with the phrase indicated by the voice command uttered by the user and the operation of the target device corresponding to the phrase, is stored in advance, and the user utters by referring to this voice operation information. A device control device that recognizes a voice command as an operation command for a target device is known. In addition, as a method of registering voice operation information in the device control device, a voice command corresponding to an operation having a high operation frequency is generated by memorizing the user's operation and referring to the operation history information consisting of the stored operation. A method of registration has been proposed (see, for example, Patent Document 1).
しかしながら、上記従来の機器制御装置に対し音声コマンドによって所望の指示を入力するためには、ユーザは、登録されている音声コマンドを示す語句を記憶している必要がある。つまり、ユーザは、所望の操作コマンドに対応する音声コマンドを示す語句を思い出す必要がある。このため、音声コマンドの入力のために要求されるユーザの負担が大きいという課題がある。 However, in order to input a desired instruction to the conventional device control device by a voice command, the user needs to memorize a phrase indicating a registered voice command. That is, the user needs to remember the phrase indicating the voice command corresponding to the desired operation command. Therefore, there is a problem that the burden on the user required for inputting a voice command is large.
本発明は、上記従来の課題を解決するためになされたものであり、音声コマンドの入力のために要求されるユーザの負担の軽減を可能にする機器制御装置、機器制御システム、機器制御方法、及び機器制御プログラムを提供することを目的とする。 The present invention has been made to solve the above-mentioned conventional problems, and is a device control device, a device control system, a device control method, which can reduce the burden on the user required for inputting a voice command. And to provide equipment control programs.
本発明の一態様に係る機器制御装置は、ユーザ操作部から入力されたユーザ操作に基づく操作コマンド及びマイクから入力された音声コマンドに基づく操作コマンドの少なくとも一方によって対象機器の動作を制御する装置であって、前記操作コマンドが入力されたときの時刻及び曜日の少なくとも一方を含む時間情報を取得する時間情報取得部と、前記ユーザ操作を入力するユーザ及び前記音声コマンドを発声するユーザを示すユーザ特定情報を生成するユーザ特定情報生成部と、前記操作コマンドに、前記ユーザ特定情報と前記時間情報とを含む第1のユーザ環境情報を関連付けることで得られたユーザ操作情報を、前記操作コマンドが入力される度に蓄積することで、複数のユーザ操作情報を含む操作履歴情報を記憶するデータベース部と、予め決められた類似条件を満たす第1のユーザ環境情報を含む複数のユーザ操作情報をパターンコマンドとして前記データベース部に記録するパターンコマンド記録処理と、1つ以上の単語を含む定型句からなる前記音声コマンドが発声されたときに、前記定型句からなる前記音声コマンドに基づく前記操作コマンドについての前記ユーザ特定情報と前記時間情報とを含む第2のユーザ環境情報に合致する前記第1のユーザ環境情報を含む前記パターンコマンドを前記データベース部から選択する音声解析処理と、を行う解析部と、前記解析部によって選択された前記パターンコマンドに基づいて前記対象機器の動作を制御する機器制御部と、を有することを特徴とする。 The device control device according to one aspect of the present invention is a device that controls the operation of the target device by at least one of an operation command based on a user operation input from a user operation unit and an operation command based on a voice command input from a microphone. A user identification unit indicating a time information acquisition unit that acquires time information including at least one of the time and day when the operation command is input, a user who inputs the user operation, and a user who issues the voice command. The operation command inputs user operation information obtained by associating the user-specific information generation unit that generates information and the first user environment information including the user-specific information and the time information with the operation command. A pattern command is used to store operation history information including a plurality of user operation information and a plurality of user operation information including a first user environment information satisfying a predetermined similarity condition by accumulating each time. The pattern command recording process to be recorded in the database unit and the operation command based on the voice command consisting of the fixed phrase when the voice command including the fixed phrase including one or more words is uttered. An analysis unit that performs a voice analysis process for selecting a pattern command including the first user environment information that matches the second user environment information including the user specific information and the time information from the database unit, and the analysis unit. It is characterized by having a device control unit that controls the operation of the target device based on the pattern command selected by the analysis unit.
本発明の他の態様に係る機器制御方法は、ユーザ操作部から入力されたユーザ操作に基づく操作コマンド及びマイクから入力された音声コマンドに基づく操作コマンドの少なくとも一方によって対象機器の動作を制御する方法であって、前記操作コマンドが入力されたときの時刻及び曜日の少なくとも一方を含む時間情報を取得するステップと、前記ユーザ操作を入力するユーザ及び前記音声コマンドを発声するユーザを示すユーザ特定情報を生成するステップと、前記操作コマンドに、前記ユーザ特定情報と前記時間情報とを含む第1のユーザ環境情報を関連付けることで得られたユーザ操作情報を、前記操作コマンドが入力される度に蓄積することで、複数のユーザ操作情報を含む操作履歴情報をデータベース部に記憶するステップと、予め決められた類似条件を満たす第1のユーザ環境情報を含む複数のユーザ操作情報をパターンコマンドとして前記データベース部に記録するステップと、1つ以上の単語を含む定型句からなる前記音声コマンドが発声されたときに、前記定型句からなる前記音声コマンドに基づく前記操作コマンドについての前記ユーザ特定情報と前記時間情報とを含む第2のユーザ環境情報に合致する前記第1のユーザ環境情報を含む前記パターンコマンドを前記データベース部から選択するステップと、選択された前記パターンコマンドに基づいて前記対象機器の動作を制御するステップと、を有することを特徴とする。 The device control method according to another aspect of the present invention is a method of controlling the operation of a target device by at least one of an operation command based on a user operation input from a user operation unit and an operation command based on a voice command input from a microphone. The step of acquiring the time information including at least one of the time and the day when the operation command is input, and the user-specific information indicating the user who inputs the user operation and the user who utters the voice command. The user operation information obtained by associating the generated step with the first user environment information including the user specific information and the time information with the operation command is accumulated every time the operation command is input. As a result, the step of storing the operation history information including a plurality of user operation information in the database unit and the plurality of user operation information including the first user environment information satisfying a predetermined similarity condition are used as pattern commands in the database unit. When the voice command consisting of a fixed phrase including one or more words is uttered, the user-specific information and the time information about the operation command based on the voice command consisting of the fixed phrase. The step of selecting the pattern command including the first user environment information matching the second user environment information including the above from the database unit, and the operation of the target device are controlled based on the selected pattern command. It is characterized by having a step to perform.
本発明によれば、音声コマンドの入力のためのユーザの負担を軽減することができる。 According to the present invention, it is possible to reduce the burden on the user for inputting a voice command.
以下に、本発明の実施の形態に係る機器制御装置、機器制御システム、機器制御方法、及び機器制御プログラムを、図面を参照しながら説明する。以下の説明では、機器制御システムがテレビ装置であり、対象機器がテレビ装置の構成の一部である場合を説明する。ただし、機器制御システムは、テレビ装置以外の機器であってもよい。例えば、機器制御システムは、スマートフォン、携帯電話、タブレット端末、カーナビゲーションシステム、などの電子機器であってもよい。また、以下の実施の形態は、例にすぎず、本発明の範囲内で種々の変更が可能である。 Hereinafter, the device control device, the device control system, the device control method, and the device control program according to the embodiment of the present invention will be described with reference to the drawings. In the following description, the case where the device control system is a television device and the target device is a part of the configuration of the television device will be described. However, the device control system may be a device other than the television device. For example, the device control system may be an electronic device such as a smartphone, a mobile phone, a tablet terminal, a car navigation system, or the like. In addition, the following embodiments are merely examples, and various modifications can be made within the scope of the present invention.
《1》機器制御装置の概要
本実施の形態に係る機器制御装置は、ユーザ操作部から入力されたユーザ操作に基づく操作コマンド及びマイクから入力された音声コマンドに基づく操作コマンドの少なくとも一方によって対象機器の動作を制御する装置である。<< 1 >> Outline of the device control device The device control device according to the present embodiment is a target device by at least one of an operation command based on a user operation input from a user operation unit and an operation command based on a voice command input from a microphone. It is a device that controls the operation of.
本実施の形態に係る機器制御装置は、操作コマンドが入力されたときの時刻及び曜日の少なくとも一方を含む時間情報を取得する。また、本実施の形態に係る機器制御装置は、リモコンなどから操作コマンドを入力するユーザである第1のユーザを示す第1のユーザ特定情報を生成するユーザ認識部と、音声コマンドを発声するユーザである第2のユーザを示す第2のユーザ特定情報を生成する音声認識部とを有している。ユーザ認識部と音声認識部とは、ユーザ特定情報生成部としての機能を有している。したがって、ユーザ特定情報生成部は、ユーザ操作を入力するユーザ及び音声コマンドを発声するユーザを示すユーザ特定情報を生成する。 The device control device according to the present embodiment acquires time information including at least one of the time and the day of the week when the operation command is input. Further, the device control device according to the present embodiment includes a user recognition unit that generates first user identification information indicating a first user who is a user who inputs an operation command from a remote controller or the like, and a user who issues a voice command. It has a voice recognition unit that generates a second user-specific information indicating a second user. The user recognition unit and the voice recognition unit have a function as a user specific information generation unit. Therefore, the user-specific information generation unit generates user-specific information indicating a user who inputs a user operation and a user who utters a voice command.
本実施の形態に係る機器制御装置は、操作コマンドに、ユーザ特定情報と時間情報とを含む第1のユーザ環境情報を関連付けることで得られたユーザ操作情報を、操作コマンドが入力される度に蓄積することで、複数のユーザ操作情報を含む操作履歴情報をデータベース部に格納する。 The device control device according to the present embodiment inputs the user operation information obtained by associating the operation command with the first user environment information including the user identification information and the time information every time the operation command is input. By accumulating, the operation history information including a plurality of user operation information is stored in the database unit.
また、本実施の形態に係る機器制御装置は、予め決められた類似条件を満たす第1のユーザ環境情報を含む複数のユーザ操作情報をパターンコマンドとしてデータベース部に記録するパターンコマンド記録処理と、1つ以上の単語を含む定型句からなる音声コマンドが発声されたときに、定型句からなる音声コマンドに基づく操作コマンドについてのユーザ特定情報と時間情報とを含む第2のユーザ環境情報に合致する第1のユーザ環境情報を含むパターンコマンドをデータベース部から選択する音声解析処理とを行う。さらに、本実施の形態に係る機器制御装置は、選択されたパターンコマンドに基づいて対象機器の動作を制御する。 Further, the device control device according to the present embodiment has a pattern command recording process of recording a plurality of user operation information including a first user environment information satisfying a predetermined similarity condition in a database unit as a pattern command, and 1 When a voice command consisting of a fixed phrase containing two or more words is uttered, the second user environment information including user specific information and time information about an operation command based on the fixed phrase voice command is matched. Performs voice analysis processing for selecting a pattern command including the user environment information of 1 from the database unit. Further, the device control device according to the present embodiment controls the operation of the target device based on the selected pattern command.
ここで、「類似条件」は、例えば、複数のユーザ操作情報に含まれる第1のユーザ特定情報が示すユーザが共通であることを条件として含む。また、「類似条件」は、例えば、複数のユーザ操作情報に含まれる時間情報が示す時刻が、予め決められた時刻範囲内であることを条件として含んでもよい。また、「類似条件」は、複数のユーザ操作情報に含まれる時間情報が示す曜日が共通であることを条件として含んでもよい。 Here, the "similar condition" includes, for example, a condition that the user indicated by the first user specific information included in the plurality of user operation information is common. Further, the "similar condition" may include, for example, a condition that the time indicated by the time information included in the plurality of user operation information is within a predetermined time range. Further, the "similar condition" may include a condition that the day of the week indicated by the time information included in the plurality of user operation information is common.
また、本出願において、「定型句」は、対象機器の機能を示す用語を含まない。定型句の例は、「いつもの」などである。定型句は、指示代名詞を含む又は指示代名詞のみから構成されることができる。定型句を構成する指示代名詞の例は、「あれ」、「それ」などである。 Further, in the present application, the "fixed phrase" does not include a term indicating the function of the target device. An example of a boilerplate is "usual". The boilerplate can include demonstrative pronouns or consist only of demonstrative pronouns. Examples of demonstrative pronouns that make up a fixed phrase are "that", "it", and so on.
また、「第2のユーザ環境情報に合致する第1のユーザ環境情報」は、例えば、第2のユーザ環境情報に含まれるユーザ特定情報が第1のユーザ環境情報に含まれるユーザ特定情報に一致し、且つ第2のユーザ環境情報に含まれる時間情報が示す時刻と第1のユーザ環境情報に含まれる時間情報が示す時刻との差が予め決められた閾値以下であることである。また、「第2のユーザ環境情報に合致する第1のユーザ環境情報」は、例えば、第2のユーザ環境情報に含まれるユーザ特定情報が第1のユーザ環境情報に含まれるユーザ特定情報に一致し、且つ第2のユーザ環境情報に含まれる時間情報が示す曜日が第1のユーザ環境情報に含まれる時間情報が示す曜日に一致することであってもよい。また、「第2のユーザ環境情報に合致する第1のユーザ環境情報」は、例えば、第2のユーザ環境情報に含まれるユーザ特定情報が第1のユーザ環境情報に含まれるユーザ特定情報に一致し、且つ第2のユーザ環境情報に含まれる時間情報が示す曜日が第1のユーザ環境情報に含まれる時間情報が示す曜日に一致し、且つ第2のユーザ環境情報に含まれる時間情報が示す時刻と第1のユーザ環境情報に含まれる時間情報が示す時刻との差が予め決められた閾値以下であることであってもよい。 Further, the "first user environment information matching the second user environment information" includes, for example, the user identification information included in the second user environment information is one to the user identification information included in the first user environment information. In addition, the difference between the time indicated by the time information included in the second user environment information and the time indicated by the time information included in the first user environment information is equal to or less than a predetermined threshold value. Further, the "first user environment information matching the second user environment information" includes, for example, the user identification information included in the second user environment information is one to the user identification information included in the first user environment information. In addition, the day of the week indicated by the time information included in the second user environment information may match the day of the week indicated by the time information included in the first user environment information. Further, the "first user environment information matching the second user environment information" includes, for example, the user identification information included in the second user environment information is one to the user identification information included in the first user environment information. However, the day indicated by the time information included in the second user environment information matches the day indicated by the time information included in the first user environment information, and the time information included in the second user environment information indicates. The difference between the time and the time indicated by the time information included in the first user environment information may be equal to or less than a predetermined threshold value.
本実施の形態に係る機器制御装置100を用いれば、対象機器の機能を含まない曖昧な定型句からなる音声コマンドによって、対象機器を制御することができる。
By using the
《2》機器制御装置100の構成
〈テレビ装置10〉
図1は、本実施の形態に係る機器制御システムとしてのテレビ装置10及び機器制御装置100の構成を概略的に示すブロック図である。図1に示されるように、機器制御装置100は、機器制御部101と、推定操作部102と、解析部103と、記憶装置としてのデータベース部104と、ユーザ認識部105と、音声認識部106と、音声合成部107とを有している。機器制御装置100は、実施の形態1に係る機器制御方法を実施することができる装置である。<< 2 >> Configuration of
FIG. 1 is a block diagram schematically showing the configuration of a
また、図1に示されるように、テレビ装置10は、音声取得装置としてのマイク11と、A/D(Analog to Digital)コンバータ12と、音声出力装置としてのスピーカ13と、D/A(Digital to Analog)コンバータ14と、ユーザ操作部としてのリモコン20と、入力部15と、撮像装置としてのカメラ16と、表示装置としての表示部17と、機器制御装置100とを有している。機器制御装置100の機器制御部101は、放送波を受信するチューナ、及び受信した放送波に基づく映像データ及び音声データを生成する処理回路、などを備えている。
Further, as shown in FIG. 1, the
マイク11は、ユーザである話者が発声する音声指示である音声コマンドを受け取り、音声コマンドに対応するアナログ音声信号を生成する。A/Dコンバータ12は、マイク11で生成されたアナログ音声信号をデジタル音声信号に変換する。
The
音声認識部106は、A/Dコンバータ12から出力されたデジタル音声信号から音声コマンドに対応するテキストデータを生成する。このテキストデータは、機器制御部101によって、音声コマンドに基づく操作コマンドに変換される。また、音声認識部106は、音声コマンドを発声したユーザの音声を分析して、このユーザを特定するユーザ特定情報であるユーザID(すなわち、ユーザ識別子)を生成する。音声認識部106は、テキストデータとともにユーザIDを、機器制御部101へ出力する。音声からユーザを特定するユーザIDを生成する技術は、話者識別と呼ばれる公知の技術である。なお、話者識別のために、ユーザの声の特徴を示す特徴情報とユーザIDとが、事前に音声認識部106に備えられるメモリに登録されていてもよい。音声コマンドに基づくユーザIDは、音声コマンドを発声したユーザを識別する識別情報である。
The
音声合成部107は、機器制御部101から受け取ったテキストデータに基づいてデジタル音声信号を合成する。このテキストデータは、例えば、ユーザに対して、音声コマンドによる入力が可能であることを通知する内容のデータである。
The
D/Aコンバータ14は、音声合成部107によって生成されたデジタル音声信号をアナログ音声信号に変換する。スピーカ13は、アナログ音声信号に基づく音声を出力する。音声合成部107、D/Aコンバータ14、及びスピーカ13は、ユーザに情報を通知する通知部を構成する。
The D /
リモコン20は、ユーザによって操作されるユーザ操作部である。ただし、ユーザ操作部は、テレビ装置10に備えられた操作部であってもよい。リモコン20から入力された操作コマンドは、赤外線信号によって入力部15に送信される。入力部15は、赤外線センサを有し、赤外線センサで検出された赤外線信号に基づいて、操作コマンドに対応するユーザ操作信号を機器制御部101に出力する。このユーザ操作信号は、「ユーザ操作に基づく操作コマンド」の一例である。
The
カメラ16は、リモコン20を操作するユーザを撮影して、ユーザの画像情報をユーザ認識部105に提供する。ユーザ認識部105は、カメラ16から取得した画像情報を元に、リモコン20を操作しているユーザを特定するユーザ特定情報であるユーザIDを生成する。ユーザ認識部105は、例えば、リモコン20によるキーイベント(すなわち、キーコード)の出力と連動してユーザ操作を行うユーザの識別を行い、ユーザ操作を行うユーザを示すユーザIDを機器制御部101へ出力する。画像情報に基づいてユーザを特定する方法としては、公知の顔認証技術などを用いることができる。なお、ユーザを識別するために、ユーザの顔の特徴を示す特徴情報とユーザIDとを、事前にユーザ認識部105のメモリに登録してもよい。ユーザIDは、ユーザ識別情報である。
The
表示部17は、機器制御部101から受け取った映像データに基づく映像を表示する。表示部17は、ユーザに情報を通知する通知部として使用されてもよい。
The
〈機器制御部101〉
機器制御部101は、テレビ装置10の全体の動作を制御する。機器制御部101は、入力部15からリモコン20のキーイベントを、ユーザ認識部105からリモコン20を操作するユーザの識別情報であるユーザIDを受け取る。また、機器制御部101は、音声認識部106から、テキストデータと、音声コマンドを発声したユーザの識別情報であるユーザIDとを受け取る。<
The
機器制御部101は、入力部15から出力されるリモコン20のキーイベントを受け取り、そのときに表示部17に表示されている画面との関連から、キーイベントの対象となる操作を割り出し、キーイベントが操作コマンドに該当するか否かを判断する。キーイベントが操作コマンドであるか否かの判断基準は、機器制御部101によって制御される制御対象が要求する機器の仕様によって異なる。
The
例えば、制御対象である表示部17の画面に郵便番号の登録用の入力画面が表示されている状況で、リモコン20で数字キーが押下された場合には、機器制御部101は、ユーザ操作を郵便番号の入力として扱い、郵便番号の入力が完了するまで、数字キーの押下を、操作コマンドの入力、すなわち、対象機器の動作命令の入力として扱わない。また、表示部17の画面に何も表示されていない状況で、リモコン20の数字キーが押下された場合には、機器制御部101は、ユーザ操作である数字キーの押下をチャンネルの選局として扱い、ユーザ操作が、予め決められた操作コマンドであると判断する。ユーザ操作が予め決められた操作コマンドであると判断された場合には、機器制御部101は、操作コマンドを示すユーザ操作信号と、ユーザ認識部105から受け取ったユーザIDと、ユーザ操作の時刻及び曜日の少なくとも一方を含む時間情報とを、解析部103へ出力する。
For example, when an input screen for registering a zip code is displayed on the screen of the
また、機器制御部101は、マイク11から入力されたユーザの発話指示、すなわち、対象機器の機能を示す用語を含む音声指示である音声コマンドに基づいて、テレビ装置10の動作を制御する機能を備えている。つまり、機器制御部101は、ユーザが発声する音声コマンドが示すフレーズとそのフレーズに対応する対象機器の動作とが関連付けされている情報である音声操作情報を予めデータベース部104などに記憶し、この音声操作情報を参照することによって、ユーザが発声した音声コマンドを対象機器に対する操作コマンドとして認識する機能を有している。例えば、機器制御部101は、マイク11から入力されたユーザの音声コマンドが「音量を上げて。」である場合、発話指示の内容に応じた操作コマンドを生成して、この操作コマンド(すなわち、音声コマンドに基づく操作コマンド)に基づいて制御を行う機能を備えてもよい。このような、対象機器の機能を示す用語を含む音声コマンドによる対象機器の制御は、特許文献1に示されるように、公知の技術である。
Further, the
また、本実施の形態に係る機器制御装置100においては、機器制御部101は、ユーザから「いつもの」などの、機能を示す用語を含まない1つ以上の単語を含む定型句からなる音声コマンドとして使用することができる。機能を示す用語を含まない定型句の例は、「いつもの」の他に、「あれ」、「それ」などの指示代名詞、などである。機器制御部101は、機能を示す用語を含まない定型句の候補として、複数のテキストを予め機器制御装置100内のメモリに登録している。入力された音声コマンドに対応するテキストデータが、登録されている定型句の候補のいずれかと一致する場合に、そのテキストデータを解析部103へ出力する。定型句の候補を記憶するメモリは、後述の図2に示されるメモリ201であってもよい。
Further, in the
〈解析部103〉
機器制御装置100においては、解析部103は、リモコン20によるユーザ操作の操作履歴及び音声コマンドによる操作履歴から、操作頻度の高い、一連の操作群を、曜日又は時刻などを含むユーザ環境情報毎に、パターンコマンドとして抽出する。パターンコマンドは、操作パターンである一連の操作コマンド群と、ユーザが当該一連の操作を実施した時点のユーザ環境情報とをまとめた情報である。パターンコマンドの抽出では、ユーザ毎に、曜日又は時刻、特定期間毎の操作又は、ある一定操作後に実施される操作など、定期的に実行される操作の中でパターン化されているユーザ操作情報をパターンコマンドとして取り出す。<
In the
操作コマンドは、例えば、リモコン20から入力されたユーザ操作のうちの、予め決められた操作、及び音声コマンドのうちの、予め決められた音声コマンドである。操作コマンドは、リモコン20から入力され機器制御部101を通して、又は音声コマンドに基づいて機器制御部101で生成されて解析部103に提供される。
The operation command is, for example, a predetermined voice command among the user operations input from the
また、本出願では、ユーザ環境情報は、機器制御部101から操作コマンドが出力された時点におけるユーザの環境を示すものであり、例えば、曜日及び時刻を含む時間情報と、ユーザIDとを含む。なお、時刻は、年月日情報を含んでもよい。
Further, in the present application, the user environment information indicates the environment of the user at the time when the operation command is output from the
また、本出願では、操作履歴は、操作コマンドと、この操作コマンドが実行された時点におけるユーザ環境情報とを含む。 Further, in the present application, the operation history includes an operation command and user environment information at the time when the operation command is executed.
また、本出願では、パターンコマンドは、操作コマンド群から構成される。操作コマンド群は、複数の操作コマンドの時系列配列であり、複数の操作コマンドを実施した時点におけるユーザ環境情報をも含む。パターンコマンドは、複数回に渡って抽出された複数の操作コマンドから構成されるので、パターンコマンド内の操作コマンドの実行時刻の間には、ある程度の時間幅が存在する。したがって、操作コマンドに付随するユーザ環境情報に含まれる時刻としては、例えば、パターンコマンド内の複数の操作コマンドに付随する複数のユーザ環境情報に含まれる複数の時刻の平均時刻が用いられる。 Further, in the present application, the pattern command is composed of a group of operation commands. The operation command group is a time-series array of a plurality of operation commands, and also includes user environment information at the time when the plurality of operation commands are executed. Since the pattern command is composed of a plurality of operation commands extracted over a plurality of times, there is a certain time width between the execution times of the operation commands in the pattern command. Therefore, as the time included in the user environment information attached to the operation command, for example, the average time of a plurality of times included in the plurality of user environment information attached to the plurality of operation commands in the pattern command is used.
解析部103によるデータベース部104からのパターンコマンドの読み出し(すなわち、抽出)は、ある特定の曜日、又はある特定の時刻、又はある特定の曜日における特定の時刻におけるユーザ環境情報下において、定期的に実行される処理である。解析部103によるデータベース部104からのパターンコマンドの読み出しは、ユーザ毎で、且つ操作コマンド毎で実施される。解析部103は、あるユーザ環境情報下において、パターンコマンド内の操作コマンドの各々が、ある一定時間内に、ある一定頻度で出現した場合に、一連の操作コマンドの各々は、一定のパターンを持つ操作コマンド、すなわち、パターンコマンドであると判断する。解析部103は、一連の操作コマンドの間の実行時刻の間隔の閾値、及びパターンコマンドの出現回数の閾値を設けて、これらをパターン抽出時の基準として用いる。
The
本実施の形態では、解析部103は、パターンコマンドの検出を、操作コマンドのレベルにて実施するが、リモコン20のキーイベント又は音声コマンドに基づく操作コマンドの入力など、すべての情報を操作コマンドとして扱い、この操作コマンドに基づいてパターンコマンドを抽出してもよい。また、解析部103は、ユーザの識別を行わずに、パターンコマンドの抽出を行ってもよい。
In the present embodiment, the
データベース部104は、解析部103が機器制御部101から提供された操作コマンドと、この操作コマンドの実行時におけるユーザ環境情報と、解析部103が抽出したパターンコマンドとを記憶する。
The
解析部103は、機器制御部101から提供された操作コマンドとユーザ環境情報とをデータベース部104に、順次、操作履歴として記録する。ユーザ環境情報に含まれる時刻情報は、例えば、時間情報取得部101aから提供される。また、解析部103は、予め決められた時間毎に、データベース部104から操作履歴を読み出し、ユーザ毎に、予め決められた一定期間内において操作パターンが類似している1つ以上の操作コマンドからなる操作コマンド群を抽出し、この操作コマンド群をパターンコマンドとしてデータベース部104に登録する。
The
解析部103は、機器制御部101から出力される操作コマンドと、出力された時点でのユーザ環境情報とを関連付けて時系列配列として、ある一定数の時系列配列を保持する。また、解析部103は、ユーザ毎に、機器制御部101から出力される操作コマンドを常時、監視し、一連の操作コマンドから構成される操作コマンド群と、その操作コマンド群に基づく動作の実行時のユーザ環境情報とを、データベース部104に記憶されているパターンコマンドの操作コマンド及びユーザ環境情報と比較する。解析部103は、操作コマンド群とユーザ環境情報とが、データベース部104に記憶されているパターンコマンドの操作コマンド及びユーザ環境情報と類似している場合に、ユーザに対する通知を実行する。この通知は、同じユーザ環境情報下においてユーザ操作が、習慣的な操作として、ある一定回数を超えて実行され、対象機器がパターンコマンドとして認識したことをユーザに示すためのものである。この通知は、基本的に1回のみ行われる。また、解析部103は、音声による通知の代わりに、又は音声による通知に加えて、表示部17の画面による通知を行ってもよい。
The
ユーザに対する通知は、「いつもの操作ですね」などの、機能を示す用語を含まないフレーズを用いて、当該操作を習慣的な操作として対象機器が認識していることを通知する。これにより、ユーザは、以後、対象機器に対して、一連の操作を指示する際に、「いつもの」などの定型句からなる音声コマンドで指示することができることを把握できる。このため、ユーザは、個別にパターンコマンド固有のコマンド名を記憶する必要がない。したがって、定型句からなる音声コマンドで操作指示することができ、ユーザの操作負担を軽減することができる。 The notification to the user uses a phrase that does not include a term indicating a function, such as "It is a usual operation", to notify that the target device recognizes the operation as a habitual operation. As a result, the user can understand that when instructing the target device to perform a series of operations, the user can instruct the target device by a voice command consisting of a fixed phrase such as "usual". Therefore, the user does not need to individually memorize the command name unique to the pattern command. Therefore, it is possible to give an operation instruction by a voice command consisting of a fixed phrase, and it is possible to reduce the operation burden on the user.
この通知後、ユーザから「いつもの」など、対象機器の機能を示す用語を含まない定型句からなる音声コマンドを使用して操作指示が行われると、解析部103は、機器制御部101から出力されるテキストデータである「いつもの」を受け付け、この指示を受けた際のユーザ環境情報と、データベース部104に記録されているパターンコマンドのユーザ環境情報とを比較する。解析部103は、類似しているユーザ環境情報を保持するパターンコマンドを検出して、ある一定の確度で一致した場合に、推定操作部102にパターンコマンドを出力する。
After this notification, when an operation instruction is given by the user using a voice command consisting of a fixed phrase that does not include a term indicating the function of the target device such as "usual", the
また、解析部103は、機器制御部101から出力された操作コマンドにおけるユーザ環境情報から、そのユーザ環境情報に該当するパターンコマンドをデータベース部104から取り出す。解析部103は、取り出したパターンコマンドの前段の一部が、前記時系列配列内の操作コマンドとユーザ環境情報に類似した場合に、その都度、操作コマンドがユーザへパターンコマンドとして検知できたことをユーザに通知してもよい。つまり、現在のユーザによって現在の操作コマンドが入力されたときに、解析部103は、現在のユーザの現在のユーザ環境情報に一致する、データベース部104に記憶されているユーザ環境情報を有するパターンコマンドを読み出し、現在の操作コマンドが、読み出されたパターンコマンドに含まれる操作コマンドに類似しているか否かを判断し、類似していると判断した場合に、音声合成部107に、定型句によって入力可能なパターンコマンドが存在していることを通知部に通知させてもよい。ここで、現在の操作コマンドが、読み出されたパターンコマンドに含まれる操作コマンドに類似しているとは、現在の操作コマンドと、パターンコマンドに含まれる操作コマンドとが、いずれも、同じ種類の操作(例えば、チャンネルの選局、音量の調整、など)である場合である。
Further, the
ユーザに対する通知において、機器制御部101は、「いつもの操作ですね。」のように、機能を示す用語を含まない定型句を用いた操作案内を実施する。また、音声出力による通知に加えて、表示部17の画面上に通知情報を表示することで操作案内を通知してもよい。これにより、当該操作が「いつもの」などの機能を示す用語を含まない定型句からなる音声コマンドを使用して指示できる操作であることを、ユーザが忘れた場合にも、対象機器側から「いつもの操作ですね」などの機能を示す用語を含まない定型句を用いて通知される。このため、「いつもので」など、簡単な返答で操作を実行することができ、ユーザの操作負担を軽減することができる。
In the notification to the user, the
〈推定操作部102〉
推定操作部102は、解析部103から出力されたパターンコマンドに基づいて、操作コマンドを推定し、機器制御部101に推定された操作コマンドの実行を順次指示する。推定操作部102は、パターンコマンドを用いて操作する際には、ユーザ環境情報の各操作コマンドの時刻に対応する時刻に指示を出力する。<
The
推定操作部102がパターンコマンドに対応する推定された操作コマンドの実行を順次指示している間に、ユーザによるリモコン20の操作、すなわち、割り込み操作があった場合、機器制御装置100は、割り込み操作を行ったユーザの意図を推定する。つまり、推定操作部102は、パターンコマンドが、ユーザの意図したものと異なっているかどうかを判断する。この判断は、パターンコマンドの操作コマンド毎に、当該操作コマンドを拒絶するリモコン操作を予め登録しておき、この登録情報を参照して行われる。例えば、推定操作部102は、録画番組の再生時におけるボリュームの上げ・下げの操作、又は早送り・巻戻しの操作などは、選択されたパターンコマンドに対応する操作コマンドを拒絶するリモコン操作とみなさないことができる。
If the user operates the
これにより、ユーザから「いつもの」など、機能を示す用語を含まない定型句からなる音声コマンドが発声されて、推定操作部102によって推定されたパターンコマンドを実行している際に、ユーザからの操作の割り込みがあった場合に、機器制御装置100は、パターンコマンドの一連の操作における追加操作であるのか、推定したパターンコマンドの中断をユーザが希望するものなのかを、判断することができる。このため、ユーザが選択されたパターンコマンドを拒絶する意思がない場合に、ユーザの希望に反してパターンコマンドに基づく処理の実行を中止することがなくなり、ユーザの操作負担を軽減することができる。
As a result, when a voice command consisting of a fixed phrase that does not include a term indicating a function such as "usual" is uttered from the user and the pattern command estimated by the
〈ハードウェア構成〉
図2は、本実施の形態に係る機器制御装置100のハードウェア構成の例を示す図である。図2において、図1に示される構成要素と同じ構成要素には、図1に示される符号と同じ符号が付される。図2に示されるように、機器制御装置100は、フラッシュメモリなどのメモリ201と、情報処理部としてのプロセッサ202と、記憶装置203とを備えている。メモリ201は、フラッシュROM(Read Only Memory)及びRAM(Random Access Memory)を含む。機器制御装置100は、例えば、電子機器の一部である。機器制御装置100は、コンピュータであってもよい。メモリ201は、プロセッサ202によって実行されるOS(Operating System)、本実施の形態に係る機器制御プログラムなどのアプリケーションプログラム、ファームウェア、などを記録することができる。記憶装置203は、例えば、HDD(Hard Disk Drive)又は半導体記憶装置で構成される。<Hardware configuration>
FIG. 2 is a diagram showing an example of the hardware configuration of the
図1に示される機器制御装置100の全体又は一部は、ソフトウェアとしてのプログラムを格納するメモリ201と、メモリ201に格納されたプログラムを実行するプロセッサ202とを用いて実現することができる。また、図1におけるデータベース部104は、図2における記憶装置203によって実現することができる。
The whole or a part of the
《3》機器制御装置100の動作
図3は、本実施の形態に係る機器制御装置100の動作を示すフローチャートである。本実施の形態に係る機器制御装置100は、ユーザ操作部であるリモコン20から入力され、入力部15で取得された操作コマンドに基づいて対象機器の動作を制御することができる。また、機器制御装置100は、マイク11から入力された音声コマンドに基づいて対象機器の動作を制御することができる。本実施の形態に係る機器制御装置100においては、音声コマンドとして、対象機器の機能を示す用語を含む具体的な命令文による音声コマンドだけでなく、対象機器の機能を示す用語を含まない曖昧な表現である定型句からなる音声コマンドを用いることができる。対象機器の機能を示す用語を含む具体的な命令文の例は、「ボリュームを上げて下さい。」、「チャンネル4に変えて下さい。」、などである。対象機器の機能を示す用語を含まない曖昧な表現である定型句の例は、「いつもの」、「いつものやつ」、などのフレーズ、「あれ」、「それ」などの指示代名詞、である。<< 3 >> Operation of the
図3に基づいて、本実施の形態に係る機器制御装置100の主要な動作を説明する。先ず、ステップS1において、リモコン20によるユーザ操作に基づく操作コマンドが入力されると又は音声コマンドに基づく操作コマンドが入力されると、解析部103は、機器制御部101を通して、操作コマンド、操作コマンドを入力したユーザを示すユーザID、及びこの操作コマンドが入力されたときの時刻及び曜日を含む時間情報を受け取り、操作コマンド、ユーザID、及び時間情報を互いに関連付けることで得られたユーザ操作情報を、データベース部104に操作履歴情報104aとして格納する。解析部103は、ユーザ操作情報を蓄積する動作を、操作コマンドが入力される度に行う。
Based on FIG. 3, the main operation of the
次のステップS2において、解析部103は、データベース部104に記録されている操作履歴情報104aからユーザ操作情報を抽出し、抽出された複数のユーザ操作情報のうちの、予め決められた類似条件を満たすユーザ操作情報を、パターンコマンドとしてデータベース部104に記録する。
In the next step S2, the
予め決められた類似条件は、例えば、以下の(1)〜(3)のいずれかである。
(1)ユーザIDが共通であり、時間情報に含まれる時刻の差が予め決められた範囲内であること。
(2)ユーザIDが共通であり、時間情報に含まれる曜日が共通であること。
(3)ユーザIDが共通であり、時間情報に含まれる曜日が共通であり、時間情報に含まれる時刻の差が予め決められた範囲内であること。The predetermined similar condition is, for example, one of the following (1) to (3).
(1) The user ID is common, and the time difference included in the time information is within a predetermined range.
(2) The user ID is common, and the days of the week included in the time information are common.
(3) The user ID is common, the day of the week included in the time information is common, and the time difference included in the time information is within a predetermined range.
次のステップS3において、機器制御部101は、パターンコマンドの入力操作を、音声コマンドである曖昧な定型句からなる音声コマンドの発声によって実行可能であることをユーザに通知する。通知は、音声合成部107によって生成された合成音声信号に基づいてスピーカ13から出力される合成音声によって行われる。また、通知は、表示部17に表示される映像によって行われてもよい。
In the next step S3, the
次のステップS4において、音声コマンドである曖昧な定型句からなる音声コマンドが発声されたときに、解析部103は、発声された定型句からなる音声コマンドに対応するパターンコマンドをデータベース部104から読み出し、推定操作部102は、このパターンコマンドに対応する操作コマンドを推定し、推定されたパターンコマンドを機器制御部101に提供する。機器制御部101は、推定操作部102から受け取ったパターンコマンドにしたがって対象機器を制御する。
In the next step S4, when a voice command consisting of an ambiguous fixed phrase, which is a voice command, is uttered, the
図4は、本実施の形態に係る機器制御装置100における操作履歴情報の記録時の動作を示すフローチャートである。図4は、図3におけるステップS1の処理の詳細を示す。
FIG. 4 is a flowchart showing an operation at the time of recording operation history information in the
先ず、ステップS11において、ユーザによりリモコン20が操作されると、機器制御部101は、入力部15を介して入力されたユーザ操作信号を受け取る。
First, in step S11, when the
次のステップS12において、機器制御部101は、受信したユーザ操作信号が予め決められた操作コマンドに基づく信号であるか否かを判断する。つまり、機器制御部101は、ユーザ操作信号が操作履歴情報104aとして記録されるべき操作コマンド、すなわち、予め決められた操作コマンドに基づく信号であるか否かを判断する。
In the next step S12, the
ユーザ操作信号が予め決められた操作コマンドに基づく信号である場合(ステップS12における判断が「はい」である場合)、処理はステップS13に進み、ユーザ操作信号が予め決められた操作コマンドに基づく信号でない場合(ステップS12における判断が「いいえ」である場合)、処理はステップS11に戻る。 When the user operation signal is a signal based on a predetermined operation command (when the determination in step S12 is "Yes"), the process proceeds to step S13, and the user operation signal is a signal based on the predetermined operation command. If not (when the determination in step S12 is "No"), the process returns to step S11.
処理がステップS13に進んだ場合、解析部103は、機器制御部101から操作コマンドと、ユーザIDと時間情報とを含むユーザ環境情報と、を受け取る。
When the process proceeds to step S13, the
次のステップS14において、解析部103は、操作コマンドとユーザ環境情報とを関連付けて得られたユーザ操作情報を、データベース部104に操作履歴情報104aとして記録する。つまり、データベース部104に記録される操作履歴情報104aは、ユーザ操作に基づく操作コマンドとユーザ環境情報とを関連付けて得られたユーザ操作情報のみから構成されてもよい。ただし、データベース部104に記録される操作履歴情報104aは、ユーザ操作に基づく操作コマンドとユーザ環境情報とを関連付けて得られたユーザ操作情報と、音声コマンドに基づく操作コマンドとユーザ環境情報とを関連付けて得られたユーザ操作情報との両方を含むことが望ましい。なお、データベース部104に記録される操作履歴情報104aは、音声コマンドに基づく操作コマンドとユーザ環境情報とを関連付けて得られたユーザ操作情報のみから構成することも可能である。
In the next step S14, the
図5は、本実施の形態に係る機器制御装置100におけるパターンコマンドの記録時の動作を示すフローチャートである。図5は、図3におけるステップS2の処理の詳細を示す。なお、パターンコマンドは、対象機器の機能を示す用語を含まない音声コマンドである曖昧な定型句によって、入力操作を行うことが可能なコマンドである。
FIG. 5 is a flowchart showing an operation at the time of recording a pattern command in the
先ず、ステップS21において、解析部103は、予め決められた時間毎にデータベース部104を参照して、データベース部104に操作履歴情報104aが有るか否かを判断する。
First, in step S21, the
操作履歴情報104aが有る場合(ステップS21における判断が「はい」である場合)、処理はステップS22に進み、操作履歴情報104aが無い場合(ステップS21における判断が「いいえ」である場合)、ステップS21の処理が再度行われる。 When the operation history information 104a is present (when the determination in step S21 is "yes"), the process proceeds to step S22, and when there is no operation history information 104a (when the determination in step S21 is "no"), the step The process of S21 is performed again.
処理がステップS22に進んだ場合、解析部103は、データベース部104に記録されている操作履歴情報104aから、予め決められた一定期間内の操作履歴であるユーザ操作情報を読み出す。
When the process proceeds to step S22, the
次のステップS23において、解析部103は、読み出されたユーザ操作情報がパターンコマンドの条件を満たすか否かを判断する。つまり、解析部103は、読み出されたユーザ操作情報が、ユーザによって繰り返し実行されたユーザ操作についてのユーザ操作情報であり、ユーザ操作情報は類似するユーザ環境情報を含んでおり、繰り返し実行回数が予め決められた基準回数を越えたユーザ操作についての複数のユーザ操作情報(すなわち、ユーザ操作情報群)からなる、パターンコマンドであるか否かを判断する。
In the next step S23, the
ユーザ操作情報群がパターンコマンドの条件を満たす場合(ステップS23における判断が「はい」である場合)、処理はステップS24に進み、ユーザ操作情報群がパターンコマンドの条件を満たさない場合(ステップS23における判断が「いいえ」である場合)、処理はステップS21に戻る。 When the user operation information group satisfies the condition of the pattern command (when the determination in step S23 is "Yes"), the process proceeds to step S24, and when the user operation information group does not satisfy the condition of the pattern command (in step S23). If the determination is "no"), the process returns to step S21.
処理がステップS24に進んだ場合、解析部103は、データベース部104に、一連のユーザ操作情報群とそのユーザ環境情報であるユーザID及び時間情報とを、パターンコマンドとして記録する。
When the process proceeds to step S24, the
図6は、本実施の形態に係る機器制御装置100におけるユーザに対する通知の動作を示すフローチャートである。図6は、図3におけるステップS3の詳細を示す。
FIG. 6 is a flowchart showing the operation of notification to the user in the
先ず、ステップS31において、ユーザによりリモコン20が操作されると、機器制御部101は、入力部15を介して入力されたユーザ操作信号を受け取る。
First, in step S31, when the
次のステップS32において、機器制御部101は、受信したユーザ操作信号が予め決められた操作コマンドに基づく信号であるか否かを判断する。
In the next step S32, the
ユーザ操作信号が予め決められた操作コマンドに基づく信号である場合(ステップS32における判断が「はい」である場合)、処理はステップS33に進み、ユーザ操作信号が予め決められた操作コマンドに基づく信号でない場合(ステップS32における判断が「いいえ」である場合)、処理はステップS31に戻る。 When the user operation signal is a signal based on a predetermined operation command (when the determination in step S32 is "Yes"), the process proceeds to step S33, and the user operation signal is a signal based on the predetermined operation command. If not (when the determination in step S32 is "No"), the process returns to step S31.
処理がステップS33に進んだ場合、解析部103は、機器制御部101から操作コマンドと、ユーザIDと時間情報とを含むユーザ環境情報と、を受け取る。
When the process proceeds to step S33, the
次のステップS34において、解析部103は、データベース部104からパターンコマンドを読み出す。
In the next step S34, the
次のステップS35において、解析部103は、読み出されたパターンコマンドを参照し、入力された現時点における操作コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが有るか否かを判断する。つまり、解析部103は、現時点における操作コマンドのユーザ環境情報と合致するユーザ環境情報を含むパターンコマンドが有るか否かを判断する。
In the next step S35, the
操作コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが有る場合(すなわち、ステップS35における判断が「はい」である場合)、処理はステップS36に進み、操作コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが無い場合(すなわち、ステップS35における判断が「いいえ」である場合)、処理はステップS31に戻る。 When there is a user ID of the operation command, a user ID matching the time information, and a pattern command including the time information (that is, when the determination in step S35 is "yes"), the process proceeds to step S36, and the user of the operation command When there is no pattern command including the ID, the user ID matching the time information, and the time information (that is, when the determination in step S35 is "No"), the process returns to step S31.
処理がステップS36に進んだ場合、解析部103は、現在の操作コマンドが、パターンコマンドと類似しているか否かを判断する。
When the process proceeds to step S36, the
操作コマンドがパターンコマンドに類似している場合(すなわち、ステップS36における判断が「はい」である場合)、処理はステップS37に進み、操作コマンドがパターンコマンドに類似していない場合(すなわち、ステップS36における判断が「いいえ」である場合)、処理はステップS31に戻る。 If the operation command is similar to the pattern command (ie, if the decision in step S36 is "yes"), the process proceeds to step S37 and if the operation command is not similar to the pattern command (ie, step S36). If the determination in is "No"), the process returns to step S31.
処理がステップS37に進んだ場合、解析部103は、機器制御部101に、合成音声による通知を実行させる。つまり、解析部103は、ユーザに対して「いつもの操作ですね」と合成音声で通知するように、機器制御部101に指示する。
When the process proceeds to step S37, the
図7は、本実施の形態に係る機器制御装置100における音声コマンドである定型句が入力されたときの動作を示すフローチャートである。図6は、図3におけるステップS4の詳細を示す。
FIG. 7 is a flowchart showing an operation when a fixed phrase, which is a voice command, is input in the
先ず、ステップS41において、ユーザにより音声コマンドである定型句が発声されると、機器制御部101は、マイク11、A/Dコンバータ12、音声認識部106を介して音声コマンドに対応するテキストデータを受け取る。定型句は、制御対象の機能を示す用語を含まない音声コマンドであり、例えば、「いつもの」、「あれ」、などである。
First, in step S41, when a fixed phrase that is a voice command is uttered by the user, the
次のステップS42において、解析部103は、機器制御部101から定型句のテキストデータを受け取る。
In the next step S42, the
次のステップS43において、解析部103は、データベース部104からパターンコマンドを読み出す。
In the next step S43, the
次のステップS44において、解析部103は、読み出されたパターンコマンドを参照し、入力された現時点における音声コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが有るか否かを判断する。つまり、解析部103は、現時点における音声コマンドのユーザ環境情報と合致するユーザ環境情報を含むパターンコマンドが有るか否かを判断する。
In the next step S44, the
音声コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが有る場合(すなわち、ステップS44における判断が「はい」である場合)、処理はステップS45に進み、音声コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが無い場合(すなわち、ステップS44における判断が「いいえ」である場合)、処理はステップS41に戻る。 When there is a user ID of the voice command, a user ID matching the time information, and a pattern command including the time information (that is, when the determination in step S44 is "yes"), the process proceeds to step S45, and the user of the voice command When there is no pattern command including the ID, the user ID matching the time information, and the time information (that is, when the determination in step S44 is "No"), the process returns to step S41.
処理がステップS45に進んだ場合、解析部103は、音声コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドを推定操作部102に出力する。つまり、解析部103は、音声コマンドのユーザ環境情報と合致するユーザ環境情報を含むパターンコマンドを推定操作部102に出力する。
When the process proceeds to step S45, the
次のステップS46において、推定操作部102は、受け取ったパターンコマンドに対応する操作コマンドを機器制御部101に出力する。次のステップS47において、機器制御部101は、推定操作部102から受け取った操作コマンドに基づいて対象機器の動作を制御する。
In the next step S46, the
図8は、本実施の形態に係る機器制御装置100におけるパターンコマンドの確認の通知の処理を示すフローチャートである。
FIG. 8 is a flowchart showing a process of notifying confirmation of a pattern command in the
先ず、ステップS51において、ユーザによりリモコン20が操作されると、機器制御部101は、入力部15を介して入力されたユーザ操作信号を受け取る。
First, in step S51, when the
次のステップS52において、機器制御部101は、受信したユーザ操作信号が予め決められた操作コマンドに基づく信号であるか否かを判断する。
In the next step S52, the
ユーザ操作信号が予め決められた操作コマンドに基づく信号である場合(すなわち、ステップS52における判断が「はい」である場合)、処理はステップS53に進み、ユーザ操作信号が予め決められた操作コマンドに基づく信号でない場合(すなわち、ステップS52における判断が「いいえ」である場合)、処理はステップS51に戻る。 When the user operation signal is a signal based on a predetermined operation command (that is, when the determination in step S52 is "yes"), the process proceeds to step S53, and the user operation signal becomes a predetermined operation command. If the signal is not based (ie, the determination in step S52 is "no"), the process returns to step S51.
処理がステップS53に進んだ場合、解析部103は、機器制御部101から操作コマンドと、ユーザIDと時間情報とを含むユーザ環境情報と、を受け取る。
When the process proceeds to step S53, the
次のステップS54において、解析部103は、データベース部104からパターンコマンドを読み出す。
In the next step S54, the
次のステップS55において、解析部103は、読み出されたパターンコマンドを参照し、入力された現時点における操作コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが有るか否かを判断する。つまり、解析部103は、現時点における操作コマンドのユーザ環境情報と合致するユーザ環境情報を含むパターンコマンドが有るか否かを判断する。
In the next step S55, the
操作コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが有る場合(すなわち、ステップS55における判断が「はい」である場合)、処理はステップS56に進み、操作コマンドのユーザID、時間情報と合致するユーザID、時間情報を含むパターンコマンドが無い場合(すなわち、ステップS55における判断が「いいえ」である場合)、処理はステップS51に戻る。 When there is a user ID of the operation command, a user ID matching the time information, and a pattern command including the time information (that is, when the determination in step S55 is "yes"), the process proceeds to step S56, and the user of the operation command When there is no pattern command including the ID, the user ID matching the time information, and the time information (that is, when the determination in step S55 is "No"), the process returns to step S51.
処理がステップS56に進んだ場合、解析部103は、現在の操作コマンドが、パターンコマンドの前段の一部と類似しているか否かを判断する。つまり、現在のユーザによって現在の操作コマンドが入力されたときに、解析部103は、現在のユーザの現在のユーザ環境情報に一致する、データベース部104に記憶されているユーザ環境情報を有するパターンコマンドを読み出し、現在の操作コマンドが、読み出されたパターンコマンドに含まれる操作コマンドに類似しているか否かを判断する。
When the process proceeds to step S56, the
操作コマンドがパターンコマンドの前段の一部、すなわち、パターンコマンドに含まれる操作コマンドに類似している場合(すなわち、ステップS56における判断が「はい」である場合)、処理はステップS57に進み、操作コマンドがパターンコマンドの前段の一部に類似していない場合(すなわち、ステップS56における判断が「いいえ」である場合)、処理はステップS51に戻る。 When the operation command is a part of the first stage of the pattern command, that is, similar to the operation command included in the pattern command (that is, when the judgment in step S56 is "yes"), the process proceeds to step S57 and the operation proceeds. If the command does not resemble a part of the first stage of the pattern command (that is, if the determination in step S56 is "no"), the process returns to step S51.
処理がステップS57に進んだ場合、解析部103は、機器制御部101に、合成音声による通知を実行させる。つまり、解析部103は、ユーザに対して「いつもの操作ですか?」と合成音声で確認の通知を行うように、機器制御部101に指示する。
When the process proceeds to step S57, the
《4》機器制御装置100の効果
以上に説明したように、本実施の形態に係る機器制御装置100、機器制御システム10、機器制御方法、又は機器制御プログラムを用いれば、リモコン20からのユーザ入力操作と予め決められた音声コマンドによる音声入力操作に加えて、対象機器の機能を含まない曖昧な定型句である音声コマンドによって、対象機器を制御することができる。<< 4 Effect of
また、音声コマンドである定型句として「いつもの」、「さっきの」、などの決まり文句、及び「あれ」、「それ」、などの指示代名詞を用いることができるので、ユーザは、音声コマンドの内容を記憶している必要がない。このためユーザの負担を軽減することができる。 In addition, since fixed phrases such as "usual" and "previous" and demonstrative pronouns such as "that" and "it" can be used as fixed phrases that are voice commands, the user can use the voice command. You don't have to remember the contents. Therefore, the burden on the user can be reduced.
10 テレビ装置、 11 マイク、 12 A/Dコンバータ、 13 スピーカ、 14 D/Aコンバータ、 15 入力部、 16 カメラ、 20 リモコン、 100 機器制御装置、 101 機器制御部、 101a 時間情報生成部、 102 推定操作部、 103 解析部、 データベース部、 104a 操作履歴情報、 105 ユーザ認識部、 106 音声認識部、 107 音声合成部。 10 TV device, 11 microphone, 12 A / D converter, 13 speaker, 14 D / A converter, 15 input unit, 16 camera, 20 remote controller, 100 device control device, 101 device control unit, 101a time information generator, 102 estimation Operation unit, 103 analysis unit, database unit, 104a operation history information, 105 user recognition unit, 106 voice recognition unit, 107 voice synthesis unit.
Claims (15)
前記操作コマンドが入力されたときの時刻及び曜日の少なくとも一方を含む時間情報を取得する時間情報取得部と、
前記ユーザ操作を入力するユーザ及び前記音声コマンドを発声するユーザを示すユーザ特定情報を生成するユーザ特定情報生成部と、
前記操作コマンドに、前記ユーザ特定情報と前記時間情報とを含む第1のユーザ環境情報を関連付けることで得られたユーザ操作情報を、前記操作コマンドが入力される度に蓄積することで、複数のユーザ操作情報を含む操作履歴情報を記憶するデータベース部と、
予め決められた類似条件を満たす第1のユーザ環境情報を含む複数のユーザ操作情報をパターンコマンドとして前記データベース部に記録するパターンコマンド記録処理と、1つ以上の単語を含む定型句からなる前記音声コマンドが発声されたときに、前記定型句からなる前記音声コマンドに基づく前記操作コマンドについての前記ユーザ特定情報と前記時間情報とを含む第2のユーザ環境情報に合致する前記第1のユーザ環境情報を含む前記パターンコマンドを前記データベース部から選択する音声解析処理と、を行う解析部と、
前記解析部によって選択された前記パターンコマンドに基づいて前記対象機器の動作を制御する機器制御部と、
を有することを特徴とする機器制御装置。A device control device that controls the operation of a target device by at least one of an operation command based on a user operation input from a user operation unit and an operation command based on a voice command input from a microphone.
A time information acquisition unit that acquires time information including at least one of the time and the day of the week when the operation command is input, and
A user-specific information generator that generates user-specific information indicating a user who inputs the user operation and a user who issues the voice command, and a user-specific information generator.
A plurality of user operation information obtained by associating the operation command with the first user environment information including the user identification information and the time information is accumulated each time the operation command is input. A database section that stores operation history information including user operation information,
The voice consisting of a pattern command recording process for recording a plurality of user operation information including a first user environment information satisfying a predetermined similarity condition in the database unit as a pattern command, and a fixed phrase containing one or more words. When the command is uttered, the first user environment information that matches the second user environment information including the user specific information and the time information for the operation command based on the voice command consisting of the fixed phrase. An analysis unit that performs voice analysis processing for selecting the pattern command including the above database unit from the database unit, and
A device control unit that controls the operation of the target device based on the pattern command selected by the analysis unit.
A device control device characterized by having.
前記解析部は、
前記現在のユーザの現在のユーザ環境情報に一致する、前記データベース部に記憶されている前記第1のユーザ環境情報を有する前記パターンコマンドを読み出し、
前記現在の操作コマンドが、読み出された前記パターンコマンドに含まれる操作コマンドに類似しているか否かを判断し、
類似していると判断した場合に、前記通知部に、前記定型句からなる前記音声コマンドによって入力可能なパターンコマンドが存在していることを通知させる
ことを特徴とする請求項10に記載の機器制御装置。When the current operation command, which is either an operation command based on the user operation by the current user or an operation command based on the voice command by the current user, is input.
The analysis unit
Read the pattern command having the first user environment information stored in the database unit, which matches the current user environment information of the current user.
It is determined whether or not the current operation command is similar to the operation command included in the read pattern command.
The device according to claim 10, wherein when it is determined that they are similar, the notification unit is notified that a pattern command that can be input by the voice command composed of the fixed phrase exists. Control device.
前記機器制御装置によって制御される対象機器と、
を有することを特徴とする機器制御システム。The device control device according to any one of claims 1 to 12, and
The target device controlled by the device control device and
A device control system characterized by having.
前記操作コマンドが入力されたときの時刻及び曜日の少なくとも一方を含む時間情報を取得するステップと、
前記ユーザ操作を入力するユーザ及び前記音声コマンドを発声するユーザを示すユーザ特定情報を生成するステップと、
前記操作コマンドに、前記ユーザ特定情報と前記時間情報とを含む第1のユーザ環境情報を関連付けることで得られたユーザ操作情報を、前記操作コマンドが入力される度に蓄積することで、複数のユーザ操作情報を含む操作履歴情報をデータベース部に記憶するステップと、
予め決められた類似条件を満たす第1のユーザ環境情報を含む複数のユーザ操作情報をパターンコマンドとして前記データベース部に記録するステップと、
1つ以上の単語を含む定型句からなる前記音声コマンドが発声されたときに、前記定型句からなる前記音声コマンドに基づく前記操作コマンドについての前記ユーザ特定情報と前記時間情報とを含む第2のユーザ環境情報に合致する前記第1のユーザ環境情報を含む前記パターンコマンドを前記データベース部から選択するステップと、
選択された前記パターンコマンドに基づいて前記対象機器の動作を制御するステップと、
を有することを特徴とする機器制御方法。It is a device control method that controls the operation of the target device by at least one of an operation command based on the user operation input from the user operation unit and an operation command based on the voice command input from the microphone.
A step of acquiring time information including at least one of the time and the day of the week when the operation command is input, and
A step of generating user-specific information indicating a user who inputs the user operation and a user who utters the voice command, and
A plurality of user operation information obtained by associating the operation command with the first user environment information including the user identification information and the time information is accumulated each time the operation command is input. Steps to store operation history information including user operation information in the database section,
A step of recording a plurality of user operation information including a first user environment information satisfying a predetermined similarity condition as a pattern command in the database unit, and
When the voice command consisting of a fixed phrase including one or more words is uttered, a second including the user-specific information and the time information about the operation command based on the voice command consisting of the fixed phrase. A step of selecting the pattern command including the first user environment information matching the user environment information from the database unit, and
A step of controlling the operation of the target device based on the selected pattern command, and
A device control method characterized by having.
コンピュータに、
前記操作コマンドが入力されたときの時刻及び曜日の少なくとも一方を含む時間情報を取得する処理と、
前記ユーザ操作を入力するユーザ及び前記音声コマンドを発声するユーザを示すユーザ特定情報を生成する処理と、
前記操作コマンドに、前記ユーザ特定情報と前記時間情報とを含む第1のユーザ環境情報を関連付けることで得られたユーザ操作情報を、前記操作コマンドが入力される度に蓄積することで、複数のユーザ操作情報を含む操作履歴情報をデータベース部に記憶する処理と、
予め決められた類似条件を満たす第1のユーザ環境情報を含む複数のユーザ操作情報をパターンコマンドとして前記データベース部に記録する処理と、
1つ以上の単語を含む定型句からなる前記音声コマンドが発声されたときに、前記定型句からなる前記音声コマンドに基づく前記操作コマンドについての前記ユーザ特定情報と前記時間情報とを含む第2のユーザ環境情報に合致する前記第1のユーザ環境情報を含む前記パターンコマンドを前記データベース部から選択する処理と、
選択された前記パターンコマンドに基づいて前記対象機器の動作を制御する処理と、
を実行させることを特徴とする機器制御プログラム。A device control program that controls the operation of the target device by at least one of an operation command based on the user operation input from the user operation unit and an operation command based on the voice command input from the microphone.
On the computer
The process of acquiring time information including at least one of the time and the day of the week when the operation command is input, and
A process of generating user-specific information indicating a user who inputs the user operation and a user who utters the voice command, and
A plurality of user operation information obtained by associating the operation command with the first user environment information including the user identification information and the time information is accumulated each time the operation command is input. Processing to store operation history information including user operation information in the database section,
A process of recording a plurality of user operation information including a first user environment information satisfying a predetermined similarity condition in the database unit as a pattern command.
When the voice command consisting of a fixed phrase including one or more words is uttered, a second including the user-specific information and the time information about the operation command based on the voice command consisting of the fixed phrase. A process of selecting the pattern command including the first user environment information matching the user environment information from the database unit, and
A process of controlling the operation of the target device based on the selected pattern command, and
A device control program characterized by executing.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/004802 WO2020165933A1 (en) | 2019-02-12 | 2019-02-12 | Apparatus control device, apparatus control system, apparatus control method, apparatus control program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020165933A1 JPWO2020165933A1 (en) | 2021-03-25 |
JP6851565B2 true JP6851565B2 (en) | 2021-03-31 |
Family
ID=72044639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020569220A Active JP6851565B2 (en) | 2019-02-12 | 2019-02-12 | Device control device, device control system, device control method, and device control program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6851565B2 (en) |
WO (1) | WO2020165933A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331190A (en) * | 2020-09-04 | 2021-02-05 | 深圳Tcl新技术有限公司 | Intelligent equipment and method and device for self-establishing voice command thereof |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005181358A (en) * | 2003-12-16 | 2005-07-07 | Victor Co Of Japan Ltd | Speech recognition and synthesis system |
JP4684739B2 (en) * | 2005-05-13 | 2011-05-18 | クラリオン株式会社 | Audio processing device |
JP6522503B2 (en) * | 2013-08-29 | 2019-05-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Device control method, display control method and purchase settlement method |
US10018977B2 (en) * | 2015-10-05 | 2018-07-10 | Savant Systems, Llc | History-based key phrase suggestions for voice control of a home automation system |
US10467510B2 (en) * | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Intelligent assistant |
KR102025391B1 (en) * | 2017-05-15 | 2019-09-25 | 네이버 주식회사 | Device control according to user's talk position |
-
2019
- 2019-02-12 WO PCT/JP2019/004802 patent/WO2020165933A1/en active Application Filing
- 2019-02-12 JP JP2020569220A patent/JP6851565B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2020165933A1 (en) | 2020-08-20 |
JPWO2020165933A1 (en) | 2021-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11861264B2 (en) | Portable terminal device and information processing system | |
US5583965A (en) | Methods and apparatus for training and operating voice recognition systems | |
JP5771002B2 (en) | Speech recognition apparatus, speech recognition method, and television receiver equipped with speech recognition apparatus | |
US12003804B2 (en) | Information processing device, information processing method, and computer program | |
US20050259959A1 (en) | Media data play apparatus and system | |
KR102158315B1 (en) | Display apparatus for performing a voice control and method thereof | |
JP5743976B2 (en) | Information processing apparatus, program, and information processing method | |
US8041576B2 (en) | Information processing apparatus and information processing method | |
WO2019218656A1 (en) | Smart television and screenshot-taking application method therefor, and storage medium | |
JP4405418B2 (en) | Information processing apparatus and method | |
JP7406874B2 (en) | Electronic devices, their control methods, and their programs | |
JP6851565B2 (en) | Device control device, device control system, device control method, and device control program | |
KR101727587B1 (en) | A Method Generating Transcripts Of Digital Recording File | |
US20140152898A1 (en) | System and method capable of changing tv programs | |
US20160133243A1 (en) | Musical performance system, musical performance method and musical performance program | |
KR101781353B1 (en) | A Method Generating Digital Recording File Having Integrity | |
JP4235635B2 (en) | Data retrieval apparatus and control method thereof | |
KR100717009B1 (en) | Menu reproduction control method and apparatus therefor | |
JP2002358148A (en) | Method for correcting user interface of welfare electronic equipment and corresponding device and signal and data carrier | |
CN112236816A (en) | Information processing device, information processing system, and imaging device | |
JP4531546B2 (en) | Indexing system using control signals | |
JP7139839B2 (en) | Information processing device, information processing method and program | |
CN113228170B (en) | Information processing apparatus and nonvolatile storage medium | |
JP7103681B2 (en) | Speech recognition program, speech recognition method, speech recognition device and speech recognition system | |
US20210304767A1 (en) | Meeting support system, meeting support method, and non-transitory computer-readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201210 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20201210 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20210107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6851565 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |