JP2007286174A - Electronic apparatus - Google Patents
Electronic apparatus Download PDFInfo
- Publication number
- JP2007286174A JP2007286174A JP2006110940A JP2006110940A JP2007286174A JP 2007286174 A JP2007286174 A JP 2007286174A JP 2006110940 A JP2006110940 A JP 2006110940A JP 2006110940 A JP2006110940 A JP 2006110940A JP 2007286174 A JP2007286174 A JP 2007286174A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic model
- model pattern
- information
- identification information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、音声認識機能により各種制御を行うことができる電子機器に関する。 The present invention relates to an electronic apparatus capable of performing various controls by a voice recognition function.
近年、テレビやビデオ等の電子機器の多機能化・高機能化が進むに伴い、様々な機能に対応し、かつ簡易な操作が可能なものが求められ、現在では、このような操作に音声認識技術を用いた電子機器が利用されている。 In recent years, as electronic devices such as televisions and videos have become more multifunctional and sophisticated, it has become necessary to support various functions and enable simple operation. Electronic devices using recognition technology are used.
音声認識技術を用いた電子機器には、例えば、留守番電話機能付ファクシミリ装置があり、通常の操作補助として音声を入力する際には、予め定められた数の単語を基に音声認識を行い、IDの照合など特定話者の音声認識を行う場合は、予め、使用するフレーズの音声データを登録しておき、音声認識を行う機器がある(特許文献1参照)。 Electronic devices using voice recognition technology include, for example, a facsimile machine with an answering machine function, and when voice is input as a normal operation aid, voice recognition is performed based on a predetermined number of words, When performing speech recognition of a specific speaker such as ID verification, there is a device that registers speech data of a phrase to be used in advance and performs speech recognition (see Patent Document 1).
また、機器番号及びそれに対応する発音表記を表形式で格納する音声標本−機器番号対応テーブルを備え、音声認識結果を用いて前記音声標本−機器番号対応テーブルを検索し、対応する機器番号を検出することで被制御機器の特定を行う装置がある(特許文献2参照)。 It also has a voice sample-equipment number correspondence table that stores device numbers and corresponding phonetic notation in tabular form, and searches the voice sample-equipment number correspondence table using speech recognition results to detect corresponding device numbers. By doing so, there is an apparatus for specifying a controlled device (see Patent Document 2).
また、操作装置が、入力された音声と電子機器へのコマンドを多重化した多重化信号を生成して電子機器に送信し、電子機器が、受信した多重化信号より、音声とコマンドを分離し、分離した音声を認識し、認識した認識内容、および、分離されたコマンドに対応して、自らの動作を制御するようにした機器がある(特許文献3参照)。 In addition, the controller device generates a multiplexed signal obtained by multiplexing the input voice and the command to the electronic device and transmits the multiplexed signal to the electronic device. The electronic device separates the voice and the command from the received multiplexed signal. There is a device that recognizes a separated voice and controls its own operation in accordance with the recognized content and the separated command (see Patent Document 3).
また、音声認識機能を有する小型形状の携帯型リモートコントロール装置であって、音声によりコマンドを入力することにより、音声コマンドに対応するコマンドを無線で制御対象である機器に対して送信し、当該機器を制御する装置がある(特許文献4参照)。
なお、一般に、音声認識技術は、特定話者音声認識と不特定話者音声認識との2つに分けることができる。特定話者音声認識技術は、利用者がある特定の個人であるという前提に基づき、その利用者の個人の声から音響的モデルを作成して音声認識を行う技術である。このため、利用者に対してだけの精密な音響モデルを作成することができるので、高い認識率を得ることができる。一方、不特定話者音声認識技術は、利用者が不特定であるという前提に基づき、一般的な音響モデルを予め作成しておき、音声認識を行う技術である。このため、特定話者音声認識に比較して認識性能は劣るものの、誰でも使用可能な音声認識をはじめから提供できる特徴がある。
In general, the speech recognition technology can be divided into two types: specific speaker speech recognition and non-specific speaker speech recognition. The specific speaker voice recognition technology is a technology that performs voice recognition by creating an acoustic model from a voice of a user's individual based on the premise that the user is a specific individual. For this reason, since a precise acoustic model only for the user can be created, a high recognition rate can be obtained. On the other hand, the unspecified speaker speech recognition technology is a technology for performing speech recognition by creating a general acoustic model in advance based on the premise that the user is unspecified. For this reason, although the recognition performance is inferior to the specific speaker voice recognition, there is a feature that voice recognition that anyone can use is provided from the beginning.
しかしながら、音響モデルは、子供・大人などの話者層、電話や自動車内などの使用環境に応じて大きく異なり、特許文献1〜4に開示された音声認識機能を用いた電子機器では、各ユーザに最適な音声信号の周波数パターンに関する音響モデルを選択する構成ではないので、音声認識が正しく行われない場合もあった。
However, the acoustic model varies greatly depending on the use of speakers, children, adults, etc., the usage environment such as in a telephone or a car, and in the electronic device using the voice recognition function disclosed in
本発明の課題は、各ユーザに最適な音響モデルを選択し、より確実に音声認識を行うことができる電子機器を提供することである。 An object of the present invention is to provide an electronic device that can select an optimal acoustic model for each user and perform voice recognition more reliably.
上記課題を解決するため、請求項1に記載の発明は、外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成されている音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行う制御手段と、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、を備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得し、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする。
In order to solve the above-described problem, the invention according to
Identification information composed of audio information for identifying a user and an acoustic model pattern related to the frequency pattern of the audio signal can be stored in association with each other, and a plurality of acoustic model patterns can be associated with one identification information. Acoustic model pattern storage means configured to be capable of storage;
Command information storage means for storing command information including voice information for controlling the electronic device;
Audio information acquisition means for acquiring audio information;
Identification information extraction means for performing voice recognition of the voice information acquired by the voice information acquisition means, and extracting identification information stored in the acoustic model pattern storage means;
Acoustic model pattern acquisition means for acquiring an acoustic model pattern corresponding to the identification information extracted by the identification information extraction means from the acoustic model pattern storage means;
Command information for performing voice recognition of the voice information acquired by the voice information acquisition means using the acoustic model pattern acquired by the acoustic model pattern acquisition means and extracting command information stored in the command information storage means Extraction means;
Control means for performing control based on the command information extracted by the command information extraction means;
Calculating means for calculating a speech recognition rate by the command information extracting means for each identification information and for each acoustic model pattern;
Voice recognition rate storage means for storing the voice recognition rate calculated by the calculation means for each identification information and for each acoustic model pattern;
Display control means for causing the display means to display the control content by the control means corresponding to the command information extracted by the command information extraction means;
Specifying means for specifying whether to execute or stop the control content displayed on the display means by the display control means,
When the acoustic model pattern acquisition unit stores a plurality of acoustic model patterns in association with the identification information extracted by the identification information extraction unit and stores them in the acoustic model pattern storage unit, the acoustic model pattern acquisition unit stores Acquired acoustic model patterns in descending order of the speech recognition rate of the stored acoustic model pattern associated with the identification information,
The control means performs control corresponding to the command information when the designation means designates execution of the control content.
請求項2に記載の発明は、外部から入力される音声情報の音声認識を行い、音声認識結果に基づき得られたコマンド情報により制御される電子機器において、
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶する音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行う制御手段と、を備えることを特徴とする。
The invention according to
Acoustic model pattern storage means for storing identification information composed of voice information for identifying a user and an acoustic model pattern related to a frequency pattern of the voice signal in association with each other;
Command information storage means for storing command information including voice information for controlling the electronic device;
Audio information acquisition means for acquiring audio information;
Identification information extraction means for performing voice recognition of the voice information acquired by the voice information acquisition means, and extracting identification information stored in the acoustic model pattern storage means;
Acoustic model pattern acquisition means for acquiring an acoustic model pattern corresponding to the identification information extracted by the identification information extraction means from the acoustic model pattern storage means;
Command information for performing voice recognition of the voice information acquired by the voice information acquisition means using the acoustic model pattern acquired by the acoustic model pattern acquisition means and extracting command information stored in the command information storage means Extraction means;
Control means for performing control based on the command information extracted by the command information extraction means.
請求項3に記載の発明は、請求項2に記載の発明において、
前記音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、当該識別情報に対応付けられた一の音響モデルパターンを取得し、前記コマンド情報抽出手段により、前記音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することを特徴とする。
The invention according to
The acoustic model pattern storage means is configured to be capable of storing a plurality of acoustic model patterns in association with one identification information,
The acoustic model pattern acquisition unit is associated with the identification information when a plurality of acoustic model patterns are associated with the identification information extracted by the identification information extraction unit and stored in the acoustic model pattern storage unit. If the command information cannot be extracted as a result of performing voice recognition of the voice information by the command information extraction means, the other information associated with the identification information is obtained. The acoustic model pattern is acquired.
請求項4に記載の発明は、請求項3に記載の発明において、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、をさらに備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することを特徴とする。
The invention according to
Calculating means for calculating a speech recognition rate by the command information extracting means for each identification information and for each acoustic model pattern;
Voice recognition rate storage means for storing the voice recognition rate calculated by the calculation means for each identification information and for each acoustic model pattern;
When the acoustic model pattern acquisition unit stores a plurality of acoustic model patterns in association with the identification information extracted by the identification information extraction unit and stores them in the acoustic model pattern storage unit, the acoustic model pattern acquisition unit stores The acoustic model patterns are acquired in descending order of the speech recognition rate of the stored acoustic model pattern associated with the identification information.
請求項5に記載の発明は、請求項2〜4の何れか一項に記載の発明において、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、をさらに備え、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする。
The invention according to
Display control means for causing the display means to display the control content by the control means corresponding to the command information extracted by the command information extraction means;
Further comprising designation means for designating whether to execute or stop the control content displayed on the display means by the display control means,
The control means performs control corresponding to the command information when the designation means designates execution of the control content.
請求項1に記載の発明によれば、識別情報抽出手段によって、音声情報取得手段により取得された音声情報の音声認識を行い、音響モデルパターン記憶手段に記憶された識別情報を抽出することができ、算出手段によって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出手段による音声認識率を算出することができ、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができ、コマンド情報抽出手段によって、音響モデルパターン取得手段により取得された音響モデルパターンを用いて、音声情報取得手段により取得された音声情報の音声認識を行い、コマンド情報記憶手段に記憶されたコマンド情報を抽出することができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに最適な音響モデルパターンを取得して音声認識を行うことができることとなって、より確実に音声認識を行うことができる。
また、表示制御手段によって、コマンド情報抽出手段により抽出されたコマンド情報に対応する制御手段による制御内容を表示手段に表示させることができ、指定手段により、表示制御手段により表示手段に表示された制御内容を実行するか、又は、中止するかを指定することができ、制御手段によって、指定手段により、制御内容を実行すると指定された場合、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。
According to the first aspect of the invention, the identification information extraction unit can perform voice recognition of the voice information acquired by the voice information acquisition unit and extract the identification information stored in the acoustic model pattern storage unit. The voice recognition rate by the command information extraction unit can be calculated for each identification information and for each acoustic model pattern by the calculation unit, and a plurality of acoustic model patterns are included in the identification information extracted by the identification information extraction unit. Is stored in the acoustic model pattern storage means, the acoustic model pattern acquisition means stores the voice recognition rate of the acoustic model pattern associated with the identification information stored in the voice recognition rate storage means. The acoustic model pattern can be acquired in descending order, and the command information extracting means can acquire the acoustic model pattern. Using the obtained acoustic model pattern by, it performs speech recognition of the speech information obtained by the speech information acquisition unit, it is possible to extract the command information stored in the command information storage means.
Therefore, when the electronic device acquires voice information, the user who has input the voice information can be identified, and an acoustic model pattern optimal for the user can be acquired and voice recognition can be performed. Recognition can be performed.
Further, the display control means can cause the display means to display the control content by the control means corresponding to the command information extracted by the command information extraction means, and the control means displayed on the display means by the display control means by the designation means. Whether the content is to be executed or canceled can be specified. When the control means specifies that the control content is to be executed by the specifying means, control corresponding to the command information can be performed.
Therefore, before the control based on the voice recognition result is performed, the control content can be displayed and confirmed to the user, and malfunctions can be suitably reduced.
請求項2に記載の発明によれば、識別情報抽出手段によって、音声情報取得手段により取得された音声情報の音声認識を行い、音響モデルパターン記憶手段に記憶された識別情報を抽出することができ、音響モデルパターン取得手段によって、識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを音響モデルパターン記憶手段から取得することができ、コマンド情報抽出手段によって、音響モデルパターン取得手段により取得された音響モデルパターンを用いて、音声情報取得手段により取得された音声情報の音声認識を行い、コマンド情報記憶手段に記憶されたコマンド情報を抽出することができ、制御手段により、コマンド情報抽出手段により抽出したコマンド情報に基づいて制御を行うことができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに適した音響モデルパターンを取得して、音声認識を行うことができることとなって、より確実に音声認識を行うことができる。
According to the second aspect of the present invention, the identification information extraction unit can perform voice recognition of the voice information acquired by the voice information acquisition unit and extract the identification information stored in the acoustic model pattern storage unit. The acoustic model pattern acquisition unit can acquire the acoustic model pattern corresponding to the identification information extracted by the identification information extraction unit from the acoustic model pattern storage unit, and the command information extraction unit acquires the acoustic model pattern by the acoustic model pattern acquisition unit. The voice information acquired by the voice information acquisition means can be recognized using the acoustic model pattern, and the command information stored in the command information storage means can be extracted, and the command information extraction means can be extracted by the control means. Control can be performed based on the command information extracted by the above.
Therefore, when the electronic device acquires voice information, the user who has input the voice information can be identified, an acoustic model pattern suitable for the user can be acquired, and voice recognition can be performed more reliably. Voice recognition can be performed.
請求項3に記載の発明によれば、請求項2に記載の発明と同様の効果が得られることは無論のこと、音響モデルパターン記憶手段は、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、当該識別情報に対応付けられた一の音響モデルパターンを取得し、コマンド情報抽出手段により、音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することができる。
従って、ユーザは、複数の音響モデルパターンから任意の音響モデルパターンを選択して音声認識を行うことができるので、例えば、ユーザの体調の変化により周波数パターンが変化した場合、一の音響モデルパターンでの音声認識が失敗しても、別の音響モデルパターンを選択することができるので、好適に音声認識を行うことができる。
According to the invention described in
Therefore, the user can select any acoustic model pattern from a plurality of acoustic model patterns and perform speech recognition. For example, when the frequency pattern changes due to a change in the user's physical condition, the user can use one acoustic model pattern. Even if the voice recognition fails, another acoustic model pattern can be selected, so that the voice recognition can be suitably performed.
請求項4に記載の発明によれば、請求項3に記載の発明と同様の効果が得られることは無論のこと、算出手段によって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出手段による音声認識率を算出することができ、識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターン記憶手段に記憶されている場合、音響モデルパターン取得手段によって、音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができる。
従って、音声認識率に基づいて、各ユーザに最適な音響モデルパターンを選択し、より確実に音声認識を行うことができる。
According to the invention described in
Therefore, it is possible to select the optimal acoustic model pattern for each user based on the speech recognition rate and perform speech recognition more reliably.
請求項5に記載の発明によれば、請求項2〜4の何れか一項に記載の発明と同様の効果が得られることは無論のこと、表示制御手段によって、コマンド情報抽出手段により抽出されたコマンド情報に対応する制御手段による制御内容を表示手段に表示させることができ、指定手段により、表示制御手段により表示手段に表示された制御内容を実行するか、又は、中止するかを指定することができ、指定手段により、制御内容を実行すると指定された場合、制御手段によって、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。
According to the invention described in
Therefore, before the control based on the voice recognition result is performed, the control content can be displayed and confirmed to the user, and malfunctions can be suitably reduced.
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
なお、本実施の形態では、電子機器として、ディジタルテレビ受像機を例に説明する。しかし、電子機器はこれに限られることなく、例えば、ビデオやエアコン等の家電機器であっても良い。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
Note that in this embodiment, a digital television receiver is described as an example of the electronic device. However, the electronic device is not limited to this, and may be a home appliance such as a video or an air conditioner.
まず、図1を参照しながら、機器全体の構成及び要部構成について説明する。
本実施形態のディジタルテレビ受像機100は、例えば、テレビジョン放送信号(以下、放送信号という。)を受信し、受信した放送信号を、所定の出力信号に変換し、映像/音声データを出力する機器本体部1と、ユーザが音声情報を機器本体部1に無線で出力することができる音声情報出力手段としてのマイク付きリモートコントロール装置(以下、マイク付きリモコンという。)2と、を備えて構成されている。
First, with reference to FIG. 1, the configuration of the entire device and the configuration of the main part will be described.
The
次に、ディジタルテレビ受像機100の要部構成について説明する。
機器本体部1は、放送信号を受信するアンテナ3と、アンテナ3により受信された放送信号から所定の放送チャンネルの放送信号を選局するチューナ4と、チューナ4から出力された放送信号の復調及び誤り訂正処理を行う復調部5と、復調部5で復調された放送信号に付加されている不正視聴防止用のスクランブル信号を解除するデスクランブル6と、デスクランブル6で解除された放送信号から各データを分離抽出することで、映像/音声データを取得するデマルチクサ7と、デマルチクサ7で取得された映像/音声データに伸張処理を行うデコーダ8と、デコーダ8で伸張された映像データにOSDデータを付加するOSD(On-Screen Character Display)処理部9と、デコーダ8、OSD処理部9で処理された映像/音声データを出力する表示手段としての受像部10と、音声情報を取得する音声情報取得部11と、機器本体部1全体を統括制御する制御部12と、各部を接続する制御バス13と、を備えて構成されている。
Next, the configuration of the main part of the
The device
音声情報取得部11は、例えば、マイクロホンが用いられ、音声をそのまま音声情報として取得する。
なお、音声情報取得部11は、音声をそのまま音声情報として取得する場合に限らず、音声が音声信号に変換された後に、当該音声信号を音声情報として取得する設計であっても良い。
The voice
Note that the audio
制御部12は、例えば、図1に示すように、CPU(Central Processing Unit)121と、RAM(Random Access Memory)122と、記憶部123と、などを備えている。
For example, as shown in FIG. 1, the
CPU121は、記憶部123に記憶された音響モデルパターンテーブル、コマンドテーブル及び各種処理プログラムに従って各種の制御動作を行う。
The
RAM122は、CPU121によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。
The
記憶部123は、機器本体部1で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU121によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部123に記憶されている。
具体的には、記憶部123には、例えば、図1に示すように、音響モデルパターンテーブル123a、コマンドテーブル123b、識別情報抽出プログラム123c、音響モデルパターン取得プログラム123d、コマンド情報抽出プログラム123e、制御プログラム123f、算出プログラム123g、表示制御プログラム123hなどが記憶されている。
The
Specifically, in the
音響モデルパターンテーブル123aは、ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成され、また、後述する算出プログラム123gにより算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶したテーブルである。
具体的には、音響モデルパターンテーブル123aには、例えば、図2に示すように、ユーザID−1は、音声情報「一郎」からなる識別情報を有し、かかる識別情報に対して複数の音響モデルパターンA、B、Cと、かかる音響モデルパターン毎の音声認識率が対応付けられて記憶されている。
記憶部123は、かかる音響モデルパターンテーブル123aを記憶することで、音響モデルパターン記憶手段及び音声認識率記憶手段として機能する。
The acoustic model pattern table 123a can store identification information including audio information for identifying a user and an acoustic model pattern related to a frequency pattern of the audio signal in association with each other, and a plurality of identification information can be stored with respect to one identification information. The table is configured to be able to store an acoustic model pattern in association with each other, and stores a speech recognition rate calculated by a
Specifically, in the acoustic model pattern table 123a, for example, as shown in FIG. 2, the user ID-1 has identification information composed of the audio information “Ichiro”, and a plurality of acoustics are associated with the identification information. The model patterns A, B, and C are stored in association with the speech recognition rate for each acoustic model pattern.
The
コマンドテーブル123bは、機器本体部1を制御するための音声情報からなるコマンド情報を記憶したテーブルである。
記憶部123は、かかるコマンドテーブル123bを記憶することで、コマンド情報記憶手段として機能する。
The command table 123 b is a table that stores command information including voice information for controlling the device
The
識別情報抽出プログラム123cは、CPU121に、音声情報取得部11により取得された音声情報に基づき音声認識を行い、識別情報を抽出する機能を実現させるプログラムである。
ここで、音声認識は、例えば、Juliusという音声認識ソフトウェアが用いられ、膨大な音声パターンと言語パターンの統計データを集積することにより実現される。音声認識の基本原理は、音響モデル(音素(ローマ字1文字にほぼ相当)や音節(かな1文字に相当))の周波数パターンを保持し、単語辞書を参照しながら、入力された音声の音声波形信号から単音節部分を切出した音節列信号とマッチングを行い、音声の認識を行う。
具体的には、CPU121は、識別情報抽出プログラム123cを実行することにより、音声情報取得部11により取得された音声情報の音声認識を予め設定された音響モデルパターンを用いて行い、音響モデルパターンテーブル123aに記憶された識別情報の中から一致する識別情報を抽出する。
CPU121は、かかる識別情報抽出プログラム123cを実行することにより、識別情報抽出手段として機能する。
The identification
Here, speech recognition is realized by, for example, using Julius speech recognition software and accumulating enormous speech patterns and language pattern statistical data. The basic principle of speech recognition is to maintain the frequency pattern of an acoustic model (phoneme (approximately equivalent to one Roman character) or syllable (equivalent to one kana character)) and refer to the word dictionary while referring to the word dictionary. It performs matching with the syllable string signal obtained by cutting out a single syllable part from the signal and recognizes the voice.
Specifically, the
The
音響モデルパターン取得プログラム123dは、CPU121に、識別情報抽出プログラム123cの実行により抽出された識別情報に対応する音響モデルパターンを音響モデルパターンテーブル123aから取得する機能を実現させるプログラムである。
具体的には、CPU121は、音響モデルパターン取得プログラム123dを実行することにより、識別情報抽出プログラム123cの実行により抽出された識別情報に対応する音響モデルパターンを音響モデルパターンテーブル123aから取得し、また、識別情報抽出プログラム123cにより抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル123aに記憶されている場合、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得する。例えば、図2に示すように、「一郎」からなる識別情報が抽出された場合、CPU121は、最初に、音声認識率の一番高い音響モデルパターンAを取得し、次いで、音響モデルパターンB、音響モデルパターンCの順で取得する。
CPU121は、かかる音響モデルパターン取得プログラム123dを実行することにより、音響モデルパターン取得手段として機能する。
The acoustic model
Specifically, the
The
コマンド情報抽出プログラム123eは、CPU121に、音声情報取得部11により取得された音声情報の音声認識を行い、音声認識結果に基づくコマンド情報を抽出する機能を実現させるプログラムである。
具体的には、CPU121は、コマンド情報抽出プログラム123eを実行することにより、音響モデルパターン取得プログラム123dにより取得された音響モデルパターンを用いて音声情報の音声認識を行い、コマンドテーブル123bに記憶されたコマンド情報の中から一致するコマンド情報を抽出する。
CPU121は、かかるコマンド情報抽出プログラム123eを実行することにより、コマンド情報抽出手段として機能する。
The command
Specifically, by executing the command
The
制御プログラム123fは、CPU121に、制御プログラム123fの実行により、音声認識結果に基づくコマンド情報により、機器本体部1の制御を行う機能を実現させるプログラムである。
具体的には、CPU121は、後述する表示制御プログラム123hを実行することにより、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容「チャンネルアップ」が受像部10に表示され、マイク付きリモコン2により、表示された制御内容の実行が指示された場合に、制御プログラム123fを実行することにより、コマンド情報に対応する制御を行う。
CPU121は、かかる制御プログラム123fを実行することにより、制御手段として機能する。
The
Specifically, the
The
算出プログラム123gは、CPU121に、音声認識結果に基づく、音声認識率を算出する機能を実現させるプログラムである。
具体的には、CPU121は、算出プログラム123gを実行することにより、音響モデルパターンテーブル123aに記憶された、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出プログラム123eの実行による音声認識率を算出する。また、算出方法は、例えば、コマンド情報抽出プログラム123eの実行により、抽出に成功した回数をコマンド情報抽出プログラム123eの実行回数で割った値などを用いる。
CPU121は、かかる算出プログラム123gを実行することにより、算出手段として機能する。
The
Specifically, by executing the
The
表示制御プログラム123hは、CPU121に、音声認識結果に基づくコマンド情報に対応する制御内容を受像部10に表示させる機能を実現させるプログラムである。
具体的には、CPU121は、図3に示すように、表示制御プログラム123hを実行することによって、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容を表示手段としての受像部10に表示させる。
CPU121は、かかる表示制御プログラム123hを実行することにより、表示制御手段として機能する。
The
Specifically, as shown in FIG. 3, the
The
次に、本発明の機器本体部1の動作について、本発明の実施形態であるディジタルテレビ受像機を例に図4を用いて説明する。なお、ユーザである一郎が、チャンネルアップを行いたい場合を想定して、説明する。
まず、ステップS1において、音声情報取得部11で音声情報である「一郎」と「チャンネルアップ」を取得する。次いで、ステップS2において、CPU121は、識別情報抽出プログラム123cを実行することにより、音声情報取得部11で取得された音声情報「一郎」の音声認識を行い、音響モデルパターンテーブル123aに記憶された識別情報「一郎」を抽出する。
Next, the operation of the device
First, in step S1, the audio
次いで、ステップS3において、識別情報を抽出できた場合には(ステップS3;Yes)、ステップS4へ進む。一方、ステップS3において、識別情報を抽出できなかった場合(ステップS3;No)、ステップS1へ戻る。 Next, when the identification information can be extracted in step S3 (step S3; Yes), the process proceeds to step S4. On the other hand, if the identification information cannot be extracted in step S3 (step S3; No), the process returns to step S1.
次いで、ステップS4において、CPU121は、音響モデルパターン取得プログラム123dを実行することにより、識別情報に対応する音響モデルパターンを音響モデルパターンテーブル123aから取得する。かかる場合、図2に示すように、識別情報「一郎」に対して、複数の音響モデルパターンA、B、Cが対応付けられ記憶されているが、音声認識率の一番高い音響モデルパターンAを取得する。
Next, in step S4, the
次いで、ステップS5において、CPU121は、コマンド情報抽出プログラム123eを実行することにより、取得された音響モデルパターンを用いて、音声情報取得部11で取得された音声情報「チャンネルアップ」の音声認識を行い、コマンドテーブル123bに記憶されたコマンド情報を抽出する。
Next, in step S5, the
次いで、ステップS6において、コマンド情報抽出プログラム123eの実行により、コマンド情報を抽出できた場合(ステップS6;Yes)、ステップS7へ進む。一方、ステップS6において、コマンド情報を抽出できなかった場合(ステップS6;No)、ステップS4へ戻り、CPU121は、音響モデルパターン取得プログラム123dを実行することにより、再度、音響モデルパターンの取得を行う。このとき、識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル123aに記憶されている場合、CPU121は、音響モデルパターン取得プログラム123dの実行により、音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得する。かかる場合、音響モデルパターンAの次に音声認識率の高い音響モデルパターンBを取得する。
Next, in step S6, when command information can be extracted by executing the command
次いで、ステップS7において、CPU121は、表示制御プログラム123hを実行することにより、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容「チャンネルアップ」を受像部10に表示する。
Next, in step S <b> 7, the
次いで、ステップS8において、受像部10に表示された制御内容を実行する場合(ステップS8;Yes)、指定手段としてのマイク付きリモコン等により、図3に示すように、「Yes」の表示の選択指定を行い、ステップS9へ進む。一方、「No」の表示の選択指定を行った場合(ステップS8;No)、本処理を終了する。
Next, when the control content displayed on the
次いで、ステップS9において、CPU121は、制御プログラム123fを実行することにより、コマンド情報に対応する制御を行い、本処理を終了する。
Next, in step S9, the
以上説明した本発明にかかるディジタルテレビ受像機100によれば、CPU121が、識別情報抽出プログラム123cを実行することによって、音声情報取得部11により取得された音声情報の音声認識を行い、音響モデルパターンテーブル123aに記憶された識別情報を抽出することができ、算出プログラム123gを実行することによって、識別情報毎であって、且つ音響モデルパターン毎に、コマンド情報抽出プログラム123eの実行による音声認識率を算出することができ、音響モデルパターン取得プログラム123dの実行によって、識別情報抽出プログラム123cの実行により抽出された識別情報に複数の音響モデルパターンが対応付けられて音響モデルパターンテーブル123aに記憶されている場合、音響モデルパターンテーブル123aに記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することができ、コマンド情報抽出プログラム123eの実行によって、音響モデルパターン取得プログラム123dの実行により取得された音響モデルパターンを用いて、音声情報取得部11により取得された音声情報の音声認識を行い、コマンドテーブル123bに記憶されたコマンド情報を抽出することができる。
従って、電子機器が音声情報を取得した場合、当該音声情報を入力したユーザを識別し、当該ユーザに最適な音響モデルパターンを取得し、音声認識を行うことができる。
また、CPU121が、表示制御プログラム123hを実行することによって、コマンド情報抽出プログラム123eの実行により抽出されたコマンド情報に対応する制御内容を受像部10に表示させることができ、マイク付きリモコン2により、表示制御プログラム123hを実行するにより受像部10に表示された制御内容を実行するか、又は、中止するかを指定することができ、制御プログラム123fの実行によって、マイク付きリモコン2により、制御内容を実行すると指定された場合、コマンド情報に対応する制御を行うことができる。
従って、音声認識結果に基づく制御を行う前に、当該制御内容をユーザに対して表示確認することができ、誤作動を好適に低減することができる。
According to the
Therefore, when the electronic device acquires voice information, it is possible to identify a user who has input the voice information, acquire an acoustic model pattern optimal for the user, and perform voice recognition.
In addition, the
Therefore, before the control based on the voice recognition result is performed, the control content can be displayed and confirmed to the user, and malfunctions can be suitably reduced.
なお、本発明は、上記実施の形態に限定されることなく、本発明の趣旨を逸脱しない範囲において、種々の改良並びに設計の変更を行っても良い。
例えば、指定手段は、本発明におけるマイク付きリモコンに限らず、機器本体部に設けられた操作パネルの操作キーなどによっても指定することができる設計であっても良い。
また、音響モデルパターン取得手段は、ユーザにより、手動で任意の音響モデルパターンを取得することができる設計であっても良い。
また、音声認識率の算出は、コマンド情報抽出手段によりコマンド情報が抽出されたか否かに限らず、コマンド情報が抽出され、表示手段に表示された当該コマンド情報に対応する制御内容を指定手段により、実行指定されたか否かを算出基準に加えることができる設計であっても良い。
The present invention is not limited to the above embodiment, and various improvements and design changes may be made without departing from the spirit of the present invention.
For example, the designating means is not limited to the remote controller with a microphone according to the present invention, and may be designed so that it can be designated by an operation key on an operation panel provided in the apparatus main body.
The acoustic model pattern acquisition unit may be designed such that an arbitrary acoustic model pattern can be manually acquired by a user.
The calculation of the speech recognition rate is not limited to whether or not the command information is extracted by the command information extracting means, but the command information is extracted and the control content corresponding to the command information displayed on the display means is specified by the specifying means. The design may be such that whether or not execution is designated can be added to the calculation criteria.
100 ディジタルテレビ受像機(電子機器)
1 機器本体部
2 マイク付きリモコン(指定手段)
10 受像部(表示手段)
11 音声情報取得部(音声情報取得手段)
121 CPU(識別情報抽出手段、音響モデルパターン取得手段、コマンド情報抽出手段、制御手段、算出手段、表示制御手段)
123a 音響モデルパターンテーブル(音響モデルパターン記憶手段、音声認識率記憶手段)
123b コマンドテーブル(コマンド情報記憶手段)
123c 識別情報抽出プログラム(識別情報抽出手段)
123d 音響モデルパターン取得プログラム(音響モデルパターン取得手段)
123e コマンド情報抽出プログラム(コマンド情報抽出手段)
123f 制御プログラム(制御手段)
123g 算出プログラム(算出手段)
123h 表示制御プログラム(表示制御手段)
100 Digital television receiver (electronic equipment)
1
10 Image receiver (display means)
11 Voice information acquisition unit (voice information acquisition means)
121 CPU (identification information extraction means, acoustic model pattern acquisition means, command information extraction means, control means, calculation means, display control means)
123a Acoustic model pattern table (acoustic model pattern storage means, speech recognition rate storage means)
123b Command table (command information storage means)
123c Identification information extraction program (identification information extraction means)
123d Acoustic model pattern acquisition program (acoustic model pattern acquisition means)
123e Command information extraction program (command information extraction means)
123f Control program (control means)
123g Calculation program (calculation means)
123h Display control program (display control means)
Claims (5)
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶することができ、且つ、一の識別情報に対して複数の音響モデルパターンを対応付けて記憶可能に構成されている音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に基づいて制御を行う制御手段と、
識別情報毎であって、且つ音響モデルパターン毎に、前記コマンド情報抽出手段による音声認識率を算出する算出手段と、
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に対応する前記制御手段による制御内容を表示手段に表示させる表示制御手段と、
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、を備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得し、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする電子機器。 In an electronic device that performs voice recognition of voice information input from the outside and is controlled by command information obtained based on the voice recognition result,
Identification information composed of audio information for identifying a user and an acoustic model pattern related to the frequency pattern of the audio signal can be stored in association with each other, and a plurality of acoustic model patterns can be associated with one identification information. Acoustic model pattern storage means configured to be capable of storage;
Command information storage means for storing command information including voice information for controlling the electronic device;
Audio information acquisition means for acquiring audio information;
Identification information extraction means for performing voice recognition of the voice information acquired by the voice information acquisition means, and extracting identification information stored in the acoustic model pattern storage means;
Acoustic model pattern acquisition means for acquiring an acoustic model pattern corresponding to the identification information extracted by the identification information extraction means from the acoustic model pattern storage means;
Command information for performing voice recognition of the voice information acquired by the voice information acquisition means using the acoustic model pattern acquired by the acoustic model pattern acquisition means and extracting command information stored in the command information storage means Extraction means;
Control means for performing control based on the command information extracted by the command information extraction means;
Calculating means for calculating a speech recognition rate by the command information extracting means for each identification information and for each acoustic model pattern;
Voice recognition rate storage means for storing the voice recognition rate calculated by the calculation means for each identification information and for each acoustic model pattern;
Display control means for causing the display means to display the control content by the control means corresponding to the command information extracted by the command information extraction means;
Specifying means for specifying whether to execute or stop the control content displayed on the display means by the display control means,
When the acoustic model pattern acquisition unit stores a plurality of acoustic model patterns in association with the identification information extracted by the identification information extraction unit and stores them in the acoustic model pattern storage unit, the acoustic model pattern acquisition unit stores Acquired acoustic model patterns in descending order of the speech recognition rate of the stored acoustic model pattern associated with the identification information,
The electronic device according to claim 1, wherein the control means performs control corresponding to the command information when the designation means designates execution of the control content.
ユーザを識別する音声情報からなる識別情報と、音声信号の周波数パターンに関する音響モデルパターンとを対応付けて記憶する音響モデルパターン記憶手段と、
当該電子機器を制御するための音声情報からなるコマンド情報を記憶するコマンド情報記憶手段と、
音声情報を取得する音声情報取得手段と、
前記音声情報取得手段により取得された前記音声情報の音声認識を行い、前記音響モデルパターン記憶手段に記憶された識別情報を抽出する識別情報抽出手段と、
前記識別情報抽出手段により抽出された識別情報に対応する音響モデルパターンを前記音響モデルパターン記憶手段から取得する音響モデルパターン取得手段と、
前記音響モデルパターン取得手段により取得された音響モデルパターンを用いて、前記音声情報取得手段により取得された音声情報の音声認識を行い、前記コマンド情報記憶手段に記憶されたコマンド情報を抽出するコマンド情報抽出手段と、
前記コマンド情報抽出手段により抽出されたコマンド情報に基づいて制御を行う制御手段と、
を備えることを特徴とする電子機器。 In an electronic device that performs voice recognition of voice information input from the outside and is controlled by command information obtained based on the voice recognition result,
Acoustic model pattern storage means for storing identification information composed of voice information for identifying a user and an acoustic model pattern related to a frequency pattern of the voice signal in association with each other;
Command information storage means for storing command information including voice information for controlling the electronic device;
Audio information acquisition means for acquiring audio information;
Identification information extraction means for performing voice recognition of the voice information acquired by the voice information acquisition means, and extracting identification information stored in the acoustic model pattern storage means;
Acoustic model pattern acquisition means for acquiring an acoustic model pattern corresponding to the identification information extracted by the identification information extraction means from the acoustic model pattern storage means;
Command information for performing voice recognition of the voice information acquired by the voice information acquisition means using the acoustic model pattern acquired by the acoustic model pattern acquisition means and extracting command information stored in the command information storage means Extraction means;
Control means for performing control based on the command information extracted by the command information extraction means;
An electronic device comprising:
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、当該識別情報に対応付けられた一の音響モデルパターンを取得し、前記コマンド情報抽出手段により、前記音声情報の音声認識を行った結果、コマンド情報を抽出できなかった場合には、当該識別情報に対応付けられた他の一の音響モデルパターンを取得することを特徴とする請求項2に記載の電子機器。 The acoustic model pattern storage means is configured to be capable of storing a plurality of acoustic model patterns in association with one identification information,
The acoustic model pattern acquisition unit is associated with the identification information when a plurality of acoustic model patterns are associated with the identification information extracted by the identification information extraction unit and stored in the acoustic model pattern storage unit. If the command information cannot be extracted as a result of performing voice recognition of the voice information by the command information extraction means, the other information associated with the identification information is obtained. The electronic device according to claim 2, wherein an acoustic model pattern is acquired.
前記算出手段により算出された音声認識率を、識別情報毎であって、且つ音響モデルパターン毎に記憶する音声認識率記憶手段と、をさらに備え、
前記音響モデルパターン取得手段は、前記識別情報抽出手段により抽出された識別情報に複数の音響モデルパターンが対応付けられて前記音響モデルパターン記憶手段に記憶されている場合、前記音声認識率記憶手段に記憶された、当該識別情報に対応付けられた音響モデルパターンの音声認識率の高い順に音響モデルパターンを取得することを特徴とする請求項3に記載の電子機器。 Calculating means for calculating a speech recognition rate by the command information extracting means for each identification information and for each acoustic model pattern;
Voice recognition rate storage means for storing the voice recognition rate calculated by the calculation means for each identification information and for each acoustic model pattern;
When the acoustic model pattern acquisition unit stores a plurality of acoustic model patterns in association with the identification information extracted by the identification information extraction unit and stores them in the acoustic model pattern storage unit, the acoustic model pattern acquisition unit stores The electronic device according to claim 3, wherein the acoustic model patterns are acquired in descending order of the speech recognition rate of the stored acoustic model pattern associated with the identification information.
前記表示制御手段により前記表示手段に表示された前記制御内容を実行するか、又は、中止するかを指定する指定手段と、をさらに備え、
前記制御手段は、前記指定手段により、前記制御内容を実行すると指定された場合、前記コマンド情報に対応する制御を行うことを特徴とする請求項2〜4の何れか一項に記載の電子機器。 Display control means for causing the display means to display the control content by the control means corresponding to the command information extracted by the command information extraction means;
Further comprising designation means for designating whether to execute or stop the control content displayed on the display means by the display control means,
5. The electronic apparatus according to claim 2, wherein the control unit performs control corresponding to the command information when the specification unit specifies that the control content is to be executed. 6. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006110940A JP2007286174A (en) | 2006-04-13 | 2006-04-13 | Electronic apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006110940A JP2007286174A (en) | 2006-04-13 | 2006-04-13 | Electronic apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007286174A true JP2007286174A (en) | 2007-11-01 |
Family
ID=38758025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006110940A Pending JP2007286174A (en) | 2006-04-13 | 2006-04-13 | Electronic apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007286174A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018043137A1 (en) * | 2016-08-31 | 2018-03-08 | ソニー株式会社 | Information processing device and information processing method |
US10403267B2 (en) | 2015-01-16 | 2019-09-03 | Samsung Electronics Co., Ltd | Method and device for performing voice recognition using grammar model |
US10607597B2 (en) | 2017-09-18 | 2020-03-31 | Samsung Electronics Co., Ltd. | Speech signal recognition system and method |
WO2022003822A1 (en) | 2020-06-30 | 2022-01-06 | 日産自動車株式会社 | Information processing device and information processing method |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63116199A (en) * | 1986-11-05 | 1988-05-20 | 富士通株式会社 | Voice dictionary storing system for voice input/output unit |
JPH0713591A (en) * | 1993-06-22 | 1995-01-17 | Hitachi Ltd | Device and method for speech recognition |
JPH0844387A (en) * | 1994-08-04 | 1996-02-16 | Aqueous Res:Kk | Voice recognizing device |
JPH08123461A (en) * | 1994-10-20 | 1996-05-17 | Hitachi Ltd | Speech interface system using individual information card |
JP2000089781A (en) * | 1998-09-08 | 2000-03-31 | Seiko Epson Corp | Speech recognition method, device therefor, and recording medium stored with speech recognition processing program |
JP2000112492A (en) * | 1998-10-02 | 2000-04-21 | Canon Inc | Speech recognizing method, device therefor, and comminication device, and control method therefor |
JP2002108386A (en) * | 2000-09-29 | 2002-04-10 | Matsushita Electric Ind Co Ltd | Speech recognition method and system, and on-vehicle navigation device |
JP2005070092A (en) * | 2003-08-22 | 2005-03-17 | Canon Inc | Network system, data processor, method, and computer-readable storage medium |
-
2006
- 2006-04-13 JP JP2006110940A patent/JP2007286174A/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63116199A (en) * | 1986-11-05 | 1988-05-20 | 富士通株式会社 | Voice dictionary storing system for voice input/output unit |
JPH0713591A (en) * | 1993-06-22 | 1995-01-17 | Hitachi Ltd | Device and method for speech recognition |
JPH0844387A (en) * | 1994-08-04 | 1996-02-16 | Aqueous Res:Kk | Voice recognizing device |
JPH08123461A (en) * | 1994-10-20 | 1996-05-17 | Hitachi Ltd | Speech interface system using individual information card |
JP2000089781A (en) * | 1998-09-08 | 2000-03-31 | Seiko Epson Corp | Speech recognition method, device therefor, and recording medium stored with speech recognition processing program |
JP2000112492A (en) * | 1998-10-02 | 2000-04-21 | Canon Inc | Speech recognizing method, device therefor, and comminication device, and control method therefor |
JP2002108386A (en) * | 2000-09-29 | 2002-04-10 | Matsushita Electric Ind Co Ltd | Speech recognition method and system, and on-vehicle navigation device |
JP2005070092A (en) * | 2003-08-22 | 2005-03-17 | Canon Inc | Network system, data processor, method, and computer-readable storage medium |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10403267B2 (en) | 2015-01-16 | 2019-09-03 | Samsung Electronics Co., Ltd | Method and device for performing voice recognition using grammar model |
US10706838B2 (en) | 2015-01-16 | 2020-07-07 | Samsung Electronics Co., Ltd. | Method and device for performing voice recognition using grammar model |
US10964310B2 (en) | 2015-01-16 | 2021-03-30 | Samsung Electronics Co., Ltd. | Method and device for performing voice recognition using grammar model |
USRE49762E1 (en) | 2015-01-16 | 2023-12-19 | Samsung Electronics Co., Ltd. | Method and device for performing voice recognition using grammar model |
WO2018043137A1 (en) * | 2016-08-31 | 2018-03-08 | ソニー株式会社 | Information processing device and information processing method |
CN109643545A (en) * | 2016-08-31 | 2019-04-16 | 索尼公司 | Information processing equipment and information processing method |
US10607597B2 (en) | 2017-09-18 | 2020-03-31 | Samsung Electronics Co., Ltd. | Speech signal recognition system and method |
WO2022003822A1 (en) | 2020-06-30 | 2022-01-06 | 日産自動車株式会社 | Information processing device and information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4887911B2 (en) | Electronics | |
JP3844431B2 (en) | Caption system based on speech recognition | |
KR102246900B1 (en) | Electronic device for speech recognition and method thereof | |
US8706502B2 (en) | Electronic equipment and television receiver utilizing multimodal multifunction voice commands | |
JP2007010971A (en) | Speech recognition method and speech recognition apparatus | |
JP2007286174A (en) | Electronic apparatus | |
JP2007286356A (en) | Electronic equipment | |
US20160277698A1 (en) | Method for vocally controlling a television and television thereof | |
JP2008003474A (en) | Electronic apparatus | |
CN109564758B (en) | Electronic equipment and voice recognition method thereof | |
JP2008203516A (en) | Information processor and information processing method | |
EP3010016A1 (en) | Input information support apparatus, method for supporting input information, and input information support program | |
JP2007323296A (en) | Electronic device | |
JP2008122044A (en) | Controller for air conditioner | |
JP4807145B2 (en) | Electronics | |
JP4670716B2 (en) | Electronic device with voice recognition function | |
JP2009130849A (en) | Scene recognition device and video image processor | |
JP5041754B2 (en) | Still image display switching system | |
JP6100328B2 (en) | Video display device | |
JP2005004032A (en) | Device and method for speech recognition | |
JP6423470B2 (en) | Video display device | |
KR20240041956A (en) | System including TV and remote control and method of controlling the same | |
JP2007074027A (en) | Image output apparatus | |
JP4679480B2 (en) | Recording narration automatic output system for still images | |
WO2016075794A1 (en) | Voice conversion device, voice conversion method, and voice conversion program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101102 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110301 |