JP2001042884A - 音声認識制御システム及び音声認識制御方法 - Google Patents

音声認識制御システム及び音声認識制御方法

Info

Publication number
JP2001042884A
JP2001042884A JP11212556A JP21255699A JP2001042884A JP 2001042884 A JP2001042884 A JP 2001042884A JP 11212556 A JP11212556 A JP 11212556A JP 21255699 A JP21255699 A JP 21255699A JP 2001042884 A JP2001042884 A JP 2001042884A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
operator
input
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11212556A
Other languages
English (en)
Other versions
JP4314680B2 (ja
Inventor
Yoshiaki Miyazaki
良朗 宮崎
Tamiya Tanaka
民也 田中
Shizue Murayama
静江 村山
Kazuhisa Kiyota
和久 清田
Kenji Kaneko
健二 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP21255699A priority Critical patent/JP4314680B2/ja
Priority to US09/626,309 priority patent/US7801730B1/en
Priority to EP00306363A priority patent/EP1073037A2/en
Priority to CNB001306804A priority patent/CN1205600C/zh
Publication of JP2001042884A publication Critical patent/JP2001042884A/ja
Application granted granted Critical
Publication of JP4314680B2 publication Critical patent/JP4314680B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/40Bus networks
    • H04L12/40052High-speed IEEE 1394 serial bus
    • H04L12/40117Interconnection of audio or video/imaging devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 音声認識に対応した電子機器全てに対して音
声認識による制御を行うことができるようにする。 【解決手段】 オペレータの音声を入力する音声入力部
20と、その音声入力部20が入力した音声を認識して
オペレータが発生する音声を期待値とした音声認識テー
ブルITmを予め有したMDプレーヤ200の入出力を
制御する制御手段を構成する音声認識部31及びコント
ローラ32とを備え、音声認識部31は、未登録のMD
プレーヤ200が初めて接続されたときはMDプレーヤ
200から提供される音声認識テーブルITmを登録
し、音声入力部20がオペレータの音声を入力したとき
はオペレータの音声と予め登録された音声認識テーブル
ITmとを比較し、コントローラ32は、オペレータの
音声と音声認識テーブルITmとの比較結果に基づいて
MDプレーヤ200の入出力を制御するものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、オペレータが発
生する音声で電子機器の入出力を制御する音声認識制御
システム及び音声認識制御方法に関する。詳しくは、入
力されたオペレータの音声と登録された音声認識テーブ
ルとを比較し、その比較結果に基づいて電子機器の入出
力を制御する制御手段を設け、電子機器が制御手段に接
続されたときに、その電子機器の音声認識テーブルを登
録することにより、音声認識に対応した電子機器全てに
対して音声認識による電子機器の入出力を制御できるよ
うにしたものである。
【0002】
【従来の技術】近年、技術の進歩にともない様々な電子
機器が開発され、普及し始めている。このため、これら
の電子機器を簡単かつ快適に使用するために操作性の向
上を目指した開発がなされつつあり、その一例として音
声認識を用いて電子機器の操作を行う音声認識制御シス
テム等の開発が進められている。この音声認識制御シス
テムはオペレータが発生する音声に従って電子機器の操
作を行うものであり、手動での操作に比べて簡単かつ快
適に電子機器を操作することができる。
【0003】これらの制御を行うには、まず音声認識制
御システムが音声認識による制御を行えるように、接続
された音声認識対応の電子機器が音声認識制御システム
に認識されていなければならない。そして例えば音声認
識制御システムによって、入力された音声がその認識さ
れた電子機器に対応した固有の制御コマンドに変換さ
れ、この制御コマンドを電子機器に出力することで電子
機器の制御がなされる。
【0004】この音声認識制御システムを利用した一例
が車載用の音声認識制御システムである。車載用の電子
機器には音声認識に対応したコンパクトディスクプレー
ヤ(以下、CDプレーヤという。)、ミニディスクプレ
ーヤ(以下、MDプレーヤという。)及びグローバルポ
ジショニングシステム(Global Positioning system)
を利用したカーナビゲーションシステム(以下、カーナ
ビという。)等があり、これらを音声認識によって制御
することにより運転中であっても、安全性を侵害するこ
となく容易に操作することができる。
【0005】例えば音声認識に対応したCDプレーヤ、
MDプレーヤ及びカーナビを音声認識システムに接続し
て、音声認識によってそれら電子機器の操作を行う場合
において、従来方式に係る音声認識制御システムによれ
ば、予め音声認識制御システムが音声認識に対応したC
Dプレーヤ、MDプレーヤ及びカーナビをいくつか登録
していると共に、その登録されたCDプレーヤ、MDプ
レーヤ及びカーナビ毎に接続されるバス(通信線)が予
め決められている。つまり専用のバスを使用して専用認
識される。このため予め登録されたCDプレーヤ、MD
プレーヤ及びカーナビを専用のバスに接続することで音
声認識によってそれらの入出力を制御できる。
【0006】
【発明が解決しようとする課題】しかしながら、従来方
式の音声認識制御システムによれば、音声認識制御シス
テムが予め登録している音声認識に対応した電子機器が
専用バスに接続されることでその電子機器が認識され
て、音声認識による制御が行えるようになされている。
【0007】このため、音声認識に対応した未登録の電
子機器(例えば、新製品の電子機器及び他社製品等)が
接続されたときに予め登録されている登録済み電子機器
の制御情報のみしか有していないので、その電子機器を
認識できない。従って音声認識に対応した電子機器であ
っても登録手順が複雑であったり、機種によって登録内
容が異なったりするために音声認識による制御を行うこ
とができないという問題がある。
【0008】そこで本発明は、上記の課題を解消すべく
創造されたものであり、当該システムに接続される電子
機器の認識方法を工夫して、音声認識に対応した電子機
器全てに対して音声認識による制御を行うことができる
ようにした音声認識制御システム及び音声認識制御方法
を提供することを目的とするものである。
【0009】
【課題を解決するための手段】上述の課題は、オペレー
タが発生する音声を期待値とした音声認識テーブルを予
め有した電子機器の入出力を制御する音声認識制御シス
テムにおいて、オペレータの音声を入力する音声入力手
段と、音声入力手段によって入力された音声を認識して
電子機器の入出力を制御する制御手段とを備え、制御手
段は、未登録の電子機器が当該制御手段に接続されたと
きは、電子機器から提供される音声認識テーブルを登録
し、音声入力手段によって前記オペレータの音声が入力
されたときは、オペレータの音声と予め登録された電子
機器の音声認識テーブルとを比較し、オペレータの音声
と音声認識テーブルとの比較結果に基づいて電子機器の
入出力を制御することを特徴とする音声認識制御システ
ムによって解決される。
【0010】本発明によれば、未登録の電子機器が制御
手段に接続されると、制御手段によって電子機器の音声
認識テーブルが登録されると共に、制御手段によって音
声入力手段が入力したオペレータの音声が認識される。
そして、そのオペレータの音声と登録された音声認識テ
ーブルとが制御手段によって比較され、その比較結果に
基づいて電子機器の入出力が制御手段によって制御され
るので、音声認識に対応した未登録の電子機器が接続さ
れた場合であっても音声によってその電子機器を操作す
ることができる。
【0011】また、本発明に係る音声認識制御方法は、
オペレータの音声を認識すると共に制御系から各種電子
機器の入出力を制御する音声認識制御システムにおい
て、オペレータが発生する音声を期待値とした音声認識
テーブルを電子機器毎に与え、音声認識テーブルが与え
られた未登録の電子機器が制御系に接続されたときは、
電子機器の音声認識テーブルを制御系に登録し、オペレ
ータの音声を入力したときは、オペレータの音声と制御
系に登録された電子機器の音声認識テーブルとを比較
し、オペレータの音声と音声認識テーブルとの比較結果
に基づいて電子機器の入出力を制御することを特徴とす
るものである。
【0012】本発明に係る音声認識制御方法によれば、
音声認識テーブルが電子機器毎に与えられた未登録の各
種電子機器が接続系に接続されることで、各種の音声認
識テーブルがそれぞれ制御系に登録されるので、オペレ
ータの音声によって各種電子機器の入出力を制御するこ
とができる。従って、音声認識に対応した電子機器全て
に対して音声認識による制御を行うことができるように
した音声認識制御システム及び音声認識制御方法を提供
することができる。
【0013】
【発明の実施の形態】ここで、本発明に係る実施形態と
しての音声認識制御システムについて説明する。この実
施形態では、入力されたオペレータの音声と登録された
音声認識テーブルとを比較し、その比較結果に基づいて
電子機器の入出力を制御する制御手段を設け、電子機器
が制御手段に接続されたときに、その電子機器の音声認
識テーブルを登録することで、音声認識に対応した電子
機器全てに対して音声認識による電子機器の入出力を制
御できるようにしたものである。なお、ここでは音声認
識テーブルを有した未登録の電子機器としてMDプレー
ヤを使用することを前提とする。
【0014】図1は本発明に係る実施形態としての音声
認識制御システム100における構成例を示すブロック
図である。図1に示す音声入力手段としての例えば音声
入力部20等は、ここでは図示しないが、音声を入力す
るマイクロホン、入力した音声を増幅するマイクアンプ
及びアナログ信号をデジタル信号に変換するA/D変換
機等を有している。この音声入力部20はオペレータの
音声による命令(以下、音声コマンドとする。)を入力
して、その入力した音声コマンド(音声アナログデー
タ)を125μsごとに一定量のパケットを送受信する
映像やオーディオなどの転送に好適なIsochronous Date
(以下、アイソクロナス・データという。)である音声
デジタルデータVddに変換して出力する。
【0015】この音声入力部20は通信線である例えば
IEEE1394バス10等に接続されている。このI
EEE1394バス10は様々な機器が接続されること
でローカルエリアネットワークを構築する。また、この
IEEE1394バス10はIEEE1394規格の高
速シリアル・バス・インターフェースであり、アイソク
ロナス・データ転送等に使用して好適なバスである。そ
して、このIEEE1394バス10にはオペレータが
発生する音声コマンドをデジタル変換した音声デジタル
データVddを期待値とした音声認識テーブルITmを
もつ未登録のMDプレーヤ200が接続されている。な
お、この音声認識テーブルITmはMDプレーヤ200
を示す音声コマンド「MD」を期待値として有してい
る。
【0016】また、このIEEE1394バス10には
制御手段を構成する例えば音声認識部31及びコントロ
ーラ32等が接続されている。この音声認識部31は電
子機器がもつ音声認識テーブルITmを登録すると共
に、音声入力部20が出力した音声デジタルデータVd
dをIEEE1394バス10を介して入力する。この
音声認識部31は登録した音声認識テーブルが1つのみ
であるときは、入力した音声デジタルデータVddと登
録したその音声認識テーブルITmとを比較して音声デ
ジタルデータVddを認識する音声認識処理を行う。
【0017】このとき、音声デジタルデータVddが音
声認識テーブルITmの期待値であれば、その比較され
た音声認識テーブルITmを用いて音声デジタルデータ
Vddを非同期データ(Asynchronous Date:以下、ア
シンクロナス・データという。)である音声テキストデ
ータTDmに変換すると共に、この音声テキストデータ
TDmをIEEE1394バス10を介してコントロー
ラ32に転送する。ここで、音声テキストデータTDm
とはオペレータの発生した音声に従ってコントローラ3
2が制御を行うためのデータである。
【0018】また、音声認識部31がここでは図示しな
いが複数の音声認識テーブルを登録しているときに、こ
の音声認識部31は入力した音声デジタルデータVdd
と登録した全ての音声認識テーブルとを比較して音声認
識処理を行う。このとき、音声デジタルデータVddが
例えば音声認識テーブルITx等の期待値であれば、そ
の音声認識テーブルITxを用いて音声テキストデータ
TDx等に変換する。また、音声認識部31は複数の音
声認識テーブルを登録しているときに、同一の音声コマ
ンド(音声デジタルデータVdd)に対して重複する期
待値があるか否かを検知すると共に、その検知結果をI
EEE1394バス10に接続された例えば表示パネル
40等に表示する。この表示パネル40については図2
で説明する。なお、音声入力部20、IEEE1394
バス10及び音声認識部31はこれに限定されるもので
はなく同じ効果を奏するものであればよい。
【0019】ここで、コントローラ32は例えば中央演
算処理装置(Central Processing Unit)等から成り、
音声認識テーブルITmをもつMDプレーヤ200がI
EEE1394バス10に接続されたことを認識する。
この接続の認識は3つのフェーズ、バス初期化(Bus In
itialize)、ツリー識別(Tree Identify)、自己認識
(Self Identify)のプロセスを経てノード(被接続
体)に関する情報を取得することで行われる。このバス
初期化ではノードが接続されたり、接続されているノー
ドの電源が投入されるとバスリセットが発生し、ノード
の接続構成に関する情報をすべて消去する。
【0020】また、ツリー識別ではコントローラ32を
ルートとして個々に接続された各ノードをツリー状に接
続したものとして扱えるように識別する。また、自己認
識ではツリーの末端にあるリーフ・ノードから順番に自
己ノードのIDを設定した自己IDパケットを、他のノ
ードに対して通知することでそれぞれ固有の自己ノード
IDを設定する。また、コントローラ32はMDプレー
ヤ200の接続を認識すると、そのMDプレーヤ200
が自らの音声認識テーブルITmを音声認識部31に転
送する許可を要求するバス調停(以下、アービトレーシ
ョンという。)を受けて、そのアービトレーションに対
する転送許可を与える。このときアービトレーションは
非同期転送モード(Asyncronous Transfer Mode:AT
M)で行われる。
【0021】ここで、音声入力部20が入力したオペレ
ータの音声コマンドが、使用する電子機器の名称を示す
音声コマンド例えばMDプレーヤ200を示す「MD」
等である場合において、コントローラ32はこの音声コ
マンド「MD」を音声認識処理した音声認識部31から
MDプレーヤ200を示す内容の音声テキストデータT
Dmを転送されると共に、コントローラ32はこの音声
テキストデータTDmに基づいて生成した機器通知信号
Hmを音声認識部31に出力する。この機器通知信号H
mは音声認識部31に、登録された例えばMDプレーヤ
200の音声認識テーブルITmを以後の音声認識処理
で使用するように通知するものである。
【0022】また、音声入力部20が入力したオペレー
タの音声コマンドが、MDプレーヤ200を動作させる
音声コマンド例えば「プレイ」等である場合において、
コントローラ32はこの音声コマンド「プレイ」を音声
認識処理した音声認識部31からMDプレーヤ200の
「プレイ」動作を示す内容の音声テキストデータTDm
を転送されると共に、コントローラ32はこの音声テキ
ストデータTDmに基づいて生成した制御コマンドCO
mを音声認識部31に出力する。この制御コマンドCO
mはMDプレーヤ200の入出力を制御するものであ
り、ここでは例えばMDプレーヤ200が「プレイ」動
作を行うように制御する。
【0023】なお、コントローラ32はこれに限定され
るものではなく同じ効果を奏するものであればよい。ま
た、ここでは音声認識部31をIEEE1394バス上
に単独で接続したが、コントローラ32又はMDプレー
ヤ200等に内蔵してもよい。また、ここでは音声入力
部20をIEEE1394バス上に単独で接続したが、
音声認識部、コントローラ32又はMDプレーヤ200
等に接続してもよい。また、ここでは表示パネル40を
IEEE1394バス上に単独で接続したが、コントロ
ーラ32等に接続してもよい。
【0024】図2は音声認識システム100における表
示パネル40の構成例を示す平面図である。図2に示す
例えば表示画面41等はシステムの動作状況、様々な情
報等が表示される。表示画面41の下方には例えば複数
の設定ボタン42が設けられ、表示画面41の右側上方
から決定ボタン43、スタートボタン44、ストップボ
タン45、十字ボタン46、ボリュームスイッチ47等
が設けられている。そして例えばこの十字ボタン44を
操作して表示画面内に表示されるカーソルを所望の表示
に合わせて決定ボタン43を押下して所望の表示を選択
するといった操作を行うことができる。なお、表示パネ
ル40はこれに限定されるものではなく同じ効果を奏す
るものであればよい。
【0025】また、表示画面41には図1で示した音声
認識部31が同一の音声コマンド(音声デジタルデータ
Vdd)に対して重複する期待値があることを検知した
場合にワーニングが表示されると共に、例えば重複する
期待値の中から使用する期待値を選択する選択処理手
順、若しくは重複する期待値に別の期待値(音声)を再
登録する再登録処理手順が表示される。この選択処理手
順が表示された選択画面Pは音声デジタルデータVdd
を入力した時に音声認識部31が重複する期待値がある
ことを検知することで表示される。
【0026】また再登録処理手順が表示された再登録画
面Qは音声認識テーブルITmを登録した時に音声認識
部31が重複する期待値があることを検知することで表
示される。これら選択画面P及び再登録処理手順Qは手
動入力又は音声入力によって操作を行うことが可能であ
る。以下、図3を参照して選択画面Pについて及び図4
〜8を参照して再登録画面Q1〜5について及び説明す
る。
【0027】図3は選択画面Pの表示例を示すイメージ
図である。なお、ここではMDプレーヤ、CDプレーヤ
及びカーナビが接続されることを前提とする。図3に示
すように表示画面41に表示された選択画面Qには上方
にワーニングとしての「警告!」が表示されている。こ
の「警告!」の下方には「『プレイ』に対し複数のソー
スが考えられます。次のうちどれを選択しますか?」が
表示され、その下方には「CD」、「MD」及び「キャ
ンセル」が表示されている。これら「CD」、「MD」
及び「キャンセル」はオペレータによって選択されるコ
マンドとしての表示であり、このように選択可能な表示
は音声認識によって、若しくは決定ボタン43及び十字
ボタン46の操作によって選択することができる。な
お、選択された表示は背景を反転する。
【0028】図4〜8は再登録画面Q1〜5の表示例を
示すイメージ図である。図4に示すように表示画面41
に表示された再登録画面Q1には上方にワーニングとし
ての「警告!」が表示されている。この「警告!」の下
方には「複数の機器で同一の言葉が検知されました。」
と表示され、その下方には「詳細を見る」、「キャンセ
ル」がコマンド表示されている。これら「詳細を見
る」、「キャンセル」は音声認識によって、若しくは決
定ボタン43及び十字ボタン46の操作によって選択す
ることができる。なお、選択された表示は背景を反転す
る。
【0029】図5に示す再登録画面Q2は再登録画面Q
1で「詳細を見る」が選択されると表示画面41に表示
される。この再登録画面Q2には左上方に「MEN
U」、右上方に「戻る」がコマンド表示されている。
「MENU」の下方には上から例えば「CD」、「H
D」、「MD」がコマンド表示されている。つまりこれ
らは「CD」、「HD」及び「MD」で重複する言葉が
存在していることを表している。なお、ここでHDとは
カーナビのハードディスク(図示しない)を示す。
【0030】そして、「CD」、「HD」及び「MD」
のコマンド表示の中から例えば「MD」を選択して背景
を反転させるとその右方に「MD」に関する情報が上か
ら例えば「ストップ」、「スキップ」、「プレイ」と表
示される。これら「ストップ」、「スキップ」及び「プ
レイ」が「MD」に関して他の機器(「CD」,「H
D」)と重複している言葉であることを表している。
【0031】図6に示す再登録画面Q3は再登録画面Q
2において再登録される言葉を選択することで表示され
る。この再登録画面Q3の左上方には「MENU」がコ
マンド表示されている。そして画面中心付近には「再登
録する言葉を入力して下さい。キャンセルの場合はキャ
ンセルと入力して下さい。」が表示されている。なお、
このとき表示だけではなく音声合成による読み出し等を
行って表示された指示内容を音声で通知してもよい。
【0032】図7に示す再登録画面Q4は再登録画面Q
3で再登録する言葉を音声コマンドで入力することで表
示される。左上方には「MENU」がコマンド表示さ
れ、画面中央付近には、例えば再登録画面Q3で「MD
プレイ」と入力したときは「MDの『プレイ』の代わり
に『MDプレイ』を登録しました。」と再登録完了の通
知が表示されている。なお、このとき表示だけでなく音
声合成による読み出し等を行って表示された処理結果を
音声で通知してもよい。
【0033】図8に示す再登録画面Q5は再登録画面Q
4が表示された後で他に再登録が必要な言葉があるとき
に表示される。この再登録画面Q7は図5に示した再登
録画面Q2において、例えば再登録が完了した「プレ
イ」のコマンド表示を除いたものが表示されている。こ
のように、再登録されていないものだけが表示されてい
くので、以降、表示された言葉の中から再登録する言葉
を次々に選択して再登録を行うようになされている。
【0034】次に、本発明に係る実施形態としての音声
認識制御方法について説明する。なお、ここでは接続さ
れる電子機器が1機である単数接続の場合と複数機であ
る複数接続の場合とに分けて説明する。
【0035】a.単数接続における音声認識制御 図9は音声認識制御システム100の動作例(単数接
続)を示すブロック図である。なお、ここでは、電子機
器としての音声認識テーブルITmをもつ未登録のMD
プレーヤ200を接続することを前提とする。図9に示
すようにIEEE1394バス10にMDプレーヤ20
0が接続されると、コントローラ32がバス初期化を行
い、本装置の接続構成に関する情報をすべて消去する。
そして、ツリー識別を行い、接続構成をツリー状に接続
したものとして扱えるように識別する。その後、自己認
識を行い、自己ノードIDを設定することでコントロー
ラ32はMDプレーヤ200がIEEE1394バス1
0に接続されたことを認識する。
【0036】その後、接続したことを認識されたMDプ
レーヤ200は音声認識テーブルITmを音声認識部3
1に転送する許可を要求するアービトレーションをコン
トローラ32に対して行う。このアービトレーションを
受けてコントローラ32が転送を許可すると、MDプレ
ーヤ200は自らの音声認識テーブルITmを音声認識
部31に転送する。そして音声認識部31は転送された
この音声認識テーブルITmを登録する。これによっ
て、新たに接続されたMDプレーヤ200が音声認識制
御システム100に登録される。
【0037】ここで、オペレータ(図示せず)が音声認
識制御システム100に接続されたMDプレーヤ200
について音声認識による制御を行うときに、オペレータ
が例えば「プレイ」という音声コマンドを発生すると、
その音声コマンドを音声入力部20が入力する。そし
て、音声入力部20はその入力した音声コマンドを音声
デジタルデータVddに変換して、IEEE1394バ
ス10を介して音声認識部31に出力する。
【0038】この音声デジタルデータVddを入力した
音声認識部31はその音声デジタルデータVddと予め
登録した音声認識テーブルITmとを比較して音声認識
処理を行い、その音声デジタルデータVdd(「プレ
イ」)が音声認識テーブルITmの期待値であれば音声
デジタルデータVdd(「プレイ」)を音声認識テーブ
ルITmを用いて音声テキストデータTDmに変換し
て、この音声テキストデータTDmをIEEE1394
バス10を介してコントローラ32に転送する。
【0039】このコントローラ32は転送された音声テ
キストデータTDmに基づいてMDプレーヤ200を
「プレイ」動作させる制御コマンドCOmを生成し、M
Dプレーヤ200にその制御コマンドCOmを転送す
る。この制御コマンドCOmによってMDプレーヤ20
0はオペレータの発生した音声コマンドに従った「プレ
イ」動作を実行する。
【0040】これにより、音声認識テーブルITmをも
つ未登録のMDプレーヤ200がIEEE1394バス
10に接続されたときに、音声認識部31が音声認識テ
ーブルITmを登録するので、音声認識部31は未登録
であったMDプレーヤ200を認識できると共に、音声
コマンドによってMDプレーヤ200を操作することが
できる。
【0041】b.複数接続における音声認識制御 図10は音声認識システム100の動作例(複数接続)
を示すブロック図である。なお、ここでは予め音声認識
テーブルITmをもつMDプレーヤ200が接続された
IEEE1394バス10に音声認識テーブルITcを
もつ未登録のCDプレーヤ300及び音声認識テーブル
ITnをもつ未登録のカーナビ400を追加接続するこ
とを前提とする。
【0042】図10に示すように予めMDプレーヤ20
0が接続されていたIEEE1394バス10にCDプ
レーヤ300及びカーナビ400が追加接続されると、
コントローラ32が行う接続の認識プロセスにおけるバ
ス初期化によってこれまでの接続構成が一旦全て消去さ
れる。その後、コントローラ32によって新たにMDプ
レーヤ200、CDプレーヤ300及びカーナビ400
の接続の認識が行われると共に、MDプレーヤ200、
CDプレーヤ300及びカーナビ400はアービトレー
ションを行い、MDプレーヤ200がもつ音声認識テー
ブルITm,CDプレーヤ300がもつ音声認識テーブ
ルITc及びカーナビ400がもつ音声認識テーブルI
Tnを音声認識部31に転送する。そして音声認識部3
1は転送されたこれらの音声認識テーブルITm,IT
c,ITnを登録する。これによって、音声認識制御シ
ステム100にMDプレーヤ200、CDプレーヤ30
0及びカーナビ400が登録される。
【0043】ここで、オペレータが音声認識制御システ
ム100に接続されたMDプレーヤ200、CDプレー
ヤ300及びカーナビ400について音声認識による制
御を行うときに、例えばMDプレーヤ200で記録媒体
としてのMD(図示せず)を再生(プレイ)したい場合
は、まずオペレータがMDプレーヤ200を示す「M
D」と音声コマンドを発生すると、その音声コマンドを
音声入力部20が入力する。そして、音声入力部20は
その入力した音声コマンドを音声デジタルデータVdd
に変換して、IEEE1394バス10を介して音声認
識部31に出力する。
【0044】この音声デジタルデータVddを入力した
音声認識部31はその音声デジタルデータVddと予め
登録した音声認識テーブルITm,ITc,ITnとを
比較して音声認識処理を行う。このとき、音声認識テー
ブルITmはMDプレーヤ200の名称を示す音声デジ
タルデータVdd(「MD」)を期待値としているので
音声デジタルデータVdd(「MD」)を音声認識テー
ブルITmを用いて音声テキストデータTDm(「M
D」)に変換し、この音声認識部31はこの音声テキス
トデータTDmをIEEE1394バス10を介してコ
ントローラ32に転送する。
【0045】このコントローラ32は転送された音声テ
キストデータTDmに基づいて機器通知信号Hmを生成
する。そして、コントローラ32はこの機器通知信号H
mを音声認識部31に出力してMDプレーヤ200の音
声認識テーブルITmを以後の音声認識処理で使用する
ように音声認識部31に通知する。その後、オペレータ
が例えば「プレイ」という音声コマンドを発生すると、
その音声コマンドが音声入力部20によって入力され
る。そして、音声入力部20はその入力した音声コマン
ドを音声デジタルデータVddに変換して、IEEE1
394バス10を介して音声認識部31に出力する。
【0046】この音声デジタルデータVddを入力した
音声認識部31はその音声デジタルデータVddと上述
したようにスタンバイ状態の音声認識テーブルITmと
を比較する音声認識処理を行い、音声デジタルデータV
dd(「プレイ」)が音声認識テーブルITmの期待値
であれば音声デジタルデータVdd(「プレイ」)を音
声認識テーブルITmを用いて音声テキストデータTD
mに変換して、この音声テキストデータTDmをIEE
E1394バス10を介してコントローラ32に転送す
る。
【0047】このコントローラ32は転送された音声テ
キストデータTDmに基づいてMDプレーヤ200を
「プレイ」動作させる制御コマンドCOmを生成し、M
Dプレーヤ200にその制御コマンドCOmを転送す
る。この制御コマンドCOmによってMDプレーヤ20
0はオペレータの発生した音声コマンドに従った「プレ
イ」動作を実行する。
【0048】同様に、図示しないが音声コマンド「C
D」を入力することでコントローラ32が出力する機器
通知信号HcによってCDプレーヤ300の音声認識テ
ーブルITcがスタンバイされて、音声コマンド「プレ
イ」を入力することでその音声認識テーブルITcを用
いて音声デジタルデータVdd(「プレイ」)を変換し
た音声テキストデータTDcに基づいてコントローラ3
2が制御コマンドCOcを生成し、その制御コマンドC
OcによってCDプレーヤ300の「プレイ」動作が実
行される。
【0049】また同様に、図示しないが音声コマンド
「カーナビ」を入力することでコントローラ32が発生
する機器通知信号Hnによってカーナビ400の音声認
識テーブルITnがスタンバイされて、音声コマンド
「プレイ」を入力することでその音声認識テーブルIT
nを用いて音声デジタルデータVdd(「プレイ」)を
変換した音声テキストデータTDnに基づいてコントロ
ーラ32が制御コマンドCOnを生成し、その制御コマ
ンドCOnによってカーナビ400の「プレイ」動作が
実行される。
【0050】これにより、予めMDプレーヤ200が接
続されたIEEE1394バス10に未登録のCDプレ
ーヤ300及びカーナビ400が追加接続された場合で
あっても音声認識部31がMDプレーヤ200の音声認
識テーブルITm,CDプレーヤ300の音声認識テー
ブルITc及びカーナビ400の音声認識テーブルIT
nを自動的に知ることができる。従って、MDプレーヤ
200、CDプレーヤ300及びカーナビ400をオペ
レータの音声コマンドによって操作することができる。
【0051】ここで、接続された複数の電子機器で期待
値が重複する場合、つまり登録された音声認識テーブル
ITm,ITc,ITnの全てが例えば音声コマンド
「プレイ」を期待値として有している場合において、使
用する電子機器の名称を音声入力せずに、単に「プレ
イ」を音声入力させたときに、どの音声認識テーブルを
用いて音声を変換するのか判断できないことによって発
生する音声の認識不可の処理について以下に場合分けし
て説明する。
【0052】機器選択による処理 図11は音声認識制御システム100の選択処理手順に
よる選択処理例(手動入力)を、図12はその選択処理
手順による選択処理例(音声入力)を示すフローチャー
トである。なお、ここでは音声認識部31が音声コマン
ド「プレイ」を期待値としたMDプレーヤ200の音声
認識テーブルITm,CDプレーヤ300の音声認識テ
ーブルITc及びカーナビ400の音声認識テーブルI
Tn(図10参照)を登録していることを前提とする。
【0053】まず、手動入力による機器選択について説
明する。図11に示すステップS1ではオペレータが音
声コマンドとして例えば「プレイ」を発生すると、音声
入力部20(図10参照)に「プレイ」が音声入力され
ステップS2へ進む。このステップS2では入力された
音声コマンドを変換した音声デジタルデータVddと登
録された音声認識テーブルITm,ITc,ITnとを
比較する音声認識処理が音声認識部31によって行わ
れ、ステップS3へ進む。
【0054】このステップS3ではその音声認識結果
(比較結果)に、音声デジタルデータVdd(「プレ
イ」)に対して重複する期待値があるか否かが音声認識
部31によって検知され、重複する期待値がなければス
テップS6へ進み、そのステップS6ではステップS1
において入力した音声コマンドである「プレイ」を期待
値とした機器例えばMDプレーヤ200に対して「プレ
イ」動作を実行してエンドとなる。また、ステップS3
で重複する期待値があればステップS4へ進み、このス
テップS4では選択画面P(図4参照)が表示画面41
(図10参照)に表示される。
【0055】そして、ステップS5へ進み、選択画面P
に表示された「CD」、「MD」及び「キャンセル」の
コマンドの中から決定ボタン43及び十字ボタン46を
オペレータが手動操作することによってここでは例えば
「MD」のコマンド表示を選択することで、「MD」に
相当する音声認識部31に登録されたMDプレーヤ20
0の音声認識テーブルITmが以後の音声認識処理で使
用されるようにスタンバイされる。その後、ステップS
6に進み、ステップS5において選択されたMDプレー
ヤ200に対して、ステップS1で音声入力された「プ
レイ」動作が実行されてエンドとなる。
【0056】次に、音声入力による機器選択について説
明する。図12に示すステップT1ではオペレータが音
声コマンドとして例えば「プレイ」を発生すると音声入
力部20に「プレイ」が音声入力され、ステップT2へ
進む。このステップT2では入力された音声を変換した
音声デジタルデータVddと登録された音声認識テーブ
ルITm,ITc,ITnとを比較する音声認識処理が
音声認識部31によって行われ、ステップT3へ進む。
【0057】このステップT3ではその音声認識結果
に、音声デジタルデータVdd(「プレイ」)に対して
重複する期待値があるか否かが音声認識部30によって
検知され、重複する期待値がなければステップT7へ進
んで音声コマンドを実行してエンドとなる。ステップT
3で重複する期待値があればステップT4へ進み、この
ステップT4では選択画面Pが表示画面41に表示され
ると共に、選択画面Pに表示されたワーニングが音声合
成によってオペレータに通知される。
【0058】そして、ステップT5へ進み、このステッ
プT5では選択画面Pに表示された「CD」、「MD」
及び「キャンセル」のコマンド表示の中からオペレータ
が音声コマンドで例えば「MD」を入力することでステ
ップT6に進み、入力された音声コマンドである「M
D」に対して音声認識処理が行われる。ステップT7で
はステップT6で音声認識処理された音声コマンドとし
ての「MD」に相当する音声認識部31に登録されたM
Dプレーヤ200の音声認識テーブルITmが以後の音
声認識処理で使用されるようにスタンバイされると共
に、そのMDプレーヤ200に対してステップT1にお
いて入力された音声コマンドである「プレイ」動作が実
行されてエンドとなる。
【0059】再登録による処理 図13は音声認識制御システム100の再登録処理手順
による再登録処理例(手動入力)を、図14はその再登
録処理例(音声入力)を示すフローチャートである。こ
こでは、音声コマンド「プレイ」を期待値とする図10
に示した音声認識テーブルITmをもつMDプレーヤ2
00、音声認識テーブルITcをもつCDプレーヤ30
0及び音声認識テーブルITnをもつカーナビ400を
IEEE1394バス10に接続することを前提とす
る。
【0060】まず、手動入力による再登録について説明
する。音声認識テーブルITmをもつMDプレーヤ20
0、音声認識テーブルITcをもつCDプレーヤ300
及び音声認識テーブルITnをもつカーナビ400をI
EEE1394バス10に接続すると、図13に示すス
テップU1に進む。このステップU1では音声認識部3
1によって接続の認識が行われて、ステップU2に進
む。
【0061】このステップU2ではMDプレーヤ200
が音声認識テーブルITmを音声認識部31に転送す
る。同様にCDプレーヤ300が音声認識テーブルIT
cを、カーナビ400が音声認識テーブルITnを音声
認識部31に転送する。そして、音声認識部31は転送
された音声認識テーブルITm,ITc,ITnを登録
する。ステップU3では音声認識部31が登録した音声
認識テーブルITm,ITc,ITnにおいて、同一の
音声(音声デジタルデータVdd)に対して重複する期
待値があるか否かが検知され、重複する期待値がなけれ
ばエンドとなる。また、ステップU3で重複した期待値
があればステップU4に進み、再登録画面Q1(図4参
照)が表示画面41に表示される。
【0062】このステップU4で再登録画面Q1にコマ
ンド表示された例えば「詳細を見る」を決定ボタン43
及び十字ボタン46の手動操作により選択することでス
テップU5に進む。ステップU5に進むと再登録画面Q
1から再登録画面Q2(図5参照)に切り替わり、重複
する言葉(期待値)が表示される。そして例えば重複し
た言葉である「プレイ」を別の言葉に変更するときは、
決定ボタン43及び十字ボタン46をオペレータが手動
操作することで「プレイ」を選択してステップU6に進
む。
【0063】このステップU6に進むと再登録画面Q2
から再登録画面Q3(図6参照)に切り替わり、重複し
た期待値の再登録の案内が表示されると共に、その表示
された案内が音声合成によりオペレータに通知される。
そして、ステップU7に進み、オペレータが新規コマン
ドとして例えば「MDプレイ」と音声コマンドで入力す
るとステップU8に進む。ステップU8では入力された
「MDプレイ」が音声認識処理されて、「プレイ」に代
わって新たに「MDプレイ」が再登録される。
【0064】その後、ステップU9に進むと再登録画面
Q3から再登録画面Q4(図7参照)に切り替わり、再
登録を完了したことが表示されると共に、その表示され
た再登録完了の表示を音声合成してオペレータに通知す
る。そして、再びステップU3に戻り、重複する期待値
があるか否かが検知され、重複する期待値が無ければエ
ンドとなる。このときステップU3で重複する期待値が
他に存在していればステップU4に進み、再登録画面Q
5(図8参照)を表示する。この再登録画面Q5には再
登録が完了していない重複する期待値が表示されてい
る。これらの重複する期待値に上述したように新しいコ
マンドを順次再登録していくことで最終的にステップU
3で重複する期待値は検知されなくなりエンドとなる。
【0065】次に、音声入力による再登録について説明
する。図14に示すステップW1では図13のステップ
U1と同様に接続の認識が行われ、ステップW2では図
13のステップU2と同様に音声認識テーブルITm,
ITc,ITn転送及び登録が行われる。そして、ステ
ップW3では音声認識部31が登録した音声認識テーブ
ルITm,ITc,ITnにおいて、同一の音声(音声
デジタルデータVdd)に対して重複する期待値がある
か否かが検知され、重複する期待値がなければエンドと
なる。また、ステップW3で重複した期待値があればス
テップW4に進み、再登録画面Q1(図4参照)が表示
画面41に表示される。
【0066】このステップW4で再登録画面Q1に表示
された「詳細を見る」を音声コマンドとして音声入力す
る。そして、ステップW5に進むと再登録画面Q1から
再登録画面Q2(図5参照)に切り替わり、重複する言
葉(期待値)が表示される。そして例えば重複した言葉
である「プレイ」を別の言葉に変更するときは音声コマ
ンドで「プレイ」と音声入力することでその音声入力さ
れた「プレイ」が音声認識処理されて、変更する言葉に
「プレイ」が選択される。
【0067】そして、ステップW6に進むと再登録画面
Q2から再登録画面Q3(図6参照)に切り替わり、重
複した期待値の再登録の案内が表示されると共に、その
表示された案内が音声合成によりオペレータに通知され
る。そして、ステップW7ではオペレータが新規コマン
ドとして例えば「MDプレイ」と音声入力して、ステッ
プW8へ進み、このステップW8では入力された「MD
プレイ」が音声認識処理されると共に、「プレイ」に代
わって新たに「MDプレイ」が再登録される。
【0068】その後、ステップW9に進むと再登録画面
Q3から再登録画面Q4(図7参照)に切り替わり、再
登録を完了したことが表示されると共に、その表示され
た再登録完了を音声合成してオペレータに通知する。そ
して、再びステップW3に戻り、重複する期待値がある
か否かが検知され、重複する期待値が無ければエンドと
なる。ステップW3で重複する期待値がまだ存在してい
ればステップW4に進み、再登録画面Q5(図8参照)
を表示する。この再登録画面Q5には再登録が完了して
いない重複する期待値が表示されている。これらの重複
する期待値に上述したように新しいコマンドを順次再登
録していくことで最終的にステップW3で重複する期待
値は検知されなくなりエンドとなる。
【0069】これにより、期待値が重複して存在するこ
とによる音声の認識不可が発生しても、機器の選択を行
うことで容易に処理できると共に、期待値の再登録を行
うことで音声認識の正確性を向上させることができる。
【0070】このように、本発明に係る実施形態として
の音声認識制御システム100及び音声認識制御方法に
よれば、IEEE1394バス10に音声認識テーブル
ITmをもつMDプレーヤ200が接続されるとコント
ローラ32がMDプレーヤ200の接続を認識し、音声
認識部31が転送された音声認識テーブルITmを登録
する。その後、入力したオペレータの音声コマンドを音
声入力部20が音声デジタルデータVddに変換する。
そして音声認識部31が、音声デジタルデータVddと
登録した音声認識テーブルITmの期待値とを比較して
音声認識処理すると共に、音声認識テーブルITmを用
いて音声テキストデータTDmに変換する。この音声テ
キストデータTDmに基づいてコントローラ32が音声
コマンドに従った動作を実行させる制御コマンドCOm
をMDプレーヤ200に転送するので、音声認識テーブ
ルITmをもつ未登録のMDプレーヤ200であっても
音声コマンドによって操作することができる。
【0071】また、MDプレーヤ200が接続されたI
EEE1394バス10に未登録のCDプレーヤ300
及びカーナビ400を追加接接続した場合であっても、
音声認識部31が音声認識テーブルITc,ITnを登
録して、音声コマンドによってMDプレーヤ200、C
Dプレーヤ300及びカーナビ400を操作することが
できる。
【0072】従って、音声認識に対応した全ての電子機
器を音声認識によって操作することができる。加えて、
音声コマンドに対する期待値の重複による音声の認識不
可が発生しても手動若しくは音声入力によって使用する
機器を選択することで認識不可を解消するように案内す
る選択処理手順、又は機器の接続時に重複を検知して重
複する期待値に新規の言葉を登録するように案内する再
登録処理手順を備えているため、音声認識の正確性及び
操作性を向上させることができると共に、オペレータが
音声認識制御システムを自らカスタマイズすることがで
きる。
【0073】
【発明の効果】以上、説明したように、本発明発明に係
る音声認識制御システムによれば、電子機器が接続され
たときに登録された音声認識テーブルと音声入力手段に
よって入力されたオペレータの音声とを比較し、その比
較結果に基づいて電子機器の入出力を制御する制御手段
が設けられるものである。この構成によって、音声認識
に対応した未登録の電子機器が接続された場合であって
も音声によってその電子機器を操作することができる。
【0074】また、本発明に係る音声認識制御方法によ
れば、オペレータが発生する音声を期待値とした音声認
識テーブルを電子機器毎に与え、音声認識テーブルが与
えられた未登録の電子機器が接続線に接続されたとき
は、その音声認識テーブルを制御系に登録し、オペレー
タの音声を認識したときは、オペレータの音声と制御系
に登録された電子機器の音声認識テーブルとを比較し、
オペレータの音声と音声認識テーブルとの比較結果に基
づいて電子機器の入出力を制御できるようにしたもので
ある。
【0075】従って、音声認識に対応した電子機器全て
に対して音声認識を適用することができる。この発明
は、車載用電子機器の制御を音声入力によって行う音声
認識制御システム等に用いて極めて好適である。
【図面の簡単な説明】
【図1】本発明に係る実施形態としての音声認識制御シ
ステム100の構成例を示すブロック図である。
【図2】その表示パネル40の構成例を示す平面図であ
る。
【図3】その選択画面Pの表示例を示すイメージ図であ
る。
【図4】その再登録画面Q1の表示例を示すイメージ図
である。
【図5】その再登録画面Q2の表示例を示すイメージ図
である。
【図6】その再登録画面Q3の表示例を示すイメージ図
である。
【図7】その再登録画面Q4の表示例を示すイメージ図
である。
【図8】その再登録画面Q5の表示例を示すイメージ図
である。
【図9】その音声認識制御システム100の動作例(単
数接続)を示すブロック図である。
【図10】その音声認識制御システム100の動作例
(複数接続)を示すブロック図である。
【図11】その選択処理手順による選択処理例(手動入
力)を示すフローチャートである。
【図12】その選択処理手順による選択処理例(音声入
力)を示すフローチャートである。
【図13】その再登録処理手順による再登録処理例(手
動入力)を示すフローチャートである。
【図14】その再登録処理手順による再登録処理例(音
声入力)を示すフローチャートである。
【符号の説明】
10・・・IEEE1394バス(通信線)、20・・
・音声入力部(音声入力手段)、31・・・音声認識部
(制御手段)、32・・・コントローラ(制御手段)、
100・・・音声認識制御システム
───────────────────────────────────────────────────── フロントページの続き (72)発明者 村山 静江 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 清田 和久 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 金子 健二 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5D015 GG01 KK01 LL10

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 オペレータが発生する音声を期待値とし
    た音声認識テーブルを予め有した電子機器の入出力を制
    御する音声認識制御システムにおいて、 前記オペレータの音声を入力する音声入力手段と、 前記音声入力手段によって入力された音声を認識して前
    記電子機器の入出力を制御する制御手段とを備え、 前記制御手段は、 未登録の前記電子機器が当該制御手段に接続されたとき
    は、 前記電子機器から提供される音声認識テーブルを登録
    し、 前記音声入力手段によって前記オペレータの音声が入力
    されたときは、 前記オペレータの音声と予め登録された前記電子機器の
    音声認識テーブルとを比較し、 前記オペレータの音声と前記音声認識テーブルとの比較
    結果に基づいて前記電子機器の入出力を制御することを
    特徴とする音声認識制御システム。
  2. 【請求項2】 前記音声入力手段及び制御手段が設けら
    れる場合であって、 前記制御手段は、 前記電子機器の音声認識テーブルを登録すると共に、該
    音声認識テーブルと前記音声入力手段によって入力され
    た前記音声とを比較して音声を認識する音声認識部と、 前記音声認識部によって比較された比較結果に基づいて
    前記電子機器の入出力を制御するコントローラとを有す
    ることを特徴とする請求項1に記載の音声認識制御シス
    テム。
  3. 【請求項3】 前記音声入力手段、音声認識部及びコン
    トローラが設けられる場合であって、 前記音声認識部は、 登録された前記電子機器の音声認識テーブルと入力され
    た前記オペレータの音声とを比較して音声を認識し、該
    オペレータの音声が前記音声認識テーブルの期待値であ
    る場合に、 当該音声認識テーブルを用いて前記オペレータの音声を
    音声テキストデータに変換して前記コントローラに転送
    することを特徴とする請求項2に記載の音声認識制御シ
    ステム。
  4. 【請求項4】 前記音声入力手段、音声認識部及びコン
    トローラが設けられる場合であって、 前記音声入力手段によって入力された前記電子機器の動
    作を示す前記オペレータの音声が認識されたときに、 前記コントローラは、 前記音声認識部から転送された前記電子機器の動作を示
    す前記音声テキストデータに基づいて、当該電子機器の
    入出力を制御することを特徴とする請求項3に記載の音
    声認識制御システム。
  5. 【請求項5】 前記音声入力手段、音声認識部及びコン
    トローラが設けられる場合であって、 前記音声入力手段によって入力された所定の前記電子機
    器の名称を示す前記オペレータの音声が認識されたとき
    に、 前記コントローラは、 前記音声認識部から転送された前記電子機器の名称を示
    す前記音声テキストデータを受信すると共に、前記音声
    認識部に当該電子機器の音声認識テーブルを以後の音声
    認識で使用するように通知することを特徴とする請求項
    3に記載の音声認識制御システム。
  6. 【請求項6】 前記音声入力手段、音声認識部及びコン
    トローラが設けられる場合であって、 前記音声入力手段、音声認識部及びコントローラは通信
    線で接続され、該通信線には該音声入力手段によって入
    力された音声と前記音声テキストデータとの双方が伝送
    されることを特徴とする請求項3に記載の音声認識制御
    システム。
  7. 【請求項7】 オペレータの音声を認識すると共に制御
    系から各種電子機器の入出力を制御する音声認識制御シ
    ステムにおいて、 前記オペレータが発生する音声を期待値とした音声認識
    テーブルを前記電子機器毎に与え、 前記音声認識テーブルが与えられた未登録の前記電子機
    器が前記制御系に接続されたときは、 前記電子機器の音声認識テーブルを前記制御系に登録
    し、 前記オペレータの音声を入力したときは、 前記オペレータの音声と前記制御系に登録された前記電
    子機器の音声認識テーブルとを比較し、 前記オペレータの音声と前記音声認識テーブルとの比較
    結果に基づいて前記電子機器の入出力を制御することを
    特徴とする音声認識制御方法。
  8. 【請求項8】 前記オペレータの音声が認識されたとき
    に、 前記制御系に登録された複数の前記音声認識テーブルに
    おいて同一の前記音声に対して重複する前記期待値があ
    るか否かを検知し、 重複する前記期待値が検知された場合は、 重複する前記期待値が検知されたことを前記オペレータ
    に通知すると共に、該期待値の重複を処理するための選
    択処理手順を前記オペレータに通知することを特徴とす
    る請求項7に記載の音声認識制御方法。
  9. 【請求項9】 前記選択処理手順は、 重複した前記期待値の中から所定の該期待値を前記オペ
    レータが選択するように案内表示されることを特徴とす
    る請求項8に記載の音声認識制御方法。
  10. 【請求項10】 前記制御系に接続された複数の前記電
    子機器の音声認識テーブルを登録したときに、 前記制御系に登録された複数の前記音声認識テーブルに
    おいて同一の前記音声に対して重複する前記期待値があ
    るか否かを検知し、 重複する前記期待値が検知された場合は、 重複する前記期待値が検知されたことを前記オペレータ
    に通知すると共に、該期待値の重複を処理するための再
    登録処理手順を前記オペレータに通知することを特徴と
    する請求項7に記載の音声認識制御システム。
  11. 【請求項11】 前記再登録処理手順は、 重複した前記期待値を前記オペレータが別の音声に再登
    録するように案内表示されることを特徴とする請求項1
    0に記載の音声認識制御方法。
JP21255699A 1999-07-27 1999-07-27 音声認識制御システム及び音声認識制御方法 Expired - Fee Related JP4314680B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP21255699A JP4314680B2 (ja) 1999-07-27 1999-07-27 音声認識制御システム及び音声認識制御方法
US09/626,309 US7801730B1 (en) 1999-07-27 2000-07-26 Voice recognition control system and voice recognition control method
EP00306363A EP1073037A2 (en) 1999-07-27 2000-07-26 Speech recognition using prestored templates for system control
CNB001306804A CN1205600C (zh) 1999-07-27 2000-07-27 语音识别控制系统和语音识别控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21255699A JP4314680B2 (ja) 1999-07-27 1999-07-27 音声認識制御システム及び音声認識制御方法

Publications (2)

Publication Number Publication Date
JP2001042884A true JP2001042884A (ja) 2001-02-16
JP4314680B2 JP4314680B2 (ja) 2009-08-19

Family

ID=16624653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21255699A Expired - Fee Related JP4314680B2 (ja) 1999-07-27 1999-07-27 音声認識制御システム及び音声認識制御方法

Country Status (4)

Country Link
US (1) US7801730B1 (ja)
EP (1) EP1073037A2 (ja)
JP (1) JP4314680B2 (ja)
CN (1) CN1205600C (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006514753A (ja) * 2003-03-25 2006-05-11 シーメンス アクチエンゲゼルシヤフト 話者に依存する音声認識方法および音声認識システム
WO2007066433A1 (ja) * 2005-12-07 2007-06-14 Mitsubishi Electric Corporation 音声認識装置
JP2016027484A (ja) * 2012-11-09 2016-02-18 三星電子株式会社Samsung Electronics Co.,Ltd. ディスプレイ装置、音声取得装置およびその音声認識方法
KR101821396B1 (ko) * 2017-08-09 2018-01-23 아카데미정보통신(주) 음성 인식을 통한 오디오 믹서의 조정 시스템
US12002463B2 (en) 2018-03-07 2024-06-04 Google Llc Systems and methods for voice-based initiation of custom device actions

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1377965A1 (en) * 2000-09-07 2004-01-07 Koninklijke Philips Electronics N.V. Voice control and uploadable user control information
US7917949B2 (en) 2005-12-21 2011-03-29 Sandisk Corporation Voice controlled portable memory storage device
US8161289B2 (en) 2005-12-21 2012-04-17 SanDisk Technologies, Inc. Voice controlled portable memory storage device
WO2007079357A2 (en) * 2005-12-21 2007-07-12 Sandisk Corporation Voice controlled portable memory storage device
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
EP2586026B1 (en) * 2010-06-24 2016-11-16 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
KR102003267B1 (ko) * 2011-12-30 2019-10-02 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR20130078486A (ko) * 2011-12-30 2013-07-10 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR102188090B1 (ko) * 2013-12-11 2020-12-04 엘지전자 주식회사 스마트 가전제품, 그 작동방법 및 스마트 가전제품을 이용한 음성인식 시스템
EP2891974A1 (en) * 2014-01-06 2015-07-08 Samsung Electronics Co., Ltd Display apparatus which operates in response to voice commands and control method thereof
JP2016024212A (ja) * 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN104505091B (zh) * 2014-12-26 2018-08-21 湖南华凯文化创意股份有限公司 人机语音交互方法及系统
CN104637480B (zh) * 2015-01-27 2018-05-29 广东欧珀移动通信有限公司 一种控制语音识别方法、装置以及系统
JP6501217B2 (ja) * 2015-02-16 2019-04-17 アルパイン株式会社 情報端末システム
US9633659B1 (en) * 2016-01-20 2017-04-25 Motorola Mobility Llc Method and apparatus for voice enrolling an electronic computing device
US10506204B2 (en) 2016-10-10 2019-12-10 At&T Digital Life, Inc. State detection and voice guided setup for a video doorbell unit
US12026456B2 (en) * 2017-08-07 2024-07-02 Dolbey & Company, Inc. Systems and methods for using optical character recognition with voice recognition commands
US20200074217A1 (en) * 2018-08-28 2020-03-05 Sony Corporation Techniques for providing user notice and selection of duplicate image pruning
US12057116B2 (en) * 2021-01-29 2024-08-06 Salesforce, Inc. Intent disambiguation within a virtual agent platform

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2614552B2 (ja) 1991-06-27 1997-05-28 シャープ株式会社 音声認識リモコン装置
JP3524983B2 (ja) 1995-04-28 2004-05-10 富士通テン株式会社 音声処理装置
US5909183A (en) * 1996-12-26 1999-06-01 Motorola, Inc. Interactive appliance remote controller, system and method
EP0911808B1 (en) 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
US6119088A (en) * 1998-03-03 2000-09-12 Ciluffo; Gary Appliance control programmer using voice recognition
DE69942663D1 (de) * 1999-04-13 2010-09-23 Sony Deutschland Gmbh Zusammenfügen von Sprachschnittstellen zur gleichzeitigen Benützung von Vorrichtungen und Anwendungen
US6584439B1 (en) * 1999-05-21 2003-06-24 Winbond Electronics Corporation Method and apparatus for controlling voice controlled devices

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006514753A (ja) * 2003-03-25 2006-05-11 シーメンス アクチエンゲゼルシヤフト 話者に依存する音声認識方法および音声認識システム
WO2007066433A1 (ja) * 2005-12-07 2007-06-14 Mitsubishi Electric Corporation 音声認識装置
US8060368B2 (en) 2005-12-07 2011-11-15 Mitsubishi Electric Corporation Speech recognition apparatus
JP2016027484A (ja) * 2012-11-09 2016-02-18 三星電子株式会社Samsung Electronics Co.,Ltd. ディスプレイ装置、音声取得装置およびその音声認識方法
US10043537B2 (en) 2012-11-09 2018-08-07 Samsung Electronics Co., Ltd. Display apparatus, voice acquiring apparatus and voice recognition method thereof
US10586554B2 (en) 2012-11-09 2020-03-10 Samsung Electronics Co., Ltd. Display apparatus, voice acquiring apparatus and voice recognition method thereof
US11727951B2 (en) 2012-11-09 2023-08-15 Samsung Electronics Co., Ltd. Display apparatus, voice acquiring apparatus and voice recognition method thereof
KR101821396B1 (ko) * 2017-08-09 2018-01-23 아카데미정보통신(주) 음성 인식을 통한 오디오 믹서의 조정 시스템
US12002463B2 (en) 2018-03-07 2024-06-04 Google Llc Systems and methods for voice-based initiation of custom device actions

Also Published As

Publication number Publication date
US7801730B1 (en) 2010-09-21
CN1288225A (zh) 2001-03-21
JP4314680B2 (ja) 2009-08-19
CN1205600C (zh) 2005-06-08
EP1073037A2 (en) 2001-01-31

Similar Documents

Publication Publication Date Title
JP2001042884A (ja) 音声認識制御システム及び音声認識制御方法
JP2002182679A (ja) 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体
JPH04204700A (ja) 音声認識装置
JPH07274300A (ja) 音声案内装置
JPH05150792A (ja) 個人追従型音響生成装置
JP3249069B2 (ja) 情報ネットワークシステム及びそのシステムが有する機能機器の制御方法
JP2000305596A (ja) 音声認識装置及びナビゲーション装置
JP4884129B2 (ja) 指令システム、音声出力先選択装置、及びコンピュータプログラム
JPH0693717B2 (ja) 音声応答装置
JPH06135649A (ja) エレベータの放送装置
JPH11237892A (ja) 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体
JPS6230157Y2 (ja)
JPH0825697B2 (ja) エレベ−タの制御信号伝送装置
JPS61130999A (ja) 音声認識装置
JP2000250592A (ja) 音声認識操作システム
JP2002507772A (ja) 情報再生用または機能実行用の装置
JPH06290385A (ja) 緊急指令システム
JP2005218010A (ja) 車両用データ伝送システム
JPS6173998A (ja) 音声認識装置
JPH0287757A (ja) 電話自動応答認識装置
JPS59148097A (ja) 音声認識方式
JP2020039048A (ja) 音声収集装置および音声収集方法
JP2000066777A (ja) パーソナルコンピュータシステム
JP2005176005A (ja) Avシステムの自動構成システム及びavシステムの構成方法
JPS61116400U (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060302

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120529

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130529

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees