JPH11232074A - ネットワーク装置およびコントロール端末およびネットワーク端末 - Google Patents

ネットワーク装置およびコントロール端末およびネットワーク端末

Info

Publication number
JPH11232074A
JPH11232074A JP10034481A JP3448198A JPH11232074A JP H11232074 A JPH11232074 A JP H11232074A JP 10034481 A JP10034481 A JP 10034481A JP 3448198 A JP3448198 A JP 3448198A JP H11232074 A JPH11232074 A JP H11232074A
Authority
JP
Japan
Prior art keywords
voice
network
phoneme
operation information
control terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10034481A
Other languages
English (en)
Inventor
Takeshi Hatakeyama
武士 畠山
Mitsuru Kitao
充 北尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10034481A priority Critical patent/JPH11232074A/ja
Publication of JPH11232074A publication Critical patent/JPH11232074A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 コントロール端末によりネットワークを介し
てネットワーク端末をコントロールするネットワーク装
置において、ネットワーク端末を接続すると自動的にコ
ントロール端末からの音声入力によりネットワーク端末
の操作ができる音声入力操作のプラグ&プレイ機能を実
現する。 【解決手段】 ネットワーク端末へのコマンドとコマン
ドを指示する音声の音声標準パターンを含む操作情報を
ネットワーク端末からコントロール端末へ送信する。コ
ントロール端末は、操作情報を記憶し、操作者から音声
入力が行われた時、内部の音声認識装置により、操作情
報中の各コマンドの音声標準パターンと入力音声の音声
パターンを比較してコマンドを決定し、ネットワーク端
末に送信する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワークを介
して、コントロール端末がネットワーク端末にコマンド
(操作信号)を送信し、ネットワーク端末の操作を行う
ネットワーク装置、ネットワーク端末、コントロール端
末に関するもので、特にコントロール端末において操作
者が音声により入力を行い、音声認識により操作を決定
し、ネットワーク端末にコマンド(操作信号)を送信を
行うものである。
【0002】
【従来の技術】従来の音声認識の方法としては、同一端
末内に、音声標準パターンを用意しておき、標準パター
ンと音声入力信号の音声パターンと比較することによ
り、音声認識を行う方法があった。
【0003】音声認識については、例えば、「音声情報
処理の基礎」(オーム社、1981年)にその解説があ
る。
【0004】従来の音声認識では、ある単語を認識する
場合、同じ端末内に単語に対応する標準パターンを準備
しておき、これと入力音声を比較することにより、入力
音声に対応する単語を決定する。
【0005】単語の音声認識の方式として、音声標準パ
ターンを用いるものと、音素構成パターンを用いるもの
の2つがある。
【0006】まず、音声標準パターンを用いる場合の音
声認識について、図を用いて、説明を行う。
【0007】図9は、従来の音声標準パターンを用いる
音声認識方法の説明図である。図9において、91は音
声入力装置であり、92は音声認識装置で、音声標準パ
ターン921、特徴抽出部922、単語認識部923よ
り構成される。
【0008】音声は音声入力装置91により入力された
後、音声信号として音声認識装置92に出力される。音
声信号は、音声認識装置92において、まず、特徴抽出
部922に入力され、ここで、音声標準パターン921
と同じ音声信号のフォーマットに変換される。例えば、
音声標準パターンの照合は、5ms〜10msごとにサ
ンプリングした音声スペクトルの時間変化パターンを照
合することにより行われる。
【0009】図10は、音声スペクトル時間変化パター
ンの説明図である。101は音声スペクトル時間変化パ
ターンである。
【0010】音声スペクトル時間変化パターン101の
ように、入力音声信号は、特徴抽出部922により周波
数スペクトルの時間変化パターンへ変換される。
【0011】音声標準パターン921では、認識したい
単語の音声標準パターンが記憶されている。例えば、認
識したい単語が4つ存在する場合には、認識したい4つ
の単語に対応する音声標準パターンである4つの音声ス
ペクトル時間変化パターンが記憶されている。
【0012】単語認識部923において、入力音声スペ
クトルの時間変化パターンと音声標準パターン921を
比較することにより、入力音声の単語の判定を行う。す
なわち認識したい単語が4つ存在する場合には、これら
4つの音声標準パターンのうち、入力音声パターンと最
も近いものを単語認識部923で判定し、最も近い音声
標準パターンに対応する単語を認識単語として出力す
る。
【0013】判定する際の音声標準パターンの比較方法
としては、DPマッチング法、HMM法などが知られて
いる。
【0014】次に、音素構成パターンを用いる場合の音
声認識について、図を用いて、説明を行う。
【0015】図11は、従来の音素構成パターンを用い
る音声認識方法の説明図である。図11において、11
01は音声入力装置であり、1102は音声認識装置
で、音素標準パターン11021、音素構成パターン1
1022、特徴抽出部11023、音素認識部1102
4、単語認識部11025より構成される。
【0016】入力音声は、図9と同様に、音声入力装置
1101を通って、音声認識装置1102に入力され、
特徴抽出部11023において音素標準パターンと同じ
音声信号のフォーマットに変換される。音素構成パター
ンを用いる方式では、音素認識部11024において、
音声がどのような音素から構成されるか解析される。音
素標準パターン11021では、a、i、u、e、oな
どの母音、p、b、tなどの子音などのすべての音素に
対応する音声スペクトル時間変化パターンを記憶してお
り、これらの音素標準パターンと入力音声の音声パター
ンを比較することにより、音素認識部11024で入力
音声がどのような音素からなるかを判定する。音素認識
部の認識結果である入力音声の音素構成パターンは、単
語認識部11025へ出力される。単語認識部1102
5は、音素構成パターンから入力音声の単語を判定す
る。音素構成パターン11022には、認識したい各単
語がどのような音素から構成されるかという情報を記憶
されている。このような単語の音素構成パターンは、認
識したい単語数分記憶されている。単語認識部1102
5は、音素認識部11024からの入力音声の音素構成
パターンと認識単語の音素構成パターン11022を比
較して、入力音声に対応する単語を判定し、認識結果と
して出力する。
【0017】
【発明が解決しようとする課題】しかしながら、上記の
ような構成では、以下のような問題があった。
【0018】コントロール端末により、ネットワークを
介して、ネットワーク端末のコントロールを行うネット
ワーク装置への対応の問題である。
【0019】コントロール端末において、操作者が音声
入力を行い、ネットワーク端末を操作しているネットワ
ーク装置において、各ネットワーク端末に音声認識装置
をもうけ、コントロール端末から操作者の入力音声信号
をネットワークを介してネットワーク端末に送信し、各
ネットワーク端末で入力音声信号から音声認識を行い、
操作を決定する方法が考えられる。しかしながら、この
方式は、各ネットワーク端末において音声認識装置が必
要であり、ネットワークで音声入力信号を伝送する必要
があるため、ネットワーク中の帯域リソースの有効利用
からも好ましくない。
【0020】一方、コントロール端末において入力音声
の音声認識を行い、操作信号をネットワークを介してネ
ットワーク端末に送信する場合、すべてのネットワーク
端末のすべての操作に対応する音声標準パターンをコン
トロール端末に記憶する必要があり、ネットワーク装置
の形態変化に対する管理保守が煩雑になるという問題点
がある。すなわち、新たなネットワーク端末をネットワ
ーク装置に接続するために、新しいネットワーク端末に
対応する新しい操作の音声標準パターンをコントロール
端末に記憶させるという手順が発生する。
【0021】本発明は、かかる点に鑑み、音声入力によ
り操作を決定するコントロール端末によりネットワーク
端末のコントロールを行うネットワーク装置において、
ネットワーク端末の形態変化に容易に対応できるネット
ワーク装置を実現することを目的とする。
【0022】
【課題を解決するための手段】本発明におけるネットワ
ーク装置では、ネットワーク端末において自端末の操作
のための音声標準パターンを記憶しておき、この音声標
準パターンを含む操作情報をネットワーク端末の初期化
時に、コントロール端末に送信する。コントロール端末
では、操作情報を記憶し、操作者からの音声入力があっ
た場合には、音声標準パターンを基に、音声認識を行
い、認識結果に対応する操作信号をコントロール端末か
らネットワーク端末に送信する。
【0023】本発明におけるネットワーク装置では、前
記した構成により、ネットワーク端末をネットワーク装
置に接続すると自動的に、コントロール端末でネットワ
ーク端末を音声入力によりコントロールすることができ
る。
【0024】
【発明の実施の形態】(実施の形態1)以下、本発明の
第1の実施の形態におけるネットワーク装置、コントロ
ール端末、ネットワーク端末について、図面を参照しな
がら説明する。
【0025】図1は、本発明の第1の実施の形態におけ
るネットワーク装置の構成図である。
【0026】図1において、11はコントロール端末で
あり、タッチパネルディスプレイ111、操作情報記憶
装置112、音声入力装置113、音声認識装置11
4、ネットワーク送受信装置115より構成され、12
はネットワークであり、13はネットワーク端末であ
り、ネットワーク送受信装置131、操作情報記憶装置
132、ネットワーク端末本体部133より構成され
る。
【0027】以上のようなネットワーク装置の動作の概
要は以下の通りである。ネットワーク端末13がネット
ワーク12に接続された時、ネットワーク端末13は、
コントロール端末11に対して、コマンド名、アイコン
情報、音声標準パターン情報などからなる操作情報を送
信し、コントロール端末11はこれらを記憶し、解析す
ることにより、操作者に操作環境を提供する。
【0028】操作者から音声入力が行われた時、コント
ロール端末は、記憶していた音声標準パターンを基に音
声認識を行い、コマンドをネットワーク端末13に送信
し、ネットワーク端末13は、所望の動作を行う。
【0029】以上のような動作を、以下詳細に説明す
る。本実施の形態においては、ネットワーク端末13と
して、カーナビを考える。
【0030】ネットワーク端末13のカーナビが、ネッ
トワーク12に接続された時、コントロール端末11
に、コマンド名、アイコン情報、音声標準パターンなど
からなる操作情報を送信する。これらの操作情報を図を
用いて説明する。
【0031】図2は、本発明の第1の実施の形態におけ
る操作情報の説明図である。図2において、21は操作
情報である。
【0032】本実施の形態のカーナビにおいては、コマ
ンドとして、拡大、縮小、左、右、上、下の6つが存在
し、操作情報21としては6つコマンド名とそれらの各
コマンドに対するコントロール端末上に表示されるボタ
ンのアイコン、コマンドを指定する単語の音声標準パタ
ーンが存在する。
【0033】このような操作情報は、ネットワーク端末
13の操作情報記憶装置132において記憶されてお
り、ネットワーク送受信装置131によって、コントロ
ール端末11に送信される。
【0034】コントロール端末11は、ネットワーク端
末13からの操作情報をネットワーク送受信装置115
により受信し、操作情報を操作情報記憶装置112に出
力する。操作情報記憶装置112は、この操作情報を記
憶する。
【0035】タッチパネルディスプレイ111は、操作
情報記憶装置112上の操作情報を解析し、操作者に対
して、ボタンによる操作画面を提供する。
【0036】ボタンによる操作画面について図を用いて
説明する。図3は、操作画面の説明図である。図3にお
いて、31は操作画面である。
【0037】タッチパネルディスプレイ111には、操
作画面31のような画面が表示される。拡大、縮小、
左、右、上、下のコマンドのアイコンが表示され、操作
者がこれらのボタンをタッチパネルディスプレイ111
上で選択した時、次のように動作が行われ、ネットワー
ク端末13において所望の動作が行われる。今、操作者
が拡大のボタンを選択し、ボタンを押下したとする。こ
の時、タッチパネルディスプレイ111は、ネットワー
ク送受信装置115に対して、拡大のコマンドを出力す
る。ネットワーク送受信装置115は、拡大コマンドを
受け、ネットワーク端末13に拡大コマンドを送信す
る。
【0038】ネットワーク端末13は、拡大コマンドを
ネットワーク送受信装置131で受信し、ネットワーク
端末本体部133に出力する。ネットワーク端末本体部
133は、拡大コマンドを受けると拡大の動作を行い、
操作者の要求が実現される。
【0039】以上のようにして、操作画面による操作が
行われるが、本実施の形態におけるネットワーク装置に
おいては、操作画面による操作だけでなく、音声による
操作が可能である。以下、音声による操作の動作手順に
ついて説明を行う。
【0040】操作者から音声入力があった時、操作者の
音声は音声入力装置113に入力される。この音声入力
信号は音声認識装置114に入力され、操作情報記憶装
置112上の最も近い音声標準パターンを持つコマンド
と対応づけられ、認識されたコマンドが音声認識装置1
14から出力される。
【0041】音声認識装置114における動作について
図を用いて説明する。図4は、本発明の第1の実施の形
態の音声認識装置の動作の説明図である。図4におい
て、41は特徴抽出部、42は単語認識部である。
【0042】入力された音声信号はまず、特徴抽出部4
1において、従来の技術で説明したような入力音声パタ
ーン(音声スペクトル時間変化パターン)に変換され、
単語認識部42に出力される。単語認識部42において
入力音声パターンが、操作情報記憶装置112に記憶さ
れている操作情報の6つの音声標準パターンと比較さ
れ、最も近い音声標準パターンが決定され、その音声標
準パターンに対応するコマンド名が認識結果として出力
される。
【0043】この時の、動作を図5を用いて説明する。
図5は、音声パターンの比較の説明図である。図5にお
いて、51は音声入力パターン、52は音声標準パター
ンA、53は音声標準パターンB、54は音声標準パタ
ーンC、55は音声標準パターンD、56は音声標準パ
ターンE、57は音声標準パターンFである。
【0044】単語認識部42では、音声入力パターン5
1と最も近い音声標準パターンを探索する。図5の例で
は、音声標準パターンAが最も近いと判定される。
【0045】実際の比較の方式には、様々なものがあ
り、DPマッチング法、HMM法などが知られている。
【0046】単語認識部42は、入力音声が音声標準パ
ターンAの音声であると判定し、音声標準パターンAに
対応するコマンドである拡大を音声認識装置114の出
力とする。
【0047】ネットワーク送受信装置115は、この拡
大のコマンドを受け、ネットワーク12を介して、ネッ
トワーク端末13に対して、拡大コマンドを送信しす
る。ネットワーク端末13では、ネットワーク送受信装
置131を介して、ネットワーク端末本体部133に拡
大コマンドが出力され、操作者の所望の動作である拡大
が行われる。
【0048】以上のような動作により、コントロール端
末がネットワーク端末の操作を音声認識により行うネッ
トワーク装置において、新規にネットワーク端末が接続
された場合にでも自動的にそのネットワーク端末を音声
入力で操作することが可能となる。新たにネットワーク
端末を追加することができるネットワーク装置において
は、コントロール端末において将来のネットワーク端末
まですべてに対応することができるような操作情報を記
憶しておくことは非常に困難であるため、このような音
声認識を実現する操作環境のプラグ&プレイ機能は非常
に有効である。
【0049】なお、本実施の形態では、音声認識の方法
として、音声標準パターンを用いる方法について説明を
行ったが、他のいかなる標準パターンを用いる音声認識
の方法に対しても本発明は有効である。
【0050】また、本実施の形態では、ネットワーク端
末としてカーナビについて説明したが、他のいかなるネ
ットワーク端末についても本発明は有効である。
【0051】なお、本実施の形態では、音声標準パター
ンとして、音声スペクトル時間変化パターンを用いる場
合について説明を行ったが、音声標準パターンとして他
のいかなる音声信号のフォーマットを用いる場合につい
ても本発明は有効である。
【0052】また、本実施の形態では、ネットワーク端
末が1台の場合のネットワーク装置について説明を行っ
たが、ネットワーク端末が複数台のネットワーク端末を
コントロール端末でコントロールするネットワーク装置
についても本発明は有効である。この場合、コントロー
ル端末において、ネットワーク端末の選択を行う必要が
あるが、ネットワーク端末の選択の際に用いるネットワ
ーク端末の名前に対応する音声の音声標準パターンをネ
ットワークからコントロール端末へ送信し、コントロー
ル端末においてネットワーク端末の選択を音声認識によ
り行うことができる。
【0053】なお、本実施の形態では、音声認識による
操作だけでなく、操作画面による操作も可能な場合のネ
ットワーク装置について述べたが、音声認識による操作
のみ実現するネットワーク装置にも、本発明は有効であ
る。
【0054】(実施の形態2)以下、本発明の第2の実
施の形態におけるネットワーク装置、コントロール端
末、ネットワーク端末について、図面を参照しながら説
明する。
【0055】図6は、本発明の第2の実施の形態におけ
るネットワーク装置の構成図である。
【0056】図6において、61はコントロール端末で
あり、タッチパネルディスプレイ611、操作情報記憶
装置612、音声入力装置613、音声認識装置61
4、ネットワーク送受信装置615、個人認証装置61
6により構成され、62はネットワークであり、63は
ネットワーク端末であり、ネットワーク送受信装置63
1、操作情報記憶装置632、ネットワーク端末本体部
633より構成される。
【0057】なお、本実施の形態においては、実施の形
態1と同様にネットワーク端末としては、カーナビを考
えるものとする。
【0058】実施の形態1と同様の動作により、音声認
識の標準パターン情報を含む操作情報がコントロール端
末61に送信され、操作情報記憶装置612により記憶
される。本実施の形態においては、音声認識の標準パタ
ーン情報として、従来の技術で説明を行った音素構成パ
ターンを送信し、コントロール端末61において、入力
音声があった場合には、音素認識を行い、更に操作情報
の音素構成パターンと比較することにより、単語を判定
する。従って、この時、各音素の音素標準パターンは、
コントロール端末61において予め記憶しておく必要が
ある。音素標準パターンは、個人により変化するもので
あるため、コントロール端末において個人認証を行い、
各個人用の音素標準パターンを用いて音素認識を行うこ
とにより、音素認識の認識率を高めることができる。
【0059】図7は、本発明の第2の実施の形態におけ
る操作情報の説明図である。図7において、71は操作
情報である。
【0060】本実施の形態では、操作情報として、各コ
マンドを指示する音声の音素構成パターンを送信する。
例えば、拡大コマンドの音素構成パターンはk a k
ud a iとなる。これら各コマンドの音素構成パ
ターンを含む操作情報がネットワーク端末63からコン
トロール端末61に送信され、操作情報記憶装置612
に記憶される。
【0061】実施の形態1と同様の動作により、タッチ
パネルディスプレイ611にネットワーク端末63の操
作画面が映され、これを基に操作者はネットワーク端末
63の操作を行うことができる。
【0062】次に、音声入力によるネットワーク端末6
3の操作は、次のような動作により行われる。
【0063】個人認証装置616は、個人認証を行い、
個人の認証情報を音声認識装置614に出力する。個人
認証装置としては、パスワードによる個人認証、カード
による個人認証を行う装置が考えられる。本実施の形態
では、Aさん、Bさん、Cさんという3人を個人認証装
置616は認証できるものとし、個人認証装置616か
ら現在、コントロール端末61を使用しているのは、A
さん、Bさん、Cさんのいずれかという個人認証情報を
音声認識装置614に出力するものとする。
【0064】音声認識装置614の動作を図を用いて説
明する。図8は、本発明の第2の実施の形態における音
声認識装置の動作の説明図である。図8においては、8
1は音素標準パターンA、82は音素標準パターンB、
83は音素標準パターンC、84は特徴抽出部、85は
音素認識部、86は単語認識部である。
【0065】入力された音声は、特徴抽出部84で、従
来の技術で説明したような音声入力パターン(音声スペ
クトル時間変化パターン)に変換され、音素認識部85
に出力される。音素認識部85は、音素標準パターンを
用いて、音声入力がどのような音素により構成されるか
を判別する。音素標準パターンA、B、Cでは、すべて
の音素(a、i、u、e、o、k、、、、)に対応する
図10のような音声標準パターンを記憶しており、これ
らと特徴抽出部84からの音声入力パターンを比較する
ことにより、音素認識部85は、音声入力の音素構成パ
ターンを決定する。これらの比較方法としてDPマッチ
ング法、HMM法が知られている。コマンドが拡大の場
合には、音素認識部85からは、k a k u d
a iという音素構成パターンが単語認識部86に出力
される。
【0066】音素認識部85は、比較に用いる音素標準
パターンをA、B、Cの3つから選択する。この際、個
人認証装置614からの個人認証情報を基にして、選択
を行うことにより、コントロール端末61を使用中の操
作者に適した音素認識を行う。音素標準パターンは個人
により特徴があるため、このような方式により、音素の
認識率の向上を図ることができる。
【0067】単語認識部86は、音素認識部85からの
音素構成パターンと操作情報記憶装置612の操作情報
に含まれる各コマンドの音素構成パターンを比較し、入
力音声に対応するコマンドを決定する。従って、本実施
の形態の例においては、ka k u d a iとい
う音素構成パターンから拡大コマンドが単語認識部86
から出力される。
【0068】音声認識装置714からのコマンド出力で
ある拡大コマンドは、実施の形態1と同様にして、ネッ
トワーク端末63のネットワーク端末本体部633に送
信され、操作者の所望の動作が実現される。
【0069】以上のような動作により、ネットワーク端
末から各コマンドを指定する音声の音素構成パターンを
送信し、コントロール端末において音素構成パターンに
より音声認識を行うより、新しいネットワーク端末をネ
ットワーク装置に接続するだけで自動的に、コントロー
ル端末で音声入力を用いてネットワーク端末を操作する
ことが可能となる。音素標準パターンを用いる音声認識
は、音声標準パターンを用いる音声認識に比べて認識率
が低くなるが、本実施の形態は、第1実施の形態の方式
と比べてネットワーク中を送信する操作情報の量が少な
くなるというメリットがある。また、個人認証を行い、
各個人用の音素標準パターンを用いることにより、音素
認識率を上げることが可能である。
【0070】なお、本実施の形態では、音素認識の方法
として、音声スペクトル時間変化パターンを用いる方法
について説明を行ったが、他のいかなる標準パターンを
用いる音素認識の方法に対しても本発明は有効である。
【0071】また、本実施の形態では、ネットワーク端
末としてカーナビについて説明したが、他のいかなるネ
ットワーク端末についても本発明は有効である。
【0072】なお、本実施の形態では、ネットワーク端
末が1台の場合のネットワーク装置について説明を行っ
たが、ネットワーク端末が複数台のネットワーク端末を
コントロール端末でコントロールするネットワーク装置
についても本発明は有効である。この場合、ネットワー
ク端末の選択を行う必要があるが、ネットワーク端末の
選択の際に用いるネットワーク端末の名前に対応する音
声の音素構成パターンをコントロール端末から送信し、
コントロール端末においてネットワーク端末の選択を音
声認識により行うことができる。
【0073】また、本実施の形態では、音声認識による
操作だけでなく、操作画面による操作も可能とするネッ
トワーク装置について述べたが、音声認識による操作の
み実現するネットワーク装置にも、本発明は有効であ
る。
【0074】また、本実施の形態では、個人認証を行
い、各個人ごとの音素標準パターンを音声認識装置にお
いて準備する場合について述べたが、音素標準パターン
を個人毎に準備せず、各人に共通の音素標準パターンを
1つ準備することも可能である。
【0075】
【発明の効果】以上、説明したように、本発明における
ネットワーク装置では、ネットワーク端末において自端
末の操作のための音声標準パターンを記憶しておき、音
声標準パターンを含む操作情報を、コントロール端末に
送信し、コントロール端末において、操作者からの音声
入力があった場合には、音声標準パターンを基に、音声
認識を行い、認識結果に対応するコマンドをコントロー
ル端末からネットワーク端末に送信する。これにより、
ネットワーク端末をネットワーク装置に接続すると自動
的に、コントロール端末において音声入力でネットワー
ク端末を操作することが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態におけるネットワー
ク装置の構成図
【図2】本発明の第1の実施の形態における操作情報の
説明図
【図3】操作画面の説明図
【図4】本発明の第1の実施の形態における音声認識装
置の動作の説明図
【図5】音声パターンの比較の説明図
【図6】本発明の第2の実施の形態におけるネットワー
ク装置の構成図
【図7】本発明の第2の実施の形態における操作情報の
説明図
【図8】本発明の第2の実施の形態における音声認識装
置の動作の説明図
【図9】従来の音声標準パターンを用いる音声認識方法
の説明図
【図10】音声スペクトル時間変化パターンの説明図
【図11】従来の音素構成パターンを用いる音声認識方
法の説明図
【符号の説明】
11,61 コントロール端末 111,611 タッチパネルディスプレイ 112,132,612,632 操作情報記憶装置 113,613,91,1101 音声入力装置 114,614,92,1102 音声認識装置 115,131,615,631 ネットワーク送受信
装置 12,62 ネットワーク 13,63 ネットワーク端末 133,633 ネットワーク端末本体部 21,71 操作情報 31 操作画面 41,84,922,11023 特徴抽出部 42,86,923,11025 単語認識部 51 音声入力パターン 52 音声標準パターンA 53 音声標準パターンB 54 音声標準パターンC 55 音声標準パターンD 56 音声標準パターンE 57 音声標準パターンF 616 個人認証装置 81 音素標準パターンA 82 音素標準パターンB 83 音素標準パターンC 85,11024 音素認識部 921 音声標準パターン 101 音声スペクトル時間変化パターン 11021 音素標準パターン 11022 音素構成パターン

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク端末とコントロール端末を
    具備し、 前記ネットワーク端末は、前記コントロール端末に対し
    て、操作を指定する音声の音声標準パターンを含む操作
    情報を送信し、前記コントロール端末から操作信号を受
    け、前記操作信号で指定された動作を行い、 前記コントロール端末は、前記ネットワーク端末から前
    記音声標準パターンを含む前記操作情報を受信し、操作
    者から音声入力があった時、前記音声入力と前記音声標
    準パターンから操作者の意図する操作を判定し、操作に
    対応する前記操作信号を前記ネットワーク端末に送信す
    ることを特徴とするネットワーク装置。
  2. 【請求項2】 操作情報が、ボタンに関する情報とボタ
    ンに対応する音声標準パターンの組み合わせを含むこと
    を特徴とする請求項1記載のネットワーク装置。
  3. 【請求項3】 コントロール端末に対して、操作を指定
    する音声の音声標準パターンを含む操作情報を送信し、
    前記コントロール端末から操作信号を受け、前記操作信
    号で指定された動作を行うことを特徴とするネットワー
    ク端末。
  4. 【請求項4】 操作情報が、ボタンに関する情報とボタ
    ンに対応する音声標準パターンの組み合わせを含むこと
    を特徴とする請求項3記載のネットワーク装置。
  5. 【請求項5】 ネットワーク端末から操作を指定する音
    声の音声標準パターンを含む操作情報を受信し、操作者
    から音声入力があった時、音声入力信号と前記音声標準
    パターンから操作者の意図する操作を判定し、操作に対
    応する操作信号を前記ネットワーク端末に送信すること
    を特徴とするコントロール端末。
  6. 【請求項6】 操作情報が、ボタンに関する情報とボタ
    ンに対応する音声標準パターンの組み合わせを含むこと
    を特徴とする請求項5記載のコントロール端末。
  7. 【請求項7】 ネットワーク送受信装置と操作情報記憶
    装置とネットワーク端末本体部を具備するネットワーク
    端末であって、 前記ネットワーク送受信装置は、前記操作情報記憶装置
    からの操作を指示する音声の音声標準パターンを含む操
    作情報をネットワークに送信し、コントロール端末から
    の操作信号を前記ネットワーク端末本体部に送信し、 前記操作情報記憶装置は、前記操作情報を記憶してお
    り、前記操作情報を前記ネットワーク送受信装置に出力
    し、 前記ネットワーク端末本体部は、前記ネットワーク送受
    信装置から前記操作信号を受け、前記操作信号に対応す
    る動作を行うことを特徴とするネットワーク端末。
  8. 【請求項8】 ネットワーク送受信装置と操作情報記憶
    装置と音声入力装置と音声認識装置を具備するコントロ
    ール端末であって、 前記ネットワーク送受信装置は、ネットワーク端末から
    操作を指示する音声の音声標準パターンを含む操作情報
    を受信した時、前記操作情報を前記操作情報記憶装置に
    出力し、前記音声認識装置からの操作信号を受け、前記
    操作信号を前記ネットワーク端末に送信し、 前記操作情報記憶装置は、前記ネットワーク送受信装置
    からの前記操作情報を記憶し、前記音声認識装置からの
    指示に基づき、前記操作情報を前記音声認識装置に出力
    し、 前記音声入力装置は、操作者からの音声入力を受け、前
    記音声入力に対応する音声入力信号を前記音声認識装置
    に出力し、 前記音声認識装置は、前記操作情報記憶装置から、前記
    操作情報を受け、前記音声入力装置からの前記音声入力
    信号を受けた時、前記操作情報中の操作を指示する音声
    の前記音声標準パターンとの比較から、操作者の意図す
    る操作を判定し、前記音声入力に対応する前記操作信号
    を前記ネットワーク送受信装置に出力することを特徴と
    するコントロール端末。
  9. 【請求項9】 ネットワーク端末とコントロール端末を
    具備し、 前記ネットワーク端末は、前記コントロール端末に対し
    て、操作を指定する音声がどのような音素から構成され
    るかを示す音素構成パターンを含む操作情報を送信し、
    前記コントロール端末から操作信号を受信し、前記操作
    信号で指定された動作を行い、 前記コントロール端末は、前記ネットワーク端末から前
    記操作情報を受信し、操作者から音声入力があった時、
    前記音声入力に対応する音声入力信号と記憶しておいた
    音素標準パターンの比較により音素認識を行い、前記音
    声入力の前記音素構成パターンを識別し、操作者からの
    前記音声入力の前記音素構成パターンと前記操作情報の
    前記音素構成パターンを比較することにより、操作者の
    意図する操作を判定し、操作に対応する前記操作信号を
    前記コントロール端末に送信することを特徴とするネッ
    トワーク装置。
  10. 【請求項10】 コントロール端末に対して、操作を指
    定する音声がどのような音素から構成されるかを示す音
    素構成パターンを含む操作情報を送信し、前記コントロ
    ール端末から操作信号を受信し、前記操作信号で指定さ
    れた動作を行うことを特徴とするネットワーク端末。
  11. 【請求項11】 ネットワーク端末から操作を指定する
    音声がどのような音素から構成されるかを示す音素構成
    パターンを含む操作情報を受信し、操作者から音声入力
    があった時、前記音声入力と記憶しておいた音素標準パ
    ターンの比較により音素認識を行い、前記音声入力の前
    記音素構成パターンを識別し、操作者からの前記音声入
    力の前記音素構成パターンと前記操作情報の前記音素構
    成パターンを比較することにより、操作者の意図する操
    作を判定し、操作に対応する操作信号を前記ネットワー
    ク端末に送信することを特徴とするコントロール端末。
  12. 【請求項12】 コントロール端末が、個人認証機能を
    有し、個人毎に異なる音素標準パターンを準備してお
    き、前記コントロール端末を使用中の個人に対応した前
    記音素標準パターンを用いて音素認識を行い、操作者の
    意図する操作を判定することを特徴とする請求項9記載
    のネットワーク装置。
  13. 【請求項13】 個人認証機能を有し、個人毎に異なる
    音素標準パターンを準備しておき、前記コントロール端
    末を使用中の個人に対応した前記音素標準パターンを用
    いて音素認識を行い、操作者の意図する操作を判定する
    ことを特徴とする請求項11記載のコントロール端末。
  14. 【請求項14】 ネットワーク送受信装置と操作情報記
    憶装置とネットワーク端末本体部を具備するネットワー
    ク端末であって、 前記ネットワーク送受信装置は、前記操作情報記憶装置
    からの操作を指示する音声がどのような音素から構成さ
    れるかを示す音素構成パターンを含む操作情報をコント
    ロール端末に送信し、前記コントロール端末からの操作
    信号を前記ネットワーク端末本体部に送信し、 前記操作情報記憶装置は、前記操作情報を記憶してお
    り、前記操作情報を前記ネットワーク送受信装置に出力
    し、 前記ネットワーク端末本体部は、前記ネットワーク送受
    信装置から前記操作信号を受け、前記操作信号に対応す
    る動作を行うことを特徴とするネットワーク端末。
  15. 【請求項15】 ネットワーク送受信装置と操作情報記
    憶装置と音声入力装置と音声認識装置を具備するコント
    ロール端末であって、 前記ネットワーク送受信装置は、ネットワーク端末から
    操作を指示する音声がどのような音素から構成されるか
    を示す音素構成パターンを含む操作情報を受信した時、
    前記操作情報を前記操作情報記憶装置に出力し、前記音
    声認識装置からの操作信号を受け、前記ネットワーク端
    末に送信し、 前記操作情報記憶装置は、前記ネットワーク送受信装置
    からの前記操作情報を記憶し、前記音声認識装置からの
    指示に基づき、前記音声認識装置に前記操作情報を出力
    し、 前記音声入力装置は、操作者からの音声入力を受け、前
    記音声入力に対応する音声入力信号を前記音声認識装置
    に出力し、 前記音声認識装置は、予め音素標準パターンを記憶して
    おり、前記音声入力装置からの前記音声入力信号と前記
    音素標準パターンを比較することにより音素認識を行
    い、前記音声入力の前記音素構成パターンを識別し、前
    記操作情報記憶装置に指示を出し、前記操作情報を受
    け、操作を指示する音声の前記音素構成パターンと前記
    音声入力の前記音素構成パターンを比較することにより
    前記音声入力に対応する操作を判定し、操作に対応する
    前記操作信号を前記ネットワーク送受信装置に出力する
    ことを特徴とするコントロール端末。
  16. 【請求項16】 個人認証装置とネットワーク送受信装
    置と操作情報記憶装置と音声入力装置と音声認識装置を
    具備するコントロール端末であって、 前記個人認証装置は、装置を使用している個人を認証
    後、個人認証情報を前記音声認識装置に出力し、 前記ネットワーク送受信装置は、ネットワーク端末から
    操作を指示する音声がどのような音素から構成されるか
    を示す音素構成パターンを含む操作情報を受信した時、
    前記操作情報を前記操作情報記憶装置に出力し、前記音
    声認識装置からの操作信号を受け、前記ネットワーク端
    末に送信し、 前記操作情報記憶装置は、前記ネットワーク送受信装置
    からの前記操作情報を記憶し、前記音声認識装置からの
    指示に基づき、前記音声認識装置に前記操作情報を出力
    し、 前記音声入力装置は、操作者からの音声入力を受け、前
    記音声認識装置に出力し、 前記音声認識装置は、予め複数人に対する前記音素構成
    パターンを記憶しており、前記個人認証装置からの前記
    個人認証情報を受け、コントロール端末を使用中の個人
    に対応した前記音素構成パターンと前記音声入力装置か
    ら音声入力信号を比較することにより音素認識を行い、
    前記音声入力の前記音素構成パターンを識別し、前記操
    作情報記憶装置に指示を出し、前記操作情報を受け、操
    作を指示する音声の前記音素構成パターンと前記音声入
    力の前記音素構成パターンを比較することにより前記音
    声入力に対応する操作を判定し、操作に対応する前記操
    作信号を前記ネットワーク送受信装置に出力することを
    特徴とするコントロール端末。
JP10034481A 1998-02-17 1998-02-17 ネットワーク装置およびコントロール端末およびネットワーク端末 Pending JPH11232074A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10034481A JPH11232074A (ja) 1998-02-17 1998-02-17 ネットワーク装置およびコントロール端末およびネットワーク端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10034481A JPH11232074A (ja) 1998-02-17 1998-02-17 ネットワーク装置およびコントロール端末およびネットワーク端末

Publications (1)

Publication Number Publication Date
JPH11232074A true JPH11232074A (ja) 1999-08-27

Family

ID=12415451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10034481A Pending JPH11232074A (ja) 1998-02-17 1998-02-17 ネットワーク装置およびコントロール端末およびネットワーク端末

Country Status (1)

Country Link
JP (1) JPH11232074A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001296881A (ja) * 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001296881A (ja) * 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体

Similar Documents

Publication Publication Date Title
US10424298B2 (en) Voice processing device
US7249025B2 (en) Portable device for enhanced security and accessibility
KR100753780B1 (ko) 음성 입력 디바이스
US7356471B2 (en) Adjusting sound characteristic of a communication network using test signal prior to providing communication to speech recognition server
JPH11231886A (ja) 登録名称認識装置
US6526381B1 (en) Remote control with speech recognition
EP1207516B1 (en) Device setter, device setting system, and recorded medium where device setting program is recorded
JPH09171394A (ja) 家庭環境内の装置の音声識別システム
US8798985B2 (en) Interpretation terminals and method for interpretation through communication between interpretation terminals
JP2009300537A (ja) 音声作動システム、音声作動方法および車載装置
JPH11232074A (ja) ネットワーク装置およびコントロール端末およびネットワーク端末
JP2002182896A (ja) 音声認識システム及び音声認識装置ならびにそれらの方法
EP1316944A2 (en) Sound signal recognition system and method, and dialog control system and method using it
CN109102808A (zh) 一种基于显示交互的本地语音识别系统及其方法
EP1187441B1 (en) Audio recognition method and device for sequence of numbers
JP3291347B2 (ja) 音声認識装置
JPS60152A (ja) 情報システムの加入者端末用操作装置
KR20080052306A (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
JP4093394B2 (ja) 音声認識装置
KR100423495B1 (ko) 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법
KR20150061807A (ko) 수동 조작에 기반한 음성인식 명령어 안내 장치 및 방법
JP2000029490A (ja) 音声認識装置用の単語辞書データ構築方法、音声認識装置及びナビゲーションシステム
JPH06318977A (ja) 音声対話装置
JPH1152983A (ja) 音声認識装置
WO2015102039A1 (ja) 音声認識装置