JPS60186897A - 音声入力による制御装置 - Google Patents

音声入力による制御装置

Info

Publication number
JPS60186897A
JPS60186897A JP59042320A JP4232084A JPS60186897A JP S60186897 A JPS60186897 A JP S60186897A JP 59042320 A JP59042320 A JP 59042320A JP 4232084 A JP4232084 A JP 4232084A JP S60186897 A JPS60186897 A JP S60186897A
Authority
JP
Japan
Prior art keywords
voice
speech
command
section
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59042320A
Other languages
English (en)
Other versions
JPH0570160B2 (ja
Inventor
透 清水
吉田 和永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59042320A priority Critical patent/JPS60186897A/ja
Publication of JPS60186897A publication Critical patent/JPS60186897A/ja
Publication of JPH0570160B2 publication Critical patent/JPH0570160B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明a被制御系の制御?実時間住良く、容易に制御で
さる音声人力1’cよる制御装置に関する。
ここで、制御される対象としてrI元生学機器オート7
オーカシング、オートズーミング、電気製品の調整つま
み、車両用パワーウィンド、ミラー等の駆動回路部分が
考えられる。
(従来技術) 近年、音声認識技術と′4=導体技術の進歩1’(Lj
Q、予め限定された複数の孤立単語全認識することので
きる小型の音声認識装置が開発されている。その応用と
して、特願昭56−16971.特願昭56−1697
2、特願昭56−16973.特願昭57−33587
 等の明細書に操作者の発声した命令音声l(対応した
動作(以下、命令音声動作と称する)4被制御系に指令
する信号(以下、命令音声動作イH号と称Tる)?出力
する音声入力による制御装置(以下、音声認識制御装置
と称する)が、車両用装置のパワーウィンド、カーラジ
オ等の制御に用いた実例?あけて示されている。
しかし、前記音声入力制御装置fCおいて、命令音声w
Jfll:信号全山力Tるのに、操作者の発声した命令
音声の始端と終端を検出し、その入力音声の特徴量と予
め記憶しである命令音声の特徴量との比較全行ない、そ
の相違が最も小さいもの?認識結果とする認識過程ケ経
た後である。従って、音声の終端検出と認識過程(要す
る時間のため、被制御機器が命令動作を開始するまでに
遅h、が生じざる得なかった0そのため実時間性が悪く
、操作者の望む任意の時刻に精度良く9作動及び停止1
行なうことができず、精密註會要する制御部に不適当で
あるといつ問題点があった0 (発明の目的) 本発明口、この工9な従来の問題点に層目してなされた
ものであり、命令音声の語尾ケ引き延ばして発声しく以
下、その工9九発声ケ1語尾引き延ばし音声と称丁/)
)、引き延は下前の音声区間の認識結果と、引き娯はさ
れた音声の終端検出時刻を用いることにLv、操作者に
任意の時刻で被制御系を制御でさる。実時間性の長い音
声入力装置全提供することを目的とする。
(発明の構成) 本発明vcよると語尾?引き延はした命令音声を入力す
る手段と、入力音声を分析する分析部と。
音声区間Ω検出と命令音声の引き延ばされた語尾と前半
部分全セグメンテーションする音声検出部と、セグメン
トされた意味情報を含んだ前半部分の音声の認識1行な
う認識部と、引き延ばされた語尾の終端検出時に認識結
果に対応(7た動作ケ被制御部に指令下る信号ケ出力す
る制御部?持つことを特徴とした音声入力による制御装
置が得られるO 丁lわち、不発明に入力音声を分析して、音声の定常部
と終端部?検出することIC,Uり語尾引き延ばし音声
の前の意味情報?含んだ区間(以下、意味区間と称する
0)と、語尾音引き延ばした区間(以下、語尾区間と称
するうとのセグメンテーション全行ない、意味区間の特
徴パラメータと、予め記憶している標準パターンとのマ
ツチ771行ない認識結果?得、この認識結果r(対応
した命令音声動作信号全発生(−1終端部検出時でオン
あるいaオフという操作全行なうようにしたもので6る
0 (発明の原理ン 先ず本発明の詳細な説明する0操作者に命令音声の語尾
音引き延ばした語尾引き延ばし音声ケ発声する。語尾区
間a、母音音引き延ばして発声しているので、音響的特
徴に定常となり、その定常性を一定時間以上検出した時
、その定常性の始まり時点で意味区間と語尾区間會セグ
メンテーションする。そして、意味区間の音声を認識し
、語尾区間の終端検出時に除令音声動作信号?出力する
○次九図を用いて、その操作例?3つ示す。第1図(5
)に語尾引@延ばし音声のパワーを示したもので、時間
t1〜t2の区間が意味区間、 t2〜t3の区間が語
尾区間である。第1の例口、第1図中)に示す工うK、
比較的短い期間被制御機系を作動させ、操作者の希望す
る時刻で停止させる場合で、動作信号8Brl意味区間
の音声を認識した後オン(Oへ)となり、語尾区間を検
出中rr(JNのま1で、音声の終端t3に至るとオフ
((JFF’)となる。第2の例a、第1図(e) r
c示す工う九、被制御系の動作t、精度良く操作者の希
望する時刻で作aさせる場合で、命令音声動作信号8C
D、音声の終端t3に至った時点で(JNとなる。第3
の例に、第1図(1)l IC示すLうに、被制御系の
動作音、精度良く操作者の希望する時刻で停止させる場
合で、命令音声動作信号SDQ、音声の終端t 3 r
c至った時点で(JFFとなるO 以上の方式?用いることl’(エフ、操作者a音声入力
【ニジ被制御系ケ希望する任意の時点で精度良く、作動
お裏び停止させることができる。
(実施例〉 以下、不発明の被制御系として小型カメラケ例に取り上
げ、オートフォーカシング、オートズーミング、オート
シャッター等の制御全行なう実施例全図面ケ参照して説
明する。
第2図a本発明の一実21i!1fll?示すブロック
図、第り表に、命令音声とカメラへの命令音声動作の対
応表、第3図に命令音声1テレ」と命令音声動作信号の
送信のタイムチャート図である〇第1表 操作者a第1表に対応した命令音声をマイクIOに発声
する0今、レンズケ望遠flIrc移動させたい場合を
1例として述べる。操作者にレンズを務勤させたい間、
マイクロtovc語尾引@延ばし音声1テレ〜」と発声
する。マイクtort前記命令音声紮驚気信号に変換し
、前処理部20へ送る。前処理部20でa%A/l)変
換、フ”リエンファゾス等を行ケい、音声信号を分析部
30へ送る。分析部30でに音声信号全帯域フィルタ群
で分析し、その結果であるパワースペクトル・パターン
?特徴パラメータとして音声検出部40へ送る。音声検
出部40でに音声のパワー?監視下ることにエリ、音声
の始端、終端?見つけ、第3図に示すよう終端検出時t
2に、終端検出信−IrjES會制御部60へ送る。更
にフレーム間の特徴パラメータの差分D =二la+ 
(t) al(t−11ただしa+(t)rr時刻ti
cおける1番目の特徴パラメータ?計算し、その値が一
定値IJh以下になった区間が一定時間Th以上続いた
場合、その始まりから語尾区間BE′″r:あるとして
、意味区間AEと語尾区間BEiセグメンテーションす
る0認識部50でa、時間RtQ間に意味区間AEの特
徴パラメータと標準パターンメモリ部70に予め記憶し
である命令音声の標準パターンの特徴パラメータとの相
違全DPマツチング法?用いてめ、相違の最小値の得ら
れた標準パターンの属する命令音声音認識結果として制
御部60へ送る。尚、DPマツチングに関してa、昭和
54年10月、共立出版ニジ出版され7tl音声認識」
の第107頁よV第108頁に記載されている。制御部
60でに、認識結果(対応した命令音声動fll:信号
8n紫、第1表に示したタイミングで、カメラの駆動回
路部80へ送る。
以上述べた認識動作口、命令音声[テレ−」に限らず、
他の命令音声(関しても、第1表と対応して丁べて同じ
である0かくして、レンズが希望の状態でなるまで語尾
引き延ばし音声を発声し、オートシャッター?切りたい
時1シヤツター」の語尾引き延ばし音声?発声し、発声
?止めた時点でシャッターが作動する音声入力制御装置
によるカメラが得られる。
以上、本発明を被制御系?カメラのレンズ駆動。
シャッタ等とした場合の実施例ycついて説明したが、
不発明0音声入力で操作者の希望する時刻でIM作作曲
開始停止させたいエリな場合、例えば、電気製品の調節
つまみ、パワーウィンド、ミラー。
カーラジオ等車両用装置等に有効である。
また、分析法rx 、 H,P、 F法に限らず、ケグ
ストラム、メルケプストラム、メルスベクトル、LPC
法、零交差分析法等、認識方法口、DP會用いたテング
レートマツチングに限らず、他の時間正規化マツチング
法、お工ひ、構文的識別法等ケ用いることができるのa
l明白である。なお、こわらの分析法、認識方法a、前
記l音声認識」の再99頁から第117頁に記載されて
いる。
(発明の効果) 本発明1c工わば、操作者の希望する任意の時点で、精
度よく@作を開始またに停止できる実時間性の良い音声
入力制御装置が得られる。こわにエリ、精密注紮要求さ
れる作業の制御VCおいても、音声入力?用いろ事が可
能となり、手作業による労力の軽減紮げかることができ
る。
【図面の簡単な説明】
第1図a本発明における語尾引き延ばし音声と。 命令音声動作信号のOへ、UFFのタイミングを示した
図、第2図a不発明の一実施例?示すブロック図、第3
図に、語尾引き延ばし音声の1例1テレ−」におけるセ
グメンテーションと、各信号のタイミングを示した図で
ある。 8B、8C,:3D−@令音声wJn信号、10°フイ
クロホン、20・・・前処理部、3o・・・分析部、4
゜・・・音声検出部、50・・・音声認識部、6o・・
・制御部、70・・・標準バタンメモリ部、8o・・・
カメラ駆動部、P・・・音声のパワー、tl・・・音声
の始端検出時刻、t2・・・音声の終端検出時刻、E8
・・・終端検出信号、Th・・・定常部検出用時間パラ
メータ、Dh・・・セグメンテーション用差分パラメー
タ、AE・・・意味区1’FJ] 、B B・・・語尾
区間、几t・・・認識に要する時間、sn・・・音声命
令動作信号 (8) t e r e 華 3 図 手続補正書(自発) 1.事件の表示 昭和59年 特許 願第042320
号2、発明の名称 音声入力にょる制御装置3、補正を
する者 事件との関係 出 願 人 東京都港区芝1i、J“1133計18(423) 日
本電気株式会社 代表者 関本忠弘 4、代理人 〒108 東卓都港区芝/i、1目37番8′iシー 
住友モ1[1とル −二二「L) 明細書の「特許請求の範囲」の欄。 6、補正の内容 「特許請求の範囲」の欄を、別紙のように補正する。 代理人 弁理士 内 原 晋 別紙 特許請求の範囲 語尾を引き延ばした命令音声を入力する手段と、入力音
声を分析する分析部と、音声区間の検出と命令音声の引
き延ばされた語尾と前半部分をセグメンテーションする
音声検出部と、セグメントされた意味情報を含んだ前半
部分の音声の認識を行なう認識部と、引き延ばされた語
尾の終端検出時に認識結果に対応した動作を被制御部に
指令する信号を出力する制御部を持つことを特徴とした
音声入力による制御装置。 、′+ 代理人 弁理士 内 原 晋

Claims (1)

  1. 【特許請求の範囲】 語尾音引き延ばした命令音声を入力する手段と。 入力音声を分析部と、音声区間の検出と命令音声の引き
    延ばされた語尾と前半部分?セグメンテーションする音
    声検出部と、セグメントされた意味情報ケ含んだ前半部
    分の音声の認識葡行なう認識部と、引き延ばされた語尾
    の終端検出時罠認識結果に対応したvEJ咋?被制御部
    に指令する11埼出力する制御部を持つことを特徴とし
    た音声入力VCよる制御装置。
JP59042320A 1984-03-06 1984-03-06 音声入力による制御装置 Granted JPS60186897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59042320A JPS60186897A (ja) 1984-03-06 1984-03-06 音声入力による制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59042320A JPS60186897A (ja) 1984-03-06 1984-03-06 音声入力による制御装置

Publications (2)

Publication Number Publication Date
JPS60186897A true JPS60186897A (ja) 1985-09-24
JPH0570160B2 JPH0570160B2 (ja) 1993-10-04

Family

ID=12632719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59042320A Granted JPS60186897A (ja) 1984-03-06 1984-03-06 音声入力による制御装置

Country Status (1)

Country Link
JP (1) JPS60186897A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005328963A (ja) * 2004-05-19 2005-12-02 Toshiba Corp 画像ビューワ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005328963A (ja) * 2004-05-19 2005-12-02 Toshiba Corp 画像ビューワ
JP4515818B2 (ja) * 2004-05-19 2010-08-04 株式会社東芝 画像ビューワ

Also Published As

Publication number Publication date
JPH0570160B2 (ja) 1993-10-04

Similar Documents

Publication Publication Date Title
US5970451A (en) Method for correcting frequently misrecognized words or command in speech application
EP1159735B1 (en) Voice recognition rejection scheme
JP3069531B2 (ja) 音声認識方法
JPS60186897A (ja) 音声入力による制御装置
JP2002215198A (ja) 声質変換装置および声質変換方法およびプログラム記憶媒体
US4790017A (en) Speech processing feature generation arrangement
JP3277579B2 (ja) 音声認識方法および装置
JPS59137999A (ja) 音声認識装置
Ananthakrishnan et al. Important regions in the articulator trajectory
JPS6370298A (ja) 促音認識装置
EP0519360B1 (de) Einrichtung und Verfahren zum Erkennen von Sprache
Leandro et al. Low cost speaker dependent isolated word speech preselection system using static phoneme pattern recognition.
Cosi Evidence against frame-based analysis techniques
JPH0642157B2 (ja) 話者適応化装置
JPS62255999A (ja) 単語音声認識装置
JPS59170894A (ja) 音声区間の切り出し方式
JPS61256397A (ja) 音声認識装置
JPS63279305A (ja) 音声制御装置
JPH0311478B2 (ja)
Shimotani et al. A voice recognizer for car telephone system
JPS607492A (ja) 単音節音声認識方式
JPH0449716B2 (ja)
JPS6027000A (ja) パタンマツチング方法
JPH0558556B2 (ja)
JPH03149598A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees