JPS62157938A - 音声によるカ−ソル位置制御方式 - Google Patents
音声によるカ−ソル位置制御方式Info
- Publication number
- JPS62157938A JPS62157938A JP60299340A JP29934085A JPS62157938A JP S62157938 A JPS62157938 A JP S62157938A JP 60299340 A JP60299340 A JP 60299340A JP 29934085 A JP29934085 A JP 29934085A JP S62157938 A JPS62157938 A JP S62157938A
- Authority
- JP
- Japan
- Prior art keywords
- cursor
- voice
- cursor position
- vowels
- formant frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Digital Computer Display Output (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
人間が発声した母音をカーソル位置に対応づけることに
より、カーソル位置制御を容易にする。
より、カーソル位置制御を容易にする。
本発明は、ディスプレイ装置のカーソル位置制御方式に
関するものであり、特に音声を用いたカーソル位置制御
方式に関するものである。
関するものであり、特に音声を用いたカーソル位置制御
方式に関するものである。
従来、ディスプレイ−ヒのカーソル位置を指定(制御)
する方式として、キーホード上の特殊キー。
する方式として、キーホード上の特殊キー。
マウス、トラックポール等が用いられていた。これらの
方式を、キーボードと併用する場合2 (文字入力はキ
ーホードから、カーソル制御は特殊;1−一、マウス、
トラックボール等で行う場合)、キーボード上の手をボ
ームポジション(ブラインド“タッチ−めくら打ち−す
るときの手の標準位置)からはずさなければならない。
方式を、キーボードと併用する場合2 (文字入力はキ
ーホードから、カーソル制御は特殊;1−一、マウス、
トラックボール等で行う場合)、キーボード上の手をボ
ームポジション(ブラインド“タッチ−めくら打ち−す
るときの手の標準位置)からはずさなければならない。
このため9手をホームポジションに戻すときに目線をキ
ーボードに向けなければならす5■目線を原稿やディス
プレイに集中できないという不便さ、0手をボームポジ
ションに戻すのに時間がかかるという2つの欠点があっ
た。
ーボードに向けなければならす5■目線を原稿やディス
プレイに集中できないという不便さ、0手をボームポジ
ションに戻すのに時間がかかるという2つの欠点があっ
た。
これらの欠点に対処する方法として、音声によってカー
ソル位置を制御することが丸えられる。
ソル位置を制御することが丸えられる。
音声によってカーソル位置を制御すれば2手をキーボー
ド−1−のホームポジションに置いたままで仕事ができ
、目線は原稿とディスプレイに集中することができる。
ド−1−のホームポジションに置いたままで仕事ができ
、目線は原稿とディスプレイに集中することができる。
音声でカーソルを制御する方式として、■音声認識装置
を用いる方法、■声の大きさく強さ)をカーソル位置に
対応づける方法の2つが容易に考えられる。
を用いる方法、■声の大きさく強さ)をカーソル位置に
対応づける方法の2つが容易に考えられる。
しかし、■では、カーソルを何社ふんか上に移動する場
合、「上、上、上、・・・・・・上」と音声で指令する
のはやっかいである。また、「上」と発声するとカーソ
ルが上に動きはじめ、適当な位置に来たときに「止まれ
」というのも使いにくい。「6行・上」と発声するよう
にすると2行数を前取て数えなければならないので使い
にくい。
合、「上、上、上、・・・・・・上」と音声で指令する
のはやっかいである。また、「上」と発声するとカーソ
ルが上に動きはじめ、適当な位置に来たときに「止まれ
」というのも使いにくい。「6行・上」と発声するよう
にすると2行数を前取て数えなければならないので使い
にくい。
そこで、■の方法が考えられる。これは、第12図に例
示されるように、たとえば「ア〜」という発声を用い、
大きな声を出すとカーソルが画面の下方に位置づけられ
、中位の大きさの声では画面中央、小さな声では画面の
上方に位置づけられるようにする方法である。しかし、
この方法では。
示されるように、たとえば「ア〜」という発声を用い、
大きな声を出すとカーソルが画面の下方に位置づけられ
、中位の大きさの声では画面中央、小さな声では画面の
上方に位置づけられるようにする方法である。しかし、
この方法では。
時によって大声を出さねばならない点、カーソル位置が
適当な位置に来たとき、何らかのキー人力を行う必要が
ある点の2つの欠点がある。すなわち2発声をやめると
常にカーソルが画面の」1方に行ってしまう。
適当な位置に来たとき、何らかのキー人力を行う必要が
ある点の2つの欠点がある。すなわち2発声をやめると
常にカーソルが画面の」1方に行ってしまう。
また、第3の方法として、声の高さくピ・7チ。
音階)によってカーソル位置を制御する方法も考えられ
るが、使いやすい方法とは言えない(声の高さをスムー
スに変化させることは容易でないし1高い声を出すのは
楽でない)。
るが、使いやすい方法とは言えない(声の高さをスムー
スに変化させることは容易でないし1高い声を出すのは
楽でない)。
最近、音声入力は、キーボードと併用あるいは代替する
形でまずます利用が高まる傾向にあるが。
形でまずます利用が高まる傾向にあるが。
ディスプレイ装置のカーソル位置制御手段としては、従
来、必ずしも有効に機能させることができなかった。こ
のため、音声入力手段を改良し、カーソル位置を確実容
易に制御できる実用的な方法を開発する必要があった。
来、必ずしも有効に機能させることができなかった。こ
のため、音声入力手段を改良し、カーソル位置を確実容
易に制御できる実用的な方法を開発する必要があった。
本発明は、音声の[大きさ1や[高さ1以外の。
もっと容易に制御できる音声の属性を利用してカーソル
位置制御を行う手段を提供するものであり。
位置制御を行う手段を提供するものであり。
具体約6こは2人間の発声する母音の種類(ア、イ。
つ、工、オ)とカーソル位置を対応づけることによって
カーソル制御を行うものである。母音の発声し分IJは
人間が日常行っていることであるので。
カーソル制御を行うものである。母音の発声し分IJは
人間が日常行っていることであるので。
極めて容易であり、しかも、声の1大きさ−1はカーソ
ル位置に関係しないため1発声を終えることによってカ
ーソル位置を固定でき、特別なキー人力を不要にするこ
とができる。
ル位置に関係しないため1発声を終えることによってカ
ーソル位置を固定でき、特別なキー人力を不要にするこ
とができる。
第1図に1本発明の原理的構成を示す。
図において、1は音声入力部、2ばフォルマント分析部
、3はカーソル制御部、4はCI)U、5はディスプレ
イ装置である。
、3はカーソル制御部、4はCI)U、5はディスプレ
イ装置である。
音声入力部1は、装置利用者が発声した音声を入力し、
音声信号について増幅、フィルタ処理。
音声信号について増幅、フィルタ処理。
A/[]変換等のii1処理を行う。
フォルマント分析部2は、入力された音声信号について
周波数解析を行い、その中からIυ、音のフォルマン1
−周波数を抽出する。
周波数解析を行い、その中からIυ、音のフォルマン1
−周波数を抽出する。
カーソル制御部3は、抽出されたフォルマント周波数が
予め定めされたフメルマンl−Ji+波数と一致すると
き、それを対応するカーソル位置情報6.r変換し、C
P[J、iに指示する。
予め定めされたフメルマンl−Ji+波数と一致すると
き、それを対応するカーソル位置情報6.r変換し、C
P[J、iに指示する。
(’、 )) LJ 4は、す、えられたカーソル制御
信号にしたがって、カーツルア11/スの変更制御を行
う。
信号にしたがって、カーツルア11/スの変更制御を行
う。
ディスプレイ装置5は、変更されたカーソル了トレスに
基づいてカーソル表示を行う。
基づいてカーソル表示を行う。
母音として、イ、工、ア、オ、つおよびその中間の母音
から適当なものを複数個iπび、それらの各母音をカー
ソルの移動指示情報として使用する。
から適当なものを複数個iπび、それらの各母音をカー
ソルの移動指示情報として使用する。
そして入力された母音から第1フォルマント周波数、ま
たは第1と第2のフォルマント周波数を抽出し、これら
が1υ音の種別によ〃)異なることを利用して、指示さ
れた」1下左右の(T意のイ☆置ヘカーソル移動を行わ
せる。
たは第1と第2のフォルマント周波数を抽出し、これら
が1υ音の種別によ〃)異なることを利用して、指示さ
れた」1下左右の(T意のイ☆置ヘカーソル移動を行わ
せる。
入力音声信号のl/ヘルを監視し、 nL音のし・\ル
が所定のしきい値以上のときカーソル移動を可能とし、
しきい値以下のときは現在のカーソル位置を保持させる
。
が所定のしきい値以上のときカーソル移動を可能とし、
しきい値以下のときは現在のカーソル位置を保持させる
。
第2図に、イ〜工〜ア〜オ〜つの母音を用いた縦方向の
カーソル位置制御の例を示す。なお、記号パ〜”は、そ
の前後の母音の中間の母音を表す。
カーソル位置制御の例を示す。なお、記号パ〜”は、そ
の前後の母音の中間の母音を表す。
この例では、母音イ、工、ア、第5 ウの各々に。
画面1−の異なる縦(行)アドレスが対応づけられてお
り、これらの中のある1つの母音を発声し。
り、これらの中のある1つの母音を発声し。
入力することにより、カーソルは、その母音に指定され
た縦位置に移動される。
た縦位置に移動される。
第3図に本発明の第1の実施例の構成を示す。
この実施例では2人間の発声する母音のうち。
「ア」、「オ」、「つ」とそれらの間をなめらかに変化
する部分[ア〜オ〜ウ−1を用いる。また人間の音声を
特徴づけるパラメータとして第]フォルマント周波数(
Fl)を用いる。
する部分[ア〜オ〜ウ−1を用いる。また人間の音声を
特徴づけるパラメータとして第]フォルマント周波数(
Fl)を用いる。
第1フォルマント周波数(Fl)は人間の音声を周波数
分析しC得られるヘクトルの]KI(z以下の部分にあ
られれるピークのrffl波数である。第4図にその1
例をボす。
分析しC得られるヘクトルの]KI(z以下の部分にあ
られれるピークのrffl波数である。第4図にその1
例をボす。
LJ音[ア1.「オー1,1−)」の第1フォルマント
周波数は1男性の場合、[アl (0,7Kllz)
−” rオー1 ((1,5KHz)−→Iつ」(
0,3Ktb)のように変化し。
周波数は1男性の場合、[アl (0,7Kllz)
−” rオー1 ((1,5KHz)−→Iつ」(
0,3Ktb)のように変化し。
女性の場合、[ア−1(0,9KHz)−” [オJ
(0,5Kllz)−+[つj (0,4KHz)のよ
うに変化するく個人差もある)。本実施例では、この第
1フAルマント周波数(Fl)とカーソル位置を対応づ
けようとするものである。
(0,5Kllz)−+[つj (0,4KHz)のよ
うに変化するく個人差もある)。本実施例では、この第
1フAルマント周波数(Fl)とカーソル位置を対応づ
けようとするものである。
第3図において、1は音声入力部、2ばフォルマン1へ
分析部、3ばカーソル制御部、4はCI) LJ 。
分析部、3ばカーソル制御部、4はCI) LJ 。
5ばディスプレイ装置、11はローパスフィルタL P
F、 12はΔ/I)変換器、21は周波数解析器
FFT、22は第1フォルマント周波数d1算部。
F、 12はΔ/I)変換器、21は周波数解析器
FFT、22は第1フォルマント周波数d1算部。
31 i;を学習・判定部、32はパワー計算部を表す
。
。
ローパスフィルタL l) F 11 u;I:、
8声のl K llZ以下の成分を取り出すものである
。
8声のl K llZ以下の成分を取り出すものである
。
A / D変換器12は、音声信号をディジタル量に変
換するもので、 IKHzまでの帯域の音声信号を扱
う場合、サンプリング周波数は2KHz程度となる。
換するもので、 IKHzまでの帯域の音声信号を扱
う場合、サンプリング周波数は2KHz程度となる。
周波数解析部FFT21は、A/D変換器12の出力(
X(t)、tは時間)を周波数分析するもので、数学的
に、 P(j) = l FFT (X(t) )
l 。
X(t)、tは時間)を周波数分析するもので、数学的
に、 P(j) = l FFT (X(t) )
l 。
j=1〜N/2.t=1〜Nで表される。ここでNはF
FTのポイント数と呼ばれるもので9例えばN=256
とする。つまりA/D変換器12の出力がN点そろうご
とにFFT計算をくりがえす。
FTのポイント数と呼ばれるもので9例えばN=256
とする。つまりA/D変換器12の出力がN点そろうご
とにFFT計算をくりがえす。
1回の計算でN/2ポイントのスペクトル(パワースペ
クトル、 P(j) )が求まる。
クトル、 P(j) )が求まる。
第1フォルマント周波数計算部22は、 P(j)。
j=1〜N/2の中から最大値P (J)を求め、最大
値を与えるjの値(J)を出力する(もしP(j)+
j = 1〜128のうちP(7)が最大値であれば7
を出力する。
値を与えるjの値(J)を出力する(もしP(j)+
j = 1〜128のうちP(7)が最大値であれば7
を出力する。
学習・判定部31は9発声者の個性を考慮しながら、第
1フォルマント周波数計算部22の出力を、 1.
2. 3.・・・・・・、L(Lはディスプレイの表示
行数、つまり、カーソルの位置が何通りあるかを示す数
2例えば25)に量子化するものである。具体的には1
本装置使用者に「ア」を発声させ、その時の第1フォル
マント周波数計算部22の出力をFlmaxとし5次に
[ウ−1を発灼さ−U。
1フォルマント周波数計算部22の出力を、 1.
2. 3.・・・・・・、L(Lはディスプレイの表示
行数、つまり、カーソルの位置が何通りあるかを示す数
2例えば25)に量子化するものである。具体的には1
本装置使用者に「ア」を発声させ、その時の第1フォル
マント周波数計算部22の出力をFlmaxとし5次に
[ウ−1を発灼さ−U。
その時の第1フォルマント周波数計算部22の出力をF
lminとする。そして、カーソル制御時の発声に対す
る第1フォルマント周波数計算部22の出力をFlとし
、 C−(F 1−F 1m1n ) / (F 1m
ax −F lm1n ) Xl−によってカーソル位
置Cを計算する。
lminとする。そして、カーソル制御時の発声に対す
る第1フォルマント周波数計算部22の出力をFlとし
、 C−(F 1−F 1m1n ) / (F 1m
ax −F lm1n ) Xl−によってカーソル位
置Cを計算する。
パワー計算部32は2周波数解析部F F T 21と
同じ入力信号を受けて、そのパワーをpw−Σ(x”(
tN 、t=1〜Nによって計算する。そしてこのイ直
がしきいイ直(TH)を超えた時に “l゛。
同じ入力信号を受けて、そのパワーをpw−Σ(x”(
tN 、t=1〜Nによって計算する。そしてこのイ直
がしきいイ直(TH)を超えた時に “l゛。
しきい値以下のときに “0′ となる1ビツトの信号
を出力する。
を出力する。
CPU4は2時々刻々、学習・判定部31の出力を人力
し、ディスプレイにカーソルを表示するためのもので、
パワー計算部32の出力が1゛のときにカーソルの移動
を行い、 “0゛のときにはカーソルの位置を固定する
。
し、ディスプレイにカーソルを表示するためのもので、
パワー計算部32の出力が1゛のときにカーソルの移動
を行い、 “0゛のときにはカーソルの位置を固定する
。
第5図に本発明の第2の実施例の構成を示す。
この例では1人間の発声する母音のうち、「イ」、「工
」、「ア」、「オ」、「つ」と、それらの間を滑らかに
変化する部分[イ〜工〜ア〜オ〜つ」を用いる。人間の
音声を特徴づけるパラメータには、第1フオルマン)(
Fl)以外に、第2フォルマント周波数(F2)がある
。これは、第6図に例示するように1人間の音声を周波
数分析して得られるスペクトルのIKHz〜3KHzの
部分にあられれるピークの周波数である。FlとF2を
2次元表示すると第7図のようになる。
」、「ア」、「オ」、「つ」と、それらの間を滑らかに
変化する部分[イ〜工〜ア〜オ〜つ」を用いる。人間の
音声を特徴づけるパラメータには、第1フオルマン)(
Fl)以外に、第2フォルマント周波数(F2)がある
。これは、第6図に例示するように1人間の音声を周波
数分析して得られるスペクトルのIKHz〜3KHzの
部分にあられれるピークの周波数である。FlとF2を
2次元表示すると第7図のようになる。
本実施例では、第8図に示すように、これらの「イ」、
「工」、「ア」、「オ」、「つ」の中心(0)を決定し
、その垂線(OR)と「0と母音の特徴点を結んだ線分
」とのなす角度(θ)をパラメータとし、これとカーソ
ル位置を対応づけようとするものである。
「工」、「ア」、「オ」、「つ」の中心(0)を決定し
、その垂線(OR)と「0と母音の特徴点を結んだ線分
」とのなす角度(θ)をパラメータとし、これとカーソ
ル位置を対応づけようとするものである。
第5図において9点線ブロックの要素は第3図の第1の
実施例の要素と同様の機能をもつものであり、実線ブロ
ックの要素が本実施例において付加あるいは変形された
要素である。すなわち、23は第2フオルマント計算部
、31′は学習・判定部である。
実施例の要素と同様の機能をもつものであり、実線ブロ
ックの要素が本実施例において付加あるいは変形された
要素である。すなわち、23は第2フオルマント計算部
、31′は学習・判定部である。
この実施例では3KHzまでの帯域を扱うため。
ローパスフィルタLPFIIのカットオフ周波数は3K
Hz、A/D変換器12のサンプリング周波数は6 K
Hzとする。
Hz、A/D変換器12のサンプリング周波数は6 K
Hzとする。
第1フォルマント周波数計算部22は周波数解析器FF
T21の出力のうち、0−IKH2の部分についてのピ
ークを検出して、その周波数を出力する。
T21の出力のうち、0−IKH2の部分についてのピ
ークを検出して、その周波数を出力する。
第2フォルマント周波数計算部23は、lKH2〜3K
Hzの部分について同様の計算を行う。
Hzの部分について同様の計算を行う。
学習・判定部31′は、装置利用者かはしめに学習用に
発声した「イ〜工〜ア〜オ〜つ」に対し。
発声した「イ〜工〜ア〜オ〜つ」に対し。
Flのmax、 min、そしてF2のmaに、 m
inを計算し、第1フォルマント周波数の中心F10=
(F 1max +F 1m1n ) /2.第2フォ
ルマント周波数の中心F20− (F 2max 4−
F 2m1n > / 2によってFIOとF20を
決定する。次に、再び。
inを計算し、第1フォルマント周波数の中心F10=
(F 1max +F 1m1n ) /2.第2フォ
ルマント周波数の中心F20− (F 2max 4−
F 2m1n > / 2によってFIOとF20を
決定する。次に、再び。
装置利用者が学習用に発声した[イ〜工〜ア〜オ〜ウ−
1に対し。
1に対し。
θ= arcl、an (−x / y )y =F1
−FIO x = F 20−F 2 を計算し、θのmax、 minを計算する。
−FIO x = F 20−F 2 を計算し、θのmax、 minを計算する。
以後は、実連用にはいり、カーソル位置Cについて。
C=−(θ−θmin ) / (θmax −
8m1n)XLにより計算し、Cを出力する。Lはディ
スプレイの表示可能行数である。
8m1n)XLにより計算し、Cを出力する。Lはディ
スプレイの表示可能行数である。
第9図に本発明の第3の実施例の構成を示す。
本実施例は第1と第2の改良し7たものである。
第9図は第2の実施例の構成を示す第5図Qこもとづい
ているが2本実施例に特徴的な部分は実線ブロックで示
し、第5図と同様の機能の部分は点線ブロックで示して
いる。すなわち2本実施例の特徴的部分は、24の低域
重心計算部と25の高域重心計算部にある。これらBa
t第5図の第1フメルマント周波数旧算部22と第2フ
ォルマント周波数計算部23におきかわるものである。
ているが2本実施例に特徴的な部分は実線ブロックで示
し、第5図と同様の機能の部分は点線ブロックで示して
いる。すなわち2本実施例の特徴的部分は、24の低域
重心計算部と25の高域重心計算部にある。これらBa
t第5図の第1フメルマント周波数旧算部22と第2フ
ォルマント周波数計算部23におきかわるものである。
第5図の第1フAルマンl−周波数旧算部22と第2フ
ォルマント周波数計算部23は同様の機能を持っている
が、第1フォルマント周波数計算部22を例にとっ”0
第2の実施例におけるその欠点を説明する。
ォルマント周波数計算部23は同様の機能を持っている
が、第1フォルマント周波数計算部22を例にとっ”0
第2の実施例におけるその欠点を説明する。
第10図に2周波数解析器F T? T 21の出力の
うち、IKHz以下の部分を示す。このように。
うち、IKHz以下の部分を示す。このように。
F F T 21の出力は、音声に含まれる基本周波数
の影響を受け、デコボコしており、ピークを1える周波
数を哨純に決定したものでば■がフォルマント周波数と
判断されてしまう (実際は■)。
の影響を受け、デコボコしており、ピークを1える周波
数を哨純に決定したものでば■がフォルマント周波数と
判断されてしまう (実際は■)。
また、デニ1ボコを取り去るために、スペクトルを平滑
化することも考えられる。例えば、 I)(j)’=
((P(j) 十P(j−1)+P(j N))/
3のような式を用いて平滑化することが可能であるが、
その場合でも、第11図のような例が起こり、求めたい
■のかわりに■がフォルマント周波数として出力されて
しま・う。
化することも考えられる。例えば、 I)(j)’=
((P(j) 十P(j−1)+P(j N))/
3のような式を用いて平滑化することが可能であるが、
その場合でも、第11図のような例が起こり、求めたい
■のかわりに■がフォルマント周波数として出力されて
しま・う。
音声によるカーソル制御では、フォルマント周波数抽出
精度はあまり重要ではないが「ア〜」と連続的に発声し
ても1発声のゆらぎによって第10図や第11図の■と
■が交互にピークとして検出され、検出されるフォルマ
ント周波数の値が不安定にゆれ動くことになる。この不
安定さはカーソル制御に障害となる。
精度はあまり重要ではないが「ア〜」と連続的に発声し
ても1発声のゆらぎによって第10図や第11図の■と
■が交互にピークとして検出され、検出されるフォルマ
ント周波数の値が不安定にゆれ動くことになる。この不
安定さはカーソル制御に障害となる。
このため、第9図に示す第3の実施例では、フォルマン
ト周波数をピーク検出によって求めることによる不安定
さを1重心を求めることによって回避している。すなわ
ち。
ト周波数をピーク検出によって求めることによる不安定
さを1重心を求めることによって回避している。すなわ
ち。
F=(Σ(P(i) x l) ) /ΣP(+)によ
ってフォルマント周波数を決定する。重心によってフォ
ルマント周波数を決定すれば、第10図や第11図の場
合の■や■のどちらかが微妙に高いかということには大
きく影響されないので。
ってフォルマント周波数を決定する。重心によってフォ
ルマント周波数を決定すれば、第10図や第11図の場
合の■や■のどちらかが微妙に高いかということには大
きく影響されないので。
安定した結果が得られる。つまり、連続的に同じ母音を
発声している時にゆらぎによってフォルマント周波数計
算結果が大きく変動することがない。
発声している時にゆらぎによってフォルマント周波数計
算結果が大きく変動することがない。
本発明によれば3人間の制御し2やすい母音の種類([
イ、工、ア、オ、つ1)とカーソル召))置を対応づけ
ることによってカーソル制御を行・)ので。
イ、工、ア、オ、つ1)とカーソル召))置を対応づけ
ることによってカーソル制御を行・)ので。
人間にとって快適に、しかも2両手をキーボードのホー
ムポジションに置いたままカーソルの制御を行うことが
できる。
ムポジションに置いたままカーソルの制御を行うことが
できる。
第1図は本発明の原理的構成図、第2図は本発明による
動作例の説明図、第3図は本発明の第1の実施例の構成
図、第4図は第1フオルマン[・周波数の1例を示す図
、第5図は本発明の第2の実施例の構成図、第6図は第
1および第2フォルマント周波数の1例を示す図、第7
図はFlおよびF2の2次元表示の1例を示す図、第8
図はFlおよびF2に基づく]変量(θ)の例を示す図
。 第9図は本発明の第3の実施例の構成図、第10図およ
び第11図はそれぞれフォルマント周波数が不安定な例
(その1)および(その2)を示す図、第12図は従来
の音声によるカーソル制御例の説明図である。 第1図中。 1:音声入力部 2:フォルマント分析部 3:カーソル制御部 4 : CPU 5:ディスプレイ装置
動作例の説明図、第3図は本発明の第1の実施例の構成
図、第4図は第1フオルマン[・周波数の1例を示す図
、第5図は本発明の第2の実施例の構成図、第6図は第
1および第2フォルマント周波数の1例を示す図、第7
図はFlおよびF2の2次元表示の1例を示す図、第8
図はFlおよびF2に基づく]変量(θ)の例を示す図
。 第9図は本発明の第3の実施例の構成図、第10図およ
び第11図はそれぞれフォルマント周波数が不安定な例
(その1)および(その2)を示す図、第12図は従来
の音声によるカーソル制御例の説明図である。 第1図中。 1:音声入力部 2:フォルマント分析部 3:カーソル制御部 4 : CPU 5:ディスプレイ装置
Claims (7)
- (1)カーソル機能を有するディスプレイ装置において
、音声入力部(1)と、 上記音声入力部(1)に入力された音声から母音のフォ
ルマント周波数を抽出するフォルマント分析部(2)と
、抽出されたフォルマント周波数を特定のカーソル位置
に対応づけるカーソル制御部(3)とをそなえ、 所定の適当な母音を発声して音声入力部(1)から入力
することにより、そのフォルマント周波数に基づいてカ
ーソルを所望の位置に移動させることを特徴とする音声
によるカーソル位置制御方式。 - (2)特許請求の範囲第1項において、母音として「ア
」、「オ」、「ウ」または「ア」、「エ」、「イ」とそ
れらの中間に位置する母音を用いるとともに、それぞれ
の母音の第1フォルマント周波数をカーソル位置に対応
づけることを特徴とする音声によるカーソル位置制御方
式。 - (3)特許請求の範囲第1項において、母音として「イ
」、「エ」、「ア」、「オ」、「ウ」とそれらの中間に
位置する母音を用いるとともに、それぞれの母音の第1
フォルマント周波数および第2フォルマント周波数から
導かれる1変量をカーソル位置に対応づけることを特徴
とする音声によるカーソル位置制御方式。 - (4)特許請求の範囲第1項において、第1フォルマン
ト周波数と第2フォルマント周波数を1変量に変換する
方法として、第1フォルマント周波数と第2フォルマン
ト周波数の2軸による座標系上に各母音を配し、その中
心点と母音とを結ぶベクトルの方向を変量とする方法を
用いることを特徴とする音声によるカーソル位置制御方
式。 - (5)特許請求の範囲第1項において、発声された音、
音声の強さがしきい値以上のときはカーソル位置を移動
させ、しきい値以下になったときは直前のカーソル位置
を固定させることを特徴とする音声によるカーソル位置
制御方式。 - (6)特許請求の範囲第1項において、音声のスペクト
ルのピークを与える周波数としてフォルマント周波数を
抽出することを特徴とする音声によるカーソル位置制御
方式。 - (7)特許請求の範囲第1項において、音声のスペクト
ルの重心としてフォルマント周波数を抽出することを特
徴とする音声によるカーソル位置制御方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60299340A JPS62157938A (ja) | 1985-12-28 | 1985-12-28 | 音声によるカ−ソル位置制御方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60299340A JPS62157938A (ja) | 1985-12-28 | 1985-12-28 | 音声によるカ−ソル位置制御方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62157938A true JPS62157938A (ja) | 1987-07-13 |
Family
ID=17871285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60299340A Pending JPS62157938A (ja) | 1985-12-28 | 1985-12-28 | 音声によるカ−ソル位置制御方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62157938A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06342365A (ja) * | 1990-12-26 | 1994-12-13 | Internatl Business Mach Corp <Ibm> | 線型音声制御方法及び装置 |
US7286991B2 (en) | 2002-05-30 | 2007-10-23 | International Business Machines Corporation | Computer, display control device, pointer position control method, and program |
JP2009258366A (ja) * | 2008-04-16 | 2009-11-05 | Arcadia:Kk | 音声制御装置 |
US7921364B2 (en) | 2005-11-03 | 2011-04-05 | Nuance Communications, Inc. | Controlling a computer user interface with sound |
-
1985
- 1985-12-28 JP JP60299340A patent/JPS62157938A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06342365A (ja) * | 1990-12-26 | 1994-12-13 | Internatl Business Mach Corp <Ibm> | 線型音声制御方法及び装置 |
US7286991B2 (en) | 2002-05-30 | 2007-10-23 | International Business Machines Corporation | Computer, display control device, pointer position control method, and program |
US7870002B2 (en) | 2002-05-30 | 2011-01-11 | Nuance Communications, Inc. | Computer, display control device, pointer position control method, and program |
US7921364B2 (en) | 2005-11-03 | 2011-04-05 | Nuance Communications, Inc. | Controlling a computer user interface with sound |
JP2009258366A (ja) * | 2008-04-16 | 2009-11-05 | Arcadia:Kk | 音声制御装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1635327B1 (en) | Information transmission device | |
KR100547533B1 (ko) | 음성 인식 장치 및 음성 인식 방법 | |
JP4587854B2 (ja) | 感情解析装置、感情解析プログラム、プログラム格納媒体 | |
JP4906776B2 (ja) | 音声制御装置 | |
JP2005227512A (ja) | 音信号処理方法及びその装置、音声認識装置並びにプログラム | |
JPS62157938A (ja) | 音声によるカ−ソル位置制御方式 | |
JP2003163951A (ja) | 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法 | |
JPS6126677B2 (ja) | ||
Kaur | Mouse movement using speech and non-speech characteristics of human voice | |
JPS58181099A (ja) | 音声識別装置 | |
JP4760179B2 (ja) | 音声特徴量算出装置およびプログラム | |
JPH024920B2 (ja) | ||
JPH07168520A (ja) | 学習習熟度判別装置付き語学用教育装置 | |
KR20190123120A (ko) | 홀로그램 스피커 | |
JPS61137199A (ja) | 単語音声の認識方法 | |
JP2012220607A (ja) | 音認識方法及び装置 | |
JPS6126678B2 (ja) | ||
Suk et al. | Voice/non-voice classification using reliable fundamental frequency estimator for voice activated powered wheelchair control | |
Kim et al. | Emotion interactive robot focus on speaker independently emotion recognition | |
JP2017068153A (ja) | 半導体装置、システム、電子機器、及び、音声認識方法 | |
Suk et al. | Voice activated powered wheelchair with non-voice rejection algorithm | |
Abass et al. | Speech recognition based Microcontroller for Wheelchair movement | |
Kinsner et al. | A speech recognition system using linear predictive coding and dynamic time warping | |
Resnikoff et al. | Linguistic segmentation of acoustic speech waveforms | |
Shahin | Enhancing speaker identification performance using circular hidden Markov model |