JPS62157938A - 音声によるカ−ソル位置制御方式 - Google Patents

音声によるカ−ソル位置制御方式

Info

Publication number
JPS62157938A
JPS62157938A JP60299340A JP29934085A JPS62157938A JP S62157938 A JPS62157938 A JP S62157938A JP 60299340 A JP60299340 A JP 60299340A JP 29934085 A JP29934085 A JP 29934085A JP S62157938 A JPS62157938 A JP S62157938A
Authority
JP
Japan
Prior art keywords
cursor
voice
cursor position
vowels
formant frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60299340A
Other languages
English (en)
Inventor
Yasuhiro Nara
奈良 泰弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60299340A priority Critical patent/JPS62157938A/ja
Publication of JPS62157938A publication Critical patent/JPS62157938A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Digital Computer Display Output (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 人間が発声した母音をカーソル位置に対応づけることに
より、カーソル位置制御を容易にする。
〔産業上の利用分野〕
本発明は、ディスプレイ装置のカーソル位置制御方式に
関するものであり、特に音声を用いたカーソル位置制御
方式に関するものである。
〔従来の技術〕
従来、ディスプレイ−ヒのカーソル位置を指定(制御)
する方式として、キーホード上の特殊キー。
マウス、トラックポール等が用いられていた。これらの
方式を、キーボードと併用する場合2 (文字入力はキ
ーホードから、カーソル制御は特殊;1−一、マウス、
トラックボール等で行う場合)、キーボード上の手をボ
ームポジション(ブラインド“タッチ−めくら打ち−す
るときの手の標準位置)からはずさなければならない。
このため9手をホームポジションに戻すときに目線をキ
ーボードに向けなければならす5■目線を原稿やディス
プレイに集中できないという不便さ、0手をボームポジ
ションに戻すのに時間がかかるという2つの欠点があっ
た。
これらの欠点に対処する方法として、音声によってカー
ソル位置を制御することが丸えられる。
音声によってカーソル位置を制御すれば2手をキーボー
ド−1−のホームポジションに置いたままで仕事ができ
、目線は原稿とディスプレイに集中することができる。
音声でカーソルを制御する方式として、■音声認識装置
を用いる方法、■声の大きさく強さ)をカーソル位置に
対応づける方法の2つが容易に考えられる。
しかし、■では、カーソルを何社ふんか上に移動する場
合、「上、上、上、・・・・・・上」と音声で指令する
のはやっかいである。また、「上」と発声するとカーソ
ルが上に動きはじめ、適当な位置に来たときに「止まれ
」というのも使いにくい。「6行・上」と発声するよう
にすると2行数を前取て数えなければならないので使い
にくい。
そこで、■の方法が考えられる。これは、第12図に例
示されるように、たとえば「ア〜」という発声を用い、
大きな声を出すとカーソルが画面の下方に位置づけられ
、中位の大きさの声では画面中央、小さな声では画面の
上方に位置づけられるようにする方法である。しかし、
この方法では。
時によって大声を出さねばならない点、カーソル位置が
適当な位置に来たとき、何らかのキー人力を行う必要が
ある点の2つの欠点がある。すなわち2発声をやめると
常にカーソルが画面の」1方に行ってしまう。
また、第3の方法として、声の高さくピ・7チ。
音階)によってカーソル位置を制御する方法も考えられ
るが、使いやすい方法とは言えない(声の高さをスムー
スに変化させることは容易でないし1高い声を出すのは
楽でない)。
〔発明が解決しようとする問題点〕
最近、音声入力は、キーボードと併用あるいは代替する
形でまずます利用が高まる傾向にあるが。
ディスプレイ装置のカーソル位置制御手段としては、従
来、必ずしも有効に機能させることができなかった。こ
のため、音声入力手段を改良し、カーソル位置を確実容
易に制御できる実用的な方法を開発する必要があった。
〔問題点を解決するだめの手段〕
本発明は、音声の[大きさ1や[高さ1以外の。
もっと容易に制御できる音声の属性を利用してカーソル
位置制御を行う手段を提供するものであり。
具体約6こは2人間の発声する母音の種類(ア、イ。
つ、工、オ)とカーソル位置を対応づけることによって
カーソル制御を行うものである。母音の発声し分IJは
人間が日常行っていることであるので。
極めて容易であり、しかも、声の1大きさ−1はカーソ
ル位置に関係しないため1発声を終えることによってカ
ーソル位置を固定でき、特別なキー人力を不要にするこ
とができる。
第1図に1本発明の原理的構成を示す。
図において、1は音声入力部、2ばフォルマント分析部
、3はカーソル制御部、4はCI)U、5はディスプレ
イ装置である。
音声入力部1は、装置利用者が発声した音声を入力し、
音声信号について増幅、フィルタ処理。
A/[]変換等のii1処理を行う。
フォルマント分析部2は、入力された音声信号について
周波数解析を行い、その中からIυ、音のフォルマン1
−周波数を抽出する。
カーソル制御部3は、抽出されたフォルマント周波数が
予め定めされたフメルマンl−Ji+波数と一致すると
き、それを対応するカーソル位置情報6.r変換し、C
P[J、iに指示する。
(’、 )) LJ 4は、す、えられたカーソル制御
信号にしたがって、カーツルア11/スの変更制御を行
う。
ディスプレイ装置5は、変更されたカーソル了トレスに
基づいてカーソル表示を行う。
〔作用〕
母音として、イ、工、ア、オ、つおよびその中間の母音
から適当なものを複数個iπび、それらの各母音をカー
ソルの移動指示情報として使用する。
そして入力された母音から第1フォルマント周波数、ま
たは第1と第2のフォルマント周波数を抽出し、これら
が1υ音の種別によ〃)異なることを利用して、指示さ
れた」1下左右の(T意のイ☆置ヘカーソル移動を行わ
せる。
入力音声信号のl/ヘルを監視し、 nL音のし・\ル
が所定のしきい値以上のときカーソル移動を可能とし、
しきい値以下のときは現在のカーソル位置を保持させる
第2図に、イ〜工〜ア〜オ〜つの母音を用いた縦方向の
カーソル位置制御の例を示す。なお、記号パ〜”は、そ
の前後の母音の中間の母音を表す。
この例では、母音イ、工、ア、第5 ウの各々に。
画面1−の異なる縦(行)アドレスが対応づけられてお
り、これらの中のある1つの母音を発声し。
入力することにより、カーソルは、その母音に指定され
た縦位置に移動される。
〔実施例〕
第3図に本発明の第1の実施例の構成を示す。
この実施例では2人間の発声する母音のうち。
「ア」、「オ」、「つ」とそれらの間をなめらかに変化
する部分[ア〜オ〜ウ−1を用いる。また人間の音声を
特徴づけるパラメータとして第]フォルマント周波数(
Fl)を用いる。
第1フォルマント周波数(Fl)は人間の音声を周波数
分析しC得られるヘクトルの]KI(z以下の部分にあ
られれるピークのrffl波数である。第4図にその1
例をボす。
LJ音[ア1.「オー1,1−)」の第1フォルマント
周波数は1男性の場合、[アl  (0,7Kllz)
 −” rオー1  ((1,5KHz)−→Iつ」(
0,3Ktb)のように変化し。
女性の場合、[ア−1(0,9KHz)−” [オJ 
(0,5Kllz)−+[つj (0,4KHz)のよ
うに変化するく個人差もある)。本実施例では、この第
1フAルマント周波数(Fl)とカーソル位置を対応づ
けようとするものである。
第3図において、1は音声入力部、2ばフォルマン1へ
分析部、3ばカーソル制御部、4はCI) LJ 。
5ばディスプレイ装置、11はローパスフィルタL P
 F、  12はΔ/I)変換器、21は周波数解析器
FFT、22は第1フォルマント周波数d1算部。
31 i;を学習・判定部、32はパワー計算部を表す
ローパスフィルタL l) F 11 u;I:、  
8声のl K llZ以下の成分を取り出すものである
A / D変換器12は、音声信号をディジタル量に変
換するもので、  IKHzまでの帯域の音声信号を扱
う場合、サンプリング周波数は2KHz程度となる。
周波数解析部FFT21は、A/D変換器12の出力(
X(t)、tは時間)を周波数分析するもので、数学的
に、  P(j) = l FFT (X(t) ) 
 l 。
j=1〜N/2.t=1〜Nで表される。ここでNはF
FTのポイント数と呼ばれるもので9例えばN=256
とする。つまりA/D変換器12の出力がN点そろうご
とにFFT計算をくりがえす。
1回の計算でN/2ポイントのスペクトル(パワースペ
クトル、  P(j) )が求まる。
第1フォルマント周波数計算部22は、  P(j)。
j=1〜N/2の中から最大値P (J)を求め、最大
値を与えるjの値(J)を出力する(もしP(j)+ 
j = 1〜128のうちP(7)が最大値であれば7
を出力する。
学習・判定部31は9発声者の個性を考慮しながら、第
1フォルマント周波数計算部22の出力を、  1. 
2. 3.・・・・・・、L(Lはディスプレイの表示
行数、つまり、カーソルの位置が何通りあるかを示す数
2例えば25)に量子化するものである。具体的には1
本装置使用者に「ア」を発声させ、その時の第1フォル
マント周波数計算部22の出力をFlmaxとし5次に
[ウ−1を発灼さ−U。
その時の第1フォルマント周波数計算部22の出力をF
lminとする。そして、カーソル制御時の発声に対す
る第1フォルマント周波数計算部22の出力をFlとし
、 C−(F 1−F 1m1n ) / (F 1m
ax −F lm1n ) Xl−によってカーソル位
置Cを計算する。
パワー計算部32は2周波数解析部F F T 21と
同じ入力信号を受けて、そのパワーをpw−Σ(x”(
tN 、t=1〜Nによって計算する。そしてこのイ直
がしきいイ直(TH)を超えた時に “l゛。
しきい値以下のときに “0′ となる1ビツトの信号
を出力する。
CPU4は2時々刻々、学習・判定部31の出力を人力
し、ディスプレイにカーソルを表示するためのもので、
パワー計算部32の出力が1゛のときにカーソルの移動
を行い、 “0゛のときにはカーソルの位置を固定する
第5図に本発明の第2の実施例の構成を示す。
この例では1人間の発声する母音のうち、「イ」、「工
」、「ア」、「オ」、「つ」と、それらの間を滑らかに
変化する部分[イ〜工〜ア〜オ〜つ」を用いる。人間の
音声を特徴づけるパラメータには、第1フオルマン)(
Fl)以外に、第2フォルマント周波数(F2)がある
。これは、第6図に例示するように1人間の音声を周波
数分析して得られるスペクトルのIKHz〜3KHzの
部分にあられれるピークの周波数である。FlとF2を
2次元表示すると第7図のようになる。
本実施例では、第8図に示すように、これらの「イ」、
「工」、「ア」、「オ」、「つ」の中心(0)を決定し
、その垂線(OR)と「0と母音の特徴点を結んだ線分
」とのなす角度(θ)をパラメータとし、これとカーソ
ル位置を対応づけようとするものである。
第5図において9点線ブロックの要素は第3図の第1の
実施例の要素と同様の機能をもつものであり、実線ブロ
ックの要素が本実施例において付加あるいは変形された
要素である。すなわち、23は第2フオルマント計算部
、31′は学習・判定部である。
この実施例では3KHzまでの帯域を扱うため。
ローパスフィルタLPFIIのカットオフ周波数は3K
Hz、A/D変換器12のサンプリング周波数は6 K
 Hzとする。
第1フォルマント周波数計算部22は周波数解析器FF
T21の出力のうち、0−IKH2の部分についてのピ
ークを検出して、その周波数を出力する。
第2フォルマント周波数計算部23は、lKH2〜3K
Hzの部分について同様の計算を行う。
学習・判定部31′は、装置利用者かはしめに学習用に
発声した「イ〜工〜ア〜オ〜つ」に対し。
Flのmax、  min、そしてF2のmaに、 m
inを計算し、第1フォルマント周波数の中心F10=
(F 1max +F 1m1n ) /2.第2フォ
ルマント周波数の中心F20− (F 2max 4−
 F 2m1n > / 2によってFIOとF20を
決定する。次に、再び。
装置利用者が学習用に発声した[イ〜工〜ア〜オ〜ウ−
1に対し。
θ= arcl、an (−x / y )y =F1
−FIO x = F 20−F 2 を計算し、θのmax、 minを計算する。
以後は、実連用にはいり、カーソル位置Cについて。
C=−(θ−θmin )  /  (θmax  −
8m1n)XLにより計算し、Cを出力する。Lはディ
スプレイの表示可能行数である。
第9図に本発明の第3の実施例の構成を示す。
本実施例は第1と第2の改良し7たものである。
第9図は第2の実施例の構成を示す第5図Qこもとづい
ているが2本実施例に特徴的な部分は実線ブロックで示
し、第5図と同様の機能の部分は点線ブロックで示して
いる。すなわち2本実施例の特徴的部分は、24の低域
重心計算部と25の高域重心計算部にある。これらBa
t第5図の第1フメルマント周波数旧算部22と第2フ
ォルマント周波数計算部23におきかわるものである。
第5図の第1フAルマンl−周波数旧算部22と第2フ
ォルマント周波数計算部23は同様の機能を持っている
が、第1フォルマント周波数計算部22を例にとっ”0
第2の実施例におけるその欠点を説明する。
第10図に2周波数解析器F T? T 21の出力の
うち、IKHz以下の部分を示す。このように。
F F T 21の出力は、音声に含まれる基本周波数
の影響を受け、デコボコしており、ピークを1える周波
数を哨純に決定したものでば■がフォルマント周波数と
判断されてしまう (実際は■)。
また、デニ1ボコを取り去るために、スペクトルを平滑
化することも考えられる。例えば、  I)(j)’=
 ((P(j)  十P(j−1)+P(j N))/
3のような式を用いて平滑化することが可能であるが、
その場合でも、第11図のような例が起こり、求めたい
■のかわりに■がフォルマント周波数として出力されて
しま・う。
音声によるカーソル制御では、フォルマント周波数抽出
精度はあまり重要ではないが「ア〜」と連続的に発声し
ても1発声のゆらぎによって第10図や第11図の■と
■が交互にピークとして検出され、検出されるフォルマ
ント周波数の値が不安定にゆれ動くことになる。この不
安定さはカーソル制御に障害となる。
このため、第9図に示す第3の実施例では、フォルマン
ト周波数をピーク検出によって求めることによる不安定
さを1重心を求めることによって回避している。すなわ
ち。
F=(Σ(P(i) x l) ) /ΣP(+)によ
ってフォルマント周波数を決定する。重心によってフォ
ルマント周波数を決定すれば、第10図や第11図の場
合の■や■のどちらかが微妙に高いかということには大
きく影響されないので。
安定した結果が得られる。つまり、連続的に同じ母音を
発声している時にゆらぎによってフォルマント周波数計
算結果が大きく変動することがない。
〔発明の効果〕
本発明によれば3人間の制御し2やすい母音の種類([
イ、工、ア、オ、つ1)とカーソル召))置を対応づけ
ることによってカーソル制御を行・)ので。
人間にとって快適に、しかも2両手をキーボードのホー
ムポジションに置いたままカーソルの制御を行うことが
できる。
【図面の簡単な説明】
第1図は本発明の原理的構成図、第2図は本発明による
動作例の説明図、第3図は本発明の第1の実施例の構成
図、第4図は第1フオルマン[・周波数の1例を示す図
、第5図は本発明の第2の実施例の構成図、第6図は第
1および第2フォルマント周波数の1例を示す図、第7
図はFlおよびF2の2次元表示の1例を示す図、第8
図はFlおよびF2に基づく]変量(θ)の例を示す図
。 第9図は本発明の第3の実施例の構成図、第10図およ
び第11図はそれぞれフォルマント周波数が不安定な例
(その1)および(その2)を示す図、第12図は従来
の音声によるカーソル制御例の説明図である。 第1図中。 1:音声入力部 2:フォルマント分析部 3:カーソル制御部 4 : CPU 5:ディスプレイ装置

Claims (7)

    【特許請求の範囲】
  1. (1)カーソル機能を有するディスプレイ装置において
    、音声入力部(1)と、 上記音声入力部(1)に入力された音声から母音のフォ
    ルマント周波数を抽出するフォルマント分析部(2)と
    、抽出されたフォルマント周波数を特定のカーソル位置
    に対応づけるカーソル制御部(3)とをそなえ、 所定の適当な母音を発声して音声入力部(1)から入力
    することにより、そのフォルマント周波数に基づいてカ
    ーソルを所望の位置に移動させることを特徴とする音声
    によるカーソル位置制御方式。
  2. (2)特許請求の範囲第1項において、母音として「ア
    」、「オ」、「ウ」または「ア」、「エ」、「イ」とそ
    れらの中間に位置する母音を用いるとともに、それぞれ
    の母音の第1フォルマント周波数をカーソル位置に対応
    づけることを特徴とする音声によるカーソル位置制御方
    式。
  3. (3)特許請求の範囲第1項において、母音として「イ
    」、「エ」、「ア」、「オ」、「ウ」とそれらの中間に
    位置する母音を用いるとともに、それぞれの母音の第1
    フォルマント周波数および第2フォルマント周波数から
    導かれる1変量をカーソル位置に対応づけることを特徴
    とする音声によるカーソル位置制御方式。
  4. (4)特許請求の範囲第1項において、第1フォルマン
    ト周波数と第2フォルマント周波数を1変量に変換する
    方法として、第1フォルマント周波数と第2フォルマン
    ト周波数の2軸による座標系上に各母音を配し、その中
    心点と母音とを結ぶベクトルの方向を変量とする方法を
    用いることを特徴とする音声によるカーソル位置制御方
    式。
  5. (5)特許請求の範囲第1項において、発声された音、
    音声の強さがしきい値以上のときはカーソル位置を移動
    させ、しきい値以下になったときは直前のカーソル位置
    を固定させることを特徴とする音声によるカーソル位置
    制御方式。
  6. (6)特許請求の範囲第1項において、音声のスペクト
    ルのピークを与える周波数としてフォルマント周波数を
    抽出することを特徴とする音声によるカーソル位置制御
    方式。
  7. (7)特許請求の範囲第1項において、音声のスペクト
    ルの重心としてフォルマント周波数を抽出することを特
    徴とする音声によるカーソル位置制御方式。
JP60299340A 1985-12-28 1985-12-28 音声によるカ−ソル位置制御方式 Pending JPS62157938A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60299340A JPS62157938A (ja) 1985-12-28 1985-12-28 音声によるカ−ソル位置制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60299340A JPS62157938A (ja) 1985-12-28 1985-12-28 音声によるカ−ソル位置制御方式

Publications (1)

Publication Number Publication Date
JPS62157938A true JPS62157938A (ja) 1987-07-13

Family

ID=17871285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60299340A Pending JPS62157938A (ja) 1985-12-28 1985-12-28 音声によるカ−ソル位置制御方式

Country Status (1)

Country Link
JP (1) JPS62157938A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342365A (ja) * 1990-12-26 1994-12-13 Internatl Business Mach Corp <Ibm> 線型音声制御方法及び装置
US7286991B2 (en) 2002-05-30 2007-10-23 International Business Machines Corporation Computer, display control device, pointer position control method, and program
JP2009258366A (ja) * 2008-04-16 2009-11-05 Arcadia:Kk 音声制御装置
US7921364B2 (en) 2005-11-03 2011-04-05 Nuance Communications, Inc. Controlling a computer user interface with sound

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342365A (ja) * 1990-12-26 1994-12-13 Internatl Business Mach Corp <Ibm> 線型音声制御方法及び装置
US7286991B2 (en) 2002-05-30 2007-10-23 International Business Machines Corporation Computer, display control device, pointer position control method, and program
US7870002B2 (en) 2002-05-30 2011-01-11 Nuance Communications, Inc. Computer, display control device, pointer position control method, and program
US7921364B2 (en) 2005-11-03 2011-04-05 Nuance Communications, Inc. Controlling a computer user interface with sound
JP2009258366A (ja) * 2008-04-16 2009-11-05 Arcadia:Kk 音声制御装置

Similar Documents

Publication Publication Date Title
EP1635327B1 (en) Information transmission device
KR100547533B1 (ko) 음성 인식 장치 및 음성 인식 방법
JP4587854B2 (ja) 感情解析装置、感情解析プログラム、プログラム格納媒体
JP4906776B2 (ja) 音声制御装置
JP2005227512A (ja) 音信号処理方法及びその装置、音声認識装置並びにプログラム
JPS62157938A (ja) 音声によるカ−ソル位置制御方式
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JPS6126677B2 (ja)
Kaur Mouse movement using speech and non-speech characteristics of human voice
JPS58181099A (ja) 音声識別装置
JP4760179B2 (ja) 音声特徴量算出装置およびプログラム
JPH024920B2 (ja)
JPH07168520A (ja) 学習習熟度判別装置付き語学用教育装置
KR20190123120A (ko) 홀로그램 스피커
JPS61137199A (ja) 単語音声の認識方法
JP2012220607A (ja) 音認識方法及び装置
JPS6126678B2 (ja)
Suk et al. Voice/non-voice classification using reliable fundamental frequency estimator for voice activated powered wheelchair control
Kim et al. Emotion interactive robot focus on speaker independently emotion recognition
JP2017068153A (ja) 半導体装置、システム、電子機器、及び、音声認識方法
Suk et al. Voice activated powered wheelchair with non-voice rejection algorithm
Abass et al. Speech recognition based Microcontroller for Wheelchair movement
Kinsner et al. A speech recognition system using linear predictive coding and dynamic time warping
Resnikoff et al. Linguistic segmentation of acoustic speech waveforms
Shahin Enhancing speaker identification performance using circular hidden Markov model