JPS62157938A

JPS62157938A - 音声によるカ−ソル位置制御方式

Info

Publication number: JPS62157938A
Application number: JP60299340A
Authority: JP
Inventors: Yasuhiro Nara; 奈良　泰弘
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1985-12-28
Filing date: 1985-12-28
Publication date: 1987-07-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概要〕人間が発声した母音をカーソル位置に対応づけることに
より、カーソル位置制御を容易にする。

〔産業上の利用分野〕

本発明は、ディスプレイ装置のカーソル位置制御方式に
関するものであり、特に音声を用いたカーソル位置制御
方式に関するものである。

〔従来の技術〕

従来、ディスプレイ−ヒのカーソル位置を指定（制御）
する方式として、キーホード上の特殊キー。

マウス、トラックポール等が用いられていた。これらの
方式を、キーボードと併用する場合２　（文字入力はキ
ーホードから、カーソル制御は特殊；１−一、マウス、
トラックボール等で行う場合）、キーボード上の手をボ
ームポジション（ブラインド“タッチ−めくら打ち−す
るときの手の標準位置）からはずさなければならない。

このため９手をホームポジションに戻すときに目線をキ
ーボードに向けなければならす５■目線を原稿やディス
プレイに集中できないという不便さ、０手をボームポジ
ションに戻すのに時間がかかるという２つの欠点があっ
た。

これらの欠点に対処する方法として、音声によってカー
ソル位置を制御することが丸えられる。

音声によってカーソル位置を制御すれば２手をキーボー
ド−１−のホームポジションに置いたままで仕事ができ
、目線は原稿とディスプレイに集中することができる。

音声でカーソルを制御する方式として、■音声認識装置
を用いる方法、■声の大きさく強さ）をカーソル位置に
対応づける方法の２つが容易に考えられる。

しかし、■では、カーソルを何社ふんか上に移動する場
合、「上、上、上、・・・・・・上」と音声で指令する
のはやっかいである。また、「上」と発声するとカーソ
ルが上に動きはじめ、適当な位置に来たときに「止まれ
」というのも使いにくい。「６行・上」と発声するよう
にすると２行数を前取て数えなければならないので使い
にくい。

そこで、■の方法が考えられる。これは、第１２図に例
示されるように、たとえば「ア〜」という発声を用い、
大きな声を出すとカーソルが画面の下方に位置づけられ
、中位の大きさの声では画面中央、小さな声では画面の
上方に位置づけられるようにする方法である。しかし、
この方法では。

時によって大声を出さねばならない点、カーソル位置が
適当な位置に来たとき、何らかのキー人力を行う必要が
ある点の２つの欠点がある。すなわち２発声をやめると
常にカーソルが画面の」１方に行ってしまう。

また、第３の方法として、声の高さくピ・７チ。

音階）によってカーソル位置を制御する方法も考えられ
るが、使いやすい方法とは言えない（声の高さをスムー
スに変化させることは容易でないし１高い声を出すのは
楽でない）。

〔発明が解決しようとする問題点〕

最近、音声入力は、キーボードと併用あるいは代替する
形でまずます利用が高まる傾向にあるが。

ディスプレイ装置のカーソル位置制御手段としては、従
来、必ずしも有効に機能させることができなかった。こ
のため、音声入力手段を改良し、カーソル位置を確実容
易に制御できる実用的な方法を開発する必要があった。

〔問題点を解決するだめの手段〕

本発明は、音声の［大きさ１や［高さ１以外の。

もっと容易に制御できる音声の属性を利用してカーソル
位置制御を行う手段を提供するものであり。

具体約６こは２人間の発声する母音の種類（ア、イ。

つ、工、オ）とカーソル位置を対応づけることによって
カーソル制御を行うものである。母音の発声し分ＩＪは
人間が日常行っていることであるので。

極めて容易であり、しかも、声の１大きさ−１はカーソ
ル位置に関係しないため１発声を終えることによってカ
ーソル位置を固定でき、特別なキー人力を不要にするこ
とができる。

第１図に１本発明の原理的構成を示す。

図において、１は音声入力部、２ばフォルマント分析部
、３はカーソル制御部、４はＣＩ）Ｕ、５はディスプレ
イ装置である。

音声入力部１は、装置利用者が発声した音声を入力し、
音声信号について増幅、フィルタ処理。

Ａ／［］変換等のｉｉ１処理を行う。

フォルマント分析部２は、入力された音声信号について
周波数解析を行い、その中からＩυ、音のフォルマン１
−周波数を抽出する。

カーソル制御部３は、抽出されたフォルマント周波数が
予め定めされたフメルマンｌ−Ｊｉ＋波数と一致すると
き、それを対応するカーソル位置情報６．ｒ変換し、Ｃ
Ｐ［Ｊ、ｉに指示する。

（’、　））　ＬＪ　４は、す、えられたカーソル制御
信号にしたがって、カーツルア１１／スの変更制御を行
う。

ディスプレイ装置５は、変更されたカーソル了トレスに
基づいてカーソル表示を行う。

〔作用〕

母音として、イ、工、ア、オ、つおよびその中間の母音
から適当なものを複数個ｉπび、それらの各母音をカー
ソルの移動指示情報として使用する。

そして入力された母音から第１フォルマント周波数、ま
たは第１と第２のフォルマント周波数を抽出し、これら
が１υ音の種別によ〃）異なることを利用して、指示さ
れた」１下左右の（Ｔ意のイ☆置ヘカーソル移動を行わ
せる。

入力音声信号のｌ／ヘルを監視し、　ｎＬ音のし・＼ル
が所定のしきい値以上のときカーソル移動を可能とし、
しきい値以下のときは現在のカーソル位置を保持させる
。

第２図に、イ〜工〜ア〜オ〜つの母音を用いた縦方向の
カーソル位置制御の例を示す。なお、記号パ〜”は、そ
の前後の母音の中間の母音を表す。

この例では、母音イ、工、ア、第５　ウの各々に。

画面１−の異なる縦（行）アドレスが対応づけられてお
り、これらの中のある１つの母音を発声し。

入力することにより、カーソルは、その母音に指定され
た縦位置に移動される。

〔実施例〕

第３図に本発明の第１の実施例の構成を示す。

この実施例では２人間の発声する母音のうち。

「ア」、「オ」、「つ」とそれらの間をなめらかに変化
する部分［ア〜オ〜ウ−１を用いる。また人間の音声を
特徴づけるパラメータとして第］フォルマント周波数（
Ｆｌ）を用いる。

第１フォルマント周波数（Ｆｌ）は人間の音声を周波数
分析しＣ得られるヘクトルの］ＫＩ（ｚ以下の部分にあ
られれるピークのｒｆｆｌ波数である。第４図にその１
例をボす。

ＬＪ音［ア１．「オー１，１−）」の第１フォルマント
周波数は１男性の場合、［アｌ　　（０，７Ｋｌｌｚ）
　−”　ｒオー１　　（（１，５ＫＨｚ）−→Ｉつ」（
０，３Ｋｔｂ）のように変化し。

女性の場合、［ア−１（０，９ＫＨｚ）−”　［オＪ　
（０，５Ｋｌｌｚ）−＋［つｊ　（０，４ＫＨｚ）のよ
うに変化するく個人差もある）。本実施例では、この第
１フＡルマント周波数（Ｆｌ）とカーソル位置を対応づ
けようとするものである。

第３図において、１は音声入力部、２ばフォルマン１へ
分析部、３ばカーソル制御部、４はＣＩ）　ＬＪ　。

５ばディスプレイ装置、１１はローパスフィルタＬ　Ｐ
　Ｆ、　　１２はΔ／Ｉ）変換器、２１は周波数解析器
ＦＦＴ、２２は第１フォルマント周波数ｄ１算部。

３１　ｉ；を学習・判定部、３２はパワー計算部を表す
。

ローパスフィルタＬ　ｌ）　Ｆ　１１　ｕ；Ｉ：、　　
８声のｌ　Ｋ　ｌｌＺ以下の成分を取り出すものである
。

Ａ　／　Ｄ変換器１２は、音声信号をディジタル量に変
換するもので、　　ＩＫＨｚまでの帯域の音声信号を扱
う場合、サンプリング周波数は２ＫＨｚ程度となる。

周波数解析部ＦＦＴ２１は、Ａ／Ｄ変換器１２の出力（
Ｘ（ｔ）、ｔは時間）を周波数分析するもので、数学的
に、　　Ｐ（ｊ）　＝　ｌ　ＦＦＴ　（Ｘ（ｔ）　）　
　ｌ　。

ｊ＝１〜Ｎ／２．ｔ＝１〜Ｎで表される。ここでＮはＦ
ＦＴのポイント数と呼ばれるもので９例えばＮ＝２５６
とする。つまりＡ／Ｄ変換器１２の出力がＮ点そろうご
とにＦＦＴ計算をくりがえす。

１回の計算でＮ／２ポイントのスペクトル（パワースペ
クトル、　　Ｐ（ｊ）　）が求まる。

第１フォルマント周波数計算部２２は、　　Ｐ（ｊ）。

ｊ＝１〜Ｎ／２の中から最大値Ｐ　（Ｊ）を求め、最大
値を与えるｊの値（Ｊ）を出力する（もしＰ（ｊ）＋　
ｊ　＝　１〜１２８のうちＰ（７）が最大値であれば７
を出力する。

学習・判定部３１は９発声者の個性を考慮しながら、第
１フォルマント周波数計算部２２の出力を、　　１．　
２．　３．・・・・・・、Ｌ（Ｌはディスプレイの表示
行数、つまり、カーソルの位置が何通りあるかを示す数
２例えば２５）に量子化するものである。具体的には１
本装置使用者に「ア」を発声させ、その時の第１フォル
マント周波数計算部２２の出力をＦｌｍａｘとし５次に
［ウ−１を発灼さ−Ｕ。

その時の第１フォルマント周波数計算部２２の出力をＦ
ｌｍｉｎとする。そして、カーソル制御時の発声に対す
る第１フォルマント周波数計算部２２の出力をＦｌとし
、　Ｃ−（Ｆ　１−Ｆ　１ｍ１ｎ　）　／　（Ｆ　１ｍ
ａｘ　−Ｆ　ｌｍ１ｎ　）　Ｘｌ−によってカーソル位
置Ｃを計算する。

パワー計算部３２は２周波数解析部Ｆ　Ｆ　Ｔ　２１と
同じ入力信号を受けて、そのパワーをｐｗ−Σ（ｘ”（
ｔＮ　、ｔ＝１〜Ｎによって計算する。そしてこのイ直
がしきいイ直（ＴＨ）を超えた時に　“ｌ゛。

しきい値以下のときに　“０′　となる１ビツトの信号
を出力する。

ＣＰＵ４は２時々刻々、学習・判定部３１の出力を人力
し、ディスプレイにカーソルを表示するためのもので、
パワー計算部３２の出力が１゛のときにカーソルの移動
を行い、　“０゛のときにはカーソルの位置を固定する
。

第５図に本発明の第２の実施例の構成を示す。

この例では１人間の発声する母音のうち、「イ」、「工
」、「ア」、「オ」、「つ」と、それらの間を滑らかに
変化する部分［イ〜工〜ア〜オ〜つ」を用いる。人間の
音声を特徴づけるパラメータには、第１フオルマン）（
Ｆｌ）以外に、第２フォルマント周波数（Ｆ２）がある
。これは、第６図に例示するように１人間の音声を周波
数分析して得られるスペクトルのＩＫＨｚ〜３ＫＨｚの
部分にあられれるピークの周波数である。ＦｌとＦ２を
２次元表示すると第７図のようになる。

本実施例では、第８図に示すように、これらの「イ」、
「工」、「ア」、「オ」、「つ」の中心（０）を決定し
、その垂線（ＯＲ）と「０と母音の特徴点を結んだ線分
」とのなす角度（θ）をパラメータとし、これとカーソ
ル位置を対応づけようとするものである。

第５図において９点線ブロックの要素は第３図の第１の
実施例の要素と同様の機能をもつものであり、実線ブロ
ックの要素が本実施例において付加あるいは変形された
要素である。すなわち、２３は第２フオルマント計算部
、３１′は学習・判定部である。

この実施例では３ＫＨｚまでの帯域を扱うため。

ローパスフィルタＬＰＦＩＩのカットオフ周波数は３Ｋ
Ｈｚ、Ａ／Ｄ変換器１２のサンプリング周波数は６　Ｋ
　Ｈｚとする。

第１フォルマント周波数計算部２２は周波数解析器ＦＦ
Ｔ２１の出力のうち、０−ＩＫＨ２の部分についてのピ
ークを検出して、その周波数を出力する。

第２フォルマント周波数計算部２３は、ｌＫＨ２〜３Ｋ
Ｈｚの部分について同様の計算を行う。

学習・判定部３１′は、装置利用者かはしめに学習用に
発声した「イ〜工〜ア〜オ〜つ」に対し。

Ｆｌのｍａｘ、　　ｍｉｎ、そしてＦ２のｍａに、　ｍ
ｉｎを計算し、第１フォルマント周波数の中心Ｆ１０＝
（Ｆ　１ｍａｘ　＋Ｆ　１ｍ１ｎ　）　／２．第２フォ
ルマント周波数の中心Ｆ２０−　（Ｆ　２ｍａｘ　４−
　Ｆ　２ｍ１ｎ　＞　／　２によってＦＩＯとＦ２０を
決定する。次に、再び。

装置利用者が学習用に発声した［イ〜工〜ア〜オ〜ウ−
１に対し。

θ＝　ａｒｃｌ、ａｎ　（−ｘ　／　ｙ　）ｙ　＝Ｆ１
−ＦＩＯｘ　＝　Ｆ　２０−Ｆ　２を計算し、θのｍａｘ、　ｍｉｎを計算する。

以後は、実連用にはいり、カーソル位置Ｃについて。

Ｃ＝−（θ−θｍｉｎ　）　　／　　（θｍａｘ　　−
８ｍ１ｎ）ＸＬにより計算し、Ｃを出力する。Ｌはディ
スプレイの表示可能行数である。

第９図に本発明の第３の実施例の構成を示す。

本実施例は第１と第２の改良し７たものである。

第９図は第２の実施例の構成を示す第５図Ｑこもとづい
ているが２本実施例に特徴的な部分は実線ブロックで示
し、第５図と同様の機能の部分は点線ブロックで示して
いる。すなわち２本実施例の特徴的部分は、２４の低域
重心計算部と２５の高域重心計算部にある。これらＢａ
ｔ第５図の第１フメルマント周波数旧算部２２と第２フ
ォルマント周波数計算部２３におきかわるものである。

第５図の第１フＡルマンｌ−周波数旧算部２２と第２フ
ォルマント周波数計算部２３は同様の機能を持っている
が、第１フォルマント周波数計算部２２を例にとっ”０
第２の実施例におけるその欠点を説明する。

第１０図に２周波数解析器Ｆ　Ｔ？　Ｔ　２１の出力の
うち、ＩＫＨｚ以下の部分を示す。このように。

Ｆ　Ｆ　Ｔ　２１の出力は、音声に含まれる基本周波数
の影響を受け、デコボコしており、ピークを１える周波
数を哨純に決定したものでば■がフォルマント周波数と
判断されてしまう　（実際は■）。

また、デニ１ボコを取り去るために、スペクトルを平滑
化することも考えられる。例えば、　　Ｉ）（ｊ）’＝
　（（Ｐ（ｊ）　　十Ｐ（ｊ−１）＋Ｐ（ｊ　Ｎ））／
３のような式を用いて平滑化することが可能であるが、
その場合でも、第１１図のような例が起こり、求めたい
■のかわりに■がフォルマント周波数として出力されて
しま・う。

音声によるカーソル制御では、フォルマント周波数抽出
精度はあまり重要ではないが「ア〜」と連続的に発声し
ても１発声のゆらぎによって第１０図や第１１図の■と
■が交互にピークとして検出され、検出されるフォルマ
ント周波数の値が不安定にゆれ動くことになる。この不
安定さはカーソル制御に障害となる。

このため、第９図に示す第３の実施例では、フォルマン
ト周波数をピーク検出によって求めることによる不安定
さを１重心を求めることによって回避している。すなわ
ち。

Ｆ＝（Σ（Ｐ（ｉ）　ｘ　ｌ）　）　／ΣＰ（＋）によ
ってフォルマント周波数を決定する。重心によってフォ
ルマント周波数を決定すれば、第１０図や第１１図の場
合の■や■のどちらかが微妙に高いかということには大
きく影響されないので。

安定した結果が得られる。つまり、連続的に同じ母音を
発声している時にゆらぎによってフォルマント周波数計
算結果が大きく変動することがない。

〔発明の効果〕

本発明によれば３人間の制御し２やすい母音の種類（［
イ、工、ア、オ、つ１）とカーソル召））置を対応づけ
ることによってカーソル制御を行・）ので。

人間にとって快適に、しかも２両手をキーボードのホー
ムポジションに置いたままカーソルの制御を行うことが
できる。

【図面の簡単な説明】

第１図は本発明の原理的構成図、第２図は本発明による
動作例の説明図、第３図は本発明の第１の実施例の構成
図、第４図は第１フオルマン［・周波数の１例を示す図
、第５図は本発明の第２の実施例の構成図、第６図は第
１および第２フォルマント周波数の１例を示す図、第７
図はＦｌおよびＦ２の２次元表示の１例を示す図、第８
図はＦｌおよびＦ２に基づく］変量（θ）の例を示す図
。第９図は本発明の第３の実施例の構成図、第１０図およ
び第１１図はそれぞれフォルマント周波数が不安定な例
（その１）および（その２）を示す図、第１２図は従来
の音声によるカーソル制御例の説明図である。第１図中。１：音声入力部２：フォルマント分析部３：カーソル制御部４　：　ＣＰＵ５：ディスプレイ装置

Claims

【特許請求の範囲】

（１）カーソル機能を有するディスプレイ装置において
、音声入力部（１）と、上記音声入力部（１）に入力された音声から母音のフォ
ルマント周波数を抽出するフォルマント分析部（２）と
、抽出されたフォルマント周波数を特定のカーソル位置
に対応づけるカーソル制御部（３）とをそなえ、所定の適当な母音を発声して音声入力部（１）から入力
することにより、そのフォルマント周波数に基づいてカ
ーソルを所望の位置に移動させることを特徴とする音声
によるカーソル位置制御方式。
（２）特許請求の範囲第１項において、母音として「ア
」、「オ」、「ウ」または「ア」、「エ」、「イ」とそ
れらの中間に位置する母音を用いるとともに、それぞれ
の母音の第１フォルマント周波数をカーソル位置に対応
づけることを特徴とする音声によるカーソル位置制御方
式。
（３）特許請求の範囲第１項において、母音として「イ
」、「エ」、「ア」、「オ」、「ウ」とそれらの中間に
位置する母音を用いるとともに、それぞれの母音の第１
フォルマント周波数および第２フォルマント周波数から
導かれる１変量をカーソル位置に対応づけることを特徴
とする音声によるカーソル位置制御方式。
（４）特許請求の範囲第１項において、第１フォルマン
ト周波数と第２フォルマント周波数を１変量に変換する
方法として、第１フォルマント周波数と第２フォルマン
ト周波数の２軸による座標系上に各母音を配し、その中
心点と母音とを結ぶベクトルの方向を変量とする方法を
用いることを特徴とする音声によるカーソル位置制御方
式。
（５）特許請求の範囲第１項において、発声された音、
音声の強さがしきい値以上のときはカーソル位置を移動
させ、しきい値以下になったときは直前のカーソル位置
を固定させることを特徴とする音声によるカーソル位置
制御方式。
（６）特許請求の範囲第１項において、音声のスペクト
ルのピークを与える周波数としてフォルマント周波数を
抽出することを特徴とする音声によるカーソル位置制御
方式。
（７）特許請求の範囲第１項において、音声のスペクト
ルの重心としてフォルマント周波数を抽出することを特
徴とする音声によるカーソル位置制御方式。