JPH06124097A

JPH06124097A - 携帯型端末装置

Info

Publication number: JPH06124097A
Application number: JP4274609A
Authority: JP
Inventors: Hiroaki Kokubo; 浩明小窪
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1992-10-13
Filing date: 1992-10-13
Publication date: 1994-05-06

Abstract

(57)【要約】【構成】音声認識機能を備えた携帯端末装置であっ
て、認識対象となる音声を入力する音声入力部１０１
と、該音声入力部より得られた入力音声を認識する音声
認識部１０３〜１０５と、入力部と使用者との距離を計
測するセンサ部１０６と、少なくとも音声認識部での認
識結果に基づく音声を合成する音声合成部１０８と、該
合成された音声を再生するための音声出力部１１０と、
認識結果を表示するための表示部１１１と、センサ部で
計測された距離が予め定義した閾値よりも小さい場合に
は音声出力部より認識結果を提示し、閾値以上の場合に
は表示部に認識結果を提示する制御部１０７とを備え
た。【効果】口許で操作する場合は騒音下でも充分なＳ／
Ｎが確保でき、かつディスプレイを見なくとも音声によ
り認識結果を確認することができる。また、口許から離
して使用する場合には、ディスプレイにより認識候補を
確認することができるため、使用者は目的や使用環境に
応じて使い分けることが出来る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声認識機能を備えた
携帯型端末装置に係り、特に騒音下でも使用可能な携帯
型端末装置装置に関する。

【０００２】

【従来の技術】携帯電話に代表される小型携帯型端末装
置では、小型故に操作ボタンの数や大きさは限定されて
くる。従ってこのような装置にはボタンにより操作する
よりも、手書き文字や音声等を用いた操作が望まれてい
る。

【０００３】音声認識の問題点は、音声のもつあいまい
さのため必ずしも常に正しく認識できるとは限らないこ
とと、騒音環境下で使用すると周囲雑音のため認識性能
が大幅に劣化してしまう点である。前者は大語彙の認識
や類似単語の多い認識の場合には特に問題となる。この
ような認識誤りによる誤操作を防ぐために、誤って認識
してしまった時でも次候補を呈示するなどしてうまくエ
ラーリカバリーすることが必要である。

【０００４】また、音声認識機能を備えた携帯型端末装
置を実用化するためには騒音下で発声した音声でも正し
く認識出来るような耐雑音化の技術も不可欠である。騒
音環境下で発声した音声を正しく認識させる手段として
は前処理によって雑音が重畳した音声から雑音を除去す
る手法、あるいは雑音が重畳されてた音声でも正しく認
識できる認識手法が必要である。前者は適応フィルタを
用いて雑音を除去するもの、音声に混入した雑音スペク
トルを推定し、入力スペクトルから差し引くスペクトル
サブトラクション法などがある。後者には雑音の影響を
受けにくいパラメータや距離尺度を用いる手法、および
雑音を予め標準パタンに重畳しておく雑音重畳法などが
ある。しかしながら、数多くの雑音処理手法が提案され
ているものの、依然静かな環境下での認識性能と比較す
ると十分とは言えず、最良の騒音対策は接話型マイクロ
フォン等を用いてなるべく入力音声のＳ／Ｎを向上させ
ることである。

【０００５】

【発明が解決しようとする課題】誤りなく認識結果の確
認を行うためには、ディスプレイに表示された認識結果
を確認する手法や複数の認識候補の中から使用者に選択
させる手法が望ましく、また騒音環境下でも正しく認識
できるためには、接話型マイクロフォンのように、なる
べく口とマイクとの距離を小さくしてＳ／Ｎを向上させ
ることが必要である。然るに、小型携帯型端末装置で
は、携帯性および使い勝手を損なわずにマイクと表示部
を分離させることは不可能に近く、マイクを口許に近付
けて使用する場合では表示部を目で確認することは困難
である。一方、表示部で認識結果を確認する目的で口許
から離れた位置で操作を行う場合、騒音の多い場所では
十分なS/Nが確保できず、満足できる認識性能を確保す
ることは難しい。

【０００６】本発明の目的は、音声認識機能を備えた携
帯型端末装置において、騒音が多い場所など確認操作の
容易さよりも認識率の向上が優先するような場合には口
許に近付けて操作することができ、比較的騒音の少ない
ところでは口許から離して表示部で認識結果を確認しな
がら操作ができるよう、目的や使用環境に応じて使用者
が使い分けが出来るようにすることにある。

【０００７】

【課題を解決するための手段】上記目的を達成するため
に、本発明による携帯型端末装置は、音声認識機能を備
えた携帯端末装置であって、認識対象となる音声を入力
する音声入力部と、該音声入力部より得られた入力音声
を認識する音声認識部と、前記音声入力部と使用者との
距離を計測するセンサ部と、少なくとも前記音声認識部
での認識結果に基づく音声を合成する音声合成部と、該
合成された音声を再生するための音声出力部と、前記認
識結果を表示するための表示部と、前記センサ部で計測
された距離が予め定義した閾値よりも小さい場合には前
記音声出力部より認識結果を提示し、前記距離が前記閾
値以上の場合には前記表示部に認識結果を提示する制御
部とを備えたことを特徴とする。

【０００８】

【作用】本発明には数々の変形が考えられるが、その中
で代表的な手段についてその作用を説明する。

【０００９】センサ部で計測された距離が予め定めれた
閾値よりも小さい場合には音声出力部より認識結果を提
示し、逆に閾値以上の場合には表示部に認識結果を提示
する。これにより、口許で操作する場合は騒音下でも充
分なＳ／Ｎが確保でき、かつ表示部（ディスプレイ）を
見なくとも音声により認識結果を確認することができ
る。また、口許から離して使用する場合には、表示部に
よる認識候補の確認が可能であるため、類似した認識候
補がある場合でも使用者が選択することができる。従っ
て、使用者は目的や使用環境に応じて使い分けることに
より、騒音が多い場所では口許に近付けて操作すること
で充分なＳ／Ｎを確保し高い認識性能が得られ、比較的
騒音の少ないところでは口許から離して表示部で複数の
認識候補を確認することができる。このため、大語彙の
認識や類似語が多く含まれている認識でもエラリカバリ
が容易である。このため、認識誤りによるストレスをほ
とんど生じずに操作を遂行することができる。

【００１０】

【実施例】以下、本発明の実施例を図面により詳細に説
明する。

【００１１】図１に、本発明による音声認識機能を備え
た携帯型端末装置の一実施例の構成を示すブロック図で
ある。本実施例では、図２にその外観を示すように、携
帯電話を例にとって説明する。但し、本発明は、携帯電
話以外に電子手帳、リモコン装置等の小型携帯端末にも
同様に適用することが可能である。

【００１２】図１、図２において、１０１は音声入力
部、１０２はＡ／Ｄ変換部、１０３は分析部、１０４は
照合部、１０５は標準パタン、１０６はセンサ部、１０
７は制御部、１０８は音声合成部、１０９はＤ／Ａ変換
部、１１０は音声出力部、１１１は表示部、１１２は選
択ボタン、１１３は命令実行部である。音声入力部１０
１は音声コマンド等の音声を入力する部分である。音声
入力部１０１より入力した音声信号は、Ａ／Ｄ変換部１
０２により量子化され、分析部１０３に入る。分析部１
０３では、ＬＰＣ分析等の公知の分析手法を用いて認識
の判定に用いる音声の特徴ベクトルを抽出する。音声の
特長抽出法については、古井“ディジタル音声処理”東
海大学出版会などに詳しい。分析部１０３で抽出した特
徴ベクトルに対して、照合部１０４で、認識対象語彙の
特徴ベクトルから成る標準パタン１０５との類似度を計
算することで認識候補を求め、上位の認識候補を認識結
果として制御部１０７に出力する。照合部１０４は、第
１位認識候補の類似度がある一定値を満足しなかった場
合は、認識候補のかわりにリジェクト信号を認識結果と
して出力する。

【００１３】センサ部１０６は、使用者と装置との距離
を測定するためのものであり、赤外線センサや超音波セ
ンサ等の距離センサを使用することで容易に実現でき
る。センサ部１０６は、その機能上は１つ存在すれば足
りるが、手に持ったときに覆い隠してしまう可能性を考
慮して、図２に示したように相互に離れた位置に少なく
とも２個設置することが好ましい。

【００１４】制御部１０７は、センサ部１０６で求めた
距離情報を用いて認識結果の提示法などを制御する。す
なわち、制御部１０７に入力された距離値がある閾値よ
りも小さい場合は認識結果を音声合成部１０８に渡し、
逆に距離が閾値よりも大きい場合は表示部１１１に渡
す。

【００１５】まず、入力された距離が小さい場合につい
て先に説明する。制御部１０７は認識結果を音声合成部
１０８に渡し、第１位の認識候補の音声を合成する。ま
た、音声合成部１０８にリジェクト信号が入力されたと
きには、再入力を促すガイダンスの音声を合成する。ガ
イダンス音声とは、例えば「もう一度お願いします」と
いったものである。もちろん予め再生用の音声データを
格納しておけば、音声合成部は不用である。音声合成部
１０８で合成された音声はＤ／Ａ変換部１０９によりア
ナログ信号に変換された後、音声出力部１１０より再生
される。制御部１０７は音声合成部１０８に認識結果を
渡した後、照合部１０４より新たな認識結果が入力して
きた場合、過去の認識結果を棄却し認識結果を更新す
る。また、認識結果を出力した後一定時間音声の入力が
無いと、制御部１０７は認識結果を命令実行部１１３に
出力する。これにより、使用者は音声出力部１１０より
出力した認識候補が誤っている場合、または再入力を施
すガイダンス音声であった場合は、再度、音声入力部１
０１より音声コマンドを入力し直すことが可能となる。
命令実行部１１３は、音声命令を実行する部分であり、
例えば音声ダイヤルのダイヤル部がこれに相当する。

【００１６】次に、制御部１０７に入力された距離が閾
値よりも大きい値の場合について説明する。表示部１１
１は、制御部１０７より入力された認識結果を文字情報
として表示するためのものである。表示部１１１で提示
する認識結果は第１位候補のみを提示する以外にも、類
似した認識候補を複数同時に提示することも可能であ
る。例えば、類似度の大きい上位３位までを提示した
り、照合部１０４で求めた類似度がある値以上のもの提
示するといった応用が考えられる。表示部１１１で提示
された認識結果に対する確認は選択ボタン１１２によっ
て行われる。例えば、提示された認識結果が第１位候補
のみの場合は、確認ボタンまたは取り消しボタンを押す
ことによって、複数候補が提示された場合は各候補に対
応付けられたボタンを選択することによってである。な
お、選択ボタン１１２は、同様な機能が機能が備わって
いれば必ずしもボタンである必要はなく、例えば表示部
１１１にタッチセンサをつけたようなものでもよい。ま
た、使用者はボタンを選択する代わりに音声入力１０１
より再び音声コマンドを入力することも可能である。制
御部１０７は選択ボタン１１２により正しい認識候補が
確定した時点で命令実行部１１３に認識結果を出力す
る。

【００１７】この様に、本実施例によれば、装置を顔に
近付けた場合には音声出力部より認識結果を提示し、顔
から離した場合には表示部に認識結果を提示するため、
口許で操作する場合は騒音下でも充分なＳ／Ｎが確保で
き、かつディスプレイを見なくとも音声により認識結果
を確認することができる。また、口許から離して使用す
る場合には、ディスプレイにより認識候補の確認が可能
であるため、類似した認識候補がある場合でも使用者が
正しい候補を選択することができる。従って、使用者は
目的や使用環境に応じて使い分けることにより、騒音が
多い場所では口許に近付けて操作することで充分なＳ／
Ｎを確保し高い認識性能が得られ、比較的騒音の少ない
ところでは口許から離して表示部で複数の認識候補を確
認することができるため、大語彙の認識や類似語が多く
含まれている認識でもエラリカバリが容易である。この
ため、認識誤りによるストレスをほとんど生じずに操作
を遂行することができる。

【００１８】上述の実施例では音声入力部１０１を口許
に近付けることでＳ／Ｎを改善し、騒音環境下での認識
率の向上を図っているが、分析部１０３の前に雑音処理
部を設けることで、口許から離して操作する場合でもあ
る程度の認識率の向上が図れることは言うまでもない。
図３に、雑音処理部の構成の一例を示す。この雑音処理
部では、スペクトルサブトラクション法と呼ばれる手法
を用いて雑音の除去を行なっている。スペクトルサブト
ラクションについては、S.F.Boll,"Suppression of Aco
ustic Noise in Speech Using Spectral Subtraction",
IEEE Trsns. onAcoustics, Speech, and Signal proces
sing, Vol.ASSP-27,No.2,April 1979,pp.113-120に詳し
い。図３において、３０１は波形切り出し部、３０２は
フーリエ変換部、３０３は雑音スペクトル推定部、３０
４はサブトラクション部、３０５はフーリエ逆変換部、
３０６は波形合成部である。Ａ／Ｄ変換部１０２から出
力されたディジタル信号は波形切り出し部３０１に入力
する。波形切り出し部３０１は、入力信号からスペクト
ル情報を分析するための波形区間を切り出すものであ
り、数十ms程度の区間を一定間隔で切り出す。切り出さ
れた区間信号波形は、フーリエ変換部３０２においてス
ペクトルデータに変換される。ここで、切り出された波
形にハミング窓等、従来用いられている窓関数を掛けた
後、前後に零データを埋め込み２の階乗点数のデータと
することで高速フーリエ変換を行うことが出来、高速な
データ処理が実現される。フーリエ変換されたスペクト
ル信号は雑音スペクトル推定部３０３に入力する。雑音
スペクトル推定部３０３は区間スペクトル信号のパワを
計算し、そのパワの値が一定時間以上閾値を下回る区間
を無音声区間とみなし、その区間のスペクトル信号を用
いて雑音スペクトルを推定する。無音声区間（音声区
間）の検出法にはこの他にも幾つもの手法が提案されて
おり、それらの手法を用いて無音声区間を検出すること
も可能である。無音声区間の信号を用いて雑音スペクト
ルの推定法についても幾つか考えられるが、例えば数フ
レーム分のスペクトルの平均スペクトルを計算するなど
して推定する。サブトラクション部３０４では入力スペ
クトル信号に対して雑音スペクトル推定部３０３で推定
された雑音スペクトルを用いてスペクトルの引き算を行
なう。いま、入力音声のスペクトルをX(f)、推定雑音ス
ペクトルをN(f)とするとサブトラクションは次式で表さ
れる。

【００１９】

【数１】

【００２０】数１におけるαはサブトラクション係数と
呼ばれ、この値を大きくするほど雑音除去の効果が大き
くなる。しかし、αを大きくし過ぎると音声成分までも
除去されてしまうため、値の選択には注意が必要であ
る。本実施例ではセンサ部１０６で計測された距離が大
きいほどＳ／Ｎが悪化していると判断し、αの値を大き
くすることが可能である。また、数１ではスペクトルの
振幅に対して引き算を行なっているが、パワスペクトラ
ムを用いて引き算を行なったり、位相成分も入れて引き
算を行なうといったことも可能である。

【００２１】サブトラクション部３０４で雑音成分を除
去したスペクトルは、フーリエ逆変換部３０５で再び時
間領域の信号に変換され、フレーム単位で切り出されて
いるフレーム波形データは波形合成部３０６で再びもと
の音声波形として合成され、分析部１０３に出力され
る。もちろん雑音処理部のフレーム周期と分析部１０３
のフレーム周期とを一致させておけば、波形合成部３０
６を用いずにフレームデータをそのまま分析部１０３に
出力することが可能である。

【００２２】また、雑音環境に合わせた標準パタンを複
数種類用意しておき、使用環境に応じて選択することで
も騒音環境下での認識率を改善することができる。図４
に、標準パタン選択部の構成の一例を示す。図４におい
て、４０１は音声区間検出部、４０２は雑音情報分析
部、４０３は標準パタン格納部、４０４は雑音情報照合
部である。標準パタン作成に用いる音声データは認識装
置の使用環境に合わせて音声に雑音を重畳したものを用
いる。雑音処理部１０６より出力された雑音除去信号
は、音声区間検出部４０１において音声区間信号と雑音
区間信号とに分離される。雑音情報分析部４０２では、
入力された雑音成分を分析し、その分析パラメータを出
力する。標準パタン格納部４０３は、種類の異なった雑
音をそれぞれ重畳した音声データより作成した数種類の
標準パタンと作成に用いた音声データに重畳した雑音成
分の特徴量を格納してある。雑音成分の特徴量は雑音情
報分析部４０２で用いたものと同じ分析手法を用いる。
雑音情報照合部４０４は、雑音処理信号の雑音成分の特
徴量と標準パタン格納部４０３に格納されている重畳雑
音の特徴量とを照合し、その照合結果から標準パタン格
納部４０３にある標準パタンの中から雑音処理信号の雑
音成分と最も近い雑音を重畳した音声を用いて作成した
標準パタンを選択し、出力する。また、雑音情報分析部
４０２は雑音の特徴パタンをもとめる代わりに、入力音
声のＳ／Ｎを求めることも可能である。また、本出願人
が先に提案した特願平3-329063号で述べたように、雑音
処理部と標準パタン選択部を共に設けることも可能であ
る。

【００２３】このように、雑音処理部や複数種類の標準
パタンを設けることによって、騒音環境下において顔か
ら離して使用する場合でも、雑音による認識誤りを減少
させることができる。これらによりそれぞれを単独で用
いたものよりもより耐雑音性の高い認識が可能となる。

【００２４】上述したように、照合部１４０では類似度
が閾値以上のものを認識候補として制御部１０７に入力
し、制御部１０７はセンサ部１０６により得られた距離
情報に基づいて、音声による出力と表示部による出力と
を随時切り替える。ここで、音声と表示のそれぞれの出
力例について、電話機における音声ダイヤルを例にとっ
て説明する。

【００２５】図５に、音声入力に対する音声出力および
表示部出力の出力例を示す。この図において、認識結果
１００１は、音声入力に対して照合部１０４から制御部
１０７へ入力される認識結果である。音声出力例１００
２は、音声として出力する場合の出力例を示し、表示部
出力例１００３は、表示として出力する場合の出力例を
示す。

【００２６】これらの出力例について、３つのケースに
分けて説明する。ケース１は、認識候補が見つからず、
リジェクト信号が発生した場合である。この場合、音声
出力では「もう一度お願いします。」と出力し、表示部
出力では「もう一度お願いします。」と表示することに
より、使用者に再入力を促す。ケース２では、認識候補
が１つ(“ながた”）である場合を示す。この場合、音
声で出力するときには「“ながた”さんに電話をしま
す。」と出力し、表示部に出力するときには「“なが
た”さんに電話をします。」と表示するとともに、選択
肢「１はい」、「０いいえ」を表示する。ケース３
は、認識候補が複数ある場合（“ながた”、“なか
た”、“たかだ”）を示す。この場合、音声で出力する
ときには、第１位認識候補のみを採用し「“ながた”さ
んに電話をします。」と出力する。一方、表示部に表示
するときには、「電話したい人を選択してください。」
と表示し、複数の選択候補「１ながた」、「２なか
た」、「３たかだ」および「０取消」を表示する。

【００２７】なお、以上説明した出力例は単に説明のた
めのものであり、本発明はこれに限定されるものではな
い。また、音声ダイヤルを例にとって説明したが、音声
ダイヤル以外の用途にも適用可能である。

【００２８】次に、図６に、制御部１０７の処理フロー
を示す。制御部１０７は、照合部１０４より認識結果が
入力されると（２００１）、入力された認識結果が認識
候補であるかリジェクト信号であるかを判断し（２００
２）、認識候補が存在しない場合は使用者に再入力を促
す。再入力の誘導を音声で行うか表示で行うかは、セン
サ部１０６で特定された距離情報を用い、これを予め定
められた閾値と比較して判断する（２００３）。もし距
離が閾値より小さい場合は、リジェクト信号を音声合成
部１０８に送り、音声出力により再入力を促す（２００
４）。距離が閾値以上の場合には、リジェクト信号を表
示部１１１に送り表示部より再入力を促す（２００
５）。

【００２９】一方、認識候補が存在する場合も同様に、
距離と閾値とを比較して認識候補の提示方法を切り替え
る。

【００３０】まず、認識結果を音声により出力する場合
について考える。認識結果を音声により出力した後（２
００７）、制御部１０７は照合部１０４より再び認識結
果が入力されるのを一定時間待つ（２００８）。もし再
び認識結果が入力された場合は、提示した認識候補が誤
っていたと判断し、認識候補を棄却するとともに（２０
０９）、新たな認識認識結果に対して処理２００２から
実行する。また、一定時間入力がない場合は、提示した
認識候補が正しいと判断し、認識結果を実行する（２０
１０）。

【００３１】次に、表示部１１１に認識候補を出力する
場合について考える。この場合、表示部１１１には選択
を促すガイダンスとともに、認識候補が表示される（２
０１１）。選択ボタン１１２により認識候補が選択され
ると（２０１３）、選択された認識結果を実行する（２
０１０）。また、取消しボタン選択等により認識結果が
選択されなかった場合は（２０１３）、再び処理２００
１に戻り、再度認識結果が入力されるのを待つ。

【００３２】以上、本実施例では、顔との距離の閾値を
境に認識結果の提示方法を完全に切り替えた例で説明し
てきたが、顔との距離が閾値の近傍である場合は両方の
提示を同時に行うことも可能である。また、顔との距離
に応じて音声入力部１０１の利得や音声出力部１１０の
出力レベルを可変にすることも可能である。また、本実
施例の変形として、センサ部１０６で距離を計測する代
わりに音声入力部１０１に入力された音声の大きさを用
いることも可能である。つまり、音声の入力レベルは口
と音声入力部１０１との距離の二乗に反比例しているの
で、うまく閾値を設定することが出来れば同様の効果が
期待できる。また同様に、認識結果を音声で出力する
か、表示部に表示するかを使用者が選択できるようなス
イッチを用いることも可能である。以上のような変形
は、センサ部１０６を必要としないため、デザイン上の
制約が少なくなり、かつ製造コストを安くできるという
利点もある。

【００３３】

【発明の効果】以上述べたように、本発明によれば、口
許で操作する場合は騒音下でも充分なＳ／Ｎが確保で
き、かつディスプレイを見なくとも音声により認識結果
を確認することができる。また、口許から離して使用す
る場合には、ディスプレイにより認識候補の確認が可能
であるため、類似した認識候補がある場合でも使用者が
正しい候補を選択することができる。従って、使用者は
目的や使用環境に応じて使い分けることにより、騒音が
多い場所では口許に近付けて操作することで充分なＳ／
Ｎを確保し高い認識性能が得られ、比較的騒音の少ない
ところでは口許から離して表示部で複数の認識候補を確
認することができるため、大語彙の認識や類似語が多く
含まれている認識でもエラリカバリが容易である。この
ため、認識誤りによるストレスをほとんど生じずに操作
を遂行することができる。

【図面の簡単な説明】

【図１】本発明の一実施例の構成を示すブロック図であ
る。

【図２】実施例における電話機の外観図である。

【図３】図１の構成に追加することができる雑音処理部
の構成を示すブロック図である。

【図４】図１の構成に追加することができる標準パタン
選択部の構成を示すブロック図である。

【図５】実施例における音声入力に対する出力例の説明
図である。

【図６】図１に示した制御部の処理フローを示すフロー
チャートである。

【符号の説明】

１０１…音声入力部、１０２…Ａ／Ｄ変換部、１０３…
分析部、１０４…照合部、１０５…標準パタン、１０６
…センサ部、１０７…制御部、１０８…音声合成部、１
０９…Ｄ／Ａ変換部、１１０…音声出力部、１１１…表
示部、１１２…選択部。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁵ 識別記号庁内整理番号ＦＩ技術表示箇所Ｇ０６Ｆ 3/16 Ｄ 7165−5ＢＧ１０Ｌ 3/02 ３０１Ｂ 9379−5ＨＤ 9379−5Ｈ

Claims

【特許請求の範囲】

【請求項１】音声認識機能を備えた携帯端末装置であっ
て、認識対象となる音声を入力する音声入力部と、該音声入力部より得られた入力音声を認識する音声認識
部と、前記音声入力部と使用者との距離を計測するセンサ部
と、少なくとも前記音声認識部での認識結果に基づく音声を
合成する音声合成部と、該合成された音声を再生するための音声出力部と、前記認識結果を表示するための表示部と、前記センサ部で計測された距離が予め定義した閾値より
も小さい場合には前記音声出力部より認識結果を提示
し、前記距離が前記閾値以上の場合には前記表示部に認
識結果を提示する制御部とを備えたことを特徴とする携
帯型端末装置。
【請求項２】前記センサ部を異なる場所に複数個設けた
ことを特徴とする請求項１記載の携帯型端末装置。
【請求項３】前記センサ部で計測された距離に応じて前
記音声入力部の利得を変えることを特徴とする請求項１
記載の携帯型端末装置。
【請求項４】前記センサ部で計測された距離に応じて前
記音声出力部の音量を変えることを特徴とする請求項１
記載の携帯型端末装置。
【請求項５】前記入力信号を周波数分析し、該周波数分
析された音声スペクトルに対し推定雑音スペクトルを引
き算することにより、雑音を除去する雑音処理部を設
け、前記センサ部で計測された距離が予め定義した閾値
よりも大きいときは、前記雑音処理部において雑音を除
去することを特徴とする請求項１記載の携帯型端末装
置。
【請求項６】前記センサ部で計測された距離の大きさに
応じて、前記雑音処理部における雑音除去の大きさを調
節することを特徴とする請求項５記載の携帯型端末装
置。
【請求項７】前記音声認識部において、予め想定される
騒音環境に応じた雑音重畳データを用いて作成した少な
くとも１種類の標準パタンを用意しておき、前記センサ
部で計測された距離が予め定義した閾値よりも大きい場
合には、前記雑音重畳データを用いて作成した標準パタ
ンを使用することを特徴とする請求項１または５記載の
携帯型端末装置。
【請求項８】前記認識結果は、前記音声出力部より提示
する場合は１位候補のみを提示し、前記表示部により提
示する場合は認識候補を複数個提示することを特徴とす
る請求項１記載の携帯型端末装置。
【請求項９】前記音声認識部で認識した音声命令に従っ
た処理を行う命令実行部を有し、前記音声出力部より認
識候補を提示した後に一定時間入力がない場合、前記命
令実行部は第１位の認識候補の音声命令に従った処理を
実行することを特徴とする請求項１記載の携帯型端末装
置。
【請求項１０】前記距離センサにより計測される値を用
いる代わりに、前記音声入力部から入力した音声の入力
レベルの大きさを用いることを特徴とする請求項１記載
の携帯型端末装置。
【請求項１１】前記センサで距離を計測する代わりに、
認識結果を音声で出力するか、表示部に表示するかを選
択するスイッチを備えたことを特徴とする請求項１記載
の携帯型端末装置。