JPH06124097A - 携帯型端末装置 - Google Patents

携帯型端末装置

Info

Publication number
JPH06124097A
JPH06124097A JP4274609A JP27460992A JPH06124097A JP H06124097 A JPH06124097 A JP H06124097A JP 4274609 A JP4274609 A JP 4274609A JP 27460992 A JP27460992 A JP 27460992A JP H06124097 A JPH06124097 A JP H06124097A
Authority
JP
Japan
Prior art keywords
voice
unit
recognition
terminal device
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4274609A
Other languages
English (en)
Inventor
Hiroaki Kokubo
浩明 小窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4274609A priority Critical patent/JPH06124097A/ja
Publication of JPH06124097A publication Critical patent/JPH06124097A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】 音声認識機能を備えた携帯端末装置であっ
て、認識対象となる音声を入力する音声入力部101
と、該音声入力部より得られた入力音声を認識する音声
認識部103〜105と、入力部と使用者との距離を計
測するセンサ部106と、少なくとも音声認識部での認
識結果に基づく音声を合成する音声合成部108と、該
合成された音声を再生するための音声出力部110と、
認識結果を表示するための表示部111と、センサ部で
計測された距離が予め定義した閾値よりも小さい場合に
は音声出力部より認識結果を提示し、閾値以上の場合に
は表示部に認識結果を提示する制御部107とを備え
た。 【効果】 口許で操作する場合は騒音下でも充分なS/
Nが確保でき、かつディスプレイを見なくとも音声によ
り認識結果を確認することができる。また、口許から離
して使用する場合には、ディスプレイにより認識候補を
確認することができるため、使用者は目的や使用環境に
応じて使い分けることが出来る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識機能を備えた
携帯型端末装置に係り、特に騒音下でも使用可能な携帯
型端末装置装置に関する。
【0002】
【従来の技術】携帯電話に代表される小型携帯型端末装
置では、小型故に操作ボタンの数や大きさは限定されて
くる。従ってこのような装置にはボタンにより操作する
よりも、手書き文字や音声等を用いた操作が望まれてい
る。
【0003】音声認識の問題点は、音声のもつあいまい
さのため必ずしも常に正しく認識できるとは限らないこ
とと、騒音環境下で使用すると周囲雑音のため認識性能
が大幅に劣化してしまう点である。前者は大語彙の認識
や類似単語の多い認識の場合には特に問題となる。この
ような認識誤りによる誤操作を防ぐために、誤って認識
してしまった時でも次候補を呈示するなどしてうまくエ
ラーリカバリーすることが必要である。
【0004】また、音声認識機能を備えた携帯型端末装
置を実用化するためには騒音下で発声した音声でも正し
く認識出来るような耐雑音化の技術も不可欠である。騒
音環境下で発声した音声を正しく認識させる手段として
は前処理によって雑音が重畳した音声から雑音を除去す
る手法、あるいは雑音が重畳されてた音声でも正しく認
識できる認識手法が必要である。前者は適応フィルタを
用いて雑音を除去するもの、音声に混入した雑音スペク
トルを推定し、入力スペクトルから差し引くスペクトル
サブトラクション法などがある。後者には雑音の影響を
受けにくいパラメータや距離尺度を用いる手法、および
雑音を予め標準パタンに重畳しておく雑音重畳法などが
ある。しかしながら、数多くの雑音処理手法が提案され
ているものの、依然静かな環境下での認識性能と比較す
ると十分とは言えず、最良の騒音対策は接話型マイクロ
フォン等を用いてなるべく入力音声のS/Nを向上させ
ることである。
【0005】
【発明が解決しようとする課題】誤りなく認識結果の確
認を行うためには、ディスプレイに表示された認識結果
を確認する手法や複数の認識候補の中から使用者に選択
させる手法が望ましく、また騒音環境下でも正しく認識
できるためには、接話型マイクロフォンのように、なる
べく口とマイクとの距離を小さくしてS/Nを向上させ
ることが必要である。然るに、小型携帯型端末装置で
は、携帯性および使い勝手を損なわずにマイクと表示部
を分離させることは不可能に近く、マイクを口許に近付
けて使用する場合では表示部を目で確認することは困難
である。一方、表示部で認識結果を確認する目的で口許
から離れた位置で操作を行う場合、騒音の多い場所では
十分なS/Nが確保できず、満足できる認識性能を確保す
ることは難しい。
【0006】本発明の目的は、音声認識機能を備えた携
帯型端末装置において、騒音が多い場所など確認操作の
容易さよりも認識率の向上が優先するような場合には口
許に近付けて操作することができ、比較的騒音の少ない
ところでは口許から離して表示部で認識結果を確認しな
がら操作ができるよう、目的や使用環境に応じて使用者
が使い分けが出来るようにすることにある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明による携帯型端末装置は、音声認識機能を備
えた携帯端末装置であって、認識対象となる音声を入力
する音声入力部と、該音声入力部より得られた入力音声
を認識する音声認識部と、前記音声入力部と使用者との
距離を計測するセンサ部と、少なくとも前記音声認識部
での認識結果に基づく音声を合成する音声合成部と、該
合成された音声を再生するための音声出力部と、前記認
識結果を表示するための表示部と、前記センサ部で計測
された距離が予め定義した閾値よりも小さい場合には前
記音声出力部より認識結果を提示し、前記距離が前記閾
値以上の場合には前記表示部に認識結果を提示する制御
部とを備えたことを特徴とする。
【0008】
【作用】本発明には数々の変形が考えられるが、その中
で代表的な手段についてその作用を説明する。
【0009】センサ部で計測された距離が予め定めれた
閾値よりも小さい場合には音声出力部より認識結果を提
示し、逆に閾値以上の場合には表示部に認識結果を提示
する。これにより、口許で操作する場合は騒音下でも充
分なS/Nが確保でき、かつ表示部(ディスプレイ)を
見なくとも音声により認識結果を確認することができ
る。また、口許から離して使用する場合には、表示部に
よる認識候補の確認が可能であるため、類似した認識候
補がある場合でも使用者が選択することができる。従っ
て、使用者は目的や使用環境に応じて使い分けることに
より、騒音が多い場所では口許に近付けて操作すること
で充分なS/Nを確保し高い認識性能が得られ、比較的
騒音の少ないところでは口許から離して表示部で複数の
認識候補を確認することができる。このため、大語彙の
認識や類似語が多く含まれている認識でもエラリカバリ
が容易である。このため、認識誤りによるストレスをほ
とんど生じずに操作を遂行することができる。
【0010】
【実施例】以下、本発明の実施例を図面により詳細に説
明する。
【0011】図1に、本発明による音声認識機能を備え
た携帯型端末装置の一実施例の構成を示すブロック図で
ある。本実施例では、図2にその外観を示すように、携
帯電話を例にとって説明する。但し、本発明は、携帯電
話以外に電子手帳、リモコン装置等の小型携帯端末にも
同様に適用することが可能である。
【0012】図1、図2において、101は音声入力
部、102はA/D変換部、103は分析部、104は
照合部、105は標準パタン、106はセンサ部、10
7は制御部、108は音声合成部、109はD/A変換
部、110は音声出力部、111は表示部、112は選
択ボタン、113は命令実行部である。音声入力部10
1は音声コマンド等の音声を入力する部分である。音声
入力部101より入力した音声信号は、A/D変換部1
02により量子化され、分析部103に入る。分析部1
03では、LPC分析等の公知の分析手法を用いて認識
の判定に用いる音声の特徴ベクトルを抽出する。音声の
特長抽出法については、古井“ディジタル音声処理”東
海大学出版会などに詳しい。分析部103で抽出した特
徴ベクトルに対して、照合部104で、認識対象語彙の
特徴ベクトルから成る標準パタン105との類似度を計
算することで認識候補を求め、上位の認識候補を認識結
果として制御部107に出力する。照合部104は、第
1位認識候補の類似度がある一定値を満足しなかった場
合は、認識候補のかわりにリジェクト信号を認識結果と
して出力する。
【0013】センサ部106は、使用者と装置との距離
を測定するためのものであり、赤外線センサや超音波セ
ンサ等の距離センサを使用することで容易に実現でき
る。センサ部106は、その機能上は1つ存在すれば足
りるが、手に持ったときに覆い隠してしまう可能性を考
慮して、図2に示したように相互に離れた位置に少なく
とも2個設置することが好ましい。
【0014】制御部107は、センサ部106で求めた
距離情報を用いて認識結果の提示法などを制御する。す
なわち、制御部107に入力された距離値がある閾値よ
りも小さい場合は認識結果を音声合成部108に渡し、
逆に距離が閾値よりも大きい場合は表示部111に渡
す。
【0015】まず、入力された距離が小さい場合につい
て先に説明する。制御部107は認識結果を音声合成部
108に渡し、第1位の認識候補の音声を合成する。ま
た、音声合成部108にリジェクト信号が入力されたと
きには、再入力を促すガイダンスの音声を合成する。ガ
イダンス音声とは、例えば「もう一度お願いします」と
いったものである。もちろん予め再生用の音声データを
格納しておけば、音声合成部は不用である。音声合成部
108で合成された音声はD/A変換部109によりア
ナログ信号に変換された後、音声出力部110より再生
される。制御部107は音声合成部108に認識結果を
渡した後、照合部104より新たな認識結果が入力して
きた場合、過去の認識結果を棄却し認識結果を更新す
る。また、認識結果を出力した後一定時間音声の入力が
無いと、制御部107は認識結果を命令実行部113に
出力する。これにより、使用者は音声出力部110より
出力した認識候補が誤っている場合、または再入力を施
すガイダンス音声であった場合は、再度、音声入力部1
01より音声コマンドを入力し直すことが可能となる。
命令実行部113は、音声命令を実行する部分であり、
例えば音声ダイヤルのダイヤル部がこれに相当する。
【0016】次に、制御部107に入力された距離が閾
値よりも大きい値の場合について説明する。表示部11
1は、制御部107より入力された認識結果を文字情報
として表示するためのものである。表示部111で提示
する認識結果は第1位候補のみを提示する以外にも、類
似した認識候補を複数同時に提示することも可能であ
る。例えば、類似度の大きい上位3位までを提示した
り、照合部104で求めた類似度がある値以上のもの提
示するといった応用が考えられる。表示部111で提示
された認識結果に対する確認は選択ボタン112によっ
て行われる。例えば、提示された認識結果が第1位候補
のみの場合は、確認ボタンまたは取り消しボタンを押す
ことによって、複数候補が提示された場合は各候補に対
応付けられたボタンを選択することによってである。な
お、選択ボタン112は、同様な機能が機能が備わって
いれば必ずしもボタンである必要はなく、例えば表示部
111にタッチセンサをつけたようなものでもよい。ま
た、使用者はボタンを選択する代わりに音声入力101
より再び音声コマンドを入力することも可能である。制
御部107は選択ボタン112により正しい認識候補が
確定した時点で命令実行部113に認識結果を出力す
る。
【0017】この様に、本実施例によれば、装置を顔に
近付けた場合には音声出力部より認識結果を提示し、顔
から離した場合には表示部に認識結果を提示するため、
口許で操作する場合は騒音下でも充分なS/Nが確保で
き、かつディスプレイを見なくとも音声により認識結果
を確認することができる。また、口許から離して使用す
る場合には、ディスプレイにより認識候補の確認が可能
であるため、類似した認識候補がある場合でも使用者が
正しい候補を選択することができる。従って、使用者は
目的や使用環境に応じて使い分けることにより、騒音が
多い場所では口許に近付けて操作することで充分なS/
Nを確保し高い認識性能が得られ、比較的騒音の少ない
ところでは口許から離して表示部で複数の認識候補を確
認することができるため、大語彙の認識や類似語が多く
含まれている認識でもエラリカバリが容易である。この
ため、認識誤りによるストレスをほとんど生じずに操作
を遂行することができる。
【0018】上述の実施例では音声入力部101を口許
に近付けることでS/Nを改善し、騒音環境下での認識
率の向上を図っているが、分析部103の前に雑音処理
部を設けることで、口許から離して操作する場合でもあ
る程度の認識率の向上が図れることは言うまでもない。
図3に、雑音処理部の構成の一例を示す。この雑音処理
部では、スペクトルサブトラクション法と呼ばれる手法
を用いて雑音の除去を行なっている。スペクトルサブト
ラクションについては、S.F.Boll,"Suppression of Aco
ustic Noise in Speech Using Spectral Subtraction",
IEEE Trsns. onAcoustics, Speech, and Signal proces
sing, Vol.ASSP-27,No.2,April 1979,pp.113-120に詳し
い。図3において、301は波形切り出し部、302は
フーリエ変換部、303は雑音スペクトル推定部、30
4はサブトラクション部、305はフーリエ逆変換部、
306は波形合成部である。A/D変換部102から出
力されたディジタル信号は波形切り出し部301に入力
する。波形切り出し部301は、入力信号からスペクト
ル情報を分析するための波形区間を切り出すものであ
り、数十ms程度の区間を一定間隔で切り出す。切り出さ
れた区間信号波形は、フーリエ変換部302においてス
ペクトルデータに変換される。ここで、切り出された波
形にハミング窓等、従来用いられている窓関数を掛けた
後、前後に零データを埋め込み2の階乗点数のデータと
することで高速フーリエ変換を行うことが出来、高速な
データ処理が実現される。フーリエ変換されたスペクト
ル信号は雑音スペクトル推定部303に入力する。雑音
スペクトル推定部303は区間スペクトル信号のパワを
計算し、そのパワの値が一定時間以上閾値を下回る区間
を無音声区間とみなし、その区間のスペクトル信号を用
いて雑音スペクトルを推定する。無音声区間(音声区
間)の検出法にはこの他にも幾つもの手法が提案されて
おり、それらの手法を用いて無音声区間を検出すること
も可能である。無音声区間の信号を用いて雑音スペクト
ルの推定法についても幾つか考えられるが、例えば数フ
レーム分のスペクトルの平均スペクトルを計算するなど
して推定する。サブトラクション部304では入力スペ
クトル信号に対して雑音スペクトル推定部303で推定
された雑音スペクトルを用いてスペクトルの引き算を行
なう。いま、入力音声のスペクトルをX(f)、推定雑音ス
ペクトルをN(f)とするとサブトラクションは次式で表さ
れる。
【0019】
【数1】
【0020】数1におけるαはサブトラクション係数と
呼ばれ、この値を大きくするほど雑音除去の効果が大き
くなる。しかし、αを大きくし過ぎると音声成分までも
除去されてしまうため、値の選択には注意が必要であ
る。本実施例ではセンサ部106で計測された距離が大
きいほどS/Nが悪化していると判断し、αの値を大き
くすることが可能である。また、数1ではスペクトルの
振幅に対して引き算を行なっているが、パワスペクトラ
ムを用いて引き算を行なったり、位相成分も入れて引き
算を行なうといったことも可能である。
【0021】サブトラクション部304で雑音成分を除
去したスペクトルは、フーリエ逆変換部305で再び時
間領域の信号に変換され、フレーム単位で切り出されて
いるフレーム波形データは波形合成部306で再びもと
の音声波形として合成され、分析部103に出力され
る。もちろん雑音処理部のフレーム周期と分析部103
のフレーム周期とを一致させておけば、波形合成部30
6を用いずにフレームデータをそのまま分析部103に
出力することが可能である。
【0022】また、雑音環境に合わせた標準パタンを複
数種類用意しておき、使用環境に応じて選択することで
も騒音環境下での認識率を改善することができる。図4
に、標準パタン選択部の構成の一例を示す。図4におい
て、401は音声区間検出部、402は雑音情報分析
部、403は標準パタン格納部、404は雑音情報照合
部である。標準パタン作成に用いる音声データは認識装
置の使用環境に合わせて音声に雑音を重畳したものを用
いる。雑音処理部106より出力された雑音除去信号
は、音声区間検出部401において音声区間信号と雑音
区間信号とに分離される。雑音情報分析部402では、
入力された雑音成分を分析し、その分析パラメータを出
力する。標準パタン格納部403は、種類の異なった雑
音をそれぞれ重畳した音声データより作成した数種類の
標準パタンと作成に用いた音声データに重畳した雑音成
分の特徴量を格納してある。雑音成分の特徴量は雑音情
報分析部402で用いたものと同じ分析手法を用いる。
雑音情報照合部404は、雑音処理信号の雑音成分の特
徴量と標準パタン格納部403に格納されている重畳雑
音の特徴量とを照合し、その照合結果から標準パタン格
納部403にある標準パタンの中から雑音処理信号の雑
音成分と最も近い雑音を重畳した音声を用いて作成した
標準パタンを選択し、出力する。また、雑音情報分析部
402は雑音の特徴パタンをもとめる代わりに、入力音
声のS/Nを求めることも可能である。また、本出願人
が先に提案した特願平3-329063号で述べたように、雑音
処理部と標準パタン選択部を共に設けることも可能であ
る。
【0023】このように、雑音処理部や複数種類の標準
パタンを設けることによって、騒音環境下において顔か
ら離して使用する場合でも、雑音による認識誤りを減少
させることができる。これらによりそれぞれを単独で用
いたものよりもより耐雑音性の高い認識が可能となる。
【0024】上述したように、照合部140では類似度
が閾値以上のものを認識候補として制御部107に入力
し、制御部107はセンサ部106により得られた距離
情報に基づいて、音声による出力と表示部による出力と
を随時切り替える。ここで、音声と表示のそれぞれの出
力例について、電話機における音声ダイヤルを例にとっ
て説明する。
【0025】図5に、音声入力に対する音声出力および
表示部出力の出力例を示す。この図において、認識結果
1001は、音声入力に対して照合部104から制御部
107へ入力される認識結果である。音声出力例100
2は、音声として出力する場合の出力例を示し、表示部
出力例1003は、表示として出力する場合の出力例を
示す。
【0026】これらの出力例について、3つのケースに
分けて説明する。ケース1は、認識候補が見つからず、
リジェクト信号が発生した場合である。この場合、音声
出力では「もう一度お願いします。」と出力し、表示部
出力では「もう一度お願いします。」と表示することに
より、使用者に再入力を促す。ケース2では、認識候補
が1つ(“ながた”)である場合を示す。この場合、音
声で出力するときには「“ながた”さんに電話をしま
す。」と出力し、表示部に出力するときには「“なが
た”さんに電話をします。」と表示するとともに、選択
肢「1 はい」、「0 いいえ」を表示する。ケース3
は、認識候補が複数ある場合(“ながた”、“なか
た”、“たかだ”)を示す。この場合、音声で出力する
ときには、第1位認識候補のみを採用し「“ながた”さ
んに電話をします。」と出力する。一方、表示部に表示
するときには、「電話したい人を選択してください。」
と表示し、複数の選択候補「1 ながた」、「2 なか
た」、「3 たかだ」および「0取消」を表示する。
【0027】なお、以上説明した出力例は単に説明のた
めのものであり、本発明はこれに限定されるものではな
い。また、音声ダイヤルを例にとって説明したが、音声
ダイヤル以外の用途にも適用可能である。
【0028】次に、図6に、制御部107の処理フロー
を示す。制御部107は、照合部104より認識結果が
入力されると(2001)、入力された認識結果が認識
候補であるかリジェクト信号であるかを判断し(200
2)、認識候補が存在しない場合は使用者に再入力を促
す。再入力の誘導を音声で行うか表示で行うかは、セン
サ部106で特定された距離情報を用い、これを予め定
められた閾値と比較して判断する(2003)。もし距
離が閾値より小さい場合は、リジェクト信号を音声合成
部108に送り、音声出力により再入力を促す(200
4)。距離が閾値以上の場合には、リジェクト信号を表
示部111に送り表示部より再入力を促す(200
5)。
【0029】一方、認識候補が存在する場合も同様に、
距離と閾値とを比較して認識候補の提示方法を切り替え
る。
【0030】まず、認識結果を音声により出力する場合
について考える。認識結果を音声により出力した後(2
007)、制御部107は照合部104より再び認識結
果が入力されるのを一定時間待つ(2008)。もし再
び認識結果が入力された場合は、提示した認識候補が誤
っていたと判断し、認識候補を棄却するとともに(20
09)、新たな認識認識結果に対して処理2002から
実行する。また、一定時間入力がない場合は、提示した
認識候補が正しいと判断し、認識結果を実行する(20
10)。
【0031】次に、表示部111に認識候補を出力する
場合について考える。この場合、表示部111には選択
を促すガイダンスとともに、認識候補が表示される(2
011)。選択ボタン112により認識候補が選択され
ると(2013)、選択された認識結果を実行する(2
010)。また、取消しボタン選択等により認識結果が
選択されなかった場合は(2013)、再び処理200
1に戻り、再度認識結果が入力されるのを待つ。
【0032】以上、本実施例では、顔との距離の閾値を
境に認識結果の提示方法を完全に切り替えた例で説明し
てきたが、顔との距離が閾値の近傍である場合は両方の
提示を同時に行うことも可能である。また、顔との距離
に応じて音声入力部101の利得や音声出力部110の
出力レベルを可変にすることも可能である。また、本実
施例の変形として、センサ部106で距離を計測する代
わりに音声入力部101に入力された音声の大きさを用
いることも可能である。つまり、音声の入力レベルは口
と音声入力部101との距離の二乗に反比例しているの
で、うまく閾値を設定することが出来れば同様の効果が
期待できる。また同様に、認識結果を音声で出力する
か、表示部に表示するかを使用者が選択できるようなス
イッチを用いることも可能である。以上のような変形
は、センサ部106を必要としないため、デザイン上の
制約が少なくなり、かつ製造コストを安くできるという
利点もある。
【0033】
【発明の効果】以上述べたように、本発明によれば、口
許で操作する場合は騒音下でも充分なS/Nが確保で
き、かつディスプレイを見なくとも音声により認識結果
を確認することができる。また、口許から離して使用す
る場合には、ディスプレイにより認識候補の確認が可能
であるため、類似した認識候補がある場合でも使用者が
正しい候補を選択することができる。従って、使用者は
目的や使用環境に応じて使い分けることにより、騒音が
多い場所では口許に近付けて操作することで充分なS/
Nを確保し高い認識性能が得られ、比較的騒音の少ない
ところでは口許から離して表示部で複数の認識候補を確
認することができるため、大語彙の認識や類似語が多く
含まれている認識でもエラリカバリが容易である。この
ため、認識誤りによるストレスをほとんど生じずに操作
を遂行することができる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】実施例における電話機の外観図である。
【図3】図1の構成に追加することができる雑音処理部
の構成を示すブロック図である。
【図4】図1の構成に追加することができる標準パタン
選択部の構成を示すブロック図である。
【図5】実施例における音声入力に対する出力例の説明
図である。
【図6】図1に示した制御部の処理フローを示すフロー
チャートである。
【符号の説明】
101…音声入力部、102…A/D変換部、103…
分析部、104…照合部、105…標準パタン、106
…センサ部、107…制御部、108…音声合成部、1
09…D/A変換部、110…音声出力部、111…表
示部、112…選択部。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 G06F 3/16 D 7165−5B G10L 3/02 301 B 9379−5H D 9379−5H

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】音声認識機能を備えた携帯端末装置であっ
    て、 認識対象となる音声を入力する音声入力部と、 該音声入力部より得られた入力音声を認識する音声認識
    部と、 前記音声入力部と使用者との距離を計測するセンサ部
    と、 少なくとも前記音声認識部での認識結果に基づく音声を
    合成する音声合成部と、 該合成された音声を再生するための音声出力部と、 前記認識結果を表示するための表示部と、 前記センサ部で計測された距離が予め定義した閾値より
    も小さい場合には前記音声出力部より認識結果を提示
    し、前記距離が前記閾値以上の場合には前記表示部に認
    識結果を提示する制御部とを備えたことを特徴とする携
    帯型端末装置。
  2. 【請求項2】前記センサ部を異なる場所に複数個設けた
    ことを特徴とする請求項1記載の携帯型端末装置。
  3. 【請求項3】前記センサ部で計測された距離に応じて前
    記音声入力部の利得を変えることを特徴とする請求項1
    記載の携帯型端末装置。
  4. 【請求項4】前記センサ部で計測された距離に応じて前
    記音声出力部の音量を変えることを特徴とする請求項1
    記載の携帯型端末装置。
  5. 【請求項5】前記入力信号を周波数分析し、該周波数分
    析された音声スペクトルに対し推定雑音スペクトルを引
    き算することにより、雑音を除去する雑音処理部を設
    け、前記センサ部で計測された距離が予め定義した閾値
    よりも大きいときは、前記雑音処理部において雑音を除
    去することを特徴とする請求項1記載の携帯型端末装
    置。
  6. 【請求項6】前記センサ部で計測された距離の大きさに
    応じて、前記雑音処理部における雑音除去の大きさを調
    節することを特徴とする請求項5記載の携帯型端末装
    置。
  7. 【請求項7】前記音声認識部において、予め想定される
    騒音環境に応じた雑音重畳データを用いて作成した少な
    くとも1種類の標準パタンを用意しておき、前記センサ
    部で計測された距離が予め定義した閾値よりも大きい場
    合には、前記雑音重畳データを用いて作成した標準パタ
    ンを使用することを特徴とする請求項1または5記載の
    携帯型端末装置。
  8. 【請求項8】前記認識結果は、前記音声出力部より提示
    する場合は1位候補のみを提示し、前記表示部により提
    示する場合は認識候補を複数個提示することを特徴とす
    る請求項1記載の携帯型端末装置。
  9. 【請求項9】前記音声認識部で認識した音声命令に従っ
    た処理を行う命令実行部を有し、前記音声出力部より認
    識候補を提示した後に一定時間入力がない場合、前記命
    令実行部は第1位の認識候補の音声命令に従った処理を
    実行することを特徴とする請求項1記載の携帯型端末装
    置。
  10. 【請求項10】前記距離センサにより計測される値を用
    いる代わりに、前記音声入力部から入力した音声の入力
    レベルの大きさを用いることを特徴とする請求項1記載
    の携帯型端末装置。
  11. 【請求項11】前記センサで距離を計測する代わりに、
    認識結果を音声で出力するか、表示部に表示するかを選
    択するスイッチを備えたことを特徴とする請求項1記載
    の携帯型端末装置。
JP4274609A 1992-10-13 1992-10-13 携帯型端末装置 Pending JPH06124097A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4274609A JPH06124097A (ja) 1992-10-13 1992-10-13 携帯型端末装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4274609A JPH06124097A (ja) 1992-10-13 1992-10-13 携帯型端末装置

Publications (1)

Publication Number Publication Date
JPH06124097A true JPH06124097A (ja) 1994-05-06

Family

ID=17544117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4274609A Pending JPH06124097A (ja) 1992-10-13 1992-10-13 携帯型端末装置

Country Status (1)

Country Link
JP (1) JPH06124097A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09292895A (ja) * 1996-04-25 1997-11-11 Matsushita Electric Ind Co Ltd ヒューマン・マシン・インタフェース装置
JP2003271193A (ja) * 2002-03-14 2003-09-25 Denso Corp 車載用電子機器、車載用電子機器の音声認識結果報知方法、音声認識確認通知用プログラム及びナビゲーションシステム
US7050974B1 (en) * 1999-09-14 2006-05-23 Canon Kabushiki Kaisha Environment adaptation for speech recognition in a speech communication system
US7221622B2 (en) 2003-01-22 2007-05-22 Fujitsu Limited Speaker distance detection apparatus using microphone array and speech input/output apparatus
JP2010204266A (ja) * 2009-03-02 2010-09-16 Fujitsu Ltd 音響信号変換装置、方法、及びプログラム
US7895534B2 (en) 2003-12-11 2011-02-22 Canon Kabushiki Kaisha Information processing apparatus, control method therefor, and program
JP2011175265A (ja) * 1998-05-25 2011-09-08 Nokia Corp ユーザの発話を認識するための方法及び装置
KR20150137050A (ko) * 2013-04-03 2015-12-08 엘지전자 주식회사 모바일 디바이스 및 그 제어 방법
CN105869639A (zh) * 2016-03-21 2016-08-17 广东小天才科技有限公司 一种语音识别的方法及系统
WO2016157658A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム
CN107197098A (zh) * 2017-06-12 2017-09-22 联想(北京)有限公司 一种通话控制方法和电子设备
JP2018031985A (ja) * 2016-08-26 2018-03-01 恒次 國分 音声認識補完システム
JP2018185075A (ja) * 2017-04-25 2018-11-22 株式会社パロマ コンロ
JP2021135648A (ja) * 2020-02-26 2021-09-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09292895A (ja) * 1996-04-25 1997-11-11 Matsushita Electric Ind Co Ltd ヒューマン・マシン・インタフェース装置
JP2011175265A (ja) * 1998-05-25 2011-09-08 Nokia Corp ユーザの発話を認識するための方法及び装置
JP2015018276A (ja) * 1998-05-25 2015-01-29 ノキア コーポレイション ユーザの発話を認識するための方法及び装置
US7050974B1 (en) * 1999-09-14 2006-05-23 Canon Kabushiki Kaisha Environment adaptation for speech recognition in a speech communication system
JP2003271193A (ja) * 2002-03-14 2003-09-25 Denso Corp 車載用電子機器、車載用電子機器の音声認識結果報知方法、音声認識確認通知用プログラム及びナビゲーションシステム
US7221622B2 (en) 2003-01-22 2007-05-22 Fujitsu Limited Speaker distance detection apparatus using microphone array and speech input/output apparatus
US7895534B2 (en) 2003-12-11 2011-02-22 Canon Kabushiki Kaisha Information processing apparatus, control method therefor, and program
JP2010204266A (ja) * 2009-03-02 2010-09-16 Fujitsu Ltd 音響信号変換装置、方法、及びプログラム
KR20150137050A (ko) * 2013-04-03 2015-12-08 엘지전자 주식회사 모바일 디바이스 및 그 제어 방법
WO2016157658A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム
WO2016158792A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム
CN105869639A (zh) * 2016-03-21 2016-08-17 广东小天才科技有限公司 一种语音识别的方法及系统
JP2018031985A (ja) * 2016-08-26 2018-03-01 恒次 國分 音声認識補完システム
JP2018185075A (ja) * 2017-04-25 2018-11-22 株式会社パロマ コンロ
CN107197098A (zh) * 2017-06-12 2017-09-22 联想(北京)有限公司 一种通话控制方法和电子设备
JP2021135648A (ja) * 2020-02-26 2021-09-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Similar Documents

Publication Publication Date Title
JP3452443B2 (ja) 騒音下音声認識装置及び騒音下音声認識方法
US6529866B1 (en) Speech recognition system and associated methods
EP1355296B1 (en) Keyword detection in a speech signal
US7634401B2 (en) Speech recognition method for determining missing speech
JPH06124097A (ja) 携帯型端末装置
US20030200090A1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
KR20050086378A (ko) 이동 장치의 다감각 음성 개선을 위한 방법 및 장치
JP4246703B2 (ja) 自動音声認識の方法
JPH11502953A (ja) 厳しい環境での音声認識方法及びその装置
US6032115A (en) Apparatus and method for correcting the difference in frequency characteristics between microphones for analyzing speech and for creating a recognition dictionary
JP3451146B2 (ja) スペクトルサブトラクションを用いた雑音除去システムおよび方法
CN111028845A (zh) 多音频识别方法、装置、设备及可读存储介质
CN113327620A (zh) 声纹识别的方法和装置
US7908142B2 (en) Apparatus and method for identifying prosody and apparatus and method for recognizing speech
JP4074543B2 (ja) 音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体
JPH0713591A (ja) 音声認識装置および音声認識方法
JP2009258366A (ja) 音声制御装置
Raczynski Speech processing algorithm for isolated words recognition
JP3837061B2 (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
Maazouzi et al. MFCC and similarity measurements for speaker identification systems
JP2000194392A (ja) 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体
JP3531342B2 (ja) 音声処理装置および音声処理方法
JP3106543B2 (ja) 音声信号処理装置
JP3098593B2 (ja) 音声認識装置
Sharma et al. Speech recognition of Punjabi numerals using synergic HMM and DTW approach