JP2003303093A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JP2003303093A
JP2003303093A JP2003044547A JP2003044547A JP2003303093A JP 2003303093 A JP2003303093 A JP 2003303093A JP 2003044547 A JP2003044547 A JP 2003044547A JP 2003044547 A JP2003044547 A JP 2003044547A JP 2003303093 A JP2003303093 A JP 2003303093A
Authority
JP
Japan
Prior art keywords
speaker
lip portion
voice
image
voice input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003044547A
Other languages
English (en)
Other versions
JP3729179B2 (ja
Inventor
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003044547A priority Critical patent/JP3729179B2/ja
Publication of JP2003303093A publication Critical patent/JP2003303093A/ja
Application granted granted Critical
Publication of JP3729179B2 publication Critical patent/JP3729179B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 安定した音声入力を達成すること。 【解決手段】 音声入力装置は、話者によって発声され
た入力音声を電気信号に変換して、その電気信号を出力
する音声入力部1と、その話者の口唇部分の位置と所定
の位置との間の空間的なずれを示す情報を表示する表示
部2とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声入力装置に関
し、特に、音声認識装置などの装置に安定した音声信号
を供給する音声入力装置に関する。
【0002】
【従来の技術】音声認識装置に音声を入力する場合、音
声入力装置として、ほとんどの場合マイクロフォンが使
用される。マイクロフォンの種類としては、手持ち型、
卓上型、ネクタイピン型、接話型(電話交換手などによ
って使用される頭に固定するタイプのもの)、受話器型
などがある。これらのマイクロフォンのうち、接話型又
は受話器型のマイクロフォンを使用した場合には、比較
的良好な音声認識性能が得られる。接話型又は受話器型
のマイクロフォンは、口とマイクロフォンとの間の距離
が近いからである。
【0003】また、他の音声入力装置として、マイクロ
フォンとテレビカメラとを用いて、音声と口唇部分の画
像あるいは顔画像とを取り込む装置が知られている(特
開昭60−188998号公報、特開昭62−2392
31号公報など)。これらの装置は、口唇部分の画像を
用いることにより、音声認識性能をさらに向上させるこ
とを狙ったものである。
【0004】図5は、音声認識装置用の従来の音声入力
装置の構成を示す。図5において、話者が発声した音声
は、マイクロフォンなどの音声入力部110によって音
声−電気変換され、その電気信号は音声認識装置に出力
される。また、話者の顔画像は、画像入力部120によ
って画像信号に変換される。口唇画像抽出部130は、
この画像信号から口唇部分に対応する信号を抽出して、
口唇部分に対応する信号のみを音声認識装置に出力す
る。
【0005】
【発明が解決しようとする課題】従来の音声入力装置
は、話者の口唇部分とマイクロフォンとの間の距離が一
定に保たれないため、安定した音声信号を音声認識装置
に供給することができないという問題点があった。この
ため、音声認識装置において、話者の口唇部分とマイク
ロフォンとの間の距離のばらつきを考慮して入力音声信
号を補正する必要があった。また、従来の音声入力装置
では、話者の顔画像から口唇部分の画像を抽出する必要
があった。しかし、特に、話者の顔が移動する場合に
は、かかる抽出を高い精度で実現することは困難である
という問題点があった。
【0006】本発明は、(1)安定した音声信号を音声
認識装置に供給する音声入力装置を提供すること、
(2)話者の顔画像から口唇部分の画像を抽出する処理
が不要な音声入力装置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の音声入力装置
は、話者によって発声された入力音声を電気信号に変換
して、該電気信号を出力する音声入力手段と、前記音声
入力手段近傍に配されて前記話者の口唇部分の画像を入
力する画像入力部と、該音声入力手段の位置に関連して
決定される所定の位置と該話者の口唇部分の位置との間
の空間的なずれを表示する表示手段とを備えるものであ
る。
【0008】
【発明の実施の形態】話者によって発声された入力音声
を電気信号に変換して、該電気信号を出力する音声入力
手段と、該話者の口唇部分の位置と所定の位置との間の
空間的なずれを示す情報を表示する表示手段とを備えて
おり、これにより、上記目的が達成される。前記音声入
力装置は、前記話者の口唇部分の入力画像を電気信号に
変換して、該電気信号を出力する画像入力手段をさらに
備えていてもよい。
【0009】前記表示手段は前記話者の口唇部分を映す
ための鏡面を有し、該鏡面は前記所定の位置を規定する
ための印を有していてもよい。
【0010】前記所定の位置は、前記音声入力手段の位
置に関連して決定されることが好ましい。
【0011】前記音声入力装置は、前記話者の口唇部分
の入力画像を電気信号に変換して、該電気信号を出力す
る画像入力手段と、該画像入力手段から出力される電気
信号に基づいて、該話者の口唇部分の位置を特定する位
置特定手段と、該位置特定手段によって特定された該話
者の口唇部分の位置と前記所定の位置とを比較し、比較
結果を出力する位置比較手段とをさらに備えており、前
記表示手段は、該位置比較手段による該比較結果に基づ
いて、該話者の口唇部分の位置と該所定の位置との間の
空間的なずれを示す情報を表示してもよい。
【0012】前記所定の位置は、前記音声入力手段の位
置及び前記画像入力手段の位置に関連して決定されるこ
とが好ましい。
【0013】前記音声入力装置は、音声処理装置に接続
され、該音声処理装置は、前記話者の口唇部分の入力画
像を電気信号に変換して、該電気信号を出力する画像入
力手段を備えており、該音声処理装置は、該音声入力装
置の該画像入力手段から出力される該電気信号に基づい
て、該話者の口唇部分の位置を特定する位置特定手段
と、該位置特定手段によって特定された該話者の口唇部
分の位置と前記所定の位置とを比較し、比較結果を出力
する位置比較手段とを備えており、該音声入力装置の前
記表示手段は、該音声処理装置の該位置比較手段による
該比較結果に基づいて、該話者の口唇部分の位置と該所
定の位置との間の空間的なずれを示す情報を表示しても
よい。
【0014】前記所定の位置は、前記音声入力手段の位
置及び前記画像入力手段の位置に関連して決定されるこ
とが好ましい。
【0015】以下、本発明を実施例について説明する。
【0016】(第1の実施例)図1(a)は、本発明の
第1の実施例の音声入力装置の構成を示す。音声入力装
置は、音声入力部1及び表示部2を有している。音声入
力部1は、入力された音声を電気信号に変換して、その
電気信号を外部装置(不図示)に出力する。音声入力部
1としては、例えば、マイクロフォンが使用される。外
部装置としては、例えば、音声処理装置や音声認識装置
が考えられる。表示部2は、話者の口唇部分の位置と所
定の位置との間の空間的なずれを表示する。その所定の
位置は、話者の口唇部分の位置がその所定の位置に一致
した場合に、音声入力部1に入力される音声が最も安定
して得られるように予め決められる。例えば、表示部2
は、話者の口唇部分を少なくとも映すための鏡などの鏡
面を有し、その鏡面は所定の位置を規定するための印を
有する。その印の形状は、話者が自分の口唇部分を一致
させるべき所定の位置を認識できるものであればいかな
る形状であってもよい。例えば、その印の形状は、十字
形、楕円形、台形などとされる。話者は、鏡面に映った
自分の口唇部分の位置が鏡面上の印に一致するように自
分の口唇部分の位置を保ちつつ、発声する。このように
して、話者は自分の口唇部分の位置を音声入力部1に対
して常に適切な位置に保つことができる。その結果、音
声入力部1には常に安定した音声が供給されることとな
る。
【0017】図1(b)に示されるように、音声入力装
置は、入力された画像を電気信号に変換して、その電気
信号を外部装置(不図示)に出力する画像入力部3をさ
らに有していてもよい。画像入力部3としては、例え
ば、テレビカメラやCCD素子が使用される。入力され
た画像は、話者の口唇部分の画像を少なくとも含む。音
声入力装置が音声認識装置などの外部装置に接続される
場合において、話者の口唇部分の画像は、例えば、音声
入力部1から出力される音声信号に基づいて、音声が存
在する区間を検出するために利用される。これにより、
ノイズ環境の下で、特に音楽や人声などによって騒音レ
ベルが非定常である環境の下で、話者の周囲の騒音を音
声であると誤認識する確率が低減される。音声入力装置
が画像入力部3を有する場合には、音声入力装置は話者
の口唇部分を少なくとも照射する光源部4をさらに有し
ていることが好ましい。これは、話者の口唇部分の画像
を正確に得るために十分な照度を確保するためである。
【0018】図2は、本発明の第1の実施例の音声入力
装置の具体的な構成例を示す。この音声入力装置は、マ
イクロフォン6及び鏡9を含む筐体5を有している。マ
イクロフォン6には、話者によって発声された音声が入
力される。鏡9は、話者が鏡9に映る自分の口唇部分の
中心を鏡9の印10に一致させた状態で発声した場合
に、話者の口唇部分とマイクロフォン6との間の距離が
ほぼ一定に保たれるように配置される。話者の口唇部分
とマイクロフォン6との間の適切な距離は、話者によら
ずほぼ一定の値であることが実験により確認されてい
る。ただし、話者に応じて話者の口唇部分とマイクロフ
ォン6との間の距離を微調整するために、鏡9の位置及
び/又は角度を変更できるようにしてもよい。
【0019】この例では、筐体5には、話者の口唇部分
を照射する発光ダイオード7、話者の口唇部分の画像を
少なくとも入力するための受光部8がさらに設けられて
いる。
【0020】次に、上述の構成を有する音声入力装置に
音声を入力する方法を説明する。話者は、自分の口唇部
分が鏡9に映り、かつ、その口唇部分の中心が鏡9上の
印10に一致するように、自分の口唇部分と筐体5との
位置関係を調整する。話者が筐体5を手で自然に持った
場合に、話者の口唇部分と筐体5との位置関係がほぼ一
意に決定されるような形状を筐体5が有していることが
好ましい。話者の口唇部分の位置と所定の位置との間の
空間的なずれの自由度を一定以下に抑えるためである。
例えば、通常の電話機の受話器に近似した形状は、上述
した筐体5の好ましい形状に該当する。その後、話者
は、鏡9に映る自分の口唇部分の中心が鏡9上の印10
に一致するように筐体5を保持しつつ、発声する。その
発声の際、話者の口唇部分は発光ダイオード7によって
照射され、受光部8がその話者の口唇部分の画像を得る
のに十分な照度が確保される。
【0021】本発明の第1の実施例の音声入力装置によ
れば、話者の口唇部分と音声入力部1との間の距離を常
にほぼ一定に保つことができるので、話者は自分の口唇
部分の位置を音声入力部1に対して常に適切な位置に保
つことができる。その結果、音声入力部1から常に安定
した音声信号が出力されることとなる。これにより、音
声入力装置が音声認識装置などの外部装置に接続される
場合に、その外部装置は、話者の口唇部分と音声入力装
置1との間の距離のばらつきを考慮して入力音声信号を
補正する必要がない。
【0022】(第2の実施例)図3は、本発明の第2の
実施例の音声入力装置の構成を示す。音声入力装置は、
音声入力部1、画像入力部3及び表示部2を有してい
る。音声入力部1は、入力された音声を電気信号に変換
して、その電気信号を外部装置(不図示)に出力する。
画像入力部3は、入力された口唇部分の画像を電気信号
に変換して、その電気信号を外部装置(不図示)に出力
する。表示部2は、話者の口唇部分の位置と所定の位置
との間の空間的なずれを表示する。その所定の位置は、
話者の口唇部分の位置がその所定の位置に一致した場合
に、音声入力部1から出力される音声信号が最も安定し
て得られ、かつ、画像入力部3に口唇部分の画像のみが
入力されるように予め決められる。表示部2としては、
例えば、液晶表示ディスプレイやCRTが使用される。
また、第1の実施例と同様にして、話者の口唇部分の画
像を正確に得るために十分な照度を確保するために、音
声入力装置は、話者の口唇部分を照射する光源部4をさ
らに有していていることが好ましい。
【0023】本発明の第2の実施例の音声入力装置で
は、画像入力部3には話者の口唇部分の画像のみが入力
されるので、画像入力部3は、例えば、マトリクス状に
配列された32×32個の光電変換素子を有していれば
足りる。従来、話者の顔全体の画像を入力する場合に
は、通常、512×512個の光電変換素子が使用され
ていた。従って、話者の口唇部分の画像のみを画像入力
部3に入力するようにしたことにより、光電変換素子の
数を大幅に低減することができる。さらに重要なこと
は、光電変換素子の数を大幅に低減したことにより、音
声入力部1から出力される音声信号の周波数帯域と画像
入力部3から出力される画像信号の周波数帯域とがほぼ
同一となることである。例えば、32×32画素を10
0m秒/1フレームで駆動する場合、1秒につき約10
000画素を駆動することになる。この場合、画像信号
の周波数帯域は約10kHzとなる。これにより、音声
入力装置に接続される音声認識装置など外部装置におい
て、音声信号と画像信号とを同一のプロセッサで処理す
ることが可能になる。
【0024】音声入力装置は、位置特定部11及び位置
比較部12をさらに有している。これらは、話者の口唇
部分の位置と所定の位置との間の空間的なずれを表示部
2上に表示するために使用される。
【0025】位置特定部11は、画像入力部3から出力
される話者の口唇部分の画像を表す電気信号に基づい
て、その話者の口唇部分の位置を特定する。位置特定部
11において、話者の口唇部分の位置を特定する方法と
しては、パターンマッチングによる方法が簡便かつ効果
的である。例えば、位置特定部11は、唇の形状は楕円
に近似するという知識を用いて、入力画像の濃淡情報か
ら口唇部分の位置を特定する。より詳しくいうと、位置
特定部11は、図4に示すように口唇部分の外枠にほぼ
一致する楕円関数を推定し、その推定された楕円関数の
位置を口唇部分の位置として特定する。また、図5に示
されるように、楕円関数を使用する代わりに台形関数を
使用してもよい。
【0026】位置比較部12は、位置特定部11によっ
て特定された口唇部分の位置と所定の位置とを比較し、
比較結果を出力する。その所定の位置は、位置特定部1
1によって特定された口唇部分の位置がその所定の位置
に一致した場合に、話者の口唇部分と音声入力部1との
間の距離がほぼ一定に保たれ、かつ、話者の口唇部分と
画像入力部3との間の距離がほぼ一定に保たれるように
位置比較部12の中に予め記憶される。位置比較部12
によって得られる比較結果は、表示部2に供給される。
表示部2は、その比較結果に基づいて、話者の口唇部分
の位置と所定の位置との間の空間的なずれを表示する。
【0027】次に、表示部2において、話者の口唇部分
の位置と所定の位置との間の空間的なずれを表示する態
様を説明する。空間的なずれを表示するためには、一般
的には、そのずれを3次元的に表示することが必要であ
る。しかし、実際には、口唇部分が接する平面に垂直な
方向における口唇部分の座標位置は実質的に一定である
とみなすことができるので、その空間的なずれは、2次
元的に又は1次元的に示されれば十分である。
【0028】図6(a)〜(e)は、話者の口唇部分の
位置と所定の位置との間の空間的なずれを表示する態様
の例を示す。図6(a)は、空間的なずれを単一のイン
ジケータを用いて1次元的に表示する例を示す。例え
ば、空間的なずれが小さい場合には、インジケータの度
数が増大し、空間的なずれが大きい場合には、インジケ
ータの度数が減少するように表示すればよい。また、図
6(b)に示されるように、空間的なずれの方向性を示
すために、複数のインジケータを用いて空間的なずれを
表示してもよい。図6(c)は、空間的なずれを2つの
円の重なり度合を用いて2次元的に表示する例を示す。
この例では、話者の口唇部分の位置は実線、所定の位置
は破線で表示される。図6(d)は、空間的なずれをそ
のずれの方向を示す矢印を用いて2次元的に表示する例
を示す。この例では、上、下、右、左、右上、左上、右
下、左下の8方向のうち、いずれかの方向を示す矢印が
表示される。例えば、話者の口唇部分の位置が所定の位
置に対し上方向にずれている場合には、下方向を示す矢
印が表示される。図6(e)は、画像入力部3によって
入力された口唇部分の画像と所定の位置を示す印を表示
することにより、両者の間の空間的なずれを2次元的に
表示する例である。当業者であれば、上述のようにして
空間的なずれを表示する代わりに、又は、それを表示す
ることに加えて、空間的なずれを示す警告音を発生させ
ることによっても同様の効果が得られることを理解する
だろう。
【0029】図7は、本発明の第2の実施例の音声入力
装置の具体的な構成例を示す。この音声入力装置は、マ
イクロフォン6、発光ダイオード7、受光部8を含む筐
体5を有している。液晶表示ディスプレイ13は、筐体
5上に設けられてもよいが、話者が空間的なずれを容易
に視認できるように筐体5とは分離されていることが好
ましい。位置特定部11及び位置比較部12は、筐体5
の内部に収納されているため、図7には示されていな
い。
【0030】次に、上述の構成を有する音声入力装置に
音声を入力する方法を説明する。話者は、発声する前
に、液晶表示ディスプレイ13に表示される自分の口唇
部分の位置と所定の位置との間の空間的なずれが実質的
にゼロとなるように、自分の口唇部分と筐体5との位置
関係を調整する。その後、話者は、液晶表示ディスプレ
イ13に表示される自分の口唇部分の位置と所定の位置
との間の空間的なずれが実質的にゼロとなるように筐体
5を保持しつつ、発声する。その発声の際、話者の口唇
部分は発光ダイオード7によって照射され、受光部8が
その話者の口唇部分の画像を得るのに十分な照度が確保
される。
【0031】本発明の第2の実施例の音声入力装置によ
れば、話者の口唇部分と音声入力部1との間の距離を常
にほぼ一定に保つことができ、かつ、話者の口唇部分と
画像入力部3との間の距離を常にほぼ一定に保つことが
できるので、話者は自分の口唇部分の位置を音声入力部
1及び画像入力部3に対して常に適切な位置に保つこと
ができる。その結果、音声入力部1から常に安定した音
声信号が出力され、画像入力部3から常に安定した画像
信号が出力されることとなる。また、画像入力部3に
は、口唇部分の画像のみが入力されるので、音声入力装
置において、顔画像から口唇部分の画像を抽出する必要
がない。これにより、精度の高い口唇部分の画像が得ら
れる。
【0032】さらに、音声入力装置が音声認識装置など
の外部装置に接続される場合に、その外部装置は、話者
の口唇部分と音声入力部1との間の距離のばらつきを考
慮して入力音声信号を補正する必要がない。また、その
外部装置には口唇部分に対応する画像信号が供給される
ので、外部装置において、口唇部分の画像を切り出す処
理を行う必要がない。さらに、音声入力部1から出力さ
れる音声信号の周波数帯域と画像入力部3から出力され
る画像信号の周波数帯域とがほぼ同一とされるので、外
部装置において、音声信号と画像信号とを同一のプロセ
ッサで処理することが可能となる。
【0033】上述したように、本発明の第2の実施例の
音声入力装置は、位置特定部11及び位置比較部12を
有している。しかし、位置特定部11及び位置比較部1
2は必ずしも音声入力装置に含まれている必要はない。
むしろ、位置特定部11及び位置比較部12は、音声認
識装置などの外部装置に含まれることが好ましい。その
理由は、そのような外部装置は、音声信号や画像信号を
処理するためのプロセッサを有していることが通常であ
るので、そのプロセッサにより位置特定部11及び位置
比較部12の処理を行うことが可能だからである。
【0034】図8は、位置特定部11及び位置比較部1
2が外部装置に含まれる場合の音声入力装置の構成を示
す。図8に示される各部の機能及び動作は、第2の実施
例と同様であるので、説明を省略する。本発明によれ
ば、話者の口唇部分と音声入力部1との間の距離を常に
ほぼ一定に保つことができるので、話者は自分の口唇部
分の位置を音声入力部1に対して常に適切な位置に保つ
ことができる。その結果、音声入力部1から常に安定し
た音声信号が出力される。
【0035】さらに、第2の実施例の音声入力装置によ
れば、話者の口唇部分と画像入力部3との間の距離をも
常にほぼ一定に保つことができるので、話者は自分の口
唇部分の位置を画像入力部3に対して常に適切な位置に
保つことができる。その結果、画像入力部3から常に安
定した画像信号が出力される。また、画像入力部3に
は、口唇部分の画像のみが入力されるので、画像入力部
3において、顔画像から口唇部分の画像を抽出する必要
がない。これにより、精度の高い口唇部分の画像を得る
ことができる。さらに、音声入力部1から出力される音
声信号の周波数帯域と画像入力部3から出力される画像
信号の周波数帯域とがほぼ同一とされるので、音声認識
装置などの外部装置において、音声信号と画像信号とを
同一のプロセッサで処理することが可能となる。
【0036】
【発明の効果】本発明によれば、話者の口唇部分と音声
入力部1との間の距離を常にほぼ一定に保つことができ
るので、話者は自分の口唇部分の位置を音声入力部に対
して常に適切な位置に保つことができる。その結果、音
声入力部から常に安定した音声信号が出力される。
【図面の簡単な説明】
【図1】(a)は本発明の第1の実施例の音声入力装置
の構成を示すブロック図 (b)は本発明の第1の実施例の音声入力装置の構成を
示すブロック図
【図2】本発明の第1の実施例の音声入力装置の具体的
な構成例を示す図
【図3】本発明の第2の実施例の音声入力装置の構成を
示すブロック図
【図4】話者の口唇部分の位置を特定する方法を説明す
る図
【図5】話者の口唇部分の位置を特定する方法を説明す
る図
【図6】(a)は話者の口唇部分の位置と所定の位置と
の間の空間的なずれの表示態様の例を示す図 (b)は話者の口唇部分の位置と所定の位置との間の空
間的なずれの表示態様の例を示す図 (c)は話者の口唇部分の位置と所定の位置との間の空
間的なずれの表示態様の例を示す図 (d)は話者の口唇部分の位置と所定の位置との間の空
間的なずれの表示態様の例を示す図 (e)は話者の口唇部分の位置と所定の位置との間の空
間的なずれの表示態様の例を示す図
【図7】本発明の第2の実施例の音声入力装置の具体的
な構成例を示す図
【図8】本発明の第2の実施例の他の音声入力装置の構
成を示すブロック図
【図9】従来の音声入力装置の構成を示すブロック図
【符号の説明】
1 音声入力部 2 表示部 3 画像入力部 4 光源部 11 位置特定部 12 位置比較部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/28 G10L 3/00 571G

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 話者によって発声された入力音声を電気
    信号に変換して、該電気信号を出力する音声入力手段
    と、前記音声入力手段近傍に配されて前記話者の口唇部
    分の画像を入力する画像入力部と、該音声入力手段の位
    置に関連して決定される所定の位置と該話者の口唇部分
    の位置との間の空間的なずれを表示する表示手段とを備
    えた音声入力装置。
  2. 【請求項2】 前記音声入力装置は、前記話者の口唇部
    分の入力画像を電気信号に変換して、該電気信号を出力
    する画像入力手段と、該画像入力手段から出力される電
    気信号に基づいて、該話者の口唇部分の位置を特定する
    位置特定手段と、該位置特定手段によって特定された該
    話者の口唇部分の位置と前記所定の位置とを比較し、比
    較結果を出力する位置比較手段とをさらに備え、前記表
    示手段は、該位置比較手段による該位置比較手段による
    該比較結果に基づいて、該話者の口唇部分の位置と該所
    定の位置との間の空間的なずれを表示する請求項1に記
    載の音声入力装置。
  3. 【請求項3】 前記音声入力装置は、音声処理装置に接
    続され、該音声処理装置は、前記話者の口唇部分の入力
    画像を電気信号に変換して、該電気信号を出力する画像
    入力手段を備えており、該音声入力装置の前記表示手段
    は、該音声処理装置の該位置比較手段による該比較結果
    に基づいて、該話者の口唇部分の位置と該所定の位置と
    の間の空間的なずれを表示する請求項1に記載の音声入
    力装置。
  4. 【請求項4】 前記所定の位置は、前記音声入力手段の
    位置及び前記画像入力手段の位置に関連して決定され
    る、請求項2又は3に記載の音声入力装置。
  5. 【請求項5】 前記表示手段は前記空間的なずれを規定
    するための印を有する請求項1に記載の音声入力装置。
JP2003044547A 1992-11-02 2003-02-21 音声入力装置 Expired - Fee Related JP3729179B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003044547A JP3729179B2 (ja) 1992-11-02 2003-02-21 音声入力装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP29411792 1992-11-02
JP4-294117 1992-11-02
JP2003044547A JP3729179B2 (ja) 1992-11-02 2003-02-21 音声入力装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001004698A Division JP3478269B2 (ja) 1992-11-02 2001-01-12 音声入力装置

Publications (2)

Publication Number Publication Date
JP2003303093A true JP2003303093A (ja) 2003-10-24
JP3729179B2 JP3729179B2 (ja) 2005-12-21

Family

ID=29404596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003044547A Expired - Fee Related JP3729179B2 (ja) 1992-11-02 2003-02-21 音声入力装置

Country Status (1)

Country Link
JP (1) JP3729179B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047949A (ja) * 2005-08-08 2007-02-22 Advanced Telecommunication Research Institute International 口トラッキング装置及びコンピュータプログラム
JP2007094104A (ja) * 2005-09-29 2007-04-12 Sony Corp 情報処理装置および方法、並びにプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047949A (ja) * 2005-08-08 2007-02-22 Advanced Telecommunication Research Institute International 口トラッキング装置及びコンピュータプログラム
JP2007094104A (ja) * 2005-09-29 2007-04-12 Sony Corp 情報処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP3729179B2 (ja) 2005-12-21

Similar Documents

Publication Publication Date Title
US5839109A (en) Speech recognition apparatus capable of recognizing signals of sounds other than spoken words and displaying the same for viewing
WO2012133058A1 (ja) 電子機器及び情報伝達システム
JP6344125B2 (ja) 表示装置、表示装置の制御方法、および、プログラム
EP1715717A1 (en) Mobile body with superdirectivity speaker
EP0896319A1 (en) Recognition apparatus, recognition method, learning apparatus and learning method
EP1083769A4 (en) LANGUAGE CONVERSION DEVICE AND PROCEDURE
US11182567B2 (en) Speech translation apparatus, speech translation method, and recording medium storing the speech translation method
JP2010154259A (ja) 画像音声処理装置
KR101822084B1 (ko) 시각장애인을 위한 지팡이
JP2012205240A (ja) 電子機器及び情報伝達システム
US8135217B2 (en) Method for optimized camera position finding for system with optical character recognition
JP6675527B2 (ja) 音声入出力装置
RU2004136294A (ru) Диалоговое управление для электрического устройства
JP7063005B2 (ja) 運転支援方法、車両、及び運転支援システム
CN111128180A (zh) 一种听力障碍者的辅助对话系统
JP2017123505A (ja) コンテンツ再生装置、コンテンツ再生方法及びプログラム
US5687280A (en) Speech input device including display of spatial displacement of lip position relative to predetermined position
JP2003303093A (ja) 音声入力装置
JP3478269B2 (ja) 音声入力装置
JP2012205242A (ja) 電子機器及び情報伝達システム
JP3838159B2 (ja) 音声認識対話装置およびプログラム
JPH06208451A (ja) 音声入力装置
JP4789227B2 (ja) 音声認識機能を内蔵した映像表示装置
CN110716181A (zh) 声音信号采集方法以及分离式麦克风阵列
JP2002229592A (ja) 音声認識装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040617

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040915

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041015

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050926

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091014

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091014

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101014

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111014

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees