JP2003044090A - 音声認識装置及び音声認識方法 - Google Patents

音声認識装置及び音声認識方法

Info

Publication number
JP2003044090A
JP2003044090A JP2001226492A JP2001226492A JP2003044090A JP 2003044090 A JP2003044090 A JP 2003044090A JP 2001226492 A JP2001226492 A JP 2001226492A JP 2001226492 A JP2001226492 A JP 2001226492A JP 2003044090 A JP2003044090 A JP 2003044090A
Authority
JP
Japan
Prior art keywords
light receiving
voice recognition
light
time
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001226492A
Other languages
English (en)
Inventor
Takehiro Sekine
剛宏 関根
Masaru Nakamori
勝 中森
Haruhiro Kuboyama
晴弘 久保山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2001226492A priority Critical patent/JP2003044090A/ja
Publication of JP2003044090A publication Critical patent/JP2003044090A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Light Receiving Elements (AREA)

Abstract

(57)【要約】 【課題】 安価で簡単な手法でユーザの発話意図を検出
して音声認識の開始を正確に判定する。 【解決手段】 外部からの光をマイク部23で受光して
受光量に応じた受光信号を用いて、定常状態における受
光量を示す判定値を予め生成して判定値記憶部31に記
憶しておき、音声認識を開始するときに、受光量に応じ
た受光信号を受光部27により生成し、生成した受光信
号と判定値との受光量差と、所定値とを比較して、受光
量差が所定値を超えたか否かを光信号判定部29により
判定し、受光量差が所定値を超えたと判定した時刻から
の時間を時間計測部30計測し、計測した時間が所定時
間を超えた場合に、入力する音声を用いて音声認識を開
始するように制御部32により制御をする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザの発話意図
を検出し、ユーザから発話された音声を入力して音声認
識を開始する音声認識装置及び音声認識方法に関する。
【0002】
【従来の技術】従来より、ユーザの発話意図があること
を、CCD(Charge Coupled Device)カメラ等を用い
た画像認識技術により検出したり、発光素子からの光を
ユーザに照射して反射光を検出する光学的技術により検
出したりする音声認識装置が知られている。
【0003】また、従来の音声認識装置としては、圧力
センサ等を床部に設置してユーザの存在を検出する簡単
な構成のものが知られている。
【0004】
【発明が解決しようとする課題】上述の画像認識技術や
光学的技術を用いた音声認識装置は、正確にユーザの発
話意図を検出することが可能であるが、ユーザの発話意
図を検出するのに高価な電子部品を用いており、且つ、
情報処理技術を必要とするために、装置全体として高価
になっていた。
【0005】また、光学的技術を用いた音声認識装置で
は、受光信号の変化を検出し、しきい値を用いてユーザ
の発話意図の有無判定をしているため、発話意図のない
人や物体が発光素子の発光範囲を通り過ぎただけでも、
発話意図のあるユーザが存在すると誤判定してしまう。
【0006】また、圧力センサを床部に設けた音声認識
装置は、装置とは別に離れた、外部に圧力センサを設置
する必要があり、装置自体が大型化してしまい、更に床
部に圧力センサを設置、施工する必要がある。
【0007】そこで、本発明は、上述した実情に鑑みて
提案されたものであり、安価で簡単な手法でユーザの発
話意図を検出して音声認識の開始を正確に判定すること
ができる音声認識装置及び音声認識方法を提供すること
を目的とする。
【0008】
【課題を解決するための手段】請求項1に係る発明は、
上述の課題を解決するために、ユーザからの音声を入力
する音声入力手段と、上記音声入力手段で入力した音声
を認識する音声認識手段と、外部からの光を受光して受
光量に応じた受光信号を生成する受光手段と、上記受光
手段で生成した受光信号に基づいて、ユーザの存在有無
を判定する有無判定手段と、上記有無判定手段でユーザ
が存在すると判定した時刻からの時間を計測する時間計
測手段と、上記時間計測手段で計測した時間が所定時間
を超えた場合に、上記音声入力手段で入力した音声を用
いた音声認識を開始するように上記音声認識手段を制御
する制御手段とを備えることを特徴とする。
【0009】請求項2に係る発明では、請求項1に記載
の発明であって、上記受光手段で生成した受光信号を用
いて、定常状態における受光量を示す判定値を取得する
判定値取得手段を更に備え、上記有無判定手段は、上記
受光手段で生成した受光信号と上記判定値取得手段で保
持している判定値との受光量差と、所定値とを比較し
て、受光量差が所定のしきい値を超えたか否かを判定
し、上記時間計測手段は、上記有無判定手段での受光量
差が所定の値を超えたと判定した時刻からの時間を計測
し、上記制御手段は、上記時間計測手段で計測した時間
が所定時間を超えた場合に、上記音声入力手段で入力し
た音声を用いた音声認識を開始するように上記音声認識
手段を制御することを特徴とする。
【0010】請求項3に係る発明では、請求項1又は請
求項2に記載の発明であって、上記各手段を収容する筐
体を更に備え、上記筐体正面に凹部を設けると共に、上
記受光手段を凹部底面に設けたことを特徴とする。
【0011】請求項4に係る発明では、請求項3に記載
の発明であって、上記受光手段は、上記筐体から外部に
露呈した複数の受光部からなることを特徴とする。
【0012】請求項5に係る発明では、請求項4に記載
の発明であって、上記各受光部の受光方向を異としたこ
とを特徴とする。
【0013】請求項6に係る発明では、請求項4に記載
の発明であって、上記各受光部の受光方向を装置下方と
したことを特徴とする。
【0014】請求項7に係る発明では、請求項1又は請
求項2に記載の発明であって、上記受光手段とは別体で
あって、装置下方に設けられた受光装置を更に備えるこ
とを特徴とする。
【0015】請求項8に係る発明では、請求項3〜請求
項6の何れか一に記載の発明であって、上記凹部の内壁
を光拡散面としたことを特徴とする。
【0016】請求項9に係る発明では、請求項1又は請
求項2に記載のであって、上記受光手段の受光方向を回
転させる受光方向回転手段を更に備え、上記有無判定手
段は、上記受光方向回転手段で回転された上記受光手段
の受光方向、各受光方向に対応した上記受光手段の受光
信号、各受光方向に対する判定値とを用いて、ユーザの
存在有無の判定をすることを特徴とする。
【0017】請求項10に係る発明では、請求項3〜請
求項6の何れか一に記載の発明であって、上記凹部の開
口部と凹部底面との間にレンズを設けたことを特徴とす
る。
【0018】請求項11に係る発明では、請求項2に記
載の発明であって、上記判定値取得手段は、音声認識を
開始する時刻に応じて異なる判定値とすることを特徴と
する。
【0019】請求項12に係る発明では、請求項1又は
請求項2に記載の発明であって、上記受光手段は、異な
る位置に設けられた複数の受光部からなり、上記有無判
定手段は、複数の受光部の受光信号のパターンを予め記
憶し、各受光部からの受光信号と予め記憶した受光信号
のパターンとを比較して、ユーザの存在有無を判定する
ことを特徴とする。
【0020】請求項13に係る発明では、請求項3〜請
求項6の何れか一に記載の発明であって、上記凹部内に
光反射体を設け、上記凹部の開口部と凹部底面に設けた
受光部との実効長さを変更することを特徴とする。
【0021】請求項14に係る発明では、上述の課題を
解決するために、外部からの光を受光して受光量に応じ
た受光信号を生成し、生成した受光信号に基づいて、ユ
ーザの存在有無を判定し、ユーザが存在すると判定した
時刻から時間計測を開始し、計測した時間が所定時間を
超えた場合に、上記音声入力手段で入力した音声を用い
た音声認識を開始する。
【0022】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0023】本発明は、例えば図1及び図2に示すよう
に構成された音声認識装置に適用される。
【0024】[音声認識装置の構成] 「音声認識装置の外観構成」この音声認識装置は、図1
のその外観構成を示すように、筐体10の正面に、表示
部1、操作ボタン2、マイク3、外部からの光を受光す
る複数の受光部4A、4B、4C(以下、総称するとき
には、単に「受光部4」と呼ぶ。)を備えて構成されて
いる。受光部4は、音声認識装置の正面から奥行き方向
に形成された凹部11の底面に設けられている。なお、
この凹部11の構成については後述する。
【0025】この音声認識装置は、音声認識を開始する
に際して、表示部1に各種内容を表示させてユーザに提
示すると共に、操作ボタン2が必要に応じて操作され、
ユーザから発生された音声をマイク3で検出する。この
とき、音声認識装置の受光部4は、ユーザが筐体10の
前に滞在したことにより、外部光の受光量が変化され
る。
【0026】「音声認識装置の機能的な構成」図2に、
上述の音声認識装置の機能的な構成を示す。この音声認
識装置は、上記表示部1に対応する表示部21、上記操
作ボタン2に対応する操作入力部22、上記マイク3に
対応するマイク部23、音声入力制御部24、音声認識
部25、音声信号判定部26、上記受光部4に対応する
受光部27、受光方向制御部28、光信号判定部29、
時間計測部30、判定値記憶部31、制御部32を備え
る。
【0027】この音声認識装置は、図1に示したよう
に、表示部21、操作入力部22、マイク部23、受光
部27が筐体10から外部に露呈してなり、上述の各部
が電子回路や集積回路、又は、プログラムを記憶する記
憶機構及びプログラムを実行するCPU(Central Proc
essing Unit)として、筐体10内に収容されて構成さ
れる。
【0028】表示部21は、例えば液晶ディスプレイか
らなり、後述の制御部32からの表示データを入力し、
各種内容を表示することで、例えば音声認識結果等をユ
ーザに提示する。
【0029】操作入力部22は、ユーザにより押圧操作
などがされることにより操作入力信号を生成して、制御
部32に出力する。この操作入力部22は、例えば音声
認識装置が住宅の玄関等に設けられ、音声認識装置の前
に存在するユーザとなる外来者により操作される。
【0030】マイク部23は、音声認識装置の前に存在
するユーザからの音声を入力して、入力した音声を電気
信号である音声信号に変換して音声入力制御部24及び
音声信号判定部26に出力する。なお、このマイク部2
3は、図1では筐体10の正面に単一のものが設けられ
ている一例を示したが、これに限らず、複数のマイクで
構成されていても良い。このとき、マイク部23は、複
数のマイクで検出した音声信号を音声入力制御部24及
び音声信号判定部26に出力する。
【0031】音声信号判定部26は、マイク部23から
の音声信号のうち、音声認識部25での音声認識処理に
必要な信号レベルを超えていたときには、音声に関する
条件を満たした旨を示す信号を制御部32に出力する。
この音声信号判定部26は、例えば、ユーザが音声認識
装置を音声操作する場合、音声認識装置から適切な距離
内で、且つ適切な音量で発話した場合にマイク部23で
生成される信号レベルが予め設定されており、マイク部
23からの音声信号と、信号レベルとを比較する。
【0032】受光部27は、例えばフォトダイオード等
の受光素子を有し、入射した外部光の強度に比例した受
光量を示す受光信号を生成して光信号判定部29に出力
する。
【0033】受光部27は、音声認識装置の正面に設け
られ、ユーザが音声認識装置の前に立つことにより、室
内照明や室外等の外部光がユーザにより遮られ、受光量
が変化する。
【0034】受光方向制御部28は、受光部27が受光
方向を変更する機能を有する場合に、制御部32からの
制御信号に従って、受光部27を駆動制御して受光方向
を変更する。なお、この受光方向制御部28の具体的な
説明については後述する。
【0035】光信号判定部29は、受光部27からの受
光信号が入力されると共に、判定値記憶部31に記憶さ
れた判定値を読み込む。光信号判定部29は、受光信号
が示す受光量と判定値との差を算出し、受光量と判定値
との差が予め設定されたしきい値を超えた場合に、時間
計測部30に計測開始信号を出力する。
【0036】ここで、判定値記憶部31に記憶されてい
る判定値は、受光部27に入射されている光が定常状態
であるときの受光量に制御部32により設定されてい
る。
【0037】また、この光信号判定部29は、受光量を
示す受光信号を例えば所定時間毎に制御部32に出力す
る。
【0038】時間計測部30は、光信号判定部29から
の計測開始信号に従って、時間計測を開始する。時間計
測部30は、時間計測を開始して、計測した時間が予め
設定した所定時間を超えたときには、時間に関する条件
を満たした旨を示す信号を制御部32に出力する。
【0039】制御部32は、音声信号判定部26からの
音声に関する条件を満たした旨を示す信号、及び時間計
測部30からの時間に関する条件を満たした旨を示す信
号が入力され、音声及び時間に関する条件の論理積が
「真」である場合に、マイク部23で入力した音声信号
を音声認識部25に出力することを示す音声信号通過信
号を音声入力制御部24に出力する。すなわち、制御部
32は、時間及び音声に関する条件を満たす場合に、音
声認識装置の前に立っているユーザに発話意図があると
判定してマイク部23で検出した音声信号を音声入力制
御部24を介して音声認識部25に入力して音声認識を
開始させる。
【0040】また、制御部32は、光信号判定部29か
らの受光量を示す受光信号を所定時間ごとに評価して判
定値記憶部31の判定値を更新するか否かの判定をし、
受光部27に入射する光が定常状態である場合の受光量
に対応した判定値を生成して更新する処理をする。
【0041】制御部32は、新たに生成した判定値と共
に判定値更新信号を判定値記憶部31に送信する。これ
に対し、判定値記憶部31は、判定値更新信号と共に入
力された判定値に書き換える。
【0042】例えば音声認識装置が設置されているのが
室内であり、室内が暗くなって室内照明を点灯した場合
には、受光部27に入射される受光量が大きくなり、判
定値記憶部31に記憶されている判定値よりも高い値の
受光量となる。これにより、光信号判定部29では、判
定値よりも受光量が高いために、通常時における判定値
と受光量との大小関係と、室内照明を点灯した時におけ
る判定値と受光量との大小関係とが逆になる。この場合
では、音声認識装置の前にユーザが立っても、判定値よ
りも受光量の方が高くなって音声認識を開始する判定が
できないことになる。
【0043】これに対し、制御部32では、受光信号が
急激に変化して、判定値記憶部31に記憶させている判
定値よりも受光量が高くなったことを認識すると、判定
値記憶部31の判定値を更新する判定をし、室内照明が
点灯されたときの判定値を新たに生成して、判定値記憶
部31に記憶させている判定値を更新する。制御部32
では、光信号判定部29から受光信号を所定時間毎に入
力することにより、所定時間毎に判定値記憶部31の判
定値を更新するか否かの判定をして、受光量が判定値よ
りも大きくなった場合に判定値の更新をする。
【0044】本実施形態において、判定値を制御部32
により更新する場合としては、照明器具の点灯及び消灯
等の操作、昼間のカーテンの開閉、ドアの開閉等などに
よる急激な周囲光量の変化が発生して受光部27に入射
される受光量が急激に変化したときである。
【0045】更に、制御部32は、受光部27が受光方
向を変更する機能を有する場合に、光信号判定部29か
らの受光信号に基づいて、受光部27で受光する受光量
を制御するために、受光部27の受光方向を変更する制
御信号を受光方向制御部28に出力する。
【0046】音声入力制御部24は、制御部32から音
声信号通過信号を入力して、マイク部23からの音声信
号を音声認識部25に出力する。
【0047】音声認識部25は、音声入力制御部24か
ら入力された音声信号を用いて音声認識をし、図示しな
いシステムに出力する。ここで、システムとは、例えば
音声認識装置が住宅の玄関に設けられて外来者をユーザ
とする場合には、住宅内の住居者に音声認識結果を通知
するためのものである。
【0048】このような音声認識装置によれば、受光部
27で外部光を入射して定常状態における判定値を記憶
しておき、ユーザが音声認識装置の前に立ったことによ
り変化する受光量と判定値との差分がしきい値を超え、
且つ所定時間以上ユーザが音声認識装置の前に存在して
いると判定したときに、ユーザに発話意図があると判定
して音声認識を正確に開始することができる。
【0049】したがって、この音声認識装置によれば、
投光器等の高価な部品を備える必要なく、簡単で安価に
構成することができ、装置の低価格化を実現することが
できる。
【0050】「凹部の構成」凹部11は、図3に示すよ
うに、その底面部11aに受光部4を設け、開口部11
bにレンズ41を配設し、凹部11の内壁11cに表面
処理を施して粗面とする。これにより、凹部11の内壁
11cを光拡散面とする。
【0051】このように、底面部11aに受光部4を設
けた構成の凹部11を備える音声認識装置によれば、受
光部4により検出する外光の進行方向を制限して、ユー
ザが音声認識装置の前に立ったことによる外光の遮断を
正確に検出することができる。したがって、ユーザが音
声認識装置を音声操作する際にユーザが立つであろう範
囲を明確に定義して、不必要な入射光量の変化により音
声認識を開始する誤動作を制限することができる。
【0052】また、開口部11bにレンズ41を配設す
ることにより、レンズ41の焦点を結ぶ方向以外の光の
変化による受光部4の動作を鈍化させることができる。
【0053】また、音声認識装置によれば、凹部11の
内壁11cを粗面としたので凹部11の内壁11cに入
射する外光を拡散することができ、外部から入射した外
光の進行方向が凹部11の軸方向とは異なって内壁11
cに入射した場合でも、凹部11の軸方向とは異なる進
行方向の外光を効果的に低減することができる。
【0054】また、図4に示すように、凹部11の軸方
向と平行してスリット42を凹部11の内壁11cに形
成するようにしても良い。これにより、凹部11の内壁
11cを粗面とした場合と同様に内壁11cを光拡散面
にし、凹部11の軸方向とは異なる進行方向の外光をス
リット42により拡散することができる。
【0055】更に、図3に示すように凹部11の内壁1
1cを粗面とすると共に、図4に示すように凹部11の
内部にスリット42を設けても良い。
【0056】「受光部の構成」上述した音声認識装置に
おいて、受光部4部分の上面を図5に示すように、凹部
11A、凹部11Cの深さ方向を筐体10の正面から所
定角度θを以て斜め方向にすると共に、受光部4A、受
光部4Cの光入射面を受光部4Bの光入射面に対して斜
め方向に配設する。
【0057】これにより、各受光部4の光入射方向を異
なるものにし、各受光部4の光入射方向に指向性を与
え、室内に音声認識装置が設けられた場合に室内全体の
光量の変化を受光部4で検出することができる。また、
このように構成することにより、受光部4Bのみでは音
声認識装置の真正面にユーザ等の遮蔽物が存在しないと
検出することができないが、受光部4を複数設けると共
に、光入射方向を異とした受光部4A、受光部4Cを設
けることにより、ユーザが音声認識装置の正面に立った
場合のみならず、ユーザが音声認識装置の正面から斜め
方向に立った場合であっても、正確に音声認識を開始さ
せることができる。
【0058】また、音声認識装置において、図6にその
側面図を示すように、壁51に掛けるように設け、ユー
ザが音声認識装置の斜め下方向の床52に存在する場合
に、凹部11の深さ方向を斜め下方向の床52方向にす
ると共に、受光部4の光入射面を斜め下方向に配設す
る。
【0059】これにより、例えば音声認識装置と天井方
向からの光を遮断することができない程度の身長のユー
ザに対しても存在を検知することが可能となる。また、
音声認識装置に複数の受光部4を設けた場合には、全て
の受光部4を床52方向とする必要は無く、図4に示す
ように異なる入射方向としても良い。
【0060】更に、音声認識装置において、図7にその
側面図を示すように、音声認識装置から内部配線53を
介して壁51の下方であって、床52の近傍に光センサ
モジュール54を設けた構成にする。この光センサモジ
ュール54は、内部に、深さ方向がユーザが立つ方向と
された凹部55、凹部55の底部に設けられた受光部5
6を備える。
【0061】このように、床52に近い部分に光センサ
モジュール54を設けることにより、例えば音声認識装
置本体の受光部4では検知できない身長のユーザの存在
を確実に検知することができる。なお、壁51の下方で
あって床52近傍に光センサモジュール54を設けた場
合には、音声認識装置に受光部4を設けなくても良い。
【0062】「受光方向変更部の動作」上述の音声認識
装置において、正面に設けられ、真正面に入射方向を有
する受光部4のみでは真正面以外からの入射光を検知で
きないので、図8(a)に上面図、図8(b)に側面図
を示すように、筐体10内に受光部4の入射方向を回転
させる回転機構を有する光センサモジュール61を設け
る。この場合、音声認識装置には、複数の受光部を設け
ず、光センサモジュール61内の受光部4のみを使用す
る。この場合において、受光方向制御部28により光セ
ンサモジュール61の受光部4を回転駆動させる。
【0063】光センサモジュール61は、受光方向制御
部28により受光部4の入射方向が回転されて、方向角
ごとの受光信号のパターンから、ユーザの存在を検出す
る。具体的には、光センサモジュール61は、受光部4
の入射方向を所定周波数fで回転させることにより、図
9に示すような受光信号を検出する。図9では、所定時
間T(1/f)をパターン検出周期とし、時刻t0〜時
刻t1、時刻t1〜時刻t2では音声認識装置の前方に
遮蔽物が存在せず、時刻t2以降では音声認識装置の前
方に遮蔽物が存在したために、時刻t0〜時刻t2まで
の受光信号のパターンと異なるパターンとなる。これに
より、光センサモジュール61では、音声認識装置の前
方に遮蔽物が存在することを検出する。
【0064】また、光センサモジュール61では、例え
ばユーザが適切な操作位置に立った場合の光遮断断面の
幅を予め設定することにより、より正確にユーザの存在
を検知することができる。すなわち、図10に示すよう
に、受光部4の光入射角θ1のうち、ユーザAが存在す
ると光入射角θ1のうち角度θ2に相当する分だけ光入
射量が少なくなり、ユーザAが存在するよりも音声認識
装置から離れたユーザBが存在すると光入射角θ1のう
ち角度θ3に相当する分だけ光入射量が少なくなる。こ
のように、ユーザの位置により光入射量が異なることを
利用して、ユーザが適切な操作位置の範囲を決め、この
場合の光入射量の変化を検出してユーザの存在を検出す
ることができる。
【0065】更に、この音声認識装置では、光センサモ
ジュール61により検出したユーザの方向と、マイク3
の指向性の方向とを一致させることにより、マイク3に
ユーザの音声を最大限に収音でき、S/N比を増加させ
ることができる。
【0066】更にまた、この音声認識装置では、壁51
に設置されている場合、受光量の時間変化のパターンを
光センサモジュール61で予め記憶しておく。例えば朝
では太陽光が差し込んで徐々に受光量が増加し、午後で
は日の入りにより徐々に受光量が減少して受光量の減少
に伴って室内照明を点灯し、就寝時には室内照明を消灯
させて非常に受光量の小さい状態になることを示すパタ
ーンを予め記憶しておくことにより、大まかな判定値の
変更を行う。このような音声認識装置によれば、周囲の
光が変化する時刻や時間帯に応じて予め判定値を設定す
ることにより、判定値を適切に変化させて受光量の変化
に伴う誤動作を軽減することができる。
【0067】更にまた、この音声認識装置では、複数の
受光部4を備える場合において、各受光部4からの受信
信号の組み合わせパターンから受光部4を回転させたと
きの同様の手法によりユーザが適切な位置に立ったこと
を検出する。すなわち、隣接した受光部4により生成し
た受光信号の組み合わせにより、ユーザの存在を検出す
ることができる。
【0068】更にまた、この音声認識装置では、受光部
4の検知方向をより狭い範囲に制限する場合には、凹部
11の内部に反射部材を設けることにより、凹部11の
実効的な経路長を長くして筐体10の奥行きが浅い場合
においても、効果的に入射方向を制限することができ
る。
【0069】なお、上述の実施の形態は本発明の一例で
ある。このため、本発明は、上述の実施形態に限定され
ることはなく、この実施の形態以外であっても、本発明
に係る技術的思想を逸脱しない範囲であれば、設計等に
応じて種々の変更が可能であることは勿論である。
【0070】
【発明の効果】請求項1に係る発明によれば、受光信号
に基づいて、ユーザの存在有無を判定し、ユーザが存在
すると判定した時刻から時間計測を開始し、計測した時
間が所定時間を超えた場合に、上記音声入力手段で入力
した音声を用いた音声認識を開始するので、投光器等の
高価な部品を備える必要なく、装置の低価格化を実現す
ることができ、安価で簡単な手法でユーザの発話意図を
検出して音声認識の開始を正確に判定することができ
る。
【0071】請求項2に係る発明によれば、定常状態に
おける受光量を示す判定値を生成し、受光信号と判定値
との受光量差と、所定値とを比較して、受光量差が所定
値を超えたと判定した時刻からの時間が所定時間を超え
た場合に、入力した音声を用いた音声認識を開始するの
で、投光器等の高価な部品を備える必要なく、装置の低
価格化を実現することができ、安価で簡単な手法でユー
ザの発話意図を検出して音声認識の開始を正確に判定す
ることができる。
【0072】請求項3に係る発明によれば、筐体正面に
凹部を設けると共に、受光手段を凹部底面に設けたの
で、請求項1又は請求項2に記載の発明による効果に加
えて、受光手段により検出する外光の進行方向を制限し
て、ユーザが装置の前に立ったことにより外光の遮断を
正確に検出することができ、ユーザが装置を音声操作す
る際にユーザが立つであろう範囲を明確に定義して、不
必要な入射光量の変化により音声認識を開始する誤動作
を制限することができる。
【0073】請求項4に係る発明によれば、受光手段を
筐体から外部に露呈した複数の受光部として構成したの
で、請求項3記載の発明による効果に加えて、ユーザが
装置の正面とは異なる位置に立った場合であっても、正
確に音声認識を開始させることができる。
【0074】請求項5に係る発明によれば、各受光部の
受光方向を異としたので、請求項4記載の発明による効
果に加えて、ユーザが装置の正面に立った場合のみなら
ず、ユーザが音声認識装置の正面から斜め方向に立った
場合であっても、正確に音声認識を開始させることがで
きる。
【0075】請求項6に係る発明によれば、各受光部の
受光方向を装置下方としたので、請求項4記載の発明に
よる効果に加えて、例えば装置と天井方向からの光を遮
断することができない程度の身長のユーザに対しても存
在を検知することができる。
【0076】請求項7に係る発明によれば、受光手段と
は別体であって、装置下方に設けられた受光装置を更に
備える構成としたので、請求項1又は請求項2に記載の
発明による効果に加えて、例えば装置本体の受光手段で
は検知できない身長のユーザの存在を検知することがで
きる。
【0077】請求項8に係る発明によれば、凹部の内壁
を光拡散面としたので、請求項3〜請求項6記載の発明
による効果に加えて、受光手段により検出する外光の進
行方向を制限して、ユーザが装置前に立ったことにより
外光の遮断を正確に検出することができ、不必要な入射
光量の変化により音声認識を開始する誤動作を制限する
ことができる。
【0078】請求項9に係る発明によれば、受光手段の
受光方向、各受光方向に対応した受光手段の受光信号、
各受光方向に対する判定値とを用いて、受光量差が所定
値を超えたか否かの判定をするので、請求項1又は請求
項2に記載の発明による効果に加えて、単一の受光手段
であっても、複数の受光部を備える場合と同等以上に受
光方向を制限することができる。
【0079】請求項10に係る発明によれば、凹部の開
口部と凹部底面との間にレンズを設けたので、請求項3
〜請求項6記載の発明による効果に加えて、レンズの焦
点を結ぶ方向以外の光の変化による受光手段の動作を鈍
化させることができる。
【0080】請求項11に係る発明によれば、判定値取
得手段により音声認識を開始する時刻に応じて異なる判
定値とするので、請求項2記載の発明による効果に加え
て、受光手段に入射される光の変化を予め設定すること
により、判定値を適切に変化させて受光量の変化に伴う
誤動作を軽減することができる。
【0081】請求項12に係る発明によれば、受光手段
を異なる位置に設けられた複数の受光部にし、有無判定
手段により複数の受光部の受光信号のパターンを予め記
憶し、各受光部からの受光信号と予め記憶した受光信号
のパターンとを比較するするので、請求項1又は請求項
2に記載の発明による効果に加えて、複数の受光部によ
り生成した受光信号の組み合わせにより、ユーザの存在
を検出することができる。
【0082】請求項13に係る発明によれば、凹部内に
光反射体を設け、凹部の開口部と凹部底面に設けた受光
部との実効長さを変更するので、請求項3〜請求項6に
記載の発明による効果に加えて、凹部の実効的な経路長
を長くして筐体の奥行きが浅い場合においても、効果的
に入射方向を制限することができる。
【0083】請求項14に係る発明によれば、受光信号
に基づいて、ユーザの存在有無を判定し、ユーザが存在
すると判定した時刻から時間計測を開始し、計測した時
間が所定時間を超えた場合に、上記音声入力手段で入力
した音声を用いた音声認識を開始するので、投光器等の
高価な部品を備える必要なく、装置の低価格化を実現す
ることができ、安価で簡単な手法でユーザの発話意図を
検出して音声認識の開始を正確に判定することができ
る。
【図面の簡単な説明】
【図1】本発明を適用した音声認識装置の外観構成を示
す正面図である。
【図2】本発明を適用した音声認識装置の構成を示すブ
ロック図である。
【図3】凹部の内部構造を示す断面図である。
【図4】凹部の他の構造を示す断面図である。
【図5】複数の受光部を音声認識装置に設けた場合の構
成を示す断面図である。
【図6】壁に音声認識装置を設けたときの凹部及び受光
部の構成を示す図である。
【図7】壁に音声認識装置を設けると共に、床付近に光
センサモジュールを設けたときの構成を示す図である。
【図8】受光部の受光方向を回転させる光センサモジュ
ールを説明するための図であり、(a)は上面図、
(b)は側面図である。
【図9】受光部の受光方向を回転させたときの光量の変
化を示す図である。
【図10】筐体から異なる位置にユーザが存在するとき
の受光量の変化を説明するための図である。
【符号の説明】
1 表示部 2 操作ボタン 3 マイク 4 受光部 11 凹部 21 表示部 22 操作入力部 23 マイク部 24 音声入力制御部 25 音声認識部 26 音声信号判定部 27 受光部 28 受光方向制御部 29 光信号判定部 30 時間計測部 31 判定値記憶部 32 制御部 41 レンズ 42 スリット 51 壁 52 床 53 内部配線 54,61 光センサモジュール 55 凹部 56 受光部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 久保山 晴弘 大阪府門真市大字門真1048番地 松下電工 株式会社内 Fターム(参考) 5D015 LL10 5F088 AA01 BA15 BA16 BB10

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 ユーザからの音声を入力する音声入力手
    段と、 上記音声入力手段で入力した音声を認識する音声認識手
    段と、 外部からの光を受光して受光量に応じた受光信号を生成
    する受光手段と、 上記受光手段で生成した受光信号に基づいて、ユーザの
    存在有無を判定する有無判定手段と、 上記有無判定手段でユーザが存在すると判定した時刻か
    らの時間を計測する時間計測手段と、 上記時間計測手段で計測した時間が所定時間を超えた場
    合に、上記音声入力手段で入力した音声を用いた音声認
    識を開始するように上記音声認識手段を制御する制御手
    段とを備えることを特徴とする音声認識装置。
  2. 【請求項2】 上記受光手段で生成した受光信号を用い
    て、定常状態における受光量を示す判定値を取得する判
    定値取得手段を更に備え、 上記有無判定手段は、上記受光手段で生成した受光信号
    と上記判定値取得手段で保持している判定値との受光量
    差と、所定値とを比較して、受光量差が所定のしきい値
    を超えたか否かを判定し、上記時間計測手段は、上記有
    無判定手段での受光量差が所定の値を超えたと判定した
    時刻からの時間を計測し、上記制御手段は、上記時間計
    測手段で計測した時間が所定時間を超えた場合に、上記
    音声入力手段で入力した音声を用いた音声認識を開始す
    るように上記音声認識手段を制御することを特徴とする
    請求項1に記載の音声認識装置。
  3. 【請求項3】 上記各手段を収容する筐体を更に備え、 上記筐体正面に凹部を設けると共に、上記受光手段を凹
    部底面に設けたことを特徴とする請求項1又は請求項2
    に記載の音声認識装置。
  4. 【請求項4】 上記受光手段は、上記筐体から外部に露
    呈した複数の受光部からなることを特徴とする請求項3
    に記載の音声認識装置。
  5. 【請求項5】 上記各受光部の受光方向を異としたこと
    を特徴とする請求項4に記載の音声認識装置。
  6. 【請求項6】 上記各受光部の受光方向を装置下方とし
    たことを特徴とする請求項4に記載の音声認識装置。
  7. 【請求項7】 上記受光手段とは別体であって、装置下
    方に設けられた受光装置を更に備えることを特徴とする
    請求項1又は請求項2に記載の音声認識装置。
  8. 【請求項8】 上記凹部の内壁を光拡散面としたことを
    特徴とする請求項3〜請求項6の何れか一に記載の音声
    認識装置。
  9. 【請求項9】 上記受光手段の受光方向を回転させる受
    光方向回転手段を更に備え、 上記有無判定手段は、上記受光方向回転手段で回転され
    た上記受光手段の受光方向、各受光方向に対応した上記
    受光手段の受光信号、各受光方向に対する判定値とを用
    いて、ユーザの存在有無の判定をすることを特徴とする
    請求項1又は請求項2に記載の音声認識装置。
  10. 【請求項10】 上記凹部の開口部と凹部底面との間に
    レンズを設けたことを特徴とする請求項3〜請求項6の
    何れか一に記載の音声認識装置。
  11. 【請求項11】 上記判定値取得手段は、音声認識を開
    始する時刻に応じて異なる判定値とすることを特徴とす
    る請求項2に記載の音声認識装置。
  12. 【請求項12】 上記受光手段は、異なる位置に設けら
    れた複数の受光部からなり、 上記有無判定手段は、複数の受光部の受光信号のパター
    ンを予め記憶し、各受光部からの受光信号と予め記憶し
    た受光信号のパターンとを比較して、ユーザの存在有無
    を判定することを特徴とする請求項1又は請求項2に記
    載の音声認識装置。
  13. 【請求項13】 上記凹部内に光反射体を設け、上記凹
    部の開口部と凹部底面に設けた受光部との実効長さを変
    更することを特徴とする請求項3〜請求項6の何れか一
    に記載の音声認識装置。
  14. 【請求項14】 外部からの光を受光して受光量に応じ
    た受光信号を生成し、 生成した受光信号に基づいて、ユーザの存在有無を判定
    し、 ユーザが存在すると判定した時刻から時間計測を開始
    し、 計測した時間が所定時間を超えた場合に、上記音声入力
    手段で入力した音声を用いた音声認識を開始することを
    特徴とする音声認識方法。
JP2001226492A 2001-07-26 2001-07-26 音声認識装置及び音声認識方法 Withdrawn JP2003044090A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001226492A JP2003044090A (ja) 2001-07-26 2001-07-26 音声認識装置及び音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001226492A JP2003044090A (ja) 2001-07-26 2001-07-26 音声認識装置及び音声認識方法

Publications (1)

Publication Number Publication Date
JP2003044090A true JP2003044090A (ja) 2003-02-14

Family

ID=19059299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001226492A Withdrawn JP2003044090A (ja) 2001-07-26 2001-07-26 音声認識装置及び音声認識方法

Country Status (1)

Country Link
JP (1) JP2003044090A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018109980A (ja) * 2013-02-07 2018-07-12 アップル インコーポレイテッド デジタルアシスタントのためのボイストリガ
JP2020140473A (ja) * 2019-02-28 2020-09-03 レノボ・シンガポール・プライベート・リミテッド 情報処理装置、音声認識方法、及び音声認識プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018109980A (ja) * 2013-02-07 2018-07-12 アップル インコーポレイテッド デジタルアシスタントのためのボイストリガ
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US12009007B2 (en) 2013-02-07 2024-06-11 Apple Inc. Voice trigger for a digital assistant
JP2020140473A (ja) * 2019-02-28 2020-09-03 レノボ・シンガポール・プライベート・リミテッド 情報処理装置、音声認識方法、及び音声認識プログラム

Similar Documents

Publication Publication Date Title
KR101162803B1 (ko) 광전식 연기 감지기
US8130099B2 (en) Sensor light
JP2016500818A (ja) 感知される光レベルに対する異なる貢献度を区別する照明センサ
JP4995783B2 (ja) 携帯端末機
US10614685B2 (en) Surveillance door monitor apparatus and method with IR sensors and wrong-way entry detection
JP6845854B2 (ja) 生活空間機能を制御するためのシステム
US4800285A (en) Flame detecting arrangement for detecting a flame through horizontal and vertical scanning of a supervisory region by using a photodetector
CN106383644A (zh) 一种电子设备的语音识别开启方法及装置
JP2008242627A (ja) 光電式煙感知器
JP2017162682A (ja) 照明システム
US20080136589A1 (en) Multi-function replica traffic light
US7482574B2 (en) Light guide having an elongate shape with dual concave shaped end and electronic device using light guide
JP2003044090A (ja) 音声認識装置及び音声認識方法
JP2020013037A (ja) 投影装置
KR102519742B1 (ko) 스피커 모듈을 포함하는 전자 장치, 및 조명 장치
JP2008093137A (ja) 扉開閉検出装置とこの扉開閉検出装置を備えた遊技機及び管理コンピュータシステム
JP6191208B2 (ja) 電子装置
CN105716210B (zh) 具有遥控器位置检测功能的空调、感光部支架
JP2011186643A (ja) 煙感知器
CN115298525A (zh) 传感器设备
JP2003270354A (ja) 自動扉用スイッチ
JP5885786B2 (ja) 煙感知器
KR100518866B1 (ko) 홍채 인식 장치 및 홍채 인식 장치의 거리 판단 방법
JP5854585B2 (ja) 煙感知器
KR101797850B1 (ko) 난반사 방지 기능이 구비된 홍채 영상 촬영 장치

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007