JP2000338995A - 音声認識装置及び音声認識用プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

音声認識装置及び音声認識用プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2000338995A
JP2000338995A JP11152749A JP15274999A JP2000338995A JP 2000338995 A JP2000338995 A JP 2000338995A JP 11152749 A JP11152749 A JP 11152749A JP 15274999 A JP15274999 A JP 15274999A JP 2000338995 A JP2000338995 A JP 2000338995A
Authority
JP
Japan
Prior art keywords
voice
speaker
unit
output
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11152749A
Other languages
English (en)
Inventor
Yasuyuki Masai
康之 正井
Yuichi Hashizume
裕一 橋爪
Takumi Yamamoto
琢己 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP11152749A priority Critical patent/JP2000338995A/ja
Publication of JP2000338995A publication Critical patent/JP2000338995A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】特別なボタンスイッチ操作を行わなくても、話
者が所定の動きをするだけで、音声入力動作の開始な
ど、音声認識に関する処理の開始を指示することができ
るようにする。 【解決手段】位置検出部11により話者の体の所定部位
の位置を検出し、その検出位置が、設定された位置条件
に合致した場合に、音声入力制御部12から音声入力部
13に音声入力制御指令を送って、当該音声入力部13
による音声入力動作を開始させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、話者が発する音声
を認識する音声認識装置に係り、特に話者の動きを検出
するユーザインタフェースを備えた音声認識装置及び当
該インタフェースを利用した音声認識用プログラムを記
録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】話者が発する音声を認識する音声認識装
置では、その認識性能向上のために、話者が発声するタ
イミングを検出することが重要である。そこで近年の音
声認識装置(を搭載した電子機器)では、音声の入力開
始など、音声認識に関する処理の開始を、話者自身が当
該装置に指示するための例えばボタンスイッチを備え、
このボタンスイッチがオン操作されたのを検出すること
で、音声入力を開始するなど、音声認識に関する処理を
開始するようになっている。
【0003】
【発明が解決しようとする課題】近年、音声認識装置は
種々の用途に応用されるようになってきている。その結
果、音声認識装置の用途によっては、ボタンスイッチの
使用がシステムの構築を困難にする場合が生じるように
なった。例えば、音声認識機能が付加されたカーナビゲ
ーション装置では、使い勝手と安全面からも、運転者は
極力ボタン操作等から解放されることが好ましく、上記
ボタンスイッチに代わる指示手段が望まれる。
【0004】本発明は上記事情を考慮してなされたもの
でその目的は、特別なボタンスイッチ操作を行わなくて
も、話者が所定の動きをするだけで、認識性能の向上に
必要な音声の入力開始など、音声認識に関する処理の開
始を指示することができ、もって種々の用途に応用でき
る使い勝手の良い音声認識装置及び音声認識用プログラ
ムを記録したコンピュータ読み取り可能な記録媒体を提
供することにある。
【0005】
【課題を解決するための手段】本発明は、話者が発する
音声を認識する音声認識装置において、話者の動きを検
出する動き検出手段と、この動作検出手段の動き検出結
果が所定の条件を満たした場合に、音声入力の動作開始
を決定して対応する制御指令を発する制御手段と、この
制御手段から出力される制御指令に基づき、音声を入力
して対応する音声データを出力する音声入力手段と、こ
の音声入力手段から出力される音声データを音響分析し
て特徴パラメータ系列を出力する音声処理手段と、この
音声処理手段から出力される特徴パラメータ系列と予め
用意されている音声モデルとを照合することで認識結果
を取得する音声認識手段とを備えたことを特徴とする。
【0006】このように、音声入力手段の動作を、動作
検出手段により検出される話者の動き(アクション)に
応じて制御することで、話者によるボタンスイッチ等の
操作を必要とせずに、入力音声データの始まりを絞り込
むことができ、使い勝手の良い音声認識装置が実現可能
となる。
【0007】また、上記制御手段に代えて、動作検出手
段の動き検出結果が所定の条件を満たした場合に、音声
処理の動作開始を決定して対応する音声処理制御指令を
発する制御手段を用い、この音声処理制御指令に基づき
音声処理手段での上記動作が開始される構成とすること
も可能である。
【0008】このように、音声処理手段の動作を、動作
検出手段により検出される話者の動き(アクション)に
応じて制御することでも、話者によるボタンスイッチ等
の操作を必要とせずに、入力音声データの始まりを絞り
込むことができ、使い勝手の良い音声認識装置が実現可
能となる。
【0009】また、上記制御手段に代えて、動作検出手
段の動き検出結果が所定の条件を満たした場合に、音声
認識の動作開始を決定して対応する音声認識制御指令を
発する制御手段を用い、この音声認識制御指令に基づき
音声認識手段での上記動作が開始される構成とすること
も可能である。
【0010】このように、音声認識手段の動作を、動作
検出手段により検出される話者の動き(アクション)に
応じて制御することでも、話者によるボタンスイッチ等
の操作を必要とせずに、入力音声データの始まりを絞り
込むことができ、使い勝手の良い音声認識装置が実現可
能となる。
【0011】ここで、上記動作検出手段として、話者の
動きを当該話者の体の所定部位の位置により検出する位
置検出手段、または話者の動きを当該話者の体の任意の
部位の加速度により検出する加速度検出手段、または話
者の動きを当該話者の体の任意の部位の傾きにより検出
する傾き検出手段を用いることにより、話者は、自身の
体の所定部位を、上記条件(判定のための位置条件)に
合致する位置に動かすとか、体の任意の部位を、上記条
件(判定のための加速度条件)に合致する加速度で動か
すとか、体の任意の部位を、上記条件(判定のための傾
き条件)に合致する傾き(傾斜角)に傾けるとかするだ
けで、上記音声入力等の動作開始の指示を与えることが
できる。
【0012】また、上記動作検出手段を、上記位置検出
手段、加速度検出手段及び傾き検出手段のうちの少なく
とも2つで構成し、それに対応した少なくとも2つの判
定条件(複合条件)を用いて、制御手段による条件判定
を行うならば、話者の無意識の動きが偶然に設定条件に
合致して音声入力等の動作が開始される不具合を解消で
きる。
【0013】また、外部からの操作により任意の上記条
件を設定登録するための動作登録手段を付加するなら
ば、条件の設定変更が任意に行えるようになることか
ら、利用者にとって使いやすい条件にチューニングで
き、一層使い勝手の良い音声認識装置が実現可能とな
る。
【0014】また、上記制御手段から出力される制御指
令に基づき、話者の動きが所定の条件を満たした旨、つ
まり話者の動きに基づく音声入力等の音声認識に関する
動作を開始した旨を当該話者に報知する報知手段を付加
するならば、話者は、自身の動きで音声認識に関する動
作の開始を指示した場合に、その指示が装置側で正しく
検出されたか否かを確認することができる。ここで、上
記報知手段に、音出力、光出力、振動出力、または上記
音声入力手段から出力される音声データに基づく音声出
力の少なくとも1つの機能を持たせるならば、話者への
報知を効果的に行える。
【0015】なお、本発明は方法に係る発明としても成
立する。また、本発明は、コンピュータに当該発明に相
当する手順を実行させるための(或いはコンピュータを
当該発明に相当する手段として機能させるための、或い
はコンピュータに当該発明に相当する機能を実現させる
ための)音声認識用プログラムを記録したコンピュータ
読み取り可能な記録媒体としても成立する。
【0016】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0017】[第1の実施形態]図1は本発明の第1の
実施形態に係る音声認識装置の構成を示すブロック図で
ある。同図において、位置検出部11は、話者の体の所
定部位の位置を常時検出するもので、例えば話者を撮影
して画像情報を取得する撮像装置としてのCCDカメラ
11aと、このCCDカメラ11aから出力される画像
情報に基づく画像認識処理を行うことで、話者の所定部
位の位置を検出する画像処理プロセッサ11bとから構
成される。
【0018】ここで、話者の画像から上記所定部位の位
置を検出するには、当該画像から、話者の体の基準とな
る部位、例えば脇の下と、所定部位(例えば左手の人差
し指の先端、左の手首、左足のつま先など)を検出し、
その基準部位に対する所定部位の例えば2次元空間上の
相対位置を求めればよい。なお、基準部位には、話者の
体の部位に代えて静止物体の所定部分を用いてもよく、
図1の音声認識装置が(車両に搭載された)カーナビゲ
ーション装置に適用された例であれば、当該カーナビゲ
ーション装置、或いはハンドルの所定部分を用いてもよ
い。
【0019】位置検出部11により検出された話者の所
定部位の位置を表す位置データは音声入力制御部12に
渡される。音声入力制御部12は位置検出部11から渡
される位置データを、位置登録部16により設定登録さ
れている位置データ(登録位置データ、位置条件デー
タ)と比較して、話者の体の所定部位が位置条件データ
の示す位置を基準とする一定の範囲(許容範囲)内に入
ったか否かを判定する。
【0020】ここでは、位置条件データとして、話者が
左手の人差し指の先端を唇の位置に持ってきた場合の、
脇の下を基準とする当該人差し指の先端の位置を示す位
置データが設定されているものとする。また、上記許容
範囲(Δx,Δy)の情報は、基準位置を示す位置条件
データに付されていても、位置条件データから独立に管
理されていても構わない。
【0021】音声入力制御部12は、話者の体の所定部
位が位置条件データの示す位置を基準とする一定の範囲
(許容範囲)内に入ったものと判定した場合、つまり話
者が体の所定部位を基準位置に移動した結果、位置条件
(動作判定条件)に合致したと判定した場合、話者から
音声入力の動作開始が指示されたものと判断する。この
場合、音声入力制御部12は音声入力部13に対して特
定の制御指令(音声入力制御指令)を出力する。
【0022】音声入力部13は、周知のように、マイク
ロホン(図示せず)を使用して、話者が発する音声を入
力して電気信号(音声信号)に変換し、更にA/D(ア
ナログ/ディジタル)変換により音声データ(ディジタ
ル音声信号)を取得する。但し音声入力部13は、上記
の動作(音声入力動作)を、音声入力制御部12から音
声入力制御指令を受けることで開始する。
【0023】音声入力部13は、音声入力制御部12か
らの音声入力制御指令に応じて音声入力動作を開始する
と、以後、その入力動作で取得した音声データを音声処
理部14に出力する。
【0024】音声処理部14は、音声入力部13から出
力される音声データを分析して、周知の特徴パラメータ
系列に変換する。音声認識に使用される代表的な特徴パ
ラメータとして、バンドパスフィルタまたはフーリエ変
換によって求めることができるパワースペクトラムや、
LPC(線形予測)分析によって求められるケプストラ
ム係数などがよく知られている。但し、本実施形態で
は、使用する特徴パラメータの種類は問わない。
【0025】音声処理部14が取得した入力音声(に対
応する音声データ)の特徴パラメータ系列は音声認識部
15に出力される。音声認識部15は、音声処理部14
から特徴パラメータ系列を受け取ると、当該特徴パラメ
ータ系列を予め用意されている各音声モデル(認識対象
の各特徴パラメータ系列)と照合することで、各音声モ
デルとの類似度或いは距離を算出し、認識結果を取得す
る。ここで、音声認識部15で適用可能な音声認識の方
法としては、音声モデルを特徴パラメータ系列で表現し
ておき、DP(動的)計画法で音声モデルの特徴パラメ
ータ系列と、入力音声の特徴パラメータ系列との距離を
求める方法や、HMM(隠れマルコフモデル)を用いて
音声モデルを表現しておき、入力音声の特徴パラメータ
系列が入力されたときの各音声モデルの確率を計算する
方法などが広く知られている。但し、音声認識部15で
実際に適用する方法は特に問わない。
【0026】このように本実施形態においては、音声入
力部13の動作を、位置検出部11で検出される話者の
体の所定部位の位置に応じて制御することで、更に具体
的に述べるならば、話者の体の所定部位が基準位置に移
動した結果、設定された位置条件(動作判定条件)に合
致したと判定して、音声入力部13の動作を制御するこ
とで、入力音声データの始まりを絞り込むことができ、
使い勝手の良い音声認識装置が実現可能となる。
【0027】さて本実施形態では、上記の位置条件(動
作判定条件、位置条件データ、登録位置データ)が、利
用者の操作により位置登録部16から任意に設定登録・
変更登録できるようになっている。このように、位置条
件(動作判定条件)が任意に変更登録可能とすること
で、利用者にとって使いやすい条件にチューニングでき
るため、一層使い勝手の良い音声認識装置が実現可能と
なる。
【0028】(1a)第1の実施形態の第1の変形例 次に、上記第1の実施形態に係る音声認識装置の第1の
変形例について図2のブロック構成図を参照して説明す
る。なお、図1と同一部分には同一符号を付してある。
【0029】図2の構成が図1の構成と異なる点は、図
1中の音声入力制御部12に代えて音声処理制御部22
を、音声入力部13に代えて音声入力部23を、そして
音声処理部14に代えて音声処理部24を用いているこ
とである。
【0030】音声入力部23の特徴は、図1中の音声入
力部13と異なって常時音声入力動作を行う点にある。
次に音声処理制御部22は、位置検出部11から渡され
る位置データを、位置登録部16により設定登録されて
いる位置データ(登録位置データ、位置条件データ)と
比較して、話者の体の所定部位が位置条件データの示す
位置を基準とする一定の範囲(許容範囲)内に入ったか
否かを判定する点では、図1中の音声入力制御部12と
同様である。音声処理制御部22の特徴は、話者が体の
所定部位を基準位置に移動した結果、設定された位置条
件(動作判定条件)に合致したと判定した場合に、話者
から音声処理の動作開始が指示されたものと判断して、
音声処理部24に対して特定の制御指令(音声処理制御
指令)を出力する点にある。
【0031】音声処理部24は、この音声処理制御部2
2からの音声処理制御指令に応じて図1中の音声処理部
14が行ったのと同様の音声処理動作を開始し、音声入
力部23から出力される音声データを特徴パラメータ系
列に変換して音声認識部15に出力する。この音声認識
部15での音声認識動作は、図1の構成と同様である。
【0032】このように本変形例においては、音声処理
部24の動作を、位置検出部11で検出される話者の体
の所定部位の位置に応じて制御することで、入力音声デ
ータの始まりを絞り込むことができ、使い勝手の良い音
声認識装置が実現可能となる。
【0033】(1b)第1の実施形態の第2の変形例 次に、上記第1の実施形態に係る音声認識装置の第2の
変形例について図3のブロック構成図を参照して説明す
る。なお、図1または図2と同一部分には同一符号を付
してある。
【0034】図3の構成が図1の構成と異なる点は、図
1中の音声入力制御部12に代えて音声認識制御部32
を、音声入力部13に代えて(図2の構成で適用した)
音声入力部23を、そして音声認識部15に代えて音声
認識部35を用いていることである。
【0035】音声認識制御部32は、位置検出部11か
ら渡される位置データを、位置登録部16により設定登
録されている位置データ(登録位置データ、位置条件デ
ータ)と比較して、話者の体の所定部位が位置条件デー
タの示す位置を基準とする一定の範囲(許容範囲)内に
入ったか否かを判定する点では、図1中の音声入力制御
部12と同様である。音声認識制御部32の特徴は、話
者が体の所定部位を基準位置に移動した結果、設定され
た位置条件(動作判定条件)に合致したと判定した場合
に、話者から音声認識の動作開始が指示されたものと判
断して、音声認識部35に対して特定の制御指令(音声
認識制御指令)を出力する点にある。
【0036】音声認識部35は、この音声認識制御部3
2からの音声認識制御指令に応じて図1中の音声認識部
15が行ったのと同様の音声認識動作を開始し、音声処
理部14から出力される特徴パラメータ系列を予め用意
されている各音声モデル(認識対象の各特徴パラメータ
系列)と照合することで、各音声モデルとの類似度或い
は距離を算出し、認識結果を取得する。
【0037】このように本変形例においては、音声認識
部35の動作を、位置検出部11で検出される話者の体
の所定部位の位置に応じて制御することで、入力音声デ
ータの始まりを絞り込むことができ、使い勝手の良い音
声認識装置が実現可能となる。
【0038】以上に述べた図1乃至図3の構成の音声認
識装置では、位置登録部16が設けられているものとし
て説明したが、当該位置登録部16は必ずしも必要でな
く、特定の位置条件が制御部(音声入力制御部12、音
声処理制御部22、音声認識制御部32)に予め設定登
録されているものであっても構わない。
【0039】[第2の実施形態]図4は本発明の第2の
実施形態に係る音声認識装置の構成を示すブロック図で
ある。本実施形態の特徴は、前記第1の実施形態が、話
者による、音声の入力開始など、音声認識に関する処理
の開始の指示動作を、話者の体の部位の位置により判定
していたのに対し、話者の体の部位の加速度により判定
するようにした点にある。
【0040】図4の音声認識装置は、加速度検出部4
1、音声入力制御部42、音声入力部43、音声処理部
44、音声認識部45及び加速度登録部46から構成さ
れている。
【0041】図4の構成が図1の構成と異なるのは、図
1中の位置検出部11に代えて加速度検出部41が、音
声入力制御部12に代えて音声入力制御部42が、位置
登録部16に代えて加速度登録部46が用いられている
点である。図4中の他の構成要素、即ち音声入力部4
3、音声処理部44、音声認識部45は、図1中の音声
入力部13、音声処理部14、音声認識部15と同様で
ある。
【0042】加速度検出部41は、加速度センサを用い
て構成されており、話者の体の任意の部位(腕、手首、
首、耳、頭、足など)に装着して使用されることで、当
該部位の加速度を常時検出する。
【0043】加速度検出部41により検出された話者の
任意の部位の加速度を表すデータ(加速度データ)は音
声入力制御部42に渡される。音声入力制御部42は加
速度検出部41から渡される加速度データを、加速度登
録部46により設定登録されている加速度データ(登録
加速度データ、加速度条件データ)と比較して、話者の
体の任意の部位の加速度が加速度条件データの示す加速
度を基準とする一定の範囲(許容範囲)内に入ったか否
かを判定する。
【0044】音声入力制御部42は、話者の体の任意の
部位の加速度が加速度条件データの示す加速度を基準と
する一定の範囲(許容範囲)内に入ったものと判定した
場合、つまり話者が(加速度検出部41を装着した)体
の任意の部位を基準加速度で動かした結果、加速度条件
(動作判定条件)に合致したと判定した場合、話者から
音声入力の動作開始が指示されたものと判断する。この
場合、音声入力制御部42は音声入力部43に対して特
定の制御指令(音声入力制御指令)を出力する。
【0045】音声入力部43は、音声入力制御部42か
らの音声入力制御指令に応じて(図1の構成における音
声入力部13と同様に)音声入力動作を開始し、以後、
その入力動作で取得した音声データを音声処理部44に
出力する。以降の音声処理部44、音声認識部45の動
作は、前記した図1中の音声処理部14、音声認識部1
5の動作と同様であるため、説明を省略する。
【0046】以上に述べたように本実施形態において
は、音声入力部43の動作を、加速度検出部41で検出
される話者の体の任意の部位の加速度に応じて制御する
ことで、更に具体的に述べるならば、話者が体の任意の
部位を基準加速度で動かした結果、設定された加速度条
件(動作判定条件)に合致したと判定して、音声入力部
43の動作を制御することで、入力音声データの始まり
を絞り込むことができ、使い勝手の良い音声認識装置が
実現可能となる。
【0047】しかも本実施形態では、上記の加速度条件
(動作判定条件、加速度条件データ、登録加速度デー
タ)が、利用者の操作により加速度登録部46から任意
に設定登録・変更登録できるようになっている。このよ
うに、加速度条件(動作判定条件)が任意に変更登録可
能とすることで、利用者にとって使いやすい条件にチュ
ーニングできるため、一層使い勝手の良い音声認識装置
が実現可能となる。
【0048】(2a)第2の実施形態の第1の変形例 次に、上記第2の実施形態に係る音声認識装置の第1の
変形例について図5のブロック構成図を参照して説明す
る。なお、図4と同一部分には同一符号を付してある。
【0049】図5の構成が図4の構成と異なる点は、図
4中の音声入力制御部42に代えて音声処理制御部52
を、音声入力部43に代えて音声入力部53を、そして
音声処理部44に代えて音声処理部54を用いているこ
とである。
【0050】音声入力部53は、図4中の音声入力部4
3と異なって(図2中の音声入力部23と同様に)常時
音声入力動作を行う。音声処理制御部52は、加速度検
出部41から渡される加速度データを、加速度登録部4
6により設定登録されている加速度データ(登録加速度
データ、加速度条件データ)と比較して、話者の体の任
意の部位の加速度が加速度条件データの示す加速度を基
準とする一定の範囲(許容範囲)内に入ったか否かを判
定する点では、図4中の音声入力制御部42と同様であ
る。音声処理制御部52の特徴は、話者が体の任意の部
位を基準加速度で動かした結果、設定された加速度条件
(動作判定条件)に合致したと判定した場合に、話者か
ら音声処理の動作開始が指示されたものと判断して、音
声処理部54に対して特定の制御指令(音声処理制御指
令)を出力する点にある。
【0051】音声処理部54は、この音声処理制御部5
2からの音声処理制御指令に応じて図1中の音声処理部
14が行ったのと同様の音声処理動作を開始し、音声入
力部53から出力される音声データを特徴パラメータ系
列に変換して音声認識部45に出力する。この音声認識
部45での音声認識動作は、図1中の音声認識部15と
同様である。
【0052】このように本変形例においては、音声処理
部54の動作を、加速度検出部41で検出される話者の
体の任意の部位の加速度に応じて制御することで、入力
音声データの始まりを絞り込むことができ、使い勝手の
良い音声認識装置が実現可能となる。
【0053】(2b)第2の実施形態の第2の変形例 次に、上記第2の実施形態に係る音声認識装置の第2の
変形例について図6のブロック構成図を参照して説明す
る。なお、図4または図5と同一部分には同一符号を付
してある。
【0054】図6の構成が図4の構成と異なる点は、図
4中の音声入力制御部42に代えて音声認識制御部62
を、音声入力部43に代えて音声入力部53を、そして
音声認識部45に代えて音声認識部65を用いているこ
とである。
【0055】音声認識制御部62は、加速度検出部41
から渡される加速度データを、加速度登録部46により
設定登録されている加速度データ(登録加速度データ、
加速度条件データ)と比較して、話者の体の任意の部位
の加速度が加速度条件データの示す加速度を基準とする
一定の範囲(許容範囲)内に入ったか否かを判定する点
では、図4中の音声入力制御部42と同様である。音声
認識制御部62の特徴は、話者が体の任意の部位を基準
加速度で動かした結果、設定された加速度条件(動作判
定条件)に合致したと判定した場合に、話者から音声認
識の動作開始が指示されたものと判断して、音声認識部
65に対して特定の制御指令(音声認識制御指令)を出
力する点にある。
【0056】音声認識部65は、この音声認識制御部6
2からの音声認識制御指令に応じて図1中の音声認識部
15が行ったのと同様の音声認識動作を開始し、音声処
理部44から出力される特徴パラメータ系列を予め用意
されている各音声モデル(認識対象の各特徴パラメータ
系列)と照合することで、各音声モデルとの類似度或い
は距離を算出し、認識結果を取得する。
【0057】このように本変形例においては、音声認識
部65の動作を、加速度検出部41で検出される話者の
体の任意の部位の加速度に応じて制御することで、入力
音声データの始まりを絞り込むことができ、使い勝手の
良い音声認識装置が実現可能となる。
【0058】以上に述べた図4乃至図6の構成の音声認
識装置では、加速度登録部46が設けられているものと
して説明したが、当該加速度登録部46は必ずしも必要
でなく、特定の加速度条件が制御部(音声入力制御部4
2、音声処理制御部52、音声認識制御部62)に予め
設定登録されているものであっても構わない。
【0059】[第3の実施形態]図7は本発明の第3の
実施形態に係る音声認識装置の構成を示すブロック図で
ある。本実施形態の特徴は、前記第1、第2の実施形態
が、話者による、音声の入力開始など、音声認識に関す
る処理の開始の指示動作を、話者の体の部位の位置、加
速度により判定していたのに対し、話者の体の部位の傾
きにより判定するようにした点にある。
【0060】図7の音声認識装置は、傾き検出部71、
音声入力制御部72、音声入力部73、音声処理部7
4、音声認識部75及び傾き登録部76から構成されて
いる。
【0061】図7の構成が図1の構成と異なるのは、図
1中の位置検出部11に代えて傾き検出部71が、音声
入力制御部12に代えて音声入力制御部72が、位置登
録部16に代えて傾き登録部76が用いられている点で
ある。図7中の他の構成要素、即ち音声入力部73、音
声処理部74、音声認識部75は、図1中の音声入力部
13、音声処理部14、音声認識部15と同様である。
【0062】傾き検出部71は、2軸または3軸の傾斜
角センサを用いて構成されており、話者の体の任意の部
位(腕、手首、首、耳、頭、足など)に装着して使用さ
れることで、当該部位の傾き(2次元または3次元の傾
き)を常時検出する。
【0063】傾き検出部71により検出された話者の任
意の部位の傾き(傾斜角)を表すデータ(傾きデータ)
は音声入力制御部72に渡される。音声入力制御部72
は傾き検出部71から渡される傾きデータを、傾き登録
部76により設定登録されている傾きデータ(登録傾き
データ、傾き条件データ)と比較して、話者の体の任意
の部位の傾きが傾き条件データの示す傾きを基準とする
一定の範囲(許容範囲)内に入ったか否かを判定する。
【0064】音声入力制御部72は、話者の体の任意の
部位の傾きが傾き条件データの示す傾きを基準とする一
定の範囲(許容範囲)内に入ったものと判定した場合、
つまり話者が(傾き検出部71を装着した)体の任意の
部位を基準の傾きに一致するように傾けた結果、傾き条
件(動作判定条件)に合致したと判定した場合、話者か
ら音声入力の動作開始が指示されたものと判断する。こ
の場合、音声入力制御部72は音声入力部73に対して
特定の制御指令(音声入力制御指令)を出力する。
【0065】音声入力部73は、音声入力制御部72か
らの音声入力制御指令に応じて(図1の構成における音
声入力部13と同様に)音声入力動作を開始し、以後、
その入力動作で取得した音声データを音声処理部74に
出力する。以降の音声処理部74、音声認識部75の動
作は、前記した図1中の音声処理部14、音声認識部1
5の動作と同様であるため、説明を省略する。
【0066】以上に述べたように本実施形態において
は、音声入力部73の動作を、傾き検出部71で検出さ
れる話者の体の任意の部位の傾きに応じて制御すること
で、更に具体的に述べるならば、話者が体の任意の部位
を基準の傾斜角に一致するように傾けた結果、設定され
た傾き条件(動作判定条件)に合致したと判定して、音
声入力部73の動作を制御することで、入力音声データ
の始まりを絞り込むことができ、使い勝手の良い音声認
識装置が実現可能となる。
【0067】しかも本実施形態では、上記の傾き条件
(動作判定条件、傾き条件データ、登録傾きデータ)
が、利用者の操作により傾き登録部76から任意に設定
登録・変更登録できるようになっている。このように、
傾き条件(動作判定条件)が任意に変更登録可能とする
ことで、利用者にとって使いやすい条件にチューニング
できるため、一層使い勝手の良い音声認識装置が実現可
能となる。
【0068】(3a)第3の実施形態の第1の変形例 次に、上記第3の実施形態に係る音声認識装置の第1の
変形例について図8のブロック構成図を参照して説明す
る。なお、図7と同一部分には同一符号を付してある。
【0069】図8の構成が図7の構成と異なる点は、図
7中の音声入力制御部72に代えて音声処理制御部82
を、音声入力部73に代えて音声入力部83を、そして
音声処理部74に代えて音声処理部84を用いているこ
とである。
【0070】音声入力部83は、図7中の音声入力部7
3と異なって(図2中の音声入力部23と同様に)常時
音声入力動作を行う。音声処理制御部82は、傾き検出
部71から渡される傾きデータを、傾き登録部76によ
り設定登録されている傾きデータ(登録傾きデータ、傾
き条件データ)と比較して、話者の体の任意の部位の傾
きが傾き条件データの示す傾きを基準とする一定の範囲
(許容範囲)内に入ったか否かを判定する点では、図7
中の音声入力制御部72と同様である。音声処理制御部
82の特徴は、話者が体の任意の部位を基準の傾きに傾
けた結果、設定された傾き条件(動作判定条件)に合致
したと判定した場合に、話者から音声処理の動作開始が
指示されたものと判断して、音声処理部84に対して特
定の制御指令(音声処理制御指令)を出力する点にあ
る。
【0071】音声処理部84は、この音声処理制御部8
2からの音声処理制御指令に応じて図1中の音声処理部
14が行ったのと同様の音声処理動作を開始し、音声入
力部83から出力される音声データを特徴パラメータ系
列に変換して音声認識部75に出力する。この音声認識
部75での音声認識動作は、図1中の音声認識部15と
同様である。
【0072】このように本変形例においては、音声処理
部84の動作を、傾き検出部71で検出される話者の体
の任意の部位の傾きに応じて制御することで、入力音声
データの始まりを絞り込むことができ、使い勝手の良い
音声認識装置が実現可能となる。
【0073】(3b)第3の実施形態の第2の変形例 次に、上記第3の実施形態に係る音声認識装置の第2の
変形例について図9のブロック構成図を参照して説明す
る。なお、図9と同一部分には同一符号を付してある。
【0074】図9の構成が図7の構成と異なる点は、図
7中の音声入力制御部72に代えて音声認識制御部92
を、音声入力部73に代えて音声入力部83を、そして
音声認識部75に代えて音声認識部95を用いているこ
とである。
【0075】音声入力部83は、図7中の音声入力部7
3と異なって(図2中の音声入力部23と同様に)常時
音声入力動作を行う。音声認識制御部92は、傾き検出
部71から渡される傾きデータを、傾き登録部76によ
り設定登録されている傾きデータ(登録傾きデータ、傾
き条件データ)と比較して、話者の体の任意の部位の傾
きが傾き条件データの示す傾きを基準とする一定の範囲
(許容範囲)内に入ったか否かを判定する点では、図7
中の音声入力制御部72と同様である。音声認識制御部
92の特徴は、話者が体の任意の部位を基準の傾きに傾
けた結果、設定された傾き条件(動作判定条件)に合致
したと判定した場合に、話者から音声認識の動作開始が
指示されたものと判断して、音声認識部95に対して特
定の制御指令(音声認識制御指令)を出力する点にあ
る。
【0076】音声認識部95は、この音声認識制御部9
2からの音声認識制御指令に応じて図1中の音声認識部
15が行ったのと同様の音声認識動作を開始し、音声処
理部74から出力される特徴パラメータ系列を予め用意
されている各音声モデル(認識対象の各特徴パラメータ
系列)と照合することで、各音声モデルとの類似度或い
は距離を算出し、認識結果を取得する。
【0077】このように本変形例においては、音声認識
部95の動作を、傾き検出部71で検出される話者の体
の任意の部位の傾きに応じて制御することで、入力音声
データの始まりを絞り込むことができ、使い勝手の良い
音声認識装置が実現可能となる。
【0078】以上に述べた図7乃至図9の構成の音声認
識装置では、傾き登録部76が設けられているものとし
て説明したが、当該傾き登録部76は必ずしも必要でな
く、特定の傾き条件が制御部(音声入力制御部72、音
声処理制御部82、音声認識制御部92)に予め設定登
録されているものであっても構わない。
【0079】(4a)第1乃至第3の実施形態に共通の
第1の変形例 前記第1、第2、第3の実施形態では、話者の体の所定
部位の位置、任意の部位の加速度、または任意の部位の
傾きが、設定された唯一の条件である位置、加速度、ま
たは傾きの条件に合致した場合に制御指令(音声入力制
御指令、音声処理制御指令、または音声認識制御指令)
が出力されるものとして説明した。しかし、位置、加速
度、または傾きのうちの1つだけに基づく動作判定で
は、話者の無意識の動作が偶然に設定条件に合致するこ
とがあり得る。そこで、位置、加速度、または傾きのう
ちの少なくとも2つに基づく動作判定を行うようにする
とよい。
【0080】図10に、位置、加速度及び傾きの3つに
基づく動作判定を実現する要部のブロック構成図を示
す。なお、図1乃至図9と同一部分には同一符号を付し
てある。同図において、動作検出部101は話者の動き
を検出するためのものであり、位置検出部11、加速度
検出部41及び傾き検出部71から構成される。ここ
で、加速度検出部41及び傾き検出部71は、同一筐体
(例えば、手首に装着して用いられる時計状のケース)
内に実装することが可能である。
【0081】さて、動作検出部101内の位置検出部1
1により検出される話者の所定部位の位置を表す位置デ
ータ、加速度検出部41により検出される話者の任意の
部位の加速度を表す加速度データ、及び傾き検出部71
により検出される話者の任意の部位の傾きを表す傾きデ
ータは、いずれも制御部102に出力される。
【0082】制御部102には、動作登録部103によ
り、位置、加速度及び傾きの3つについて条件の設定登
録がなされているものとする。この場合、制御部102
は、位置検出部11により検出された(話者の体の所定
部位の)位置が位置条件に合致し、且つ加速度検出部4
1により検出された(話者の体の任意の部位の)加速度
が加速度条件に合致し、且つ傾き検出部71により検出
された(話者の体の任意の部位の)傾きが傾き条件に合
致する場合にのみ、制御指令(音声入力制御指令、音声
処理制御指令、または音声認識制御指令)を出力する。
【0083】なお、動作検出部101が、位置検出部1
1、加速度検出部41及び傾き検出部71のうちの任意
の2つから構成されるものであっても構わない。また、
動作登録部103は必ずしも必要ない。
【0084】(4b)第1乃至第3の実施形態に共通の
第2の変形例 前記第1、第2、第3の実施形態では、話者が、音声の
入力開始など、音声認識に関する処理の開始を音声認識
装置に対して指示するための動き(アクション)を行っ
た場合に、その話者の指示動作を装置側で正しく検出し
て、指示された音声認識に関する処理を開始したか否か
を、話者は確認することができない。
【0085】そこで、図11(a)に示すように、図1
乃至図9の構成の音声認識装置に、音声入力制御部(1
2,42,72)からの音声入力制御指令、音声処理制
御部(22,52,82)からの音声処理制御指令、ま
たは音声認識制御部(32,62,92)からの音声認
識制御指令に応じて、話者に対する確認のための音(確
認音)を出力する確認音出力部111を追加するとよ
い。
【0086】また、図11(b)に示すように、確認音
出力部111に代えて、話者に対する確認のための光
(確認光)を出力する確認光出力部112を用いてもよ
い。
【0087】また、図11(c)に示すように、確認音
出力部111に代えて、話者に対する確認のための振動
(確認振動)を発生する確認振動出力部113を用いて
もよい。
【0088】更に、図11(c)に示すように、音声入
力部(13,23,43,53,73,83)から出力
さるれ音声データに基づく音声出力を行う音声出力部1
16を用いてもよい。この場合、音声入力部からの音声
データをその出力順に一時格納するバッファ(音声バッ
ファ)114と、上記制御指令(音声入力制御指令、音
声処理制御指令、または音声認識制御指令)に応じて、
そのタイミング以降に音声バッファ114に格納された
音声データを音声出力部116に出力する音声出力制御
部115を設けるとよい。
【0089】なお、以上の実施形態における音声認識装
置の各機能、即ち制御機能(音声入力制御機能、音声処
理制御機能、または音声認識制御機能)、音声入力機
能、音声処理機能、音声認識機能等は、ソフトウェアと
しても実現可能である。
【0090】また、本実施形態は、コンピュータに音声
認識に関する所定の手順を実行させるための(或いはコ
ンピュータを音声認識に関する所定の手段として機能さ
せるための、或いはコンピュータに音声認識に関する所
定の機能を実現させるための)音声認識用プログラムを
記録したコンピュータ読み取り可能なCD−ROM等の
記録媒体として実施することもできる。また、このプロ
グラムが通信媒体を介してダウンロードされるものであ
っても構わない。
【0091】
【発明の効果】以上詳述したように本発明によれば、音
声入力動作等、音声認識に関する動作の開始を、話者の
動き(アクション)に応じて制御するようにしたので、
話者によるボタンスイッチ等の操作を必要とせずに、入
力音声データの始まりを絞り込むことができ、使い勝手
の良い音声認識が実現可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音声認識装置の
構成を示すブロック図。
【図2】同第1の実施形態に係る音声認識装置の第1の
変形例を示すブロック構成図。
【図3】同第1の実施形態に係る音声認識装置の第2の
変形例を示すブロック構成図。
【図4】本発明の第2の実施形態に係る音声認識装置の
構成を示すブロック図。
【図5】同第2の実施形態に係る音声認識装置の第1の
変形例を示すブロック構成図。
【図6】同第2の実施形態に係る音声認識装置の第2の
変形例を示すブロック構成図。
【図7】本発明の第3の実施形態に係る音声認識装置の
構成を示すブロック図。
【図8】同第3の実施形態に係る音声認識装置の第1の
変形例を示すブロック構成図。
【図9】同第3の実施形態に係る音声認識装置の第2の
変形例を示すブロック構成図。
【図10】上記各実施形態に共通の第1の変形例を示す
要部のブロック構成図。
【図11】上記各実施形態に共通の第2の変形例を示す
要部のブロック構成図。
【符号の説明】
11…位置検出部(動作検出手段) 12,42,72…音声入力制御部(制御手段) 13,23,43,53,73,83…音声入力部 14,24,44,54,74,84…音声処理部 15,35,45,65,75,95…音声認識部 16…位置登録部(動作登録手段) 22,52,82…音声処理制御部(制御手段) 32,62,92…音声認識制御部(制御手段) 41…加速度検出部(動作検出手段) 46…加速度登録部(動作登録手段) 71…傾き検出部(動作検出手段) 76…傾き登録部(動作登録手段) 101…動作検出部 102…制御部 103…動作登録部 111…確認音出力部 112…確認光出力部 113…確認振動出力部 114…音声バッファ 115…音声出力制御部 116…音声出力部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 橋爪 裕一 東京都青梅市新町3丁目3番地の1 東芝 コンピュ―タエンジニアリング株式会社内 (72)発明者 山本 琢己 東京都青梅市新町3丁目3番地の1 東芝 コンピュ―タエンジニアリング株式会社内 Fターム(参考) 5D015 HH00 KK01 LL10

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 話者が発する音声を認識する音声認識装
    置において、 話者の動きを検出する動作検出手段と、 前記動作検出手段の動き検出結果が所定の条件を満たし
    た場合に、音声入力の動作開始を決定して対応する制御
    指令を発する制御手段と、 前記制御手段から出力される前記制御指令に基づき、音
    声を入力して対応する音声データを出力する音声入力手
    段と、 前記音声入力手段から出力される音声データを音響分析
    して特徴パラメータ系列を出力する音声処理手段と、 前記音声処理手段から出力される特徴パラメータ系列と
    予め用意されている音声モデルとを照合することで認識
    結果を取得する音声認識手段とを具備することを特徴と
    する音声認識装置。
  2. 【請求項2】 話者が発する音声を認識する音声認識装
    置において、 話者の動きを検出する動作検出手段と、 前記動作検出手段の動き検出結果が所定の条件を満たし
    た場合に、音声処理の動作開始を決定して対応する音声
    処理制御指令を発する制御手段と、 音声を入力して対応する音声データを出力する音声入力
    手段と、 前記制御手段から出力される前記音声処理制御指令に基
    づき、前記音声入力手段から出力される音声データを音
    響分析して特徴パラメータ系列を出力する音声処理手段
    と、 前記音声処理手段から出力される特徴パラメータ系列と
    予め用意されている音声モデルとを照合することで認識
    結果を取得する音声認識手段とを具備することを特徴と
    する音声認識装置。
  3. 【請求項3】 話者が発する音声を認識する音声認識装
    置において、 話者の動きを検出する動作検出手段と、 前記動作検出手段の動き検出結果が所定の条件を満たし
    た場合に、音声認識の動作開始を決定して対応する音声
    認識制御指令を発する制御手段と、 音声を入力して対応する音声データを出力する音声入力
    手段と、 前記音声入力手段から出力される音声データを音響分析
    して特徴パラメータ系列を出力する音声処理手段と、 前記制御手段から出力される前記音声認識制御指令に基
    づき、前記音声処理手段から出力される特徴パラメータ
    系列と予め用意されている音声モデルとを照合すること
    で認識結果を取得する音声認識手段とを具備することを
    特徴とする音声認識装置。
  4. 【請求項4】 前記動作検出手段が、前記話者の動きを
    当該話者の体の所定部位の位置により検出する位置検出
    手段であることを特徴とする請求項1乃至請求項3のい
    ずれかに記載の音声認識装置。
  5. 【請求項5】 前記動作検出手段が、前記話者の動きを
    当該話者の体の任意の部位の加速度により検出する加速
    度検出手段であることを特徴とする請求項1乃至請求項
    3のいずれかに記載の音声認識装置。
  6. 【請求項6】 前記動作検出手段が、前記話者の動きを
    当該話者の体の任意の部位の傾きにより検出する傾き検
    出手段であることを特徴とする請求項1乃至請求項3の
    いずれかに記載の音声認識装置。
  7. 【請求項7】 前記動作検出手段は、前記話者の動き
    を、当該話者の体の所定部位の位置により検出する位置
    検出手段、当該話者の体の任意の部位の加速度により検
    出する加速度検出手段、及び当該話者の体の任意の部位
    の傾きにより検出する傾き検出手段のうちの少なくとも
    2つの検出手段を有しており、 前記制御手段は、前記動作検出手段が有する前記少なく
    とも2つの検出手段の検出結果と、当該少なくとも2つ
    の検出手段により検出される動きに関する所定の条件と
    を比較することで、前記動作検出手段の動作検出結果が
    当該条件を満たしたか否かを判定することを特徴とする
    請求項1乃至請求項3のいずれかに記載の音声認識装
    置。
  8. 【請求項8】 外部からの操作により任意の前記条件を
    設定登録するための動作登録手段を更に具備することを
    特徴とする請求項1乃至請求項3のいずれかに記載の音
    声認識装置。
  9. 【請求項9】 前記制御手段から出力される前記制御指
    令に基づき、前記話者の動きが所定の条件を満たした旨
    を当該話者に報知する報知手段を更に具備することを特
    徴とする請求項1乃至請求項3のいずれかに記載の音声
    認識装置。
  10. 【請求項10】 前記報知手段は、音出力、光出力、振
    動出力、または前記音声入力手段から出力される音声デ
    ータに基づく音声出力の少なくとも1つにより前記話者
    への報知を行うことを特徴とする請求項1乃至請求項3
    のいずれかに記載の音声認識装置。
  11. 【請求項11】 コンピュータに、 話者の動きを検出する動作検出手段の動き検出結果を監
    視して、前記動き検出結果が所定の条件を満たしたか否
    かを判定する動作判定ステップと、 前記動作判定ステップで前記動き検出結果が所定の条件
    を満たしたことが判定された場合に、音声入力の動作開
    始を決定して対応する制御指令を発する制御ステップ
    と、 前記制御指令に基づいて音声入力動作を開始し、音声を
    入力して対応する音声データを出力する音声入力ステッ
    プと、 前記音声入力ステップで出力される音声データを音響分
    析して特徴パラメータ系列を出力する音声処理ステップ
    と、 前記音声処理ステップで出力される特徴パラメータ系列
    と予め用意されている音声モデルとを照合することで認
    識結果を取得する音声認識ステップとを実行させるため
    の音声認識用プログラムを記録したコンピュータ読み取
    り可能な記録媒体。
  12. 【請求項12】 コンピュータに、 話者の動きを検出する動作検出手段の動き検出結果を監
    視して、前記動き検出結果が所定の条件を満たしたか否
    かを判定する動作判定ステップと、 前記動作判定ステップで前記動き検出結果が所定の条件
    を満たしたことが判定された場合に、音声処理の動作開
    始を決定して対応する制御指令を発する制御ステップ
    と、 音声を入力して対応する音声データを出力する音声入力
    ステップと、 前記制御指令に基づき音声処理動作を開始し、前記音声
    入力ステップで出力される音声データを音響分析して特
    徴パラメータ系列を出力する音声処理ステップと、 前記音声処理ステップで出力される特徴パラメータ系列
    と予め用意されている音声モデルとを照合することで認
    識結果を取得する音声認識ステップとを実行させるため
    の音声認識用プログラムを記録したコンピュータ読み取
    り可能な記録媒体。
  13. 【請求項13】 コンピュータに、 話者の動きを検出する動作検出手段の動き検出結果を監
    視して、前記動き検出結果が所定の条件を満たしたか否
    かを判定する動作判定ステップと、 前記動作判定ステップで前記動き検出結果が所定の条件
    を満たしたことが判定された場合に、音声処理の動作開
    始を決定して対応する制御指令を発する制御ステップ
    と、 音声を入力して対応する音声データを出力する音声入力
    ステップと、 前記音声入力ステップで出力される音声データを音響分
    析して特徴パラメータ系列を出力する音声処理ステップ
    と、 前記制御指令に基づき音声認識動作を開始し、前記音声
    処理ステップで出力される特徴パラメータ系列と予め用
    意されている音声モデルとを照合することで認識結果を
    取得する音声認識ステップとを実行させるための音声認
    識用プログラムを記録したコンピュータ読み取り可能な
    記録媒体。
JP11152749A 1999-05-31 1999-05-31 音声認識装置及び音声認識用プログラムを記録したコンピュータ読み取り可能な記録媒体 Withdrawn JP2000338995A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11152749A JP2000338995A (ja) 1999-05-31 1999-05-31 音声認識装置及び音声認識用プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11152749A JP2000338995A (ja) 1999-05-31 1999-05-31 音声認識装置及び音声認識用プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2000338995A true JP2000338995A (ja) 2000-12-08

Family

ID=15547335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11152749A Withdrawn JP2000338995A (ja) 1999-05-31 1999-05-31 音声認識装置及び音声認識用プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2000338995A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006251298A (ja) * 2005-03-10 2006-09-21 Nissan Motor Co Ltd 音声入力装置および音声入力方法
WO2017188801A1 (ko) * 2016-04-29 2017-11-02 주식회사 브이터치 동작-음성의 다중 모드 명령에 기반한 최적 제어 방법 및 이를 적용한 전자 장치
WO2018155981A1 (ko) * 2017-02-27 2018-08-30 주식회사 브이터치 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
WO2019013447A1 (en) * 2017-07-10 2019-01-17 Samsung Electronics Co., Ltd. REMOTE CONTROL DEVICE AND METHOD FOR RECEIVING VOICE FROM AN ASSOCIATED USER

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006251298A (ja) * 2005-03-10 2006-09-21 Nissan Motor Co Ltd 音声入力装置および音声入力方法
KR20190135974A (ko) * 2016-04-29 2019-12-09 주식회사 브이터치 동작-음성의 다중 모드 명령에 기반한 최적 제어 방법 및 이를 적용한 전자 장치
WO2017188801A1 (ko) * 2016-04-29 2017-11-02 주식회사 브이터치 동작-음성의 다중 모드 명령에 기반한 최적 제어 방법 및 이를 적용한 전자 장치
KR20170124104A (ko) * 2016-04-29 2017-11-09 주식회사 브이터치 동작-음성의 다중 모드 명령에 기반한 최적 제어 방법 및 이를 적용한 전자 장치
CN109074819B (zh) * 2016-04-29 2023-05-16 维塔驰有限公司 基于操作-声音的多模式命令的优选控制方法及应用其的电子设备
KR102181588B1 (ko) * 2016-04-29 2020-11-23 주식회사 브이터치 동작-음성의 다중 모드 명령에 기반한 최적 제어 방법 및 이를 적용한 전자 장치
CN109074819A (zh) * 2016-04-29 2018-12-21 维塔驰有限公司 基于操作-声音的多模式命令的优选控制方法及应用其的电子设备
JP2019520626A (ja) * 2016-04-29 2019-07-18 ブイタッチ・カンパニー・リミテッド 動作−音声の多重モード命令に基づいた最適制御方法およびこれを適用した電子装置
JP2020510865A (ja) * 2017-02-27 2020-04-09 ブイタッチ・カンパニー・リミテッド 音声認識トリガーを提供するための方法、システムおよび非一過性のコンピュータ読み取り可能な記録媒体
KR101893768B1 (ko) * 2017-02-27 2018-09-04 주식회사 브이터치 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
US11315557B2 (en) 2017-02-27 2022-04-26 VTouch Co., Ltd. Method and system for providing voice recognition trigger and non-transitory computer-readable recording medium
WO2018155981A1 (ko) * 2017-02-27 2018-08-30 주식회사 브이터치 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
WO2019013447A1 (en) * 2017-07-10 2019-01-17 Samsung Electronics Co., Ltd. REMOTE CONTROL DEVICE AND METHOD FOR RECEIVING VOICE FROM AN ASSOCIATED USER
US11449307B2 (en) 2017-07-10 2022-09-20 Samsung Electronics Co., Ltd. Remote controller for controlling an external device using voice recognition and method thereof

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
JP6400109B2 (ja) 音声認識システム
JP3885002B2 (ja) 情報処理装置およびその方法
KR20100119250A (ko) 모션 정보를 이용하는 음성 검출 장치 및 방법
JP2002091466A (ja) 音声認識装置
KR100742888B1 (ko) 음성 인식 방법
JP4722499B2 (ja) 音声認識型機器制御装置および車両
JP2018013549A (ja) 発話内容認識装置
JP2007045217A (ja) 車両用電動ミラーの制御システム
JP3654045B2 (ja) 音声認識装置
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP2000322078A (ja) 車載型音声認識装置
JP4410378B2 (ja) 音声認識方法および装置
JP2000338995A (ja) 音声認識装置及び音声認識用プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06124097A (ja) 携帯型端末装置
JP3446857B2 (ja) 音声認識装置
JP2004004239A (ja) 音声認識対話装置およびプログラム
JP4478146B2 (ja) 音声認識システム、音声認識方法およびそのプログラム
JPH11352987A (ja) 音声認識装置
JP2001188551A (ja) 情報処理装置および方法、並びに記録媒体
JP2004318026A (ja) セキュリティペットロボット及びその装置に関する信号処理方法
JP2019132997A (ja) 音声処理装置、方法およびプログラム
JP7172120B2 (ja) 音声認識装置及び音声認識方法
JP6748565B2 (ja) 音声対話システム及び音声対話方法
JP2000311077A (ja) 音声情報入力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051201

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060809

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060814