JP2003308079A - 音声入力装置 - Google Patents
音声入力装置Info
- Publication number
- JP2003308079A JP2003308079A JP2002111760A JP2002111760A JP2003308079A JP 2003308079 A JP2003308079 A JP 2003308079A JP 2002111760 A JP2002111760 A JP 2002111760A JP 2002111760 A JP2002111760 A JP 2002111760A JP 2003308079 A JP2003308079 A JP 2003308079A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- utterance
- command
- input device
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 音声による機器の操作命令(音声命令)の発
話とそれ以外の発話とを確実に区別する。 【解決手段】 発話者の発話音声を集音するとともに、
集音音声から発話と発話との間の無音声時間を計時し、
計時された無音声時間に基づいて音声による機器の操作
命令(音声命令)の発話かまたは音声命令以外の発話か
を判定する。
話とそれ以外の発話とを確実に区別する。 【解決手段】 発話者の発話音声を集音するとともに、
集音音声から発話と発話との間の無音声時間を計時し、
計時された無音声時間に基づいて音声による機器の操作
命令(音声命令)の発話かまたは音声命令以外の発話か
を判定する。
Description
【0001】
【発明の属する技術分野】本発明は音声入力装置に関
し、特に、操作性を改善したものである。
し、特に、操作性を改善したものである。
【0002】
【従来の技術】発話者を撮像してその画像を処理し、画
像に基づいて発話の有無を判定し、発話有りと判定され
たときはマイクロフォン(以下、マイクという)からの
入力信号を音声認識処理することによって、発話者によ
るトークスイッチ操作を不要にした音声認識装置が知ら
れている(例えば特開平11−352987号公報参
照)。
像に基づいて発話の有無を判定し、発話有りと判定され
たときはマイクロフォン(以下、マイクという)からの
入力信号を音声認識処理することによって、発話者によ
るトークスイッチ操作を不要にした音声認識装置が知ら
れている(例えば特開平11−352987号公報参
照)。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た音声認識装置では、発話者の撮像画像の外観形状に基
づいて発話の有無を判断しているので、同乗者との会話
や紛らわしい動作に対して発話有りと誤認する可能性が
ある上に、発話者を撮像するための撮像装置と撮像画像
を処理するための画像処理装置が必要となり、音声認識
装置のコストが増大するという問題がある。
た音声認識装置では、発話者の撮像画像の外観形状に基
づいて発話の有無を判断しているので、同乗者との会話
や紛らわしい動作に対して発話有りと誤認する可能性が
ある上に、発話者を撮像するための撮像装置と撮像画像
を処理するための画像処理装置が必要となり、音声認識
装置のコストが増大するという問題がある。
【0004】本発明の目的は、特別の装置を用いず、ま
たトークスイッチングの操作をせずに、音声による機器
の操作命令(以下、音声命令またはコマンドという)の
発話とそれ以外の発話とを確実に区別することにある。
たトークスイッチングの操作をせずに、音声による機器
の操作命令(以下、音声命令またはコマンドという)の
発話とそれ以外の発話とを確実に区別することにある。
【0005】
【課題を解決するための手段】(1) 請求項1の発明
は、発話者の発話音声を集音する集音手段と、前記集音
手段による集音音声から発話と発話との間の無音声時間
を計時する計時手段と、前記計時手段により計時された
無音声時間に基づいて、音声による機器の操作命令(音
声命令またはコマンド)の発話か、または音声命令以外
の発話かを判定する判定手段とを備え、音声命令により
機器を操作する。 (2) 請求項2の音声入力装置は、前記集音手段によ
る集音音声に基づいて発話者を特定する特定手段を備
え、前記判定手段によって、前記特定手段による特定結
果と前記計時手段による計時結果とにより、発話者の異
なる発話と発話との間の無音声時間に基づいて音声命令
の発話かそれ以外の発話かを判定するようにしたもので
ある。 (3) 請求項3の音声入力装置は、前記集音手段を発
話予定者の数だけ用意してそれぞれ発話予定者の近くに
設置し、前記特定手段によって発話音声を集音した前記
集音手段の別により発話者を特定するようにしたもので
ある。 (4) 請求項4の音声入力装置は車両に搭載される音
声入力装置であって、前記集音手段を乗員の数だけ用意
してそれぞれ車室内の各シートの近くに設置するととも
に、発話音声を集音した前記集音手段の別により発話者
を特定する特定手段を備え、前記判定手段によって、前
記特定手段による特定結果と前記計時手段による計時結
果とにより、発話者の異なる発話と発話との間の無音声
時間に基づいて音声命令の発話かそれ以外の発話かを判
定するようにしたものである。 (5) 請求項5の音声入力装置は、前記判定手段によ
って、発話者の着座位置と発話者の異なる発話と発話と
の間の無音声時間とに基づいて、音声命令の発話かそれ
以外の発話かを判定するようにしたものである。
は、発話者の発話音声を集音する集音手段と、前記集音
手段による集音音声から発話と発話との間の無音声時間
を計時する計時手段と、前記計時手段により計時された
無音声時間に基づいて、音声による機器の操作命令(音
声命令またはコマンド)の発話か、または音声命令以外
の発話かを判定する判定手段とを備え、音声命令により
機器を操作する。 (2) 請求項2の音声入力装置は、前記集音手段によ
る集音音声に基づいて発話者を特定する特定手段を備
え、前記判定手段によって、前記特定手段による特定結
果と前記計時手段による計時結果とにより、発話者の異
なる発話と発話との間の無音声時間に基づいて音声命令
の発話かそれ以外の発話かを判定するようにしたもので
ある。 (3) 請求項3の音声入力装置は、前記集音手段を発
話予定者の数だけ用意してそれぞれ発話予定者の近くに
設置し、前記特定手段によって発話音声を集音した前記
集音手段の別により発話者を特定するようにしたもので
ある。 (4) 請求項4の音声入力装置は車両に搭載される音
声入力装置であって、前記集音手段を乗員の数だけ用意
してそれぞれ車室内の各シートの近くに設置するととも
に、発話音声を集音した前記集音手段の別により発話者
を特定する特定手段を備え、前記判定手段によって、前
記特定手段による特定結果と前記計時手段による計時結
果とにより、発話者の異なる発話と発話との間の無音声
時間に基づいて音声命令の発話かそれ以外の発話かを判
定するようにしたものである。 (5) 請求項5の音声入力装置は、前記判定手段によ
って、発話者の着座位置と発話者の異なる発話と発話と
の間の無音声時間とに基づいて、音声命令の発話かそれ
以外の発話かを判定するようにしたものである。
【0006】
【発明の効果】(1) 請求項1の発明によれば、撮像
装置や画像処理装置のような高価な装置を用いずに、ま
たトークスイッチの操作がなくても、音声命令の発話と
それ以外の発話とを正しく区別することができる。 (2) 請求項2の発明によれば、発話者が特定される
ので音声命令の発話とそれ以外の発話とをさらに正しく
区別することができる。 (3) 請求項3および請求項4の発明によれば、発話
者を特定するための音声分析装置のような高価な装置を
用いずに、また、紛らわしい音質の発話者がいても正確
に発話者を特定することができ、音声命令の発話とそれ
以外の発話とをさらに正しく区別することができる。 (4) 請求項5の発明によれば、車室内の通常の会話
では、運転者と助手席乗員との間では会話の頻度が高
く、運転者と後席乗員との間では会話の頻度が低いとい
う傾向があり、発話者の着座位置を考慮することによっ
て音声命令の発話とそれ以外の発話とをさらに正しく区
別することができる。
装置や画像処理装置のような高価な装置を用いずに、ま
たトークスイッチの操作がなくても、音声命令の発話と
それ以外の発話とを正しく区別することができる。 (2) 請求項2の発明によれば、発話者が特定される
ので音声命令の発話とそれ以外の発話とをさらに正しく
区別することができる。 (3) 請求項3および請求項4の発明によれば、発話
者を特定するための音声分析装置のような高価な装置を
用いずに、また、紛らわしい音質の発話者がいても正確
に発話者を特定することができ、音声命令の発話とそれ
以外の発話とをさらに正しく区別することができる。 (4) 請求項5の発明によれば、車室内の通常の会話
では、運転者と助手席乗員との間では会話の頻度が高
く、運転者と後席乗員との間では会話の頻度が低いとい
う傾向があり、発話者の着座位置を考慮することによっ
て音声命令の発話とそれ以外の発話とをさらに正しく区
別することができる。
【0007】
【発明の実施の形態】車両に搭載して乗員の音声を入力
する一実施の形態を説明する。図1は一実施の形態の構
成を示す。車両の運転席シート、助手席シート、後席右
シートおよび後席左シートの近くにそれぞれマイク1〜
4を設置し、各座席に着座する乗員からの音声を各マイ
ク1〜4から集音する。入力ソース判定部5は、マイク
1〜4により集音した音声の発話者を特定する。発話分
離部6は、発話者が異なる発話は個別の発話として分離
し、同じ発話者からの発話でも複数の発話が連続する場
合はコマンド処理のために発話を分離する。発話間隔時
間計測部7は、発話分離部6で分離された発話の中に複
数の発話がある場合に発話間隔時間を計測する。
する一実施の形態を説明する。図1は一実施の形態の構
成を示す。車両の運転席シート、助手席シート、後席右
シートおよび後席左シートの近くにそれぞれマイク1〜
4を設置し、各座席に着座する乗員からの音声を各マイ
ク1〜4から集音する。入力ソース判定部5は、マイク
1〜4により集音した音声の発話者を特定する。発話分
離部6は、発話者が異なる発話は個別の発話として分離
し、同じ発話者からの発話でも複数の発話が連続する場
合はコマンド処理のために発話を分離する。発話間隔時
間計測部7は、発話分離部6で分離された発話の中に複
数の発話がある場合に発話間隔時間を計測する。
【0008】コマンド/会話判定部8は、入力ソース判
定部5により特定された発話者と、発話間隔時間計測部
7により計測された発話間隔時間とに基づいて、コマン
ドかコマンド以外の会話かを判定する。コマンド制御部
9は、コマンド/会話判定部8でコマンドと判定された
場合に、そのコマンドにしたがって車載機器10を操作
するとともに、操作内容提示部11へ操作内容を出力
し、利用者に対して実行されたコマンドの内容を表示デ
ィスプレイ12に表示するとともにスピーカー13によ
り放送する。
定部5により特定された発話者と、発話間隔時間計測部
7により計測された発話間隔時間とに基づいて、コマン
ドかコマンド以外の会話かを判定する。コマンド制御部
9は、コマンド/会話判定部8でコマンドと判定された
場合に、そのコマンドにしたがって車載機器10を操作
するとともに、操作内容提示部11へ操作内容を出力
し、利用者に対して実行されたコマンドの内容を表示デ
ィスプレイ12に表示するとともにスピーカー13によ
り放送する。
【0009】図2はコマンド/会話判定処理を示すフロ
ーチャートである。このフローチャートにより、一実施
の形態の動作を説明する。ステップ1において、車室内
の各座席に設けられたマイク1〜4のいずれかから「発
話1」の集音が検出されるとステップ2へ進む。ステッ
プ2では、「発話1」以前の、発話と発話との間の無音
声時間が規定時間T1(例えば5秒)以上か否かを確認
する。「発話1」以前の無音声時間が規定時間T1未満
の場合はステップ3へ進み、「発話1」はそれ以前の発
話に対する会話または独り言と判定してコマンドは実行
しない。
ーチャートである。このフローチャートにより、一実施
の形態の動作を説明する。ステップ1において、車室内
の各座席に設けられたマイク1〜4のいずれかから「発
話1」の集音が検出されるとステップ2へ進む。ステッ
プ2では、「発話1」以前の、発話と発話との間の無音
声時間が規定時間T1(例えば5秒)以上か否かを確認
する。「発話1」以前の無音声時間が規定時間T1未満
の場合はステップ3へ進み、「発話1」はそれ以前の発
話に対する会話または独り言と判定してコマンドは実行
しない。
【0010】一方、「発話1」以前の無音声時間が規定
時間T1以上の場合はステップ4へ進み、その無音声時
間が規定時間T2(>T1で例えば10秒)以上か否か
を確認する。「発話1」以前の無音声時間が規定時間T
2以上の場合はステップ5ヘ進み、「発話1」の発話者
が運転者か否かを確認する。「発話1」の発話者が運転
者の場合はステップ6へ進み、この車両の乗員は運転者
1名と判断して「発話1」をコマンドと判定する。な
お、「発話1」の発話者が運転者でない場合はステップ
7へ進む。
時間T1以上の場合はステップ4へ進み、その無音声時
間が規定時間T2(>T1で例えば10秒)以上か否か
を確認する。「発話1」以前の無音声時間が規定時間T
2以上の場合はステップ5ヘ進み、「発話1」の発話者
が運転者か否かを確認する。「発話1」の発話者が運転
者の場合はステップ6へ進み、この車両の乗員は運転者
1名と判断して「発話1」をコマンドと判定する。な
お、「発話1」の発話者が運転者でない場合はステップ
7へ進む。
【0011】「発話1」以前の無音声時間が規定時間T
1以上かつ規定時間T2未満の場合は、ステップ7で、
「発話1」以降の無音声時間が規定時間T3(例えば7
秒)以上か否かを確認する。「発話1」以降の無音声時
間が規定時間T3以上の場合はステップ8へ進み、「発
話1」の発話後、T3時間以上次の発話が検出されない
から「発話1」をコマンドと判定する。
1以上かつ規定時間T2未満の場合は、ステップ7で、
「発話1」以降の無音声時間が規定時間T3(例えば7
秒)以上か否かを確認する。「発話1」以降の無音声時
間が規定時間T3以上の場合はステップ8へ進み、「発
話1」の発話後、T3時間以上次の発話が検出されない
から「発話1」をコマンドと判定する。
【0012】一方、「発話1」以降の無音声時間が規定
時間T3未満の場合はステップ9へ進み、次の「発話
2」を検出する。「発話1」の発話後、T3時間以内に
次の「発話2」があった場合は、ステップ10で、「発
話2」の発話者が「発話1」の発話者と同一か否かを確
認する。「発話1」と「発話2」の発話者が同一でない
場合はステップ11へ進み、乗員どうしの会話であると
判定する。
時間T3未満の場合はステップ9へ進み、次の「発話
2」を検出する。「発話1」の発話後、T3時間以内に
次の「発話2」があった場合は、ステップ10で、「発
話2」の発話者が「発話1」の発話者と同一か否かを確
認する。「発話1」と「発話2」の発話者が同一でない
場合はステップ11へ進み、乗員どうしの会話であると
判定する。
【0013】「発話1」と「発話2」の発話者が同一の
場合はステップ12へ進み、「発話2」が規定時間T4
(例えば4秒)以上継続中か否かを確認する。「発話
2」の継続時間がT4時間未満の場合はステップ14へ
進み、「発話2」は「発話1」の繰り返し、もしくは言
い直しと判断して「発話2」をコマンドと判定する。
場合はステップ12へ進み、「発話2」が規定時間T4
(例えば4秒)以上継続中か否かを確認する。「発話
2」の継続時間がT4時間未満の場合はステップ14へ
進み、「発話2」は「発話1」の繰り返し、もしくは言
い直しと判断して「発話2」をコマンドと判定する。
【0014】しかし、「発話2」の継続時間がT4時間
以上の場合はステップ13へ進み、「発話2」はコマン
ド以外の独り言、あるいは歌などであると判断し、「発
話1」をコマンドと判定する。
以上の場合はステップ13へ進み、「発話2」はコマン
ド以外の独り言、あるいは歌などであると判断し、「発
話1」をコマンドと判定する。
【0015】以上の発話パターン〜に対するコマン
ド/会話判定を整理すると、T1時間以上無音声が続
いた後に(発話者A)の「発話1」があり、その後T3
時間以上無音声が続いた場合は、「発話1」をコマンド
と判定する。
ド/会話判定を整理すると、T1時間以上無音声が続
いた後に(発話者A)の「発話1」があり、その後T3
時間以上無音声が続いた場合は、「発話1」をコマンド
と判定する。
【0016】(発話者A)の「発話1」以前の無音声
時間がT1時間未満の場合は、「発話1」をコマンド以
外の会話または独り言と判定する。
時間がT1時間未満の場合は、「発話1」をコマンド以
外の会話または独り言と判定する。
【0017】T1時間以上無音声が続いた後に(発話
者A)の「発話1」があり、その後T3時間未満に(発
話者B)の「発話2」があった場合は、「発話1」およ
び「発話2」をコマンド以外の会話と判定する。
者A)の「発話1」があり、その後T3時間未満に(発
話者B)の「発話2」があった場合は、「発話1」およ
び「発話2」をコマンド以外の会話と判定する。
【0018】T2時間以上無音声が続いた後に(運転
者)の「発話1」があった場合は、「発話1」をコマン
ドと判定する。
者)の「発話1」があった場合は、「発話1」をコマン
ドと判定する。
【0019】T1時間以上無音声が続いた後に(発話
者A)の「発話1」があり、その後(発話者A)の「発
話2」がT4時間以上継続している場合は、「発話1」
をコマンドと判定する。
者A)の「発話1」があり、その後(発話者A)の「発
話2」がT4時間以上継続している場合は、「発話1」
をコマンドと判定する。
【0020】T1時間以上無音声が続いた後に(発話
者A)の「発話1」があり、さらにその後、T4時間未
満の(発話者A)の「発話1」があった場合は、「発話
2」をコマンドと判定する。
者A)の「発話1」があり、さらにその後、T4時間未
満の(発話者A)の「発話1」があった場合は、「発話
2」をコマンドと判定する。
【0021】以上説明したように一実施の形態によれ
ば、撮像装置や画像処理装置のような高価な装置を用い
ずに、またトークスイッチの操作がなくても、音声命令
の発話とそれ以外の発話とを正しく区別することができ
る。
ば、撮像装置や画像処理装置のような高価な装置を用い
ずに、またトークスイッチの操作がなくても、音声命令
の発話とそれ以外の発話とを正しく区別することができ
る。
【0022】また、車室内の各シートの近くにそれぞれ
マイクを設置して発話音声を集音することによって発話
者を特定するための音声分析装置のような高価な装置を
用いずに、また、紛らわしい音質の発話者がいても正確
に発話者とその着座位置を特定することができ、音声命
令の発話とそれ以外の発話とをさらに正しく区別するこ
とができる。
マイクを設置して発話音声を集音することによって発話
者を特定するための音声分析装置のような高価な装置を
用いずに、また、紛らわしい音質の発話者がいても正確
に発話者とその着座位置を特定することができ、音声命
令の発話とそれ以外の発話とをさらに正しく区別するこ
とができる。
【0023】特許請求の範囲の構成要素と一実施の形態
の構成要素との対応関係は次の通りである。すなわち、
マイク1〜4が集音手段を、発話間隔時間計測部7が計
時手段を、コマンド/会話判定部8が判定手段を、入力
ソース判定部5が特定手段をそれぞれ構成する。なお、
本発明の特徴的な機能を損なわない限り、各構成要素は
上記構成に限定されるものではない。
の構成要素との対応関係は次の通りである。すなわち、
マイク1〜4が集音手段を、発話間隔時間計測部7が計
時手段を、コマンド/会話判定部8が判定手段を、入力
ソース判定部5が特定手段をそれぞれ構成する。なお、
本発明の特徴的な機能を損なわない限り、各構成要素は
上記構成に限定されるものではない。
【0024】なお、上述した一実施の形態では車両に搭
載して乗員の音声を入力する装置を例に上げて説明した
が、本願発明の音声入力装置は車両用に限定されるもの
ではない。
載して乗員の音声を入力する装置を例に上げて説明した
が、本願発明の音声入力装置は車両用に限定されるもの
ではない。
【0025】なお、上述した一実施の形態では車室内の
各座席にマイク1〜4を設置して発話者を特定する例を
示したが、乗員の数、すなわち発話が予定される人員の
数よりも少ない集音マイクを設置し、それらのマイクに
よる集音音声を分析して発話者を特定するようにしても
よい。
各座席にマイク1〜4を設置して発話者を特定する例を
示したが、乗員の数、すなわち発話が予定される人員の
数よりも少ない集音マイクを設置し、それらのマイクに
よる集音音声を分析して発話者を特定するようにしても
よい。
【図1】 一実施の形態の構成を示す図である。
【図2】 一実施の形態のコマンド/会話判定処理を示
すフローチャートである。
すフローチャートである。
1〜4 マイク
5 入力ソース判定部
6 発話分離部
7 発話間隔時間計測部
8 コマンド/会話判定部
9 コマンド制御部
10 車載機器
11 操作内容提示部
12 表示ディスプレイ
13 スピーカー
Claims (5)
- 【請求項1】発話者の発話音声を集音する集音手段と、 前記集音手段による集音音声から発話と発話との間の無
音声時間を計時する計時手段と、 前記計時手段により計時された無音声時間に基づいて、
音声による機器の操作命令(以下、音声命令またはコマ
ンドという)の発話か、または音声命令以外の発話かを
判定する判定手段とを備え、 音声命令により機器を操作することを特徴とする音声入
力装置。 - 【請求項2】請求項1に記載の音声入力装置において、 前記集音手段による集音音声に基づいて発話者を特定す
る特定手段を備え、 前記判定手段は、前記特定手段による特定結果と前記計
時手段による計時結果とにより、発話者の異なる発話と
発話との間の無音声時間に基づいて音声命令の発話かそ
れ以外の発話かを判定することを特徴とする音声入力装
置。 - 【請求項3】請求項2に記載の音声入力装置において、 前記集音手段を発話予定者の数だけ用意してそれぞれ発
話予定者の近くに設置し、前記特定手段は発話音声を集
音した前記集音手段の別により発話者を特定することを
特徴とする音声入力装置。 - 【請求項4】請求項1に記載の音声入力装置は車両に搭
載される音声入力装置であって、 前記集音手段を乗員の数だけ用意してそれぞれ車室内の
各シートの近くに設置するとともに、発話音声を集音し
た前記集音手段の別により発話者を特定する特定手段を
備え、 前記判定手段は、前記特定手段による特定結果と前記計
時手段による計時結果とにより、発話者の異なる発話と
発話との間の無音声時間に基づいて音声命令の発話かそ
れ以外の発話かを判定することを特徴とする音声入力装
置。 - 【請求項5】請求項4に記載の音声入力装置において、 前記判定手段は、発話者の着座位置と発話者の異なる発
話と発話との間の無音声時間とに基づいて、音声命令の
発話かそれ以外の発話かを判定することを特徴とする音
声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002111760A JP2003308079A (ja) | 2002-04-15 | 2002-04-15 | 音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002111760A JP2003308079A (ja) | 2002-04-15 | 2002-04-15 | 音声入力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003308079A true JP2003308079A (ja) | 2003-10-31 |
Family
ID=29394464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002111760A Pending JP2003308079A (ja) | 2002-04-15 | 2002-04-15 | 音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003308079A (ja) |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008250236A (ja) * | 2007-03-30 | 2008-10-16 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
JP2008299221A (ja) * | 2007-06-01 | 2008-12-11 | Fujitsu Ten Ltd | 発話検知装置 |
JP2014077969A (ja) * | 2012-10-12 | 2014-05-01 | Honda Motor Co Ltd | 対話システム及び対話システム向け発話の判別方法 |
JP2015004928A (ja) * | 2013-06-24 | 2015-01-08 | 日本電気株式会社 | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム |
JP2016004270A (ja) * | 2014-05-30 | 2016-01-12 | アップル インコーポレイテッド | 手動始点/終点指定及びトリガフレーズの必要性の低減 |
WO2016051519A1 (ja) * | 2014-09-30 | 2016-04-07 | 三菱電機株式会社 | 音声認識システム |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
JP2019191477A (ja) * | 2018-04-27 | 2019-10-31 | 日産自動車株式会社 | 音声認識装置及び音声認識方法 |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
CN111033611A (zh) * | 2017-03-23 | 2020-04-17 | 乔伊森安全系统收购有限责任公司 | 使嘴部图像与输入指令关联的系统和方法 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
WO2022137534A1 (ja) * | 2020-12-25 | 2022-06-30 | 三菱電機株式会社 | 車載用音声認識装置及び車載用音声認識方法 |
-
2002
- 2002-04-15 JP JP2002111760A patent/JP2003308079A/ja active Pending
Cited By (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318871B2 (en) | 2005-09-08 | 2019-06-11 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
JP2008250236A (ja) * | 2007-03-30 | 2008-10-16 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
JP2008299221A (ja) * | 2007-06-01 | 2008-12-11 | Fujitsu Ten Ltd | 発話検知装置 |
US9865248B2 (en) | 2008-04-05 | 2018-01-09 | Apple Inc. | Intelligent text-to-speech conversion |
US10795541B2 (en) | 2009-06-05 | 2020-10-06 | Apple Inc. | Intelligent organization of tasks items |
US11080012B2 (en) | 2009-06-05 | 2021-08-03 | Apple Inc. | Interface for a virtual digital assistant |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10706841B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Task flow identification based on user intent |
US10049675B2 (en) | 2010-02-25 | 2018-08-14 | Apple Inc. | User profiling for voice input processing |
US10079014B2 (en) | 2012-06-08 | 2018-09-18 | Apple Inc. | Name recognition system |
US9971774B2 (en) | 2012-09-19 | 2018-05-15 | Apple Inc. | Voice-based media searching |
JP2014077969A (ja) * | 2012-10-12 | 2014-05-01 | Honda Motor Co Ltd | 対話システム及び対話システム向け発話の判別方法 |
US9966060B2 (en) | 2013-06-07 | 2018-05-08 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
JP2015004928A (ja) * | 2013-06-24 | 2015-01-08 | 日本電気株式会社 | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
JP2018136568A (ja) * | 2014-05-30 | 2018-08-30 | アップル インコーポレイテッド | 手動始点/終点指定及びトリガフレーズの必要性の低減 |
JP2016004270A (ja) * | 2014-05-30 | 2016-01-12 | アップル インコーポレイテッド | 手動始点/終点指定及びトリガフレーズの必要性の低減 |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10904611B2 (en) | 2014-06-30 | 2021-01-26 | Apple Inc. | Intelligent automated assistant for TV user interactions |
CN106796786A (zh) * | 2014-09-30 | 2017-05-31 | 三菱电机株式会社 | 语音识别系统 |
WO2016051519A1 (ja) * | 2014-09-30 | 2016-04-07 | 三菱電機株式会社 | 音声認識システム |
US9986419B2 (en) | 2014-09-30 | 2018-05-29 | Apple Inc. | Social reminders |
US10475448B2 (en) | 2014-09-30 | 2019-11-12 | Mitsubishi Electric Corporation | Speech recognition system |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US10356243B2 (en) | 2015-06-05 | 2019-07-16 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10354011B2 (en) | 2016-06-09 | 2019-07-16 | Apple Inc. | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10269345B2 (en) | 2016-06-11 | 2019-04-23 | Apple Inc. | Intelligent task discovery |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
JP7337699B2 (ja) | 2017-03-23 | 2023-09-04 | ジョイソン セイフティ システムズ アクイジション エルエルシー | 口の画像を入力コマンドと相互に関連付けるシステム及び方法 |
JP2020518844A (ja) * | 2017-03-23 | 2020-06-25 | ジョイソン セイフティ システムズ アクイジション エルエルシー | 口の画像を入力コマンドと相互に関連付けるシステム及び方法 |
CN111033611A (zh) * | 2017-03-23 | 2020-04-17 | 乔伊森安全系统收购有限责任公司 | 使嘴部图像与输入指令关联的系统和方法 |
US10755703B2 (en) | 2017-05-11 | 2020-08-25 | Apple Inc. | Offline personal assistant |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10791176B2 (en) | 2017-05-12 | 2020-09-29 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10410637B2 (en) | 2017-05-12 | 2019-09-10 | Apple Inc. | User-specific acoustic models |
US10810274B2 (en) | 2017-05-15 | 2020-10-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10482874B2 (en) | 2017-05-15 | 2019-11-19 | Apple Inc. | Hierarchical belief states for digital assistants |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
JP7172120B2 (ja) | 2018-04-27 | 2022-11-16 | 日産自動車株式会社 | 音声認識装置及び音声認識方法 |
JP2019191477A (ja) * | 2018-04-27 | 2019-10-31 | 日産自動車株式会社 | 音声認識装置及び音声認識方法 |
WO2022137534A1 (ja) * | 2020-12-25 | 2022-06-30 | 三菱電機株式会社 | 車載用音声認識装置及び車載用音声認識方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003308079A (ja) | 音声入力装置 | |
US11437020B2 (en) | Techniques for spatially selective wake-up word recognition and related systems and methods | |
US6889189B2 (en) | Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations | |
JP2008299221A (ja) | 発話検知装置 | |
US20130332165A1 (en) | Method and systems having improved speech recognition | |
JP5077107B2 (ja) | 車両用飲酒検知装置及び車両用飲酒検知方法 | |
JP2007219207A (ja) | 音声認識装置 | |
US20030028384A1 (en) | Method for detecting emotions from speech using speaker identification | |
US20110208525A1 (en) | Voice recognizing apparatus | |
EP1494208A1 (en) | Method for controlling a speech dialog system and speech dialog system | |
JP2017193207A (ja) | 車室内会話支援装置 | |
JP2009251388A (ja) | 母国語発話装置 | |
JPH1152976A (ja) | 音声認識装置 | |
JP2016061888A (ja) | 音声認識装置、音声認識対象区間設定方法、及び音声認識区間設定プログラム | |
CN112823387A (zh) | 语音识别装置、语音识别系统以及语音识别方法 | |
JP2008250236A (ja) | 音声認識装置および音声認識方法 | |
JP2007168972A (ja) | エレベータ制御装置 | |
JP4478146B2 (ja) | 音声認識システム、音声認識方法およびそのプログラム | |
JP7172120B2 (ja) | 音声認識装置及び音声認識方法 | |
JP7163876B2 (ja) | 車内会話支援装置 | |
JP4507996B2 (ja) | 運転者負荷推定装置 | |
JP2007286198A (ja) | 音声合成出力装置 | |
JPH1165588A (ja) | 車両用音声入力装置 | |
WO2022239142A1 (ja) | 音声認識装置及び音声認識方法 | |
JP7192561B2 (ja) | 音声出力装置および音声出力方法 |