JP2005266192A - 音声認識装置および音声認識方法 - Google Patents
音声認識装置および音声認識方法 Download PDFInfo
- Publication number
- JP2005266192A JP2005266192A JP2004077477A JP2004077477A JP2005266192A JP 2005266192 A JP2005266192 A JP 2005266192A JP 2004077477 A JP2004077477 A JP 2004077477A JP 2004077477 A JP2004077477 A JP 2004077477A JP 2005266192 A JP2005266192 A JP 2005266192A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- request
- information
- speech recognition
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】入力部201と、認識部202と、依頼判定部203と、認識結果確定部204と、依頼応答部205と、インターフェース部206と、出力部207とを備え、入力部201に入力された音声に対して音声認識を行い、その結果をもとに依頼判定部203で他の機器への依頼が必要かを判断し、必要ならばインターフェース部206を介してネットワークに接続された他の機器に認識保証もしくは認識依頼を行い、その結果をもとに認識結果確定部204で認識結果を確定することにより、複数の機器で連携して音声認識ができるので、単体の機器では困難であった人間の発話のバリエーションを吸収することができる。
【選択図】図2
Description
本発明の実施の形態1では、具体例として、それぞれ本実施の形態の音声認識装置が搭載された電子レンジ、冷蔵庫、パソコンがネットワークに接続されている場合を例に説明する。
して送信し、さらに、同様に依頼応答部205に対しても再判定の結果を認識結果格納信号243として送信する。
232として認識結果確定部204に送信する(S308)。
に音の特徴xが出現する確率を表し、この確率p(x|w)*P(w)が最尤となる単語系列が認識結果となる。
いないなどの状況が考えられる。そこで、言語モデルの確率がある閾値以下の単語が認識結果から得られていた場合、依頼をすればよい。また、音声認識の結果得られる尤度(音響尤度、音響尤度+言語スコアの尤度)で候補を閾値判定したときに閾値以下に候補が複数得られたとき、あるいは第一の候補と第二候補との尤度差がある閾値以下の場合に他の機器への依頼が必要であると判断するなどの方法をとれば良い。
うかを判定する(S703)。判定は、音声の全体について正しいかどうかを依頼したい場合には認識依頼を、入力音声のうちの一部分だけの保証を求めたいときには保証依頼を依頼するように判断すれば良い。
1.通信のための情報:送信か受信かどの機器にメッセージを送るか、どのメッセージへの返信かなどを表す。
2.機能情報:保証依頼、保証依頼返信などのメッセージの機能を表す情報。
3.内容情報:メッセージの機能が保証依頼ならば保証対象である単語情報の時間情報、単語情報、品詞や句などの文法情報、意味情報、尤度などからなり、メッセージの機能が認識依頼ならば音声情報もしくは認識すべき音声区間の時間情報など認識すべき音声区間が特定可能な情報で構成する。
4.結果情報:保証依頼結果、認識依頼結果などの情報。
5.コンテキスト情報:誰の音声かという話者情報(名前、性別、年齢、地域)や発声時の感情などの情報。
6.環境情報:機器の設置場所(台所、駅のホームなど)に関する情報や、周囲のノイズ環境に関する情報など。
7.システム情報:認識方式、語彙数、語彙ファイル、言語モデル、音響モデル、搭載メモリ、搭載チップ、サンプリング周波数、マイク特性など。
ても、他の機器に保証や認識の依頼をすることによって得られる保証結果および認識結果に基づいて認識結果を再考することができ、自機器の能力を超えた音声認識の性能を実現できるようになる。
(実施の形態2)
実施の形態1では、PC1,電子レンジ2、冷蔵庫3の全ての構成を同じとした、しかし電子レンジ2や冷蔵庫3で利用可能な計算リソースは非常に限られていることが多い。そこで、電子レンジ2や冷蔵庫3上に搭載する連携型の音声認識部101は、他の機器からの要求にこたえる機能を省略することも可能である。そこで、電子レンジや冷蔵庫などのように、計算リソースの限られた機器上の音声認識は図19に示すように図2における依頼応答部205を省略することができる。一方、PC1や音声認識サーバーのような計算リソースに余裕のある機器上には、図2の構成をとればよい。なお、動作は図2に説明したものと同様であるので省略する。
図20は本発明の実施の形態3の連携型の音声認識101の構成図である。図2と同一構成については同一番号を付し、説明を省略する。インターフェース部206に接続された音声認識機器プロファイル格納部2001(以下SRSP:Speech Recognition System Profile)はネットワーク4に接続されている機器の情報や状態をプロファイル情報として格納する。辞書ファイル格納部2002にはテレビ用、チケット検索用、メール書き用など様々なドメインに対応した辞書ファイルが格納されている。言語モデル格納部2003にはテレビ用、チケット検索用、メール書き用など様々なドメインに対応した言語モデルが格納されている。音響モデル格納部2004には、話し言葉用、読み上げ音声用など様々な話し方や様々な環境下な対応可能な音響モデルが格納されている。これら辞書ファイル、言語モデル、音響モデルはあらかじめ用意しておいてもよいし、必要に応じてサーバーからダウンロードする形態をとることも可能である。認識結果蓄積部2005には認識結果が格納される。
きるようになる。性能の高い機器であっても、同等の性能の異なる特徴をもつ認識器により保証、認識依頼を行うことで自機器の能力を超えた音声認識の性能を実現できるようになる。
図25に本発明の実施の形態4の構成図を示す。音声情報蓄積部2501は自機器の入力部201に入力された音声を蓄積する。他の構成は実施の形態3と同じであるので説明は省略する。このように、音声を常に蓄積しておく音声情報蓄積部2501を設けることで、受入依頼メッセージ信号238によって認識依頼を受けた際に、その蓄積された音声を用いて認識を行うことが出来るようになる。
図26に本発明の実施の形態5の構成図を示す。音声情報蓄積部2501は自機器の入力部201およびネットワーク4を介して音声情報を蓄積する。他の構成は実施の形態3と同じであるので説明は省略する。このように、ネットワーク4につながれた機器に入力された音声を常に蓄積しておくように音声情報蓄積部2501を構成することで、受入依頼メッセージ信号238によって認識依頼を受けた際に、確実に一番近くで収集された音声を用いて認識を行うことが出来るようになる。
図27に本発明の実施の形態6の構成図を示す。本実施の形態では、図2に示す実施の形態1に、音声認識機器プロファイル格納部2001と音声情報蓄積部2501と、さらに通知判定部3001を有している。
ドレス192.168.0.1の機械からIPアドレス192.168.0.2の機械に対して、“時刻2003年2月13日8時23分51秒から時刻2003年2月13日8時23分53秒までの間に、「温め」という単語が入力された“ということを通知するメッセージを意味する。
図30は本発明の実施の形態7の連携型の音声認識部101の構成図である。本実施の形態では、図2に示す実施の形態に、音声認識機器プロファイル格納部2001と信頼度情報格納部2701を有している。信頼度情報格納部2701にはネットワーク4に接続されている機器から受ける受入応答メッセージ信号236に対する信頼度情報が格納される。
図33は本発明の実施の形態8の機器連携型の音声認識の構成図である。本実施の形態では、図2に示す実施の形態1に、音声認識機器プロファイル格納部2001と機器状態検出部3301がインターフェース部206に接続されている。機器状態検出部3301は、自機器がネットワーク4に接続されたかどうか、あるいは電源が入っているかどうかといった状態を検出する機能を有し、自機器がネットワークに接続された場合にPlug&Playで機器が使えるように自機器の設定を行う機能を有する。また電源が入ったとき、あるいは切れたときに自機器の設定を自動的に行う、さらにはネットワークの他の機器に電源が入っていないことを知らせることができる機能を有する。
ャストし(S3509)。一方サーバーが見つかった場合、サーバーにSRSPをアップロードする(S3506)。
図36は、本発明の音声認識装置の実施の形態9を示す構成図である。電子レンジ2には計算リソースの関係上、単語の認識を行える音声認識部3601が搭載されており、一方、PC1には文の認識が行える音声認識部3602が搭載されている。
ことはないため、多くの場合、音声認識誤りを起こすか、あるいは図37のように第一の候補と第二の候補の尤度差が小さくなり、確信をもって認識結果を信頼するには至らない。図37の場合、「温め」と「炒め」の両方が誤認識されている。
て電子レンジ2からの依頼に対して保証結果を返すことが出来るようになる。これにより、たとえ発声者とPCや音声認識サーバーのようなより強力な機器の位置が離れていたとしても、認識することが可能となる効果をもつ。
図40は本発明の実施の形態10を示す構成図であって、電子レンジ4001には計算リソースの関係上、単語の認識が行える音声認識部4011が搭載されており、一方、PC4002の方には文の認識が行える音声認識部4012が搭載されている。また、PC4002にはネットワーク4に接続された機器に対するヘルプシステム、さらにはレシピ検索などのアプリケーションが搭載されている。そして電子レンジ4001は、PC4002上にダウンロードされたレシピ情報に記載されたプログラム情報により料理方法が逐次更新出来るようにされたネット家電型の電子レンジであるとする。
明したが、連続音声認識が搭載できたとした場合でも、新たなレシピ情報がダウンロードされてくるなど、認識すべき文の対象が前もって限定できない場合には、ユーザの発声を認識できない場合が多くなる。そこで、連続音声認識を用いている場合であっても、言語の尤度が低いなどの情報を用いて入力音声全体の信頼度を測り、その値を元に、他の機器に認識を依頼するように判断できる。
可能である。
図42に本発明の実施の形態11の構成図を示す。ネットワーク4上に複数の機器、例えば、PC4001、電子レンジ4202、冷蔵庫4203、洗濯機4204、音声認識サーバー4205が接続されている。各機器は家の中に分散して配置されている。ユーザは、部屋の中の任意の場所から各機器の動作を音声により指示できるようになっている。
図44は、本発明の実施の形態12を示すシステム構成と動作を示した図である。電子レンジ4202に搭載の音声認識部101は、認識に失敗したとする。そのとき、電子レンジ4202は、他の強力な音声認識サーバー4205に対して認識を依頼する。しかし、その音声認識サーバー4205でも、上記音声を認識するにあたってちょうど対応する言語モデルなどがないとする。その場合、前記音声認識サーバー4205は、また別途異なるサーバー(例えば、PC4001)に対して依頼を行う。このような連鎖を繰り返すことで音声の認識結果を、ユーザと機器との距離に応じずネットワーク4上に置かれた機器を用いて認識を行うことが出来るようになる。
図45は、本発明の実施の形態13における音声認識装置を用いたシステム構成図である。音声認識を行う音声認識サーバー4501は、例えば家庭内などに作られたローカルなネットワーク環境4とインターネットなどを介してつながっている。ユーザは音声認識による家電機器などのコントロールを家庭内に構築するのではなく、インターネット上のサービスサイトとして用意された音声認識サーバー4501を利用する。このようにすることで、ユーザはあらかじめ高価なサーバーを買う必要がなく、必要に応じて課金サーバー4502で課金されるようにシステムを構成できる。
調し合うことで、各々の機器単体で認識出来る以上に、単語や文のバリエーションの認識が可能となるという効果を有し、ユビキタスコンピューティング、情報家電、カーナビゲーションなどの分野で有用である。
2 電子レンジ
3 冷蔵庫
4 洗濯機
5 音声認識サーバー
6 洗濯機
101 音声認識部
201 入力部
202 認識部
203 依頼判定部
204 認識結果確定部
205 依頼応答部
206 インターフェース部
207 出力部
221 入力音声信号
222 出力内容信号
231 送信依頼内容信号
232 受入返答内容信号
233 送信応答内容信号
234 入依頼内容信号
235 送信依頼メッセージ信号
236 受入応答メッセージ信号
237 送信応答メッセージ信号
238 受入依頼メッセージ信号
241 認識結果信号
242 認識結果依頼情報付き信号
243 認識結果格納信号
1201 IPリストテーブル格納部
1211 IPリストテーブル信号
2001 音声認識機器プロファイル格納部
2002 辞書ファイル格納部
2003 言語モデル格納部
2004 音響モデル格納部
2005 認識結果蓄積部
2011 音声認識機器プロファイル信号
2501 音声情報蓄積部
2511 蓄積音声信号
2701 信頼度情報格納部
2711 信頼度情報信号
3001 通知判定部
3002 通知機能付きインターフェース部
3011 通知内容信号
3012 通知メッセージ信号
3301 機器状態検出部
3311 機器状態検出信号
3312 機器状態通知メッセージ信号
3601、3602 音声認識部
3702 意味理解部
3703 機器制御部
4502 課金サーバー
Claims (18)
- 音声情報が入力される入力手段と、前記入力された音声情報の音声認識を行う認識手段と、前記認識手段での認識結果について支援の依頼が必要かどうかを判定する判定手段と、前記判定手段から支援を依頼される他の機器が接続された回線手段と、前記他の機器から送られてくる前記支援の結果に基づいて前記認識結果を確定する確定手段と、前記確定された認識結果を出力する出力手段とを備えた音声認識装置。
- 前記他の機器からの支援の依頼に対して応答する応答手段を備えたことを特徴とする請求項1に記載の音声認識装置。
- 前記入力手段が、前記入力された音声情報を蓄積する音声情報蓄積手段を有し、前記応答手段が、前記他の機器からの支援の依頼に対して、前記音声情報蓄積手段に蓄積された音声情報に基づいて応答することを特徴とする請求項2に記載の音声認識装置。
- 前記音声情報蓄積手段が、前記回線手段に接続された他の機器に入力された音声情報を蓄積することを特徴とする請求項3に記載の音声認識装置。
- 前記回線手段が、前記回線手段に接続された他の機器のプロファイル情報を格納したプロファイル格納手段を有し、前記プロファイル情報に基づいて、前記支援を依頼する前記他の機器を決めることを特徴とする請求項1に記載の音声認識装置。
- 前記プロファイル情報が、前記回線手段に接続された他の機器を特定する特定情報を有し、前記回線手段が、前記特定情報で特定された前記他の機器に前記認識結果の通知を行う通知判定手段を備えたことを特徴とする請求項5に記載の音声認識装置。
- 前記回線手段が、前記回線手段に接続された他の機器の音声認識に関する信頼度情報を格納する信頼度情報格納手段を有し、前記確定手段が、前記信頼度情報に基づいて認識結果を確定することを特徴とする請求項1に記載の音声認識装置。
- 前記回線手段が、前記回線手段に接続された他の機器の信頼度情報を格納する信頼度情報格納手段を有し、前記応答手段が、前記他の機器からの支援の依頼に対して、前記信頼度情報に基づいて応答することを特徴とする請求項2に記載の音声認識装置。
- 前記入力手段が、前記入力された音声情報を蓄積する音声情報蓄積手段を有し、前記回線手段が、前記回線手段に接続された他の機器のプロファイル情報を格納したプロファイル格納手段を有し、前記応答手段が、辞書ファイル情報、言語モデル情報、及び音響モデル情報のうちの少なくともいずれかを格納する情報格納手段を有し、前記応答手段が、前記他の機器からの支援の依頼に対して、前記音声情報蓄積手段に蓄積された音声情報および前記プロファイル格納手段格納された前記プロファイル情報に基づいて、前記情報格納手段に格納された情報を選択して認識し応答することを特徴とする請求項2に記載の音声認識装置。
- 前記回線手段が、前記回線手段への接続の状態を検出する検出手段を有し、前記接続の状態に変化があった場合、前記検出手段が、前記回線手段に接続された他の機器に前記接続の様態の変化を通知することを特徴とする請求項1に記載の音声認識装置。
- 前記検出手段が、前記回線手段への接続の状態の変化を検出した場合、前記回線手段が、前記プロファイル格納手段に格納されているプロファイル情報を更新すると共に、前記回線手段に接続された他の機器に、前記接続の状態の変化を通知することを特徴とする請求
項6に記載の音声認識装置。 - 前記接続の状態の変化が、前記回線手段と前記他の機器との接続または離接、もしくは前記回線手段に接続された前記他の機器の電源の閉成または開放の少なくともいずれか一方であることを特徴とする請求項10に記載の音声認識装置。
- 前記認識手段が、前記入力手段に入力された音声情報の意味を理解する意味理解手段を有したことを特徴とする請求項1から請求項12までのうちのいずれかに記載の音声認識装置。
- 前記応答手段は、前記回線手段に接続された他の機器での認識結果をもとに、前記他の機器からの支援の依頼に対して応答することを特徴とする請求項2から請求項13までのうちのいずれかに記載の音声認識装置。
- 前記認識手段が、前記認識手段の利用に対して課金をする課金手段を有し、前記課金手段が、前記回線手段に接続される他の機器が前記認識手段に認識の支援の依頼をする場合に課金することを特徴とする請求項1から請求項14までのうちのいずれかに記載の音声認識装置。
- 前記回線手段に接続される少なくとも一つの他の機器の認識手段が前記課金手段を有し、前記回線手段がインターネット回線を有し、前記課金手段を有さない機器と前記課金手段を有する機器とが前記インターネット回線で接続されたことを特徴とする請求項15に記載の音声認識装置。
- 入力された音声情報の音声認識を行う手順と、他の機器に対して前記認識結果についての支援の依頼が必要かどうかを判定する手順と、前記他の機器から送られてくる前記支援の依頼の結果に基づいて前記認識結果を確定する手順と、前記確定された認識結果を出力する手順とを備えたことを特徴とする音声認識方法。
- 前記他の機器からの支援の依頼に対して応答する手順を備えたことを特徴とする請求項17に記載の音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004077477A JP4581441B2 (ja) | 2004-03-18 | 2004-03-18 | 家電機器システム、家電機器および音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004077477A JP4581441B2 (ja) | 2004-03-18 | 2004-03-18 | 家電機器システム、家電機器および音声認識方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005266192A true JP2005266192A (ja) | 2005-09-29 |
JP2005266192A5 JP2005266192A5 (ja) | 2007-05-10 |
JP4581441B2 JP4581441B2 (ja) | 2010-11-17 |
Family
ID=35090817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004077477A Expired - Fee Related JP4581441B2 (ja) | 2004-03-18 | 2004-03-18 | 家電機器システム、家電機器および音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4581441B2 (ja) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008122927A (ja) * | 2006-09-13 | 2008-05-29 | Honda Motor Co Ltd | モータ雑音下におけるロボット用音声認識方法 |
JP2009294269A (ja) * | 2008-06-03 | 2009-12-17 | Nec Corp | 音声認識システム |
JP2010130223A (ja) * | 2008-11-26 | 2010-06-10 | Fujitsu Ten Ltd | 音声操作システムおよび音声操作方法 |
JP2011232619A (ja) * | 2010-04-28 | 2011-11-17 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
JP2014056278A (ja) * | 2008-07-02 | 2014-03-27 | Google Inc | 並列認識タスクを用いた音声認識 |
JP2015164251A (ja) * | 2014-02-28 | 2015-09-10 | シャープ株式会社 | 音声サーバ |
JP2015535952A (ja) * | 2012-09-29 | 2015-12-17 | シェンジェン ピーアールテック カンパニー リミテッド | マルチメディアデバイス用音声制御システム及び方法、及びコンピュータ記憶媒体 |
US9293142B2 (en) | 2012-10-02 | 2016-03-22 | Denso Corporation | Voice recognition system |
JP2017515141A (ja) * | 2014-03-27 | 2017-06-08 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 言語モデルカスタマイズのためのフレキシブルスキーマ |
JP2017107333A (ja) * | 2015-12-08 | 2017-06-15 | キヤノン株式会社 | 通信機器及び通信機器の制御方法 |
CN107085463A (zh) * | 2016-02-15 | 2017-08-22 | 北京北信源软件股份有限公司 | 一种支持自然语言信息交互的智能设备控制体系和方法 |
CN107086949A (zh) * | 2016-02-15 | 2017-08-22 | 北京北信源软件股份有限公司 | 一种用于人与智能设备交互操作的辅助智能装置 |
CN108701459A (zh) * | 2015-12-01 | 2018-10-23 | 纽昂斯通讯公司 | 将来自各种语音服务的结果表示为统一概念知识库 |
CN108806690A (zh) * | 2013-06-19 | 2018-11-13 | 松下电器(美国)知识产权公司 | 声音对话方法及声音对话代理服务器 |
WO2019017665A1 (en) * | 2017-07-21 | 2019-01-24 | Samsung Electronics Co., Ltd. | ELECTRONIC APPARATUS FOR PROCESSING A USER STATEMENT FOR CONTROLLING AN EXTERNAL ELECTRONIC APPARATUS AND METHOD FOR CONTROLLING THE APPARATUS |
US10572602B2 (en) | 2013-06-21 | 2020-02-25 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11315553B2 (en) | 2018-09-20 | 2022-04-26 | Samsung Electronics Co., Ltd. | Electronic device and method for providing or obtaining data for training thereof |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11237892A (ja) * | 1998-02-24 | 1999-08-31 | Clarion Co Ltd | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 |
JPH11311996A (ja) * | 1997-10-23 | 1999-11-09 | Sony Internatl Europ Gmbh | 音声装置及び遠隔制御可能なネットワーク機器 |
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP2002049390A (ja) * | 2000-08-04 | 2002-02-15 | Asahi Kasei Corp | 音声認識方法およびサーバならびに音声認識システム |
JP2002182688A (ja) * | 2000-12-18 | 2002-06-26 | Seiko Epson Corp | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム |
WO2003058604A1 (en) * | 2001-12-29 | 2003-07-17 | Motorola Inc., A Corporation Of The State Of Delaware | Method and apparatus for multi-level distributed speech recognition |
JP2003223188A (ja) * | 2002-01-29 | 2003-08-08 | Toshiba Corp | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2004
- 2004-03-18 JP JP2004077477A patent/JP4581441B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11311996A (ja) * | 1997-10-23 | 1999-11-09 | Sony Internatl Europ Gmbh | 音声装置及び遠隔制御可能なネットワーク機器 |
JPH11237892A (ja) * | 1998-02-24 | 1999-08-31 | Clarion Co Ltd | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 |
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP2002049390A (ja) * | 2000-08-04 | 2002-02-15 | Asahi Kasei Corp | 音声認識方法およびサーバならびに音声認識システム |
JP2002182688A (ja) * | 2000-12-18 | 2002-06-26 | Seiko Epson Corp | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム |
WO2003058604A1 (en) * | 2001-12-29 | 2003-07-17 | Motorola Inc., A Corporation Of The State Of Delaware | Method and apparatus for multi-level distributed speech recognition |
JP2003223188A (ja) * | 2002-01-29 | 2003-08-08 | Toshiba Corp | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008122927A (ja) * | 2006-09-13 | 2008-05-29 | Honda Motor Co Ltd | モータ雑音下におけるロボット用音声認識方法 |
JP2009294269A (ja) * | 2008-06-03 | 2009-12-17 | Nec Corp | 音声認識システム |
US9373329B2 (en) | 2008-07-02 | 2016-06-21 | Google Inc. | Speech recognition with parallel recognition tasks |
US10699714B2 (en) | 2008-07-02 | 2020-06-30 | Google Llc | Speech recognition with parallel recognition tasks |
JP2014056278A (ja) * | 2008-07-02 | 2014-03-27 | Google Inc | 並列認識タスクを用いた音声認識 |
US11527248B2 (en) | 2008-07-02 | 2022-12-13 | Google Llc | Speech recognition with parallel recognition tasks |
US10049672B2 (en) | 2008-07-02 | 2018-08-14 | Google Llc | Speech recognition with parallel recognition tasks |
JP2010130223A (ja) * | 2008-11-26 | 2010-06-10 | Fujitsu Ten Ltd | 音声操作システムおよび音声操作方法 |
JP2011232619A (ja) * | 2010-04-28 | 2011-11-17 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
JP2015535952A (ja) * | 2012-09-29 | 2015-12-17 | シェンジェン ピーアールテック カンパニー リミテッド | マルチメディアデバイス用音声制御システム及び方法、及びコンピュータ記憶媒体 |
US9293142B2 (en) | 2012-10-02 | 2016-03-22 | Denso Corporation | Voice recognition system |
USRE49014E1 (en) | 2013-06-19 | 2022-04-05 | Panasonic Intellectual Property Corporation Of America | Voice interaction method, and device |
JP2020173477A (ja) * | 2013-06-19 | 2020-10-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、及び音声対話エージェントサーバ |
JP7072610B2 (ja) | 2013-06-19 | 2022-05-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声対話方法、及び音声対話エージェントサーバ |
CN108806690A (zh) * | 2013-06-19 | 2018-11-13 | 松下电器(美国)知识产权公司 | 声音对话方法及声音对话代理服务器 |
JP2018189984A (ja) * | 2013-06-19 | 2018-11-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声対話方法、及び、音声対話エージェントサーバ |
US10572602B2 (en) | 2013-06-21 | 2020-02-25 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
JP2015164251A (ja) * | 2014-02-28 | 2015-09-10 | シャープ株式会社 | 音声サーバ |
US10497367B2 (en) | 2014-03-27 | 2019-12-03 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
JP2017515141A (ja) * | 2014-03-27 | 2017-06-08 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 言語モデルカスタマイズのためのフレキシブルスキーマ |
CN108701459A (zh) * | 2015-12-01 | 2018-10-23 | 纽昂斯通讯公司 | 将来自各种语音服务的结果表示为统一概念知识库 |
JP2017107333A (ja) * | 2015-12-08 | 2017-06-15 | キヤノン株式会社 | 通信機器及び通信機器の制御方法 |
WO2017142389A1 (en) * | 2016-02-15 | 2017-08-24 | Linkdood Technologies Sdn Bhd | A type of smart device control system and method that supports natural language message interaction |
WO2017142390A1 (en) * | 2016-02-15 | 2017-08-24 | Linkdood Technologies Sdn Bhd | A type of an auxiliary smart device for human to operate smart device interactively |
CN107086949A (zh) * | 2016-02-15 | 2017-08-22 | 北京北信源软件股份有限公司 | 一种用于人与智能设备交互操作的辅助智能装置 |
CN107085463A (zh) * | 2016-02-15 | 2017-08-22 | 北京北信源软件股份有限公司 | 一种支持自然语言信息交互的智能设备控制体系和方法 |
WO2019017665A1 (en) * | 2017-07-21 | 2019-01-24 | Samsung Electronics Co., Ltd. | ELECTRONIC APPARATUS FOR PROCESSING A USER STATEMENT FOR CONTROLLING AN EXTERNAL ELECTRONIC APPARATUS AND METHOD FOR CONTROLLING THE APPARATUS |
US10824392B2 (en) | 2017-07-21 | 2020-11-03 | Samsung Electronics Co., Ltd. | Electronic apparatus for processing user utterance for controlling an external electronic apparatus and controlling method thereof |
Also Published As
Publication number | Publication date |
---|---|
JP4581441B2 (ja) | 2010-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4581441B2 (ja) | 家電機器システム、家電機器および音声認識方法 | |
JP2005266192A5 (ja) | ||
US9472193B2 (en) | Speech dialogue control method | |
CN106773742B (zh) | 语音控制方法及语音控制系统 | |
US10819806B2 (en) | Internet of things (IOT) device discovery platform | |
US10185534B2 (en) | Control method, controller, and recording medium | |
US20200135191A1 (en) | Digital Voice Butler | |
US20160373269A1 (en) | Device control method, controller, and recording medium | |
CN110858481B (zh) | 用于处理用户语音话语的系统和用于操作该系统的方法 | |
EP4064713A1 (en) | Voice control method and apparatus, server, terminal device, and storage medium | |
US20040002866A1 (en) | Speech recognition command via intermediate device | |
CN114830614B (zh) | 用于双向通信系统的功能即服务云聊天机器人 | |
JP6619488B2 (ja) | 人工知能機器における連続会話機能 | |
JP7115265B2 (ja) | 対話制御方法、対話制御プログラム、対話制御装置、情報提示方法および情報提示装置 | |
CN109285541A (zh) | 语音识别系统及语音识别方法 | |
CN111258529A (zh) | 电子设备及其控制方法 | |
CN108881508B (zh) | 一种基于区块链的语音dns单元 | |
JP6995566B2 (ja) | ロボット対話システム及びロボット対話システムの制御方法 | |
CN115658875B (zh) | 基于聊天服务的数据处理方法及相关产品 | |
CN116708065A (zh) | 智能家居环境下低功耗蓝牙语音控制方法及系统 | |
WO2015195734A1 (en) | Natural language control of a gateway device | |
US11442692B1 (en) | Acoustic workflow system distribution | |
JP2019028388A (ja) | 家電装置システム | |
CN113485335A (zh) | 语音指令的执行方法及装置、存储介质及电子装置 | |
KR20220118698A (ko) | 사용자와 대화하는 인공 지능 에이전트 서비스를 지원하는 전자 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070314 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070314 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070412 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100506 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100803 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100816 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4581441 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130910 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |