JP5351855B2 - 情報家電システム、情報取得方法及びプログラム - Google Patents

情報家電システム、情報取得方法及びプログラム Download PDF

Info

Publication number
JP5351855B2
JP5351855B2 JP2010179095A JP2010179095A JP5351855B2 JP 5351855 B2 JP5351855 B2 JP 5351855B2 JP 2010179095 A JP2010179095 A JP 2010179095A JP 2010179095 A JP2010179095 A JP 2010179095A JP 5351855 B2 JP5351855 B2 JP 5351855B2
Authority
JP
Japan
Prior art keywords
information
voice
voice recognition
home appliance
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010179095A
Other languages
English (en)
Other versions
JP2012037783A (ja
Inventor
健一 磯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010179095A priority Critical patent/JP5351855B2/ja
Publication of JP2012037783A publication Critical patent/JP2012037783A/ja
Application granted granted Critical
Publication of JP5351855B2 publication Critical patent/JP5351855B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、クライアント端末と、ネットワークを介して前記クライアント端末に接続する音声認識サーバと、ネットワークを介して音声認識サーバに接続する情報家電とを備える情報家電システム、情報取得方法及びプログラムに関する。
近年、ネットワークを介して、サーバに接続できる機能を備えるとともに、ディスプレイ上のWebブラウザを用いて、インターネットを利用することができるテレビジョン、カー・ナビゲーション等の家電、いわゆる情報家電(以下、情報家電と示す)が広く知られている(例えば、特許文献1)。
このような情報家電によれば、ユーザは、従来から用いられているパソコン等に限定されることなく、インターネットを利用することができる。
特開2008−79077号公報
しかしながら、上述した従来の情報家電には、次のような問題があった。すなわち、上述した情報家電を用いて、インターネットを利用する場合、ユーザは、パソコンにおけるキーボードに代わる入力装置として、通常、各情報家電に付属するリモコンを利用する。このようなリモコンは、本来、文字入力を目的としておらず、リモコンを用いた文字入力は、操作性に対するユーザの要求を満たせていないという問題がある。
上述した情報家電にキーボード等を接続して、操作性を解消することや、情報家電に制御プログラムをインストールし、外部に設置したパソコン等を用いて情報家電を制御することも可能であるが、この場合、追加の機器や、制御プログラムが必要となり、ユーザに経済的な負担や新たな作業負荷を強いることとなる。
そこで、本発明は、このような状況に鑑みてなされたものであり、特別な制御プログラムのインストールなど、ユーザに負担を強いて利便性を低下させることなく、操作性を向上させた情報家電システム、情報取得方法及びプログラムを提供することを目的とする。
上述した問題を解決するため、本発明は、次のような特徴を有している。まず、本発明の第1の特徴は、クライアント端末(例えば、携帯通信端末10、クライアント端末30)と、ネットワーク(通信ネットワーク50)を介して前記クライアント端末に接続する音声認識サーバ(音声認識サーバ100)と、Webブラウザ(Webブラウザ210)を有し、ネットワークを介して前記音声認識サーバに接続する情報家電(情報家電200)とを備える情報家電システム(情報家電システム1)であって、前記クライアント端末は、音声を入力する音声入力手段(音声入力部13)と、前記音声認識サーバを利用するユーザを識別するユーザ識別情報(例えば、ユーザID150)及び前記音声入力手段により入力された音声を送信する音声送信手段(通信部17)とを備え、前記音声認識サーバは、前記音声を受信する音声受信手段(通信部103)と、前記音声受信手段から取得した音声(音声情報140)について、音声認識をする音声認識手段(音声認識部113)と、前記音声認識手段の音声認識の結果を認識結果情報(認識結果情報170)として前記ユーザ識別情報に関連する情報家電に送信する認識結果送信手段(通信部103)と、前記音声受信手段が音声を受信するに先立ち、前記情報家電によって送信された前記ユーザ識別情報と、該ユーザ識別情報に対応し、前記認識結果情報を受信する該情報家電を識別する情報家電識別情報(情報家電識別情報160)とを記憶する記憶手段(ユーザ情報記憶部105)を備え、前記認識結果送信手段(通信部103)は、前記音声認識手段が音声認識をしたことを確認し、前記認識結果情報を、前記記憶手段が記憶している対応関係に基づいて、前記ユーザ識別情報に関連する情報家電に送信し、前記情報家電の前記Webブラウザ(Webブラウザ210)は、前記認識結果情報を取得するデータ取得手段(データ取得部213)と、所定のタイミングで、前記ユーザ識別情報に関連する前記情報家電に対する前記認識結果情報の有無を確認する確認要求を前記音声認識サーバに送信する確認要求送信手段を備え、前記認識結果送信手段は、前記確認要求に基づいて、前記確認要求を送信した情報家電に前記認識結果情報を送信することを要旨とする。
このような情報家電システムは、クライアント端末と、音声認識サーバと、情報家電とを備える。ここで、クライアント端末は、音声を入力する音声入力手段と、音声認識サーバを利用するユーザを識別するユーザ識別情報及び音声入力手段により入力された音声を送信する音声入力手段とを備える。
また、音声認識サーバは、情報家電から受信した音声について、音声認識をする音声認識手段と、ユーザ識別情報に関連する情報家電に音声認識の結果である認識結果情報を送信するデータ取得手段とを備える。
このため、情報家電は、ネットワークを介して音声認識サーバに接続し、Webブラウザさえ備えていれば、キーボード等を接続して、操作性を解消することや、情報家電に制御プログラムをインストールし、外部に設置したパソコン等を用いて制御されていなくてもよい。
従って、特別な制御プログラムのインストールなど、ユーザに負担を強いて利便性を低下させることなく、操作性を向上させた情報家電システムを提供できる。
本発明の第の特徴は、本発明の第1の特徴に係り、前記音声認識サーバは、インターネットサービス(インターネットサービス115a)と、前記インターネットサービスに関連するサービス関連単語(サービス関連単語117b)とを記憶するインターネットサービス記憶部(インターネットサービス記憶部115)と、前記音声認識手段の音声認識の結果と、前記インターネットサービス記憶部のサービス関連単語とに基づいて、対応するインターネットサービスを判定するインターネットサービス判定手段(インターネットサービス判定部119)とを更に備えることを要旨とする。
本発明の第の特徴は、本発明の第1の特徴に係り、前記音声認識サーバは、前記音声認識手段の音声認識の結果に基づいて、対応するインターネットサービスを指定するURL(URL115c)を作成するURL作成手段(URL作成部121)を更に備え、前記認識結果送信手段は、前記URLを認識結果情報として送信することを要旨とする。
本発明の第の特徴は、本発明の第の特徴に係り、前記URL作成手段は、前記音声認識手段の音声認識の結果を用いてインターネット検索を行い、前記音声認識手段の音声認識の結果に対応するWebページの属性に基づいて、前記インターネットサービスを指定する前記URLを作成することを要旨とする。
本発明の第の特徴は、本発明の第又は第の特徴に係り、前記音声認識サーバは、インターネットサービスと、前記インターネットサービスに関連するサービス関連単語とを記憶するインターネットサービス記憶部(インターネットサービス記憶部115)を更に備え、前記URL作成手段は、前記インターネットサービス記憶部に記憶されるサービス関連単語と、前記音声認識手段の音声認識の結果とに基づいて、前記インターネットサービスを判定し、前記URL(URL148)を作成することを要旨とする。
本発明の第6の特徴は、クライアント端末と、ネットワークを介して前記クライアント端末に接続する音声認識サーバと、Webブラウザを有し、ネットワークを介して前記音声認識サーバに接続する情報家電とを備える情報家電システムの情報取得方法であって、前記情報家電が、情報家電識別情報と、音声認識サーバを利用するユーザを識別するユーザ識別情報を前記音声認識サーバに送信するステップ(ステップS101)と、前記クライアント端末が、音声を入力するステップ(ステップS111)と、前記クライアント端末が、前記ユーザ識別情報及び前記音声を送信するステップ(ステップS113)と、前記音声認識サーバが、前記音声を受信するステップ(ステップS121)と、前記音声認識サーバが、該音声について、音声認識をするステップ(ステップS123)と、前記音声認識サーバが、前記音声認識の結果を認識結果情報として前記ユーザ識別情報に関連する情報家電に送信するステップ(ステップS129)と、前記情報家電の前記Webブラウザが、前記認識結果情報を取得するステップ(ステップS131)と、前記情報家電の前記Webブラウザが、所定のタイミングで、前記ユーザ識別情報に関連する前記情報家電に対する前記認識結果情報の有無を確認する確認要求を前記音声認識サーバに送信するステップを備え、前記認識結果情報を送信するステップは、前記確認要求に基づいて、前記確認要求を送信した情報家電に前記認識結果情報を送信することを要旨とする。
本発明の第7の特徴は、クライアント端末と、ネットワークを介して前記クライアント端末に接続する音声認識サーバと、Webブラウザを有し、ネットワークを介して前記音声認識サーバに接続する情報家電とを備える情報家電システムに情報を取得させるプログラムであって、前記情報家電、情報家電識別情報と、音声認識サーバを利用するユーザを識別するユーザ識別情報を前記音声認識サーバに送信するステップと、前記クライアント端末に、音声を入力するステップと、前記クライアント端末に、ユーザ識別情報及び前記音声を送信するステップと、前記音声認識サーバに、前記音声を受信するステップと、前記音声認識サーバに、該音声について、音声認識をするステップと、前記音声認識サーバに、前記音声認識の結果を認識結果情報として前記ユーザ識別情報に関連する情報家電に送信するステップと、前記情報家電の前記Webブラウザに、前記認識結果情報を取得するステップと、前記情報家電の前記Webブラウザに、所定のタイミングで、前記ユーザ識別情報に関連する前記情報家電に対する前記認識結果情報の有無を確認する確認要求を前記音声認識サーバに送信するステップを実行させ、前記認識結果情報を送信するステップは、前記確認要求に基づいて、前記確認要求を送信した情報家電に前記認識結果情報を送信することを要旨とする。
本発明によれば、特別な制御プログラムのインストールなど、ユーザに負担を強いて利便性を低下させることなく、操作性を向上させた情報家電システム、情報取得方法及びプログラムを提供できる。
本発明の第1実施形態に係る情報家電システム1の全体概略構成図である。 本発明の第1実施形態に係る携帯通信端末10の機能ブロック図である。 本発明の第1実施形態に係る音声認識サーバ100の機能ブロック図である。 本発明の第1実施形態に係る音声認識サーバ100のユーザ情報記憶部105に記憶される情報の一例を示す図である。 本発明の第1実施形態に係る音声認識サーバ100の音声認識部113の動作を説明するための概念図である。 本発明の第1実施形態に係る音声認識サーバ100のインターネットサービス記憶部115に記憶される情報の一例を示す図である。 本発明の第1実施形態に係る音声認識サーバ100の関連単語記憶部117に記憶される情報の一例を示す図である。 本発明の第1実施形態に係る音声認識サーバ100のインターネットサービス判定部119及びURL作成部121の動作を説明するための概念図である。 本発明の第1実施形態に係る音声認識サーバ100の認識結果記憶部123に記憶される情報の一例を示す図である。 本発明の第1実施形態に係る情報家電200の機能ブロック図である。 本発明の第1実施形態に係る情報家電システム1の動作を示すフローチャートである。 本発明の第1実施形態に係る情報家電システム1の動作の詳細を示すフローチャートである。 本発明の第2実施形態に係る音声認識サーバ100aの機能ブロック図である。
次に、図面を参照して、本発明の実施形態について説明する。
なお、以下の図面の記載において、同一または類似の部分には、同一または類似の符号を付している。また、図面は模式的なものであり、各寸法の比率などは現実のものとは異なる。
したがって、具体的な寸法などは以下の説明を参酌して判断すればよく、図面相互間においても互いの寸法の関係や比率が異なる部分が含まれている。
[第1実施形態]
以下の実施形態においては、(1)情報家電システム1の全体構成、(2)携帯通信端末10の詳細構成、(3)音声認識サーバ100の詳細構成、(4)情報家電200の詳細構成、(5)情報家電システム1の動作、及び(6)作用・効果について説明する。
(1)情報家電システム1の全体構成
図1は、第1実施形態に係る情報家電システム1の全体概略構成図である。
図1に示す情報家電システム1は、クライアント端末として機能する携帯通信端末10、クライアント端末30と、音声認識サーバ100と、情報家電200と、Webサーバ500とを備える。
第1実施形態では、携帯通信端末10、クライアント端末30、音声認識サーバ100、情報家電200、Webサーバ500が、通信ネットワーク50(インターネットなど)を介して接続されている。
情報家電システム1では、音声情報140が、携帯通信端末10又はクライアント端末30から音声認識サーバ100に送信される。また、情報家電システム1では、認識結果情報170が、音声認識サーバ100から情報家電200に送信される。また、情報家電システム1では、HTML言語により構成され、JavaScript等が埋め込まれたWebページ510が、Webサーバ500から情報家電200に送信される。Webページ510は、認識結果情報170に含まれるプログラムの実行を反映できるWebページページである。
音声認識サーバ100及びWebサーバ500は、CPU等の制御装置、メモリやHDD等の記憶装置、通信ネットワーク50と通信する通信I/F等の通信装置といったハードウェア資源を有するコンピュータ(単一或いは複数)により構成される。音声認識サーバ100が備える下記の各ブロックは、前述したコンピュータの制御装置等のハードウェア資源を用いてコンピュータプログラムを実行することによって実現されるものである。なお、これらの各ブロック、手段は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される構成を採用しても良い。
携帯通信端末10は、携帯通信端末装置(携帯電話機やスマートフォン)、クライアント端末30は、ユーザが利用するPC(Personal Computer)、タブレット型のPC、カーナビゲーションシステム等であり、無線LANや、近傍無線通信(Bluetooth(登録商標)や赤外線通信等)或いは有線通信(USB(Universal Serial Bus)ケーブル接続等)によって、通信ネットワーク50を介して、音声認識サーバ100に接続されている。携帯通信端末10、クライアント端末30は、音声認識サーバ100及びWebサーバ500が有するハードウェア資源に加えて、キーボタンやタッチパネル等の入力装置、液晶ディスプレイ等の出力装置、一般的なWebブラウザを備える。Webブラウザは、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求、取得及び表示、フォームデータの送信等を行う機能を有している。
なお、携帯通信端末10、クライアント端末30は、同一の機能を有しており、以下の記載においては、主に携帯通信端末10について、記載する。従って、クライアント端末30についても携帯通信端末10と同様の機能を有しているが、詳細の記載は、適宜省略する。
情報家電200は、無線LANや、近傍無線通信(Bluetooth(登録商標)や赤外線通信等)或いは有線通信(LANケーブル等)によって、通信ネットワーク50を介して、音声認識サーバ100に接続されている。情報家電200は、いわゆる家電が有するハードウェア資源に加えて、ディスプレイ上のWebブラウザ210を用いて、インターネットを利用することができる情報家電である。例えば、情報家電200は、テレビジョン、カー・ナビゲーション等の従来からディスプレイを備える家電に限られず、冷蔵庫、電子レンジ、エアコンなどの家電であってもよい。また、情報家電200は、ネットワークを介して、サーバに接続できる機能を備えるとともに、ディスプレイ上のWebブラウザを用いて、インターネットを利用することができるいわゆるパソコンであってもよい。
(2)携帯通信端末10の詳細構成
図2は、本発明の第1実施形態に係る携帯通信端末10の機能ブロック図である。図2に示すように、携帯通信端末10は、制御部11、音声入力部13、テキスト情報入力部15、通信部17、記憶部19を備える。これらの機能部は、いわゆるコンピュータにより構成され、演算/制御装置としてのCPU(Central Processing Unit)、記憶媒体としてのRAM(Random Access Memory)及びROM(Read Only Memory)、通信インターフェイス等が関連することで実現される。以下、各機能部について、説明する。なお、下記に示す音声認識サーバ100及び情報家電200の機能部も、携帯通信端末10の機能部と同様に、いわゆるコンピュータにより構成されている。
(2.1)制御部11
制御部11は、携帯通信端末10を制御するCPU等の制御装置である。制御部11は、下記に示す機能部の動作を制御する。
(2.2)音声入力部13
音声入力部13は、マイク等の入力装置であり、携帯通信端末10を利用するユーザ等の音声を入力する。また、音声入力部13は、入力されたアナログ音声をデジタルの音声信号からなる音声情報140に変換する。
(2.3)テキスト情報入力部15
テキスト情報入力部15は、キーボタンやタッチパネル等の入力装置であり、携帯通信端末10を利用するユーザの操作に伴ったテキストを入力する。
(2.4)通信部17
通信部17は、通信ネットワーク50を介して、他の機器と通信を行う。具体的には、通信部17は、音声送信手段として機能し、音声認識サーバ100を利用するユーザを識別するユーザ識別情報であるユーザID150及び音声入力部13により入力され、変換された音声情報140を音声認識サーバ100に送信する。例えば、ユーザID150は、音声認識サーバ100により発行されるCookie等を用いることができる。また、通信部17は、ユーザID150の代わり、或いはユーザID150に加えて、情報家電200を識別する情報家電識別情報160を送信してもよい。
(2.5)記憶部19
記憶部19は、音声入力部13により入力され、変換された音声情報140、ユーザID150、携帯通信端末10に固有の情報である端末識別情報等を記憶する。
(3)音声認識サーバ100の詳細構成
図3は、第1実施形態に係る音声認識サーバ100の機能ブロック図である。図3に示すように、音声認識サーバ100は、制御部101、通信部103、ユーザ情報記憶部105、認証部107、音響モデル記憶部109、言語モデル記憶部111、音声認識部113、インターネットサービス記憶部115、関連単語記憶部117、インターネットサービス判定部119、URL作成部121、認識結果記憶部123を備える。
音声認識サーバ100は、音声情報140について、音声認識を行い、音声認識が終了後、適時、認識結果情報170を情報家電200に送信する。すなわち、音声認識サーバ100は、処理が終了後適宜、次の処理を進めるいわゆるプッシュ型の配信を行うコンピュータである。
(3.1)制御部101
制御部101、音声認識サーバ100を制御するCPU等の制御装置である。制御部101は、下記に示す機能部の動作を制御する。
(3.2)通信部103
通信部103は、通信ネットワーク50を介して、他の機器と通信を行う。例えば、通信部103は、音声受信手段として機能し、音声情報140を携帯通信端末10から受信する。
また、通信部103は、認識結果送信手段として機能し、音声認識部113の音声認識の結果を認識結果情報170としてユーザID150に関連する情報家電200に送信する。通信部103は、音声認識部113が音声認識をしたことを確認し、適時、認識結果情報170を情報家電識別情報160に関連する情報家電200に送信する。すなわち、通信部103により、音声認識サーバ100は、いわゆるプッシュ型の配信を可能にする。
(3.3)ユーザ情報記憶部105
図4は、第1実施形態に係る音声認識サーバ100のユーザ情報記憶部105に記憶される情報の一例を示す図である。図4に示すように、ユーザ情報記憶部105は、ユーザID150を記憶する。更に、ユーザ情報記憶部105は、認識結果情報170を受信する情報家電200を識別する情報家電識別情報160をユーザID150に対応させて記憶する。ユーザ情報記憶部105は、所定のユーザが、複数の情報家電を用いて、音声認識サーバ100を利用する場合、ユーザの要求等に基づいて、ユーザID150に対応する複数の情報家電識別情報160を記憶する。ユーザ情報記憶部105は、ユーザID150に対応するユーザのパスワード、ユーザの名前、居住地、メールアドレス、音声認識サーバ100の利用履歴等の情報をユーザ識別情報として記憶してもよい。
ユーザID150は、tarou等のユーザが任意に指定した文字列である。ユーザID150は、音声認識サーバ100により指定された乱数等であってもよい。
情報家電識別情報160は、情報家電200を構成する家電固有の情報である。情報家電識別情報160は、情報家電200の製造番号、通信ネットワーク50上で情報家電200を判別するためのIPアドレス等であってもよい。
(3.4)認証部107
認証部107は、通信部103を介して携帯通信端末10又は情報家電200から取得したユーザを識別するユーザ識別情報に基づいて、ユーザの認証をする。例えば、認証部107は、情報家電200から取得したユーザID150と、パスワードとが、ユーザ情報記憶部105に記憶される情報と一致した場合に、音声認識サーバ100を利用するユーザとして、妥当であると判定し、ユーザ固有のセッションを作成する。
(3.5)音響モデル記憶部109
音響モデル記憶部109は、発音記号と、発音記号に対応する複数の音声波形又は音声波形の統計的な音声波形のモデルである音声波形モデルとを記憶する。例えば、音響モデル記憶部109は、「あ」から「ん」までの平仮名の発音記号と、各発音記号に対応する複数又は統計的な音声波形モデルとを記憶する。
(3.6)言語モデル記憶部111
言語モデル記憶部111は、辞書部と、n−gramを用いた言語モデルとからなる。辞書部には、発音記号と、発音記号に対応する単語とが含まれる。辞書部は、使用頻度に応じて各単語の出現確率をデータ化している。すなわち、辞書部の所定の発音記号に対する各単語の確率の累積は、100%になる。例えば、辞書部は、「ろっぽんぎ」という発音記号に対して、「六本木」である確率は、90%、「六方木」である確率は、5%・・・、という確率のデータを有し、「ろっぽんぎ」という発音記号に対する各単語の確率の累積は、100%になる。
n−gramを用いた言語モデルは、直前のn−1単語を指定したときに、n単語目の単語の出現頻度を示すテーブルを有する。これにより、例えば、2−gramを用いた言語モデルでは、「新宿」という地名の単語の次には、「行く」等の動詞、「私」等の代名詞、が続きにくく、「タワー」等の名詞、固有名詞等が続きやすいというデータを有する。
(3.7)音声認識部113
図5は、第1実施形態に係る音声認識サーバ100の音声認識部113の動作を説明するための概念図である。具体的には、図5(a)は、音声認識部113で変換される音声情報140の概念図である。図5(b)は、音声認識部113で音声情報140に基づいて置き換えられる発音記号142の一例を示す図である。図5(c)は、音声認識部113で発音記号142に基づいて変換される音声変換候補144の概念図である。
図5に示すように、音声認識部113は、音声受信手段として機能する通信部103から取得した音声情報140に対して、音声認識をする。
まず、図5(b)に示すように、音声認識部113は、音声情報140と、音響モデル記憶部109とに基づいて、音声情報140を発音記号142に置き換える。具体的には、音声認識部113は、音声情報140の特徴量等に基づいて、音声情報140を単語又は文節等である音声区間に区切る。次に、音声認識部113は、音響モデル記憶部109から、音声情報140に対応する発音記号142を抽出することにより、音声情報140の所定の音声区間を発音記号142に置き換える。また、音声認識部113は、発音記号142に対して、音響モデル記憶部109に基づいた確率を付与して記憶する。
例えば、音声認識部113は、音声情報140の特徴量に基づいて、音響モデル記憶部109に基づいた確率付きで、音声情報140を「ろっぽんぎからしんじゅくまで」等の発音記号142に置き換える。
次に、図5(c)に示すように、音声認識部113は、発音記号142について、言語モデル記憶部111に記憶される単語と、確率統計的な手法に基づいて、音声認識をする。言語モデル記憶部111は、発音記号142について、音声変換候補144と、音声変換候補144の確率とを記憶する。例えば、音声認識部113は、「ろっぽんぎからしんじゅくまで」という発音記号142について、言語モデル記憶部111に基づいて、「六本木から新宿まで」という音声変換候補144を作成する。すなわち、音声変換候補144は、発音記号142に対応するテキストデータである。
(3.8)インターネットサービス記憶部115
図6は、第1実施形態に係る音声認識サーバ100のインターネットサービス記憶部115に記憶される情報の一例を示す図である。インターネットサービス記憶部115は、インターネットサービス115aと、インターネットサービスを判定する条件115bと、インターネットサービスに対応するURL115c等を記憶する。
具体的には、インターネットサービス115aは、サービスの概要を示す名称や、サービスIDであり、例えば、経路探索、地図、レシピ等である。
条件115bは、各インターネットサービス115aに含まれるサービス関連単語117bと、条件式とを含む情報である。例えば、インターネットサービス記憶部115は、サービス関連単語として、「から」、「まで」、「路線」「経路」を、経路探索というインターネットサービス115aに対応させて記憶する。同様にしてインターネットサービス記憶部115は、サービス関連単語として、「地図」、「県」、「府」「市」等を、地図というインターネットサービス115aに、「天気」、「郵便番号」、「〒」等を、天気というインターネットサービス115aに、「作り方」、「料理」等を、レシピというインターネットサービス115aに、それぞれ対応させて記憶する。
URL115cは、各インターネットサービス115aに対応するWebページのURLである。
(3.9)関連単語記憶部117
図7は、第1実施形態に係る音声認識サーバ100の関連単語記憶部117に記憶される情報の一例を示す図である。関連単語記憶部117は、URL117aと、サービス関連単語117bと、該当項目117cと、処理プログラム117d等を記憶する。
具体的には、URL117aは、インターネットサービス記憶部115に記憶されるURL115cと共通のURLであり、各インターネットサービスに対応するWebページのURLである。
サービス関連単語117bは、インターネットサービス記憶部115に記憶される条件115bに含まれる各サービス関連単語であり、インターネットサービス115a又はURL117aの特徴となる単語である。
該当項目117cは、URL117aに対応するWebページにおいて、サービス関連単語117bがどの項目に該当するかを示す属性情報である。例えば、該当項目117cは、URL117aに対応するWebページのHTMLにおいて、サービス関連単語117bがどのテキストボックスに該当するかを示す。
処理プログラム117dは、サービス関連単語117bと、該当項目117cとに基づいて、URL117aに対応するWebページにおいて、どのような処理をすべきかを示す情報である。例えば、処理プログラム117dは、JavaScript等のスクリプト言語により記述され、URL117aに対応するWebページにおいて、どの項目に、サービス関連単語117bの前後の単語を入力すべきかを示している。
(3.10)インターネットサービス判定部119
図8は、第1実施形態に係る音声認識サーバ100のインターネットサービス判定部119及びURL作成部121の動作を説明するための概念図である。具体的には、図8(a)は、インターネットサービス判定部119で変換される音声変換候補144の概念図である。図8(b)は、インターネットサービス判定部119で音声変換候補144に基づいて置き換えられる標準クエリ146の一例を示す図である。図8(c)は、URL作成部121で標準クエリ146に基づいて変換されるURL148の概念図である。
インターネットサービス判定部119は、音声認識部113の音声認識の結果である音声変換候補144に基づいて、対応するインターネットサービスを判定する。具体的には、インターネットサービス判定部119は、インターネットサービス記憶部115のサービス関連単語117bと、音声変換候補144とに基づいて、音声変換候補144に含まれる単語と、条件115bとを比較して、インターネットサービス115aを判定する。
例えば、インターネットサービス判定部119は、音声変換候補144に「から」、「まで」、「路線」の全て、又は、「から」、「まで」、「経路」の全てが含まれている場合に、インターネットサービス115aが、経路探索であると判定する。
更に、図8(b)に示すように、インターネットサービス判定部119は、インターネットサービス記憶部115と、関連単語記憶部117とに基づいて、標準クエリ146を作成する。具体的には、インターネットサービス判定部119は、インターネットサービス115aを判定し、条件115bに含まれるサービス関連単語117bに基づいて、音声変換候補144をURL115cに対応するWebページにおいて該当する該当項目117cに変換することで、標準クエリ146を作成する。
例えば、インターネットサービス判定部119は、音声変換候補144に「から」、「まで」、「路線」の全て、又は、「から」、「まで」、「経路」の全てが含まれている場合に、インターネットサービス115aが、経路探索であると判定し、音声変換候補144に含まれる「から」を「出発地」、「まで」を「目的地」に変換し、更に「経路探索」を検索候補とした標準クエリ146を作成する。
(3.11)URL作成部121
URL作成部121は、音声認識部113の音声認識の結果である音声変換候補144に基づいて、対応するインターネットサービスを指定するURL115cを作成する。
具体的には、URL作成部121は、条件115bと、音声変換候補144とを比較して、インターネットサービス115aを判定し、URL115cを作成する。すなわち、URL作成部121は、インターネットサービス記憶部115に記憶される条件115bに含まれるサービス関連単語117bと、音声変換候補144とに基づいて、インターネットサービス115aを判定し、URL115cを作成する。
図8(c)に示すように、URL作成部121は、音声変換候補144と、URL115cに対応するWebページにおいて該当する該当項目117cとに基づいて、標準クエリ146を反映したURL148を作成する。例えば、URL作成部121は、「出発地」が「六本木」であることに対応したURLと、「目的地」が、「新宿」であることに対応したURLと、URL115cとを合わせたURL148を作成する。すなわち、URL148は、経路探索サービスを提供するインターネットサービスにおいて、六本木から新宿までの経路を示したWebページのアドレスとなる。
URL作成部121は、音声変換候補144と、URL115cに対応するWebページにおいて該当する該当項目117cとに基づいて、標準クエリ146を反映した処理プログラム117dを作成してもよい。この場合、例えば、URL作成部121は、関連単語記憶部117の情報に基づいて、「出発地」が「六本木」であることに対応した処理プログラム117dと、「目的地」が、「新宿」であることに対応した処理プログラム117dとを組み合わせたJavaScript等のプログラムを作成する。
通信部103は、認識結果情報170として、URL148を情報家電200に送信する。又は、通信部103は、認識結果情報170として、URL115cと、処理プログラム117dの組み合わせからなる情報を情報家電200に送信してもよい。
(3.12)認識結果記憶部123
図9は、第1実施形態に係る音声認識サーバ100の認識結果記憶部123に記憶される情報の一例を示す図である。
認識結果記憶部123は、ユーザID150と、情報家電識別情報160と、認識結果情報170と、送信日時等を記憶する。送信日時は、通信部103により認識結果情報170が情報家電200に送信された日時を示す情報である。
(4)情報家電200の詳細構成
図10は、第1実施形態の情報家電200の機能ブロック図である。図10に示すように、情報家電200は、制御部201、通信部203、入力部205、情報記憶部207、Webブラウザ210を備える。
(4.1)制御部201
制御部201は、情報家電200を制御するCPU等の制御装置である。制御部201は、下記に示す機能部の動作を制御する。
(4.2)通信部203
通信部203は、通信ネットワーク50を介して、他の機器と通信を行う。具体的には、通信部203は、送信手段として機能し、情報記憶部207に記憶されている情報を音声認識サーバ100に送信する。例えば、通信部203は、ログイン処理において、ユーザID150、パスワード、ログイン要求を音声認識サーバ100に送信する。
また、通信部203は、受信手段として機能し、音声認識サーバ100から認識結果情報170を受信する。具体的には、通信部203は、音声認識サーバ100から認識結果情報170として、URL115cと、処理プログラム117dの組み合わせからなる情報、又はURL148を受信する。
また、通信部203は、外部入力装置からの信号の受信手段として機能する。例えば、通信部203は、情報家電200の外部から、情報を入力するリモコンの操作に基づいて、送信された信号を受信する。通信部203は、Webサーバに対して、Webページの送信要求を送信するとともに、WebサーバからWebページを受信する。
(4.3)入力部205
入力部205は、ボタンやタッチパネル等の入力装置であり、情報家電200を利用するユーザの操作に伴った信号のオン、オフを入力する。
(4.4)情報記憶部207
情報記憶部207は、情報家電200の機能に関連する情報を記憶する。また、情報記憶部207は、情報家電識別情報160と、情報家電識別情報160に関連する情報を記憶する。
(4.5)Webブラウザ210
図10に示すように、Webブラウザ210は、表示部211、データ取得部213、スクリプト実行部215を備える。Webブラウザ210は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたWebページの取得要求の送信、Webページの取得、及びWebページの表示、フォームデータの送信等を行う機能を有している。また、Webブラウザ210には、Webページを表示する際の操作を制御するスクリプト言語、例えば、JavaScriptが実装されている。
(4.5.1)表示部211
表示部211は、通信部203から取得したWebページを情報家電200のディスプレイ等を介して、Webページを表示する。
(4.5.2)データ取得部213
データ取得部213は、認識結果情報170を通信部203から取得する。具体的には、データ取得部213は、認識結果情報170として、URL148又は、URL115cと、処理プログラム117dの組み合わせからなる情報を取得する。
(4.5.3)スクリプト実行部215
スクリプト実行部215は、Webページを構成するHTMLに埋め込まれたJavaScript等のプログラム、または、Webページと共に取得したJavaScript等のプログラムを実行する。これにより、Webブラウザ210を介して表示されるWebページにプログラムに基づいて、動きを付加する。
例えば、データ取得部213が、路線探索に関するWebページを記載したURL115cと、「出発地」に「六本木」を入力すること、「目的地」に「新宿」を入力することを示した処理プログラム117dの組み合わせからなる情報を取得した場合、Webブラウザ210は、URL115cに記載されたWebページをWebサーバより取得する。次に、表示部211は、路線探索に関するWebページを表示し、スクリプト実行部215は、取得したプログラムを実行することにより、対応するテキストボックスに、「六本木」、「新宿」を入力する。
(5)情報家電システム1の動作
情報家電システム1の動作について、(5.1)全体概略動作、(5.2)情報家電システム1のログイン動作、(5.3)携帯通信端末10の音声入力動作、(5.4)音声認識サーバ100の音声認識動作の順に説明する。
(5.1)全体概略動作
図11は、第1実施形態に係る情報家電システム1の動作を示すフローチャートである。
図11に示すように、ステップS100において、ユーザは、情報家電200及び携帯通信端末10を用いて、それぞれ情報家電システム1にログインする。具体的には、携帯通信端末10が、ユーザの操作等により、ユーザID150を音声認識サーバ100に送信することにより、音声認識サーバ100にログインする。また、情報家電200が、ユーザの操作等により、ユーザID150又は、情報家電識別情報160を音声認識サーバ100に送信することにより、音声認識サーバ100にログインする。
ステップS110において、ユーザは、携帯通信端末10を用いて、音声を入力する。具体的には、携帯通信端末10が、音声入力部13により入力され、変換された音声情報140を音声認識サーバ100に送信する。
ステップS120において、音声認識サーバ100は、音声情報140について、音声認識を行い、認識結果情報170を情報家電200に送信する。
ステップS130において、情報家電200は、認識結果情報170に基づいて、該当するWebサーバから認識結果情報170に該当するWebページを取得する。
(5.2)情報家電システム1のログイン動作
図12は、第1実施形態に係る情報家電システム1の動作の詳細を示すフローチャートである。ステップS101〜ステップS109は、図11におけるステップS100のログイン動作の詳細を示す。
ステップS101において、情報家電200は、ユーザの操作等により、ユーザを識別するユーザ識別情報と、情報家電システム1へのログイン要求とを音声認識サーバ100に送信する。具体的には、情報家電200の通信部203は、ユーザの操作等により、ユーザID150又は、情報家電識別情報160、パスワード等と、ログイン要求とを音声認識サーバ100に送信する。
ステップS103において、音声認識サーバ100の認証部107は、通信部103を介して情報家電200から取得したユーザ識別情報に基づいて、ユーザの認証をする。
ステップS105において、携帯通信端末10は、ユーザの操作等により、ユーザを識別するユーザ識別情報と、情報家電システム1へのログイン要求とを音声認識サーバ100に送信する。具体的には、携帯通信端末10の通信部17は、ユーザの操作等により、ユーザID150又は、情報家電識別情報160、パスワード等と、ログイン要求とを音声認識サーバ100に送信する。
ステップS107において、音声認識サーバ100の認証部107は、通信部17を介して携帯通信端末10から取得したユーザ識別情報に基づいて、ユーザの認証をする。
ステップS109において、音声認識サーバ100の通信部103は、ログインを示す情報を含むWebページ510を情報家電200及び携帯通信端末10に送信する。
(5.3)携帯通信端末10の音声入力動作
図12に示すステップS111〜ステップS113は、図11におけるステップS110の音声入力動作の詳細を示す。
ステップS111において、携帯通信端末10の音声入力部13は、携帯通信端末10を利用するユーザ等の音声を入力する。また、音声入力部13は、入力された音声を音声信号からなる音声情報140に変換する。
ステップS113において、携帯通信端末10の通信部17は、音声情報140を音声認識サーバ100に送信する。また、音声認識サーバ100を利用するユーザが、複数の情報家電を用いる場合、すなわち、ユーザ情報記憶部105にユーザID150に対応する情報家電識別情報160が複数記憶される場合、通信部17は、認識結果情報170を受信する情報家電200を識別する情報家電識別情報160を音声認識サーバ100に送信する。
また、ユーザ情報記憶部105にユーザID150に対応する情報家電識別情報160が複数記憶される場合において、携帯通信端末10の通信部17から情報家電200を識別する情報家電識別情報160が送信されなかった場合、音声認識サーバ100は、どの情報家電200に対して、認識結果情報170を送信するかを問いかける確認要求をステップS113以降で携帯通信端末10に送信してもよい。
(5.4)音声認識サーバ100の音声認識動作
図12に示すステップS121〜ステップS129は、図11におけるステップS120の音声認識動作の詳細を示す。
ステップS121において、音声認識サーバ100の通信部103は、音声情報140を受信する。
ステップS123において、音声認識サーバ100の音声認識部113は、通信部103から取得した音声情報140について、音声認識をする。
ステップS125において、音声認識サーバ100のインターネットサービス判定部119は、音声認識部113の音声認識の結果である音声変換候補144に基づいて、対応するインターネットサービスを判定する。
ステップS127において、音声認識サーバ100のURL作成部121は、音声認識部113の音声認識の結果である音声変換候補144に基づいて、対応するインターネットサービスを指定するURL115cを作成する。
ステップS129において、音声認識サーバ100の通信部103は、音声認識部113の音声認識の結果を認識結果情報170としてユーザID150に関連する情報家電200に送信する。具体的には、通信部103は、ユーザ情報記憶部105を参照して、ユーザID150に対応する情報家電識別情報160を備える情報家電200に認識結果情報170を送信する。音声認識サーバ100を利用するユーザが、複数の情報家電を用いる場合、通信部103は、携帯通信端末10から受信した情報家電識別情報160に基づいて、対応する情報家電200に認識結果情報170を送信する。
通信部103は、認識結果情報170としてURL148又は、URL115cと、処理プログラム117dの組み合わせからなる情報を情報家電200に送信する。なお、通信部103は、音声認識部113が音声認識をしたことを確認することにより、認識結果情報170を情報家電識別情報160に関連する情報家電200に送信してもよい。
(5.5)情報家電200のWebページ取得動作
図12に示すステップS131〜ステップS137は、図11におけるステップS130のWebページの取得動作の詳細を示す。
ステップS131において、情報家電200のデータ取得部213は、認識結果情報170を通信部203から取得する。具体的には、データ取得部213は、認識結果情報170として、URL148又は、URL115cと、処理プログラム117dの組み合わせからなる情報を取得する。
ステップS133において、情報家電200の通信部203は、URL148に基づいて、該当するWebサーバ500に対して、Webページの送信要求を送信する。
ステップS135において、情報家電200の通信部203は、URL148に記載されたWebページをWebサーバ500から受信する。
ステップS137において、表示部211は、通信部203から取得したWebページ510を情報家電200のディスプレイ等を介して、表示する。
(6)作用・効果
以上説明したように、第1実施形態によれば、情報家電システム1は、携帯通信端末10と、音声認識サーバ100と、情報家電200とを備える。
ここで、携帯通信端末10は、音声を入力する音声入力部13と、音声認識サーバ100を利用するユーザを識別するユーザ識別情報及び音声入力部13により入力された音声情報140を送信する通信部17とを備える。
また、音声認識サーバ100は、情報家電200から受信した音声について、音声認識をする音声認識部113と、ユーザ識別情報であるユーザID150に関連する情報家電200に音声認識の結果である認識結果情報170を送信する通信部103とを備える。
このため、情報家電200は、通信ネットワーク50を介して音声認識サーバ100に接続し、Webブラウザ210さえ備えていれば、キーボード等を接続して、操作性を解消することや、情報家電に制御プログラムをインストールし、外部に設置したパソコン等を用いて制御されていなくてもよい。
従って、特別な制御プログラムのインストールなど、ユーザに負担を強いて利便性を低下させることなく、操作性を向上させた情報家電システム1を提供できる。
また、情報家電200は、Webブラウザ210さえ備えていれば、それ以上の新たな構成を付与する必要がないため、情報家電200を製造する家電メーカの協力が無くとも情報家電システム1を利用可能とすることができる。
実施形態では、音声認識サーバ100のユーザ情報記憶部105は、認識結果情報170を受信する情報家電200を識別する情報家電識別情報160をユーザ識別情報に対応させて記憶する。また、通信部103は、音声認識部113が音声認識をしたことを確認し、認識結果情報170を情報家電識別情報160に関連する情報家電200に送信する。
このため、通信部103は、音声認識部113が音声認識をした後、適宜、認識結果情報170を情報家電200に送信する。従って、情報家電200は、認識結果情報170をタイムリーに受信することができる。
実施形態では、音声認識サーバ100は、インターネットサービス115aと、インターネットサービス115aに関連するサービス関連単語117bとを記憶するインターネットサービス記憶部115と、音声認識部113の音声認識の結果である音声変換候補144と、インターネットサービス記憶部115に基づいて、対応するインターネットサービス115aを判定するインターネットサービス判定部119とを更に備える。
このため、音声認識サーバ100は、音声認識部113の音声認識の結果を情報家電200に送信するだけでなく、対応するインターネットサービス115aを情報家電200に送信することができる。従って、情報家電システム1は、ユーザにより入力された音声に基づいて、音声認識の結果を出力する、いわゆる音声認識システムとして機能するだけでなく、ユーザの欲する最適なインターネットサービス115aを出力することができる。
実施形態では、音声認識サーバ100は、音声認識部113の音声認識の結果である音声変換候補144に基づいて、対応するインターネットサービス115aを指定するURL115cを作成するURL作成部121を更に備える。また、通信部103は、URL115cを認識結果情報170として送信する。
従って、情報家電システム1は、ユーザにより入力された音声に基づいて、音声認識の結果を出力する、いわゆる音声認識システムとして機能するだけでなく、ユーザの欲するインターネットサービス115aを提供するURL115cを出力することができる。これによれば、ユーザは、音声さえ入力すれば、URL115cを選択するだけで、ユーザの欲するインターネットサービス115aを提供するWebページへアクセスすることができる。
更に、実施形態では、URL作成部121は、インターネットサービス記憶部115に記憶されるサービス関連単語117bと、音声認識部113の音声認識の結果である音声変換候補144とに基づいて、インターネットサービス115aを判定し、URL148を作成する。
すなわち、URL作成部121は、インターネットサービス115aを判定するだけでなく、音声認識部113の音声認識の結果である音声変換候補144に基づいたURL148を作成する。従って、情報家電システム1は、ユーザにより入力された音声に基づいて、音声認識の結果を出力する、いわゆる音声認識システムとして機能するだけでなく、ユーザの欲する項目を考慮したWebページを提供するURL148を出力することができる。例えば、ユーザは、「六本木から新宿まで」と音声入力すれば、URL148に基づいた六本木から新宿までの経路を示したWebページへアクセスすることができる。
実施形態では、携帯通信端末10の通信部17は、情報家電200を識別する情報家電識別情報160を更に送信する。また、音声認識サーバ100のユーザ情報記憶部105は、ユーザ識別情報に対応する複数の情報家電識別情報160を記憶する。このため、音声認識サーバ100の通信部103は、携帯通信端末10の通信部17により送信された情報家電識別情報160に基づいて、情報を情報家電識別情報160に関連する情報家電200に送信する。従って、情報家電システム1は、音声認識サーバ100のユーザ情報記憶部105が、ユーザ識別情報に対応する複数の情報家電識別情報160を記憶する場合においても、該当する情報家電200に認識結果情報170を送信することができる。
[第2実施形態]
以下の第2実施形態においては、第1実施形態と異なる点を主に説明し、重複する説明を省略する。
上述した第1実施形態では、図3に示すように、音声認識サーバ100は、制御部101、通信部103、ユーザ情報記憶部105、認証部107、音響モデル記憶部109、言語モデル記憶部111、音声認識部113、インターネットサービス記憶部115、関連単語記憶部117、インターネットサービス判定部119、URL作成部121、認識結果記憶部123を備える。
これに対して、第2実施形態では、図13に示すように、音声認識サーバ100aは、制御部101、通信部103、ユーザ情報記憶部105、認証部107、音響モデル記憶部109、言語モデル記憶部111、音声認識部113、認識結果記憶部123を備える。すなわち、音声認識サーバ100aは、第1実施形態に記載のインターネットサービス記憶部115、関連単語記憶部117、インターネットサービス判定部119、URL作成部121を備えない点で、音声認識サーバ100と異なる。
また、第2実施形態では、スクリプト実行部215が実行するWebページを構成するHTMLに埋め込まれたJavaScript等のプログラム、または、Webページと共に取得したJavaScript等のプログラム(以下、プログラムと示す)が、第1実施形態に記載のプログラムと異なる。具体的には、第2実施形態では、上述したプログラムが、第1実施形態に記載のインターネットサービス記憶部115、関連単語記憶部117、インターネットサービス判定部119、URL作成部121の機能を備える。
すなわち、第2実施形態では、スクリプト実行部215が実行するプログラムが、インターネットサービス115a、条件115b、URL115c等を記憶する。また、上述したプログラムは、音声認識部113の音声認識の結果である音声変換候補144に基づいて、対応するインターネットサービスを判定する機能を備える。また、プログラムは、インターネットサービスを判定し、URL115cを作成する機能を備える。
このようなプログラムは、Webページ510を送信するWebサーバ500から送信され、Webページ510向けの機能を備えていればよい。例えば、Webページ510が、地図を提供するページである場合、プログラムは、音声変換候補144に「地図」、「県」、「府」「市」等の地図に関連するサービス関連単語が含まれているか、否かに基づいて、判定をする機能を備えていればよい。
なお、プログラムは、第1実施形態に記載のインターネットサービス記憶部115、関連単語記憶部117に相当する機能を備えていなくてもよい。この場合、Webページ510を送信するWebサーバ500が、インターネットサービス記憶部115、関連単語記憶部117に相当する機能を備えることにより、プログラムは、適宜Webサーバ500に問い合わせを行うことにより、インターネットサービス等の判定を実行できる。
[その他の実施形態]
上述した第1実施形態では、音声認識サーバ100は、音声情報140について、音声認識を行い、音声認識が終了後、適時、認識結果情報170を情報家電200に送信する。すなわち、音声認識サーバ100は、処理が終了後適宜、次の処理を進めるいわゆるプッシュ型の配信を行うコンピュータである。本発明は、これに限られず、例えば、音声認識サーバ100は、音声情報140について、音声認識を行い、音声認識が終了後、情報家電200の要求に応じて、認識結果情報170を情報家電200に送信する。すなわち、情報家電200が、音声認識サーバ100に対して、情報家電200に送信すべき情報の有無を確認する、いわゆるポーリング型の配信を行うコンピュータであってもよい。
この場合、情報家電200のWebブラウザ210は、所定のタイミングで、ユーザ識別情報に関連するWebブラウザ210に対する認識結果情報170の有無を確認する確認要求を音声認識サーバ100に送信する確認要求送信手段を更に備える。また、音声認識サーバ100の通信部103は、確認要求に基づいて、確認要求を送信した情報家電200に認識結果情報170を送信する。
このような情報家電200によれば、例えば、情報家電200のセキュリティー仕様などにより、プッシュ型の配信を受け付けない場合においても、情報家電200の確認要求送信手段が、所定のタイミングで、確認要求を音声認識サーバ100に送信することにより、音声認識サーバ100と、情報家電200との通信を可能にすることができる。このようなポーリング型の配信は、情報家電200のWebブラウザ210に実装されるJavaScriptにより、実現できる。
上述した第1実施形態では、URL作成部121は、音声認識部113の音声認識の結果である音声変換候補144に基づいて、対応するインターネットサービス115aを指定するURL115cを作成する。本発明は、これに限定されず、URL作成部121は、音声認識部113の音声認識の結果である音声変換候補144を用いてインターネット検索を行い、音声変換候補144に対応するWebページの属性に基づいて、インターネットサービス115aを指定するURL148を作成してもよい。具体的には、URL作成部121は、Webページの特徴語をTF/IDF等の技術により抽出して、サービスと特徴語とを関連づけたテーブルを参照することにより、インターネットサービス115aを指定するURL148を作成してもよい。
このようなURL作成部121によれば、リアルタイムで、音声変換候補144に基づく、最適のインターネットサービス115aを提供するWebページを検索することができる。
上述した第1実施形態では、音声認識サーバ100を利用するユーザを識別するユーザ識別情報として、ユーザID150を用いている。本発明は、これに限られず、ユーザを識別するユーザ識別情報としてとして、ユーザ情報、端末の識別情報等を用いてもよい。ユーザ情報は、ユーザの氏名、居住地等の個人に関連する情報である。端末の識別情報は、端末固有の情報であり、端末を所有するユーザを特定できる。
これらのユーザ識別情報は、携帯通信端末10と、音声認識サーバ100との間で暗号化されて送受信されてもよい。また、携帯通信端末10及び音声認識サーバ100が、ユーザID、ユーザ情報、端末の識別情報等の少なくとも何れかに基づく情報をそれぞれ記憶し、共有してもよい。この場合、ユーザ識別情報は、携帯通信端末10及び音声認識サーバ100でそれぞれ記憶し、共有した情報であり、ユーザID、ユーザ情報、端末の識別情報等の少なくとも何れかに基づく情報であればよい。
上述した第1実施形態では、通信部103は、「出発地」が「六本木」であることに対応したURLと、「目的地」が、「新宿」であることに対応したURLと、URL115cとを合わせたURL148を認識結果情報170として、情報家電200に送信している。本発明は、これに限定されず、通信部103は、音声認識部113の音声認識の結果である音声変換候補144を認識結果情報170として、情報家電200に送信してもよい。また、通信部103は、音声変換候補144に含まれる「から」を「出発地」、「まで」を「目的地」に変換し、更に「経路探索」を検索候補とした標準クエリ146を認識結果情報170として、情報家電200に送信してもよい。
上述した第1実施形態では、音声認識の結果を情報家電200で表示しているが、本発明はこれに限定されず、認識結果を携帯通信端末10に送信して、携帯通信端末10で表示してもよい。
上述した第1実施形態では、携帯通信端末10、音声認識サーバ100、情報家電200が備える各ブロックについて記載しているが、本発明はこれに限られず、例えば、上記の各ブロックの機能を実行するコンピュータプログラムとしてもよく、また、このコンピュータプログラムを配信する情報処理装置であってもよい。また、上述したように、情報を取得する情報取得方法であってもよい。
上述した第1実施形態では、本発明の情報家電200は、いわゆる家電が有するハードウェア資源に加えて、ディスプレイ上のWebブラウザ210を用いて、インターネットを利用することができる情報家電である。しかしながら、情報家電200は、前述の通りWebブラウザ210を備えていればよく、パソコンであってもよい。この場合、情報家電システム1によれば、キーボードを用いなくてもよいため、キーボード入力に不慣れなユーザ、キーボードによる入力に不自由なユーザに特に有効である。
上述した第1実施形態では、ステップS100において、携帯通信端末10及び情報家電200が、音声認識サーバ100にログインしてから音声認識を行っている。本発明は、これに限定されず、例えば、ステップS113において、携帯通信端末10の通信部17は、音声情報140と共に、ユーザID150を音声認識サーバ100に送信することにより、携帯通信端末10は、ステップS120の音声認識と同時に音声認識サーバ100にログインしてもよい。また、情報家電200は、ステップS120の音声認識の段階で、音声認識サーバ100にログインしていなくてもよく、代わりに携帯通信端末10が、認識結果情報170を送信すべく情報家電200を識別する情報家電識別情報160を音声認識サーバ100に送信していればよい。これによれば、情報家電200は、ステップS120の音声認識の段階で、音声認識サーバ100にログインしていなくても、認識結果情報170を受信した際に、音声認識サーバ100にログインすることで、情報家電システム1は、動作する。
このように、本発明は、ここでは記載していない様々な実施の形態などを含むことは勿論である。したがって、本発明の技術的範囲は、上述の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
例えば、各構成図、フローチャート、概念図の図などは例示に過ぎず、各要素の有無、その順序や具体的内容などは適宜変更可能である。一例として、手動によるブロックの指定は必須ではなく、また、本発明において、各手段などの要素は、コンピュータの演算制御部に限らず、ワイヤードロジック等に基づく電子回路で実現してもよい。
1 情報家電システム
10 携帯通信端末
11 制御部
13 音声入力部
15 テキスト情報入力部
17 通信部
19 記憶部
30 クライアント端末
50 通信ネットワーク
100 音声認識サーバ
101 制御部
103 通信部
105 ユーザ情報記憶部
107 認証部
109 音響モデル記憶部
111 言語モデル記憶部
113 音声認識部
115 インターネットサービス記憶部
115a インターネットサービス
115b 条件
117 関連単語記憶部
117b サービス関連単語
117c 該当項目
117d 処理プログラム
119 インターネットサービス判定部
121 URL作成部
123 認識結果記憶部
140 音声情報
142 発音記号
144 音声変換候補
146 標準クエリ
150 ユーザID
160 情報家電識別情報
170 認識結果情報
200 情報家電
201 制御部
203 通信部
205 入力部
207 情報記憶部
210 ブラウザ
211 表示部
213 データ取得部
215 スクリプト実行部
500 Webサーバ
510 Webページ

Claims (7)

  1. クライアント端末と、ネットワークを介して前記クライアント端末に接続する音声認識サーバと、Webブラウザを有しネットワークを介して前記音声認識サーバに接続する情報家電とを備える情報家電システムであって、
    前記クライアント端末は、
    音声を入力する音声入力手段と、前記音声認識サーバを利用するユーザを識別するユーザ識別情報及び前記音声入力手段により入力された音声を送信する音声送信手段とを備え、
    前記音声認識サーバは、
    前記音声を受信する音声受信手段と、
    前記音声受信手段から取得した音声について、音声認識をする音声認識手段と、
    前記音声認識手段の音声認識の結果を認識結果情報として前記ユーザ識別情報に関連する情報家電に送信する認識結果送信手段と、
    前記音声受信手段が音声を受信するに先立ち、前記情報家電によって送信された前記ユーザ識別情報と、該ユーザ識別情報に対応し、前記認識結果情報を受信する該情報家電を識別する情報家電識別情報とを記憶する記憶手段を備え、
    前記認識結果送信手段は、前記音声認識手段が音声認識をしたことを確認し、前記認識結果情報を、前記記憶手段が記憶している対応関係に基づいて、前記ユーザ識別情報に関連する情報家電に送信し、
    前記情報家電の前記Webブラウザは、
    前記認識結果情報を取得するデータ取得手段と、
    所定のタイミングで、前記ユーザ識別情報に関連する前記情報家電に対する前記認識結果情報の有無を確認する確認要求を前記音声認識サーバに送信する確認要求送信手段を備え、
    前記認識結果送信手段は、前記確認要求に基づいて、前記確認要求を送信した情報家電に前記認識結果情報を送信する
    ことを特徴とする情報家電システム。
  2. 前記音声認識サーバは、
    インターネットサービスと、前記インターネットサービスに関連するサービス関連単語とを記憶するインターネットサービス記憶部と、
    前記音声認識手段の音声認識の結果と、前記インターネットサービス記憶部のサービス関連単語とに基づいて、対応するインターネットサービスを判定するインターネットサービス判定手段とを更に備えることを特徴とする請求項1に記載の情報家電システム。
  3. 前記音声認識サーバは、
    前記音声認識手段の音声認識の結果に基づいて、対応するインターネットサービスを指定するURLを作成するURL作成手段を更に備え、
    前記認識結果送信手段は、前記URLを認識結果情報として送信することを特徴とする請求項1に記載の情報家電システム。
  4. 前記URL作成手段は、
    前記音声認識手段の音声認識の結果を用いてインターネット検索を行い、前記音声認識手段の音声認識の結果に対応するWebページの属性に基づいて、前記インターネットサービスを指定する前記URLを作成することを特徴とする請求項3に記載の情報家電システム。
  5. 前記音声認識サーバは、
    インターネットサービスと、前記インターネットサービスに関連するサービス関連単語とを記憶するインターネットサービス記憶部を更に備え、
    前記URL作成手段は、
    前記インターネットサービス記憶部に記憶されるサービス関連単語と、前記音声認識手段の音声認識の結果とに基づいて、前記インターネットサービスを判定し、前記URLを作成することを特徴とする請求項3又は4に記載の情報家電システム。
  6. クライアント端末と、ネットワークを介して前記クライアント端末に接続する音声認識サーバと、Webブラウザを有し、ネットワークを介して前記音声認識サーバに接続する情報家電とを備える情報家電システムの情報取得方法であって、
    前記情報家電が、情報家電識別情報と、音声認識サーバを利用するユーザを識別するユーザ識別情報を前記音声認識サーバに送信するステップと、
    前記クライアント端末が、音声を入力するステップと、
    前記クライアント端末が、前記ユーザ識別情報及び前記音声を送信するステップと、
    前記音声認識サーバが、前記音声を受信するステップと、
    前記音声認識サーバが、該音声について、音声認識をするステップと、
    前記音声認識サーバが、前記音声認識の結果を認識結果情報として前記ユーザ識別情報に関連する情報家電に送信するステップと、
    前記情報家電の前記Webブラウザが、前記認識結果情報を取得するステップと、
    前記情報家電の前記Webブラウザが、所定のタイミングで、前記ユーザ識別情報に関連する前記情報家電に対する前記認識結果情報の有無を確認する確認要求を前記音声認識サーバに送信するステップを備え、
    前記認識結果情報を送信するステップは、前記確認要求に基づいて、前記確認要求を送信した情報家電に前記認識結果情報を送信する
    ことを特徴とする情報家電システムの情報取得方法。
  7. クライアント端末と、ネットワークを介して前記クライアント端末に接続する音声認識サーバと、Webブラウザを有し、ネットワークを介して前記音声認識サーバに接続する情報家電とを備える情報家電システムに情報を取得させるプログラムであって、
    前記情報家電、情報家電識別情報と、音声認識サーバを利用するユーザを識別するユーザ識別情報を前記音声認識サーバに送信するステップと、
    前記クライアント端末に、音声を入力するステップと、
    前記クライアント端末に、ユーザ識別情報及び前記音声を送信するステップと、
    前記音声認識サーバに、前記音声を受信するステップと、
    前記音声認識サーバに、該音声について、音声認識をするステップと、
    前記音声認識サーバに、前記音声認識の結果を認識結果情報として前記ユーザ識別情報に関連する情報家電に送信するステップと、
    前記情報家電の前記Webブラウザに、前記認識結果情報を取得するステップと、
    前記情報家電の前記Webブラウザに、所定のタイミングで、前記ユーザ識別情報に関連する前記情報家電に対する前記認識結果情報の有無を確認する確認要求を前記音声認識サーバに送信するステップを実行させ、
    前記認識結果情報を送信するステップは、前記確認要求に基づいて、前記確認要求を送信した情報家電に前記認識結果情報を送信する
    ことを特徴とするプログラム。
JP2010179095A 2010-08-10 2010-08-10 情報家電システム、情報取得方法及びプログラム Active JP5351855B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010179095A JP5351855B2 (ja) 2010-08-10 2010-08-10 情報家電システム、情報取得方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010179095A JP5351855B2 (ja) 2010-08-10 2010-08-10 情報家電システム、情報取得方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012037783A JP2012037783A (ja) 2012-02-23
JP5351855B2 true JP5351855B2 (ja) 2013-11-27

Family

ID=45849817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010179095A Active JP5351855B2 (ja) 2010-08-10 2010-08-10 情報家電システム、情報取得方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5351855B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10694777B2 (en) 2015-03-31 2020-06-30 Kt & G Corporation Method and apparatus for manufacturing flavor capsule of tobacco

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6068901B2 (ja) * 2012-09-26 2017-01-25 京セラ株式会社 情報端末、音声操作プログラムおよび音声操作方法
JP6059253B2 (ja) * 2012-12-28 2017-01-11 株式会社レイトロン 音声認識デバイス
JP6338494B2 (ja) 2013-11-28 2018-06-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 制御方法、プログラム、プログラムの提供方法、通信端末、及び、制御システム
JP6710037B2 (ja) 2015-10-23 2020-06-17 シャープ株式会社 通信装置
JP6928842B2 (ja) * 2018-02-14 2021-09-01 パナソニックIpマネジメント株式会社 制御情報取得システム、及び、制御情報取得方法
JP6959205B2 (ja) * 2018-09-19 2021-11-02 Kddi株式会社 情報処理システム及び情報処理方法
JP7180330B2 (ja) * 2018-11-30 2022-11-30 株式会社リコー 情報処理システム、情報処理装置、および方法
JP2020119425A (ja) * 2019-01-28 2020-08-06 シャープ株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP2020136920A (ja) * 2019-02-20 2020-08-31 パナソニックIpマネジメント株式会社 音声制御システム及び音声制御方法
JP7379139B2 (ja) * 2019-12-20 2023-11-14 東芝ライフスタイル株式会社 情報処理システム、家電機器、およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3519712B2 (ja) * 2001-10-05 2004-04-19 エヌ・ティ・ティ・コムウェア株式会社 電気機器遠隔制御システム、その方法、そのプログラム及びそのプログラムが記録された記録媒体
JP2006203900A (ja) * 2002-07-16 2006-08-03 Advanced Media Inc 音声認識サーバ及び音声認識システム
JP4157418B2 (ja) * 2003-05-02 2008-10-01 日本放送協会 データ閲覧支援装置、データ閲覧方法及びデータ閲覧プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10694777B2 (en) 2015-03-31 2020-06-30 Kt & G Corporation Method and apparatus for manufacturing flavor capsule of tobacco
US11957164B2 (en) 2015-03-31 2024-04-16 Kt&G Corporation Nozzle for manufacturing flavor capsule of tobacco

Also Published As

Publication number Publication date
JP2012037783A (ja) 2012-02-23

Similar Documents

Publication Publication Date Title
JP5351855B2 (ja) 情報家電システム、情報取得方法及びプログラム
JP6440513B2 (ja) 音声認識機能を用いた情報提供方法および機器の制御方法
CN100586075C (zh) 一种家庭网络设备的控制方法及设备管理装置
KR101777392B1 (ko) 중앙 서버 및 이에 의한 사용자 음성 처리 방법
WO2016094303A1 (en) Accessing messaging applications in search
US20160255186A1 (en) Method for communication between users and smart appliances
EP2605170A2 (en) Computer apparatus and method for operating application
US9418539B2 (en) Remote control apparatus and electronic device remotely controlled by the same
CN103384244A (zh) 针对网络浏览器配置键盘的方法和装置
JP5327838B2 (ja) 音声入力分散処理方法及び音声入力分散処理システム
JP2007251630A (ja) リモートデスクトップ表示方法
JP2007299375A (ja) モバイル電子機器の適応型テキスト入力モード、電子機器、プログラム、および記録媒体
JP4754432B2 (ja) 遠隔操作システム、通信端末、サーバ装置、およびコンピュータプログラム
JP5696749B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
TWI641969B (zh) 電子裝置與其操作方法以及伺服器主機
JP2019056913A (ja) 音声認識機能を用いた情報提供方法および機器の制御方法
JP2021513103A (ja) オーディオ情報の処理方法、装置、記憶媒体並びに電子装置
TW201926314A (zh) 外部控制裝置、聲音對話型控制系統、控制方法、記錄介質及程式產品
JP5014373B2 (ja) Webページへの入力方法、Webサーバ及びWebシステム
US20170186426A1 (en) System and method for predictive device control
WO2004013761A1 (ja) 多言語対応システム
KR20050086185A (ko) 가전기기 네트워크 시스템 및 그 동작방법
KR101054669B1 (ko) 웹 환경의 이벤트 핸들링을 위한 리모콘 지원 시스템 및 방법
KR20090002226A (ko) 범위 지정 정보 검색 방법 및 장치
KR20090093370A (ko) 온라인 서비스를 위한 사용자 표시 명칭의 등록 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120913

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121220

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130104

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20130308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130823

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5351855

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250