JP2002150039A - サービス仲介装置 - Google Patents

サービス仲介装置

Info

Publication number
JP2002150039A
JP2002150039A JP2001027637A JP2001027637A JP2002150039A JP 2002150039 A JP2002150039 A JP 2002150039A JP 2001027637 A JP2001027637 A JP 2001027637A JP 2001027637 A JP2001027637 A JP 2001027637A JP 2002150039 A JP2002150039 A JP 2002150039A
Authority
JP
Japan
Prior art keywords
service
voice
information processing
service providing
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001027637A
Other languages
English (en)
Inventor
Manabu Niie
学 新江
Makoto Shiotani
真 塩谷
Seiji Ukai
誠治 鵜飼
Toshihiro Kujirai
俊宏 鯨井
Yoshito Nene
義人 禰寝
Tadashi Kamiwaki
正 上脇
Riichiro Sasaki
利一郎 佐々木
Naoyuki Koga
尚之 古賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001027637A priority Critical patent/JP2002150039A/ja
Publication of JP2002150039A publication Critical patent/JP2002150039A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】音声による入力に対して、インターネット上の
サービス提供装置からの情報提供を含むサービス提供を
効率よく行うことを目的とする。 【解決手段】利用者からのサービス要求を示す音声を、
サービス要求装置300が受付け、受付けられた音声に
対応する音声データを、ネットワーク1を介してサービ
ス仲介装置100に送信し、サービス仲介装置100で
は利用者から入力される音声に応じて音声を認識する音
声認識エンジンを特定し、特定された音声認識エンジン
で認識された要求に従った処理をサービス提供装置のい
ずれかで行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワークを介
した情報やサービス等の提供を仲介する技術に関する。
この中でも特に、クライアント装置(サービス要求)装
置からの入力が、音声やイメージなどサーバ装置(サー
ビス提供装置)がサービス提供のための情報処理を行う
ために直接用いないデータ形式の場合の仲介処理に関す
る。また、クライアント装置は、特に車両で使用可能な
ものに関する。
【0002】
【従来の技術】音声による入力によりインターネットの
ウエブにアクセスまたはウエブ上からの情報取得の仲介
に関する技術として、特開平10−271223号公報
がある。
【0003】この従来技術では、電話・インタネットゲ
ートウエイプロセッサ44が、入力された話し言葉に応
答して、ウエブにアクセス可能とする通信リンク、デー
タフォーマット変換およびプロトコル変換を行う。
【0004】また、音声認識に関する従来技術として、
特開2000−112610号公報がある。ここでは、
音声認識および画像認識を含む複数の認識方法を取り扱
う技術が開示されている。本従来技術では、表示コンテ
ンツの記述テキストに記述された認識装置の種類を示す
「カテゴリ」に基づいた認識装置に表示コンテンツを送
っている。
【0005】
【発明が解決しようとする課題】上記の従来技術である
特開平10−271223号公報においては、複数の利
用者からの音声の全てを、電話・インタネットゲートウ
エイプロセッサ44のみで行っている。音声認識の場
合、音声認識エンジンにも認識の得手不得手がある。話
す内容(分野)に従って、認識速度、精度が大きく異な
る。特許向けの音声認識エンジンは、特許に関する音声
(話し)は認識速度も速く認識精度も高いが、料理に関
する音声については、認識速度は遅く認識精度も低くな
ることもある。
【0006】このため、色々なサービスが要求される、
つまり、さまざまな話題の音声が入力されるインターネ
ットを含むネットワーク上で、それら様様な音声の認識
を1つ装置で行う従来技術では、効率的に音声認識ひい
ては音声認識に基づくサービス提供を効率よく行うこと
はできない。
【0007】特に、車載されたサービス要求装置から要
求を出す場合は、音声入力を利用するのが望ましい。こ
れは、運転者であっても入力可能とするためである。ま
た、走行中の車両からの要求は、早急に処理する必要性
が高い。これは、利用者の位置が刻々かわるためであ
る。つまり、利用者が「近いレストランを検索」と指示
を出した場合、検索に数時間もかけていては、指示をだ
した位置からは近いかもしれないが、検索結果を受ける
位置が大きく離れ結果として適切な情報を提供できない
との問題が生じる。つまり、どの要求に対しても同じ音
声認識エンジンを用いた場合、上記の問題が生じる可能
性が高くなる。
【0008】また、特開2000−112610号公報
においては、音声コンテンツは音声認識装置に、画像デ
ータはジェスチャー認識装置に送信することができる。
しかし、音声情報をその内容に応じた音声認識エンジン
で認識させることはできない。音声認識エンジンではそ
の種類に応じて、辞書の内容等によって、認識しやすい
(認識精度の高い、認識速度が速い)音声情報、認識に
し難い(認識精度が低い、認識速度が遅い)音声情報が
ある。本従来技術では、音声コンテンツは一意に第1認
識装置(音声認識)14Aで認識されるため、音声コン
テンツに応じた認識装置での認識は不可能である。つま
り、音声認識しにくい音声コンテンツまで第1認識装置
で認識しなくてはならず、上記の従来技術と同様にどの
要求に対しても同じ音声認識エンジン(認識装置)を用
いているものにすぎない。また、本従来技術において
は、音声認識結果をサービス提供(または受領)に用い
ることは考慮されていない。このため、認識装置の特定
は記述テキストとして記述された「カテゴリ」を用いて
行われており、認識すべき音声情報とサービスの内容を
対応付けることは考慮されていない。したがって、音声
情報の内容で要求されるサービスにふさわしい音声認識
エンジンで音声認識することはできない。
【0009】
【課題を解決するための手段】上記の海内を解決するた
めに、本発明では、利用者が要求するサービス毎または
入力された音声に応じた、ネットワーク上の音声認識エ
ンジンが音声認識を実行するものである。また、本発明
は、上記の通り実行するよう制御するサービス仲介装置
を含む。
【0010】ここで、サービス毎または入力された音声
に応じた音声認識エンジンを特定するために、利用者が
要求するサービスに対応するリンク先に音声認識エンジ
ンを対応付けた情報を準備し、これを用いて行ってもよ
い。
【0011】また、本発明は、利用者からのサービス提
供に関する一連の音声認識を、ネットワーク上の複数の
コンピュータで、機能分担しておこなうものでもある。
【0012】なお、利用者からの入力は音声に限らず、
イメージなどサービス提供の情報処理に直接利用できな
いデータ形式であってもよい。
【0013】なお、本発明は、音声認識エンジンの対応
関係を拡張可能なマーク付け言語であるVXML(Voic
e XML(eXtended Markup lang
uage)を用いてもよい。
【0014】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を用いて説明する。図1は、本発明のサービス仲介シ
ステムの全体構成を示す図である。サービス仲介装置1
00、複数のサービス提供装置200A−F、複数のサ
ービス要求装置300A−Eがそれぞれネットワーク1
を介して接続されている。サービス要求装置300A−
Eが利用者からの音声入力を受付け、サービス仲介装置
が音声入力に対応する要求を、サービス提供装置200
A−Fのうち要求されたサービスに対応するものに中継
する。これにより、利用者はサービス提供装置A−Fの
いずれからサービス(情報の提供を含む)を受けること
が可能になる。
【0015】以下、この処理の詳細について、サービス
提供装置200A−Fは、レストランAが運営・管理
し、サービス要求装置300A−Eは、カーナビゲーシ
ョン装置で、レストランの検索が要求された例で説明す
る。ここで、サービス提供装置A−Fには、その他、映
画館、その他娯楽施設が運営または管理するコンピュー
タが含まれ、そのサービスにはメニュー、営業時間、上
映映画など情報の提示や予約受付け、チケットの販売な
どのサービスが含まれる。また、サービス要求装置30
0A−Eは、図示した通りカーナビゲーション装置など
の車載器の他、携帯電話、パーソナルコンピュータ等の
情報処理装置が含まれる。
【0016】以下、図5のフローチャートに従って処理
の内容を説明する。ここでは、サービス要求装置が30
0Cである場合について説明する。サービス要求装置3
00Cは車両30内の利用者からの音声をマイク304
から受付ける(ステップ501)。本実施の形態では、
利用者から「近くのレストランを知りたい」と入力があ
ったものとする。
【0017】入力された音声データを記憶装置301に
格納されたプログラムに従いインターフェース303を
用いて、ネットワーク1を経由して音声ポータルセンタ
のサービス仲介装置に送信する(ステップ502)。な
お、送信するデータは音声データそのものでもよいし、
音声認識した結果(データ形式を変更したデータ)をあ
わせて送信してもよい。また、音声データには、入力さ
れた音声そのもの、音声データの形式を音声認識に適し
た形式に符号化するなどした変換したデータなどを含
む。
【0018】サービス要求装置が、200AやBのよう
に少なくとも音声ブラウザおよび対話管理プログラム
(機能)を有する場合は、サービス要求装置自体が、利
用者の要求に対する対応を行ってもよい。但し、本実施
の形態では、サービス仲介装置100がこの処理を実行
するものとする。ここで、利用者に対する対応とは、サ
ービス要求装置内のプログラムに従って、検索の絞込み
を助ける処理を含む。例えば、「近くのレストランを知
りたい」との入力を認識し、対話管理プログラムに従い
「レストランのカテゴリは“和食”、“中華”、“フラ
ンス料理”、“イタリア料理”のいずれですか?」と問
い合わせ検索のための入力を促す処理をする。ここで、
この問合せは、音声合成プログラムに従ってスピーカ3
05から音声により行ってもよいし、表示器306に表
示してもよい。この処理は、サービス要求装置で対応可
能な入力まで行い、不可能な入力になった場合に、サー
ビス仲介装置に接続し、のちの処理をサービス提供装置
が行うようにする。これは、サービス要求装置に格納さ
れた対応不可の場合のリンク先を、サービス仲介装置と
することで実現可能である。
【0019】また、この入力の内、認識についてはサー
ビス要求装置とサービス仲介装置もしくはサービス提供
装置との両方で行ってもよい。この場合、サービス要求
装置で認識が不可になっても、サービス仲介装置もしく
はサービス提供装置にて認識を行っているため、引き続
き入力を行うことが可能である。
【0020】なお、前述の対応不可には、「今週最も人
気があったウエブサイトは何か?」との質問のように、
サービス要求装置自身がデータを持っていないものに対
する要求を含む。このデータには、認識に必要な単語や
文法を含む。
【0021】また、対応可能な場合には、サービス要求
装置を操作するためのコマンドやそれに近接する装置を
操作するためのコマンドによる要求を含む。この近接す
る装置とは、例えば、車両の場合、エアコンやワイパー
やラジオといった車載装置を含む。
【0022】サービス要求装置300A−Eは、車載さ
れるものでなくともよい。また、車載の場合は、無線で
ネットワーク1と接続する構成とするのがよい。
【0023】サービス仲介装置100が、「近くのレス
トランを知りたい」との内容を示すネットワークを介し
て送信された音声データを、インターフェース103を
用いて受信する(ステップ503)。
【0024】サービス仲介装置200は、入力された音
声データを音声認識プログラムまたは他の認識プログラ
ムを用いて、処理装置102でその内容を認識する(ス
テップ504)。ここでは、「近く」とあるので、車両
30Cの走行位置を把握する処理を行う。例えば、
(1)サービス要求装置300Cがカーナビゲーション
システムであれば、カーナビゲーションシステムの有す
る走行位置情報を取得する、(2)対話管理プログラム
を用いて、利用者に現在の位置をサービス要求装置30
0Cに入力することを促す処理する。(2)としては、
「現在位置を入力してください」と、スピーカ305に
より音声で、または表示器306に表示させることで行
う。また、「近くの」判断としては、レストランが車両
30Cから予め定めた距離内にあるかどうかで判断して
もよい。この判断では、テーブルに格納されたレストラ
ンの位置情報を用いて行う。
【0025】また、レストランは、記憶装置104に格
納されたテーブルから検索する。ここで、レストランの
分野に複数の詳細分野がある場合には、「レストランの
カテゴリは“和食”、“中華”、“フランス料理”、
“イタリア料理”のいずれですか?」と問い合わせるよ
う対話管理プログラムを設定する。詳細分野がさらに複
数の店名がある場合は、同様に店名を1つづつ、サービ
ス要求装置300Cに出力してもよい。また、店名を特
定するための条件入力を促す処理をしてもよい。例え
ば、各店名に条件(値段、営業時間、味、駐車場の有
無、大きさなど)を対応付けて記憶しておき、利用者に
条件を入力させるよう促す処理を行う。
【0026】認識された結果を用いて、サービス要求装
置300Cからの音声データを認識する音声認識エンジ
ンを特定する(ステップ505)。
【0027】ステップ505の具体例を、図6を用いて
説明する。ステップ505は、ステップ5051および
ステップ5052が対応する。
【0028】サービス仲介装置100の処理装置102
は、音声データで要求されるサービスを提供するサービ
ス提供装置であるリンク先を検索する(ステップ505
1)。この検索は、図10に示すテーブル105を用い
て行う。つまり、テーブルの選別仕様の部分を用いて検
索する。上述したレストランのカテゴリについての問合
せの回答が、イタリア料理の場合、レストランA〜Dが
検索される。さらに、サービス仲介装置100は処理装
置102を用いて、味、値段、位置などを問合せ、利用
者からの要求に対応するレストランおよびそれに対応す
るサービス提供装置を特定する。本例では、レストラン
Aを特定したものとする。そして、テーブルを用いて、
レストランAに対応するリンク先、例えばサービス提供
装置を特定する。なお、特定されるレストランおよびリ
ンク先はそれぞれ2以上であってもよい。
【0029】また、ステップ5052では、テーブルを
用いて特定されたリンク先に対応する音声認識エンジン
を特定する。なお、音声認識エンジンの特定に、音声認
識エンジンの接続するためのアドレスを含めてもよい。
また、音声認識エンジンの特定は、テーブルでリンク先
と1対1に決めるのでなく、1つのリンク先に複数の音
声認識エンジンの候補を対応付けておいてもよい。この
構成では、利用者からの絞込み指示、例えば、利用料金
の高低、翻訳の正確さ、を勘案して最終的に音声認識エ
ンジンを1つに特定してもよい。ここで、上記のテーブ
ルはネットワーク上の他の情報処理装置が有していても
よい。
【0030】また、テーブルでなく、図7に記載したV
XML言語を用いてもよい。
【0031】また、さらに図7に記載したVXML言語
の代わりに図11に記載した形式を用いてもよい。この
形式では、音声認識に使用する音声認識エンジンをng
ramやbergeinやnbestやconfide
nce等の条件によって指定する。ここで、ngram
は連続単語認識を行うことを表わし、bergeinは
音声合成中に利用者が割り込みをかけることができるこ
とを表わし、nbestは複数個の音声認識候補を出力
することを表わし、confidenceは音声認識結
果に対する信頼度を出力することを表わす。すなわち、
図11では、連続単語認識が可能で、音声合成中の割り
込みができ、複数個の音声認識候補を出力可能で、音声
認識結果に対する信頼度を出力することができる音声認
識エンジンを選択するように条件指定を行っている。
【0032】図11に記載した形式で音声認識エンジン
を指定する場合、使用する音声認識エンジンはリンク先
のサービス提供装置が持つ音声認識エンジンから検索し
てもよいし、または、今、使用しているサービス提供装
置の持つ音声認識エンジンから検索してもよい。
【0033】また、1つの音声認識エンジンを特定する
のではなく、複数の音声認識エンジンを指定し、同一音
声を複数の音声認識エンジンにて認識するようにしても
よい。この場合、最も応答の速かった認識結果を使用す
ることで、レスポンスを早くすることができ、また、複
数の認識結果の中から最も確度の高い結果を選択するこ
とで、認識の精度を上げることが可能になる。
【0034】本実施の形態では、サービス提供装置20
0Aおよびそれが有する音声認識エンジンを特定した。
【0035】リンク先および音声認識エンジンが特定さ
れたら、サービス仲介装置100が特定されたリンク先
および音声認識エンジンが、所定の処理を実行できるよ
うに制御する(ステップ506)。
【0036】このステップ506の具体例を、図6を用
いて説明する。図6のステップ5061および5062
がこれに該当する。
【0037】ステップ5061でリンク先を変更する。
例えば、リンク先のサービス提供装置Aが利用者からの
音声データを受信できるようにサービス要求装置300
Cとサービス提供装置Aの接続を設定する。
【0038】また、ステップ5062で、ステップ50
52で特定された音声認識エンジンに音声データの認識
が実行可能な状態と制御する。この際のサービス要求装
置300Cからの音声データの送信先を、サービス提供
装置200Aの音声認識エンジンとする。
【0039】なお、音声認識エンジンは、サービス提供
装置300Dのようにサービスを提供するものと別物で
あってもよい。また、音声認識専門のサービス提供装置
が音声を認識してもよい。音声認識エンジンの特定は、
テーブルでサービス提供装置を一意に決めるのでなく、
デーブルに優先順位を記述して行ってもよい。それは、
特定されたサービス提供装置に音声認識エンジンがある
場合はそれを用い、なければ特定されたサービス提供装
置に関連する分野の音声認識エンジンをネットワーク上
から検索し、それもなければサービス仲介装置100の
音声認識エンジンを用いる、としてもよい。
【0040】そして、サービス提供装置200Aの音声
認識エンジンが、サービス要求装置300Cからの要求
を認識し(ステップ507)、サービス提供装置200
Aが、認識された音声データに対応し、利用者からの要
求に応じたサービスを提供するための情報処理を実行す
る(ステップ508)。ステップ508では、利用者
が、「メニューを見たい」と入力した場合、音声認識エ
ンジンの認識結果に基づき、サービス提供装置200A
が有するメニューのデータを、サービス要求装置300
Cにネットワーク1を介して出力する。サービス要求装
置300Cでは、表示器306でメニューの画面を お
よび/またはスピーカ305からメニューを読み上げた
音声を出力する。ステップ507には、音声データの認
識を含む。また、音声データの認識は、他の装置で実行
してもよい。なお、サービス・情報の受信(ステップ5
09)は、サービス仲介装置100を介して行ってもよ
い。
【0041】なお、本実施の形態を実行するための各装
置間の通信プロトコルは、図8の表に従うようにしても
よい。この際の、システム構成の一例を図9に示す。な
お、本発明では、各装置間のデータ形式が通信する装置
に応じて異なるものとしてもよい。例えば、サービス要
求装置300Aに対してはテキスト形式、300Eに対
しては音声そのもののデータとしてもよい。これは、送
信先の機能にあわせればよい。
【0042】さらに、本実施の形態のサービス提供要求
装置には、音声合成プログラムおよび音声認識エンジン
しか記載していないが、他に利用者と対話処理するため
の対話管理プログラム、音声ブラウザの少なくとも一方
をのせてもよい。また、プログラムを乗せず、音声の入
出力機能を有するだけでもよい。また、音声を分析する
音声分析プログラムをのせてもよい。
【0043】さらに、サービス提供装置は、200Aの
形態の他に、情報・サービス提供プログラム、対話管理
プログラム、音声ブラウザのいずれかはなくともかまわ
ない。例えば、音声認識をサービスとして提供するサー
ビス提供装置200C、Dはこれらのうち、少なくとも
1つがなくともかまわない。また、音声認識エンジンを
備えていなくともかまわない。例えば、レストラン情報
を提供するサービス提供装置200Bは、音声認識エン
ジンがなくともかまわない。この場合、サービス仲介装
置100が特定した音声認識エンジンで認識された音声
データを用いて、レストラン情報を検索する。検索され
た情報を提供する。
【0044】また、サービス要求装置300A−Cにお
いては、音声認識のための辞書を、ネットワーク1を介
して音声認識に利用してもよい。この際、利用頻度を記
憶しておき、利用頻度が所定以上のものをダウンロード
またはキャッシュして用いてもよい。
【0045】音声認識に失敗した場合、自動的に人間の
オペレータに音声を接続する場合もある。図1において
サービス提供装置200Aには人間のオペレータがお
り、音声認識エンジンが音声認識に失敗した場合には、
自動的にオペレータに接続を切り替えて応答する。
【0046】図12は、音声認識に失敗した場合にオペ
レータへの接続を行う場合の処理のフローチャートを示
す。サービス提供装置200Aにおいて、要求の認識を
行い(ステップ1207)、それに失敗した場合(ステ
ップ1208N)は、サービス要求装置300Cからの
入力をオペレータへ接続し、利用者とオペレータとの対
話によって要求を入力する(ステップ1209)。要求
が確定した後は、サービスのための情報処理を行い(ス
テップ1210)、サービス・情報をサービス要求装置
300Cに返す(ステップ1211)。
【0047】また、音声認識を行っている音声を常に一
定時間記録しておき、失敗時にはその記録しておいた音
声とそれまでの音声認識結果をオペレータに提示するこ
とにしてもよい。これにより、オペレータは利用者とサ
ービス提供装置の会話を常に聞いていなくとも、それま
での会話を聞いたり、音声認識結果を参照することで内
容を素早く理解することができ、スムーズにオペレータ
へ応答切り替えを行うことが可能になる。
【0048】なお、ここではサービス提供装置にオペレ
ータがいるものとしたが、サービス仲介装置であっても
よい。
【0049】以上の通り、実施の形態を説明したが、本
発明は、レストランの検索以外のサービス提供、音声以
外の入力、車載以外のシステムも含む。音声以外の入力
としては、画像、テキストデータなどが含まれる。ま
た、車載以外のシステムでは、家庭内のコンピュータ、
モバイルコンピュータ、携帯電話などが含まれる。
【0050】サービス提供装置は200A以外の態様も
含み、その機能にあった処理を行う。例えば、音声認識
エンジンを持たないものは他の装置の音声認識エンジン
で認識された結果を用いてサービス提供のための情報処
理を実行する。また、サービス要求装置も300C以外
の態様も含み、その機能にあった処理を行う。例えば、
300Aの場合は、可能な範囲で音声認識および利用者
との対話処理を実行する。
【0051】
【発明の効果】本発明によれば、ネットワーク上でのサ
ービス要求に対する認識を早急に精度よく行うことが可
能になる。ひいては、要求に対するサービス提供を効率
よく行うことが可能になる。
【図面の簡単な説明】
【図1】本実施の形態のサービス仲介システムの全体構
成図を示す図。
【図2】本実施の形態のサービス提供装置200Aの構
成を示す図。
【図3】本実施の形態のサービス仲介装置100の構成
を示す図。
【図4】本実施の形態の車両30Cおよびそのサービス
要求装置300Cの構成を示す図。
【図5】本実施の形態のサービス仲介システムの処理の
流れを示すフローチャート。
【図6】図5におけるステップ505および506の処
理例を示すフローチャート。
【図7】VXML言語で記述したサービス提供のリンク
先と音声認識エンジンの対応関係を示す図。
【図8】各装置間の通信プロトコルを示す表。
【図9】図8に示す通信プロトコルで通信するためのシ
ステム構成図。
【図10】サービス仲介装置100がサービス仲介処理
を行うためのテーブルを示す図。
【図11】VXML言語でサービス提供のリンク先と音
声認識エンジンの対応関係を表わすことにおいて、使用
する音声認識エンジンを実行条件で指定する場合の記述
方法を示す図。
【図12】図5におけるサービス仲介システムの処理に
おいて、人間のオペレータが介在する場合の処理を示す
フローチャート。
【符号の説明】
1…ネットワーク、100A〜F…サービス提供装置、
200…サービス仲介装置、300A〜E…サービス要
求装置
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 310 G06F 17/30 310Z G10L 15/00 G10L 3/00 551A 551J (72)発明者 鵜飼 誠治 東京都千代田区神田駿河台四丁目6番地 株式会社日立製作所システム事業部内 (72)発明者 鯨井 俊宏 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 禰寝 義人 東京都品川区南大井6丁目27番18号 株式 会社日立製作所情報事業本部内 (72)発明者 上脇 正 茨城県日立市大みか町七丁目1番1号 株 式会社日立製作所日立研究所内 (72)発明者 佐々木 利一郎 茨城県日立市大みか町五丁目2番1号 株 式会社日立製作所情報制御システム事業部 内 (72)発明者 古賀 尚之 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所情報サービス事業部内 Fターム(参考) 5B075 PP07 PQ04 PQ05 5D015 KK02

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】サービスを提供するための情報処理を行う
    サービス提供装置および前記サービス提供装置に、前記
    サービスの要求を行うための情報処理を行うサービス要
    求装置とネットワークを介して接続されたサービス仲介
    装置を有するサービス提供システムにおいて、 前記サービス要求装置が、当該サービス要求装置の利用
    者が要求するサービスに関する指示を示す音声による入
    力を受付け、 前記サービス仲介装置が、前記指示に対する処理を実行
    するサービス提供装置を特定し、 前記サービス仲介装置が、前記特定されたサービス提供
    装置に応じて、前記利用者から入力される音声を認識す
    る情報処理装置を特定し、 前記特定された情報処理装置が行った音声認識に基づい
    て、前記特定されたサービス提供装置が、サービス提供
    のための情報処理を実行することを特徴とするサービス
    提供システム。
  2. 【請求項2】請求項1に記載のサービス提供システムに
    おいて、 前記サービス仲介装置は、前記サービス提供装置と前記
    音声を認識する情報処理装置の対応関係を示す情報に基
    づいて、前記情報処理装置の特定を行うことを特徴とす
    るサービス提供システム。
  3. 【請求項3】請求項2に記載のサービス提供システムに
    おいて、 前記サービス仲介装置は、前記サービス提供装置と前記
    音声を認識する情報処理装置の対応関係を示す情報を記
    憶した記憶装置を備えたことを特徴とするサービス提供
    システム。
  4. 【請求項4】請求項3に記載のサービス提供システムに
    おいて、 前記対応関係は、拡張可能なマーク付け言語であるVX
    ML言語にて記述されていることを特徴とするサービス
    提供システム。
  5. 【請求項5】請求項4記載のサービス提供システムにお
    いて、 前記VXML言語にて記述する内容は音声を認識するた
    めの実行条件を指定する内容であることを特徴とするサ
    ービス提供システム。
  6. 【請求項6】請求項1に記載のサービス提供システムに
    おいて、 前記音声を認識する情報処理装置は、前記ネットワーク
    に接続されていることを特徴とするサービス提供システ
    ム。
  7. 【請求項7】請求項1に記載のサービス提供システムに
    おいて、 前記サービス要求装置は、移動中の車両にて利用可能な
    情報処理装置であることを特徴とするサービス提供シス
    テム。
  8. 【請求項8】サービスを提供するための情報処理を行う
    サービス提供装置および前記サービス提供装置に、前記
    サービスの要求を行うための情報処理を行うサービス要
    求装置とネットワークを介して接続されたサービス仲介
    装置において、以下の構成を有する、 前記サービス要求装置が受付けた当該サービス要求装置
    の利用者が要求するサービスに関する指示を示す音声に
    よる入力を、前記ネットワークを介して受信する手段、 前記指示に対する処理を実行するサービス提供装置を特
    定する手段および、 前記特定されたサービス提供装置に応じて、前記利用者
    から入力される音声を認識する情報処理装置を特定する
    手段とを有し、 前記特定された情報処理装置が行った音声認識に基づい
    て、前記特定されたサービス提供装置が、サービス提供
    のための情報処理を実行することを特徴とするサービス
    仲介装置。
  9. 【請求項9】請求項8に記載のサービス仲介装置におい
    て、 前記情報処理装置を特定する手段は、前記サービス提供
    装置と前記音声を認識する情報処理装置の対応関係を示
    す情報に基づいて、前記情報処理装置の特定を行うこと
    を特徴とするサービス仲介装置。
  10. 【請求項10】請求項9に記載のサービス仲介装置にお
    いて、 前記サービス提供装置と前記音声を認識する情報処理装
    置の対応関係を示す情報を記憶した記憶装置をさらに有
    することを特徴とするサービス仲介装置。
  11. 【請求項11】請求項8に記載のサービス仲介装置にお
    いて、 前記対応関係は、拡張可能なマーク付け言語であるVX
    ML言語にて記述されていることを特徴とするサービス
    仲介装置。
  12. 【請求項12】12.請求項11記載のサービス仲介装置
    において、 前記VXML言語にて記述する内容は音声を認識するた
    めの実行条件を指定する内容であることを特徴とするサ
    ービス仲介装置。
  13. 【請求項13】請求項10に記載のサービス仲介装置に
    おいて、 前記音声を認識する情報処理装置と前記ネットワークを
    介して接続する手段をさらに有することを特徴とするサ
    ービス仲介装置。
  14. 【請求項14】サービスに関する仲介のための情報処理
    を実行するサービス仲介装置において、以下の構成を有
    する、 前記サービス要求装置の利用者が要求するサービスに関
    する指示を示す利用者音声情報を、受付ける受信装置、 音声情報が示す指示に対応するサービスを特定し、前記
    特定されたサービスに応じて、前記音声情報を認識する
    音声認識プログラムを特定するプログラムが格納された
    記憶装置、 前記受信装置および前記記憶装置と接続され、前記プロ
    グラムに従って、前記利用者音声情報が示す指示に対応
    するサービスを特定し、前記特定されたサービスに応じ
    て、前記利用者音声情報を認識する音声認識プログラム
    を特定する処理を実行する処理装置、および前記特定さ
    れた音声認識プログラムにより音声認識を実行する情報
    処理装置に、前記利用者音声情報を認識するための情報
    を出力する出力装置。
  15. 【請求項15】請求項14に記載のサービス仲介装置に
    おいて、 前記サービスと音声認識プログラムの対応関係を示す第
    2の記憶装置をさらに有し、 前記処理装置は、前記第2の記憶装置を用いて、音声認
    識プログラムを特定する処理を実行する。
  16. 【請求項16】請求項13に記載のサービス仲介装置に
    おいて、 前記対応関係は、拡張可能なマーク付け言語であるVX
    ML言語にて記述されていることを特徴とするサービス
    仲介装置。
  17. 【請求項17】請求項14に記載のサービス仲介装置に
    おいて、 前記音声認識エンジンを有する情報処理装置と前記ネッ
    トワークを介して接続する。
  18. 【請求項18】請求項14に記載のサービス仲介装置に
    おいて、 前記記憶装置は、音声認識プログラムを有し、前記処理
    装置は、前記記憶手段が有する音声認識プログラムを用
    いて、前記利用者音声情報を認識する。
  19. 【請求項19】請求項14に記載のサービス仲介装置に
    おいて、 前記受信装置は、サービス要求装置とネットワークを介
    して接続可能であり、前記ネットワークを介して前記サ
    ービス要求装置から、利用者音声情報を受信する。
JP2001027637A 2000-08-31 2001-02-05 サービス仲介装置 Pending JP2002150039A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001027637A JP2002150039A (ja) 2000-08-31 2001-02-05 サービス仲介装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000268371 2000-08-31
JP2000-268371 2000-08-31
JP2001027637A JP2002150039A (ja) 2000-08-31 2001-02-05 サービス仲介装置

Publications (1)

Publication Number Publication Date
JP2002150039A true JP2002150039A (ja) 2002-05-24

Family

ID=26599259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001027637A Pending JP2002150039A (ja) 2000-08-31 2001-02-05 サービス仲介装置

Country Status (1)

Country Link
JP (1) JP2002150039A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062794A (ja) * 2002-07-31 2004-02-26 P To Pa:Kk 会話制御システム、会話制御方法、プログラム
JP2005031758A (ja) * 2003-07-07 2005-02-03 Canon Inc 音声処理装置及び方法
JP2007272123A (ja) * 2006-03-31 2007-10-18 Toyota Central Res & Dev Lab Inc 音声操作システム
JP2009505139A (ja) * 2005-08-09 2009-02-05 モバイル・ヴォイス・コントロール・エルエルシー 音声制御型ワイヤレス通信デバイス・システム
JP2010130223A (ja) * 2008-11-26 2010-06-10 Fujitsu Ten Ltd 音声操作システムおよび音声操作方法
WO2013137660A1 (en) * 2012-03-16 2013-09-19 Samsung Electronics Co., Ltd. Collaborative personal assistant system for delegating provision of services by third party task providers and method therefor
JP2014056278A (ja) * 2008-07-02 2014-03-27 Google Inc 並列認識タスクを用いた音声認識
JP2014074813A (ja) * 2012-10-04 2014-04-24 Yahoo Japan Corp 広告配信装置、広告配信システム及び広告配信方法
JP2017078753A (ja) * 2015-10-19 2017-04-27 株式会社日立情報通信エンジニアリング コールセンタシステム、および、その音声認識制御方法
JP2022088626A (ja) * 2021-04-16 2022-06-14 阿波▲羅▼智▲聯▼(北京)科技有限公司 アプリケーション通信方法、アプリケーション通信装置、電子機器及び記憶媒体

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062794A (ja) * 2002-07-31 2004-02-26 P To Pa:Kk 会話制御システム、会話制御方法、プログラム
JP2005031758A (ja) * 2003-07-07 2005-02-03 Canon Inc 音声処理装置及び方法
JP2009505139A (ja) * 2005-08-09 2009-02-05 モバイル・ヴォイス・コントロール・エルエルシー 音声制御型ワイヤレス通信デバイス・システム
JP2009505140A (ja) * 2005-08-09 2009-02-05 モバイル・ヴォイス・コントロール・エルエルシー 音声制御型ワイヤレス通信デバイス・システム
JP2009505142A (ja) * 2005-08-09 2009-02-05 モバイル・ヴォイス・コントロール・エルエルシー 音声制御型ワイヤレス通信デバイス・システム
JP2007272123A (ja) * 2006-03-31 2007-10-18 Toyota Central Res & Dev Lab Inc 音声操作システム
JP2014056278A (ja) * 2008-07-02 2014-03-27 Google Inc 並列認識タスクを用いた音声認識
US9373329B2 (en) 2008-07-02 2016-06-21 Google Inc. Speech recognition with parallel recognition tasks
US10049672B2 (en) 2008-07-02 2018-08-14 Google Llc Speech recognition with parallel recognition tasks
US10699714B2 (en) 2008-07-02 2020-06-30 Google Llc Speech recognition with parallel recognition tasks
US11527248B2 (en) 2008-07-02 2022-12-13 Google Llc Speech recognition with parallel recognition tasks
JP2010130223A (ja) * 2008-11-26 2010-06-10 Fujitsu Ten Ltd 音声操作システムおよび音声操作方法
WO2013137660A1 (en) * 2012-03-16 2013-09-19 Samsung Electronics Co., Ltd. Collaborative personal assistant system for delegating provision of services by third party task providers and method therefor
JP2014074813A (ja) * 2012-10-04 2014-04-24 Yahoo Japan Corp 広告配信装置、広告配信システム及び広告配信方法
JP2017078753A (ja) * 2015-10-19 2017-04-27 株式会社日立情報通信エンジニアリング コールセンタシステム、および、その音声認識制御方法
JP2022088626A (ja) * 2021-04-16 2022-06-14 阿波▲羅▼智▲聯▼(北京)科技有限公司 アプリケーション通信方法、アプリケーション通信装置、電子機器及び記憶媒体

Similar Documents

Publication Publication Date Title
JP4439920B2 (ja) 同時マルチモーダル通信セッションパーシスタンスのためのシステムおよび方法
US10056077B2 (en) Using speech recognition results based on an unstructured language model with a music system
US6807529B2 (en) System and method for concurrent multimodal communication
US8996379B2 (en) Speech recognition text entry for software applications
US7522711B1 (en) Delivery of audio driving directions via a telephone interface
US20070043868A1 (en) System and method for searching for network-based content in a multi-modal system using spoken keywords
US20030093419A1 (en) System and method for querying information using a flexible multi-modal interface
US20120259951A1 (en) Systems and Methods for Delivering Content to Vehicles
US20100106497A1 (en) Internal and external speech recognition use with a mobile communication facility
JP2002318132A (ja) 音声対話型ナビゲーションシステムおよび移動端末装置および音声対話サーバ
US20080221902A1 (en) Mobile browser environment speech processing facility
EP1603318A2 (en) Full-featured and actionable access to directory assistence query results
CN102439661A (zh) 用于车辆内自动交互的面向服务语音识别
JP2005527020A (ja) 同時マルチモーダル・タグを使用する同時マルチモーダル通信システムおよび方法
US20060173689A1 (en) Speech information service system and terminal
JP2002150039A (ja) サービス仲介装置
JP2003167895A (ja) 情報検索システム、サーバおよび車載端末
JP7274404B2 (ja) 情報提供装置、情報提供方法、およびプログラム
EP1376418B1 (en) Service mediating apparatus
CN115240677A (zh) 用于车辆座舱的语音交互方法、装置和设备
JP7451033B2 (ja) データ処理システム
CN112995270B (zh) 智能体系统、智能体系统的控制方法及存储介质
CA2839259A1 (en) Systems and methods for delivering content to vehicles
JP2000090104A (ja) 情報検索システム
JP2017161815A (ja) 応答システムおよび応答プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041021

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070612

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080115