JP2005309630A

JP2005309630A - Ｗｅｂを利用した音声認識によるコミュニケーションシステム

Info

Publication number: JP2005309630A
Application number: JP2004123643A
Authority: JP
Inventors: Yasuhiro Shioda; 塩田恭裕
Original assignee: Hitachi Hybrid Network Co Ltd
Current assignee: Hitachi Information Technology Co Ltd
Priority date: 2004-04-20
Filing date: 2004-04-20
Publication date: 2005-11-04

Abstract

【課題】ユーザ側で予めソフトウェアを用意することなく、且つ検索目的が具体的でなくとも適切な情報を的確に導きだすこと。
【解決手段】ユーザ端末が接続されているＷｅｂを利用した音声認識によるコミュニケーションシステムであって、サーバが、接続されているユーザ端末から入力した音声データを解析してユーザの意図を示す入力内容を特定し、該入力内容に対応するキーワードを選択する入力解析部２１と、重み付け値を含む複数のキーワードを格納するキーワードＤＢ２４と、該キーワードＤＢ２４に格納したキーワードに重み付け値を加算又は減算するキーワード編集部２２と、キーワードに対応する複数の情報を格納する情報データＤＢ２５と、前記選択されたキーワードを基にキーワードＤＢ２４に格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して前記情報ＤＢ２５を検索する検索部２３とを備える。
【選択図】図１

Description

本発明は、インターネット等の通信回線網を介するＷｅｂを利用した音声認識によるコミュニケーションシステムに係り、特にユーザ端末が接続されているサーバを利用し、ユーザと自然言語により対話を行うＷｅｂを利用した音声コミュニケーションシステムに関するものである。

近年においてはインターネット通信網の普及によって一般のユーザが該通信網を介して各種データベースにアクセスし、必要な情報を検索することが行われている。この検索手法としては、一般にはユーザが必要とする情報を検索するためのキーワードを検索エンジンと呼ばれる検索Ｗｅｂ（ウェブ）に入力し、該検索Ｗｅｂが論理条件と共に指定されたキーワードと一致するサイト等をユーザに提示ことが行われている。

また前記検索手法としては、ユーザ側で音声入力をテキストデータ等に変換して検索を指示するソフトウェアを用意し、このソフトウェアを用いてＷｅｂ上で情報検索を行うものが知られている。

尚、情報の検索を行う技術が記載された文献としては、下記特許文献が挙げられ、この文献には、検索を行う際にユーザの条件指定が漠然としている場合、システムからデータベースに含まれる例をユーザに紹介して対話の主導を行う自然言語システムが記載されている。この文献記載の方式は、ユーザのあいまいな検索条件より推測される候補例や肯定・否定を表わす制御表現、若しくはこれらの組み合わせ表現により対話を進行させ、ユーザの望む検索結果を検出しているものである。
特開平１１−１４９４８２号公報

前述の従来技術による検索手法は、ユーザが検索対象となるデータベースの特性や、検索エンジンの特性を充分に理解してキーワードの設定を行うことができれば、比較的ノイズの少ない情報の候補をリストとして得ることが可能であるが、ユーザが前記検索対象となるデータベースの特性等を理解していない場合は、有効な情報を検索することが困難であると言う不具合があった。

これを具体的に説明すると、例えば特許庁の特許電子図書館の特実公報テキスト検索の場合、データベースの特性としては、検索対象のなるデータ範囲が例えば「要約書」と「特許請求の範囲」に限られる事、所謂シソーラス辞書等は搭載しておらず、同一語でなければ検索対象と成らない事が挙げられ、例えば実施形態にしか記載されない様なキーワードを設定しても検索ができない事、類似語も考慮しなければならない事をユーザが知らなければ有効な検索ができないと言う不具合があった。

特に近年においては、音声を用いて前述のデータベースの検索を行うものが提案されているが、この従来技術はユーザ側で予め音声データを識別してキーワードを選定する機能やこの選定したキーワードを用いて何等かの検索エンジンに検索を促す機能を備えるソフトウェアを用意する必要があると言う不具合があった。

尚、前記特許公報記載の技術は、ユーザとのやり取りで得られたユーザの趣味嗜好情報を学習することが記載されているが、具体的にどのような学習を行うかは開示されていないものである。また前記文献記載技術は、ユーザが他人の意見を参考に検索を行いたい場合、例えば「今話題の店」や「彼女が気に入りそうなプレゼント」といった、売れ筋情報や具体的な提案を望むような情報を必要としている場合、更新されているユーザの趣味嗜好情報のみでは、対話の主導を取ることができなくなり、ユーザが意図する結果を得るためには多くの対話が必要となると言う不具合があった。

本発明の目的は、前記従来技術による不具合を除去することであり、ユーザ側で予めソフトウェアを用意することなく、且つユーザの検索目的がユーザの趣味嗜好によらずに具体的な提案を求める場合や検索を行う場合であっても対話の中で適切な情報を的確に導きだすことができるＷｅｂを利用した音声コミュニケーションシステムを提供することにある。

前記目的を達成するため本発明は、通信回線網を介して接続された、１以上のユーザ端末が接続されている１以上のサーバを備えるＷｅｂを利用した音声認識によるコミュニケーションシステムにおいて、前記サーバが、該サーバに接続されている前記ユーザ端末からの音声データを通信回線網を介して入力し、該入力した音声データを解析して、ユーザの意図を示す入力内容を特定し、該特定した入力内容に対応するキーワードを選択する解析手段と、重み付け値を含む複数のキーワードを格納するキーワードデータベースと、該キーワードデータベースに格納したキーワードに重み付け値を加算又は減算するキーワード編集手段と、複数のキーワードに対応する複数の情報を格納する情報データベースと、該前記解析手段により選択されたキーワードを基に、前記キーワードデータベースに格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して前記情報データベースを検索する検索手段と、該検索手段より検索された情報を基にユーザに提示するメッセージを作成するメッセージ作成手段と、該メッセージ作成により作成されたメッセージをユーザに出力する出力手段とを備えたことを第１の特徴とする。

更に本発明は、前記Ｗｅｂを利用した音声認識による音声コミュニケーションシステムにおいて、前記キーワードデータベースが、ユーザが入力した音声データから抽出したキーワードに対する質問文を格納し、前記解析部が、ユーザが入力した音声データに対して前記キーワードデータベースに格納した質問文をユーザに提示し、ユーザからの承認または許否によってキーワードを選定することを第２の特徴とする。

前記本発明によるＷｅｂを利用した音声認識による音声コミュニケーションシステムは、サーバが、ユーザが入力した音声データを基に該音声データから質問文をキーワードデータベースから検索してユーザに提示し、該質問文に対する承諾又は許否を基にして追加のキーワードを選定し、この選定されたキーワードを基に情報データベースの検索を行うことにより、ユーザが意図した内容の情報検索を容易に行うことができ、更に検索対象となったキーワードに対して重み付け値を付加し、データベース検索部が選定されたキーワードに重み付けを行って情報データベースから検索を行う又は検索した情報のリスト表示の際に重み付け値の大きい情報順にソートして表示することにより、ユーザ側で予めソフトウェアを用意することなく、且つユーザの検索目的がユーザの趣味嗜好によらずに具体的な提案を求める場合や検索を行う場合であっても対話の中で適切な情報を的確に導きだすことができる。

以下、本発明によるＷｅｂを利用した音声コミュニケーションシステムの一実施形態を図面を参照して詳細に説明する。図１は、本実施形態による音声コミュニケーションシステムのブロック図である。

本実施形態による音声コミュニケーションシステムの全体構成は、図１に示す如く、携帯電話１０及びユーザ端末１１と、本実施形態の特徴であるサーバ２０と、前記携帯電話１０及びユーザ端末１１とサーバ２０とを接続するインターネットの公衆通信回線網１３とから構成される。前記携帯電話１０及びユーザ端末１１は、ユーザの音声データを入力するための音声入力部と、前記サーバ２０から受信した音声データを再生出力するための音声出力部と、該サーバ２０むと各種データのやり取りを行え通信機能とを備え、例えば携帯電話や固定電話等の電話端末の他、音声通信機能を備えたパーソナルコンピュータやＩＰ電話等であってもよい。

前記サーバ２０は、前記携帯電話１０及びユーザ端末１１から公衆通信回線網１３を介して受信した自然言語による音声データを解析して、ユーザの意図を示す入力内容を特定し、該特定した入力内容に対応するキーワードを選択する入力解析部２１と、後述する各キーワードに対応した重み付け値を含む複数のキーワードを格納するキーワードデータベース２４と、該キーワードデータベース２４に格納したキーワードに重み付け値を加算又は減算するキーワード編集部２２と、複数のキーワードに対応する複数の情報を格納する情報データベース２５と、前記入力解析部２１により選択されたキーワードを基に、前記キーワードデータベース２４に格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して情報データベース２５を検索するデータベース検索部２３と、該データベース検索部２３より検索された情報を基にユーザに提示するメッセージを作成し、テキストデータ又は音声データとして出力する検索情報編集部（メッセージ作成手段）２６と、この作成されたメッセージをユーザに公衆通信回線網１３を介して出力する出力部２７とを備える。

前記キーワードデータベース２４は、後述するキーワードに対する質問項目や類語のキーワードを格納すると共に、キーワード毎に後述の重み付け値が付加されているものである。また情報データベース２５は、各種情報を文字情報及び画像情報として格納し、個々の情報に予め登録されたキーワード又は前記情報に含まれる任意の文字列をキーワードが検索キーとして設定されている。

前記入力解析部２１は、ユーザからの音声データの解析及び会話によってユーザの意図を示す入力内容の特定機能及び該特定した入力内容に対応するキーワードの選択機能を備える。これら機能は、例えばユーザからの問いかけが「彼女と、今話題のレストランに行きたい。彼女は、夜景が綺麗な店が好き」の場合、次のような会話処理等を行う。

(1)前記音声データから「彼女」「話題」「レストラン」「夜景」の自然語を抽出する。
(2)前記自然語の組合せによってユーザが意図する入力内容が「夜景が綺麗且つ食事ができるデートに好適なレストラン」の検索であることを認識する。
(3)この認識結果に応じて、例えば「夜景」「食事」「レストラン」「デート」のキーワ
ードを初期選定する。

(4)当該初期選定キーワードを基に、ユーザに対する質問項目をキーワードデータベース２４を参照して検索する。例えば、予めキーワードデータベース２４に、「夜景」に対する質問項目として「海辺／海岸を希望か？」「都会の夜景か？」を登録しておき、「夜景」に対する「海辺／海岸を希望か？」「都会の夜景か？」の質問項目を検索する。

(5)前記質問項目に対するユーザの承認／許否に応じて、新たなキーワードを設定する。例えば前記「夜景」に対して「都会の夜景か？」が承諾された場合は、「都会」「高層ビル」「東京タワー」等のキーワードを前記特定キーワードに追加する。同様に、例えば「食事」に対して「フランス料理」「イタリア料理」「和食」「中華」等の料理種を提示し、ユーザにより承諾されたキーワードを前記特定キーワードに追加する。これら入力音声データの入力内容の解析は、前述のユーザとの会話による肯定表現／否定表現／意味表現を抽出してそれらの意味表現を分析することにより、ユーザの入力内容（意図）を分析して得られるものであって、これら分析手法は、例えば、第１階述語論理を用いる方法（「自然言語理解」＜田中、辻井共編、知識工学講座第８巻、オーム社、１９８８＞ｐｐ．１０２−１０４）や格文法を用いる方法（同ｐｐ．１０４−１０９）などの公知の手法を用いてもよく、また意味表現をキーワード化してその意味表現とその意味表現が意図する内容との照合ができるようにデータベースに格納し、抽出された意味表現との照合を行うことにより入力意図の分析を行ってもよい。

(6)前記会話を継続することによって、入力解析部２１は、ユーザが意図した入力内容に対応した好適な特定キーワードを用いて、後述するデータベース検索部２３に情報データベース２５の検索を指示する。具体的に説明すると入力解析部２１は、前記ユーザとの会話によって、キーワードとして「夜景」「食事」「レストラン」「デート」「都会」「高層ビル」「イタリア料理」「ワイン」が選定され、この選定されたキーワードを基にデータベース検索部２３に情報データベース２５の検索を指示する。

前記キーワード編集部２２は、前記入力解析部２１が選定したキーワードをキーワードデータベース２４から検索する際、検索対象となったキーワードに重み付け値と呼ばれる数値を加算し、該キーワードと当該キーワード対応の重み付け値をデータベース検索部２３に送信する。前記重み付け値は、初期値が「０」であり、前述したユーザとの対話により承認されるたびに「１」を加算し、ユーザとの対話により許否された際に「１」を減算する様に編集されるものである。例えば、料理の選択において「イタリア料理」の情報が承諾されたときに、キーワード「イタリア料理」に重み付け値「１」が加算され、逆に「フランス料理」が許否されたときに、キーワード「フランス料理」に重み付け値「１」が減算されるように動作するものである。このように本実施形態においては、ユーザとの対話において選定されたキーワードに重み付け値「１」を加算し、逆に許否されたキーワードに重み付け値「１」を減算することによって、ユーザの嗜好・趣味等をキーワード毎に重み付け値として登録することができる。また前記重み付け値の処理は、最終的にユーザによって選定された情報を基に加算／減算しても良い。

前記検索情報編集部２６は、前記情報データベース２５から検索した情報をユーザに送信するための音声データへの変換／画像データの縮小等の編集を行うものであり、出力部２７は前述した質問文の送信や前記検索情報編集部２６により編集された情報を公衆通信回線１３を介してユーザ側の携帯電話１０又はユーザ端末１１に送信するものである。

前述のように構成した音声コミュニケーションシステムは、サーバ２０が、通信回線網１３を介し、ユーザが最初に入力した音声データを基に該音声データから質問文をキーワードデータベース２４から検索してユーザに提示し、該質問文に対する承諾又は許否を基にして追加のキーワードを選定し、この選定されたキーワードを基に情報データベース２５の検索を行うことにより、ユーザが意図した内容の情報検索を容易に行うことができ、更に検索対象となったキーワードに対して重み付け値を付加し、データベース検索部２３が選定されたキーワードに重み付けを行って情報データベース２５から検索を行う又は検索した情報のリスト表示の際に重み付け値の大きい情報順にソートして表示することにより、ユーザ側で予めソフトウェアを用意することなく、且つユーザの検索目的がユーザの趣味嗜好によらずに具体的な提案を求める場合や検索を行う場合であっても対話の中で適切な情報を的確に導きだすことができる。

本発明の一実施形態に係る音声コミュニケーションシステムの構成例を示す図。

符号の説明

１０：携帯電話、１１：ユーザ端末、１３：公衆通信回線網、１３：公衆通信回線網、２０：サーバ、２１：入力解析部、２２：キーワード編集部、２３：データベース検索部、２４：キーワードデータベース、２５：情報データベース、２６：検索情報編集部、２７：出力部。

Claims

通信回線網を介して接続された、１以上のユーザ端末が接続されている１以上のサーバを備えるＷｅｂを利用した音声認識によるコミュニケーションシステムであって、前記サーバは、
該サーバに接続されている前記ユーザ端末からの音声データを通信回線網を介して入力し、該入力した音声データを解析して、ユーザの意図を示す入力内容を特定し、該特定した入力内容に対応するキーワードを選択する解析手段と、重み付け値を含む複数のキーワードを格納するキーワードデータベースと、該キーワードデータベースに格納したキーワードに重み付け値を加算又は減算するキーワード編集手段と、複数のキーワードに対応する複数の情報を格納する情報データベースと、該前記解析手段により選択されたキーワードを基に、前記キーワードデータベースに格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して前記情報データベースを検索する検索手段と、該検索手段より検索された情報を基にユーザに提示するメッセージを作成するメッセージ作成手段と、該メッセージ作成により作成されたメッセージをユーザに出力する出力手段とを備えたことを特徴とするＷｅｂを利用した音声認識による音声コミュニケーションシステム。
前記キーワードデータベースが、ユーザが入力した音声データから抽出したキーワードに対する質問文を格納し、前記解析部が、ユーザが入力した音声データに対して前記キーワードデータベースに格納した質問文をユーザに提示し、ユーザからの承認または許否によってキーワードを選定することを特徴とする請求項１記載のＷｅｂを利用した音声認識による音声コミュニケーションシステム。