JP2005309630A - Webを利用した音声認識によるコミュニケーションシステム - Google Patents
Webを利用した音声認識によるコミュニケーションシステム Download PDFInfo
- Publication number
- JP2005309630A JP2005309630A JP2004123643A JP2004123643A JP2005309630A JP 2005309630 A JP2005309630 A JP 2005309630A JP 2004123643 A JP2004123643 A JP 2004123643A JP 2004123643 A JP2004123643 A JP 2004123643A JP 2005309630 A JP2005309630 A JP 2005309630A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- user
- information
- database
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000004891 communication Methods 0.000 title claims abstract description 31
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 235000012054 meals Nutrition 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】 ユーザ側で予めソフトウェアを用意することなく、且つ検索目的が具体的でなくとも適切な情報を的確に導きだすこと。
【解決手段】 ユーザ端末が接続されているWebを利用した音声認識によるコミュニケーションシステムであって、サーバが、接続されているユーザ端末から入力した音声データを解析してユーザの意図を示す入力内容を特定し、該入力内容に対応するキーワードを選択する入力解析部21と、重み付け値を含む複数のキーワードを格納するキーワードDB24と、該キーワードDB24に格納したキーワードに重み付け値を加算又は減算するキーワード編集部22と、キーワードに対応する複数の情報を格納する情報データDB25と、前記選択されたキーワードを基にキーワードDB24に格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して前記情報DB25を検索する検索部23とを備える。
【選択図】 図1
【解決手段】 ユーザ端末が接続されているWebを利用した音声認識によるコミュニケーションシステムであって、サーバが、接続されているユーザ端末から入力した音声データを解析してユーザの意図を示す入力内容を特定し、該入力内容に対応するキーワードを選択する入力解析部21と、重み付け値を含む複数のキーワードを格納するキーワードDB24と、該キーワードDB24に格納したキーワードに重み付け値を加算又は減算するキーワード編集部22と、キーワードに対応する複数の情報を格納する情報データDB25と、前記選択されたキーワードを基にキーワードDB24に格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して前記情報DB25を検索する検索部23とを備える。
【選択図】 図1
Description
本発明は、インターネット等の通信回線網を介するWebを利用した音声認識によるコミュニケーションシステムに係り、特にユーザ端末が接続されているサーバを利用し、ユーザと自然言語により対話を行うWebを利用した音声コミュニケーションシステムに関するものである。
近年においてはインターネット通信網の普及によって一般のユーザが該通信網を介して各種データベースにアクセスし、必要な情報を検索することが行われている。この検索手法としては、一般にはユーザが必要とする情報を検索するためのキーワードを検索エンジンと呼ばれる検索Web(ウェブ)に入力し、該検索Webが論理条件と共に指定されたキーワードと一致するサイト等をユーザに提示ことが行われている。
また前記検索手法としては、ユーザ側で音声入力をテキストデータ等に変換して検索を指示するソフトウェアを用意し、このソフトウェアを用いてWeb上で情報検索を行うものが知られている。
尚、情報の検索を行う技術が記載された文献としては、下記特許文献が挙げられ、この文献には、検索を行う際にユーザの条件指定が漠然としている場合、システムからデータベースに含まれる例をユーザに紹介して対話の主導を行う自然言語システムが記載されている。この文献記載の方式は、ユーザのあいまいな検索条件より推測される候補例や肯定・否定を表わす制御表現、若しくはこれらの組み合わせ表現により対話を進行させ、ユーザの望む検索結果を検出しているものである。
特開平11−149482号公報
前述の従来技術による検索手法は、ユーザが検索対象となるデータベースの特性や、検索エンジンの特性を充分に理解してキーワードの設定を行うことができれば、比較的ノイズの少ない情報の候補をリストとして得ることが可能であるが、ユーザが前記検索対象となるデータベースの特性等を理解していない場合は、有効な情報を検索することが困難であると言う不具合があった。
これを具体的に説明すると、例えば特許庁の特許電子図書館の特実公報テキスト検索の場合、データベースの特性としては、検索対象のなるデータ範囲が例えば「要約書」と「特許請求の範囲」に限られる事、所謂シソーラス辞書等は搭載しておらず、同一語でなければ検索対象と成らない事が挙げられ、例えば実施形態にしか記載されない様なキーワードを設定しても検索ができない事、類似語も考慮しなければならない事をユーザが知らなければ有効な検索ができないと言う不具合があった。
特に近年においては、音声を用いて前述のデータベースの検索を行うものが提案されているが、この従来技術はユーザ側で予め音声データを識別してキーワードを選定する機能やこの選定したキーワードを用いて何等かの検索エンジンに検索を促す機能を備えるソフトウェアを用意する必要があると言う不具合があった。
尚、前記特許公報記載の技術は、ユーザとのやり取りで得られたユーザの趣味嗜好情報を学習することが記載されているが、具体的にどのような学習を行うかは開示されていないものである。また前記文献記載技術は、ユーザが他人の意見を参考に検索を行いたい場合、例えば「今話題の店」や「彼女が気に入りそうなプレゼント」といった、売れ筋情報や具体的な提案を望むような情報を必要としている場合、更新されているユーザの趣味嗜好情報のみでは、対話の主導を取ることができなくなり、ユーザが意図する結果を得るためには多くの対話が必要となると言う不具合があった。
本発明の目的は、前記従来技術による不具合を除去することであり、ユーザ側で予めソフトウェアを用意することなく、且つユーザの検索目的がユーザの趣味嗜好によらずに具体的な提案を求める場合や検索を行う場合であっても対話の中で適切な情報を的確に導きだすことができるWebを利用した音声コミュニケーションシステムを提供することにある。
前記目的を達成するため本発明は、通信回線網を介して接続された、1以上のユーザ端末が接続されている1以上のサーバを備えるWebを利用した音声認識によるコミュニケーションシステムにおいて、前記サーバが、該サーバに接続されている前記ユーザ端末からの音声データを通信回線網を介して入力し、該入力した音声データを解析して、ユーザの意図を示す入力内容を特定し、該特定した入力内容に対応するキーワードを選択する解析手段と、重み付け値を含む複数のキーワードを格納するキーワードデータベースと、該キーワードデータベースに格納したキーワードに重み付け値を加算又は減算するキーワード編集手段と、複数のキーワードに対応する複数の情報を格納する情報データベースと、該前記解析手段により選択されたキーワードを基に、前記キーワードデータベースに格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して前記情報データベースを検索する検索手段と、該検索手段より検索された情報を基にユーザに提示するメッセージを作成するメッセージ作成手段と、該メッセージ作成により作成されたメッセージをユーザに出力する出力手段とを備えたことを第1の特徴とする。
更に本発明は、前記Webを利用した音声認識による音声コミュニケーションシステムにおいて、前記キーワードデータベースが、ユーザが入力した音声データから抽出したキーワードに対する質問文を格納し、前記解析部が、ユーザが入力した音声データに対して前記キーワードデータベースに格納した質問文をユーザに提示し、ユーザからの承認または許否によってキーワードを選定することを第2の特徴とする。
前記本発明によるWebを利用した音声認識による音声コミュニケーションシステムは、サーバが、ユーザが入力した音声データを基に該音声データから質問文をキーワードデータベースから検索してユーザに提示し、該質問文に対する承諾又は許否を基にして追加のキーワードを選定し、この選定されたキーワードを基に情報データベースの検索を行うことにより、ユーザが意図した内容の情報検索を容易に行うことができ、更に検索対象となったキーワードに対して重み付け値を付加し、データベース検索部が選定されたキーワードに重み付けを行って情報データベースから検索を行う又は検索した情報のリスト表示の際に重み付け値の大きい情報順にソートして表示することにより、ユーザ側で予めソフトウェアを用意することなく、且つユーザの検索目的がユーザの趣味嗜好によらずに具体的な提案を求める場合や検索を行う場合であっても対話の中で適切な情報を的確に導きだすことができる。
以下、本発明によるWebを利用した音声コミュニケーションシステムの一実施形態を図面を参照して詳細に説明する。図1は、本実施形態による音声コミュニケーションシステムのブロック図である。
本実施形態による音声コミュニケーションシステムの全体構成は、図1に示す如く、携帯電話10及びユーザ端末11と、本実施形態の特徴であるサーバ20と、前記携帯電話10及びユーザ端末11とサーバ20とを接続するインターネットの公衆通信回線網13とから構成される。前記携帯電話10及びユーザ端末11は、ユーザの音声データを入力するための音声入力部と、前記サーバ20から受信した音声データを再生出力するための音声出力部と、該サーバ20むと各種データのやり取りを行え通信機能とを備え、例えば携帯電話や固定電話等の電話端末の他、音声通信機能を備えたパーソナルコンピュータやIP電話等であってもよい。
前記サーバ20は、前記携帯電話10及びユーザ端末11から公衆通信回線網13を介して受信した自然言語による音声データを解析して、ユーザの意図を示す入力内容を特定し、該特定した入力内容に対応するキーワードを選択する入力解析部21と、後述する各キーワードに対応した重み付け値を含む複数のキーワードを格納するキーワードデータベース24と、該キーワードデータベース24に格納したキーワードに重み付け値を加算又は減算するキーワード編集部22と、複数のキーワードに対応する複数の情報を格納する情報データベース25と、前記入力解析部21により選択されたキーワードを基に、前記キーワードデータベース24に格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して情報データベース25を検索するデータベース検索部23と、該データベース検索部23より検索された情報を基にユーザに提示するメッセージを作成し、テキストデータ又は音声データとして出力する検索情報編集部(メッセージ作成手段)26と、この作成されたメッセージをユーザに公衆通信回線網13を介して出力する出力部27とを備える。
前記キーワードデータベース24は、後述するキーワードに対する質問項目や類語のキーワードを格納すると共に、キーワード毎に後述の重み付け値が付加されているものである。また情報データベース25は、各種情報を文字情報及び画像情報として格納し、個々の情報に予め登録されたキーワード又は前記情報に含まれる任意の文字列をキーワードが検索キーとして設定されている。
前記入力解析部21は、ユーザからの音声データの解析及び会話によってユーザの意図を示す入力内容の特定機能及び該特定した入力内容に対応するキーワードの選択機能を備える。これら機能は、例えばユーザからの問いかけが「彼女と、今話題のレストランに行きたい。彼女は、夜景が綺麗な店が好き」の場合、次のような会話処理等を行う。
(1)前記音声データから「彼女」「話題」「レストラン」「夜景」の自然語を抽出する。
(2)前記自然語の組合せによってユーザが意図する入力内容が「夜景が綺麗且つ食事ができるデートに好適なレストラン」の検索であることを認識する。
(3)この認識結果に応じて、例えば「夜景」「食事」「レストラン」「デート」のキーワ
ードを初期選定する。
(2)前記自然語の組合せによってユーザが意図する入力内容が「夜景が綺麗且つ食事ができるデートに好適なレストラン」の検索であることを認識する。
(3)この認識結果に応じて、例えば「夜景」「食事」「レストラン」「デート」のキーワ
ードを初期選定する。
(4)当該初期選定キーワードを基に、ユーザに対する質問項目をキーワードデータベース24を参照して検索する。例えば、予めキーワードデータベース24に、「夜景」に対する質問項目として「海辺/海岸を希望か?」「都会の夜景か?」を登録しておき、「夜景」に対する「海辺/海岸を希望か?」「都会の夜景か?」の質問項目を検索する。
(5)前記質問項目に対するユーザの承認/許否に応じて、新たなキーワードを設定する。例えば前記「夜景」に対して「都会の夜景か?」が承諾された場合は、「都会」「高層ビル」「東京タワー」等のキーワードを前記特定キーワードに追加する。同様に、例えば「食事」に対して「フランス料理」「イタリア料理」「和食」「中華」等の料理種を提示し、ユーザにより承諾されたキーワードを前記特定キーワードに追加する。これら入力音声データの入力内容の解析は、前述のユーザとの会話による肯定表現/否定表現/意味表現を抽出してそれらの意味表現を分析することにより、ユーザの入力内容(意図)を分析して得られるものであって、これら分析手法は、例えば、第1階述語論理を用いる方法(「自然言語理解」<田中、辻井 共編、知識工学講座第8巻、オーム社、1988>pp.102−104)や格文法を用いる方法(同pp.104−109)などの公知の手法を用いてもよく、また意味表現をキーワード化してその意味表現とその意味表現が意図する内容との照合ができるようにデータベースに格納し、抽出された意味表現との照合を行うことにより入力意図の分析を行ってもよい。
(6)前記会話を継続することによって、入力解析部21は、ユーザが意図した入力内容に対応した好適な特定キーワードを用いて、後述するデータベース検索部23に情報データベース25の検索を指示する。具体的に説明すると入力解析部21は、前記ユーザとの会話によって、キーワードとして「夜景」「食事」「レストラン」「デート」「都会」「高層ビル」「イタリア料理」「ワイン」が選定され、この選定されたキーワードを基にデータベース検索部23に情報データベース25の検索を指示する。
前記キーワード編集部22は、前記入力解析部21が選定したキーワードをキーワードデータベース24から検索する際、検索対象となったキーワードに重み付け値と呼ばれる数値を加算し、該キーワードと当該キーワード対応の重み付け値をデータベース検索部23に送信する。前記重み付け値は、初期値が「0」であり、前述したユーザとの対話により承認されるたびに「1」を加算し、ユーザとの対話により許否された際に「1」を減算する様に編集されるものである。例えば、料理の選択において「イタリア料理」の情報が承諾されたときに、キーワード「イタリア料理」に重み付け値「1」が加算され、逆に「フランス料理」が許否されたときに、キーワード「フランス料理」に重み付け値「1」が減算されるように動作するものである。このように本実施形態においては、ユーザとの対話において選定されたキーワードに重み付け値「1」を加算し、逆に許否されたキーワードに重み付け値「1」を減算することによって、ユーザの嗜好・趣味等をキーワード毎に重み付け値として登録することができる。また前記重み付け値の処理は、最終的にユーザによって選定された情報を基に加算/減算しても良い。
前記検索情報編集部26は、前記情報データベース25から検索した情報をユーザに送信するための音声データへの変換/画像データの縮小等の編集を行うものであり、出力部27は前述した質問文の送信や前記検索情報編集部26により編集された情報を公衆通信回線13を介してユーザ側の携帯電話10又はユーザ端末11に送信するものである。
前述のように構成した音声コミュニケーションシステムは、サーバ20が、通信回線網13を介し、ユーザが最初に入力した音声データを基に該音声データから質問文をキーワードデータベース24から検索してユーザに提示し、該質問文に対する承諾又は許否を基にして追加のキーワードを選定し、この選定されたキーワードを基に情報データベース25の検索を行うことにより、ユーザが意図した内容の情報検索を容易に行うことができ、更に検索対象となったキーワードに対して重み付け値を付加し、データベース検索部23が選定されたキーワードに重み付けを行って情報データベース25から検索を行う又は検索した情報のリスト表示の際に重み付け値の大きい情報順にソートして表示することにより、ユーザ側で予めソフトウェアを用意することなく、且つユーザの検索目的がユーザの趣味嗜好によらずに具体的な提案を求める場合や検索を行う場合であっても対話の中で適切な情報を的確に導きだすことができる。
10:携帯電話、11:ユーザ端末、13:公衆通信回線網、13:公衆通信回線網、20:サーバ、21:入力解析部、22:キーワード編集部、23:データベース検索部、24:キーワードデータベース、25:情報データベース、26:検索情報編集部、27:出力部。
Claims (2)
- 通信回線網を介して接続された、1以上のユーザ端末が接続されている1以上のサーバを備えるWebを利用した音声認識によるコミュニケーションシステムであって、前記サーバは、
該サーバに接続されている前記ユーザ端末からの音声データを通信回線網を介して入力し、該入力した音声データを解析して、ユーザの意図を示す入力内容を特定し、該特定した入力内容に対応するキーワードを選択する解析手段と、重み付け値を含む複数のキーワードを格納するキーワードデータベースと、該キーワードデータベースに格納したキーワードに重み付け値を加算又は減算するキーワード編集手段と、複数のキーワードに対応する複数の情報を格納する情報データベースと、該前記解析手段により選択されたキーワードを基に、前記キーワードデータベースに格納されたキーワードに対応した重み付け値を得、該重み付け値により指定された優先順位によりキーワードを設定して前記情報データベースを検索する検索手段と、該検索手段より検索された情報を基にユーザに提示するメッセージを作成するメッセージ作成手段と、該メッセージ作成により作成されたメッセージをユーザに出力する出力手段とを備えたことを特徴とするWebを利用した音声認識による音声コミュニケーションシステム。 - 前記キーワードデータベースが、ユーザが入力した音声データから抽出したキーワードに対する質問文を格納し、前記解析部が、ユーザが入力した音声データに対して前記キーワードデータベースに格納した質問文をユーザに提示し、ユーザからの承認または許否によってキーワードを選定することを特徴とする請求項1記載のWebを利用した音声認識による音声コミュニケーションシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004123643A JP2005309630A (ja) | 2004-04-20 | 2004-04-20 | Webを利用した音声認識によるコミュニケーションシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004123643A JP2005309630A (ja) | 2004-04-20 | 2004-04-20 | Webを利用した音声認識によるコミュニケーションシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005309630A true JP2005309630A (ja) | 2005-11-04 |
Family
ID=35438377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004123643A Withdrawn JP2005309630A (ja) | 2004-04-20 | 2004-04-20 | Webを利用した音声認識によるコミュニケーションシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005309630A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008152417A (ja) * | 2006-12-15 | 2008-07-03 | Pioneer Electronic Corp | 情報取得装置及び情報取得プログラム |
JP2009169477A (ja) * | 2008-01-10 | 2009-07-30 | Hitachi Ltd | ヘルプデスクにおけるオペレータ業務支援システム、オペレータ業務支援方法及びプログラム |
KR101491843B1 (ko) * | 2013-11-13 | 2015-02-11 | 네이버 주식회사 | 대화 기반 검색 도우미 시스템 및 그 방법 |
CN107038080A (zh) * | 2017-03-27 | 2017-08-11 | 深圳市金立通信设备有限公司 | 一种获取目标对象的方法及终端 |
JP2020184343A (ja) * | 2020-06-12 | 2020-11-12 | 株式会社インタラクティブソリューションズ | 表示装置、表示プログラム、表示システム及び表示装置の制御方法 |
-
2004
- 2004-04-20 JP JP2004123643A patent/JP2005309630A/ja not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008152417A (ja) * | 2006-12-15 | 2008-07-03 | Pioneer Electronic Corp | 情報取得装置及び情報取得プログラム |
JP2009169477A (ja) * | 2008-01-10 | 2009-07-30 | Hitachi Ltd | ヘルプデスクにおけるオペレータ業務支援システム、オペレータ業務支援方法及びプログラム |
KR101491843B1 (ko) * | 2013-11-13 | 2015-02-11 | 네이버 주식회사 | 대화 기반 검색 도우미 시스템 및 그 방법 |
CN107038080A (zh) * | 2017-03-27 | 2017-08-11 | 深圳市金立通信设备有限公司 | 一种获取目标对象的方法及终端 |
JP2020184343A (ja) * | 2020-06-12 | 2020-11-12 | 株式会社インタラクティブソリューションズ | 表示装置、表示プログラム、表示システム及び表示装置の制御方法 |
JP7046326B2 (ja) | 2020-06-12 | 2022-04-04 | 株式会社インタラクティブソリューションズ | 表示装置、表示プログラム、表示システム及び表示装置の制御方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11755666B2 (en) | In-conversation search | |
KR101634086B1 (ko) | 감정 분석을 통한 스티커 추천 방법 및 시스템 | |
KR102369784B1 (ko) | 지능형 자동 어시스턴트 | |
KR102030078B1 (ko) | 대화형 상호작용 시스템에서 서치 입력에서의 사용자 의도를 추론하는 방법 및 이를 위한 시스템 | |
US8935163B2 (en) | Automatic conversation system and conversation scenario editing device | |
JP4654780B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
KR20230079478A (ko) | 지능형 자동화 어시스턴트 | |
CN104991943A (zh) | 音乐搜索方法及装置 | |
US20230026945A1 (en) | Virtual Conversational Agent | |
JP6994289B2 (ja) | キャラクタ属性に応じた対話シナリオを作成するプログラム、装置及び方法 | |
AU2013205571B2 (en) | Service orchestration for intelligent automated assistant | |
WO2003085550A1 (en) | Conversation control system and conversation control method | |
JP6576847B2 (ja) | 解析システム、解析方法、及び解析プログラム | |
US8914289B2 (en) | Analyzing and processing a verbal expression containing multiple goals | |
Pargellis et al. | An automatic dialogue generation platform for personalized dialogue applications | |
EP2261818A1 (en) | A method for inter-lingual electronic communication | |
JP2005309630A (ja) | Webを利用した音声認識によるコミュニケーションシステム | |
Trivedi | Fundamentals of Natural Language Processing | |
JP4279883B2 (ja) | 会話制御システム、会話制御方法、プログラム及びプログラムを記録した記録媒体 | |
KR20230163649A (ko) | 실시간 음성 상담 지원을 위한 지능형 답변 추천 시스템 및 그 방법 | |
JP6843689B2 (ja) | コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 | |
CN112017647A (zh) | 一种结合语义的语音识别方法、装置和系统 | |
JP2003173349A (ja) | 情報検索システム及び情報検索方法 | |
JP7211384B2 (ja) | 音声認識装置、個人識別方法および個人識別プログラム | |
JP3947421B2 (ja) | 会話制御システム、会話制御方法、プログラム及びプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070703 |