JP2014110005A - Information search device and information search method - Google Patents

Information search device and information search method Download PDF

Info

Publication number
JP2014110005A
JP2014110005A JP2012265504A JP2012265504A JP2014110005A JP 2014110005 A JP2014110005 A JP 2014110005A JP 2012265504 A JP2012265504 A JP 2012265504A JP 2012265504 A JP2012265504 A JP 2012265504A JP 2014110005 A JP2014110005 A JP 2014110005A
Authority
JP
Japan
Prior art keywords
keyword
information
word
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012265504A
Other languages
Japanese (ja)
Inventor
Junichiro Yamazaki
順一郎 山崎
Koji Sato
浩治 佐藤
Seiichiro Matsutani
征一郎 松谷
Makoto Sato
佐藤  誠
Kenta Kasahara
健太 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Tohoku Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Tohoku Ltd filed Critical NEC Software Tohoku Ltd
Priority to JP2012265504A priority Critical patent/JP2014110005A/en
Publication of JP2014110005A publication Critical patent/JP2014110005A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a technology for enabling a user to smoothly acquire desired information.SOLUTION: An information search device 100 includes: an utterance data acquisition part 51 for acquiring the utterance text data of a user; a specification part 52 for specifying a distribution keyword related to the utterance text data acquired by the utterance data acquisition part 51 by referring to a distribution word storage part 101 for storing each distribution keyword about each information providing part; a word data acquisition part 53 for acquiring at least one word data other than the distribution keyword specified by the specification part 52 to be obtained when the utterance text data are subjected to the decomposition of a part of speech; and an information requesting part 54 for requesting information to the information providing part corresponding to the distribution keyword specified by the specification part 52 by using at least one word data acquired by the word data acquisition part 53 as a search keyword.

Description

本発明は、情報検索技術に関する。   The present invention relates to an information retrieval technique.

現在、インターネットの普及等により、欲しい情報が必要な時に入手可能となっている。例えば、スマートフォンユーザは、スマートフォンのタッチパネルを介して、所望の情報のキーワードを入力し検索を実行することで、そのキーワードに関連する情報を即座に閲覧することができる。   Currently, due to the spread of the Internet and the like, the information you want is available when you need it. For example, a smartphone user can immediately browse information related to a keyword by inputting a keyword of desired information and executing a search via the touch panel of the smartphone.

下記特許文献1は、インターネットを利用したチャットシステムを提案している。このシステムは、ユーザ端末から取得された発言文章を形態素解析することにより、その発言文章に含まれている所定のキーワードを抽出し、当該抽出されたキーワードを利用して、当該キーワードに対応する一乃至複数の応答文が登録されている会話用DBを用いて上記ユーザ端末に送信する応答文を決定する。ユーザ端末から取得した発言文章から上記所定のキーワードを抽出できない場合には、上記システムは、キーワード検索用DBを用いてキーワードを検索し、そのキーワードを抽出できない場合にユーザ端末に送信する質問文を作成する。また、上記システムは、所定のキーワードに基づいてインターネットのWeb上から情報を収集し、収集した情報を上記会話用DB若しくはキーワード検索用DBに登録する。   The following Patent Document 1 proposes a chat system using the Internet. This system extracts a predetermined keyword included in the utterance sentence by performing morphological analysis on the utterance sentence acquired from the user terminal, and uses the extracted keyword to correspond to the keyword. A response sentence to be transmitted to the user terminal is determined using a conversation DB in which a plurality of response sentences are registered. When the predetermined keyword cannot be extracted from the remarks acquired from the user terminal, the system searches the keyword using the keyword search DB, and when the keyword cannot be extracted, the system transmits a question sentence to be transmitted to the user terminal. create. Further, the system collects information from the Web on the Internet based on a predetermined keyword, and registers the collected information in the conversation DB or the keyword search DB.

特開2004−145541号公報JP 2004-145541 A

上述の提案手法によれば、ユーザ端末において、音声入力又は文字入力により取得されたユーザの発言文章に対して、それに含まれるキーワードに関連しインターネット上から収集された情報を含む応答文が出力され得る。しかしながら、この提案手法や通常のインターネット検索では、そのキーワードに関連する多量な情報が得られ、ユーザは、その多量な情報の各々について所望の情報であるか否かを判断する必要がある。即ち、ユーザは、所望の情報を容易に入手することが出来ない場合がある。   According to the above-described proposed method, a response sentence including information collected from the Internet related to a keyword included in a user's comment sentence acquired by voice input or character input is output at the user terminal. obtain. However, in the proposed method and normal Internet search, a large amount of information related to the keyword is obtained, and the user needs to determine whether or not the large amount of information is desired information. That is, the user may not be able to easily obtain desired information.

但し、ユーザは、所望の情報を提供するサイトの存在を知っていれば、比較的容易に、その所望の情報に到達することができる。言い換えれば、ユーザは、所望の情報を提供するサイトの存在(URL(Uniform Resource Locator)等)を知っていなければ、所望の情報を容易に入手することが出来ない場合がある。   However, if the user knows the existence of a site that provides desired information, the user can reach the desired information relatively easily. In other words, if the user does not know the presence of a site that provides desired information (such as a URL (Uniform Resource Locator)), the user may not be able to easily obtain the desired information.

本発明は、このような事情に鑑みてなされたものであり、ユーザに所望の情報をスムーズに入手させることを可能とする技術を提供する。   The present invention has been made in view of such circumstances, and provides a technique that enables a user to obtain desired information smoothly.

本発明の各態様では、上述した課題を解決するために、それぞれ以下の構成を採用する。   Each aspect of the present invention employs the following configurations in order to solve the above-described problems.

第1の態様は、情報検索装置に関する。第1態様に係る情報検索装置は、ユーザの発言テキストデータを取得する発言データ取得部と、各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、発言データ取得部により取得される発言テキストデータに関連する振分けキーワードを特定する特定部と、上記発言テキストデータが品詞分解されることにより得られる、特定部により特定される振分けキーワード以外の少なくとも1つの単語データを取得する単語データ取得部と、単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、特定部により特定される振分けキーワードに対応する情報提供部に対し情報を要求する情報要求部と、を有する。   A 1st aspect is related with an information search device. The information search device according to the first aspect refers to the utterance data acquisition unit that acquires the utterance text data of the user and the utterance data acquisition unit by referring to the distribution word storage unit that stores the distribution keyword for each information providing unit. Acquiring at least one word data other than the specifying keyword specified by the specifying unit and the specifying unit for specifying the distributing keyword related to the acquired comment text data and the part of speech decomposition of the comment text data. A word data acquisition unit, and an information requesting unit that requests information from the information providing unit corresponding to the distribution keyword specified by the specifying unit using at least one word data acquired by the word data acquiring unit as a search keyword; Have.

第2の態様は、情報検索方法に関する。第2態様に係る情報検索方法は、少なくとも1つのコンピュータが、ユーザの発言テキストデータを取得し、各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、発言テキストデータに関連する振分けキーワードを特定し、上記発言テキストデータが品詞分解されることにより得られる、上記特定された振分けキーワード以外の少なくとも1つの単語データを取得し、取得された少なくとも1つの単語データを検索キーワードとして用いて、上記特定された振分けキーワードに対応する情報提供部に対し情報を要求する、ことを含む。   The second aspect relates to an information search method. In the information search method according to the second aspect, at least one computer obtains the remark text data by acquiring the remark text data of the user and referring to the redistribution word storage unit that stores the redistribution keyword for each information providing unit. A related distribution keyword is specified, and at least one word data other than the specified distribution keyword obtained by decomposing part of speech text data is acquired, and the acquired at least one word data is used as a search keyword. And requesting information from the information providing unit corresponding to the specified sorting keyword.

なお、本発明の他の態様としては、上記第1の態様の構成を少なくとも1つのコンピュータに実現させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。   Another aspect of the present invention may be a program that causes at least one computer to implement the configuration of the first aspect, or a computer-readable recording medium that records such a program. May be. This recording medium includes a non-transitory tangible medium.

上記各態様によれば、ユーザに所望の情報をスムーズに入手させることを可能とする技術を提供することができる。   According to each of the above aspects, it is possible to provide a technique that enables a user to obtain desired information smoothly.

本発明の実施の形態に係る情報検索装置の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the information search device which concerns on embodiment of this invention. 第1実施形態における音声対話サーバ装置の構成例を示す概念図である。It is a conceptual diagram which shows the structural example of the speech dialogue server apparatus in 1st Embodiment. 第1実施形態における音声対話サーバ装置及びクライアント装置の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the speech dialogue server apparatus in 1st Embodiment, and a client apparatus. 固定ワードテーブルの例を示す図である。It is a figure which shows the example of a fixed word table. 連想ワードテーブルの例を示す図である。It is a figure which shows the example of an associative word table. 類義ワードテーブルの例を示す図である。It is a figure which shows the example of a similar word table. 第1実施形態における音声対話サーバ装置の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the speech dialogue server apparatus in 1st Embodiment. 図7に示される固定キーワードの特定(S72)の詳細を示すフローチャートである。It is a flowchart which shows the detail of identification (S72) of the fixed keyword shown by FIG. 図7に示される連想キーワードの特定(S74)の詳細を示すフローチャートである。It is a flowchart which shows the detail of identification (S74) of the associative keyword shown by FIG. 図7に示される学習ワードテーブルを用いた類義キーワードの特定(S76)の詳細を示すフローチャートである。It is a flowchart which shows the detail of specification (S76) of the similar keyword using the learning word table shown by FIG. 図7に示される類義ワードテーブルを用いた類義キーワードの特定(S78)の詳細を示すフローチャートである。It is a flowchart which shows the detail of specification (S78) of the synonymous keyword using the synonymous word table shown by FIG. 第2実施形態における音声対話サーバ装置及びクライアント装置の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the speech dialogue server apparatus in 2nd Embodiment, and a client apparatus. 第2実施形態における対話サーバ1の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the dialogue server 1 in 2nd Embodiment.

以下、本発明の実施の形態について説明する。なお、以下に挙げる実施形態は例示であり、本発明は以下の実施形態の構成に限定されない。   Embodiments of the present invention will be described below. In addition, embodiment mentioned below is an illustration and this invention is not limited to the structure of the following embodiment.

図1は、本発明の実施の形態に係る情報検索装置100の処理構成例を概念的に示す図である。図1に示されるように、情報検索装置100は、ユーザの発言テキストデータを取得する発言データ取得部51と、各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部101を参照することにより、発言データ取得部51により取得される発言テキストデータに関連する振分けキーワードを特定する特定部52と、上記発言テキストデータが品詞分解されることにより得られる、特定部52により特定される振分けキーワード以外の少なくとも1つの単語データを取得する単語データ取得部53と、単語データ取得部53により取得される少なくとも1つの単語データを検索キーワードとして用いて、特定部52により特定される振分けキーワードに対応する情報提供部に対し情報を要求する情報要求部54と、を有する。   FIG. 1 is a diagram conceptually illustrating a processing configuration example of an information search apparatus 100 according to an embodiment of the present invention. As shown in FIG. 1, the information search apparatus 100 refers to a message data acquisition unit 51 that acquires user's message text data, and a distribution word storage unit 101 that stores a distribution keyword for each information providing unit. , A specifying unit 52 for specifying a distribution keyword related to the comment text data acquired by the comment data acquisition unit 51, and a distribution keyword specified by the specifying unit 52 obtained by decomposing the comment text data Information corresponding to a sorting keyword specified by the specifying unit 52 using at least one word data acquired by the word data acquiring unit 53 as a search keyword An information requesting unit 54 that requests information from the providing unit; A.

情報検索装置100は、例えば、後述する詳細実施形態における音声対話サーバ装置1と同様のハードウェア構成を有し、その音声対話サーバ装置1と同様にプログラムが処理されることで、上述の各処理部が実現される。なお、図1の例では、情報検索装置100は、振分けワード格納部101を有していないが、振分けワード格納部101を内部に有するようにしてもよい。   The information search apparatus 100 has, for example, the same hardware configuration as that of the voice interaction server apparatus 1 in the detailed embodiment described later. Part is realized. In the example of FIG. 1, the information search apparatus 100 does not include the distribution word storage unit 101, but may include the distribution word storage unit 101 therein.

本発明の実施の形態に係る情報検索方法は、図1に示される情報検索装置100のような、少なくとも1つのコンピュータにより実行される次のような工程を含む。即ち、当該情報提供方法は、少なくとも1つのコンピュータが、ユーザの発言テキストデータを取得し、各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、発言テキストデータに関連する振分けキーワードを特定し、上記発言テキストデータが品詞分解されることにより得られる、上記特定された振分けキーワード以外の少なくとも1つの単語データを取得し、取得された少なくとも1つの単語データを検索キーワードとして用いて、上記特定された振分けキーワードに対応する情報提供部に対し情報を要求する、ことを含む。   The information search method according to the embodiment of the present invention includes the following steps executed by at least one computer, such as the information search apparatus 100 shown in FIG. That is, the information providing method relates to the comment text data by referring to the sorting word storage unit in which at least one computer acquires the user's comment text data and stores the sorting keyword for each information providing unit. The distribution keyword is specified, and at least one word data other than the specified distribution keyword obtained by decomposing the speech text data is obtained, and the acquired at least one word data is used as a search keyword. Requesting information from the information providing unit corresponding to the specified distribution keyword.

本実施形態では、ユーザの発言テキストデータが取得される。発言テキストデータは、ユーザにより発声された発言音声が録音及び音声認識されることにより得られる文章データであってもよいし、当該ユーザ又は他の者により、キーボード、タッチパネル等の入力装置を用いて入力された文章データであってもよい。   In this embodiment, the user's comment text data is acquired. The utterance text data may be sentence data obtained by recording and recognizing the utterance voice uttered by the user, or by the user or another person using an input device such as a keyboard or a touch panel. It may be input text data.

本実施形態では、振分けワード格納部に格納される振分けキーワードの中で、当該発言テキストデータに関連する振分けキーワードが特定される。振分けワード格納部では、各情報提供部に対して少なくとも1つの振分けキーワードがそれぞれ格納されている。情報提供部とは、情報提供サイトのように、情報検索装置100以外のコンピュータであってもよいし、情報検索装置100上で実現されるデータベース処理部であってもよい。   In the present embodiment, among the distribution keywords stored in the distribution word storage unit, a distribution keyword related to the comment text data is specified. In the sorting word storage unit, at least one sorting keyword is stored for each information providing unit. The information providing unit may be a computer other than the information search device 100, such as an information providing site, or may be a database processing unit realized on the information search device 100.

振分けキーワードには、対応する情報提供部により提供される情報を得るためにユーザが発する発言に含まれる可能性の高い言葉、この言葉から連想される言葉、その言葉の意義に類似する言葉などが設定される。振分けキーワードには、主に、名詞、名詞句、動詞又は動詞句が設定される。例えば、グルメ情報を提供するサイトの振分けキーワードには、「食べたい」や「飲みたい」が設定され、天気情報を提供するサイトの振分けキーワードには、「天気」や「気象」が設定され、辞書検索を提供するサイトの振分けキーワードには、「教えて」、「何」、「誰」などが設定される。   The distribution keyword includes words that are likely to be included in the utterances made by the user to obtain information provided by the corresponding information providing unit, words associated with these words, words similar to the meaning of the words, etc. Is set. As a sorting keyword, a noun, a noun phrase, a verb, or a verb phrase is mainly set. For example, “I want to eat” and “I want to drink” are set as the distribution keywords for sites that provide gourmet information, and “Weather” and “Weather” are set as distribution keywords for sites that provide weather information. “Tell me”, “What”, “Who”, etc. are set as the sorting keywords for sites that provide dictionary search.

発言テキストデータに関連するとは、その発言テキストデータから導出することができることを意味する。よって、特定される振分けキーワードは、発言テキストデータに含まれていてもよいし、その発言テキストデータから連想される言葉であってもよいし、その発言テキストデータの意義に類似する言葉であってもよい。   Being related to the comment text data means that it can be derived from the comment text data. Therefore, the specified sorting keyword may be included in the comment text data, may be a word associated with the comment text data, or is a word similar to the significance of the comment text data. Also good.

これにより、上記特定された振分けキーワードにより、その振分けキーワードに対応する情報提供部が特定され得る。更に、本実施形態では、発言テキストデータを形成する単語データの中の、上記特定された振分けキーワード以外の少なくとも1つの単語データが取得され、この単語データを検索キーワードとして用いて、上記特定された振分けキーワードに対応する情報提供部に対し情報が要求される。ここで、単語データとは、単語又は単語列を示すデータを意味する。   Thereby, the information provision part corresponding to the distribution keyword can be specified by the specified distribution keyword. Furthermore, in the present embodiment, at least one word data other than the specified sorting keyword is acquired from the word data forming the remark text data, and the above specified using the word data as a search keyword. Information is requested from the information providing unit corresponding to the distribution keyword. Here, the word data means data indicating a word or a word string.

このように、発言テキストデータに関連する振分けキーワードにより、その振分けキーワードに予め紐付けられている適切な情報提供部が選択されるため、本実施形態によれば、ユーザは、自身が欲しい情報を提供するサイトを知らなくても、そのようなサイトから情報を受けることができる。更に、発言テキストデータに含まれる単語又は単語列が検索キーワードに用いられるため、ユーザは、所望の情報を簡単に取得することができる。一般的に、ユーザが所望の情報を得るために発する発言(会話)には、その所望の情報に関連する言葉が含まれる可能性が高いからであり、そのような言葉は検索キーワードに適しているからである。   In this way, since an appropriate information providing unit linked in advance to the distribution keyword is selected by the distribution keyword related to the comment text data, according to the present embodiment, the user can select the information he / she wants. You can get information from such sites without knowing the sites they offer. Furthermore, since a word or a word string included in the remark text data is used as a search keyword, the user can easily obtain desired information. This is because a speech (conversation) that a user utters to obtain desired information generally includes a word related to the desired information, and such a word is suitable for a search keyword. Because.

以下、上述の実施形態について更に詳細を説明する。以下には、詳細実施形態として、第1実施形態及び第2実施形態を例示する。以下の各詳細実施形態は、上述の情報検索装置100及び情報検索方法をクラウド型の音声対話サーバ装置に適用した場合の例である。但し、上述の情報検索装置100及び情報検索方法は、音声データを扱う音声対話システムへの適用に限定されるものではなく、入力される各種形態のデータに基づいて情報検索を行う様々な形態に適用可能である。   Hereinafter, the details of the above-described embodiment will be described. Below, 1st Embodiment and 2nd Embodiment are illustrated as detailed embodiment. Each of the following detailed embodiments is an example when the above-described information search device 100 and the information search method are applied to a cloud type voice interaction server device. However, the information search apparatus 100 and the information search method described above are not limited to application to a voice dialogue system that handles voice data, but can be variously searched for information based on various types of input data. Applicable.

[第1実施形態]
〔装置構成〕
図2は、第1実施形態における音声対話サーバ装置(以降、単に、対話サーバと表記する)1の構成例を示す概念図である。対話サーバ1は、通信網3を介して、ユーザが利用するクライアント装置2、及び、情報提供サイト5に通信可能に接続される。通信網3は、インターネット等のような公衆網、WAN(Wide Area Network)、LAN(Local Area Network)、無線通信ネットワーク等である。なお、本実施形態において、対話サーバ1、クライアント装置2及び情報提供サイト5の間の通信形態は限定されない。
[First Embodiment]
〔Device configuration〕
FIG. 2 is a conceptual diagram illustrating a configuration example of the voice conversation server device (hereinafter simply referred to as a conversation server) 1 in the first embodiment. The dialogue server 1 is communicably connected to the client device 2 used by the user and the information providing site 5 via the communication network 3. The communication network 3 is a public network such as the Internet, a WAN (Wide Area Network), a LAN (Local Area Network), a wireless communication network, or the like. In the present embodiment, the communication mode among the dialogue server 1, the client device 2, and the information providing site 5 is not limited.

情報提供サイト5は、一般的なコンピュータであり、WEBサーバ、データベースサーバ等のような各種情報を提供するサーバ装置である。本実施形態は、情報提供サイト5のハードウェア構成及びソフトウェア構成を制限しない。情報提供サイト5は、上述の実施形態における情報提供部に相当する。   The information providing site 5 is a general computer, and is a server device that provides various types of information such as a WEB server and a database server. The present embodiment does not limit the hardware configuration and software configuration of the information providing site 5. The information providing site 5 corresponds to the information providing unit in the above-described embodiment.

対話サーバ1は、クライアント装置2からユーザの発言テキストデータを取得し、この発言テキストデータに基づいて情報提供サイト5を検索することにより、その検索結果をクライアント装置2へ提供する。   The dialogue server 1 obtains the user's comment text data from the client device 2 and searches the information providing site 5 based on the comment text data to provide the search result to the client device 2.

対話サーバ1は、図2に示されるように、ハードウェア構成として、相互にバス15により接続される、CPU(Central Processing Unit)10、メモリ11、入出力インタフェース(I/F)12、通信装置13等を有する。メモリ11は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク、可搬型記憶媒体等である。入出力I/F12は、キーボード、マウス等のようなユーザ操作の入力を受け付ける装置、表示装置やプリンタ等のようなユーザに情報を提供する装置などと接続される。通信装置13は、通信網3を介して、他のノードと通信を行う。なお、対話サーバ1のハードウェア構成は制限されない。なお、上述の情報検索装置100は、このような対話サーバ1と同様のハードウェア構成を有してもよい。この場合、上述の情報検索装置100の各処理部は、例えば、CPU10によりメモリ11に格納されるプログラムが実行されることにより実現される。   As shown in FIG. 2, the dialogue server 1 includes a CPU (Central Processing Unit) 10, a memory 11, an input / output interface (I / F) 12, and a communication device that are mutually connected via a bus 15 as a hardware configuration. 13 etc. The memory 11 is a random access memory (RAM), a read only memory (ROM), a hard disk, a portable storage medium, or the like. The input / output I / F 12 is connected to a device that accepts an input of a user operation such as a keyboard and a mouse, and a device that provides information to the user such as a display device and a printer. The communication device 13 communicates with other nodes via the communication network 3. Note that the hardware configuration of the dialog server 1 is not limited. Note that the information search apparatus 100 described above may have a hardware configuration similar to that of the dialog server 1. In this case, each processing unit of the information search apparatus 100 described above is realized by, for example, the CPU 10 executing a program stored in the memory 11.

クライアント装置2は、PC(Personal Computer)、タブレット端末、スマートフォン、携帯電話等のような一般的なユーザ端末である。以降、クライアント装置2は、単に、クライアント2と表記する。クライアント2は、図2に示されるように、相互にバス15により接続される、CPU10、メモリ11、入出力I/F12、通信装置13等を有する。入出力I/F12は、キーボード、マウス等のようなユーザ操作の入力を受け付ける入力装置(図示せず)、ユーザの発言音声を取得するマイク(図示せず)、音声を出力するスピーカ(図示せず)、ディスプレイ装置やプリンタ等のようなユーザに情報を提供する出力装置(図示せず)などと接続される。なお、クライアント2のハードウェア構成は制限されない。   The client device 2 is a general user terminal such as a PC (Personal Computer), a tablet terminal, a smartphone, a mobile phone, or the like. Hereinafter, the client device 2 is simply referred to as a client 2. As shown in FIG. 2, the client 2 includes a CPU 10, a memory 11, an input / output I / F 12, a communication device 13, and the like that are connected to each other via a bus 15. The input / output I / F 12 includes an input device (not shown) that receives input of a user operation such as a keyboard and a mouse, a microphone (not shown) that acquires a user's speech, and a speaker (not shown) that outputs the voice. And an output device (not shown) for providing information to the user such as a display device or a printer. Note that the hardware configuration of the client 2 is not limited.

〔処理構成〕
図3は、第1実施形態における対話サーバ1及びクライアント2の処理構成例を概念的に示す図である。図3において、図1に示される情報検索装置100の処理部と同じ処理部には、図1と同じ符号が付されている。
[Processing configuration]
FIG. 3 is a diagram conceptually illustrating a processing configuration example of the dialogue server 1 and the client 2 in the first embodiment. 3, the same processing units as those of the information search apparatus 100 shown in FIG.

〈クライアント装置〉
クライアント2は、音声認識部21、音声合成部22等を有する。これら各処理部は、例えば、CPU10によりメモリ11に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD(Compact Disc)、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F12又は通信装置13を介してインストールされ、メモリ11に格納されてもよい。
<Client device>
The client 2 includes a voice recognition unit 21, a voice synthesis unit 22, and the like. Each of these processing units is realized, for example, by executing a program stored in the memory 11 by the CPU 10. In addition, the program is installed from a portable recording medium such as a CD (Compact Disc) or a memory card or another computer on the network via the input / output I / F 12 or the communication device 13 and is stored in the memory 11. It may be stored.

音声認識部21は、マイクを介して入力されかつ録音されたユーザの発言音声に対して音声認識処理を実行することにより、その発言音声に対応する発言テキストデータを生成する。発言テキストデータは、その出力元となるユーザの識別情報(ユーザIDと表記)と共に、対話サーバ1へ送られる。発言テキストデータとは、ユーザにより発された声がテキスト化された文字データである。なお、本実施形態では、この音声認識処理には、周知な手法が利用されればよく、その音声認識処理自体及びその音声認識処理で利用される各種音声認識パラメータを制限しない。   The speech recognition unit 21 generates speech text data corresponding to the speech by executing speech recognition processing on the speech of the user input and recorded through the microphone. The utterance text data is sent to the dialogue server 1 together with the identification information (noted as user ID) of the user as the output source. The comment text data is character data in which a voice uttered by the user is converted into text. In the present embodiment, a known technique may be used for the voice recognition process, and the voice recognition process itself and various voice recognition parameters used in the voice recognition process are not limited.

音声合成部22は、対話サーバ1から送られる検索結果データを音声合成処理することにより、その検索結果データの音声をスピーカを介して出力する。スピーカから出力される音声は、例えば、その検索結果データに含まれる情報を読み上げる音声である。なお、本実施形態では、この音声合成処理には、周知な手法が利用されればよく、その音声合成処理自体は制限されない。   The voice synthesizer 22 performs voice synthesis processing on the search result data sent from the dialogue server 1 and outputs the voice of the search result data via a speaker. The sound output from the speaker is, for example, a sound that reads out information included in the search result data. In the present embodiment, a known method may be used for the speech synthesis process, and the speech synthesis process itself is not limited.

〈音声対話サーバ装置〉
対話サーバ1は、図3に示されるように、WEBサーバ処理部30、対話制御エンジン31、振分けワードDB(DataBase)41、ユーザ学習DB(DataBase)42等を有する。これら各処理部は、例えば、CPU10によりメモリ11に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F12又は通信装置13を介してインストールされ、メモリ11に格納されてもよい。
<Voice dialogue server device>
As shown in FIG. 3, the dialogue server 1 includes a WEB server processing unit 30, a dialogue control engine 31, a sorting word DB (DataBase) 41, a user learning DB (DataBase) 42, and the like. Each of these processing units is realized, for example, by executing a program stored in the memory 11 by the CPU 10. The program may be installed from a portable recording medium such as a CD or a memory card or another computer on the network via the input / output I / F 12 or the communication device 13 and stored in the memory 11. Good.

WEBサーバ処理部30は、一般的なWEBサーバ機能を実現する。例えば、WEBサーバ処理部30は、クライアント装置2と音声対話サーバ装置1との間の双方向通信や、WEBサーバ上でのサーブレットの実行等を可能とする。本実施形態は、このWEBサーバ処理部30を制限しない。   The WEB server processing unit 30 realizes a general WEB server function. For example, the WEB server processing unit 30 enables bidirectional communication between the client device 2 and the voice interaction server device 1, execution of a servlet on the WEB server, and the like. The present embodiment does not limit the WEB server processing unit 30.

振分けワードDB41及びユーザ学習DB42は、情報要求先となる情報提供サイト5と振分けキーワードとの対応関係を予め格納する。1つの情報提供サイト5には、少なくとも1つの振分けキーワードが対応付けられる。振分けワードDB41及びユーザ学習DB42は、関係データベースであってもよいし、JSON(JavaScript(登録商標) Object Notation)やXML(Extensible Markup Language)等のような所定の記述言語で記載されたファイルであってもよい。なお、振分けワードDB41は、上述の振分けワード格納部101に相当する。   The distribution word DB 41 and the user learning DB 42 store in advance the correspondence between the information providing site 5 that is the information request destination and the distribution keyword. One information providing site 5 is associated with at least one sorting keyword. The distribution word DB 41 and the user learning DB 42 may be a relational database or a file described in a predetermined description language such as JSON (JavaScript (registered trademark) Object Notation) or XML (Extensible Markup Language). May be. The sort word DB 41 corresponds to the sort word storage unit 101 described above.

上記振分けキーワードには、固定キーワード、連想キーワード、類義キーワードが含まれる。固定キーワードとは、対応する情報提供サイト5により提供される情報を得るためにユーザが発する発言に含まれる可能性の高い言葉であり、固定文字列である。連想キーワードとは、その固定キーワードの連想語である。類義キーワードとは、その固定キーワードの類義語である。振分けワードDB41は、これら各種振分けキーワードをそれぞれ格納する、固定ワードテーブル、連想ワードテーブル、類義ワードテーブル等を含む。   The distribution keywords include fixed keywords, associative keywords, and similar keywords. The fixed keyword is a word that has a high possibility of being included in the utterance made by the user in order to obtain information provided by the corresponding information providing site 5, and is a fixed character string. An association keyword is an association word of the fixed keyword. A synonymous keyword is a synonym for the fixed keyword. The distribution word DB 41 includes a fixed word table, an associative word table, a synonym word table, and the like that store these various distribution keywords.

図4は、固定ワードテーブルの例を示す図である。固定ワードテーブルには、図4に示されるように、固定キーワード、情報提供サイト情報及び検索キーワードの条件情報の対応関係が格納される。情報提供サイト情報には、情報提供サイト5を特定可能な情報、例えば、URL(Uniform Resource Locator)が設定される。検索キーワードの条件情報には、その情報提供サイトに対する情報要求において検索キーワードが利用されるか否か、利用される場合にはその検索キーワードの条件が設定される。検索キーワードの条件には、図4に示されるように、発言テキストデータに含まれている単語のうち、検索キーワードとして使われる単語の情報が設定される。図4の例によれば、天気サイトについては、「天気」、「気象」、「天気情報」、「天気予報」、「気象予報」及び「気象情報」が固定キーワードとして設定され、「日付」及び「地名」に相当する単語の情報が検索キーワードとして設定されている。   FIG. 4 is a diagram illustrating an example of a fixed word table. As shown in FIG. 4, the fixed word table stores correspondence relationships between fixed keywords, information providing site information, and search keyword condition information. Information that can identify the information providing site 5, for example, a URL (Uniform Resource Locator) is set in the information providing site information. In the search keyword condition information, whether or not the search keyword is used in an information request to the information providing site, and if used, the search keyword condition is set. In the search keyword condition, as shown in FIG. 4, information on a word used as a search keyword among words included in the comment text data is set. According to the example of FIG. 4, for the weather site, “weather”, “weather”, “weather information”, “weather forecast”, “weather forecast” and “weather information” are set as fixed keywords, and “date” And information of words corresponding to “place names” is set as a search keyword.

図5は、連想ワードテーブルの例を示す図である。連想ワードテーブルには、図5に示されるように、連想キーワードと情報提供サイト情報との対応関係が格納される。図5の例によれば、天気サイトについては、「気温」、「予報」、「気象」が連想キーワードとして設定されている。   FIG. 5 is a diagram illustrating an example of an associative word table. In the associative word table, as shown in FIG. 5, the correspondence relationship between associative keywords and information providing site information is stored. According to the example of FIG. 5, “temperature”, “forecast”, and “weather” are set as associated keywords for the weather site.

図6は、類義ワードテーブルの例を示す図である。類義ワードテーブルには、図6に示されるように、類義キーワードと情報提供サイト情報との対応関係が格納される。図6の例によれば、天気サイトについては、「空模様」、「天候」、「陽気」、「晴れ」、「気候」、「気圧配置」が類義キーワードとして設定されている。   FIG. 6 is a diagram illustrating an example of a similar word table. In the synonym word table, as shown in FIG. 6, the correspondence between synonymous keywords and information providing site information is stored. According to the example of FIG. 6, for the weather site, “sky”, “weather”, “cheerful”, “sunny”, “climate”, and “atmospheric pressure arrangement” are set as similar keywords.

ユーザ学習DB42は、ユーザ毎に、類義キーワードを用いた情報要求先決定結果が反映される学習ワードテーブルを含む。これにより、ユーザ学習DB42は、学習ワード格納部と呼ぶこともできる。学習ワードテーブルは、ユーザ毎に別々に設けられてもよいし、内部でユーザ毎の情報を区分けして格納するようにしてもよい。学習ワードテーブルは、発言データ取得部51により発言テキストデータと共に取得されるユーザIDにより特定可能となっている。学習ワードテーブルは、情報要求先の決定に寄与した類義キーワードと、その類義キーワードで決定された情報提供サイト情報との対応関係を格納する。   The user learning DB 42 includes a learning word table in which an information request destination determination result using a similar keyword is reflected for each user. Thereby, user learning DB42 can also be called a learning word storage part. The learning word table may be provided separately for each user, or information for each user may be stored separately. The learning word table can be specified by the user ID acquired together with the message text data by the message data acquisition unit 51. The learning word table stores a correspondence relationship between the synonymous keywords contributing to the determination of the information request destination and the information providing site information determined by the synonymous keywords.

対話制御エンジン31は、クライアント装置2からユーザの発言テキストデータを取得し、この発言テキストデータに基づいて適切な情報提供サイト5を選択し、その情報提供サイト5に対して情報を要求し、その結果を取得する。対話制御エンジン31は、図3に示されるように、発言データ取得部51、特定部52、単語データ取得部53、情報要求部54、抽出部35、連想単語取得部36、類義語取得部37、学習処理部38等を有する。これら各処理部は、同様に、例えば、CPU10によりメモリ11に格納されるプログラムが実行されることにより実現される。以下、発言データ取得部51、特定部52、単語データ取得部53及び情報要求部54については、上述の情報検索装置と異なる内容を中心に説明し、同じ内容については適宜省略する。   The dialogue control engine 31 acquires the user's comment text data from the client device 2, selects an appropriate information providing site 5 based on the comment text data, requests information from the information providing site 5, Get the result. As shown in FIG. 3, the dialogue control engine 31 includes a utterance data acquisition unit 51, a specification unit 52, a word data acquisition unit 53, an information request unit 54, an extraction unit 35, an associative word acquisition unit 36, a synonym acquisition unit 37, A learning processing unit 38 and the like are included. Similarly, each of these processing units is realized, for example, by executing a program stored in the memory 11 by the CPU 10. Hereinafter, the remark data acquisition unit 51, the identification unit 52, the word data acquisition unit 53, and the information request unit 54 will be described with a focus on content different from the information search device described above, and the same content will be appropriately omitted.

発言データ取得部51は、クライアント装置2から送られるユーザの発言テキストデータ及びユーザIDをWEBサーバ処理部30を介して取得する。   The utterance data acquisition unit 51 acquires the user's utterance text data and user ID sent from the client device 2 via the WEB server processing unit 30.

特定部52は、発言データ取得部51により取得された発言テキストデータに基づいて、振分けワードDB41又はユーザ学習DB42において、情報要求先となる情報提供サイト5に紐付く振分けキーワードを特定する。特定部52は、振分けキーワードの特定において、固定キーワード、連想キーワード、類義キーワードの順に段階的に特定する。具体的には、特定部52は、固定キーワードの特定に失敗したら、連想キーワードの特定を試み、連想キーワードの特定にも失敗したら、類義キーワードの特定を試みる。特定部52は、全ての振分けキーワードの特定に失敗した場合、所定の情報提供サイト5を特定する。特定部52は、所定の情報提供サイト5として、例えば、複数の信頼できる情報提供サイト5の情報を予め保持する。但し、本実施形態は、特定の順番を上述の順番に制限しない。例えば、類義キーワードを連想キーワードよりも先に特定するようにしてもよい。   Based on the comment text data acquired by the comment data acquisition unit 51, the specifying unit 52 specifies a distribution keyword associated with the information providing site 5 that is an information request destination in the distribution word DB 41 or the user learning DB 42. The identification unit 52 identifies the allocation keyword step by step in the order of fixed keyword, associative keyword, and similarity keyword. Specifically, the specifying unit 52 tries to specify an associative keyword when the specification of the fixed keyword fails, and when the specification of the associative keyword fails, the specifying unit 52 tries to specify the similar keyword. The identification unit 52 identifies a predetermined information providing site 5 when identification of all the distribution keywords fails. The specifying unit 52 holds, as the predetermined information providing site 5, for example, information of a plurality of reliable information providing sites 5 in advance. However, this embodiment does not limit the specific order to the order described above. For example, the similar keyword may be specified before the associative keyword.

特定部52は、振分けワードDB41の固定ワードテーブルを参照することにより、発言データ取得部51により取得される発言テキストデータに含まれる固定キーワードを特定する。特定部52は、固定キーワードが特定されなかった場合、振分けワードDB41の連想ワードテーブルを参照することにより、後述する連想単語取得部36により取得される連想単語データと一致する連想キーワードを特定する。特定部52は、連想キーワードが特定されなかった場合、発言テキストデータの出力者であるユーザの、ユーザ学習DB42の学習ワードテーブルを参照することにより、後述する抽出部35により抽出される振分け用単語データと一致する類義キーワードを特定する。特定部52は、そのユーザの学習ワードテーブルでは、類義キーワードを特定できなかった場合、振分けワードDB41の類義ワードテーブルを参照することにより、後述する類義語取得部37により取得される類義語データと一致する類義キーワードを特定する。   The specifying unit 52 specifies a fixed keyword included in the utterance text data acquired by the utterance data acquisition unit 51 by referring to the fixed word table of the sorting word DB 41. When the fixed keyword is not specified, the specifying unit 52 refers to the associative word table of the assignment word DB 41 to specify the associative keyword that matches the associative word data acquired by the associative word acquiring unit 36 described later. When the associative keyword is not specified, the specifying unit 52 refers to the learning word table of the user learning DB 42 of the user who is the output person of the remark text data, and thereby the sorting word extracted by the extracting unit 35 described later Identify similar keywords that match the data. If the synonym keyword cannot be specified in the user's learning word table, the specifying unit 52 refers to the synonym data acquired by the synonym acquisition unit 37 described later by referring to the synonym word table of the distribution word DB 41. Identify matching similar keywords.

抽出部35は、発言データ取得部51により取得された発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出する。この振分け用単語データは、発言テキストデータに固定キーワードが含まれない場合に、その発言テキストデータ内において、その固定キーワードに代わり、振分けキーワードとなり得る単語又は単語列を示すデータである。抽出部35は、振分け用単語データの抽出条件を予め保持しており、この抽出条件に合致する単語データを振分け用単語データとして抽出する。当該抽出条件には、例えば、発言テキストデータの中の最後の名詞句又は動詞句といった条件が設定される。   The extraction unit 35 extracts sorting word data from word data obtained by decomposing part of speech text data acquired by the speech data acquisition unit 51. The word data for distribution is data indicating a word or a word string that can be a distribution keyword in place of the fixed keyword in the remark text data when the remark text data does not include the fixed keyword. The extraction unit 35 holds the extraction condition of the word data for distribution in advance, and extracts word data that matches the extraction condition as word data for distribution. For example, a condition such as the last noun phrase or verb phrase in the comment text data is set as the extraction condition.

品詞分解処理は、抽出部35により実行されてもよいし、他のコンピュータにより実行されてもよい。他のコンピュータにより品詞分解処理が実行される場合には、抽出部35は、発言テキストデータをそのコンピュータに送り、品詞分解の結果をそのコンピュータから取得する。本実施形態では、周知の品詞分解処理が実行されればよいため、品詞分解処理自体の説明はここでは省略する。   The part of speech decomposition process may be executed by the extraction unit 35 or may be executed by another computer. When the part-of-speech decomposition process is executed by another computer, the extraction unit 35 sends the comment text data to the computer, and acquires the result of the part-of-speech decomposition from the computer. In this embodiment, since a known part-of-speech decomposition process only needs to be executed, description of the part-of-speech decomposition process itself is omitted here.

発言テキストデータが品詞分解されると、品詞毎に区分けされた単語データと、その単語データの品詞情報とが取得される。例えば、抽出部35は、品詞分解により得られた単語データの集合の中に所定の単語列が含まれる場合に、当該所定の単語列を名詞句又は動詞句と判定する。例えば、「奈良の大仏」、「ピサの斜塔」、「完食した」等が所定の単語列に該当する。   When the speech text data is decomposed into parts of speech, the word data divided for each part of speech and the part of speech information of the word data are acquired. For example, when a predetermined word string is included in a set of word data obtained by part-of-speech decomposition, the extraction unit 35 determines the predetermined word string as a noun phrase or a verb phrase. For example, “Great Buddha of Nara”, “Leaning Tower of Pisa”, “Completed”, etc. correspond to the predetermined word string.

連想単語取得部36は、抽出部35により抽出された振分け用単語データの連想単語データを取得する。連想単語取得部36は、連想語辞典を有していてもよいし、他のコンピュータ(情報提供サイト5等)により実装される連想語辞典や、CD等の記録媒体に記録される連想語辞典を使うようにしてもよい。情報提供サイト5により提供される連想語辞典を用いる手法は、周知であり、様々な手法が知られているため、ここでは説明を省略する。   The association word acquisition unit 36 acquires association word data of the distribution word data extracted by the extraction unit 35. The associative word acquisition unit 36 may have an associative word dictionary, an associative word dictionary implemented by another computer (such as the information providing site 5), or an associative word dictionary recorded on a recording medium such as a CD. May be used. Since the method using the associative dictionary provided by the information providing site 5 is well known and various methods are known, the description is omitted here.

類義語取得部37は、抽出部35により抽出された振分け用単語データの類義語データを取得する。類義語取得部37は、類義語辞典を有していてもよいし、他のコンピュータ(情報提供サイト5)により実装される類義語辞典や、CD等の記録媒体に記録される類義語辞典を使うようにしてもよい。情報提供サイト5により提供される類義語辞典を用いる手法は、周知であり、様々な手法が知られているため、ここでは説明を省略する。   The synonym acquisition unit 37 acquires the synonym data of the sorting word data extracted by the extraction unit 35. The synonym acquisition unit 37 may have a synonym dictionary, use a synonym dictionary implemented by another computer (information providing site 5), or a synonym dictionary recorded on a recording medium such as a CD. Also good. Since the technique using the synonym dictionary provided by the information providing site 5 is well known and various techniques are known, the description is omitted here.

学習処理部38は、特定部52により特定された類義キーワードを、振分けワードDB41の類義ワードテーブルにてこの類義振分けキーワードと紐付けられている情報提供サイトと関連付けて、発言テキストデータの出力者であるユーザの、ユーザ学習DB42の学習ワードテーブルに格納する。これにより、各ユーザの学習ワードテーブルには、そのユーザの発言テキストデータに含まれる振分け用単語データの類義語で、振分けワードDB41の類義ワードテーブルの類義キーワードと一致し、情報要求先の情報提供サイト5を選択するのに利用された類義語のデータが順次格納される。このように、学習処理部38の処理によれば、学習ワードテーブルに格納される類義キーワードの数が増加し、結果として、特定部52による、学習ワードテーブルを用いた振分けキーワードの特定の可能性を増加させることができる。   The learning processing unit 38 associates the synonymous keyword specified by the specifying unit 52 with the information providing site linked to the synonymous distribution keyword in the synonymous word table of the distribution word DB 41, It stores in the learning word table of user learning DB42 of the user who is an output person. Thereby, the learning word table of each user is a synonym of the word data for sorting included in the remark text data of the user, matches the synonym keyword of the synonym word table of the sorting word DB 41, and information on the information request destination Synonym data used to select the providing site 5 is sequentially stored. As described above, according to the processing of the learning processing unit 38, the number of similar keywords stored in the learning word table increases, and as a result, the identification keyword can be specified by the specifying unit 52 using the learning word table. Sex can be increased.

単語データ取得部53は、検索キーワードとして用いるために、発言データ取得部51により取得された発言テキストデータの中から、単語又は単語列を示す少なくとも1つの単語データを取得する。単語データ取得部53は、固定キーワード又は振分け用単語データ以外の少なくとも1つの単語データを取得する。このとき、単語データ取得部53は、振分けワードDB41の固定ワードテーブルにおいて、特定部52により特定された振分けキーワードに対応する情報提供サイト5と紐付く、検索キーワードの条件情報を用いる。図4の例において、天気サイトに対応する振分けキーワードが特定部52により特定された場合、単語データ取得部53は、日付及び地名を示す少なくとも2つの単語データの抽出を試みる。   The word data acquisition unit 53 acquires at least one word data indicating a word or a word string from the utterance text data acquired by the utterance data acquisition unit 51 for use as a search keyword. The word data acquisition unit 53 acquires at least one word data other than the fixed keyword or the sorting word data. At this time, the word data acquisition unit 53 uses the search keyword condition information associated with the information providing site 5 corresponding to the distribution keyword specified by the specifying unit 52 in the fixed word table of the distribution word DB 41. In the example of FIG. 4, when the sorting keyword corresponding to the weather site is specified by the specifying unit 52, the word data acquiring unit 53 tries to extract at least two word data indicating the date and the place name.

但し、単語データ取得部53は、検索キーワードが不要な振分けキーワードが特定された場合、処理を行わなくてもよい。また、単語データ取得部53は、特定部52により所定の情報提供サイト5が特定された場合には、検索キーワードを取得しなくてもよいし、発言テキストデータが品詞分解されることにより得られる少なくとも1つの単語データを検索キーワードとして取得してもよい。   However, the word data acquisition unit 53 does not have to perform processing when a sorting keyword that does not require a search keyword is specified. Further, the word data acquisition unit 53 does not have to acquire a search keyword when the predetermined information providing site 5 is specified by the specifying unit 52, and is obtained by decomposing speech text data. At least one word data may be acquired as a search keyword.

情報要求部54は、単語データ取得部53により取得された少なくとも1つの単語データを検索キーワードとして用いて、特定部52により特定される振分けキーワード(固定キーワード、連想キーワード、又は、類義キーワード)に対応する情報提供サイトに対し情報を要求する。単語データ取得部53により検索キーワードに用いる単語データが取得されない場合には、情報要求部54は、検索キーワード無しの状態で、情報提供サイトに対して情報を要求する。また、情報要求部54は、特定部52により所定の情報提供サイト5が特定された場合には、その情報提供サイト5に対して情報を要求する。   The information request unit 54 uses the at least one word data acquired by the word data acquisition unit 53 as a search keyword, and assigns it to a distribution keyword (fixed keyword, associative keyword, or similar keyword) specified by the specifying unit 52. Request information from the corresponding information provider site. When the word data used for the search keyword is not acquired by the word data acquisition unit 53, the information request unit 54 requests information from the information providing site without the search keyword. In addition, when the predetermined information providing site 5 is specified by the specifying unit 52, the information requesting unit 54 requests information from the information providing site 5.

情報要求部54は、上記要求の応答として、要求先の情報提供サイト5から情報を取得し、この情報を発言テキストデータの送信元であるクライアント2に送信する。情報要求部54は、情報提供サイト5から取得された情報をクライアント2の表示装置に表示させるための表示画面データ(WEBデータ等)を生成し、その表示画面データをクライアント2に送るようにしてもよい。また、情報要求部54は、情報提供サイト5から取得された情報を含む電子メールをクライアント2宛てに送信するようにしてもよい。本実施形態では、情報提供サイト5から提供された情報のユーザへの具体的提供方法を制限しない。   As a response to the request, the information request unit 54 acquires information from the information providing site 5 that is the request destination, and transmits this information to the client 2 that is the transmission source of the comment text data. The information request unit 54 generates display screen data (WEB data or the like) for displaying the information acquired from the information providing site 5 on the display device of the client 2, and sends the display screen data to the client 2. Also good. Further, the information request unit 54 may transmit an e-mail including information acquired from the information providing site 5 to the client 2. In this embodiment, the specific provision method to the user of the information provided from the information providing site 5 is not limited.

〔動作例〕
以下、第1実施形態における情報検索方法について図7から図11を用いて説明する。図7は、第1実施形態における対話サーバ1の動作例を示すフローチャートである。
[Operation example]
Hereinafter, the information search method in the first embodiment will be described with reference to FIGS. FIG. 7 is a flowchart showing an operation example of the dialogue server 1 in the first embodiment.

対話サーバ1は、クライアント2から発言テキストデータを取得する(S71)。この発言テキストデータは、例えば、クライアント2のユーザが発声した発言音声が、クライアント2で録音及び音声認識されることにより、生成され、クライアント2から対話サーバ1へ送信される。   The dialogue server 1 acquires message text data from the client 2 (S71). The comment text data is generated, for example, by recording and recognizing the speech voice uttered by the user of the client 2 by the client 2, and is transmitted from the client 2 to the dialogue server 1.

対話サーバ1は、振分けワードDB41の固定ワードテーブルを参照することにより、発言データ取得部51により取得される発言テキストデータに含まれる固定キーワードの特定を試みる(S72)。この固定キーワードの特定(S72)の詳細については、図8を用いて後述する。   The dialogue server 1 tries to specify a fixed keyword included in the utterance text data acquired by the utterance data acquisition unit 51 by referring to the fixed word table of the sorting word DB 41 (S72). Details of the specification of the fixed keyword (S72) will be described later with reference to FIG.

対話サーバ1は、発言テキストデータに固定キーワードが含まれていないため、固定キーワードの特定に失敗した場合(S73;NO)、連想キーワードの特定を試みる(S74)。この連想キーワードの特定(S74)の詳細については、図9を用いて後述する。   Since the fixed text is not included in the comment text data, the dialogue server 1 tries to specify the associative keyword when it fails to specify the fixed keyword (S73; NO) (S74). Details of the specification of the associative keyword (S74) will be described later with reference to FIG.

対話サーバ1は、連想キーワードの特定に失敗した場合(S75;NO)、クライアント2のユーザのためのユーザ学習DB42の学習ワードテーブルを用いて、類義キーワードの特定を試みる(S76)。この学習ワードテーブルを用いた類義キーワードの特定(S76)の詳細については、図10を用いて後述する。   When the dialogue server 1 fails to identify the associative keyword (S75; NO), the dialogue server 1 tries to identify the synonymous keyword using the learning word table of the user learning DB 42 for the user of the client 2 (S76). Details of the specification of similar keywords (S76) using the learning word table will be described later with reference to FIG.

対話サーバ1は、学習ワードテーブルを用いた類義キーワードの特定(S76)に失敗した場合(S77;NO)、振分けワードDB41の類義ワードテーブルを用いて、類義キーワードの特定を試みる(S78)。この類義ワードテーブルを用いた類義キーワードの特定(S78)の詳細については、図11を用いて後述する。   When the dialogue server 1 fails to identify the synonymous keyword using the learning word table (S76) (S77; NO), the dialogue server 1 tries to identify the synonymous keyword using the synonymous word table of the sorting word DB 41 (S78). ). Details of specifying a similar keyword (S78) using this similar word table will be described later with reference to FIG.

対話サーバ1は、類義ワードテーブルを用いた類義キーワードの特定(S78)に失敗した場合(S79;NO)、所定の情報提供サイトを特定する(S80)。   When the dialog server 1 fails to specify the synonym keyword using the synonym word table (S78) (S79; NO), the dialog server 1 specifies a predetermined information providing site (S80).

続いて、対話サーバ1は、必要に応じて、(S71)で取得された発言テキストデータを品詞分解することにより得られる単語データの中から、検索キーワードとして用いるための単語データを取得する(S81)。具体的には、対話サーバ1は、(S72)、(S74)、(S76)及び(S78)のいずれか1つで特定された振分けキーワードに対応付けられた、振分けワードDB41の固定ワードテーブルの検索キーワード情報を取得し、検索キーワードの取得の要否を決定する。対話サーバ1は、検索キーワードの取得が不要と決定した場合、(S81)を実行しなくてもよい。対話サーバ1は、固定ワードテーブルの検索キーワード情報により示される形態の単語データを発言テキストデータの中から取得する。   Subsequently, the dialogue server 1 acquires word data to be used as a search keyword from word data obtained by decomposing the speech text data acquired in (S71) as necessary (S81). ). Specifically, the dialog server 1 stores the fixed word table in the sorting word DB 41 associated with the sorting keyword specified in any one of (S72), (S74), (S76), and (S78). Search keyword information is acquired and whether or not it is necessary to acquire a search keyword is determined. When it is determined that the acquisition of the search keyword is unnecessary, the dialog server 1 does not need to execute (S81). The dialogue server 1 acquires word data in the form indicated by the search keyword information in the fixed word table from the comment text data.

対話サーバ1は、(S72)、(S74)、(S76)及び(S78)のいずれか1つで特定された振分けキーワードに対応付けられた情報提供サイト5を特定する。具体的には、対話サーバ1は、振分けワードDB41の固定ワードテーブルを参照することにより、(S72)で特定された固定キーワードに対応付けられた情報提供サイト5を特定する。また、対話サーバ1は、振分けワードDB41の連想ワードテーブルを参照することにより、(S74)で特定された連想キーワードに対応付けられた情報提供サイト5を特定する。また、対話サーバ1は、ユーザ学習DB42の学習ワードテーブルを参照することにより、(S76)で特定された類義キーワードに対応付けられた情報提供サイト5を特定する。また、対話サーバ1は、振分けワードDB41の類義ワードテーブルを参照することにより、(S78)で特定された類義キーワードに対応付けられた情報提供サイト5を特定する。   The dialogue server 1 identifies the information providing site 5 associated with the distribution keyword identified in any one of (S72), (S74), (S76), and (S78). Specifically, the dialogue server 1 specifies the information providing site 5 associated with the fixed keyword specified in (S72) by referring to the fixed word table of the sorting word DB 41. Moreover, the dialogue server 1 specifies the information providing site 5 associated with the associative keyword specified in (S74) by referring to the associative word table of the distribution word DB 41. Moreover, the dialogue server 1 specifies the information providing site 5 associated with the similar keyword specified in (S76) by referring to the learning word table of the user learning DB. Further, the dialogue server 1 specifies the information providing site 5 associated with the similar keyword specified in (S78) by referring to the similar word table of the distribution word DB 41.

対話サーバ1は、(S81)で取得された単語データを検索キーワードとして用いて、上述のように振分けキーワードにより特定された情報提供サイト5、又は、(S80)で特定された所定の情報提供サイト5に対して情報を要求する(S82)。   The dialogue server 1 uses the word data acquired in (S81) as a search keyword, the information providing site 5 specified by the sorting keyword as described above, or the predetermined information providing site specified in (S80) 5 is requested for information (S82).

対話サーバ1は、上記要求の応答として、要求先の情報提供サイト5から情報を取得し、この情報を発言テキストデータの送信元であるクライアント2に送信する(S83)。これにより、クライアント2では、例えば、対話サーバ1により送信された情報が音声により出力される。   As a response to the request, the dialog server 1 acquires information from the requested information providing site 5 and transmits this information to the client 2 that is the transmission source of the comment text data (S83). Thereby, in the client 2, for example, the information transmitted by the dialogue server 1 is output by voice.

図8は、図7に示される固定キーワードの特定(S72)の詳細を示すフローチャートである。対話サーバ1は、振分けワードDB41の固定ワードテーブルに格納される情報を読み込む(S81)。これにより、対話サーバ1は、全ての固定キーワードを取得することになる。   FIG. 8 is a flowchart showing details of the fixed keyword identification (S72) shown in FIG. The dialogue server 1 reads information stored in the fixed word table of the sorting word DB 41 (S81). Thereby, the dialogue server 1 acquires all the fixed keywords.

対話サーバ1は、発言テキストデータに含まれる固定キーワードが特定されるか、又は、当該固定ワードテーブルに格納される全ての固定キーワードの比較が完了するまで、固定キーワード毎に、(S83)の比較処理を繰り返し行う(S82、S84)。(S83)では、対話サーバ1は、発言テキストデータと固定キーワードとを比較する。ループ終了後、対話サーバ1は、発言テキストデータに含まれる固定キーワードが特定されたか否かを判定する(S85)。この判定結果が、図7の(S73)で参照される。   The dialogue server 1 compares (S83) for each fixed keyword until a fixed keyword included in the comment text data is specified or until all fixed keywords stored in the fixed word table are compared. The process is repeated (S82, S84). In (S83), the dialogue server 1 compares the comment text data with the fixed keyword. After the end of the loop, the dialogue server 1 determines whether or not a fixed keyword included in the comment text data is specified (S85). This determination result is referred to in (S73) of FIG.

図9は、図7に示される連想キーワードの特定(S74)の詳細を示すフローチャートである。対話サーバ1は、振分けワードDB41の連想ワードテーブルに格納される情報を読み込む(S91)。これにより、対話サーバ1は、全ての連想キーワードを取得することになる。更に、対話サーバ1は、発言テキストデータが品詞分解されることにより得られる単語データの中から、振分けキーワードになり得る振分け用単語データを抽出する(S92)。続いて、対話サーバ1は、振分け用単語データの連想単語データを取得する(S93)。   FIG. 9 is a flowchart showing details of the associative keyword specification (S74) shown in FIG. The dialogue server 1 reads information stored in the associative word table of the sorting word DB 41 (S91). Thereby, the dialogue server 1 acquires all the associative keywords. Furthermore, the dialog server 1 extracts word data for sorting that can be a sorting keyword from word data obtained by decomposing speech text data into parts of speech (S92). Subsequently, the dialogue server 1 acquires associative word data of the word data for distribution (S93).

対話サーバ1は、(S93)で取得された連想単語データと一致する連想キーワードが特定されるか、又は、当該連想ワードテーブルに格納される全ての連想キーワードの比較が完了するまで、連想キーワード毎に、(S95)の比較処理を繰り返し行う(S94、S96)。(S95)では、対話サーバ1は、(S93)で取得された連想単語データと連想キーワードとを比較する。ループ終了後、対話サーバ1は、連想単語データと一致した連想キーワードがあったか否かを判定する(S97)。この判定結果が、図7の(S75)で参照される。   The dialogue server 1 identifies each associative keyword until the associative keyword matching the associative word data acquired in (S93) is specified or the comparison of all the associative keywords stored in the associative word table is completed. In addition, the comparison process of (S95) is repeated (S94, S96). In (S95), the dialogue server 1 compares the associative word data acquired in (S93) with the associative keyword. After the end of the loop, the dialogue server 1 determines whether or not there is an associated keyword that matches the associated word data (S97). This determination result is referred to in (S75) of FIG.

図10は、図7に示される学習ワードテーブルを用いた類義キーワードの特定(S76)の詳細を示すフローチャートである。対話サーバ1は、ユーザ学習DB42における対象ユーザの学習ワードテーブルに格納される情報を読み込む(S101)。これにより、対話サーバ1は、対象ユーザの学習ワードテーブルに格納される全ての類義キーワードを取得することになる。更に、対話サーバ1は、発言テキストデータが品詞分解されることにより得られる単語データの中から、振分けキーワードになり得る振分け用単語データを抽出する(S102)。   FIG. 10 is a flowchart showing details of specifying a similar keyword (S76) using the learning word table shown in FIG. The dialogue server 1 reads information stored in the learning word table of the target user in the user learning DB 42 (S101). Thereby, the dialogue server 1 acquires all the similar keywords stored in the learning word table of the target user. Furthermore, the dialogue server 1 extracts word data for sorting that can be a sorting keyword from word data obtained by decomposing speech text data into parts of speech (S102).

対話サーバ1は、(S102)で取得された振分け用単語データと一致する類義キーワードが特定されるか、又は、対象ユーザの学習ワードテーブルに格納される全ての類義キーワードの比較が完了するまで、類義キーワード毎に、(S104)の比較処理を繰り返し行う(S103、S105)。(S104)では、対話サーバ1は、(S102)で取得された振分け用単語データと類義キーワードとを比較する。ループ終了後、対話サーバ1は、振分け用単語データと一致した類義キーワードがあったか否かを判定する(S106)。この判定結果が、図7の(S77)で参照される。   The dialogue server 1 identifies a similar keyword that matches the sorting word data acquired in (S102), or completes comparison of all similar keywords stored in the learning word table of the target user. Until then, the comparison process of (S104) is repeated for each similar keyword (S103, S105). In (S104), the dialogue server 1 compares the word data for sorting acquired in (S102) with the similar keywords. After the end of the loop, the dialogue server 1 determines whether there is a similar keyword that matches the sorting word data (S106). This determination result is referred to in (S77) of FIG.

図11は、図7に示される類義ワードテーブルを用いた類義キーワードの特定(S78)の詳細を示すフローチャートである。対話サーバ1は、振分けワードDB41の類義ワードテーブルに格納される情報を読み込む(S111)。これにより、対話サーバ1は、全ての類義キーワードを取得することになる。更に、対話サーバ1は、発言テキストデータが品詞分解されることにより得られる単語データの中から、振分けキーワードになり得る振分け用単語データを抽出する(S112)。続いて、対話サーバ1は、振分け用単語データの類義語データを取得する(S113)。   FIG. 11 is a flowchart showing details of specifying a similar keyword (S78) using the similar word table shown in FIG. The dialogue server 1 reads the information stored in the similar word table of the sorting word DB 41 (S111). Thereby, the dialogue server 1 acquires all the similar keywords. Furthermore, the dialogue server 1 extracts word data for sorting that can be a sorting keyword from word data obtained by decomposing speech text data into parts of speech (S112). Subsequently, the dialogue server 1 acquires synonym data of the word data for sorting (S113).

対話サーバ1は、(S113)で取得された類義語データと一致する類義キーワードが特定されるか、又は、全ての類義キーワードの比較が完了するまで、類義キーワード毎に、(S115)の比較処理を繰り返し行う(S114、S116)。(S115)では、対話サーバ1は、(S113)で取得された類義語データと類義キーワードとを比較する。ループ終了後、対話サーバ1は、類義語データと一致した類義キーワードがあったか否かを判定する(S117)。この判定結果が、図7の(S79)で参照される。対話サーバ1は、類義語データと一致した類義キーワードが存在した場合(S117;YES)、その類義キーワードを、ユーザ学習DB42における対象ユーザの学習ワードテーブルに追加する(S118)。   The dialogue server 1 determines whether the synonym keyword that matches the synonym data acquired in (S113) is specified, or until the comparison of all the synonym keywords is completed, for each synonym keyword (S115). The comparison process is repeated (S114, S116). In (S115), the dialogue server 1 compares the synonym data acquired in (S113) with the synonym keywords. After the end of the loop, the dialogue server 1 determines whether there is a synonymous keyword that matches the synonym data (S117). This determination result is referred to in (S79) of FIG. When there is a synonymous keyword that matches the synonym data (S117; YES), the dialogue server 1 adds the synonymous keyword to the learning word table of the target user in the user learning DB 42 (S118).

〔第1実施形態の作用及び効果〕
上述したように第1実施形態では、情報要求先となり得る各情報提供サイト5と、その情報提供サイト5を選択するための各振分けキーワードとが対応付けられて振分けワードDB41又はユーザ学習DB42に格納されている。更に、その振分けキーワードとして、固定文字列である固定キーワードに加えて、その固定キーワードの連想語に相当する連想キーワード、及び、その固定キーワードの類義語に相当する類義キーワードが格納されている。これにより、ユーザの発言テキストデータに固定キーワードが含まれておらず、固定キーワードを用いて情報要求先の情報提供サイト5を決めることが出来ない場合、その発言テキストデータに含まれる振分け用単語データの連想単語データと連想キーワードとの比較により、情報要求先が決定される。更に、連想キーワードを用いて検索先の情報提供サイト5を決めることが出来ない場合には、その発言テキストデータに含まれる振分け用単語データの類義語データと類義キーワードとの比較により、情報要求先が決定される。更に、振分けキーワードを用いて情報要求先の情報提供サイト5を決めることが出来ない場合には、所定の情報提供サイト5が情報要求先に決定される。
[Operation and Effect of First Embodiment]
As described above, in the first embodiment, each information providing site 5 that can be an information request destination and each sorting keyword for selecting the information providing site 5 are associated with each other and stored in the sorting word DB 41 or the user learning DB 42. Has been. Furthermore, in addition to a fixed keyword that is a fixed character string, an associative keyword corresponding to an associative word of the fixed keyword and a synonym keyword corresponding to a synonym of the fixed keyword are stored as the distribution keyword. Thereby, when the fixed keyword is not included in the user's utterance text data and the information providing site 5 as the information request destination cannot be determined using the fixed keyword, the allocating word data included in the utterance text data The information request destination is determined by comparing the associated word data with the associated keyword. Further, when the information providing site 5 as the search destination cannot be determined using the associative keyword, the information request destination is obtained by comparing the synonym data of the word data for sorting included in the comment text data with the synonym keyword. Is determined. Further, when the information providing site 5 as the information request destination cannot be determined using the distribution keyword, the predetermined information providing site 5 is determined as the information request destination.

このように、第1実施形態では、発言テキストデータに含まれる単語又は単語列だけでなく、発言テキストデータから連想される連想語及び発言テキストデータの類義語を用いて、情報要求先の情報提供サイト5が決定される。従って、発言テキストデータに関連する情報提供サイト5に対して情報要求をすることができるため、第1実施形態によれば、ユーザが期待する情報が見つからない可能性を極力低くすることができる。   As described above, in the first embodiment, not only the word or word string included in the utterance text data but also the associative word associated with the utterance text data and the synonyms of the utterance text data, the information providing site of the information request destination 5 is determined. Therefore, since it is possible to make an information request to the information providing site 5 related to the comment text data, according to the first embodiment, it is possible to minimize the possibility that the information expected by the user cannot be found.

また、第1実施形態では、ユーザ毎に設けられる学習ワードテーブルには、ユーザからの発言テキストデータに基づいて過去に情報要求を行った情報提供サイト5とそのときの類義語データとの対応関係が順次格納される。そして、類義キーワードを用いた情報要求先の決定において、この過去の実績が反映された対応関係がまず参照される。これにより、振分け用単語データの類義語データを取得する処理を行うことなく、その学習ワードテーブルを用いて情報要求先を即座に決めることができる。   In the first embodiment, the learning word table provided for each user has a correspondence relationship between the information providing site 5 that has made an information request in the past based on the remark text data from the user and the synonym data at that time. Stored sequentially. In the determination of the information request destination using the synonymous keyword, the correspondence relationship reflecting the past performance is first referred to. As a result, the information request destination can be immediately determined using the learning word table without performing the process of acquiring the synonym data of the word data for distribution.

以下、このような第1実施形態の作用及び効果を具体例に沿って説明する。例えば、「今日の仙台の天気を教えて」という発言テキストデータが取得されたと仮定する。この場合、その発言テキストデータには固定キーワード「天気」が含まれているため、図4に示されるように、天気サイトが情報要求先に決定される。更に、固定キーワード「天気」以外の単語データ「今日」及び「仙台」が検索キーワードとして抽出され、その天気サイトに、その検索キーワードと共に情報を提供するように要求される。   Hereinafter, the operation and effect of the first embodiment will be described with reference to specific examples. For example, assume that utterance text data “Tell me about the weather in Sendai today” has been acquired. In this case, since the fixed text “weather” is included in the comment text data, the weather site is determined as the information request destination as shown in FIG. Further, the word data “today” and “Sendai” other than the fixed keyword “weather” are extracted as search keywords, and the weather site is requested to provide information together with the search keywords.

他の例として、「雪が降ってきた」という発言テキストデータが取得されたと仮定する。この場合、その発言テキストデータにはいずれの固定キーワードも含まれていないため、その中から振分け用単語データ「雪」が取得される。更に、この振分け用単語データ「雪」の連想単語データ「気象」が取得される。一方、連想ワードテーブルには、図5に示されるように、その連想単語データ「気象」と一致する連想キーワード「気象」が存在する。これにより、その連想キーワード「気象」と紐付く天気サイトが情報要求先に決定される。この場合には、日付及び地名に相当する単語データが存在しないので、検索キーワードなしで、その天気サイトに情報が要求されてもよい。   As another example, it is assumed that message text data “snow has fallen” has been acquired. In this case, since the fixed text is not included in the comment text data, the sorting word data “snow” is acquired from the fixed keyword. Furthermore, associative word data “weather” of the word data for distribution “snow” is acquired. On the other hand, in the associative word table, as shown in FIG. 5, there is an associative keyword “weather” that matches the associative word data “weather”. As a result, the weather site associated with the associated keyword “weather” is determined as the information request destination. In this case, since there is no word data corresponding to the date and place name, information may be requested from the weather site without a search keyword.

他の例として、「京都に関心がある」という発言テキストデータが取得されたと仮定する。この場合、その発言テキストデータにはいずれの固定キーワードも含まれていないため、その中から振分け用単語データ「関心」が取得される。また、この振分け用単語データ「関心」の連想単語データのいずれも、連想ワードテーブルの連想キーワードと一致しないため、この振分け用単語データ「関心」の類語単語データ「興味」が取得される。対象ユーザの学習ワードテーブルに類語キーワード「興味」が存在する場合、類語キーワード「興味」と類語単語データ「興味」が一致するため、類語キーワード「興味」と紐付く辞書サイトが情報要求先に決定される。一方、対象ユーザの学習ワードテーブルに類語キーワード「興味」が存在しない場合、類語ワードテーブルには、類語単語データ「興味」と一致する類語キーワード「興味」が存在する。これにより、類語キーワード「興味」と紐付く辞書サイトが情報要求先に決定される。また、対象ユーザの学習ワードテーブルに類語キーワード「興味」が辞書サイトと紐付けられて格納される。   As another example, assume that utterance text data “I am interested in Kyoto” has been acquired. In this case, since no fixed keyword is included in the comment text data, the word data for distribution “interest” is acquired from the fixed keyword data. Also, since none of the associative word data of the word data for distribution “interest” matches the associative keyword in the associative word table, the synonym word data “interest” of the word data for distribution “interest” is acquired. If the synonym keyword “interest” exists in the target user's learning word table, the synonym keyword “interest” matches the synonym word data “interest”, so the dictionary site associated with the synonym keyword “interest” is determined as the information request destination Is done. On the other hand, when the synonym keyword “interest” does not exist in the learning word table of the target user, the synonym keyword “interest” that matches the synonym word data “interest” exists in the synonym word table. Thereby, the dictionary site associated with the synonym keyword “interest” is determined as the information request destination. Further, the synonym keyword “interest” is stored in the learning word table of the target user in association with the dictionary site.

[第2実施形態]
ユーザが期待する情報を得るために必要な検索キーワードが、発言テキストデータに含まれていない場合、振分けキーワード等により適切な情報要求先の情報提供サイト5が特定されていたとしても、ユーザが期待する情報が得られない可能性がある。具体的には、図4の例において天気サイトに対応する検索キーワード情報に「日付」と「地名」とが設定されているが、発言テキストデータに「地名」が含まれていない場合には、ユーザが期待する天気情報が得られない。そこで、第2実施形態では、情報要求の応答が検索キーワードに合致する情報がないことを示している場合には、ガイドデータがクライアント2に提供される。以下、第2実施形態における対話サーバ1について、第1実施形態と異なる内容を中心説明する。以下の説明では、第1実施形態と同様の内容については適宜省略する。
[Second Embodiment]
When the search keyword necessary for obtaining the information expected by the user is not included in the comment text data, the user expects even if the information providing site 5 of an appropriate information request destination is specified by the distribution keyword or the like Information may not be obtained. Specifically, in the example of FIG. 4, “date” and “place name” are set in the search keyword information corresponding to the weather site, but when the place text is not included in the comment text data, The weather information expected by the user cannot be obtained. Thus, in the second embodiment, guide data is provided to the client 2 when the response to the information request indicates that there is no information that matches the search keyword. Hereinafter, the content different from the first embodiment will be mainly described for the dialogue server 1 in the second embodiment. In the following description, the same contents as those in the first embodiment are omitted as appropriate.

〔処理構成〕
図12は、第2実施形態における対話サーバ1及びクライアント2の処理構成例を概念的に示す図である。第2実施形態における対話サーバ1は、第1実施形態に加えて、ガイド提供部61を更に有する。ガイド提供部61についても、他の処理部と同様に、例えば、CPU10によりメモリ11に格納されるプログラムが実行されることにより実現される。
[Processing configuration]
FIG. 12 is a diagram conceptually illustrating a processing configuration example of the dialogue server 1 and the client 2 in the second embodiment. The dialogue server 1 in the second embodiment further includes a guide providing unit 61 in addition to the first embodiment. The guide providing unit 61 is also realized by executing a program stored in the memory 11 by the CPU 10, for example, as in the other processing units.

振分けワードDB41の固定ワードテーブルは、第1実施形態の構成に加えて、検索キーワードの条件情報に対応するガイドデータを更に格納する。即ち、当該固定ワードテーブルは、固定キーワード、情報提供サイト情報、及び検索キーワードの条件情報、並びにその条件情報に対応するガイドデータの対応関係が格納される。ガイドデータには、ガイドの内容を示すテキストデータが含まれる。具体的には、当該条件情報に示される数に満たない検索キーワードが用いられた際のガイドデータは、不足している名詞又は名詞句を入力する旨のテキストデータを含む。また、検索キーワードが用いられたのに所望の情報が得られない場合のガイドデータは、有名な観光地名を入力する旨、もう少し具体的な内容を入力する旨等のようなテキストデータを含む。   In addition to the configuration of the first embodiment, the fixed word table of the sorting word DB 41 further stores guide data corresponding to the search keyword condition information. That is, the fixed word table stores fixed keyword, information providing site information, search keyword condition information, and correspondence relation of guide data corresponding to the condition information. The guide data includes text data indicating the content of the guide. Specifically, the guide data when a search keyword less than the number indicated in the condition information is used includes text data indicating that a missing noun or noun phrase is input. Further, the guide data when desired information is not obtained even though the search keyword is used includes text data such as inputting a famous sightseeing spot name, inputting a more specific content, and the like.

ガイド提供部61は、情報要求部54による情報要求に対する、情報要求先の情報提供サイト5からの応答が、その情報要求と共に送られた検索キーワードに合致する情報がないことを示す場合に、単語データ取得部53により取得され検索キーワードとして用いられた単語データと、上記固定ワードテーブルに格納される検索キーワードの条件情報とを比較し、比較結果に対応するガイドデータをクライアント2に送信する。ガイド提供部61は、当該比較により、検索キーワードの不足、検索キーワードの適性等を判断する。検索キーワードの適正の判断では、検索キーワードが不足していないのに、検索キーワードに対応する情報が得られないことのみに基づいて、その検索キーワードは不適正と判断されるようにしてもよい。また、ガイド提供部61は、情報要求部54による情報要求実行前に、検索キーワードの不足等を判断し、その判断結果に対応するガイドデータをクライアント2に送信するようにしてもよい。   When the response from the information request destination information providing site 5 to the information request by the information requesting unit 54 indicates that there is no information matching the search keyword sent together with the information request, the guide providing unit 61 The word data acquired by the data acquisition unit 53 and used as the search keyword is compared with the search keyword condition information stored in the fixed word table, and guide data corresponding to the comparison result is transmitted to the client 2. The guide providing unit 61 determines the lack of search keywords, the suitability of search keywords, and the like based on the comparison. In determining whether or not a search keyword is appropriate, the search keyword may be determined to be inappropriate only based on the fact that information corresponding to the search keyword cannot be obtained even though the search keyword is not insufficient. In addition, the guide providing unit 61 may determine whether there is a shortage of search keywords or the like before executing the information request by the information requesting unit 54, and may transmit guide data corresponding to the determination result to the client 2.

〔動作例〕
以下、第2実施形態における情報検索方法について図13を用いて説明する。図13は、第2実施形態における対話サーバ1の動作例を示すフローチャートである。図13には、図7に示される(S82)以降の対話サーバ1の動作例が示され、(S82)以前については、図7に示される第1実施形態と同様である。
[Operation example]
Hereinafter, an information search method according to the second embodiment will be described with reference to FIG. FIG. 13 is a flowchart showing an operation example of the dialog server 1 in the second embodiment. FIG. 13 shows an operation example of the dialog server 1 after (S82) shown in FIG. 7, and the operation before (S82) is the same as that of the first embodiment shown in FIG.

対話サーバ1は、(S81)で取得された単語データを検索キーワードとして用いて、振分けキーワードにより特定された情報提供サイト5、又は、(S80)で特定された所定の情報提供サイト5に対して情報を要求する(S82)。対話サーバ1は、当該情報要求先の情報提供サイト5から応答を受信する(S131)。   The dialogue server 1 uses the word data acquired in (S81) as a search keyword, and the information providing site 5 specified by the sorting keyword or the predetermined information providing site 5 specified in (S80) Information is requested (S82). The dialogue server 1 receives a response from the information providing site 5 of the information request destination (S131).

対話サーバ1は、当該応答が検索キーワードに合致する情報がその情報提供サイト5に存在しなかったことを示しているか否かを判断する(S132)。対話サーバ1は、当該応答が検索キーワードに合致する情報がその情報提供サイト5に存在したことを示している場合には(S132;NO)、その情報提供サイト5から応答として得られた情報を発言テキストデータの送信元であるクライアント2に送信する(S83)。   The dialogue server 1 determines whether or not the response indicates that the information matching the search keyword does not exist in the information providing site 5 (S132). When the response indicates that the information matching the search keyword exists in the information providing site 5 (S132; NO), the dialogue server 1 uses the information obtained from the information providing site 5 as a response. The message text data is transmitted to the client 2 that is the transmission source (S83).

一方、対話サーバ1は、当該応答が検索キーワードに合致する情報がその情報提供サイト5に存在しなかったことを示している場合には(S132;YES)、(S81)で取得された単語データ(検索キーワード)が、振分けワードDB41の固定ワードテーブルに格納される検索キーワードの条件を満たしているか否かを判断する(S133)。この判断(S133)は、検索キーワードの不足、検索キーワードの適性などの判断である。   On the other hand, when the response indicates that the information matching the search keyword does not exist in the information providing site 5 (S132; YES), the dialogue server 1 acquires the word data acquired in (S81). It is determined whether (search keyword) satisfies the search keyword condition stored in the fixed word table of the sorting word DB 41 (S133). This determination (S133) is a determination of lack of search keywords, suitability of search keywords, and the like.

対話サーバ1は、当該単語データが検索キーワードの条件を満たしている場合には(S133;YES)、所望の情報が得られなかった旨を示すデータをクライアント2に送信する(S136)。   When the word data satisfies the search keyword condition (S133; YES), the dialogue server 1 transmits data indicating that the desired information cannot be obtained to the client 2 (S136).

対話サーバ1は、当該単語データが検索キーワードの条件を満たしていない場合には(S133;NO)、当該固定ワードテーブルに格納されるガイドデータの中の、当該検索キーワード条件に対応するガイドデータを決定する(S134)。対話サーバ1は、決定されたガイドデータをクライアント2に送信する(S135)。これにより、クライアント2では、例えば、そのガイドデータが音声により出力される。   When the word data does not satisfy the search keyword condition (S133; NO), the dialogue server 1 sets the guide data corresponding to the search keyword condition in the guide data stored in the fixed word table. Determine (S134). The dialogue server 1 transmits the determined guide data to the client 2 (S135). Thereby, in the client 2, for example, the guide data is output by voice.

〔第2実施形態の作用及び効果〕
第2実施形態では、各情報提供サイト5について、振分けキーワードに加えて、検索キーワード条件に対応するガイドデータがそれぞれ格納される。そして、振分けキーワード等に応じて決められた情報要求先の情報提供サイト5から、情報要求と共に送った検索キーワードに合致する情報が得られなかった場合には、その検索キーワードが所定条件を満たしているか否かが判断される。検索キーワードが所定条件を満たしていない場合、その条件に対応するガイドデータがクライアント2に送られ、ユーザに提示される。
[Operation and Effect of Second Embodiment]
In the second embodiment, the guide data corresponding to the search keyword condition is stored for each information providing site 5 in addition to the distribution keyword. If information matching the search keyword sent with the information request is not obtained from the information requesting site 5 of the information request destination determined according to the distribution keyword, the search keyword satisfies the predetermined condition. It is determined whether or not. When the search keyword does not satisfy the predetermined condition, guide data corresponding to the condition is sent to the client 2 and presented to the user.

従って、そのガイドデータを聞く又は見たユーザは、どのような発言をすれば、又は、どのような発言テキストデータを入力すれば、所望の情報を得ることができるのか、即座に認識することができる。例えば、ユーザが対話サーバ1と音声対話を行う形態では、その音声対話の中でユーザは対話サーバ1から誘導されるため、その誘導に従えば、簡単に所望の情報を得ることができる。   Therefore, the user who hears or sees the guide data can immediately recognize what kind of utterance or what kind of utterance text data can be obtained to obtain desired information. it can. For example, in the form in which the user performs a voice dialogue with the dialogue server 1, the user is guided from the dialogue server 1 in the voice dialogue. Therefore, according to the guidance, desired information can be easily obtained.

具体的には、例えば、観光情報サイトについて、固定キーワード「観光」と、検索キーワードの条件情報「名詞」とが対応付けられた状態で固定ワードテーブルに格納されており、発言テキストデータ「仙台市青葉区の観光名所って何?」が取得されたと仮定する。この場合には、固定キーワード「観光」に基づいて観光情報サイトが選ばれ、検索キーワードとして「仙台市青葉区」が抽出され、その観光情報サイトに対してその検索キーワードと共に情報提供が要求される。その観光情報サイトが「仙台市青葉区」の情報が存在しない旨の応答を返してきた場合、「有名な観光地名を入力してください」というガイドデータが生成され、クライアント2に送信される。これにより、ユーザは、そのガイドに誘導され、適切なキーワードを含む発言テキストデータが得られるように、発言又は入力することができる。   Specifically, for example, for a tourism information site, the fixed keyword “sightseeing” and the search keyword condition information “noun” are stored in the fixed word table, and the comment text data “Sendai City” is stored. Suppose that "What are the tourist attractions in Aoba Ward?" In this case, a tourism information site is selected based on the fixed keyword “tourism”, “Aoba Ward in Sendai City” is extracted as a search keyword, and information provision is requested to the tourism information site along with the search keyword. . When the tourist information site returns a response that the information of “Aoba Ward, Sendai City” does not exist, guide data “Please enter a famous tourist name” is generated and transmitted to the client 2. Thereby, the user can speak or input so that the comment text data including an appropriate keyword is obtained by being guided to the guide.

[変形例]
上述の第1実施形態では、振分けキーワードとして、固定キーワード、連想キーワード及び類義キーワードが用いられたが、固定キーワードのみが用いられてもよいし、固定キーワードと連想キーワードとが用いられてもよいし、固定キーワードと類義キーワードとが用いられてもよい。固定キーワードのみが用いられる場合で、固定キーワードが特定されない場合には、所定の情報提供サイト5が選択されるようにすればよい。他の組み合わせについても同様に、いずれの振分けキーワードが特定されない場合には、所定の情報提供サイト5が選択されるようにすればよい。例えば、類義キーワードが用いられない場合には、類義語取得部37及び学習処理部38は不要となり、図7の(S76)から(S79)が不要となる。また、連想キーワードが用いられない場合には、連想単語取得部36が不要となり、図7の(S74)及び(S75)が不要となる。更に、類義キーワードは用いられても、学習ワードテーブルが利用されなくてもよい。この場合、学習処理部38が不要となり、図7の(S76)及び(S77)、図11の(S118)は不要となる。
[Modification]
In the first embodiment described above, fixed keywords, associative keywords, and similar keywords are used as distribution keywords. However, only fixed keywords may be used, or fixed keywords and associative keywords may be used. In addition, fixed keywords and similar keywords may be used. If only fixed keywords are used and no fixed keyword is specified, a predetermined information providing site 5 may be selected. Similarly, for any other combination, when any sorting keyword is not specified, a predetermined information providing site 5 may be selected. For example, when a synonym keyword is not used, the synonym acquisition unit 37 and the learning processing unit 38 are unnecessary, and (S76) to (S79) in FIG. 7 are unnecessary. Further, when the associative keyword is not used, the associative word acquisition unit 36 is not necessary, and (S74) and (S75) in FIG. 7 are not required. Furthermore, the similar keyword may be used, or the learning word table may not be used. In this case, the learning processing unit 38 becomes unnecessary, and (S76) and (S77) in FIG. 7 and (S118) in FIG. 11 become unnecessary.

また、上述の各実施形態では、情報提供部として、情報提供サイト5が例示された。しかしながら、対話サーバ1内に持つデータベースが情報提供部として特定されるようにしてもよい。この場合、図4に示される固定ワードテーブル、図5に示される連想ワードテーブル、及び、図6に示される類義ワードテーブルにおける、情報提供サイトのフィールドには、対話サーバ1内のデータベース又は情報提供サイト5が設定される。同様に、ユーザ学習DB42の情報提供サイト情報には、対話サーバ1内のデータベース又は情報提供サイト5が設定される。そして、情報要求部54は、特定部52により特定される振分けキーワード(固定キーワード、連想キーワード、又は、類義キーワード)に対応する要求先としてデータベースが選択された場合には、そのデータベースに対して情報を要求する。   Moreover, in each above-mentioned embodiment, the information provision site 5 was illustrated as an information provision part. However, the database in the dialogue server 1 may be specified as the information providing unit. In this case, the information providing site field in the fixed word table shown in FIG. 4, the associative word table shown in FIG. 5, and the synonym word table shown in FIG. The providing site 5 is set. Similarly, the database in the dialogue server 1 or the information providing site 5 is set in the information providing site information of the user learning DB 42. Then, when a database is selected as a request destination corresponding to the distribution keyword (fixed keyword, associative keyword, or similar keyword) specified by the specifying unit 52, the information request unit 54 Request information.

また、上述の実施形態では、ユーザの発する音声から、発言データ取得部51により取得される発言テキストデータが生成される例が示された。しかしながら、発言テキストデータは、キーボードやタッチパネル等のようなクライアント2の入力装置を介したユーザ操作により、入力されたテキストデータであってもよい。また、情報提供サイト5から提供された情報のユーザへの出力形態についても、音声出力のみに制限されず、クライアント2が備える表示装置への表示であってもよいし、クライアント2に接続される印刷装置への印刷であってもよい。更に、情報提供サイト5から提供された情報は、2種以上の出力形態で出力されるようにしてもよい。   Moreover, in the above-mentioned embodiment, the example in which the utterance text data acquired by the utterance data acquisition part 51 is produced | generated from the audio | voice which a user utters was shown. However, the comment text data may be text data input by a user operation via the input device of the client 2 such as a keyboard or a touch panel. Further, the output form of the information provided from the information providing site 5 to the user is not limited to audio output, and may be displayed on a display device provided in the client 2 or connected to the client 2. Printing to a printing apparatus may be used. Furthermore, the information provided from the information providing site 5 may be output in two or more output forms.

また、上述の実施形態では、クライアント2が音声認識部21及び音声合成部22を持つ例が示されたが、対話サーバ1が音声認識部21及び音声合成部22を持つ形態もあり得る。この場合、対話サーバ1とクライアント2との間では、音声データのやり取りが行われてもよい。   In the above-described embodiment, an example in which the client 2 has the speech recognition unit 21 and the speech synthesis unit 22 has been shown. However, the dialog server 1 may have a speech recognition unit 21 and a speech synthesis unit 22. In this case, voice data may be exchanged between the dialogue server 1 and the client 2.

なお、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、本実施形態で実行される工程の実行順序は、その記載の順番に制限されない。本実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態及び各変形例は、内容が相反しない範囲で組み合わせることができる。   In the plurality of flowcharts used in the above description, a plurality of steps (processes) are described in order, but the execution order of the steps executed in the present embodiment is not limited to the description order. In the present embodiment, the order of the illustrated steps can be changed within a range that does not hinder the contents. Moreover, each above-mentioned embodiment and each modification can be combined in the range with which the content does not conflict.

上記の各実施形態及び各変形例の一部又は全部は、以下の付記のようにも特定され得る。但し、各実施形態及び各変形例が以下の記載に限定されるものではない。   A part or all of each of the above embodiments and modifications may be specified as in the following supplementary notes. However, each embodiment and each modification are not limited to the following description.

(付記1)
ユーザの発言テキストデータを取得する発言データ取得部と、
各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、前記発言データ取得部により取得される発言テキストデータに関連する振分けキーワードを特定する特定部と、
前記発言テキストデータが品詞分解されることにより得られる、前記特定部により特定される振分けキーワード以外の少なくとも1つの単語データを取得する単語データ取得部と、
前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される振分けキーワードに対応する情報提供部に対し情報を要求する情報要求部と、
を備える情報検索装置。
(Appendix 1)
A remark data acquisition unit for acquiring remark text data of the user;
A specifying unit for specifying a distribution keyword related to the remark text data acquired by the remark data acquisition unit by referring to a distribution word storage unit that stores a distribution keyword for each information providing unit;
A word data acquisition unit that acquires at least one word data other than the sorting keyword specified by the specifying unit, obtained by decomposing part of speech of the remark text data;
Using at least one word data acquired by the word data acquiring unit as a search keyword, an information requesting unit that requests information from the information providing unit corresponding to the sorting keyword specified by the specifying unit;
An information retrieval apparatus comprising:

(付記2)
前記振分けキーワードには、固定文字列である固定キーワードが含まれ、
前記特定部は、前記発言データ取得部により取得される発言テキストデータに含まれる前記固定キーワードを特定し、
前記単語データ取得部は、前記発言テキストデータが品詞分解されることにより得られる、前記特定部により特定される固定キーワード以外の少なくとも1つの単語データを取得し、
前記情報要求部は、前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される固定キーワードに対応する情報提供部に対し情報を要求する、
付記1に記載の情報検索装置。
(Appendix 2)
The sorting keyword includes a fixed keyword that is a fixed character string,
The specifying unit specifies the fixed keyword included in the comment text data acquired by the comment data acquisition unit,
The word data acquisition unit acquires at least one word data other than the fixed keyword specified by the specifying unit, obtained by decomposing part of speech text data,
The information request unit requests information from the information providing unit corresponding to the fixed keyword specified by the specifying unit using at least one word data acquired by the word data acquiring unit as a search keyword.
The information search device according to appendix 1.

(付記3)
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出する抽出部と、
前記抽出部により抽出される振分け用単語データの連想単語データを取得する連想単語取得部と、
を更に備え、
前記振分けキーワードには、前記固定キーワードの連想単語に相当する連想キーワードが含まれ、
前記特定部は、前記連想単語取得部により取得される連想単語データと一致する前記連想キーワードを特定し、
前記単語データ取得部は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求部は、前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される連想キーワードに対応する情報提供部に対し情報を要求する、
付記2に記載の情報検索装置。
(Appendix 3)
An extraction unit for extracting word data for sorting from word data obtained by decomposing part of speech of the remark text data;
An associative word acquisition unit for acquiring associative word data of the word data for distribution extracted by the extraction unit;
Further comprising
The distribution keyword includes an association keyword corresponding to the association keyword of the fixed keyword,
The identifying unit identifies the associated keyword that matches the associated word data acquired by the associated word acquiring unit,
The word data obtaining unit obtains at least one word data other than the sorting word data obtained by decomposing part of the speech text data;
The information requesting unit uses at least one word data acquired by the word data acquiring unit as a search keyword, and requests information from the information providing unit corresponding to the associative keyword specified by the specifying unit.
The information search device according to attachment 2.

(付記4)
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出する抽出部と、
前記抽出部により抽出される振分け用単語データの類義語データを取得する類義語取得部と、
を更に備え、
前記振分けキーワードには、前記固定キーワードの類義語に相当する類義キーワードが含まれ、
前記特定部は、前記類義語取得部により取得される類義語データと一致する前記類義キーワードを特定し、
前記単語データ取得部は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求部は、前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される類義キーワードに対応する情報提供部に対し情報を要求する、
付記2又は3に記載の情報検索装置。
(Appendix 4)
An extraction unit for extracting word data for sorting from word data obtained by decomposing part of speech of the remark text data;
A synonym acquisition unit for acquiring synonym data of the word data for sorting extracted by the extraction unit;
Further comprising
The distribution keyword includes a synonym keyword corresponding to a synonym of the fixed keyword,
The specifying unit specifies the synonym keyword that matches the synonym data acquired by the synonym acquisition unit,
The word data obtaining unit obtains at least one word data other than the sorting word data obtained by decomposing part of the speech text data;
The information request unit requests information from the information providing unit corresponding to the synonymous keyword specified by the specifying unit using at least one word data acquired by the word data acquiring unit as a search keyword.
The information search device according to appendix 2 or 3.

(付記5)
前記特定部により特定され、情報要求先の決定に利用された類義キーワードを、該類義キーワードに基づいて該情報要求先に決定された情報提供部と関連付けて、学習ワード格納部に格納する学習処理部、
を更に備え、
前記特定部は、前記学習ワード格納部を参照することにより、前記振分け用単語データと一致する類義キーワードを特定し、特定に失敗した場合に、前記類義ワード格納部を参照することにより、前記類義語取得部により取得される類義語データと一致する類義キーワードを特定する、
付記4に記載の情報検索装置。
(Appendix 5)
The similar keyword specified by the specifying unit and used for determining the information request destination is stored in the learning word storage unit in association with the information providing unit determined by the information request destination based on the similar keyword. Learning processor,
Further comprising
The identifying unit identifies a synonymous keyword that matches the word data for sorting by referring to the learning word storage unit, and when the identification fails, by referring to the synonym word storage unit, Identify synonym keywords that match the synonym data acquired by the synonym acquisition unit;
The information search device according to appendix 4.

(付記6)
前記特定部は、前記固定キーワードの特定と、前記連想キーワードの特定、及び、前記類義キーワードの特定の少なくとも1つとを所定の順番で実行する、
付記2から5のいずれか1つに記載の情報検索装置。
(Appendix 6)
The specifying unit executes the specification of the fixed keyword, the specification of the associative keyword, and the specification of at least one of the similar keywords in a predetermined order.
The information search device according to any one of appendices 2 to 5.

(付記7)
前記特定部は、実行された全ての特定に失敗した場合に、所定の情報提供部を特定し、
前記情報要求部は、前記発言テキストデータが品詞分解されることにより得られる少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される前記所定の情報提供部に対し情報を要求する、
付記6に記載の情報検索装置。
(Appendix 7)
The identifying unit identifies a predetermined information providing unit when all the performed identifications have failed,
The information requesting unit requests information from the predetermined information providing unit specified by the specifying unit using at least one word data obtained by decomposing the speech text data as a search keyword. ,
The information search device according to appendix 6.

(付記8)
前記振分けワード格納部は、前記各情報提供部について、更に、前記検索キーワードの条件情報、及び、該条件情報に対応するガイドデータをそれぞれ格納し、
前記情報要求部による情報要求に対する、情報要求先の情報提供部からの応答が、該情報要求と共に送られた前記検索キーワードに合致する情報がないことを示す場合に、前記単語データ取得部により取得され前記検索キーワードとして用いられた単語データと、前記振分けワード格納部に格納される前記検索キーワードの条件情報とを比較し、該比較結果に対応する前記ガイドデータを前記ユーザに提供するガイド提供部、
を更に備える付記1から7のいずれか1つに記載の情報検索装置。
(Appendix 8)
The sorting word storage unit further stores condition information of the search keyword and guide data corresponding to the condition information for each information providing unit,
Acquired by the word data acquisition unit when a response from the information requesting unit of the information request destination to the information request by the information request unit indicates that there is no information that matches the search keyword sent with the information request. The guide providing unit that compares the word data used as the search keyword with the search keyword condition information stored in the sorting word storage unit and provides the user with the guide data corresponding to the comparison result ,
The information search device according to any one of appendices 1 to 7, further comprising:

(付記9)
少なくとも1つのコンピュータが、
ユーザの発言テキストデータを取得し、
各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、前記取得された発言テキストデータに関連する振分けキーワードを特定し、
前記発言テキストデータが品詞分解されることにより得られる、前記特定された振分けキーワード以外の少なくとも1つの単語データを取得し、
前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された振分けキーワードに対応する情報提供部に対し情報を要求する、
ことを含む情報検索方法。
(Appendix 9)
At least one computer
Get user remark text data,
By identifying a distribution word storage unit that stores a distribution keyword for each information providing unit, the distribution keyword related to the acquired comment text data is specified,
Obtaining at least one word data other than the specified sorting keyword obtained by decomposing the speech text data into parts of speech;
Using the acquired at least one word data as a search keyword, and requesting information from the information providing unit corresponding to the specified sorting keyword;
Information retrieval method including that.

(付記10)
前記振分けキーワードには、固定文字列である固定キーワードが含まれ、
前記特定は、前記発言テキストデータに含まれる前記固定キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記特定された固定キーワード以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された固定キーワードに対応する情報提供部に対し情報を要求する、
付記9に記載の情報検索方法。
(Appendix 10)
The sorting keyword includes a fixed keyword that is a fixed character string,
The specifying specifies the fixed keyword included in the comment text data,
The word data is acquired by acquiring at least one word data other than the specified fixed keyword, which is obtained by decomposing part of speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from an information providing unit corresponding to the specified fixed keyword.
The information search method according to appendix 9.

(付記11)
前記少なくとも1つのコンピュータが、
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出し、
前記抽出された振分け用単語データの連想単語データを取得する、
ことを更に含み、
前記振分けキーワードには、前記固定キーワードの連想単語に相当する連想キーワードが含まれ、
前記特定は、前記取得された連想単語データと一致する前記連想キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された連想キーワードに対応する情報提供部に対し情報を要求する、
付記10に記載の情報検索方法。
(Appendix 11)
The at least one computer comprises:
From the word data obtained by decomposing the speech text data, the word data for sorting is extracted,
Obtaining associative word data of the extracted word data for sorting,
Further including
The distribution keyword includes an association keyword corresponding to the association keyword of the fixed keyword,
The identification identifies the association keyword that matches the acquired association word data,
The word data is acquired by acquiring at least one word data other than the sorting word data obtained by decomposing part of the speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from the information providing unit corresponding to the identified associative keyword.
The information search method according to appendix 10.

(付記12)
前記少なくとも1つのコンピュータが、
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出し、
前記抽出された振分け用単語データの類義語データを取得する、
ことを更に含み、
前記振分けキーワードには、前記固定キーワードの類義語に相当する類義キーワードが含まれ、
前記特定は、前記取得された類義語データと一致する前記類義キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された類義キーワードに対応する情報提供部に対し情報を要求する、
付記10又は11に記載の情報検索方法。
(Appendix 12)
The at least one computer comprises:
From the word data obtained by decomposing the speech text data, the word data for sorting is extracted,
Obtaining synonym data of the extracted word data for sorting,
Further including
The distribution keyword includes a synonym keyword corresponding to a synonym of the fixed keyword,
The specifying specifies the synonymous keyword that matches the acquired synonym data,
The word data is acquired by acquiring at least one word data other than the sorting word data obtained by decomposing part of the speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from an information providing unit corresponding to the specified synonymous keyword,
The information search method according to appendix 10 or 11.

(付記13)
前記少なくとも1つのコンピュータが、
情報要求先の決定に利用された類義キーワードを、該類義キーワードに基づいて該情報要求先に決定された情報提供部と関連付けて、学習ワード格納部に格納する、
ことを更に含み、
前記特定は、前記学習ワード格納部を参照することにより、前記振分け用単語データと一致する類義キーワードを特定し、特定に失敗した場合に、前記類義ワード格納部を参照することにより、前記取得された類義語データと一致する類義キーワードを特定する、
付記12に記載の情報検索方法。
(Appendix 13)
The at least one computer comprises:
The similar keyword used for determining the information request destination is stored in the learning word storage unit in association with the information providing unit determined as the information request destination based on the similar keyword.
Further including
The identification is performed by referring to the learning word storage unit to identify a synonymous keyword that matches the sorting word data, and when the identification fails, by referring to the synonym word storage unit, Identify synonymous keywords that match the retrieved synonym data,
The information search method according to attachment 12.

(付記14)
前記特定は、前記固定キーワードの特定と、前記連想キーワードの特定、及び、前記類義キーワードの特定の少なくとも1つとを所定の順番で実行する、
付記10から13のいずれか1つに記載の情報検索方法。
(Appendix 14)
The identification is performed in a predetermined order by identifying the fixed keyword, identifying the associative keyword, and identifying at least one of the similar keywords.
The information search method according to any one of appendices 10 to 13.

(付記15)
前記特定は、実行された全ての特定に失敗した場合に、所定の情報提供部を特定し、
前記情報要求は、前記発言テキストデータが品詞分解されることにより得られる少なくとも1つの単語データを検索キーワードとして用いて、前記所定の情報提供部に対し情報を要求する、
付記14に記載の情報検索方法。
(Appendix 15)
The identification specifies a predetermined information providing unit when all the identifications that have been executed fail,
The information request requests information from the predetermined information providing unit using at least one word data obtained by decomposing part of speech text data as a search keyword.
The information search method according to appendix 14.

(付記16)
前記振分けワード格納部は、前記各情報提供部について、更に、前記検索キーワードの条件情報、及び、該条件情報に対応するガイドデータをそれぞれ格納し、
前記少なくとも1つのコンピュータが、
前記情報要求に対する、情報要求先の情報提供部からの応答が、該情報要求と共に送られた前記検索キーワードに合致する情報がないことを示す場合に、前記検索キーワードとして用いられた単語データと、前記振分けワード格納部に格納される前記検索キーワードの条件情報とを比較し、該比較結果に対応する前記ガイドデータを前記ユーザに提供する、
ことを更に含む付記9から15のいずれか1つに記載の情報検索方法。
(Appendix 16)
The sorting word storage unit further stores condition information of the search keyword and guide data corresponding to the condition information for each information providing unit,
The at least one computer comprises:
When the response from the information requesting unit of the information request destination to the information request indicates that there is no information that matches the search keyword sent together with the information request, word data used as the search keyword; Comparing the search keyword condition information stored in the sorting word storage unit and providing the user with the guide data corresponding to the comparison result;
The information search method according to any one of appendices 9 to 15, further including:

(付記17)
少なくとも1つのコンピュータに、
ユーザの発言テキストデータを取得し、
各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、前記取得された発言テキストデータに関連する振分けキーワードを特定し、
前記発言テキストデータが品詞分解されることにより得られる、前記特定された振分けキーワード以外の少なくとも1つの単語データを取得し、
前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された振分けキーワードに対応する情報提供部に対し情報を要求する、
ことを実行させるプログラム。
(Appendix 17)
On at least one computer,
Get user remark text data,
By identifying a distribution word storage unit that stores a distribution keyword for each information providing unit, the distribution keyword related to the acquired comment text data is specified,
Obtaining at least one word data other than the specified sorting keyword obtained by decomposing the speech text data into parts of speech;
Using the acquired at least one word data as a search keyword, and requesting information from the information providing unit corresponding to the specified sorting keyword;
A program that lets you do that.

(付記18)
前記振分けキーワードには、固定文字列である固定キーワードが含まれ、
前記特定は、前記発言テキストデータに含まれる前記固定キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記特定された固定キーワード以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された固定キーワードに対応する情報提供部に対し情報を要求する、
付記17に記載のプログラム。
(Appendix 18)
The sorting keyword includes a fixed keyword that is a fixed character string,
The specifying specifies the fixed keyword included in the comment text data,
The word data is acquired by acquiring at least one word data other than the specified fixed keyword, which is obtained by decomposing part of speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from an information providing unit corresponding to the specified fixed keyword.
The program according to appendix 17.

(付記19)
前記少なくとも1つのコンピュータに、
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出し、
前記抽出された振分け用単語データの連想単語データを取得する、
ことを更に実行させ、
前記振分けキーワードには、前記固定キーワードの連想単語に相当する連想キーワードが含まれ、
前記特定は、前記取得された連想単語データと一致する前記連想キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された連想キーワードに対応する情報提供部に対し情報を要求する、
付記18に記載のプログラム。
(Appendix 19)
Said at least one computer,
From the word data obtained by decomposing the speech text data, the word data for sorting is extracted,
Obtaining associative word data of the extracted word data for sorting,
To do more,
The distribution keyword includes an association keyword corresponding to the association keyword of the fixed keyword,
The identification identifies the association keyword that matches the acquired association word data,
The word data is acquired by acquiring at least one word data other than the sorting word data obtained by decomposing part of the speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from the information providing unit corresponding to the identified associative keyword.
The program according to appendix 18.

(付記20)
前記少なくとも1つのコンピュータに、
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出し、
前記抽出された振分け用単語データの類義語データを取得する、
ことを更に実行させ、
前記振分けキーワードには、前記固定キーワードの類義語に相当する類義キーワードが含まれ、
前記特定は、前記取得された類義語データと一致する前記類義キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された類義キーワードに対応する情報提供部に対し情報を要求する、
付記18又は19に記載のプログラム。
(Appendix 20)
Said at least one computer,
From the word data obtained by decomposing the speech text data, the word data for sorting is extracted,
Obtaining synonym data of the extracted word data for sorting,
To do more,
The distribution keyword includes a synonym keyword corresponding to a synonym of the fixed keyword,
The specifying specifies the synonymous keyword that matches the acquired synonym data,
The word data is acquired by acquiring at least one word data other than the sorting word data obtained by decomposing part of the speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from an information providing unit corresponding to the specified synonymous keyword,
The program according to appendix 18 or 19.

(付記21)
前記少なくとも1つのコンピュータに、
情報要求先の決定に利用された類義キーワードを、該類義キーワードに基づいて該情報要求先に決定された情報提供部と関連付けて、学習ワード格納部に格納する、
ことを更に実行させ、
前記特定は、前記学習ワード格納部を参照することにより、前記振分け用単語データと一致する類義キーワードを特定し、特定に失敗した場合に、前記類義ワード格納部を参照することにより、前記取得された類義語データと一致する類義キーワードを特定する、
付記20に記載のプログラム。
(Appendix 21)
Said at least one computer,
The similar keyword used for determining the information request destination is stored in the learning word storage unit in association with the information providing unit determined as the information request destination based on the similar keyword.
To do more,
The identification is performed by referring to the learning word storage unit to identify a synonymous keyword that matches the sorting word data, and when the identification fails, by referring to the synonym word storage unit, Identify synonymous keywords that match the retrieved synonym data,
The program according to appendix 20.

(付記22)
前記特定は、前記固定キーワードの特定と、前記連想キーワードの特定、及び、前記類義キーワードの特定の少なくとも1つとを所定の順番で実行する、
付記18から21のいずれか1つに記載のプログラム。
(Appendix 22)
The identification is performed in a predetermined order by identifying the fixed keyword, identifying the associative keyword, and identifying at least one of the similar keywords.
The program according to any one of appendices 18 to 21.

(付記23)
前記特定は、実行された全ての特定に失敗した場合に、所定の情報提供部を特定し、
前記情報要求は、前記発言テキストデータが品詞分解されることにより得られる少なくとも1つの単語データを検索キーワードとして用いて、前記所定の情報提供部に対し情報を要求する、
付記22に記載のプログラム。
(Appendix 23)
The identification specifies a predetermined information providing unit when all the identifications that have been executed fail,
The information request requests information from the predetermined information providing unit using at least one word data obtained by decomposing part of speech text data as a search keyword.
The program according to attachment 22.

(付記24)
前記振分けワード格納部は、前記各情報提供部について、更に、前記検索キーワードの条件情報、及び、該条件情報に対応するガイドデータをそれぞれ格納し、
前記少なくとも1つのコンピュータに、
前記情報要求に対する、情報要求先の情報提供部からの応答が、該情報要求と共に送られた前記検索キーワードに合致する情報がないことを示す場合に、前記検索キーワードとして用いられた単語データと、前記振分けワード格納部に格納される前記検索キーワードの条件情報とを比較し、該比較結果に対応する前記ガイドデータを前記ユーザに提供する、
ことを更に実行させる付記17から23のいずれか1つに記載のプログラム。
(Appendix 24)
The sorting word storage unit further stores condition information of the search keyword and guide data corresponding to the condition information for each information providing unit,
Said at least one computer,
When the response from the information requesting unit of the information request destination to the information request indicates that there is no information that matches the search keyword sent together with the information request, word data used as the search keyword; Comparing the search keyword condition information stored in the sorting word storage unit and providing the user with the guide data corresponding to the comparison result;
24. The program according to any one of appendices 17 to 23, further executing

1 音声対話サーバ装置(対話サーバ)
2 クライアント装置(クライアント)
5 情報提供サイト
10 CPU
11 メモリ
21 音声認識部
22 音声合成部
30 WEBサーバ処理部
31 対話制御エンジン
35 抽出部
36 連想単語取得部
37 類義語取得部
38 学習処理部
41 振分けワードDB
42 ユーザ学習DB
51 発言データ取得部
52 特定部
53 単語データ取得部
54 情報要求部
100 情報検索装置
101 振分けワード格納部
1 Voice dialogue server device (dialogue server)
2 Client device (client)
5 Information service site 10 CPU
DESCRIPTION OF SYMBOLS 11 Memory 21 Speech recognition part 22 Speech synthesis part 30 WEB server processing part 31 Dialog control engine 35 Extraction part 36 Associative word acquisition part 37 Synonym acquisition part 38 Learning processing part 41 Sorting word DB
42 User Learning DB
DESCRIPTION OF SYMBOLS 51 Remark data acquisition part 52 Identification part 53 Word data acquisition part 54 Information request part 100 Information search device 101 Sorting word storage part

Claims (15)

ユーザの発言テキストデータを取得する発言データ取得部と、
各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、前記発言データ取得部により取得される発言テキストデータに関連する振分けキーワードを特定する特定部と、
前記発言テキストデータが品詞分解されることにより得られる、前記特定部により特定される振分けキーワード以外の少なくとも1つの単語データを取得する単語データ取得部と、
前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される振分けキーワードに対応する情報提供部に対し情報を要求する情報要求部と、
を備える情報検索装置。
A remark data acquisition unit for acquiring remark text data of the user;
A specifying unit for specifying a distribution keyword related to the remark text data acquired by the remark data acquisition unit by referring to a distribution word storage unit that stores a distribution keyword for each information providing unit;
A word data acquisition unit that acquires at least one word data other than the sorting keyword specified by the specifying unit, obtained by decomposing part of speech of the remark text data;
Using at least one word data acquired by the word data acquiring unit as a search keyword, an information requesting unit that requests information from the information providing unit corresponding to the sorting keyword specified by the specifying unit;
An information retrieval apparatus comprising:
前記振分けキーワードには、固定文字列である固定キーワードが含まれ、
前記特定部は、前記発言データ取得部により取得される発言テキストデータに含まれる前記固定キーワードを特定し、
前記単語データ取得部は、前記発言テキストデータが品詞分解されることにより得られる、前記特定部により特定される固定キーワード以外の少なくとも1つの単語データを取得し、
前記情報要求部は、前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される固定キーワードに対応する情報提供部に対し情報を要求する、
請求項1に記載の情報検索装置。
The sorting keyword includes a fixed keyword that is a fixed character string,
The specifying unit specifies the fixed keyword included in the comment text data acquired by the comment data acquisition unit,
The word data acquisition unit acquires at least one word data other than the fixed keyword specified by the specifying unit, obtained by decomposing part of speech text data,
The information request unit requests information from the information providing unit corresponding to the fixed keyword specified by the specifying unit using at least one word data acquired by the word data acquiring unit as a search keyword.
The information search device according to claim 1.
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出する抽出部と、
前記抽出部により抽出される振分け用単語データの連想単語データを取得する連想単語取得部と、
を更に備え、
前記振分けキーワードには、前記固定キーワードの連想単語に相当する連想キーワードが含まれ、
前記特定部は、前記連想単語取得部により取得される連想単語データと一致する前記連想キーワードを特定し、
前記単語データ取得部は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求部は、前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される連想キーワードに対応する情報提供部に対し情報を要求する、
請求項2に記載の情報検索装置。
An extraction unit for extracting word data for sorting from word data obtained by decomposing part of speech of the remark text data;
An associative word acquisition unit for acquiring associative word data of the word data for distribution extracted by the extraction unit;
Further comprising
The distribution keyword includes an association keyword corresponding to the association keyword of the fixed keyword,
The identifying unit identifies the associated keyword that matches the associated word data acquired by the associated word acquiring unit,
The word data obtaining unit obtains at least one word data other than the sorting word data obtained by decomposing part of the speech text data;
The information requesting unit uses at least one word data acquired by the word data acquiring unit as a search keyword, and requests information from the information providing unit corresponding to the associative keyword specified by the specifying unit.
The information search device according to claim 2.
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出する抽出部と、
前記抽出部により抽出される振分け用単語データの類義語データを取得する類義語取得部と、
を更に備え、
前記振分けキーワードには、前記固定キーワードの類義語に相当する類義キーワードが含まれ、
前記特定部は、前記類義語取得部により取得される類義語データと一致する前記類義キーワードを特定し、
前記単語データ取得部は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求部は、前記単語データ取得部により取得される少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される類義キーワードに対応する情報提供部に対し情報を要求する、
請求項2又は3に記載の情報検索装置。
An extraction unit for extracting word data for sorting from word data obtained by decomposing part of speech of the remark text data;
A synonym acquisition unit for acquiring synonym data of the word data for sorting extracted by the extraction unit;
Further comprising
The distribution keyword includes a synonym keyword corresponding to a synonym of the fixed keyword,
The specifying unit specifies the synonym keyword that matches the synonym data acquired by the synonym acquisition unit,
The word data obtaining unit obtains at least one word data other than the sorting word data obtained by decomposing part of the speech text data;
The information request unit requests information from the information providing unit corresponding to the synonymous keyword specified by the specifying unit using at least one word data acquired by the word data acquiring unit as a search keyword.
The information search device according to claim 2 or 3.
前記特定部により特定され、情報要求先の決定に利用された類義キーワードを、該類義キーワードに基づいて該情報要求先に決定された情報提供部と関連付けて、学習ワード格納部に格納する学習処理部、
を更に備え、
前記特定部は、前記学習ワード格納部を参照することにより、前記振分け用単語データと一致する類義キーワードを特定し、特定に失敗した場合に、前記類義ワード格納部を参照することにより、前記類義語取得部により取得される類義語データと一致する類義キーワードを特定する、
請求項4に記載の情報検索装置。
The similar keyword specified by the specifying unit and used for determining the information request destination is stored in the learning word storage unit in association with the information providing unit determined by the information request destination based on the similar keyword. Learning processor,
Further comprising
The identifying unit identifies a synonymous keyword that matches the word data for sorting by referring to the learning word storage unit, and when the identification fails, by referring to the synonym word storage unit, Identify synonym keywords that match the synonym data acquired by the synonym acquisition unit;
The information search device according to claim 4.
前記特定部は、前記固定キーワードの特定と、前記連想キーワードの特定、及び、前記類義キーワードの特定の少なくとも1つとを所定の順番で実行する、
請求項2から5のいずれか1項に記載の情報検索装置。
The specifying unit executes the specification of the fixed keyword, the specification of the associative keyword, and the specification of at least one of the similar keywords in a predetermined order.
The information search device according to any one of claims 2 to 5.
前記特定部は、実行された全ての特定に失敗した場合に、所定の情報提供部を特定し、
前記情報要求部は、前記発言テキストデータが品詞分解されることにより得られる少なくとも1つの単語データを検索キーワードとして用いて、前記特定部により特定される前記所定の情報提供部に対し情報を要求する、
請求項6に記載の情報検索装置。
The identifying unit identifies a predetermined information providing unit when failing to identify all performed,
The information requesting unit requests information from the predetermined information providing unit specified by the specifying unit using at least one word data obtained by decomposing the speech text data as a search keyword. ,
The information search device according to claim 6.
前記振分けワード格納部は、前記各情報提供部について、更に、前記検索キーワードの条件情報、及び、該条件情報に対応するガイドデータをそれぞれ格納し、
前記情報要求部による情報要求に対する、情報要求先の情報提供部からの応答が、該情報要求と共に送られた前記検索キーワードに合致する情報がないことを示す場合に、前記単語データ取得部により取得され前記検索キーワードとして用いられた単語データと、前記振分けワード格納部に格納される前記検索キーワードの条件情報とを比較し、該比較結果に対応する前記ガイドデータを前記ユーザに提供するガイド提供部、
を更に備える請求項1から7のいずれか1項に記載の情報検索装置。
The sorting word storage unit further stores condition information of the search keyword and guide data corresponding to the condition information for each information providing unit,
Acquired by the word data acquisition unit when a response from the information requesting unit of the information request destination to the information request by the information request unit indicates that there is no information that matches the search keyword sent with the information request. The guide providing unit that compares the word data used as the search keyword with the search keyword condition information stored in the sorting word storage unit and provides the user with the guide data corresponding to the comparison result ,
The information search device according to any one of claims 1 to 7, further comprising:
少なくとも1つのコンピュータが、
ユーザの発言テキストデータを取得し、
各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、前記取得された発言テキストデータに関連する振分けキーワードを特定し、
前記発言テキストデータが品詞分解されることにより得られる、前記特定された振分けキーワード以外の少なくとも1つの単語データを取得し、
前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された振分けキーワードに対応する情報提供部に対し情報を要求する、
ことを含む情報検索方法。
At least one computer
Get user remark text data,
By identifying a distribution word storage unit that stores a distribution keyword for each information providing unit, the distribution keyword related to the acquired comment text data is specified,
Obtaining at least one word data other than the specified sorting keyword obtained by decomposing the speech text data into parts of speech;
Using the acquired at least one word data as a search keyword, and requesting information from the information providing unit corresponding to the specified sorting keyword;
Information retrieval method including that.
前記振分けキーワードには、固定文字列である固定キーワードが含まれ、
前記特定は、前記発言テキストデータに含まれる前記固定キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記特定された固定キーワード以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された固定キーワードに対応する情報提供部に対し情報を要求する、
請求項9に記載の情報検索方法。
The sorting keyword includes a fixed keyword that is a fixed character string,
The specifying specifies the fixed keyword included in the comment text data,
The word data is acquired by acquiring at least one word data other than the specified fixed keyword, which is obtained by decomposing part of speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from an information providing unit corresponding to the specified fixed keyword.
The information search method according to claim 9.
前記少なくとも1つのコンピュータが、
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出し、
前記抽出された振分け用単語データの連想単語データを取得する、
ことを更に含み、
前記振分けキーワードには、前記固定キーワードの連想単語に相当する連想キーワードが含まれ、
前記特定は、前記取得された連想単語データと一致する前記連想キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された連想キーワードに対応する情報提供部に対し情報を要求する、
請求項10に記載の情報検索方法。
The at least one computer comprises:
From the word data obtained by decomposing the speech text data, the word data for sorting is extracted,
Obtaining associative word data of the extracted word data for sorting,
Further including
The distribution keyword includes an association keyword corresponding to the association keyword of the fixed keyword,
The identification identifies the association keyword that matches the acquired association word data,
The word data is acquired by acquiring at least one word data other than the sorting word data obtained by decomposing part of the speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from the information providing unit corresponding to the identified associative keyword.
The information search method according to claim 10.
前記少なくとも1つのコンピュータが、
前記発言テキストデータが品詞分解されることにより得られる単語データの中から、振分け用単語データを抽出し、
前記抽出された振分け用単語データの類義語データを取得する、
ことを更に含み、
前記振分けキーワードには、前記固定キーワードの類義語に相当する類義キーワードが含まれ、
前記特定は、前記取得された類義語データと一致する前記類義キーワードを特定し、
前記単語データの取得は、前記発言テキストデータが品詞分解されることにより得られる、前記振分け用単語データ以外の少なくとも1つの単語データを取得し、
前記情報要求は、前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された類義キーワードに対応する情報提供部に対し情報を要求する、
請求項10又は11に記載の情報検索方法。
The at least one computer comprises:
From the word data obtained by decomposing the speech text data, the word data for sorting is extracted,
Obtaining synonym data of the extracted word data for sorting,
Further including
The distribution keyword includes a synonym keyword corresponding to a synonym of the fixed keyword,
The specifying specifies the synonymous keyword that matches the acquired synonym data,
The word data is acquired by acquiring at least one word data other than the sorting word data obtained by decomposing part of the speech text data,
The information request uses the acquired at least one word data as a search keyword to request information from an information providing unit corresponding to the specified synonymous keyword,
The information search method according to claim 10 or 11.
前記少なくとも1つのコンピュータが、
情報要求先の決定に利用された類義キーワードを、該類義キーワードに基づいて該情報要求先に決定された情報提供部と関連付けて、学習ワード格納部に格納する、
ことを更に含み、
前記特定は、前記学習ワード格納部を参照することにより、前記振分け用単語データと一致する類義キーワードを特定し、特定に失敗した場合に、前記類義ワード格納部を参照することにより、前記取得された類義語データと一致する類義キーワードを特定する、
請求項12に記載の情報検索方法。
The at least one computer comprises:
The similar keyword used for determining the information request destination is stored in the learning word storage unit in association with the information providing unit determined as the information request destination based on the similar keyword.
Further including
The identification is performed by referring to the learning word storage unit to identify a synonymous keyword that matches the sorting word data, and when the identification fails, by referring to the synonym word storage unit, Identify synonymous keywords that match the retrieved synonym data,
The information search method according to claim 12.
前記振分けワード格納部は、前記各情報提供部について、更に、前記検索キーワードの条件情報、及び、該条件情報に対応するガイドデータをそれぞれ格納し、
前記少なくとも1つのコンピュータが、
前記情報要求に対する、情報要求先の情報提供部からの応答が、該情報要求と共に送られた前記検索キーワードに合致する情報がないことを示す場合に、前記検索キーワードとして用いられた単語データと、前記振分けワード格納部に格納される前記検索キーワードの条件情報とを比較し、該比較結果に対応する前記ガイドデータを前記ユーザに提供する、
ことを更に含む請求項9から13のいずれか1項に記載の情報検索方法。
The sorting word storage unit further stores condition information of the search keyword and guide data corresponding to the condition information for each information providing unit,
The at least one computer comprises:
When the response from the information requesting unit of the information request destination to the information request indicates that there is no information that matches the search keyword sent together with the information request, word data used as the search keyword; Comparing the search keyword condition information stored in the sorting word storage unit and providing the user with the guide data corresponding to the comparison result;
The information retrieval method according to claim 9, further comprising:
少なくとも1つのコンピュータに、
ユーザの発言テキストデータを取得し、
各情報提供部について振分けキーワードをそれぞれ格納する振分けワード格納部を参照することにより、前記取得された発言テキストデータに関連する振分けキーワードを特定し、
前記発言テキストデータが品詞分解されることにより得られる、前記特定された振分けキーワード以外の少なくとも1つの単語データを取得し、
前記取得された少なくとも1つの単語データを検索キーワードとして用いて、前記特定された振分けキーワードに対応する情報提供部に対し情報を要求する、
ことを実行させるプログラム。
On at least one computer,
Get user remark text data,
By identifying a distribution word storage unit that stores a distribution keyword for each information providing unit, the distribution keyword related to the acquired comment text data is specified,
Obtaining at least one word data other than the specified sorting keyword obtained by decomposing the speech text data into parts of speech;
Using the acquired at least one word data as a search keyword, and requesting information from the information providing unit corresponding to the specified sorting keyword;
A program that lets you do that.
JP2012265504A 2012-12-04 2012-12-04 Information search device and information search method Pending JP2014110005A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012265504A JP2014110005A (en) 2012-12-04 2012-12-04 Information search device and information search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012265504A JP2014110005A (en) 2012-12-04 2012-12-04 Information search device and information search method

Publications (1)

Publication Number Publication Date
JP2014110005A true JP2014110005A (en) 2014-06-12

Family

ID=51030579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012265504A Pending JP2014110005A (en) 2012-12-04 2012-12-04 Information search device and information search method

Country Status (1)

Country Link
JP (1) JP2014110005A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190115405A (en) * 2018-04-02 2019-10-11 페가트론 코포레이션 Search method and electronic device using the method
CN110413875A (en) * 2019-06-26 2019-11-05 腾讯科技(深圳)有限公司 A kind of method and relevant apparatus of text information push
JPWO2019103006A1 (en) * 2017-11-24 2020-12-17 株式会社Nttドコモ Information processing device and information processing method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2019103006A1 (en) * 2017-11-24 2020-12-17 株式会社Nttドコモ Information processing device and information processing method
KR20190115405A (en) * 2018-04-02 2019-10-11 페가트론 코포레이션 Search method and electronic device using the method
KR102140391B1 (en) * 2018-04-02 2020-08-03 페가트론 코포레이션 Search method and electronic device using the method
CN110413875A (en) * 2019-06-26 2019-11-05 腾讯科技(深圳)有限公司 A kind of method and relevant apparatus of text information push

Similar Documents

Publication Publication Date Title
US10657966B2 (en) Better resolution when referencing to concepts
US10963499B2 (en) Generating command-specific language model discourses for digital assistant interpretation
US9330661B2 (en) Accuracy improvement of spoken queries transcription using co-occurrence information
US9251786B2 (en) Method, medium and apparatus for providing mobile voice web service
US8521766B1 (en) Systems and methods for providing information discovery and retrieval
US8825661B2 (en) Systems and methods for two stream indexing of audio content
US10698654B2 (en) Ranking and boosting relevant distributable digital assistant operations
US10963495B2 (en) Automated discourse phrase discovery for generating an improved language model of a digital assistant
US10929613B2 (en) Automated document cluster merging for topic-based digital assistant interpretation
US20080114747A1 (en) Speech interface for search engines
CN111213136A (en) Generation of domain-specific models in networked systems
CN113343108B (en) Recommended information processing method, device, equipment and storage medium
US20050010422A1 (en) Speech processing apparatus and method
CN110692042A (en) Platform selection to perform requested actions in an audio-based computing environment
CN108710653B (en) On-demand method, device and system for reading book
WO2020233381A1 (en) Speech recognition-based service request method and apparatus, and computer device
JP6179971B2 (en) Information providing apparatus and information providing method
US20140351232A1 (en) Accessing enterprise data using a natural language-based search
JP2014110005A (en) Information search device and information search method
RU2631975C2 (en) Method and system for user input command processing
JP4962416B2 (en) Speech recognition system
JP5688754B2 (en) Information retrieval apparatus and computer program
CN108595470B (en) Audio paragraph collection method, device and system and computer equipment
JP6640519B2 (en) Information analysis device and information analysis method
JP2014109998A (en) Interactive apparatus and computer interactive method

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20140613