JP2017072964A - Information analyzing apparatus and information analyzing method - Google Patents

Information analyzing apparatus and information analyzing method Download PDF

Info

Publication number
JP2017072964A
JP2017072964A JP2015199094A JP2015199094A JP2017072964A JP 2017072964 A JP2017072964 A JP 2017072964A JP 2015199094 A JP2015199094 A JP 2015199094A JP 2015199094 A JP2015199094 A JP 2015199094A JP 2017072964 A JP2017072964 A JP 2017072964A
Authority
JP
Japan
Prior art keywords
information
word data
category
data
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015199094A
Other languages
Japanese (ja)
Other versions
JP6640519B2 (en
Inventor
裕一郎 田島
Yuichiro Tajima
裕一郎 田島
欽也 札野
Kinya Satsuno
欽也 札野
友謙 佐々木
Tomonori Sasaki
友謙 佐々木
征一郎 松谷
Seiichiro Matsutani
征一郎 松谷
健太 笠原
Kenta Kasahara
健太 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2015199094A priority Critical patent/JP6640519B2/en
Publication of JP2017072964A publication Critical patent/JP2017072964A/en
Application granted granted Critical
Publication of JP6640519B2 publication Critical patent/JP6640519B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technology of presenting desired information to a user.SOLUTION: An information analyzing apparatus includes: an acquisition unit for acquiring multiple pieces of word data generated by user action; a specifying unit which specifies a provision category corresponding to the acquired multiple pieces of word data, from among a plurality of provision categories; a selection unit which determines whether the acquired word data belongs to a query category associated with the specified provision category, on the basis of query relation information including the provision categories, query categories, and a multiple pieces of keyword information data, to select word data to be used for a search keyword from among the acquired word data; and a search control unit which requests for a search using the selected word data, as a search keyword, for the information provided from an information providing destination corresponding to the specified provision category.SELECTED DRAWING: Figure 11

Description

本発明は、ユーザに情報を提供するための情報分析技術に関する。   The present invention relates to an information analysis technique for providing information to a user.

情報通信技術の急速な進歩に伴い、近年、デジタルデバイドの問題が指摘されている。この問題は、IT(Information Technology)機器に対する不慣れさのみならず、入手可能な情報量の膨大さにも起因する。IT機器を或る程度利用できる者であっても、膨大な情報の中から有益な情報を探すのは大変困難な状況となっている。   With the rapid progress of information and communication technology, the problem of digital divide has been pointed out in recent years. This problem is caused not only by unfamiliarity with IT (Information Technology) equipment but also by the huge amount of information that can be obtained. Even those who can use IT equipment to a certain extent find it very difficult to find useful information from a vast amount of information.

下記特許文献1には、大量の文書に対する検索を短時間で高精度に行う情報処理装置が記載されている。この情報処理装置は、文書等を登録対象データとして取得し、そのデータの言語解析により得られる単語データに基づいて、その登録対象データを分類してその登録先を決定する。更に、この装置は、取得されたクエリに含まれる単語間の関係と検索対象となる文書に含まれる単語間の関係とを比較して、クエリと文書中の文との類似度を算出し、検索結果リストを一致度の高い順に一覧表示する。また、下記特許文献2には、先行の検索結果データからカテゴリ同義語を推定する方法が記載されている。この方法では、先行の結果データに関するクエリ情報及びカテゴリ情報を含む先行のクエリデータが識別され、クエリ情報がカテゴリ情報の同義語であるか否かが判断される。そして、同義語で有ると判断された場合、後続の検索要求でクエリ情報及びカテゴリ情報が使用される。   Patent Document 1 listed below describes an information processing apparatus that performs high-accuracy searches for a large number of documents in a short time. This information processing apparatus acquires a document or the like as registration target data, classifies the registration target data based on word data obtained by language analysis of the data, and determines a registration destination. Further, the apparatus compares the relationship between the words included in the acquired query with the relationship between the words included in the document to be searched, and calculates the similarity between the query and the sentence in the document, List the search result list in descending order of match. Patent Document 2 below describes a method for estimating a category synonym from previous search result data. In this method, prior query data including query information and category information related to previous result data is identified, and it is determined whether the query information is a synonym for category information. And when it is judged that it is a synonym, query information and category information are used by a subsequent search request.

下記特許文献3には、ユーザに所望の情報をスムーズに入手させることを可能とする情報検索装置が記載されている。この情報検索装置は、ユーザの発言テキストデータに関連する振分けキーワードを特定し、その特定された振分けキーワードに対応する情報提供部(例えば、サイト)に対して情報を要求する。このとき、その装置は、発言テキストデータが品詞分解されることにより得られる、振分けキーワード以外の少なくとも1つの単語データを検索キーワードとして用いる。   Patent Document 3 listed below describes an information search apparatus that allows a user to obtain desired information smoothly. This information search device specifies a distribution keyword related to the user's comment text data, and requests information from an information providing unit (for example, a site) corresponding to the specified distribution keyword. At this time, the apparatus uses, as a search keyword, at least one word data other than the sorting keyword obtained by decomposing speech text data.

特開2006−227823号公報JP 2006-227823 A 特表2009−516890号公報Special table 2009-516890 特開2014−110005号公報JP 2014-110005 A

上述の特許文献1及び2に記載される手法では、高精度な検索のために適切な単語を含むクエリが用いられる必要があり、ユーザの能力への依存度が高いように思われる。また、特許文献3に記載される手法においても、提供する情報をユーザの興味により一層近付けるための工夫の余地は残されているように思われる。   In the methods described in Patent Documents 1 and 2 described above, a query including an appropriate word needs to be used for high-accuracy search, and it seems that the degree of dependence on the user's ability is high. In addition, in the technique described in Patent Document 3, it seems that there is still room for ingenuity to make the provided information closer to the user's interest.

本発明は、このような事情に鑑みてなされたものであり、ユーザに所望の情報を提供する技術を実現する。   This invention is made | formed in view of such a situation, and implement | achieves the technique which provides a user with desired information.

本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。   Each aspect of the present invention employs the following configurations in order to solve the above-described problems.

第一の側面は、情報分析装置に関する。第一の側面に係る情報分析装置は、ユーザの動作に起因して生成された複数の単語データを取得する取得手段と、複数の提供先カテゴリの中から、前記取得された複数の単語データに対応する提供先カテゴリを特定する特定手段と、前記複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定することにより、前記取得された複数の単語データの中から検索キーワードに用いる単語データを選択する選択手段と、前記特定された提供先カテゴリに対応する情報提供先から提供される情報に対する前記選択された単語データを検索キーワードとして用いた検索を要求する検索制御手段と、を備える。   The first aspect relates to an information analysis apparatus. The information analysis apparatus according to the first aspect includes an acquisition unit configured to acquire a plurality of word data generated due to a user's action, and a plurality of acquired destination data from the plurality of provision destination categories. Based on query relation information indicating a relationship between a plurality of destination categories and a plurality of query categories and a relationship between the plurality of query categories and a plurality of keyword information data, a specifying unit for identifying a corresponding destination category, Word data used as a search keyword from the plurality of acquired word data by determining whether or not each acquired word data belongs to a query category associated with the specified provider category Selecting means for selecting the information provided from the information providing destination corresponding to the specified providing destination category; It includes a search control means for requesting a search using the word data as a search keyword, a.

第二の側面は、少なくとも一つのコンピュータにより実行される情報分析方法に関する。第二の側面に係る情報分析方法は、ユーザの動作に起因して生成された複数の単語データを取得し、複数の提供先カテゴリの中から、前記取得された少なくとも一つの単語データに対応する提供先カテゴリを特定し、前記複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定し、前記判定の結果に基づいて、前記取得された複数の単語データの中から検索キーワードに用いる単語データを選択し、前記特定された提供先カテゴリに対応する情報提供先から提供される情報に対する前記選択された単語データを検索キーワードとして用いた検索を要求する、ことを含む。   The second aspect relates to an information analysis method executed by at least one computer. The information analysis method according to the second aspect acquires a plurality of word data generated due to a user's action and corresponds to the acquired at least one word data from a plurality of provision destination categories. Each of the acquired categories is specified based on the query relationship information indicating the relationship between the plurality of destination categories and the plurality of query categories and the relationship between the plurality of query categories and the plurality of keyword information data. Words that determine whether or not the word data belongs to a query category associated with the specified provider category, and a word that is used as a search keyword from the plurality of acquired word data based on the determination result The selected word data for information provided from an information providing destination corresponding to the specified providing destination category by selecting data Requesting a search using as a search keyword includes.

なお、本発明の他の側面は、上記第二の側面の方法を少なくとも1つのコンピュータに実行させるプログラム又はこのようなプログラムを記録したコンピュータが読み取り可能な記録媒体である。この記録媒体は、非一時的な有形の媒体を含む。   Another aspect of the present invention is a program that causes at least one computer to execute the method according to the second aspect, or a computer-readable recording medium that records such a program. This recording medium includes a non-transitory tangible medium.

上記各側面によれば、ユーザに所望の情報を提供する技術を実現することができる。   According to each said aspect, the technique which provides a user with desired information is realizable.

第一実施形態における情報分析装置(分析装置)のハードウェア構成例を概念的に示す図である。It is a figure which shows notionally the hardware structural example of the information analysis apparatus (analysis apparatus) in 1st embodiment. 第一実施形態における情報分析装置(分析装置)の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the information analyzer (analyzer) in 1st embodiment. キーワードの提供先関係テーブルの例を示す図である。It is a figure which shows the example of the provision destination relation table of a keyword. キーワードのクエリカテゴリテーブルの例を示す図である。It is a figure which shows the example of the query category table of a keyword. キーワードのクエリワードテーブルの例を示す図である。It is a figure which shows the example of the query word table of a keyword. 第一実施形態における情報分析装置(分析装置)の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the information analysis apparatus (analysis apparatus) in 1st embodiment. 第一実施形態における情報分析装置(分析装置)の一動作例のフロー及びデータの処理例を示す図である。It is a figure which shows the example of the flow of one operation example of the information analysis apparatus (analysis apparatus) in 1st embodiment, and the data processing example. 第二実施形態における情報分析装置(分析装置)の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the information analyzer (analyzer) in 2nd embodiment. 第二実施形態における情報分析装置(分析装置)の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the information analysis apparatus (analysis apparatus) in 2nd embodiment. 第二実施形態における情報分析装置(分析装置)の一動作例のフロー及びデータの処理例を示す図である。It is a figure which shows the flow of one operation example of the information analysis apparatus (analysis apparatus) in 2nd embodiment, and the example of a data processing. 第三実施形態における情報分析装置の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the information analyzer in 3rd embodiment.

以下、本発明の実施の形態について説明する。なお、以下に挙げる各実施形態はそれぞれ例示であり、本発明は以下の実施形態の構成に限定されない。   Embodiments of the present invention will be described below. In addition, each embodiment given below is an illustration, respectively, and this invention is not limited to the structure of the following embodiment.

[第一実施形態]
以下、第一実施形態における情報分析装置及び情報分析方法について説明する。
〔装置構成〕
図1は、第一実施形態における情報分析装置(以降、分析装置と略称する場合もある)10のハードウェア構成例を概念的に示す図である。分析装置10は、通信網5を介して、ユーザが利用するクライアント装置8及び情報提供サイト7に通信可能に接続される。通信網5は、インターネット等のような公衆網、WAN(Wide Area Network)、LAN(Local Area Network)、無線通信ネットワーク等である。なお、本実施形態において、分析装置10、情報提供サイト7及びクライアント装置8の間の通信形態は限定されない。
[First embodiment]
Hereinafter, an information analysis apparatus and an information analysis method in the first embodiment will be described.
〔Device configuration〕
FIG. 1 is a diagram conceptually illustrating a hardware configuration example of an information analysis apparatus (hereinafter sometimes abbreviated as an analysis apparatus) 10 in the first embodiment. The analysis device 10 is communicably connected to the client device 8 and the information providing site 7 used by the user via the communication network 5. The communication network 5 is a public network such as the Internet, a WAN (Wide Area Network), a LAN (Local Area Network), a wireless communication network, or the like. In the present embodiment, the communication mode among the analysis device 10, the information providing site 7, and the client device 8 is not limited.

分析装置10は、一般的なコンピュータであり、図1に示されるようなハードウェア要素を有する。具体的には、分析装置10は、ハードウェア構成として、CPU(Central Processing Unit)1、メモリ2、入出力インタフェース(I/F)3、通信ユニット4等を有する。これら各ハードウェア要素はバスにより接続される。   The analysis apparatus 10 is a general computer and has hardware elements as shown in FIG. Specifically, the analysis apparatus 10 includes a CPU (Central Processing Unit) 1, a memory 2, an input / output interface (I / F) 3, a communication unit 4, and the like as a hardware configuration. Each of these hardware elements is connected by a bus.

CPU1には、一般的なCPUに加えて、特定用途向け集積回路(ASIC)、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)等も含まれる。
メモリ2は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)である。
In addition to a general CPU, the CPU 1 includes an application specific integrated circuit (ASIC), a DSP (Digital Signal Processor), a GPU (Graphics Processing Unit), and the like.
The memory 2 is a RAM (Random Access Memory), a ROM (Read Only Memory), or an auxiliary storage device (such as a hard disk).

入出力I/F3は、表示装置(図示せず)、入力装置(図示せず)等のユーザインタフェース装置と接続可能である。表示装置は、LCD(Liquid Crystal Display)やCRT(Cathode Ray Tube)ディスプレイのような、CPU1により処理された描画データに対応する画面を表示する装置である。入力装置は、キーボード、マウス等のようなユーザ操作の入力を受け付ける装置である。表示装置及び入力装置は一体化され、タッチパネルとして実現されてもよい。   The input / output I / F 3 can be connected to a user interface device such as a display device (not shown) or an input device (not shown). The display device is a device that displays a screen corresponding to the drawing data processed by the CPU 1, such as an LCD (Liquid Crystal Display) or a CRT (Cathode Ray Tube) display. The input device is a device that receives an input of a user operation such as a keyboard and a mouse. The display device and the input device may be integrated and realized as a touch panel.

通信ユニット4は、他のコンピュータとの通信網5を介した通信や、他の機器との信号のやりとり等を行う。通信ユニット4には、可搬型記録媒体等も接続され得る。分析装置10は、図1に図示しないハードウェア要素を含んでもよく、各ハードウェア要素の数も図1に示される数に制限されない。例えば、分析装置10は、複数のCPU1や複数のメモリ2を有する。分析装置10のハードウェア構成は制限されない。   The communication unit 4 communicates with other computers via the communication network 5 and exchanges signals with other devices. A portable recording medium or the like can be connected to the communication unit 4. The analysis apparatus 10 may include hardware elements not shown in FIG. 1, and the number of hardware elements is not limited to the number shown in FIG. For example, the analysis device 10 includes a plurality of CPUs 1 and a plurality of memories 2. The hardware configuration of the analyzer 10 is not limited.

情報提供サイト7は、一般的なコンピュータであり、WEBサーバ、データベースサーバ等のような各種情報を提供するサーバ装置である。本実施形態は、情報提供サイト7のハードウェア構成及びソフトウェア構成を制限しない。以降、情報提供サイト7は、サイト7と略称される場合もある。   The information providing site 7 is a general computer, and is a server device that provides various types of information such as a WEB server and a database server. The present embodiment does not limit the hardware configuration and software configuration of the information providing site 7. Hereinafter, the information providing site 7 may be abbreviated as the site 7.

分析装置10は、1以上のサイト7と通信可能に接続される。本実施形態において分析装置10がアクセスするサイト7の数は制限されない。分析装置10は、サイト7により提供される大量の情報の中から各ユーザが欲しいと推測される情報をピックアップして、所望の情報をユーザ(クライアント装置8)に提供する。   The analysis device 10 is connected to one or more sites 7 so as to be communicable. In the present embodiment, the number of sites 7 accessed by the analysis apparatus 10 is not limited. The analysis device 10 picks up information that each user is supposed to want from the large amount of information provided by the site 7 and provides the user (client device 8) with desired information.

クライアント装置8は、PC(Personal Computer)、タブレット端末、スマートフォン、携帯電話等のような一般的なユーザ端末である。また、クライアント装置8は、ユーザインタフェースを備えるコミュニケーションロボットであってもよい。クライアント装置8は、分析装置10により提供される情報をユーザに向けて出力することができ、かつユーザからの入力を受けることができる装置であれば、そのハードウェア構成及びソフトウェア構成は制限されない。情報は、表示装置、プリンタ装置、音声出力装置等により出力可能である。また、ユーザからの入力は、キーボード、マウス等のようなユーザ操作の入力を受け付ける入力装置(図示せず)、ユーザの発言音声を取得するマイク(図示せず)、ユーザのジェスチャを撮像するカメラ等により受けることができる。以降、クライアント装置8は、クライアント8と略称する場合もある。   The client device 8 is a general user terminal such as a PC (Personal Computer), a tablet terminal, a smartphone, a mobile phone, or the like. The client device 8 may be a communication robot having a user interface. The hardware configuration and the software configuration of the client device 8 are not limited as long as the client device 8 can output information provided by the analysis device 10 to the user and can receive input from the user. Information can be output by a display device, a printer device, an audio output device, or the like. In addition, an input from a user is an input device (not shown) that accepts an input of a user operation such as a keyboard and a mouse, a microphone (not shown) that acquires a user's speech, and a camera that captures a user's gesture. Etc. can be received. Hereinafter, the client device 8 may be abbreviated as a client 8.

クライアント8は、ユーザの動作に起因して取得された文字列データを分析装置10に送る。具体的には、クライアント8は、入力装置に対するユーザ操作により入力された文字列データを取得する。例えば、ブラウザに対して入力された検索文字列、カレンダアプリケーションに対して入力されたスケジュール文字列、メモ書き等、あらゆる文字列データが取得され得る。   The client 8 sends the character string data acquired due to the user's operation to the analysis device 10. Specifically, the client 8 acquires character string data input by a user operation on the input device. For example, any character string data such as a search character string input to the browser, a schedule character string input to the calendar application, and a memo can be acquired.

また、クライアント8は、マイクロフォンで集音されたユーザの音声を録音し、その録音された音声データを分析装置10に送ることもできる。クライアント8は、既知の音声認識技術を用いてその音声データから文字列データを取得し、この文字列データを分析装置10に送ってもよい。   The client 8 can also record the user's voice collected by the microphone and send the recorded voice data to the analyzer 10. The client 8 may acquire character string data from the voice data using a known voice recognition technique and send the character string data to the analysis device 10.

本実施形態では、当該文字列データ又は当該音声データがユーザの動作に起因するものであれば、クライアント8による当該文字列データ又は当該音声データの取得手法は制限されない。例えば、クライアント8にインストールされたアプリケーション(WEBブラウザを含む)が周知の技術を用いて当該文字列データ又は当該音声データを取得し、取得されたデータを分析装置10に送る。また、クライアント8は、取得された文字列データを品詞分解することにより単語データを抽出し、抽出された単語データを分析装置10に送信することもできる。   In the present embodiment, as long as the character string data or the voice data is caused by the user's action, the acquisition method of the character string data or the voice data by the client 8 is not limited. For example, an application (including a WEB browser) installed in the client 8 acquires the character string data or the voice data using a known technique, and sends the acquired data to the analysis apparatus 10. Further, the client 8 can extract word data by decomposing the acquired character string data into parts of speech, and can transmit the extracted word data to the analysis device 10.

〔処理構成〕
図2は、第一実施形態における分析装置10の処理構成例を概念的に示す図である。分析装置10は、図2に示されるようなソフトウェア要素を有する。具体的には、分析装置10は、取得部11、ユーザ単語DB(DataBase)12、キーワードDB(DataBase)13、特定部14、選択部15、検索制御部16、出力処理部17等を有する。これら各ソフトウェア要素は、例えば、CPU1によりメモリ2に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD(Compact Disc)、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F3又は通信ユニット4を介してインストールされ、メモリ2に格納されてもよい。
[Processing configuration]
FIG. 2 is a diagram conceptually illustrating a processing configuration example of the analysis apparatus 10 in the first embodiment. The analyzer 10 has software elements as shown in FIG. Specifically, the analysis apparatus 10 includes an acquisition unit 11, a user word DB (DataBase) 12, a keyword DB (DataBase) 13, a specifying unit 14, a selection unit 15, a search control unit 16, an output processing unit 17, and the like. Each of these software elements is realized, for example, by executing a program stored in the memory 2 by the CPU 1. In addition, the program is installed from a portable recording medium such as a CD (Compact Disc) or a memory card or another computer on the network via the input / output I / F 3 or the communication unit 4 and is stored in the memory 2. It may be stored.

取得部11は、クライアント8又は他の装置から文字列データ又は音声データを受信する場合には、受信された文字列データ又は音声データから1以上の単語データを抽出する。具体的には、取得部11は、受信された文字列データを品詞分解(形態素解析)することにより1以上の単語データを抽出する。形態素解析には、MeCab等のような様々な既知の手法が利用可能である。例えば、取得部11は、各種品詞の単語の中から、名詞、動詞などの特定の品詞の単語データのみを取得してもよい。更に、取得部11は、名詞の中でも、一般名詞、固有名詞、サ変接続名詞といった特定の名詞の単語データのみを取得することもできるし、取得された動詞を基本形に正規化することもできる。   When the acquisition unit 11 receives character string data or voice data from the client 8 or another device, the acquisition unit 11 extracts one or more word data from the received character string data or voice data. Specifically, the acquisition unit 11 extracts one or more word data by performing part-of-speech decomposition (morphological analysis) on the received character string data. Various known methods such as MeCab can be used for morphological analysis. For example, the acquisition unit 11 may acquire only word data of specific parts of speech such as nouns and verbs from words of various parts of speech. Furthermore, the acquisition unit 11 can also acquire only word data of specific nouns such as general nouns, proper nouns, and sagittal connection nouns among nouns, and can also normalize the acquired verbs to basic forms.

取得部11は、音声データに対して既知の音声認識技術を適用することにより、ユーザの声がテキスト化された文字列データを取得し、この文字列データを品詞分解することもできる。上述のような品詞分解又は音声認識がクライアント8上で実行される場合には、取得部11は、クライアント8により抽出された当該複数の単語データをクライアント8から受信してもよい。   The acquisition unit 11 can acquire character string data in which a user's voice is converted into text by applying a known voice recognition technique to the voice data, and can also decompose the part of speech of the character string data. When the part-of-speech decomposition or speech recognition as described above is executed on the client 8, the acquisition unit 11 may receive the plurality of word data extracted by the client 8 from the client 8.

取得部11は、取得された単語データを送信元のユーザ又はクライアント8の識別情報と関連付けてユーザ単語DB12に格納する。ユーザの識別情報が利用される場合、取得部11は、単語データ又はその単語データの元となるデータと共に、ユーザの識別情報をクライアント8から受信する。取得部11は、単語データの取得日時をその単語データと関連付けて更にユーザ単語DB12に格納してもよい。   The acquisition unit 11 stores the acquired word data in the user word DB 12 in association with the identification information of the transmission source user or the client 8. When the user identification information is used, the acquisition unit 11 receives the user identification information from the client 8 together with the word data or the data that is the basis of the word data. The acquisition unit 11 may further store the acquisition date and time of the word data in the user word DB 12 in association with the word data.

更に、取得部11は、任意のタイミングで、ユーザ単語DB12から当該複数の単語データをユーザ毎に取得する。任意のタイミングは、ランダムなタイミング、所定の周期を含む。このとき、取得部11は、ユーザ単語DB12において、ユーザ毎に蓄積される複数の単語データの中から、ユーザの興味や関心を強く示す単語データを取得することが望ましい。ユーザの興味や関心の強さは、例えば、単語データの発生頻度により判断することができる。取得部11は、ユーザ単語DB12に単語データが格納されている全ユーザを対象にして単語データの抽出を行ってもよいし、ユーザ毎のログイン状況に基づいて、ログイン中のユーザのみに関して、ユーザ単語DB12から当該複数の単語データを抽出してもよい。   Furthermore, the acquisition unit 11 acquires the plurality of word data for each user from the user word DB 12 at an arbitrary timing. The arbitrary timing includes random timing and a predetermined cycle. At this time, it is desirable for the acquisition unit 11 to acquire word data that strongly indicates the user's interest or interest from among a plurality of word data accumulated for each user in the user word DB 12. The user's interest and the intensity of interest can be determined by, for example, the occurrence frequency of word data. The acquisition unit 11 may extract word data for all users whose word data is stored in the user word DB 12, or based on the login status of each user, only the logged-in users The plurality of word data may be extracted from the word DB 12.

後述する特定部14、選択部15、検索制御部16及び出力処理部17は、取得部11により取得された単語データに基づいて、処理を行う。一方、取得部11は、上述したとおり、クライアント8から送られるデータから直接的に単語データを取得する場合と、ユーザ単語DB12から自発的に単語データを取得する場合とをサポートする。前者は、ユーザの動作が契機となるため、受動的な動作と表現でき、後者は、自発的又は能動的な動作と表現できる。よって、以降、クライアント8から送られるデータから直接的に取得された単語データに基づいて動作するモードをパッシブ動作モードと表記し、ユーザ単語DB12から取得された単語データに基づいて動作するモードをアクティブ動作モードと表記する。   The specifying unit 14, the selection unit 15, the search control unit 16, and the output processing unit 17 described later perform processing based on the word data acquired by the acquisition unit 11. On the other hand, as described above, the acquisition unit 11 supports the case of acquiring word data directly from the data sent from the client 8 and the case of acquiring word data spontaneously from the user word DB 12. The former can be expressed as a passive operation because the user's operation is triggered, and the latter can be expressed as a spontaneous or active operation. Therefore, hereinafter, the mode that operates based on the word data directly acquired from the data sent from the client 8 is referred to as a passive operation mode, and the mode that operates based on the word data acquired from the user word DB 12 is active. Indicated as operation mode.

ユーザ単語DB12は、ユーザ毎に、ユーザの動作に起因して生成された単語データを蓄積する。具体的には、ユーザ単語DB12は、ユーザ又はクライアント8の識別情報と単語データとを相互に関連付けて格納する。ユーザ単語DB12は、一ユーザに関して同一単語データを複数重複して格納してもよいし、重複を排除して、一ユーザに関して一単語データ及び発生回数を格納してもよい。また、ユーザ単語DB12は、ユーザ毎に、単語データ及びその単語データの取得日時を格納してもよい。   User word DB12 accumulate | stores the word data produced | generated based on a user's operation | movement for every user. Specifically, the user word DB 12 stores the identification information of the user or client 8 and the word data in association with each other. The user word DB 12 may store a plurality of the same word data for one user, or may store one word data and the number of occurrences for one user by eliminating the duplication. Further, the user word DB 12 may store word data and acquisition date and time of the word data for each user.

キーワードDB13は、提供先関係テーブル、クエリカテゴリテーブル及びクエリワードテーブルを含む。   The keyword DB 13 includes a provider relationship table, a query category table, and a query word table.

提供先関係テーブルは、提供先カテゴリと提供先キーワードとの関係を示す提供先関係情報を格納する。具体的には、提供先関係テーブルは、提供先カテゴリの識別情報と提供先キーワードのキーワードデータとを相互に関連付けて格納する。各提供先カテゴリは、各サイト7が提供している情報のカテゴリを示し、対応するカテゴリの情報を提供するサイト7に対応付けられる。提供先カテゴリの識別情報とサイト7のアドレス情報とが別途対応付けられている。サイト7のアドレス情報は、URL(Uniform Resource Locator)のような、サイト7により提供されている情報を取得するための情報である。提供先キーワードは、提供先カテゴリに何らかの関係を有する単語である。例えば、提供先カテゴリに属する意味を持つ単語が提供先キーワードとして格納される。また、提供先カテゴリに間接的に関係する単語が提供先キーワードとして格納されてもよい。   The providing destination relationship table stores providing destination relationship information indicating the relationship between the providing destination category and the providing destination keyword. Specifically, the provision destination relation table stores identification information of the provision destination category and keyword data of the provision destination keyword in association with each other. Each provision destination category indicates a category of information provided by each site 7 and is associated with the site 7 that provides information of the corresponding category. The identification information of the provider category is associated with the address information of the site 7 separately. The address information of the site 7 is information for acquiring information provided by the site 7 such as a URL (Uniform Resource Locator). The provision destination keyword is a word having some relationship with the provision destination category. For example, a word having a meaning belonging to the provision destination category is stored as the provision destination keyword. In addition, a word indirectly related to the provision destination category may be stored as the provision destination keyword.

図3は、キーワードDB13の提供先関係テーブルの例を示す図である。図3では、分かり易くするために、提供先カテゴリの識別情報がそのカテゴリを示す単語(名詞)で図示されている。但し、提供先関係テーブルに格納される提供先カテゴリの識別情報は、図3に図示される単語ではなく、数値であってもよい。図3の例では、提供先カテゴリ「グルメ」に提供先キーワードとして「行く」が関連付けられている。単語「行く」は、外出を意味することから、「外出時の食事」を連想させる。このように、単語「行く」は、直接的には「グルメ」というカテゴリには属さないものの、間接的な関係(例えば、「外出時の食事」の連想)から「グルメ」に関連付けられる。   FIG. 3 is a diagram illustrating an example of the provision destination relation table of the keyword DB 13. In FIG. 3, for the sake of easy understanding, the identification information of the provider category is illustrated by a word (noun) indicating the category. However, the identification information of the provider category stored in the provider relationship table may be a numerical value instead of the word illustrated in FIG. In the example of FIG. 3, “go” is associated with the provision destination category “gourmet” as the provision destination keyword. Since the word “go” means going out, it is reminiscent of “meal when going out”. Thus, although the word “go” does not directly belong to the category “gourmet”, it is related to “gourmet” from an indirect relationship (for example, association of “meal when going out”).

上述したとおり、提供先カテゴリはサイト7に対応付けられるため、提供先関係テーブルは、単語と、その単語に直接的及び間接的に関連する情報を提供するサイト7との関連を示すということもできる。従って、提供先関係テーブルは、提供先カテゴリの識別情報として、サイト7の識別情報(アドレス情報であってもよい)を格納してもよい。   As described above, since the provision destination category is associated with the site 7, the provision destination relationship table indicates the relationship between the word and the site 7 that provides information directly and indirectly related to the word. it can. Therefore, the providing destination relationship table may store the identification information (may be address information) of the site 7 as the providing category identification information.

クエリカテゴリテーブルは、提供先カテゴリとクエリカテゴリとの関係を示す情報を格納する。具体的には、クエリカテゴリテーブルは、提供先カテゴリの識別情報とクエリカテゴリの識別情報とを相互に関連付けて格納する。クエリカテゴリテーブルに格納される提供先カテゴリは、上述の提供先関係テーブルに格納される提供先カテゴリと同じである。クエリカテゴリは、提供先カテゴリに対応するサイト7から提供される情報に含まれる情報カテゴリを示す。言い換えれば、クエリカテゴリテーブルにおいて或る提供先カテゴリに関連付けられていないクエリカテゴリは、その提供先カテゴリに対応するサイト7から提供される情報に対する検索のキーワードとして利用されないカテゴリを示す。   The query category table stores information indicating the relationship between the provider category and the query category. Specifically, the query category table stores the identification information of the provider category and the identification information of the query category in association with each other. The provider category stored in the query category table is the same as the provider category stored in the provider relationship table described above. The query category indicates an information category included in information provided from the site 7 corresponding to the provision destination category. In other words, a query category that is not associated with a certain provider category in the query category table indicates a category that is not used as a search keyword for information provided from the site 7 corresponding to the provider category.

図4は、キーワードDB13のクエリカテゴリテーブルの例を示す図である。図4では、分かり易くするために、提供先カテゴリ及びクエリカテゴリの各識別情報がそのカテゴリを示す単語(名詞)でそれぞれ図示されている。但し、クエリカテゴリテーブルに格納される提供先カテゴリ及びクエリカテゴリの各識別情報は、図4に図示される単語ではなく、数値であってもよい。図4の例では、提供先カテゴリ「グルメ」には「料理名」及び「地名」がクエリカテゴリとして格納されている。よって、「グルメ」に対応するサイト7から提供される情報に対する検索のキーワードとして「料理名」及び「地名」のカテゴリの単語が利用されることを示している。一方で、提供先カテゴリ「グルメ」には「食材名」が関連付けられていない。よって、「グルメ」に対応付けられたサイト7から提供される情報に対する検索のキーワードとして「食材名」のカテゴリの単語が利用されないことを示している。   FIG. 4 is a diagram illustrating an example of a query category table in the keyword DB 13. In FIG. 4, for the sake of easy understanding, each identification information of the provision destination category and the query category is illustrated by a word (noun) indicating the category. However, the identification information of the destination category and the query category stored in the query category table may be numerical values instead of the words illustrated in FIG. In the example of FIG. 4, “dish name” and “place name” are stored as query categories in the provision destination category “gourmet”. Therefore, it is shown that the words of the categories “dishes names” and “place names” are used as search keywords for the information provided from the site 7 corresponding to “gourmet”. On the other hand, the “food name” is not associated with the provision category “gourmet”. Therefore, it is shown that the word of the category of “food name” is not used as a search keyword for information provided from the site 7 associated with “gourmet”.

クエリワードテーブルは、上述のクエリカテゴリとクエリキーワードとの関係を示す情報を格納する。具体的には、クエリワードテーブルは、クエリカテゴリの識別情報とクエリキーワードのキーワードデータとを相互に関連付けて格納する。クエリワードテーブルに格納されるクエリカテゴリは、上述のクエリカテゴリテーブルに格納されるクエリカテゴリと同じである。クエリキーワードは、クエリカテゴリに属する意味を持つ単語である。   The query word table stores information indicating the relationship between the query category and the query keyword. Specifically, the query word table stores query category identification information and query keyword keyword data in association with each other. The query category stored in the query word table is the same as the query category stored in the above-described query category table. The query keyword is a word having a meaning belonging to the query category.

図5は、キーワードDB13のクエリワードテーブルの例を示す図である。図5では、分かり易くするために、クエリカテゴリの識別情報がそのカテゴリを示す単語(名詞)で図示されている。但し、クエリワードテーブルに格納されるクエリカテゴリの識別情報は、図5に図示される単語ではなく、数値であってもよい。図5の例では、クエリカテゴリ「日付名」に、クエリキーワードとして「明日」、「明後日」、「6月8日」が関連付けられている。   FIG. 5 is a diagram illustrating an example of a query word table in the keyword DB 13. In FIG. 5, for easy understanding, the identification information of the query category is illustrated by a word (noun) indicating the category. However, the query category identification information stored in the query word table may be numerical values instead of the words illustrated in FIG. In the example of FIG. 5, “Tomorrow”, “Tomorrow”, and “June 8” are associated with the query category “date name” as query keywords.

クエリカテゴリテーブル及びクエリワードテーブルは、上述したとおり、クエリカテゴリにより相互に関連付けられる。よって、クエリカテゴリテーブル及びクエリワードテーブルは、クエリ関係情報と表記することもできる。また、クエリカテゴリを用いて、クエリカテゴリテーブル及びクエリワードテーブルを統合することもできる。この場合、統合されたテーブルでは、提供先カテゴリとクエリキーワードとの関係が示される。本実施形態のようにクエリカテゴリテーブルとクエリワードテーブルとを別に設けることにより、重複するクエリキーワードをテーブルに格納せずにすむため、メモリリソースの削減につながる。また、各テーブルのデータを管理し易いというメリットも享受できる。   As described above, the query category table and the query word table are associated with each other by the query category. Therefore, the query category table and the query word table can also be expressed as query relation information. In addition, the query category table and the query word table can be integrated using the query category. In this case, the integrated table shows the relationship between the provision destination category and the query keyword. By providing the query category table and the query word table separately as in this embodiment, it is not necessary to store duplicate query keywords in the table, leading to a reduction in memory resources. Moreover, the merit that it is easy to manage the data of each table can also be enjoyed.

ユーザ単語DB12及びキーワードDB13は、関係データベースであってもよいし、JSON(JavaScript(登録商標) Object Notation)やXML(Extensible Markup Language)等のような所定の記述言語で記載されたファイルであってもよい。   The user word DB 12 and the keyword DB 13 may be relational databases, or files written in a predetermined description language such as JSON (JavaScript (registered trademark) Object Notation) or XML (Extensible Markup Language). Also good.

特定部14は、上述の提供先関係テーブルを参照することにより、取得部11により取得された1以上の単語データに対応する提供先カテゴリを特定する。例えば、特定部14は、取得部11により取得された単語データがキーワードDB13の提供先関係テーブルに提供先キーワードとして格納されているか否かを判定する。特定部14は、1以上の単語データが提供先キーワードとして格納されている提供先カテゴリを特定する。特定部14は、複数の提供先カテゴリを特定してもよい。また、1以上の単語データが提供先キーワードとして格納されている提供先カテゴリが複数存在する場合、特定部14は、最多の単語データが提供先キーワードとして格納されている一つの提供先カテゴリを特定してもよい。   The specifying unit 14 specifies a provider category corresponding to one or more word data acquired by the acquiring unit 11 by referring to the above-described provider relationship table. For example, the specifying unit 14 determines whether or not the word data acquired by the acquiring unit 11 is stored as a provision destination keyword in the provision destination relation table of the keyword DB 13. The identification unit 14 identifies a provision destination category in which one or more word data is stored as a provision destination keyword. The specifying unit 14 may specify a plurality of provision destination categories. Further, when there are a plurality of provision category categories in which one or more word data are stored as the provision destination keywords, the specifying unit 14 identifies one provision destination category in which the most word data is stored as the provision destination keywords. May be.

また、特定部14は、提供先キーワードの特徴量と取得部11により取得された各単語データの特徴量との類似度を算出し、この類似度を用いて、提供先カテゴリを特定することもできる。単語データの特徴量の表記手法及び単語間の類似度計算手法については様々な既知の手法が利用できる。特定部14は、提供先キーワードデータ及び取得部11により取得された各単語データをそれぞれ特徴量データに変換し、変換された特徴量データ間の類似度を計算する。特徴量データはベクトル構造を有していてもよい。本実施形態では、単語間の類似度の計算手法は何ら制限されない。但し、意味及び概念の近さが類似度として高精度に算出される手法が利用されることが望ましい。   Further, the specifying unit 14 may calculate a similarity between the feature amount of the providing destination keyword and the feature amount of each word data acquired by the acquiring unit 11, and specify the providing destination category using the similarity. it can. Various known methods can be used as a method for expressing the feature amount of word data and a method for calculating similarity between words. The specifying unit 14 converts the provision destination keyword data and each word data acquired by the acquiring unit 11 into feature amount data, and calculates the similarity between the converted feature amount data. The feature amount data may have a vector structure. In the present embodiment, the method for calculating the similarity between words is not limited. However, it is desirable to use a method in which the closeness of meaning and concept is calculated with high accuracy as the similarity.

特定部14は、上述のように算出された類似度の距離により、提供先カテゴリを特定することもできる。他の例として、特定部14は、所定閾値以上でかつ最も高い類似度を示す提供先キーワードと関連付けられた提供先カテゴリを特定してもよい。また、特定部14は、所定閾値以上の類似度を示す提供先キーワードの数が最大の提供先カテゴリを特定してもよい。また、特定部14は、提供先カテゴリ毎の提供先キーワードの平均類似度が最も高い提供先カテゴリを特定してもよい。特定部14は、当該平均類似度が所定閾値以上の提供先カテゴリを特定してもよい。   The specifying unit 14 can also specify the provision destination category based on the distance of the similarity calculated as described above. As another example, the specifying unit 14 may specify a providing category associated with a providing keyword that is equal to or higher than a predetermined threshold and that shows the highest degree of similarity. Further, the specifying unit 14 may specify a providing destination category having the largest number of providing destination keywords that indicate a degree of similarity equal to or greater than a predetermined threshold. Further, the specifying unit 14 may specify a providing category having the highest average similarity of the providing keywords for each providing category. The specifying unit 14 may specify a providing category whose average similarity is a predetermined threshold or more.

特定部14は、上述の既知の技術を用いて多数の単語について予め算出された特徴量データを保持しておいてもよい。このような単語毎の特徴量データは、分析装置10以外の他の装置により生成されてもよい。この場合、特定部14は、単語毎の特徴量データのテーブルを用いて、取得部11により取得された各単語データをそれぞれ特徴量データに置き換える。キーワードDB13には、提供先キーワード及びクエリキーワードとして、各々に対応する特徴量データが予め格納されてもよい。また、提供先関係テーブルには、提供先カテゴリ毎に、複数の提供先キーワードの平均特徴量データが格納されてもよい。この場合、特定部14は、取得部11により取得された各単語データの特徴量データと提供先カテゴリ毎の平均特徴量データとの類似度を計算することで、提供先カテゴリを特定する。このように、特定部14による提供先カテゴリの特定手法は制限されない。   The specifying unit 14 may hold feature amount data calculated in advance for a large number of words using the above-described known technique. Such feature amount data for each word may be generated by a device other than the analysis device 10. In this case, the specifying unit 14 replaces each word data acquired by the acquisition unit 11 with feature amount data, using a table of feature amount data for each word. In the keyword DB 13, feature amount data corresponding to each of the provision destination keyword and the query keyword may be stored in advance. The provision destination relation table may store average feature amount data of a plurality of provision destination keywords for each provision destination category. In this case, the specifying unit 14 specifies the providing category by calculating the similarity between the feature data of each word data acquired by the acquiring unit 11 and the average feature data for each providing category. As described above, the method of specifying the providing category by the specifying unit 14 is not limited.

選択部15は、取得部11により取得された1以上の単語データの中から検索キーワードに用いる単語データを選択する。具体的には、選択部15は、キーワードDB13のクエリカテゴリテーブル及びクエリワードテーブルに基づいて、取得部11により取得された各単語データが特定部14により特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定する。選択部15は、この判定により、取得部11により取得された1以上の単語データの中から検索キーワードに用いる単語データを選択する。以降、特定部14により特定された提供先カテゴリに関連付けられたクエリカテゴリを「対象クエリカテゴリ」と表記する場合もある。特定部14が複数の提供先カテゴリを選択している場合、選択部15は、特定された複数の提供先カテゴリの各々について、取得部11で取得された複数の単語データの中から検索キーワードに用いる単語データをそれぞれ選択する。つまり、提供先カテゴリ毎に異なる単語データが選択される場合や、同一の単語データが全ての提供先カテゴリに共通で選択される場合や、単語データが全く選択されない提供先カテゴリが存在する場合などがあり得る。   The selection unit 15 selects word data used as a search keyword from one or more word data acquired by the acquisition unit 11. Specifically, the selection unit 15 selects a query in which each word data acquired by the acquisition unit 11 is associated with the provision destination category specified by the specifying unit 14 based on the query category table and the query word table of the keyword DB 13. Whether it belongs to a category is determined. Based on this determination, the selection unit 15 selects word data to be used as a search keyword from one or more word data acquired by the acquisition unit 11. Hereinafter, the query category associated with the provision category specified by the specifying unit 14 may be referred to as “target query category”. When the specifying unit 14 has selected a plurality of supply destination categories, the selection unit 15 selects a search keyword from among the plurality of word data acquired by the acquisition unit 11 for each of the specified plurality of supply destination categories. Each word data to be used is selected. In other words, when different word data is selected for each provider category, when the same word data is selected in common for all provider categories, or when there is a provider category where no word data is selected. There can be.

例えば、選択部15は、クエリカテゴリテーブルから対象クエリカテゴリを抽出し、取得部11により取得された各単語データが、クエリワードテーブルにおいて、対象クエリカテゴリに関連付けられたクエリキーワードと一致するか否かをそれぞれ判定する。選択部15は、対象クエリカテゴリに関連付けられたクエリキーワードと一致する単語データを検索キーワードに用いる単語データの候補として選択し、それ以外の単語データをその候補から除外する。   For example, the selection unit 15 extracts the target query category from the query category table, and whether or not each word data acquired by the acquisition unit 11 matches the query keyword associated with the target query category in the query word table. Respectively. The selection unit 15 selects word data matching the query keyword associated with the target query category as a word data candidate used as a search keyword, and excludes other word data from the candidate.

また、選択部15は、クエリワードテーブルで示されるクエリキーワードと取得部11により取得された各単語データの特徴量との類似度をそれぞれ算出し、算出された類似度を用いて、取得部11により取得された各単語データについて上記判定をそれぞれ行ってもよい。選択部15は、クエリキーワードデータ及び取得部11により取得された各単語データをそれぞれ特徴量データに変換し、変換された特徴量データ間の類似度を計算する。単語データの特徴量の表記手法及び単語間の類似度計算手法については上述したとおりである。   Further, the selection unit 15 calculates the similarity between the query keyword shown in the query word table and the feature amount of each word data acquired by the acquisition unit 11, and uses the calculated similarity to acquire the acquisition unit 11 The above determination may be performed for each word data acquired by the above. The selection unit 15 converts the query keyword data and each word data acquired by the acquisition unit 11 into feature amount data, and calculates the similarity between the converted feature amount data. The notation method of the feature amount of the word data and the similarity calculation method between the words are as described above.

例えば、選択部15は、単語データとの類似度が所定閾値以上を示すクエリキーワードが対象クエリカテゴリに関連付けられている場合、その単語データを当該クエリカテゴリに属すると決定する。クエリワードテーブルがクエリカテゴリ毎に複数のクエリキーワードの平均特徴量データを格納している場合、選択部15は、対象クエリカテゴリの平均特徴量データとの類似度が所定閾値以上となる単語データを当該クエリカテゴリに属すると決定する。   For example, when a query keyword whose similarity with word data indicates a predetermined threshold or more is associated with the target query category, the selection unit 15 determines that the word data belongs to the query category. When the query word table stores average feature amount data of a plurality of query keywords for each query category, the selection unit 15 selects word data whose similarity with the average feature amount data of the target query category is a predetermined threshold or more. It is determined that it belongs to the query category.

検索制御部16は、特定部14により特定された提供先カテゴリに対応するサイト7を特定し、このサイト7から提供される情報に対する選択部15により選択された単語データを検索キーワードとして用いた検索を要求する。一つの単語データも選択されなかった提供先カテゴリが存在する場合には、検索制御部16は、その提供先カテゴリに対応するサイト7から提供される情報に対する検索には検索キーワードを指定しなくてもよい。   The search control unit 16 specifies a site 7 corresponding to the provision destination category specified by the specifying unit 14, and uses the word data selected by the selection unit 15 for information provided from the site 7 as a search keyword Request. When there is a providing category for which no word data has been selected, the search control unit 16 does not specify a search keyword for searching for information provided from the site 7 corresponding to the providing category. Also good.

特定されたサイト7がサイト内検索をサポートしている場合、検索制御部16は、その特定されたサイト7に対して、選択された単語データを検索キーワードとする検索を要求し、その検索結果として抽出された情報をサイト7から受信する。また、特定されたサイト7がサイト内検索をサポートしていない場合、サイト7以外のコンピュータが、そのサイト7が提供している全ての情報をそのサイト7から取得し、取得された情報に対して当該検索を実施してもよい。この場合、検索制御部16は、その検索を行うコンピュータに対して検索を要求する。このとき検索制御部16は、そのコンピュータに対して、サイト7のアドレス情報と検索キーワードとして選択された単語データとを送る。検索を実施するコンピュータは、分析装置10であってもよい。   When the identified site 7 supports in-site search, the search control unit 16 requests the identified site 7 to perform a search using the selected word data as a search keyword, and the search result The information extracted as is received from the site 7. In addition, when the specified site 7 does not support search within the site, a computer other than the site 7 acquires all the information provided by the site 7 from the site 7, and for the acquired information The search may be performed. In this case, the search control unit 16 requests a search to the computer that performs the search. At this time, the search control unit 16 sends the address information of the site 7 and the word data selected as the search keyword to the computer. The computer that performs the search may be the analysis apparatus 10.

出力処理部17は、検索制御部16により検索結果として取得された情報をクライアント8に送信する。これにより、クライアント8ではその情報が出力される。クライアント8は、分析装置10から提供された情報を、表示、印刷、音声など様々な方法で出力可能である。パッシブ動作モードでは、クライアント8は、ユーザの動作に起因して生じたデータ(文字列、単語、音声等)を分析装置10に送信し、分析装置10から受信された情報をユーザに提示する。アクティブ動作モードでは、クライアント8は、ユーザの動作に関わらず分析装置10から自発的に送られる情報を受信し、その情報をユーザに提示する。   The output processing unit 17 transmits information acquired as a search result by the search control unit 16 to the client 8. As a result, the client 8 outputs the information. The client 8 can output the information provided from the analysis device 10 by various methods such as display, printing, and voice. In the passive operation mode, the client 8 transmits data (character string, word, voice, etc.) generated due to the user's operation to the analysis device 10 and presents the information received from the analysis device 10 to the user. In the active operation mode, the client 8 receives information sent spontaneously from the analysis apparatus 10 regardless of the user's operation, and presents the information to the user.

〔動作例/情報分析方法〕
以下、第一実施形態における情報分析方法について図6を用いて説明する。図6は、第一実施形態における分析装置10の動作例を示すフローチャートである。図6に示されるように、第一実施形態における情報分析方法は、分析装置10のような少なくとも一つのコンピュータにより実行される。図6に示される各工程は、分析装置10が有する各ソフトウェア要素の処理内容と同様であるため、各工程の詳細は、適宜省略される。
[Operation example / Information analysis method]
Hereinafter, the information analysis method in the first embodiment will be described with reference to FIG. FIG. 6 is a flowchart showing an operation example of the analyzer 10 in the first embodiment. As shown in FIG. 6, the information analysis method in the first embodiment is executed by at least one computer such as the analysis apparatus 10. Each process shown in FIG. 6 is the same as the processing content of each software element included in the analyzer 10, and therefore details of each process are omitted as appropriate.

分析装置10は、複数の単語データを取得する(S61)。(S61)での単語データの取得方法は2つの方法に分類できる。一つは、パッシブ動作モードで実行される方法である。具体的には、分析装置10は、クライアント8から文字列データ又は音声データを受信し、既知の技術を用いて、その受信された文字列データ又は音声データから複数の単語データを抽出する。この単語データの抽出手法については、取得部11の説明中で述べたとおりである。分析装置10は、クライアント8から当該複数の単語データそのものを受信してもよい。分析装置10は、取得された単語データを、送信元のユーザ又はクライアント8の識別情報と関連付けて、ユーザ単語DB12に格納する。パッシブ動作モードでは、このようにクライアント8からのデータの受信を契機に以降の工程が実行される。   The analysis apparatus 10 acquires a plurality of word data (S61). The word data acquisition method in (S61) can be classified into two methods. One is a method executed in the passive operation mode. Specifically, the analysis apparatus 10 receives character string data or voice data from the client 8, and extracts a plurality of word data from the received character string data or voice data using a known technique. This method of extracting word data is as described in the description of the acquisition unit 11. The analysis device 10 may receive the plurality of word data itself from the client 8. The analysis device 10 stores the acquired word data in the user word DB 12 in association with the identification information of the transmission source user or the client 8. In the passive operation mode, the subsequent steps are executed in response to the reception of data from the client 8 as described above.

もう一つの方法は、アクティブ動作モードで実行される方法である。この場合、分析装置10は、ユーザ単語DB12を任意のタイミングで参照することにより、ユーザ単語DB12から当該複数の単語データをユーザ毎に取得する。このとき、分析装置10は、ユーザ単語DB12において、ユーザ毎に蓄積される複数の単語データの中から、ユーザの興味や関心を強く示す単語データを取得することが望ましい。アクティブ動作モードでは、このように分析装置10が自発的に当該単語データを取得し、この取得を契機に以降の工程が実行される。   Another method is performed in the active mode of operation. In this case, the analysis apparatus 10 acquires the plurality of word data from the user word DB 12 for each user by referring to the user word DB 12 at an arbitrary timing. At this time, it is desirable for the analysis apparatus 10 to acquire word data that strongly indicates the user's interest or interest from among a plurality of word data accumulated for each user in the user word DB 12. In the active operation mode, the analysis apparatus 10 voluntarily acquires the word data as described above, and the subsequent steps are executed in response to the acquisition.

分析装置10は、キーワードDB13の提供先関係テーブルを参照することにより、提供先関係テーブルに格納される複数の提供先カテゴリの中から、(S61)で取得された単語データに対応する提供先カテゴリを特定する(S62)。提供先カテゴリの特定方法については、特定部14の説明中で述べたとおりである。   The analysis apparatus 10 refers to the provision destination relation table in the keyword DB 13, thereby providing the provision destination category corresponding to the word data acquired in (S61) from among a plurality of provision destination categories stored in the provision destination relation table. Is specified (S62). The method of specifying the providing category is as described in the description of the specifying unit 14.

分析装置10は、キーワードDB13のクエリカテゴリテーブル及びクエリワードテーブルを参照することにより、(S61)で取得された複数の単語データの中から検索キーワードに用いる単語データを選択する(S63)。具体的には、分析装置10は、(S61)で取得された各単語データが(S62)で特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定することにより、上記選択を行う。この選択手法については、選択部15の説明中で述べたとおりである。   The analysis apparatus 10 refers to the query category table and the query word table in the keyword DB 13 to select word data to be used as a search keyword from the plurality of word data acquired in (S61) (S63). Specifically, the analysis device 10 determines whether each word data acquired in (S61) belongs to the query category associated with the provision destination category specified in (S62), thereby Make a selection. This selection method is as described in the description of the selection unit 15.

分析装置10は、(S62)で特定された提供先カテゴリに対応するサイト7を特定し、そのサイト7から提供される情報に対する(S63)で選択された単語データを用いた検索を要求する(S64)。分析装置10は、特定されたサイト7に検索を要求してもよいし、他のコンピュータに対して検索を要求してもよい。また、分析装置10は、自身で検索を実行してもよい。   The analysis apparatus 10 identifies the site 7 corresponding to the provision destination category identified in (S62), and requests a search using the word data selected in (S63) for the information provided from the site 7 (S63). S64). The analysis device 10 may request a search from the identified site 7 or may request a search from another computer. Further, the analysis device 10 may perform a search by itself.

分析装置10は、上記検索の結果として抽出された情報をクライアント8に出力させる(S65)。パッシブ動作モードでは、クライアント8のユーザは、クライアント8に対する入力操作といった自身の動作を契機に、所望の情報を得ることができる。一方、アクティブ動作モードでは、クライアント8のユーザは、任意のタイミングで所望の情報を得ることができる。   The analysis apparatus 10 causes the client 8 to output information extracted as a result of the search (S65). In the passive operation mode, the user of the client 8 can obtain desired information in response to his / her own operation such as an input operation on the client 8. On the other hand, in the active operation mode, the user of the client 8 can obtain desired information at an arbitrary timing.

次に、図3、図4及び図5に示される具体的なデータを用いて、第一実施形態における情報分析方法の具体例を更に説明する。図7は、第一実施形態における分析装置10の一動作例のフロー及びデータの処理例を示す図である。ここでは、クライアント8で表示されているカレンダ画面に対して、ユーザが、「花見に行く」というスケジュールを入力したと仮定する。   Next, a specific example of the information analysis method in the first embodiment will be further described using specific data shown in FIGS. 3, 4, and 5. FIG. 7 is a diagram illustrating a flow of one operation example of the analysis apparatus 10 and a data processing example in the first embodiment. Here, it is assumed that the user inputs a schedule “going to cherry blossom viewing” on the calendar screen displayed on the client 8.

この場合、分析装置10は、クライアント8から文字列データ「花見に行く」を受信する(S71)。分析装置10は、受信された文字列データを品詞分解し、名詞単語データ「花見」及び動詞単語データ「行く」を取得する(S72)。ここでは、助詞単語データ「に」は処理対象から除外される。   In this case, the analysis apparatus 10 receives the character string data “Go to Hanami” from the client 8 (S71). The analysis apparatus 10 decomposes the part of speech of the received character string data, and acquires the noun word data “hanami” and the verb word data “go” (S72). Here, the particle word data “ni” is excluded from the processing target.

分析装置10は、単語データ「花見」及び「行く」を特徴ベクトルにそれぞれ変換する(S73)。ここでは、単語データの特徴量を表すデータとして特徴ベクトルが例示される。   The analysis apparatus 10 converts the word data “cherry-blossom viewing” and “go” into feature vectors, respectively (S73). Here, a feature vector is exemplified as data representing the feature amount of word data.

ここでは、キーワードDB13の提供先関係テーブルには、提供先カテゴリ毎に、提供先キーワードの平均特徴ベクトルが格納されていると仮定する。図3の例によれば、提供先カテゴリ「イベント」には、「イベント」、「花火」、「祭り」、「防災訓練」、「花見」、「復興」等の複数の提供先キーワードの平均特徴ベクトルが関連付けられている。また、提供先カテゴリ「グルメ」には、「食事」、「グルメ」、「行く」等の複数の提供先キーワードの平均特徴ベクトルが関連付けられている。   Here, it is assumed that the average feature vector of the provision destination keyword is stored for each provision destination category in the provision destination relation table of the keyword DB 13. According to the example of FIG. 3, the destination category “event” includes an average of a plurality of destination keywords such as “event”, “fireworks”, “festival”, “disaster prevention training”, “cherry blossom viewing”, “reconstruction”, etc. A feature vector is associated. In addition, the provision destination category “gourmet” is associated with an average feature vector of a plurality of provision destination keywords such as “meal”, “gourmet”, and “go”.

分析装置10は、(S73)で変換された「花見」及び「行く」の各特徴ベクトルと、提供先関係テーブルに格納されている各平均特徴ベクトルとの類似度をそれぞれ計算し、所定閾値以上の類似度を示す平均特徴ベクトルに関連付けられた提供先カテゴリをそれぞれ特定する(S74)。ここでは、「花見」の特徴ベクトルと提供先カテゴリ「イベント」の平均特徴ベクトルとの類似度「0.82」が所定閾値以上であるため、単語データ「花見」に関して提供先カテゴリ「イベント」が特定される。また、「行く」の特徴ベクトルと提供先カテゴリ「グルメ」の平均特徴ベクトルとの類似度「0.78」が所定閾値以上であるため、単語データ「行く」に関して提供先カテゴリ「グルメ」が特定される。   The analysis apparatus 10 calculates the similarity between each of the “Hanami” and “Go” feature vectors converted in (S73) and each average feature vector stored in the provider relationship table, and exceeds a predetermined threshold value. Each providing category associated with the average feature vector indicating the similarity is identified (S74). Here, since the similarity “0.82” between the feature vector of “Hanami” and the average feature vector of the destination category “Event” is equal to or greater than a predetermined threshold, the destination category “Event” is related to the word data “Hanami”. Identified. Also, since the similarity “0.78” between the feature vector of “go” and the average feature vector of the destination category “gourmet” is equal to or greater than a predetermined threshold, the destination category “gourmet” is specified for the word data “go” Is done.

分析装置10は、クエリカテゴリテーブルから、(S74)で特定された提供先カテゴリに対応するクエリカテゴリを抽出する。具体的には、分析装置10は、提供先カテゴリ「イベント」に対してクエリカテゴリ「イベント名」を抽出し、提供先カテゴリ「グルメ」に対してクエリカテゴリ「料理名」及び「地名」を抽出する。   The analysis apparatus 10 extracts a query category corresponding to the provision destination category specified in (S74) from the query category table. Specifically, the analysis apparatus 10 extracts the query category “event name” for the provider category “event”, and extracts the query categories “dishes name” and “location name” for the provider category “gourmet”. To do.

ここでは、キーワードDB13のクエリワードテーブルには、クエリカテゴリ毎に、クエリキーワードの平均特徴ベクトルが格納されていると仮定する。図5の例によれば、クエリカテゴリ「イベント名」には、クエリキーワード「花火」、「祭り」、「花見」及び「七夕」の平均特徴ベクトルが関連付けられている。また、クエリカテゴリ「料理名」には、クエリキーワード「お好み焼き」、「すき焼き」及び「焼肉」の平均特徴ベクトルが関連付けられている。   Here, it is assumed that an average feature vector of query keywords is stored in the query word table of the keyword DB 13 for each query category. According to the example of FIG. 5, the query category “event name” is associated with the average feature vectors of the query keywords “fireworks”, “festival”, “cherry blossom viewing”, and “Tanabata”. The query category “dishes name” is associated with the average feature vectors of the query keywords “okonomiyaki”, “sukiyaki”, and “yakiniku”.

分析装置10は、抽出された各クエリカテゴリ「イベント名」、「料理名」及び「地名」に関連付けられた各平均特徴ベクトルと、(S73)で変換された「花見」及び「行く」の各特徴ベクトルとの類似度をそれぞれ計算する。分析装置10は、算出された類似度が所定閾値以上を示す単語データを検索キーワードとして選択する(S75)。ここでは、単語データ「花見」は、その特徴ベクトルとクエリカテゴリ「イベント名」との類似度が所定閾値以上であるため、提供先カテゴリ「イベント」に対する検索キーワードとして選択される。但し、単語データ「花見」は、各クエリカテゴリ「料理名」及び「地名」の特徴ベクトルとの類似度が所定閾値未満であるため、提供先カテゴリ「グルメ」に対する検索キーワードからは除外される。一方で、単語データ「行く」は、クエリカテゴリ「イベント名」、「料理名」及び「地名」の各特徴ベクトルとの類似度が所定閾値未満であるため、提供先カテゴリ「イベント」及び「グルメ」に対する検索キーワードから除外される。   The analysis apparatus 10 uses the average feature vectors associated with the extracted query categories “event name”, “dishes name”, and “place name”, and “cherry-blossom viewing” and “go” converted in (S73). The similarity with the feature vector is calculated. The analysis apparatus 10 selects word data whose calculated similarity is equal to or greater than a predetermined threshold as a search keyword (S75). Here, the word data “cherry-blossom viewing” is selected as a search keyword for the providing category “event” because the similarity between the feature vector and the query category “event name” is equal to or greater than a predetermined threshold. However, the word data “cherry blossom” is excluded from the search keyword for the provision category “gourmet” because the similarity to the feature vector of each query category “dishes name” and “place name” is less than a predetermined threshold. On the other hand, the word data “go” has a similarity to the feature vectors of the query categories “event name”, “dishes name”, and “place name” less than a predetermined threshold value. Is excluded from search keywords for "".

分析装置10は、(S74)で特定された提供先カテゴリ「イベント」及び「グルメ」に対応するイベントサイト及びグルメサイト(共にサイト7)を決定し、更に、各サイトに要求するクエリを決定する(S76)。イベントサイトに対する検索のクエリに、検索キーワード「花見」が決定され、グルメサイトに対する検索のクエリには、検索キーワードが指定されない。   The analysis apparatus 10 determines an event site and a gourmet site (both sites 7) corresponding to the provision destination categories “event” and “gourmet” specified in (S74), and further determines a query required for each site. (S76). The search keyword “hanami” is determined as the search query for the event site, and no search keyword is specified in the search query for the gourmet site.

〔第一実施形態の作用及び効果〕
上述したように第一実施形態では、ユーザの動作に起因して生成される単語データが取得され、複数の提供先カテゴリと複数の提供先キーワードとの関係を示す提供先関係テーブルに基づいて、その取得された単語データに対応する提供先カテゴリが特定される。当該複数の提供先カテゴリは、情報提供サイト7にそれぞれ対応付けられている。つまり、第一実施形態では、予め検索先として登録されているサイト7の中から、ユーザから得られる単語データに関連するサイト7が検索先として特定される。従って、第一実施形態によれば、信頼性がありかつユーザに関連する情報を提供するサイト7を対象に検索を実行することができるため、信頼性が高くかつユーザに関連する情報を提供することができる。
[Operation and effect of the first embodiment]
As described above, in the first embodiment, word data generated due to the user's action is acquired, and based on the provision destination relationship table indicating the relationship between the plurality of provision destination categories and the plurality of provision destination keywords, A providing category corresponding to the acquired word data is specified. The plurality of provision destination categories are associated with the information providing site 7 respectively. That is, in the first embodiment, the site 7 related to the word data obtained from the user is specified as the search destination from the sites 7 registered in advance as the search destination. Therefore, according to the first embodiment, since the search can be performed on the site 7 that provides information that is reliable and relates to the user, the information that is highly reliable and relates to the user is provided. be able to.

また、第一実施形態では、複数の提供先カテゴリと複数のクエリカテゴリとの関係を示すクエリカテゴリテーブル及び複数のクエリカテゴリと複数のクエリキーワードとの関係を示すクエリワードテーブルが参照される。これらテーブルでは、各サイト7(各提供先カテゴリ)について、そのサイト7から提供される情報の内容に合うカテゴリがクエリカテゴリとしてそれぞれ登録されており、各クエリカテゴリについて、そのクエリカテゴリに属する単語がクエリキーワードとしてそれぞれ登録されている。そして、これらテーブルに基づいて、各単語データが特定された提供先カテゴリに対応するクエリカテゴリに属するか否かがそれぞれ判定され、この判定に基づいて、取得された単語データの中から検索キーワードに用いる単語データが選択される。従って、第一実施形態によれば、サイト7から提供される情報の内容に合った単語データを検索キーワードに用いた検索を実行することができるため、ユーザの興味や関心に合った情報を高精度に提供することができる。   In the first embodiment, a query category table indicating the relationship between a plurality of destination categories and a plurality of query categories and a query word table indicating the relationship between the plurality of query categories and a plurality of query keywords are referred to. In these tables, for each site 7 (each provider category), a category that matches the content of information provided from the site 7 is registered as a query category, and for each query category, the words belonging to the query category are registered. Each is registered as a query keyword. Then, based on these tables, it is determined whether each word data belongs to the query category corresponding to the specified provider category, and based on this determination, search word is selected from the acquired word data. The word data to be used is selected. Therefore, according to the first embodiment, it is possible to execute a search using word data that matches the content of the information provided from the site 7 as a search keyword. Can provide accuracy.

また、第一実施形態では、提供先カテゴリとキーワードとの対応関係が、提供先関係テーブルと、クエリカテゴリテーブル及びクエリワードテーブルの組み合わせとで、別々に格納される。提供先関係テーブルには、当該対応関係が直接格納され、クエリカテゴリテーブル及びクエリワードテーブルの組み合わせには、クエリカテゴリを介して、当該対応関係が間接的に格納される。これにより、同一のサイト7(提供先カテゴリ)に対応付けるキーワードの集合を、提供先関係テーブルと、クエリカテゴリテーブル及びクエリワードテーブルの組み合わせとで相違させることができる。結果、検索先を決めるための提供先関係テーブルでは、提供先カテゴリには、直接的に関連するキーワードのみではなく、間接的に関連するキーワードも関連付けることができる。これにより、ユーザから得られる単語に付随した情報も提供することができるため、提供する情報の範囲を広げることができる。   In the first embodiment, the correspondence relationship between the provision destination category and the keyword is stored separately in the provision destination relation table and the combination of the query category table and the query word table. The corresponding relationship is directly stored in the providing destination relationship table, and the corresponding relationship is indirectly stored in the combination of the query category table and the query word table via the query category. Thereby, the set of keywords associated with the same site 7 (providing destination category) can be made different between the providing destination relation table and the combination of the query category table and the query word table. As a result, in the providing destination relationship table for determining the search destination, not only directly related keywords but also indirectly related keywords can be associated with the providing destination category. Thereby, since the information accompanying the word obtained from a user can also be provided, the range of the information to provide can be expanded.

また、第一実施形態では、提供先カテゴリの特定及び検索キーワードに用いる単語データの選択において、ユーザから得られる単語データと提供先キーワード又はクエリキーワードとの類似度が用いられてもよい。つまり、第一実施形態では、単語間の類似度に基づいて、検索先のサイト7及び検索キーワードが決定され得る。これにより、第一実施形態によれば、ユーザから得られる単語データに基づいて、概念レベル又は意味レベルでユーザの嗜好に合う情報を提供するサイト7及びそのような情報を抽出するための検索キーワードを特定することができる。よって、提供する情報をユーザの興味や関心により近付けることができる。   In the first embodiment, the similarity between the word data obtained from the user and the provision destination keyword or the query keyword may be used in specifying the provision destination category and selecting the word data used for the search keyword. That is, in the first embodiment, the search destination site 7 and the search keyword can be determined based on the similarity between words. Thereby, according to 1st embodiment, based on the word data obtained from a user, the site 7 which provides the information which suits a user preference in a concept level or a semantic level, and a search keyword for extracting such information Can be specified. Therefore, the information to be provided can be brought closer to the user's interest and interest.

更に、第一実施形態では、クライアント8からのデータの受信を契機に、検索を実行し、検索により抽出された情報をクライアント8に提供するパッシブ動作モードと、ユーザ単語DB12からの自発的な単語データの取得を契機に、情報を提供するアクティブ動作モードとがサポートされる。これにより、ユーザは、自身が欲しいときに欲しい情報を取得することもできるし、不意に欲しい情報を取得することもできる。   Furthermore, in the first embodiment, triggered by reception of data from the client 8, a search is executed, and a passive operation mode in which information extracted by the search is provided to the client 8, and a spontaneous word from the user word DB 12 In response to data acquisition, an active operation mode that provides information is supported. Thereby, the user can acquire the information he wants when he wants it, or can acquire the information he wants unexpectedly.

[第2実施形態]
上述の第一実施形態において、単語データの特徴量を示すデータとして特徴ベクトルが利用されてもよいこと、提供先関係テーブル及びクエリワードテーブルにおいて、提供先キーワード及びクエリキーワードの替わりに、平均特徴ベクトルが予め格納されてもよいことを述べた。第二実施形態は、特徴ベクトルの学習を行うことで、テーブル設定を自動化する。以下、第二実施形態における情報分析装置及び情報分析方法について、第一実施形態と異なる内容を中心に説明する。以下の説明では、第一実施形態と同様の内容については適宜省略する。
[Second Embodiment]
In the first embodiment described above, the feature vector may be used as data indicating the feature amount of the word data. In the providing destination relation table and the query word table, instead of the providing destination keyword and the query keyword, the average feature vector is used. Mentioned that may be stored in advance. The second embodiment automates table setting by learning feature vectors. Hereinafter, the information analysis device and the information analysis method in the second embodiment will be described focusing on the contents different from those in the first embodiment. In the following description, the same contents as those in the first embodiment are omitted as appropriate.

第二実施形態における分析装置10のハードウェア構成は、第一実施形態と同様でよい。
〔処理構成〕
図8は、第二実施形態における分析装置10の処理構成例を概念的に示す図である。分析装置10は、図8に示されるようなソフトウェア要素を有する。具体的には、分析装置10は、取得部21、変換部22、提供先DB(DataBase)23、特定部24、検索制御部25、出力処理部26、評価取得部27、更新部28等を有する。これら各ソフトウェア要素は、例えば、CPU1によりメモリ2に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD(Compact Disc)、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F3又は通信ユニット4を介してインストールされ、メモリ2に格納されてもよい。
The hardware configuration of the analyzer 10 in the second embodiment may be the same as in the first embodiment.
[Processing configuration]
FIG. 8 is a diagram conceptually illustrating a processing configuration example of the analyzer 10 in the second embodiment. The analyzer 10 has software elements as shown in FIG. Specifically, the analysis apparatus 10 includes an acquisition unit 21, a conversion unit 22, a provision destination DB (DataBase) 23, a specification unit 24, a search control unit 25, an output processing unit 26, an evaluation acquisition unit 27, an update unit 28, and the like. Have. Each of these software elements is realized, for example, by executing a program stored in the memory 2 by the CPU 1. In addition, the program is installed from a portable recording medium such as a CD (Compact Disc) or a memory card or another computer on the network via the input / output I / F 3 or the communication unit 4 and is stored in the memory 2. It may be stored.

取得部21は、ユーザの動作に起因して生成された複数の単語データを取得する。取得部21は、単語データ又はその単語データの元となるデータと共に、ユーザの識別情報をクライアント8から受信する。本実施形態では、第一実施形態におけるユーザ単語DB12が存在しないため、アクティブ動作モードはサポートされない。この点を除き、取得部21の処理内容については、第一実施形態における取得部11と同様である。   The acquisition unit 21 acquires a plurality of word data generated due to the user's action. The acquisition unit 21 receives user identification information from the client 8 together with word data or data that is the basis of the word data. In this embodiment, since the user word DB 12 in the first embodiment does not exist, the active operation mode is not supported. Except for this point, the processing content of the acquisition unit 21 is the same as that of the acquisition unit 11 in the first embodiment.

変換部22は、取得部21により取得された複数の単語データを特徴ベクトルにそれぞれ変換する。この変換方法には既知の様々な手法が利用可能である。変換部22は、既知の手法を用いて多数の単語について予め算出された特徴ベクトルのリストを保持しておいてもよい。特徴ベクトルは、分析装置10以外の他の装置により生成されてもよい。この場合、変換部22は、保持される特徴ベクトルのリストを用いて、取得部21により取得された各単語データを特徴ベクトルに変換する。以降、変換された特徴ベクトルは、単語特徴ベクトルと表記される場合もある。   The conversion unit 22 converts the plurality of word data acquired by the acquisition unit 21 into feature vectors. Various known methods can be used for this conversion method. The conversion unit 22 may hold a list of feature vectors calculated in advance for a large number of words using a known method. The feature vector may be generated by a device other than the analysis device 10. In this case, the converting unit 22 converts each word data acquired by the acquiring unit 21 into a feature vector using the retained feature vector list. Hereinafter, the converted feature vector may be referred to as a word feature vector.

提供先DB23は、複数の情報提供先と複数の特徴ベクトルとの関係を示す提供先関係テーブルを含む。提供先関係テーブルは、ユーザ毎に設けられる。また、提供先関係テーブル内で、ユーザの識別情報と複数の情報提供先と複数の特徴ベクトルとの関係が格納されてもよい。本実施形態では、情報提供先はサイト7と表記されるため、提供先関係テーブルには、サイト7の識別情報と特徴ベクトルとが一対一で関連付けられて格納される。サイト7の識別情報は、サイト7のアドレス情報であってもよいし、第一実施形態のような提供先カテゴリの識別情報であってもよい。サイト7のアドレス情報が取得できれば、提供先関係テーブルに格納される情報提供先の識別情報は制限されない。   The provision destination DB 23 includes a provision destination relation table indicating the relation between a plurality of information provision destinations and a plurality of feature vectors. The provision destination relation table is provided for each user. Further, the relationship between the user identification information, the plurality of information providing destinations, and the plurality of feature vectors may be stored in the providing destination relationship table. In this embodiment, since the information providing destination is described as the site 7, the providing destination relation table stores the identification information of the site 7 and the feature vector in a one-to-one relationship. The identification information of the site 7 may be the address information of the site 7, or may be identification information of a provision category as in the first embodiment. If the address information of the site 7 can be acquired, the information providing destination identification information stored in the providing destination relation table is not limited.

提供先関係テーブルに格納される特徴ベクトルは、随時、更新されるため、その初期値は、任意である。ランダムに生成された特徴ベクトルが初期値とされてもよいし、対応するサイト7から提供される情報の内容を表す代表的な単語から変換された特徴ベクトルが初期値とされてもよい。   Since the feature vector stored in the provider relationship table is updated at any time, the initial value is arbitrary. A randomly generated feature vector may be an initial value, or a feature vector converted from a representative word representing the content of information provided from the corresponding site 7 may be an initial value.

特定部24は、ユーザの提供先関係テーブルに格納される各特徴ベクトルと、変換部22により算出された各単語特徴ベクトルとの類似度をそれぞれ算出することにより、検索対象とする情報提供先(サイト7)と単語データとの組み合わせを特定する。特定部24は、取得部21により取得されたユーザの識別情報によりそのユーザの提供先関係テーブルを特定する。特定部24は、算出された類似度が所定閾値以上となる単語特徴ベクトルと特徴ベクトルとの組み合わせに基づいて、その単語特徴ベクトルに対応する単語データとその特徴ベクトルに対応するサイト7との組み合わせを特定する。その所定閾値は、予め特定部24により保持されていればよく、その具体的な値は制限されない。   The specifying unit 24 calculates the degree of similarity between each feature vector stored in the user providing destination relationship table and each word feature vector calculated by the conversion unit 22, thereby obtaining an information providing destination (to be searched) ( The combination of the site 7) and word data is specified. The specifying unit 24 specifies the user's provider relationship table based on the user identification information acquired by the acquiring unit 21. Based on the combination of the word feature vector and the feature vector whose calculated similarity is equal to or greater than a predetermined threshold, the specifying unit 24 combines the word data corresponding to the word feature vector and the site 7 corresponding to the feature vector. Is identified. The predetermined threshold only needs to be held in advance by the specifying unit 24, and the specific value is not limited.

検索制御部25は、特定部24により特定された組み合わせに対応する検索を要求する。具体的には、検索制御部25は、特定部24により特定された組み合わせにおけるサイト7から提供される情報に対するその組み合わせにおける単語データを検索キーワードとして用いた検索を要求する。検索制御部25は、特定部24により特定された複数の組み合わせにおいて、同一のサイト7に対して異なる単語データが組み合わされている場合、検索制御部25は、そのサイト7から提供される情報に対する複数の検索を要求する。例えば、情報提供先ST1に対して2つの単語データWD1及びWD2が組み合わされた場合、検索制御部25は、情報提供先ST1から提供される情報に対する検索キーワードWD1を用いた検索と、情報提供先ST1から提供される情報に対する検索キーワードWD2を用いた検索とをそれぞれ要求する。検索制御部25の処理内容は、第一実施形態における検索制御部16と同様である。   The search control unit 25 requests a search corresponding to the combination specified by the specifying unit 24. Specifically, the search control unit 25 requests a search using the word data in the combination for the information provided from the site 7 in the combination specified by the specifying unit 24 as a search keyword. In a case where different word data are combined for the same site 7 in the plurality of combinations specified by the specifying unit 24, the search control unit 25 selects the information provided from the site 7. Request multiple searches. For example, when the two word data WD1 and WD2 are combined with the information providing destination ST1, the search control unit 25 performs a search using the search keyword WD1 for the information provided from the information providing destination ST1, and the information providing destination. A search using the search keyword WD2 is requested for the information provided from ST1. The processing content of the search control unit 25 is the same as that of the search control unit 16 in the first embodiment.

出力処理部26は、検索制御部16により検索結果として取得された情報をクライアント8に送信する。同一サイト7に関して異なる検索キーワードを用いた複数の検索が行われた場合、出力処理部26は、各検索の結果をクライアント8のユーザが区別できるように、取得された情報をクライアント8に送る。検索結果として取得された情報のクライアント8での出力方法については、第一実施形態で述べたとおりである。   The output processing unit 26 transmits information acquired as a search result by the search control unit 16 to the client 8. When a plurality of searches using different search keywords are performed for the same site 7, the output processing unit 26 sends the acquired information to the client 8 so that the user of the client 8 can distinguish the results of each search. The method for outputting the information acquired as the search result at the client 8 is as described in the first embodiment.

評価取得部27は、出力処理部26により送信された情報に対する前記ユーザの評価情報を取得する。取得された評価情報は、評価点を示す数値を示してもよいし、その情報をユーザが閲覧したか否かを示してもよい。評価点を示す数値は、良し悪しのみを示してもよいし、5段階、10段階のような詳細な点数を示してもよい。評価取得部27は、出力された情報に対するユーザの操作を検出することで、情報に対するユーザの閲覧状態を把握することができる。評価取得部27は、出力処理部26により情報が送信された後に、その情報の評価をユーザに入力させる画面をクライアント8に表示させてもよい。評価取得部27は、出力処理部26により複数の検索の結果が区別されてクライアント8に送信された場合、各検索について評価情報をそれぞれ取得する。本実施形態では、ユーザの評価情報の取得手法は制限されない。   The evaluation acquisition unit 27 acquires the user evaluation information for the information transmitted by the output processing unit 26. The acquired evaluation information may indicate a numerical value indicating an evaluation score, or may indicate whether or not the user has viewed the information. The numerical value indicating the evaluation point may indicate only good or bad, or may indicate a detailed score such as 5 levels or 10 levels. The evaluation acquisition part 27 can grasp | ascertain the browsing state of the user with respect to information by detecting the user's operation with respect to the output information. The evaluation acquisition unit 27 may cause the client 8 to display a screen for allowing the user to input an evaluation of the information after the information is transmitted by the output processing unit 26. The evaluation acquisition unit 27 acquires evaluation information for each search when the output processing unit 26 distinguishes a plurality of search results and transmits them to the client 8. In the present embodiment, the method for acquiring user evaluation information is not limited.

更新部28は、評価取得部27により取得された評価情報に基づいて、提供先関係テーブルにおいて、当該検索の対象とされた情報提供先に関連付けられている特徴ベクトルを更新する。評価取得部27により取得される評価情報は、ユーザに提供された情報を抽出した検索に対する評価を示す。よって、評価される検索の対象とされた情報提供先に関連付けられている特徴ベクトルが、その検索で用いられた単語データの特徴ベクトルに近付く又はその特徴ベクトルから離れるように、更新される。本実施形態では、特徴ベクトルの更新手法は制限されない。   Based on the evaluation information acquired by the evaluation acquisition unit 27, the update unit 28 updates the feature vector associated with the information providing destination that is the target of the search in the providing destination relation table. The evaluation information acquired by the evaluation acquisition unit 27 indicates an evaluation for a search in which information provided to the user is extracted. Therefore, the feature vector associated with the information provider to be evaluated is updated so as to approach or separate from the feature vector of the word data used in the search. In the present embodiment, the feature vector update method is not limited.

〔動作例/情報分析方法〕
以下、第二実施形態における情報分析方法について図9を用いて説明する。図9は、第二実施形態における分析装置10の動作例を示すフローチャートである。図9に示されるように、第二実施形態における情報分析方法は、分析装置10のような少なくとも一つのコンピュータにより実行される。図9に示される各工程は、分析装置10が有する各ソフトウェア要素の処理内容と同様であるため、各工程の詳細は、適宜省略される。
[Operation example / Information analysis method]
Hereinafter, the information analysis method in the second embodiment will be described with reference to FIG. FIG. 9 is a flowchart showing an operation example of the analyzer 10 in the second embodiment. As shown in FIG. 9, the information analysis method in the second embodiment is executed by at least one computer such as the analysis apparatus 10. Each process shown in FIG. 9 is the same as the processing content of each software element included in the analyzer 10, and therefore details of each process are omitted as appropriate.

分析装置10は、複数の単語データを取得する(S91)。このとき、分析装置10は、その単語データの元となるユーザの識別情報も合わせて取得する。アクティブ動作モードがサポートされていない点を除いて、工程(S91)の具体的内容は、第一実施形態における工程(S61)と同様である。   The analyzer 10 acquires a plurality of word data (S91). At this time, the analysis apparatus 10 also acquires user identification information that is the source of the word data. Except for the fact that the active operation mode is not supported, the specific content of the step (S91) is the same as the step (S61) in the first embodiment.

分析装置10は、(S91)で取得された複数の単語データを単語特徴ベクトルにそれぞれ変換する(S92)。この変換方法については、変換部22の説明中で述べたとおりである。   The analysis apparatus 10 converts the plurality of word data acquired in (S91) into word feature vectors, respectively (S92). This conversion method is as described in the description of the conversion unit 22.

分析装置10は、ユーザの提供先関係テーブルに格納される各特徴ベクトルと、(S92)の変換で得られた各単語特徴ベクトルとの類似度をそれぞれ算出することにより、検索対象とする情報提供先(サイト7)と単語データとの組み合わせを特定する(S93)。類似度の算出手法及び組み合わせの特定手法については、特定部24の説明中で述べたとおりである。   The analysis device 10 provides information to be searched for by calculating the similarity between each feature vector stored in the user's provider relationship table and each word feature vector obtained by the conversion of (S92). A combination of the destination (site 7) and the word data is specified (S93). The similarity calculation method and the combination specifying method are as described in the description of the specifying unit 24.

分析装置10は、特定部24により特定された組み合わせ毎に、その組み合わせに対応する情報検索を要求する(S94)。(S94)の内容については、検索制御部25の説明中で述べたとおりである。   For each combination specified by the specifying unit 24, the analyzer 10 requests an information search corresponding to the combination (S94). The contents of (S94) are as described in the description of the search control unit 25.

分析装置10は、(S94)の要求に応じて実行された検索の結果、取得された情報をクライアント8に送信する(S95)。同一サイト7に関して異なる検索キーワードを用いた複数の検索が行われた場合、分析装置10は、各検索の結果をクライアント8のユーザが区別できるように、取得された情報をそれぞれクライアント8に送る。検索結果として取得された情報のクライアント8での出力方法については、第一実施形態で述べたとおりである。   The analysis apparatus 10 transmits information acquired as a result of the search executed in response to the request (S94) to the client 8 (S95). When a plurality of searches using different search keywords are performed for the same site 7, the analysis apparatus 10 sends the acquired information to the client 8 so that the user of the client 8 can distinguish the results of each search. The method for outputting the information acquired as the search result at the client 8 is as described in the first embodiment.

分析装置10は、(S95)で送信された(出力された)情報に対するユーザの評価情報を取得する(S96)。取得される評価情報及びその評価情報の取得方法については、評価取得部27の説明中で述べたとおりである。   The analysis apparatus 10 acquires user evaluation information for the information transmitted (output) in (S95) (S96). The evaluation information acquired and the method for acquiring the evaluation information are as described in the description of the evaluation acquisition unit 27.

分析装置10は、(S96)で取得された評価情報に基づいて、提供先関係テーブルにおいて、当該検索の対象とされた情報提供先に関連付けられている特徴ベクトルを更新する(S97)。この更新手法については、更新部28の説明中で述べたとおりである。   Based on the evaluation information acquired in (S96), the analysis apparatus 10 updates the feature vector associated with the information providing destination that is the search target in the providing destination relation table (S97). This update method is as described in the description of the update unit 28.

次に、具体的なデータを用いて、第二実施形態における情報分析方法の具体例を更に説明する。図10は、第二実施形態における分析装置10の一動作例のフロー及びデータの処理例を示す図である。ここでは、クライアント8で表示されているカレンダ画面に対して、ユーザUS2が、「花見に行く」というスケジュールを入力したと仮定する。   Next, a specific example of the information analysis method in the second embodiment will be further described using specific data. FIG. 10 is a diagram illustrating a flow of an operation example of the analysis apparatus 10 and a data processing example in the second embodiment. Here, it is assumed that the user US2 inputs a schedule “going to cherry blossom viewing” on the calendar screen displayed on the client 8.

(S101)、(S102)及び(S103)の内容については、図7について説明された(S71)、(S72)及び(S73)の内容と同様である。   The contents of (S101), (S102), and (S103) are the same as the contents of (S71), (S72), and (S73) described with reference to FIG.

本実施形態では、提供先DB23の提供先関係テーブルには、情報提供先(サイト7)毎に特徴ベクトルが格納されている。図10の例では、ユーザの識別情報と情報提供先の識別情報と特徴ベクトルとが関連付けられて提供先関係テーブルに格納されている。例えば、ユーザUS2に関し、情報提供先「イベントサイト」と特徴ベクトルVC3とが関連付けられており、情報提供先「グルメサイト」と特徴ベクトルVC4とが関連付けられている。   In the present embodiment, a feature vector is stored for each information provider (site 7) in the provider relationship table of the provider DB 23. In the example of FIG. 10, the identification information of the user, the identification information of the information providing destination, and the feature vector are associated and stored in the providing destination relationship table. For example, for the user US2, the information providing destination “event site” and the feature vector VC3 are associated, and the information providing destination “gourmet site” and the feature vector VC4 are associated.

分析装置10は、(S103)の変換で取得された「花見」及び「行く」の各単語特徴ベクトルと、ユーザUS2の提供先関係テーブルに格納されている各特徴ベクトルとの類似度をそれぞれ計算し、情報提供先と単語データとの組み合わせを特定する(S104)。ここでは、「花見」の単語特徴ベクトルと情報提供先「イベントサイト」の特徴ベクトルとの類似度「0.56」が所定閾値「0」以上であるため、単語データ「花見」と情報提供先「イベントサイト」との組み合わせが特定される。更に、単語データ「行く」の特徴ベクトルと情報提供先「イベントサイト」の特徴ベクトルとの類似度「0.23」が所定閾値「0」以上であるため、単語データ「行く」と情報提供先「イベントサイト」との組み合わせが特定される。ここでは、類似度が所定閾値未満を示したことにより、情報提供先「グルメサイト」に係る組み合わせは、特定されない。   The analysis apparatus 10 calculates the degree of similarity between the word feature vectors “cherry-blossom viewing” and “go” acquired in the conversion of (S103) and the feature vectors stored in the providing relationship table of the user US2. Then, the combination of the information providing destination and the word data is specified (S104). Here, since the similarity “0.56” between the word feature vector of “Hanami” and the feature vector of the information providing destination “event site” is equal to or greater than the predetermined threshold “0”, the word data “Hanami” and the information providing destination are provided. A combination with the “event site” is specified. Furthermore, since the similarity “0.23” between the feature vector of the word data “go” and the feature vector of the information provider “event site” is equal to or greater than the predetermined threshold “0”, the word data “go” and the information provider A combination with the “event site” is specified. Here, the combination related to the information providing destination “gourmet site” is not specified because the similarity is less than the predetermined threshold.

分析装置10は、(S104)で特定された2つの組み合わせに対応する2つの検索を要求する。これにより、情報提供先「イベントサイト」から提供される情報に対する検索キーワード「花見」を用いた第一の検索と、同じ情報提供先「イベントサイト」から提供される情報に対する検索キーワード「行く」を用いた第二の検索とがそれぞれ実行される。
分析装置10は、2つの検索により得られる情報を区別可能な状態でそれぞれクライアント8に送信する(S105)。
The analysis apparatus 10 requests two searches corresponding to the two combinations specified in (S104). As a result, the first search using the search keyword “hanami” for information provided from the information provider “event site” and the search keyword “go” for information provided from the same information provider “event site” Each of the used second searches is executed.
The analysis device 10 transmits the information obtained by the two searches to the client 8 in a distinguishable state (S105).

分析装置10は、(S105)でクライアント8に送信された情報についての、ユーザUS2の評価を示す評価情報を取得する(S106)。具体的には、分析装置10は、第一の検索により得られた情報の評価情報及び第二の検索により得られた情報の評価情報を取得する。ここでは、第一の検索に関する評価情報は、提供された情報がユーザUS2により閲覧されたことを示し、第二の検索に関する評価情報は、提供された情報がユーザUS2により閲覧されなかったことを示す。   The analysis apparatus 10 acquires evaluation information indicating the evaluation of the user US2 with respect to the information transmitted to the client 8 in (S105) (S106). Specifically, the analysis apparatus 10 acquires evaluation information of information obtained by the first search and evaluation information of information obtained by the second search. Here, the evaluation information regarding the first search indicates that the provided information has been browsed by the user US2, and the evaluation information regarding the second search indicates that the provided information has not been browsed by the user US2. Show.

分析装置10は、(S106)で取得された評価情報に基づいて、ユーザUS2の提供先関係テーブルにおいて、情報提供先「イベントサイト」に関連付けられている特徴ベクトルVC3を更新する(S107)。図10の例では、単語データ「花見」の単語特徴ベクトルに近づき、なおかつ単語データ「行く」の単語特徴ベクトルから離れた値を取るように、特徴ベクトルVC3をVC3'へと更新する。   Based on the evaluation information acquired in (S106), the analysis apparatus 10 updates the feature vector VC3 associated with the information providing destination “event site” in the providing destination relation table of the user US2 (S107). In the example of FIG. 10, the feature vector VC3 is updated to VC3 ′ so as to approach the word feature vector of the word data “cherry blossom” and take a value away from the word feature vector of the word data “go”.

〔第二実施形態の作用及び効果〕
第二実施形態では、情報提供先毎に特徴ベクトルが関連付けられており、ユーザから得られた単語データの特徴ベクトルとその特徴ベクトルとの類似度により、情報提供先と単語データとの組み合わせが特定される。更に、その特定された組み合わせに基づいて、情報提供先から提供される情報に対する検索キーワードを用いた検索が行われ、その検索により抽出される情報がユーザに提供される。そして、その提供された情報に関するユーザの評価情報が取得され、その評価情報に基づいて情報提供先に関連付けられた特徴ベクトルが更新される。
[Operation and effect of the second embodiment]
In the second embodiment, a feature vector is associated with each information providing destination, and the combination of the information providing destination and the word data is specified based on the similarity between the feature vector of the word data obtained from the user and the feature vector. Is done. Furthermore, based on the identified combination, a search using a search keyword is performed on information provided from the information providing destination, and information extracted by the search is provided to the user. Then, the user evaluation information related to the provided information is acquired, and the feature vector associated with the information providing destination is updated based on the evaluation information.

これにより、ユーザの評価が高い場合、情報提供先毎に関連付けられている特徴ベクトルが、検索キーワードに用いられた単語データの特徴量に近付くように更新され、ユーザの評価が低い場合、その単語データの特徴量から離れるように更新される。即ち、第二実施形態によれば、情報提供先と特徴ベクトルとの関係が、各ユーザの嗜好に合うように、自動で学習される。結果、第二実施形態によれば、提供先関係テーブルの設定を自動化することができる。第二実施形態によれば、ユーザに所望の情報を提供できると共に、テーブルの管理労力を低減することができる。   Thereby, when the user's evaluation is high, the feature vector associated with each information providing destination is updated so as to approach the feature amount of the word data used for the search keyword, and when the user's evaluation is low, the word Updated to move away from the data feature. That is, according to the second embodiment, the relationship between the information providing destination and the feature vector is automatically learned so as to suit each user's preference. As a result, according to the second embodiment, setting of the provision destination relation table can be automated. According to the second embodiment, desired information can be provided to the user, and the management effort of the table can be reduced.

[第三実施形態]
以下、第三実施形態における情報分析装置及び情報分析方法について説明する。また、第三実施形態は、この情報分析方法を少なくとも一つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録した当該少なくとも一つのコンピュータが読み取り可能な記録媒体であってもよい。
[Third embodiment]
Hereinafter, an information analysis apparatus and an information analysis method according to the third embodiment will be described. The third embodiment may be a program that causes at least one computer to execute the information analysis method, or may be a recording medium that can be read by the at least one computer that records such a program. Good.

図11は、第三実施形態における情報分析装置100の処理構成例を概念的に示す図である。図11に示されるように、情報分析装置100は、取得部101、特定部102、選択部103及び検索制御部104を有する。図11に示される情報分析装置100は、例えば、図1に示される上述の分析装置10と同様のハードウェア構成を有し、その分析装置10と同様にプログラムが処理されることで、上述の各ソフトウェア要素が実現される。   FIG. 11 is a diagram conceptually illustrating a processing configuration example of the information analysis apparatus 100 in the third embodiment. As illustrated in FIG. 11, the information analysis apparatus 100 includes an acquisition unit 101, a specification unit 102, a selection unit 103, and a search control unit 104. The information analysis apparatus 100 shown in FIG. 11 has, for example, the same hardware configuration as that of the above-described analysis apparatus 10 shown in FIG. Each software element is realized.

取得部101は、ユーザの動作に起因して生成された複数の単語データを取得する。ユーザの動作は、クライアント8の操作(キーボード操作、マウス操作、タッチパネル操作、クライアント8の端末を動かす等)、発声、ジェスチャ等、あらゆる動作を含む。取得される単語データは、ユーザの動作に間接的に起因して得られる単語データであってもよい。例えば、取得部101は、ユーザの閲覧操作によりサーバ装置(図示せず)から提供される情報に含まれる文字列データから、当該複数の単語データを取得することもできる。取得部101は、クライアント8から当該複数の単語データを取得してもよいし、クライアント8又は他の装置から得られるデータに対して所定処理(形態素解析、音声認識、ジェスチャ認識等)を適用することで当該複数の単語データを取得してもよい。また、取得部101は、可搬型記録媒体や、クライアント8以外の他の装置から単語データを取得することもできる。   The acquisition unit 101 acquires a plurality of word data generated due to the user's action. The user's operation includes all operations such as operation of the client 8 (keyboard operation, mouse operation, touch panel operation, moving the terminal of the client 8, etc.), speech, gesture and the like. The acquired word data may be word data obtained indirectly due to the user's action. For example, the acquisition unit 101 can also acquire the plurality of word data from character string data included in information provided from a server device (not shown) by a user browsing operation. The acquisition unit 101 may acquire the plurality of word data from the client 8, or apply predetermined processing (morphological analysis, speech recognition, gesture recognition, etc.) to data obtained from the client 8 or another device. Thus, the plurality of word data may be acquired. The acquisition unit 101 can also acquire word data from a portable recording medium or a device other than the client 8.

特定部102は、複数の提供先カテゴリの中から、取得部101により取得された複数の単語データに対応する提供先カテゴリを特定する。提供先カテゴリの意味は、第一実施形態において述べたとおりである。特定部102の具体例が、特定部14及び特定部24である。即ち、特定部102は、第一実施形態におけるキーワードDB13の提供先関係テーブルを用いてもよいし、第二実施形態における提供先DB23の提供先関係テーブルを用いてもよい。また、特定部102は、単語間の一致を用いてもよいし、単語間(特徴量データ間)の類似度を用いてもよい。   The specifying unit 102 specifies a provider category corresponding to the plurality of word data acquired by the acquiring unit 101 from the plurality of provider categories. The meaning of the provision destination category is as described in the first embodiment. Specific examples of the specifying unit 102 are the specifying unit 14 and the specifying unit 24. That is, the specifying unit 102 may use the provision destination relation table of the keyword DB 13 in the first embodiment or the provision destination relation table of the provision destination DB 23 in the second embodiment. The specifying unit 102 may use matching between words, or may use similarity between words (between feature data).

図11に示されるように、情報分析装置100は、提供先関係テーブルを持たなくてもよいし、持っていてもよい。情報分析装置100は、他の装置が持つ提供先関係テーブルを参照すればよい。   As illustrated in FIG. 11, the information analysis apparatus 100 may or may not have the provision destination relation table. The information analysis apparatus 100 may refer to the provision destination relation table possessed by another apparatus.

選択部103は、複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、取得部101により取得された各単語データが特定部102により特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定することにより、取得部101により取得された複数の単語データの中から検索キーワードに用いる単語データを選択する。クエリ関係情報の具体例が、第一実施形態におけるクエリカテゴリテーブル及びクエリワードテーブルである。クエリ関係情報で示されるキーワード情報データとは、単語データ又は単語の特徴を示す特徴データ(特徴ベクトルも含む)である。クエリカテゴリの意味は第一実施形態で述べたとおりである。情報分析装置100は、クエリ関係情報を持っていてもよいし、持たなくてもよい。情報分析装置100は、他の装置が持つクエリ関係情報を参照してもよい。選択部103の具体例が、選択部15である。   The selection unit 103 is configured to obtain each relationship acquired by the acquisition unit 101 based on query relationship information indicating a relationship between a plurality of provision destination categories and a plurality of query categories and a relationship between the plurality of query categories and a plurality of keyword information data. A word used as a search keyword from among a plurality of word data acquired by the acquisition unit 101 by determining whether the word data belongs to a query category associated with the provision category specified by the specifying unit 102 Select data. Specific examples of the query relation information are the query category table and the query word table in the first embodiment. The keyword information data indicated by the query relation information is word data or feature data (including a feature vector) indicating a word feature. The meaning of the query category is as described in the first embodiment. The information analysis apparatus 100 may or may not have query related information. The information analysis apparatus 100 may refer to query relation information possessed by another apparatus. A specific example of the selection unit 103 is the selection unit 15.

検索制御部104は、特定部102により特定された提供先カテゴリに対応する情報提供先から提供される情報に対する、選択部103により選択された単語データを検索キーワードとして用いた検索を要求する。情報提供先とは、各種情報を提供する装置を意味する。情報提供先の具体例が情報提供サイト7である。検索制御部104は、情報提供先に対して検索を要求してもよいし、情報提供先から提供される全情報を収集した他の装置に対して検索を要求してもよい。また、検索制御部104は、情報分析装置100自身が検索を実行する場合には、その検索を行うソフトウェア要素に対して検索を要求してもよい。検索制御部104の具体例が、検索制御部16及び検索制御部25である。   The search control unit 104 requests a search using the word data selected by the selection unit 103 as a search keyword for information provided from an information providing destination corresponding to the providing destination category specified by the specifying unit 102. The information providing destination means a device that provides various types of information. A specific example of the information providing destination is the information providing site 7. The search control unit 104 may request a search from the information providing destination, or may request a search from another device that has collected all the information provided from the information providing destination. In addition, when the information analysis apparatus 100 itself executes a search, the search control unit 104 may request a search from a software element that performs the search. Specific examples of the search control unit 104 are the search control unit 16 and the search control unit 25.

図11に示されるように、情報分析装置100は、出力処理部17及び出力処理部26を有していなくてもよい。検索により得られた情報は、他の装置(情報提供先を含む)からクライアント8に送られてもよいからである。   As illustrated in FIG. 11, the information analysis apparatus 100 may not include the output processing unit 17 and the output processing unit 26. This is because the information obtained by the search may be sent to the client 8 from another device (including the information providing destination).

第三実施形態における情報分析方法は、情報分析装置100のような少なくとも一つのコンピュータにより実行される。本実施形態における情報分析方法は、工程(S111)、(S112)、(S113)、(S114)及び(S115)を含む。これら各工程は、情報分析装置100が有する各ソフトウェア要素の処理内容と同様であるため、各工程の詳細は、適宜省略される。   The information analysis method in the third embodiment is executed by at least one computer such as the information analysis apparatus 100. The information analysis method in this embodiment includes steps (S111), (S112), (S113), (S114), and (S115). Since these processes are the same as the processing contents of the software elements included in the information analysis apparatus 100, details of the processes are omitted as appropriate.

工程(S111)では、コンピュータ(CPU1)は、ユーザの動作に起因して生成された複数の単語データを取得する。
工程(S112)では、コンピュータ(CPU1)は、複数の提供先カテゴリの中から、(S111)で記取得された少なくとも一つの単語データに対応する提供先カテゴリを特定する。
In step (S111), the computer (CPU 1) acquires a plurality of word data generated due to the user's action.
In step (S112), the computer (CPU 1) specifies a provision destination category corresponding to at least one word data recorded and acquired in (S111) from among a plurality of provision destination categories.

工程(S113)では、コンピュータ(CPU1)は、複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、(S111)で取得された各単語データが(S112)で特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定する。   In the step (S113), the computer (CPU 1), based on the query relationship information indicating the relationship between the plurality of destination categories and the plurality of query categories and the relationship between the plurality of query categories and the plurality of keyword information data ( It is determined whether each word data acquired in (S111) belongs to the query category associated with the providing destination category specified in (S112).

工程(S114)では、コンピュータ(CPU1)は、(S113)における判定の結果に基づいて、(S111)で取得された複数の単語データの中から検索キーワードに用いる単語データを選択する。
工程(S115)では、コンピュータ(CPU1)は、(S112)で特定された提供先カテゴリに対応する情報提供先から提供される情報に対する、(S114)で選択された単語データを検索キーワードとして用いた検索を要求する。
In step (S114), the computer (CPU 1) selects word data to be used as a search keyword from the plurality of word data acquired in (S111) based on the determination result in (S113).
In step (S115), the computer (CPU1) uses the word data selected in (S114) as the search keyword for the information provided from the information provider corresponding to the provider category specified in (S112). Request a search.

第三実施形態において、一つの提供先カテゴリは、一つの情報提供先のみに対応付けられてもよいし、複数の情報提供先に対応付けられてもよい。例えば、一つの提供先カテゴリが一つの情報提供先のみに対応付けられる場合には、上述の「提供先カテゴリ」は、「情報提供先」に置き換えることができる。   In the third embodiment, one provision destination category may be associated with only one information provision destination, or may be associated with a plurality of information provision destinations. For example, in the case where one provision destination category is associated with only one information provision destination, the above-mentioned “provision destination category” can be replaced with “information provision destination”.

〔第三実施形態の作用及び効果〕
第三実施形態では、ユーザの動作に起因して生成された複数の単語データに基づいて、提供先カテゴリが特定され、この提供先カテゴリに対応する情報提供先が情報検索の対象とされる。従って、第三実施形態によれば、信頼性の高い情報提供先を登録しておくことにより、信頼性が高くかつユーザに関連する情報を提供する情報提供先を対象に検索を実行することができる。結果、ユーザに対して、信頼性が高くかつユーザに関連する情報を提供することができる。
[Operation and effect of the third embodiment]
In the third embodiment, a provision destination category is specified based on a plurality of word data generated due to a user's action, and an information provision destination corresponding to the provision destination category is a target of information search. Therefore, according to the third embodiment, by registering a highly reliable information providing destination, it is possible to perform a search for an information providing destination that provides information that is highly reliable and related to the user. it can. As a result, it is possible to provide the user with high reliability and information related to the user.

更に、第三実施形態では、当該各単語データがその特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かが判定され、その判定結果により当該複数の単語データの中から検索キーワードに用いる単語データが選択される。これにより、第三実施形態では、ユーザの動作に起因して生成された単語データであっても、上述のように特定された情報提供先に対応するクエリカテゴリに属さない単語データは、検索キーワードから除外される。従って、第三実施形態によれば、情報提供先から提供される情報の内容に合った単語データを検索キーワードに用いた検索を実行することができるため、ユーザの興味や関心に合った情報を高精度に提供することができる。   Furthermore, in the third embodiment, it is determined whether or not each of the word data belongs to a query category associated with the specified provider category, and a search keyword is selected from the plurality of word data based on the determination result. The word data to be used is selected. Thereby, in the third embodiment, even if the word data is generated due to the user's action, the word data that does not belong to the query category corresponding to the information providing destination specified as described above is the search keyword. Excluded from. Therefore, according to the third embodiment, since it is possible to execute a search using word data that matches the content of information provided from an information providing destination as a search keyword, information that matches the user's interests and interests can be obtained. It can be provided with high accuracy.

そして、第三実施形態では、上述のように特定された提供先カテゴリ及び選択された単語データに基づいて、情報提供先から提供される情報に対する検索キーワードを用いた検索が要求される。この要求は、情報検索機能を持つ装置又はソフトウェア要素に対して行われればよいため、サイト検索機能の有無に依存せず、信頼性の高い様々な情報提供先を対象とすることができる。   In the third embodiment, a search using a search keyword for information provided from the information providing destination is requested based on the providing destination category specified as described above and the selected word data. Since this request only needs to be made to a device or software element having an information search function, it does not depend on the presence or absence of the site search function and can target various reliable information providing destinations.

なお、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。   In addition, in the some flowchart used by the above-mentioned description, although several process (process) is described in order, the execution order of the process performed by each embodiment is not restrict | limited to the order of the description. In each embodiment, the order of the illustrated steps can be changed within a range that does not hinder the contents. Moreover, each above-mentioned embodiment can be combined in the range in which the content does not conflict.

上述の内容は、以下のようにも特定され得る。但し、上述の内容が以下の記載に限定されるものではない。   The above contents can also be specified as follows. However, the above-mentioned content is not limited to the following description.

1. ユーザの動作に起因して生成された複数の単語データを取得する取得手段と、
複数の提供先カテゴリの中から、前記取得された複数の単語データに対応する提供先カテゴリを特定する特定手段と、
前記複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定することにより、前記取得された複数の単語データの中から検索キーワードに用いる単語データを選択する選択手段と、
前記特定された提供先カテゴリに対応する情報提供先から提供される情報に対する前記選択された単語データを検索キーワードとして用いた検索を要求する検索制御手段と、
を備える情報分析装置。
2. 前記特定手段は、前記複数の提供先カテゴリと複数のキーワード情報データとの関係を示す提供先関係情報を参照することにより、前記提供先カテゴリを特定し、
前記提供先関係情報と前記クエリ関係情報とでは、少なくとも一つの同一提供先カテゴリに対応付けられるキーワード情報データ群が、相違する、
1.に記載の情報分析装置。
3. 前記特定手段は、前記取得された複数の単語データに対応する複数の提供先カテゴリを特定し、
前記選択手段は、前記特定された複数の提供先カテゴリの各々について、前記取得された複数の単語データの中から検索キーワードに用いる単語データをそれぞれ選択する、
1.又は2.に記載の情報分析装置。
4. 前記選択手段は、前記クエリ関係情報で示されるキーワード情報データと前記取得された各単語データの特徴量との類似度をそれぞれ算出し、算出された類似度を用いて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定する、
1.から3.のいずれか1つに記載の情報分析装置。
5. 前記特定手段は、前記複数の提供先カテゴリと複数のキーワード情報データとの関係を示す提供先関係情報で示されるキーワード情報データと前記取得された各単語データの特徴量との類似度をそれぞれ算出し、算出された類似度の距離により、前記提供先カテゴリを特定する、
1.から4.のいずれか1つに記載の情報分析装置。
6. 前記検索制御手段は、一つの単語データも選択されてなかった提供先カテゴリが存在する場合には、その提供先カテゴリに対応するサイト7から提供される情報に対する、検索キーワードを指定しない検索を要求する、
1.から5.のいずれか1つに記載の情報分析装置。
7. ユーザの動作に起因して生成された複数の単語データを取得する取得手段と、
前記取得された複数の単語データを単語特徴ベクトルにそれぞれ変換する変換手段と、
前記ユーザの提供先関係情報において複数の情報提供先と関連付けられた各特徴ベクトルと各単語特徴ベクトルとの類似度をそれぞれ算出することにより、検索対象とする情報提供先と単語データとの組み合わせを特定する特定手段と、
前記特定された組み合わせにおける情報提供先から提供される情報に対するその組み合わせにおける単語データを検索キーワードとして用いた検索を要求する検索制御手段と、
前記検索制御手段により要求された前記検索の結果情報に対する前記ユーザの評価情報を取得する評価取得手段と、
前記取得された評価情報に基づいて、前記検索の対象とされた情報提供先に前記提供先関係情報において関連付けられている特徴ベクトルを更新する更新手段と、
を備える情報分析装置。
8. 前記取得手段は、前記ユーザの動作に起因して取得された文字列データを品詞分解することにより、前記複数の単語データを抽出する、
1.から7.のいずれか1つに記載の情報分析装置。
9. 前記取得手段は、前記ユーザに関連付けられて蓄積される複数の単語データの中から前記複数の単語データを取得する、
1.から6.のいずれか1つに記載の情報分析装置。
10. 少なくとも一つのコンピュータにより実行される情報分析方法において、
ユーザの動作に起因して生成された複数の単語データを取得し、
複数の提供先カテゴリの中から、前記取得された少なくとも一つの単語データに対応する提供先カテゴリを特定し、
前記複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定し、
前記判定の結果に基づいて、前記取得された複数の単語データの中から検索キーワードに用いる単語データを選択し、
前記特定された提供先カテゴリに対応する情報提供先から提供される情報に対する前記選択された単語データを検索キーワードとして用いた検索を要求する、
ことを含む情報分析方法。
11. 前記特定は、前記複数の提供先カテゴリと複数のキーワード情報データとの関係を示す提供先関係情報を参照することを含み、
前記提供先関係情報と前記クエリ関係情報とでは、少なくとも一つの同一提供先カテゴリに対応付けられるキーワード情報データ群が、相違する、
10.に記載の情報分析方法。
12. 前記取得された複数の単語データに対応する複数の提供先カテゴリを特定し、
前記クエリ関係情報に基づいて、前記取得された各単語データが前記特定された各提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定し、
前記特定された複数の提供先カテゴリの各々について、前記取得された複数の単語データの中から検索キーワードに用いる単語データをそれぞれ選択する、
ことを更に含む10.又は11.に記載の情報分析方法。
13. 前記クエリ関係情報で示されるキーワード情報データと前記取得された各単語データの特徴量との類似度をそれぞれ算出する、
ことを更に含み、
前記判定は、前記算出された類似度を用いて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定する、
10.から12.のいずれか1つに記載の情報分析方法。
14. 前記複数の提供先カテゴリと複数のキーワード情報データとの関係を示す提供先関係情報で示されるキーワード情報データと前記取得された各単語データの特徴量との類似度をそれぞれ算出する、
ことを更に含み、
前記特定は、前記算出された類似度の距離により、前記提供先カテゴリを特定する、
10.から13.のいずれか1つに記載の情報分析方法。
15. 一つの単語データも選択されてなかった提供先カテゴリが存在する場合には、その提供先カテゴリに対応するサイト7から提供される情報に対する、検索キーワードを指定しない検索を要求する、
ことを更に含む10.から14.のいずれか1つに記載の情報分析方法。
16. 少なくとも一つのコンピュータにより実行される情報分析方法において、
ユーザの動作に起因して生成された複数の単語データを取得し、
前記取得された複数の単語データを単語特徴ベクトルにそれぞれ変換し、
前記ユーザの提供先関係情報において複数の情報提供先と関連付けられた各特徴ベクトルと各単語特徴ベクトルとの類似度をそれぞれ算出し、
前記算出された類似度に基づいて、検索対象とする情報提供先と単語データとの組み合わせを特定し、
前記特定された組み合わせにおける情報提供先から提供される情報に対するその組み合わせにおける単語データを検索キーワードとして用いた検索を要求し、
前記要求された前記検索の結果情報に対する前記ユーザの評価情報を取得し、
前記取得された評価情報に基づいて、前記検索の対象とされた情報提供先に前記提供先関係情報において関連付けられている特徴ベクトルを更新する、
ことを更に含む情報分析方法。
17. 前記ユーザの動作に起因して取得された文字列データを品詞分解する、
ことを更に含む10.から16.のいずれか1つに記載の情報分析方法。
18. 前記取得は、前記ユーザに関連付けられて蓄積される複数の単語データの中から前記複数の単語データを取得する、
10.から15.のいずれか1つに記載の情報分析方法。
19. 10.から18.のいずれか1つに記載の情報分析方法を少なくとも一つのコンピュータに実行させるプログラム。
1. Acquisition means for acquiring a plurality of word data generated due to user's action;
A specifying means for specifying a provider category corresponding to the acquired plurality of word data from a plurality of provider categories;
Each acquired word data is specified based on query relationship information indicating a relationship between the plurality of destination categories and a plurality of query categories and a relationship between the plurality of query categories and a plurality of keyword information data. Selecting means for selecting word data to be used as a search keyword from the plurality of obtained word data by determining whether or not each belongs to a query category associated with a provider category;
Search control means for requesting a search using the selected word data as a search keyword for information provided from an information provider corresponding to the specified provider category;
An information analysis apparatus comprising:
2. The specifying unit specifies the providing destination category by referring to providing destination relation information indicating a relationship between the plurality of providing destination categories and the plurality of keyword information data;
In the provider relationship information and the query relationship information, keyword information data groups associated with at least one same provider category are different.
1. Information analysis device described in 1.
3. The specifying means specifies a plurality of provision destination categories corresponding to the plurality of acquired word data,
The selection means selects word data to be used as a search keyword from the plurality of acquired word data for each of the specified plurality of provision destination categories.
1. Or 2. Information analysis device described in 1.
4). The selection unit calculates a similarity between the keyword information data indicated by the query relation information and the feature amount of each acquired word data, and uses each of the acquired words using the calculated similarity. Respectively determining whether the data belongs to a query category associated with the specified provider category;
1. To 3. An information analysis apparatus according to any one of the above.
5. The specifying unit calculates the similarity between the keyword information data indicated by the supply destination relation information indicating the relationship between the plurality of supply destination categories and the plurality of keyword information data and the feature amount of each acquired word data. And specifying the provider category based on the calculated distance of similarity.
1. To 4. An information analysis apparatus according to any one of the above.
6). When there is a provision category for which no word data has been selected, the search control means requests a search without specifying a search keyword for information provided from the site 7 corresponding to the provision category. To
1. To 5. An information analysis apparatus according to any one of the above.
7). Acquisition means for acquiring a plurality of word data generated due to user's action;
Conversion means for converting each of the obtained plurality of word data into a word feature vector;
By calculating the similarity between each feature vector and each word feature vector associated with a plurality of information providing destinations in the user providing destination relation information, a combination of the information providing destination and word data to be searched is calculated. Identification means to identify;
Search control means for requesting a search using word data in the combination as a search keyword for the information provided from the information providing destination in the specified combination;
Evaluation acquisition means for acquiring the user evaluation information for the search result information requested by the search control means;
Updating means for updating a feature vector associated with the information providing destination to be searched based on the obtained evaluation information in the providing destination relation information;
An information analysis apparatus comprising:
8). The acquisition means extracts the plurality of word data by decomposing part-of-speech of character string data acquired due to the action of the user.
1. To 7. An information analysis apparatus according to any one of the above.
9. The acquisition means acquires the plurality of word data from a plurality of word data accumulated in association with the user.
1. To 6. An information analysis apparatus according to any one of the above.
10. In an information analysis method executed by at least one computer,
Get multiple word data generated due to user actions,
A provider category corresponding to the acquired at least one word data is identified from a plurality of provider categories;
Each acquired word data is specified based on query relationship information indicating a relationship between the plurality of destination categories and a plurality of query categories and a relationship between the plurality of query categories and a plurality of keyword information data. Determine whether each belongs to the query category associated with the provided category,
Based on the result of the determination, select word data to be used as a search keyword from the plurality of acquired word data,
Requesting a search using the selected word data as a search keyword for information provided from an information provider corresponding to the specified provider category;
Information analysis method.
11. The specifying includes referring to provision destination relation information indicating a relation between the plurality of provision destination categories and the plurality of keyword information data;
In the provider relationship information and the query relationship information, keyword information data groups associated with at least one same provider category are different.
10. Information analysis method described in 1.
12 Identifying a plurality of destination categories corresponding to the plurality of acquired word data;
Based on the query relation information, it is determined whether each of the acquired word data belongs to a query category associated with each specified provider category,
For each of the plurality of specified supply destination categories, respectively select word data to be used as a search keyword from the plurality of acquired word data.
Further includes: Or 11. Information analysis method described in 1.
13. Calculating the degree of similarity between the keyword information data indicated by the query relation information and the feature quantity of each acquired word data;
Further including
The determination is performed by using the calculated similarity to determine whether each acquired word data belongs to a query category associated with the specified provider category,
10. To 12. The information analysis method as described in any one of these.
14 Calculating the degree of similarity between the keyword information data indicated by the provision destination relation information indicating the relationship between the plurality of provision destination categories and the plurality of keyword information data and the feature amount of each of the acquired word data;
Further including
The specification specifies the provision destination category based on the calculated distance of similarity.
10. To 13. The information analysis method as described in any one of these.
15. If there is a provision category for which no word data has been selected, a search without designating a search keyword is requested for information provided from the site 7 corresponding to the provision category.
Further includes: To 14. The information analysis method as described in any one of these.
16. In an information analysis method executed by at least one computer,
Get multiple word data generated due to user actions,
Respectively converting the plurality of acquired word data into word feature vectors;
Calculating the similarity between each feature vector and each word feature vector associated with a plurality of information providing destinations in the user providing destination relation information,
Based on the calculated similarity, identify a combination of information providing destination and word data to be searched,
Requesting a search using word data in the combination for the information provided from the information providing destination in the specified combination as a search keyword;
Obtaining the user evaluation information for the requested search result information;
Based on the acquired evaluation information, the feature vector associated with the information providing destination that is the target of the search is updated in the providing destination relation information.
An information analysis method further comprising:
17. Part-of-speech decomposition of character string data acquired due to the user's action;
Further includes: To 16. The information analysis method as described in any one of these.
18. The acquisition acquires the plurality of word data from a plurality of word data accumulated in association with the user.
10. To 15. The information analysis method as described in any one of these.
19. 10. To 18. A program that causes at least one computer to execute the information analysis method according to any one of the above.

1 CPU
2 メモリ
7 情報提供サイト(サイト)
8 クライアント装置(クライアント)
10,100 情報分析装置(分析装置)
11,21,101 取得部
12 ユーザ単語DB
13 キーワードDB
14,24,102 特定部
15,103 選択部
16,25,104 検索制御部
17,26 出力処理部
22 変換部
23 提供先DB
27 評価取得部
28 更新部
1 CPU
2 Memory 7 Information provision site (site)
8 Client device (client)
10,100 Information analyzer (analyzer)
11, 21, 101 Acquisition unit 12 User word DB
13 Keyword DB
14, 24, 102 Identification unit 15, 103 Selection unit 16, 25, 104 Search control unit 17, 26 Output processing unit 22 Conversion unit 23 Destination DB
27 Evaluation acquisition unit 28 Update unit

Claims (11)

ユーザの動作に起因して生成された複数の単語データを取得する取得手段と、
複数の提供先カテゴリの中から、前記取得された複数の単語データに対応する提供先カテゴリを特定する特定手段と、
前記複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定することにより、前記取得された複数の単語データの中から検索キーワードに用いる単語データを選択する選択手段と、
前記特定された提供先カテゴリに対応する情報提供先から提供される情報に対する前記選択された単語データを検索キーワードとして用いた検索を要求する検索制御手段と、
を備える情報分析装置。
Acquisition means for acquiring a plurality of word data generated due to user's action;
A specifying means for specifying a provider category corresponding to the acquired plurality of word data from a plurality of provider categories;
Each acquired word data is specified based on query relationship information indicating a relationship between the plurality of destination categories and a plurality of query categories and a relationship between the plurality of query categories and a plurality of keyword information data. Selecting means for selecting word data to be used as a search keyword from the plurality of obtained word data by determining whether or not each belongs to a query category associated with a provider category;
Search control means for requesting a search using the selected word data as a search keyword for information provided from an information provider corresponding to the specified provider category;
An information analysis apparatus comprising:
前記特定手段は、前記複数の提供先カテゴリと複数のキーワード情報データとの関係を示す提供先関係情報を参照することにより、前記提供先カテゴリを特定し、
前記提供先関係情報と前記クエリ関係情報とでは、少なくとも一つの同一提供先カテゴリに対応付けられるキーワード情報データ群が、相違する、
請求項1に記載の情報分析装置。
The specifying unit specifies the providing destination category by referring to providing destination relation information indicating a relationship between the plurality of providing destination categories and the plurality of keyword information data;
In the provider relationship information and the query relationship information, keyword information data groups associated with at least one same provider category are different.
The information analysis apparatus according to claim 1.
前記特定手段は、前記取得された複数の単語データに対応する複数の提供先カテゴリを特定し、
前記選択手段は、前記特定された複数の提供先カテゴリの各々について、前記取得された複数の単語データの中から検索キーワードに用いる単語データをそれぞれ選択する、
請求項1又は2に記載の情報分析装置。
The specifying means specifies a plurality of provision destination categories corresponding to the plurality of acquired word data,
The selection means selects word data to be used as a search keyword from the plurality of acquired word data for each of the specified plurality of provision destination categories.
The information analysis apparatus according to claim 1 or 2.
前記選択手段は、前記クエリ関係情報で示されるキーワード情報データと前記取得された各単語データの特徴量との類似度をそれぞれ算出し、算出された類似度を用いて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定する、
請求項1から3のいずれか1項に記載の情報分析装置。
The selection unit calculates a similarity between the keyword information data indicated by the query relation information and the feature amount of each acquired word data, and uses each of the acquired words using the calculated similarity. Respectively determining whether the data belongs to a query category associated with the specified provider category;
The information analysis apparatus according to any one of claims 1 to 3.
前記特定手段は、前記複数の提供先カテゴリと複数のキーワード情報データとの関係を示す提供先関係情報で示されるキーワード情報データと前記取得された各単語データの特徴量との類似度をそれぞれ算出し、算出された類似度の距離により、前記提供先カテゴリを特定する、
請求項1から4のいずれか1項に記載の情報分析装置。
The specifying unit calculates the similarity between the keyword information data indicated by the supply destination relation information indicating the relationship between the plurality of supply destination categories and the plurality of keyword information data and the feature amount of each acquired word data. And specifying the provider category based on the calculated distance of similarity.
The information analysis device according to any one of claims 1 to 4.
前記検索制御手段は、一つの単語データも選択されてなかった提供先カテゴリが存在する場合には、その提供先カテゴリに対応するサイト7から提供される情報に対する、検索キーワードを指定しない検索を要求する、
請求項1から5のいずれか1項に記載の情報分析装置。
When there is a provision category for which no word data has been selected, the search control means requests a search without specifying a search keyword for information provided from the site 7 corresponding to the provision category. To
The information analysis device according to any one of claims 1 to 5.
ユーザの動作に起因して生成された複数の単語データを取得する取得手段と、
前記取得された複数の単語データを単語特徴ベクトルにそれぞれ変換する変換手段と、
前記ユーザの提供先関係情報において複数の情報提供先と関連付けられた各特徴ベクトルと各単語特徴ベクトルとの類似度をそれぞれ算出することにより、検索対象とする情報提供先と単語データとの組み合わせを特定する特定手段と、
前記特定された組み合わせにおける情報提供先から提供される情報に対するその組み合わせにおける単語データを検索キーワードとして用いた検索を要求する検索制御手段と、
前記検索制御手段により要求された前記検索の結果情報に対する前記ユーザの評価情報を取得する評価取得手段と、
前記取得された評価情報に基づいて、前記検索の対象とされた情報提供先に前記提供先関係情報において関連付けられている特徴ベクトルを更新する更新手段と、
を備える情報分析装置。
Acquisition means for acquiring a plurality of word data generated due to user's action;
Conversion means for converting each of the obtained plurality of word data into a word feature vector;
By calculating the similarity between each feature vector and each word feature vector associated with a plurality of information providing destinations in the user providing destination relation information, a combination of the information providing destination and word data to be searched is calculated. Identification means to identify;
Search control means for requesting a search using word data in the combination as a search keyword for the information provided from the information providing destination in the specified combination;
Evaluation acquisition means for acquiring the user evaluation information for the search result information requested by the search control means;
Updating means for updating a feature vector associated with the information providing destination to be searched based on the obtained evaluation information in the providing destination relation information;
An information analysis apparatus comprising:
前記取得手段は、前記ユーザの動作に起因して取得された文字列データを品詞分解することにより、前記複数の単語データを抽出する、
請求項1から7のいずれか1項に記載の情報分析装置。
The acquisition means extracts the plurality of word data by decomposing part-of-speech of character string data acquired due to the action of the user.
The information analysis apparatus according to any one of claims 1 to 7.
前記取得手段は、前記ユーザに関連付けられて蓄積される複数の単語データの中から前記複数の単語データを取得する、
請求項1から6のいずれか1項に記載の情報分析装置。
The acquisition means acquires the plurality of word data from a plurality of word data accumulated in association with the user.
The information analysis apparatus according to any one of claims 1 to 6.
少なくとも一つのコンピュータにより実行される情報分析方法において、
ユーザの動作に起因して生成された複数の単語データを取得し、
複数の提供先カテゴリの中から、前記取得された少なくとも一つの単語データに対応する提供先カテゴリを特定し、
前記複数の提供先カテゴリと複数のクエリカテゴリとの関係及び当該複数のクエリカテゴリと複数のキーワード情報データとの関係を示すクエリ関係情報に基づいて、前記取得された各単語データが前記特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定し、
前記判定の結果に基づいて、前記取得された複数の単語データの中から検索キーワードに用いる単語データを選択し、
前記特定された提供先カテゴリに対応する情報提供先から提供される情報に対する前記選択された単語データを検索キーワードとして用いた検索を要求する、
ことを含む情報分析方法。
In an information analysis method executed by at least one computer,
Get multiple word data generated due to user actions,
A provider category corresponding to the acquired at least one word data is identified from a plurality of provider categories;
Each acquired word data is specified based on query relationship information indicating a relationship between the plurality of destination categories and a plurality of query categories and a relationship between the plurality of query categories and a plurality of keyword information data. Determine whether each belongs to the query category associated with the provided category,
Based on the result of the determination, select word data to be used as a search keyword from the plurality of acquired word data,
Requesting a search using the selected word data as a search keyword for information provided from an information provider corresponding to the specified provider category;
Information analysis method.
請求項10に記載の情報分析方法を少なくとも一つのコンピュータに実行させるプログラム。   A program causing at least one computer to execute the information analysis method according to claim 10.
JP2015199094A 2015-10-07 2015-10-07 Information analysis device and information analysis method Active JP6640519B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015199094A JP6640519B2 (en) 2015-10-07 2015-10-07 Information analysis device and information analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015199094A JP6640519B2 (en) 2015-10-07 2015-10-07 Information analysis device and information analysis method

Publications (2)

Publication Number Publication Date
JP2017072964A true JP2017072964A (en) 2017-04-13
JP6640519B2 JP6640519B2 (en) 2020-02-05

Family

ID=58538712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015199094A Active JP6640519B2 (en) 2015-10-07 2015-10-07 Information analysis device and information analysis method

Country Status (1)

Country Link
JP (1) JP6640519B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019020958A (en) * 2017-07-14 2019-02-07 株式会社日立製作所 Information collection support device and information collection support method
JP2021149468A (en) * 2020-03-18 2021-09-27 ヤフー株式会社 Information processing apparatus, information processing method, and program
JP2022120100A (en) * 2021-09-16 2022-08-17 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Method and device for recognizing instruction, electronic apparatus, storage medium, computer program, and voice interactive screen

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269106A (en) * 2001-03-08 2002-09-20 Dainippon Printing Co Ltd Device for introducing book
JP2004246422A (en) * 2003-02-10 2004-09-02 Hitachi Software Eng Co Ltd Information retrieval support device
JP2011076565A (en) * 2009-10-02 2011-04-14 Fujitsu Toshiba Mobile Communications Ltd Information processing apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269106A (en) * 2001-03-08 2002-09-20 Dainippon Printing Co Ltd Device for introducing book
JP2004246422A (en) * 2003-02-10 2004-09-02 Hitachi Software Eng Co Ltd Information retrieval support device
JP2011076565A (en) * 2009-10-02 2011-04-14 Fujitsu Toshiba Mobile Communications Ltd Information processing apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019020958A (en) * 2017-07-14 2019-02-07 株式会社日立製作所 Information collection support device and information collection support method
JP2021149468A (en) * 2020-03-18 2021-09-27 ヤフー株式会社 Information processing apparatus, information processing method, and program
JP7330919B2 (en) 2020-03-18 2023-08-22 ヤフー株式会社 Information processing device, information processing method and program
JP2022120100A (en) * 2021-09-16 2022-08-17 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Method and device for recognizing instruction, electronic apparatus, storage medium, computer program, and voice interactive screen

Also Published As

Publication number Publication date
JP6640519B2 (en) 2020-02-05

Similar Documents

Publication Publication Date Title
JP6745384B2 (en) Method and apparatus for pushing information
US10146775B2 (en) Apparatus, system and method for string disambiguation and entity ranking
KR20180126577A (en) Explore related entities
JP6956119B2 (en) Systems and methods for providing contextual information
US20150331847A1 (en) Apparatus and method for classifying and analyzing documents including text
JP6593873B2 (en) Information analysis apparatus and information analysis method
KR20150086441A (en) Connecting people based on content and relational distance
JP6640519B2 (en) Information analysis device and information analysis method
JP5226241B2 (en) How to add tags
CN108280081B (en) Method and device for generating webpage
JP2017146926A (en) Information processing device, information processing method and information processing program
KR20110035001A (en) Apparatus and method of visualizing key-word
KR101955920B1 (en) Search method and apparatus using property language
KR20140091375A (en) System and method for searching semantic contents using user query expansion
JP6163143B2 (en) Information providing apparatus, information providing method, and information providing program
CN107622125B (en) Information crawling method and device and electronic equipment
JP2016045552A (en) Feature extraction program, feature extraction method, and feature extraction device
WO2021098876A1 (en) Question and answer method and apparatus based on knowledge graph
JP2019185620A (en) Message processor and program
JP2018072873A (en) Information processing apparatus, information processing method, and program
JP5777663B2 (en) Search support device and search support program
WO2020193391A1 (en) An apparatus and method for performing image-based dish recognition
JP7212655B2 (en) Information processing device, information processing method, and information processing program
JP6887002B2 (en) Information processing equipment, server equipment, user terminals, methods and programs
JP2013109514A (en) Related word display controller, related word display method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191226

R150 Certificate of patent or registration of utility model

Ref document number: 6640519

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150