JP6593873B2 - Information analysis apparatus and information analysis method - Google Patents

Information analysis apparatus and information analysis method Download PDF

Info

Publication number
JP6593873B2
JP6593873B2 JP2015199093A JP2015199093A JP6593873B2 JP 6593873 B2 JP6593873 B2 JP 6593873B2 JP 2015199093 A JP2015199093 A JP 2015199093A JP 2015199093 A JP2015199093 A JP 2015199093A JP 6593873 B2 JP6593873 B2 JP 6593873B2
Authority
JP
Japan
Prior art keywords
time
word data
word
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015199093A
Other languages
Japanese (ja)
Other versions
JP2017072963A (en
Inventor
裕一郎 田島
欽也 札野
友謙 佐々木
征一郎 松谷
健太 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solutions Innovators Ltd
Original Assignee
NEC Solutions Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solutions Innovators Ltd filed Critical NEC Solutions Innovators Ltd
Priority to JP2015199093A priority Critical patent/JP6593873B2/en
Publication of JP2017072963A publication Critical patent/JP2017072963A/en
Application granted granted Critical
Publication of JP6593873B2 publication Critical patent/JP6593873B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザの興味に関する情報を獲得する情報分析技術に関する。   The present invention relates to an information analysis technique for acquiring information related to a user's interest.

情報通信技術の急速な進歩に伴い、近年、デジタルデバイドの問題が指摘されている。この問題は、IT(Information Technology)機器に対する不慣れさのみならず、入手可能な情報量の膨大さにも起因する。IT機器を或る程度利用できる者であっても、膨大な情報の中から有益な情報を探すのは大変困難な状況となっている。   With the rapid progress of information and communication technology, the problem of digital divide has been pointed out in recent years. This problem is caused not only by unfamiliarity with IT (Information Technology) equipment but also by the huge amount of information that can be obtained. Even those who can use IT equipment to a certain extent find it very difficult to find useful information from a vast amount of information.

下記特許文献1には、ユーザの直近の興味に応じた番組を推薦する方法が記載されている。この方法では、ユーザが体験した事象を特定するキーワードを含むライフログ情報(訪問場所、視聴されたテレビ番組、ファイル閲覧、音楽再生等)が取得され、取得されたライフログ情報中のキーワードが蓄積され、蓄積される各キーワードについて、ユーザが関心を持つ度合いを表す記憶度がそれぞれ算出される。その記憶度は、事象が生じた最終日時と基準日時(現在の日時)の差が大きいほど大きく減衰し、取得頻度が小さいほど大きく減衰するように算出される。また、下記特許文献2には、ホームページの情報やメール情報からイベント日時情報を抽出し、イベントの情報及びその関連情報を、イベントの日時や期限以前の適切な時点で通知する方法が記載されている。   Patent Document 1 below describes a method for recommending a program according to the user's most recent interest. In this method, life log information including a keyword for identifying an event experienced by the user (visited place, watched TV program, file browsing, music playback, etc.) is acquired, and the keyword in the acquired life log information is accumulated. Then, for each of the accumulated keywords, a degree of memory representing the degree of interest of the user is calculated. The degree of storage is calculated so that the greater the difference between the last date and time when the event occurred and the reference date and time (current date and time), the greater the attenuation, and the smaller the acquisition frequency, the greater the degree of storage. Patent Document 2 below describes a method for extracting event date / time information from homepage information and email information, and notifying event information and related information at an appropriate time before the event date / time or due date. Yes.

特開2010−266959号公報JP 2010-266959 A 特開2000−067082号公報JP 2000-067082 A

上述の特許文献1及び2では、各単語に対するユーザの興味や関心の度合いを高精度に管理するといった視点については言及されていない。特許文献2には、或る情報の通知タイミングの適正化が記載されているに過ぎない。特許文献1には、ユーザが事象を体験した日時からの経過時間が長い程、その事象を特定するキーワードの記憶度の減衰が大きくなること、取得頻度が小さい程、キーワードの記憶度の減衰が大きくなることが記載されているに過ぎない。しかしながら、各単語に対するユーザの興味や関心の度合いは、このような原因のみで決定されるわけではなく、この手法には、改善の余地が残されている。   In the above-mentioned patent documents 1 and 2, the viewpoint of managing the user's interest and the degree of interest with respect to each word with high accuracy is not mentioned. Patent Document 2 merely describes the optimization of the notification timing of certain information. In Patent Document 1, the longer the elapsed time from the date and time when the user experienced an event, the greater the attenuation of the storage degree of the keyword specifying the event, and the lower the acquisition frequency, the lower the attenuation of the keyword storage degree. It is only described that it grows. However, the user's interest in each word and the degree of interest are not determined only by such causes, and there is room for improvement in this method.

本発明は、このような事情に鑑みてなされたものであり、各単語に対するユーザの興味や関心の度合いを高精度に管理する技術を提供する。本明細書において、「興味」と「関心」とは特に区別されない。   This invention is made | formed in view of such a situation, and provides the technique of managing a user's interest with respect to each word and the degree of interest with high precision. In the present specification, “interest” and “interest” are not particularly distinguished.

本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。   Each aspect of the present invention employs the following configurations in order to solve the above-described problems.

第一の側面は、情報分析装置に関する。第一の側面に係る情報分析装置は、ユーザの動作に起因して生成された単語データを取得する取得手段と、その単語データを、その単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納する格納処理手段と、その生成日時及びその予定日時と現在日時との関係に基づいて、当該単語データの重み値を更新する更新手段と、を有する。   The first aspect relates to an information analysis apparatus. An information analysis apparatus according to a first aspect includes an acquisition unit that acquires word data generated due to a user's action, and stores the user word by associating the word data with a generation date and a scheduled date and time related to the word data. Storage processing means stored in the section, and update means for updating the weight value of the word data based on the relationship between the generation date / time and the scheduled date / time and the current date / time.

第二の側面は、少なくとも一つのコンピュータにより実行される情報分析方法に関する。第二の側面に係る情報分析方法は、ユーザの動作に起因して生成された単語データを取得し、その単語データを、その単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納し、その生成日時及びその予定日時と現在日時との関係に基づいて、当該単語データの重み値を更新する、ことを含む。   The second aspect relates to an information analysis method executed by at least one computer. The information analysis method according to the second aspect acquires word data generated due to a user's action, and stores the word data in a user word storage unit in association with a generation date / time and a scheduled date / time related to the word data. And updating the weight value of the word data based on the generation date / time and the relationship between the scheduled date / time and the current date / time.

なお、本発明の他の側面は、上記第二の側面の方法を少なくとも1つのコンピュータに実行させるプログラム又はこのようなプログラムを記録したコンピュータが読み取り可能な記録媒体である。この記録媒体は、非一時的な有形の媒体を含む。   Another aspect of the present invention is a program that causes at least one computer to execute the method according to the second aspect, or a computer-readable recording medium that records such a program. This recording medium includes a non-transitory tangible medium.

上記各側面によれば、各単語に対するユーザの興味や関心の度合いを高精度に管理する技術を提供することができる。   According to each said aspect, the technique which manages a user's interest with respect to each word and the degree of interest with high precision can be provided.

第一実施形態における情報分析装置(分析装置)のハードウェア構成例を概念的に示す図である。It is a figure which shows notionally the hardware structural example of the information analysis apparatus (analysis apparatus) in 1st embodiment. 第一実施形態における情報分析装置(分析装置)の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the information analyzer (analyzer) in 1st embodiment. 第一実施形態における重み値の時間変化モデルの第一例を示す図である。It is a figure which shows the 1st example of the time change model of the weight value in 1st embodiment. 第一実施形態における重み値の時間変化モデルの第二例を示す図である。It is a figure which shows the 2nd example of the time change model of the weight value in 1st embodiment. 第一実施形態における重み値の時間変化モデルの第三例を示す図である。It is a figure which shows the 3rd example of the time change model of the weight value in 1st embodiment. キーワードDBの提供先関係テーブルの例を示す図である。It is a figure which shows the example of the provision destination relation table of keyword DB. キーワードDBのクエリカテゴリテーブルの例を示す図である。It is a figure which shows the example of the query category table of keyword DB. キーワードDBのクエリワードテーブルの例を示す図である。It is a figure which shows the example of the query word table of keyword DB. 第一実施形態における情報分析装置(分析装置)の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the information analysis apparatus (analysis apparatus) in 1st embodiment. 第一実施形態における情報分析装置(分析装置)の一動作例のフロー及びデータの処理例を示す図である。It is a figure which shows the example of the flow of one operation example of the information analysis apparatus (analysis apparatus) in 1st embodiment, and the processing example of data. 第二実施形態における情報分析装置(分析装置)の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the information analyzer (analyzer) in 2nd embodiment. 第二実施形態における重み値の時間変化モデルの例を示す図である。It is a figure which shows the example of the time change model of the weight value in 2nd embodiment. 第二実施形態における情報分析装置(分析装置)の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the information analysis apparatus (analysis apparatus) in 2nd embodiment. 第二実施形態における情報分析装置(分析装置)の一動作例のフロー及びデータの処理例を示す図である。It is a figure which shows the flow of one operation example of the information analysis apparatus (analysis apparatus) in 2nd embodiment, and the example of a data processing. 第三実施形態における情報分析装置の処理構成例を概念的に示す図である。It is a figure which shows notionally the process structural example of the information analyzer in 3rd embodiment.

以下、本発明の実施の形態について説明する。なお、以下に挙げる各実施形態はそれぞれ例示であり、本発明は以下の実施形態の構成に限定されない。   Embodiments of the present invention will be described below. In addition, each embodiment given below is an illustration, respectively, and this invention is not limited to the structure of the following embodiment.

[第一実施形態]
以下、第一実施形態における情報分析装置及び情報分析方法について説明する。
〔装置構成〕
図1は、第一実施形態における情報分析装置(以降、分析装置と略称する場合もある)10のハードウェア構成例を概念的に示す図である。分析装置10は、通信網5を介して、ユーザが利用するクライアント装置8及び情報提供サイト7に通信可能に接続される。通信網5は、インターネット等のような公衆網、WAN(Wide Area Network)、LAN(Local Area Network)、無線通信ネットワーク等である。なお、本実施形態において、分析装置10、情報提供サイト7及びクライアント装置8の間の通信形態は限定されない。
[First embodiment]
Hereinafter, an information analysis apparatus and an information analysis method in the first embodiment will be described.
〔Device configuration〕
FIG. 1 is a diagram conceptually illustrating a hardware configuration example of an information analysis apparatus (hereinafter sometimes abbreviated as an analysis apparatus) 10 in the first embodiment. The analysis device 10 is communicably connected to the client device 8 and the information providing site 7 used by the user via the communication network 5. The communication network 5 is a public network such as the Internet, a WAN (Wide Area Network), a LAN (Local Area Network), a wireless communication network, or the like. In the present embodiment, the communication mode among the analysis device 10, the information providing site 7, and the client device 8 is not limited.

分析装置10は、一般的なコンピュータであり、図1に示されるようなハードウェア要素を有する。具体的には、分析装置10は、ハードウェア構成として、CPU(Central Processing Unit)1、メモリ2、入出力インタフェース(I/F)3、通信ユニット4等を有する。これら各ハードウェア要素はバスにより接続される。   The analysis apparatus 10 is a general computer and has hardware elements as shown in FIG. Specifically, the analysis apparatus 10 includes a CPU (Central Processing Unit) 1, a memory 2, an input / output interface (I / F) 3, a communication unit 4, and the like as a hardware configuration. Each of these hardware elements is connected by a bus.

CPU1には、一般的なCPUに加えて、特定用途向け集積回路(ASIC)、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)等も含まれる。
メモリ2は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)である。
In addition to a general CPU, the CPU 1 includes an application specific integrated circuit (ASIC), a DSP (Digital Signal Processor), a GPU (Graphics Processing Unit), and the like.
The memory 2 is a RAM (Random Access Memory), a ROM (Read Only Memory), or an auxiliary storage device (such as a hard disk).

入出力I/F3は、表示装置(図示せず)、入力装置(図示せず)等のユーザインタフェース装置と接続可能である。表示装置は、LCD(Liquid Crystal Display)やCRT(Cathode Ray Tube)ディスプレイのような、CPU1により処理された描画データに対応する画面を表示する装置である。入力装置は、キーボード、マウス等のようなユーザ操作の入力を受け付ける装置である。表示装置及び入力装置は一体化され、タッチパネルとして実現されてもよい。   The input / output I / F 3 can be connected to a user interface device such as a display device (not shown) or an input device (not shown). The display device is a device that displays a screen corresponding to the drawing data processed by the CPU 1, such as an LCD (Liquid Crystal Display) or a CRT (Cathode Ray Tube) display. The input device is a device that receives an input of a user operation such as a keyboard and a mouse. The display device and the input device may be integrated and realized as a touch panel.

通信ユニット4は、他のコンピュータとの通信網5を介した通信や、他の機器との信号のやりとり等を行う。通信ユニット4には、可搬型記録媒体等も接続され得る。分析装置10は、図1に図示しないハードウェア要素を含んでもよく、各ハードウェア要素の数も図1に示される数に制限されない。例えば、分析装置10は、複数のCPU1や複数のメモリ2を有する。分析装置10のハードウェア構成は制限されない。   The communication unit 4 communicates with other computers via the communication network 5 and exchanges signals with other devices. A portable recording medium or the like can be connected to the communication unit 4. The analysis apparatus 10 may include hardware elements not shown in FIG. 1, and the number of hardware elements is not limited to the number shown in FIG. For example, the analysis device 10 includes a plurality of CPUs 1 and a plurality of memories 2. The hardware configuration of the analyzer 10 is not limited.

情報提供サイト7は、一般的なコンピュータであり、WEBサーバ、データベースサーバ等のような各種情報を提供するサーバ装置である。本実施形態は、情報提供サイト7のハードウェア構成及びソフトウェア構成を制限しない。以降、情報提供サイト7は、サイト7と略称される場合もある。   The information providing site 7 is a general computer, and is a server device that provides various types of information such as a WEB server and a database server. The present embodiment does not limit the hardware configuration and software configuration of the information providing site 7. Hereinafter, the information providing site 7 may be abbreviated as the site 7.

分析装置10は、1以上のサイト7と通信可能に接続される。本実施形態において分析装置10がアクセスするサイト7の数は制限されない。分析装置10は、サイト7により提供される大量の情報の中から各ユーザが欲しいと推測される情報をピックアップして、所望の情報をユーザ(クライアント装置8)に提供する。   The analysis device 10 is connected to one or more sites 7 so as to be communicable. In the present embodiment, the number of sites 7 accessed by the analysis apparatus 10 is not limited. The analysis device 10 picks up information that each user is supposed to want from the large amount of information provided by the site 7 and provides the user (client device 8) with desired information.

クライアント装置8は、PC(Personal Computer)、タブレット端末、スマートフォン、携帯電話等のような一般的なユーザ端末である。また、クライアント装置8は、ユーザインタフェースを備えるコミュニケーションロボットであってもよい。クライアント装置8は、分析装置10により提供される情報をユーザに向けて出力することができ、かつユーザからの入力を受けることができる装置であれば、そのハードウェア構成及びソフトウェア構成は制限されない。情報は、表示装置、プリンタ装置、音声出力装置等により出力可能である。また、ユーザからの入力は、キーボード、マウス等のようなユーザ操作の入力を受け付ける入力装置(図示せず)、ユーザの発言音声を取得するマイク(図示せず)、ユーザのジェスチャを撮像するカメラ等により受けることができる。以降、クライアント装置8は、クライアント8と略称する場合もある。   The client device 8 is a general user terminal such as a PC (Personal Computer), a tablet terminal, a smartphone, a mobile phone, or the like. The client device 8 may be a communication robot having a user interface. The hardware configuration and the software configuration of the client device 8 are not limited as long as the client device 8 can output information provided by the analysis device 10 to the user and can receive input from the user. Information can be output by a display device, a printer device, an audio output device, or the like. In addition, an input from a user is an input device (not shown) that accepts an input of a user operation such as a keyboard and a mouse, a microphone (not shown) that acquires a user's speech, and a camera that captures a user's gesture. Etc. can be received. Hereinafter, the client device 8 may be abbreviated as a client 8.

クライアント8は、ユーザの動作に起因して取得された文字列データを分析装置10に送る。具体的には、クライアント8は、入力装置に対するユーザ操作により入力された文字列データを取得する。例えば、ブラウザに対して入力された検索文字列、カレンダアプリケーションに対して入力されたスケジュール文字列、メモ書き等、あらゆる文字列データが取得され得る。   The client 8 sends the character string data acquired due to the user's operation to the analysis device 10. Specifically, the client 8 acquires character string data input by a user operation on the input device. For example, any character string data such as a search character string input to the browser, a schedule character string input to the calendar application, and a memo can be acquired.

また、クライアント8は、マイクロフォンで集音されたユーザの音声を録音し、その録音された音声データを分析装置10に送ることもできる。クライアント8は、既知の音声認識技術を用いてその音声データから文字列データを取得し、この文字列データを分析装置10に送ってもよい。   The client 8 can also record the user's voice collected by the microphone and send the recorded voice data to the analyzer 10. The client 8 may acquire character string data from the voice data using a known voice recognition technique and send the character string data to the analysis device 10.

本実施形態では、当該文字列データ又は当該音声データがユーザの動作に起因するものであれば、クライアント8による当該文字列データ又は当該音声データの取得手法は制限されない。例えば、クライアント8にインストールされたアプリケーション(WEBブラウザを含む)が周知の技術を用いて当該文字列データ又は当該音声データを取得し、取得されたデータを分析装置10に送る。また、クライアント8は、取得された文字列データを品詞分解することにより単語データを抽出し、抽出された単語データを分析装置10に送信することもできる。   In the present embodiment, as long as the character string data or the voice data is caused by the user's action, the acquisition method of the character string data or the voice data by the client 8 is not limited. For example, an application (including a WEB browser) installed in the client 8 acquires the character string data or the voice data using a known technique, and sends the acquired data to the analysis apparatus 10. Further, the client 8 can extract word data by decomposing the acquired character string data into parts of speech, and can transmit the extracted word data to the analysis device 10.

〔処理構成〕
図2は、第一実施形態における分析装置10の処理構成例を概念的に示す図である。分析装置10は、図2に示されるようなソフトウェア要素を有する。具体的には、分析装置10は、取得部11、格納処理部12、ユーザ単語DB(DataBase)13、更新部14、抽出部15、キーワードDB(DataBase)16、決定部17、検索制御部18、出力処理部19等を有する。これら各ソフトウェア要素は、例えば、CPU1によりメモリ2に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD(Compact Disc)、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F3又は通信ユニット4を介してインストールされ、メモリ2に格納されてもよい。
[Processing configuration]
FIG. 2 is a diagram conceptually illustrating a processing configuration example of the analysis apparatus 10 in the first embodiment. The analyzer 10 has software elements as shown in FIG. Specifically, the analysis apparatus 10 includes an acquisition unit 11, a storage processing unit 12, a user word DB (DataBase) 13, an update unit 14, an extraction unit 15, a keyword DB (DataBase) 16, a determination unit 17, and a search control unit 18. And an output processing unit 19 and the like. Each of these software elements is realized, for example, by executing a program stored in the memory 2 by the CPU 1. In addition, the program is installed from a portable recording medium such as a CD (Compact Disc) or a memory card or another computer on the network via the input / output I / F 3 or the communication unit 4 and is stored in the memory 2. It may be stored.

取得部11は、クライアント8又は他の装置から文字列データ又は音声データを受信する場合には、受信された文字列データ又は音声データから1以上の単語データを抽出する。具体的には、取得部11は、受信された文字列データを品詞分解(形態素解析)することにより1以上の単語データを抽出する。形態素解析には、MeCab等のような様々な既知の手法が利用可能である。例えば、取得部11は、各種品詞の単語の中から、名詞、動詞などの特定の品詞の単語データのみを取得してもよい。更に、取得部11は、名詞の中でも、一般名詞、固有名詞、サ変接続名詞といった特定の名詞の単語データのみを取得することもできるし、取得された動詞を基本形に正規化することもできる。   When the acquisition unit 11 receives character string data or voice data from the client 8 or another device, the acquisition unit 11 extracts one or more word data from the received character string data or voice data. Specifically, the acquisition unit 11 extracts one or more word data by performing part-of-speech decomposition (morphological analysis) on the received character string data. Various known methods such as MeCab can be used for morphological analysis. For example, the acquisition unit 11 may acquire only word data of specific parts of speech such as nouns and verbs from words of various parts of speech. Furthermore, the acquisition unit 11 can also acquire only word data of specific nouns such as general nouns, proper nouns, and sagittal connection nouns among nouns, and can also normalize the acquired verbs to basic forms.

取得部11は、音声データに対して既知の音声認識技術を適用することにより、ユーザの声がテキスト化された文字列データを取得し、この文字列データを品詞分解することもできる。上述のような品詞分解又は音声認識がクライアント8上で実行される場合には、取得部11は、クライアント8により抽出された当該複数の単語データをクライアント8から受信してもよい。   The acquisition unit 11 can acquire character string data in which a user's voice is converted into text by applying a known voice recognition technique to the voice data, and can also decompose the part of speech of the character string data. When the part-of-speech decomposition or speech recognition as described above is executed on the client 8, the acquisition unit 11 may receive the plurality of word data extracted by the client 8 from the client 8.

取得部11は、取得された単語データに関し、生成日時又は生成日時と予定日時との両方を更に取得する。   The acquisition unit 11 further acquires the generation date / time or both the generation date / time and the scheduled date / time regarding the acquired word data.

「単語データに関する生成日時」とは、その単語データが生成された日時又はその単語データの元となる文字列データ又は音声データが生成された日時を意味する。「単語データが生成された日時」は、クライアント8又は分析装置10によりその単語データが取得された日時を含む。「単語データの元となる文字列データ又は音声データが生成された日時」は、クライアント8又は分析装置10によりその文字列データ又はその音声データが取得された日時を含む。例えば、ユーザがクライアント8上で或る情報を閲覧した場合、取得部11は、その閲覧日時を、その閲覧された情報から得られる単語データに関する生成日時として取得する。また、ユーザがクライアント8を操作して文字列を入力した場合、取得部11は、その入力日時を、その入力された文字列から得られる単語データに関する生成日時として取得する。「単語データに関する生成日時」は、取得部11により決定されてもよいし、取得部11によりクライアント8から取得されてもよい。   “Generation date and time related to word data” means the date and time when the word data was generated or the date and time when the character string data or the voice data that is the source of the word data was generated. The “date and time when word data was generated” includes the date and time when the word data was acquired by the client 8 or the analysis device 10. The “date and time when the character string data or voice data that is the source of the word data is generated” includes the date and time when the client 8 or the analysis device 10 acquires the character string data or the voice data. For example, when the user browses certain information on the client 8, the acquisition unit 11 acquires the viewing date and time as a generation date and time related to word data obtained from the browsed information. When the user operates the client 8 and inputs a character string, the acquisition unit 11 acquires the input date and time as a generation date and time related to word data obtained from the input character string. The “generation date and time related to word data” may be determined by the acquisition unit 11 or may be acquired from the client 8 by the acquisition unit 11.

「単語データに関する予定日時」とは、その単語データ又はその単語データの元となる文字列データ若しくは音声データが表す計画の予定日時を意味する。例えば、ユーザがカレンダ画面上の或る日付に或る予定(計画)を入力した場合、取得部11は、その日付を、予定として入力された文字列データから抽出される単語データに関する予定日時として取得する。また、ユーザがクライアント8上で或るイベントの情報を閲覧した場合、取得部11は、その情報で示されるイベントの予定日時を、その閲覧された情報から得られる単語データに関する予定日時として取得する。そのイベントの予定日時は、閲覧された情報に含まれる文字列データの中から、既存の文字認識技術を用いて、抽出されてもよい。取得部11は、文字列データ及びその文字列データの生成日時をクライアント8から取得した場合、その文字列データから抽出された単語データに関する生成日時をその文字列データの生成日時に設定し、その文字列データから抽出された日時情報をその単語データに関する予定日時に設定してもよい。「単語データに関する予定日時」は、取得部11により決定されてもよいし、取得部11によりクライアント8から取得されてもよい。また、「単語データに関する予定日時」は、取得されない場合もある。   The “scheduled date and time related to word data” means the scheduled date and time of the plan represented by the word data or character string data or voice data that is the source of the word data. For example, when the user inputs a certain schedule (plan) on a certain date on the calendar screen, the acquisition unit 11 sets the date as the scheduled date and time related to word data extracted from the character string data input as the schedule. get. Further, when the user browses information on an event on the client 8, the acquisition unit 11 acquires the scheduled date and time of the event indicated by the information as the scheduled date and time related to word data obtained from the browsed information. . The scheduled date and time of the event may be extracted from character string data included in the browsed information using an existing character recognition technique. When the acquisition unit 11 acquires the character string data and the generation date / time of the character string data from the client 8, the acquisition unit 11 sets the generation date / time related to the word data extracted from the character string data to the generation date / time of the character string data. The date / time information extracted from the character string data may be set as the scheduled date / time related to the word data. The “scheduled date and time related to word data” may be determined by the acquisition unit 11 or may be acquired from the client 8 by the acquisition unit 11. In addition, “scheduled date and time related to word data” may not be acquired.

本明細書において、文言「日時」が表す時間粒度は任意である。文言「日時」は、日付のみを表してもよいし、日付及び時刻を表してもよい。時刻は、秒単位、ミリ秒単位等、任意の時間粒度で表されればよい。   In this specification, the time granularity represented by the word “date and time” is arbitrary. The wording “date and time” may represent only the date, or may represent the date and time. The time may be represented by an arbitrary time granularity such as a second unit or a millisecond unit.

格納処理部12は、送信元のユーザ毎又は送信元のクライアント8毎に、取得部11により取得された単語データを、その単語データに関する生成日時及び予定日時と関連付けてユーザ単語DB13に格納する。予定日時が取得されなかった場合、格納処理部12は、予定日時とは関連付けず、生成日時と関連付けて、単語データをユーザ単語DB13に格納する。「予定日時と関連付けない」とは、ユーザ単語DB13に設けられている予定日時のフィールドを未設定状態とすることも含む。また、格納処理部12は、異なる生成日時と共に重複して同一単語データが取得部11により取得された場合、その単語データを、異なる複数の生成日時と関連付けてユーザ単語DB13に格納する。   The storage processing unit 12 stores the word data acquired by the acquisition unit 11 for each transmission source user or transmission source client 8 in the user word DB 13 in association with the generation date and the scheduled date and time related to the word data. When the scheduled date / time is not acquired, the storage processing unit 12 stores the word data in the user word DB 13 in association with the generation date / time without associating with the scheduled date / time. “Do not associate with the scheduled date and time” includes setting the scheduled date and time field provided in the user word DB 13 to an unset state. Moreover, when the same word data is acquired by the acquisition unit 11 in duplicate with different generation dates and times, the storage processing unit 12 stores the word data in the user word DB 13 in association with a plurality of different generation dates and times.

ユーザ単語DB13は、ユーザ毎又はクライアント8毎に、ユーザの動作に起因して生成された単語データを格納する。ユーザ単語DB13には、ユーザ毎又はクライアント8毎に、別々のテーブルが設けられていてもよい。また、単語データが、ユーザの識別情報又はクライアント8の識別情報と関連付けられて、ユーザ単語DB13に格納されてもよい。ユーザの識別情報が利用される場合、単語データ又はその単語データの元となるデータと共に、ユーザの識別情報が取得部11によりクライアント8から受信されてもよい。   The user word DB 13 stores word data generated for each user or for each client 8 due to user actions. In the user word DB 13, separate tables may be provided for each user or for each client 8. The word data may be stored in the user word DB 13 in association with the user identification information or the client 8 identification information. When the user identification information is used, the user identification information may be received from the client 8 by the acquisition unit 11 together with the word data or the data that is the basis of the word data.

ユーザ単語DB13は、各単語データを、その単語データに関して取得された生成日時及び予定日時又はその生成日時のみと関連付けてそれぞれ格納する。このように、ユーザ単語DB13に格納される単語データの中には、予定日時と関連付けられていない単語データが含まれていてもよい。単語データに予定日時が関連付けられていない状態は、単語データに予定日時が設定されていないとも表記される。   The user word DB 13 stores each word data in association with only the generation date / time and the scheduled date / time acquired with respect to the word data or only the generation date / time. Thus, the word data stored in the user word DB 13 may include word data that is not associated with the scheduled date and time. The state where the scheduled date and time is not associated with the word data is also expressed as no scheduled date and time is set for the word data.

また、本実施形態では、ユーザ単語DB13は、生成日時が異なる同一単語データを、一ユーザに関して重複して格納する。例えば、取得部11が、同一ユーザに関する同一単語データ「花火」を異なる生成日時と共に重複して取得した場合、格納処理部12は、同一ユーザに関する同一単語データ「花火」を次のようにユーザ単語DB13に格納する。例えば、ユーザ単語DB13は、そのユーザに関して、単語データ「花火」、生成日時「8月10日(月)10時25分」及び予定日時「なし」を格納し、更に、単語データ「花火」、生成日時「8月10日(月)10時30分」及び予定日時「8月28日(金)19時」を格納する。   In the present embodiment, the user word DB 13 stores the same word data having different generation dates and times with respect to one user. For example, when the acquisition unit 11 repeatedly acquires the same word data “fireworks” related to the same user together with different generation dates and times, the storage processing unit 12 acquires the same word data “fireworks” related to the same user as user words as follows: Store in DB13. For example, the user word DB 13 stores word data “fireworks”, generation date and time “August 10 (Monday) 10:25” and scheduled date and time “none” for the user, and further includes word data “fireworks”, The generation date and time “August 10 (Monday) 10:30” and the scheduled date and time “August 28 (Friday) 19:00” are stored.

更新部14は、任意のタイミングで、ユーザ単語DB13に格納される各単語データについて、重み値をそれぞれ算出する。具体的には、更新部14は、ユーザ単語DB13に格納される生成日時及び予定日時とそのときの日時(現在日時)との関係に基づいて、各単語データの重み値をそれぞれ更新する。更新部14は、重み値が単語に対するユーザの興味又は関心の度合いを示すように、各単語データの重み値をそれぞれ計算する。   The updating unit 14 calculates a weight value for each word data stored in the user word DB 13 at an arbitrary timing. Specifically, the update unit 14 updates the weight value of each word data based on the relationship between the generation date / time and the scheduled date / time stored in the user word DB 13 and the date / time (current date / time) at that time. The updating unit 14 calculates the weight value of each word data so that the weight value indicates the user's interest or degree of interest in the word.

心理学の分野での研究にエビングハウスの忘却曲線と呼ばれるものがある。それは、人間の記憶量の時間的変化を模式化したものである。この忘却曲線で示されるように、人間の記憶は、経過時間に反比例して薄れていくことが分かっている。興味や関心の度合いも、記憶と同様に変化すると考えられ、時間経過と共に小さくなると考えられる。
加えて、今後の予定に関する興味や関心の度合いは、その予定が作成された時点からの経過時間に反比例して低下していく一方で、その予定の日時に近付くにつれて再び高まると考えられる。
A study in the field of psychology is called the Ebbinghaus forgetting curve. It is a schematic representation of temporal changes in human memory. As shown by this forgetting curve, it is known that human memory fades in inverse proportion to elapsed time. The degree of interest and the degree of interest are also considered to change in the same manner as the memory, and are considered to decrease with time.
In addition, it is considered that the interest and the degree of interest regarding the future schedule will decrease in inverse proportion to the elapsed time from the time when the schedule was created, but will increase again as the date and time of the schedule approaches.

更新部14は、人間のこのような心理学的特性を反映した方法で重み値を更新することで、その重み値の変化を人の興味や関心の度合いの変化に近似させることができる。
具体的には、更新部14は、生成日時及び予定日時からの各経過時間に応じて低下し、かつ、予定日時までの残り時間の減少に応じて上昇する時間変化モデルを用いて、単語データの重み値を算出する。更新部14は、予定日時が設定されない単語データの重み値については、生成日時からの経過時間に応じて低下させる。
The update unit 14 can approximate the change in the weight value to the change in the interest and the degree of interest by updating the weight value by a method that reflects such psychological characteristics of the human.
Specifically, the update unit 14 uses a time change model that decreases according to each elapsed time from the generation date / time and the scheduled date / time and increases according to a decrease in the remaining time until the scheduled date / time. The weight value of is calculated. The update unit 14 reduces the weight value of the word data for which the scheduled date and time is not set according to the elapsed time from the generation date and time.

図3は、第一実施形態における重み値の時間変化モデルの第一例を示す図である。この第一例では、予定日時が設定されている単語データに関する重み値の時間変化モデルが示される。即ち、生成日時(0日経過)の時点の重み値は、生成日時からの経過時間に従って徐々に低下する。その重み値は、予定日時(2日経過)に近付くにつれて上昇し、予定日時の時点で生成日時と略同じ値に戻る。その後、その重み値は、生成日時及び予定日時からの経過時間に従って、また、徐々に低下する。この時間変化モデルは、今後の予定に関して人が抱く興味や関心の度合いの変化傾向に近似するものとなっている。   FIG. 3 is a diagram illustrating a first example of a time value model of weight values in the first embodiment. In this first example, a time change model of weight values related to word data for which a scheduled date and time is set is shown. That is, the weight value at the time of generation date and time (0-day elapsed) gradually decreases according to the elapsed time from the generation date and time. The weight value rises as it approaches the scheduled date and time (2 days have passed), and returns to the same value as the generated date and time at the scheduled date and time. Thereafter, the weight value gradually decreases in accordance with the elapsed time from the generation date and time and the scheduled date and time. This time change model approximates a person's interest and a changing tendency of the degree of interest regarding a future schedule.

第一実施形態では、上述したとおり、同一の単語データが重複してユーザ単語DB13に登録される。即ち、単語データ毎の生成回数が管理される。単語データ毎の生成回数は、各単語を生じさせるユーザの行動回数に相当する。人間は、興味や関心の高い情報に対しては多くの行動を取ると考えられる。例えば、人は、関心の高い情報を検索し、入力し、発声し、その情報に関連する予定を立てようとする。即ち、ユーザに触れられる機会の多い単語は、そのユーザにとって関心や興味の高い単語と考えられる。   In the first embodiment, as described above, the same word data is duplicated and registered in the user word DB 13. That is, the number of generations for each word data is managed. The number of generations for each word data corresponds to the number of user actions that generate each word. Humans are expected to take a lot of actions on information that is of interest and interest. For example, a person searches for, inputs, speaks, and schedules information that is of high interest. That is, a word that is frequently touched by a user is considered a word that is highly interested and interesting for the user.

更新部14は、人間のこのような心理学的特性を更に反映した方法で重み値を更新することで、その重み値の変化を人の興味や関心の度合いの変化に更に近似させることができる。
具体的には、更新部14は、単語データの生成回数の増加に応じて上昇するように、単語データの重み値を算出する。
The update unit 14 can update the weight value by a method that further reflects such psychological characteristics of the human, thereby further approximating the change in the weight value to the change in the interest and the degree of interest of the person. .
Specifically, the update unit 14 calculates the weight value of the word data so as to increase as the number of generation times of word data increases.

図4は、第一実施形態における重み値の時間変化モデルの第二例を示す図である。この第二例では、異なる生成日時でユーザ単語DB13に2回格納された単語データが例示されている。その単語データの重み値は、1回目の生成日時からの経過時間に従って徐々に低下し、2回目の生成日時に、1回目の生成日時での重み値よりも大きい値に設定される。その後、その重み値は、1回目及び2回目の生成日時からの経過時間に従って徐々に低下する。この時間変化モデルは、同じ単語について複数回行動を取ったユーザが抱く、その単語に対する興味や関心の度合いの変化傾向に近似するものとなっている。   FIG. 4 is a diagram illustrating a second example of a time value model of weight values in the first embodiment. In this second example, word data stored twice in the user word DB 13 at different generation dates is illustrated. The weight value of the word data gradually decreases according to the elapsed time from the first generation date and time, and is set to a value larger than the weight value at the first generation date and time at the second generation date and time. Thereafter, the weight value gradually decreases according to the elapsed time from the first and second generation dates. This time change model approximates the change tendency of interest and the degree of interest of a user who has taken action for the same word a plurality of times.

このように、更新部14は、ユーザ単語DB13に重複して格納される同一の単語データについては、一つの重み値を算出する。例えば、更新部14は、生成日時又は生成日時及び予定日時のペアを時間変化モデルにそれぞれ適用することにより、生成日時毎に重み値をそれぞれ算出する。更新部14は、その算出された各重み値を足し合わせることで、重複して格納されている当該単語データについて一つの重み値を算出する。   Thus, the update unit 14 calculates one weight value for the same word data stored redundantly in the user word DB 13. For example, the update unit 14 calculates a weight value for each generation date and time by applying the generation date and time or the pair of the generation date and the scheduled date and time to the time change model. The updating unit 14 calculates one weight value for the word data stored redundantly by adding the calculated weight values.

このような更新部14による算出手法は、例えば、次のような計算式で実装することができる。但し、本実施形態における更新部14で用いられる重み値の算出手法は、以下の(式1)、(式2)及び(式3)に限定されない。この例では、単語データ毎に計算される重み値は、その単語データと関連付けられて重みテーブルに格納される。以下の各式において、sは、ユーザ単語DB13に格納されるi番目(i行目=iレコード目)の単語データを示し、s'は、重みテーブルに格納されるj番目(j行目=jレコード目)の単語データを示す。wは、単語データsの重み値を示し、w'は、単語データs'について算出される重み値を示す。更に、計算時点の日時(現在日時)がdで示され、ユーザ単語DB13に単語データsと関連付けられて格納される生成日時がdで示され、その予定日時がd'で示される。

Figure 0006593873
Such a calculation method by the update unit 14 can be implemented by the following calculation formula, for example. However, the weight value calculation method used by the updating unit 14 in the present embodiment is not limited to the following (Expression 1), (Expression 2), and (Expression 3). In this example, the weight value calculated for each word data is stored in the weight table in association with the word data. In each of the following expressions, s i indicates the i-th (i-th row = i-th record) word data stored in the user word DB 13, and s ′ j is the j-th (j-th row) stored in the weight table. Word = jth record). w i represents a weight value of the word data s i , and w ′ j represents a weight value calculated for the word data s ′ j . Additionally, date and time of the calculation time (current date) is indicated by d 0, generation date and time are stored in association with the word data s i to a user word DB13 is indicated by d i, the date and time is represented by d 'i It is.
Figure 0006593873

即ち、(式1)では、単語データs'の重み値w'は、s=s'を満たす重み値wの総和により算出される。予定日時が設定されていない単語データsの重み値wは、(式2)により算出され、予定日時及び生成日時と関連付けられている単語データsの重み値wは、(式3)により算出される。(式2)は、1日経過すると重み値が2分の1、2日経過すると重み値が3分の1と減っていく数理モデルである。(式3)は、現在日時が生成日時又は予定日時に一致する場合に最大となり、生成日時及び予定日時から離れる程低下する数理モデルである。 That is, in (Formula 1), the weight value w ′ j of the word data s ′ j is calculated by the sum of the weight values w i satisfying s i = s ′ j . The weight value w i of the word data s i for which the scheduled date / time is not set is calculated by (Equation 2), and the weight value w i of the word data s i associated with the scheduled date / time and the generation date / time is (Equation 3) ). (Equation 2) is a mathematical model in which the weight value decreases to 1/3 when one or two days have elapsed and the weight value has decreased to one third when one day has elapsed. (Formula 3) is a mathematical model that becomes maximum when the current date and time coincides with the generation date and time or the scheduled date and time, and decreases as the date and time depart from the generation date and time.

図5は、第一実施形態における重み値の時間変化モデルの第三例を示す図である。この第三例では、対象の単語データがユーザ単語DB13に2回格納される。1回目では、その単語データは、生成日時及び予定日時と関連付けられて格納され、2回目では、予定日時は設定されず、その単語データは、1回目と異なる生成日時と関連付けられて格納される。ここで、この例を上記式に当てはめる。1回目に登録された単語データがs(i=3)で示され、2回目に登録された単語データがs(i=7)で示され、重みテーブルにおいて、その単語データは、1番目に登録されていると仮定する。この場合、8日経過時点で算出される重み値は、次の式で表すことができる。
w'=(1/9+1/7)+1/3≒0.587
FIG. 5 is a diagram illustrating a third example of a time change model of weight values in the first embodiment. In this third example, the target word data is stored twice in the user word DB 13. In the first time, the word data is stored in association with the generation date / time and the scheduled date / time. In the second time, the scheduled date / time is not set, and the word data is stored in association with the generation date / time different from the first time. . Here, this example is applied to the above equation. The word data registered for the first time is indicated by s 3 (i = 3), the word data registered for the second time is indicated by s 7 (i = 7). In the weight table, the word data is 1 Suppose that it is registered in the second. In this case, the weight value calculated when 8 days have elapsed can be expressed by the following equation.
w ′ 1 = (1/9 + 1/7) + 1 / 3≈0.587

更新部14は、ユーザ単語DB13に重複して格納される同一の単語データの重み値の算出において、生成日時毎に算出される重み値の足し合わせを行わなくてもよい。例えば、更新部14は、最新の生成日時のみ又は最新の生成日時及び予定日時のペアのみを時間変化モデルに適用し、得られる重み値に、その単語データの生成回数(格納数)に対応する係数を加算又は掛け算することにより、その単語データの重み値を算出することもできる。   The update unit 14 does not have to add the weight values calculated for each generation date and time when calculating the weight values of the same word data stored redundantly in the user word DB 13. For example, the update unit 14 applies only the latest generation date / time or only the latest generation date / time / scheduled date / time pair to the time change model, and corresponds to the obtained weight value to the number of generations (stored number) of the word data. The weight value of the word data can also be calculated by adding or multiplying the coefficients.

抽出部15は、更新部14により算出される各単語データの重み値に基づいて、ユーザ単語DB13に格納される複数の単語データの中から1以上の単語データをユーザ毎に抽出する。上記例のように、重みテーブルが設けられている場合には、抽出部15は、その重みテーブルから単語データを抽出してもよい。抽出部15は、ユーザの興味や関心が高い単語の単語データを抽出する。抽出部15は、所定閾値以上の重み値を有する単語データを抽出してもよいし、ユーザ毎に、重み値の大きい順に所定数の単語データを抽出してもよい。抽出部15による抽出のタイミングは、任意のタイミングでよく、ランダムなタイミング、所定の周期を含む。また、抽出部15は、更新部14により重み値が更新された直後のタイミングで、単語データを抽出してもよい。抽出部15は、ユーザ単語DB13に単語データが格納されている全ユーザを対象にして単語データの抽出を行ってもよいし、ログイン状況に基づいて、ログイン中のユーザのみに関して、ユーザ単語DB13から単語データを抽出してもよい。   Based on the weight value of each word data calculated by the update unit 14, the extraction unit 15 extracts one or more word data from the plurality of word data stored in the user word DB 13 for each user. When a weight table is provided as in the above example, the extraction unit 15 may extract word data from the weight table. The extraction unit 15 extracts word data of words that are highly interested in the user. The extraction unit 15 may extract word data having a weight value equal to or greater than a predetermined threshold, or may extract a predetermined number of word data in descending order of the weight value for each user. The extraction timing by the extraction unit 15 may be an arbitrary timing, and includes a random timing and a predetermined cycle. The extraction unit 15 may extract word data at a timing immediately after the updating unit 14 updates the weight value. The extraction unit 15 may extract word data for all users whose word data is stored in the user word DB 13, or from the user word DB 13 for only the logged-in user based on the login status. Word data may be extracted.

決定部17は、抽出部15により抽出された1以上の単語データに基づいて、情報提供先及び検索キーワードを決定する。本実施形態では、重み値に基づいて抽出された単語データが用いられれば、情報提供先及び検索キーワードの決定手法は制限されない。例えば、決定部17は、予め決められた情報提供先を特定し、抽出部15により抽出された全ての単語データを検索キーワードに決定してもよい。また、決定部17は、抽出部15により抽出された単語データの中の、固有名詞等のような特定の品詞の単語データを検索キーワードとして決定してもよい。   The determination unit 17 determines an information providing destination and a search keyword based on one or more word data extracted by the extraction unit 15. In the present embodiment, as long as word data extracted based on the weight value is used, the method for determining the information providing destination and the search keyword is not limited. For example, the determination unit 17 may specify a predetermined information providing destination and determine all the word data extracted by the extraction unit 15 as search keywords. The determination unit 17 may determine word data of a specific part of speech such as a proper noun in the word data extracted by the extraction unit 15 as a search keyword.

以下、情報提供先及び検索キーワードの決定手法の一具体例を例示する。但し、本実施形態における決定部17は、以下の手法以外の手法で、情報提供先及び検索キーワードを決定してもよい。
決定部17は、後述のキーワードDB16を参照することにより、抽出された単語データに対応するサイト7を情報提供先として特定する。決定部17は、後述のキーワードDB16を参照することにより、抽出された単語データの中から検索キーワードに用いる単語データを選択する。
Hereinafter, a specific example of an information providing destination and a search keyword determination method will be illustrated. However, the determination unit 17 in the present embodiment may determine the information providing destination and the search keyword by a method other than the following method.
The determination unit 17 specifies the site 7 corresponding to the extracted word data as an information providing destination by referring to a keyword DB 16 described later. The determination unit 17 selects word data to be used as a search keyword from the extracted word data by referring to a keyword DB 16 described later.

キーワードDB16は、提供先関係テーブル、クエリカテゴリテーブル及びクエリワードテーブルを含む。   The keyword DB 16 includes a provider relationship table, a query category table, and a query word table.

提供先関係テーブルは、提供先カテゴリと提供先キーワードとの関係を示す提供先関係情報を格納する。具体的には、提供先関係テーブルは、提供先カテゴリの識別情報と提供先キーワードのキーワードデータとを相互に関連付けて格納する。各提供先カテゴリは、各サイト7が提供している情報のカテゴリを示し、対応するカテゴリの情報を提供するサイト7に対応付けられる。提供先カテゴリの識別情報とサイト7のアドレス情報とが別途対応付けられている。サイト7のアドレス情報は、URL(Uniform Resource Locator)のような、サイト7により提供されている情報を取得するための情報である。提供先キーワードは、提供先カテゴリに何らかの関係を有する単語である。例えば、提供先カテゴリに属する意味を持つ単語が提供先キーワードとして格納される。また、提供先カテゴリに間接的に関係する単語が提供先キーワードとして格納されてもよい。   The providing destination relationship table stores providing destination relationship information indicating the relationship between the providing destination category and the providing destination keyword. Specifically, the provision destination relation table stores identification information of the provision destination category and keyword data of the provision destination keyword in association with each other. Each provision destination category indicates a category of information provided by each site 7 and is associated with the site 7 that provides information of the corresponding category. The identification information of the provider category is associated with the address information of the site 7 separately. The address information of the site 7 is information for acquiring information provided by the site 7 such as a URL (Uniform Resource Locator). The provision destination keyword is a word having some relationship with the provision destination category. For example, a word having a meaning belonging to the provision destination category is stored as the provision destination keyword. In addition, a word indirectly related to the provision destination category may be stored as the provision destination keyword.

図6は、キーワードDB16の提供先関係テーブルの例を示す図である。図6では、分かり易くするために、提供先カテゴリの識別情報がそのカテゴリを示す単語(名詞)で図示されている。但し、提供先関係テーブルに格納される提供先カテゴリの識別情報は、図6に図示される単語ではなく、数値であってもよい。図6の例では、提供先カテゴリ「グルメ」に提供先キーワードとして「行く」が関連付けられている。単語「行く」は、外出を意味することから、「外出時の食事」を連想させる。このように、単語「行く」は、直接的には「グルメ」というカテゴリには属さないものの、間接的な関係(例えば、「外出時の食事」の連想)から「グルメ」に関連付けられる。   FIG. 6 is a diagram illustrating an example of the provision destination relation table of the keyword DB 16. In FIG. 6, for the sake of easy understanding, the identification information of the provision category is illustrated by a word (noun) indicating the category. However, the identification information of the provider category stored in the provider relationship table may be a numerical value instead of the word illustrated in FIG. In the example of FIG. 6, “go” is associated with the provision destination category “gourmet” as the provision destination keyword. Since the word “go” means going out, it is reminiscent of “meal when going out”. Thus, although the word “go” does not directly belong to the category “gourmet”, it is related to “gourmet” from an indirect relationship (for example, association of “meal when going out”).

上述したとおり、提供先カテゴリはサイト7に対応付けられるため、提供先関係テーブルは、単語と、その単語に直接的及び間接的に関連する情報を提供するサイト7との関連を示すということもできる。従って、提供先関係テーブルは、提供先カテゴリの識別情報として、サイト7の識別情報(アドレス情報であってもよい)を格納してもよい。   As described above, since the provision destination category is associated with the site 7, the provision destination relationship table indicates the relationship between the word and the site 7 that provides information directly and indirectly related to the word. it can. Therefore, the providing destination relationship table may store the identification information (may be address information) of the site 7 as the providing category identification information.

クエリカテゴリテーブルは、提供先カテゴリとクエリカテゴリとの関係を示す情報を格納する。具体的には、クエリカテゴリテーブルは、提供先カテゴリの識別情報とクエリカテゴリの識別情報とを相互に関連付けて格納する。クエリカテゴリテーブルに格納される提供先カテゴリは、上述の提供先関係テーブルに格納される提供先カテゴリと同じである。クエリカテゴリは、提供先カテゴリに対応するサイト7から提供される情報に含まれる情報カテゴリを示す。言い換えれば、クエリカテゴリテーブルにおいて或る提供先カテゴリに関連付けられていないクエリカテゴリは、その提供先カテゴリに対応するサイト7から提供される情報に対する検索のキーワードとして利用されないカテゴリを示す。   The query category table stores information indicating the relationship between the provider category and the query category. Specifically, the query category table stores the identification information of the provider category and the identification information of the query category in association with each other. The provider category stored in the query category table is the same as the provider category stored in the provider relationship table described above. The query category indicates an information category included in information provided from the site 7 corresponding to the provision destination category. In other words, a query category that is not associated with a certain provider category in the query category table indicates a category that is not used as a search keyword for information provided from the site 7 corresponding to the provider category.

図7は、キーワードDB16のクエリカテゴリテーブルの例を示す図である。図7では、分かり易くするために、提供先カテゴリ及びクエリカテゴリの各識別情報がそのカテゴリを示す単語(名詞)でそれぞれ図示されている。但し、クエリカテゴリテーブルに格納される提供先カテゴリ及びクエリカテゴリの各識別情報は、図7に図示される単語ではなく、数値であってもよい。図7の例では、提供先カテゴリ「グルメ」には「料理名」及び「地名」がクエリカテゴリとして格納されている。よって、「グルメ」に対応するサイト7から提供される情報に対する検索のキーワードとして「料理名」及び「地名」のカテゴリの単語が利用されることを示している。一方で、提供先カテゴリ「グルメ」には「食材名」が関連付けられていない。よって、「グルメ」に対応付けられたサイト7から提供される情報に対する検索のキーワードとして「食材名」のカテゴリの単語が利用されないことを示している。   FIG. 7 is a diagram illustrating an example of a query category table in the keyword DB 16. In FIG. 7, for the sake of easy understanding, each identification information of the provider category and the query category is illustrated by a word (noun) indicating the category. However, each identification information of the provision destination category and the query category stored in the query category table may be a numerical value instead of the word illustrated in FIG. In the example of FIG. 7, “dishes name” and “place name” are stored as query categories in the provision destination category “gourmet”. Therefore, it is shown that the words of the categories “dishes names” and “place names” are used as search keywords for the information provided from the site 7 corresponding to “gourmet”. On the other hand, the “food name” is not associated with the provision category “gourmet”. Therefore, it is shown that the word of the category of “food name” is not used as a search keyword for information provided from the site 7 associated with “gourmet”.

クエリワードテーブルは、上述のクエリカテゴリとクエリキーワードとの関係を示す情報を格納する。具体的には、クエリワードテーブルは、クエリカテゴリの識別情報とクエリキーワードのキーワードデータとを相互に関連付けて格納する。クエリワードテーブルに格納されるクエリカテゴリは、上述のクエリカテゴリテーブルに格納されるクエリカテゴリと同じである。クエリキーワードは、クエリカテゴリに属する意味を持つ単語である。   The query word table stores information indicating the relationship between the query category and the query keyword. Specifically, the query word table stores query category identification information and query keyword keyword data in association with each other. The query category stored in the query word table is the same as the query category stored in the above-described query category table. The query keyword is a word having a meaning belonging to the query category.

図8は、キーワードDB16のクエリワードテーブルの例を示す図である。図8では、分かり易くするために、クエリカテゴリの識別情報がそのカテゴリを示す単語(名詞)で図示されている。但し、クエリワードテーブルに格納されるクエリカテゴリの識別情報は、図8に図示される単語ではなく、数値であってもよい。図8の例では、クエリカテゴリ「日付名」に、クエリキーワードとして「明日」、「明後日」、「6月8日」が関連付けられている。   FIG. 8 is a diagram illustrating an example of a query word table of the keyword DB 16. In FIG. 8, for easy understanding, the identification information of the query category is illustrated by a word (noun) indicating the category. However, the query category identification information stored in the query word table may be numeric values instead of the words illustrated in FIG. In the example of FIG. 8, “Tomorrow”, “Tomorrow”, and “June 8” are associated with the query category “date name” as query keywords.

クエリカテゴリテーブル及びクエリワードテーブルは、上述したとおり、クエリカテゴリにより相互に関連付けられる。よって、クエリカテゴリテーブル及びクエリワードテーブルは、クエリ関係情報と表記することもできる。また、クエリカテゴリを用いて、クエリカテゴリテーブル及びクエリワードテーブルを統合することもできる。この場合、統合されたテーブルでは、提供先カテゴリとクエリキーワードとの関係が示される。本実施形態のようにクエリカテゴリテーブルとクエリワードテーブルとを別に設けることにより、重複するクエリキーワードをテーブルに格納せずにすむため、メモリリソースの削減につながる。また、各テーブルのデータを管理し易いというメリットも享受できる。   As described above, the query category table and the query word table are associated with each other by the query category. Therefore, the query category table and the query word table can also be expressed as query relation information. In addition, the query category table and the query word table can be integrated using the query category. In this case, the integrated table shows the relationship between the provision destination category and the query keyword. By providing the query category table and the query word table separately as in this embodiment, it is not necessary to store duplicate query keywords in the table, leading to a reduction in memory resources. Moreover, the merit that it is easy to manage the data of each table can also be enjoyed.

ユーザ単語DB13及びキーワードDB16は、関係データベースであってもよいし、JSON(JavaScript(登録商標) Object Notation)やXML(Extensible Markup Language)等のような所定の記述言語で記載されたファイルであってもよい。   The user word DB 13 and the keyword DB 16 may be relational databases or files written in a predetermined description language such as JSON (JavaScript (registered trademark) Object Notation) or XML (Extensible Markup Language). Also good.

決定部17は、上述の提供先関係テーブルを参照することにより、抽出部15により抽出された1以上の単語データに対応する提供先カテゴリを特定する。例えば、決定部17は、抽出部15により抽出された単語データがキーワードDB16の提供先関係テーブルに提供先キーワードとして格納されているか否かを判定する。決定部17は、1以上の単語データが提供先キーワードとして格納されている提供先カテゴリを特定する。決定部17は、複数の提供先カテゴリを特定してもよい。また、1以上の単語データが提供先キーワードとして格納されている提供先カテゴリが複数存在する場合、決定部17は、最多の単語データが提供先キーワードとして格納されている一つの提供先カテゴリを特定してもよい。   The deciding unit 17 refers to the above-mentioned provision destination relation table, and specifies a provision destination category corresponding to one or more word data extracted by the extraction unit 15. For example, the determination unit 17 determines whether the word data extracted by the extraction unit 15 is stored as a provision destination keyword in the provision destination relation table of the keyword DB 16. The determination unit 17 specifies a provision destination category in which one or more word data is stored as a provision destination keyword. The determination unit 17 may specify a plurality of provision destination categories. Further, when there are a plurality of provision category categories in which one or more word data are stored as the provision destination keywords, the determination unit 17 specifies one provision destination category in which the most word data is stored as the provision destination keywords. May be.

また、決定部17は、提供先キーワードの特徴量と抽出部15により抽出された各単語データの特徴量との類似度を算出し、この類似度を用いて、提供先カテゴリを特定することもできる。単語データの特徴量の表記手法及び単語間の類似度計算手法については様々な既知の手法が利用できる。決定部17は、提供先キーワードデータ及び抽出部15により抽出された各単語データをそれぞれ特徴量データに変換し、変換された特徴量データ間の類似度を計算する。特徴量データはベクトル構造を有していてもよい。本実施形態では、単語間の類似度の計算手法は何ら制限されない。但し、意味及び概念の近さが類似度として高精度に算出される手法が利用されることが望ましい。   Further, the determination unit 17 may calculate a similarity between the feature amount of the provision destination keyword and the feature amount of each word data extracted by the extraction unit 15, and specify the provision destination category using the similarity. it can. Various known methods can be used as a method for expressing the feature amount of word data and a method for calculating similarity between words. The determination unit 17 converts each word data extracted by the provision destination keyword data and the extraction unit 15 into feature amount data, and calculates a similarity between the converted feature amount data. The feature amount data may have a vector structure. In the present embodiment, the method for calculating the similarity between words is not limited. However, it is desirable to use a method in which the closeness of meaning and concept is calculated with high accuracy as the similarity.

決定部17は、上述のように算出された類似度の距離により、提供先カテゴリを特定することもできる。他の例として、決定部17は、所定閾値以上でかつ最も高い類似度を示す提供先キーワードと関連付けられた提供先カテゴリを特定してもよい。また、決定部17は、所定閾値以上の類似度を示す提供先キーワードの数が最大の提供先カテゴリを特定してもよい。また、決定部17は、提供先カテゴリ毎の提供先キーワードの平均類似度が最も高い提供先カテゴリを特定してもよい。決定部17は、当該平均類似度が所定閾値以上の提供先カテゴリを特定してもよい。   The determination unit 17 can also specify the provision destination category based on the distance of the similarity calculated as described above. As another example, the determination unit 17 may specify a provision destination category associated with a provision destination keyword that is equal to or higher than a predetermined threshold and shows the highest similarity. Further, the determination unit 17 may specify a provision destination category having the largest number of provision destination keywords that indicate a degree of similarity equal to or greater than a predetermined threshold. Moreover, the determination part 17 may specify the provision destination category with the highest average similarity of the provision destination keyword for every provision destination category. The determination unit 17 may specify a provider category whose average similarity is equal to or greater than a predetermined threshold.

決定部17は、上述の既知の技術を用いて多数の単語について予め算出された特徴量データを保持しておいてもよい。このような単語毎の特徴量データは、分析装置10以外の他の装置により生成されてもよい。この場合、決定部17は、単語毎の特徴量データのテーブルを用いて、抽出部15により抽出された各単語データをそれぞれ特徴量データに置き換える。キーワードDB16には、提供先キーワード及びクエリキーワードとして、各々に対応する特徴量データが予め格納されてもよい。また、提供先関係テーブルには、提供先カテゴリ毎に、複数の提供先キーワードの平均特徴量データが格納されてもよい。この場合、決定部17は、抽出部15により抽出された各単語データの特徴量データと提供先カテゴリ毎の平均特徴量データとの類似度を計算することで、提供先カテゴリを特定する。   The determination unit 17 may hold feature amount data calculated in advance for a large number of words using the above-described known technique. Such feature amount data for each word may be generated by a device other than the analysis device 10. In this case, the determination unit 17 replaces each word data extracted by the extraction unit 15 with feature amount data using a table of feature amount data for each word. In the keyword DB 16, feature amount data corresponding to each of the providing destination keyword and the query keyword may be stored in advance. The provision destination relation table may store average feature amount data of a plurality of provision destination keywords for each provision destination category. In this case, the determination unit 17 specifies the provision category by calculating the similarity between the feature amount data of each word data extracted by the extraction unit 15 and the average feature amount data for each provision destination category.

決定部17は、抽出部15により抽出された1以上の単語データの中から検索キーワードに用いる単語データを選択する。具体的には、決定部17は、キーワードDB16のクエリカテゴリテーブル及びクエリワードテーブルに基づいて、抽出部15により抽出された各単語データが決定部17により特定された提供先カテゴリに関連付けられたクエリカテゴリに属するか否かをそれぞれ判定する。決定部17は、この判定により、抽出部15により抽出された1以上の単語データの中から検索キーワードに用いる単語データを選択する。以降、決定部17により特定された提供先カテゴリに関連付けられたクエリカテゴリを「対象クエリカテゴリ」と表記する場合もある。複数の提供先カテゴリを特定している場合、決定部17は、特定された複数の提供先カテゴリの各々について、抽出部15により抽出された複数の単語データの中から検索キーワードに用いる単語データをそれぞれ選択する。つまり、提供先カテゴリ毎に異なる単語データが選択される場合や、同一の単語データが全ての提供先カテゴリに共通で選択される場合や、単語データが全く選択されない提供先カテゴリが存在する場合などがあり得る。   The determination unit 17 selects word data to be used as a search keyword from one or more word data extracted by the extraction unit 15. Specifically, the determination unit 17 is a query in which each word data extracted by the extraction unit 15 is associated with the provision destination category specified by the determination unit 17 based on the query category table and the query word table of the keyword DB 16. Whether it belongs to a category is determined. Based on this determination, the determination unit 17 selects word data to be used as a search keyword from one or more word data extracted by the extraction unit 15. Hereinafter, the query category associated with the provider category specified by the determination unit 17 may be referred to as “target query category”. When a plurality of supply destination categories are specified, the determination unit 17 selects word data to be used as a search keyword from among the plurality of word data extracted by the extraction unit 15 for each of the specified plurality of supply destination categories. Select each one. In other words, when different word data is selected for each provider category, when the same word data is selected in common for all provider categories, or when there is a provider category where no word data is selected. There can be.

例えば、決定部17は、クエリカテゴリテーブルから対象クエリカテゴリを抽出し、抽出部15により抽出された各単語データが、クエリワードテーブルにおいて、対象クエリカテゴリに関連付けられたクエリキーワードと一致するか否かをそれぞれ判定する。決定部17は、対象クエリカテゴリに関連付けられたクエリキーワードと一致する単語データを検索キーワードに用いる単語データの候補として選択し、それ以外の単語データをその候補から除外する。   For example, the determination unit 17 extracts the target query category from the query category table, and whether or not each word data extracted by the extraction unit 15 matches the query keyword associated with the target query category in the query word table. Respectively. The determination unit 17 selects word data that matches the query keyword associated with the target query category as a word data candidate to be used as a search keyword, and excludes other word data from the candidate.

また、決定部17は、クエリワードテーブルで示されるクエリキーワードと抽出部15により抽出された各単語データの特徴量との類似度をそれぞれ算出し、算出された類似度を用いて、抽出部15により抽出された各単語データについて上記判定をそれぞれ行ってもよい。決定部17は、クエリキーワードデータ及び抽出部15により抽出された各単語データをそれぞれ特徴量データに変換し、変換された特徴量データ間の類似度を計算する。単語データの特徴量の表記手法及び単語間の類似度計算手法については上述したとおりである。   Further, the determination unit 17 calculates the similarity between the query keyword shown in the query word table and the feature amount of each word data extracted by the extraction unit 15, and uses the calculated similarity to extract the extraction unit 15. The determination may be performed for each word data extracted by the above. The determination unit 17 converts the query keyword data and each word data extracted by the extraction unit 15 into feature amount data, and calculates the similarity between the converted feature amount data. The notation method of the feature amount of the word data and the similarity calculation method between the words are as described above.

例えば、決定部17は、単語データとの類似度が所定閾値以上を示すクエリキーワードが対象クエリカテゴリに関連付けられている場合、その単語データを当該クエリカテゴリに属すると決定する。クエリワードテーブルがクエリカテゴリ毎に複数のクエリキーワードの平均特徴量データを格納している場合、決定部17は、対象クエリカテゴリの平均特徴量データとの類似度が所定閾値以上となる単語データを当該クエリカテゴリに属すると決定する。   For example, when a query keyword whose similarity with word data indicates a predetermined threshold or more is associated with the target query category, the determination unit 17 determines that the word data belongs to the query category. When the query word table stores average feature amount data of a plurality of query keywords for each query category, the determination unit 17 selects word data whose similarity with the average feature amount data of the target query category is a predetermined threshold value or more. It is determined that it belongs to the query category.

検索制御部18は、決定部17により決定された提供先カテゴリに対応するサイト7を特定し、このサイト7から提供される情報に対する決定部17により選択された単語データを検索キーワードとして用いた検索を要求する。一つの単語データも選択されなかった提供先カテゴリが存在する場合には、検索制御部18は、その提供先カテゴリに対応するサイト7から提供される情報に対する検索には検索キーワードを指定しなくてもよい。   The search control unit 18 specifies the site 7 corresponding to the provision destination category determined by the determination unit 17 and searches using the word data selected by the determination unit 17 for the information provided from the site 7 as a search keyword. Request. If there is a provision category for which no word data has been selected, the search control unit 18 does not specify a search keyword for the search for information provided from the site 7 corresponding to the provision category. Also good.

特定されたサイト7がサイト内検索をサポートしている場合、検索制御部18は、その特定されたサイト7に対して、選択された単語データを検索キーワードとする検索を要求し、その検索結果として抽出された情報をサイト7から受信する。また、特定されたサイト7がサイト内検索をサポートしていない場合、サイト7以外のコンピュータが、そのサイト7が提供している全ての情報をそのサイト7から取得し、取得された情報に対して当該検索を実施してもよい。この場合、検索制御部18は、その検索を行うコンピュータに対して検索を要求する。このとき検索制御部18は、そのコンピュータに対して、サイト7のアドレス情報と検索キーワードとして選択された単語データとを送る。検索を実施するコンピュータは、分析装置10であってもよい。   If the identified site 7 supports in-site search, the search control unit 18 requests the identified site 7 to perform a search using the selected word data as a search keyword, and the search result. The information extracted as is received from the site 7. In addition, when the specified site 7 does not support search within the site, a computer other than the site 7 acquires all the information provided by the site 7 from the site 7, and for the acquired information The search may be performed. In this case, the search control unit 18 requests a search to the computer that performs the search. At this time, the search control unit 18 sends the address information of the site 7 and the word data selected as the search keyword to the computer. The computer that performs the search may be the analysis apparatus 10.

出力処理部19は、検索制御部18により検索結果として取得された情報をクライアント8に送信する。これにより、クライアント8ではその情報が出力される。クライアント8は、分析装置10から提供された情報を、表示、印刷、音声など様々な方法で出力可能である。   The output processing unit 19 transmits information acquired as a search result by the search control unit 18 to the client 8. As a result, the client 8 outputs the information. The client 8 can output the information provided from the analysis device 10 by various methods such as display, printing, and voice.

〔動作例/情報分析方法〕
以下、第一実施形態における情報分析方法について図9を用いて説明する。図9は、第一実施形態における分析装置10の動作例を示すフローチャートである。図9に示されるように、第一実施形態における情報分析方法は、分析装置10のような少なくとも一つのコンピュータにより実行される。図9に示される各工程は、分析装置10が有する各ソフトウェア要素の処理内容と同様であるため、各工程の詳細は、適宜省略される。
[Operation example / Information analysis method]
Hereinafter, the information analysis method in the first embodiment will be described with reference to FIG. FIG. 9 is a flowchart showing an operation example of the analyzer 10 in the first embodiment. As shown in FIG. 9, the information analysis method in the first embodiment is executed by at least one computer such as the analysis apparatus 10. Each process shown in FIG. 9 is the same as the processing content of each software element included in the analyzer 10, and therefore details of each process are omitted as appropriate.

分析装置10は、ユーザの動作に起因して生成された単語データを取得する(S91)。具体的には、分析装置10は、クライアント8から文字列データ又は音声データを受信し、既知の技術を用いて、その受信された文字列データ又は音声データから単語データを抽出する。この単語データの取得手法については、取得部11の説明中で述べたとおりである。分析装置10は、クライアント8から当該単語データそのものを受信してもよい。   The analysis apparatus 10 acquires word data generated due to the user's action (S91). Specifically, the analysis device 10 receives character string data or voice data from the client 8 and extracts word data from the received character string data or voice data using a known technique. This method of acquiring word data is as described in the description of the acquisition unit 11. The analysis device 10 may receive the word data itself from the client 8.

分析装置10は、(S91)で取得された単語データに関する生成日時及び予定日時又はその生成日時を取得する(S92)。予定日時は取得されない場合もある。単語データに関する生成日時及び予定日時の意味及びそれらの取得手法については、取得部11の説明中で述べたとおりである。   The analysis apparatus 10 acquires the generation date / time and the scheduled date / time regarding the word data acquired in (S91) or the generation date / time (S92). The scheduled date and time may not be acquired. The meaning of the generation date / time and the scheduled date / time regarding the word data and the acquisition method thereof are as described in the description of the acquisition unit 11.

分析装置10は、(S91)で取得された単語データを、(S92)で取得された生成日時及び予定日時と関連付けて、ユーザ単語DB13に格納する(S93)。ユーザ毎にユーザ単語DB13が設けられている場合には、分析装置10は、その単語データの発生元のユーザに対応するユーザ単語DB13に、その単語データを格納する。また、分析装置10は、その単語データを、そのユーザ又はクライアント8の識別情報と共に、ユーザ単語DB13に格納してもよい。   The analysis apparatus 10 stores the word data acquired in (S91) in the user word DB 13 in association with the generation date / time and the scheduled date / time acquired in (S92) (S93). When the user word DB 13 is provided for each user, the analysis apparatus 10 stores the word data in the user word DB 13 corresponding to the user who generated the word data. The analysis device 10 may store the word data in the user word DB 13 together with the identification information of the user or the client 8.

分析装置10は、ユーザ単語DB13に格納される各単語データについて、その単語データに関連付けられている生成日時及び予定日時に基づいて、重み値をそれぞれ算出する(S94)。重み値の算出手法については、更新部14の説明中で述べたとおりである。具体的には、予定日時が設定されていない単語データについては、分析装置10は、生成日時からの経過時間に応じて低下するように、その単語データの重み値を算出する。予定日時が設定されている単語データについては、生成日時及び予定日時からの各経過時間に応じて低下し、かつ、予定日時までの残り時間の減少に応じて上昇するように、その単語データの重み値を算出する。更に、複数回取得された単語データについては、分析装置10は、その単語データの生成回数の増加に応じて上昇するように、その単語データの重み値を算出する。   The analysis device 10 calculates a weight value for each word data stored in the user word DB 13 based on the generation date and the scheduled date and time associated with the word data (S94). The method for calculating the weight value is as described in the description of the updating unit 14. Specifically, for the word data for which the scheduled date and time is not set, the analysis device 10 calculates the weight value of the word data so as to decrease according to the elapsed time from the generation date and time. For the word data for which the scheduled date and time is set, the word data is reduced so that it decreases with each generation time and the elapsed time from the scheduled date and time and increases with the decrease in the remaining time until the scheduled date and time. A weight value is calculated. Further, for the word data acquired a plurality of times, the analysis device 10 calculates the weight value of the word data so as to increase as the number of times the word data is generated.

分析装置10は、(S94)で算出された各単語データの重み値に基づいて、ユーザ単語DB13に格納される単語データの中から、ユーザ毎に1以上の単語データを抽出する(S95)。単語データの抽出手法については、抽出部15の説明中で述べたとおりである。   The analysis device 10 extracts one or more word data for each user from the word data stored in the user word DB 13 based on the weight value of each word data calculated in (S94) (S95). The word data extraction method is as described in the description of the extraction unit 15.

分析装置10は、(S95)で抽出された単語データに基づいて、情報提供先を決定する(S96)。更に、分析装置10は、(S95)で抽出された単語データに基づいて、検索キーワードを決定する(S97)。情報提供先及び検索キーワードの決定手法については、決定部17の説明中で述べたとおりである。   The analysis apparatus 10 determines an information providing destination based on the word data extracted in (S95) (S96). Further, the analysis apparatus 10 determines a search keyword based on the word data extracted in (S95) (S97). The method of determining the information providing destination and the search keyword is as described in the description of the determination unit 17.

分析装置10は、(S96)で情報提供先として決定されたサイト7から提供される情報に対する(S97)で決定された単語データを用いた検索を要求する(S98)。分析装置10は、特定されたサイト7に検索を要求してもよいし、他のコンピュータに対して検索を要求してもよい。また、分析装置10は、自身で検索を実行してもよい。   The analysis apparatus 10 requests a search using the word data determined in (S97) for the information provided from the site 7 determined as the information providing destination in (S96) (S98). The analysis device 10 may request a search from the identified site 7 or may request a search from another computer. Further, the analysis device 10 may perform a search by itself.

分析装置10は、上記検索の結果として抽出された情報をクライアント8に出力させる(S99)。   The analysis apparatus 10 causes the client 8 to output information extracted as a result of the search (S99).

次に、第一実施形態における情報分析方法の具体例を更に説明する。図10は、第一実施形態における分析装置10の一動作例のフロー及びデータの処理例を示す図である。ここでは、クライアント8で表示されているカレンダ画面に対して、ユーザが、第一予定「パスタを買う」及び第二予定「パスタを食べる」を入力したと仮定する。   Next, a specific example of the information analysis method in the first embodiment will be further described. FIG. 10 is a diagram illustrating a flow of one operation example of the analysis apparatus 10 and a data processing example in the first embodiment. Here, it is assumed that the user inputs the first schedule “buy pasta” and the second schedule “eat pasta” on the calendar screen displayed on the client 8.

この場合、分析装置10は、クライアント8から2つの文字列データ「パスタを買う」及び「パスタを食べる」を受信する(S101)。このとき、分析装置10は、その文字列データが受信された時間と、その文字列データが入力されたカレンダ上の日程情報とを取得することができる。   In this case, the analysis apparatus 10 receives two character string data “buy pasta” and “eat pasta” from the client 8 (S101). At this time, the analyzer 10 can acquire the time when the character string data is received and the schedule information on the calendar to which the character string data is input.

分析装置10は、受信された2つの文字列データをそれぞれ品詞分解し、名詞単語データ「パスタ」及び動詞単語データ「買う」及び「食べる」を取得する(S102)。ここでは、助詞単語データ「を」は処理対象から除外される。更に、分析装置10は、単語データ「パスタ」及び「買う」に関する生成日時を、文字列データ「パスタを買う」が受信された日時に設定し、その予定日時をその文字列データ「パスタを買う」が示す予定の日程に設定する。分析装置10は、単語データ「パスタ」及び「食べる」に関する生成日時を、文字列データ「パスタを食べる」が受信された日時に設定し、その予定日時をその文字列データ「パスタを買う」が示す予定の日程に設定する。   The analysis apparatus 10 decomposes the received two character string data, respectively, to obtain noun word data “pasta” and verb word data “buy” and “eat” (S102). Here, the particle word data “O” is excluded from the processing target. Furthermore, the analysis apparatus 10 sets the generation date and time related to the word data “pasta” and “buy” to the date and time when the character string data “buy pasta” is received, and sets the scheduled date and time as the character string data “buy pasta”. "Is set to the scheduled date indicated by. The analysis apparatus 10 sets the generation date and time related to the word data “pasta” and “eat” to the date and time when the character string data “eating pasta” is received, and the character string data “buy pasta” is set as the scheduled date and time. Set to the scheduled date shown.

分析装置10は、(S102)で取得された各単語データを、その単語データに関する生成日時及び予定日時と関連付けて、ユーザ単語DB13にそれぞれ格納する(S103)。図10の例では、単語データ「パスタ」及び「買う」は、生成日時「2015年6月6日」及び予定日時「2015年6月13日」と関連付けられて格納され、単語データ「パスタ」及び「食べる」は、生成日時「2015年6月7日」及び予定日時「2015年6月13日」と関連付けられて格納される。   The analysis apparatus 10 stores each word data acquired in (S102) in the user word DB 13 in association with the generation date / time and the scheduled date / time related to the word data (S103). In the example of FIG. 10, the word data “pasta” and “buy” are stored in association with the generation date “June 6, 2015” and the scheduled date “June 13, 2015”, and the word data “pasta”. And “eat” are stored in association with the generation date “June 7, 2015” and the scheduled date “June 13, 2015”.

分析装置10は、ユーザ単語DB13に格納される各単語データについて重み値をそれぞれ算出する(S104)。分析装置10は、生成日時及び予定日時のペアを時間変化モデルにそれぞれ適用することにより、単語データ「買う」及び「食べる」の重み値をそれぞれ算出する。図10の例では、単語データ「食べる」の生成日時が、単語データ「買う」のそれよりも後であるため、単語データ「食べる」の重み値は、単語データ「買う」のそれよりも大きい値となっている。ここで、単語データ「パスタ」は、異なる生成日時と関連付けられて2つ格納されている。よって、分析装置10は、生成日時及び予定日時のペアを時間変化モデルにそれぞれ適用することにより、生成日時毎に重み値をそれぞれ算出し、その算出された各重み値を足し合わせることで、単語データ「パスタ」について一つの重み値を算出する。   The analysis device 10 calculates a weight value for each word data stored in the user word DB 13 (S104). The analysis apparatus 10 calculates the weight values of the word data “buy” and “eat” by applying the generation date / time and scheduled date / time pairs to the time change model, respectively. In the example of FIG. 10, since the generation date and time of the word data “eat” is later than that of the word data “buy”, the weight value of the word data “eat” is larger than that of the word data “buy”. It is a value. Here, two pieces of word data “pasta” are stored in association with different generation dates and times. Therefore, the analysis device 10 applies the generation date / time and scheduled date / time pairs to the time change model, thereby calculating the weight value for each generation date / time, and adding the calculated weight values to each word. One weight value is calculated for the data “pasta”.

分析装置10は、ユーザ単語DB13に格納される複数の単語データの中から、重み値が所定条件を満たす単語データを抽出する(S105)。図10の例では、分析装置10は、所定閾値「0.8」より大きい重み値「0.83」を有する単語データ「パスタ」を抽出する。   The analysis apparatus 10 extracts word data whose weight value satisfies a predetermined condition from a plurality of word data stored in the user word DB 13 (S105). In the example of FIG. 10, the analysis apparatus 10 extracts word data “pasta” having a weight value “0.83” greater than a predetermined threshold “0.8”.

分析装置10は、(S105)で抽出された単語データに対応する情報提供先(検索サイト)及び検索キーワード(クエリ)を決定する(S106)。
分析装置10は、(S106)で決定された検索サイトに対して、(S106)で決定されたクエリに基づく検索を要求する。分析装置10は、その検索の結果得られた情報をクライアント8に出力させる(S107)。図10の例では、「パスタ」に関連する情報が出力される。
The analysis apparatus 10 determines an information providing destination (search site) and a search keyword (query) corresponding to the word data extracted in (S105) (S106).
The analysis apparatus 10 requests the search site determined in (S106) based on the query determined in (S106). The analysis apparatus 10 causes the client 8 to output information obtained as a result of the search (S107). In the example of FIG. 10, information related to “pasta” is output.

図9及び図10では、一続きの動作フローが例示されている。しかしながら、第一実施形態における情報分析方法及び分析装置10の動作は、そのような一続きのフローでなくてもよい。例えば、図9において、(S91)、(S92)及び(S93)の処理フローと、(S94)の処理と、(S95)以降の処理フローとは、並行して実行されてもよい。また、(S94)以降の処理フローと、(S91)、(S92)及び(S93)の処理フローとが並行して実行されてもよい。また、(S96)及び(S97)は、逆の順で実行されてもよいし、並行して実行されてもよい。   9 and 10 illustrate a series of operation flows. However, the operation of the information analysis method and the analysis apparatus 10 in the first embodiment may not be such a continuous flow. For example, in FIG. 9, the processing flow of (S91), (S92) and (S93), the processing of (S94), and the processing flow after (S95) may be executed in parallel. Further, the processing flow after (S94) and the processing flows of (S91), (S92), and (S93) may be executed in parallel. Further, (S96) and (S97) may be executed in the reverse order or may be executed in parallel.

〔第一実施形態の作用及び効果〕
上述したように第一実施形態では、ユーザの動作に起因して生成された単語データが、発生元のユーザ毎にユーザ単語DB13に格納される。このとき、単語データは、その単語データに関する生成日時及び予定日時と関連付けられて格納される。そして、生成日時と現在日時との関係又は生成日時及び予定日時と現在日時との関係に基づいて、格納されている各単語データの重み値がそれぞれ算出される。
[Operation and effect of the first embodiment]
As described above, in the first embodiment, the word data generated due to the user's action is stored in the user word DB 13 for each user who generated the data. At this time, the word data is stored in association with the generation date and the scheduled date and time related to the word data. Based on the relationship between the generation date / time and the current date / time or the relationship between the generation date / time and the scheduled date / time and the current date / time, the weight value of each stored word data is calculated.

第一実施形態では、単語データの重み値は、生成日時及び予定日時からの各経過時間に応じて低下し、かつ、予定日時までの残り時間の減少に応じて上昇するように、算出される。これにより、算出される重み値は、日付が経つにつれて関心や興味は薄れていくという人間の特性及び予定日時が近付くにつれて関心や興味が高まっていくという人間の特性を反映した値となる。   In the first embodiment, the weight value of the word data is calculated so as to decrease with each elapsed time from the generation date and time and the scheduled date and time and to increase with a decrease in remaining time until the scheduled date and time. . As a result, the calculated weight value reflects the human characteristic that interest and interest decrease as the date passes, and the human characteristic that interest and interest increase as the scheduled date approaches.

更に、第一実施形態では、同一単語を示す単語データが異なる生成日時と共に取得される場合には、その単語データは、各生成日時と関連付けられて、重複してユーザ単語DB13に格納される。そして、単語データの生成回数の増加に応じて上昇するように、単語データの重み値が算出される。これにより、算出される重み値は、その単語データに対するユーザの行動の回数により表れるユーザの興味や関心の度合いを反映した値となる。   Furthermore, in the first embodiment, when word data indicating the same word is acquired with different generation dates and times, the word data is associated with each generation date and stored in the user word DB 13 in duplicate. Then, the weight value of the word data is calculated so as to increase as the number of word data generations increases. Thus, the calculated weight value is a value reflecting the user's interest and the degree of interest expressed by the number of times the user's action is performed on the word data.

このように、関心や興味に関する時間的変化及び人間の行動特性を反映した方法で重み値が算出されるため、第一実施形態によれば、各単語データの重み値の変化を人間が抱く興味や関心の度合いの変化に近似させることができる。即ち、第一実施形態によれば、各単語に対するユーザの興味や関心の度合いを高精度に管理することができる。   Thus, since the weight value is calculated by a method reflecting the interest and the temporal change related to the interest and the human behavioral characteristics, according to the first embodiment, the interest that the human holds the change in the weight value of each word data. And a change in the degree of interest. That is, according to the first embodiment, it is possible to manage the user's interest in each word and the degree of interest with high accuracy.

更に、第一実施形態では、ユーザの行動に起因して生成された複数の単語データの中から、上述のように算出された各単語データの重み値に基づいて、1以上の単語データが抽出される。各重み値には、ユーザが抱く興味や関心の度合いが高精度に反映されているため、抽出される単語データは、ユーザにとって関心の高い(興味の強い)単語のデータとなる。そして、第一実施形態では、抽出された単語データに基づいて情報提供先及び検索キーワードが決定され、その情報提供先から提供される情報に対するその決定された検索キーワードを用いた検索が実行され、その検索の結果得られた情報がクライアント8(ユーザ)に提供される。これにより、ユーザにとって関心の高い単語に関連する情報がユーザに提供されることになる。   Furthermore, in the first embodiment, one or more word data is extracted from a plurality of word data generated due to user behavior based on the weight value of each word data calculated as described above. Is done. Since each weight value reflects the degree of interest and interest of the user with high accuracy, the extracted word data is data of a word that is highly interested (strongly interested) by the user. In the first embodiment, the information providing destination and the search keyword are determined based on the extracted word data, and the search using the determined search keyword is performed on the information provided from the information providing destination. Information obtained as a result of the search is provided to the client 8 (user). As a result, information related to words of high interest to the user is provided to the user.

従って、第一実施形態によれば、ユーザ毎に、関心の高い情報を適切なタイミングで提供することができる。ここで、適切なタイミングとは、ユーザが関心の高いそのときを意味する。ユーザの興味や関心は、上述したとおり、時間の経過に従って減少していくため、或る時点で感心が高かったトピックであっても、その後の或る時点でも関心が高いとは限らない。また、今後の予定に関連するトピックに対する興味や関心は、或る時点で低かったとしても、その予定の接近により、再び高まる。第一実施形態によれば、このような人間が抱く興味や関心の度合いの変化に従って、ユーザが関心の高い情報を関心の高いときに提供することができる。   Therefore, according to the first embodiment, it is possible to provide highly interested information at an appropriate timing for each user. Here, the appropriate timing means the time when the user is highly interested. As described above, the user's interests and interests decrease with the passage of time, so even a topic that is highly impressed at a certain point in time does not necessarily have a high interest at a certain point in time. In addition, even if the interest or interest in a topic related to a future schedule is low at a certain point in time, it increases again as the schedule approaches. According to the first embodiment, according to such a change in the interest and the degree of interest that a person has, information that the user is highly interested in can be provided when the interest is high.

[第二実施形態]
第二実施形態は、検索により抽出された情報に対するユーザの評価を更に考慮して、単語データの重み値を更新する。以下、第二実施形態における情報分析装置及び情報分析方法について、第一実施形態と異なる内容を中心に説明する。以下の説明では、第一実施形態と同様の内容については適宜省略する。
[Second Embodiment]
In the second embodiment, the weight value of the word data is updated by further considering the user's evaluation on the information extracted by the search. Hereinafter, the information analysis device and the information analysis method in the second embodiment will be described focusing on the contents different from those in the first embodiment. In the following description, the same contents as those in the first embodiment are omitted as appropriate.

第二実施形態における分析装置10のハードウェア構成は、第一実施形態と同様でよい。
〔処理構成〕
図11は、第二実施形態における分析装置10の処理構成例を概念的に示す図である。第二実施形態における分析装置10は、図11に示されるようなソフトウェア要素を有する。具体的には、分析装置10は、第一実施形態の処理構成に加えて、評価取得部21を更に有する。評価取得部21についても、例えば、CPU1によりメモリ2に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力I/F3又は通信ユニット4を介してインストールされ、メモリ2に格納されてもよい。
The hardware configuration of the analyzer 10 in the second embodiment may be the same as in the first embodiment.
[Processing configuration]
FIG. 11 is a diagram conceptually illustrating a processing configuration example of the analysis apparatus 10 in the second embodiment. The analyzer 10 in the second embodiment has software elements as shown in FIG. Specifically, the analyzer 10 further includes an evaluation acquisition unit 21 in addition to the processing configuration of the first embodiment. The evaluation acquisition unit 21 is also realized, for example, by executing a program stored in the memory 2 by the CPU 1. Further, the program may be installed from a portable recording medium such as a CD or a memory card or another computer on the network via the input / output I / F 3 or the communication unit 4 and stored in the memory 2. Good.

出力処理部19は、検索制御部18により検索結果として取得された情報をクライアント8に送信する。このとき、出力処理部19は、検索結果として取得された情報と共に、クライアント8のユーザにその情報の評価結果を入力させるための画面を送信することもできる。例えば、その入力画面には、良いか否かを選択させる画面要素が含まれていてもよいし、評価点(例えば、最良(5点)から不要(0点)までの6段階の一つ)を入力させる画面要素が含まれていてもよい。   The output processing unit 19 transmits information acquired as a search result by the search control unit 18 to the client 8. At this time, the output processing unit 19 can also transmit a screen for allowing the user of the client 8 to input the evaluation result of the information together with the information acquired as the search result. For example, the input screen may include a screen element for selecting whether it is good or not, and an evaluation score (for example, one of six levels from the best (5 points) to unnecessary (0 points)). May be included.

評価取得部21は、検索制御部18により検索結果として取得された情報に対するユーザの評価情報を取得する。ユーザの評価情報は、提供された情報の、ユーザにとっての必要性の有無又は高さを示す情報である。例えば、ユーザの評価情報は、必要であったか否かの二値により示されてもよいし、必要性の高さを示す評価値により示されてもよい。ユーザの評価がクライアント8の操作により入力される場合には、評価取得部21は、その入力された情報をユーザの評価情報として取得する。また、評価取得部21は、提供された情報のサマリをユーザが選択して、その詳細情報をユーザが閲覧したか否かをユーザの評価情報として取得することもできる。例えば、出力処理部19が検索結果として得られた情報のサマリリストの画面をクライアント8に表示させ、評価取得部21は、その画面に対する選択操作に関する情報によりユーザの閲覧状況を判定することができる。   The evaluation acquisition unit 21 acquires user evaluation information for the information acquired as a search result by the search control unit 18. The user evaluation information is information indicating the necessity or height of the provided information for the user. For example, the evaluation information of the user may be indicated by a binary value indicating whether or not it is necessary, or may be indicated by an evaluation value indicating the level of necessity. When the user evaluation is input by the operation of the client 8, the evaluation acquisition unit 21 acquires the input information as user evaluation information. Moreover, the evaluation acquisition part 21 can also acquire as a user evaluation information whether the user selected the summary of the provided information and the user browsed the detailed information. For example, the output processing unit 19 displays a screen of a summary list of information obtained as a search result on the client 8, and the evaluation acquisition unit 21 can determine a user's browsing status based on information regarding a selection operation on the screen. .

評価取得部21は、取得された評価情報の対象となる検索を特定し、その評価情報により示される評価値をその検索の基礎とされた単語データの評価値に設定する。検索の基礎とされた単語データとは、その検索に用いられた情報提供先及び検索キーワードを決めるために参照された単語データを意味する。単語データの評価値は、ユーザ単語DB13に、単語データと関連付けられて格納されてもよいし、別のテーブルに、その単語データと更新部14により算出される重み値と共に格納されてもよい。   The evaluation acquisition unit 21 specifies the search that is the target of the acquired evaluation information, and sets the evaluation value indicated by the evaluation information as the evaluation value of the word data that is the basis of the search. The word data used as the basis of the search means word data referred to in order to determine an information providing destination and a search keyword used for the search. The evaluation value of the word data may be stored in the user word DB 13 in association with the word data, or may be stored in another table together with the word data and the weight value calculated by the update unit 14.

評価情報の対象となる検索の特定及び評価値を設定すべき単語データの特定は、例えば、次のように遂行される。検索制御部18は、実行された検索毎に、対象ユーザ(又はクライアント8)の識別情報とその検索の基礎とされた単語データと検索により得られた情報との関連情報を保持しておく。評価取得部21は、評価情報と共に、ユーザ(又はクライアント8)の識別情報とその評価情報の対象となる情報との関係情報を取得する。評価取得部21は、その関係情報に基づいて、評価情報の対象となる検索を特定し、評価値を設定すべき単語データを特定することができる。   For example, the search for the evaluation information and the word data for which the evaluation value is to be set are specified as follows. For each search performed, the search control unit 18 holds information related to the identification information of the target user (or the client 8), the word data used as the basis of the search, and the information obtained by the search. The evaluation acquisition unit 21 acquires the relationship information between the identification information of the user (or client 8) and the information that is the target of the evaluation information together with the evaluation information. Based on the relationship information, the evaluation acquisition unit 21 can specify a search that is a target of evaluation information, and can specify word data for which an evaluation value is to be set.

更新部14は、評価取得部21により取得された評価情報を更に考慮して、各単語データの重み値を更新する。更新部14は、評価情報により示される、ユーザにとっての必要性の高さに従って高くなるように、重み値を算出する。このような更新部14による算出手法は、例えば、次のような計算式で実装することができる。但し、本実施形態における更新部14で用いられる重み値の算出手法は、以下の(式4)に限定されない。

Figure 0006593873
The update unit 14 further updates the weight value of each word data in consideration of the evaluation information acquired by the evaluation acquisition unit 21. The updating unit 14 calculates the weight value so as to increase according to the necessity for the user indicated by the evaluation information. Such a calculation method by the update unit 14 can be implemented by the following calculation formula, for example. However, the weight value calculation method used by the updating unit 14 in the present embodiment is not limited to the following (Formula 4).
Figure 0006593873

上記の(式4)において、eは、単語データs'についての評価値を示す。例えば、eは、未評価ならば「1」、肯定的な評価ならば「2」、否定的な評価ならば「0」といった値を取る。単語データsの重み値を示すwは、上記(式2)又は上記(式3)で算出される。上記(式4)によれば、肯定的な評価を得た単語データの重み値は、否定的な評価を得た単語データ及び未評価の単語データに比べて、高く算出される。 In the above (Formula 4), e j represents an evaluation value for the word data s ′ j . For example, e j may, if not rated "1", if positive reviews "2", if negative rating takes a value such as "0". W i indicating the weight value of the word data s i is calculated by the above (formula 2) or the above (formula 3). According to the above (Formula 4), the weight value of the word data obtained with a positive evaluation is calculated higher than the word data obtained with a negative evaluation and the unevaluated word data.

図12は、第二実施形態における重み値の時間変化モデルの例を示す図である。この例では、4日経過時点において、ユーザの否定的な評価を示す評価情報に基づいて、重み値が0に設定されている。この例は、否定的な評価を示す評価値eが「0」に設定される場合に、上記(式4)で算出される重み値と同じである。また、8日経過時点において、ユーザの肯定的な評価を示す評価情報に基づいて、重み値が上げられている。この例は、肯定的な評価を示す評価値eが「2」に設定される場合に、上記(式4)で算出される重み値と同じで、重み値が2倍に更新されている。 FIG. 12 is a diagram illustrating an example of a time change model of weight values in the second embodiment. In this example, the weight value is set to 0 based on the evaluation information indicating the negative evaluation of the user when 4 days have elapsed. In this example, when the evaluation value e j indicating a negative evaluation is set to "0", the same as the weight value calculated by the above equation (4). In addition, the weight value is increased based on the evaluation information indicating the positive evaluation of the user when 8 days have passed. In this example, when the evaluation value e j indicating a positive evaluation is set to "2", the same as the weight value calculated by the above equation (4), has been updated weight values doubled .

〔動作例/情報分析方法〕
以下、第二実施形態における情報分析方法について図13を用いて説明する。図13は、第二実施形態における分析装置10の動作例を示すフローチャートである。図13に示されるように、第二実施形態における情報分析方法は、分析装置10のような少なくとも一つのコンピュータにより実行される。図13に示される各工程は、分析装置10が有する各ソフトウェア要素の処理内容と同様であるため、各工程の詳細は、適宜省略される。
[Operation example / Information analysis method]
Hereinafter, the information analysis method in the second embodiment will be described with reference to FIG. FIG. 13 is a flowchart showing an operation example of the analyzer 10 in the second embodiment. As shown in FIG. 13, the information analysis method in the second embodiment is executed by at least one computer such as the analysis apparatus 10. Each step shown in FIG. 13 is the same as the processing content of each software element included in the analysis apparatus 10, and therefore details of each step are omitted as appropriate.

図13に示される工程(S91)から(S99)は、図9に示される第一実施形態における各工程と同様である。   Steps (S91) to (S99) shown in FIG. 13 are the same as the steps in the first embodiment shown in FIG.

第二実施形態では、分析装置10は、(S99)で検索結果として出力された情報に対するユーザの評価情報を取得する(S131)。分析装置10は、(S99)での情報の送信先となるクライアント8又はユーザの識別情報と、(S99)で送信した情報と、(S98)での検索の基礎とされた((S95)で抽出された)単語データとの関係情報を保持することができる。分析装置10は、(S131)で取得された評価情報が(S99)で送信した情報に対応することを確認し、その情報と関係する単語データを、評価値を設定すべき単語データとして決定する。分析装置10は、決定された単語データに関連付けて、取得された評価情報に対応する評価値を格納する。   In the second embodiment, the analysis apparatus 10 acquires user evaluation information for the information output as a search result in (S99) (S131). The analysis apparatus 10 is based on the identification information of the client 8 or the user who is the transmission destination of the information in (S99), the information transmitted in (S99), and the search basis in (S98) (in (S95)) Information on the relationship with the extracted word data can be held. The analysis apparatus 10 confirms that the evaluation information acquired in (S131) corresponds to the information transmitted in (S99), and determines word data related to the information as word data for which an evaluation value is to be set. . The analysis device 10 stores an evaluation value corresponding to the acquired evaluation information in association with the determined word data.

分析装置10は、その格納された評価値を更に用いて、その単語データの重み値を更新する(S132)。このときの重み値の算出手法については、更新部14の説明中に述べたとおりである。   The analysis device 10 further uses the stored evaluation value to update the weight value of the word data (S132). The calculation method of the weight value at this time is as described in the description of the updating unit 14.

次に、第二実施形態における情報分析方法の具体例を更に説明する。図14は、第二実施形態における分析装置10の一動作例のフロー及びデータの処理例を示す図である。前提条件は、図10に示される場面と同じである。更に、(S101)から(S107)については、図10と同様である。   Next, a specific example of the information analysis method in the second embodiment will be further described. FIG. 14 is a diagram illustrating a flow of one operation example of the analysis apparatus 10 and a data processing example in the second embodiment. The precondition is the same as the scene shown in FIG. Further, (S101) to (S107) are the same as in FIG.

分析装置10は、パスタ関連の情報を検索結果としてクライアント8に出力させた後(S107)、その情報に対するユーザの評価情報を取得する(S141)。このユーザは、(S107)における情報の提供先となるユーザであり、(S101)で取得された文字列データの発生元となるユーザである。ここでは、取得された評価情報は、肯定的な評価を示していたと仮定する。これにより、分析装置10は、(S105)で抽出された単語データと関連付けて、その評価情報に対応する評価値「2」を格納する。   The analysis apparatus 10 causes the client 8 to output pasta-related information as a search result (S107), and obtains user evaluation information for the information (S141). This user is a user who provides information in (S107) and a user who generates the character string data acquired in (S101). Here, it is assumed that the acquired evaluation information indicates a positive evaluation. Accordingly, the analysis apparatus 10 stores the evaluation value “2” corresponding to the evaluation information in association with the word data extracted in (S105).

分析装置10は、その評価値「2」を更に用いて、その単語データの重み値を更新する(S104)。ここでは、分析装置10は、元の重み値「0.83」に評価値「2」を掛け合わせて、新たな重み値「1.66」を算出する。結果、そのユーザにとって、パスタの関連情報の有用性が高かったため、再度、パスタの関連情報が提供されることになる。   The analysis apparatus 10 further uses the evaluation value “2” to update the weight value of the word data (S104). Here, the analysis apparatus 10 calculates a new weight value “1.66” by multiplying the original weight value “0.83” by the evaluation value “2”. As a result, the pasta related information is highly useful for the user, and the pasta related information is provided again.

第二実施形態における分析装置10の動作及び情報分析方法は、図13及び図14に示される例に制限されない。分析装置10は、ユーザの評価情報を取得したタイミングで、その評価情報に対応する単語データの重み値を更新しなくてもよい。この場合、分析装置10は、(S131)の後、単語データに関連付けて、取得された評価情報に対応する評価値を格納して終える。分析装置10は、任意のタイミングで重み値を更新する際に、評価値が格納されている単語データの重み値は、その評価値を更に用いて、算出すればよい。   The operation of the analysis apparatus 10 and the information analysis method in the second embodiment are not limited to the examples shown in FIGS. The analysis device 10 may not update the weight value of the word data corresponding to the evaluation information at the timing when the user evaluation information is acquired. In this case, after (S131), the analysis apparatus 10 stores the evaluation value corresponding to the acquired evaluation information in association with the word data and ends. When the analysis device 10 updates the weight value at an arbitrary timing, the weight value of the word data in which the evaluation value is stored may be calculated by further using the evaluation value.

〔第二実施形態の作用及び効果〕
上述したとおり、第二実施形態では、検索結果として取得された情報がユーザ(クライアント8)に提供され、その情報に対するユーザの評価情報が取得される。そして、生成日時、予定日時、生成回数(格納回数)に加えて、その取得された評価情報を更に考慮して、各単語データの重み値が算出される。このように、第二実施形態では、興味や関心に関する人間の心理的特性及び行動特性だけでなく、検索結果に対してユーザから直接フィードバックされた嗜好情報が各単語データの重み値に更に反映される。
[Operation and effect of the second embodiment]
As described above, in the second embodiment, information acquired as a search result is provided to the user (client 8), and user evaluation information for the information is acquired. Then, in addition to the generation date / time, the scheduled date / time, and the generation count (storage count), the weight value of each word data is calculated by further considering the acquired evaluation information. As described above, in the second embodiment, not only human psychological characteristics and behavioral characteristics related to interest, but also preference information directly fed back from the user to the search result is further reflected in the weight value of each word data. The

従って、第二実施形態によれば、ユーザの嗜好に合った情報を提供できる値になるように、単語データの重み値を学習することができるため、各単語に対するユーザの興味や関心の度合いをより高精度に管理することができる。結果、ユーザにとって興味や関心の高い情報、即ちユーザの嗜好に合った情報のみを提供することができる。   Therefore, according to the second embodiment, since the weight value of the word data can be learned so as to be a value that can provide information that suits the user's preference, the user's interest and degree of interest in each word can be determined. It can be managed with higher accuracy. As a result, it is possible to provide only information that is highly interested in the user, that is, information that matches the user's preference.

[第二実施形態の変形例]
上述のキーワードDB16に含まれる提供先関係テーブルは、複数の情報提供先と複数の特徴ベクトルとの関係を示してもよい。この場合、提供先関係テーブルは、ユーザ毎に設けられてもよいし、ユーザの識別情報と複数の情報提供先と複数の特徴ベクトルとの関係を示してもよい。本変形例では、抽出部15は、抽出された単語データを特徴ベクトルに変換する。この変換方法には既知の様々な手法が利用可能である。抽出部15は、既知の手法を用いて多数の単語について予め算出された特徴ベクトルのリストを保持しておいてもよい。特徴ベクトルは、分析装置10以外の他の装置により生成されてもよい。この場合、抽出部15は、保持される特徴ベクトルのリストを用いて、抽出された各単語データを特徴ベクトルにそれぞれ変換する。以降、変換された特徴ベクトルは、単語特徴ベクトルと表記される。
[Modification of Second Embodiment]
The provision destination relationship table included in the keyword DB 16 described above may indicate the relationship between a plurality of information provision destinations and a plurality of feature vectors. In this case, the provision destination relationship table may be provided for each user, or may indicate the relationship between the user identification information, a plurality of information provision destinations, and a plurality of feature vectors. In this modification, the extraction unit 15 converts the extracted word data into a feature vector. Various known methods can be used for this conversion method. The extraction unit 15 may hold a list of feature vectors calculated in advance for a large number of words using a known method. The feature vector may be generated by a device other than the analysis device 10. In this case, the extraction unit 15 converts each extracted word data into a feature vector by using the retained feature vector list. Hereinafter, the converted feature vector is referred to as a word feature vector.

決定部17は、ユーザの提供先関係テーブルに格納される各特徴ベクトルと、抽出部15により算出された各単語特徴ベクトルとの類似度をそれぞれ算出することにより、検索対象とする情報提供先(サイト7)と単語データとの組み合わせを特定する。決定部17は、算出された類似度が所定閾値以上となる単語特徴ベクトルと特徴ベクトルとの組み合わせに基づいて、その単語特徴ベクトルに対応する単語データとその特徴ベクトルに対応するサイト7との組み合わせを特定する。当該所定閾値は、予め決定部17により保持されていればよく、その具体的な値は制限されない。   The determining unit 17 calculates the similarity between each feature vector stored in the user providing destination relationship table and each word feature vector calculated by the extracting unit 15, thereby obtaining an information providing destination (to be searched) ( The combination of the site 7) and word data is specified. Based on a combination of a word feature vector and a feature vector whose calculated similarity is equal to or greater than a predetermined threshold, the determination unit 17 combines the word data corresponding to the word feature vector and the site 7 corresponding to the feature vector. Is identified. The predetermined threshold only needs to be held in advance by the determination unit 17, and the specific value is not limited.

検索制御部18は、決定部17により特定された組み合わせに対応する検索を要求する。具体的には、検索制御部18は、決定部17により特定された組み合わせにおけるサイト7から提供される情報に対するその組み合わせにおける単語データを検索キーワードとして用いた検索を要求する。検索制御部18は、決定部17により特定された複数の組み合わせにおいて、同一のサイト7に対して異なる単語データが組み合わされている場合、そのサイト7から提供される情報に対する複数の検索を要求する。   The search control unit 18 requests a search corresponding to the combination specified by the determination unit 17. Specifically, the search control unit 18 requests a search using word data in the combination for information provided from the site 7 in the combination specified by the determination unit 17 as a search keyword. When a plurality of combinations specified by the determination unit 17 include different word data for the same site 7, the search control unit 18 requests a plurality of searches for information provided from the site 7. .

更新部14は、各単語データの重み値に加えて、キーワードDB16の提供先関係テーブルに格納される特徴ベクトルを更に更新する。具体的には、更新部14は、評価取得部21により取得された評価情報に基づいて、提供先関係テーブルにおいて、当該検索の対象とされた情報提供先に関連付けられている特徴ベクトルを更新する。更新部14は、評価情報の対象とされた検索の情報提供先に関連付けられている特徴ベクトルを、その検索で用いられた単語データの特徴ベクトルに近付く又はその特徴ベクトルから離れるように、更新する。特徴ベクトルの更新手法は制限されない。   The update unit 14 further updates the feature vector stored in the provision destination relationship table of the keyword DB 16 in addition to the weight value of each word data. Specifically, based on the evaluation information acquired by the evaluation acquisition unit 21, the update unit 14 updates the feature vector associated with the information providing destination that is the search target in the providing destination relation table. . The update unit 14 updates the feature vector associated with the information providing destination of the search that is the target of the evaluation information so as to approach or separate from the feature vector of the word data used in the search. . The feature vector update method is not limited.

本変形例によれば、情報提供先と特徴ベクトルとの関係が、各ユーザの嗜好に合うように、自動で学習される。結果、提供先関係テーブルの設定を自動化することができ、テーブルの管理労力を低減することができる。   According to this modification, the relationship between the information providing destination and the feature vector is automatically learned so as to suit each user's preference. As a result, the setting of the provision destination relation table can be automated, and the management effort of the table can be reduced.

[第三実施形態]
以下、第三実施形態における情報分析装置及び情報分析方法について説明する。また、第三実施形態は、この情報分析方法を少なくとも一つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録した当該少なくとも一つのコンピュータが読み取り可能な記録媒体であってもよい。
[Third embodiment]
Hereinafter, an information analysis apparatus and an information analysis method according to the third embodiment will be described. The third embodiment may be a program that causes at least one computer to execute the information analysis method, or may be a recording medium that can be read by the at least one computer that records such a program. Good.

図15は、第三実施形態における情報分析装置100の処理構成例を概念的に示す図である。図15に示されるように、情報分析装置100は、取得部101、格納処理部102及び更新部103を有する。図15に示される情報分析装置100は、例えば、図1に示される上述の分析装置10と同様のハードウェア構成を有し、その分析装置10と同様にプログラムが処理されることで、図15に示される各ソフトウェア要素が実現される。   FIG. 15 is a diagram conceptually illustrating a processing configuration example of the information analysis apparatus 100 in the third embodiment. As illustrated in FIG. 15, the information analysis apparatus 100 includes an acquisition unit 101, a storage processing unit 102, and an update unit 103. The information analysis apparatus 100 shown in FIG. 15 has, for example, the same hardware configuration as that of the above-described analysis apparatus 10 shown in FIG. Each software element shown in FIG.

取得部101は、ユーザの動作に起因して生成された単語データを取得する。ユーザの動作は、クライアント8の操作(キーボード操作、マウス操作、タッチパネル操作、クライアント8の端末を動かす等)、発声、ジェスチャ等、あらゆる動作を含む。取得される単語データは、ユーザの動作に間接的に起因して得られる単語データであってもよい。例えば、取得部101は、ユーザの閲覧操作によりサーバ装置(図示せず)から提供される情報に含まれる文字列データから、当該複数の単語データを取得することもできる。取得部101は、クライアント8から当該複数の単語データを取得してもよいし、クライアント8又は他の装置から得られるデータに対して所定処理(形態素解析、音声認識、ジェスチャ認識等)を適用することで当該複数の単語データを取得してもよい。また、取得部101は、可搬型記録媒体や、クライアント8以外の他の装置から単語データを取得することもできる。   The acquisition unit 101 acquires word data generated due to the user's action. The user's operation includes all operations such as operation of the client 8 (keyboard operation, mouse operation, touch panel operation, moving the terminal of the client 8, etc.), speech, gesture and the like. The acquired word data may be word data obtained indirectly due to the user's action. For example, the acquisition unit 101 can also acquire the plurality of word data from character string data included in information provided from a server device (not shown) by a user browsing operation. The acquisition unit 101 may acquire the plurality of word data from the client 8, or apply predetermined processing (morphological analysis, speech recognition, gesture recognition, etc.) to data obtained from the client 8 or another device Thus, the plurality of word data may be acquired. The acquisition unit 101 can also acquire word data from a portable recording medium or a device other than the client 8.

格納処理部102は、取得部101により取得された単語データを、その単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納する。生成日時及び予定日時の意味については、第一実施形態で述べたとおりである。格納処理部102の具体例が、上述の格納処理部12である。   The storage processing unit 102 stores the word data acquired by the acquisition unit 101 in the user word storage unit in association with the generation date / time and the scheduled date / time related to the word data. The meanings of the generation date and time and the scheduled date and time are as described in the first embodiment. A specific example of the storage processing unit 102 is the above-described storage processing unit 12.

ユーザ単語格納部は、単語データと生成日時と予定日時とを関連付けて格納する。但し、ユーザ単語格納部は、他の情報を格納してもよい。また、ユーザ単語格納部は、上述の各実施形態と同様に、同一単語を示す単語データを重複して格納してもよいし、同一単語を示す単語データを一つだけ格納してもよい。後者の場合、ユーザ単語格納部は、最新の生成日時及び予定日時を、その単語データと関連付けて格納すればよい。   The user word storage unit stores word data, generation date / time, and scheduled date / time in association with each other. However, the user word storage unit may store other information. In addition, the user word storage unit may store redundant word data indicating the same word, or may store only one word data indicating the same word, as in the above-described embodiments. In the latter case, the user word storage unit may store the latest generation date / time and scheduled date / time in association with the word data.

図15に示されるように、情報分析装置100は、ユーザ単語格納部を持たなくてもよいし、持っていてもよい。情報分析装置100は、通信ユニット4を介した通信により、他の装置が持つユーザ単語格納部を参照することができる。   As illustrated in FIG. 15, the information analysis apparatus 100 may or may not have a user word storage unit. The information analysis apparatus 100 can refer to the user word storage unit of another apparatus through communication via the communication unit 4.

更新部103は、生成日時及び予定日時と現在日時との関係に基づいて、単語データの重み値を更新する。更新部103の具体例が上述の更新部14である。本実施形態では、生成日時及び予定日時からの各経過時間に応じて低下し、かつ、予定日時までの残り時間の減少に応じて上昇するように、更新されれば、重み値の更新手法(算出手法)は制限されない。例えば、ユーザ単語格納部が、同一単語を示す単語データを重複して格納しない場合、更新部103は、単語データの生成回数(取得回数)を考慮することなく、最新の生成日時及び予定日時と現在日時との関係から、単語データの重みを算出すればよい。   The update unit 103 updates the weight value of the word data based on the relationship between the generation date / time and the scheduled date / time and the current date / time. A specific example of the updating unit 103 is the updating unit 14 described above. In the present embodiment, the weight value updating method (if updated so as to decrease according to each elapsed time from the generation date / time and the scheduled date / time and to increase according to a decrease in the remaining time until the scheduled date / time ( The calculation method is not limited. For example, when the user word storage unit does not store redundant word data indicating the same word, the update unit 103 determines the latest generation date / time and scheduled date / time without considering the number of word data generations (number of acquisitions). The weight of word data may be calculated from the relationship with the current date and time.

図15に示されるように、情報分析装置100は、抽出部15、キーワードDB16、決定部17、検索制御部18及び出力処理部19を有していなくてもよい。他の少なくとも一つのコンピュータ(装置)が、抽出部15、キーワードDB16、決定部17、検索制御部18及び出力処理部19を有し、これら各ソフトウェア要素が情報分析装置100により更新される重み値を参照すればよい。   As illustrated in FIG. 15, the information analysis apparatus 100 may not include the extraction unit 15, the keyword DB 16, the determination unit 17, the search control unit 18, and the output processing unit 19. At least one other computer (device) has an extraction unit 15, a keyword DB 16, a determination unit 17, a search control unit 18, and an output processing unit 19, and these software elements are updated by the information analysis device 100. Please refer to.

第三実施形態における情報分析方法は、情報分析装置100のような少なくとも一つのコンピュータにより実行される。本実施形態における情報分析方法は、第一工程、第二工程及び第三工程を含む。これら各工程は、情報分析装置100が有する各ソフトウェア要素の処理内容と同様であるため、各工程の詳細は、適宜省略される。   The information analysis method in the third embodiment is executed by at least one computer such as the information analysis apparatus 100. The information analysis method in this embodiment includes a first step, a second step, and a third step. Since these processes are the same as the processing contents of the software elements included in the information analysis apparatus 100, details of the processes are omitted as appropriate.

第一工程では、コンピュータ(CPU1)は、ユーザの動作に起因して生成された単語データを取得する。
第二工程では、コンピュータ(CPU1)は、第一工程で取得された単語データを、その単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納する。
第三工程では、コンピュータ(CPU1)は、生成日時及び予定日時と現在日時との関係に基づいて、単語データの重み値を更新する。
In the first step, the computer (CPU 1) acquires word data generated due to the user's action.
In the second step, the computer (CPU 1) stores the word data acquired in the first step in the user word storage unit in association with the generation date / time and the scheduled date / time related to the word data.
In the third step, the computer (CPU 1) updates the weight value of the word data based on the relationship between the generation date / time and the scheduled date / time and the current date / time.

〔第三実施形態の作用及び効果〕
第三実施形態では、ユーザの動作に起因して生成された単語データが、その単語データに関する生成日時及び予定日時と関連付けられて格納され、生成日時及び予定日時と現在日時との関係に基づいて、その単語データの重み値が更新される。このように、生成日時及び予定日時と現在日時との関係を考慮することにより、単語データの重み値に、日付が経つにつれて関心や興味は薄れていくという人間の特性及び予定日時が近付くにつれて関心や興味が高まっていくという人間の特性を反映することができる。従って、第三実施形態によれば、各単語に対するユーザの興味や関心の度合いを高精度に管理することができる。
[Operation and effect of the third embodiment]
In the third embodiment, the word data generated due to the user's action is stored in association with the generation date / time and the scheduled date / time regarding the word data, and based on the relationship between the generation date / time and the scheduled date / time and the current date / time. The weight value of the word data is updated. In this way, by taking into account the relationship between the generation date and time, the scheduled date and time, and the current date and time, the human data that interest and interest fades with the weight value of the word data and interest as the date and time approaches. And can reflect the human characteristics of increasing interest. Therefore, according to the third embodiment, the user's interest in each word and the degree of interest can be managed with high accuracy.

なお、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。   In addition, in the some flowchart used by the above-mentioned description, although several process (process) is described in order, the execution order of the process performed by each embodiment is not restrict | limited to the order of the description. In each embodiment, the order of the illustrated steps can be changed within a range that does not hinder the contents. Moreover, each above-mentioned embodiment can be combined in the range in which the content does not conflict.

上述の内容は、以下のようにも特定され得る。但し、上述の内容が以下の記載に限定されるものではない。   The above contents can also be specified as follows. However, the above-mentioned content is not limited to the following description.

1. ユーザの動作に起因して生成された単語データを取得する取得手段と、
前記単語データを、前記単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納する格納処理手段と、
前記生成日時及び前記予定日時と現在日時との関係に基づいて、前記単語データの重み値を更新する更新手段と、
を備える情報分析装置。
2. 前記更新手段は、前記生成日時及び前記予定日時からの各経過時間に応じて低下し、かつ、前記予定日時までの残り時間の減少に応じて上昇する時間変化モデルを用いて、前記単語データの重み値を算出する、
1.に記載の情報分析装置。
3. 前記格納処理手段は、或る単語データを、異なる複数の生成日時と関連付けて前記ユーザ単語格納部に格納し、
前記更新手段は、生成日時又は生成日時及び予定日時のペアを前記時間変化モデルにそれぞれ適用することにより、生成日時毎に重み値をそれぞれ算出し、算出された各重み値を足し合わせることで、前記単語データの重み値を算出する、
2.に記載の情報分析装置。
4. 前記更新手段は、単語データの生成回数の増加に応じて上昇するように、その単語データの重み値を算出する、
1.から3.のいずれか1つに記載の情報分析装置。
5. 単語データ毎の重み値に基づいて、複数の単語データの中から単語データを抽出する抽出手段と、
前記抽出された単語データに基づいて、情報提供先及び検索キーワードを決定する決定手段と、
前記決定された情報提供先から提供される情報に対する前記決定された検索キーワードを用いた検索を要求する検索制御手段と、
前記検索により抽出された情報に対する前記ユーザの評価情報を取得する評価取得手段と、
を更に備え、
前記更新手段は、前記ユーザの評価情報に基づいて、前記抽出された単語データの重み値を更新する、
1.から4.のいずれか1つに記載の情報分析装置。
6. 前記取得手段は、前記ユーザの動作に起因して取得された文字列データを品詞分解することにより、前記単語データを抽出する、
1.から5.のいずれか1つに記載の情報分析装置。
7. 少なくとも一つのコンピュータにより実行される情報分析方法において、
ユーザの動作に起因して生成された単語データを取得し、
前記単語データを、前記単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納し、
前記生成日時及び前記予定日時と現在日時との関係に基づいて、前記単語データの重み値を更新する、
ことを含む情報分析方法。
8. 前記更新は、前記生成日時及び前記予定日時からの各経過時間に応じて低下し、かつ、前記予定日時までの残り時間の減少に応じて上昇する時間変化モデルを用いて、前記単語データの重み値を算出することを含む、
7.に記載の情報分析方法。
9. 或る単語データを、異なる複数の生成日時と関連付けて前記ユーザ単語格納部に格納し、
生成日時又は生成日時及び予定日時のペアを前記時間変化モデルにそれぞれ適用することにより、生成日時毎に重み値をそれぞれ算出し、
前記算出された各重み値を足し合わせることで、前記単語データの重み値を算出する、
ことを更に含む8.に記載の情報分析方法。
10. 単語データの生成回数の増加に応じて上昇するように、その単語データの重み値を算出する、
ことを更に含む7.から9.のいずれか1つに記載の情報分析方法。
11. 単語データ毎の重み値に基づいて、複数の単語データの中から単語データを抽出し、
前記抽出された単語データに基づいて、情報提供先及び検索キーワードを決定し、
前記決定された情報提供先から提供される情報に対する前記決定された検索キーワードを用いた検索を要求し、
前記検索により抽出された情報に対する前記ユーザの評価情報を取得し、
前記ユーザの評価情報に基づいて、前記抽出された単語データの重み値を更新する、
ことを更に含む7.から10.のいずれか1つに記載の情報分析方法。
12. 前記取得は、前記ユーザの動作に起因して取得された文字列データを品詞分解することを含む、
7.から11.のいずれか1つに記載の情報分析方法。
13. 7.から12.のいずれか1つに記載の情報分析方法を少なくとも一つのコンピュータに実行させるプログラム。
1. Acquisition means for acquiring word data generated due to the user's action;
Storage processing means for storing the word data in a user word storage unit in association with a generation date and a scheduled date and time related to the word data;
Updating means for updating the weight value of the word data based on the relationship between the generation date and time and the scheduled date and time and the current date and time;
An information analysis apparatus comprising:
2. The update means uses a time change model that decreases according to each elapsed time from the generation date and time and the scheduled date and time and increases according to a decrease in remaining time until the scheduled date and time. Calculate weight values,
1. Information analysis device described in 1.
3. The storage processing means stores certain word data in the user word storage unit in association with a plurality of different generation dates and times,
The update means calculates the weight value for each generation date and time by applying the generation date and time or a pair of the generation date and the scheduled date and time to the time change model, and adds the calculated weight values together. Calculating a weight value of the word data;
2. Information analysis device described in 1.
4). The updating means calculates a weight value of the word data so as to increase in accordance with an increase in the number of generations of word data;
1. To 3. An information analysis apparatus according to any one of the above.
5). Extraction means for extracting word data from a plurality of word data based on a weight value for each word data;
A determination means for determining an information providing destination and a search keyword based on the extracted word data;
Search control means for requesting a search using the determined search keyword for information provided from the determined information providing destination;
Evaluation acquisition means for acquiring evaluation information of the user for the information extracted by the search;
Further comprising
The update means updates the weight value of the extracted word data based on the user evaluation information.
1. To 4. An information analysis apparatus according to any one of the above.
6). The acquisition means extracts the word data by decomposing part-of-speech of character string data acquired due to the action of the user.
1. To 5. An information analysis apparatus according to any one of the above.
7). In an information analysis method executed by at least one computer,
Get word data generated due to user actions,
The word data is stored in the user word storage unit in association with the generation date and scheduled date and time related to the word data,
Updating the weight value of the word data based on the relationship between the generation date and time and the scheduled date and time and the current date and time;
Information analysis method.
8). The update is performed using a time change model that decreases according to each elapsed time from the generation date and time and the scheduled date and time and increases according to a decrease in remaining time until the scheduled date and time. Including calculating the value,
7). Information analysis method described in 1.
9. Certain word data is associated with a plurality of different generation dates and stored in the user word storage unit,
By applying the generation date / time or the generation date / time and scheduled date / time pair to the time change model, respectively, the weight value is calculated for each generation date / time,
The weight value of the word data is calculated by adding the calculated weight values.
Further includes: Information analysis method described in 1.
10. Calculating the weight value of the word data so as to increase as the number of generations of word data increases,
Further includes: To 9. The information analysis method as described in any one of these.
11. Extract word data from multiple word data based on the weight value for each word data,
Based on the extracted word data, an information providing destination and a search keyword are determined,
Requesting a search using the determined search keyword for information provided from the determined information providing destination;
Obtaining the user's evaluation information for the information extracted by the search;
Updating the weight value of the extracted word data based on the evaluation information of the user;
Further includes: To 10. The information analysis method as described in any one of these.
12 The obtaining includes decomposing part of speech of character string data obtained due to the user's action,
7). To 11. The information analysis method as described in any one of these.
13. 7). To 12. A program that causes at least one computer to execute the information analysis method according to any one of the above.

1 CPU
2 メモリ
7 情報提供サイト(サイト)
8 クライアント装置(クライアント)
10,100 情報分析装置(分析装置)
11,101 取得部
12,102 格納処理部
13 ユーザ単語DB
14,103 更新部
15 抽出部
16 キーワードDB
17 決定部
18 検索制御部
19 出力処理部
21 評価取得部
1 CPU
2 Memory 7 Information provision site (site)
8 Client device (client)
10,100 Information analyzer (analyzer)
11, 101 Acquisition unit 12, 102 Storage processing unit 13 User word DB
14,103 Update unit 15 Extraction unit 16 Keyword DB
17 Determination unit 18 Search control unit 19 Output processing unit 21 Evaluation acquisition unit

Claims (8)

ユーザの動作に起因して生成された単語データを取得する取得手段と、
前記単語データを、前記単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納する格納処理手段と、
前記生成日時及び前記予定日時と現在日時との関係に基づいて、前記単語データの重み値を更新する更新手段と、
を備える情報分析装置。
Acquisition means for acquiring word data generated due to the user's action;
Storage processing means for storing the word data in a user word storage unit in association with a generation date and a scheduled date and time related to the word data;
Updating means for updating the weight value of the word data based on the relationship between the generation date and time and the scheduled date and time and the current date and time;
An information analysis apparatus comprising:
前記更新手段は、前記生成日時及び前記予定日時からの各経過時間に応じて低下し、かつ、前記予定日時までの残り時間の減少に応じて上昇する時間変化モデルを用いて、前記単語データの重み値を算出する、
請求項1に記載の情報分析装置。
The update means uses a time change model that decreases according to each elapsed time from the generation date and time and the scheduled date and time and increases according to a decrease in remaining time until the scheduled date and time. Calculate weight values,
The information analysis apparatus according to claim 1.
前記格納処理手段は、或る単語データを、異なる複数の生成日時と関連付けて前記ユーザ単語格納部に格納し、
前記更新手段は、生成日時又は生成日時及び予定日時のペアを前記時間変化モデルにそれぞれ適用することにより、生成日時毎に重み値をそれぞれ算出し、算出された各重み値を足し合わせることで、前記単語データの重み値を算出する、
請求項2に記載の情報分析装置。
The storage processing means stores certain word data in the user word storage unit in association with a plurality of different generation dates and times,
The update means calculates the weight value for each generation date and time by applying the generation date and time or the generation date and time / schedule date and time pair to the time change model, and adds the calculated weight values. Calculating a weight value of the word data;
The information analysis apparatus according to claim 2.
前記更新手段は、単語データの生成回数の増加に応じて上昇するように、その単語データの重み値を算出する、
請求項1から3のいずれか1項に記載の情報分析装置。
The updating means calculates a weight value of the word data so as to increase in accordance with an increase in the number of generations of word data;
The information analysis apparatus according to any one of claims 1 to 3.
単語データ毎の重み値に基づいて、複数の単語データの中から単語データを抽出する抽出手段と、
前記抽出された単語データに基づいて、情報提供先及び検索キーワードを決定する決定手段と、
前記決定された情報提供先から提供される情報に対する前記決定された検索キーワードを用いた検索を要求する検索制御手段と、
前記検索により抽出された情報に対する前記ユーザの評価情報を取得する評価取得手段と、
を更に備え、
前記更新手段は、前記ユーザの評価情報に基づいて、前記抽出された単語データの重み値を更新する、
請求項1から4のいずれか1項に記載の情報分析装置。
Extraction means for extracting word data from a plurality of word data based on a weight value for each word data;
A determination means for determining an information providing destination and a search keyword based on the extracted word data;
Search control means for requesting a search using the determined search keyword for information provided from the determined information providing destination;
Evaluation acquisition means for acquiring evaluation information of the user for the information extracted by the search;
Further comprising
The update means updates the weight value of the extracted word data based on the user evaluation information.
The information analysis device according to any one of claims 1 to 4.
前記取得手段は、前記ユーザの動作に起因して取得された文字列データを品詞分解することにより、前記単語データを抽出する、
請求項1から5のいずれか1項に記載の情報分析装置。
The acquisition means extracts the word data by decomposing part-of-speech of character string data acquired due to the action of the user.
The information analysis device according to any one of claims 1 to 5.
少なくとも一つのコンピュータにより実行される情報分析方法において、
ユーザの動作に起因して生成された単語データを取得し、
前記単語データを、前記単語データに関する生成日時及び予定日時と関連付けてユーザ単語格納部に格納し、
前記生成日時及び前記予定日時と現在日時との関係に基づいて、前記単語データの重み値を更新する、
ことを含む情報分析方法。
In an information analysis method executed by at least one computer,
Get word data generated due to user actions,
The word data is stored in the user word storage unit in association with the generation date and scheduled date and time related to the word data,
Updating the weight value of the word data based on the relationship between the generation date and time and the scheduled date and time and the current date and time;
Information analysis method.
請求項7に記載の情報分析方法を少なくとも一つのコンピュータに実行させるプログラム。   A program for causing at least one computer to execute the information analysis method according to claim 7.
JP2015199093A 2015-10-07 2015-10-07 Information analysis apparatus and information analysis method Active JP6593873B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015199093A JP6593873B2 (en) 2015-10-07 2015-10-07 Information analysis apparatus and information analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015199093A JP6593873B2 (en) 2015-10-07 2015-10-07 Information analysis apparatus and information analysis method

Publications (2)

Publication Number Publication Date
JP2017072963A JP2017072963A (en) 2017-04-13
JP6593873B2 true JP6593873B2 (en) 2019-10-23

Family

ID=58537188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015199093A Active JP6593873B2 (en) 2015-10-07 2015-10-07 Information analysis apparatus and information analysis method

Country Status (1)

Country Link
JP (1) JP6593873B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7199000B2 (en) * 2018-02-19 2023-01-05 Arithmer株式会社 Dialogue management server, dialogue management method, and program
CN108399253A (en) * 2018-03-06 2018-08-14 王海泉 Conjunctive word method of adjustment and adjustment system
CN108416019A (en) * 2018-03-06 2018-08-17 王海泉 Conjunctive word method of adjustment and adjustment system
CN108399254B (en) * 2018-03-06 2023-02-24 王海泉 Relevant word adjusting method and adjusting system
CN111026721A (en) * 2019-11-12 2020-04-17 上海麦克风文化传媒有限公司 Temperature data storage method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075993A (en) * 1999-09-07 2001-03-23 Fuji Xerox Co Ltd Person recommending device and recording medium
JP4608740B2 (en) * 2000-02-21 2011-01-12 ソニー株式会社 Information processing apparatus and method, and program storage medium
US7849079B2 (en) * 2006-07-31 2010-12-07 Microsoft Corporation Temporal ranking of search results

Also Published As

Publication number Publication date
JP2017072963A (en) 2017-04-13

Similar Documents

Publication Publication Date Title
US11709901B2 (en) Personalized search filter and notification system
TWI424369B (en) Activity based users' interests modeling for determining content relevance
US11681750B2 (en) System and method for providing content to users based on interactions by similar other users
CN105247507B (en) Method, system and storage medium for the influence power score for determining brand
JP6593873B2 (en) Information analysis apparatus and information analysis method
US20150356571A1 (en) Trending Topics Tracking
US10146775B2 (en) Apparatus, system and method for string disambiguation and entity ranking
CN112889043A (en) User-centric browser location
JP6405704B2 (en) Information processing apparatus, information processing method, and program
JP2019113943A (en) Information providing apparatus, information providing method, and program
US20200364765A1 (en) Method for managing item recommendation using degree of association between language unit and usage history
US20220067113A1 (en) Filtering and Scoring of Web Content
US9058328B2 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
US20100306224A1 (en) Online Measurement of User Satisfaction Using Long Duration Clicks
JP5964149B2 (en) Apparatus and program for identifying co-occurrence words
JP6870467B2 (en) Advertising effectiveness estimation device, advertising effectiveness estimation method and advertising effectiveness estimation program
JP5813052B2 (en) Information processing apparatus, method, and program
WO2022095661A1 (en) Update method and apparatus for recommendation model, computer device, and storage medium
JP6640519B2 (en) Information analysis device and information analysis method
JP6576534B1 (en) Information display program, information display method, information display device, and information processing system
KR20200006421A (en) Apparatus of recommending hot places based on events and method thereof
JP7309669B2 (en) Information processing device, information processing method, and information processing program
CN111539208B (en) Sentence processing method and device, electronic device and readable storage medium
JP5832502B2 (en) Information processing apparatus, method, and program
JP5832503B2 (en) Information processing apparatus, method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190919

R150 Certificate of patent or registration of utility model

Ref document number: 6593873

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150