JPH05307569A - Method for storing and retrieving information corresponding to information varied with time - Google Patents

Method for storing and retrieving information corresponding to information varied with time

Info

Publication number
JPH05307569A
JPH05307569A JP4112682A JP11268292A JPH05307569A JP H05307569 A JPH05307569 A JP H05307569A JP 4112682 A JP4112682 A JP 4112682A JP 11268292 A JP11268292 A JP 11268292A JP H05307569 A JPH05307569 A JP H05307569A
Authority
JP
Japan
Prior art keywords
information
time
keyword
occurrence
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4112682A
Other languages
Japanese (ja)
Other versions
JP3168479B2 (en
Inventor
Hideaki Ozawa
英昭 小澤
Toru Nakagawa
透 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11268292A priority Critical patent/JP3168479B2/en
Publication of JPH05307569A publication Critical patent/JPH05307569A/en
Application granted granted Critical
Publication of JP3168479B2 publication Critical patent/JP3168479B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To provide information, which is most suitable for the time period requested by a user, from a data base. CONSTITUTION:This method consists of a relative time calculating part 2 which demarcates a preliminarily designated time range to measure the frequency in occurrence of similar information, a period calculating part 3 which measures and stores the variance of the frequency in occurrence of similar information among plural time ranges, a period calculating part 4 which checks the period of the occurrence of information in accordance with information of the variance of the frequency in occurrence, a data base 1 where information including the period of occurrence of each information is stored, and an information weight setting part 6 which selects information important for the time period from frequencies in occurrence of respective information to the time period given from the user.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、時間変動する情報に対
応する情報の蓄積・検索方法に係り、特に、情報の格
納、検索を目的とするデータベースシステムにおいて、
周期的に重要になる情報と突発的な情報と分離または選
択を行う情報の格納、検索を行う時間変動する情報に対
応する情報の蓄積・検索方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method of storing and retrieving information corresponding to time-varying information, and more particularly, in a database system for storing and retrieving information.
The present invention relates to a method of storing / retrieving information that separates or selects information that becomes periodically important and sudden information, and a method of accumulating / retrieving information that corresponds to information that changes with time.

【0002】[0002]

【従来の技術】情報検索システムでの検索、特に時事情
報を検索する場合には、獲得したい情報の時間的な領域
を制限するために検索条件の一つとして、例えば、“1
990年1月”のように時間範囲の条件を与えることが
できる。図書館のような紙を媒体とするシステムでも製
本された雑誌のバックナンバーから特定の年の雑誌を選
択するような方法により、情報全体に一律な時間区間の
制約を与えて検索を行う方法がある。
2. Description of the Related Art In a search by an information search system, particularly when searching for current affairs information, one of the search conditions is, for example, "1" as a search condition in order to limit a temporal area of information to be acquired.
It is possible to give a time range condition such as “January 990.” Even in a system using a paper medium such as a library, by selecting a magazine of a specific year from back numbers of bound magazines, There is a method of performing search by giving a uniform time interval constraint to the entire information.

【0003】このように、従来は同時に発生した情報を
時間軸に対して同一の価値があるものとして扱う。
Thus, conventionally, information generated simultaneously is treated as having the same value with respect to the time axis.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、時事情
報の価値は例えば、終戦記念日の情報や台風の情報のよ
うに毎年発生する情報や、ハレー彗星のように数十年に
一度の周期で話題になるような、時間に対して周期的に
価値を持つ情報もあれば、情報が発生した時点では有効
であるが、すぐに価値を失う突発的な情報等様々であ
り、全ての情報に対して同じ時間区間で、情報の廃棄や
検索の制限を行うことはできない。ところが従来のシス
テムでは、同時に発生した情報を時間軸に対して同一の
価値があるものとして扱うために、記憶媒体の容量の制
限等から、単純に新しい情報を高速な記憶媒体に保存し
たり、単純に時間が経過した情報を除去してしまい、季
節の話題のような予め情報が必要となる時期を予測でき
る情報を的確に入手しにくいという問題がある。
However, the value of current affairs information is discussed every year, such as information about the days of the end of the war and typhoon information, or every tenths of a year like Comet Halley. If there is information that has periodic value with respect to time, it is effective at the time when the information occurs, but there is various information such as sudden information that loses value immediately. It is not possible to discard information or limit search in the same time period. However, in the conventional system, in order to treat the information generated at the same time as having the same value with respect to the time axis, it is possible to simply store new information in a high-speed storage medium due to the limitation of the capacity of the storage medium, There is a problem that it is difficult to accurately obtain information that can predict the time when information is needed in advance, such as seasonal topics, simply by removing information that has elapsed.

【0005】本発明は上記の点に鑑みなされたもので、
ユーザが要求する時間周期に最適な情報を提供すること
ができる時間変動する情報に対応する情報の蓄積・検索
方法を提供することを目的とする。
The present invention has been made in view of the above points,
It is an object of the present invention to provide a method of accumulating and retrieving information corresponding to time-varying information, which can provide optimum information for a time period requested by a user.

【0006】[0006]

【課題を解決するための手段】本発明は、周期的に現れ
る第1の情報と該第1の情報の特徴を表現する一つ以上
の第2の情報と第1の情報が発生した時刻が格納される
データベースにおいて、類似した第1の情報の発生の回
数を予め指定された時間範囲に区切って計測し、複数の
時間範囲内の類似した第1の情報の発生頻度のばらつき
を計測し、発生頻度のばらつきの情報から第2の情報が
発生する周期を調べ、各第2の情報に対する発生の周期
を含めた第3の情報を記憶し、ユーザから与えられた時
間周期に対する第2の情報の発生の頻度から時間周期に
対して重要度を決定し、重要度の高い第1の情報を選択
する。
According to the present invention, the first information that appears periodically, one or more second information that expresses the characteristics of the first information, and the time at which the first information occurs are In the stored database, the number of occurrences of similar first information is divided into pre-designated time ranges and measured, and the variation in the occurrence frequency of similar first information within a plurality of time ranges is measured. The cycle in which the second information occurs is checked from the information on the variation in the occurrence frequency, the third information including the cycle of the occurrence for each second information is stored, and the second information for the time cycle given by the user is stored. The degree of importance is determined for the time period from the frequency of occurrence of, and the first information having high importance is selected.

【0007】また、本発明は周期的に現れる第1の情報
と第1の情報の特徴を表現する一つ以上の第2の情報と
第1の情報が発生した時刻が格納されるデータベースに
おいて、第2の情報が発生する時間周期を計算するため
に、第1の情報に1つ以上のキーワードを与え、時間周
期に対する各キーワードの発生分布を計測し、予め与え
られる計算式により、キーワードの時間周期に対する発
生の頻度よりキーワードを有する第1の情報の発生する
時間周期を決定する。
Further, according to the present invention, in a database in which first information which appears periodically, one or more pieces of second information expressing characteristics of the first information, and a time when the first information occurs are stored, In order to calculate the time period in which the second information occurs, one or more keywords are given to the first information, the occurrence distribution of each keyword with respect to the time period is measured, and the keyword time is calculated according to a calculation formula given in advance. The time period in which the first information having the keyword occurs is determined from the frequency of occurrence for the period.

【0008】また、本発明は周期的に現れる第1の情報
と第1の情報の特徴を表現する一つ以上の第2の情報と
第1の情報が発生した時刻が格納されるデータベースに
おいて、キーワードの時間周期に対する発生頻度の分布
と予め与えられている時間周期に対する発生頻度の分布
とを比較してキーワードを持つ情報の時間周期に対する
重要度の計算への影響を変化させる。
Further, according to the present invention, in the database in which the first information which appears periodically, one or more second information expressing the characteristics of the first information, and the time when the first information occurs are stored, The distribution of the frequency of occurrence of the keyword with respect to the time period is compared with the distribution of the frequency of occurrence of the keyword given in advance to change the influence on the calculation of the importance of the information having the keyword with respect to the time period.

【0009】さらに、本発明は周期的に現れる第1の情
報と第1の情報の特徴を表現する一つ以上の第2の情報
と第1の情報が発生した時刻が格納されるデータベース
において、キーワードと共に、時間周期の情報と、時間
周期に対する重みの情報を格納するデータベースを備
え、予め与えられた時間範囲と時間周期に対してキーワ
ードの重みの順に並べて予め与えられる閾値と重みのデ
ータを比較し、該当する時間周期と重みを大きい順に順
序付けして並べ、時間範囲と時間周期に対して重要なキ
ーワードを判定する。
Further, according to the present invention, the first information, the one or more second information expressing the characteristics of the first information, and the time at which the first information occurs are stored in a database. It is equipped with a database that stores time period information and weight period information together with keywords, and compares preset threshold values and weight data by arranging in order of keyword weights for a given time range and time period. Then, the corresponding time period and weight are ordered in descending order, and the important keywords for the time range and time period are determined.

【0010】[0010]

【作用】本発明は、まず、1日、1週間、1年等のよう
に予め指定された時間範囲に区切って、類似した情報の
発生頻度を計測し、発生頻度のばらつきの情報から情報
が発生する周期を調べ、各情報と、情報の発生の周期を
含めた情報をデータベースに記憶し、ユーザから与えら
れた時間周期に対する各情報の発生頻度より時間周期に
対して重要な情報を選択する。
According to the present invention, first, the frequency of occurrence of similar information is measured by dividing it into a predetermined time range such as 1 day, 1 week, 1 year, etc. Examine the occurrence cycle, store each information and information including the information occurrence cycle in the database, and select important information for the time cycle from the occurrence frequency of each information for the time cycle given by the user. ..

【0011】また、情報の時間周期を計算するために、
情報にキーワードを与え、時間周期に対する各キーワー
ドの発生の分布を計測し、所定の計算式により、個々の
キーワードの時間周期に対する発生頻度より、そのキー
ワードを持つ情報が発生する時間周期を決定する。
Further, in order to calculate the time period of information,
A keyword is given to information, a distribution of occurrence of each keyword with respect to a time period is measured, and a time period in which information having the keyword occurs is determined from a frequency of occurrence of each keyword according to a predetermined calculation formula.

【0012】また、時間周期に対してキーワードの発生
の頻度がランダムな場合には、類似の計算に対しての影
響を小さくし、キーワードの発生する時間周期の特徴が
顕著なキーワードに対して類似度の計算への影響を大き
くする。
Further, when the frequency of occurrence of the keyword is random with respect to the time period, the influence on similar calculation is reduced, and the feature of the time period in which the keyword occurs is similar to the keyword. Increase the effect on degree calculation.

【0013】さらに、キーワード、時間周期の情報及び
時間周期に対する重みの情報を格納するデータベースを
用いて、特に所定のある時間範囲と、時間周期、例え
ば、3月から4月の時間範囲で1年周期に対して、キー
ワードの重みの順に並べて予め与えられる閾値と重みの
データを比較することにより該当する時間周期と時間範
囲における重要なキーワードを判定できる。
Furthermore, by using a database that stores keywords, time period information, and weighting information for the time period, particularly one year in a predetermined certain time range and time period, for example, the time range from March to April. It is possible to determine an important keyword in a corresponding time period and time range by arranging the weights of the keywords in order of the period and comparing the data of the threshold and the weight given in advance.

【0014】このように、本発明は、情報の発生頻度に
より情報を区別することで、原爆の日のような周期的に
話題になる情報と、突発的な事件のような、一過性の情
報とを分離して扱えることと、8月から9月に周期的に
話題となるキーワードは台風であるといった、任意の時
間範囲と時間周期に対応して重要となるキーワードを識
別することを最も主要な特徴であり、従来の技術では検
索対象の期間の全ての情報は同等に検索されていたが、
これにより、検索対象の時期にあった情報が的確に検索
される。
As described above, according to the present invention, by distinguishing information according to the frequency of occurrence of information, information that becomes a periodic topic such as the day of the atomic bomb and transient information such as a sudden incident. It is most important to be able to handle information separately and to identify important keywords corresponding to an arbitrary time range and time cycle, such as a typhoon that is a topic that periodically becomes a topic from August to September. This is a major feature, and in the conventional technology, all information in the search target period was searched equally.
As a result, the information that was in the search target period is accurately searched.

【0015】[0015]

【実施例】本発明の実施例を図面を用いて説明する。Embodiments of the present invention will be described with reference to the drawings.

【0016】図1は本発明の一実施例の情報蓄積、検索
のシステム構成を示す。
FIG. 1 shows a system configuration of information storage and retrieval according to an embodiment of the present invention.

【0017】本発明のシステムは、時事情報データベー
ス11とキーワードデータベース12からなるデータベ
ース1と、相対時刻演算部2、分布情報格納部3、周期
計算部4、キーワード重み設定部5、情報重み設定部
6、時間範囲決定部7より構成される。
The system of the present invention comprises a database 1 comprising a current affairs information database 11 and a keyword database 12, a relative time calculation unit 2, a distribution information storage unit 3, a period calculation unit 4, a keyword weight setting unit 5, an information weight setting unit. 6 and a time range determining unit 7.

【0018】データベース1は、時事情報を格納するた
めの時事情報データベース11とキーワード及び各キー
ワードの相対時刻に対する重みと、検索用の絶対時刻を
格納するキーワードデータベース12の7つのモジュー
ルより構成される。
The database 1 is composed of a current affairs information database 11 for storing current affairs information, a keyword database 12 for storing keywords and relative time of each keyword, and a keyword database 12 for storing absolute time for retrieval.

【0019】本実施例において、時事情報の構造は一つ
以上の内容に関するデータと、少なくとも一つ以上のキ
ーワード、情報の発生時間を持つ。情報の発生時間は、
例えば各時事情報が新聞に掲載されたり、テレビやラジ
オにより放送された日付を用いることで実現できる。
In the present embodiment, the structure of the current affairs information has data relating to one or more contents, at least one or more keywords, and an information generation time. The time of occurrence of information is
For example, it can be realized by posting each current affairs information in a newspaper or using the date when it is broadcast on TV or radio.

【0020】相対時刻演算部2は、データベース1から
検索された情報と入力された情報の発生時刻をデータベ
ース1が格納する最も古いデータから相対的な時刻に変
換する。
The relative time calculation unit 2 converts the generation time of the information retrieved from the database 1 and the input information from the oldest data stored in the database 1 into a relative time.

【0021】分布情報格納部3は、相対時刻演算部2か
ら出力された相対時刻と各キーワードによる2次元的な
スロットをもち、相対時刻演算部2で決められた時刻と
キーワードから該当するスロットの値をインクリメント
し、保存する。
The distribution information storage unit 3 has a two-dimensional slot based on the relative time output from the relative time operation unit 2 and each keyword, and the slot corresponding to the slot determined from the time and the keyword determined by the relative time operation unit 2. Increment the value and save.

【0022】周期計算部4は、分布情報格納部3に格納
された値の分布から情報の発生する周期を判定する。
The period calculation unit 4 determines the period in which information is generated from the distribution of values stored in the distribution information storage unit 3.

【0023】キーワード重み設定部5は、周期計算部4
からの周期の情報に基づいて、各キーワードの周期に対
する重みを計算する。
The keyword weight setting unit 5 includes a period calculation unit 4
Based on the period information from, the weight for the period of each keyword is calculated.

【0024】情報重み設定部6は、データベース1の検
索時に、キーワード毎に付けられた重みの情報から各時
事情報毎の重みを計算する。
The information weight setting unit 6 calculates the weight for each current affairs information from the weight information given for each keyword when searching the database 1.

【0025】時間範囲決定部7は、検索する対象となる
時間周期の幅を計算する。
The time range determination unit 7 calculates the width of the time period to be searched.

【0026】図1において、実線は、データベース1へ
のデータ登録時の流れを示し、点線は、データベース1
のデータ検索時の流れを示す。
In FIG. 1, the solid line shows the flow of data registration in the database 1, and the dotted line shows the database 1.
The flow at the time of data retrieval of is shown.

【0027】データベース1に投入される各時事情報
は、情報を識別するために、ジャンルや情報の特徴を表
す複数個のキーワードと、その情報が発生した時を示す
発生時間が付けられている。
In order to identify the information, each piece of current affairs information entered into the database 1 is provided with a plurality of keywords representing the genre and characteristics of the information and an occurrence time indicating the time when the information occurred.

【0028】本実施例における分布情報格納部3は、例
えば、時間範囲として、1日から31日、32日から6
1日のように、一月毎に時間範囲を与える。そして、相
対時刻演算部2で与えられた時刻は、365日で除して
剰余を求め、閏年分を換算して3月1日を第1日として
1年の範囲内の相対的な日数に変換し、該当するスロッ
トの値を増加させる。この結果、例えば、年末の宝くじ
の情報は、276日から306日までのスロットの所に
値が集中するので、年末の宝くじの情報は、276日か
ら306日の範囲である12月に重要な情報として判断
できる。
The distribution information storage unit 3 in this embodiment has, for example, 1 to 31 days, 32 days to 6 as a time range.
Give a time range every month, such as a day. Then, the time given by the relative time calculation unit 2 is divided by 365 days to obtain a remainder, and the leap year is converted to March 1st as the first day to obtain a relative number of days within the range of one year. Convert and increase the value of the corresponding slot. As a result, for example, year-end lottery information is concentrated in slots from 276 days to 306 days, so year-end lottery information is important in December, which is in the range of 276 days to 306 days. It can be judged as information.

【0029】図2は、本発明の一実施例の時事情報の登
録時の処理過程のフローチャートを示す。
FIG. 2 shows a flow chart of a process of registering current affairs information according to an embodiment of the present invention.

【0030】ステップ20:データベース1に新しい時
事情報が追加される場合には、時事情報と発生時間を入
力する。
Step 20: When new current affairs information is added to the database 1, current affairs information and occurrence time are input.

【0031】ステップ21:新しい時事情報の持つ各キ
ーワードを用いて、時事情報データベース11を検索
し、該当するキーワードを持つ情報の発生時間を獲得す
る。
Step 21: Using each keyword possessed by the new current affairs information, the current affairs information database 11 is searched and the generation time of the information having the corresponding keyword is acquired.

【0032】ステップ22:時事情報データベース11
より検索された発生時間を相対時刻演算部2によって予
め定められた時刻から相対時間に変換し、キーワードと
ともに、分布情報格納部3に格納する。
Step 22: Current Affairs Information Database 11
The occurrence time searched for is converted from a predetermined time by the relative time calculation unit 2 into a relative time, and stored in the distribution information storage unit 3 together with the keyword.

【0033】ステップ23からステップ26の処理をキ
ーワードの個数分だけ繰り返す。
The processing from step 23 to step 26 is repeated for the number of keywords.

【0034】ステップ23:分布情報格納部3よりキー
ワードを1つ取り出す。
Step 23: One keyword is retrieved from the distribution information storage unit 3.

【0035】ステップ24:周期計算部4において分布
情報格納部3からある一つのキーワードに対する分布の
データからピークの部分の時間範囲を求める。
Step 24: The period calculation unit 4 obtains the time range of the peak portion from the distribution data for one keyword stored in the distribution information storage unit 3.

【0036】ステップ25:キーワード重み設定部5に
おいて、各キーワード毎の分布の値を予め設定した閾値
のパターンと比較する。
Step 25: The keyword weight setting unit 5 compares the distribution value for each keyword with a preset threshold pattern.

【0037】ステップ26:キーワードの時間周期に対
する分布のうち、ピーク値の閾値よりも大きい場合に
は、その値を周期の値及び位相差の値と共に、キーワー
ドデータベース12に格納する。
Step 26: If the distribution of the keyword with respect to the time period is larger than the threshold value of the peak value, the value is stored in the keyword database 12 together with the value of the period and the value of the phase difference.

【0038】キーワードデータベース12に格納される
データの例としては、例えば「台風」というキーワード
があったとすると、上記の一実施例による分布情報格納
部3を用いれば、「台風」と8月に相当する位相差の値
として154日から184日と周期の値として1年に相
当する365日、8月の重みの値と9月についても同様
にして得られた値が格納される。この過程を入力すべき
時事情報(キーワード)が存在する限り繰り返す。
As an example of the data stored in the keyword database 12, if the keyword "typhoon" is used, the distribution information storage unit 3 according to the above-described embodiment can be used for "typhoon" and August. The value of the phase difference is 154 to 184 days, the value of the cycle is 365 days corresponding to one year, the value of the weight of August and the value obtained in the same manner for September are stored. This process is repeated as long as there is current information (keyword) to be input.

【0039】また、この処理過程は、データベース中の
データが全くない場合でも、同様であり、十分なデータ
が格納されると安定する。
This process is the same even when there is no data in the database, and becomes stable when sufficient data is stored.

【0040】本実施例におけるキーワード重み設定部5
での処理として、一月刻みで設定された時間範囲のスロ
ット値から、平均値を求め、平均値2倍未満の時間範囲
に対する重みはゼロ、平均値の2倍以上の値に対する重
みは1であり、3倍以上の値に対する重みは2のよう
に、平均値のn倍以上の値の重みをn−1とする。さら
に、この各時間範囲の重みの値をその時間範囲に対する
スロットの値を掛けて、そのキーワードに対する重みと
する。
The keyword weight setting unit 5 in this embodiment
As the processing in, the average value is calculated from the slot values of the time range set every January, the weight for the time range less than twice the average value is zero, and the weight for the value more than twice the average value is 1. There is a weight of 3 or more times, and a weight of n or more times the average value is n-1. Further, the value of the weight of each time range is multiplied by the value of the slot for that time range to obtain the weight for that keyword.

【0041】この結果、例えば台風というキーワード
は、3月や4月には、1回程度しか現れないが、6月過
ぎからしばしば登場するようになり、8月には25回
位、9月には40回位現れる。よって平均すると、月に
8回程度登場するため、8月は重みが25/8*25で
75となり、9月は200となる。
As a result, for example, the keyword typhoon appears only once in March or April, but it often appears after June, about 25 times in August and about September. Appears about 40 times. Therefore, on average, they appear about eight times a month, so the weight in August is 25/8 * 25, which is 75, and in September, it is 200.

【0042】これに対して株価というキーワードは、月
単位でみると、1年を通しておおよそ、40から60程
度で登場するため、全ての月で重みが0になり、時間周
期に依存した情報ではないと判断される。
On the other hand, the keyword stock price appears in about 40 to 60 throughout the year when viewed on a monthly basis, so that the weight becomes 0 in all months and it is not information depending on the time period. Is judged.

【0043】本実施例で示した時事情報データベース1
1を利用するユーザがある季節によく起こる時事情報を
検索したい場合、例えば、ユーザは8月、1ヵ月、1年
周期などの検索したい時期や日付と時間範囲と時間周期
の実施例のシステムに投入する。
Current affairs information database 1 shown in this embodiment
When a user who uses 1 wants to retrieve current affairs information that frequently occurs in a certain season, for example, the user may select the time, date, time range, and time period of the system such as 8 months, 1 month, 1 year cycle, etc. throw into.

【0044】図3は本発明の一実施例のデータベースを
利用するユーザからの検索要求に対する処理の過程を示
すフローチャートである。図1においては、点線で示さ
れる流れを参照されたい。
FIG. 3 is a flow chart showing a process of a search request from a user who uses the database according to the embodiment of the present invention. Please refer to the flow indicated by the dotted line in FIG.

【0045】ステップ30:時期、時間範囲、時間周期
が入力される。
Step 30: Timing, time range and time period are input.

【0046】ステップ31:時間範囲決定部7は、ステ
ップ30で与えられた日時と時間範囲から、例えば、1
年周期という条件から350日から380日間という検
索すべき時間周期の幅に変換する。これは、入力された
時間周期を日を単位とした周期に変換している。
Step 31: The time range determining unit 7 determines, for example, 1 from the date and time range given in step 30.
From the condition of annual cycle, it is converted into the width of the time cycle to be searched from 350 days to 380 days. This converts the input time cycle into a cycle with the unit of day.

【0047】ステップ32:ステップ31で決定した時
間の幅と8月、1ヵ月間を表す、154日から184日
という時間範囲を条件としてキーワードデーベース12
を検索し、該当するキーワードと、キーワードの重みを
獲得する。これらは、一年周期で8月に重要となるキー
ワードなので、以下では8月のキーワードと呼ぶ。
Step 32: The keyword date base 12 is conditioned on the time range determined in step 31 and the time range from 154 days to 184 days, which represents 8 months and 1 month.
To find the relevant keyword and the weight of the keyword. These are important keywords for August in the one-year cycle, and are hereinafter referred to as August keywords.

【0048】ステップ33:キーワードデータベース1
2を検索した結果からキーワードを1つ取り出し、以下
の処理がすべての検索結果の処理が終了するまで、繰り
返す。
Step 33: Keyword database 1
One keyword is extracted from the search result of 2, and the following processing is repeated until the processing of all search results is completed.

【0049】ステップ34:キーワードデータベース1
2から検索された個々の情報が持つキーワードを抽出
し、そのキーワードを用いて、時事情報データベース1
1を検索する。
Step 34: Keyword database 1
The keyword of each information retrieved from 2 is extracted, and the keyword is used to create the current affairs information database 1
Search for 1.

【0050】ステップ35:情報重み設定部6におい
て、例えば、ステップ34で抽出された時事情報のキー
ワードと、ステップ32で得られた8月のキーワードを
比較し、一致するキーワードについては、キーワード重
みを付け、一致しないキーワードについては0として、
個々の時事情報の8月に対する重みの値の総和を求め
る。
Step 35: In the information weight setting unit 6, for example, the keyword of the current affairs information extracted in Step 34 is compared with the keyword of August obtained in Step 32, and the keyword weight is attached to the matching keyword. Add 0 for keywords that do not match,
The sum of the weight values for each current affairs information for August is calculated.

【0051】ステップ36:すべての検索結果の処理を
終了したら、情報重み設定部6で作成された重みの大き
い順に順序付けして並べ、ユーザに提供する。
Step 36: When all the search results have been processed, they are ordered and arranged in descending order of weight created by the information weight setting unit 6 and provided to the user.

【0052】図4は本発明の一実施例におけるキーワー
ドデータベースのデータ構造を示す。キーワードデータ
ベース12の構造としては、1つのキーワードに対し
て、少なくとも1つ以上の周期情報からなる。周期情報
は、本発明の方法によって得られた1年等の時間周期の
情報と9月などの位相差の情報、時間周期に対する重み
の情報から構成される。同図の例では、「台風」という
キーワードは、350日〜380日の周期で、3月1日
から見て154日から184日の位相(8月に相当)を
持ち、重みが75の周期情報と、350日〜380日周
期で、3月1日から見て185日から214日の位相
(9月に相当)を持ち、重みが200の周期情報から構
成される。
FIG. 4 shows the data structure of the keyword database in one embodiment of the present invention. The structure of the keyword database 12 includes at least one or more period information for one keyword. The period information is composed of time period information such as one year obtained by the method of the present invention, phase difference information such as September, and weight information for the time period. In the example of the figure, the keyword “typhoon” has a cycle of 350 to 380 days, has a phase of 154 to 184 days (corresponding to August) from March 1, and has a weight of 75. Information and a cycle of 350 days to 380 days, having a phase of 185 days to 214 days (corresponding to September) as viewed from March 1st, and having a weight of 200.

【0053】次に本発明の他の実施例について説明す
る。
Next, another embodiment of the present invention will be described.

【0054】分布情報格納部3は時間範囲のスロットを
データベース1中に格納している情報のうち最も古い情
報の時刻から、一日刻みの相対的な時刻の範囲として表
現し、周期計算部4は分布情報格納部3で得られた分布
の自己相関関数を求め、時間遅れを計算することによ
り、月単位のような固定的な時間範囲ではなく、任意の
日数を持つ周期を求めることができる。
The distribution information storage unit 3 expresses the slots in the time range as a relative time range in increments of one day from the time of the oldest information stored in the database 1, and the period calculation unit 4 By calculating the autocorrelation function of the distribution obtained in the distribution information storage unit 3 and calculating the time delay, it is possible to calculate the cycle having an arbitrary number of days instead of the fixed time range such as the monthly unit. ..

【0055】上記の他の実施例では、自己相関関数を使
用したが、任意の周期を求めるために、フーリエ変換を
用いることも可能であり、パワースペクトルを求めるこ
とで、情報が発生する時間周期と発生頻度を計算でき
る。さらに、フーリエ変換を用いることで、周期の情報
と共に、位相差の情報を得ることができる。
In the other embodiments described above, the autocorrelation function is used, but it is also possible to use the Fourier transform to obtain an arbitrary period, and by obtaining the power spectrum, the time period in which information is generated. And the frequency of occurrence can be calculated. Furthermore, by using the Fourier transform, it is possible to obtain information on the phase difference as well as information on the period.

【0056】次に、キーワード重み設定部5の他の実施
例について説明する。各時間範囲のスロットの値の対数
関数log2を求め、予め与えた閾値以上の場合には、対数
関数log2の値を重みとし、閾値以下の場合には重みを0
とする(但し、スロットの値が0の場合にはも、重みを
0とする)。この結果、重みの大きい領域ではlog 関数
によって重みの大きさが均一化されるために、ある特定
のキーワードの値による影響が大きくなり過ぎることが
なくなる。
Next, another embodiment of the keyword weight setting unit 5 will be described. The logarithmic function log 2 of the value of the slot in each time range is obtained. When the logarithmic function log 2 is equal to or more than a threshold value given in advance, the value of the logarithmic function log 2 is used as a weight.
(However, even if the value of the slot is 0, the weight is 0). As a result, since the weights of the weights are made uniform by the log function in a region having a large weight, the influence of the value of a certain specific keyword does not become too large.

【0057】さらにキーワード重み設定部5の他の実施
例として、フーリエ変換を用いてキーワードの発生頻度
を周波数領域に変換した場合において、パワースペクト
ルが予め与えられた閾値よりも大きい場合には、その値
をキーワードの重みとし、閾値よりも小さい場合には0
とする。そして、位相差の情報から相対的な日数として
時間周期の情報を獲得する。
As another embodiment of the keyword weight setting unit 5, when the frequency of occurrence of a keyword is transformed into the frequency domain by using Fourier transform, if the power spectrum is larger than a threshold value given in advance, The value is used as the weight of the keyword, and 0 when the value is smaller than the threshold value.
And Then, the information on the time period is acquired as the relative number of days from the information on the phase difference.

【0058】次に、データベース検索時の他の実施例に
ついて説明する。先に示した図3のステップ32におい
て検索したキーワードを該当する時間範囲の重みの情報
を用いて値の大きい方から順序付けし、予め与えられて
いる閾値よりも大きな重みを持つ情報をユーザに提供す
ることにより、ある時間範囲における重要なキーワード
を得ることも可能である。
Next, another embodiment for searching the database will be described. The keywords searched in step 32 of FIG. 3 described above are ordered from the one with the larger value using the weight information of the corresponding time range, and the user is provided with information having a weight greater than a preset threshold value. By doing so, it is possible to obtain important keywords in a certain time range.

【0059】例えば、図3のステップ32におけるデー
タベースの検索によって、8月のキーワードとして「台
風」(重みの値75)、「夏」(重みの値100)、
「水不足」(重みの値50)、「ビール」(重みの値3
0)等が得られたとすると、これらのキーワードに付け
られている重みのデータの順に並べ、例えば、閾値とし
て50を与えたならば、「夏」、「台風」、「水不足」
のように8月に重要なキーワードを選択して得ることが
できる。
For example, by searching the database in step 32 in FIG. 3, "typhoon" (weight value 75), "summer" (weight value 100),
"Water shortage" (weight value 50), "Beer" (weight value 3)
0) etc. are obtained, they are arranged in the order of the weight data attached to these keywords. For example, if 50 is given as the threshold value, “summer”, “typhoon”, “water shortage”
It can be obtained by selecting important keywords in August.

【0060】ユーザが与える時間周期の値の範囲は、一
実施例では最小は1日、最大で時事情報データベース1
1に格納している最も古い情報の発生日時から現在まで
の日数である。周期の指定の単位は、日数だけでなく一
週間、一年間などの指定も可能である。この場合、指定
された周期を標準的な日数の周期に変換し、予め指定さ
れた幅を持たすことで達成できる。例えば、一年周期で
あれば、標準的な365日に変換し、さらに、前後例え
ば5%の幅を持たせ、347日から383日として、検
索を行う。一実施例での時間周期の単位は一日である
が、時事情報の発生時間のサンプリングを変えること
で、任意の値にすることができる。
The range of the value of the time period given by the user is, in one embodiment, a minimum of one day and a maximum of the current affairs information database 1.
It is the number of days from the date and time of occurrence of the oldest information stored in 1 to the present. The unit for designating the cycle can be not only the number of days but also one week or one year. In this case, it can be achieved by converting the specified cycle into a cycle of standard days and having a width specified in advance. For example, if it is a one-year cycle, it is converted to a standard 365 days, and further, for example, with a width of 5% before and after, it is searched from 347 days to 383 days. Although the unit of the time period in one embodiment is one day, it can be set to an arbitrary value by changing the sampling of the occurrence time of the current affair information.

【0061】上記のように、本発明による方法は、任意
の時間範囲と時間周期に対応して重量なキーワードを識
別することができる。このキーワードでデータベースに
蓄積されている情報より適正な情報を得ることができ
る。
As described above, the method according to the present invention can identify heavy keywords corresponding to arbitrary time ranges and time periods. With this keyword, more appropriate information can be obtained from the information stored in the database.

【0062】[0062]

【発明の効果】上述のように本発明によれば、例えば、
株価の情報や、交通事故の情報のような、季節や時間の
周期に無関係に発生する一過性の情報は、時間周期に対
する重みが小さくなる。これに対して、お祭りなどの情
報は情報発生の時点から時間が経つにつれて情報の重み
は小さくなるが、毎年繰り返して関連する情報が発生す
るために、一年周期の時間範囲で見ると、他の情報に比
べて情報の重みが大きくなり、周期的に重要な情報と日
常的に発生する情報や突発的な情報を分離することが可
能となる。
As described above, according to the present invention, for example,
Temporary information that occurs regardless of the season or time cycle, such as stock price information or traffic accident information, has a smaller weight for the time cycle. On the other hand, information such as festivals becomes less weighted as time passes from the time information is generated, but since related information is repeatedly generated every year, when viewed in the time range of one year cycle, The weight of the information becomes larger than that of the information described above, and it becomes possible to separate the periodically important information from the information that occurs daily or the unexpected information.

【0063】その結果、日々キーワード付きの情報を本
発明の方法を用いて、データベースに登録していくこと
により、ユーザが要求する時間周期に最適な情報を提供
することができる。
As a result, it is possible to provide the optimum information for the time period requested by the user by registering the information with the keyword in the database every day by using the method of the present invention.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の情報蓄積・検索方法のシス
テム構成図である。
FIG. 1 is a system configuration diagram of an information storage / retrieval method according to an embodiment of the present invention.

【図2】本発明の一実施例の時事情報の登録時の処理過
程のフローチャートである。
FIG. 2 is a flowchart of a process of registering current affairs information according to an embodiment of the present invention.

【図3】本発明の一実施例のデータベースを利用するユ
ーザからの検索要求に対する処理の過程を示すフローチ
ャートである。
FIG. 3 is a flowchart showing a process of processing a search request from a user who uses a database according to an embodiment of the present invention.

【図4】本発明の一実施例におけるキーワードデータベ
ースのデータ構造を示す図である。
FIG. 4 is a diagram showing a data structure of a keyword database according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 データベース 2 相対時刻演算部 3 分布情報格納部 4 周期計算部 5 キーワード重み設定部 6 情報重み設定部 7 時間範囲決定部 11 時事情報データベース 12 キーワードデータベース 1 database 2 relative time calculation unit 3 distribution information storage unit 4 cycle calculation unit 5 keyword weight setting unit 6 information weight setting unit 7 time range determining unit 11 current affairs information database 12 keyword database

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 周期的に現れる第1の情報と該第1の情
報の特徴を表現する一つ以上の第2の情報と該第1の情
報が発生した時刻が格納されるデータベースにおいて、 類似した第1の情報の発生の回数を予め指定された時間
範囲に区切って計測し、 複数の該時間範囲内の類似した第1の情報の発生頻度の
ばらつきを計測し、 該発生頻度のばらつきの情報から第2の情報が発生する
周期を調べ、 各第2の情報に対する発生の周期を含めた第3の情報を
記憶し、 ユーザから与えられた時間周期に対する第2の情報の発
生の頻度から時間周期に対して重要度を決定し、重要度
の高い第1の情報を選択することを特徴とする時間変動
する情報に対応する情報の蓄積及び検索方法。
1. A database in which first information that appears periodically, one or more pieces of second information that represent characteristics of the first information, and a time when the first information occurs are stored in a database. The number of occurrences of the generated first information is divided into pre-designated time ranges and measured, and the variation in the occurrence frequency of similar first information within a plurality of the time ranges is measured. The cycle in which the second information occurs is checked from the information, the third information including the cycle of occurrence for each second information is stored, and the frequency of occurrence of the second information for the time cycle given by the user is calculated. A method of accumulating and retrieving information corresponding to time-varying information, characterized in that importance is determined for a time period and first information having high importance is selected.
【請求項2】 周期的に現れる第1の情報と該第1の情
報の特徴を表現する一つ以上の第2の情報と該第1の情
報が発生した時刻が格納されるデータベースにおいて、 前記第2の情報が発生する時間周期を計算するために、
前記第1の情報に1つ以上のキーワードを与え、時間周
期に対する各キーワードの発生分布を計測し、 予め与えられる計算式により、該キーワードの時間周期
に対する発生の頻度より該キーワードを有する第1の情
報の発生する時間周期を決定することを特徴とする請求
項1記載の時間変動する情報に対応する情報の蓄積及び
検索方法。
2. A database in which first information that appears periodically, one or more second information that expresses characteristics of the first information, and a time when the first information occurs are stored. In order to calculate the time period in which the second information occurs,
One or more keywords are given to the first information, the distribution of occurrence of each keyword with respect to the time period is measured, and a first formula that has the keyword from the frequency of occurrence of the keyword with respect to the time period is calculated according to a predetermined calculation formula. The method for accumulating and retrieving information corresponding to time-varying information according to claim 1, wherein a time period in which the information is generated is determined.
【請求項3】 周期的に現れる第1の情報と該第1の情
報の特徴を表現する一つ以上の第2の情報と該第1の情
報が発生した時刻が格納されるデータベースにおいて、 前記キーワードの時間周期に対する発生頻度の分布と予
め与えられている時間周期に対する発生頻度の分布とを
比較して前記キーワードを持つ情報の時間周期に対する
重要度の計算への影響を変化させることを特徴とする請
求項1記載の時間変動する情報に対応する情報の蓄積及
び検索方法。
3. A database in which first information that appears periodically, one or more second information that expresses characteristics of the first information, and a time when the first information occurs are stored. A feature is that the distribution of the frequency of occurrence of the keyword with respect to the time period and the distribution of the frequency of occurrence with respect to the time period given in advance are compared to change the influence on the calculation of the importance of the information having the keyword to the time period A method of storing and retrieving information corresponding to time-varying information according to claim 1.
【請求項4】 周期的に現れる第1の情報と該第1の情
報の特徴を表現する一つ以上の第2の情報と該第1の情
報が発生した時刻が格納されるデータベースにおいて、 前記キーワードと共に、時間周期の情報と、時間周期に
対する重みの情報を格納するデータベースを備え、 予め与えられた時間範囲と時間周期に対してキーワード
の重みの順に並べて予め与えられる閾値と重みのデータ
を比較し、 該当する時間周期と重みを大きい順に順序付けして並
べ、 該時間範囲と時間周期に対して重要なキーワードを判定
することを特徴とする請求項1記載の時間変動する情報
に対応する情報の検索方法。
4. A database in which first information that appears periodically, one or more pieces of second information that express the characteristics of the first information, and a time when the first information occurs are stored. It has a database that stores time period information and weight period information together with keywords, and compares the given threshold value and weight data by arranging in order of keyword weights for a given time range and time period. 2. The information corresponding to the time-varying information according to claim 1, wherein the corresponding time periods and weights are arranged in order from the largest and the important keywords for the time range and time period are determined. retrieval method.
JP11268292A 1992-05-01 1992-05-01 Method of storing and retrieving information corresponding to time-varying information Expired - Lifetime JP3168479B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11268292A JP3168479B2 (en) 1992-05-01 1992-05-01 Method of storing and retrieving information corresponding to time-varying information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11268292A JP3168479B2 (en) 1992-05-01 1992-05-01 Method of storing and retrieving information corresponding to time-varying information

Publications (2)

Publication Number Publication Date
JPH05307569A true JPH05307569A (en) 1993-11-19
JP3168479B2 JP3168479B2 (en) 2001-05-21

Family

ID=14592841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11268292A Expired - Lifetime JP3168479B2 (en) 1992-05-01 1992-05-01 Method of storing and retrieving information corresponding to time-varying information

Country Status (1)

Country Link
JP (1) JP3168479B2 (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (en) * 1994-05-31 1995-12-12 Fujitsu Ltd Retrieval method for utilizing timewise change of word usage pattern and information retrieval device
JPH10320419A (en) * 1997-05-22 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> Device and method for relating information
JPH11143796A (en) * 1997-11-10 1999-05-28 Nippon Telegr & Teleph Corp <Ntt> Mailing list service system
JP2000215204A (en) * 1999-01-22 2000-08-04 Nec Corp System for retrieving event corresponding to customer
JP2002334106A (en) * 2001-05-11 2002-11-22 Fujitsu Ltd Device, method, program for extracting topic and recording medium to record the same program
US7099867B2 (en) * 2000-07-28 2006-08-29 Fujitsu Limited Dynamic determination of keyword and degree of importance thereof in system for transmitting and receiving messages
JP2009086773A (en) * 2007-09-27 2009-04-23 Nomura Research Institute Ltd Retrieval service device
WO2009113266A1 (en) * 2008-03-10 2009-09-17 パナソニック株式会社 Content search device and content search method
JP2011086152A (en) * 2009-10-16 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for extracting time expression
JP2012037962A (en) * 2010-08-04 2012-02-23 Mitsubishi Electric Information Systems Corp Document retrieval system, document retrieval method and document retrieval program
JP5223018B1 (en) * 2012-05-30 2013-06-26 楽天株式会社 Information processing apparatus, information processing method, information processing program, and recording medium
JP2013206434A (en) * 2012-03-29 2013-10-07 Nippon Telegr & Teleph Corp <Ntt> Time condition presentation method and device and program
CN111046141A (en) * 2019-12-03 2020-04-21 新华智云科技有限公司 Text library keyword refining method based on historical time characteristics

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325832A (en) * 1994-05-31 1995-12-12 Fujitsu Ltd Retrieval method for utilizing timewise change of word usage pattern and information retrieval device
JPH10320419A (en) * 1997-05-22 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> Device and method for relating information
JPH11143796A (en) * 1997-11-10 1999-05-28 Nippon Telegr & Teleph Corp <Ntt> Mailing list service system
JP2000215204A (en) * 1999-01-22 2000-08-04 Nec Corp System for retrieving event corresponding to customer
US7099867B2 (en) * 2000-07-28 2006-08-29 Fujitsu Limited Dynamic determination of keyword and degree of importance thereof in system for transmitting and receiving messages
JP4489994B2 (en) * 2001-05-11 2010-06-23 富士通株式会社 Topic extraction apparatus, method, program, and recording medium for recording the program
JP2002334106A (en) * 2001-05-11 2002-11-22 Fujitsu Ltd Device, method, program for extracting topic and recording medium to record the same program
JP2009086773A (en) * 2007-09-27 2009-04-23 Nomura Research Institute Ltd Retrieval service device
WO2009113266A1 (en) * 2008-03-10 2009-09-17 パナソニック株式会社 Content search device and content search method
US8073851B2 (en) 2008-03-10 2011-12-06 Panasonic Corporation Content searching device and content searching method
JP2011086152A (en) * 2009-10-16 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for extracting time expression
JP2012037962A (en) * 2010-08-04 2012-02-23 Mitsubishi Electric Information Systems Corp Document retrieval system, document retrieval method and document retrieval program
JP2013206434A (en) * 2012-03-29 2013-10-07 Nippon Telegr & Teleph Corp <Ntt> Time condition presentation method and device and program
JP5223018B1 (en) * 2012-05-30 2013-06-26 楽天株式会社 Information processing apparatus, information processing method, information processing program, and recording medium
US9208503B2 (en) 2012-05-30 2015-12-08 Rakuten, Inc. Information processing apparatus, information processing method, information processing program, and recording medium
CN111046141A (en) * 2019-12-03 2020-04-21 新华智云科技有限公司 Text library keyword refining method based on historical time characteristics
CN111046141B (en) * 2019-12-03 2023-07-18 新华智云科技有限公司 Text library keyword refining method based on historical time characteristics

Also Published As

Publication number Publication date
JP3168479B2 (en) 2001-05-21

Similar Documents

Publication Publication Date Title
US6473753B1 (en) Method and system for calculating term-document importance
JPH05307569A (en) Method for storing and retrieving information corresponding to information varied with time
US6549897B1 (en) Method and system for calculating phrase-document importance
US7111000B2 (en) Retrieval of structured documents
US6728701B1 (en) Method and apparatus for database retrieval utilizing vector optimization
US7783629B2 (en) Training a ranking component
KR100304335B1 (en) Keyword Extraction System and Document Retrieval System Using It
JP3547069B2 (en) Information associating apparatus and method
US6804662B1 (en) Method and apparatus for query and analysis
US8290975B2 (en) Graph-based keyword expansion
CN105468651B (en) Relational database data query method and system
JP3767909B2 (en) Method for storing document processing information about items in a limited text source
Anh et al. Simplified similarity scoring using term ranks
Cavnar N-gram-based text filtering for TREC-2
Salton et al. Term relevance weights in on-line information retrieval
US6718323B2 (en) Automatic method for quantifying the relevance of intra-document search results
JP3157257B2 (en) Information importance determination method
Sanderson Reuters test collection
Hawking et al. Scaling up the TREC Collection
Sanderson et al. Report on the Glasgow IR group (glair4) submission
Can et al. First large-scale information retrieval experiments on Turkish texts
Lap et al. A study on n-gram indexing of musical features
Tague A Bayesian approach to interactive retrieval
Aktug et al. Signature file hashing using term occurrence and query frequencies
Brauen et al. XI. Document Indexing Based on Relevance Feedback

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090316

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090316

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 12