JP2012164063A - Information retrieval device, information retrieval method and information retrieval program - Google Patents

Information retrieval device, information retrieval method and information retrieval program Download PDF

Info

Publication number
JP2012164063A
JP2012164063A JP2011022790A JP2011022790A JP2012164063A JP 2012164063 A JP2012164063 A JP 2012164063A JP 2011022790 A JP2011022790 A JP 2011022790A JP 2011022790 A JP2011022790 A JP 2011022790A JP 2012164063 A JP2012164063 A JP 2012164063A
Authority
JP
Japan
Prior art keywords
numerical data
data
information retrieval
storage means
means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011022790A
Other languages
Japanese (ja)
Other versions
JP5499369B2 (en
Inventor
Chao Gao
Takeshi Inoue
Hiroyuki Morikawa
Hiroshi Sato
Junichiro Takagi
Takahiro Yamazaki
武 井上
浩史 佐藤
敬広 山崎
博之 森川
超 高
潤一郎 高木
Original Assignee
Nippon Telegr & Teleph Corp <Ntt>
Univ Of Tokyo
国立大学法人 東京大学
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegr & Teleph Corp <Ntt>, Univ Of Tokyo, 国立大学法人 東京大学, 日本電信電話株式会社 filed Critical Nippon Telegr & Teleph Corp <Ntt>
Priority to JP2011022790A priority Critical patent/JP5499369B2/en
Publication of JP2012164063A publication Critical patent/JP2012164063A/en
Application granted granted Critical
Publication of JP5499369B2 publication Critical patent/JP5499369B2/en
Application status is Active legal-status Critical
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an information retrieval device capable of substantially reducing retrieval time and performing real-time retrieval.SOLUTION: An information retrieval device comprises: storage means for storing retrieval target numeric data; means for extracting a part of all pieces of numeric data from the storage means; means for detecting one piece of numeric data that mostly meets first predetermined conditions from the extracted pieces of numeric data; means for extracting a part of pieces of numeric data in a vicinity region of the detected numeric data from the storage means; means for detecting one piece of numeric data that mostly meets the first predetermined conditions from the extracted pieces of numeric data of the vicinity region; and means for repeating detection processing of setting a smaller area inside of the vicinity area as a new vicinity area until the new vicinity area meets second predetermined conditions.

Description

本発明は、データベースに蓄積された情報を効率よく検索する情報検索装置、情報検索方法及び情報検索プログラムに関する。 The present invention relates to an information retrieval apparatus for searching efficiently information stored in the database, an information retrieval method, and information retrieval program.

近年の計算機の進歩により、数値の検査・比較演算は非常に高速化されている。 Recent advances in computer, inspection and comparison operation figures have been very high speed. 一方、ハードディスクなどの記憶装置から情報を読み取る読み取り速度は、演算速度に比べると大きく劣るため、データベースシステムにおいては、大量のデータを読み取ることが必須である処理を実行するためには、多大な処理時間を必要とするのが現状である。 On the other hand, the reading speed for reading information from a storage device such as a hard disk, for greatly inferior compared to the operation speed, in a database system, in order to perform the process to read large amounts of data is essential, considerable processing at present, it requires the time. 記憶装置から読み取るデータ量を削減することができれば、大量のデータを読み取る必要があるデータベースシステムにおいて、データ検索の処理時間を短縮することができる。 If it is possible to reduce the amount of data read from the storage device, in a database system is required to read large amounts of data, it is possible to shorten the processing time for data retrieval.

しかしながら、従来手法には以下に述べる問題がある。 However, the conventional method has the following problems. 例えば、図8に示すような周波数と信号強度の数値データを対象とした無線通信におけるホワイトスペース検索においては、空き周波数帯を再利用するために、信号レベルが閾値以下である周波数帯を検索する必要がある。 For example, in the white space search in a wireless communication intended for the numerical data of the frequency and the signal intensity as shown in FIG. 8, in order to reuse the available frequency band, searches for the frequency band signal level is below a threshold There is a need. このような連続した数値列から閾値以下(あるいは以上)の領域を検索する際に、最も単純な方法として、図9に示すように、条件を満たす領域を発見するまで、領域をスライドさせながら繰り返し検査を行う方法がある。 When searching an area of ​​such a threshold value or less from a continuous numerical sequence (or higher), as the simplest way, as shown in FIG. 9, until you find a satisfying area repeatedly while sliding the region there is a method to perform the inspection. この方法では、最悪の場合、すべての数値データを記憶装置から読み取らなければならないため、検索時間は長くなるという問題がある。 In this way, in the worst case, because it must read all the numerical data from the storage device, there is a problem that the search time becomes long. このような問題を解決するために、事前にデータ変換を行っておくことによって、検索時間を短縮する方法がいくつか提案されている(例えば、非特許文献1、2、3参照)。 To solve this problem, by keeping performing advance data conversion have been proposed several methods to reduce the search time (for example, see Non-Patent Documents 1, 2 and 3).

しかしながら、特許文献1〜3に記載の検索方法にあっては、予め前処理を実行しておる必要があるため、生成されたデータを即時に検索する必要がある場合には適用できないという問題がある。 However, in the search method described in Patent Documents 1 to 3, it is necessary to Nikki by executing a pre-processing, it can not be applied when it is necessary to search the generated data immediately is there.

本発明は、このような事情に鑑みてなされたもので、検索時間を大幅に短縮することができ、リアルタイムの検索を行うことができる情報検索装置、情報検索方法及び情報検索プログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, the search time can be greatly shortened, the information retrieval apparatus capable of performing real-time search, to provide an information retrieval method, and information retrieval program With the goal.

本発明は、検索対象の数値データが記憶された記憶手段と、前記記憶手段から全数値データの一部を抽出する手段と、前記抽出した数値データから最も第1の所定条件を満たす数値データを1つ検出する手段と、前記記憶手段から、前記検出した数値データの近傍領域の数値データの一部を抽出する手段と、前記近傍領域の数値データから最も前記第1の所定条件を満たす数値データを1つ検出する手段と、前記近傍領域より狭い領域を近傍領域に設定し、前記近傍領域が第2の所定条件を満たすまで検出処理を繰り返す手段とを備えたことを特徴とする。 The present invention includes a storage unit for numeric data to be searched is stored, means for extracting a portion of the total numerical data from said storage means, the most first predetermined condition is satisfied numerical data from the numerical data the extracted one detect means, from said storage means, means for extracting a portion of the numerical data of the neighborhood area of ​​the numerical data the detected, most said first predetermined condition is satisfied numerical data from the numerical data of the neighboring region means for detecting one, set narrower than the region near the region in the vicinity of the region, wherein the region near and means to repeat the detection process to a second predetermined condition is satisfied.

本発明は、前記記憶手段から前記数値データを読み出す際に、近傍の複数の数値データに基づき前記数値データの異常値を取り除いて検出処理を行うことを特徴とする。 The present invention, when reading the numerical data from the storage unit, and performs a detection process to remove the abnormal value of the numeric data based on a plurality of numerical data of the neighborhood.

本発明は、前記数値データは、連続性を持って変化する特性を有していることを特徴とする。 The present invention, the numerical data is characterized by having a characteristic that varies with continuity.

本発明は、検索対象の数値データが記憶された記憶手段と、演算部とを備えた情報検索装置における情報検索方法であって、前記演算部が、前記記憶手段から全数値データの一部を抽出するステップと、前記抽出した数値データから最も第1の所定条件を満たす数値データを1つ検出するステップと、前記記憶手段から、前記検出した数値データの近傍領域の数値データの一部を抽出するステップと、前記近傍領域の数値データから最も前記第1の所定条件を満たす数値データを1つ検出するステップと、前記近傍領域より狭い領域を近傍領域に設定し、前記近傍領域が第2の所定条件を満たすまで検出処理を繰り返すステップとを有することを特徴とする。 The present invention includes a storage unit for numeric data to be searched is stored, an information retrieval method in the information retrieval apparatus and an arithmetic unit, the arithmetic unit, a portion of the total numerical data from said storage means extraction extracting, detecting one closest to the first predetermined condition is satisfied numerical data from the numerical data obtained by the extraction, from the storage means, a part of the numerical data of the neighborhood area of ​​the numerical data the detected the method comprising the steps of: detecting one of the most said first predetermined condition is satisfied numerical data from the numerical data of the neighboring region, the narrower than the neighboring region region set in the vicinity of the region, the region in the vicinity of the second characterized in that a step of repeating the detection process to a predetermined condition is satisfied.

本発明は、検索対象の数値データが記憶された記憶手段を備えた情報検索装置上のコンピュータに情報検索を行わせるコンピュータプログラムであって、前記記憶手段から全数値データの一部を抽出するステップと、前記抽出した数値データから最も第1の所定条件を満たす数値データを1つ検出するステップと、前記記憶手段から、前記検出した数値データの近傍領域の数値データの一部を抽出するステップと、前記近傍領域の数値データから最も前記第1の所定条件を満たす数値データを1つ検出するステップと、前記近傍領域より狭い領域を近傍領域に設定し、前記近傍領域が第2の所定条件を満たすまで検出処理を繰り返すステップとを前記コンピュータ行わせることを特徴とする。 The present invention concerns a computer program which causes the information retrieval information retrieval device on a computer having a storage means for numeric data to be searched is stored, the step of extracting a portion of the total numerical data from said storage means When a step of detecting one closest to the first predetermined condition is satisfied numerical data from the numerical data obtained by the extraction, from the storage means, and extracting a portion of the numerical data of the neighborhood area of ​​the numerical data the detected a step of detecting one of the most said first predetermined condition is satisfied numerical data from the numerical data of the neighboring region, the narrower than the neighboring region region set in the vicinity of the region, the region near the second predetermined condition and repeating the detection process until satisfied, characterized in that causing the computer.

本発明によれば、検索時間が大幅に短縮できるとともに、リアルタイム検索も可能になるという効果が得られる。 According to the present invention, the search with time can be greatly shortened, the effect is obtained that real-time search becomes possible.

本発明の一実施形態の構成を示すブロック図である。 It is a block diagram showing a configuration of an embodiment of the present invention. 図1に示す装置の動作を示すシーケンス図である。 Is a sequence diagram showing the operation of the device shown in FIG. 図1に示す記憶部2から読み出したデータの一例を示す説明図である。 Is an explanatory diagram showing an example of data read from the storage unit 2 shown in FIG. 図1に示す記憶部2から読み出したデータの一例を示す説明図である。 Is an explanatory diagram showing an example of data read from the storage unit 2 shown in FIG. 一連の検索過程を模式化した説明図である。 A series of search process is an explanatory diagram schematically illustrating. 図1に示す装置の動作を示すシーケンス図である。 Is a sequence diagram showing the operation of the device shown in FIG. 図1に示す記憶部2から読み出したデータの一例を示す説明図である。 Is an explanatory diagram showing an example of data read from the storage unit 2 shown in FIG. 検索対象のデータ構造を示す説明図である。 Is an explanatory view showing the data structure of the search target. 従来技術による検索過程を模式化した説明図である。 The search process according to the prior art is an explanatory diagram schematically illustrating.

以下、図面を参照して、本発明の一実施形態による情報検索装置を説明する。 Hereinafter, with reference to the accompanying drawings, illustrating the information retrieval apparatus according to an embodiment of the present invention. 図1は同実施形態の構成を示すブロック図である。 Figure 1 is a block diagram showing the configuration of the embodiment. この図において、符号1は、コンピュータ装置から構成する情報検索装置である。 In this figure, reference numeral 1 is an information retrieval apparatus which constitutes a computer system. 符号2は、検索対象のデータが記憶された記憶部である。 Reference numeral 2 is a storage unit in which data to be retrieved is stored. 記憶部2は、必ずしも情報検索装置1内に備えている必要はなく、他の装置内に備えられており、通信手段を介して、記憶部2から検索対象のデータを読み出すことができる構成となっていてよい。 Storage unit 2 does not need to be necessarily provided in the information retrieval system 1, and provided in the other device via the communication means, the configuration from the memory unit 2 can read out data of the search target it may have turned to. 符号3は、データ検索処理を実行する演算部である。 Reference numeral 3 is a arithmetic unit for executing data retrieval processing. 符号4は、ユーザが操作を行ってデータ検索の条件を入力する入力部であり、マウスやキーボード等から構成する。 Reference numeral 4 is an input unit which the user performs an operation to enter a data retrieval condition, constituting a mouse or a keyboard. 符号5は、検索結果を表示する表示部であり、ディスプレイ装置等から構成する。 Reference numeral 5 is a display unit for displaying the search results, constituting a display device or the like. 検索結果は、必ずしも表示部5に表示する必要はなく、他の装置に対して出力する構成であってもよい。 Results do not necessarily have to be displayed on the display unit 5 may be configured to be output to another device.

次に、図2を参照して、図1に示す情報検索装置1の動作を説明する。 Next, with reference to FIG. 2, the operation of the data search device 1 shown in FIG. 図2は、図1に示す情報検索装置1の動作を示すシーケンス図である。 Figure 2 is a sequence diagram showing the operation of the data search device 1 shown in FIG. ここでは、図1に示す記憶部2には、図8に示す周波数毎の信号強度の数値データが10000個記憶されており、これらの数値データから、周波数の幅が100以上で、信号強度が50以下の領域を検索するものとする。 Here, the storage unit 2 shown in FIG. 1 are numerical data 10000 stored in the signal strength for each frequency shown in FIG. 8, these numerical data, a width of the frequency is more than 100, the signal strength We shall find the 50 following areas. 図8に示す数値データは、図9に示すようにある程度の連続性を持って変化するという特性を有しているため、情報検索装置1は、この特性を利用して、すべてのデータを読み込むことなく、所望の領域を検索する。 Numerical data shown in Figure 8, because it has a characteristic that varies with a certain continuity as shown in FIG. 9, the information retrieval system 1, by utilizing this property, read all the data it without searching for a desired region.

まず、ユーザは、入力部4を操作して、検索条件(周波数幅100以上、信号強度50以下)を入力する(ステップS0)。 First, the user operates the input unit 4, a search condition (frequency width 100 or more, the signal strength 50 below) to enter (step S0). この検索条件を受けて、演算部3は、記憶部2から一部の信号強度データを読み出す(ステップS1)。 In response to this query, calculating unit 3 reads a part of the signal intensity data from the storage unit 2 (step S1). ここでは100個に1個の割合で数値を読み出すものとする。 Here, it is assumed that read a number in a ratio of one to one hundred. 図8に示す数値データは全部で10000個あるため、図3に示すように100個を読み出すことになる。 For numeric data which is 10000 in total shown in FIG. 8, it will be read 100, as shown in FIG. これは等間隔に読み出してもよいし、図3のようにランダムサンプリング(乱択)を行ってもよい。 This may be read at regular intervals, it may be carried out random sampling (Randomized) as shown in Figure 3. なお、ランダムサンプリングを行うときには、例えば次のようにして読み取りデータ数を決定する。 Note that when performing random sampling, for example, in the following manner to determine the number of read data. 対象データ数をN個(この例では10000)としたとき、L個から1つのデータを確率pで取得するためには、n=log(1−p)/log(1−L/N)個のデータを読み取ればよい。 When the number of target data is N pieces (10000 in this example), in order to obtain a probability p of one data of L is, n = log (1-p) / log (1-L / N) pieces You should read the data. この結果、周波数7103の信号強度が最小(43)であったとすると、次は周波数7103を中心とする幅1000の領域(6603−7602)から、100個の点を読み出す(10個に1個の割合となる)。 As a result, when the signal strength of the frequency 7103 is the smallest (43), following the region (6603-7602) of width 1000 around the frequency 7103, reads the 100 points (1 to 10 at a ratio).

なお、ここでは単純に最小の信号強度を持つ周波数を中心として幅1000の領域を決定したが、いくつかの値の平均値を用いても構わない。 Here, it has been determined a region of width 1000 around the frequency having the lowest signal strength simply are may be used mean value of several values. 例えば、周波数帯を1000ずつに区切り、それぞれの領域で得られている数値の平均を計算し、平均値が最小になる領域を選択してもよい。 For example, separate the frequency bands by 1000, the average of the numerical values ​​have been obtained in the respective regions to calculate, may select an area average value is minimized. また、ここでは幅1000の値(全データの1/10)としたが、この値はデータの特性などによって調整してもよい。 Further, where it is the value of the width 1000 (1/10 of the total data), this value may be adjusted by the characteristics of the data. ここでは唯一の領域のみを選択したが、検索条件(この例では信号強度50以下)を満たす領域が複数あれば、それらすべてを選択し、以下の処理を行ってもよい。 Here it was chosen only a single region, if a plurality of regions which satisfy the search criteria (signal strength 50 or less in this example), and select all of them, may perform the following processing. これは、条件を満たす領域を一つだけ求めればいい場合と、なるべく多く求めたい場合で異なる。 This is a case where I be determined only one satisfying the condition region, different in case you want to find as many as possible.

次に、演算部3は、得られた幅1000の領域から、100個の点を読み出し(ここでは10個に1個の割合となる)、同様にして信号強度(あるいは平均値)の小さな周波数を求める(ステップS2)。 Next, the arithmetic unit 3, the area of ​​the resulting width 1000, (the rate of one to ten in this case) read out 100 points, a small frequency Likewise the signal strength (or average) the determined (step S2). この結果、図4に示すように、周波数7084の信号強度が最小(39)であったとすると、ここでも同様に、単純に最小の信号強度をのみを用いて幅100の領域を決定してもよいし、いくつかの値の平均値を用いても構わない。 As a result, as shown in FIG. 4, when the signal strength of the frequency 7084 is to be a minimum (39), here as well, also determine the area of ​​width 100 simply using the minimum signal strength only it may, may be used an average value of several values. そして、演算部3は、周波数7084を中心とする幅100の領域(ここでは7034−7133)の情報を検索結果として表示部5に表示する(ステップS3)。 The operating section 3 includes an area having a width 100 around the frequency 7084 (here 7034-7133) displayed on the display section 5 as retrieval result information (step S3).

一連の検索過程は、図5に示すように、まずは粗い粒度で検索を行い、徐々に範囲を狭めながら粒度を細かくしていくことで、読み取るデータ量を削減する。 A series of search process, as shown in FIG. 5, first perform a search in a coarse granularity, that continue to fine granularity while gradually narrowing the range, to reduce the amount of data to be read. 従来の単純な手法では、最悪の場合10000個のすべての数値を記憶部から読み出さなければならなかったが、前述した手法では100個の数値を2回読み出すだけでよい。 In a conventional simple approach, but had read all numbers 10000 worst case from the storage unit, it is only read out twice 100 numbers in the manner described above. この結果、検索時間を大きく短縮することができる。 As a result, it is possible to increase shorten the search time. また、検索のための前処理は不要であり、数値データが記憶部2に書き込まれた後に、即時に(リアルタイムに)検索を実行することが可能となる。 Also, pre-processing for the search is not necessary, after the numerical data has been written in the storage unit 2, (in real time) immediately becomes possible to perform the search.

次に、図6を参照して、図2に示す処理動作の変形例を説明する。 Next, referring to FIG. 6, illustrating a modified example of the processing operation illustrated in FIG. 図6は、図1に示す情報検索装置1の動作を示すシーケンス図である。 Figure 6 is a sequence diagram showing the operation of the data search device 1 shown in FIG. 図6に示す処理動作が、図2に示す処理動作と異なる点は、ステップS2とS3の間に新たにステップS4、S5を設けた点である。 Processing operation illustrated in FIG. 6, the processing operation differs from FIG. 2, is that newly provided steps S4, S5 between step S2 and S3. ステップS0〜S2と、ステップS3は、図2に示す処理動作と同様であるので、ステップS0〜S2と、ステップS3の処理動作は簡単に説明する。 A step S0-S2, step S3 is similar to the processing operation illustrated in FIG. 2, a step S0-S2, the processing operation of step S3 is briefly described.

まず、ユーザは、入力部4を操作して、検索条件(周波数幅100以上、信号強度50以下)を入力する(ステップS0)。 First, the user operates the input unit 4, a search condition (frequency width 100 or more, the signal strength 50 below) to enter (step S0). この検索条件を受けて、演算部3は、記憶部2から一部の信号強度データを読み出す(ステップS1)。 In response to this query, calculating unit 3 reads a part of the signal intensity data from the storage unit 2 (step S1). 次に、演算部3は、得られた幅1000の領域から、100個の点を読み出し(ここでは10個に1個の割合となる)、同様にして信号強度(あるいは平均値)の小さな周波数を求める(ステップS2)。 Next, the arithmetic unit 3, the area of ​​the resulting width 1000, (the rate of one to ten in this case) read out 100 points, a small frequency Likewise the signal strength (or average) the determined (step S2).

次に、演算部3は、目的領域の信号強度データすべて(7034−7133)を読み出し(ステップS4)、読み出した信号強度データが検索条件を満たしているか(すべて50以下であるか)否かを判定する(ステップS5)。 Next, the arithmetic unit 3 reads all signal intensity data object region (7034-7133) (step S4), and the read or signal intensity data satisfies the search condition (or all 50 or less) whether the determining (step S5). この判定の結果、検索条件を満たしていれば、演算部3は、周波数7084を中心とする幅100の領域(ここでは7034−7133)の情報を検索結果として表示部5に表示する(ステップS3)。 The result of this determination, if they meet the search criteria, computation unit 3, a region of width 100 around the frequency 7084 (here 7034-7133) displayed on the display section 5 as retrieval result information (step S3 ). 一方、検索条件を満たしていなければ、ステップS1に戻って最初から検索をやり直すか(ランダムサンプリングであれば、異なる結果を得る可能性がある)、またはエラーメッセージを表示部5に表示する。 On the other hand, it does not satisfy the search criteria, (if random sampling, there is a possibility of obtaining different results) or repeat the search from the beginning returns to step S1, or an error message is displayed on the display unit 5. この方法では、図2に示す処理動作と比べて、さらに100個の数値データを読み出すことになるが、それでも10000個に比べれば大幅に少なくすることができる。 In this way, as compared with the process operation shown in FIG. 2, but further results in reading the 100 numerical data, but still significantly less compared to 10000.

信号強度を検出するセンサによっては、大きく外れた誤った異常値を検出することがあり、この異常値が記憶部2に記憶されることがある(図7に示す信号強度999など)。 The sensor for detecting the signal strength, may detect an erroneous outliers largely deviated, sometimes this abnormal value is stored in the storage unit 2 (such as signal strength 999 shown in FIG. 7). 信号強度データを読み出すときにこのような異常値を選択してしまうと、数値データの傾向から大きく外れているため、正しく検索を行うことができない。 When thus selected such outliers when reading the signal strength data, since the far off from the tendency of the numerical data can not be correctly performed search. このような問題を避けるために、近傍の値をいくつか読み出し(図7に示す例では、信号強度163と、信号強度164)、その中央値(図7に示す例では中央値164)、あるいは最大最小を除いた平均値などを代わりに用いるようにしてもよい。 To avoid such a problem, (in the example shown in FIG. 7, the signal strength 163, the signal strength 164) some reading the value in the vicinity, the median (median 164 in the example shown in FIG. 7), or such as an average value excluding the maximum and minimum may be used instead. 図7に示す例では、3つずつの連続した値を取得し、その中央値を用いている。 In the example shown in FIG. 7, it acquires the sequential values ​​of triplicate and using the median. このようにすることで、センサの異常値の影響を抑制することができる。 In this way, it is possible to suppress the influence of outliers sensor. この方法では数倍の数値を読み出すことになるが、それでも10000個に比べれば大幅に少なくすることができる。 It will be read several times numbers in this way, but still can be significantly reduced compared to 10000.

無線通信におけるホワイトスペースを検索するような際に、連続した数値列から閾値以下(あるいは以上)の領域を検索する必要があるが、従来は、すべての数値を検査するような効率に劣る手法や、効率を高めるためにデータ変換などの前処理を要する手法が用いられてきた。 When such search for white space in a wireless communication, it is necessary to find an area more than the threshold from a continuous numerical sequence (or higher), conventionally, less efficient such that examine all numerical techniques Ya , techniques that require pre-processing such as data conversion in order to increase the efficiency have been used. 本発明は、以上説明したように、連続的に変化する数値データを対象とした、ランダムサンプリングによる効率的な検索手法を用いたため、従来手法のようにすべての数値を検査することがなく、検索効率が高い。 The present invention, As described above, intended for continuously changing the numerical data, for using an efficient search method by random sampling, without having to inspect all numbers as in the conventional method, search high efficiency. また、データ変換などの前処理は不要であるため、データ取得後、即時にデータ検索を開始することができる。 Further, since pretreatment of such data conversion is not necessary, after data acquisition, it is possible to start the data search immediately.

なお、図1に示す演算部3の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより情報検索処理を行ってもよい。 The information retrieval by recording the program for realizing the functions of the computation unit 3 shown in FIG. 1 in a computer-readable recording medium, to read the program recorded in this recording medium into a computer system, executes processing may be performed. なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。 Here, the "computer system" includes an OS and hardware such as peripheral devices. また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。 In addition, the "computer system" also includes a WWW system having a homepage providing environment (or display environment). また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。 The "computer-readable recording medium" refers to flexible disks, magneto-optical disks, ROM, portable media such as a CD-ROM, and a storage device such as a hard disk built in the computer system. さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。 Furthermore, the "computer-readable recording medium", as the Internet or the like networks or telephone via a communication line of the circuit, such as a server or a client when the program is sending computer system internal volatile memory (RAM) in, and also includes those that holds the program for a certain time.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。 Further, the program from a computer system storing the program in a storage device or the like via a transmission medium or may be transmitted to another computer system by a transmission wave in the transmission medium. ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。 Here, "transmission medium" for transmitting the program refers to a medium having a function of transmitting information, such as the Internet or a network (communication network), a telephone line communication circuit (communication line) such as. また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。 Further, the program may be one for implementing part of the above-described functions. さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。 Furthermore, what can be achieved in combination with a program already recorded in the above-described functions in the computer system may be a so-called differential file (differential program).

無線通信におけるホワイトスペースを検索するように、検索対象のデータにある程度の連続性を持って変化するという特性を有しているデータから、すべてのデータを読み込むことなく、所望の領域を検索することが不可欠な用途に適用できる。 To search for white space in a wireless communication, the data has a characteristic that varies with a certain degree of continuity in the search data, without reading all the data, searching a desired region It can be applied to the essential applications.

1・・・情報検索装置、2・・・記憶部、3・・・演算部、4・・・入力部、5・・・表示部 1 ... information retrieval system, 2 ... storage unit, 3 ... computing unit, 4 ... input section, 5 ... display unit

Claims (7)

  1. 検索対象の数値データが記憶された記憶手段と、 Storage means for numeric data to be searched is stored,
    前記記憶手段から全数値データの一部を抽出する手段と、 Means for extracting a portion of the total numerical data from said storage means,
    前記抽出した数値データから最も第1の所定条件を満たす数値データを1つ検出する手段と、 Means for detecting one of the most first predetermined condition is satisfied numerical data from the numerical data obtained by the extraction,
    前記記憶手段から、前記検出した数値データの近傍領域の数値データの一部を抽出する手段と、 From the storage means, means for extracting a portion of the numerical data of the neighborhood area of ​​the numerical data the detected,
    前記近傍領域の数値データから最も前記第1の所定条件を満たす数値データを1つ検出する手段と、 Means for detecting one of the most said first predetermined condition is satisfied numerical data from the numerical data of the neighboring region,
    前記近傍領域より狭い領域を近傍領域に設定し、前記近傍領域が第2の所定条件を満たすまで検出処理を繰り返す手段と を備えたことを特徴とする情報検索装置。 Wherein the narrow region than neighboring region set in the vicinity region, the information retrieval apparatus characterized by comprising a means for repeating the detection process the area near to a second predetermined condition is satisfied.
  2. 前記記憶手段から前記数値データを読み出す際に、近傍の複数の数値データに基づき前記数値データの異常値を取り除いて検出処理を行うことを特徴とする請求項1に記載の情報検索装置。 Wherein when reading said numerical data from the storage means, the information retrieval apparatus according to claim 1, characterized in that the detection process to remove the abnormal value of the numeric data based on a plurality of numerical data of the neighborhood.
  3. 前記数値データは、連続性を持って変化する特性を有していることを特徴とする請求項1または2に記載の情報検索装置。 The numeric data, information retrieval apparatus according to claim 1 or 2, characterized in that it has a characteristic that varies with continuity.
  4. 検索対象の数値データが記憶された記憶手段と、演算部とを備えた情報検索装置における情報検索方法であって、 Storage means for numeric data to be searched is stored, an information retrieval method in the information retrieval apparatus and an arithmetic unit,
    前記演算部が、 The arithmetic unit,
    前記記憶手段から全数値データの一部を抽出するステップと、 Extracting a portion of the total numerical data from said storage means,
    前記抽出した数値データから最も第1の所定条件を満たす数値データを1つ検出するステップと、 Detecting one closest to the first predetermined condition is satisfied numerical data from the numerical data obtained by the extraction,
    前記記憶手段から、前記検出した数値データの近傍領域の数値データの一部を抽出するステップと、 From the storage means, and extracting a portion of the numerical data of the neighborhood area of ​​the numerical data the detected,
    前記近傍領域の数値データから最も前記第1の所定条件を満たす数値データを1つ検出するステップと、 Detecting one of the most said first predetermined condition is satisfied numerical data from the numerical data of the neighboring region,
    前記近傍領域より狭い領域を近傍領域に設定し、前記近傍領域が第2の所定条件を満たすまで検出処理を繰り返すステップと を有することを特徴とする情報検索方法。 Information retrieval method characterized by a step of the narrower than the neighboring region region set in the vicinity of the area to repeat the detection process the area near to a second predetermined condition is satisfied.
  5. 前記記憶手段から前記数値データを読み出す際に、近傍の複数の数値データに基づき前記数値データの異常値を取り除いて検出処理を行うことを特徴とする請求項4に記載の情報検索方法。 The method of information retrieval according to claim 4, characterized in that when reading the numerical data from the storage means, the detection process to remove the abnormal value of the numeric data based on a plurality of numerical data of the neighborhood.
  6. 前記数値データは、連続性を持って変化する特性を有していることを特徴とする請求項4または5に記載の情報検索方法。 The numeric data, information search method according to claim 4 or 5, characterized in that it has a characteristic that varies with continuity.
  7. 検索対象の数値データが記憶された記憶手段を備えた情報検索装置上のコンピュータに情報検索を行わせるコンピュータプログラムであって、 The information retrieval device on a computer having a storage means for numeric data to be searched is stored a computer program for causing an information search,
    前記記憶手段から全数値データの一部を抽出するステップと、 Extracting a portion of the total numerical data from said storage means,
    前記抽出した数値データから最も第1の所定条件を満たす数値データを1つ検出するステップと、 Detecting one closest to the first predetermined condition is satisfied numerical data from the numerical data obtained by the extraction,
    前記記憶手段から、前記検出した数値データの近傍領域の数値データの一部を抽出するステップと、 From the storage means, and extracting a portion of the numerical data of the neighborhood area of ​​the numerical data the detected,
    前記近傍領域の数値データから最も前記第1の所定条件を満たす数値データを1つ検出するステップと、 Detecting one of the most said first predetermined condition is satisfied numerical data from the numerical data of the neighboring region,
    前記近傍領域より狭い領域を近傍領域に設定し、前記近傍領域が第2の所定条件を満たすまで検出処理を繰り返すステップと を前記コンピュータ行わせることを特徴とする情報検索プログラム。 Wherein the narrow region than neighboring region set in the vicinity area, information retrieval program that the neighboring region is characterized in that to perform said computer and a step of repeating the detection process to a second predetermined condition is satisfied.
JP2011022790A 2011-02-04 2011-02-04 Information retrieval apparatus, information retrieval method, and information retrieval program Active JP5499369B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011022790A JP5499369B2 (en) 2011-02-04 2011-02-04 Information retrieval apparatus, information retrieval method, and information retrieval program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011022790A JP5499369B2 (en) 2011-02-04 2011-02-04 Information retrieval apparatus, information retrieval method, and information retrieval program

Publications (2)

Publication Number Publication Date
JP2012164063A true JP2012164063A (en) 2012-08-30
JP5499369B2 JP5499369B2 (en) 2014-05-21

Family

ID=46843405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011022790A Active JP5499369B2 (en) 2011-02-04 2011-02-04 Information retrieval apparatus, information retrieval method, and information retrieval program

Country Status (1)

Country Link
JP (1) JP5499369B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5548809A (en) * 1992-07-15 1996-08-20 Southwestern Bell Technology Resources, Inc. Spectrum sharing communications system and system for monitoring available spectrum
US20070082687A1 (en) * 2005-10-07 2007-04-12 Microsoft Corporation Station selecting transmitter
JP2007150836A (en) * 2005-11-29 2007-06-14 Toshiba Corp Radio communication equipment, system and method
JP2009200773A (en) * 2008-02-21 2009-09-03 Toyota Infotechnology Center Co Ltd Mobile radio communication system, and radio communication method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5548809A (en) * 1992-07-15 1996-08-20 Southwestern Bell Technology Resources, Inc. Spectrum sharing communications system and system for monitoring available spectrum
US20070082687A1 (en) * 2005-10-07 2007-04-12 Microsoft Corporation Station selecting transmitter
JP2007150836A (en) * 2005-11-29 2007-06-14 Toshiba Corp Radio communication equipment, system and method
JP2009200773A (en) * 2008-02-21 2009-09-03 Toyota Infotechnology Center Co Ltd Mobile radio communication system, and radio communication method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200800905015; 阿部裕之、外4名: '多段階検出方式による広帯域スペクトル検出の高速・高ダイナミックレンジ化' 電子情報通信学会技術研究報告(SR2008-38〜68) 第108巻,第250号, 20081015, p.181-188, 社団法人電子情報通信学会 *
JPN6014005612; 阿部裕之、外4名: '多段階検出方式による広帯域スペクトル検出の高速・高ダイナミックレンジ化' 電子情報通信学会技術研究報告(SR2008-38〜68) 第108巻,第250号, 20081015, p.181-188, 社団法人電子情報通信学会 *

Also Published As

Publication number Publication date
JP5499369B2 (en) 2014-05-21

Similar Documents

Publication Publication Date Title
Bar-Yossef et al. Do not crawl in the dust: different urls with similar text
Bullinaria et al. Extracting semantic representations from word co-occurrence statistics: stop-lists, stemming, and SVD
Sakurai et al. Braid: Stream mining through group lag correlations
JP5264740B2 (en) Time series search engine
US7574449B2 (en) Content matching
US20080313140A1 (en) Method and Apparatus for Multi-Dimensional Content Search and Video Identification
Alshraideh et al. Search‐based software test data generation for string data using program‐specific search operators
US20100293179A1 (en) Identifying synonyms of entities using web search
RU2464630C2 (en) Two-pass hash extraction of text strings
US7996404B2 (en) System and method for detecting and analyzing pattern relationships
US7461056B2 (en) Text mining apparatus and associated methods
Mueen et al. Enumeration of time series motifs of all lengths
US8180785B2 (en) Method and system for searching numerical terms
GB2395806A (en) Information retrieval
US7546294B2 (en) Automated relevance tuning
Huang et al. Keyphrase extraction using semantic networks structure analysis
EP2080111A1 (en) A method and system for storing, organizing and processing data in a relational database
US20090234832A1 (en) Graph-based keyword expansion
US7584184B2 (en) System of effectively searching text for keyword, and method thereof
JP5597255B2 (en) Ranking of search results based on the weight of the word
KR20080049804A (en) Click distance determination
Doquire et al. Mutual information-based feature selection for multilabel classification
US9418144B2 (en) Similar document detection and electronic discovery
AU2009234120B2 (en) Search results ranking using editing distance and document information
US20060224584A1 (en) Automatic linear text segmentation

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130514

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130612

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130704

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130726

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140219

R150 Certificate of patent or registration of utility model

Ref document number: 5499369

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140320

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250