JP2010128660A - Text retrieval program, text retrieving device, and text browsing method - Google Patents

Text retrieval program, text retrieving device, and text browsing method Download PDF

Info

Publication number
JP2010128660A
JP2010128660A JP2008300850A JP2008300850A JP2010128660A JP 2010128660 A JP2010128660 A JP 2010128660A JP 2008300850 A JP2008300850 A JP 2008300850A JP 2008300850 A JP2008300850 A JP 2008300850A JP 2010128660 A JP2010128660 A JP 2010128660A
Authority
JP
Japan
Prior art keywords
character string
search
text
appearances
function unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008300850A
Other languages
Japanese (ja)
Other versions
JP5217958B2 (en
Inventor
Yasuhiko Ueno
康彦 上野
Takeshi Goto
剛 後藤
Koichi Takahashi
廣一 高橋
Toshiya Kanai
利始也 金井
Tsutomu Ogawana
務 小川名
Masakazu Kumakura
正和 熊倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008300850A priority Critical patent/JP5217958B2/en
Publication of JP2010128660A publication Critical patent/JP2010128660A/en
Application granted granted Critical
Publication of JP5217958B2 publication Critical patent/JP5217958B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To obtain an intended retrieval group about text retrieval by combining retrieval conditions with negative conditions. <P>SOLUTION: A text retrieval program is provided to make a computer, which performs text retrieval by combining retrieval conditions that a first character string is included with negative conditions that a second character string is not included, function as an appearance frequency count function part 43 for, when the first character string is included in the second character, counting the appearance frequency of the first and second character strings in the retrieval object text; and function as an appearance frequency comparison/decision function part 44 for comparing the appearance frequency of the first and the second character strings in the retrieval object text, and for, when the appearance frequency of the first and the second character strings is the same, determining that the retrieval object text is not a hit object, and for, when the appearance frequency of the first character string is larger than the appearance frequency of the second character string, determining that the retrieval object text is the hit object, so that an intended retrieval group can be obtained. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明はテキスト検索プログラム、テキスト検索装置及びテキスト検索方法に係り、特に第一の文字列を含むという検索条件と第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うテキスト検索プログラム、テキスト検索装置及びテキスト検索方法に関する。   The present invention relates to a text search program, a text search device, and a text search method, and in particular, performs a text search that combines a search condition that includes a first character string and a negative condition that does not include a second character string. The present invention relates to a program, a text search device, and a text search method.

従来、全文テキスト検索(N−gram方式の索引による全文テキスト検索や全テキストベタ読み検索:例えば特許文献1参照)には、余分にヒットするもの(以下、検索ノイズという)を排除するため、特定の文字列を含むという条件(検索条件)と、特定の文字列を含まないという条件(NOT条件又は否定条件)とを組み合わせるNOT検索方法があった。
特開2002−269139号公報
Conventionally, in order to eliminate extra hits (hereinafter referred to as search noise) in full text search (full text search by N-gram index or full text solid text search: see Patent Document 1, for example) There is a NOT search method that combines a condition that the character string is included (search condition) and a condition that the specific character string is not included (NOT condition or negative condition).
JP 2002-269139 A

従来のNOT検索方法は、全文テキスト検索において、通常の検索条件の文字列(条件語A)が、否定条件の文字列(条件語B)に含まれている場合、意図した通りの検索集合を得られないという問題が発生する。   In the conventional NOT search method, in a full-text search, when a character string of a normal search condition (condition word A) is included in a character string of a negative condition (condition word B), a search set as intended is obtained. The problem that it cannot be obtained occurs.

例えば従来のNOT検索方法では、文献検索において「ログ」を含む文献を検索したいが「プログラム」でヒットする文献を検索ノイズとして排除したい、ただし、「ログ検索プログラム」のように「ログ」及び「プログラム」の両方を含む文献をヒットさせたいという場合、意図した通りの検索集合を得られなかった。   For example, in the conventional NOT search method, it is desired to search for documents including “log” in the document search, but to exclude documents hit by “program” as search noise. However, “log” and “ When we wanted to hit a document containing both of the program, we couldn't get the search set we intended.

例えば「プログラム」の文字列には「ログ」の文字列が含まれている。従って、従来のNOT検索方法においては、否定条件の文字列「プログラム」に、通常の検索条件の文字列「ログ」が含まれるため、意図した通りの検索集合を得ることができない。   For example, the character string “program” includes the character string “log”. Therefore, in the conventional NOT search method, since the character string “log” of the normal search condition is included in the character string “program” of the negative condition, a search set as intended cannot be obtained.

従来のNOT検索方法では、検索条件の文字列「ログ」を含む文献を検索し、「ログ」を含む文献から否定条件の文字列「プログラム」を含む文献を排除するという手順で処理を行う。   In the conventional NOT search method, a document including the character string “log” of the search condition is searched, and the document including the character string “program” of the negative condition is excluded from the document including “log”.

したがって、従来のNOT検索方法では否定条件の文字列「プログラム」の文字列に含まれていない検索条件の文字列「ログ」と、否定条件の文字列「プログラム」とを両方含む文献まで削除されてしまい、ヒットさせたい文献まで検索集合(検索結果)から除かれてしまうという問題があった。   Therefore, in the conventional NOT search method, documents including both the search condition character string “log” and the negative condition character string “program” which are not included in the negative condition character string “program” are deleted. As a result, there is a problem that even a document to be hit is excluded from the search set (search result).

つまり、従来のNOT検索方法では『文字列「ログ」を含む文献を検索したいが、文字列「プログラム」でヒットする文献を検索ノイズとして排除したい。ただし、「ログ検索プログラム」のように「ログ」と「プログラム」とを両方含む文献はヒットさせたい。』というような文献検索を、どのような検索条件及び否定条件を与えても実現できないという問題あった。   In other words, in the conventional NOT search method, “I want to search for documents including the character string“ log ”, but I want to exclude documents hit by the character string“ program ”as search noise. However, we want to hit documents that contain both “log” and “program” such as “log search program”. There is a problem that a document search such as "cannot be realized no matter what search conditions and negative conditions are given."

一方、NOT検索方法では形態素解析による単語区切り(例えば特許文献1参照)を利用することにより、検索ノイズを排除することもできる。例えば単語「携帯電話」は「携帯」と「電話」とに区切られるため、検索条件の文字列「帯電」で検索しても、ヒットしない。   On the other hand, in the NOT search method, search noise can be eliminated by using word breaks (for example, see Patent Document 1) based on morphological analysis. For example, since the word “mobile phone” is divided into “mobile phone” and “phone”, a search with the character string “charging” in the search condition does not hit.

しかし、形態素解析による単語区切りを利用するNOT検索方法は、以下の2つの問題があった。第一の問題として、形態素解析は検索漏れが発生する。形態素解析は辞書に登録された単語単位でしかインデックスを作成しないため、インデックスに無い語句について検索漏れを起こす。例えば検索条件の文字列「帯電」で単語「携帯電話」をヒットさせたい場合であっても、形態素解析による単語区切りを利用するNOT検索方法は検索条件の文字列「帯電」で単語「携帯電話」をヒットさせることができない。   However, the NOT search method using word breaks by morphological analysis has the following two problems. As a first problem, morphological analysis causes a search omission. Since morphological analysis creates an index only for each word registered in the dictionary, it causes a search omission for a phrase that is not in the index. For example, even if it is desired to hit the word “mobile phone” with the character string “charge” of the search condition, the NOT search method using the word break by morphological analysis is the word “mobile phone” with the character string “charge” of the search condition. Cannot be hit.

第二の問題として、形態素解析による単語区切りを利用するNOT検索方法は、上記したように、ヒットさせたい文献まで検索集合から除かれてしまうことがある。例えば形態素解析による単語区切りを利用するNOT検索方法において『文字列「ログ」を含む文献を検索したいが、文字列「アクセスログ」でヒットする文献を、検索ノイズとして排除したい。ただし、その他の「ログ(イベントログ等)」はヒットさせたい。』という場合は以下のようになる。   As a second problem, as described above, the NOT search method that uses word breaks by morphological analysis sometimes excludes documents to be hit from the search set. For example, in a NOT search method using word breaks by morphological analysis, “I want to search for documents including the character string“ log ”, but I want to exclude documents that hit the character string“ access log ”as search noise. However, I want to hit other “logs (event log etc.)”. The case is as follows.

形態素解析による単語区切りを利用するNOT検索方法では文字列「アクセスログ」の単語区切りが「アクセス/ログ」となるため、文字列「ログ」で検索すれば文字列「アクセスログ」がヒットする。検索集合から文字列「アクセスログ」を含む文献を削除した場合は、例えば文字列「イベントログ」と「アクセスログ」とを両方含む文献も排除されてしまうという問題があった。   In the NOT search method using word breaks based on morphological analysis, the word break of the character string “access log” is “access / log”. Therefore, if the character string “log” is searched, the character string “access log” is hit. When a document including the character string “access log” is deleted from the search set, for example, a document including both the character strings “event log” and “access log” is also excluded.

本発明の一実施形態は、上記の点に鑑みなされたもので、第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索において意図した通りの検索集合を得ることが可能なテキスト検索プログラム、テキスト検索装置及びテキスト検索方法を提供することを目的とする。   One embodiment of the present invention has been made in view of the above points, and is intended for a text search that combines a search condition that includes a first character string and a negative condition that does not include a second character string. An object of the present invention is to provide a text search program, a text search apparatus, and a text search method capable of obtaining a street search set.

上記の課題を解決するため、本発明の一実施形態は、第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うコンピュータを、前記第二の文字列が前記第一の文字列を含む文字列であるとき、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする出現回数カウント機能部と、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数を比較し、前記第一の文字列及び前記第二の文字列の出現回数が同一であるとき前記検索対象のテキストをヒット対象外と判定し、前記第一の文字列の出現回数が前記第二の文字列の出現回数よりも多いとき前記検索対象のテキストをヒット対象と判定する出現回数比較・判定機能部として機能させる為のテキスト検索プログラムである。   In order to solve the above problem, an embodiment of the present invention provides a computer that performs a text search that combines a search condition that includes a first character string and a negative condition that does not include a second character string. When the second character string is a character string including the first character string, the number of appearances counts the number of appearances of the first character string and the second character string, respectively, in the search target text. The count function unit compares the number of appearances of the first character string and the second character string in the text to be searched, and the number of appearances of the first character string and the second character string is the same. If the number of occurrences of the first character string is greater than the number of appearances of the second character string, the search target text is determined to be a hit target. Appearance It is a text search program of order to function as the number comparing and determining function unit.

なお、本発明の一実施形態の構成要素、表現又は構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。   In addition, what applied the component, the expression, or the arbitrary combinations of the component of one Embodiment of this invention to a method, an apparatus, a system, a computer program, a recording medium, a data structure, etc. is also effective as an aspect of this invention. .

上述の如く、本発明の一実施形態によれば、第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索において意図した通りの検索集合を得ることが可能なテキスト検索プログラム、テキスト検索装置及びテキスト検索方法を提供可能である。   As described above, according to an embodiment of the present invention, a search set as intended in a text search that combines a search condition that includes the first character string and a negative condition that does not include the second character string. A text search program, a text search device, and a text search method can be provided.

次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。なお、本実施例では従来のNOT検索方法と区別するため、本実施例のNOT検索方法を拡張NOT検索方法と呼ぶ。   Next, the best mode for carrying out the present invention will be described based on the following embodiments with reference to the drawings. In this embodiment, in order to distinguish from the conventional NOT search method, the NOT search method of this embodiment is referred to as an extended NOT search method.

本実施例の拡張NOT検索方法は、図1及び図2に示すように、従来のNOT検索方法と検索により得られる検索集合が異なる。図1は、従来のNOT検索方法による検索処理の一例のイメージ図である。図2は、本実施例の拡張NOT検索方法による検索処理の一例のイメージ図である。   As shown in FIGS. 1 and 2, the extended NOT search method of this embodiment is different from the conventional NOT search method in the search set obtained by the search. FIG. 1 is an image diagram of an example of search processing by a conventional NOT search method. FIG. 2 is an image diagram of an example of search processing by the extended NOT search method of this embodiment.

図1及び図2のイメージ図は、検索条件の文字列「ログ」及び否定条件の文字列「プログラム」で文献1「ログの検索方法」,文献2「ログ検索プログラム」,文献3「検索プログラム」,文献4「検索方法」をNOT検索又は拡張NOT検索したものである。   The image diagrams of FIGS. 1 and 2 are a document 1 “log search method”, a document 2 “log search program”, and a document 3 “search program” with a search condition character string “log” and a negative condition character string “program”. , Reference 4 “search method” is a NOT search or extended NOT search.

図1に示す従来のNOT検索方法では、文字列「ログ」を検索条件として検索することで文献1〜3がヒットし、文献4がヒットしない。続いて、従来のNOT検索方法では文字列「プログラム」を否定条件として検索することで、文献1がヒットし、文献2〜3がヒットしない。   In the conventional NOT search method shown in FIG. 1, documents 1 to 3 are hit and documents 4 are not hit by searching the character string “log” as a search condition. Subsequently, in the conventional NOT search method, the document 1 is hit and the documents 2 to 3 are not hit by searching the character string “program” as a negative condition.

図1に示す従来のNOT検索方法では検索結果として文献1が得られるが、本来、文献2の「ログ検索プログラム」も検索結果として得る必要がある。文献2の「ログ検索プログラム」は「プログラム」の文字列に含まれる「ログ」の他、1〜2文字目に「ログ」が含まれているからである。   In the conventional NOT search method shown in FIG. 1, reference 1 is obtained as a search result. Originally, the “log search program” of reference 2 also needs to be obtained as a search result. This is because the “log search program” in Document 2 includes “log” in the first and second characters in addition to “log” included in the character string “program”.

このように、従来のNOT検索方法では、検索条件の文字列(例えばログ)が否定条件の文字列(例えばプログラム)に含まれている場合、意図した通りの検索集合を得ることができなかった。   Thus, in the conventional NOT search method, when a search condition character string (for example, a log) is included in a negative condition character string (for example, a program), a search set as intended cannot be obtained. .

図2に示す本実施例の拡張NOT検索方法では、文字列「ログ」を検索条件として検索することで文献1〜3がヒットし、文献4がヒットしない。続いて、本実施例の拡張NOT検索方法では文字列「プログラム」を否定条件として検索することで、文献1及び2がヒットし、文献3がヒットしない。   In the extended NOT search method of this embodiment shown in FIG. 2, documents 1 to 3 are hit and documents 4 are not hit by searching the character string “log” as a search condition. Subsequently, in the extended NOT search method according to the present embodiment, the documents 1 and 2 are hit and the document 3 is not hit by searching the character string “program” as a negative condition.

図2に示す本実施例の拡張NOT検索方法では検索結果として、意図した通りの文献1及び2が得られる。本実施例の拡張NOT検索方法は、後述の原理により、検索条件の文字列(例えばログ)が否定条件の文字列(例えばプログラム)に含まれていても、意図した通りの検索集合を得ることができる。   In the extended NOT search method of the present embodiment shown in FIG. 2, documents 1 and 2 as intended are obtained as search results. The extended NOT search method of this embodiment obtains a search set as intended even if a character string (for example, a log) of a search condition is included in a character string (for example, a program) of a negative condition, according to the principle described later. Can do.

図3は本実施例の拡張NOT検索を行うシステムの一例の構成図である。図3(a)に示したシステムは、スタンドアローンのコンピュータにより実現されるテキスト検索装置10を含む構成である。図3(b)に示したシステムは、インターネットやLANなどのネットワーク22に接続されたコンピュータにより実現されるテキスト検索装置20及び利用者端末21を含む構成である。テキスト検索装置20と利用者端末21とは、ネットワーク22経由でデータ通信可能である。   FIG. 3 is a configuration diagram of an example of a system that performs an extended NOT search according to the present embodiment. The system shown in FIG. 3A includes a text search device 10 realized by a stand-alone computer. The system shown in FIG. 3B includes a text search device 20 and a user terminal 21 that are realized by a computer connected to a network 22 such as the Internet or a LAN. The text search device 20 and the user terminal 21 can perform data communication via the network 22.

図3(a)のシステムに含まれるテキスト検索装置10は、ユーザから検索条件及び否定条件の入力を受け、入力された検索条件及び否定条件に基づき拡張NOT検索を行ったあと、検索結果を出力するものである。また、図3(b)のシステムに含まれるテキスト検索装置20は利用者端末21にユーザが入力した検索条件及び否定条件をネットワーク22経由で受け付け、入力された検索条件及び否定条件に基づき拡張NOT検索を行ったあと、ネットワーク22経由で検索結果を利用者端末21に提供するものである。   The text search apparatus 10 included in the system of FIG. 3A receives search conditions and negative conditions from the user, performs an extended NOT search based on the input search conditions and negative conditions, and then outputs the search results. To do. Also, the text search device 20 included in the system of FIG. 3B accepts the search condition and negative condition input by the user to the user terminal 21 via the network 22 and expands NOT according to the input search condition and negative condition. After performing the search, the search result is provided to the user terminal 21 via the network 22.

図4はテキスト検索装置の一例の構成図である。なお、ここではテキスト検索装置20を例に説明する。図4のテキスト検索装置20は、バスBで相互に接続されている入力装置31,出力装置32,ドライブ装置33,補助記憶装置34,主記憶装置35,演算処理装置36及びインターフェース装置37を有するように構成される。   FIG. 4 is a configuration diagram of an example of a text search apparatus. Here, the text search device 20 will be described as an example. 4 includes an input device 31, an output device 32, a drive device 33, an auxiliary storage device 34, a main storage device 35, an arithmetic processing device 36, and an interface device 37 that are connected to each other via a bus B. Configured as follows.

入力装置31はキーボードやマウスなどで構成され、各種信号を入力するために用いられる。出力装置32はディスプレイ装置などで構成され、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置37は、モデム,LANカードなどで構成されており、インターネットやLANなどのネットワーク22に接続するために用いられる。   The input device 31 includes a keyboard and a mouse, and is used for inputting various signals. The output device 32 includes a display device and is used to display various windows, data, and the like. The interface device 37 includes a modem, a LAN card, and the like, and is used to connect to a network 22 such as the Internet or a LAN.

本実施例の拡張NOT検索を行うためのテキスト検索プログラムは、テキスト検索装置20を制御する各種プログラムの少なくとも一部である。テキスト検索プログラムは記録媒体38の配布やネットワーク22からのダウンロードなどによって提供される。テキスト検索プログラムを記録した記録媒体38はCD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。   The text search program for performing the extended NOT search of this embodiment is at least a part of various programs that control the text search device 20. The text search program is provided by distributing the recording medium 38, downloading from the network 22, or the like. The recording medium 38 on which the text search program is recorded is information such as a CD-ROM, flexible disk, magneto-optical disk, etc., a recording medium for recording information optically, electrically or magnetically, ROM, flash memory, etc. Various types of recording media such as a semiconductor memory for electrical recording can be used.

また、テキスト検索プログラムを記録した記録媒体38がドライブ装置33にセットされると、テキスト検索プログラムは、記録媒体38からドライブ装置33を介して補助記憶装置34にインストールされる。ネットワーク22からダウンロードされたテキスト検索プログラムは、インターフェース装置37を介して補助記憶装置34にインストールされる。   When the recording medium 38 on which the text search program is recorded is set in the drive device 33, the text search program is installed in the auxiliary storage device 34 from the recording medium 38 via the drive device 33. The text search program downloaded from the network 22 is installed in the auxiliary storage device 34 via the interface device 37.

補助記憶装置34はインストールされたテキスト検索プログラムを格納すると共に、必要なファイル,データ等を格納する。主記憶装置35は、コンピュータの起動時に補助記憶装置34からテキスト検索プログラムを読み出して格納する。そして、演算処理装置36は主記憶装置35に格納されたテキスト検索プログラムに従って、後述するような各種処理を実現している。テキスト検索プログラムはアプリケーションやミドルウェア等のソフトウェア本体の他、ソフトウェアに機能を追加する為のアドオンのようなソフトウェアであってもよい。   The auxiliary storage device 34 stores the installed text search program and also stores necessary files, data, and the like. The main storage device 35 reads and stores the text search program from the auxiliary storage device 34 when the computer is activated. The arithmetic processing unit 36 implements various processes as described later in accordance with a text search program stored in the main storage device 35. The text search program may be software such as an add-on for adding a function to the software in addition to the software main body such as an application and middleware.

なお、図4ではテキスト検索装置20の例を説明したが、テキスト検索装置10も同様である。ただし、テキスト検索装置10はインターフェース装置37を有していなくてもよい。   In addition, although the example of the text search device 20 was demonstrated in FIG. 4, the text search device 10 is also the same. However, the text search device 10 may not have the interface device 37.

以下、本実施例の拡張NOT検索を行うテキスト検索装置10,20の詳細について説明していく。なお、テキスト検索装置10,20は、ユーザから検索条件及び否定条件の入力を直接受けるか、利用者端末21にユーザが入力した検索条件及び否定条件をネットワーク22経由で受けるかの違いと、検索結果の出力を直接行うか、利用者端末21に検索結果を提供して検索結果の出力を利用者端末21に行わせるかの違いがあるが、機能的に同様である。そこで、以下の説明ではテキスト検索装置10を一例として説明する。   Hereinafter, the details of the text search devices 10 and 20 that perform the extended NOT search of this embodiment will be described. It should be noted that the text search devices 10 and 20 are different in whether the search conditions and negative conditions are directly input from the user or the search conditions and negative conditions input by the user to the user terminal 21 are received via the network 22. There is a difference between outputting the result directly or providing the user terminal 21 with the search result and causing the user terminal 21 to output the search result, but the functions are the same. Therefore, in the following description, the text search apparatus 10 will be described as an example.

図5は本実施例の拡張NOT検索を行うテキスト検索装置の一例のブロック図である。図5のテキスト検索装置10は、条件受付機能部41,検索機能部42,出現回数カウント機能部43,出現回数比較・判定機能部44,結果出力機能部45及び検索対象のテキストデータ46を有する構成である。   FIG. 5 is a block diagram of an example of a text search apparatus that performs an extended NOT search according to this embodiment. The text search apparatus 10 of FIG. 5 includes a condition reception function unit 41, a search function unit 42, an appearance count counting function unit 43, an appearance count comparison / determination function unit 44, a result output function unit 45, and search target text data 46. It is a configuration.

図5のテキスト検索装置10の処理手順について、図6のフローチャートを参照しつつ説明する。図6は本実施例の拡張NOT検索を行うテキスト検索装置の処理手順を表した一例のフローチャートである。   The processing procedure of the text search apparatus 10 of FIG. 5 will be described with reference to the flowchart of FIG. FIG. 6 is a flowchart illustrating an example of a processing procedure of the text search apparatus that performs the extended NOT search according to this embodiment.

図6のフローチャートは文献検索の条件が『文字列「ログ」を含む文献を検索する。文字列「プログラム」を含む文献を検索ノイズとして排除する。ただし、文字列「ログ検索プログラム」のように、文字列「プログラム」に含まれる文字列「ログ」の他、文字列「ログ」を含む文献をヒットさせる。』の場合を表している。   In the flowchart of FIG. 6, the document search condition is “search for documents including the character string“ log ”. A document including the character string “program” is excluded as search noise. However, documents including the character string “log” in addition to the character string “log” included in the character string “program” are hit like the character string “log search program”. ] Represents the case.

ステップS1では、条件受付機能部41が、ユーザから検索条件及び否定条件を入力される。例えば条件受付機能部41は「ログ −プログラム」という様に、検索条件としての文字列「ログ」、否定条件としての文字列「プログラム」が入力される。条件受付機能部41はユーザから入力された検索条件及び否定条件を、検索機能部42に通知する。   In step S1, the condition reception function unit 41 receives a search condition and a negative condition from the user. For example, the condition reception function unit 41 receives a character string “log” as a search condition and a character string “program” as a negative condition, such as “log-program”. The condition reception function unit 41 notifies the search function unit 42 of the search conditions and negative conditions input by the user.

ステップS2に進み、検索機能部42は現在評価している文献を表す「n」に「0」を設定する。また、検索機能部42は全文献数を表す「m」に、検索対象のテキストデータ46に含まれる文献数をセットする。ステップS3に進み、検索機能部42は現在評価している文献を表す「n」に「1」を加算する。   In step S2, the search function unit 42 sets “0” to “n” representing the currently evaluated document. Further, the search function unit 42 sets the number of documents included in the text data 46 to be searched for “m” representing the total number of documents. In step S3, the search function unit 42 adds “1” to “n” representing the currently evaluated document.

ステップS4に進み、検索機能部42はテキストデータ46に含まれる1番目の文献について、検索条件の文字列「ログ」、否定条件の文字列「プログラム」がヒットするか否かを評価する。   In step S4, the search function unit 42 evaluates whether or not the character string “log” of the search condition and the character string “program” of the negative condition are hit for the first document included in the text data 46.

ステップS5に進み、検索機能部42はテキストデータ46に含まれる1番目の文献に検索条件の文字列「ログ」が含まれるか否かを判定する。テキストデータ46に含まれる1番目の文献に検索条件の文字列「ログ」が含まれていれば、検索機能部42はステップS6に進み、テキストデータ46に含まれる1番目の文献に否定条件の文字列「プログラム」が含まれるか否かを判定する。   In step S 5, the search function unit 42 determines whether or not the first document included in the text data 46 includes the search condition character string “log”. If the first document included in the text data 46 includes the character string “log” of the search condition, the search function unit 42 proceeds to step S 6, and the first document included in the text data 46 has a negative condition. It is determined whether or not the character string “program” is included.

テキストデータ46に含まれる1番目の文献に否定条件の文字列「プログラム」が含まれていれば、検索機能部42は1番目の文献内での文字列「ログ」及び「プログラム」の出現回数のカウントを出現回数カウント機能部43に要求する。   If the first document included in the text data 46 includes the negative condition character string “program”, the search function unit 42 counts the number of occurrences of the character strings “log” and “program” in the first document. Is requested to the appearance count function unit 43.

ステップS7に進み、出現回数カウント機能部43は、検索機能部42からの要求に基づいて、1番目の文献内での文字列「ログ」の出現回数をカウントする。また、ステップS8に進み、出現回数カウント機能部43は検索機能部42からの要求に基づいて、1番目の文献内での文字列「プログラム」の出現回数をカウントする。出現回数カウント機能部43は、カウントした1番目の文献内での文字列「ログ」の出現回数及び文字列「プログラム」の出現回数を出現回数比較・判定機能部44に通知する。   In step S 7, the appearance count counting function unit 43 counts the number of appearances of the character string “log” in the first document based on the request from the search function unit 42. In step S8, the appearance count function unit 43 counts the number of appearances of the character string “program” in the first document based on the request from the search function unit 42. The appearance number counting function unit 43 notifies the appearance number comparison / determination function unit 44 of the counted appearance number of the character string “log” and the appearance number of the character string “program” in the first document.

ステップS9に進み、出現回数比較・判定機能部44はカウントした1番目の文献内での文字列「ログ」の出現回数と文字列「プログラム」の出現回数とを比較する。カウントした1番目の文献内での文字列「ログ」の出現回数と文字列「プログラム」の出現回数とが同じであれば、出現回数比較・判定機能部44はステップS10に進み、1番目の文献をヒット対象外と判定し、検索機能部42へ通知する。   In step S9, the appearance number comparison / determination function unit 44 compares the appearance number of the character string “log” with the appearance number of the character string “program” in the counted first document. If the number of appearances of the character string “log” and the number of appearances of the character string “program” in the first document counted are the same, the appearance number comparison / determination function unit 44 proceeds to step S10. The document is determined not to be hit, and the search function unit 42 is notified.

カウントした1番目の文献内での文字列「ログ」の出現回数と文字列「プログラム」の出現回数とが同じであれば、1番目の文献内は否定条件の文字列「プログラム」に含まれる文字列「ログ」の他、文字列「ログ」が含まれていない為、ヒット対象外とされる。   If the number of occurrences of the character string “log” in the counted first document is the same as the number of appearances of the character string “program”, the first document is included in the negative condition character string “program”. Since the character string “log” is not included in addition to the character string “log”, it is excluded from the hit target.

カウントした1番目の文献内での文字列「ログ」の出現回数が文字列「プログラム」の出現回数より多ければ、出現回数比較・判定機能部44はステップS11に進み、1番目の文献をヒット対象と判定し、検索機能部42へ通知する。検索機能部42は、1番目の文献をヒット文献一覧に追加する。   If the number of appearances of the character string “log” in the counted first document is larger than the number of appearances of the character string “program”, the appearance number comparison / determination function unit 44 proceeds to step S11 and hits the first document. The target is determined and notified to the search function unit 42. The search function unit 42 adds the first document to the hit document list.

カウントした1番目の文献内での文字列「ログ」の出現回数が文字列「プログラム」の出現回数より多ければ、1番目の文献内は否定条件の文字列「プログラム」に含まれる文字列「ログ」の他、文字列「ログ」が含まれている為、ヒット対象とされる。   If the number of appearances of the character string “log” in the counted first document is greater than the number of appearances of the character string “program”, the character string “included in the negative condition character string“ program ”is included in the first document. Since the character string “log” is included in addition to “log”, it is a hit target.

なお、ステップS5において、テキストデータ46に含まれる1番目の文献に検索条件の文字列「ログ」が含まれていなければ、検索機能部42はステップS10に進み、1番目の文献をヒット対象外と判定し、検索機能部42へ通知する。また、ステップS6において、テキストデータ46に含まれる1番目の文献に否定条件の文字列「プログラム」が含まれていなければ、出現回数比較・判定機能部44はステップS11に進み、1番目の文献をヒット対象と判定し、検索機能部42へ通知する。検索機能部42は、1番目の文献をヒット文献一覧に追加する。   In step S5, if the character string “log” of the search condition is not included in the first document included in the text data 46, the search function unit 42 proceeds to step S10, and the first document is excluded from the hit target. And the search function unit 42 is notified. In step S6, if the first document included in the text data 46 does not include the negative condition character string “program”, the appearance frequency comparison / determination function unit 44 proceeds to step S11 and proceeds to step S11. Is determined as a hit target, and the search function unit 42 is notified. The search function unit 42 adds the first document to the hit document list.

ステップS10又はS11に続いてステップS12に進み、検索機能部42は現在評価している文献を表す「n」と全文献数を表す「m」とが同じか否かを判定する。現在評価している文献を表す「n」と全文献数を表す「m」とが同じでなければ、検索機能部42はステップS3に戻り、現在評価している文献を表す「n」に「1」を加算し、次の文献に進む。その後の処理は1番目の文献と同様である。   Progressing to step S12 following step S10 or S11, the search function unit 42 determines whether “n” representing the currently evaluated document and “m” representing the total number of documents are the same. If “n” representing the currently evaluated document is not the same as “m” representing the total number of documents, the search function unit 42 returns to step S3 and sets “n” representing the currently evaluated document to “n”. 1 ”is added and the process proceeds to the next document. The subsequent processing is the same as in the first document.

現在評価している文献を表す「n」と全文献数を表す「m」とが同じであれば、検索機能部42は検索対象のテキストデータ46に含まれる全ての文献を検索したと判定してステップS13に進む。ステップS13では、検索機能部42が、結果出力機能部45に対してヒット文献一覧のユーザへの提供を要求する。結果出力機能部45は例えばヒット文献一覧をディスプレイ装置に表示してユーザに提供する。   If “n” representing the currently evaluated document and “m” representing the total number of documents are the same, the search function unit 42 determines that all documents included in the text data 46 to be searched have been searched. Then, the process proceeds to step S13. In step S13, the search function unit 42 requests the result output function unit 45 to provide the hit document list to the user. The result output function unit 45 displays, for example, a hit literature list on the display device and provides it to the user.

以上、本実施例のテキスト検索装置10は、形態素解析によらず、従来のNOT検索で排除できない検索ノイズを、拡張NOT検索により排除できる。言い換えれば、本実施例の拡張NOT検索は、排除したい文字列だけが存在する文献を、検索ノイズとして排除できる。   As described above, the text search apparatus 10 according to the present embodiment can eliminate search noise that cannot be eliminated by the conventional NOT search by the extended NOT search, regardless of the morphological analysis. In other words, the extended NOT search according to the present embodiment can exclude documents having only character strings to be excluded as search noise.

図5のテキスト検索装置10は出現回数カウント機能部43及び出現回数比較・判定機能部44が検索機能部42と別に設けられている。しかし、テキスト検索装置10は図7に示すように、出現回数カウント機能部43及び出現回数比較・判定機能部44を検索機能部42に含ませて設けるようにしてもよい。   The text search apparatus 10 of FIG. 5 is provided with an appearance count function unit 43 and an appearance number comparison / determination function unit 44 separately from the search function unit 42. However, as shown in FIG. 7, the text search device 10 may include an appearance count counting function unit 43 and an appearance count comparison / determination function unit 44 included in the search function unit 42.

図7は、本実施例の拡張NOT検索を行うテキスト検索装置の他の例のブロック図である。図7のテキスト検索装置10は、条件受付機能部41,検索機能部42,結果出力機能部45及び検索対象のテキストデータ46を有する構成である。また、検索機能部42は出現回数カウント機能部43及び出現回数比較・判定機能部44を有する構成である。   FIG. 7 is a block diagram of another example of a text search apparatus that performs an extended NOT search according to this embodiment. The text search apparatus 10 of FIG. 7 has a configuration including a condition reception function unit 41, a search function unit 42, a result output function unit 45, and text data 46 to be searched. The search function unit 42 includes an appearance count counting function unit 43 and an appearance count comparison / determination function unit 44.

図7のテキスト検索装置10の処理手順について、図8のフローチャートを参照しつつ説明する。図8は本実施例の拡張NOT検索を行うテキスト検索装置の処理手順を表した他の例のフローチャートである。   The processing procedure of the text search apparatus 10 in FIG. 7 will be described with reference to the flowchart in FIG. FIG. 8 is a flowchart of another example showing the processing procedure of the text search apparatus for performing the extended NOT search according to this embodiment.

図8のフローチャートは、図6のフローチャートと文献検索の条件が同様の場合を表している。ステップS11〜S14の処理は、図6に示したステップS1〜S4と同様であるため、説明を省略する。   The flowchart of FIG. 8 represents a case where the document search conditions are the same as those of the flowchart of FIG. Since the process of step S11-S14 is the same as that of step S1-S4 shown in FIG. 6, description is abbreviate | omitted.

ステップS15に進み、検索機能部42内の出現回数カウント機能部43は、1番目の文献内での文字列「ログ」の出現回数をカウントする。文字列「ログ」の出現回数が1回以上カウントされると、出現回数カウント機能部43はステップS16に進み、1番目の文献内での文字列「プログラム」の出現回数をカウントする。文字列「プログラム」の出現回数が1回以上カウントされると、出現回数カウント機能部43は、ステップS17に進む。   In step S15, the appearance count counting function unit 43 in the search function unit 42 counts the number of appearances of the character string “log” in the first document. When the number of appearances of the character string “log” is counted one or more times, the appearance number counting function unit 43 proceeds to step S16 and counts the number of appearances of the character string “program” in the first document. When the number of appearances of the character string “program” is counted one or more times, the appearance number counting function unit 43 proceeds to step S17.

ステップS17に進み、出現回数比較・判定機能部44はカウントした1番目の文献内での文字列「ログ」の出現回数と文字列「プログラム」の出現回数とを比較する。カウントした1番目の文献内での文字列「ログ」の出現回数と文字列「プログラム」の出現回数とが同じであれば、出現回数比較・判定機能部44はステップS18に進み、1番目の文献をヒット対象外と判定する。   In step S17, the appearance number comparison / determination function unit 44 compares the appearance number of the character string “log” with the appearance number of the character string “program” in the counted first document. If the number of appearances of the character string “log” in the first document and the number of appearances of the character string “program” are the same, the appearance number comparison / determination function unit 44 proceeds to step S18. The document is determined not to be hit.

カウントした1番目の文献内での文字列「ログ」の出現回数と文字列「プログラム」の出現回数とが同じであれば、1番目の文献内は否定条件の文字列「プログラム」に含まれる文字列「ログ」の他、文字列「ログ」が含まれていない為、ヒット対象外とされる。   If the number of occurrences of the character string “log” in the counted first document is the same as the number of appearances of the character string “program”, the first document is included in the negative condition character string “program”. Since the character string “log” is not included in addition to the character string “log”, it is excluded from the hit target.

カウントした1番目の文献内での文字列「ログ」の出現回数が文字列「プログラム」の出現回数より多ければ、出現回数比較・判定機能部44はステップS19に進み、1番目の文献をヒット対象と判定する。検索機能部42は、1番目の文献をヒット文献一覧に追加する。   If the number of appearances of the character string “log” in the counted first document is larger than the number of appearances of the character string “program”, the appearance number comparison / determination function unit 44 proceeds to step S19 and hits the first document. Judge as the target. The search function unit 42 adds the first document to the hit document list.

カウントした1番目の文献内での文字列「ログ」の出現回数が文字列「プログラム」の出現回数より多ければ、1番目の文献内は否定条件の文字列「プログラム」に含まれる文字列「ログ」の他、文字列「ログ」が含まれている為、ヒット対象とされる。   If the number of appearances of the character string “log” in the counted first document is greater than the number of appearances of the character string “program”, the character string “included in the negative condition character string“ program ”is included in the first document. Since the character string “log” is included in addition to “log”, it is a hit target.

なお、ステップS15において、文字列「ログ」の出現回数がカウントされず、出現回数が0回であれば、出現回数カウント機能部43はステップS18に進み、1番目の文献をヒット対象外と判定する。ステップS16において、文字列「プログラム」の出現回数がカウントされず、出現回数が0回であれば、出現回数カウント機能部43はステップS19に進み、1番目の文献をヒット対象と判定する。検索機能部42は、1番目の文献をヒット文献一覧に追加する。   If the number of appearances of the character string “log” is not counted in step S15 and the number of appearances is 0, the appearance count counting function unit 43 proceeds to step S18 and determines that the first document is not a hit target. To do. If the number of appearances of the character string “program” is not counted in step S16 and the number of appearances is 0, the appearance count counting function unit 43 proceeds to step S19 and determines the first document as a hit target. The search function unit 42 adds the first document to the hit document list.

ステップS18又はS19に続いてステップS20に進み、検索機能部42は現在評価している文献を表す「n」と全文献数を表す「m」とが同じか否かを判定する。現在評価している文献を表す「n」と全文献数を表す「m」とが同じでなければ、検索機能部42はステップS13に戻り、現在評価している文献を表す「n」に「1」を加算し、次の文献に進む。その後の処理は1番目の文献と同様である。   Progressing to step S20 following step S18 or S19, the search function unit 42 determines whether or not “n” representing the currently evaluated document and “m” representing the total number of documents are the same. If “n” representing the currently evaluated document and “m” representing the total number of documents are not the same, the search function unit 42 returns to step S13 and sets “n” representing the currently evaluated document to “n”. 1 ”is added and the process proceeds to the next document. The subsequent processing is the same as in the first document.

現在評価している文献を表す「n」と全文献数を表す「m」とが同じであれば、検索機能部42は検索対象のテキストデータ46に含まれる全ての文献を検索したと判定してステップS21に進む。ステップS21では、検索機能部42が、結果出力機能部45に対してヒット文献一覧のユーザへの提供を要求する。結果出力機能部45は例えばヒット文献一覧をディスプレイ装置に表示してユーザに提供する。   If “n” representing the currently evaluated document and “m” representing the total number of documents are the same, the search function unit 42 determines that all documents included in the text data 46 to be searched have been searched. Then, the process proceeds to step S21. In step S21, the search function unit 42 requests the result output function unit 45 to provide the hit document list to the user. The result output function unit 45 displays, for example, a hit literature list on the display device and provides it to the user.

以上、本実施例のテキスト検索装置10は、形態素解析によらず、従来のNOT検索で排除できない検索ノイズを、拡張NOT検索により排除できる。言い換えれば、本実施例の拡張NOT検索は、排除したい文字列だけが存在する文献を、検索ノイズとして排除できる。   As described above, the text search apparatus 10 according to the present embodiment can eliminate search noise that cannot be eliminated by the conventional NOT search by the extended NOT search, regardless of the morphological analysis. In other words, the extended NOT search according to the present embodiment can exclude documents having only character strings to be excluded as search noise.

本実施例の拡張NOT検索によれば、検索条件及び否定条件の与え方によって実現できない「検索条件の文字列が否定条件の文字列に含まれている場合」であっても、NOT検索が可能となり、検索ノイズを排除した意図した通りの検索結果を得ることができる。   According to the extended NOT search of the present embodiment, a NOT search is possible even when “a character string of the search condition is included in the character string of the negative condition” that cannot be realized by the way of providing the search condition and the negative condition. Thus, a search result as intended without the search noise can be obtained.

本発明は、以下に記載する付記のような構成が考えられる。
(付記1)
第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うコンピュータを、
前記第二の文字列が前記第一の文字列を含む文字列であるとき、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする出現回数カウント機能部と、
前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数を比較し、前記第一の文字列及び前記第二の文字列の出現回数が同一であるとき前記検索対象のテキストをヒット対象外と判定し、前記第一の文字列の出現回数が前記第二の文字列の出現回数よりも多いとき前記検索対象のテキストをヒット対象と判定する出現回数比較・判定機能部と
して機能させる為のテキスト検索プログラム。
(付記2)
前記出現回数カウント機能部は、前記検索対象のテキスト内に前記第一の文字列及び前記第二の文字列が含まれるとき、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする付記1記載のテキスト検索プログラム。
(付記3)
前記出現回数カウント機能部及び出現回数比較・判定機能部は、前記テキスト検索を行う検索機能部に設けられる付記1又は2記載のテキスト検索プログラム。
(付記4)
第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うテキスト検索装置であって、
前記第二の文字列が前記第一の文字列を含む文字列であるとき、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする出現回数カウント機能部と、
前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数を比較し、前記第一の文字列及び前記第二の文字列の出現回数が同一であるとき前記検索対象のテキストをヒット対象外と判定し、前記第一の文字列の出現回数が前記第二の文字列の出現回数よりも多いとき前記検索対象のテキストをヒット対象と判定する出現回数比較・判定機能部と
を有するテキスト検索装置。
(付記5)
コンピュータが第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うテキスト検索方法であって、
前記コンピュータが前記第二の文字列が前記第一の文字列を含む文字列であるとき前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする出現回数カウントステップと、
前記コンピュータが前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数を比較し、前記第一の文字列及び前記第二の文字列の出現回数が同一であるとき前記検索対象のテキストをヒット対象外と判定し、前記第一の文字列の出現回数が前記第二の文字列の出現回数よりも多いとき前記検索対象のテキストをヒット対象と判定する出現回数比較・判定ステップと
を有するテキスト検索方法。
The present invention may have the following configurations as described below.
(Appendix 1)
A computer that performs a text search that combines a search condition that includes the first character string and a negative condition that does not include the second character string,
When the second character string is a character string including the first character string, the number of appearances counts the number of appearances of the first character string and the second character string, respectively, in the search target text. A count function,
The number of appearances of the first character string and the second character string is compared in the search target text, and the search is performed when the number of appearances of the first character string and the second character string is the same. Comparison / determination of the number of appearances when it is determined that the target text is not a hit target, and when the number of appearances of the first character string is greater than the number of appearances of the second character string, the search target text is determined as a hit target A text search program to function as a functional part.
(Appendix 2)
When the first character string and the second character string are included in the search target text, the appearance count counting function unit is configured to display the first character string and the second character string in the search target text. The text search program according to appendix 1, which counts the number of occurrences of each character string.
(Appendix 3)
The text search program according to appendix 1 or 2, wherein the appearance count function unit and the appearance count comparison / determination function unit are provided in a search function unit that performs the text search.
(Appendix 4)
A text search device that performs a text search that combines a search condition that includes a first character string and a negative condition that does not include a second character string,
When the second character string is a character string including the first character string, the number of appearances counts the number of appearances of the first character string and the second character string, respectively, in the search target text. A count function,
The number of appearances of the first character string and the second character string is compared in the search target text, and the search is performed when the number of appearances of the first character string and the second character string is the same. Comparison / determination of the number of appearances when the target text is determined not to be hit and the number of appearances of the first character string is greater than the number of appearances of the second character string A text search apparatus having a function unit.
(Appendix 5)
A text search method for performing a text search that combines a search condition that a computer includes a first character string and a negative condition that the computer does not include a second character string,
The computer counts the number of appearances of the first character string and the second character string in the search target text when the second character string is a character string including the first character string. An appearance count step,
The computer compares the number of appearances of the first character string and the second character string in the text to be searched, and the number of appearances of the first character string and the second character string is the same. The number of appearances when the text to be searched is determined not to be hit and the number of appearances of the first character string is greater than the number of appearances of the second character string A text search method comprising a comparison / determination step.

本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。   The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.

従来のNOT検索方法による検索処理の一例のイメージ図である。It is an image figure of an example of the search process by the conventional NOT search method. 本実施例の拡張NOT検索方法による検索処理の一例のイメージ図である。It is an image figure of an example of the search process by the extended NOT search method of a present Example. 本実施例の拡張NOT検索を行うシステムの一例の構成図である。It is a block diagram of an example of the system which performs the extended NOT search of a present Example. テキスト検索装置の一例の構成図である。It is a block diagram of an example of a text search device. 本実施例の拡張NOT検索を行うテキスト検索装置の一例のブロック図である。It is a block diagram of an example of the text search apparatus which performs the extended NOT search of a present Example. 本実施例の拡張NOT検索を行うテキスト検索装置の処理手順を表した一例のフローチャートである。It is a flowchart of an example showing the process sequence of the text search apparatus which performs the extended NOT search of a present Example. 本実施例の拡張NOT検索を行うテキスト検索装置の他の例のブロック図である。It is a block diagram of the other example of the text search apparatus which performs the extended NOT search of a present Example. 本実施例の拡張NOT検索を行うテキスト検索装置の処理手順を表した他の例のフローチャートである。It is a flowchart of the other example showing the process sequence of the text search apparatus which performs the extended NOT search of a present Example.

符号の説明Explanation of symbols

10、20 テキスト検索装置
21 利用者端末
22 ネットワーク
31 入力装置
32 出力装置
33 ドライブ装置
34 補助記憶装置
35 主記憶装置
36 演算処理装置
37 インターフェース装置
38 記録媒体
41 条件受付機能部
42 検索機能部
43 出現回数カウント機能部
44 出現回数比較・判定機能部
45 結果出力機能部
46 検索対象のテキストデータ
10, 20 Text search device 21 User terminal 22 Network 31 Input device 32 Output device 33 Drive device 34 Auxiliary storage device 35 Main storage device 36 Arithmetic processing device 37 Interface device 38 Recording medium 41 Condition receiving function portion 42 Search function portion 43 Appearance Number of times count function unit 44 Number of appearances comparison / determination function unit 45 Result output function unit 46 Text data to be searched

Claims (5)

第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うコンピュータを、
前記第二の文字列が前記第一の文字列を含む文字列であるとき、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする出現回数カウント機能部と、
前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数を比較し、前記第一の文字列及び前記第二の文字列の出現回数が同一であるとき前記検索対象のテキストをヒット対象外と判定し、前記第一の文字列の出現回数が前記第二の文字列の出現回数よりも多いとき前記検索対象のテキストをヒット対象と判定する出現回数比較・判定機能部と
して機能させる為のテキスト検索プログラム。
A computer that performs a text search that combines a search condition that includes the first character string and a negative condition that does not include the second character string,
When the second character string is a character string including the first character string, the number of appearances counts the number of appearances of the first character string and the second character string, respectively, in the search target text. A count function,
The number of appearances of the first character string and the second character string is compared in the search target text, and the search is performed when the number of appearances of the first character string and the second character string is the same. Comparison / determination of the number of appearances when it is determined that the target text is not a hit target, and when the number of appearances of the first character string is greater than the number of appearances of the second character string, the search target text is determined as a hit target A text search program to function as a functional part.
前記出現回数カウント機能部は、前記検索対象のテキスト内に前記第一の文字列及び前記第二の文字列が含まれるとき、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする請求項1記載のテキスト検索プログラム。   When the first character string and the second character string are included in the search target text, the appearance count counting function unit is configured to display the first character string and the second character string in the search target text. The text search program according to claim 1, wherein the number of occurrences of each character string is counted. 前記出現回数カウント機能部及び出現回数比較・判定機能部は、前記テキスト検索を行う検索機能部に設けられる請求項1又は2記載のテキスト検索プログラム。   The text search program according to claim 1, wherein the appearance count function unit and the appearance number comparison / determination function unit are provided in a search function unit that performs the text search. 第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うテキスト検索装置であって、
前記第二の文字列が前記第一の文字列を含む文字列であるとき、前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする出現回数カウント機能部と、
前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数を比較し、前記第一の文字列及び前記第二の文字列の出現回数が同一であるとき前記検索対象のテキストをヒット対象外と判定し、前記第一の文字列の出現回数が前記第二の文字列の出現回数よりも多いとき前記検索対象のテキストをヒット対象と判定する出現回数比較・判定機能部と
を有するテキスト検索装置。
A text search device that performs a text search that combines a search condition that includes a first character string and a negative condition that does not include a second character string,
When the second character string is a character string including the first character string, the number of appearances counts the number of appearances of the first character string and the second character string, respectively, in the search target text. A count function,
The number of appearances of the first character string and the second character string is compared in the search target text, and the search is performed when the number of appearances of the first character string and the second character string is the same. Comparison / determination of the number of appearances when it is determined that the target text is not a hit target, and when the number of appearances of the first character string is greater than the number of appearances of the second character string, the search target text is determined as a hit target A text search apparatus having a function unit.
コンピュータが第一の文字列を含むという検索条件と、第二の文字列を含まないという否定条件とを組み合わせたテキスト検索を行うテキスト検索方法であって、
前記コンピュータが前記第二の文字列が前記第一の文字列を含む文字列であるとき前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数をそれぞれカウントする出現回数カウントステップと、
前記コンピュータが前記検索対象のテキスト内における前記第一の文字列及び前記第二の文字列の出現回数を比較し、前記第一の文字列及び前記第二の文字列の出現回数が同一であるとき前記検索対象のテキストをヒット対象外と判定し、前記第一の文字列の出現回数が前記第二の文字列の出現回数よりも多いとき前記検索対象のテキストをヒット対象と判定する出現回数比較・判定ステップと
を有するテキスト検索方法。
A text search method for performing a text search that combines a search condition that a computer includes a first character string and a negative condition that the computer does not include a second character string,
The computer counts the number of appearances of the first character string and the second character string in the search target text when the second character string is a character string including the first character string. An appearance count step,
The computer compares the number of appearances of the first character string and the second character string in the text to be searched, and the number of appearances of the first character string and the second character string is the same. The number of occurrences when the text to be searched is determined not to be hit and the number of appearances of the first character string is greater than the number of appearances of the second character string A text search method comprising a comparison / determination step.
JP2008300850A 2008-11-26 2008-11-26 Text search program, text search device, and text search method Expired - Fee Related JP5217958B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008300850A JP5217958B2 (en) 2008-11-26 2008-11-26 Text search program, text search device, and text search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008300850A JP5217958B2 (en) 2008-11-26 2008-11-26 Text search program, text search device, and text search method

Publications (2)

Publication Number Publication Date
JP2010128660A true JP2010128660A (en) 2010-06-10
JP5217958B2 JP5217958B2 (en) 2013-06-19

Family

ID=42329023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008300850A Expired - Fee Related JP5217958B2 (en) 2008-11-26 2008-11-26 Text search program, text search device, and text search method

Country Status (1)

Country Link
JP (1) JP5217958B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019153119A (en) * 2018-03-05 2019-09-12 コニカミノルタ株式会社 Sentence extraction device and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0954777A (en) * 1995-06-09 1997-02-25 Matsushita Electric Ind Co Ltd Information retrieving device
JPH11328195A (en) * 1998-05-13 1999-11-30 Nec Corp Character string retrieving device
JP2005063470A (en) * 2000-01-05 2005-03-10 Mitsubishi Electric Corp Keyword extracting device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0954777A (en) * 1995-06-09 1997-02-25 Matsushita Electric Ind Co Ltd Information retrieving device
JPH11328195A (en) * 1998-05-13 1999-11-30 Nec Corp Character string retrieving device
JP2005063470A (en) * 2000-01-05 2005-03-10 Mitsubishi Electric Corp Keyword extracting device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019153119A (en) * 2018-03-05 2019-09-12 コニカミノルタ株式会社 Sentence extraction device and program

Also Published As

Publication number Publication date
JP5217958B2 (en) 2013-06-19

Similar Documents

Publication Publication Date Title
CN107704480B (en) Method and system for extending and reinforcing knowledge graph and computer medium
CN108763582B (en) File searching method, device, terminal and storage medium
JP5437557B2 (en) Search processing method and search system
WO2017045443A1 (en) Image retrieval method and system
US8626786B2 (en) Dynamic language checking
US20060294049A1 (en) Back-off mechanism for search
US20170109435A1 (en) Apparatus and method for searching for information
CN110096655B (en) Search result sorting method, device, equipment and storage medium
US10235427B2 (en) Entity-driven logic for improved name-searching in mixed-entity lists
US20180218079A1 (en) Method and system for generating phrase blacklist to prevent certain content from appearing in a search result in response to search queries
CN105550217B (en) Scene music searching method and scene music searching device
US9552411B2 (en) Trending suggestions
KR20060043583A (en) Compression of logs of language data
JP2004171258A (en) Permission token management system and program
JP5217958B2 (en) Text search program, text search device, and text search method
US20080077563A1 (en) Determining logically-related sub-strings of a string
JP2024509824A (en) Document editing methods, equipment, devices and storage media
WO2017175247A1 (en) Method and system for generating content from search results rendered by a search engine
JP2010086210A (en) Retrieval method, program, and server for preferentially displaying page corresponding to amount of information
KR100740690B1 (en) Information terminal set up the contents serching system
CN114238976B (en) File detection method and device, readable medium and electronic equipment
JP3563737B2 (en) Search device, search method, and information recording medium
CN113609309B (en) Knowledge graph construction method and device, storage medium and electronic equipment
JP2002207761A (en) Searching device, searching method, program and recording medium
JP2005234688A (en) Method, program and apparatus for discriminating important language, document retrieval apparatus and key word extraction apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5217958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees