JP4034374B2 - Information search system and information search method - Google Patents

Information search system and information search method Download PDF

Info

Publication number
JP4034374B2
JP4034374B2 JP03364897A JP3364897A JP4034374B2 JP 4034374 B2 JP4034374 B2 JP 4034374B2 JP 03364897 A JP03364897 A JP 03364897A JP 3364897 A JP3364897 A JP 3364897A JP 4034374 B2 JP4034374 B2 JP 4034374B2
Authority
JP
Japan
Prior art keywords
text information
information
search
collected
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03364897A
Other languages
Japanese (ja)
Other versions
JPH10232870A (en
Inventor
正浩 梶浦
一男 住田
Original Assignee
株式会社ニューズウオッチ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ニューズウオッチ filed Critical 株式会社ニューズウオッチ
Priority to JP03364897A priority Critical patent/JP4034374B2/en
Publication of JPH10232870A publication Critical patent/JPH10232870A/en
Application granted granted Critical
Publication of JP4034374B2 publication Critical patent/JP4034374B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、たとえば電子メール、WWWホームページ、ネットワークニュース記事およびネットワーク会話システムでの会話ログであるチャットログなどの電子化されたテキスト情報を検索対象とし、これらの中からユーザの要求に合致したものを選択する情報検索システムおよび情報検索方法に係り、特に任意に選択されたテキスト情報およびこのテキスト情報と予め指定された関係を有するテキスト情報から検索条件を生成することによって再現率の高い検索を実現する情報検索システムおよび情報検索方法に関する。
【0002】
【従来の技術】
近年、ワードプロセッサやパーソナルコンピュータの普及に加え、インターネットやパソコン通信などのコンピュータネットワークを介した電子メール、WWW(World Wide Web)の社会への浸透が急速に進んでいる。これにより、個人で保有したりアクセス(入手)可能となる電子化された情報の量は膨大となり、必要とする情報を探し出す労力も増大してきた。
【0003】
このような背景から、個人が保有していたり、公開されている電子的テキスト情報などからユーザの要求・関心にあったものを選択する、いわゆる情報検索システムの需要が高まっている。
【0004】
しかしながら、従来より実現されている情報検索システムは、ユーザが入力した単語(もしくはその同義語)の存在有無によって適合文書を検索する方式を採用しているのが主流であり、単数もしくは複数の指定文書や話題(時間的に連続な電子的テキスト情報)などに類似した電子的テキスト情報を検索するには向いていなかった。
【0005】
【発明が解決しようとする課題】
このように、従来の情報検索システムは、単数もしくは複数の指定文書や話題(時間的に連続な電子的テキスト情報)などに類似した電子的テキスト情報を検索するのには向いていないといった問題があった。
【0006】
この発明はこのような実情に鑑みてなされたものであり、ユーザが指定した単数もしくは複数の電子的テキスト情報の近傍の電子的テキスト情報を検索に用いることによって、それらの電子的テキスト情報と類似した電子的テキスト情報の検索の再現率を向上させ話題に即した検索を可能にする情報検索システムおよび情報検索方法を提供することを目的とする。さらに、この発明は、指定された電子的テキスト情報や近傍の電子的テキスト情報をもとに検索時に実行される同義語の展開を制御することによって、適合率の低下を防止する情報検索システムおよび情報検索方法を提供することを目的とする。
【0007】
【課題を解決するための手段】
この発明は、前述した目的を達成するために、各種テキスト情報を検索対象とする情報検索システムにおいて、複数のテキスト情報の中から一つ以上のテキスト情報を選択させるテキスト情報選択手段と、前記テキスト情報選択手段により選択されたテキスト情報から所定の範囲内に存在するテキスト情報を収集する関係テキスト情報収集手段と、前記テキスト情報選択手段により選択されたテキスト情報と前記関係テキスト情報収集手段により収集されたテキスト情報とから検索条件を生成する検索条件生成手段と、前記検索条件生成手段により生成された検索条件に合致するテキスト情報を検索するテキスト情報検索手段とを具備してなることを特徴とする。
【0008】
【発明の実施の形態】
以下、図面を参照してこの発明の一実施形態を説明する。
図1に、この発明の実施形態に係る情報検索システムが動作する情報機器の概略構成を示す。図1に示すように、この実施形態の情報検索システムが動作する情報機器は、機器全体の制御や各種処理を行なう中央処理装置1、プログラムならびにデータを格納する半導体メモリ、磁器ディスク、光ディスクなどの記憶装置2、インターネットやパソコン通信サービスシステムなどの情報源にアクセスするための通信装置3、ユーザからの指示を受けるためのキーボードやマウスなどの入力装置4およびユーザに情報を伝達するためのモニタなどの出力装置5から構成される。すなわち、この実施形態の情報検索システムは、ごく一般的なパーソナルコンピュータもしくはそれと同等以上の機能をもつ情報機器上で動作するものである。
【0009】
図2に、この実施形態の情報検索システムの機能構成を示す。図2に示したように、この実施形態の情報検索システムは、ユーザが検索命令生成の種となるテキスト情報を選択するテキスト情報選択部11と、そのユーザによる制御のためのユーザインターフェース部12と、ユーザが保有するテキスト情報を記憶するテキスト情報記憶部13と、ネットワークニュースにアクセスするためのニュース記事アクセス部14と、WWWホームページにアクセスするためのWWWアクセス部15と、予め指定された関係を有するテキスト情報(近傍テキスト情報)を選択するための近傍テキスト情報選択部16と、近傍テキスト情報の選択時に使用するパラメータを記憶するパラメータ記憶部17と、テキスト情報から検索命令を生成する検索命令生成部18と、テキスト情報からの同義語の展開を制御する同義語展開制御部19と、同義語辞書を記憶するための同義語辞書記憶部20と、テキスト情報の集合から検索命令に適合するテキスト情報を検索するテキスト情報検索部21と、検索結果をユーザに提示する検索結果表示部22により構成される。
【0010】
図3に、この実施形態の情報検索システムの処理の流れを示す。
この情報検索システムの処理は、図3に示したように、ユーザが指定したテキスト情報の近傍の電子的テキスト情報の選択(ステップA1)、ステップA1で得られたテキスト情報からの検索命令の生成(ステップA2)、ステップA1で得られたテキスト情報をもとにした検索命令の単語の同義語展開(ステップA3)、この展開によって得られた単語によるテキスト情報の検索(ステップA4)からなる。以下、それぞれの処理を詳細に説明する。
【0011】
図4には、図3のステップA1の処理の詳細が示されている。この情報検索システムでは、選択されたテキスト情報(1つでも複数でも構わない)各々について、
(1)指定されたテキスト情報がWWWホームページであれば、そのホームページの近傍のホームページを探す(ステップB3)。
【0012】
(2)指定されたテキスト情報がネットワークニュース記事であれば、そのニュース記事の近傍のニュース記事を探す(ステップB5)。
(3)指定されたテキスト情報が電子メールであれば、その電子メールの近傍の電子メールを探す(ステップB7)。
【0013】
(4)指定されたテキスト情報がチャットログであれば、そのチャットログの指定位置の近傍のログの範囲を決定する。(ステップB9)。
ここで、「近傍」とは、テキスト情報に置ける「距離」の定義によって変わってくる。まず、ここで各テキスト情報においての「距離」を定義する。
【0014】
(1)WWWホームページの場合の距離は、あるホームページから他のあるページにたどり着くまでに必要な、たどったリンク数の中の最小のものと定義する。
【0015】
(2)ネットワークニュース記事の場合は、スレッド(フォロー記事の連鎖)内の記事を時系列順に並べたときに、同じスレッド内にある2記事間の距離は各々記事に付与された順番の差と定義する(異なるスレッドの記事間では距離は無限大)。
【0016】
(3)電子メールの場合は、ネットワークニュース記事の場合と同じ。
(4)チャットログの場合は、2つの位置の間の距離は2つの位置の間に含まれる文字数/文の数/段落の数、もしくは2つの位置の時刻の差のいずれかと定義し、ユーザが選択できるようにする。
【0017】
2つのテキスト情報が「近傍」にあるかどうかは、2つのテキスト情報間の距離があるしきい値以内に入っているかどうかで判断する。この情報検索システムでは、このしきい値をパラメータ記憶部17に記憶し、また、ユーザの判断で値を変更することが可能である。
【0018】
図5には、図3のステップA2の処理の詳細が示されている。この情報検索システムでは、検索命令は、適合文書か否かの判断が可能な単語の集合であるとする。
【0019】
まず、情報検索システムは、ユーザの指定もしくは近傍のテキスト情報各々から形態素解析などの手法により単語を切り出す(ステップC1)。次に、これにより得られた単語を頻度の大きい順に並び変え(ステップC2)、そのうち予めパラメータ記憶部17に記憶されたパラメータ(しきい値)以下の頻度の単語を削除する(ステップC3)。そして、この手順によって残った単語を検索命令とする。このパラメータは、ユーザによって変更が可能である。
【0020】
図6には、図3のステップA3の処理の詳細が示されている。ここでは、まず具体例を説明する。
同義語辞書の形式は、同義語とその同義語が属する概念との対のリストが「見出し語」に結び付いているものとする。表現の形式としては、たとえば図7の形式が考えられる。ここで、この同義語辞書には、図8に示す内容が格納されていると仮定する。また、矢印は各同義語ノードをリンクするためのポインタを表している。そして、このような辞書に対して「CD」という単語の同義語展開を考える。
【0021】
同義語辞書中の「CD」は、
概念A
キャッシュディスペンサ
キャッシュディスペンサー
現金自動支払機
cash dispenser
概念B
コンパクトディスク
compact disc
概念C
譲渡性預貯金
概念D
軍縮会議(Conference on Disarmament)
のように、「CD」は4つの概念に分類される合計11の単語に展開されたとする。
【0022】
このとき、どの概念の同義語を選択するかは、ユーザが指定したテキスト情報やその近傍のテキスト情報がどの概念の単語を多く含んでいるかによる。概念Bの単語がテキスト情報に多ければ、「CD」の同義語としては「コンパクトディスク」や「compact disc」を採用する。
【0023】
この具体例を踏まえて、図6を参照して同義語展開の詳細を説明する。この情報検索システムは、検索命令の単語1つ1つに対して、まず単語の同義語を展開し(ステップD2)、同義語展開で得た概念の種類についてユーザが指定したテキスト情報やその近傍のテキスト情報がどの概念の単語を多く含んでいるか調べて(ステップD3)、もっとも多く存在する概念に属する同義語を採用する(ステップD4)。
【0024】
これら「近傍」のテキスト情報群は、それらで1つの話題を構成している場合があると考えられる。したがって、この情報検索システムにように、近傍のテキスト情報を用いることで話題に即した検索が可能になり、また、近傍のテキスト情報に含まれる単語が元の電子的テキスト情報に含まれる単語より多くなるので検索の再現率を向上させることができる。
【0025】
また、同義語展開の制御を行なうことにより、不要な概念に属した単語による検索を排除し、不要なテキスト情報の検索を避ける結果、適合率の低下を防止することが可能になる。
【0026】
なお、前述した実施形態の情報検索システムでは、ユーザ指定のテキスト情報やその近傍の電子的テキスト情報情報によって同義語展開を制御していたが、同義語辞書に含まれている同義語をそのまますべて採用する場合であっても、検索の再現率を向上させることができるために有効である。
【0027】
また、ユーザが指定した電子的テキスト情報の近傍のテキスト情報を決定しなくい場合であっても、ユーザ指定のテキスト情報処理によって同義語展開を制御すれば、適合率の低下を防止することが可能となり有効である。
【0028】
【発明の効果】
以上詳述したように、この発明によれば、ユーザが指定したテキスト情報の近傍の電子的テキスト情報を検索命令作成のための情報とすることにより、検索の再現率が高まり話題に即した検索を可能とすることができる。
【0029】
また、ユーザが指定したテキスト情報や近傍の電子的テキスト情報をもとに同義語展開を制御することによって、検索の適合率の低下を防止することが可能となる。
【図面の簡単な説明】
【図1】この発明の実施形態に係る情報検索システムが動作する情報機器の概略構成を示す図。
【図2】同実施形態の情報検索システムの機能構成を示す図。
【図3】同実施形態の情報検索システムの処理の流れを示すフローチャート。
【図4】図3のステップA1の処理の詳細を示すフローチャート。
【図5】図3のステップA2の処理の詳細を示すフローチャート。
【図6】図3のステップA3の処理の詳細を示すフローチャート。
【図7】同実施形態の同義語辞書の形式を示す概念図。
【図8】同実施形態の同義語辞書の格納内容の具体例を例す図。
【符号の説明】
1…中央処理装置、2…記憶装置、3…通信装置、4…入力装置、5…表示装置、11…テキスト情報選択部、12…ユーザインターフェース部、13…テキスト情報記憶部、14…ニュース記事アクセス部、15…WWWアクセス部、16…近傍テキスト情報選択部、17…パラメータ記憶部、18…検索命令生成部、19…同義語展開制御部、20…同義語辞書記憶部、21…テキスト情報検索部、22…検索結果表示部。
[0001]
BACKGROUND OF THE INVENTION
The present invention searches electronic text information such as e-mails, WWW homepages, network news articles, and chat logs that are conversation logs in a network conversation system, and matches the user's request from these. Search system and information search method for selecting a user, and in particular, a search with a high reproducibility is realized by generating a search condition from arbitrarily selected text information and text information having a predetermined relationship with the text information. The present invention relates to an information search system and an information search method.
[0002]
[Prior art]
In recent years, in addition to the widespread use of word processors and personal computers, the spread of electronic mail and WWW (World Wide Web) via computer networks such as the Internet and personal computer communication has been rapidly progressing. As a result, the amount of computerized information that can be held and accessed (obtained) by individuals has become enormous, and the effort to search for necessary information has increased.
[0003]
From such a background, there is an increasing demand for a so-called information retrieval system that selects an electronic text information possessed by an individual or publicly available to meet a user's request / interest.
[0004]
However, the information retrieval system that has been realized in the past mainly adopts a method of searching for a conforming document based on the presence or absence of a word (or its synonym) input by a user, and a single or plural designations are adopted. It was not suitable for searching electronic text information similar to documents and topics (electronic text information continuous in time).
[0005]
[Problems to be solved by the invention]
As described above, the conventional information retrieval system is not suitable for retrieving electronic text information similar to one or a plurality of designated documents or topics (electronic text information continuous in time). there were.
[0006]
The present invention has been made in view of such circumstances, and uses electronic text information in the vicinity of one or more electronic text information specified by the user for retrieval, thereby resembling the electronic text information. It is an object of the present invention to provide an information search system and an information search method capable of improving the recall of electronic text information search and enabling search in accordance with the topic. Furthermore, the present invention provides an information retrieval system for preventing a decrease in precision by controlling the development of synonyms executed at the time of retrieval based on designated electronic text information and nearby electronic text information, and The object is to provide an information retrieval method.
[0007]
[Means for Solving the Problems]
In order to achieve the above-described object, the present invention provides a text information selection means for selecting one or more text information from a plurality of text information in an information search system for searching various text information, and the text A relational text information collecting means for collecting text information existing within a predetermined range from the text information selected by the information selecting means; a text information selected by the text information selecting means; and a relational text information collecting means. Search condition generation means for generating a search condition from the text information obtained, and text information search means for searching for text information that matches the search condition generated by the search condition generation means. .
[0008]
DETAILED DESCRIPTION OF THE INVENTION
An embodiment of the present invention will be described below with reference to the drawings.
FIG. 1 shows a schematic configuration of an information device on which an information search system according to an embodiment of the present invention operates. As shown in FIG. 1, the information apparatus on which the information retrieval system of this embodiment operates includes a central processing unit 1 that controls the entire apparatus and performs various processes, a semiconductor memory that stores programs and data, a magnetic disk, an optical disk, and the like. A storage device 2, a communication device 3 for accessing information sources such as the Internet and a personal computer communication service system, an input device 4 such as a keyboard and a mouse for receiving instructions from a user, and a monitor for transmitting information to the user Output device 5. That is, the information retrieval system of this embodiment operates on a very general personal computer or an information device having a function equivalent to or better than that.
[0009]
FIG. 2 shows a functional configuration of the information search system of this embodiment. As shown in FIG. 2, the information search system of this embodiment includes a text information selection unit 11 for selecting text information as a seed for generating a search command, and a user interface unit 12 for control by the user. A text information storage unit 13 for storing text information held by the user, a news article access unit 14 for accessing network news, a WWW access unit 15 for accessing a WWW homepage, and a predetermined relationship. A neighboring text information selection unit 16 for selecting text information (neighboring text information), a parameter storage unit 17 for storing parameters used when selecting the neighboring text information, and a search command generation for generating a search command from the text information Part 18 and controls the development of synonyms from text information A synonym expansion control unit 19, a synonym dictionary storage unit 20 for storing a synonym dictionary, a text information search unit 21 that searches text information suitable for a search command from a set of text information, and a search result as a user The search result display part 22 presented in FIG.
[0010]
FIG. 3 shows a processing flow of the information search system of this embodiment.
As shown in FIG. 3, the processing of this information retrieval system selects electronic text information in the vicinity of text information designated by the user (step A1), and generates a search command from the text information obtained in step A1. (Step A2), synonym expansion of words of the search command based on the text information obtained in Step A1 (Step A3), and retrieval of text information by the words obtained by this expansion (Step A4). Hereinafter, each processing will be described in detail.
[0011]
FIG. 4 shows details of the processing in step A1 of FIG. In this information retrieval system, for each selected text information (which may be one or more),
(1) If the designated text information is a WWW homepage, a homepage in the vicinity of the homepage is searched (step B3).
[0012]
(2) If the designated text information is a network news article, search for a news article near the news article (step B5).
(3) If the designated text information is an electronic mail, an electronic mail in the vicinity of the electronic mail is searched (step B7).
[0013]
(4) If the designated text information is a chat log, the log range in the vicinity of the designated position of the chat log is determined. (Step B9).
Here, “neighborhood” varies depending on the definition of “distance” that can be placed in the text information. First, the “distance” in each text information is defined here.
[0014]
(1) The distance in the case of a WWW home page is defined as the minimum number of links required to reach from a home page to another page.
[0015]
(2) In the case of network news articles, when articles in a thread (following article chain) are arranged in chronological order, the distance between two articles in the same thread is the difference in the order given to each article. Define (the distance between articles in different threads is infinite).
[0016]
(3) In the case of e-mail, the same as in the case of network news articles.
(4) In the case of a chat log, the distance between two positions is defined as either the number of characters / number of sentences / number of paragraphs included between the two positions or the time difference between the two positions. Can be selected.
[0017]
Whether or not the two pieces of text information are “near” is determined by whether or not the distance between the two pieces of text information is within a certain threshold. In this information retrieval system, this threshold value can be stored in the parameter storage unit 17, and the value can be changed at the user's discretion.
[0018]
FIG. 5 shows details of the process in step A2 of FIG. In this information search system, it is assumed that the search command is a set of words that can be determined as to whether the document is a relevant document.
[0019]
First, the information retrieval system cuts out a word from a user's designation or each nearby text information by a technique such as morphological analysis (step C1). Next, the words thus obtained are rearranged in descending order of frequency (step C2), and words having a frequency equal to or lower than the parameter (threshold value) stored in advance in the parameter storage unit 17 are deleted (step C3). Then, the word remaining by this procedure is used as a search command. This parameter can be changed by the user.
[0020]
FIG. 6 shows details of the process in step A3 of FIG. Here, a specific example will be described first.
The synonym dictionary format is such that a list of pairs of synonyms and concepts to which the synonyms belong is linked to “headwords”. As a form of expression, for example, the form of FIG. 7 can be considered. Here, it is assumed that the contents shown in FIG. 8 are stored in this synonym dictionary. Moreover, the arrow represents the pointer for linking each synonym node. Then, consider the synonym expansion of the word “CD” for such a dictionary.
[0021]
"CD" in the synonym dictionary is
Concept A
Cash dispenser cash dispenser cash dispenser
Concept B
Compact disc compact disc
Concept C
Transferable deposits concept D
Conference on Disarmament
Suppose that “CD” is expanded into a total of 11 words classified into four concepts.
[0022]
At this time, which concept synonym is selected depends on which concept word contains a lot of text information specified by the user and text information in the vicinity thereof. If there are many words of concept B in the text information, “compact disc” or “compact disc” is adopted as a synonym for “CD”.
[0023]
Based on this specific example, details of synonym development will be described with reference to FIG. This information retrieval system first expands a synonym of a word for each word of a search command (step D2), and text information designated by the user for the type of concept obtained by synonym expansion and its vicinity The concept information contains many words of which concept (step D3), and synonyms belonging to the most existing concept are adopted (step D4).
[0024]
These “neighboring” text information groups may constitute one topic in some cases. Therefore, as in this information search system, it is possible to search according to the topic by using the nearby text information, and the word included in the nearby text information is more than the word included in the original electronic text information. As the number increases, the reproduction rate of the search can be improved.
[0025]
Further, by controlling the synonym expansion, it is possible to eliminate a search by a word belonging to an unnecessary concept and avoid a search for unnecessary text information, thereby preventing a decrease in precision.
[0026]
In the information retrieval system of the above-described embodiment, synonym expansion is controlled by text information specified by the user and electronic text information information in the vicinity thereof, but all synonyms included in the synonym dictionary are directly used. Even if it is adopted, it is effective because the recall rate of search can be improved.
[0027]
Moreover, even if it is not necessary to determine text information in the vicinity of electronic text information designated by the user, if the synonym development is controlled by the text information processing designated by the user, it is possible to prevent the precision from being lowered. It is possible and effective.
[0028]
【The invention's effect】
As described above in detail, according to the present invention, electronic text information in the vicinity of text information designated by the user is used as information for creating a search command, so that the search reproducibility is increased and the search is adapted to the topic. Can be made possible.
[0029]
In addition, by controlling synonym development based on text information specified by the user and electronic text information in the vicinity, it is possible to prevent a decrease in the search precision.
[Brief description of the drawings]
FIG. 1 is a diagram showing a schematic configuration of an information device on which an information search system according to an embodiment of the present invention operates.
FIG. 2 is an exemplary diagram showing a functional configuration of the information search system according to the embodiment.
FIG. 3 is an exemplary flowchart showing the flow of processing of the information search system of the embodiment;
4 is a flowchart showing details of processing in step A1 in FIG. 3;
FIG. 5 is a flowchart showing details of processing in step A2 of FIG. 3;
FIG. 6 is a flowchart showing details of processing in step A3 of FIG. 3;
FIG. 7 is a conceptual diagram showing a format of a synonym dictionary according to the embodiment.
FIG. 8 is a diagram illustrating a specific example of the stored contents of the synonym dictionary of the embodiment.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Central processing unit, 2 ... Memory | storage device, 3 ... Communication apparatus, 4 ... Input device, 5 ... Display apparatus, 11 ... Text information selection part, 12 ... User interface part, 13 ... Text information storage part, 14 ... News article Access unit, 15 ... WWW access unit, 16 ... Neighboring text information selection unit, 17 ... Parameter storage unit, 18 ... Search command generation unit, 19 ... Synonym expansion control unit, 20 ... Synonym dictionary storage unit, 21 ... Text information Search unit, 22 ... Search result display unit.

Claims (10)

各種テキスト情報を検索対象とする情報検索システムにおいて、
複数のテキスト情報の中から一つ以上のテキスト情報を選択させるテキスト情報選択手段と、
前記テキスト情報選択手段により選択されたテキスト情報から指定されたしきい値の範囲を検索し、当該範囲に存在するテキスト情報を収集する関係テキスト情報収集手段と、
前記テキスト情報選択手段により選択されたテキスト情報と前記関係テキスト情報収集手段により収集されたテキスト情報とから検索条件を生成する検索条件生成手段と、
前記検索条件生成手段により生成された検索条件に合致するテキスト情報を検索するテキスト情報検索手段と
を具備してなることを特徴とする情報検索システム。
In an information search system that searches various text information,
Text information selection means for selecting one or more text information from a plurality of text information;
Relevant text information collecting means for searching a specified threshold range from text information selected by the text information selecting means and collecting text information existing in the range ;
Search condition generating means for generating a search condition from the text information selected by the text information selecting means and the text information collected by the related text information collecting means;
An information search system comprising: text information search means for searching for text information that matches the search conditions generated by the search condition generation means.
前記関係テキスト情報収集手段は、前記テキスト情報選択手段により選択されたテキスト情報がハイパーテキスト型データである場合、そのテキスト情報と前記しきい値として指定されたリンク数以内で連結されたテキスト情報を収集することを特徴とする請求項1記載の情報検索システム。When the text information selected by the text information selection unit is hypertext type data, the related text information collection unit displays the text information connected to the text information within the number of links specified as the threshold value. The information search system according to claim 1, wherein the information search system is collected. 前記関係テキスト情報収集手段は、前記テキスト情報選択手段により選択されたテキスト情報が生成順序または生成時刻を持つデータである場合、テキスト情報を時系列に並べた場合に付与される順番の差または時刻の差が前記テキスト情報選択手段により選択されたテキスト情報との間で前記しきい値として指定された値以内のテキスト情報を収集することを特徴とする請求項1記載の情報検索システム。The related text information collecting means, when the text information selected by the text information selecting means is data having a generation order or generation time, a difference in order or time given when the text information is arranged in time series 2. The information search system according to claim 1, wherein the text information within the value specified as the threshold value is collected from the text information selected by the text information selection means. 前記関係テキスト情報収集手段は、前記テキスト情報選択手段により選択されたテキスト情報がログデータである場合、前記テキスト情報選択手段により選択されたテキスト情報との間に介在する文字数、文の数または段落数が前記しきい値として指定された数以内のテキスト情報を収集することを特徴とする請求項1記載の情報検索システム。When the text information selected by the text information selection unit is log data, the related text information collection unit includes the number of characters, the number of sentences, or the paragraph interposed between the text information selected by the text information selection unit. 2. The information retrieval system according to claim 1, wherein text information within a number specified as the threshold value is collected. 前記テキスト情報選択手段により選択されたテキスト情報と前記関係テキスト情報収集手段により収集されたテキスト情報とを用いて前記検索条件生成手段により生成された検索条件に含まれる検索語の同義語展開を制御する同義語展開制御手段をさらに具備してなることを特徴とする請求項1記載の情報検索システム。  Controlling synonym expansion of search terms included in the search condition generated by the search condition generation means using the text information selected by the text information selection means and the text information collected by the related text information collection means The information retrieval system according to claim 1, further comprising synonym expansion control means. 各種テキスト情報を検索対象とする、コンピュータにおける情報検索方法において、
前記コンピュータが、
複数のテキスト情報の中から一つ以上のテキスト情報を選択する入力を受け付け
前記選択されたテキスト情報から指定されたしきい値の範囲を検索し、当該範囲に存在するテキスト情報を収集し、
前記選択されたテキスト情報と前記収集されたテキスト情報とから検索条件を生成し、
前記生成された検索条件に合致するテキスト情報を検索する
ことを特徴とする情報検索方法。
In an information search method for a computer, which searches various text information,
The computer is
Accepts input to select one or more text information from multiple text information,
Search the specified threshold range from the selected text information, collect the text information existing in the range ,
Generating a search condition from the selected text information and the collected text information;
Searching for text information that matches the generated search condition.
前記コンピュータによる前記関係テキスト情報の収集は、前記選択されたテキスト情報がハイパーテキスト型データである場合、そのテキスト情報と前記しきい値として指定されたリンク数以内で連結されたテキスト情報を収集するものであることを特徴とする請求項6記載の情報検索方法。 The related text information is collected by the computer when the selected text information is hypertext type data, and the text information connected with the text information within the number of links specified as the threshold is collected. The information retrieval method according to claim 6, wherein the information retrieval method is a thing. 前記コンピュータによる前記関係テキスト情報の収集は、前記選択されたテキスト情報が生成順序または生成時刻を持つデータである場合、テキスト情報を時系列に並べた場合に付与される順番の差または時刻の差が前記選択されたテキスト情報との間で前記しきい値として指定された値以内のテキスト情報を収集するものであることを特徴とする請求項6記載の情報検索方法。 The related text information is collected by the computer when the selected text information is data having a generation order or generation time, or when the text information is arranged in time series, the difference in order or time difference is given. The information search method according to claim 6, wherein text information within a value specified as the threshold value is collected with the selected text information. 前記コンピュータによる前記関係テキスト情報の収集は、前記選択されたテキスト情報がログデータである場合、前記選択されたテキスト情報との間に介在する文字数、文の数または段落数が前記しきい値として指定された数以内のテキスト情報を収集するものであることを特徴とする請求項6記載の情報検索方法。 In the collection of the related text information by the computer , when the selected text information is log data, the number of characters, the number of sentences or the number of paragraphs intervening with the selected text information is used as the threshold value. 7. The information search method according to claim 6, wherein text information within a specified number is collected. さらに、前記コンピュータが、前記選択されたテキスト情報と前記収集されたテキスト情報とを用いて前記生成された検索条件に含まれる検索語の同義語展開を制御することを特徴とする請求項6記載の情報検索方法。The computer further controls synonym expansion of a search term included in the generated search condition using the selected text information and the collected text information. Information retrieval method.
JP03364897A 1997-02-18 1997-02-18 Information search system and information search method Expired - Fee Related JP4034374B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03364897A JP4034374B2 (en) 1997-02-18 1997-02-18 Information search system and information search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03364897A JP4034374B2 (en) 1997-02-18 1997-02-18 Information search system and information search method

Publications (2)

Publication Number Publication Date
JPH10232870A JPH10232870A (en) 1998-09-02
JP4034374B2 true JP4034374B2 (en) 2008-01-16

Family

ID=12392279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03364897A Expired - Fee Related JP4034374B2 (en) 1997-02-18 1997-02-18 Information search system and information search method

Country Status (1)

Country Link
JP (1) JP4034374B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542887B (en) * 2011-12-31 2014-04-16 燕山大学 Demonstrating device for light oscillography vector synthesis graph line

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000025234A1 (en) * 1998-10-26 2000-05-04 Choonyeol Yu Database system and search keyword of 5w1h and hierarchical structure
AU769098B2 (en) * 1999-05-28 2004-01-15 Index Systems, Inc. Method and system utilizing text selected on a web page for searching in a database of television programs
WO2006003692A1 (en) 2004-06-30 2006-01-12 Fujitsu Limited Information search terminal
JP4388137B2 (en) 2008-03-10 2009-12-24 パナソニック株式会社 Content search apparatus and content search method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03174653A (en) * 1989-12-01 1991-07-29 Matsushita Electric Ind Co Ltd Method and device for control of key word
JP3023943B2 (en) * 1993-07-29 2000-03-21 富士通株式会社 Document search device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542887B (en) * 2011-12-31 2014-04-16 燕山大学 Demonstrating device for light oscillography vector synthesis graph line

Also Published As

Publication number Publication date
JPH10232870A (en) 1998-09-02

Similar Documents

Publication Publication Date Title
US8037065B1 (en) Information extraction from a database
Pazzani et al. Syskill & Webert: Identifying interesting web sites
Balabanovic et al. An adaptive agent for automated web browsing
Brin et al. What can you do with a web in your pocket?
US5649186A (en) System and method for a computer-based dynamic information clipping service
CN1871603B (en) System and method for processing a query
US8224857B2 (en) Techniques for personalized and adaptive search services
US6772141B1 (en) Method and apparatus for organizing and using indexes utilizing a search decision table
JP4241934B2 (en) Text processing and retrieval system and method
US8756212B2 (en) Techniques for web site integration
KR100672277B1 (en) Personalized Search Method Using Cookie Information And System For Enabling The Method
JP2001510607A (en) Intelligent network browser using indexing method based on proliferation concept
EP1508105A2 (en) System and method for automatically discovering a hierarchy of concepts from a corpus of documents
JP2008071372A (en) Method and device for searching data of database
KR20070058685A (en) Presentation of search results based on document structure
Yang et al. Hierarchical summarization of large documents
JP4034374B2 (en) Information search system and information search method
Kimoto et al. Construction of a dynamic thesaurus and its use for associated information retrieval
Al-Khateeb et al. Query reformulation using WordNet and genetic algorithm
JP3512926B2 (en) Information filtering device
Letsche Toward large-scale information retrieval using latent semantic indexing
Choi Knowledge Engineering the Web
JP4094844B2 (en) Document collection apparatus for specific use, method thereof, and program for causing computer to execute
Sunita et al. Web URLs retrieval with least execution time using MPV clustering approach
TWI290684B (en) Incremental thesaurus construction method

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20041203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071025

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees