JP2000259648A - Sentence retrieving device, its retrieving method and computer readable recording medium storing sentence retrieving program - Google Patents

Sentence retrieving device, its retrieving method and computer readable recording medium storing sentence retrieving program

Info

Publication number
JP2000259648A
JP2000259648A JP11058791A JP5879199A JP2000259648A JP 2000259648 A JP2000259648 A JP 2000259648A JP 11058791 A JP11058791 A JP 11058791A JP 5879199 A JP5879199 A JP 5879199A JP 2000259648 A JP2000259648 A JP 2000259648A
Authority
JP
Japan
Prior art keywords
data
search
sentence
text
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11058791A
Other languages
Japanese (ja)
Inventor
広市 ▲吉▼田
Hiroichi Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11058791A priority Critical patent/JP2000259648A/en
Publication of JP2000259648A publication Critical patent/JP2000259648A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a sentence retrieving device capable of improving the efficiency of retrieval. SOLUTION: Plural data including sentences constituting a hypertext linking plural sentences through a communication part 13 are collected under the control of a CPU 11. Plural linked sentences judged from the linked relation of the hypertext in the collected data are integrated into a sentence and the integrated sentence is stored in an integrated sentence storing area 21. When one or more retrieving character strings are specified and inputted from an input part 12, a retrieval part 15 retrieves the retrieving character strings from the integrated sentence stored in the storing area 21 and displays the retrieved result on a display part 16.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明はハイパーテキスト
など、特定のキーワードなどで有機的に結び合わせて作
成される文章を検索対象とする文章検索装置および方法
ならびに文章検索プログラムを記録したコンピュータで
読取り可能な記録媒体に関し、特に、リンクされている
複数の文章を1つに統合して検索する文章検索装置およ
び方法ならびに文章検索プログラムを記録したコンピュ
ータで読取り可能な記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a text search apparatus and a text search method for a text, such as a hypertext, which is created by being organically linked with a specific keyword or the like, and a computer which records a text search program. In particular, the present invention relates to a text search apparatus and method for integrating and searching a plurality of linked texts into one, and a computer-readable storage medium storing a text search program.

【0002】なお、ここでリンクを張るとは、相互に関
係付けることをいう。またリンク情報とはこの関係付け
を示す情報を指す。ハイパーテキストとは、音声デー
タ、画像データ、文章データなど同士をデータ中でリン
クを張ることで有機的に結合して作成された文章をい
う。
[0002] It should be noted that linking here means to associate with each other. The link information refers to information indicating this association. The hypertext is a sentence created by linking sound data, image data, sentence data, and the like in the data and organically linking them.

【0003】[0003]

【従来の技術および発明が解決しようとする課題】近
年、文章の検索システムとして種々のものが実用化され
ている。その1つに、インターネットの発達で各種ホー
ムページの情報を収集するサーチエンジン(検索システ
ム)が開発されている。このサーチエンジンでは、ホー
ムページが階層化されて文字列が分散していると検索し
たい文字列が別々の文章に分かれて存在するため文字列
が完全に一致せずに、検索できない。逆に、検索する文
字列を短く区切ると不要なホームページが大量に検索抽
出されてしまう。
2. Description of the Related Art In recent years, various text retrieval systems have been put into practical use. As one of them, a search engine (search system) for collecting information of various homepages with the development of the Internet has been developed. In this search engine, if the home page is hierarchized and the character strings are dispersed, the character strings to be searched are divided into different sentences, and the character strings do not completely match and cannot be searched. Conversely, if the character string to be searched is delimited, a large number of unnecessary homepages will be searched and extracted.

【0004】全部を検索対象とするいわゆるフルテキト
ストサーチ技術は、インターネットのサーチエンジンで
よく使われている。しかし、検索文字列が一致している
かどうかは、1つの文章内に限定されており、その文章
内からリンクが張られた別の文章までを1つの文章とし
て扱ってサーチするものではない。大規模な文章を階層
化して複数の文章に分割することで、該文章が一画面に
表示されたときに一覧性に優れる文章として、たとえば
インターネットで公開される文章があるが、このような
文章から目的の文章を効率よく探すには、階層化して分
割されたそれらの文章を本来の形の1つの文章としてま
とめて扱うことが重要である。
[0004] The so-called full-text search technique for searching all is often used in search engines on the Internet. However, whether or not the search character strings match is limited to one sentence, and a search is not performed by treating a part of the sentence up to another linked text as one sentence. By dividing a large-scale sentence into a plurality of sentences and dividing the sentence into a plurality of sentences, when the sentence is displayed on one screen, there is a sentence that is excellent in listing, for example, a sentence published on the Internet. In order to efficiently search for a target sentence from a group, it is important to collectively treat the hierarchized and divided sentences as one original form.

【0005】特開平8−249342号公報には、ハイ
パーテキストを構成するカードの中からリンク情報に従
って検索表インデックスを参照し、指示した語句を含む
カード(文章)およびそのカードをリンク先に持つカー
ドを検索する装置が示される。しかしながら、本公報に
開示の技術ではリンクされている文章(カード)を1つ
に結合してから検索するものではないから、検索のヒッ
ト率に優れない。
Japanese Patent Laid-Open Publication No. Hei 8-249342 discloses a card (sentence) including a designated phrase and a card having the card as a link destination by referring to a search table index according to link information from cards constituting a hypertext. Is shown. However, the technique disclosed in this publication does not search for linked texts (cards) after merging them into one sentence, so that the search hit rate is not excellent.

【0006】それゆえに、この発明の目的は検索のヒッ
ト率に優れる文章検索装置および方法ならびに文章検索
プログラムを記録したコンピュータで読取り可能な記録
媒体を提供することである。
SUMMARY OF THE INVENTION It is therefore an object of the present invention to provide a text search apparatus and a text search method having an excellent search hit rate and a computer-readable recording medium storing a text search program.

【0007】[0007]

【課題を解決するための手段】請求項1に記載の文章検
索装置は、各データ内で相互に関連付けるためのリンク
情報に従い関連付けられた文章データを含む複数のデー
タを記憶する記憶手段と、記憶手段中の複数のデータを
リンク情報に従い統合処理して1つ以上の統合文章デー
タに生成するための統合手段と、1つ以上の検索文字列
データを指定する指定手段と、統合手段により統合され
た1つ以上の統合文章データのそれぞれにおいて、指定
手段により指定された1つ以上の検索文字列データが含
まれるか否か検索する検索手段と、検索手段の検索結果
を表示する表示手段とを備える。
According to a first aspect of the present invention, there is provided a text search apparatus for storing a plurality of data including text data associated with each other in accordance with link information for associating the data with each other. The integrating means for integrating the plurality of data in the means in accordance with the link information to generate one or more integrated text data, the specifying means for specifying one or more search character string data, and the integrating means Search means for searching whether or not each of the one or more integrated text data includes one or more search character string data designated by the designation means, and display means for displaying a search result of the search means. Prepare.

【0008】したがって、小さな画面での見易さを優先
してリンク情報で階層化されて相互に関連付けられてい
る複数のデータを検索対象とする場合でも、これらの複
数データは統合手段にて統合された文章データとされ、
検索手段はこの統合文章データを対象にして指定された
検索文字列データを検索する。
Therefore, even when a plurality of data hierarchically linked with each other and linked with each other with priority given to the ease of viewing on a small screen are to be searched, the plurality of data are integrated by the integration means. Sentence data,
The search means searches the integrated sentence data for specified search character string data.

【0009】それゆえに、統合文章データを検索対象と
するから、検索手段によるフルテキストサーチであって
も不要なデータは検索されず、1つ以上の検索文字列デ
ータのAND/ORの検索で必要なデータは表示して不
要なデータは表示しない事ができて、検索時のヒット率
を高めることができる。
Therefore, since the integrated sentence data is set as a search target, unnecessary data is not searched even in the full text search by the search means, and is necessary for AND / OR search of one or more search character string data. Data can be displayed and unnecessary data can not be displayed, and the hit rate at the time of retrieval can be increased.

【0010】請求項2に記載の文章検索装置は、請求項
1に記載の装置がリンク情報を記憶するリンク情報記憶
手段をさらに有する。そして、統合手段は、リンク情報
記憶手段中のリンク情報に基づいて複数データにおいて
関連付けがループしているか検出するループ検出手段を
さらに有して、ループ検出手段により複数データにおい
てループしていると検出されたデータは統合処理の対象
としない。
[0010] According to a second aspect of the present invention, there is provided a text search apparatus, wherein the apparatus according to the first aspect further includes link information storage means for storing link information. The integration means further includes a loop detection means for detecting whether or not the association is looped in the plurality of data based on the link information in the link information storage means. The processed data is not subject to integration processing.

【0011】したがって、リンク情報による関連付けが
ループしていることはループ検出手段にて検出されて、
統合処理の対象とされないから統合処理が該ループによ
り無限ループ処理となることが回避されて、検索の無駄
がなくなる。
Therefore, the looping of the association by the link information is detected by the loop detecting means.
Since it is not a target of the integration processing, the integration processing is prevented from being an infinite loop processing by the loop, and the search is not wasted.

【0012】請求項3に記載の文章検索装置は、請求項
2に記載の文章検索装置の統合手段は、ループ検出手段
によりループしていると検出された場合には、ループし
ている関連付けにおける1つ以上の部分で関連付けが無
しとされた後のリンク情報に基づいて、複数データにつ
いて統合処理をする。
According to a third aspect of the present invention, there is provided a text search apparatus, wherein the integrating means of the second aspect of the present invention is configured such that, when the loop detecting means detects that a loop has occurred, An integration process is performed on a plurality of data based on the link information after the association is determined to be absent in one or more portions.

【0013】したがって、ループしている1つ以上の部
分で関連付けを断つ(切る)ことで、ループを解消して
断った部分について個々に統合処理して複数の統合文章
データを作成できる。また、統合処理が該ループにより
無限ループ処理となることが回避されて、検索の無駄が
なくなる。
Therefore, by breaking (cutting) the association in one or more looped portions, the loop can be resolved and the broken portions can be individually integrated to create a plurality of integrated text data. Further, the integration processing is prevented from being an infinite loop processing by the loop, and the search is not wasted.

【0014】請求項4に記載の文章検索装置は、請求項
2または3に記載の文章検索装置において統合手段は、
リンク情報記憶手段中のリンク情報に基づいて複数デー
タにおいて一方の文章データから他方の文章データへの
関連付けを判定する関連付け判定手段をさらに有する。
そして、関連付け判定手段により一方文章データ中の複
数の単語のそれぞれから他方文章データ中の複数の単語
それぞれに関連付けされていると判定された場合には、
統合手段は他方文章データを前記関連付けに基づいて分
割して、分割後の文章データのそれぞれを用いて統合処
理する。
According to a fourth aspect of the present invention, in the text search apparatus of the second or third aspect, the integrating means includes:
The information processing apparatus further includes an association determination unit configured to determine an association from one sentence data to another sentence data in the plurality of data based on the link information in the link information storage unit.
When the association determination unit determines that each of the plurality of words in the one sentence data is associated with each of the plurality of words in the other sentence data,
The integrating means divides the other sentence data based on the association, and performs an integrating process using each of the divided sentence data.

【0015】したがって、リンク情報に従う関連先の文
章データの関連部分のみを統合文章となる該リンク情報
に従う関連元の文章データに取込むことができるから、
統合文章データは必要とされるデータのみを用いて生成
されて、検索手段による検索に無駄がない。
[0015] Therefore, only the relevant part of the related sentence data according to the link information can be taken into the related original sentence data according to the link information, which becomes an integrated sentence.
The integrated sentence data is generated using only required data, and there is no waste in the search by the search means.

【0016】請求項5に記載の文章検索装置は、請求項
4に記載の文章検索装置において関連付け判定手段によ
り、一方文章データ中の複数の単語から他方文章データ
中の同じ単語に関連付け去れていると判定された場合に
は、統合手段は他方文章データをそのまま一方文章デー
タ中に取込んで統合処理をする。
According to a fifth aspect of the present invention, a plurality of words in one sentence data are associated with the same word in the other sentence data by association determining means in the sentence search device according to the fourth aspect. When it is determined that the text data is the other, the integrating means fetches the other sentence data as it is into the one sentence data and performs the integrating process.

【0017】したがって、リンク情報に従う関連先の文
章データそのままを統合文章となる該リンク情報に従う
関連元の文章データに取込むことができるから、統合文
章データは検索に必要とされるデータを用いて生成され
て、検索手段による検索の成功率が高まる。
Therefore, the text data of the related destination according to the link information can be taken as it is into the text data of the related source according to the link information which becomes the integrated text, so that the integrated text data is obtained by using the data required for the search. Once generated, the success rate of the search by the search means is increased.

【0018】請求項6に記載の文章検索装置は、請求項
1ないし5のいずれかに記載の文章検索装置の統合処理
において、文章データが統合される場合には、関連付け
における関連元の文章データ中に対応の関連先の文章デ
ータが段落を下げて取込まれる。
According to a sixth aspect of the present invention, when the text data is integrated in the integration processing of the text search device according to any one of the first to fifth aspects, the text data of the related source in the association is provided. The sentence data of the related destination of the corresponding is taken in with the paragraph lowered.

【0019】したがって、表示手段による検索結果で統
合文章データが表示されるとき、または検索手段の検索
時に、段落が下げられていることによりリンク情報に従
う関連先の文章データであることが容易に検出できる。
Therefore, when the integrated sentence data is displayed in the search result by the display means, or when the search means is searched, it is easily detected that the sentence data is related to the link information due to the lowered paragraph. it can.

【0020】請求項7に記載の文章検索装置は、請求項
1ないし6のいずれかに記載の文章検索装置の統合処理
において、文章データが統合される場合に、関連付けに
おける関連元の文章データ中の対応する関連先文章デー
タの取込位置の文字列と該関連先文章データの先頭文字
列が同じであるときは、一方の文字列が省略される。
According to a seventh aspect of the present invention, when the text data is integrated in the integration processing of the text search apparatus according to any one of the first to sixth aspects, the text data of the related source in the association is used. When the character string at the position where the corresponding destination text data is fetched and the leading character string of the relevant destination text data are the same, one of the character strings is omitted.

【0021】したがって、統合処理では、統合文章デー
タにおいて同一文字列が連続して位置することがないよ
うな編集が併せて行われるから、統合文章データは内容
が変更されることなく冗長な部分は排除されて、検索手
段による検索効率が高まる。
Therefore, in the integration processing, editing is performed in such a manner that the same character string is not located consecutively in the integrated text data. It is eliminated and the search efficiency by the search means increases.

【0022】請求項8に記載の文章検索装置は、請求項
1ないし7のいずれかに記載の文章検索装置の表示手段
において、検索結果である統合文章データはアウトライ
ン機能モードで表示される。
According to a sentence search device of the present invention, the integrated sentence data as a search result is displayed in an outline function mode on the display means of the sentence search device of any one of the first to seventh aspects.

【0023】したがって、表示される統合文章データを
アウトライン機能によりインデント処理などしてユーザ
に対して見やすい態様で表示できる。
Therefore, the displayed integrated sentence data can be displayed in an easily viewable manner for the user by performing indentation processing or the like by the outline function.

【0024】請求項9に記載の文章検索装置は、請求項
1ないし8のいずれかに記載の文章検索装置の統合処理
において、関連先のデータが文章データでない場合に
は、該データは処理対象とされない。
According to a ninth aspect of the present invention, in the integration processing of the text retrieval apparatus according to any one of the first to eighth aspects, when the data of the related destination is not the text data, the data is a processing target. And not.

【0025】したがって、文章データでないデータ、た
とえば画像データまたは音声データは統合されないよう
にすることができて、統合文章データに検索可能でない
データが取り込まれて検索処理が誤動作することは回避
される。また、表示手段による検索結果としての統合文
章データ表示の処理が誤動作することが回避される。
Therefore, data that is not sentence data, for example, image data or audio data, can be prevented from being integrated, and it is possible to prevent the unretrievable data from being incorporated into the integrated sentence data and prevent the search process from malfunctioning. Further, it is possible to prevent the processing of displaying the integrated sentence data as a search result by the display unit from malfunctioning.

【0026】請求項10に記載の文章検索装置は、請求
項1ないし8のいずれかに記載の文章検索装置の統合処
理において、関連先のデータが文章データでない場合に
は、該データを識別するために予め付与された文字列デ
ータを用いて処理される。
According to a tenth aspect of the present invention, in the integration processing of the text retrieval apparatus according to any one of the first to eighth aspects, when the data of the related destination is not the text data, the data is identified. Is processed using character string data assigned in advance.

【0027】したがって、文章データでないデータ、た
とえば画像データまたは音声データは、それを識別する
ためのファイル名またはデータ名の文字列データで統合
するようにできて、これらファイル名またはデータ名を
検索文字列として指定できる。
Therefore, data that is not sentence data, for example, image data or audio data, can be integrated with character string data of a file name or data name for identifying the data, and these file names or data names can be used as search characters. Can be specified as a column.

【0028】請求項11に記載の文章検索装置は、請求
項1ないし10のいずれかに記載の文章検索装置の記憶
手段中の複数データは、ハイパーテキストを構成するデ
ータである。
[0028] In the text retrieval device according to the eleventh aspect, the plurality of data in the storage means of the text retrieval device according to any one of the first to tenth aspects is data constituting a hypertext.

【0029】したがって、統合文章データとしてハイパ
ーテキストによるものを得ることができて、これを対象
にして検索できる。
Therefore, it is possible to obtain integrated text data in the form of hypertext, and to search for the integrated text data.

【0030】請求項12に記載の文章検索装置は、各デ
ータ内で相互に関連付けるためのリンク情報に従い関連
付けられた文章データを含む複数のデータを記憶する記
憶手段と、1つ以上の検索文字列データを指定する指定
手段と、記憶手段中の複数データ中から指定手段により
指定された検索文字列データを検索する検索手段と、検
索手段による検索結果を表示する表示手段とを備える。
そして、検索手段は、データの検索中にリンク情報があ
れば、該データの検索を中断し該リンク情報に従う関連
先のデータを検索して検索終了すれば、該リンク情報に
従う関連元のデータの検索を再開しながら、1つ以上の
検索文字列データが検索された文章データを逐次統合し
て統合文章データに生成する。
According to a twelfth aspect of the present invention, there is provided a text search apparatus, comprising: storage means for storing a plurality of data including text data associated with each other in accordance with link information for associating the data with each other; There are provided a designation unit for designating data, a retrieval unit for retrieving the search character string data designated by the designation unit from a plurality of data in the storage unit, and a display unit for displaying a retrieval result by the retrieval unit.
Then, if there is link information during the data search, the search means interrupts the data search, searches for the related destination data according to the link information, and terminates the search. While the search is restarted, the sentence data from which one or more search character string data has been searched are sequentially integrated to generate integrated sentence data.

【0031】したがって、データ検索時にリンク情報が
あれば、該リンク情報に従う関連先のデータもその時点
で検索することで、指定された1つ以上の検索文字列デ
ータのAND/ORなどの検索で必要なデータは逐次統
合文章データとして取込み、不要なデータは取込みされ
ないようできる。それゆえに、検索文字列を用いた検索
と統合文章データの作成とを並行して行なうことができ
る。
Therefore, if there is link information at the time of data search, related data according to the link information is also searched at that time, so that one or more specified search character string data such as AND / OR can be searched. Necessary data can be successively imported as integrated sentence data, and unnecessary data can be prevented from being imported. Therefore, the search using the search character string and the creation of the integrated sentence data can be performed in parallel.

【0032】請求項13に記載の文章検索方法は、各デ
ータ内で相互に関連付けるためのリンク情報に従い関連
付けられた文章データを含む複数のデータを対象にした
文章検索方法であって、複数のデータを前記リンク情報
に従い統合処理して1つ以上の統合文章データに生成す
るための統合ステップと、1つ以上の検索文字列データ
を指定する指定ステップと、統合ステップにより統合さ
れた1つ以上の統合文章データのそれぞれにおいて、指
定ステップにより指定された1つ以上の検索文字列デー
タが含まれるか否か検索する検索ステップと、検索ステ
ップの検索結果を表示する表示ステップとを備える。
A text search method according to a thirteenth aspect is a text search method for a plurality of data including text data associated with each other in accordance with link information for associating the data with each other. For generating one or more integrated text data by performing an integration process according to the link information, a specifying step of specifying one or more search character string data, and one or more integrated by the integration step. The integrated sentence data includes a search step for searching whether or not one or more search character string data specified by the specification step is included, and a display step for displaying a search result of the search step.

【0033】したがって、小さな画面での見易さを優先
してリンク情報で階層化されて相互に関連付けられてい
る複数のデータを検索対象とする場合でも、これらの複
数データは統合手段にて統合された文章データとされ、
検索手段はこの統合文章データを対象にして指定された
検索文字列データを検索する。
Therefore, even when a plurality of data hierarchically linked by the link information and associated with each other are searched for with priority given to the ease of viewing on a small screen, the plurality of data are integrated by the integrating means. Sentence data,
The search means searches the integrated sentence data for specified search character string data.

【0034】それゆえに、統合文章データを検索対象と
するから、検索手段によるフルテキストサーチであって
も不要なデータは検索されず、1つ以上の検索文字列デ
ータのAND/ORの検索で必要なデータは表示して不
要なデータは表示しない事ができて、検索時のヒット率
を高めることができる。
Therefore, since the integrated sentence data is set as a search target, unnecessary data is not searched even in the full text search by the search means, and it is necessary for AND / OR search of one or more search character string data. Data can be displayed and unnecessary data can not be displayed, and the hit rate at the time of retrieval can be increased.

【0035】請求項14に記載の文章検索方法は、各デ
ータ内で相互に関連付けるためのリンク情報に従い関連
付けられた文章データを含む複数のデータを対象にした
文章検索方法であって、1つ以上の検索文字列データを
指定する指定ステップと、複数データ中から指定ステッ
プにより指定された検索文字列データを検索する検索ス
テップと、検索ステップによる検索結果を表示する表示
ステップとを備える。そして、検索ステップは、データ
の検索中にリンク情報があれば、該データの検索を中断
し該リンク情報に従う関連先のデータを検索して検索終
了すれば、該リンク情報に従う関連元のデータの検索を
再開しながら、1つ以上の検索文字列データが検索され
た文章データを逐次統合して統合文章データに生成す
る。
A sentence retrieval method according to a fourteenth aspect is a sentence retrieval method for a plurality of data including sentence data associated in accordance with link information for associating with each other in each data, wherein A specifying step of specifying the search character string data, a search step of searching the plurality of data for the search character string data specified by the specifying step, and a display step of displaying a search result by the search step. Then, if there is link information during the data search, the search of the data is interrupted, the data of the related destination according to the link information is searched, and if the search is completed, the data of the related source according to the link information is searched. While the search is restarted, the sentence data from which one or more search character string data has been searched are sequentially integrated to generate integrated sentence data.

【0036】したがって、データ検索時にリンク情報が
あれば、該リンク情報に従う関連先のデータもその時点
で検索することで、指定された1つ以上の検索文字列デ
ータのAND/ORなどの検索で必要なデータは順次統
合文章データとして取込み、不要なデータは取込みされ
ないようできる。それゆえに、検索と統合文章データ作
成とを並行して行なうことができる。
Therefore, if there is link information at the time of data search, related data according to the link information is also searched at that time, so that one or more specified search character string data such as AND / OR can be searched. Necessary data is sequentially taken in as integrated sentence data, and unnecessary data can be prevented from being taken in. Therefore, the search and the creation of the integrated sentence data can be performed in parallel.

【0037】請求項15に記載の記録媒体は、各データ
内で相互に関連付けるためのリンク情報に従い関連付け
られた文章データを含む複数のデータを対象にした文章
検索方法をコンピュータに実行させるための文章検索プ
ログラムを記録したコンピュータで読取り可能な記録媒
体である。
A recording medium according to a fifteenth aspect is a document for causing a computer to execute a text search method for a plurality of data including text data associated with each other in accordance with link information for associating the data with each other. This is a computer-readable recording medium that stores a search program.

【0038】そして、この文章検索方法は、複数のデー
タをリンク情報に従い統合処理して1つ以上の統合文章
データに生成するための統合ステップと、1つ以上の検
索文字列データを指定する指定ステップと、統合ステッ
プにより統合された1つ以上の統合文章データのそれぞ
れにおいて、指定ステップにより指定された1つ以上の
検索文字列データが含まれるか否か検索する検索ステッ
プと、検索ステップの検索結果を表示する表示ステップ
とを備える。
This sentence search method includes an integration step for integrating a plurality of data in accordance with link information to generate one or more integrated sentence data, and a designation for designating one or more search character string data. A search step for searching whether or not each of the one or more integrated text data integrated by the integration step includes one or more search character string data specified by the specification step; and a search of the search step And displaying the result.

【0039】したがって、小さな画面での見易さを優先
してリンク情報で階層化されて相互に関連付けられてい
る複数のデータを検索対象とする場合でも、これらの複
数データは統合手段にて統合された文章データとされ、
検索手段はこの統合文章データを対象にして指定された
検索文字列データを検索する。
Therefore, even when a plurality of data hierarchically linked by link information and associated with each other are searched for with priority given to the ease of viewing on a small screen, the plurality of data are integrated by the integrating means. Sentence data,
The search means searches the integrated sentence data for specified search character string data.

【0040】それゆえに、統合文章データを検索対象と
するから、検索手段によるフルテキストサーチであって
も不要なデータは検索されず、1つ以上の検索文字列デ
ータのAND/ORの検索で必要なデータは表示して不
要なデータは表示しない事ができて、検索時のヒット率
を高めることができる。
Therefore, since the integrated sentence data is set as a search target, unnecessary data is not searched even in the full text search by the search means, and it is necessary for AND / OR search of one or more search character string data. Data can be displayed and unnecessary data can not be displayed, and the hit rate at the time of retrieval can be increased.

【0041】請求項16に記載の記録媒体は、各データ
内で相互に関連付けるためのリンク情報に従い関連付け
られた文章データを含む複数のデータを対象にした文章
検索方法をコンピュータに実行させるための文章検索プ
ログラムを記録したコンピュータで読取り可能な記録媒
体である。そして、この文章検索方法は、各データ内で
相互に関連付けるためのリンク情報に従い関連付けられ
た文章データを含む複数のデータを対象にした文章検索
方法であって、1つ以上の検索文字列データを指定する
指定ステップと、複数データ中から指定ステップにより
指定された検索文字列データを検索する検索ステップ
と、検索ステップによる検索結果を表示する表示ステッ
プとを備える。
A recording medium according to a sixteenth aspect is a document for causing a computer to execute a text search method for a plurality of data including text data associated with each other in accordance with link information for associating the data with each other. This is a computer-readable recording medium that stores a search program. This text search method is a text search method targeting a plurality of data including text data associated with each other in accordance with link information for associating the data with each other in the data. The method includes a specifying step of specifying, a searching step of searching for the search character string data specified by the specifying step from the plurality of data, and a displaying step of displaying a search result by the searching step.

【0042】そして検索ステップは、データの検索中に
リンク情報があれば、該データの検索を中断し該リンク
情報に従う関連先のデータを検索して検索終了すれば、
該リンク情報に従う関連元のデータの検索を再開しなが
ら、1つ以上の検索文字列データが検索された文章デー
タを逐次統合して統合文章データに生成することを特徴
とする。
In the search step, if there is link information during the data search, the search of the data is interrupted, the data of the related destination according to the link information is searched, and the search is terminated.
One or more pieces of search character string data are successively integrated to generate integrated sentence data while restarting the search for related source data according to the link information.

【0043】したがって、データ検索時にリンク情報が
あれば、該リンク情報に従う関連先のデータもその時点
で検索することで、指定された1つ以上の検索文字列デ
ータのAND/ORなどの検索で必要なデータは順次統
合文章データとして取込み、不要なデータは取込みされ
ないようできる。それゆえに、検索と統合文章データの
作成とを並行して行なうことができる。
Therefore, if there is link information at the time of data search, related data according to the link information is also searched at that time, so that one or more specified search character string data such as AND / OR can be searched. Necessary data is sequentially taken in as integrated sentence data, and unnecessary data can be prevented from being taken in. Therefore, the search and the creation of the integrated sentence data can be performed in parallel.

【0044】[0044]

【発明の実施の形態】図1はこの発明の実施の形態に適
用される文章検索装置のブロック構成図である。図1に
おいて文章検索装置は該装置全体を制御するCPU(中
央処理装置の略)11、検索する文字列を入力したり検
索結果を選択するために操作されるキーボードなどの入
力部12、インターネットなどの通信ネットワークから
データを入手するための通信部13、通信ネットワーク
から収集し統合されたデータを保存するためのHDD
(ハードディスクドライブ)などの記憶部14、記憶さ
れた内容の中から指定された文字列を検索するための検
索部15、入力部12から入力された文字列や通信部1
3で入手したデータを表示するためのCRT(陰極線管
の略)や液晶ディスプレイなどの表示部16、検索結果
得られたデータを記憶する候補バッファ17、選択され
た文章をどのモードで表示するかを記憶する表示モード
記憶領域18、表示/編集対象である文章を格納するた
めのテキストバッファ19、収集した文章を格納するテ
キスト記憶領域20、後述するリンクの相関関係を記憶
するための相関記憶部27、収集した文章を統合した統
合文章に加工した後保存するための統合文章記憶領域2
1、検索途中のアドレスをセーブするアドレスセーブバ
ッファ22、検索中の文章に対応してフラグを割当てる
検索フラグバッファ23、読出されて検索された文章に
フラグを設定する読出フラグバッファ24、リンク先の
文章を取込むときの段落の深さを記憶するための取込深
さ記憶領域25からなる。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram of a sentence retrieval apparatus applied to an embodiment of the present invention. In FIG. 1, a sentence search apparatus is a CPU (abbreviated central processing unit) 11 for controlling the entire apparatus, an input unit 12 such as a keyboard operated for inputting a character string to be searched or selecting a search result, the Internet, etc. Communication unit 13 for obtaining data from a communication network, HDD for storing integrated data collected from the communication network
(A hard disk drive), a search unit 15 for searching a specified character string from stored contents, a character string input from the input unit 12, and a communication unit 1.
A display section 16 such as a CRT (abbreviation of cathode ray tube) or liquid crystal display for displaying the data obtained in step 3, a candidate buffer 17 for storing data obtained as a result of the search, and a mode in which the selected text is displayed , A text buffer 19 for storing text to be displayed / edited, a text storage area 20 for storing collected text, and a correlation storage unit for storing a link relationship described later. 27. Integrated sentence storage area 2 for processing the collected sentences into an integrated sentence and storing it
1. An address save buffer 22 for saving an address in the middle of a search, a search flag buffer 23 for allocating a flag corresponding to a sentence being searched, a read flag buffer 24 for setting a flag for a read and searched sentence, a link destination It comprises a capture depth storage area 25 for storing the depth of a paragraph when capturing a sentence.

【0045】また、後述する各種処理フローチャートを
プログラムとして格納したFD(フレキシブルディス
ク)などの記録媒体26が該文章検索装置のために準備
され、記録媒体26から図示されないFDD(フレキシ
ブルディスクドライバ)などを介してプログラムが読出
されて該装置のメモリに格納されCPU11の制御の下
に実行される。
A recording medium 26 such as an FD (flexible disk) storing various processing flowcharts to be described later as a program is prepared for the text retrieval apparatus, and an unillustrated FDD (flexible disk driver) or the like is prepared from the recording medium 26. The program is read out via the device, stored in the memory of the device, and executed under the control of the CPU 11.

【0046】本文章検索装置では、個人のHD(ハード
ディスク)内の情報やLAN(ローカルエリアネットワ
ーク)、インターネット上からテキスト情報が収集さ
れ、該装置内に蓄積され、蓄積されているハイパーテキ
ストのデータがリンク関係に基づき1つ以上の文章に統
合される。そして、ユーザからの検索指示が検索文字列
入力により行なわれると、1つ以上の統合文章から入力
された検索文字列が検索されて、該検索文字列を含む統
合文章が指定された表示形態で表示される。
The text chapter search apparatus collects information in a personal HD (hard disk) and text information from a LAN (local area network) and the Internet, stores the information in the apparatus, and stores the stored hypertext data. Are integrated into one or more sentences based on the link relation. When a search instruction from the user is made by inputting a search character string, the search character string input from one or more integrated sentences is searched, and the integrated sentence including the search character string is displayed in a designated display form. Is displayed.

【0047】図2は、この発明の実施の形態に適用され
るハイパーテキストの第1例を示す図である。図2では
文章Aから文章Bと文章Cに同時にリンクが張られてい
る。データの個数が多い場合には、データを階層化して
格納し階層化された関係であるリンク元とリンク先の関
係(親子関係)をリンクで結ぶことで、一覧性をよくし
ている。
FIG. 2 is a diagram showing a first example of a hypertext applied to the embodiment of the present invention. In FIG. 2, a link is simultaneously provided from the sentence A to the sentence B and the sentence C. When the number of data is large, the data is stored in a hierarchical manner, and the hierarchical relationship between the link source and the link destination (parent-child relationship) is linked by a link to improve the listability.

【0048】図3(A)〜(C)は図2の各文章の内部
データを示す図である。この例では、インターネットで
一般的に使用されているものが示されており、HTML
(Hyper Text Mark-up Languageの略)のバージョンに
より、サポートされているタグも変わってくる。リンク
情報は場所(検索アドレスまたは記憶アドレス)とファ
イル名で指定される。図では“<HTML>”から“<
/HTML>”までがブラウザで見るデータで、“<B
ODY>”から“</BODY>”が本文で、ブラウザ
で画面内に表示されるものである。“<BR>”が改行
で通常のエディタの改行と同じように文字列が折り返し
て表示される。“< HREF=“***.HTML♯
**”>”から“</A>”までが、リンクを持ってい
て“***.HTML”というファイルの“**”とい
う名前の位置を指していることを示している。“♯*
*”がなければ“***.HTML”というファイル全
体を指していることになる。“**”という名前はデー
タ内に“<A NAME=“**”></A>”で示さ
れる。“<TITLE>”から“</TITLE>”ま
でがタイトルで通常ブラウザのウィンドウの一番上に表
示される。
FIGS. 3A to 3C are diagrams showing internal data of each sentence in FIG. In this example, those commonly used on the Internet are shown, and HTML
The supported tags vary depending on the version (short for Hyper Text Mark-up Language). The link information is specified by a location (search address or storage address) and a file name. In the figure, “<HTML>” to “<
/ HTML>"is the data to be viewed on the browser, and"<B
“</ BODY>” to “</ BODY>” is the body and is displayed on the screen in the browser. “<BR>” is a line feed, and the character string is wrapped and displayed in the same way as a normal editor line feed. "<HREF =“ ***. HTML}
"**"> to "</A>" indicate that they have a link and point to the location named "**" in the file "**. HTML". “♯ *
If there is no “*”, “****”. The name "**" is indicated in the data as "<A NAME="**"><//A>" from "<TITLE>" to "< / TITLE>"is a title and is usually displayed at the top of the window of the browser.

【0049】図4は図3(A)〜(C)のデータが統合
された結果の統合文章を示す図である。図の統合文書A
Tではリンク先の文章はリンク元の文章において段落を
下げて取込まれるので見やすくなっている。この統合文
章ならば今までのサーチエンジンで検索可能となる。元
の文章A〜Cから文字列“奈良県”と文字列“大和郡山
市”のANDの条件で検索すると、どの文章も条件に該
当せず一致しないが、図4の統合文章ATでは文字列
“奈良県”と文字列“大和郡山市”の両方の文字列が同
時に含まれるので検索することが可能となる。
FIG. 4 is a diagram showing an integrated sentence as a result of integrating the data of FIGS. 3 (A) to 3 (C). Figure integrated document A
In T, the text at the link destination is taken in the text at the link source with the paragraph lowered, so that it is easy to see. This integrated sentence will be searchable with the existing search engine. When the original texts A to C are searched under the AND condition of the character string “Nara prefecture” and the character string “Yamatokoriyama-shi”, none of the texts match the conditions and do not match. However, in the integrated text AT of FIG. Since both the character strings “Nara” and the character string “Yamatokoriyama-shi” are included at the same time, it is possible to search.

【0050】図5は、この発明の実施の形態に適用され
るハイパーテキストの第2例を示す図である。文章Dか
ら文章Eへ、文章Eから文章Fへ、そして文章Fから文
章Dへそれぞれリンクが張られて、ループしている例が
示される。図6(A)〜(C)は、図5の各文章の内部
データを示す図である。ここではリンク情報は場所とフ
ァイル名で指定される。
FIG. 5 is a diagram showing a second example of the hypertext applied to the embodiment of the present invention. A linking example is shown from the sentence D to the sentence E, from the sentence E to the sentence F, and from the sentence F to the sentence D, showing a looping example. FIGS. 6A to 6C are diagrams showing internal data of each sentence in FIG. Here, the link information is specified by a location and a file name.

【0051】検索時には、図5に示されるようなリンク
によるループのチェックをしなければ検索処理が無限ル
ープ処理に陥ってしまう。そこで、既に読出して検索し
た文章には読出フラグをセットして、検索しようとする
文章に対応の読出フラグが既にセットされていればリン
クがループしていると判断され、そこでそのリンクを検
索するのを中止する。またループしていればループを切
る場所を順番に変えることで、複数種類の統合文章を作
成することができる。この、文章に対応して読出フラグ
を格納する領域は図1の読出フラグバッファ24であ
る。
At the time of retrieval, unless a loop check by a link as shown in FIG. 5 is performed, the retrieval process falls into an infinite loop process. Therefore, a read flag is set for a sentence that has already been read and searched, and if a read flag corresponding to the sentence to be searched has already been set, it is determined that the link is looping, and the link is searched there. To stop. In addition, if there is a loop, a plurality of types of integrated sentences can be created by changing the place where the loop is cut in order. The area for storing the read flag corresponding to the text is the read flag buffer 24 in FIG.

【0052】図7〜図9は、図5および図6に示される
各文章が統合された結果の統合文章の第1〜第3例を示
す図である。図10〜図12は、図5および図6に示さ
れる各文章が改良して統合された統合文章の第1〜第3
例を示す図である。
FIGS. 7 to 9 are diagrams showing first to third examples of integrated sentences obtained as a result of integrating the sentences shown in FIGS. 5 and 6. FIG. 10 to 12 show first to third integrated sentences obtained by improving and integrating the sentences shown in FIGS. 5 and 6.
It is a figure showing an example.

【0053】図7〜図9では統合された結果文字列が重
複して見にくくなるので、リンク先の文章の先頭の文字
列がリンク元の文章の文字列と一致していれば、リンク
先の先頭の文字列をカット(省略)して統合することで
図10〜図12に示されるように見やすい統合文章に改
良することができる。図10〜図12の統合文章ならば
今までのサーチエンジンで検索可能となる。またどれを
元にするか見やすいものを選ぶことができる。
In FIG. 7 to FIG. 9, since the integrated character strings are duplicated and difficult to see, if the leading character string of the linked text matches the character string of the link source text, By cutting (omitting) the leading character string and integrating it, it is possible to improve the integrated sentence as shown in FIGS. The integrated sentences shown in FIGS. 10 to 12 can be searched by the conventional search engine. You can also choose which one is easier to see.

【0054】図13は、この発明の実施の形態に適用さ
れるハイパーテキストの第3例を示す図であり、同一文
章内の複数の異なる位置にリンクが張られている例が示
される。文章G内の2ヵ所からそれぞれ文章Hの1番目
に位置する文字列”ブルドック”と文章Hの2番目に位
置する文字列”シャム猫”にリンクが張られている。図
14(A)と(B)は、図13の各文章の内部データを
示す図である。リンク情報は場所とファイル名で指定さ
れる。図15は図13に示される文章が統合された結果
の統合文章を示す図である。リンク先の文章の必要な部
分(文字列)だけがリンク元の文章のリンク位置に統合
されているので見やすくなっている。
FIG. 13 is a diagram showing a third example of the hypertext applied to the embodiment of the present invention, in which links are provided at a plurality of different positions in the same sentence. A link is provided from two places in the sentence G to the character string “bulldog” located first in the sentence H and the character string “siam cat” located second in the sentence H, respectively. FIGS. 14A and 14B are diagrams showing internal data of each sentence in FIG. Link information is specified by location and file name. FIG. 15 is a diagram showing an integrated sentence as a result of integrating the sentences shown in FIG. Only the necessary part (character string) of the link destination text is integrated at the link position of the link source text, so that it is easy to see.

【0055】図16は、この発明の実施の形態に適用さ
れるハイパーテキストの第4例を示す図であり、同一文
章の同じ位置の文字列(名前)に、複数の異なるリンク
が張られている例である。図16では文章K内の2ヵ所
から同一文章L内の1番目に位置する文字列”家畜”に
リンクが張られている。図17(A)と(B)は図16
の各文章の内部データを示す図である。リンク情報は場
所とファイル名で指定される。
FIG. 16 is a diagram showing a fourth example of the hypertext applied to the embodiment of the present invention, in which a plurality of different links are attached to a character string (name) at the same position in the same sentence. This is an example. In FIG. 16, links are provided from two places in the sentence K to the first character string “livestock” in the same sentence L. FIGS. 17A and 17B show FIG.
3 is a diagram showing internal data of each sentence of FIG. Link information is specified by location and file name.

【0056】図18は、図17(A)と(B)のデータ
が統合された結果の統合文章を示す図である。この統合
文章KTならば今までのサーチエンジンで検索可能とな
る。データ(文字列)が重複して格納されているが、検
索抽出したときに表示されるとリンク先の内容がリンク
元の文章に入っているので見やすくなる。
FIG. 18 is a diagram showing an integrated sentence as a result of integrating the data of FIGS. 17 (A) and (B). This integrated sentence KT can be searched by a conventional search engine. Although data (character strings) are redundantly stored, when displayed when retrieved and extracted, the contents of the link destination are included in the text of the link source, so that it is easy to see.

【0057】図19はこの発明の実施の形態に適用され
るデータ収集時の処理フローチャートである。図20
は、図19の処理において表示されるデータ取込条件設
定画面例を示す図である。
FIG. 19 is a processing flowchart at the time of data collection applied to the embodiment of the present invention. FIG.
FIG. 20 is a diagram showing an example of a data acquisition condition setting screen displayed in the process of FIG.

【0058】まず、データ収集時には図20の収集対象
となるデータの取込条件のための指定ウィンドウが表示
部16に表示されて(S101)、ユーザが入力部12
を操作して日本語/英語などの収集対象となる文章の言
語、収集の頻度であるチェック頻度などの収集方法を指
定すると(S102)、検索先であるインターネットな
どのアドレスが初期化されて(S103)、アドレスに
基づいて通信部13を介して順次、情報検索され(S1
04)、画像/音声などのデータを省いた文章データの
みが記憶部14に読込まれる(S105)。
First, at the time of data collection, a designation window for acquiring the data to be collected shown in FIG. 20 is displayed on the display unit 16 (S101), and the user inputs the
To specify the language of the sentence to be collected, such as Japanese / English, and the collection method such as the check frequency, which is the frequency of collection (S102), the address of the search destination, such as the Internet, is initialized ( S103), information is sequentially searched through the communication unit 13 based on the address (S1).
04), only the text data excluding data such as images / voices is read into the storage unit 14 (S105).

【0059】ここで、インターネットのアドレスは現在
4バイトで表現されている。0.0.0.0から25
6.256.256.256まで表現可能であり、一部
のアドレスを除き重複せずに割振られている。このよう
な値を順次カウントアップしながらアドレス更新して更
新されたアドレスに基づいて情報検索して文章データを
取込むことができる。
Here, the Internet address is currently represented by 4 bytes. 0.0.0.0 to 25
Expressions up to 6.256.256.256 can be expressed, and are assigned without duplication except for some addresses. The address can be updated while sequentially counting up such values, and information retrieval can be performed based on the updated address to take in text data.

【0060】図21は、この発明の実施の形態によるリ
ンク先がテキスト以外の例を示す図である。図21のよ
うにリンク先が画像や音声などのデータの場合はそのフ
ァイル名等の文字列データも取込む。取込まれたデータ
をHDなどの記憶部14に保存し(S106)、検索す
るアドレスをアップし(S107)、図20で予め入力さ
れて定められた条件に一致するアドレスをすべて検索終
了したかチェックし(S108)、検索終了でなければ
再度検索(S104)から繰返される。
FIG. 21 is a diagram showing an example where the link destination is other than text according to the embodiment of the present invention. When the link destination is data such as an image or sound as shown in FIG. 21, character string data such as the file name is also taken. The fetched data is stored in the storage unit 14 such as an HD (S106), the address to be searched is increased (S107), and whether or not the search for all the addresses that match the predetermined conditions input in advance in FIG. A check is made (S108). If the search is not completed, the search is repeated again from the search (S104).

【0061】なお、記憶部14に保存されたデータは、
後述される検索処理のためにテキスト記憶領域20に格
納される。
The data stored in the storage unit 14 is
It is stored in the text storage area 20 for a search process described later.

【0062】図22は、この発明の実施の形態に適用さ
れるデータ統合時の処理フローチャートである。図23
は図22のテキスト統合の詳細処理フローチャートであ
る。まず、インターネットを検索してテキスト記憶領域
20に格納している文章データ検索のアドレスを初期化
し(S111)、図23のテキスト統合ルーチンをコー
ルし(S112)、その後アドレスをアップし(S11
3)、終了かチェックし(S114)、終了ならば統合
文章を統合文章記憶領域21に保存する(S115)。
終了でなければS112の処理から続ける。
FIG. 22 is a processing flowchart at the time of data integration applied to the embodiment of the present invention. FIG.
23 is a detailed processing flowchart of text integration of FIG. First, the Internet is searched and the address of the sentence data search stored in the text storage area 20 is initialized (S111), the text integration routine of FIG. 23 is called (S112), and then the address is increased (S11).
3) It is checked whether the processing is completed (S114). If the processing is completed, the integrated text is stored in the integrated text storage area 21 (S115).
If the processing is not to be ended, the processing is continued from S112.

【0063】図23のテキスト統合ルーチンではS11
1またはS113で指定されたアドレスが指す文章をテ
キスト記憶領域20から読出し(S116)、読出フラ
グバッファ24において読出された文章に対応の読出フ
ラグがセットされているかチェックし(S117)、読
出フラグがセットされていれば既に読込まれているの
で、この文章の処理を終える。一方、読出フラグがセッ
トされていなければ読出フラグをセットし(S11
8)、その文章に含まれているリンクを順番に読出し
(S119)、各リンク先の文章に対応の読出フラグが
セットされているかチェックし(S120)、読出フラ
グがセットされていれば、既に該リンク先の文章は記憶
領域21に読込まれているので、このリンク先の文章の
処理を終える。
In the text integration routine of FIG.
1 or the text pointed to by the address specified in S113 is read from the text storage area 20 (S116), it is checked whether a read flag corresponding to the text read in the read flag buffer 24 is set (S117), and the read flag is set. If it is set, it has already been read, and the processing of this sentence ends. On the other hand, if the read flag is not set, the read flag is set (S11).
8) The links included in the sentence are sequentially read (S119), and it is checked whether the read flag corresponding to the text of each link is set (S120). If the read flag is set, the link is already read. Since the linked text has been read into the storage area 21, the processing of the linked text is completed.

【0064】読出フラグがセットされていなければ読出
フラグをセットし(S121)、記憶領域21の現在の
ポイント位置より段落を下げて記憶領域21に取込んで
(S122)、リンク先の文章をリンク元の文章に統合
する(S123)。ここで、リンク先の文章の先頭に位
置する文字列とリンク元の文章の取込み位置の文字列が
一致していれば、前述したように一致している文字列の
一方をカットして統合することも可能である。
If the read flag is not set, the read flag is set (S121), the paragraph is lowered from the current point position in the storage area 21 and fetched into the storage area 21 (S122), and the linked text is linked. It is integrated into the original text (S123). Here, if the character string located at the beginning of the text of the link destination matches the character string of the capture position of the text of the link source, one of the matching character strings is cut and integrated as described above. It is also possible.

【0065】図24(A)と(B)は、リンク先のデー
タを取込んで統合するか否かによる統合文章の例を示す
図である。リンク先が画像などの文章以外のデータなら
ば図24(B)に示されるようにそのファイル名または
タイトル名を取込むことも可能であり、図24(A)の
ように取込まないこともできる。この取込要/否の設定
は予め入力部12を介してユーザが設定すればよい。
FIGS. 24A and 24B are diagrams showing an example of an integrated sentence depending on whether or not to take in the data at the link destination and to integrate the data. If the link destination is data other than text such as an image, the file name or the title name can be captured as shown in FIG. 24B, and it is not necessary to capture it as shown in FIG. it can. The setting of the necessity / non-take-in may be set by the user via the input unit 12 in advance.

【0066】このテキスト統合ルーチンはこのフローで
示されている処理全体を行なう(リカーシブルコール)
ため、その統合先の文章におけるリンクも処理してリン
ク先の文章を記憶領域21に取込むことになる。リンク
先文章の処理を終了するとリンク元文章に戻って記憶領
域21における取込位置を示す段落を元の位置に戻す
(S124)。
This text integration routine performs the entire processing shown in this flow (recursive call)
Therefore, the link in the text of the integration destination is also processed, and the text of the link destination is fetched into the storage area 21. When the processing of the link destination text is completed, the process returns to the link source text and returns the paragraph indicating the capture position in the storage area 21 to the original position (S124).

【0067】続いて、次のリンク先を検索し(S12
5)、まだリンクがあればその文章を検索して読出すこ
とから処理を続ける。もうリンクがなければ(S12
6)、リンク元文章の取込位置の文字列とリンク先文章
の取込まれる先頭文字列が同じかチェックし(S12
7)、同じならば同じ文字列の一方をカットし(S12
8)統合文章に追加し(S129)、リターンする。
Subsequently, the next link destination is searched (S12).
5) If there is still a link, the process is continued since the sentence is searched and read. If there is no more link (S12
6) It is checked whether the character string at the position where the link source text is fetched and the head character string where the link destination text is fetched are the same (S12).
7) If they are the same, cut one of the same character strings (S12)
8) Add to the integrated sentence (S129) and return.

【0068】図25(A)〜(D)は、図2、図5、図
13および図16のハイパーテキストにおける相関関係
を表形式で示す相関表の図である。この相関表は図1の
相関記憶部27に記憶される。
FIGS. 25 (A) to 25 (D) are diagrams of correlation tables showing the correlation in the hypertext of FIGS. 2, 5, 13 and 16 in the form of a table. This correlation table is stored in the correlation storage unit 27 of FIG.

【0069】まず、ハイパーテキストにおけるリンク関
係が複雑な場合には、予めリンク関係を表形式でまとめ
て、この表を参照しながら文章を統合すると、ループし
ているリンクを検索対象から外したり、ループの切る位
置を順次変更して異なる統合文章を作成したり、同一文
章の複数の単語にリンクされているときに文章を分割し
たりすることが容易に可能となる。
First, when the link relation in the hypertext is complicated, the link relation is previously summarized in a table format, and the sentences are integrated while referring to this table. It becomes easy to create different integrated sentences by sequentially changing the position where the loop is cut, or to divide a sentence when linked to a plurality of words in the same sentence.

【0070】図25(A)〜(D)の相関表ではリンク
元文章のファイル名と、そのリンク元の単語(文字列)
と、リンク先文章のファイル名と、そのリンク位置が格
納される。このリンク位置はリンク先単語(文字列)ま
たは該単語の該文章における位置を示す。
In the correlation tables shown in FIGS. 25A to 25D, the file name of the link source sentence and the word (character string) of the link source are shown.
, The file name of the link destination text and the link position are stored. This link position indicates the link destination word (character string) or the position of the word in the sentence.

【0071】図26はこの発明の実施の形態による相関
表を作成するための処理フローチャートである。まず相
関記憶部27の相関表が初期化され(S211)、検索
のためのアドレスが初期化され(S212)、検索アド
レスが指す記憶部14の文章のファイルが読出される
(S212)。
FIG. 26 is a processing flowchart for creating a correlation table according to the embodiment of the present invention. First, a correlation table in the correlation storage unit 27 is initialized (S211), an address for search is initialized (S212), and a text file in the storage unit 14 indicated by the search address is read (S212).

【0072】そして、読出されたファイルである文章に
関する検索のためのテキストポインタが初期化され(S
214)、このテキストポインタを用いて読出された文
章内が検索され(S215)、検索結果得られた情報は
リンクかチェックされ(S216)、リンクならば図2
5(A)〜(D)に示されるように相関表にリンク元フ
ァイル名、リンク元単語、リンク先ファイル名およびリ
ンク先位置がセットされ(S217)、該文章のテキス
トポインタを用いた検索が終了するまで繰返される(S
218)。
Then, a text pointer for searching for a sentence which is the read file is initialized (S
214), the text read using this text pointer is searched (S215), and the information obtained as a result of the search is checked for a link (S216).
As shown in FIGS. 5A to 5D, the link source file name, the link source word, the link destination file name, and the link destination position are set in the correlation table (S217), and the search using the text pointer of the text is performed. Repeated until it ends (S
218).

【0073】該文章のテキストポインタを用いた処理が
終了すれば前述の検索のアドレスが更新され(S21
9)、更新された検索アドレスを用いてテキスト記憶領
域20中で別の文章であるファイルがあるか検索されて
チェックされる(S220)。なければ相関表において
同じファイル名がリンク元ファイル名およびリンク先フ
ァイル名として出現してループしているかチェックされ
る(S221)。
When the processing using the text pointer of the sentence is completed, the above-mentioned search address is updated (S21).
9) Using the updated search address, the text storage area 20 is searched for a file as another sentence and checked (S220). If not, it is checked whether the same file name appears in the correlation table as the link source file name and the link destination file name and loops (S221).

【0074】図25(B)の場合、文書Dがリンク元フ
ァイル名およびリンク先ファイル名として出現してルー
プしているからループ位置を順次変えて取込み、別々の
統合文章を作成したり(S222)、ループしている部
分を取込まないようにすることもできる。
In the case of FIG. 25B, the document D appears as a link source file name and a link destination file name and forms a loop. Therefore, the loop position is sequentially changed and fetched to create separate integrated sentences (S222). ), It is possible not to take in the looped part.

【0075】また相関表に同じファイルの組合せがある
かチェックし(S223)、あればリンク元もリンク先
も異なるファイルかチェックし(S224)、異なれば
位置の後のリンク先の前後で分割して取込み統合文章を
作成する(S225)。これは、図25(C)の場合で
あり、図15の統合文章が得られる。
Also, it is checked whether the same file combination is present in the correlation table (S223). If there is a different file, the link source and the link destination are also different (S224). If different, the file is divided before and after the link destination after the position. Then, an integrated text is created (S225). This is the case of FIG. 25C, and the integrated sentence of FIG. 15 is obtained.

【0076】またリンク元が異なるがリンク先が同じか
チェックし(S226)、同じならばリンク先の文章を
すべて取込む(S227)。これは、図25(D)の場
合であり図18の統合文章が得られる。
It is checked whether the link source is different but the link destination is the same (S226), and if they are the same, all the sentences of the link destination are taken in (S227). This is the case of FIG. 25 (D), and the integrated sentence of FIG. 18 is obtained.

【0077】図27はこの発明の実施の形態による統合
文章検索時のフローチャートである。図28は図27の
処理にて表示される検索文字列入力ウィンドウの一例を
示す図である。図29は図27の処理にて表示される表
示モード指定画面の一例を示す図である。
FIG. 27 is a flowchart at the time of integrated sentence retrieval according to the embodiment of the present invention. FIG. 28 is a diagram showing an example of the search character string input window displayed in the process of FIG. FIG. 29 is a diagram showing an example of the display mode designation screen displayed in the process of FIG.

【0078】図27においてまず、図28の検索文字列
入力ウィンドウが表示部16に表示されて(S13
1)、ユーザが1つ以上の検索文字列を入力部12から
入力すると(S132)、1つ以上入力された文字列は
たとえばAND条件で検索される。そしてまず統合文章
記憶領域21の先頭に登録されたの統合文章にポインタ
が移動し(S133)、候補バッファ17を初期化し
(S134)、ポインタが示す統合文章記憶領域21中
の統合文章を、予め入力された検索文字列を用いて検索
部15によりフルテキストサーチエンジンなどで検索す
る(S135)。
In FIG. 27, first, the search character string input window of FIG. 28 is displayed on the display unit 16 (S13).
1) When the user inputs one or more search character strings from the input unit 12 (S132), the one or more input character strings are searched, for example, under an AND condition. Then, first, the pointer moves to the integrated sentence registered at the head of the integrated sentence storage area 21 (S133), the candidate buffer 17 is initialized (S134), and the integrated sentence indicated by the pointer in the integrated sentence storage area 21 is stored in advance. Using the input search character string, the search unit 15 performs a search using a full-text search engine or the like (S135).

【0079】このときに、文章以外のデータ(画像デー
タまたは音声データ)も取込むよう予め指定されている
ならば、図24(B)のように画像データまたは音声デ
ータなどのファイル名を取込むために、リンク先のファ
イル名も検索される。
At this time, if data (image data or audio data) other than the text is specified in advance, a file name such as image data or audio data is imported as shown in FIG. Therefore, the file name of the link destination is also searched.

【0080】入力されて指定されていた検索文字列がす
べて該統合文章内に存在していれば(AND条件成立な
らば)、候補バッファ17にその統合文章名(リンクの
ルートとなる文章名)をセットし(S137)、候補バ
ッファ17のポインタが更新される(S138)。そし
て、記憶領域21のポインタを次に登録されている統合
文章に移動し(S139)、統合文章がまだ存在するか
否かチェックされ(S140)、まだ統合文章があれ
ば、検索(S135)の処理から繰返される。
If all of the input and designated search character strings exist in the integrated sentence (if the AND condition is satisfied), the integrated sentence name (the sentence name serving as the link root) is stored in the candidate buffer 17. Is set (S137), and the pointer of the candidate buffer 17 is updated (S138). Then, the pointer in the storage area 21 is moved to the integrated text registered next (S139), and it is checked whether or not the integrated text still exists (S140). If there is any integrated text, the search (S135) is performed. Repeated from processing.

【0081】統合文章がなければ、検索文字列を用いた
検索の結果、得られた統合文章名が記憶されている候補
バッファ17の内容が表示部16に表示される(S14
1)。ユーザは、表示部16の表示内容を見て呼出した
い統合文章名を入力部12を介して指定し(S14
2)、図29の画面にて表示モードも指定すると(S1
43)、指定された表示モードで指定された統合文章が
表示部16に表示される(S144)。
If there is no integrated sentence, as a result of the search using the search character string, the contents of the candidate buffer 17 storing the obtained integrated sentence name are displayed on the display unit 16 (S14).
1). The user specifies, via the input unit 12, the name of the integrated sentence to be called while viewing the display contents of the display unit 16 (S14)
2) If the display mode is also specified on the screen of FIG. 29 (S1)
43), the integrated sentence specified in the specified display mode is displayed on the display unit 16 (S144).

【0082】図30は、この発明の実施の形態による複
数の単語を検索するときの例を説明する図である。リン
ク元になる文章を検索する時点で、図30に示される文
章のファイル名をすべて初期化し、対応する検索単語が
見つかったらそのファイル名を書込み、リンクをすべて
検索した時点で、検索単語のそれぞれについてファイル
名が書込まれていれば、複数の単語(検索文字列)を用
いたAND検索ができたことになり、1つでも書込まれ
ていればOR検索できたことになる。
FIG. 30 is a diagram for explaining an example of searching for a plurality of words according to the embodiment of the present invention. At the time of searching for the text as the link source, all the file names of the text shown in FIG. 30 are initialized, and when the corresponding search word is found, the file name is written. If a file name has been written, AND search using a plurality of words (search character strings) has been performed, and if at least one has been written, OR search has been performed.

【0083】図31(A)と(B)は、この発明の実施
の形態による表示モードによる表示の違いを示している
図である。テキストモード指定のときは文字列が単純に
羅列されている。アウトラインモード指定のときはアウ
トラインの表示モードにより段落になったり、リンク先
が表示されない。図の場合は、段落深さ2のレベルの文
字列が表示されていない。
FIGS. 31 (A) and 31 (B) are diagrams showing a difference in display between display modes according to the embodiment of the present invention. When the text mode is specified, the character strings are simply listed. When the outline mode is specified, paragraphs or links are not displayed depending on the outline display mode. In the case of the figure, the character string at the paragraph depth 2 level is not displayed.

【0084】図32はこの発明の実施の形態による統合
文章のアウトライン表示のフローチャートである。図3
2において、まず表示モード記憶領域18から予めユー
ザにより設定された表示モードを取出し(S191)、
ユーザが選んだ統合文章を読込み(S192)、統合文
章のポインタを初期化し(S193)、表示用のポイン
タを初期化し(S194)、表示している段落深さのデ
ータを初期化する(S194)。そして統合文章のポイ
ンタが指している1行を取出し(S196)、統合文章
のポインタを更新し(S197)、設定表示モードが通
常(テキスト)モードかチェックし(S198)、通常
モードならばその1行を表示し(S201)、表示ポイ
ンタを更新する(S202)。
FIG. 32 is a flowchart of an integrated sentence outline display according to the embodiment of the present invention. FIG.
In 2, first, the display mode set by the user in advance is extracted from the display mode storage area 18 (S 191),
The integrated text selected by the user is read (S192), the pointer of the integrated text is initialized (S193), the pointer for display is initialized (S194), and the data of the displayed paragraph depth is initialized (S194). . Then, one line pointed by the pointer of the integrated text is fetched (S196), the pointer of the integrated text is updated (S197), and it is checked whether the setting display mode is the normal (text) mode (S198). The line is displayed (S201), and the display pointer is updated (S202).

【0085】設定表示モードがアウトラインモードなら
ば、文章のインデント位置を取出し(S199)、その
インデント位置が図29で予め指定される表示の段落深さ
と比較して(S200)、小さければ上のレベルなの
で、その1行を表示し(S201)、表示ポインタを更
新する(S202)。この操作を該統合文章が終了する
まで繰返す(S203)。
If the setting display mode is the outline mode, the indent position of the sentence is extracted (S199), and the indent position is compared with the paragraph depth of the display specified in advance in FIG. 29 (S200). Therefore, the one line is displayed (S201), and the display pointer is updated (S202). This operation is repeated until the integrated sentence ends (S203).

【0086】上述した文章の検索処理では、複数の文章
を検索して取込んだ後1つの文章に統合する処理を行な
ってから、統合文章について従来のフルテキストサーチ
エンジンを適用して検索を行なっていたが、文章検索時
にリンクが出てきたときは、その時点で検索をリンク先
の文章に切換えるようにしてもよい。
In the above-described sentence retrieval process, a process of retrieving and importing a plurality of sentences and integrating them into one sentence is performed, and then the integrated sentence is searched by applying a conventional full-text search engine. However, when a link comes out during a text search, the search may be switched to the linked text at that time.

【0087】図33は、この発明の実施の形態による検
索時リンク追跡のフローチャートである。まず、図28
のような検索ウィンドウが表示され(S151)、ユー
ザが1つ以上の検索文字列を入力すると(S152)、
テキスト記憶領域20の先頭の文章にポインタが移動し
(S153)、候補バッファ17を初期化し(S15
4)、検索フラグバッファ23で該文章に対応の検索フ
ラグがセットされているかチェックし(S155)、セ
ットされていればこの文章は既に検索されているから検
索を終了する。
FIG. 33 is a flowchart of link tracing at the time of retrieval according to the embodiment of the present invention. First, FIG.
Is displayed (S151), and when the user inputs one or more search character strings (S152),
The pointer moves to the first sentence of the text storage area 20 (S153), and the candidate buffer 17 is initialized (S15).
4) It is checked whether a search flag corresponding to the sentence is set in the search flag buffer 23 (S155). If set, the search is terminated because this sentence has already been searched.

【0088】そしてポインタが指す次の文章を検索する
(S156)。このときに、文章以外も取込むような指
定がされているならば図24(B)のようにファイル名
を取込むことができるようリンク先のファイル名も検索
する。リンクがあれば(S157)現在の文章における
アドレスをアドレスセーブバッファ22にセーブし(S
158)、この文章に対応の検索フラグバッファ23に
おける検索フラグをセットし(S259)、リンク先の
文章を検索する(S160)。
Then, the next sentence indicated by the pointer is searched (S156). At this time, if it is specified that other than the text is to be taken, the file name of the link destination is also searched so that the file name can be taken as shown in FIG. If there is a link (S157), the address in the current text is saved in the address save buffer 22 (S157).
158), a search flag in the search flag buffer 23 corresponding to the sentence is set (S259), and the linked text is searched (S160).

【0089】リンク先が検索終了すれば検索フラグバッ
ファ23における対応の検索フラグをリセット(クリ
ア)し(S171)、セーブしていたアドレスセーブバ
ッファ22中のアドレスから検索を再開する(S17
2)。
When the search of the link destination is completed, the corresponding search flag in the search flag buffer 23 is reset (cleared) (S171), and the search is restarted from the saved address in the address save buffer 22 (S17).
2).

【0090】予め入力された検索文字列がすべてあれば
(S173)、候補バッファ17にリンク元の文章名を
統合文章名としてセットし(S174)、候補バッファ
17のポインタを更新し(S175)、検索のためのテ
キスト記憶領域20のポインタを次の文章に移動し(S
176)、文章がまだ存在するか否かチェックし(S1
77)、あれば検索フラグのチェックから繰返し、なけ
れば候補バッファ17の内容である1つ以上の統合文章
名を表示し(S178)、ユーザが呼出したい統合文章
名が指定される(S179)。この指定に応じてCPU
11は指定統合文章名であるリンク元文章と、これにリ
ンクに従い関連付けられている他の文章を統合して統合
文章をテキストバッファ19に作成する。表示モード
(図29参照)も指定されると(S180)、指定され
た表示モードで作成されたテキストバッファ19の統合
文章が表示される(S181)。
If all of the previously input search character strings are present (S173), the link source text name is set in the candidate buffer 17 as an integrated text name (S174), and the pointer of the candidate buffer 17 is updated (S175). The pointer of the text storage area 20 for search is moved to the next sentence (S
176), and check whether the sentence still exists (S1).
77) If there is, the process is repeated from checking the search flag. If not, one or more integrated sentence names, which are the contents of the candidate buffer 17, are displayed (S178), and the integrated sentence name that the user wants to call is specified (S179). CPU according to this specification
Numeral 11 integrates a link source sentence, which is a designated integrated sentence name, and another sentence associated therewith according to a link to create an integrated sentence in the text buffer 19. When the display mode (see FIG. 29) is also specified (S180), the integrated text of the text buffer 19 created in the specified display mode is displayed (S181).

【0091】この処理フローチャートでは、検索エンジ
ンにリンク先の検索も行なう対応を入れなければならな
いが、統合された文章データを内部にて蓄えなくて良い
という利点がある。
In this processing flowchart, it is necessary to provide a search engine with a function of searching for a link destination, but there is an advantage that integrated sentence data need not be stored internally.

【0092】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
The embodiments disclosed this time are to be considered in all respects as illustrative and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の実施の形態に適用される文章検索装
置のブロック構成図である。
FIG. 1 is a block configuration diagram of a text search device applied to an embodiment of the present invention.

【図2】この発明の実施の形態に適用されるハイパーテ
キストの第1例を示す図である。
FIG. 2 is a diagram showing a first example of a hypertext applied to the embodiment of the present invention.

【図3】(A)〜(C)は図2の各文章の内部データを
示す図である。
FIGS. 3A to 3C are diagrams showing internal data of each sentence of FIG. 2;

【図4】図3(A)〜(C)のデータが統合された結果
の統合文章を示す図である。
FIG. 4 is a diagram showing an integrated sentence as a result of integrating the data of FIGS. 3 (A) to (C).

【図5】この発明の実施の形態に適用されるハイパーテ
キストの第2例を示す図である。
FIG. 5 is a diagram showing a second example of the hypertext applied to the embodiment of the present invention.

【図6】(A)〜(C)は、図5の各文章の内部データ
を示す図である。
FIGS. 6A to 6C are diagrams showing internal data of each sentence in FIG. 5;

【図7】図5および図6に示される各文章が統合された
結果の統合文章の第1例を示す図である。
FIG. 7 is a diagram showing a first example of an integrated sentence as a result of integrating the sentences shown in FIGS. 5 and 6;

【図8】図5および図6に示される各文章が統合された
結果の統合文章の第2例を示す図である。
FIG. 8 is a diagram showing a second example of an integrated sentence as a result of integrating the sentences shown in FIGS. 5 and 6;

【図9】図5および図6に示される各文章が統合された
結果の統合文章の第3例を示す図である。
FIG. 9 is a diagram showing a third example of an integrated sentence as a result of integrating the sentences shown in FIGS. 5 and 6;

【図10】図5および図6に示される各文章が改良して
統合された統合文章の第1例を示す図である。
FIG. 10 is a diagram showing a first example of an integrated sentence in which the sentences shown in FIGS. 5 and 6 are improved and integrated;

【図11】図5および図6に示される各文章が改良して
統合された統合文章の第2例を示す図である。
FIG. 11 is a diagram showing a second example of an integrated sentence in which the sentences shown in FIGS. 5 and 6 have been improved and integrated;

【図12】図5および図6に示される各文章が改良して
統合された統合文章の第3例を示す図である。
FIG. 12 is a diagram showing a third example of an integrated sentence in which the sentences shown in FIGS. 5 and 6 are improved and integrated;

【図13】この発明の実施の形態に適用されるハイパー
テキストの第3例を示す図である。
FIG. 13 is a diagram showing a third example of the hypertext applied to the embodiment of the present invention.

【図14】(A)と(B)は図13の各文章の内部デー
タを示す図である。
14A and 14B are diagrams showing internal data of each sentence in FIG.

【図15】図13に示される文章が統合された結果の統
合文章を示す図である。
FIG. 15 is a diagram showing an integrated sentence as a result of integrating the sentences shown in FIG. 13;

【図16】この発明の実施の形態に適用されるハイパー
テキストの第4例を示す図である。
FIG. 16 is a diagram showing a fourth example of a hypertext applied to the embodiment of the present invention.

【図17】(A)と(B)は図16の各文章の内部デー
タを示す図である。
17A and 17B are diagrams showing internal data of each sentence in FIG. 16;

【図18】図17(A)と(B)のデータが統合された
結果の統合文章を示す図である。
FIG. 18 is a diagram showing an integrated sentence as a result of integrating the data of FIGS. 17 (A) and (B).

【図19】この発明の実施の形態に適用されるデータ収
集時の処理フローチャートである。
FIG. 19 is a processing flowchart at the time of data collection applied to the embodiment of the present invention.

【図20】図19の処理において表示されるデータ取込
条件設定画面例を示す図である。
20 is a diagram showing an example of a data capture condition setting screen displayed in the process of FIG. 19;

【図21】この発明の実施の形態によるリンク先がテキ
スト以外の例を示す図である。
FIG. 21 is a diagram illustrating an example where a link destination is other than text according to the embodiment of the present invention;

【図22】この発明の実施の形態に適用されるデータ統
合時の処理フローチャートである。
FIG. 22 is a processing flowchart at the time of data integration applied to the embodiment of the present invention.

【図23】図22のテキスト統合の詳細処理フローチャ
ートである。
FIG. 23 is a detailed processing flowchart of text integration in FIG. 22;

【図24】(A)と(B)は、リンク先のデータを取込
んで統合するか否かによる統合文章の例を示す図であ
る。
FIGS. 24A and 24B are diagrams showing examples of an integrated sentence depending on whether or not to take in and integrate data at a link destination;

【図25】(A)〜(D)は、図2、図5、図13およ
び図16のハイパーテキストの相関関係を表形式で示す
相関表の図である。
FIGS. 25A to 25D are diagrams of a correlation table showing the correlation between the hypertexts of FIGS. 2, 5, 13 and 16 in a table format.

【図26】この発明の実施の形態による相関表を作成す
るための処理フローチャートである。
FIG. 26 is a processing flowchart for creating a correlation table according to the embodiment of the present invention.

【図27】この発明の実施の形態に適用される統合文章
検索時の処理フローチャートである。
FIG. 27 is a processing flowchart at the time of an integrated sentence search applied to the embodiment of the present invention.

【図28】図27の処理にて表示される検索文字列入力
ウィンドウの一例を示す図である。
FIG. 28 is a diagram showing an example of a search character string input window displayed in the process of FIG. 27.

【図29】図27の処理にて表示される表示モード指定
画面の一例を示す図である。
FIG. 29 is a diagram illustrating an example of a display mode designation screen displayed in the process of FIG. 27;

【図30】この発明の実施の形態による複数の単語を検
索するときの例を説明する図である。
FIG. 30 is a diagram illustrating an example of searching for a plurality of words according to an embodiment of the present invention.

【図31】(A)と(B)は、この発明の実施の形態に
よる表示モードによる表示の違いを示している図であ
る。
FIGS. 31 (A) and 31 (B) are diagrams showing a difference in display between display modes according to an embodiment of the present invention.

【図32】この発明の実施の形態による統合文章のアウ
トライン表示のフローチャートである。
FIG. 32 is a flowchart of an integrated sentence outline display according to an embodiment of the present invention.

【図33】この発明の実施の形態による検索時リンク追
跡の処理フローチャートである。
FIG. 33 is a processing flowchart of link tracing during search according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

11 CPU 12 入力部 13 通信部 14 記憶部 15 検索部 16 表示部 17 候補バッファ 18 表示モード記憶領域 19 テキストバッファ 20 テキスト記憶領域 21 統合文章記憶領域 22 アドレスセーブバッファ 23 検索フラグバッファ 23 読出フラグバッファ 25 取込深さ記憶領域 26 記録媒体 27 相関記憶部 11 CPU 12 input unit 13 communication unit 14 storage unit 15 search unit 16 display unit 17 candidate buffer 18 display mode storage area 19 text buffer 20 text storage area 21 integrated text storage area 22 address save buffer 23 search flag buffer 23 read flag buffer 25 Capture depth storage area 26 Recording medium 27 Correlation storage unit

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 各データ内で相互に関連付けるためのリ
ンク情報に従い関連付けられた文章データを含む複数の
データを記憶する記憶手段と、 前記記憶手段中の前記複数のデータを前記リンク情報に
従い統合処理して1つ以上の統合文章データに生成する
ための統合手段と、 1つ以上の検索文字列データを指定する指定手段と、 前記統合手段により統合された前記1つ以上の統合文章
データのそれぞれにおいて、前記指定手段により指定さ
れた前記1つ以上の検索文字列データが含まれるか否か
検索する検索手段と、 前記検索手段の検索結果を表示する表示手段とを備え
た、文章検索装置。
1. A storage unit for storing a plurality of data including text data associated with each other in accordance with link information for associating the data with each other, and integrating the plurality of data in the storage unit in accordance with the link information. Integrating means for generating at least one integrated sentence data, specifying means for specifying one or more search character string data, and each of the one or more integrated sentence data integrated by the integrating means , A text search device, comprising: a search unit that searches whether or not the one or more search character string data specified by the specification unit is included; and a display unit that displays a search result of the search unit.
【請求項2】 前記リンク情報を記憶するリンク情報記
憶手段をさらに有して、 前記統合手段は、 前記リンク情報記憶手段中の前記リンク情報に基づいて
前記複数データにおいて前記関連付けがループしている
か検出するループ検出手段をさらに有して、前記ループ
検出手段により前記複数データにおいてループしている
と検出された前記データは前記統合処理の対象としない
ことを特徴とする、請求項1に記載の文章検索装置。
2. The apparatus according to claim 1, further comprising a link information storage unit configured to store the link information, wherein the integration unit determines whether the association is looped in the plurality of data based on the link information in the link information storage unit. 2. The apparatus according to claim 1, further comprising a loop detection unit for detecting, wherein the data detected as a loop in the plurality of data by the loop detection unit is not subjected to the integration processing. Text retrieval device.
【請求項3】 前記統合手段は、前記ループ検出手段に
よりループしていると検出された場合には、ループして
いる前記関連付けにおける1つ以上の部分で前記関連付
けが無しとされた後の前記リンク情報に基づいて、前記
複数データについて前記統合処理をすることを特徴とす
る、請求項2に記載の文章検索装置。
3. The method according to claim 2, wherein, when the loop detection unit detects that the association is looped, the integration unit determines that the association is not performed in one or more parts of the association that is looped. The text search device according to claim 2, wherein the integration processing is performed on the plurality of data based on link information.
【請求項4】 前記統合手段は、前記リンク情報記憶手
段中の前記リンク情報に基づいて前記複数データにおい
て一方の前記文章データから他方の前記文章データへの
前記関連付けを判定する関連付け判定手段をさらに有
し、 前記関連付け判定手段により前記一方文章データ中の複
数の単語のそれぞれから前記他方文章データ中の複数の
単語それぞれに関連付けされていると判定された場合に
は、前記統合手段は前記他方文章データを前記関連付け
に基づいて分割して、分割後の文章データのそれぞれを
用いて前記統合処理することを特徴とする、請求項2ま
たは3に記載の文章検索装置。
4. The associating unit further includes an association determining unit that determines the association from one sentence data to the other sentence data in the plurality of data based on the link information in the link information storage unit. When the association determination unit determines that the plurality of words in the one-sentence data are associated with each of the plurality of words in the other-sentence data, the integration unit includes the other-sentence 4. The text search device according to claim 2, wherein data is divided based on the association, and the integration processing is performed using each of the divided text data. 5.
【請求項5】 前記関連付け判定手段により、前記一方
文章データ中の複数の単語から前記他方文章データ中の
同じ単語に関連付け去れていると判定された場合には、
前記統合手段は前記他方文章データを分割せずに前記統
合処理をすることを特徴とする、請求項4に記載の文章
検索装置。
5. When the association determination unit determines that a plurality of words in the one sentence data are associated with the same word in the other sentence data,
The text search device according to claim 4, wherein the integration unit performs the integration process without dividing the other text data.
【請求項6】 前記統合処理において、前記文章データ
が統合される場合には、前記関連付けにおける関連元の
前記文章データ中に対応の関連先の前記文章データが段
落を下げて取込まれることを特徴とする、請求項1ない
し5のいずれかに記載の文章検索装置。
6. When the sentence data is integrated in the integration processing, the sentence data of the corresponding destination is taken into the sentence data of the associated source in the association by lowering paragraphs. The sentence retrieval device according to any one of claims 1 to 5, characterized in that:
【請求項7】 前記統合処理において、前記文章データ
が統合される場合に、前記関連付けにおける関連元の前
記文章データ中の対応する関連先文章データの取込位置
の文字列と該関連先文章データの先頭文字列が同じであ
るときは、一方の文字列が省略されることを特徴とす
る、請求項1ないし6のいずれかに記載の文章検索装
置。
7. In the integration processing, when the text data is integrated, a character string of a position where a corresponding relevant destination text data is taken in the relevant source text data in the association and the relevant destination text data 7. The sentence retrieval apparatus according to claim 1, wherein one of the character strings is omitted when the first character string is the same.
【請求項8】 前記表示手段において、前記検索結果で
ある前記統合文章データはアウトライン機能モードで表
示されることを特徴とする、請求項1ないし7のいずれ
かに記載の文章検索装置。
8. The text search device according to claim 1, wherein the integrated text data as the search result is displayed in an outline function mode on the display unit.
【請求項9】 前記統合処理において、関連先の前記デ
ータが前記文章データでない場合には、該データは処理
対象とされないことを特徴とする請求項1ないし8のい
ずれかに記載の文章検索装置。
9. The text search apparatus according to claim 1, wherein, in the integration processing, if the data at the related destination is not the text data, the data is not processed. .
【請求項10】 前記統合処理において、関連先の前記
データが前記文章データでない場合には、該データを識
別するために予め付与された文字列データを用いて処理
されることを特徴とする、請求項1ないし8のいずれか
に記載の文章検索装置。
10. In the integration processing, if the data at the related destination is not the text data, the data is processed using character string data assigned in advance to identify the data. The sentence retrieval device according to any one of claims 1 to 8.
【請求項11】 前記記憶手段中の前記複数のデータ
は、ハイパーテキストを構成するデータであることを特
徴とする、請求項1ないし10のいずれかに記載の文章
検索装置。
11. The text search device according to claim 1, wherein the plurality of data in the storage unit is data constituting a hypertext.
【請求項12】 各データ内で相互に関連付けるための
リンク情報に従い関連付けられた文章データを含む複数
のデータを記憶する記憶手段と、 1つ以上の検索文字列データを指定する指定手段と、 前記記憶手段中の前記複数データ中から前記指定手段に
より指定された前記検索文字列データを検索する検索手
段と、 前記検索手段による検索結果を表示する表示手段とを備
え、 前記検索手段は、前記データの検索中に前記リンク情報
があれば、該データの検索を中断し該リンク情報に従う
関連先の前記データを検索して検索終了すれば、該リン
ク情報に従う関連元の前記データの検索を再開しなが
ら、前記1つ以上の検索文字列データが検索された前記
文章データを逐次統合して統合文章データに生成するこ
とを特徴とする、文章検索装置。
12. A storage unit for storing a plurality of data including sentence data associated with each other in accordance with link information for associating with each other in data, a designation unit for designating one or more search character string data, A search unit for searching the search string data designated by the designation unit from the plurality of data in the storage unit; and a display unit for displaying a search result by the search unit. If there is the link information during the search, the search of the data is interrupted, the search of the data of the related destination according to the link information is completed, and the search of the data of the related source according to the link information is restarted. Wherein the one or more pieces of the search character string data are successively integrated to generate integrated sentence data, whereby the sentence data is retrieved.
【請求項13】 各データ内で相互に関連付けるための
リンク情報に従い関連付けられた文章データを含む複数
のデータを対象にした文章検索方法であって、 前記複数のデータを前記リンク情報に従い統合処理して
1つ以上の統合文章データに生成するための統合ステッ
プと、 1つ以上の検索文字列データを指定する指定ステップ
と、 前記統合ステップにより統合された前記1つ以上の統合
文章データのそれぞれにおいて、前記指定ステップによ
り指定された前記1つ以上の検索文字列データが含まれ
るか否か検索する検索ステップと、 前記検索ステップの検索結果を表示する表示ステップと
を備えた、文章検索方法。
13. A sentence search method for a plurality of data including sentence data associated according to link information for associating with each other in each data, wherein the plurality of data are integrated according to the link information. An integration step for generating at least one integrated sentence data into one or more integrated sentence data, a designation step of designating one or more search character string data, and each of the one or more integrated sentence data integrated by the integration step A text search method, comprising: a search step of searching whether or not the one or more search character string data specified by the specification step is included; and a display step of displaying a search result of the search step.
【請求項14】 各データ内で相互に関連付けるための
リンク情報に従い関連付けられた文章データを含む複数
のデータを対象にした文章検索方法であって、 1つ以上の検索文字列データを指定する指定ステップ
と、 前記複数データ中から前記指定ステップにより指定され
た前記検索文字列データを検索する検索ステップと、 前記検索ステップによる検索結果を表示する表示ステッ
プとを備え、 前記検索ステップは、前記データの検索中に前記リンク
情報があれば、該データの検索を中断し該リンク情報に
従う関連先の前記データを検索して検索終了すれば、該
リンク情報に従う関連元の前記データの検索を再開しな
がら、前記1つ以上の検索文字列データが検索された前
記文章データを逐次統合して統合文章データに生成する
ことを特徴とする、文章検索方法。
14. A sentence search method for a plurality of data including sentence data associated with each other in accordance with link information for associating each data with each other, wherein a designation for designating one or more search character string data A search step for searching the search character string data specified by the specification step from the plurality of data; and a display step of displaying a search result obtained by the search step, wherein the search step includes: If there is the link information during the search, the search of the data is interrupted, and the search for the data of the related destination according to the link information is completed, and the search of the data of the related source according to the link information is restarted. Wherein the sentence data from which the one or more search character string data has been searched are sequentially integrated to generate integrated sentence data. To, text search method.
【請求項15】 各データ内で相互に関連付けるための
リンク情報に従い関連付けられた文章データを含む複数
のデータを対象にした文章検索方法をコンピュータに実
行させるための文章検索プログラムを記録したコンピュ
ータで読取り可能な記録媒体であって、 前記文章検索方法は、 前記複数のデータを前記リンク情報に従い統合処理して
1つ以上の統合文章データに生成するための統合ステッ
プと、 1つ以上の検索文字列データを指定する指定ステップ
と、 前記統合ステップにより統合された前記1つ以上の統合
文章データのそれぞれにおいて、前記指定ステップによ
り指定された前記1つ以上の検索文字列データが含まれ
るか否か検索する検索ステップと、 前記検索ステップの検索結果を表示する表示ステップと
を備えた、文章検索プログラムを記録したコンピュータ
で読取り可能な記録媒体。
15. A computer which records a sentence search program for causing a computer to execute a sentence search method for a plurality of data including sentence data associated with each other in accordance with link information for associating each data with each other. A possible recording medium, wherein the sentence search method comprises: an integration step of integrating the plurality of data in accordance with the link information to generate one or more integrated sentence data; and one or more search character strings. A designation step of designating data; and a search as to whether or not each of the one or more integrated text data integrated by the integration step includes the one or more search character string data specified by the specification step Sentence search, comprising: a search step for performing search, and a display step for displaying a search result of the search step Readable recording medium recorded with computer programs.
【請求項16】 各データ内で相互に関連付けるための
リンク情報に従い関連付けられた文章データを含む複数
のデータを対象にした文章検索方法をコンピュータに実
行させるための文章検索プログラムを記録したコンピュ
ータで読取り可能な記録媒体であって、 前記文章検索方法は、 各データ内で相互に関連付けるためのリンク情報に従い
関連付けられた文章データを含む複数のデータを対象に
した文章検索方法であって、 1つ以上の検索文字列データを指定する指定ステップ
と、 前記複数データ中から前記指定ステップにより指定され
た前記検索文字列データを検索する検索ステップと、 前記検索ステップによる検索結果を表示する表示ステッ
プとを備え、 前記検索ステップは、前記データの検索中に前記リンク
情報があれば、該データの検索を中断し該リンク情報に
従う関連先の前記データを検索して検索終了すれば、該
リンク情報に従う関連元の前記データの検索を再開しな
がら、前記1つ以上の検索文字列データが検索された前
記文章データを逐次統合して統合文章データに生成する
ことを特徴とする、文章検索プログラムを記録したコン
ピュータで読取り可能な記録媒体。
16. A computer which records a sentence search program for causing a computer to execute a sentence search method for a plurality of data including sentence data associated with each other in accordance with link information for associating each data with each other. A possible recording medium, wherein the sentence search method is a sentence search method for a plurality of data including sentence data associated according to link information for associating with each other in each data; A search step of specifying the search character string data of the above, a search step of searching for the search character string data specified by the specification step from the plurality of data, and a display step of displaying a search result by the search step. The search step includes, if the link information is found during the search for the data, If the search of the related data according to the link information is interrupted and the search is terminated, the search of the one or more search character string data is resumed while resuming the search of the related data according to the link information. A computer-readable recording medium storing a sentence search program, wherein the searched sentence data is sequentially integrated to generate integrated sentence data.
JP11058791A 1999-03-05 1999-03-05 Sentence retrieving device, its retrieving method and computer readable recording medium storing sentence retrieving program Pending JP2000259648A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11058791A JP2000259648A (en) 1999-03-05 1999-03-05 Sentence retrieving device, its retrieving method and computer readable recording medium storing sentence retrieving program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11058791A JP2000259648A (en) 1999-03-05 1999-03-05 Sentence retrieving device, its retrieving method and computer readable recording medium storing sentence retrieving program

Publications (1)

Publication Number Publication Date
JP2000259648A true JP2000259648A (en) 2000-09-22

Family

ID=13094406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11058791A Pending JP2000259648A (en) 1999-03-05 1999-03-05 Sentence retrieving device, its retrieving method and computer readable recording medium storing sentence retrieving program

Country Status (1)

Country Link
JP (1) JP2000259648A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004036497A1 (en) * 2002-10-18 2004-04-29 Japan Science And Technology Agency Learning/thinking machine and learning/thinking method based on structured knowledge, computer system, and information generation method
JP2008059428A (en) * 2006-09-01 2008-03-13 Mitsubishi Electric Corp Document data management device, document data management method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004036497A1 (en) * 2002-10-18 2004-04-29 Japan Science And Technology Agency Learning/thinking machine and learning/thinking method based on structured knowledge, computer system, and information generation method
JP2008059428A (en) * 2006-09-01 2008-03-13 Mitsubishi Electric Corp Document data management device, document data management method, and program

Similar Documents

Publication Publication Date Title
US6564210B1 (en) System and method for searching databases employing user profiles
US7254773B2 (en) Automated spell analysis
JP2770715B2 (en) Structured document search device
US5983248A (en) Data processing system and method for generating a representation for and random access rendering of electronic documents
US7958115B2 (en) Search systems and methods using in-line contextual queries
US7676462B2 (en) Method, apparatus, and program for refining search criteria through focusing word definition
US8458207B2 (en) Using anchor text to provide context
US7558792B2 (en) Automatic extraction of human-readable lists from structured documents
US8788494B2 (en) Method, device and system for processing, browsing and searching an electronic documents
US20050081146A1 (en) Relation chart-creating program, relation chart-creating method, and relation chart-creating apparatus
JPH06266780A (en) Character string retrieving method by semantic pattern recognition and device therefor
KR20060117978A (en) Lateral search
JP2008511075A (en) System and method for searching legal points
AU2020221062B2 (en) Generating and provisioning of additional content for source perspective(s) of a document
JP2004280661A (en) Retrieval method and program
JPH08305729A (en) Network information filtering system
TWI680377B (en) Method and device for processing the accumulation searching
JP2004514967A (en) Method and apparatus for linking databases
JP2005107931A (en) Image search apparatus
JP2000259648A (en) Sentence retrieving device, its retrieving method and computer readable recording medium storing sentence retrieving program
US20050071333A1 (en) Method for determining synthetic term senses using reference text
US20020147705A1 (en) Method system and program product for data searching
JP3504002B2 (en) Node link automatic generation method
JP2005309498A (en) Information extraction system, information extraction method and computer program
JP2001306584A (en) Knowledge retrieval service method and device for supporting retrieval of books or the like

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040622

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050111