JP2005173999A - Device, system and method for searching electronic file, program, and recording media - Google Patents

Device, system and method for searching electronic file, program, and recording media Download PDF

Info

Publication number
JP2005173999A
JP2005173999A JP2003413562A JP2003413562A JP2005173999A JP 2005173999 A JP2005173999 A JP 2005173999A JP 2003413562 A JP2003413562 A JP 2003413562A JP 2003413562 A JP2003413562 A JP 2003413562A JP 2005173999 A JP2005173999 A JP 2005173999A
Authority
JP
Japan
Prior art keywords
search
document
input
unit
electronic file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003413562A
Other languages
Japanese (ja)
Inventor
Toshio Miyazawa
利夫 宮澤
Toshifumi Yamaai
敏文 山合
Hideaki Yamagata
秀明 山形
Fumihiro Hasegawa
史裕 長谷川
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003413562A priority Critical patent/JP2005173999A/en
Publication of JP2005173999A publication Critical patent/JP2005173999A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an electronic file search device capable of assisting a user in creating documents by automatically extracting search words to conduct searches when conditions preset by the user are met. <P>SOLUTION: Character strings or editing operations for creating or editing documents are inputted. Whether or not the characters inputted meet predetermined conditions is determined as necessary, and if they are determined to meet the conditions, search words are extracted from the character strings inputted, and for the first search the extracted search words are used to search a document database. For second and subsequent searches, search refinements are carried out on the previous search results, and searches and the display of search results are repeated until no new characters are inputted. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体に関し、文書を新規に作成または既存の文書を編集するときに関連のある文書を検索して提示する技術に関する。   The present invention relates to an electronic file search device, an electronic file search system, an electronic file search method, a program, and a recording medium, and relates to a technique for searching and presenting a related document when creating a new document or editing an existing document. About.

従来、文書を作成する場合、過去に作成した関連のある文書を参照したいときには、関連のある文書を検索するためのキーワードを選択して検索式を作成する。文書を集積してある文書データベースにこの検索式を適用して、関連ある文書の候補を抽出して、その抽出された候補から概要や内容を読むことによって所望の文書を特定している。さらに、検索結果が思わしくないときには、検索式の修正を行って再検索している。
このようにして検索された関連ある文書から所望の文書を選択して、その内容を見ることにより、新たな文書や既存文書の編集を行っていた。
Conventionally, when creating a document, if it is desired to refer to a related document created in the past, a search expression is created by selecting a keyword for searching the related document. This search formula is applied to a document database in which documents are accumulated to extract related document candidates, and a desired document is specified by reading an outline and contents from the extracted candidates. Further, when the search result is not satisfactory, the search formula is corrected and the search is performed again.
A new document or an existing document is edited by selecting a desired document from the related documents searched in this way and viewing the contents thereof.

また、検索式の自然言語での入力、検索結果に対する対話、対話による絞込み検索等を支援する次のような検索システムがある。   In addition, there are the following search systems that support input of a search expression in a natural language, dialogue on search results, narrowed search by dialogue, and the like.

特許文献1は、ユーザの自然語による入力文をその対話の状況(その入力文がシステムの発した質問に対する回答なのかどうかといった発話の状況)を判断し、その状況判断に従って入力を理解するため入力モードを切り替えて解析することができ、さらにはその入力文の文意を判定し、適切な作業を実行し、その実行に応じた適切な応答文をユーザに返すことができる人間の対話に、より近い対話を可能としている。   Japanese Patent Laid-Open No. 2004-151867 determines an input sentence in a user's natural language based on a dialog situation (an utterance situation such as whether the input sentence is an answer to a question issued by the system) and understands the input according to the situation judgment. It is possible to analyze by switching the input mode, and also to determine the meaning of the input sentence, execute appropriate work, and return an appropriate response sentence to the user according to the execution. , Enabling closer dialogue.

特許文献2は、自然言語を用いて検索条件を入力し、入力された検索条件を分解・解析して、検索に用いるキーワードとして抽出する。この抽出されたキーワードを用いて全文を対象に検索して検索結果を出力するようにした自然言語型検索支援方法であって、キーワードのカテゴリに関する相関関係を登録しているカテゴリ構造データベースを参照して、キーワードに基づいて検索対象のカテゴリを特定し、利用者との対話形式によって、検索対象のカテゴリが特定できるまで検索条件を変更するよう誘導する質問文を生成するようにした。これにより、利用者自身の真の検索ニーズを具現化することができ、かつ、計算機資源の無駄遣いを抑制することもできる自然言語型検索支援装置を提供することができる。   In Patent Document 2, a search condition is input using a natural language, the input search condition is decomposed and analyzed, and extracted as a keyword used for the search. This is a natural language search support method that uses the extracted keywords to search the entire text and outputs the search results, and refers to a category structure database that registers correlations for keyword categories. In addition, the category of the search target is specified based on the keyword, and a question sentence that guides the user to change the search condition until the category of the search target can be specified is generated by an interactive form with the user. Thus, it is possible to provide a natural language search support apparatus that can embody the user's own search needs and can suppress the waste of computer resources.

特許文献3は、ユーザの行った検索作業の履歴を、自然言語による入出力の履歴と検索対象集合の作成履歴をネットワーク化したものとして管理し、以前の検索結果に対する言及があれば、自然言語による入出力の履歴をサーチして以前の検索対象集合を利用することで、同様の検索処理の繰り返しを避け、また、検索履歴の取り出しを容易にして、効率的な検索作業を実現している。   Patent Document 3 manages the history of search work performed by a user as a network of input / output history and search target set creation history in natural language, and if there is a reference to previous search results, By searching the input / output history by using the previous search target set, it is possible to avoid the repetition of the same search process and to easily retrieve the search history, thereby realizing efficient search work. .

特許文献4は、入力された自然言語から可能な限り多くの論理検索式を作成可能とすることによって、検索者は作成された複数の論理検索式から自己の意図する論理検索式を簡単に指定でき、たとえ複雑な論理検索式を必要とする複雑な条件の検索を実施する場合に、普段用いている自然言語を入力したとしても、正確に検索者の意図した情報検索を実施でき、高い操作性と高い検索精度を実現できる。   Patent Document 4 enables a searcher to easily specify a logical search expression intended by the plurality of generated logical search expressions by making it possible to create as many logical search expressions as possible from the input natural language. Even if you enter a natural language that you normally use, even if you search for complex conditions that require complex logical search expressions, you can accurately search for information intended by the searcher and perform high operations. And high search accuracy.

特許文献5は、形態素解析部で入力文を解析して要素に分解し、意味解析部により入力文を内部表現形式に変換して該入力文の概念および概念関係を明確にし、文関係抽出部により入力文における文と文の間の関係を抽出し、データベース検索部により内部表現形式に基づきデータベースをアクセスして情報検索および情報登録を行う。回答情報検査部により情報検索の結果である回答情報の重複部分を抽出し、回答情報整合部により回答情報の重複部分を調整し提示順序の整合をとり、自然言語文生成部により調整および整合後の回答情報を自然言語形式に変換する。
これにより、ユーザの複数の意図や複雑な条件に対して情報の整理・分類を行って、検索要求に即した情報をユーザにわかりやすく提示することができる。
特開2001−022763号公報 特開2001−034614号公報 特開平7−078171号公報 特開平11−175541号公報 特開平11−272710号公報
Patent Document 5 analyzes an input sentence by a morphological analysis unit and decomposes it into elements, and converts the input sentence to an internal representation format by a semantic analysis unit to clarify the concept and conceptual relationship of the input sentence, and a sentence relation extraction unit Then, the relation between sentences in the input sentence is extracted, and the database retrieval unit accesses the database based on the internal representation format to perform information retrieval and information registration. The response information inspection part extracts the duplicate part of the response information as a result of the information search, the reply information matching part adjusts the duplicate part of the reply information to match the presentation order, and the natural language sentence generation part adjusts and matches The answer information of is converted into a natural language format.
As a result, it is possible to organize and classify information for a plurality of user's intentions and complicated conditions, and to present information that meets the search request to the user in an easy-to-understand manner.
JP 2001-022763 A Japanese Patent Laid-Open No. 2001-034614 Japanese Patent Laid-Open No. 7-078171 JP 11-175541 A Japanese Patent Laid-Open No. 11-272710

上述したように、関連のある文書を検索する際に、従来ではユーザがキーワード等の検索語を入力して、そのたびに検索実行ボタン等を押すことによって初めて検索が開始された。
しかし、文書を作成するときには、入力のたびに関連のある文書が変化していくことがある。このような場合には、この変化のたびに検索式を作成して、文書検索をし直さなければならなくなり、文書作成作業が煩雑となってしまう。
As described above, when searching for a related document, conventionally, a search is started only when a user inputs a search word such as a keyword and presses a search execution button each time.
However, when creating a document, the related document may change each time an input is made. In such a case, it is necessary to create a search formula every time this change occurs and to perform a document search again, which complicates the document creation work.

本発明は、上述の実情を考慮してなされたものであって、ユーザが予め設定して条件になったときに、検索語を自動的に抽出して検索実行し、検索された関連文書を表示することで、ユーザの文書作成を支援することができる電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体を提供することを目的としている。   The present invention has been made in consideration of the above-described circumstances, and when a user sets in advance and becomes a condition, a search word is automatically extracted and searched, and a related document searched for is retrieved. It is an object of the present invention to provide an electronic file search device, an electronic file search system, an electronic file search method, a program, and a recording medium that can support user document creation by displaying.

上記の課題を解決するために、請求項1の発明は、文書の作成または編集のための文字列や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて文書データベースを検索する検索部と、前記検索部で検索された検索結果を表示する結果表示部とを有し、条件に合致した文字が入力されると、前回の検索以降に入力された文字列に対して検索語を抽出し、この検索語を用いて検索して検索結果を表示することを、新たに文字が入力されなくなるまで繰り返すようにしたことを特徴とする。   In order to solve the above-described problems, the invention of claim 1 is directed to a character input unit for inputting a character string or an editing operation for creating or editing a document, and whether or not the input character satisfies a predetermined condition. A determination unit that sequentially determines whether or not a condition is satisfied by the determination unit, a search word extraction unit that extracts a search word from an input character string, and the search word extraction unit A search unit that searches a document database using a search term and a result display unit that displays a search result searched by the search unit, and when a character that matches the condition is input, A feature is that a search word is extracted from the input character string, and the search using the search word and displaying the search result are repeated until no new character is input.

請求項2の発明は、請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で入力された文書内容の文字列から抽出された検索語を用いて文書データベースを検索し、文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする。   According to a second aspect of the present invention, in the electronic file search apparatus according to the first aspect, the electronic document retrieval apparatus includes a document input unit that reads the contents of the specified existing document. When the existing document is specified, the document input unit The document database is searched using a search word extracted from the character string of the input document content, and after the document content is read, the character input unit inputs characters.

請求項3の発明は、請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする。   According to a third aspect of the present invention, in the electronic file search apparatus according to the first aspect, the electronic document retrieval apparatus includes a document input unit that reads the contents of the specified existing document. When the existing document is specified, the document input unit Characters are input by the character input unit after reading the document contents.

請求項4の発明は、請求項1、2または3に記載の電子ファイル検索装置において、前記検索部は、2回目以降の検索実行の場合には、前回の検索結果を対象にして絞り込み検索を行うことを特徴とする。   According to a fourth aspect of the present invention, in the electronic file search apparatus according to the first, second, or third aspect, in the case of performing the second or subsequent search, the search unit performs a narrow search for the previous search result. It is characterized by performing.

請求項5の発明は、請求項1乃至4のいずれかに記載の電子ファイル検索装置において、前記結果表示部は、検索結果の文書を縮小画像形式で表示することを特徴とする。   According to a fifth aspect of the present invention, in the electronic file search device according to any one of the first to fourth aspects, the result display unit displays a search result document in a reduced image format.

請求項6の発明は、任意台数の端末と電子ファイル検索サーバとを通信ネットワークで接続した電子ファイル検索システムにおいて、前記端末は、文書の作成または編集のための文字列や編集操作を入力して、前記電子ファイル検索サーバへ送信する文書編集部と、前記電子ファイル検索サーバから検索結果を受信して表示する結果表示部とを有し、前記電子ファイル検索サーバは、前記端末から受信した文字や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて、最初の検索の場合には文書データベースを検索対象として検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、検索結果を前記端末へ返信する検索部とを有することを特徴とする。   The invention according to claim 6 is an electronic file search system in which an arbitrary number of terminals and an electronic file search server are connected by a communication network. The terminal inputs a character string or an edit operation for creating or editing a document. A document editing unit that transmits to the electronic file search server; and a result display unit that receives and displays the search result from the electronic file search server, wherein the electronic file search server includes characters received from the terminal, A character input unit that inputs an editing operation, a determination unit that sequentially determines whether or not the input character satisfies a predetermined condition, and an input if the determination unit determines that the condition is satisfied Using a search term extraction unit that extracts a search term from a character string, and a search term extracted by the search term extraction unit, a document database as a search target in the case of an initial search And search, in the case of the second or subsequent search is performed refine search directed to the previous search results, and having a search unit for returning the search results to the terminal.

請求項7の発明は、文書の作成または編集のための文字列や編集操作を入力し、入力された文字が予め指定された条件を満たすか否かを逐次的に判定し、条件を満たすと判定された場合には入力された文字列から検索語を抽出した後、最初の検索の場合には抽出された検索語を用いて文書データベースを対象にして検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、新たに文字が入力されなくなるまで、検索と検索結果の表示を繰り返すようにしたことを特徴とする。   The invention of claim 7 inputs a character string or editing operation for creating or editing a document, sequentially determines whether or not the input character satisfies a predesignated condition, and satisfies the condition If it is judged, after extracting the search word from the input character string, in the case of the first search, the document database is searched using the extracted search word. Is characterized in that a refined search is performed on the previous search result, and the search and the display of the search result are repeated until no new characters are input.

請求項8の発明は、コンピュータに、請求項1乃至5のいずれかに記載の電子ファイル検索装置の機能、または、請求項6に記載の電子ファイル検索システムの機能を実行させるためのプログラムである。
請求項9の発明は、請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
The invention according to claim 8 is a program for causing a computer to execute the function of the electronic file search apparatus according to any one of claims 1 to 5 or the function of the electronic file search system according to claim 6. .
A ninth aspect of the present invention is a computer-readable recording medium on which the program according to the eighth aspect is recorded.

本発明によれば、ユーザが予め設定して条件になったときに、入力中の文章から検索語を自動的に抽出して検索実行することで、既存の文書の中から入力中の文章に関連した文書を自動的に表示してくれるため、わざわざ検索式を考えて検索実行を行う手間が省けるので、文書作成や文書編集の作業向上につながる。   According to the present invention, when a condition set by the user in advance is reached, a search word is automatically extracted from the text being input, and the search is executed. Since related documents are automatically displayed, it is possible to save time and effort to perform search by considering a search expression, which leads to improvement in document creation and document editing.

以下、図面を参照して本発明に係る好適な実施形態について説明する。
図1は、本発明の実施形態に係る電子ファイル検索装置の機能構成を示すブロック図である。同図において、電子ファイル検索装置は、文字入力部110、判定部120、判定条件125、検索語抽出部130、検索語テーブル135、検索部140、文書データベース(DB)142、検索集合144、結果表示部150、条件設定部160、文書入力部170、内容表示指定部210、内容抽出部180、内容表示部220とから構成される。
Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a functional configuration of an electronic file search apparatus according to an embodiment of the present invention. In the figure, the electronic file search apparatus includes a character input unit 110, a determination unit 120, a determination condition 125, a search word extraction unit 130, a search word table 135, a search unit 140, a document database (DB) 142, a search set 144, and a result. The display unit 150 includes a condition setting unit 160, a document input unit 170, a content display designation unit 210, a content extraction unit 180, and a content display unit 220.

この電子ファイル検索装置は、ワープロソフトなどで文書を作成する時に、過去に作成した関連文書を自動的に抽出して表示し、必要に応じて抽出された文書の内容を表示させ、内容を参考にしてユーザの文書の作成を支援するようにしている。
以下、各構成要素について説明する。
This electronic file search device automatically extracts and displays related documents created in the past when creating documents using word processing software, etc., and displays the contents of the extracted documents as necessary. It helps to create user's document.
Hereinafter, each component will be described.

文字入力部110は、ワープロソフトの入力部に相当するものであり、ユーザがキーボードやマウス等の入力装置を利用して文章を入力し、入力された文章は液晶ディスプレイ等の表示装置上の入力窓(図5参照)に表示するとともに、文書の編集操作(例えば、挿入、置換、削除、移動や複写等)に応じて、入力した文章を保持する文章編集領域を編集し、さらに入力された文字や文字列を判定部120へ渡して、自動検索を行うか否かを判定させる。編集操作(例えば削除等)については検索語テーブルのところで後述する。   The character input unit 110 corresponds to an input unit of word processing software, and a user inputs a sentence using an input device such as a keyboard or a mouse, and the input sentence is input on a display device such as a liquid crystal display. In addition to being displayed in the window (see FIG. 5), the text editing area holding the input text is edited and further input according to the editing operation of the document (for example, insertion, replacement, deletion, movement, copying, etc.) A character or character string is passed to the determination unit 120 to determine whether or not to perform an automatic search. The editing operation (for example, deletion) will be described later in the search term table.

図2は、文章編集領域で文章を校正する文字の入力位置および編集位置を管理するための各種ポインタを示している。文書開始位置は、入力編集対象の文書の先頭の文字を示すポインタであり、文書終了位置は入力編集対象の文書の最後の文字を示すポインタである。文書には、判定部120で検索実行と判断される1つ以上の検索実行単位が存在している。この1つの検索実行単位は、文章編集領域中の開始位置と終了位置のポインタで示される。   FIG. 2 shows various pointers for managing the input position and edit position of characters for proofreading a sentence in the sentence editing area. The document start position is a pointer indicating the first character of the input editing target document, and the document end position is a pointer indicating the last character of the input editing target document. The document includes one or more search execution units determined by the determination unit 120 as search execution. This one search execution unit is indicated by the start position and end position pointers in the text editing area.

判定部120は、文字入力部110から渡された文字や文字列が判定条件125のいずれに該当するかを判断して、該当していた場合に検索語抽出部130の動作を開始する。
判定条件125は、例えば、句読点、改行、改ページの文字が入力された時、漢字から平仮名に変わった時、所定の時間を過ぎた時等の条件である。
条件設定部160は、上記の各条件のうち1つ以上をユーザに予め選択させ、判定条件125に保持しておく。
The determination unit 120 determines which of the determination conditions 125 the character or character string passed from the character input unit 110 corresponds to, and starts the operation of the search word extraction unit 130 if it corresponds.
The determination condition 125 is, for example, a condition such as when a punctuation mark, a line feed, or a page break character is input, when a character changes from kanji to hiragana, or when a predetermined time has passed.
The condition setting unit 160 causes the user to select one or more of the above-described conditions in advance and holds the determination condition 125.

検索語抽出部130は、判定部120から起動され、検索実行単位の開始位置と終了位置間の文字列に対して、既存の技術、例えば、特開平05−298352号公報のような形態素解析の手法を用いて単語に分解し、この単語を検索語として検索実行単位ごとに出現回数を累積するようにして検索語テーブル135へ記録するとともに、検索部140を起動する。また、文字列に、例えば、強調や網がけや下線等の修飾がなされていたり、また、文字列がタイトルに用いられている検索語は他の単語より重みを大きく設定する。   The search term extraction unit 130 is activated by the determination unit 120 and performs an existing technique, for example, a morphological analysis as disclosed in Japanese Patent Application Laid-Open No. 05-298352 on the character string between the start position and the end position of the search execution unit. Using the technique, the words are decomposed into words, and the words are recorded as search words in the search word table 135 so that the number of appearances is accumulated for each search execution unit, and the search unit 140 is activated. Further, for example, the character string is modified such as emphasis, shading or underline, or the search word in which the character string is used for the title is set to have a higher weight than other words.

この検索語テーブル135は、例えば、図3のようなデータ構造を持っている。図3において、検索実行単位ごとに、検索実行単位情報と、この中に含まれる1つ以上の検索語情報が記録される。
検索実行単位情報には、検索集合ID(後述)、文章編集領域中の検索実行単位の開始位置と終了位置とが記録される。
検索語情報は、この検索実行単位の文字列に含まれる1つ以上の検索語(検索語抽出部130で抽出された単語)、この文字列中に出現した検索語の回数および検索語の重みとが少なくとも含まれる。
The search term table 135 has a data structure as shown in FIG. 3, for example. In FIG. 3, for each search execution unit, search execution unit information and one or more search term information included therein are recorded.
In the search execution unit information, a search set ID (described later) and a start position and an end position of the search execution unit in the text editing area are recorded.
The search word information includes one or more search words (words extracted by the search word extraction unit 130) included in the character string of the search execution unit, the number of search words that appear in the character string, and the weight of the search word And at least.

例えば、「本日は晴天なり。明日は本日よりも暑くなるでしょう。」という文字列が入力されていると、1つの検索実行単位(「本日は晴天なり。」)に対しては「本日」という単語はその出現回数が「1」、「晴天」の出現回数が「1」であり、次の検索実行単位(「明日は本日よりも暑くなるでしょう。」)に対しては、「本日」、「明日」と「暑く」の出現回数はそれぞれ「1」として検索語テーブルへ記録される。   For example, if the string “Today is sunny. Tomorrow will be hotter than today.” Is entered, “Today” for one search execution unit (“Today is sunny.”) For the next search execution unit (“Tomorrow will be hotter than today.”), The number of occurrences is “1” and the number of occurrences of “fine weather” is “1”. “,“ Tomorrow ”and“ Hot ”appear as“ 1 ”in the search term table.

文字入力部110で編集操作が入力されると、検索語抽出部130を起動して、編集操作された文字列に含まれる単語を抽出して検索語テーブル135を更新する。
例えば、単語が削除された場合には、削除された単語のあった検索実行単位の検索語テーブル135の該当する検索語の回数を1つ減らし、ゼロになった場合にはその検索語を検索語テーブル135から削除する。
When an editing operation is input through the character input unit 110, the search word extraction unit 130 is activated to extract words included in the edited character string and update the search word table 135.
For example, when a word is deleted, the number of corresponding search words in the search word table 135 of the search execution unit having the deleted word is reduced by one, and when the word becomes zero, the search word is searched. Delete from the word table 135.

例えば、上記例文において「本日は晴天なり」から「本日は」が削除されると、単語「本日」とが削除されるため、該当する検索実行単位に対して「本日」の回数が「0」、「晴天」の回数が「1」となるので、「本日」という検索語は削除される。   For example, in the above example sentence, when “today is clear” and “today is”, the word “today” is deleted, so the number of times of “today” is “0” for the corresponding search execution unit. Since the number of times of “fine weather” is “1”, the search term “today” is deleted.

同様に、単語の挿入の場合には、単語が挿入された検索実行単位に検索語として追加する。このとき新規検索語であれば、回数を1とし、同じ単語の時には回数を1つ増加させて検索語テーブル135を更新する。他の置換、移動、複写等の編集操作に対しても、検索語テーブル135を同様に更新する。
この更新された検索実行単位の一つ前の検索実行単位の検索集合に対して、更新された検索実行単位以降の検索語により検索部140を起動して絞込み検索を実行させる。
Similarly, in the case of inserting a word, it is added as a search word to the search execution unit in which the word is inserted. At this time, if it is a new search word, the number of times is set to 1, and if the same word, the number of times is increased by one and the search word table 135 is updated. The search word table 135 is similarly updated for other editing operations such as replacement, movement, and copying.
With respect to the search set of the search execution unit immediately before the updated search execution unit, the search unit 140 is activated by a search word after the updated search execution unit to execute a narrow search.

検索部140は、検索語テーブル135を参照して、指定された検索実行単位に含まれる検索単語から検索式を生成して、最初の検索の時には文書データベース(DB)142を検索し、検索結果の文書IDのリストを検索集合144へ出力する。
また、検索部140は、2回目以降の検索の場合には、検索集合144を対象にして絞込み検索を行って、検索結果を検索集合144へ出力する。
この検索集合144には、検索実行単位ごとに識別可能なファイルへ書き出し、そのファイルのID(検索集合ID)を検索語テーブル135の該当領域へ記録しておく。
The search unit 140 refers to the search word table 135, generates a search expression from the search words included in the specified search execution unit, searches the document database (DB) 142 at the time of the first search, and searches the search results. A list of document IDs is output to the search set 144.
In the second and subsequent searches, the search unit 140 performs a narrow search for the search set 144 and outputs the search result to the search set 144.
In this search set 144, a file that can be identified for each search execution unit is written, and the ID (search set ID) of the file is recorded in the corresponding area of the search word table 135.

文書DB142は、例えば、図4に示すようなデータ構造をしている。同図において、1つの文書に対して、文書ID(識別子)、文書のタイトル、文書の登録日、文書の内容(または、文書の内容を格納するファイル名等でもよい)、文書の概要(文書の概要を格納するファイル名等でもよい)、この文書をアクセスしたユーザごとにユーザIDと最新アクセス日とアクセス回数とを記録している。   For example, the document DB 142 has a data structure as shown in FIG. In the figure, for one document, a document ID (identifier), a document title, a document registration date, a document content (or a file name storing the document content, etc.), a document summary (document The user ID, the latest access date, and the number of accesses are recorded for each user who has accessed this document.

検索式は、指定された検索実行単位に属する検索語を「AND」で結合することによって生成する。
例えば、最初に「本日は晴天なり」が入力されると、検索語テーブル135には検索語として「本日」と「晴天」とが記録される。これにより検索式は「”本日”&”晴天”」が生成される。
文書DB142を検索対象として、この検索式に該当する文書を検索して、検索実行単位に割り当てられた検索集合IDの検索集合144へ検索結果を出力する。
A search expression is generated by combining search terms belonging to a specified search execution unit with “AND”.
For example, when “Today is sunny” is input first, “Today” and “Sunny” are recorded as search terms in the search term table 135. As a result, the search expression “Today” & “Sunny” is generated.
Using the document DB 142 as a search target, a document corresponding to this search expression is searched, and the search result is output to the search set 144 of the search set ID assigned to the search execution unit.

次に、「明日は本日よりも暑くなるでしょう。」が入力されると、検索語テーブル135には検索語として「明日」、「本日」、「暑く」とが記録される。
この場合には、先に検索された検索集合144を対象として、検索式「”明日”&”本日”&”暑く”」で検索し、この検索実行単位に割り当てられた検索集合IDの検索集合144へ検索結果を出力する。
従って、このときの検索集合144には、検索式「”本日”&”晴天”&”明日”&”本日”&”暑く”」を文書DB142に適用したときの検索結果が記録された状態になっている。
Next, when “Tomorrow will be hotter than today” is entered, “Tomorrow”, “Today”, and “Hot” are recorded in the search word table 135 as search words.
In this case, the search set 144 searched previously is searched with the search formula ““ Tomorrow ”&“ Today ”&“ Hot ””, and the search set with the search set ID assigned to this search execution unit is searched. The search result is output to 144.
Accordingly, the search set 144 at this time is in a state where the search result when the search formula ““ Today ”&“ Sunny ”” & “Tomorrow” & “Today” & “Hot” ”is applied to the document DB 142 is recorded. It has become.

また、ある検索実行単位で検索語が削除されたときには、この検索実行単位の1つ前の検索実行単位の検索集合に対して、今検索語が削除されたあとの残りの検索語で生成された検索式を適用して検索し直す。以降、最後(最新)の検索実行単位となるまで、検索をやり直す。
例えば、検索実行単位が4つあって、3番目の検索実行単位の検索語が削除された場合、3番目の検索実行単位の検索式を生成し直して、この検索式で2番目の検索実行単位の検索集合に適用して検索を実行する。この後、4番目の検索実行単位の検索式に対して、やり直した3番目の検索実行単位の検索集合を適用して検索をし直す。
In addition, when a search term is deleted in a certain search execution unit, a search term of the search execution unit immediately preceding this search execution unit is generated with the remaining search terms after the current search term is deleted. Apply the specified search formula and search again. Thereafter, the search is repeated until the last (latest) search execution unit is reached.
For example, if there are four search execution units and the search term of the third search execution unit is deleted, the search expression of the third search execution unit is generated again, and the second search execution is performed with this search expression. Apply search to unit search set to execute search. Thereafter, the search is performed again by applying the search set of the third search execution unit that has been redone to the search expression of the fourth search execution unit.

上記の例文によって、検索語が削除された場合の検索の仕方を説明する。
上述したように、「明日は本日よりも暑くなるでしょう。」から「明日」が削除された場合は、検索式は「”本日”&”暑く”」となる。
従って、文書DB142を検索式「”本日”&”晴天”」で検索した結果の検索集合144に対して、検索式「”本日”&”暑く”」を適用して、文章「本日よりも暑くなるでしょう。」の検索結果を検索し直す。
The above example sentence explains how to search when a search word is deleted.
As described above, when “Tomorrow will be hotter than today,” “Tomorrow” will be deleted, the search formula will be ““ Today ”&“ Hot ””.
Therefore, the search expression ““ Today ”&“ Hot ”” is applied to the search set 144 as a result of searching the document DB 142 with the search expression ““ Today ”&“ Sunny ””, and the sentence “Today is hotter than today”. Search again.

検索部140は、一旦、検索集合144に記憶された検索結果を文書ごとに計算した得点の高い順に並び替えて検索集合144を更新する。1文書の得点は、例えば、各検索語について、文書に出現した検索語の回数に、検索語テーブル135の検索語(i)の出現回数(i)と重み(i)とを掛けた値を計算した総和の値とする。
得点=Σ「検索語iの数」×出現回数(i)×重み(i) …(式1)
ここでiは、検索実行単位内に含まれる検索語の語数である。
The search unit 140 once updates the search set 144 by sorting the search results stored in the search set 144 in descending order of the score calculated for each document. The score of one document is, for example, a value obtained by multiplying the number of search words that appear in the document by the number of times (i) of the search word (i) in the search word table 135 and the weight (i) for each search word. The calculated total value.
Score = Σ “number of search words i” × number of appearances (i) × weight (i) (Formula 1)
Here, i is the number of search words included in the search execution unit.

また、この検索の直前に入力した単語については、重みを更に増すようにしてもよい。
さらに、最近アクセスしたものを優先的に表示したり、アクセス頻度の高いものを優先して表示するために、登録日やユーザごとの最新アクセス日やアクセス頻度によって定まるアクセス頻度係数を加味するようにしてもよい。
得点=Σ「検索語iの数」×出現回数(i)×重み(i)+アクセス頻度係数 …(式2)
ここでiは、検索実行単位内に含まれる検索語の語数である。
Further, the weight of the word input immediately before the search may be further increased.
In addition, in order to display recently accessed items preferentially or display frequently accessed items preferentially, an access frequency coefficient determined by the registration date, the latest access date for each user and the access frequency should be considered. May be.
Score = Σ “number of search terms i” × number of appearances (i) × weight (i) + access frequency coefficient (Expression 2)
Here, i is the number of search words included in the search execution unit.

結果表示部150は、検索集合144に記憶された検索結果を表示装置の結果表示窓に表示する。
図5は、表示装置に表示された入力窓と結果表示窓の概念図である。入力窓は、文章の入力および編集を行う領域であり文字入力部110で使用される。
結果表示窓は、得点の高い順に文書を縮小画像(サムネイル画像)として表示し、表示するサムネイル画像の個数が多すぎるときにはスクロールバーを移動させることで全体を表示することができる。
このサムネイル画像は、文書中の検索語が含まれているページが特定できるときには、そのページをビットマップ変換して縮小した画像として得る。そのようなページが特定できないときには、先頭のページを用いてサムネイル画像を得る。
The result display unit 150 displays the search results stored in the search set 144 in the result display window of the display device.
FIG. 5 is a conceptual diagram of an input window and a result display window displayed on the display device. The input window is an area for inputting and editing text, and is used by the character input unit 110.
The result display window displays the documents as reduced images (thumbnail images) in descending order of the score, and when the number of thumbnail images to be displayed is too large, the whole can be displayed by moving the scroll bar.
This thumbnail image is obtained as a reduced image by bitmap conversion of the page when the page containing the search term in the document can be specified. When such a page cannot be specified, a thumbnail image is obtained using the first page.

また、ユーザが入力窓に入力を始めた当初は検索語が少ないので、検索結果が多数となり表示時間がかかり、また、検索結果を表示してもあまり意味がないので、検索結果の件数が所定の件数(これはユーザが予め指定してもよいし、結果を表示する窓サイズに応じて変更しても構わない)に達するまでは、図6(A)に示すように検索結果の件数のみを表示させるようにしてもよい。   In addition, since there are few search terms at the beginning when the user starts to input in the input window, the search results become large and takes a long time to display, and it is meaningless to display the search results. Until the number of items is reached (this may be specified in advance by the user or may be changed according to the window size for displaying the results), as shown in FIG. May be displayed.

所定件数以上になった場合に、個々の文書のファイル名やタイトルのリストを表示し、さらに所定の数より少なくなった場合に、サムネイル画像のみ(図6(C))、またはサムネイル画像と文書の概要(図6(D))などを表示するように、検索結果の件数に応じて自動的に表示方法を切り替えるようにしてもよい。   When the number exceeds the predetermined number, a list of file names and titles of individual documents is displayed. When the number is smaller than the predetermined number, only thumbnail images (FIG. 6C), or thumbnail images and documents are displayed. The display method may be automatically switched according to the number of search results so as to display the outline (FIG. 6D).

また、上述のようなサムネイル画像ではなく、類似している画像の場合には代表のみを表示して、限られた結果表示領域を有効に使うようにしてもよい。代表のみを表示する場合には、代表を表示していることをユーザが識別可能なように、アイコンの形式を変更して表示してもよい。   Further, in the case of similar images instead of the thumbnail images as described above, only representatives may be displayed so that a limited result display area can be used effectively. When only the representative is displayed, the icon format may be changed and displayed so that the user can identify that the representative is displayed.

類似の判断は、検索結果のページをビットマップ画像として変換を行い、1ページの画像データを重ね合わせ、画像の各画素の差分の絶対値の和をとり、この差分が所定の値よりも小さい場合に「類似している」と判断する。   Similar determination is performed by converting the search result page as a bitmap image, superimposing the image data of one page, taking the sum of the absolute values of the differences of each pixel of the image, and this difference being smaller than a predetermined value. If it is “similar”.

さらに、上述のようにして検索された検索結果を表示した場合に、文書の内容を表示したい場合がある。このような場合には、図7に示すように、検索結果を表示する結果表示窓1と文書の内容を表示する結果表示窓2を設けるようにする。
結果表示窓1に表示されたサムネイル画像やタイトル等のリストから所望のものを選択して、選択された文書の内容の表示を要求すると、内容表示指定部210では選択されたサムネイル画像に対応する文書の文書IDを内容抽出部180へ送る。
内容抽出部180は、受信した文書IDの文書の内容を文書DB142から取り出して、内容表示部220へ渡す。
内容表示部220は、受け取った文書の内容を結果表示窓2へ表示する。
Further, when the search result searched as described above is displayed, there are cases where it is desired to display the contents of the document. In such a case, as shown in FIG. 7, a result display window 1 for displaying the search result and a result display window 2 for displaying the contents of the document are provided.
When a desired image is selected from a list of thumbnail images and titles displayed in the result display window 1 and the display of the content of the selected document is requested, the content display designating unit 210 corresponds to the selected thumbnail image. The document ID of the document is sent to the content extraction unit 180.
The content extraction unit 180 takes out the content of the document with the received document ID from the document DB 142 and passes it to the content display unit 220.
The content display unit 220 displays the content of the received document on the result display window 2.

文書入力部170は、ユーザから指定された文書(例えば、文書DBや他の記録媒体に記憶された作成済みの文書や作成途中の文書)の内容を読み込んで文章編集領域へ書き込む。この書き込んだ文章編集領域の文章の取り扱いについて、次の2つの方式があり、ユーザが予め指定しておく。   The document input unit 170 reads the contents of a document designated by the user (for example, a created document stored in a document DB or other recording medium or a document in the middle of creation) and writes it in the text editing area. There are the following two methods for handling the text in the written text editing area, and the user designates in advance.

(1)全部読み込んだ後に、文章編集領域の文字列に対して、判定部120で判定しながら検索語抽出と検索を実行し、すべての検索が終了後に、その最後の検索集合の検索結果を表示した後、文字入力部110から文字列の入力を許す方式。
(2)新しく入力または編集された文字列に対してのみ本装置を適用し、本装置の終了時に編集領域を保存するときに、指定された文書へ文章編集領域の内容を追加して書き出すようにした方式。
(1) After reading all, search word extraction and search are performed on the character string in the text editing area while determining by the determination unit 120. After all searches are completed, the search results of the last search set are displayed. A method of allowing a character string to be input from the character input unit 110 after being displayed.
(2) The apparatus is applied only to a newly input or edited character string, and when the editing area is saved at the end of the apparatus, the contents of the text editing area are added and written to the specified document. Method.

次に、図8のフローチャートを用いて、本発明の実施形態に係る電子ファイル検索装置の処理手順を説明する。
ユーザは、キーボードやマウス等の入力装置を利用して液晶ディスプレイ等の表示装置上の入力窓(図5参照)に文章を入力し、文書の編集操作(例えば、挿入、置換、削除、移動や複写等)を実行する。このとき、入力された文字列は文章編集領域に記録され、この領域で編集がなされる(ステップS10)。
また、文書DBや他の記録媒体に記録された作成済みの文書や作成途中の文書を利用する場合には、指定された文書の内容を読み込んで文章編集領域へ書き込んでおく。
この際、全部読み込んだ文字列に対して、検索語を抽出して検索する方式と、新しく入力または編集された文字列に対してのみ本装置を適用する方式とがある。
Next, the processing procedure of the electronic file search apparatus according to the embodiment of the present invention will be described using the flowchart of FIG.
A user inputs text into an input window (see FIG. 5) on a display device such as a liquid crystal display using an input device such as a keyboard or a mouse, and edits a document (for example, insert, replace, delete, move, Copy). At this time, the input character string is recorded in the sentence editing area, and editing is performed in this area (step S10).
In addition, when using a created document recorded in a document DB or other recording medium or a document in the middle of creation, the contents of the designated document are read and written in the text editing area.
At this time, there are a method in which search words are extracted and searched for all the read character strings, and a method in which the present apparatus is applied only to newly input or edited character strings.

入力された文字が、例えば、句読点、改行、改ページであるか、また、漢字から平仮名に変わったか、あるいは、前回の検索から所定の時間を過ぎているかを判定する、これらに該当しなければ(ステップS11のNO)、次の文字の入力を行わせる。また、いずれかの条件に合致した場合には(ステップS11のYES)、入力された文字列に対して形態素解析を行って検索語を抽出し、この検索語の出現回数や重みを検索語テーブル135へ記録する(ステップS12)。
また、編集操作が入力されたときには、編集操作された文字列に含まれる単語を抽出して検索語テーブル135を更新する。
Determine whether the entered characters are, for example, punctuation marks, line feeds, page breaks, whether they have changed from kanji to hiragana, or whether a predetermined time has passed since the previous search. (NO in step S11), the next character is input. If any of the conditions is met (YES in step S11), the input character string is subjected to morphological analysis to extract a search word, and the number of appearances and weight of the search word are set in the search word table. 135 is recorded (step S12).
Further, when an editing operation is input, a word included in the edited character string is extracted and the search word table 135 is updated.

最初の検索かまたは2回目以降の検索かを調べ、最初の検索の場合には(ステップS13のNO)、現在の検索実行単位に属する検索語を「AND」で接続することによって生成する検索式で文書DB142を検索し、検索結果の文書IDのリストを検索集合144へ出力する(ステップS14)。このとき、検索集合144には、検索実行単位ごとに識別可能なID(検索集合ID)を振り、検索語テーブル135の該当領域へ記録しておく。
または、2回目以降の検索の場合には(ステップS13のYES)、検索集合144を対象にして絞込み検索を行って、検索結果を検索集合144へ出力する(ステップS15)。
Whether the search is the first search or the search after the second time, and in the case of the first search (NO in step S13), a search expression that is generated by connecting search terms belonging to the current search execution unit with “AND”. The document DB 142 is searched for, and a list of document IDs as search results is output to the search set 144 (step S14). At this time, an ID (search set ID) that can be identified for each search execution unit is assigned to the search set 144 and recorded in the corresponding area of the search word table 135.
Alternatively, in the case of the second and subsequent searches (YES in step S13), a narrow search is performed on the search set 144, and the search result is output to the search set 144 (step S15).

検索結果の文書ごとに計算した得点の高い順に並び替える(ステップS16)。
この文書の得点は、例えば、文書に出現した検索語の回数や検索語テーブル135に記憶された出現回数と重み、また、登録日やユーザごとの最新アクセス日やアクセス頻度等によって重み付けして計算される。
The search results are rearranged in descending order of the score calculated for each document (step S16).
The score of this document is calculated by weighting, for example, the number of search terms that appear in the document, the number and weight of appearances stored in the search term table 135, the registration date, the latest access date for each user, the access frequency, etc. Is done.

検索結果を表示装置の結果表示窓に表示する(ステップS17)。
結果表示窓には、検索結果が多数の場合には検索結果の件数のみを表示させ、所定件数以下の場合には得点の高い順に、文書のファイル名やタイトルのリスト、文書のサムネイル画像、サムネイル画像と文書の概要、類似しているサムネイル画像の場合には代表のみを検索結果の件数に応じて自動的に表示方法を切り替えて表示する。
さらに、上述のようにして検索された検索結果から所望の文書を指定して、文書の内容を表示する。
The search result is displayed on the result display window of the display device (step S17).
In the result display window, if there are a large number of search results, only the number of search results is displayed. If the number of search results is less than the predetermined number, a list of file names and titles of documents, thumbnail images of documents, thumbnails in descending order of scores In the case of thumbnail images that are similar to the outline of the image and the document, only the representative is automatically displayed according to the number of search results.
Further, a desired document is designated from the search results searched as described above, and the contents of the document are displayed.

ユーザが文書の入力や編集を終了した場合には(ステップS18のYES)、本装置の処理を終了し、終了していない場合にはステップS10へ戻って文字列の入力や編集操作を行う。   If the user has finished inputting or editing the document (YES in step S18), the process of this apparatus is terminated. If not, the process returns to step S10 to input or edit a character string.

上述した実施形態の電子ファイル検索装置では、単一の装置で実現するものとして説明したが、文字列の入力・編集を端末で行って、入力された文字列に対する関連文書の検索を電子ファイル検索サーバで行い、検索結果を端末で表示させるようにして、電子ファイル検索システムとして構成することもできる。この場合、電子ファイル検索サーバに対して任意台数の端末を通信ネットワークで接続するようにしてもよい。   The electronic file search apparatus according to the above-described embodiment has been described as being realized by a single apparatus. However, an electronic file search is performed by performing input / editing of a character string at a terminal and searching for a related document with respect to the input character string. It is also possible to configure as an electronic file search system by using a server and displaying the search result on a terminal. In this case, an arbitrary number of terminals may be connected to the electronic file search server via a communication network.

図9は、本発明の実施形態に係る電子ファイル検索システムの機能構成を示すブロック図であり、図1と同じ機能の部分については同じ符号を付し、相違点のみ説明する。
同図において、電子ファイル検索サーバ10は、文字入力部110、判定部120、判定条件125、検索語抽出部130、検索語テーブル135、検索部140、文書データベース(DB)142、検索集合144、条件設定部160、文書入力部170、内容抽出部180からなる。
また、端末20は、文書指定部230、条件入力部240、文書編集部250、結果表示部150、内容表示指定部210、内容表示部220からなっている。
FIG. 9 is a block diagram showing a functional configuration of the electronic file search system according to the embodiment of the present invention. Components having the same functions as those in FIG.
In the figure, the electronic file search server 10 includes a character input unit 110, a determination unit 120, a determination condition 125, a search word extraction unit 130, a search word table 135, a search unit 140, a document database (DB) 142, a search set 144, A condition setting unit 160, a document input unit 170, and a content extraction unit 180 are included.
The terminal 20 includes a document designation unit 230, a condition input unit 240, a document editing unit 250, a result display unit 150, a content display designation unit 210, and a content display unit 220.

端末20の文書指定部230では、文書DB142または既存の文書の一覧等を表示させて、編集したい文書の文書IDを指定して、指定された文書IDを電子ファイル検索サーバ10の文書入力部170へ送信し、文書入力部170では受信した文書IDの文書の内容を文書編集領域へ読み込む。   The document specifying unit 230 of the terminal 20 displays the document DB 142 or a list of existing documents, specifies the document ID of the document to be edited, and uses the specified document ID as the document input unit 170 of the electronic file search server 10. The document input unit 170 reads the content of the document with the received document ID into the document editing area.

また、文書の文字列の入力や編集操作を端末20の文書編集部250で入力して、入力した文字列や編集操作を電子ファイル検索サーバ10の文字入力部110へ送信し、文字入力部110は受信した文字列や編集操作に従って文書編集領域へ記憶させる。   In addition, input and editing operations of the character string of the document are input by the document editing unit 250 of the terminal 20, and the input character string and editing operation are transmitted to the character input unit 110 of the electronic file search server 10. Is stored in the document editing area in accordance with the received character string and editing operation.

検索を実行する条件を端末20の条件入力部240で入力し、この入力された条件を電子ファイル検索サーバ10の条件設定部160へ送信し、条件設定部160では受信した条件を判定条件125へ記憶させる。   A condition for executing the search is input by the condition input unit 240 of the terminal 20, the input condition is transmitted to the condition setting unit 160 of the electronic file search server 10, and the condition setting unit 160 transfers the received condition to the determination condition 125. Remember.

電子ファイル検索サーバ10の検索部140で検索された結果を端末20の結果表示部150へ送信し、結果表示部150では受信した検索結果を結果表示窓へ表示させる。   The search result of the search unit 140 of the electronic file search server 10 is transmitted to the result display unit 150 of the terminal 20, and the result display unit 150 displays the received search result on the result display window.

通信ネットワーク30は、電子ファイル検索サーバ10および端末20間を結合するための伝送路であって、一般には、ケーブルで実現され、通信プロトコルにはTCP/IPが使われる。但し、伝送路としてはケーブルだけではなく、それらの間の通信プロトコルが一致するものであれば有線または無線のいずれでもよく、例えば、公衆回線や専用回線等によるLAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどを用いることができる。   The communication network 30 is a transmission path for connecting the electronic file search server 10 and the terminal 20 and is generally realized by a cable, and TCP / IP is used as a communication protocol. However, the transmission path is not limited to a cable, and may be either wired or wireless as long as the communication protocol between them is the same. For example, a LAN (Local Area Network), WAN ( Wide Area Network) or the Internet can be used.

実施形態を以上のように構成することによって、ユーザが予め設定して条件になったときに、入力中の文章から検索語を自動的に抽出して検索実行することで、既存の文書の中から入力中の文章に関連した文書を自動的に表示してくれるため、わざわざ検索式を考えて検索実行を行う手間が省けるので、文書作成や文書編集の作業向上につながる。   By configuring the embodiment as described above, when a user sets in advance and a condition is met, a search term is automatically extracted from the sentence being input, and the search is executed. Automatically displays the document related to the text being entered, so that it is possible to save the trouble of performing the search by considering the search formula. This leads to an improvement in document creation and document editing.

さらに、上述した実施形態の端末の各機能、電子ファイル検索サーバの各機能および電子ファイル検索装置の各機能をそれぞれプログラム化し、予めCD−ROM等の記録媒体に書き込んでおき、端末、電子ファイル検索サーバおよび電子ファイル検索装置の記録媒体読取装置にこの記録媒体を装着して、これらのプログラムをCPUで実行することによって、本発明の目的が達成される。
この場合、記録媒体から読出されたプログラム自体が上述した実施形態を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
Furthermore, each function of the terminal, each function of the electronic file search server, and each function of the electronic file search device of the above-described embodiment is programmed and written in a recording medium such as a CD-ROM in advance. The object of the present invention is achieved by mounting the recording medium on the recording medium reading device of the server and the electronic file search apparatus and executing these programs by the CPU.
In this case, the program read from the recording medium itself realizes the above-described embodiment, and the program and the recording medium on which the program is recorded also constitute the present invention.

なお、記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
あるいは、インターネット等の通信ネットワークを介して記憶装置に格納されたプログラムをサーバコンピュータから直接供給を受けるようにしてもよい。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
As a recording medium, a semiconductor medium (for example, ROM, nonvolatile memory card, etc.), an optical medium (for example, DVD, MO, MD, CD-R, etc.), a magnetic medium (for example, magnetic tape, flexible disk, etc.) Either may be sufficient.
Alternatively, the program stored in the storage device may be directly supplied from the server computer via a communication network such as the Internet. In this case, the storage device of this server computer is also included in the recording medium of the present invention.

また、ロードしたプログラムを実行することにより上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステムあるいは他のアプリケーションプログラム等と共同して処理することによって上述した実施形態の機能が実現される場合も含まれる。   Further, not only the functions of the above-described embodiment are realized by executing the loaded program, but also the above-described implementation by cooperating with the operating system or other application programs based on the instructions of the program. The case where the function of the form is realized is also included.

このように上述した実施形態の機能をプログラム化して流通させることによって、コスト、可搬性、汎用性を向上させることができる。   As described above, by programming and distributing the functions of the above-described embodiment, cost, portability, and versatility can be improved.

さらに、上述した電子ファイル検索サーバの各機能をプログラム化して、サーバコンピュータの磁気ディスク等の記憶装置に格納しておき、インターネット等の通信ネットワークで接続されたユーザのコンピュータから実行指示を受信して、当該プログラムを実行し、その結果をユーザのコンピュータへ返信するようなASP(application service provider)による利用を提供する場合、このサーバコンピュータの記憶装置およびそのプログラムも本発明に含まれる。   Furthermore, each function of the electronic file search server described above is programmed and stored in a storage device such as a magnetic disk of a server computer, and an execution instruction is received from a user computer connected via a communication network such as the Internet. When providing use by an ASP (Application Service Provider) that executes the program and returns the result to the user's computer, the storage device of the server computer and the program are also included in the present invention.

本発明の実施形態に係る電子ファイル検索装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the electronic file search apparatus which concerns on embodiment of this invention. 文章編集領域とポインタの関係の説明図である。It is explanatory drawing of the relationship between a text edit area and a pointer. 検索語テーブルのデータ構造例である。It is an example of the data structure of a search term table. 文書データベースのデータ構造例である。It is an example of the data structure of a document database. 表示装置に表示された入力窓と結果表示窓の概念図である。It is a conceptual diagram of the input window and result display window which were displayed on the display apparatus. 検索結果の表示例である。It is a display example of a search result. 検索結果の他の表示例である。It is another example of a display of a search result. 本発明の実施形態に係る電子ファイル検索装置の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the electronic file search apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る電子ファイル検索システムの機能構成を示すブロック図である。It is a block diagram which shows the function structure of the electronic file search system which concerns on embodiment of this invention.

符号の説明Explanation of symbols

10…電子ファイル検索サーバ、20…端末、30…通信ネットワーク、110…文字入力部、120…判定部、125…判定条件、130…検索語抽出部、135…検索語テーブル、140…検索部、142…文書DB、144…検索集合、150…結果表示部、160…条件設定部、170…文書入力部、180…内容抽出部、210…内容表示指定部、220…内容表示部、230…文書指定部、240…条件入力部、250…文書編集部。 DESCRIPTION OF SYMBOLS 10 ... Electronic file search server, 20 ... Terminal, 30 ... Communication network, 110 ... Character input part, 120 ... Determination part, 125 ... Determination condition, 130 ... Search word extraction part, 135 ... Search word table, 140 ... Search part, 142 ... Document DB, 144 ... Search set, 150 ... Result display section, 160 ... Condition setting section, 170 ... Document input section, 180 ... Content extraction section, 210 ... Content display designation section, 220 ... Content display section, 230 ... Document Designation unit, 240 ... condition input unit, 250 ... document editing unit.

Claims (9)

文書の作成または編集のための文字列や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて文書データベースを検索する検索部と、前記検索部で検索された検索結果を表示する結果表示部とを有し、条件に合致した文字が入力されると、前回の検索以降に入力された文字列に対して検索語を抽出し、この検索語を用いて検索して検索結果を表示することを、新たに文字が入力されなくなるまで繰り返すようにしたことを特徴とする電子ファイル検索装置。   A character input unit for inputting a character string or an editing operation for creating or editing a document, a determination unit for sequentially determining whether or not an input character satisfies a predetermined condition, and a condition in the determination unit A search term extraction unit that extracts a search term from the input character string, a search unit that searches a document database using the search term extracted by the search term extraction unit, and the search And a result display section that displays the search results searched for, when a character that matches the condition is entered, search terms are extracted from the character string that has been entered since the previous search. An electronic file search apparatus characterized by repeating search using words and displaying search results until no more characters are input. 請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で入力された文書内容の文字列から抽出された検索語を用いて文書データベースを検索し、文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする電子ファイル検索装置。   The electronic file search apparatus according to claim 1, further comprising a document input unit that reads the content of a specified existing document, and when the existing document is specified, characters of the document content input by the document input unit An electronic file search apparatus characterized in that after a document database is searched using a search word extracted from a column and a document content is read, characters are input by the character input unit. 請求項1に記載の電子ファイル検索装置において、指定された既存の文書の内容を読み取る文書入力部を有し、既存の文書が指定された場合、前記文書入力部で文書内容を読み終わった後から、前記文字入力部で文字を入力するようにしたことを特徴とする電子ファイル検索装置。   The electronic file search apparatus according to claim 1, further comprising: a document input unit that reads the content of the specified existing document, and when the existing document is specified, after the document content is read by the document input unit The electronic file search device is characterized in that a character is input by the character input unit. 請求項1、2または3に記載の電子ファイル検索装置において、前記検索部は、2回目以降の検索実行の場合には、前回の検索結果を対象にして絞り込み検索を行うことを特徴とする電子ファイル検索装置。   4. The electronic file search apparatus according to claim 1, wherein the search unit performs a narrowing search on a previous search result in the case of performing a search after the second time. File search device. 請求項1乃至4のいずれかに記載の電子ファイル検索装置において、前記結果表示部は、検索結果の文書を縮小画像形式で表示することを特徴とする電子ファイル検索装置。   5. The electronic file search apparatus according to claim 1, wherein the result display unit displays a search result document in a reduced image format. 6. 任意台数の端末と電子ファイル検索サーバとを通信ネットワークで接続した電子ファイル検索システムにおいて、
前記端末は、文書の作成または編集のための文字列や編集操作を入力して、前記電子ファイル検索サーバへ送信する文書編集部と、前記電子ファイル検索サーバから検索結果を受信して表示する結果表示部とを有し、
前記電子ファイル検索サーバは、前記端末から受信した文字や編集操作を入力する文字入力部と、入力された文字が予め指定した条件を満たすか否かを逐次的に判定する判定部と、前記判定部で条件を満たすと判定された場合、入力された文字列から検索語を抽出する検索語抽出部と、前記検索語抽出部で抽出された検索語を用いて、最初の検索の場合には文書データベースを検索対象として検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、検索結果を前記端末へ返信する検索部とを有することを特徴とする電子ファイル検索システム。
In an electronic file search system in which an arbitrary number of terminals and an electronic file search server are connected via a communication network,
The terminal inputs a character string or editing operation for creating or editing a document, and transmits a document editing unit to the electronic file search server, and a result of receiving and displaying a search result from the electronic file search server. A display unit,
The electronic file search server includes a character input unit that inputs characters and editing operations received from the terminal, a determination unit that sequentially determines whether or not the input characters satisfy a predetermined condition, and the determination In the case of the first search using a search word extraction unit that extracts a search word from the input character string and the search word extracted by the search word extraction unit A search unit that searches the document database as a search target, performs a narrow search for the previous search result in the case of a second or subsequent search, and returns the search result to the terminal. Electronic file search system.
文書の作成または編集のための文字列や編集操作を入力し、入力された文字が予め指定された条件を満たすか否かを逐次的に判定し、条件を満たすと判定された場合には入力された文字列から検索語を抽出した後、最初の検索の場合には抽出された検索語を用いて文書データベースを対象にして検索し、2回目以降の検索の場合には前回の検索結果を対象にして絞り込み検索を行って、新たに文字が入力されなくなるまで、検索と検索結果の表示を繰り返すようにしたことを特徴とする電子ファイル検索方法。   Input a character string or editing operation for creating or editing a document, and sequentially determine whether or not the input character satisfies a pre-specified condition, and input if it is determined that the condition is satisfied After extracting the search term from the extracted character string, in the case of the first search, the document database is searched using the extracted search term. In the case of the second and subsequent searches, the previous search result is obtained. An electronic file search method characterized by performing a narrow search for a target and repeating the search and display of search results until no more characters are input. コンピュータに、請求項1乃至5のいずれかに記載の電子ファイル検索装置の機能、または、請求項6に記載の電子ファイル検索システムの機能を実行させるためのプログラム。   The program for making a computer perform the function of the electronic file search apparatus in any one of Claims 1 thru | or 5, or the function of the electronic file search system of Claim 6. 請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium on which the program according to claim 8 is recorded.
JP2003413562A 2003-12-11 2003-12-11 Device, system and method for searching electronic file, program, and recording media Pending JP2005173999A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003413562A JP2005173999A (en) 2003-12-11 2003-12-11 Device, system and method for searching electronic file, program, and recording media

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003413562A JP2005173999A (en) 2003-12-11 2003-12-11 Device, system and method for searching electronic file, program, and recording media

Publications (1)

Publication Number Publication Date
JP2005173999A true JP2005173999A (en) 2005-06-30

Family

ID=34733670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003413562A Pending JP2005173999A (en) 2003-12-11 2003-12-11 Device, system and method for searching electronic file, program, and recording media

Country Status (1)

Country Link
JP (1) JP2005173999A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174593A (en) * 2005-12-26 2007-07-05 Fuji Xerox Co Ltd Image display device
JP2009267526A (en) * 2008-04-22 2009-11-12 Sharp Corp Method and device for displaying a lot of content as list
WO2012132278A1 (en) * 2011-03-29 2012-10-04 パナソニック株式会社 Information terminal device, information search method, information search program
JP2014182416A (en) * 2013-03-18 2014-09-29 Casio Comput Co Ltd Information processing device and program
JP2017041133A (en) * 2015-08-20 2017-02-23 キヤノン株式会社 Information processor, computer program, and information processing method
JP2017138998A (en) * 2017-03-15 2017-08-10 カシオ計算機株式会社 Information processing device, information processing method, and program
JP2019053747A (en) * 2018-10-30 2019-04-04 カシオ計算機株式会社 Information processing device, information processing method, and program
JP2019121392A (en) * 2018-01-05 2019-07-22 Jfeスチール株式会社 Information search system
JP2020154858A (en) * 2019-03-20 2020-09-24 ヤフー株式会社 Information display program, information display device, and information display method, delivery device, and control server

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131974A (en) * 1989-10-18 1991-06-05 Hitachi Ltd Data retrieving system
JPH0528190A (en) * 1991-07-19 1993-02-05 Hitachi Ltd Information retrieval terminal equipment
JPH05290089A (en) * 1992-04-14 1993-11-05 Hitachi Ltd Document picture display system
JPH06314297A (en) * 1993-04-30 1994-11-08 Omron Corp Device and method for processing of document and device and method for retrieving data base
JPH07134720A (en) * 1993-09-17 1995-05-23 Nec Corp Method and device for presenting relative information in sentence preparing system
JPH09153031A (en) * 1995-11-29 1997-06-10 Toshiba Corp Method and device for sentence preparation support
JPH1145255A (en) * 1997-07-25 1999-02-16 Just Syst Corp Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded
JPH11504450A (en) * 1995-04-27 1999-04-20 マイケル アメン アンド カンパニー インコーポレイテッド Drug documentation system
JP2001325299A (en) * 2000-05-16 2001-11-22 Komakkusu:Kk Device and method for retrieving data and information recording medium
JP2002049638A (en) * 2000-05-26 2002-02-15 Fujitsu Ltd Document information retrieval device, method, document information retrieval program and computer readable recording medium storing document information retrieval program

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03131974A (en) * 1989-10-18 1991-06-05 Hitachi Ltd Data retrieving system
JPH0528190A (en) * 1991-07-19 1993-02-05 Hitachi Ltd Information retrieval terminal equipment
JPH05290089A (en) * 1992-04-14 1993-11-05 Hitachi Ltd Document picture display system
JPH06314297A (en) * 1993-04-30 1994-11-08 Omron Corp Device and method for processing of document and device and method for retrieving data base
JPH07134720A (en) * 1993-09-17 1995-05-23 Nec Corp Method and device for presenting relative information in sentence preparing system
JPH11504450A (en) * 1995-04-27 1999-04-20 マイケル アメン アンド カンパニー インコーポレイテッド Drug documentation system
JPH09153031A (en) * 1995-11-29 1997-06-10 Toshiba Corp Method and device for sentence preparation support
JPH1145255A (en) * 1997-07-25 1999-02-16 Just Syst Corp Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded
JP2001325299A (en) * 2000-05-16 2001-11-22 Komakkusu:Kk Device and method for retrieving data and information recording medium
JP2002049638A (en) * 2000-05-26 2002-02-15 Fujitsu Ltd Document information retrieval device, method, document information retrieval program and computer readable recording medium storing document information retrieval program

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007174593A (en) * 2005-12-26 2007-07-05 Fuji Xerox Co Ltd Image display device
JP4631699B2 (en) * 2005-12-26 2011-02-16 富士ゼロックス株式会社 Image display device
JP2009267526A (en) * 2008-04-22 2009-11-12 Sharp Corp Method and device for displaying a lot of content as list
WO2012132278A1 (en) * 2011-03-29 2012-10-04 パナソニック株式会社 Information terminal device, information search method, information search program
JP2014182416A (en) * 2013-03-18 2014-09-29 Casio Comput Co Ltd Information processing device and program
JP2017041133A (en) * 2015-08-20 2017-02-23 キヤノン株式会社 Information processor, computer program, and information processing method
JP2017138998A (en) * 2017-03-15 2017-08-10 カシオ計算機株式会社 Information processing device, information processing method, and program
JP2019121392A (en) * 2018-01-05 2019-07-22 Jfeスチール株式会社 Information search system
JP2019053747A (en) * 2018-10-30 2019-04-04 カシオ計算機株式会社 Information processing device, information processing method, and program
JP2020154858A (en) * 2019-03-20 2020-09-24 ヤフー株式会社 Information display program, information display device, and information display method, delivery device, and control server

Similar Documents

Publication Publication Date Title
US9411788B2 (en) Methods and apparatus for improved navigation among controlled terms in one or more user documents
US5140522A (en) Method and apparatus for machine translation utilizing previously translated documents
US20110252062A1 (en) Electronic device for searching for entry word in dictionary data, control method thereof and program product
JP2007299422A (en) Information processor and method for retrieving document
JPH04229364A (en) Method and system for changing emphasizing characteristic
JP2005173999A (en) Device, system and method for searching electronic file, program, and recording media
JPH06259420A (en) Sentence editing support device
JP2005107931A (en) Image search apparatus
JP4301879B2 (en) Abstract creation support system and patent document search system
JPH0877196A (en) Extracting device for document information
JP5152857B2 (en) Electronic device, display control method, and program
JP5016333B2 (en) Document creation support apparatus and document creation support program
JP2009123067A (en) Term dictionary creating method, term dictionary creating apparatus, program, and recording medium
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program
JP3734101B2 (en) Hypermedia construction support device
JPH07325826A (en) Japanese language processing system
JP2007041864A (en) Metadata acquisition/management method, apparatus and program
JP3712320B2 (en) Variable document creation system, variable document output device and variable document creation device
Adar et al. On-the-fly Hyperlink Creation for Page Images.
JP2001265780A (en) Electronic device and recording medium
JP2005327023A (en) Retrieval system of full-text search using hit number expectancy
JPH1011424A (en) Document preparation support device
JP2002140345A (en) Method for supporting generation of component manual
JP3537260B2 (en) Linked document search and display system
JP2002183134A (en) Translating device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060919

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100622