JPH10289247A - Document retrieving method and system - Google Patents

Document retrieving method and system

Info

Publication number
JPH10289247A
JPH10289247A JP9097833A JP9783397A JPH10289247A JP H10289247 A JPH10289247 A JP H10289247A JP 9097833 A JP9097833 A JP 9097833A JP 9783397 A JP9783397 A JP 9783397A JP H10289247 A JPH10289247 A JP H10289247A
Authority
JP
Japan
Prior art keywords
document
information
search
client terminal
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9097833A
Other languages
Japanese (ja)
Inventor
Kenji Ogura
健司 小倉
Masami Oguro
雅己 小黒
Osamu Nakamura
修 中村
Teruo Akiyama
照雄 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9097833A priority Critical patent/JPH10289247A/en
Publication of JPH10289247A publication Critical patent/JPH10289247A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a document retrieving method and system which retrieve even when a file name and a keyword are not clear and also retrieve with non-character information in retrieving mass document. SOLUTION: A client terminal 10 partially or totally inputs document to be retrieved (S1), retrieval information is extracted from inputted document information (S2), the retrieval information is transferred to a server 20 through a communication line (S3), the server 20 side retrieves document that is previously accumulated based on the received retrieval information (S4) and transfers it to the terminal 10 (S5), and the terminal 10 shows the document of a retrieval result (S6).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は,ドキュメント検索
方法およびシステムに係わり,特にクライアント端末か
ら文書の一部あるいは全てを入力し,入力情報から検索
情報を生成して,これに基づきサーバにおいて当該文書
を検索するドキュメント検索方法およびシステムに関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document search method and system, and more particularly, to a method of inputting a part or all of a document from a client terminal, generating search information from input information, and based on the input information, a server in accordance with the document. The present invention relates to a document search method and a document search system.

【0002】[0002]

【従来の技術】従来のドキュメント検索システムでは,
文書単位にファイル名を付与してデータベースなどに蓄
積し,検索時には予め付与されたファイル名を指定した
り,文書の中に含まれる特定のキーワードを指定して,
予め設定しておいたキーワードとの照合あるいは全文検
索により当該文書を検索している。
2. Description of the Related Art In a conventional document search system,
A file name is assigned to each document and stored in a database or the like. When searching, a file name given in advance or a specific keyword included in the document can be specified.
The document is searched by collation with a preset keyword or full-text search.

【0003】[0003]

【発明が解決しようとする課題】しかしながら,上記の
従来方法では,ファイル名,キーワードなどに文字数の
制限があったりして,ファイル名あるいはキーワードで
検索しようとした場合,自分で付与したにも関わらず,
ファイル名あるいはキーワードを忘れてしまったり,さ
らに,他人が付与したファイル名あるいはキーワードは
ほとんど分からないといった問題が生じていた。
However, in the above-mentioned conventional method, the number of characters is limited in a file name, a keyword, or the like. Not
There have been problems such as forgetting the file name or keyword, and furthermore, the file name or keyword given by another person is almost unknown.

【0004】また,ある任意の文字列による全文検索の
場合には,クライアント端末からキーボードなどにより
文字列を入力しなければならないというような問題や,
文書中に含まれる図形などの非文字情報からの検索は不
可能であるというような問題があった。
In the case of full-text search using an arbitrary character string, there is a problem that a character string must be input from a client terminal using a keyboard or the like.
There is a problem that it is impossible to search from non-character information such as a figure included in a document.

【0005】本発明は,上記の点に鑑みてなされたもの
で,紙ベースで保管していた文書あるいは記憶に頼った
手書き文書などを入力するだけで目的とする文書の検索
を可能とするドキュメント検索方法およびシステムを提
供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and has been made in view of the above circumstances. It is an object to provide a search method and system.

【0006】[0006]

【課題を解決するための手段】図1は,本発明の原理を
説明するための図である。本発明は,クライアント端末
10において検索すべき文書の一部あるいは全てを入力
し(ステップS1),入力された文書情報から検索情報
を抽出し(ステップS2),通信回線を介して検索情報
をサーバ20に転送し(ステップS3),サーバ20側
では受信した検索情報に基づき文書を検索して(ステッ
プS4),これをクライアント端末10に転送し(ステ
ップS5),クライアント端末10でサーバ20側から
送られた検索結果文書を表示する(ステップS6)もの
である。
FIG. 1 is a diagram for explaining the principle of the present invention. According to the present invention, a part or all of a document to be searched is input at the client terminal 10 (step S1), search information is extracted from the input document information (step S2), and the search information is transmitted to a server via a communication line. 20 (step S3), the server 20 searches for a document based on the received search information (step S4), and transfers it to the client terminal 10 (step S5). The sent search result document is displayed (step S6).

【0007】図2は,本発明の原理構成図である。クラ
イアント端末10は,文書入力手段11と検索情報抽出
手段12とを持つ。文書入力手段11は,検索すべき文
書の一部あるいは全てを入力するものである。検索情報
抽出手段12は,入力された文書情報から検索情報を抽
出するものである。
FIG. 2 is a diagram showing the principle of the present invention. The client terminal 10 has a document input unit 11 and a search information extraction unit 12. The document input means 11 is for inputting a part or all of a document to be searched. The search information extracting means 12 extracts search information from the input document information.

【0008】サーバ20は,検索情報蓄積手段21と文
書蓄積手段22と一致判定手段23とを持つ。検索情報
蓄積手段21は,クライアント端末10から受信した検
索情報を蓄積するものである。文書蓄積手段22は,検
索対象となる複数の文書を蓄積し保管するものである。
一致判定手段23は,複数の文書情報の文字コード部分
(またはビットマップ情報)と,検索情報の文字コード
部分(またはビットマップ情報)との一致をとり,その
一致度合いを判定するものである。
[0008] The server 20 has a search information storage unit 21, a document storage unit 22, and a coincidence determination unit 23. The search information storage unit 21 stores search information received from the client terminal 10. The document storage means 22 stores and stores a plurality of documents to be searched.
The match determining means 23 matches the character code portions (or bitmap information) of the plurality of document information with the character code portions (or bitmap information) of the search information, and determines the degree of matching.

【0009】[0009]

【発明の実施の形態】以下に,本発明の実施の一形態を
説明する。図3および図4は,本発明のシステム構成図
であって,特に,図3はクライアント端末のシステム構
成例,図4はサーバのシステム構成例を示す。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below. 3 and 4 are system configuration diagrams of the present invention. In particular, FIG. 3 shows a system configuration example of a client terminal, and FIG. 4 shows a system configuration example of a server.

【0010】図3および図4に示すように,本ドキュメ
ント検索システムは,通信網30を介してクライアント
端末10およびサーバ20が接続される構成となる。ク
ライアント端末10は,図3に示すように,CPU・メ
モリ110,文書情報をビットマップ情報として入力す
るカメラあるいはファクシミリ装置などの文書入力装置
120,CPU・メモリ110の中にあって,文書入力
装置120から入力されたビットマップ情報から文字を
認識する文字認識機構111,同じくCPU・メモリ1
10の中にあって文字認識機構111で認識された文字
コード列を蓄積する検索情報蓄積機構112,該検索情
報を通信網30に送り出し,サーバ20に転送する通信
制御装置130,およびサーバ20から転送される検索
結果の文書情報を表示する表示装置140から構成され
る。
As shown in FIGS. 3 and 4, the document search system has a configuration in which a client terminal 10 and a server 20 are connected via a communication network 30. As shown in FIG. 3, the client terminal 10 includes a CPU / memory 110, a document input device 120 such as a camera or a facsimile device for inputting document information as bitmap information, and a document input device. A character recognition mechanism 111 for recognizing a character from the bitmap information input from the CPU 120
A search information storage mechanism 112 for storing a character code string recognized by the character recognition mechanism 111 in the server 10, a communication control device 130 for sending the search information to the communication network 30 and transferring the search information to the server 20, and The display device 140 is configured to display the document information of the search result to be transferred.

【0011】また,サーバ20は,図4に示すように,
CPU・メモリ210,複数の文書情報を蓄積する文書
蓄積装置220,CPU・メモリ210の中にあってク
ライアント端末10から転送された検索情報である文字
コード列を蓄積する検索用文字コード列蓄積機構21
1,同じくCPU・メモリ210の中にあって該検索情
報と文書蓄積装置220に蓄積されている文書情報との
一致を判定する一致判定機構212,同じくCPU・メ
モリ210の中にあって一致判定機構212で検索され
た文書情報のファイル名を蓄積するファイル名蓄積機構
213,およびクライアント端末10から検索情報を受
信したり,ファイル名蓄積機構213に蓄積されたファ
イル名で特定される文書情報をクライアント端末10に
転送する通信制御装置230から構成される。
[0011] Further, as shown in FIG.
A CPU / memory 210; a document storage device 220 for storing a plurality of document information; and a search character code string storage mechanism in the CPU / memory 210 for storing a character code string which is search information transferred from the client terminal 10. 21
1, a match determination mechanism 212 that also determines the match between the search information in the CPU memory 210 and the document information stored in the document storage device 220, and determines a match in the CPU memory 210 The file name storage mechanism 213 for storing the file name of the document information searched by the mechanism 212 and the search information received from the client terminal 10 and the document information specified by the file name stored in the file name storage mechanism 213 are stored. It comprises a communication control device 230 for transferring to the client terminal 10.

【0012】上記の構成の動作を説明する。図5(A)
は,本発明のクライアント端末10における処理の概要
を示すフローチャートである。
The operation of the above configuration will be described. FIG. 5 (A)
5 is a flowchart showing an outline of processing in the client terminal 10 of the present invention.

【0013】ステップS11では,検索すべき文書の写
しなどを文書入力装置120からビットマップ情報とし
て入力する。ステップS12では,文書入力装置120
から入力されたビットマップ情報に対し,CPU・メモ
リ110内の文字認識機構111にてノイズ除去,傾き
補正などのイメージ整形処理を前処理とする文字認識を
行う。文字認識の具体的処理方法については,例えば萩
田他の「外部方向寄与度特徴による漢字の識別」(電子
情報通信学会論文誌Vol.J66-D, No.10,1983)に示される
技術を用いることにより実現する。一般に用いられてい
る文字認識技術を用いてもよい。
In step S11, a copy of a document to be searched is input from the document input device 120 as bitmap information. In step S12, the document input device 120
The character recognition mechanism 111 in the CPU / memory 110 performs character recognition with image shaping processing such as noise elimination and tilt correction as preprocessing on the bitmap information input from. For the specific processing method of character recognition, for example, use the technique shown in Hagita et al., "Kanji Character Identification Using External Direction Contribution Features" (IEICE Transactions on Electronics, Vol.J66-D, No.10, 1983) This is achieved by: A generally used character recognition technology may be used.

【0014】ステップS13では,文字認識機構111
で認識された結果である文字コードを検索情報蓄積機構
112に順次格納する。ステップS14では,入力され
たビットマップ情報に含まれる全ての文字に対する処理
が終了したかを判断し,終了していなければステップS
12〜S14を繰り返す。
In step S13, the character recognition mechanism 111
Are sequentially stored in the search information storage mechanism 112. In step S14, it is determined whether the processing for all the characters included in the input bitmap information has been completed.
12 to S14 are repeated.

【0015】ステップS15では,入力されたビットマ
ップ情報に含まれる全ての文字に対する処理が終了した
ら,検索情報蓄積機構112に蓄積された検索情報を通
信制御装置130よりサーバ20に転送する。
In step S15, when the processing for all the characters included in the input bitmap information is completed, the search information stored in the search information storage mechanism 112 is transferred from the communication control device 130 to the server 20.

【0016】ステップS16では,サーバ20からの検
索結果の受信を待ち,検索結果の文書を受信したら,ス
テップS17において検索文書を表示装置140に表示
する。
In step S16, reception of the search result from the server 20 is waited. When the search result document is received, the search document is displayed on the display device 140 in step S17.

【0017】図5(B)は,本発明のサーバ20におけ
る処理の概要を示すフローチャートである。ステップS
21では,通信制御装置230で,クライアント端末1
0から検索情報を受信し,これをCPU・メモリ210
内の検索用文字コード列蓄積機構211に格納する。
FIG. 5B is a flowchart showing an outline of the processing in the server 20 of the present invention. Step S
21, the communication control device 230 causes the client terminal 1
0 from the CPU / memory 210
Is stored in the search character code string storage mechanism 211.

【0018】ステップS22では,複数の文書情報を蓄
積している文書蓄積装置220から,一つの文書情報を
CPU・メモリ210に読み出す。ステップS23で
は,読み出された文書に対し,検索用文字コード列蓄積
機構211に蓄積された検索情報に基づき一致判定機構
212にて一致の判定処理を行う。一致を判定する具体
的処理方法については,例えば宮原他の「SIMD型並
列プロセッサを用いたフルテキスト検索」(情報処理学
会論文誌Vol.33 No.3,1992)に示される技術を用いるこ
とにより実現する。
In step S22, one piece of document information is read from the document storage device 220 storing a plurality of pieces of document information to the CPU / memory 210. In step S23, a match determination process is performed on the read document by the match determination module 212 based on the search information stored in the search character code string storage module 211. The specific processing method for judging the match is, for example, by using the technique described in Miyahara et al., "Full-text search using SIMD-type parallel processor" (Information Processing Society of Japan, Vol.33 No.3, 1992). Realize.

【0019】この「SIMD型並列プロセッサを用いた
フルテキスト検索」の技術は,SIMD型2次元アレイ
プロセッサとホストコンピュータ(パソコン)によっ
て,高速のフルテキスト検索機能を実現したものであ
り,パソコンから検索プログラムと文書データとをロー
ドしておき,必要に応じて検索単語と検索条件とを入力
することで検索を行うことができるようにしたものであ
る。文書データの水平格納によるビットシリアル型の処
理方式を採用する。部分一致検索では,異字許容照合や
単語内ワイルドカード照合が,それぞれ全文照合や絞り
込み照合とほぼ同程度の速度で検索できる。もちろん,
ステップS23における一致判定処理では,この方法に
限らず,通常の単一プロセッサによる検索手段等を用い
てもよい。
The technique of "full-text search using a SIMD-type parallel processor" realizes a high-speed full-text search function using a SIMD-type two-dimensional array processor and a host computer (personal computer). A program and document data are loaded, and a search can be performed by inputting a search word and a search condition as needed. A bit-serial processing method using horizontal storage of document data is adopted. In the partial match search, the permissible character matching and the wildcard matching within a word can be searched at almost the same speed as the full-text matching and the narrowing matching, respectively. of course,
The match determination process in step S23 is not limited to this method, but may use a search unit or the like using a normal single processor.

【0020】ステップS24で一致の判定処理結果をチ
ェックし,一致しない場合には,ステップS22の処理
へ戻って,次の文書に対する処理を繰り返す。ステップ
S25では,一致判定機構212にて一致が判定された
場合に,その文書のファイル名をファイル名蓄積機構2
13に格納する。
In step S24, the result of the matching determination process is checked. If not, the process returns to step S22 to repeat the process for the next document. In step S25, when a match is determined by the match determination unit 212, the file name of the document is stored in the file name storage unit 2.
13 is stored.

【0021】ステップS26では,検索結果であるファ
イル名蓄積機構213に格納されているファイル名で特
定される文書情報を,通信制御装置230からクライア
ント端末10に転送する。
In step S26, the document information specified by the file name stored in the file name storage mechanism 213 as the search result is transferred from the communication control device 230 to the client terminal 10.

【0022】上述のように,本実施の形態では,ビット
マップ情報から抽出される文字コードを用いて文書を検
索する例を説明したが,入力したビットマップ情報その
ものを切り出し,これをキーとして図形処理,画像処理
技術により被検索情報との一致をとり,該当する文書情
報を検索することも可能である。このとき,必ずしも大
きさまでも一致する必要はなく,相似的に一致すればよ
い。このため,必要であれば,検索情報であるビットマ
ップ情報に拡大または縮小などの変換を行い,一致を調
べる。入力したビットマップ情報から特定の領域を検索
情報として切り出す場合には,例えば入力したビットマ
ップ情報を表示装置に表示し,その中で利用者に会話的
に領域を指定させるなどの方法を用いることができる。
As described above, in this embodiment, an example has been described in which a document is searched using a character code extracted from bitmap information. However, the input bitmap information itself is cut out, and a graphic is used as a key. It is also possible to search for the corresponding document information by matching the information to be searched with processing and image processing techniques. At this time, it is not always necessary to match even if the size is large, but it is sufficient if they are similar. For this reason, if necessary, conversion such as enlargement or reduction is performed on the bitmap information as search information, and a match is checked. When extracting a specific area from the input bitmap information as search information, for example, display the input bitmap information on a display device, and allow the user to specify the area interactively in the display. Can be.

【0023】また,本実施の形態では,検索される文書
が一つとして説明しており,文字認識精度については言
及していないが,実際には入力された文字イメージが1
00%認識できることは稀であるため,ある程度の認識
精度を確保できれば,複数の候補文書を提示して利用者
に判断させることでもよい。例えば,認識すべき文字数
の半分以上でも認識できれば,その認識できた部分で検
索した文書を,候補文書として利用者に提示し,複数の
候補文書の中から利用者が詳細を知りたい文書情報を利
用者に選択させるようにしてもよい。
Also, in the present embodiment, one document is searched for, and the accuracy of character recognition is not described.
Since it is rare to be able to recognize 00%, if a certain degree of recognition accuracy can be ensured, a plurality of candidate documents may be presented to make the user judge. For example, if more than half of the number of characters to be recognized can be recognized, the document searched for the recognized part is presented to the user as a candidate document, and the document information that the user wants to know the details from among the plurality of candidate documents is displayed. You may make a user select.

【0024】本発明は,以上説明した例に限定されるこ
となく,特許請求の範囲における各請求項に記載した技
術の範囲内で種々変更・応用が可能であることは言うま
でもない。
It is needless to say that the present invention is not limited to the examples described above, but can be variously modified and applied within the scope of the technology described in each claim in the claims.

【0025】[0025]

【発明の効果】上述のように,本発明のドキュメント検
索方法およびシステムによれば,蓄積されている大量の
文書情報のファイル名,キーワードが不明であったり,
忘れていても,紙ベースの文書の写しの一部でもあれ
ば,蓄積されている電子データを検索できるばかりか,
従来のフルテキストサーチによる検索手段では不可能で
あった図形をもキーとした検索が可能となる。
As described above, according to the document search method and system of the present invention, the file name and keyword of a large amount of stored document information are unknown,
Even if you forget, if it is part of a copy of a paper-based document, you can not only search the stored electronic data,
It is possible to perform a search using a figure as a key, which is not possible with the conventional search means using full text search.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理説明図である。FIG. 1 is a diagram illustrating the principle of the present invention.

【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.

【図3】本発明のクライアント端末のシステム構成例を
示す図である。
FIG. 3 is a diagram illustrating an example of a system configuration of a client terminal according to the present invention.

【図4】本発明のサーバのシステム構成例を示す図であ
る。
FIG. 4 is a diagram illustrating a system configuration example of a server according to the present invention.

【図5】本発明のクライアント端末およびサーバの処理
の概要を示すフローチャートである。
FIG. 5 is a flowchart showing an outline of processing of a client terminal and a server of the present invention.

【符号の説明】[Explanation of symbols]

10 クライアント端末 110 (クライアント端末内の)CPU・メモリ 111 (CPU・メモリ内の)文字認識機構 112 (CPU・メモリ内の)検索情報蓄積機構 120 (クライアント端末内の)文書入力装置 130 (クライアント端末内の)通信制御装置 140 (クライアント端末内の)表示装置 20 サーバ 210 (サーバ内の)CPU・メモリ 211 (CPU・メモリ内の)検索用文字コード列蓄
積機構 212 (CPU・メモリ内の)一致判定機構 213 (CPU・メモリ内の)ファイル名蓄積機構 220 (サーバ内の)文書蓄積装置 230 (サーバ内の)通信制御装置 30 通信網
Reference Signs List 10 client terminal 110 CPU / memory (in client terminal) 111 character recognition mechanism (in CPU / memory) 112 search information storage mechanism (in CPU / memory) 120 document input device (in client terminal) 130 (client terminal) Communication controller 140 (in client terminal) Display device 20 (in client terminal) 20 Server 210 CPU memory (in server) 211 Character code string storage mechanism (in CPU / memory) 212 Match (in CPU / memory) Judgment mechanism 213 File name storage mechanism (in CPU / memory) 220 Document storage device (in server) 230 Communication control device (in server) 30 Communication network

───────────────────────────────────────────────────── フロントページの続き (72)発明者 秋山 照雄 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Teruo Akiyama 3-19-2 Nishi-Shinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Corporation

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 サーバ/クライアントシステムにおい
て,サーバに蓄積された文書情報をクライアント端末か
らの指示により検索するドキュメント検索方法であっ
て,クライアント端末から検索すべき文書の一部あるい
は全てを入力し,入力された文書情報から検索情報を抽
出し,サーバに蓄積された複数の文書情報の中から,抽
出された検索情報の内容と一致する内容を含む文書を検
索し,該検索された文書情報をクライアント端末に表示
することを特徴とするドキュメント検索方法。
1. A document search method for searching document information stored in a server in accordance with an instruction from a client terminal in a server / client system, wherein a part or all of a document to be searched is input from a client terminal. Search information is extracted from the input document information, and a document including contents matching the extracted search information is searched from a plurality of pieces of document information stored in the server, and the searched document information is retrieved. A document search method characterized by displaying on a client terminal.
【請求項2】 クライアント端末から検索すべき文書の
一部あるいは全てをビットマップ情報として入力し,該
ビットマップ情報から文字部分を認識して文字コード列
に変換し,文字コードでサーバに蓄積された複数の文書
情報の中から一致する文字コード列を含む文書情報を検
索・表示することを特徴とする請求項1記載のドキュメ
ント検索方法。
2. A part or all of a document to be searched is input as bitmap information from a client terminal, a character part is recognized from the bitmap information, converted into a character code string, and stored in a server as a character code. 2. The document search method according to claim 1, further comprising searching and displaying document information including a matching character code string from the plurality of pieces of document information.
【請求項3】 クライアント端末から検索すべき文書の
一部あるいは全てをビットマップ情報として入力し,サ
ーバに蓄積された文書情報の中から該ビットマップ情報
の一部あるいは全てが相似的に一致するイメージ情報を
含む文書情報を検索・表示することを特徴とする請求項
1記載のドキュメント検索方法。
3. A part or all of a document to be searched is input as bitmap information from a client terminal, and part or all of the bitmap information from the document information stored in the server is similar to each other. 2. The document search method according to claim 1, wherein document information including image information is searched and displayed.
【請求項4】 検索すべき文書情報を指定するクライア
ント端末と,複数の文書情報を蓄積し,クライアント端
末からの指示により特定の文書情報を検索するサーバと
を有するドキュメント検索システムであって,前記クラ
イアント端末は,検索すべき文書情報の一部あるいは全
てをビットマップ情報として入力する文書入力手段と,
該ビットマップ情報から文字部分を切り出し,文字コー
ドに変換する文字認識手段と,文字認識された文字コー
ド列を蓄積する検索情報蓄積手段と,該検索情報を前記
サーバに転送する転送手段と,前記サーバから転送され
る検索結果としての文書情報を表示する文書表示手段と
を有し,前記サーバは,複数の文書情報を蓄積する文書
蓄積手段と,前記クライアント端末からの検索情報を受
信する受信手段と,受信した検索情報である文字コード
列を蓄積する検索用文字コード列蓄積手段と,前記文書
蓄積手段に蓄積された複数の文書情報の文字コード部分
と前記検索用文字コード列蓄積手段に蓄積された文字コ
ードとの一致をとり,その一致度合を判定する一致判定
手段と,前記一致判定手段の出力により,前記文書蓄積
手段に蓄積された複数文書情報の中から特定の文書情報
のファイル名を蓄積するファイル名蓄積手段と,前記文
書蓄積手段に蓄積された全文書の一致判定が終了した時
点で,前記ファイル名蓄積手段に蓄積されたファイル名
で特定される文書情報を前記クライアント端末に転送す
る転送手段とを有することを特徴とするドキュメント検
索システム。
4. A document retrieval system comprising: a client terminal for designating document information to be retrieved; and a server for storing a plurality of document information and retrieving specific document information in accordance with an instruction from the client terminal. A client terminal for inputting part or all of the document information to be searched as bitmap information;
A character recognition unit that cuts out a character portion from the bitmap information and converts it into a character code, a search information storage unit that stores a character code string whose character has been recognized, a transfer unit that transfers the search information to the server, Document display means for displaying document information as a search result transferred from a server, wherein the server has a document storage means for storing a plurality of document information, and a reception means for receiving search information from the client terminal Character code string storage means for storing a character code string which is received search information; character code portions of a plurality of document information stored in the document storage means; and stored in the search character code string storage means. A match judging unit for judging a degree of the coincidence with the character code set, and an output of the match judging unit, the data being stored in the document storing unit. File name storage means for storing the file name of specific document information from several pieces of document information, and when the matching determination of all documents stored in the document storage means is completed, the file name is stored in the file name storage means. Transfer means for transferring document information specified by a file name to the client terminal.
【請求項5】 検索すべき文書情報を指定するクライア
ント端末と,複数の文書情報を蓄積し,クライアント端
末からの指示により特定の文書情報を検索するサーバと
を有するドキュメント検索システムであって,前記クラ
イアント端末は,検索すべき文書情報の一部あるいは全
てをビットマップ情報として入力する文書入力手段と,
該ビットマップ情報から特定の領域を検索情報として切
り出す領域切り出し手段と,切り出された検索情報であ
るビットマップ情報を蓄積する検索情報蓄積手段と,該
検索情報を前記サーバに転送する転送手段と,前記サー
バから転送される検索結果としての文書情報を表示する
文書表示手段とを有し,前記サーバは,複数の文書情報
を蓄積する文書蓄積手段と,前記クライアント端末から
の検索情報を受信する受信手段と,受信した検索情報で
あるビットマップ情報を蓄積する検索用ビットマップ情
報蓄積手段と,前記文書蓄積手段に蓄積された複数の文
書情報の中からビットマップ情報の一部を切り出し,該
切り出されたビットマップ情報に拡大縮小などの変換を
行い,前記検索用ビットマップ情報蓄積手段に蓄積され
たビットマップ情報との一致をとり,その一致度合を判
定する一致判定手段と,前記一致判定手段の出力によ
り,前記文書蓄積手段に蓄積された複数文書情報の中か
ら特定の文書情報のファイル名を蓄積するファイル名蓄
積手段と,前記文書蓄積手段に蓄積された全文書の一致
判定が終了した時点で,前記ファイル名蓄積手段に蓄積
されたファイル名で特定される文書情報を前記クライア
ント端末に転送する転送手段とを有することを特徴とす
るドキュメント検索システム。
5. A document retrieval system comprising: a client terminal for designating document information to be retrieved; and a server for storing a plurality of document information and retrieving specific document information in accordance with an instruction from the client terminal. A client terminal for inputting part or all of the document information to be searched as bitmap information;
Area extraction means for extracting a specific area from the bitmap information as search information, search information storage means for storing bitmap information as the extracted search information, transfer means for transferring the search information to the server, Document display means for displaying document information as a search result transferred from the server, wherein the server has a document storage means for storing a plurality of document information; and a reception means for receiving search information from the client terminal. Means, search bitmap information storage means for storing bitmap information as received search information, and a part of bitmap information cut out from a plurality of pieces of document information stored in the document storage means. The converted bitmap information is subjected to conversion such as scaling, and the bitmap information stored in the search bitmap information storage means is stored. And a file for storing a file name of specific document information from a plurality of pieces of document information stored in the document storage unit, based on an output of the match determination unit. Name storage means, and transfer means for transferring, to the client terminal, document information specified by the file name stored in the file name storage means when the match determination of all documents stored in the document storage means is completed. And a document search system comprising:
JP9097833A 1997-04-16 1997-04-16 Document retrieving method and system Pending JPH10289247A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9097833A JPH10289247A (en) 1997-04-16 1997-04-16 Document retrieving method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9097833A JPH10289247A (en) 1997-04-16 1997-04-16 Document retrieving method and system

Publications (1)

Publication Number Publication Date
JPH10289247A true JPH10289247A (en) 1998-10-27

Family

ID=14202727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9097833A Pending JPH10289247A (en) 1997-04-16 1997-04-16 Document retrieving method and system

Country Status (1)

Country Link
JP (1) JPH10289247A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000052645A1 (en) * 1999-03-01 2000-09-08 Matsushita Electric Industrial Co., Ltd. Document image processor, method for extracting document title, and method for imparting document tag information

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000052645A1 (en) * 1999-03-01 2000-09-08 Matsushita Electric Industrial Co., Ltd. Document image processor, method for extracting document title, and method for imparting document tag information
US7035463B1 (en) 1999-03-01 2006-04-25 Matsushita Electric Industrial Co., Ltd. Document image processor, method for extracting document title, and method for imparting document tag information

Similar Documents

Publication Publication Date Title
JP4118349B2 (en) Document selection method and document server
JP4851763B2 (en) Document retrieval technology using image capture device
US6353840B2 (en) User-defined search template for extracting information from documents
US8005831B2 (en) System and methods for creation and use of a mixed media environment with geographic location information
US7672543B2 (en) Triggering applications based on a captured text in a mixed media environment
US7920759B2 (en) Triggering applications for distributed action execution and use of mixed media recognition as a control input
US8521737B2 (en) Method and system for multi-tier image matching in a mixed media environment
US8195659B2 (en) Integration and use of mixed media documents
US20070047008A1 (en) System and methods for use of voice mail and email in a mixed media environment
US20070052997A1 (en) System and methods for portable device for mixed media system
US20060262352A1 (en) Method and system for image matching in a mixed media environment
JP2006085733A (en) Filing/retrieval device and filing/retrieval method
JPH10289240A (en) Image processor and its control method
JP2002259388A (en) System, method and program for retrieving image
JPH1173415A (en) Device and method for retrieving similar document
JPH10289247A (en) Document retrieving method and system
WO1997004409A1 (en) File searching device
JP4145171B2 (en) Image processing device unauthorized use monitoring device
JP4116852B2 (en) Extracted character string dictionary search apparatus and method, and program
JPH10334084A (en) Information processor
JPH10285325A (en) Facsimile reception transfer system
JPH10307837A (en) Retrieval device and recording medium recording retrieval program
JPH05210635A (en) Input device
JP2956743B2 (en) Centralized character recognition system and character recognition device
JP3455924B2 (en) Message information error detection device and message information error detection method