JP2012053655A - Information processor, program, and information processing system - Google Patents
Information processor, program, and information processing system Download PDFInfo
- Publication number
- JP2012053655A JP2012053655A JP2010195458A JP2010195458A JP2012053655A JP 2012053655 A JP2012053655 A JP 2012053655A JP 2010195458 A JP2010195458 A JP 2010195458A JP 2010195458 A JP2010195458 A JP 2010195458A JP 2012053655 A JP2012053655 A JP 2012053655A
- Authority
- JP
- Japan
- Prior art keywords
- information
- registered
- document
- document information
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、プログラム及び情報処理システムに関する。 The present invention relates to an information processing apparatus, a program, and an information processing system.
文書は、本文中で他の文書を参照していることがある。特許文献1には、データベースに登録済みの文書情報の名称を表す文字列が、登録対象の文書情報に含まれる場合に、登録対象の文書情報から登録済みの文書情報への参照情報を登録する技術が開示されている。 A document may refer to other documents in the text. Patent Document 1 registers reference information from registered document information to registered document information when a character string representing the name of document information registered in the database is included in the registered document information. Technology is disclosed.
本発明は、登録済みの文書情報から登録対象の文書情報への参照情報を登録可能な情報処理装置、プログラム及び情報処理システムを提供することを主な目的とする。 The main object of the present invention is to provide an information processing apparatus, a program, and an information processing system capable of registering reference information from registered document information to document information to be registered.
上記課題を解決するため、請求項1に記載の発明は、登録対象の文書情報の名称を表す文字列が、登録済みの文書情報に含まれるか否かを検索する検索手段と、検索結果に基づいて、前記登録済みの文書情報から前記登録対象の文書情報への参照情報を登録する登録手段と、を備えることを特徴とする情報処理装置である。 In order to solve the above-mentioned problem, the invention described in claim 1 includes a search means for searching whether or not a character string representing the name of document information to be registered is included in the registered document information, An information processing apparatus comprising: registration means for registering reference information from the registered document information to the document information to be registered.
また、請求項2に記載の発明は、前記登録手段は、前記登録済みの文書情報が参照する文書情報の一覧を更新する、請求項1に記載の情報処理装置である。
The invention according to
また、請求項3に記載の発明は、登録対象の文書情報の名称を表す文字列が、登録済みの文書情報に含まれるか否かを検索する検索手段と、検索結果に基づいて、前記登録済みの文書情報から前記登録対象の文書情報への参照情報を登録する登録手段と、としてコンピュータを機能させるプログラムである。 According to a third aspect of the present invention, there is provided a search means for searching whether or not a character string representing a name of document information to be registered is included in the registered document information, and the registration based on the search result. This is a program that causes a computer to function as registration means for registering reference information from registered document information to the document information to be registered.
また、請求項4に記載の発明は、文書情報を記憶する記憶装置と、端末と、前記端末から文書情報の登録を受付ける受付手段と、登録対象の文書情報の名称を表す文字列が、登録済みの文書情報に含まれるか否かを検索する検索手段と、検索結果に基づいて、前記登録済みの文書情報から前記登録対象の文書情報への参照情報を登録する登録手段と、を備えることを特徴とする情報処理システムである。 According to a fourth aspect of the present invention, there is provided a storage device that stores document information, a terminal, a reception unit that accepts registration of document information from the terminal, and a character string that represents the name of document information to be registered. Search means for searching whether or not it is included in the document information already registered, and registration means for registering reference information from the registered document information to the document information to be registered based on a search result. Is an information processing system characterized by
請求項1,3,4に記載の発明によると、登録済みの文書情報から登録対象の文書情報への参照情報を登録することが可能である。 According to the first, third, and fourth aspects of the invention, it is possible to register reference information from registered document information to document information to be registered.
請求項2に記載の発明によると、登録済みの文書情報が参照する文書情報を一覧により把握することが可能である。 According to the second aspect of the invention, it is possible to grasp the document information referred to by the registered document information from the list.
本発明の情報処理装置、プログラム及び情報処理システムの実施形態を、図面を参照しながら説明する。 Embodiments of an information processing apparatus, a program, and an information processing system of the present invention will be described with reference to the drawings.
図1は、情報処理システム1の構成例を表すブロック図である。情報処理システム1は、サーバとして構成された情報処理装置2と、1または複数の端末3と、を含んでいる。これら情報処理装置2及び端末3は、インターネット等の通信線を介して相互にデータ通信する。
FIG. 1 is a block diagram illustrating a configuration example of the information processing system 1. The information processing system 1 includes an
図2は、情報処理装置2の機能構成例を表すブロック図である。情報処理装置2は、データベースを記憶する記憶装置21と、装置全体の制御を司る制御部22と、インターフェース部24と、文書管理部25と、検索手段の例としての検索部26と、登録手段の例としての参照関係管理部27と、を備えている。
FIG. 2 is a block diagram illustrating a functional configuration example of the
各部の機能は、CPU等の演算部、メモリ等の記憶部、データの入出力を担う入出力部などを備えるコンピュータが、プログラムを読み取り、実行することによって実現される。プログラムは、CD−ROM等の、コンピュータ読み取り可能な情報記録媒体からコンピュータに提供されてもよいし、インターネット等の通信線を介してコンピュータに提供されてもよい。 The function of each unit is realized by a computer including a calculation unit such as a CPU, a storage unit such as a memory, and an input / output unit that performs input and output of data, reading and executing a program. The program may be provided to the computer from a computer-readable information recording medium such as a CD-ROM, or may be provided to the computer via a communication line such as the Internet.
文書管理部25は、記憶装置21に仮想的な保存場所を設ける。こうした保存場所はフォルダと呼ばれる。具体的には、文書管理部25は、端末3から送信された文書ファイルと文書ファイルの保存先として指定されたフォルダを含む登録要求とをインターフェース部24から受け取ると、その文書ファイルを指定されたフォルダと対応付けて記憶装置21に格納する。文書管理部25は、文書ファイルとフォルダとの対応関係が記述されたテーブルを保持している。また、各々のフォルダには、上位のフォルダも対応付けられている。各々のフォルダは複数の上位フォルダを持つことが可能であり、これによってネットワーク構造のデータベースが構成される。
The
検索部26は、検索語が文書ファイルに含まれているかどうか、検索を実行する。すなわち、検索部26は、文書ファイルが表す本文の文字列の中に、検索語と同じ文字列が含まれているか否かを検索する。具体的には、検索部26は、これから記憶装置21に登録される登録対象の文書ファイルの名称を表す文字列が、既に記憶装置21に登録済みの文書ファイルに含まれるか否かを検索する。なお、検索語との完全一致に限らず、あいまい検索を行ってもよい。あいまい検索とは、検索条件に完全一致しない対象を一定の規則の元で抽出する検索方法のことで、公知の手法を用いることができる。
The
参照関係管理部27は、検索部26による検索結果に基づいて、登録済みの文書ファイルから登録対象の文書ファイルへの参照情報を登録する。参照関係管理部27は、参照情報を管理するための参照情報管理テーブルを保持している。参照情報管理テーブルでは、後述するように、文書ファイルと、その文書ファイルを本文中で参照している文書ファイルとが対応付けられる。
The reference
以下、情報処理装置2の具体的な動作について説明する。
Hereinafter, a specific operation of the
図3に示されるように、文書ファイルが記憶装置21に登録されるとき、検索部26は、登録対象の文書ファイルの名称を表す文字列が、既に記憶装置21に登録済みの文書ファイルに含まれるか否かを検索する。図4は、情報処理装置2の具体的な動作例を表すフローチャートである。
As shown in FIG. 3, when a document file is registered in the
S1において、検索部26は検索語を決定する。検索部26は、文書のタイトルを表す文字列や、ファイル名から拡張子を除いた文字列を、検索語として決定する。
In S1, the
S2において、検索部26は、決定された検索語を用いて検索を実行する。検索は、記憶装置21に設けられた各フォルダに格納された文書ファイルに対して行われる。ここでは、文書ファイルの登録先のフォルダ及びその近傍のフォルダが検索範囲として設定される。近傍のフォルダとは、ネットワーク構造において登録先のフォルダと近い関係にあるフォルダをいう。近傍のフォルダとしては、例えば、登録先のフォルダの属するフォルダ(登録先のフォルダの親フォルダで、前述のとおり複数存在する場合がある)と登録先のフォルダから2世代まで下位のフォルダ(登録先のフォルダの子フォルダと孫フォルダ)を該当するものとして定めるようにしてもよい。
In S2, the
S3において、参照関係管理部27は、検索により探し出された文書ファイルの関連度を評価する。関連度は、例えば、次のような基準で評価される。(1)両方向の参照関係が存在するか。すなわち、文書ファイル同士が互いを参照し合っている場合には、関連度が高く評価される。(2)参照を表す文字列が検索で一致した文字列の近くに存在するか。参照を表す文字列とは、例えば「参照」、「参考」、「参考文献」、「引用」等である。こうした文字列が、検索で一致した文字列と同じ行や同じ段落に存在する場合に、関連度が高く評価される。(3)検索で一致した文字列が引用符で囲まれているか。引用符とは、[ ]、「 」、“”、()、‘’等である。検索で一致した文字列がこうした引用符で囲まれている場合に、関連度が高く評価される。(4)保存場所同士が近いか。検索により探し出された文書ファイルの保存場所が、登録対象の文書ファイルの保存場所に近いほど、関連度が高く評価される。なお、(1)〜(4)の順に優先順位が低くなる。すなわち、(1)の基準に合致する文書ファイルのほうが、(4)の基準に合致する文書ファイルより関連度が高く評価される。
In S3, the reference
S4において、参照関係管理部27は、検索・評価の結果に基づいて、参照情報管理テーブルを作成する。具体的には、参照関係管理部27は、登録対象の文書ファイルに、検索により探し出された登録済みの文書ファイルの情報を対応付ける。このとき、登録対象の文書ファイルには、関連度に関する情報も対応付けられる。また、検索により探し出された登録済みの文書ファイルは、関連度の高い順に並べられる。
In S4, the reference
参照情報管理テーブルは、図5に示されるように、文書ID、参照元文書ID、参照関連部分、引用符、距離などの項目を含んでいる。文書IDは、文書ファイルの識別情報であり、参照元文書IDは、その文書ファイルを本文中で参照している文書ファイルの識別情報である。参照関連部分、引用符および距離は、関連度の評価基準の(2)〜(4)に対応する項目である。参照情報管理テーブルでは、文書ファイルが登録される毎に、その文書ファイルを本文中で参照している既に登録済みの文書ファイルがリスト化される。 As shown in FIG. 5, the reference information management table includes items such as a document ID, a reference source document ID, a reference related part, a quotation mark, and a distance. The document ID is identification information of the document file, and the reference source document ID is identification information of the document file that refers to the document file in the text. The reference related part, the quotation mark, and the distance are items corresponding to (2) to (4) of the evaluation criteria for the degree of association. In the reference information management table, every time a document file is registered, already registered document files that refer to the document file in the text are listed.
S5において、参照関係管理部27は、逆テーブルを更新する。逆テーブルは、参照情報管理テーブルとは逆の参照関係を管理するためのテーブルであり、逆の参照関係を表す参照情報を迅速に取得可能とするために作成される。すなわち、逆テーブルでは、文書ファイルと、その文書ファイルが本文中で参照している文書ファイルとが対応付けられている。
In S5, the reference
逆テーブルは、図6に示されるように、文書ID、参照先文書IDなどの項目を含んでいる。文書IDは、文書ファイルの識別情報であり、参照先文書IDは、その文書ファイルが本文中で参照している文書ファイルの識別情報である。なお、参照関連部分、引用符、距離の項目は、参照情報管理テーブルから読み出せるので、逆テーブルには設けられていない。逆テーブルでは、文書ファイルが登録される毎に、既に登録済みの文書ファイルが本文中で参照している文書ファイルのリストが更新される。 As shown in FIG. 6, the reverse table includes items such as a document ID and a reference document ID. The document ID is identification information of the document file, and the reference destination document ID is identification information of the document file that the document file refers to in the text. Note that items related to reference, quotes, and distance are not provided in the reverse table because they can be read from the reference information management table. In the reverse table, every time a document file is registered, a list of document files that are already referenced by the already registered document file is updated.
S6において、インターフェース部24は、検索により探し出された登録済みの文書ファイルの一覧を参照情報管理テーブルから読み出し、この一覧をユーザに報知するための画面情報を生成し、端末3に送信する。端末3の画面には、図7に示されるように、登録対象の文書ファイルを参照している可能性のある登録済みの文書ファイルの一覧が表示される。検索により探し出された登録済みの文書ファイルが複数ある場合には、関連度に応じて並べられる。なお、関連度が比較的高い文書ファイルのみが表示されてもよい。
In S <b> 6, the
次に、情報処理装置2の他の動作について説明する。図8は、情報処理装置2の他の動作を表す説明図である。
Next, another operation of the
図8に示されるように、文書ファイルが記憶装置21に登録されるとき、検索部26は、既に記憶装置21に登録済みの文書ファイルの名称を表す文字列が、これから記憶装置21に登録される登録対象の文書ファイルに含まれるか否かを検索する。情報処理装置2の具体的な動作は、上記図4に示したフローチャートと同様である。端末3の画面には、図7に示されるように、登録対象の文書ファイルが参照している可能性のある登録済みの文書ファイルの一覧も表示される。
As shown in FIG. 8, when a document file is registered in the
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、種々の変形実施が当業者にとって可能であるのはもちろんである。 Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments, and various modifications can be made by those skilled in the art.
1 情報処理システム、2 情報処理装置、3 端末、21 記憶装置、22 制御部、24 インターフェース部、25 文書管理部、26 検索部、27 参照関係管理部。 DESCRIPTION OF SYMBOLS 1 Information processing system, 2 Information processing apparatus, 3 Terminal, 21 Storage apparatus, 22 Control part, 24 Interface part, 25 Document management part, 26 Search part, 27 Reference relationship management part
Claims (4)
検索結果に基づいて、前記登録済みの文書情報から前記登録対象の文書情報への参照情報を登録する登録手段と、
を備えることを特徴とする情報処理装置。 A search means for searching whether or not a character string representing the name of document information to be registered is included in the registered document information;
Registration means for registering reference information from the registered document information to the document information to be registered based on a search result;
An information processing apparatus comprising:
請求項1に記載の情報処理装置。 The registration unit updates a list of document information referred to by the registered document information;
The information processing apparatus according to claim 1.
検索結果に基づいて、前記登録済みの文書情報から前記登録対象の文書情報への参照情報を登録する登録手段と、
としてコンピュータを機能させるプログラム。 A search means for searching whether or not a character string representing the name of document information to be registered is included in the registered document information;
Registration means for registering reference information from the registered document information to the document information to be registered based on a search result;
As a program that allows the computer to function.
端末と、
前記端末から文書情報の登録を受付ける受付手段と、
登録対象の文書情報の名称を表す文字列が、登録済みの文書情報に含まれるか否かを検索する検索手段と、
検索結果に基づいて、前記登録済みの文書情報から前記登録対象の文書情報への参照情報を登録する登録手段と、
を備えることを特徴とする情報処理システム。 A storage device for storing document information;
A terminal,
Accepting means for accepting registration of document information from the terminal;
A search means for searching whether or not a character string representing the name of document information to be registered is included in the registered document information;
Registration means for registering reference information from the registered document information to the document information to be registered based on a search result;
An information processing system comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010195458A JP2012053655A (en) | 2010-09-01 | 2010-09-01 | Information processor, program, and information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010195458A JP2012053655A (en) | 2010-09-01 | 2010-09-01 | Information processor, program, and information processing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012053655A true JP2012053655A (en) | 2012-03-15 |
Family
ID=45906902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010195458A Pending JP2012053655A (en) | 2010-09-01 | 2010-09-01 | Information processor, program, and information processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012053655A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017033361A (en) * | 2015-08-04 | 2017-02-09 | コニカミノルタ株式会社 | Document associating device, document associating system, and program |
-
2010
- 2010-09-01 JP JP2010195458A patent/JP2012053655A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10133815B2 (en) | 2015-04-08 | 2018-11-20 | Konica Minolta, Inc. | Document association device, document association system, and program |
JP2017033361A (en) * | 2015-08-04 | 2017-02-09 | コニカミノルタ株式会社 | Document associating device, document associating system, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9448999B2 (en) | Method and device to detect similar documents | |
JP5116775B2 (en) | Information retrieval method and apparatus, program, and computer-readable recording medium | |
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
US8903800B2 (en) | System and method for indexing food providers and use of the index in search engines | |
US9361317B2 (en) | Method for entity enrichment of digital content to enable advanced search functionality in content management systems | |
JP2006318373A (en) | Task selection support server and task selection support method | |
US20090083266A1 (en) | Techniques for tokenizing urls | |
JP2008257444A (en) | Similar file management device, method therefor and program therefor | |
JP2010536086A (en) | User-centric information search method and system | |
JP2008090403A (en) | Document retrieval apparatus, method and program | |
TW201415254A (en) | Method and system for recommending semantic annotations | |
JP2003173280A (en) | Apparatus, method and program for generating database | |
JP2012146097A (en) | Document retrieval apparatus, document retrieval method and document retrieval program | |
JP5232054B2 (en) | Information provision device | |
JP4896168B2 (en) | Filing apparatus, filing method and filing system | |
JP2012053655A (en) | Information processor, program, and information processing system | |
JP5162215B2 (en) | Data processing apparatus, data processing method, and program | |
JP2008234403A (en) | Data retrieval method, program, and device | |
JP6707410B2 (en) | Document search device, document search method, and computer program | |
US9420052B2 (en) | Web navigation using web navigation pattern histories | |
JP6777445B2 (en) | Citation map generator, citation map generation method and computer program | |
JP2011248500A (en) | Web page collecting device, method and program thereof | |
JP5616473B2 (en) | Information processing apparatus and information processing method | |
JP5968967B2 (en) | Information processing device | |
US9754030B2 (en) | Free text search engine system and method |