JP2008083898A - Information processing system and information processing program - Google Patents
Information processing system and information processing program Download PDFInfo
- Publication number
- JP2008083898A JP2008083898A JP2006261965A JP2006261965A JP2008083898A JP 2008083898 A JP2008083898 A JP 2008083898A JP 2006261965 A JP2006261965 A JP 2006261965A JP 2006261965 A JP2006261965 A JP 2006261965A JP 2008083898 A JP2008083898 A JP 2008083898A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- image
- display
- document part
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、情報処理システムおよび情報処理プログラムに関する。 The present invention relates to an information processing system and an information processing program.
電子的な文書(スキャナにより入力された画像である文書、文書生成アプリケーションにより生成された文書などを含む)のデータベース中から、操作者が望む文書を効率良く検索したい要求がある。文書に含まれるキーワードが分かっている場合は、キーワードによる検索が可能である。
しかし、含まれる画像のイメージは思いつくが、適切なキーワードが思いつかない場合には、含まれる画像をキーとして文書を検索した方が検索効率が良い。また、キーワードで検索を行ったが、該当文書が多数存在する場合は、各文書の中身を確認して、所望の文書を探し出す必要がある。これらの時には、文書に含まれる画像をキーとして文書の検索または、候補文書の絞込みを行うと効率が良い。
There is a request for efficiently searching for a document desired by an operator from a database of electronic documents (including documents that are images input by a scanner, documents generated by a document generation application, and the like). If the keyword contained in the document is known, a search by keyword is possible.
However, if an image of an included image can be conceived but an appropriate keyword cannot be conceived, it is more efficient to search for a document using the included image as a key. In addition, when a search is performed using a keyword, but there are many corresponding documents, it is necessary to check the contents of each document to find a desired document. In these cases, it is efficient to search for a document or narrow down candidate documents using an image included in the document as a key.
これらに関連する技術として、例えば、特許文献1には、縮小画像で表示された類似画像であっても容易に識別ができる画像表示装置、画像表示方法、画像表示プログラムおよび画像表示プログラムを格納した記録媒体を提供することを課題とし、文書ファイルを取得する文書ファイル取得手段と、文書ファイル取得手段により取得した文書ファイルにかかる画像の縮小画像を生成する縮小画像生成手段と、ディスプレイに表示された前記縮小画像がポインタ指定された場合に、文書ファイルにかかる画像上の処理領域を決定する処理領域決定手段と、処理領域内の情報を前記文書ファイルから抽出する処理領域内情報抽出手段と、処理領域内情報抽出手段が抽出した処理領域内情報を所定の大きさでディスプレイに表示する処理領域内情報表示手段とを備えていることが開示されている。
For example,
また、例えば、特許文献2には、画像検索におけるユーザインターフェースを向上させた情報処理装置を提供することを課題とし、ウェブ・ブラウザに表示された電子文書から第1キーワード及び第2キーワードが抽出され、ユーザがウェブ・ブラウザ上の画像を選択するとプルダウンメニューが表示され、更に、その中の「画像検索」を選択すると、該キーワード群によって電子文書が検索され、その電子文書に含まれる画像が抽出され、GUIに所定の大きさのサムネール画像、画像の名称、該画像が表示され、GUI上の表示コントロールボタンで表示結果を操作したり、画像を選択して保持したりすることができることが開示されている。
Further, for example,
また、例えば、特許文献3には、文字検索や画像検索における検索結果表示技術に係り、操作者が検索キーを含むページを抽出し、当該ページにおける検索キーに適合するオブジェクトの配置等を容易に視認できる検索システム、検索方法および検索プログラムを提供することを課題とし、検索キー指定手段と、検索キーに適合するオブジェクトが含まれたページを検索対象から抽出する検索手段と、前記オブジェクト部分が他の部分と識別できるように特徴付けられてなる縮小簡易画像を生成する縮小簡易画像生成手段と、縮小簡易画像生成手段により生成した縮小簡易画像を表示する機能を備えた縮小簡易画像表示手段とを備えていることが開示されている。
Further, for example,
また、例えば、特許文献4には、多数頁で構成される文書の全頁構成を一目で確認できるようにすることを目的とし、ファイル格納手段によって複数頁の画像データとその各画像データの縮小画像データとインデックスデータからなる文書ファイルを格納し、検索手段のインデックスデータによる検索時、表示手段に対して、第1の表示制御手段が検索した文書ファイルの名称とその文書ファイルの頁数に応じたセルに分割したアイコンを、第2の表示制御手段がそのアイコンの選択された頁を含む前後数頁分のセルに分割したアイコンを、第3の表示制御手段がそのアイコンの選択された文書ファイルの指定されたセルに対応する頁の縮小画像データを、第4の表示制御手段がそのアイコンの選択された文書ファイルの指定されたセルに対応する頁の画像データを、それぞれ表示させることが開示されている。
本発明は、このような背景技術の状況の中でなされたもので、文書を構成している文書部品を用いてその文書部品を表示またはその文書部品を用いた文書の検索をすることができなかったことを課題とし、文書部品を用いてその文書部品を表示するまたは文書を検索することができるようにした情報処理システムおよび情報処理プログラムを提供することを目的としている。 The present invention has been made in the background of such a background art, and can display a document part using a document part constituting a document or search for a document using the document part. It is an object of the present invention to provide an information processing system and an information processing program that can display a document part or retrieve a document using the document part.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
[1] 文書を取得する文書取得手段と、
前記文書取得手段によって取得した文書を構成する文書部品を抽出する文書部品抽出手段と、
前記文書部品抽出手段によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う文書部品表示手段
を具備することを特徴とする情報処理システム。
The gist of the present invention for achieving the object lies in the inventions of the following items.
[1] Document acquisition means for acquiring a document;
Document part extraction means for extracting document parts constituting the document acquired by the document acquisition means;
An information processing system comprising: document part display means for displaying a document part by deforming the document part extracted by the document part extraction means according to a display screen.
[2] 文書を取得する文書取得手段と、
前記文書取得手段によって取得した文書を構成する文書部品を抽出する文書部品抽出手段と、
前記文書部品抽出手段によって抽出した文書部品間の類似している度合いに応じて、表示する文書部品を選択して表示する文書部品表示手段
を具備することを特徴とする情報処理システム。
[2] Document acquisition means for acquiring a document;
Document part extraction means for extracting document parts constituting the document acquired by the document acquisition means;
An information processing system comprising: document part display means for selecting and displaying a document part to be displayed according to the degree of similarity between the document parts extracted by the document part extraction means.
[3] 前記文書部品表示手段は、前記文書部品抽出手段によって抽出した文書部品間で表示が重複している場合は、該重複している文書部品のうち表示面側に位置している文書部品を表示する
ことを特徴とする[1]または[2]に記載の情報処理システム。
[3] When the document part display means overlaps the display between the document parts extracted by the document part extraction means, the document part located on the display surface side among the duplicate document parts The information processing system according to [1] or [2], wherein the information processing system is displayed.
[4] 文書を検索する場合の検索語を受け付ける検索語受付手段と、
前記検索語受付手段によって受け付けた検索語に基づいて、文書を検索する第一の文書検索手段と、
前記第一の文書検索手段によって検索した文書内の検索語に関連する文書部品を抽出する関連文書部品抽出手段と、
前記関連文書部品抽出手段によって抽出した文書部品に基づいて、文書を検索する第二の文書検索手段
を具備することを特徴とする情報処理システム。
[4] Search term accepting means for accepting a search term when searching for a document;
First document search means for searching for a document based on the search word received by the search word receiving means;
Related document part extraction means for extracting a document part related to a search term in the document searched by the first document search means;
An information processing system comprising: second document search means for searching for a document based on the document parts extracted by the related document part extraction means.
[5] 検索対象となる文書を記憶する文書記憶手段と、
文書の検索方法を指定する検索方法指定手段と、
前記検索方法指定手段によって指定された検索方法が画像を用いた検索である場合は、前記文書記憶手段によって記憶された文書から文書を構成する文書部品を抽出する文書部品抽出手段と、
前記文書部品抽出手段によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う文書部品表示手段と、
前記文書部品表示手段によって表示された文書部品を操作者の操作に応じて、検索の画像として受け付ける検索画像受付手段と、
前記検索画像受付手段によって受け付けた検索の画像を、前記文書記憶手段内を検索する画像検索手段と、
前記画像検索手段によって検索した文書を表示する文書表示手段
を具備することを特徴とする情報処理システム。
[5] Document storage means for storing a document to be searched;
A search method specifying means for specifying a document search method;
If the search method specified by the search method specifying means is a search using an image, a document part extracting means for extracting a document part constituting the document from the document stored by the document storage means;
A document part display means for displaying the document part by transforming the document part extracted by the document part extraction means according to a display screen;
A search image receiving means for receiving a document part displayed by the document part display means as a search image according to an operation of an operator;
An image search means for searching the document storage means for a search image received by the search image receiving means;
An information processing system comprising document display means for displaying a document searched by the image search means.
[6] コンピュータに、
文書を取得する文書取得機能と、
前記文書取得機能によって取得した文書を構成する文書部品を抽出する文書部品抽出機能と、
前記文書部品抽出機能によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う文書部品表示機能
を実現させることを特徴とする情報処理プログラム。
[6]
A document acquisition function for acquiring a document;
A document part extraction function for extracting a document part constituting a document acquired by the document acquisition function;
An information processing program that realizes a document part display function for deforming a document part extracted by the document part extraction function according to a display screen and displaying the document part.
[7] コンピュータに、
文書を取得する文書取得機能と、
前記文書取得機能によって取得した文書を構成する文書部品を抽出する文書部品抽出機能と、
前記文書部品抽出機能によって抽出した文書部品間の類似している度合いに応じて、表示する文書部品を選択して表示する文書部品表示機能
を実現させることを特徴とする情報処理プログラム。
[7]
A document acquisition function for acquiring a document;
A document part extraction function for extracting a document part constituting a document acquired by the document acquisition function;
An information processing program for realizing a document part display function for selecting and displaying a document part to be displayed according to the degree of similarity between the document parts extracted by the document part extraction function.
[8] コンピュータに、
文書を検索する場合の検索語を受け付ける検索語受付機能と、
前記検索語受付機能によって受け付けた検索語に基づいて、文書を検索する第一の文書検索機能と、
前記第一の文書検索機能によって検索した文書内の検索語に関連する文書部品を抽出する関連文書部品抽出機能と、
前記関連文書部品抽出機能によって抽出した文書部品に基づいて、文書を検索する第二の文書検索機能
を実現させることを特徴とする情報処理プログラム。
[8]
A search word reception function for receiving a search word when searching a document,
A first document search function for searching for a document based on a search word received by the search word reception function;
A related document part extraction function for extracting a document part related to a search term in the document searched by the first document search function;
An information processing program for realizing a second document search function for searching for a document based on the document part extracted by the related document part extraction function.
請求項1の情報処理システムによれば、本構成を有していない場合に比較して、表示画面に多くの文書部品を表示することができるので、文書を構成している文書部品を用いたその文書部品の表示またはその文書部品を用いた文書の検索をすることができる。
According to the information processing system of
請求項2の情報処理システムによれば、本構成を有していない場合に比較して、同一マークの文書部品を、その出現している数だけ表示するのではなく、そのマークを1つだけ表示することができるようになり、操作者に対するわずらわしさを減少させた文書を構成している文書部品を用いたその文書部品の表示またはその文書部品を用いた文書の検索をすることができる。
According to the information processing system of
請求項3の情報処理システムによれば、本構成を有していない場合に比較して、請求項1または2の情報処理システムによる効果に加えて、操作者が見ている文書部品と同じものが表示対象となり、文書内で見たままの文書部品を対象とすることができ、操作性、利便性がより一層向上する。
According to the information processing system of
請求項4の情報処理システムによれば、本構成を有していない場合に比較して、一般的な検索語を用いて検索した後に、その検索語によって説明している文書部品を用いた検索をすることができる。
According to the information processing system of
請求項5の情報処理システムによれば、本構成を有していない場合に比較して、文書を検索したい場合に、紙として手元にある文書を画像入力装置によって読み込み、その文書部品を効率的に表示し、選択された文書画像を用いて検索することができ、検索する際の自由度が一層向上する。
According to the information processing system of
請求項6の情報処理プログラムによれば、本構成を有していない場合に比較して、表示画面に多くの文書部品を表示することができるので、文書を構成している文書部品を用いたその文書部品の表示またはその文書部品を用いた文書の検索をすることができる。
According to the information processing program of
請求項7の情報処理プログラムによれば、本構成を有していない場合に比較して、同一マークの文書部品を、その出現している数だけ表示するのではなく、そのマークを1つだけ表示することができるようになり、操作者に対するわずらわしさを減少させた文書を構成している文書部品を用いたその文書部品の表示またはその文書部品を用いた文書の検索をすることができる。 According to the information processing program of the seventh aspect, as compared with the case where the present configuration is not provided, the document parts having the same mark are not displayed as many times as they appear, but only one mark is displayed. Thus, the user can display the document parts using the document parts constituting the document with reduced troublesomeness for the operator, or search for the documents using the document parts.
請求項8の情報処理プログラムによれば、本構成を有していない場合に比較して、一般的な検索語を用いて検索した後に、その検索語によって説明している文書部品を用いた検索をすることができる。
According to the information processing program of
以下、図面に基づき本発明の好適な一実施の形態を説明する。
図1、図2は、本発明の一実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
Hereinafter, a preferred embodiment of the present invention will be described with reference to the drawings.
1 and 2 are conceptual module configuration diagrams of an embodiment of the present invention.
The module generally refers to a component such as software or hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a program, a system, and a method. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Hereinafter, “connection” includes not only physical connection but also logical connection.
The system includes a configuration in which a plurality of computers, hardware, devices, and the like are connected via a network and the like, and includes a case where the system is realized by one computer, hardware, devices, and the like.
図1に示す本実施の形態は、文書からその文書を構成する文書部品を抽出し、文書部品を用いたその後の検索等のために効率よく表示するものである。
本実施の形態は、図1に示すように、文書取得モジュール110、文書部品抽出モジュール120、文書部品表示モジュール130を有しており、さらに、文書部品表示モジュール130は、再配置モジュール132、表示順序変更モジュール134、共通部品非表示モジュール136を有している。
文書取得モジュール110は、文書部品抽出モジュール120と接続されており、文書を取得する。ここでの文書とは、電子的な文書であり、より具体的には、スキャナにより入力された画像である文書、文書生成アプリケーション(例えば、ワープロ等)により生成された文書などを含む。そして、取得するとは、スキャナを用いて取得すること、文書データベースから文書を取得すること、通信回線を介して、外部のシステムから取得すること等を含む。また、取得する文書は、1ページであってもよいし、複数ページの文書であってもよい。
In the present embodiment shown in FIG. 1, document parts constituting the document are extracted from the document and displayed efficiently for subsequent search using the document part.
As shown in FIG. 1, the present embodiment includes a
The
文書部品抽出モジュール120は、文書取得モジュール110、文書部品表示モジュール130と接続されており、文書取得モジュール110によって取得した文書を構成する文書部品を抽出する。ここで、文書部品(以下、オブジェクトともいう。)とは、例えば、文章からなる文字領域、写真のような自然画からなる画像領域、直線、円等の比較的簡単な図形等の人工的な画像からなる図形領域、文字とその文字を囲む線からなる表領域等がある。ここでの抽出には、文書部品を文書から抽出するだけでなく、その文書部品の属性(文字、画像、図形、表等)をも抽出する。
抽出の方法は、文書が文書生成アプリケーションにより生成されたものであるならば、文書部品の領域およびその文書部品の属性を抽出することによって行う。スキャナ等により入力された画像である文書であるならば、画像に対する領域分離を行う。ここでの領域分離は、画像から空白等で区切られた領域を分離することによって行われる。もちろん他の既存の方法で領域を分離してもよい。そして、その領域の属性の識別は、分離した領域内の特徴(黒画素塊の大きさ、その形状、一定領域内の黒画素数、黒画素塊の配置等)を抽出し、特徴空間内でのその位置によって識別するが、その他の既存の方法であってもよい。
文書部品の抽出結果(文書部品そのもの、その属性を含む)を、文書部品表示モジュール130に渡す。
The document
If the document is generated by the document generation application, the extraction method is performed by extracting the document part area and the attribute of the document part. If the document is an image input by a scanner or the like, region separation is performed on the image. The region separation here is performed by separating a region separated by a blank or the like from the image. Of course, the regions may be separated by other existing methods. The attribute of the area is identified by extracting features in the separated area (the size of the black pixel block, its shape, the number of black pixels in the fixed region, the arrangement of the black pixel block, etc.) Is identified by its position, but other existing methods may be used.
The extraction result of the document part (including the document part itself and its attributes) is passed to the document
文書部品表示モジュール130は、文書部品抽出モジュール120と接続されており、文書部品抽出モジュール120より文書部品の抽出結果を受け取り、再配置モジュール132、表示順序変更モジュール134、共通部品非表示モジュール136を有している。文書部品表示モジュール130は、再配置モジュール132、表示順序変更モジュール134、共通部品非表示モジュール136を用いて、次のことを行う。
文書部品表示モジュール130は、文書部品抽出モジュール120によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う。例えば、複写機などの装置内に実現している時は、装置に備え付けの表示画面の大きさに基づいて、該文書部品の表示を行う。パーソナルコンピュータなどのアプリケーションプログラムとして実現している時は、パーソナルコンピュータのオペレーティングシステムなどから表示に使用するウィンドウサイズを取得し、取得したウィンドウサイズに応じて該文書部品の表示を行う。予めユーザの希望を記憶し、ユーザの希望と表示画面に合わせて該文書部品の表示を行っても良い。表示画面に合わせて文書部品の表示をするには、例えば、1つの文書部品を表示画面の大きさに合わせて拡大縮小処理を行って表示する、予め定めた数の文書部品を表示画面に収まるように拡大縮小処理を行って表示する、文書部品内の文字が一定の大きさ(例えば、8ポイント等)になるように拡大縮小処理を行って、表示画面に合わせて表示する数を決定する等がある。
また、文書部品表示モジュール130は、文書部品抽出モジュール120によって抽出した文書部品間の類似している度合いに応じて、表示する文書部品を選択して表示する。
さらに、文書部品表示モジュール130は、文書部品抽出モジュール120によって抽出した文書部品間で表示が重複している場合は、該重複している文書部品のうち表示面側(つまり、上位側または前面側)に位置している文書部品を表示するようにしてもよい。
The document
The document
Further, the document
Further, when the document parts display
再配置モジュール132は、文書部品表示モジュール130によって表示される文書部品の表示構成を変更する。例えば、抽出された文書部品のサイズを変更せず、多くの文書部品が1つの表示画面に収まるように文書部品を配置するようにしてもよい。具体的には、カタログ等の文書で文書部品である写真等が重複している場合があり、その重複の度合いを検知し、例えば、該重複している写真のうち表示面側に位置している写真が後方(つまり、下位側)に位置している写真の所定閾値(例えば、90%)以上を隠している場合、その表示面側に位置している写真のみを表示する。
また、再配置モジュール132は、抽出された文書部品を所定縮小率以下の縮小率で縮小し、または、そのサイズが所定サイズ以下になるように縮小し、多くの文書部品が1つの表示画面に収まるように文書部品を配置するようにしてもよい。
また、再配置モジュール132は、抽出された各々の文書部品を表示画面に収まる最大サイズまで拡大し、文書部品表示モジュール130は1ページに1つの文書部品が存在するページを表示するようにしてもよい。
The
In addition, the
The
表示順序変更モジュール134は、文書部品表示モジュール130によって表示される文書部品の順番を変更する。例えば、具体的には、文書部品抽出モジュール120によって抽出された文書部品のうち、サイズが大きな文書部品から順に出力するよう表示順を変更するようにしてもよい。
また、表示順序変更モジュール134は、文書部品抽出モジュール120によって抽出された文書部品を、その文書における出現順に出力するよう表示順を変更するようにしてもよい。
共通部品非表示モジュール136は、所定属性の文書部品のうち、1つの文書に複数個共通に含まれる文書部品は、複数回表示しないようにする。例えば、文書の各ページのフッター、ヘッダー等に表示されている商標等の同一マークの文書部品を、その出現している数だけ表示するのではなく、そのマークを1つだけ表示することができる。そのために、共通部品非表示モジュール136は、1つの文書内の文書部品のうち、画像の属性である文書部品同士の類似度を検出する。この類似度の検出は、文書部品の画像をサイズ変換して一律のサイズにした後に排他的論理和演算(EOR)を行い、黒画素数が一定の閾値よりも少ないものは類似度が高いと判断する、画像色の類似度により判断する、その他の特徴を抽出して、その特徴空間における類似度を検出するようにしてもよい。
The display
The display
The common component
図2に示す本実施の形態は、文書部品等を用いて、文書データベースから文書を検索するものである。
本実施の形態は、図2に示すように、検索方法指定モジュール210、キーワード受付モジュール220、キーワード検索モジュール230、関連文書部品抽出モジュール240、キー画像受付モジュール250、キー画像検索モジュール260、検索結果表示モジュール270、文書DB280を有している。
検索方法指定モジュール210は、キーワード受付モジュール220、キー画像受付モジュール250と接続されており、文書の検索方法を指定する。ここで、指定できる検索方法は、例えば、(1)キーワードを用いた検索、(2)キー画像を用いた画像検索、(3)キーワード検索の後にキー画像検索、の3つである。
In the present embodiment shown in FIG. 2, a document is searched from a document database using document parts or the like.
In the present embodiment, as shown in FIG. 2, a search
The search
キーワード受付モジュール220は、検索方法指定モジュール210、キーワード検索モジュール230と接続されており、検索方法指定モジュール210によって指定された検索方法がキーワード(検索語)を用いた検索である場合に実行される。操作者によるキーボード等の操作によって入力されたテキストを検索用のキーワードとして受け付ける。受け付けたキーワードをキーワード検索モジュール230へ渡す。
キーワード検索モジュール230は、キーワード受付モジュール220、関連文書部品抽出モジュール240、検索結果表示モジュール270、文書DB280と接続されており、キーワード受付モジュール220によって受け付けたキーワードに基づいて、文書DB280に記憶されている文書を検索する。つまり、文書DB280内の各文書には索引語が付けられており、キーワードと一致する索引語を有している文書が検索結果となる。その検索結果を検索結果表示モジュール270、関連文書部品抽出モジュール240へ渡す。
The
The
関連文書部品抽出モジュール240は、キーワード検索モジュール230、キー画像受付モジュール250と接続されており、キーワード検索モジュール230によって検索した文書内のキーワードに関連する文書部品を抽出する。つまり、キーワード検索モジュール230によって検索した文書であって、その文書内にキーワードに関連する文書部品、例えば、そのキーワードの位置的に周辺にある文書部品(その文書部品の説明である可能性が高い)を抽出する。このとき、単にキーワードとの距離によって文書部品を抽出しても良いし、文書の段組みなどを解析することにより、文書のレイアウトを加味したキーワードと文書部品の距離により、関連する文書部品を抽出しても良い。または、そのキーワードが含まれている段落(文書部品)内に、文書部品のタイトルが含まれている場合は、その文書部品を抽出する。キーワードが含まれている段落内に複数の文書部品のタイトルが含まれている場合は、全ての文書部品を抽出しても良いし、同じ文書タイトルが複数回出現する場合は、出現回数順に優先順位をつけて文書部品を抽出しても良い。また、文書部品自体にキーワードが含まれている場合は、そのキーワードが含まれている文書部品を抽出するようにしてもよい。そして、キー画像受付モジュール250へ抽出した文書部品を渡す。
The related document
キー画像受付モジュール250は、検索方法指定モジュール210、関連文書部品抽出モジュール240、キー画像検索モジュール260と接続されており、検索方法指定モジュール210によって指定された検索方法が画像を用いた検索である場合に実行される。
検索に用いる画像が操作者によって予め指定されていない場合は、図1で示した実施の形態を呼び出して実行させるようにしてもよい。その場合、文書取得モジュール110は、検索用の文書部品(画像)を取得するための文書を取得する。文書部品抽出モジュール120は、文書取得モジュール110によって取得した文書を構成する文書部品を抽出する。文書部品表示モジュール130は、文書部品抽出モジュール120によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う。そして、キー画像受付モジュール250は、文書部品表示モジュール130によって表示された文書部品を操作者の操作に応じて、検索の画像として受け付ける。
また、キー画像受付モジュール250は、関連文書部品抽出モジュール240によって検索した文書内のキーワードに関連する文書部品を受け付けることも行う。
そして、受け付けた文書部品(画像)をキー画像(検索用の画像)としてキー画像検索モジュール260へ渡す。
The key
When the image used for the search is not designated in advance by the operator, the embodiment shown in FIG. 1 may be called and executed. In that case, the
The key
Then, the received document part (image) is transferred to the key
キー画像検索モジュール260は、キー画像受付モジュール250、検索結果表示モジュール270、文書DB280と接続されており、キー画像受付モジュール250によって受け付けたキー画像に基づいて、文書DB280内の文書を検索する。ここでの画像検索は、類似画像検索を用いる。具体的には、予め文書DB280内の文書の画像の文書部品に対して特徴抽出を行っておき、文書DB280内にその結果を文書部品に対応付けて記憶しており、キー画像に対しても同様の特徴抽出を行い、その特徴空間における類似度(空間内での距離)により検索対象の文書部品(画像)を求める。そして、その検索結果を検索結果表示モジュール270へ渡す。
検索結果表示モジュール270は、キーワード検索モジュール230、キー画像検索モジュール260と接続されており、キーワード検索モジュール230またはキー画像検索モジュール260によって検索した文書を表示する。また、検索結果をキー画像との類似度が高い順に表示するようにしてもよい。
文書DB280は、キーワード検索モジュール230、キー画像検索モジュール260と接続されており、検索対象となる文書およびその文書と対応して索引語または文書部品(画像)の特徴を記憶する。そして、キーワード検索モジュール230、キー画像検索モジュール260から検索され、その検索結果(文書)を渡す。
The key
The search
The
次に作用・働き(動作)を説明する。
図3を用いて、図1に示した実施の形態による処理を説明する。つまり、文書から文書部品を抽出し、その文書部品を用いたその後の検索等のために表示する処理について説明する。
ステップS302では、文書取得モジュール110が文書を取得する。ここで、取得する文書は、例えば、図4に示すように、複数ページからなり、各ページは複数の文書部品から構成されている。図4に示すページ1では、属性が画像のオブジェクトが2つあり、属性が文字のオブジェクトが2つある。
Next, the function and operation (operation) will be described.
The processing according to the embodiment shown in FIG. 1 will be described with reference to FIG. That is, a process for extracting a document part from a document and displaying it for subsequent search using the document part will be described.
In step S302, the
ステップS304では、文書部品抽出モジュール120が、ステップS302で取得した文書からオブジェクトを抽出する。図4に示す文書では、属性が画像のオブジェクトをM個、属性が文字のオブジェクトをK個抽出する。
ステップS306では、ステップS304で抽出したオブジェクトの表示方法を判断する。オブジェクトのサイズを変更しない場合はステップS308へ進み、オブジェクトを拡大する場合はステップS310へ進み、オブジェクトを縮小する場合はステップS312へ進む。この判断は、操作者にどのように表示するかを選択させてもよいし、あらかじめシステムとして定めておいてもよい。なお、ここでは表示するオブジェクトは属性が画像であるオブジェクトとする。
In step S304, the document
In step S306, the display method of the object extracted in step S304 is determined. If the size of the object is not changed, the process proceeds to step S308. If the object is enlarged, the process proceeds to step S310. If the object is reduced, the process proceeds to step S312. For this determination, the operator may select how to display, or may be determined in advance as a system. Here, the object to be displayed is an object whose attribute is an image.
ステップS308では、文書部品表示モジュール130が、表示画面に表示するオブジェクトを再配置する。図5を用いて説明する。図5(A)は、図4に示した文書から画像のオブジェクトのみを取り出したものである。つまり、図4に示した文書とは異なり、1ページ目内には、画像のオブジェクトを3つ配置している。そして、図5(B)に、実際の画面表示例を示す。つまり、表示画面510内に図5(A)で示したように再配置した画像のオブジェクトを表示し、その表示するページの移動は、改ページボタン511、改ページボタン512に対する操作者の操作によって行われる。
In step S308, the document
ステップS310では、文書部品表示モジュール130が、表示画面に表示するオブジェクトを拡大する。図6を用いて説明する。図6(A)は、図4に示した文書から画像のオブジェクトを1つずつ取り出したものである。つまり、図4に示した文書とは異なり、ページ毎に、画像のオブジェクトを1つ配置している。そして、図6(B)に、実際の画面表示例を示す。つまり、表示画面内に図6(A)で示した画像のオブジェクトを、その表示画面の大きさに合わせて拡大して表示している。つまり、1枚の画像オブジェクトの全体が表示され、かつ最大のサイズとなるように拡大している。
In step S310, the document
ステップS312では、文書部品表示モジュール130が、表示画面に表示するオブジェクトを縮小する。図7を用いて説明する。図7(A)は、図4に示した文書から画像のオブジェクトを取り出したものである。つまり、図4に示した文書とは異なり、1ページ内に、画像のオブジェクト全てを配置している。そして、図7(B)に、実際の画面表示例を示す。つまり、表示画面内に図7(A)で示した画像のオブジェクトを、その表示画面の大きさに合わせて縮小して表示している。つまり、全ての画像オブジェクトが表示されるサイズとなるように縮小している。ここでの縮小は、多くのオブジェクトが1つの表示画面に収まるように縮小しているが、この他に、オブジェクトを所定縮小率以下の縮小率で縮小し、または、そのサイズが所定サイズ以下になるように縮小するものであってもよい。また、1ページに収まらない場合(収めようとすると、所定の大きさよりもオブジェクトが小さくなってしまう場合)には、複数ページに収めるようにしてもよい。
ステップS314では、ステップS308、ステップS310、ステップS312の処理が終了したオブジェクトを表示する。これについては、図5(B)、図6(B)、図7(B)を用いて既に説明した。また、この後、図2で示した実施の形態で行う検索のためにオブジェクトの中からキー画像を、操作者に選択してもらってもよい。
In step S312, the document
In step S314, the objects for which the processing in step S308, step S310, and step S312 have been completed are displayed. This has already been described with reference to FIGS. 5B, 6B, and 7B. Thereafter, the operator may select a key image from the objects for the search performed in the embodiment shown in FIG.
図8から図11を用いて、図2に示した実施の形態による処理を説明する。つまり、文書部品、検索語を用いて、文書データベースから文書を検索する
図8は、図2に示した実施の形態による全体の処理例を示したフローチャートである。
ステップS802では、検索方法指定モジュール210が、操作者の操作に応じて、文書の検索方法を指定する。ここで、指定できる文書の検索方法は、キーワードを用いた検索と画像を用いた検索である。キーワードを用いた検索が指定された場合はステップS804へ進み、画像を用いた検索が指定された場合はステップS810へ進む。
The processing according to the embodiment shown in FIG. 2 will be described with reference to FIGS. That is, a document is searched from a document database using document parts and search terms. FIG. 8 is a flowchart showing an example of the entire process according to the embodiment shown in FIG.
In step S802, the search
ステップS804では、キーワード受付モジュール220によってキーワードが受け付けられ、キーワード検索モジュール230がそのキーワードを用いて文書DB280を検索する。
ステップS806では、キーワード検索モジュール230は、ステップS804による検索結果を表示し、操作者に対して、絞込み検索が必要であるか否かを尋ねる。操作者からの返答によって、絞込み検索が必要である場合はステップS802に戻り、必要でない場合は検索を終了する(ステップS808)。
In step S804, a keyword is received by the
In step S806, the
ステップS810では、キー画像受付モジュール250が、キー画像があるか否かを操作者に尋ねる。操作者からの応答によって、キー画像がある場合はステップS814へ進み、キー画像がない場合はステップS812へ進む。
ステップS812では、キー画像を操作者に選択してもらい、そのキー画像を得る。なお、ステップS812は図1で示した実施の形態による処理であり、図3のフローチャートを用いて既に説明した。
ステップS814では、キー画像検索モジュール260がキー画像を用いて文書DB280内の該当する文書を検索する。
ステップS816では、キー画像検索モジュール260は、ステップS814による検索結果を表示し、操作者に対して、絞込み検索が必要であるか否かを尋ねる。操作者からの返答によって、絞込み検索が必要である場合はステップS802に戻り、必要でない場合は検索を終了する(ステップS818)。
In step S810, the key
In step S812, the key image is obtained by the operator selecting the key image. Step S812 is processing according to the embodiment shown in FIG. 1, and has already been described with reference to the flowchart of FIG.
In step S814, the key
In step S816, the key
図9は、図2に示した実施の形態によるキー画像を用いた検索処理例を示したフローチャートである。なお、図8で示したステップS810からステップS816をより具体的に説明したものである。
ステップS902では、ステップS810と同様であり、キー画像受付モジュール250が、キー画像があるか否かを操作者に尋ねる。操作者からの応答によって、キー画像がある場合はステップS906へ進み、キー画像がない場合はステップS904へ進む。
FIG. 9 is a flowchart showing an example of search processing using the key image according to the embodiment shown in FIG. Note that steps S810 to S816 shown in FIG. 8 are described more specifically.
In step S902, similar to step S810, the key
ステップS904では、ステップS812と同様であり、キー画像を操作者に選択してもらい、そのキー画像を得る。なお、ステップS904は図1で示した実施の形態による処理であり、図3のフローチャートを用いて既に説明した。
ステップS906では、キー画像検索モジュール260がキー画像に類似した画像(文書部品)を含む文書を検索する。
ステップS908では、検索結果表示モジュール270がステップS906で検索した結果を表示する。
ステップS910では、検索結果表示モジュール270が、操作者による操作によって、ステップS908で表示した文書の中から最終的な文書を決定する。
In step S904, similar to step S812, the operator selects the key image and obtains the key image. Step S904 is processing according to the embodiment shown in FIG. 1, and has already been described with reference to the flowchart of FIG.
In step S906, the key
In step S908, the search
In step S910, the search
図10は、図1に示した実施の形態によるキー画像を抽出した後に、図2に示した実施の形態によるキー画像を用いた検索処理例を示したフローチャートである。
ステップS1002では、文書取得モジュール110が文書を取得し、その後に、操作者によって文書を選択するようにする。
ステップS1004では、文書部品抽出モジュール120がステップS1002で選択された文書からオブジェクトを抽出し、文書部品表示モジュール130がそのオブジェクトのうち属性が画像であるオブジェクトを表示する。
FIG. 10 is a flowchart showing an example of search processing using the key image according to the embodiment shown in FIG. 2 after extracting the key image according to the embodiment shown in FIG.
In step S1002, the
In step S1004, the document
ステップS1006では、ステップS1004で表示されたオブジェクトのうち、操作者による操作によってキー画像が選択された(つまり、操作者がキー画像を発見した)か否かを判断する。キー画像が選択された場合はステップS1008へ進み、そうでない場合はステップS1002へ戻り、キー画像が選択されるまで繰り返される。
ステップS1008では、キー画像が含まれている文書がそもそも操作者が検索しようとしている文書であるか否かを、操作者の操作に応じて判断する。そうである場合は検索を終了し(ステップS1012)、そうでない場合はステップS1010へ進む。
ステップS1010では、キー画像を用いた検索を行う。つまり、図8で示したステップS814、ステップS816の処理または図9で示したステップS906、ステップS908、ステップS910の処理と同様である。
In step S1006, it is determined whether or not a key image has been selected by the operation of the operator among the objects displayed in step S1004 (that is, the operator has found the key image). If a key image has been selected, the process proceeds to step S1008. If not, the process returns to step S1002, and is repeated until a key image is selected.
In step S1008, it is determined according to the operation of the operator whether or not the document including the key image is a document that the operator is trying to retrieve. If so, the search is terminated (step S1012), otherwise, the process proceeds to step S1010.
In step S1010, a search using a key image is performed. That is, it is the same as the processing of step S814 and step S816 shown in FIG. 8 or the processing of step S906, step S908, and step S910 shown in FIG.
図11は、図2に示した実施の形態によるキーワードを用いた検索処理の後に、キー画像を用いた検索処理例を示したフローチャートである。検索方法指定モジュール210でキーワード検索の後にキー画像検索を行うことが指定された場合の処理である。
ステップS1102では、キーワード検索モジュール230がキーワードを用いて文書DB280内の文書を検索する。
ステップS1104では、検索結果表示モジュール270が、ステップS1102による検索結果を操作者に表示し、その検索結果から文書を選択してもらう。
ステップS1106では、ステップS1104で選択した文書のキーワード付近にある属性が画像であるオブジェクトを含めて表示する。
ステップS1108では、ステップS1106で表示した文書が操作者にとって検索の目的とした文書であるか否かを問い合わせる。その結果、目的とした文書であるならば検索を終了(ステップS1110)し、そうでなければステップS1112へ進む。
FIG. 11 is a flowchart showing an example of a search process using a key image after the search process using a keyword according to the embodiment shown in FIG. This is processing when the search
In step S1102, the
In step S1104, the search
In step S1106, an object including an image whose attribute is in the vicinity of the keyword of the document selected in step S1104 is displayed.
In step S1108, an inquiry is made as to whether or not the document displayed in step S1106 is a search target document for the operator. As a result, if the document is the target document, the search is terminated (step S1110), and if not, the process proceeds to step S1112.
ステップS1112では、ステップS1106で表示した画像の中にキー画像があるか否かを操作者に指定してもらう。その結果、キー画像があるのであればステップS1114へ進み、そうでなければステップS1104へ戻り、キー画像が指定されるまで、または目的としている文書が見つかるまで繰り返す。
ステップS1114では、キー画像検索モジュール260が、ステップS1112で指定されたキー画像を用いて文書DB280内の文書を検索する。
ステップS1116では、ステップS1114による検索結果を表示し、目的とした文書があるか否かを操作者に指定してもらう。その結果、目的とした文書が見つかったのであれば検索を終了(ステップS1118)し、見つからなかったならばステップS1120へ進む。
ステップS1120では、検索キー(検索方法)が文字であるか画像であるかを操作者に指定してもらう。文字である場合(キーワードによる検索が指定された場合)はステップS1102へ戻り、画像である場合(キー画像を用いた画像検索が指定された場合)はステップS1104へ戻り、目的としている文書が見つかるまで繰り返す。
In step S1112, the operator designates whether or not the image displayed in step S1106 includes a key image. As a result, if there is a key image, the process proceeds to step S1114. If not, the process returns to step S1104, and the process is repeated until the key image is designated or the target document is found.
In step S1114, the key
In step S1116, the search result obtained in step S1114 is displayed, and the operator specifies whether there is a target document. As a result, if the target document is found, the search is terminated (step S1118), and if not found, the process proceeds to step S1120.
In step S1120, the operator specifies whether the search key (search method) is a character or an image. If it is a character (when search by keyword is specified), the process returns to step S1102, and if it is an image (when image search using a key image is specified), the process returns to step S1104 to find the target document. Repeat until.
図12を参照して、本実施の形態の画像処理システムのハードウェア構成例について説明する。図12に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成される画像処理システムであり、スキャナ等のデータ読み取り部1217と、プリンタなどのデータ出力部1218を備えたハード構成例を示している。 A hardware configuration example of the image processing system according to the present embodiment will be described with reference to FIG. The configuration illustrated in FIG. 12 is an image processing system configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a data reading unit 1217 such as a scanner and a data output unit 1218 such as a printer. .
CPU(Central Processing Unit)1201は、上述の実施の形態において説明した各種のモジュール、すなわち、文書部品抽出モジュール120、文書部品表示モジュール130、キーワード検索モジュール230、キー画像検索モジュール260等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。
A CPU (Central Processing Unit) 1201 includes various modules described in the above-described embodiments, that is, each module such as the document
ROM(Read Only Memory)1202は、CPU1201が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1203は、CPU1201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1204により相互に接続されている。
A ROM (Read Only Memory) 1202 stores programs used by the CPU 1201, calculation parameters, and the like. A RAM (Random Access Memory) 1203 stores programs used in the execution of the CPU 1201, parameters that change as appropriate during the execution, and the like. These are connected to each other by a
ホストバス1204は、ブリッジ1205を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1206に接続されている。
The
キーボード1208、マウス等のポインティングデバイス1209は、操作者により操作される入力デバイスである。ディスプレイ1210は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
A
HDD(Hard Disk Drive)1211は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1201によって実行するプログラムや情報を記録または再生させる。ハードディスクには、文書取得モジュール110が取得した文書、文書DB280に格納される文書などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 1211 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 1201 and information. The hard disk stores documents acquired by the
ドライブ1212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体1213に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース1207、外部バス1206、ブリッジ1205、およびホストバス1204を介して接続されているRAM1203に供給する。リムーバブル記録媒体1213も、ハードディスクと同様のデータ記録領域として利用可能である。
The drive 1212 reads data or a program recorded on a mounted removable recording medium 1213 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read from the
接続ポート1214は、外部接続機器1215を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1214は、インタフェース1207、および外部バス1206、ブリッジ1205、ホストバス1204等を介してCPU1201等に接続されている。通信部1216は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1217は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1218は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
The connection port 1214 is a port for connecting the external connection device 1215 and has a connection unit such as USB, IEEE1394. The connection port 1214 is connected to the CPU 1201 and the like via the
なお、図12に示す画像処理システムのハードウェア構成は、1つの構成例を示すものであり、本実施の形態の画像処理システムは、図12に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図12に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(多機能複写機とも呼ばれ、スキャナ、プリンタ、複写機、ファックス等の機能を有している)などに組み込まれていてもよい。 Note that the hardware configuration of the image processing system shown in FIG. 12 shows one configuration example, and the image processing system of the present embodiment is not limited to the configuration shown in FIG. 12, but will be described in the present embodiment. Any configuration can be used as long as the module can be executed. For example, some modules may be configured by dedicated hardware (for example, ASIC), and some modules may be in an external system and connected via a communication line. A plurality of systems shown in FIG. 5 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (also called a multi-function copying machine, which has functions of a scanner, a printer, a copying machine, a fax machine, etc.).
なお、説明したプログラムについては、記録媒体に格納することも可能であり、また、そのプログラムを通信手段によって提供することもできる。その場合、例えば、上記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えることもできる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。
The described program can be stored in a recording medium, and the program can be provided by communication means. In that case, for example, the above-described program can also be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standards such as “DVD + R, DVD + RW, etc.”, compact discs (CDs), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), etc. MO), flexible disk (FD), magnetic tape, hard disk, read only memory (ROM), electrically erasable and rewritable read only memory (EEPROM), flash memory, random access memory (RAM), etc. It is.
The program or a part of the program can be recorded on the recording medium and stored or distributed. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It can be transmitted using a transmission medium such as a network or a combination of these, and can also be carried on a carrier wave.
Furthermore, the above program may be a part of another program, or may be recorded on a recording medium together with a separate program.
110…文書取得モジュール
120…文書部品抽出モジュール
130…文書部品表示モジュール
132…再配置モジュール
134…表示順序変更モジュール
136…共通部品非表示モジュール
210…検索方法指定モジュール
220…キーワード受付モジュール
230…キーワード検索モジュール
240…関連文書部品抽出モジュール
250…キー画像受付モジュール
260…キー画像検索モジュール
270…検索結果表示モジュール
280…文書DB
DESCRIPTION OF
Claims (8)
前記文書取得手段によって取得した文書を構成する文書部品を抽出する文書部品抽出手段と、
前記文書部品抽出手段によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う文書部品表示手段
を具備することを特徴とする情報処理システム。 A document acquisition means for acquiring a document;
Document part extraction means for extracting document parts constituting the document acquired by the document acquisition means;
An information processing system comprising: document part display means for displaying a document part by deforming the document part extracted by the document part extraction means according to a display screen.
前記文書取得手段によって取得した文書を構成する文書部品を抽出する文書部品抽出手段と、
前記文書部品抽出手段によって抽出した文書部品間の類似している度合いに応じて、表示する文書部品を選択して表示する文書部品表示手段
を具備することを特徴とする情報処理システム。 A document acquisition means for acquiring a document;
Document part extraction means for extracting document parts constituting the document acquired by the document acquisition means;
An information processing system comprising: document part display means for selecting and displaying a document part to be displayed according to the degree of similarity between the document parts extracted by the document part extraction means.
ことを特徴とする請求項1または2に記載の情報処理システム。 The document part display means displays the document part located on the display surface side among the duplicate document parts when the display is duplicated between the document parts extracted by the document part extraction means. The information processing system according to claim 1 or 2.
前記検索語受付手段によって受け付けた検索語に基づいて、文書を検索する第一の文書検索手段と、
前記第一の文書検索手段によって検索した文書内の検索語に関連する文書部品を抽出する関連文書部品抽出手段と、
前記関連文書部品抽出手段によって抽出した文書部品に基づいて、文書を検索する第二の文書検索手段
を具備することを特徴とする情報処理システム。 A search word receiving means for receiving a search word for searching for a document;
First document search means for searching for a document based on the search word received by the search word receiving means;
Related document part extraction means for extracting a document part related to a search term in the document searched by the first document search means;
An information processing system comprising: second document search means for searching for a document based on the document parts extracted by the related document part extraction means.
文書の検索方法を指定する検索方法指定手段と、
前記検索方法指定手段によって指定された検索方法が画像を用いた検索である場合は、前記文書記憶手段によって記憶された文書から文書を構成する文書部品を抽出する文書部品抽出手段と、
前記文書部品抽出手段によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う文書部品表示手段と、
前記文書部品表示手段によって表示された文書部品を操作者の操作に応じて、検索の画像として受け付ける検索画像受付手段と、
前記検索画像受付手段によって受け付けた検索の画像を、前記文書記憶手段内を検索する画像検索手段と、
前記画像検索手段によって検索した文書を表示する文書表示手段
を具備することを特徴とする情報処理システム。 Document storage means for storing a document to be searched;
A search method specifying means for specifying a document search method;
If the search method specified by the search method specifying means is a search using an image, a document part extracting means for extracting a document part constituting the document from the document stored by the document storage means;
A document part display means for displaying the document part by transforming the document part extracted by the document part extraction means according to a display screen;
A search image receiving means for receiving a document part displayed by the document part display means as a search image according to an operation of an operator;
An image search means for searching the document storage means for a search image received by the search image receiving means;
An information processing system comprising document display means for displaying a document searched by the image search means.
文書を取得する文書取得機能と、
前記文書取得機能によって取得した文書を構成する文書部品を抽出する文書部品抽出機能と、
前記文書部品抽出機能によって抽出した文書部品を表示画面に応じて変形して、該文書部品の表示を行う文書部品表示機能
を実現させることを特徴とする情報処理プログラム。 On the computer,
A document acquisition function for acquiring a document;
A document part extraction function for extracting a document part constituting a document acquired by the document acquisition function;
An information processing program that realizes a document part display function for deforming a document part extracted by the document part extraction function according to a display screen and displaying the document part.
文書を取得する文書取得機能と、
前記文書取得機能によって取得した文書を構成する文書部品を抽出する文書部品抽出機能と、
前記文書部品抽出機能によって抽出した文書部品間の類似している度合いに応じて、表示する文書部品を選択して表示する文書部品表示機能
を実現させることを特徴とする情報処理プログラム。 On the computer,
A document acquisition function for acquiring a document;
A document part extraction function for extracting a document part constituting a document acquired by the document acquisition function;
An information processing program for realizing a document part display function for selecting and displaying a document part to be displayed according to the degree of similarity between the document parts extracted by the document part extraction function.
文書を検索する場合の検索語を受け付ける検索語受付機能と、
前記検索語受付機能によって受け付けた検索語に基づいて、文書を検索する第一の文書検索機能と、
前記第一の文書検索機能によって検索した文書内の検索語に関連する文書部品を抽出する関連文書部品抽出機能と、
前記関連文書部品抽出機能によって抽出した文書部品に基づいて、文書を検索する第二の文書検索機能
を実現させることを特徴とする情報処理プログラム。 On the computer,
A search word reception function for receiving a search word when searching a document,
A first document search function for searching for a document based on a search word received by the search word reception function;
A related document part extraction function for extracting a document part related to a search term in the document searched by the first document search function;
An information processing program for realizing a second document search function for searching for a document based on the document part extracted by the related document part extraction function.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006261965A JP2008083898A (en) | 2006-09-27 | 2006-09-27 | Information processing system and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006261965A JP2008083898A (en) | 2006-09-27 | 2006-09-27 | Information processing system and information processing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008083898A true JP2008083898A (en) | 2008-04-10 |
Family
ID=39354735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006261965A Pending JP2008083898A (en) | 2006-09-27 | 2006-09-27 | Information processing system and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008083898A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010108453A (en) * | 2008-10-31 | 2010-05-13 | Internatl Business Mach Corp <Ibm> | Document component management device and method, and program |
WO2019013385A1 (en) * | 2017-07-14 | 2019-01-17 | (주)인터버드 | Method for searching for semiconductor component by using last alphabet letter removal algorithm |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029906A (en) * | 1998-05-08 | 2000-01-28 | Ricoh Co Ltd | System for managing document information |
JP2001297090A (en) * | 2000-04-13 | 2001-10-26 | Konica Corp | Image data retrieval method, image display method, data retrieval system, image editing device and computer readable storage medium |
JP2004151899A (en) * | 2002-10-29 | 2004-05-27 | Fuji Xerox Co Ltd | Information providing method, information provision processing system and its program |
JP2005107931A (en) * | 2003-09-30 | 2005-04-21 | Ricoh Co Ltd | Image search apparatus |
JP2005339278A (en) * | 2004-05-27 | 2005-12-08 | Fuji Xerox Co Ltd | Document processor, document processing method and document processing program |
JP2006146628A (en) * | 2004-11-22 | 2006-06-08 | Hitachi Ltd | Method and apparatus for retrieving document by content image |
-
2006
- 2006-09-27 JP JP2006261965A patent/JP2008083898A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000029906A (en) * | 1998-05-08 | 2000-01-28 | Ricoh Co Ltd | System for managing document information |
JP2001297090A (en) * | 2000-04-13 | 2001-10-26 | Konica Corp | Image data retrieval method, image display method, data retrieval system, image editing device and computer readable storage medium |
JP2004151899A (en) * | 2002-10-29 | 2004-05-27 | Fuji Xerox Co Ltd | Information providing method, information provision processing system and its program |
JP2005107931A (en) * | 2003-09-30 | 2005-04-21 | Ricoh Co Ltd | Image search apparatus |
JP2005339278A (en) * | 2004-05-27 | 2005-12-08 | Fuji Xerox Co Ltd | Document processor, document processing method and document processing program |
JP2006146628A (en) * | 2004-11-22 | 2006-06-08 | Hitachi Ltd | Method and apparatus for retrieving document by content image |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010108453A (en) * | 2008-10-31 | 2010-05-13 | Internatl Business Mach Corp <Ibm> | Document component management device and method, and program |
WO2019013385A1 (en) * | 2017-07-14 | 2019-01-17 | (주)인터버드 | Method for searching for semiconductor component by using last alphabet letter removal algorithm |
KR101945234B1 (en) * | 2017-07-14 | 2019-02-08 | (주)인터버드 | Method for Searching Semiconductor Parts Using Algorithm of Eliminating Last Alphabet |
CN109643306A (en) * | 2017-07-14 | 2019-04-16 | 网鸟株式会社 | Use a kind of semiconductor element searching method of the algorithm of removal the last letter |
JP2019523461A (en) * | 2017-07-14 | 2019-08-22 | インターバード カンパニー,リミテッド | Semiconductor component search method using last alphabet removal algorithm |
US10789245B2 (en) | 2017-07-14 | 2020-09-29 | Interbird Co., Ltd. | Semiconductor parts search method using last alphabet deletion algorithm |
CN109643306B (en) * | 2017-07-14 | 2022-12-06 | 网鸟株式会社 | Semiconductor element searching method using algorithm for removing last letter |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7930634B2 (en) | Document display apparatus and document display program | |
US8201072B2 (en) | Image forming apparatus, electronic mail delivery server, and information processing apparatus | |
US8494281B2 (en) | Automated method and system for retrieving documents based on highlighted text from a scanned source | |
US9690787B2 (en) | Contents management system, contents management method, and computer program | |
CN100382096C (en) | Document scanner | |
US8482808B2 (en) | Image processing apparatus and method for displaying a preview of scanned document data | |
CN1716253B (en) | Method and apparatus for retrieving data | |
GB2556174A (en) | Methods and systems for generating virtual reality environments from electronic documents | |
US20070279437A1 (en) | Method and apparatus for displaying document image, and information processing device | |
JP2008234148A (en) | Document display, document display method, and document display program | |
JP2008192055A (en) | Content search method and content search apparatus | |
JP2008108200A (en) | Information extraction device, method, program and storage medium | |
JP2007317034A (en) | Image processing apparatus, image processing method, program, and recording medium | |
JP4745726B2 (en) | File management apparatus, control method therefor, computer program, and computer-readable storage medium | |
JP2011039580A (en) | Device and method for processing document, and program | |
JP2006189924A (en) | Image display program and image display apparatus | |
JP5345963B2 (en) | Method for generating tag data to search for images | |
US20080170084A1 (en) | Information processing apparatus, information display method, and information display program product | |
JP2008083898A (en) | Information processing system and information processing program | |
JP4830763B2 (en) | Image processing system and image processing program | |
CN100588218C (en) | Image forming apparatus and electronic mail delivery server, | |
JP2007026279A (en) | Object editing device, method and program | |
JP2008071311A (en) | Image retrieval apparatus, image retrieval method, image retrieval program, and information storage medium | |
US8059138B2 (en) | Image processing and arranging system, image processing and arranging method, and computer readable medium for image processing and arranging | |
JP4765831B2 (en) | Image processing system and image processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110602 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120313 |