JP2006277089A - Document processor - Google Patents

Document processor Download PDF

Info

Publication number
JP2006277089A
JP2006277089A JP2005092501A JP2005092501A JP2006277089A JP 2006277089 A JP2006277089 A JP 2006277089A JP 2005092501 A JP2005092501 A JP 2005092501A JP 2005092501 A JP2005092501 A JP 2005092501A JP 2006277089 A JP2006277089 A JP 2006277089A
Authority
JP
Japan
Prior art keywords
document
information
character string
matching
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005092501A
Other languages
Japanese (ja)
Other versions
JP4682663B2 (en
Inventor
Natsumi Miyazawa
なつみ 宮澤
Toshiyuki Yamada
俊之 山田
Hiroshi Shinoda
浩 信太
Masato Saito
真人 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005092501A priority Critical patent/JP4682663B2/en
Publication of JP2006277089A publication Critical patent/JP2006277089A/en
Application granted granted Critical
Publication of JP4682663B2 publication Critical patent/JP4682663B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a document processor capable of enhancing user convenience. <P>SOLUTION: The document processor processes documents each containing character information, and specifies a portion matching a designated search character string from the character information contained in each document. Information specifying the portion matching the search character string is held as matching portion specification information in association with the documents. When at least a portion of each document to be processed is displayed as a list, a predetermined display process based on the matching portion specification information held in association with each document is implemented. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、文字情報を含むドキュメントを処理するドキュメント処理装置に関する。   The present invention relates to a document processing apparatus that processes a document including character information.

文字コードデータを含むドキュメントについて、文書の概要を把握するために、当該電子文書の一部を表示させることは広く行われている。この技術によれば、電子文書の内容を全て表示させることなく、文書の概要を利用者が容易に把握できる。   In order to grasp the outline of a document including character code data, a part of the electronic document is widely displayed. According to this technology, the user can easily grasp the outline of the document without displaying all the contents of the electronic document.

また、ドキュメントのサムネイルを作成して、当該サムネイルの一覧を表示し、ドキュメントの選択を支援することも広く行われている(例えば特許文献1)。このとき、指定した検索キーワードを含むドキュメントのサムネイルだけを一覧表示することも行われている。
特開2004−356831号公報
In addition, it is widely performed that a thumbnail of a document is created, a list of the thumbnails is displayed, and document selection is supported (for example, Patent Document 1). At this time, only thumbnails of documents including the specified search keyword are displayed as a list.
JP 2004-356831 A

しかしながら、上記従来の技術においては、指定した検索キーワードを含むドキュメントについて、そのサムネイルの一覧が表示されるだけであり、実際に検索キーワードがどこに含まれているかは、一旦、各ドキュメントの内容を表示させてから行うこととなり、利便性が低い。   However, in the above conventional technique, only a list of thumbnails is displayed for documents including the specified search keyword, and the contents of each document are displayed once to determine where the search keyword is actually included. It will be done after letting it go, and convenience is low.

本発明は、上記実情に鑑みてなされたもので、その目的の一つは、利用者の利便性を向上できるドキュメント処理装置を提供することにある。   The present invention has been made in view of the above circumstances, and one of its purposes is to provide a document processing apparatus capable of improving user convenience.

上記従来例の問題点を解決するための本発明は、ドキュメント処理装置であって、文字情報を含むドキュメントを処理対象として、当該ドキュメントに包含される文字情報から、指定された検索文字列に合致する部分を特定する手段と、検索文字列に合致する部分を特定する情報を、合致部分特定情報として前記ドキュメントに関連づけて保持する手段と、を含み、前記処理対象となったドキュメントの少なくとも一部を一覧表示する際に、各ドキュメントに関連付けて保持されている、合致部分特定情報に基づく所定の表示処理が行われることを特徴としている。   The present invention for solving the problems of the conventional example described above is a document processing apparatus, which processes a document including character information as a processing target and matches a specified search character string from character information included in the document. Means for identifying a portion to be matched, and means for retaining information for identifying a portion matching the search character string in association with the document as matching portion identification information, and at least a part of the document to be processed Is displayed in a list, a predetermined display process based on the matching portion specifying information held in association with each document is performed.

ここで前記処理対象となったドキュメントが、前記文字情報を画像データとして含む場合には、当該画像データのうち、文字情報を含む領域を特定し、当該特定した領域について文字認識処理を実行して文字列データを生成し、当該文字列データを利用して、前記検索文字列に合致する部分を特定する処理を行うこととしてもよい。   Here, when the document to be processed includes the character information as image data, an area including the character information is specified in the image data, and character recognition processing is executed on the specified area. It is also possible to generate character string data and use the character string data to perform processing for specifying a portion that matches the search character string.

さらに、本発明の一態様に係るドキュメント処理方法は、文字情報を含むドキュメントを処理対象として、当該ドキュメントに包含される文字情報から、指定された検索文字列に合致する部分を特定する工程と、検索文字列に合致する部分を特定する情報を、合致部分特定情報として前記ドキュメントに関連づけて保持する工程と、を実行し、前記処理対象となったドキュメントの少なくとも一部を一覧表示する際に、各ドキュメントに関連付けて保持されている、合致部分特定情報に基づく所定の表示処理が行われることを特徴としている。   Furthermore, the document processing method according to an aspect of the present invention includes a step of specifying a portion that matches a specified search character string from character information included in the document, with a document including character information as a processing target. When the information that identifies the part that matches the search character string is stored in association with the document as matched part specifying information, and when displaying at least a part of the document that is the processing target, It is characterized in that a predetermined display process based on the matching part specifying information held in association with each document is performed.

さらに本発明の別の態様に係るプログラムは、コンピュータに、文字情報を含むドキュメントを処理対象として、当該ドキュメントに包含される文字情報から、指定された検索文字列に合致する部分を特定する手順と、検索文字列に合致する部分を特定する情報を、合致部分特定情報として前記ドキュメントに関連づけて保持する手順と、前記処理対象となったドキュメントの少なくとも一部を一覧表示する際に、各ドキュメントに関連付けて保持されている、合致部分特定情報に基づく所定の表示処理を行う手順と、を実行させることを特徴としている。   Furthermore, a program according to another aspect of the present invention includes a procedure for identifying a part that matches a specified search character string from character information included in the document, using a document including character information as a processing target. A procedure for storing information for identifying a portion matching the search character string in association with the document as matching portion identification information, and when displaying at least a part of the document to be processed as a list. And a procedure for performing a predetermined display process based on the matching portion specifying information held in association with each other.

本発明の好適な実施の形態について、図面を参照しながら説明する。本発明の実施の形態に係るドキュメント処理装置は、図1に示すように、制御部11と、記憶部12と、画像読取部13と、表示部14と、操作部15とを含んで構成されている。   A preferred embodiment of the present invention will be described with reference to the drawings. As shown in FIG. 1, the document processing apparatus according to the embodiment of the present invention includes a control unit 11, a storage unit 12, an image reading unit 13, a display unit 14, and an operation unit 15. ing.

ここで、制御部11は、例えばCPU等で構成されており、記憶部12に格納されているプログラムに従って動作する。この制御部11は、文字情報を含むドキュメントを処理対象として、当該ドキュメントに包含される文字情報から、指定された検索文字列のそれぞれに合致する部分を特定する検索処理を実行し、各検索文字列ごとに、合致する部分を特定する情報を、合致部分特定情報としてドキュメントに関連づけて保持させる。そして、処理対象となったドキュメントの少なくとも一部を一覧表示する際に、各ドキュメントに関連付けて保持されている、合致部分特定情報に基づく所定の表示処理(一覧表示処理)を実行する。この制御部11の処理の内容については、後に詳しく述べる。   Here, the control part 11 is comprised, for example with CPU etc., and operate | moves according to the program stored in the memory | storage part 12. FIG. The control unit 11 executes a search process for specifying a part matching each of the designated search character strings from the character information included in the document, with the document including the character information as a processing target. For each column, information for identifying a matching part is held in association with the document as matching part specifying information. Then, when displaying at least a part of the document to be processed as a list, a predetermined display process (list display process) based on the matching part specifying information held in association with each document is executed. The details of the processing of the control unit 11 will be described in detail later.

記憶部12は、RAMやROM等のメモリ素子及び/又はディスクデバイスなどを含んで構成されている。この記憶部12には、制御部11によって実行されるプログラムが格納されている。また、記憶部12は、制御部11のワークメモリとしても動作する。   The storage unit 12 includes a memory element such as a RAM and a ROM and / or a disk device. The storage unit 12 stores a program executed by the control unit 11. The storage unit 12 also operates as a work memory for the control unit 11.

画像読取部13は、例えばスキャナ等であり、媒体に形成されている画像を読み取って得られた画像データを制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11からの指示に従って、情報の表示を行う。操作部15は、キーボードやマウス等であり、利用者の指示操作を受け付けて、当該指示操作の内容を制御部11に出力する。   The image reading unit 13 is a scanner or the like, for example, and outputs image data obtained by reading an image formed on a medium to the control unit 11. The display unit 14 is a display or the like, and displays information according to an instruction from the control unit 11. The operation unit 15 is a keyboard, a mouse, or the like, receives a user's instruction operation, and outputs the content of the instruction operation to the control unit 11.

[ドキュメントの生成]
ここで制御部11の具体的な処理の内容について説明する。本実施の形態では、処理対象となるドキュメントは、例えば画像読取部13にて読み取られて入力される。なお、ドキュメントは複数のページを含んでもよい。
[Generate Document]
Here, the specific processing contents of the control unit 11 will be described. In the present embodiment, a document to be processed is read and input by, for example, the image reading unit 13. Note that the document may include a plurality of pages.

すなわち制御部11は、ページごとの画像データのセットを画像読取部13から受け入れて、各画像データに対して分離処理を実行する。この分離処理では、まず画像データを、輝度のしきい値で二値化した上で、黒画素の連続する部分(画素塊)を特定し、それぞれにラベルを付与する。この処理は、ラベリング処理として広く知られている処理を用いることができる。   That is, the control unit 11 receives a set of image data for each page from the image reading unit 13 and executes a separation process on each image data. In this separation process, first, image data is binarized with a threshold value of luminance, a continuous portion (pixel block) of black pixels is specified, and a label is assigned to each. For this process, a process widely known as a labeling process can be used.

そして各特定した画素塊に外接する外接矩形を画定し、当該外接矩形が画像データ上で連続的に配列されている領域を、文字情報を含む領域として特定する。制御部11は、さらに当該特定した領域に対して文字認識処理を実行し、各外接矩形内の文字画像ごとに、認識処理結果としての文字コードデータを生成する。   A circumscribed rectangle circumscribing each identified pixel block is defined, and an area in which the circumscribed rectangle is continuously arranged on the image data is identified as an area including character information. The control unit 11 further executes character recognition processing on the identified area, and generates character code data as a recognition processing result for each character image in each circumscribed rectangle.

これらの処理は、レイアウト認識、光学的文字認識(OCR)として広く知られた処理であるので、その詳細な説明を省略する。本実施の形態において特徴的なことの一つは、文字認識処理の結果である文字コードデータごとに、文字画像に対応する外接矩形の座標情報(以下、対応座標情報と呼ぶ)を関連付けて記憶させることである。   Since these processes are widely known as layout recognition and optical character recognition (OCR), detailed description thereof is omitted. One of the characteristic features of this embodiment is that the coordinate information of the circumscribed rectangle corresponding to the character image (hereinafter referred to as the corresponding coordinate information) is stored in association with each character code data that is the result of the character recognition process. It is to let you.

制御部11は、また、レイアウト認識の処理によって文字情報を含む領域として特定された領域内の上記外接矩形について、元の画像データ上で、各外接矩形内の画素塊に対応する各画素を、その周辺画素値に基づいて変更する。例えば、元の画像データの各画素をラスタスキャン順に走査する。そして、走査により選択される注目画素が上記画素塊に対応する画素でなければ、当該注目画素の画素値をそのままとするとともに、当該注目画素の画素値を直前画素値として記憶する。   The control unit 11 also sets each pixel corresponding to the pixel block in each circumscribed rectangle on the original image data for the circumscribed rectangle in the region identified as the region including the character information by the layout recognition process. It changes based on the surrounding pixel values. For example, each pixel of the original image data is scanned in the raster scan order. If the target pixel selected by scanning is not a pixel corresponding to the pixel block, the pixel value of the target pixel is left as it is, and the pixel value of the target pixel is stored as the previous pixel value.

また、走査により選択される注目画素が上記画素塊に対応する画素である場合、当該注目画素の画素値を、記憶している直前画素値に設定する。これにより画素塊に対応する画素の値が、ラスタスキャン順に直前画素値と同一になる。このようにして生成された画像は、絵柄部分を含むものとなるので、以下、絵柄画像と呼ぶ。   When the pixel of interest selected by scanning is a pixel corresponding to the pixel block, the pixel value of the pixel of interest is set to the immediately preceding pixel value stored. As a result, the value of the pixel corresponding to the pixel block becomes the same as the previous pixel value in the raster scan order. Since the image generated in this manner includes a pattern portion, it is hereinafter referred to as a pattern image.

さらに制御部11は、元の画像データ上で外接矩形内の画素塊ごとに代表色を決定し、当該代表色と、画素塊の形状(二値化された有意画素のパターン)と、外接矩形の元の画像データ上での座標情報とを関連付けた文字画像を生成し、文字列データと、絵柄画像と、この文字画像とを関連付けて記憶部12に、ドキュメントのデータとして格納する。この記憶部12に格納されたデータは、文字と絵柄とを分離した画像と、文字の部分を認識して得た文字列データとを含むデータである。   Further, the control unit 11 determines a representative color for each pixel block in the circumscribed rectangle on the original image data, the representative color, the shape of the pixel block (binarized significant pixel pattern), and the circumscribed rectangle. A character image in which the coordinate information on the original image data is associated is generated, and the character string data, the pattern image, and the character image are associated with each other and stored in the storage unit 12 as document data. The data stored in the storage unit 12 is data including an image obtained by separating a character and a pattern, and character string data obtained by recognizing a character portion.

なお、ここでは文字画像について、外接矩形ごとに代表色を決定する例について述べたが、これに代えて、例えばMRC(Mixed Raster Content)のように、文字画像を、文字の色を表すフォアグラウンド画像と、フォアグラウンド画像のマスクとなるセレクタとの二層に分離してもよい。この場合、絵柄画像をバックグラウンド画像として、バックグラウンド画像、フォアグラウンド画像、セレクタ、及び文字列データを互いに関連付けた多層フォーマットのドキュメントとして記憶部12に保持させる。   Although an example in which a representative color is determined for each circumscribed rectangle has been described here for a character image, the character image is replaced with a foreground image representing the character color, for example, as in MRC (Mixed Raster Content). And a selector serving as a mask for the foreground image. In this case, the pattern image is used as a background image, and the background image, the foreground image, the selector, and the character string data are stored in the storage unit 12 as a document in a multilayer format associated with each other.

制御部11は、画像読取部13から入力される画像が複数のページに亘る場合は、各ページごとに、絵柄画像、文字画像(MRCの場合、二層となる)、及び文字列データを生成して、互いに関連付けて保持する。   When the image input from the image reading unit 13 covers a plurality of pages, the control unit 11 generates a pattern image, a character image (in the case of MRC, two layers), and character string data for each page. And hold them in association with each other.

なお、MRCは、ITU−T勧告T.44として規格化されているフォーマットであるので、詳しい説明を省略する。   MRC is an ITU-T recommendation T.30. Since the format is standardized as 44, detailed description is omitted.

さらに、本実施の形態の制御部11は、一覧表示のために、元の画像データを縮小処理して、所定のサイズ以下のサムネイル画像を生成する。なお、複数のページがある場合は、最初のページのサムネイル画像のみを生成してもよいし、各ページのサムネイル画像を生成してもよい。生成したサムネイル画像のデータは、ドキュメントに関連付けて記憶部12に格納しておく。   Further, the control unit 11 according to the present embodiment reduces the original image data to generate thumbnail images having a predetermined size or less for list display. When there are a plurality of pages, only the thumbnail image of the first page may be generated, or the thumbnail image of each page may be generated. The generated thumbnail image data is stored in the storage unit 12 in association with the document.

[検索処理]
制御部11は、利用者から検索キーワードが入力されると、当該検索キーワードを指定された検索文字列として、記憶部12に格納されている各ドキュメントの各ページの文字列データから当該指定された検索文字列に合致する部分を検索する。
[Search processing]
When a search keyword is input from the user, the control unit 11 specifies the search keyword as the specified search character string from the character string data of each page of each document stored in the storage unit 12. Search for the part that matches the search string.

そして、検索文字列に合致する部分が見いだされると、当該部分を特定する合致部分特定情報を生成し、ドキュメントのデータに関連付けて保持する。合致部分特定情報は、例えばページ上での検索文字列に合致する部分の各外接矩形の座標値のセット(座標情報)とすればよい。例えば制御部11は、図2に示すように、検索文字列(A)と、座標情報(B)とを関連付けたエントリを含む検索結果データを、ページごとに生成し、対応するページの絵柄画像や文字画像等に関連付けて、記憶部12に格納する。また制御部11は、検索結果データをページごとに生成するのではなく、ページと外接矩形の座標値のセットとを関連付けて座標情報を生成し、検索文字列(A)と、ページの情報を含む座標情報(B)とを関連付けたエントリを含む検索結果データを生成して、ドキュメントのデータ全体に関連付けて保持するようにしてもよい。   When a portion matching the search character string is found, matching portion specifying information for specifying the portion is generated and stored in association with document data. The matching part specifying information may be, for example, a set of coordinate values (coordinate information) of each circumscribed rectangle of the part that matches the search character string on the page. For example, as shown in FIG. 2, the control unit 11 generates search result data including an entry in which the search character string (A) and the coordinate information (B) are associated with each other, and the pattern image of the corresponding page. And stored in the storage unit 12 in association with a character image or the like. In addition, the control unit 11 does not generate search result data for each page, but generates coordinate information by associating a page with a set of coordinate values of a circumscribed rectangle, and generates a search character string (A) and page information. Search result data including an entry associated with the coordinate information (B) that is included may be generated and associated with the entire document data.

また、制御部11は、検索文字列に合致する部分が見いだされなかったドキュメントについては、検索結果データを生成しない。   Further, the control unit 11 does not generate search result data for a document in which a portion matching the search character string is not found.

ここでドキュメントのデータと検索結果データとの関連付けは、ドキュメントのデータがMRC等の多層フォーマットとなっている場合、検索結果データを一つの層として含めることによって行うことができる。   Here, the association between the document data and the search result data can be performed by including the search result data as one layer when the document data is in a multi-layer format such as MRC.

[一覧表示処理]
制御部11は、検索結果データに基づいて、各ドキュメントのサムネイル画像を加工し、修正サムネイル画像を生成する。
[List display processing]
The control unit 11 processes the thumbnail image of each document based on the search result data, and generates a corrected thumbnail image.

例えば制御部11は、検索結果データが関連づけられているドキュメントを表示対象ドキュメントとして、表示対象ドキュメントごとに、次の処理を行う。制御部11は、表示対象ドキュメントの一つを注目ドキュメントとして、そのサムネイル画像を読み出す。また、注目ドキュメントのデータに関連づけられている検索結果を読み出して、各エントリの座標情報を読み出す。制御部11は、読み出した座標情報のうち、例えばY座標値(ドキュメントの縦方向の座標値)に対して元のドキュメントに対するサムネイル画像の縮小比rを乗じて、サムネイル上でのY座標値を演算する。そして例えば図3に示すように、サムネイル画像の右端に隣接して、当該座標値によって表される位置に、所定色(例えば黄色)の矩形(P)を描画する。この描画された矩形は、あたかもサムネイル画像に付された付箋のように表示されることとなる。制御部11は、各表示対象ドキュメントについて、上述の処理を繰り返して行い、表示対象ドキュメントの各々についてのサムネイル画像に「付箋」の画像を付加する。   For example, the control unit 11 uses the document associated with the search result data as a display target document, and performs the following processing for each display target document. The control unit 11 reads out a thumbnail image of one of the display target documents as a target document. Further, the search result associated with the data of the document of interest is read out, and the coordinate information of each entry is read out. The control unit 11 multiplies the Y coordinate value on the thumbnail by multiplying, for example, the Y coordinate value (the vertical coordinate value of the document) by the reduction ratio r of the thumbnail image with respect to the original document among the read coordinate information. Calculate. For example, as shown in FIG. 3, a rectangle (P) of a predetermined color (for example, yellow) is drawn at a position represented by the coordinate value adjacent to the right end of the thumbnail image. The drawn rectangle is displayed as if it were a tag attached to the thumbnail image. The control unit 11 repeats the above-described processing for each display target document, and adds a “tag” image to the thumbnail image for each display target document.

制御部11は、こうして「付箋」を付加したサムネイル画像を例えばマトリクス状に配列して表示する。また、このとき制御部11は、検索結果データに含まれるエントリの数(検索文字列に合致する部分の数、つまり検索のヒット数)をカウントし、カウントの結果に基づいてドキュメントのサムネイル画像の表示順序を並べ替えて表示してもよい。   The control unit 11 displays the thumbnail images to which the “sticky notes” are added in this manner arranged in a matrix, for example. At this time, the control unit 11 counts the number of entries included in the search result data (the number of portions matching the search character string, that is, the number of search hits), and the thumbnail image of the document is based on the count result. The display order may be rearranged and displayed.

また制御部11は、検索結果データに、表示するサムネイル画像に対応するページに係る座標情報が含まれる場合は、当該座標情報(各外接矩形に対応する座標情報)に対して元のドキュメントに対するサムネイル画像の縮小比rを乗じて、サムネイル画像上での座標情報を演算し、当該演算結果の位置を強調する所定処理を行ってもよい。ここで強調の処理としては、例えば赤色の枠を描画し、あるいは、所定色の塗りつぶし矩形を半透明合成(合成対象となる画素値のうち輝度の低い側を残しつつ合成するなど)する。   In addition, when the search result data includes coordinate information related to the page corresponding to the thumbnail image to be displayed, the control unit 11 performs a thumbnail for the original document with respect to the coordinate information (coordinate information corresponding to each circumscribed rectangle). Multiplying by the image reduction ratio r may be used to calculate the coordinate information on the thumbnail image and to perform a predetermined process for enhancing the position of the calculation result. Here, as the emphasis processing, for example, a red frame is drawn, or a filled rectangle of a predetermined color is semitransparently synthesized (synthesized while leaving the low luminance side among the pixel values to be synthesized).

さらに制御部11は、利用者によりマウスポインタの移動操作が行われると、移動後の位置を参照して、いずれかのサムネイル画像上にマウスポインタが位置しているか否かを調べる。そして、いずれかのサムネイル画像上にマウスポインタが位置している場合には、検索結果データに含まれるエントリの少なくとも一部を文字列として表示する。この表示は例えば、各サムネイル画像にオーバレイするウインドウ画像Wを表示し、当該ウインドウ画像上に文字列を描画することで行うことができる(図4(a))。   Further, when the user performs an operation of moving the mouse pointer, the control unit 11 refers to the position after the movement and checks whether the mouse pointer is positioned on any thumbnail image. If the mouse pointer is positioned on any thumbnail image, at least a part of the entries included in the search result data is displayed as a character string. This display can be performed, for example, by displaying an overlay window image W on each thumbnail image and drawing a character string on the window image (FIG. 4A).

また、制御部11は、ここで描画する文字列として、各ページごとのエントリの数をカウントした結果としてもよい。例えば図4(b)に示すように、合計数を併せて表示し、「ヒット数合計:3個、2ページ目1個…」などとして表示することしてもよい。   Moreover, the control part 11 is good also as a result of counting the number of entries for each page as a character string drawn here. For example, as shown in FIG. 4B, the total number may be displayed together, and may be displayed as “total number of hits: three, one on the second page, etc.”.

本実施の形態によると、指定した検索文字列を含むドキュメントについて、そのサムネイル画像の表示の際に、どの位置にあるのかを表す画像(付箋や強調表示)などの表示を併せて行うので、利用者の利便性を向上できる。   According to the present embodiment, when a thumbnail image is displayed for a document including a specified search character string, an image indicating a position (such as a tag or highlight) is also displayed. User convenience can be improved.

本発明の実施の形態に係るドキュメント処理装置の一例を表す構成ブロック図である。1 is a configuration block diagram illustrating an example of a document processing apparatus according to an embodiment of the present invention. 検索結果データの例を表す説明図である。It is explanatory drawing showing the example of search result data. 本発明の実施の形態に係るドキュメント処理装置による一覧表示時のドキュメントのサムネイル画像の例を表す説明図である。It is explanatory drawing showing the example of the thumbnail image of the document at the time of the list display by the document processing apparatus concerning embodiment of this invention. 本発明の実施の形態に係るドキュメント処理装置による、一覧表示時のドキュメントの表示例を表す図である。It is a figure showing the example of a display of the document at the time of the list display by the document processing apparatus concerning embodiment of this invention.

符号の説明Explanation of symbols

11 制御部、12 記憶部、13 画像読取部、14 表示部、15 操作部。
11 control unit, 12 storage unit, 13 image reading unit, 14 display unit, 15 operation unit.

Claims (4)

文字情報を含むドキュメントを処理対象として、当該ドキュメントに包含される文字情報から、指定された検索文字列に合致する部分を特定する手段と、
検索文字列に合致する部分を特定する情報を、合致部分特定情報として前記ドキュメントに関連づけて保持する手段と、
を含み、
前記処理対象となったドキュメントの少なくとも一部を一覧表示する際に、各ドキュメントに関連付けて保持されている、合致部分特定情報に基づく所定の表示処理が行われることを特徴とするドキュメント処理装置。
A means for processing a document including character information as a processing target, and identifying a portion that matches a specified search character string from character information included in the document;
Means for associating information specifying a portion matching the search character string with the document as matched portion specifying information;
Including
A document processing apparatus, wherein when displaying at least a part of the document to be processed as a list, a predetermined display process based on matching part specifying information held in association with each document is performed.
請求項1に記載のドキュメント処理装置であって、
前記処理対象となったドキュメントが、前記文字情報を画像データとして含む場合には、当該画像データのうち、文字情報を含む領域を特定し、当該特定した領域について文字認識処理を実行して文字列データを生成し、当該文字列データを利用して、前記検索文字列に合致する部分を特定する処理を行うことを特徴とするドキュメント処理装置。
The document processing apparatus according to claim 1,
When the document to be processed includes the character information as image data, an area including the character information is specified in the image data, and character recognition processing is performed on the specified area to execute a character string. A document processing apparatus that performs processing for generating data and specifying a portion that matches the search character string using the character string data.
文字情報を含むドキュメントを処理対象として、当該ドキュメントに包含される文字情報から、指定された検索文字列に合致する部分を特定する工程と、
検索文字列に合致する部分を特定する情報を、合致部分特定情報として前記ドキュメントに関連づけて保持する工程と、
を実行し、
前記処理対象となったドキュメントの少なくとも一部を一覧表示する際に、各ドキュメントに関連付けて保持されている、合致部分特定情報に基づく所定の表示処理が行われることを特徴とするドキュメント処理方法。
Specifying a portion that matches a specified search character string from character information included in the document, with a document including character information as a processing target;
Holding information identifying a portion matching the search character string in association with the document as matching portion specifying information;
Run
A document processing method characterized in that when displaying at least a part of a document to be processed as a list, a predetermined display process based on matching part specifying information held in association with each document is performed.
コンピュータに、
文字情報を含むドキュメントを処理対象として、当該ドキュメントに包含される文字情報から、指定された検索文字列に合致する部分を特定する手順と、
検索文字列に合致する部分を特定する情報を、合致部分特定情報として前記ドキュメントに関連づけて保持する手順と、
前記処理対象となったドキュメントの少なくとも一部を一覧表示する際に、各ドキュメントに関連付けて保持されている、合致部分特定情報に基づく所定の表示処理を行う手順と、
を実行させることを特徴とするプログラム。
On the computer,
A procedure for specifying a portion that matches a specified search character string from character information included in the document, with a document including character information as a processing target,
A procedure for storing information for identifying a portion matching the search character string in association with the document as matching portion specifying information;
A procedure for performing a predetermined display process based on the matching part specifying information held in association with each document when displaying a list of at least a part of the documents to be processed;
A program characterized by having executed.
JP2005092501A 2005-03-28 2005-03-28 Document processing device Expired - Fee Related JP4682663B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005092501A JP4682663B2 (en) 2005-03-28 2005-03-28 Document processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005092501A JP4682663B2 (en) 2005-03-28 2005-03-28 Document processing device

Publications (2)

Publication Number Publication Date
JP2006277089A true JP2006277089A (en) 2006-10-12
JP4682663B2 JP4682663B2 (en) 2011-05-11

Family

ID=37211818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005092501A Expired - Fee Related JP4682663B2 (en) 2005-03-28 2005-03-28 Document processing device

Country Status (1)

Country Link
JP (1) JP4682663B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008305088A (en) * 2007-06-06 2008-12-18 Konica Minolta Business Technologies Inc Document processor, document processing method, and document processing program
JP2010211466A (en) * 2009-03-10 2010-09-24 Canon Inc Image processing apparatus, image processing method, and program

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03260768A (en) * 1990-03-09 1991-11-20 Fuji Electric Co Ltd Key word emphasis display device
JPH07319880A (en) * 1994-05-20 1995-12-08 Fujitsu Ltd Keyword extraction/retrieval device
JPH1125077A (en) * 1997-06-30 1999-01-29 Canon Inc Device, system and method for managing document
JP2000148739A (en) * 1998-11-17 2000-05-30 Fujitsu Ltd Text editing device
JP2000339327A (en) * 1999-05-27 2000-12-08 Ricoh Co Ltd System for operating thumbnail image
JP2001337993A (en) * 2000-05-30 2001-12-07 Fujitsu Ltd Retrieval device and method for retrieving information by use of character recognition result
JP2004086621A (en) * 2002-08-27 2004-03-18 Casio Comput Co Ltd Electronic device, display control method, program, and recording medium
JP2004252843A (en) * 2003-02-21 2004-09-09 Canon Inc Image processing method
JP2005004724A (en) * 2003-05-20 2005-01-06 Canon Inc Image processing apparatus, control method and program thereof

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03260768A (en) * 1990-03-09 1991-11-20 Fuji Electric Co Ltd Key word emphasis display device
JPH07319880A (en) * 1994-05-20 1995-12-08 Fujitsu Ltd Keyword extraction/retrieval device
JPH1125077A (en) * 1997-06-30 1999-01-29 Canon Inc Device, system and method for managing document
JP2000148739A (en) * 1998-11-17 2000-05-30 Fujitsu Ltd Text editing device
JP2000339327A (en) * 1999-05-27 2000-12-08 Ricoh Co Ltd System for operating thumbnail image
JP2001337993A (en) * 2000-05-30 2001-12-07 Fujitsu Ltd Retrieval device and method for retrieving information by use of character recognition result
JP2004086621A (en) * 2002-08-27 2004-03-18 Casio Comput Co Ltd Electronic device, display control method, program, and recording medium
JP2004252843A (en) * 2003-02-21 2004-09-09 Canon Inc Image processing method
JP2005004724A (en) * 2003-05-20 2005-01-06 Canon Inc Image processing apparatus, control method and program thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008305088A (en) * 2007-06-06 2008-12-18 Konica Minolta Business Technologies Inc Document processor, document processing method, and document processing program
JP2010211466A (en) * 2009-03-10 2010-09-24 Canon Inc Image processing apparatus, image processing method, and program

Also Published As

Publication number Publication date
JP4682663B2 (en) 2011-05-11

Similar Documents

Publication Publication Date Title
RU2437152C2 (en) Device to process images, method and computer programme to process images
JP4461769B2 (en) Document retrieval / browsing technique and document retrieval / browsing device
JP2002063215A (en) Method and system for displaying document, computer program and recording medium
JP2009146064A (en) Image processor, image processing method, and program and storage medium thereof
US9558433B2 (en) Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP2007004621A (en) Document management supporting device, and document management supporting method and program
JP2006301695A (en) Document processing device and program
JP2002015280A (en) Device and method for image recognition, and computer- readable recording medium with recorded image recognizing program
JP4682663B2 (en) Document processing device
JP7241506B2 (en) Correction support device and correction support program for optical character recognition results
JP5096989B2 (en) Document processing apparatus and document processing method
US20150254884A1 (en) Information processing apparatus and non-transitory computer readable medium
JP4518212B2 (en) Image processing apparatus and program
EP0759595B1 (en) Document processing system
JP4501731B2 (en) Image processing device
US10853000B2 (en) Image processing apparatus and storage medium
JP2006270589A (en) Information processing device, information processing method, program, and recording medium
JP4492407B2 (en) Image display device, image display method, and image display program
JP7318289B2 (en) Information processing device and program
JP4517822B2 (en) Image processing apparatus and program
US20020031270A1 (en) Image processing apparatus, image processing method, and computer readable storage medium
JP4548062B2 (en) Image processing device
JP4741916B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium storing image processing program for executing the method
JP4810995B2 (en) Image processing apparatus, method, and program

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071112

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees