JP4789516B2 - Document conversion apparatus, document conversion method, and storage medium - Google Patents
Document conversion apparatus, document conversion method, and storage medium Download PDFInfo
- Publication number
- JP4789516B2 JP4789516B2 JP2005174112A JP2005174112A JP4789516B2 JP 4789516 B2 JP4789516 B2 JP 4789516B2 JP 2005174112 A JP2005174112 A JP 2005174112A JP 2005174112 A JP2005174112 A JP 2005174112A JP 4789516 B2 JP4789516 B2 JP 4789516B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- document
- page
- contents
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、文書画像データを所定の文書形式の電子文書に変換する文書変換装置、文書変換方法並びに記憶媒体に関する。 The present invention, document conversion apparatus for converting document image data into an electronic document of a predetermined document format, a storage medium in the document conversion side Honami beauty.
近年、文書変換装置として、複写機等の画像形成装置は、デジタル化により多機能化され、スキャン画像を電子ファイル化し、ネットワークを介して別の装置に送信する能力を持つようになった。ここで、電子ファイル化されるものは、TIFF形式等の単純な画像ファイルや、各ページに全面画像が配置された、ワープロ等の電子文書形式を有する文書ファイルであった。 2. Description of the Related Art In recent years, image forming apparatuses such as copying machines have become multifunctional as a document conversion apparatus, and have the ability to convert a scanned image into an electronic file and transmit it to another apparatus via a network. Here, what is converted into an electronic file is a simple image file such as a TIFF format, or a document file having an electronic document format such as a word processor in which a full image is arranged on each page.
文書変換装置における次の段階として、複数の文書画像データから自動的に目次や索引を作成して電子文書に変換することが検討されている。この目次や索引を有する電子文書への変換方法では、変換対象となる複数の文書画像データからタイトル部分の抽出を行った後、抽出した情報を用いて所望の電子文書形式に変換することが行われる。 As a next stage in the document conversion apparatus, it is considered to automatically create a table of contents and an index from a plurality of document image data and convert them into an electronic document. In this method of converting to an electronic document having a table of contents and an index, after extracting a title portion from a plurality of document image data to be converted, the extracted information is used to convert it into a desired electronic document format. Is called.
このような文書変換装置として、例えば、スキャナ部によって読み込まれた画像の文字認識を行い、認識された文字から原稿の見出しおよびページ番号を抽出し、抽出された見出しをページ順にソートして目次を出力する画像形成装置が知られている(特許文献1参照)。
しかしながら、上記従来の文書変換装置では、所望の電子文書形式に変換されるまで、全ページの画像データを保持する必要があった。このため、記憶リソースに制約のある機器に搭載する場合、以下に掲げる問題が生じた。即ち、記憶装置を増やすことによってコストアップが生じたり、あるいは機器内の記憶リソースに合わせて電子文書のページ数を制限する必要があった。 However, in the conventional document conversion apparatus, it is necessary to hold image data of all pages until conversion into a desired electronic document format. For this reason, when it is mounted on a device with limited storage resources, the following problems occur. That is, increasing the number of storage devices increases the cost, or it is necessary to limit the number of pages in the electronic document according to the storage resources in the device.
また一方では、目次を有する電子文書の使い勝手を向上させることが望まれていた。 On the other hand, it has been desired to improve the usability of an electronic document having a table of contents.
そこで、本発明は、機器内の記憶リソースが限られていても、限られた記憶リソース内で複数の文書画像データから目次データを持つ電子文書への変換を容易に行うことができる文書変換装置、文書変換方法並びに記憶媒体を提供することを目的とする。また、本発明は、目次を有する電子文書の使い勝手を向上できる文書変換装置、文書変換方法並びに記憶媒体を提供することを他の目的とする。 Therefore, the present invention provides a document conversion device that can easily convert a plurality of document image data into an electronic document having table of contents data within the limited storage resource even if the storage resource in the device is limited. , and to provide a storage medium in the document conversion side Honami beauty. Further, the present invention is a document conversion apparatus capable of improving the usability of the electronic document having a table of contents, the other object to provide a storage medium in the document conversion side Honami beauty.
上記目的を達成するために、本発明の文書変換装置は、複数ページで構成される文書画像データを所定の文書形式の電子文書に変換する文書変換装置であって、前記文書画像データから文字領域を抽出する文字領域抽出手段と、前記文書画像データのページを前記電子文書のページデータに変換し、目次の作成に必要となる前記文字領域抽出手段で抽出された文字領域と該文字領域のページ番号とをデータ蓄積手段に保存するデータ変換手段と、前記文書画像データのうちの1ページに対して前記文字領域抽出手段による処理と前記データ変換手段による処理とが実行された時点で、前記変換されたページデータを情報処理装置へ送信する処理を開始するページデータ送信手段と、前記文書画像データの全ページに対して前記文字領域抽出手段による処理と前記データ変換手段による処理とが実行された後、前記データ蓄積手段に保存されている前記文字領域と該文字領域のページ番号とに基づいて目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加する目次データ作成手段と、前記目次データ作成手段により作成された前記リンク情報が付加された目次データを、前記情報処理装置へ送信する目次データ送信手段と、を備え、前記所定の文書形式の電子文書は、前記情報処理装置において、前記ページデータ送信手段で送信された前記ページデータと、前記目次データ送信手段で送信された前記目次データとを結合することによって得られることを特徴とする。 In order to achieve the above object, a document conversion apparatus according to the present invention is a document conversion apparatus that converts document image data composed of a plurality of pages into an electronic document of a predetermined document format, from the document image data to a character region. A character area extracting means for extracting the document image data, converting the page of the document image data into page data of the electronic document, and extracting the character area necessary for creating the table of contents and the page of the character area Data conversion means for storing the number in the data storage means, and when the processing by the character area extraction means and the processing by the data conversion means are executed for one page of the document image data, the conversion Page data transmitting means for starting the process of transmitting the processed page data to the information processing apparatus, and the character region extracting means for all pages of the document image data After the treatment with the processing by the data conversion unit has been performed, to create a table of contents data based on the page number of the character region and the character region stored in said data storage means, further, to the created Table of contents data creation means for adding link information for linking the table of contents data item to the corresponding position in the electronic document to the created table of contents data item, and the link information created by the table of contents data creation means And a table of contents data transmitting means for transmitting the table of contents data to which the information processing apparatus is added, and the electronic document in the predetermined document format is transmitted by the page data transmitting means in the information processing apparatus. It is obtained by combining page data and the table of contents data transmitted by the table of contents data transmitting means .
上記目的を達成するために、本発明の文書変換方法は、複数ページで構成される文書画像データを所定の文書形式の電子文書に変換する文書変換方法であって、文字領域抽出手段が、前記文書画像データから文字領域を抽出する文字領域抽出ステップと、データ変換手段が、前記文書画像データのページを前記電子文書のページデータに変換し、目次の作成に必要となる前記文字領域抽出ステップで抽出された文字領域と該文字領域のページ番号とをデータ蓄積手段に保存するデータ変換ステップと、ページデータ送信手段が、前記文書画像データのうちの1ページに対して前記文字領域抽出ステップによる処理と前記データ変換ステップによる処理とが実行された時点で、前記変換されたページデータを情報処理装置へ送信する処理を開始するページデータ送信ステップと、目次データ作成手段が、前記文書画像データの全ページに対して前記文字領域抽出ステップによる処理と前記データ変換ステップによる処理とが実行された後、前記データ蓄積手段に保存されている前記文字領域と該文字領域のページ番号とに基づいて目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加する目次データ作成ステップと、目次データ送信手段が、前記目次データ作成ステップにより作成された前記リンク情報が付加された目次データを、前記情報処理装置へ送信する目次データ送信ステップと、を備え、前記所定の文書形式の電子文書は、前記情報処理装置において、前記ページデータ送信ステップで送信された前記ページデータと、前記目次データ送信ステップで送信された前記目次データとを結合することによって得られることを特徴とする。 In order to achieve the above object, a document conversion method of the present invention is a document conversion method for converting document image data composed of a plurality of pages into an electronic document of a predetermined document format , wherein the character area extraction means includes A character region extraction step for extracting a character region from the document image data; and a data conversion unit that converts the page of the document image data into page data of the electronic document, and the character region extraction step required for creating a table of contents. A data conversion step for storing the extracted character area and the page number of the character area in the data storage means, and a page data transmission means for processing by the character area extraction step for one page of the document image data And processing for transmitting the converted page data to the information processing apparatus is started at the time when the processing by the data conversion step is executed The page data transmission step and the table of contents data creation means store the data in the data storage means after the processing by the character area extraction step and the processing by the data conversion step are executed for all pages of the document image data. is to create a table of contents data on the basis of and the character area has and the page number of the character area, further, the link information for linking the items of the table of contents data corresponding create and corresponding position in said electronic document, A table of contents data creation step to be added to the created table of contents data item, and a table of contents data transmission means for sending the table of contents data to which the link information created in the table of contents data creation step is added to the information processing apparatus A data transmission step, wherein the electronic document in the predetermined document format is stored in the information processing apparatus in the information processing apparatus. And the page data transmitted at Jideta transmitting step, characterized in that it is obtained by combining the transmitted the contents data in the contents data transmission step.
本発明によれば、作成された目次データ中の項目と当該目の前記電子文書中の該当位置とのリンクを行うために、目次データ中の項目にリンク情報を付加するので、目次を有する電子文書の使い勝手を向上できる。 According to the present invention, in order to link the item in the created table of contents data and the corresponding position in the electronic document of the eye, link information is added to the item in the table of contents data. The usability of documents can be improved.
本発明によれば、目次および索引を有する電子文書の使い勝手を向上でき、また、目次または索引を用いて電子文書中の該当位置に表示を切り替えることができ、さらに、文字認識結果の信頼度に応じたタイトル部の表示に切替可能な目次データを作成できる。 According to the present invention, the usability of an electronic document having a table of contents and an index can be improved, the display can be switched to a corresponding position in the electronic document using the table of contents or the index, and the reliability of the character recognition result can be increased. The table of contents data that can be switched to the display of the corresponding title part can be created.
また、本発明によれば、ページ単位の文書データや目次データを次々に送信可能であるので、機器(文書処理装置)内の記憶リソースが限られていても、限られた記憶リソース内で複数の文書画像データから目次データを持つ電子文書への変換を容易に行うことができ、また、目次データおよび索引データを持つ電子文書への変換を容易に行うことができる。 Further , according to the present invention, document data and table of contents data in units of pages can be transmitted one after another. Therefore, even if the storage resource in the device (document processing apparatus) is limited, a plurality of data can be stored in the limited storage resource. from the document image data can be easily performed conversion to an electronic document with contents data, and can easily be converted into an electronic document with a table of contents data and index data.
本発明の実施の形態について図面を参照しながら説明する。本実施形態の文書変換装置は、複合機(MFP)および情報処理装置(クライアントPC)がネットワークを介して接続された文書変換システムに適用される。 Embodiments of the present invention will be described with reference to the drawings. The document conversion apparatus according to the present embodiment is applied to a document conversion system in which a multifunction peripheral (MFP) and an information processing apparatus (client PC) are connected via a network.
図1は実施の形態における文書変換システムの構成を示す図である。この文書変換システムは、ドキュメントサーバ7、複数台のクライアントPC3、スキャナ装置9および複数台のMFP5がネットワーク8を介して接続された構成を有する。ドキュメントサーバ7は文書画像データ等を管理する。クライアントPC3は、文書画像データを所定の文書形式の電子文書に変換するジョブの実行を指示したり、変換された電子文書を表示する処理等を行う。スキャナ装置9は、原稿を読み取ることにより得られる文書画像データをドキュメント管理サーバ7に出力する。MFP5は、スキャナ機能、プリンタ機能およびファクシミリ機能を有し、文書画像データを所定の文書形式の電子文書に変換する処理等を行う。ここで、MFP5によって変換される文書画像データは、MFP5のスキャナ機能によって取得されてもよいし、ドキュメントサーバ7から入力してもよい。また、所定の文書形式に変換される電子文書としては、一般的なワープロ文書の他、PDF文書、HTML/XML言語による文書等が挙げられる。
FIG. 1 is a diagram showing a configuration of a document conversion system according to an embodiment. This document conversion system has a configuration in which a
図2はMFP5の内部構成を示す図である。MFP5は、主にスキャナ部10およびプリンタ部20から構成される。スキャナ部10側では、原稿自動送り装置(原稿フィーダ)142から給送された原稿は順次、原稿台ガラス101上の所定位置に載置される。原稿照明ランプ102は、例えばハロゲンランプから構成され、原稿台ガラス101上に載置された原稿を露光する。走査ミラー103、104、105は、光学走査ユニット(図示せず)に収容されており、往復動しながら原稿からの反射光をCCDユニット106に導く。CCDユニット106は、原稿からの反射光を撮像素子に結像させる結像レンズ107、CCDからなる撮像素子108、この撮像素子108を駆動するCCDドライバ109等から構成される。撮像素子108から出力される画像信号は、例えば8ビットのデジタルデータに変換された後、コントローラユニット30に入力される。
FIG. 2 is a diagram showing an internal configuration of the MFP 5. The MFP 5 mainly includes a
一方、プリンタ部20側では、画像形成に備え、感光ドラム110は前露光ランプ112によって除電される。1次帯電器113は感光ドラム110を一様に帯電させる。露光手段としての半導体レーザ117は、コントローラユニット30で処理された画像データに基づき、感光ドラム110を露光し、静電潜像を形成する。現像器118は黒色の現像剤(トナー)を収容する。転写前帯電器119は感光ドラム110上に現像されたトナー像を用紙に転写する前に高圧をかける。手差し給紙ユニット120および給紙ユニット122、124、146、144では、それぞれ各給紙ローラ121、123、125、143、145の駆動により、転写用紙が装置内に給送され、レジストローラ126の位置で一旦停止した後、感光ドラム110に形成された画像との書き出しタイミングに合わせるように、再給送される。転写帯電器127は、感光ドラム110に現像されたトナー像を給送される転写用紙に転写する。分離帯電器128は、転写動作が終了した転写用紙を感光ドラム110から分離する。転写されずに感光ドラム110上に残ったトナーは、クリーナ111によって回収される。
On the other hand, on the
搬送ベルト129は、転写プロセスが終了した転写用紙を定着器130に搬送し、例えば加熱により定着する。フラッパ131は、定着プロセスが終了した転写用紙の搬送パスを、ソータ132または中間トレイ137の配置方向のいずれかに制御する。また、給送ローラ133〜136は、一度定着プロセスが終了した転写用紙を、中間トレイ137に反転(多重)させて、あるいは非反転(両面)のまま給送する。再給送ローラ138は、中間トレイ137に載置された転写用紙を再度、レジストローラ126の位置まで搬送する。後述するように、コントローラユニット30は、マイクロコンピュータ、画像処理部等を有し、操作部140からの指示に従って、上記画像形成動作を制御する。
The
図3はコントローラユニット30のハードウェア構成を示す図である。コントローラユニット30は、周知のCPU411、ROM412、RAM413、プリンタコントローラ(PRTC)415、ディスクコントローラ(DKC)417、ネットワークコントローラ(NTC)419、スキャナコントローラ421および操作インタフェース(I/F)425がシステムバス414を介して接続された構成を有する。プリンタコントローラ(PRTC)415には、プリンタ部(プリンタエンジン)20が接続されている。ディスクコントローラ(DKC)417には、ハードディスク装置(HD)418が接続されている。このハードディスク装置(以降、単にハードディスクという)418には、文書画像データ等が格納されるボックス(BOX)418aが記憶領域の一部として割り当てられている。ネットワークコントローラ(NTC)419には、MFP5およびネットワーク8間の接続制御を行うネットワーク装置(NT)420が接続されている。スキャナコントローラ421には、スキャナ部(スキャナユニット)10が接続されている。操作I/F425には、操作パネル140が接続されている。
FIG. 3 is a diagram illustrating a hardware configuration of the
CPU411は、装置全体を制御する中央処理装置であり、RAM413をワークエリアとして利用し、ROM412に格納された各種プログラムに従って、印刷に必要な各種の処理を実行する。システムバス414は、上記各部の間でデータや制御信号を授受するための通路となっている。ROM412には、各種プログラムの他、文字パターンデータ(フォントデータ)等が格納されている。RAM413またはHD418には、要求に応じて、ドキュメントサーバ7からダウンロードされる文書データ、文書画像データ(イメージデータ)、フォントデータの他、後述する文書変換プログラム等が格納される。また、CPU411は、ROM412に格納されたプログラムに従って、文字パターンデータや画像データ(ビットマップデータ)を生成し、プリンタコントローラ415内の印刷バッファに展開する。また、後述するように、CPU411は、文書変換プログラムに従って、文書画像データを所定の文書形式の電子文書に変換する。
The
プリンタコントローラ415は、ビットマップデータに基づいて生成された印刷コントロール信号をプリンタエンジン20に出力する。ネットワークコントローラ419は、ネットワーク8を介して、クライアントコンピュータ3やドキュメントサーバ7との間でデータ送受信を行う際、ネットワーク装置(NT)420の動作を制御する。
The
図4はクライアントPC3のハードウェア構成を示す図である。複数のクライアントPC3およびドキュメントサーバ7は全て同一の構成を有するので、ここでは、1台のクライアントPC3だけを示す。CPU201は中央処理装置であり、装置全体の制御および演算処理を行う。ROM202は読み出し専用メモリであり、システム起動プログラム、基本I/Oプログラム、文字コードをビットパターンに変換するための文字パターンデータ(フォントデータ)等を記憶している。RAM203はランダムアクセスメモリであり、CPU201の演算に使用されるデータ、演算結果、表示のために文字コードから変換された文字パターンデータ列や図形データ、イメージデータ等を一時的に記憶する。
FIG. 4 is a diagram illustrating a hardware configuration of the client PC 3. Since the plurality of client PCs 3 and the
入力制御部204は、キーボード(KB)205からのキー入力データ(文字コードや制御コード)やマウス213からの指示情報を受け取り、CPU201に伝達する。ディスプレイ制御部206は、RAM203に格納された文字パターンデータ列を読み出してディスプレイ装置207に転送する。ディスプレイ装置207は、ディスプレイ制御部206から文字パターンデータ列、図形データ、イメージデータを受け取り、画面に表示する。
The
ディスク制御部(DKC)208は、外部記憶装置209に対するアクセス制御を行う。外部記憶装置209として、本実施形態では、フロッピー(登録商標)ディスク装置(FD)209a、ハードディスク装置(HD)209b、CD−ROMドライブ209cが設けられている。HD209bには、文字パターンデータ(フォントデータ)やフォントデータを読み出してビットマップデータに変換する文字展開処理プログラム、図形データを処理する図形展開処理プログラム、イメージデータを処理するイメージデータ処理プログラム、MFP5で変換された電子文書を編集可能ワープロ等のアプリケーション等が記憶されている。ネットワーク制御部(NTC)210は、ネットワーク装置(NT)211の動作を制御する。システムバス212は、上記各部の間でデータ転送を行う。
A disk control unit (DKC) 208 controls access to the
図5はMFPの文書変換機能の構成を示す図である。この文書変換機能は、文書画像解析処理部302、文字認識処理部303、キーワード抽出部304、ページデータ変換部305、データ蓄積部306およびフッタ変換部307から構成される。文書画像解析処理部302は、領域判別部302aおよびタイトル判定部302bを有し、文書画像データ(単に、文書画像という)301が入力されると、入力された文書画像に対し、文字領域の抽出やレイアウト解析によるタイトル部(見出し)の判定を行う。文字認識処理部303は、文書画像解析処理部302によって抽出された文字領域の文字認識処理を行う。キーワード抽出部304は、文字認識処理部303の認識結果から文書中に含まれるキーワードの抽出処理を行う。
FIG. 5 is a diagram showing the configuration of the document conversion function of the MFP. The document conversion function includes a document image
ページデータ変換部305は、文書画像301と、文書画像解析処理部302、文字認識処理部303およびキーワード抽出部304の処理結果とを受け、ページ単位に所望の電子文書形式を有する電子文書への変換処理を行う。電子文書への変換結果は、1ページ目のデータ308から最終ページ目のデータ309としてページ毎に出力される。また、目次や索引を作成するために必要なデータは、データ蓄積部306に出力される。データ蓄積部306は、この出力されたデータを最終ページの変換処理が終わるまで保持する。
The page
フッタ変換部307は、データ蓄積部306に保持されているデータから、目次データや索引データを作成するともに、フッタへの変換処理を行い、フッタデータ310として出力する。変換されたデータ308、309、310は、ページデータ変換部305およびフッタ変換部307によって電子文書形式に変換されたデータである。1ページ目のデータ308には、電子文書のヘッダ情報が含まれている。ヘッダ情報を除けば、1ページ目のデータと2ページ目以降のデータとの間には、構造上の違いはない。これらのページデータがページ順に出力され、そして、フッタデータ310がその順番どおりに結合されると、所望の電子文書330が得られる。尚、上記文書変換機能の各部は、後述するように、CPU411がハードディスク418に格納された文書変換プログラムを実行することにより実現される。
The
図6はMFP5の文書変換機能における電子文書への変換処理手順を示すフローチャートである。この文書変換プログラムは、前述したように、ハードディスク418に格納されており、CPU411によって実行される。まず、文書画像(文書画像データ)の入力処理を行う(ステップS1)。この文字画像の入力処理では、スキャナ部10によって原稿から読み取られる文書画像を入力する。また、本実施形態では、文書画像の入力は1枚毎に行われるが、任意の枚数毎に行われるようにしてもよい。図7は複数枚の文書画像を示す図である。ここでは、取扱説明書に関する複数(N=10)枚の文書画像301−1、301−2、301−3、……、301−10が入力される場合を示す。尚、MFP5に備わるスキャナ部10を使用する代わりに、ネットワーク8に接続されたスキャナ装置9によって読み取られた文書画像を入力するようにしてもよい。
FIG. 6 is a flowchart showing a conversion processing procedure to an electronic document in the document conversion function of the MFP 5. As described above, this document conversion program is stored in the
入力された文書画像から領域判別部302aにより文字領域を抽出し、そのレイアウトからタイトル判定部302bによりタイトル部を判定する文書画像解析処理を行う(ステップS2)。ここで、文字領域を抽出する手法として、例えば、画像データ中の黒画素を隣接する1つあるいは複数の白画素にまで水平・垂直方向に膨張させる(文字や文字行を構成している黒画素同士が繋がる程度に膨張させる)ことにより画像データを塗りつぶして文字領域を識別する塗りつぶし手法等が挙げられる。図8は抽出された文字領域を示す図である。また、タイトル部の判定は、抽出された文字領域371、372の文書画像中における位置、およびこの文字領域内の文字の大きさ等の情報に基づいて行われる。文字の大きさは、例えば、次のように求められる。2値化された文字領域の画像データに対し、主走査方向(文字行方向)に投影された黒画素の計数値(度数)を副走査方向(文字列方向)に亘って表した黒画素分布を求める。この黒画素分布において、副走査方向に亘る黒画素の分布が「0」から「1」に変化する位置から、「1」から「0」に変化する直前までの位置の範囲が文字の行データとして判断され、この文字行データから文字の大きさが判定される。
A character region is extracted from the input document image by the
そして、文字認識処理を行う(ステップS3)。この文字認識処理では、抽出された文字領域の文字認識を行い、その結果をテキストコードおよび位置情報として取得する。この文字認識では、抽出された文字領域と辞書データとの識別マッチング処理が行われ、その距離値から文字が認識される。さらに、文字認識の結果から、キーワードとなる単語を抽出するキーワード抽出処理を行う(ステップS4)。 Then, character recognition processing is performed (step S3). In this character recognition process, character recognition of the extracted character area is performed, and the result is acquired as a text code and position information. In this character recognition, an identification matching process between the extracted character region and dictionary data is performed, and a character is recognized from the distance value. Further, a keyword extraction process for extracting a word as a keyword from the result of character recognition is performed (step S4).
ページ変換処理および情報の蓄積処理を行う(ステップS5)。ページ変換処理では、所望の電子文書の各ページデータが生成される。このとき、ページ全体が表示されるように、文書画像(文書画像データ)を圧縮して配置する形式に変換される。さらに、文字認識結果の位置情報を基に、文書画像の文字位置と一致するように、テキストコードを非表示で配置する形式に変換される(例えば、文書画像に該テキストコードを透明色で埋め込む)。各ページに対して同じページ変換処理が行われるが、1ページ目の変換データの先頭には、電子文書のヘッダ情報が付加される。 Page conversion processing and information storage processing are performed (step S5). In the page conversion process, each page data of a desired electronic document is generated. At this time, the document image (document image data) is converted into a format to be compressed and arranged so that the entire page is displayed. Further, based on the position information of the character recognition result, the text code is converted into a non-display format so as to match the character position of the document image (for example, the text code is embedded in the document image with a transparent color) ). The same page conversion process is performed for each page, but the header information of the electronic document is added to the beginning of the conversion data of the first page.
一方、情報の蓄積処理では、ステップS4で得られたタイトル部およびキーワードが、そのページ番号、部分画像および位置情報とともに蓄積される。ここで、キーワードに対する部分画像は索引作成用に蓄積されるが、同じキーワードが複数ある場合、そのキーワードに対する部分画像の数は1つでよく、複数の画像を持つ必要がない。また、文書画像データおよび文字認識結果は、ページ変換処理が行われた後、不要になるので、蓄積されずに消去される。 On the other hand, in the information accumulation process, the title part and keywords obtained in step S4 are accumulated together with the page number, partial image, and position information. Here, the partial images for the keyword are accumulated for index creation. However, when there are a plurality of the same keywords, the number of partial images for the keyword may be one, and it is not necessary to have a plurality of images. Further, the document image data and the character recognition result are erased without being accumulated because they become unnecessary after the page conversion process.
ステップS5で変換された1ページ分の変換データ(ページデータ)を送信する(ステップS6)。次の文書画像の入力があるか否かを判別する(ステップS7)。次の文書画像の入力がある場合、つまり複数枚の文書画像の入力が全て終わっていない場合、ステップS1の処理に戻る。一方、次の文書画像の入力がない場合、つまり複数枚の文書画像の入力が全て終わっている場合、目次および索引のデータを作成する(ステップS8)。前述したように、ステップS5で蓄積された部分画像、文字コードおよび位置情報から、目次データおよび索引データが作成される。このとき、文字部分画像に対し、その解像度の調整(解像度変換)が行われる。そして、作成された目次および索引データを含むフッタデータの送信処理を行う(ステップS9)。 The converted data (page data) for one page converted in step S5 is transmitted (step S6). It is determined whether or not a next document image has been input (step S7). If there is an input of the next document image, that is, if input of a plurality of document images is not completed, the process returns to step S1. On the other hand, if the next document image has not been input, that is, if all of the plurality of document images have been input, table of contents and index data are created (step S8). As described above, the table of contents data and the index data are created from the partial image, the character code, and the position information accumulated in step S5. At this time, the resolution of the character partial image is adjusted (resolution conversion). Then, transmission processing of footer data including the created table of contents and index data is performed (step S9).
図9は電子文書の構造を示す図である。ステップS6およびS9で送信されたデータ(1ページ目データ308〜フッタデータ310)を結合すると、電子文書は、ヘッダ、1ページ目データ、2ページ目データ、……、最終ページデータ、目次データ、索引データ、フッタという順に並ぶ構造を有する。図10はアプリケーションによって開かれた電子文書を示す図である。そして、後述するように、ワープロ等のアプリケーションから電子文書を開くと、「目次、1、2、3、……、最終ページ、索引」の順番になるように、ヘッダ以下の変換が調節される。
FIG. 9 is a diagram showing the structure of an electronic document. When the data (
図11はステップS8における目次および索引データの作成処理手順を示すフローチャートである。目次データの作成と索引データの作成は同じ手順で行われるので、ここでは、目次データを作成する処理だけを示す。まず、ステップS3における文字認識処理の結果を取り出す(ステップS21)。この処理の結果、認識された文字の有無を判別する(ステップS22)。認識された文字がない場合、そのまま本処理を終了し、元の処理に復帰する。一方、認識された文字がある場合、文字認識結果を判定し、その信頼度を求める(ステップS23)。文字認識結果の信頼度は、文字類似度(識別マッチング処理を行った際の辞書データと距離値)等の情報から求められる。 FIG. 11 is a flowchart showing the table of contents and index data creation processing procedure in step S8. Since the creation of the table of contents data and the creation of the index data are performed in the same procedure, only the process of creating the table of contents data is shown here. First, the result of the character recognition process in step S3 is taken out (step S21). As a result of this process, it is determined whether or not there is a recognized character (step S22). If there is no recognized character, the process is terminated as it is, and the process returns to the original process. On the other hand, if there is a recognized character, the character recognition result is determined and its reliability is determined (step S23). The reliability of the character recognition result is obtained from information such as character similarity (dictionary data and distance value when identification matching processing is performed).
そして、文字類似度が所定値以上で信頼度が高い(閾値を越える)か否かを判別する(ステップS24)。信頼度が低い(閾値以下である)場合、ステップS5で蓄積されたタイトル部の部分画像、および認識結果である文字コードを用いて、目次の項目を作成する(ステップS25)。このとき、目次で使用されるフォントに合わせて、部分画像の表示サイズあるいは解像度を調整する。さらに、認識結果である文字コードは、変換対象である電子文書の形式に合わせたテキストコードとして、表示される部分画像の上に非表示で描画される。これにより、電子文書を扱うワープロ等のアプリケーションから、目次の部分もキーワード検索が可能となる。もし文字認識結果が間違っていた場合、正確なキーワード検索はできないが、元の部分画像を用いているのでユーザの視認上は正しい画像で表示され、目次としての役目は十分果たせる。 And it is discriminate | determined whether a character similarity is more than predetermined value and reliability is high (it exceeds a threshold value) (step S24). If the reliability is low (below the threshold value), a table of contents item is created using the partial image of the title part accumulated in step S5 and the character code that is the recognition result (step S25). At this time, the display size or resolution of the partial image is adjusted according to the font used in the table of contents. Furthermore, the character code as the recognition result is drawn in a non-display manner on the displayed partial image as a text code that matches the format of the electronic document to be converted. As a result, a keyword search is also possible for the table of contents from an application such as a word processor that handles electronic documents. If the character recognition result is wrong, an accurate keyword search cannot be performed, but since the original partial image is used, it is displayed as a correct image for the user's visual recognition, and can fully serve as a table of contents.
一方、ステップS24で信頼度が高い(閾値を越える)場合、通常の目次作成と同様、ステップS25で示す部分画像を用いることなく、文字コードに対応するフォントによるテキスト描画を行うように、目次の項目を作成する(ステップS26)。 On the other hand, when the reliability is high (exceeds the threshold value) in step S24, the table of contents is drawn so that the text is drawn with the font corresponding to the character code without using the partial image shown in step S25, as in the normal table of contents creation. An item is created (step S26).
ステップS25、S26で目次の項目を作成する際、加えられるページ番号は、データ蓄積部306によって記憶されたものである。この目次作成処理では、ページ番号に、電子文書中の該当個所(ページ)へのリンク情報が付加される。これにより、アプリケーションによって電子文書が開かれた際、ユーザが表示された目次中のページ番号をクリックすると、電子文書中の該当個所に表示ページが切り替わることになる。
The page numbers to be added when the table of contents items are created in steps S25 and S26 are those stored by the
そして、ステップS25、S26で作成されたデータを、変換作業中のフッタデータに追加する(ステップS27)。この後、ステップS21の処理に戻り、認識結果の取り出しを行う。ステップS22で認識された文字がある場合、ステップS23以降の同様の処理を行い、一方、認識された文字がない場合、そのまま本処理を終了し、元の処理に復帰する。 Then, the data created in steps S25 and S26 is added to the footer data being converted (step S27). Thereafter, the process returns to step S21 to extract the recognition result. If there is a character recognized in step S22, the same processing from step S23 is performed. On the other hand, if there is no recognized character, this processing is terminated as it is, and the processing returns to the original processing.
尚、前述したように、上記処理手順は、索引データの作成に対しても同様に行われる。具体的に、ステップS27でフッタデータに追加して目次データの作成が終了した後、再びステップS21の処理に戻って索引データの作成を開始する。ステップS24で判定される信頼度が低い場合、ステップS25で部分画像および文字コードを用いて索引の項目を作成し、一方、信頼度が高い場合、ステップS26で文字コードを用いて索引の項目を作成する。そして、ステップS27でフッタデータに索引の項目を追加する。これらの処理は索引データの作成が終了するまで繰り返される。また、索引の項目を作成する際、ページ番号に、電子文書中の該当個所(ページ)へのリンク情報が付加される。 As described above, the above processing procedure is similarly performed for the creation of index data. Specifically, after adding to the footer data in step S27 and creating the table of contents data, the process returns to step S21 again to start creating index data. If the reliability determined in step S24 is low, an index item is created using the partial image and the character code in step S25. On the other hand, if the reliability is high, the index item is converted using the character code in step S26. create. In step S27, an index item is added to the footer data. These processes are repeated until the creation of index data is completed. Further, when creating an index item, link information to a corresponding portion (page) in the electronic document is added to the page number.
図12はクライアントPC3における電子文書の受信処理手順を示すフローチャートである。この処理プログラムは、外部記憶装置209に格納されており、CPU201によって一旦RAM203にロードされた後、実行される。
FIG. 12 is a flowchart showing the electronic document reception processing procedure in the client PC 3. This processing program is stored in the
まず、受信の開始に際して、作成する文書ファイルの初期化処理を行う(ステップS31)。この初期化処理では、対象ファイルの作成およびオープン処理が行われる。そして、ステップS6、S9で作成されたデータを受け取り、開いているファイルの末尾に追加するデータ受信処理を行う(ステップS32)。 First, at the start of reception, a document file to be created is initialized (step S31). In this initialization process, a target file is created and opened. Then, the data generated in steps S6 and S9 is received, and a data reception process for adding to the end of the open file is performed (step S32).
受け取ったデータがステップS9で作成されたデータであるか否かを判別する(ステップS33)。ステップS9で作成されたデータである場合、開いているファイルを閉じて文書ファイルとして完成させる受信終了処理を行い(ステップS34)、本処理を終了する。一方、受け取ったデータがステップS9で作成されたデータでなく、ステップS6で作成されたデータである場合、ステップS31の処理に戻る。 It is determined whether or not the received data is the data created in step S9 (step S33). If it is the data created in step S9, a reception end process for closing the open file and completing it as a document file is performed (step S34), and this process ends. On the other hand, if the received data is not the data created in step S9 but the data created in step S6, the process returns to step S31.
尚、図6では、1ページ単位で文書データの変換および送信処理を行っているが、変換されたデータはそのタイミングで送信されるとは限らない。送受信側の処理効率や、データがやり取りされる通信回線の速度等の条件により、送信側において変換データをすぐに送信せず、可能な範囲でスプールして複数ページの変換データをまとめて送信してもよい。このような場合、図6の処理フローと図12の処理フローとは同期しなくなる。 In FIG. 6, document data conversion and transmission processing are performed in units of one page, but the converted data is not always transmitted at that timing. Depending on the processing efficiency of the transmission / reception side and the speed of the communication line through which data is exchanged, the conversion data is not sent immediately on the transmission side, but the conversion data of multiple pages is sent together by spooling as much as possible. May be. In such a case, the processing flow in FIG. 6 and the processing flow in FIG. 12 are not synchronized.
図13はクライアントPC3における電子文書の表示切替処理手順を示すフローチャートである。この処理プログラムは、クライアントPC3に搭載されたワープロ等のアプリケーションの一部として外部記憶装置209に格納されており、CPU201によって一旦RAM203にロードされた後、実行される。まず、受信した電子文書を開き、ディスプレイ装置207に目次のページを表示する(ステップS41)。図14は目次のページを示す図である。目次を表す画面では、その左側に見出し(タイトル部)が配置され、右側にはページ番号が配置されている。
FIG. 13 is a flowchart showing the procedure of electronic document display switching processing in the client PC 3. This processing program is stored in the
キーボード205のキー入力あるいはマウス213のクリック操作により、目次ページ中のページ番号(または目次の各項目)が指示されたか否かを判別する(ステップS42)。ページ番号(または目次の各項目)が指示された場合、そのページ番号(または目次の各項目)に付されているリンク情報を取得する(ステップS43)。取得したリンク情報に従って、該当個所(ページ)に表示ページを切り替える(ステップS44)。この後、本処理を終了する。一方、ステップS42で目次ページ中のページ番号が指示されず、「次へ」あるいは「前へ」等のページ切替キーが操作された場合、それに応じた表示ページの切替処理を行う(ステップS45)。この後、本処理を終了する。尚、索引ページにおいても同様であり、索引中のページ番号(または索引の各項目)を指示するだけで該当個所(ページ)に表示ページを切り替えることが可能である。図15は索引ページを示す図である。索引を表す画面では、その左側にキーワードが「あいうえお」順に配置されており、右側に該当個所のページ番号が配置されている。
It is determined whether or not a page number (or each item in the table of contents) in the table of contents page has been instructed by a key input on the
このように、本実施形態の文書検索システムによれば、1ページあるいは複数ページ毎に変換ページがMFP5からクライアントPC3に送信されるので、MFP5内の記憶リソースであるハードディスク418(特に、ボックス418a)の容量が限られていても、文書画像データを上書き保存することにより対処することができる。これにより、複数ページで構成される文書画像から、目次および索引を持つ電子文書への変換を容易に行うことができる。また、目次や索引に含まれるページ番号を指示するだけで、電子文書中の該当個所に表示ページを切り替えることができ、使い勝手の良い電子文書を得ることができる。
As described above, according to the document search system of the present embodiment, the conversion page is transmitted from the MFP 5 to the client PC 3 for each page or a plurality of pages. Therefore, the
尚、本発明は、上記実施形態の構成に限られるものではなく、特許請求の範囲で示した機能、または本実施形態の構成が持つ機能が達成できる構成であればどのようなものであっても適用可能である。例えば、上記実施形態では、目次および索引を作成する際、ページ番号の管理が必要なこと、まとめて送信することにより送受信回数を減らして処理の効率化を図ること等の理由から、ステップS5のページ変換処理では、1ページ目であるという条件を満たす場合、電子文書ヘッダを作成していた。しかし、ステップS5でこのような処理を行う代わりに、ステップS1の処理前に電子文書ヘッダの作成および送信処理を設けてもよいことは勿論である。 The present invention is not limited to the configuration of the above-described embodiment, and any configuration can be used as long as the functions shown in the claims or the functions of the configuration of the present embodiment can be achieved. Is also applicable. For example, in the above-described embodiment, when creating the table of contents and index, the management of page numbers is necessary, and the number of times of transmission / reception is reduced by transmitting all at once, so that the processing efficiency is improved. In the page conversion process, an electronic document header is created when the condition of the first page is satisfied. However, it goes without saying that an electronic document header creation and transmission process may be provided before the process of step S1 instead of performing such a process in step S5.
また、上記実施形態では、文字認識処理部303が設けられていたが、本発明は文字認識処理部を設けなくても実現可能である。この場合、キーワード抽出部304も必要なくなる。キーワードを抽出できないので、索引を作成することはできないが、目次を作成することは可能である。すなわち、抽出されたタイトル部の部分画像、その位置情報およびページ番号を蓄積しておき、目次データを作成するステップS8の処理において、蓄積された部分画像を目次に貼り付け、ページ番号に該当個所へのリンク情報を付加することで、対応可能である。
In the above embodiment, the character
また、上記実施形態では、フッタ変換部307は、ステップS8において、蓄積されている文字部分画像、文字コードおよび文字位置情報から目次データおよび索引データを作成する際、前述したように、部分画像の解像度の調整(解像度変換)を行っている(ステップS25の処理参照)。しかし、部分画像としては、文書画像301が高精細であってその画像解像度が非常に高くなるもの、あるいは解像度は非常に高くなくてもフルカラーであって蓄積される部分画像のデータサイズが大きくなるものがある。
In the above embodiment, the
このような部分画像の蓄積を行う際の容量に余裕がない場合、ページデータ変換部305は、ステップS5において、ステップS23と同様の認識結果の判定を行い、認識結果の信頼度が予め決められた閾値に達しない場合のみ、蓄積対象である部分画像の解像度変換処理を行うようにしてもよい。このとき、ページ変換処理の効率は多少落ちることになる。さらには、ステップS5において、フルカラー等の多値画像の場合、二値化処理してデータ量を落としてもよい。これに対応するべく、フッタ変換部307は、部分画像を持つか否かを選択する際、以下のような処理を行う。即ち、図11のフローチャートにおいて、ステップS23を削除し、ステップS24の処理を、蓄積されている認識結果に部分画像が付属しているか否かを判別する処理に変更し、付属している場合、ステップS25の処理を行い、付属していない場合、ステップS26の処理を行うようにする。
If there is not enough capacity for storing such partial images, the page
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。上記実施形態では、MFPに適用された場合を示したが、文書画像データを入力可能な情報処理装置、上記文書変換機能を有するスキャナ装置等、種々の装置に適用可能である。 Further, the present invention may be applied to a system composed of a plurality of devices or an apparatus composed of a single device. Although the case where the present invention is applied to the MFP has been described in the above embodiment, the present invention can be applied to various apparatuses such as an information processing apparatus capable of inputting document image data and a scanner apparatus having the document conversion function.
また、本発明の目的は、実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出して実行することによっても達成される。 In addition, an object of the present invention is to supply a storage medium storing software program codes for realizing the functions of the embodiments to a system or apparatus, and a computer (or CPU, MPU, etc.) of the system or apparatus as a storage medium. This can also be achieved by reading and executing the stored program code.
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。 In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the program code and the storage medium storing the program code constitute the present invention.
又、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。 Examples of the storage medium for supplying the program code include a floppy (registered trademark) disk, a hard disk, a magneto-optical disk, a CD-ROM, a CD-R, a CD-RW, a DVD-ROM, a DVD-RAM, and a DVD. -RW, DVD + RW, magnetic tape, nonvolatile memory card, ROM, etc. can be used. Alternatively, the program code may be downloaded via a network.
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。 Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) running on the computer based on the instruction of the program code. A case where part or all of the actual processing is performed and the functions of the above-described embodiments are realized by the processing is also included.
更に、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。 Further, after the program code read from the storage medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. This includes the case where the CPU or the like provided in the board or function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.
3 クライアントPC
5 複合機(MFP)
8 ネットワーク
30 コントローラユニット
301 文書画像
302 文書画像解析処理部
303 文字認識処理部
304 キーワード抽出部
305 ページデータ変換部
306 データ蓄積部
307 フッタ変換部
330 電子文書
3 Client PC
5 MFP (MFP)
8
Claims (10)
前記文書画像データから文字領域を抽出する文字領域抽出手段と、
前記文書画像データのページを前記電子文書のページデータに変換し、目次の作成に必要となる前記文字領域抽出手段で抽出された文字領域と該文字領域のページ番号とをデータ蓄積手段に保存するデータ変換手段と、
前記文書画像データのうちの1ページに対して前記文字領域抽出手段による処理と前記データ変換手段による処理とが実行された時点で、前記変換されたページデータを情報処理装置へ送信する処理を開始するページデータ送信手段と、
前記文書画像データの全ページに対して前記文字領域抽出手段による処理と前記データ変換手段による処理とが実行された後、前記データ蓄積手段に保存されている前記文字領域と該文字領域のページ番号とに基づいて目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加する目次データ作成手段と、
前記目次データ作成手段により作成された前記リンク情報が付加された目次データを、前記情報処理装置へ送信する目次データ送信手段と、を備え、
前記所定の文書形式の電子文書は、前記情報処理装置において、前記ページデータ送信手段で送信された前記ページデータと、前記目次データ送信手段で送信された前記目次データとを結合することによって得られることを特徴とする文書変換装置。 A document conversion device for converting document image data composed of a plurality of pages into an electronic document of a predetermined document format ,
A character region extracting means for extracting a character region from the document image data;
The page of the document image data is converted into page data of the electronic document, and the character area extracted by the character area extraction unit and the page number of the character area necessary for creating the table of contents are stored in the data storage unit. Data conversion means;
When the processing by the character area extraction unit and the processing by the data conversion unit are executed for one page of the document image data, processing for transmitting the converted page data to the information processing apparatus is started. Page data transmission means to
After the processing by the character region extraction unit and the processing by the data conversion unit are executed for all pages of the document image data, the character region stored in the data storage unit and the page number of the character region create a table of contents data based on the bets, further, contents data created link information for linking the items of the table of contents data corresponding create and corresponding position in said electronic document is added to the items of the table of contents data such created Means,
A table of contents data transmitting means for transmitting the table of contents data to which the link information created by the table of contents data creating means is added to the information processing apparatus;
The electronic document in the predetermined document format is obtained by combining the page data transmitted by the page data transmission unit and the table of contents data transmitted by the table of contents data transmission unit in the information processing apparatus. A document conversion apparatus characterized by that.
前記データ変換手段によって前記データ蓄積手段に保存するデータは、前記タイトル部判定手段で判定されたタイトル部の文字領域と、該タイトル部の文字領域のページ番号とを含み、
前記目次データ作成手段は、前記文書画像データの全ページに対して前記文字領域抽出手段による処理と前記タイトル部判定手段による処理と前記データ変換手段による処理とが実行された後、前記データ蓄積手段に保存されている前記タイトル部の文字領域と該タイトル部の文字領域のページ番号とに基づいて前記目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加することを特徴とする請求項1記載の文書変換装置。 Title part determination means for determining a title part from the extracted character area is further provided,
The data stored in the data storage means by the data conversion means includes the character area of the title part determined by the title part determination means, and the page number of the character area of the title part,
The table of contents data creation means, after the processing by the character area extraction means, the processing by the title part determination means, and the processing by the data conversion means are executed for all pages of the document image data, the data storage means The table of contents data is created based on the character area of the title part stored in the page and the page number of the character area of the title part, and the item of the created table of contents data and the corresponding position in the electronic document 2. The document conversion apparatus according to claim 1 , wherein link information for linking is added to the created table of contents data item .
前記データ変換手段によって前記データ蓄積手段に保存するデータは、前記文字領域と該文字領域の文字認識結果と該文字領域のページ番号とを含み、
前記目次データ作成手段は、前記文書画像データの全ページに対して前記文字領域抽出手段による処理と前記文字認識手段による処理と前記データ変換手段による処理とが実行された後、前記データ蓄積手段に保存されている前記文字領域と該文字領域の文字認識結果と該文字領域のページ番号とに基づいて前記目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加することを特徴とする請求項1または2記載の文書変換装置。 Further comprising character recognition means for performing character recognition of the extracted character region;
The data stored in the data storage means by the data conversion means includes the character area, the character recognition result of the character area, and the page number of the character area,
The table of contents data creation means performs processing by the character area extraction means, processing by the character recognition means, and processing by the data conversion means on all pages of the document image data, and then stores them in the data storage means. The table of contents data is created based on the stored character area, the character recognition result of the character area and the page number of the character area, and the created table of contents data item and the corresponding position in the electronic document 3. The document conversion apparatus according to claim 1 , wherein link information for linking to is added to the item of the created table of contents data .
前記文字認識の結果からキーワードを抽出するキーワード抽出手段と、
前記文書画像データの全ページに対して前記文字領域抽出手段による処理と前記文字認識手段による処理と前記キーワード抽出手段による処理と前記データ変換手段による処理とが実行された後、前記抽出されたキーワードとページ番号とに基づいて索引データを作成し、更に、当該作成した索引データ中の項目と当該項目が記載される前記電子文書中の該当位置とをリンクさせるための情報を、当該作成した索引データの項目に付加する索引データ作成手段と、
前記索引データ作成手段により作成された前記索引データを、前記情報処理装置へ送信する索引データ送信手段と、を更に備え、
前記所定の文書形式の電子文書は、前記情報処理装置において、前記ページデータ送信手段で送信された前記ページデータと、前記目次データ送信手段で送信された前記目次データと、前記索引データ送信手段で送信された前記索引データとを結合することによって得られることを特徴とする請求項1記載の文書変換装置。 Character recognition means for performing character recognition of the extracted character region;
Keyword extracting means for extracting a keyword from the result of the character recognition;
After the processing by the character region extraction unit, the processing by the character recognition unit, the processing by the keyword extraction unit, and the processing by the data conversion unit are executed on all pages of the document image data, the extracted keyword Index data is created on the basis of the page number, and information for linking the item in the created index data with the corresponding position in the electronic document in which the item is described Index data creation means to be added to the data item ;
The index data created by said index data generation means, further and a index data transmitting means for transmitting to the information processing apparatus,
The electronic document in the predetermined document format is stored in the information processing apparatus by the page data transmitted by the page data transmission unit, the table of contents data transmitted by the table of contents data transmission unit, and the index data transmission unit. The document conversion apparatus according to claim 1, wherein the document conversion apparatus is obtained by combining the transmitted index data .
前記文字認識の結果の信頼度を判定する信頼度判定手段と、を更に備え、
前記目次データ作成手段は、前記信頼度が閾値以下である場合、前記文字領域の部分文字画像データを表示状態とし、前記文字認識の結果として得られた文字コードを非表示状態とする目次データを作成し、前記信頼度が閾値を越える場合、前記文字認識の結果として得られた文字コードに対応するフォントを表示状態とする目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加することを特徴とする請求項1記載の文書変換装置。 Character recognition means for performing character recognition of the extracted character region;
Additionally and a reliability determination unit configured to determine reliability of the character recognition result,
When the reliability is equal to or lower than a threshold value, the table of contents data creation means sets the table of contents data to display the partial character image data of the character area as a display state and the character code obtained as a result of the character recognition as a non-display state If the reliability exceeds a threshold value, the table of contents data for displaying the font corresponding to the character code obtained as a result of the character recognition is generated, and the table of contents data and the electronic data 2. The document conversion apparatus according to claim 1 , wherein link information for linking to a corresponding position in the document is added to the created table of contents data item .
文字領域抽出手段が、前記文書画像データから文字領域を抽出する文字領域抽出ステップと、
データ変換手段が、前記文書画像データのページを前記電子文書のページデータに変換し、目次の作成に必要となる前記文字領域抽出ステップで抽出された文字領域と該文字領域のページ番号とをデータ蓄積手段に保存するデータ変換ステップと、
ページデータ送信手段が、前記文書画像データのうちの1ページに対して前記文字領域抽出ステップによる処理と前記データ変換ステップによる処理とが実行された時点で、前記変換されたページデータを情報処理装置へ送信する処理を開始するページデータ送信ステップと、
目次データ作成手段が、前記文書画像データの全ページに対して前記文字領域抽出ステップによる処理と前記データ変換ステップによる処理とが実行された後、前記データ蓄積手段に保存されている前記文字領域と該文字領域のページ番号とに基づいて目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加する目次データ作成ステップと、
目次データ送信手段が、前記目次データ作成ステップにより作成された前記リンク情報が付加された目次データを、前記情報処理装置へ送信する目次データ送信ステップと、を備え、
前記所定の文書形式の電子文書は、前記情報処理装置において、前記ページデータ送信ステップで送信された前記ページデータと、前記目次データ送信ステップで送信された前記目次データとを結合することによって得られることを特徴とする文書変換方法。 A document conversion method for converting document image data composed of a plurality of pages into an electronic document of a predetermined document format ,
Character region extracting means, a character region extracting step of extracting a character area from the document image data,
Data conversion means converts the page of the document image data into page data of the electronic document, and stores the character area extracted in the character area extraction step and the page number of the character area, which are necessary for creating the table of contents. A data conversion step to store in the storage means;
When the page data transmission unit executes the processing by the character region extraction step and the processing by the data conversion step on one page of the document image data, the converted page data is processed by the information processing apparatus. A page data sending step for starting the process of sending to
The table of contents data creation means, after the processing by the character area extraction step and the processing by the data conversion step are executed for all pages of the document image data, the character area stored in the data storage means The table of contents data is created based on the page number of the character area, and link information for linking the created table of contents data to the corresponding position in the electronic document Creating table of contents data to be added to
A table of contents data transmission means, comprising: a table of contents data transmission step for transmitting the table of contents data to which the link information created in the table of contents data creation step is added to the information processing apparatus;
The electronic document in the predetermined document format is obtained by combining the page data transmitted in the page data transmission step and the table of contents data transmitted in the table of contents data transmission step in the information processing apparatus. A document conversion method characterized by the above.
複数のページで構成される文書画像データから文字領域を抽出する文字領域抽出手段、
前記文書画像データのページを、所定の文書形式の電子文書のページデータに変換するデータ変換手段、
目次の作成に必要となる前記文字領域抽出手段で抽出された文字領域とそのページ番号とを対応付けてデータ蓄積手段に保存する蓄積手段、
前記文書画像データのうちの1ページに対して前記文字領域抽出手段による処理と前記データ変換手段による処理と前記蓄積手段による処理とが実行された時点で、前記変換されたページデータを情報処理装置へ送信する処理を開始するページデータ送信手段、
前記文書画像データの全ページに対して前記文字領域抽出手段による処理と前記データ変換手段による処理と前記蓄積手段による処理とが実行された後、前記データ蓄積手段に保存されている前記文字領域とそのページ番号とに基づいて目次データを作成し、更に、当該作成した目次データの項目と前記電子文書中の該当位置とをリンクさせるためのリンク情報を、当該作成した目次データの項目に付加する目次データ作成手段、
前記目次データ作成手段により作成された前記リンク情報が付加された目次データを、前記情報処理装置へ送信する目次データ送信手段、
として機能させるためのプログラムであって、
前記情報処理装置において、前記ページデータ送信手段で送信された前記ページデータと前記目次データ送信手段で送信された前記目次データとを結合することによって、前記所定の文書形式の電子文書が得られることを特徴とする前記プログラムを格納したコンピュータ読み取り可能な記憶媒体。 Computer
A character area extracting means for extracting a character area from document image data composed of a plurality of pages;
Data conversion means for converting the page of the document image data into page data of an electronic document in a predetermined document format;
Storage means for associating the character area extracted by the character area extraction means necessary for creating the table of contents with its page number and storing it in the data storage means;
When the processing by the character area extraction unit, the processing by the data conversion unit, and the processing by the storage unit are executed on one page of the document image data, the converted page data is processed as an information processing device. Page data transmission means for starting processing to transmit to
The character region stored in the data storage unit after the processing by the character region extraction unit, the processing by the data conversion unit, and the processing by the storage unit are executed on all pages of the document image data The table of contents data is created based on the page number, and link information for linking the created table of contents data item with the corresponding position in the electronic document is added to the created table of contents data item. Table of contents data creation means,
Table of contents data transmitting means for transmitting the table of contents data to which the link information created by the table of contents data creating means is added to the information processing apparatus;
Is a program for functioning as
In the information processing apparatus, an electronic document in the predetermined document format can be obtained by combining the page data transmitted by the page data transmission unit and the table of contents data transmitted by the table of contents data transmission unit. computer readable storage medium storing the program characterized.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005174112A JP4789516B2 (en) | 2005-06-14 | 2005-06-14 | Document conversion apparatus, document conversion method, and storage medium |
US11/452,176 US7853866B2 (en) | 2005-06-14 | 2006-06-13 | Apparatus, method and system for document conversion, apparatuses for document processing and information processing, and storage media that store programs for realizing the apparatuses |
US12/877,773 US8453045B2 (en) | 2005-06-14 | 2010-09-08 | Apparatus, method and system for document conversion, apparatuses for document processing and information processing, and storage media that store programs for realizing the apparatuses |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005174112A JP4789516B2 (en) | 2005-06-14 | 2005-06-14 | Document conversion apparatus, document conversion method, and storage medium |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006350551A JP2006350551A (en) | 2006-12-28 |
JP2006350551A5 JP2006350551A5 (en) | 2008-07-31 |
JP4789516B2 true JP4789516B2 (en) | 2011-10-12 |
Family
ID=37525476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005174112A Expired - Fee Related JP4789516B2 (en) | 2005-06-14 | 2005-06-14 | Document conversion apparatus, document conversion method, and storage medium |
Country Status (2)
Country | Link |
---|---|
US (2) | US7853866B2 (en) |
JP (1) | JP4789516B2 (en) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8904267B2 (en) * | 2003-10-14 | 2014-12-02 | International Business Machines Corporation | Retrieving slide show content from presentation documents |
US7937653B2 (en) * | 2005-01-10 | 2011-05-03 | Xerox Corporation | Method and apparatus for detecting pagination constructs including a header and a footer in legacy documents |
US20070300295A1 (en) * | 2006-06-22 | 2007-12-27 | Thomas Yu-Kiu Kwok | Systems and methods to extract data automatically from a composite electronic document |
JP4062345B2 (en) * | 2006-08-16 | 2008-03-19 | 富士ゼロックス株式会社 | Information processing apparatus, information processing system, and control program |
JP4609398B2 (en) * | 2006-08-23 | 2011-01-12 | カシオ計算機株式会社 | Imaging apparatus and program |
JP4854491B2 (en) * | 2006-12-13 | 2012-01-18 | キヤノン株式会社 | Image processing apparatus and control method thereof |
US20080212877A1 (en) * | 2007-03-04 | 2008-09-04 | John Franco | High speed error detection and correction for character recognition |
US20080244381A1 (en) * | 2007-03-30 | 2008-10-02 | Alex Nicolaou | Document processing for mobile devices |
US20090144277A1 (en) * | 2007-12-03 | 2009-06-04 | Microsoft Corporation | Electronic table of contents entry classification and labeling scheme |
US8250469B2 (en) * | 2007-12-03 | 2012-08-21 | Microsoft Corporation | Document layout extraction |
US8392816B2 (en) * | 2007-12-03 | 2013-03-05 | Microsoft Corporation | Page classifier engine |
US8204896B2 (en) | 2008-01-08 | 2012-06-19 | Kabushiki Kaisha Toshiba | Image processing apparatus and image processing method |
JP5341388B2 (en) * | 2008-05-02 | 2013-11-13 | キヤノン株式会社 | Document processing apparatus and document processing method |
JP5111242B2 (en) * | 2008-06-04 | 2013-01-09 | キヤノン株式会社 | Image processing apparatus and method |
US20090307183A1 (en) * | 2008-06-10 | 2009-12-10 | Eric Arno Vigen | System and Method for Transmission of Communications by Unique Definition Identifiers |
JP5062049B2 (en) * | 2008-06-11 | 2012-10-31 | コニカミノルタビジネステクノロジーズ株式会社 | Image processing device |
JP4605277B2 (en) * | 2008-08-29 | 2011-01-05 | ブラザー工業株式会社 | Printing apparatus and program |
JP5226553B2 (en) * | 2009-02-06 | 2013-07-03 | キヤノン株式会社 | Image processing apparatus, image processing method, program, and recording medium |
JP2011008446A (en) * | 2009-06-24 | 2011-01-13 | Fuji Xerox Co Ltd | Image processor |
JP5663866B2 (en) * | 2009-08-20 | 2015-02-04 | 富士ゼロックス株式会社 | Information processing apparatus and information processing program |
US8745506B2 (en) * | 2010-02-19 | 2014-06-03 | Microsoft Corporation | Data structure mapping and navigation |
JP5743443B2 (en) * | 2010-07-08 | 2015-07-01 | キヤノン株式会社 | Image processing apparatus, image processing method, and computer program |
US9886446B1 (en) * | 2011-03-15 | 2018-02-06 | Veritas Technologies Llc | Inverted index for text searching within deduplication backup system |
US20140237353A1 (en) * | 2011-09-23 | 2014-08-21 | Ecmarket Inc. | Systems, methods and articles to automatically transform documents transmitted between senders and recipients |
US9001390B1 (en) * | 2011-10-06 | 2015-04-07 | Uri Zernik | Device, system and method for identifying sections of documents |
US20130174030A1 (en) * | 2012-01-04 | 2013-07-04 | Freedom Solutions Group, LLC, d/b/a Microsystems | Method and apparatus for analyzing abbreviations in a document |
JP5622290B2 (en) * | 2012-03-30 | 2014-11-12 | 京セラドキュメントソリューションズ株式会社 | Electronic equipment |
US10620795B2 (en) * | 2013-03-14 | 2020-04-14 | RELX Inc. | Computer program products and methods for displaying digital looseleaf content |
CN104111918B (en) * | 2013-04-16 | 2018-06-22 | 腾讯科技(北京)有限公司 | The accessible processing method and accessible web device of web page contents |
US20150026130A1 (en) * | 2013-07-17 | 2015-01-22 | LiveQoS Inc. | Method for efficient management of email attachments |
US9792276B2 (en) | 2013-12-13 | 2017-10-17 | International Business Machines Corporation | Content availability for natural language processing tasks |
US9588971B2 (en) * | 2014-02-03 | 2017-03-07 | Bluebeam Software, Inc. | Generating unique document page identifiers from content within a selected page region |
US10021049B2 (en) | 2014-08-13 | 2018-07-10 | S-Printing Solution Co., Ltd. | Cloud system and method of displaying, by cloud system, content |
US10212110B2 (en) * | 2014-08-13 | 2019-02-19 | Hp Printing Korea Co., Ltd. | Cloud system and method of displaying, by cloud system, content |
CN105991860B (en) * | 2015-02-06 | 2019-09-13 | 日本冲信息株式会社 | Image forming apparatus and image forming method |
JP2016206839A (en) * | 2015-04-20 | 2016-12-08 | 沖電気工業株式会社 | Medium recognition device and transaction device |
JP6269699B2 (en) * | 2016-02-19 | 2018-01-31 | 株式会社リコー | Image processing apparatus, program, and image processing method |
US10713306B2 (en) * | 2017-09-22 | 2020-07-14 | Microsoft Technology Licensing, Llc | Content pattern based automatic document classification |
JP6737294B2 (en) * | 2018-01-04 | 2020-08-05 | 株式会社リコー | Image processing apparatus, program, image processing method |
US11005739B2 (en) * | 2018-09-05 | 2021-05-11 | Richard K. Steen | System and method for managing and presenting network data |
US11379534B2 (en) * | 2019-11-19 | 2022-07-05 | International Business Machines Corporation | Document feature repository management |
JP2022054963A (en) * | 2020-09-28 | 2022-04-07 | シャープ株式会社 | Image forming apparatus and display control method for operation guide |
US11416671B2 (en) | 2020-11-16 | 2022-08-16 | Issuu, Inc. | Device dependent rendering of PDF content |
US11030387B1 (en) * | 2020-11-16 | 2021-06-08 | Issuu, Inc. | Device dependent rendering of PDF content including multiple articles and a table of contents |
KR102507487B1 (en) * | 2021-07-26 | 2023-03-08 | 주식회사 플렉슬 | Electronic apparatus which generates the dedicated document file for supporting fast editing of the pages comprising of a document, and the operating method thereof |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3178483B2 (en) * | 1992-06-09 | 2001-06-18 | 富士ゼロックス株式会社 | Document processing device |
US5701500A (en) | 1992-06-02 | 1997-12-23 | Fuji Xerox Co., Ltd. | Document processor |
US6415307B2 (en) * | 1994-10-24 | 2002-07-02 | P2I Limited | Publication file conversion and display |
JP3976802B2 (en) | 1994-11-15 | 2007-09-19 | キヤノン株式会社 | Image processing apparatus and image processing method |
US5926824A (en) * | 1994-11-16 | 1999-07-20 | Canon Kabushiki Kaisha | System and method for retrieving a document by inputting a desired attribute and the number of areas in which the attribute occurs as a retrieval condition |
US5963966A (en) * | 1995-11-08 | 1999-10-05 | Cybernet Systems Corporation | Automated capture of technical documents for electronic review and distribution |
US6456747B2 (en) * | 1996-06-27 | 2002-09-24 | Papercomp, Inc. | Systems, processes and products for storage and retrieval of physical paper documents, electro-optically generated electronic documents, and computer generated electronic documents |
JP2000250908A (en) * | 1999-02-26 | 2000-09-14 | Planet Computer:Kk | Support device for production of electronic book |
JP4497733B2 (en) * | 2000-02-22 | 2010-07-07 | キヤノン株式会社 | Data processing apparatus and data processing method |
JP5025846B2 (en) * | 2000-10-10 | 2012-09-12 | 大和コンピューターサービス株式会社 | Paper processing system for sales promotion |
JP3615195B2 (en) * | 2002-03-19 | 2005-01-26 | 株式会社東芝 | Content recording / playback apparatus and content editing method |
US6907431B2 (en) * | 2002-05-03 | 2005-06-14 | Hewlett-Packard Development Company, L.P. | Method for determining a logical structure of a document |
JP4181892B2 (en) * | 2003-02-21 | 2008-11-19 | キヤノン株式会社 | Image processing method |
JP4246528B2 (en) * | 2003-03-26 | 2009-04-02 | 富士通コンポーネント株式会社 | Selector |
JP3747916B2 (en) * | 2003-03-27 | 2006-02-22 | コニカミノルタビジネステクノロジーズ株式会社 | JPEG2000 encoding apparatus, decoding apparatus, encoding method, and decoding method |
JP4111926B2 (en) * | 2004-03-09 | 2008-07-02 | 株式会社リコー | Image processing apparatus, program, storage medium, and image transmission method |
JP2005352696A (en) * | 2004-06-09 | 2005-12-22 | Canon Inc | Image processing device, control method thereof, and program |
US8364668B2 (en) * | 2004-09-29 | 2013-01-29 | Google Inc. | User interfaces for a document search engine |
US20060075327A1 (en) * | 2004-09-29 | 2006-04-06 | Joe Sriver | User interface for presentation of a document |
US8386453B2 (en) * | 2004-09-30 | 2013-02-26 | Google Inc. | Providing search information relating to a document |
US7756871B2 (en) * | 2004-10-13 | 2010-07-13 | Hewlett-Packard Development Company, L.P. | Article extraction |
US7529408B2 (en) * | 2005-02-23 | 2009-05-05 | Ichannex Corporation | System and method for electronically processing document images |
-
2005
- 2005-06-14 JP JP2005174112A patent/JP4789516B2/en not_active Expired - Fee Related
-
2006
- 2006-06-13 US US11/452,176 patent/US7853866B2/en not_active Expired - Fee Related
-
2010
- 2010-09-08 US US12/877,773 patent/US8453045B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006350551A (en) | 2006-12-28 |
US8453045B2 (en) | 2013-05-28 |
US7853866B2 (en) | 2010-12-14 |
US20100329567A1 (en) | 2010-12-30 |
US20060282760A1 (en) | 2006-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4789516B2 (en) | Document conversion apparatus, document conversion method, and storage medium | |
JP4137096B2 (en) | Image data search system, image data search device, image data search method, computer program, and storage medium | |
JP2007174270A (en) | Image processing apparatus, image processing method, storage medium, and program | |
JP4928373B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP2006252049A (en) | Translation system, translation method and program | |
JP4125302B2 (en) | Printing system, information processing apparatus, printing method, and program | |
US8458139B2 (en) | Image processing apparatus, control method thereof, program, and storage medium | |
US8259330B2 (en) | Output efficiency of printer forming image by interpreting PDL and performing output by using print engine | |
US8238664B2 (en) | Image processing apparatus, control method therefor, and recording medium | |
US8638456B2 (en) | Image processing apparatus and image processing method | |
US8264744B2 (en) | Image processing apparatus, image processing method, and program to execute image processing method | |
JP2006150791A (en) | Imaging device | |
JP2006235186A (en) | Electrophotographic device | |
JP5173566B2 (en) | Image processing apparatus, control method therefor, and program | |
US8259313B2 (en) | Image processing apparatus, method, and computer-readable medium storing the program thereof | |
JP4845700B2 (en) | Image forming apparatus and control method thereof | |
JP2006133880A (en) | Information processor and information processing method | |
JP2009141772A (en) | Image processing apparatus and image processing system | |
JP2006205442A (en) | Image forming apparatus, information processing method, program, and memory medium | |
JP2005196637A (en) | Image forming apparatus and its control method | |
JP2004357017A (en) | Image processor | |
JP2006221228A (en) | Image forming device | |
JP2007102011A (en) | Image forming apparatus | |
JP2006313969A (en) | Apparatus and program for image processing, storage medium stored with computer-readable program, and program | |
JP2009049598A (en) | Image forming apparatus, its control method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20070626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080616 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110719 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140729 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |