JP2013152564A - Document processor and document processing method - Google Patents
Document processor and document processing method Download PDFInfo
- Publication number
- JP2013152564A JP2013152564A JP2012012407A JP2012012407A JP2013152564A JP 2013152564 A JP2013152564 A JP 2013152564A JP 2012012407 A JP2012012407 A JP 2012012407A JP 2012012407 A JP2012012407 A JP 2012012407A JP 2013152564 A JP2013152564 A JP 2013152564A
- Authority
- JP
- Japan
- Prior art keywords
- text
- information
- expression
- correspondence
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は文書処理装置及び文書処理方法に関し、特に、電子文書データの処理を行うために用いて好適な技術に関する。 The present invention relates to a document processing apparatus and a document processing method, and more particularly to a technique suitable for use in processing electronic document data.
従来、文書中の、「オブジェクト」(例えば、写真、図面、線画、表等)と「オブジェクトの説明文」(オブジェクトの説明や解説等を行う本文中の文章)を含む紙文書、または電子文書が広く利用されている。例えば、学術論文、特許、取扱説明書、商品カタログ等の説明調の文章を含む文書などである。 Conventionally, a paper document or an electronic document containing “objects” (for example, photographs, drawings, line drawings, tables, etc.) and “descriptions of objects” (texts in the text for explaining or explaining the objects) in the document. Is widely used. For example, documents including explanatory texts such as academic papers, patents, instruction manuals, and product catalogs.
「オブジェクトの説明文」とは、主たる文章である本文の中で、前述の「オブジェクト」を説明・解説するもの(実際には、文章の内容を図式化したものがオブジェクトであることが多い)である。文書の作成者は、これら「オブジェクト」と「オブジェクトの説明文」を合せて、文書の閲覧者が利用することを意図して作成している。 "Object description" explains and explains the above-mentioned "object" in the main text, which is the main sentence (in practice, the object is often a graphical representation of the contents of the sentence) It is. The creator of the document combines these “object” and “description of the object” with the intention of being used by the viewer of the document.
そのため、それらの関係付けのために、「図15」などの表現を使用することが多い。この「図15」のように、「オブジェクト」と「オブジェクトの説明文」のそれぞれを関係づけるためのものを、「アンカー表現」と呼ぶ。また、「オブジェクト」自身の近傍に、その「オブジェクト」を説明する説明文があることが多く、これを「キャプション表現」と呼ぶが、これが「アンカー表現」を一緒に含んでいることが多い。 For this reason, an expression such as “FIG. 15” is often used to relate them. As shown in “FIG. 15”, an object for associating each of “object” and “object description” is called “anchor expression”. In addition, there are many explanatory texts explaining the “object” in the vicinity of the “object” itself, and this is called “caption expression”, which often includes the “anchor expression” together.
この場合の例を図15(a)に示す。図15中、1501は文書の1ページ目、1502は2ページ目であり、1511が文書の本文、1512が文書中の説明文に含まれるアンカー表現である。1513が文書中のオブジェクトである表、1514がその表オブジェクトのキャプション表現で、1515がそのキャプション表現中のアンカー表現である。 An example of this case is shown in FIG. In FIG. 15, 1501 is the first page of the document, 1502 is the second page, 1511 is the body of the document, and 1512 is an anchor expression included in the explanatory text in the document. 1513 is a table that is an object in the document, 1514 is a caption expression of the table object, and 1515 is an anchor expression in the caption expression.
文書の閲覧者は、「オブジェクト」と「オブジェクトの説明文」の相互の対応関係を考慮し、読み進める必要がある。そのため、閲覧者は、本文中に「Table.1は・・・」という文章を見た場合、文書内から「Table.1」に対応するオブジェクトを探して確認したのち、再び本文の元の位置に戻り、続きを読み始めることになる。 The document viewer needs to read in consideration of the mutual relationship between the “object” and the “object description”. Therefore, when the viewer sees the text “Table.1 is ...” in the text, the viewer searches for the object corresponding to “Table.1” from the document, and then confirms the original position of the text again. Return to and start reading more.
一方、本文中に「Table.1」というアンカー表現を持つオブジェクトを見た場合には、本文中より「Table.1」について説明された文章を探すことになる。そして、説明文を読んで確認した後、再び元のページに戻り続きを読み進める。複数ページ文書の場合、本文中の「Table.1は・・・」に対応するオブジェクトを探したり、「Table.1」で示されるオブジェクトに対応する本文中の説明文を探したりする場合に、ページをまたがって参照する必要が出てくる。このため、可読性が良くない問題点があった。また、本文中の説明文は探しにくい上、複数個所で書かれているなど、閲覧者が全てを確認するのは困難である場合もあった。 On the other hand, when the object having the anchor expression “Table.1” is seen in the text, the text explaining “Table.1” is searched from the text. Then, after reading and confirming the explanatory text, the user returns to the original page again and continues reading. In the case of a multi-page document, when searching for an object corresponding to “Table.1 is ...” in the text or searching for an explanatory text in the text corresponding to the object indicated by “Table.1”, You will need to browse across pages. For this reason, there was a problem that readability was not good. In addition, it is difficult for the viewer to check all the explanations in the text, such as being difficult to find and being written in a plurality of places.
そこで、この「オブジェクト」である「図」と「アンカー表現」である「図番号」のハイパーテキスト化を行って電子文書を生成する。これにより、例えば、本文中の「図番号」をマウス等でクリックすると、「図番号」に該当する図を画面表示させるなどの機能を保有させることができる。また、紙文書を光学的に読み取った電子文書において、その文書の解析を行うことで、この機能を付加することが考えられる。 Therefore, the “document” “diagram” and the “anchor expression” “diagram number” are converted into hypertext to generate an electronic document. Thus, for example, when a “diagram number” in the text is clicked with a mouse or the like, it is possible to have a function of displaying a diagram corresponding to the “diagram number” on the screen. In addition, it is conceivable to add this function by analyzing a document in an electronic document obtained by optically reading a paper document.
特許文献1では、そのアンカー表現を保有する「オブジェクトの説明文」を抽出し、また、図などの「オブジェクト」の「アンカー表現」を抽出して関係づける。これにより、「オブジェクトの説明文」を検索用のメタデータとして、その「オブジェクト」の検索を可能としている。
In
そこで、これを利用して、これらの間を容易に行き来できる操作を可能とする機能(以下、これを「オブジェクトのリンク機能」という)を、電子文書とその文書の説明文などに追加する。これにより、図などを使用した文書でも、本文と図の内容を容易に読んだり確認したりすることが可能となる。 Therefore, using this, a function (hereinafter referred to as an “object link function”) that enables an operation to easily go back and forth between these is added to an electronic document and an explanatory text of the document. This makes it possible to easily read and check the contents of the text and the figure even in a document using the figure.
すなわち、「オブジェクトの説明文」もしくはその中の「アンカー表現」と「オブジェクト」の関係と、その出現位置の情報を抽出して、このオブジェクトのリンク機能を作り出すのである。図15の1521、1522が、これを付加した場合のものである。「本文中の説明文」の中の「アンカー表現」1512に対して、操作機能1521が付加されている。
In other words, the information on the relationship between the “description of the object” or “anchor expression” and “object” and the appearance position thereof is extracted, and the link function of this object is created. 1521 and 1522 in FIG. 15 are obtained when this is added. An
これをマウス等でクリックすると、2ページ目の1502に表示部分が移動し、1513の図が強調表示されるなどして、その部分が該当部分であることが示される。同様に、「オブジェクト」1513に付加されている操作機能1522をマウス等でクリックすると、1ページ目の1501に表示部分が移動する。そして、1512の「アンカー表現」やそれを含む「オブジェクトの説明文」の部分が強調表示されるなどして、その部分が該当部分であることが示される。
When this is clicked with a mouse or the like, the display part moves to 1502 on the second page, and the figure 1513 is highlighted, indicating that the part is the corresponding part. Similarly, when an
しかし、「オブジェクトの説明文」での説明内容は、「オブジェクト」全体に関するものよりは、むしろ、その一部などの特定部分に対して、説明を行う場合がよくある。すなわち、図の中の特徴的な部分や、表の中の一部の着目してほしい部分があり、その部分に対して説明を行っていることが多い。 However, the description content of the “object description” often explains a specific part such as a part rather than the whole “object”. In other words, there are characteristic parts in the figure and some parts in the table that you want to pay attention to, and there are many explanations for these parts.
そのため、前述のハイパーテキスト化を行って電子文書とした場合でも、移動した「オブジェクト」の中にある「オブジェクトの説明文」で示された部分を探す作業が発生してしまう。また、「オブジェクトの説明文」は、「オブジェクト」内の複数の部分に対して、個々に説明する文章だった場合、何度も、「オブジェクト」の表示と「オブジェクトの説明文」との間を移動して、文書を読むことになる。 Therefore, even when the hypertext is converted into an electronic document as described above, an operation for searching for a portion indicated by “description of object” in the moved “object” occurs. In addition, when the “object description” is a sentence that individually explains a plurality of parts in the “object”, the “object description” is repeatedly displayed between the “object” display and the “object description”. Go to read the document.
その際に、何度も「オブジェクトの説明文」で示された部分を探す作業が発生してしまう可能性がある。特に、「オブジェクト」が表などの場合においては、着目している部分以外が記載されているので、この傾向が顕著である。
このような機能は、文書を作成する利用者が、文書編集装置などを用いて、強調表示そのものを作成するのが一般的である。
At that time, there is a possibility that the operation of searching for the portion indicated by the “object description” will occur many times. In particular, when the “object” is a table or the like, this trend is remarkable because the portion other than the portion of interest is described.
Such a function is generally created by a user who creates a document by using a document editing apparatus or the like to create a highlight display itself.
特許文献1のように、図面などで、その中の記載内容に関する記事形式や規則が明確な場合は、自動的に強調表現を追加するものはあった。しかし、通常の文書などにおいて、その文書の中の本文たる説明文と図表内の該当部分の対応を示し、かつ、説明文が複数ある場合や、その図表内の該当部分の違いを明確にできるような強調表現を追加するものはなかった。
本発明は前述の問題点に鑑み、文書の中の説明文と図表内のものとの対応関係が明確にわかる強調表現を行うことができるすることを目的とする。
As in
SUMMARY OF THE INVENTION In view of the above-described problems, an object of the present invention is to make it possible to perform an emphasis expression that clearly shows the correspondence between explanatory texts in a document and those in a diagram.
本発明の文書処理装置は、イメージデータを含む複数ページの電子文書をページ単位でオブジェクトとオブジェクトの説明文との間に相互リンクを作成し、マルチページの電子文書を生成する文書処理装置であって、前記イメージデータを分割して分割領域を得る領域分割手段と、前記領域分割手段により得られた分割領域の属性を判定し、領域毎に文字属性を付加する属性情報付加手段と、前記属性情報付加手段により文字属性が付加された領域内の文字を認識する文字認識手段と、前記オブジェクトに付随するアンカー表現と、前記電子文書の本文中のアンカー表現またはオブジェクトの説明文との対応を調べて、前記オブジェクトと、前記本文中のアンカー表現またはオブジェクトの説明文との対応関係を保持するためのリンク情報を生成するリンク情報生成処理手段と、前記リンク情報生成処理手段により生成されたリンク情報によって対応付けられた、オブジェクト内のテキスト表現と、前記本文中のオブジェクトの説明文との対応する部分に、対応を強調表現する対応表現情報を生成して追加する対応表現追加手段と、前記リンク情報と前記対応を強調表現する対応表現情報を含む電子文書に変換するフォーマット変換手段とを有することを特徴とする。 The document processing apparatus according to the present invention is a document processing apparatus that creates a multi-page electronic document by creating a mutual link between an object and a description of the object for each page of a multi-page electronic document including image data. Area dividing means for dividing the image data to obtain divided areas, attribute information adding means for determining attributes of the divided areas obtained by the area dividing means, and adding character attributes for each area; and Check the correspondence between the character recognition means for recognizing characters in the area to which the character attribute is added by the information addition means, the anchor expression attached to the object, and the anchor expression or the object description in the body of the electronic document. Link information for maintaining the correspondence between the object and the anchor expression in the text or the description of the object. Corresponding to the corresponding part of the text information in the object and the description of the object in the body, which is associated by the link information generation processing means to be formed, the link information generated by the link information generation processing means Correspondence expression adding means for generating and adding correspondence expression information for emphasizing expression, and format conversion means for converting into an electronic document including the link information and correspondence expression information for emphasizing the correspondence. .
本発明によれば、相互リンクを利用した場合に、対応する部分を直観的にわかりやすく示すことが可能となり、対応する部分を探す手間を省くことができ、文書の可読性を向上させることが可能となる。 According to the present invention, when a mutual link is used, it is possible to show the corresponding part intuitively and easily, and it is possible to save the trouble of searching for the corresponding part and improve the readability of the document. It becomes.
(第1の実施形態)
以下、本発明を実施するための最良の実施形態について図面を用いて説明する。
図1は、本実施形態の文書処理システムの構成例を示すブロック図である。
図1において、オフィスA内に構築されたLAN102には、複数種類の機能(複写機能、印刷機能、送信機能等)を実現する複合機であるMFP(Multi Function Peripheral)100が接続されている。
(First embodiment)
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, the best mode for carrying out the invention will be described with reference to the drawings.
FIG. 1 is a block diagram illustrating a configuration example of a document processing system according to the present embodiment.
In FIG. 1, an MFP (Multi Function Peripheral) 100 that is a multifunction machine that realizes a plurality of types of functions (copying function, printing function, transmission function, etc.) is connected to a
LAN102は、プロキシサーバ103を介して外部のネットワーク104にも接続されている。クライアントPC101はLAN102を介してMFP100からの送信データを受信したり、MFP100が有する機能を利用したりする。例えば、クライアントPC101は、印刷データをMFP100へ送信することで、その印刷データに基づく印刷物をMFP100で印刷することもできる。なお、図1の構成は一例であり、オフィスAと同様の構成要素を有する、複数のオフィスがネットワーク104上に接続されていてもよい。
The
また、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等で実現される通信ネットワークである。これは、データの送受信が可能なものであれば、何でもよい。また、クライアントPC101、プロキシサーバ103の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素を有している。例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等である。
The
図2は、本実施形態の画像処理装置であるMFP100の詳細構成を示すブロック図である。図2に示したMFP100は、画像入力デバイスであるスキャナ部201と、画像出力デバイスであるプリンタ部202と、CPU205等で構成される制御ユニット204と、ユーザインタフェースである操作部203等を有する。
FIG. 2 is a block diagram illustrating a detailed configuration of the
制御ユニット204は、スキャナ部201、プリンタ部202、操作部203と接続し、一方では、LAN219や一般の電話回線網である公衆回線(WAN)220と接続することで、画像情報やデバイス情報の入出力を行うコントローラである。CPU205は、制御ユニット204に含まれる各ユニットを制御する。RAM206はCPU205が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリでもある。
The control unit 204 is connected to the
ROM210はブートROMであり、システムのブートプログラム等のプログラムが格納されている。記憶部211はハードディスクドライブで、システム制御ソフトウェア、画像データを格納する。操作部I/F207は操作部(UI)203とのインターフェース部で、操作部203に表示するための画像データを操作部203に対して出力する。また、操作部I/F207は操作部203から本画像処理装置の使用者が入力した情報を、CPU205に伝える役割をする。
A ROM 210 is a boot ROM, and stores programs such as a system boot program. A
ネットワークI/F208は本画像処理装置をLAN219に接続し、パケット形式の情報の入出力を行う。モデム209は本画像処理装置をWAN220に接続し、データの復調・変調を行うことにより情報の入出力を行う。以上のデバイスがシステムバス221上に配置される。 A network I / F 208 connects the image processing apparatus to the LAN 219 and inputs / outputs packet format information. A modem 209 connects the image processing apparatus to the WAN 220 and inputs / outputs information by demodulating / modulating data. The above devices are arranged on the system bus 221.
イメージバスI/F212はシステムバス221と画像データを高速で転送する画像バス222とを接続し、データ構造を変換するバスブリッジである。画像バス222は、例えば、PCIバスやIEEE1394で構成される。画像バス222上には以下のデバイスが配置される。ラスターイメージプロセッサ(RIP)213は、PDL(ページ記述言語)コードを解析し、指定された解像度のビットマップイメージに展開する、いわゆるレンダリング処理を実現する。 An image bus I / F 212 is a bus bridge that connects the system bus 221 and an image bus 222 that transfers image data at high speed, and converts the data structure. The image bus 222 is composed of, for example, a PCI bus or IEEE1394. The following devices are arranged on the image bus 222. A raster image processor (RIP) 213 realizes a so-called rendering process in which a PDL (page description language) code is analyzed and developed into a bitmap image having a designated resolution.
この展開をする際には、各画素単位あるいは領域単位で属性情報が付加されることになる。これを像域判定処理と呼ぶ。像域判定処理により、画素毎にあるいは領域毎に、文字(テキスト)や線(ライン)、グラフィクス、イメージ等といったオブジェクト種類を示す属性情報が付与される。例えば、PDLコード内のPDL記述のオブジェクトの種類に応じて、RIP213から像域信号が出力され、その信号値で示される属性に応じた属性情報が、オブジェクトに対応する画素や領域に関連づけて保存される。したがって、画像データには、関連づけられた属性情報が付属している。
When this expansion is performed, attribute information is added in units of pixels or regions. This is called image area determination processing. By the image area determination process, attribute information indicating an object type such as a character (text), a line (line), graphics, an image, or the like is given for each pixel or for each area. For example, an image area signal is output from the
デバイスI/F214は、信号線223を介して画像入力デバイスであるスキャナ部201、信号線224を介して画像出力デバイスであるプリンタ部202、をそれぞれ制御ユニット204に接続し、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部215は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部216は、プリンタ部202に出力すべきプリント出力画像データに対して、プリンタ部202に応じた補正、解像度変換等を行う。画像回転部217は入力された画像データが正立するように回転を行い出力する。データ処理部218については後述する。
The device I / F 214 connects the
次に、図3を用いて、図2のデータ処理部218の詳細について説明を行う。データ処理部218は、領域分割部301、属性情報付加部302、文字認識部303、リンク処理部304、対応表現追加部305、フォーマット変換部306から構成される。データ処理部218は、スキャナ部201でスキャンしたイメージデータ300が入力されてくると、各処理部301〜306で処理を行うことにより、電子文書データ310を生成して出力する。
Next, details of the
領域分割部301には、図2のスキャナ部201でスキャンされたイメージデータ、あるいは記憶部211に保存されている過去に入力されたイメージデータ(文書画像)が入力される。そして、文字、写真、図表、イラスト等のような、そのページ内に配置されたオブジェクトの領域(オブジェクト領域)を抽出するために、データ中の画素の抽出・グループ化等の処理を行う。
Image data scanned by the
領域分割部301で行う領域抽出方法(領域分割方法)としては公知の方法を用いればよい。
一例を説明すると、まず、入力画像を2値化して2値画像を生成し、2値画像を低解像度化して間引き画像(縮小画像)を作成する。例えば、1/(M×N)の間引き画像を作成する際には、2値画像をM×N画素毎に分割し、M×N画素内に黒画素が存在すれば縮小後の対応する画素を黒画素とし、存在しなければ白画素とすることにより、間引き画像を作成する。
As a region extraction method (region division method) performed by the
As an example, first, an input image is binarized to generate a binary image, and the resolution of the binary image is reduced to create a thinned image (reduced image). For example, when a 1 / (M × N) thinned image is created, a binary image is divided into M × N pixels, and if there are black pixels in the M × N pixels, the corresponding pixels after reduction are reduced. Is a black pixel, and if it does not exist, it is a white pixel to create a thinned image.
次に、間引き画像において黒画素が連結する部分(連結黒画素)を抽出して当該連結黒画素に外接する矩形を作成していく。文字画像サイズに近い矩形(1文字の矩形)が並んでいる場合や、縦横のどちらかが文字画像サイズに近い矩形(数文字が繋がった連結黒画素の矩形)で短辺の近くに同様の矩形が並んでいる場合は、1つの文字行を構成している文字画像である可能性が高い。この場合は矩形同士を結合して、1つの文字行を表す矩形を得る。そして、1つの文字行を表す矩形の短辺の長さがほぼ同じで、列方向にほぼ等間隔に並んでいる矩形の集合は、本文部である可能性が高いので結合して本文領域を抽出する。また、写真領域や図領域や表領域は、文字画像よりも大きいサイズの連結黒画素により抽出される。 Next, a portion (connected black pixel) where black pixels are connected in the thinned image is extracted, and a rectangle circumscribing the connected black pixels is created. When the rectangles close to the character image size (one character rectangle) are lined up, or the rectangles that are close to the character image size either vertically or horizontally (connected black pixel rectangles with several characters connected) When the rectangles are arranged, it is highly possible that the image is a character image constituting one character line. In this case, the rectangles are combined to obtain a rectangle representing one character line. A set of rectangles having the same length of the short sides of the rectangle representing one character line and arranged at almost equal intervals in the column direction is likely to be a body part. Extract. In addition, the photograph area, the figure area, and the front area are extracted by the connected black pixels having a size larger than that of the character image.
属性情報付加部302は、領域分割部301で分割された分割領域毎に属性を付加する。図4の入力イメージデータの例として処理動作を説明する。説明しやすいように、図4内の拡張域を指定できるようにした図が、図5(a)である。
図5(a)中の領域506は、そのページ内で文字数や行数がある程度あり、文字数、行数、段落等の形態を保有する点から、総合的に判定して、『本文』の文字属性を付加することになる。残りの領域については、まず、文字画像サイズに近い矩形が含まれている領域か否かを判断する。
The attribute
The
特に、文字画像が含まれている領域は、領域内で文字画像の矩形が周期的に現れるので、分割領域内に文字が含まれている領域であるか否かを判断することができる。その結果、領域501、表502中の511から518、領域507、領域503中の領域504、領域505は文字が含まれる領域として『テキスト領域』の属性を付加する。ただし、こちらは、文字数、行数、段落等の形態を持たない点から、『本文』の属性は付加されないことになる。
In particular, since the character image rectangle periodically appears in the region including the character image, it can be determined whether or not the character region is included in the divided region. As a result, the
一方、それ以外の領域については、領域の大きさが非常に小さければ『ノイズ』と判定する。また、画素密度が小さい連結黒画素について、その内部の白画素輪郭追跡を行ったときに、その白画素輪郭の外接矩形が整然と並んでいる場合は当該領域を『表』と判断し、整然と並んでいない場合は『線画』と判断する。それ以外の画素密度の高いものは絵や写真であるとして『写真』の属性を付加する。これにより、領域502は『表』、領域503は『写真』と判断される。
On the other hand, other areas are determined as “noise” if the area size is very small. For connected black pixels with low pixel density, when tracking white pixel contours inside the connected black pixels, if the circumscribed rectangles of the white pixel contours are arranged in an orderly manner, the area is judged to be a “table” and arranged in an orderly manner. If not, it is determined as “line drawing”. The attribute of “photograph” is added because the other pixel density is a picture or a photograph. As a result, it is determined that the
さらに、表の領域については、その中のテキスト領域の位置的な関係と配置の規則性から、各テキスト領域に対して表内の属性を付加していく。これにより、テキスト領域512と514は『列ラベル』、テキスト領域511と515は『行ラベル』、テキスト領域513、516、517、518は『値』を付加する。
Further, for the table area, the attributes in the table are added to each text area from the positional relationship of the text area and the regularity of the arrangement. Thus, “column label” is added to the
更に、本文でないと判断された文字領域については、『表』、『線画』、『写真』が付加された領域の近傍(領域の上または下)に存在する場合、当該『表』、『線画』、『写真』の領域を説明する文字領域であると判断し、『キャプション』の属性を付加する。なお、『キャプション』を付加する領域は、その『キャプション』が付随する領域(『表』、『線画』、『写真』)を特定できるように、付随する領域と関連付けて保存する。これにより、表502に対して文字領域507を、写真の領域503に対して文字領域505を、それぞれキャプションとして、関連付けて保存する。
Furthermore, if a character area that is determined not to be a text exists in the vicinity (above or below the area) to which “table”, “line drawing”, or “photograph” is added, the “table”, “line drawing” ] And “photograph” areas are determined to be character areas, and a “caption” attribute is added. The area to which “caption” is added is stored in association with the associated area so that the area (“table”, “line drawing”, “photograph”) associated with the “caption” can be specified. Thus, the
また、テキスト領域について、本文部の文字画像より大きく、本文部の段組とは異なる位置にあれば『見出し』の属性を付加する。また、本文部の文字画像より大きく、本文部の段組の上部に存在すれば、属性を『小見出し』とする。更に、本文部の文字画像のサイズ以下の文字画像で、原稿の下端部や上端部に存在すれば『ページ』(もしくは、「ページヘッダ」、「ページフッタ」)の属性を付加する。また、テキスト領域として判断されたが、『本文』、『見出し』、『小見出し』、『キャプション』、『ページ』のどれにも当てはまらなかった場合、『テキスト』の属性のまま残ることになる。 If the text area is larger than the character image of the body part and is at a position different from the column of the body part, the “heading” attribute is added. If the text image is larger than the text image of the text part and exists above the column of the text part, the attribute is set to “subheading”. Further, if the character image is smaller than the size of the character image in the body portion and exists at the lower end portion or the upper end portion of the document, the attribute of “page” (or “page header” or “page footer”) is added. In addition, although it is determined as a text area, if it does not apply to any of “body”, “heading”, “subheading”, “caption”, and “page”, the attribute of “text” remains.
文字認識部303は、文字画像を含む領域(『テキスト』、『本文』、『見出し』、『小見出し』、『キャプション』領域)について、公知の文字認識処理を実行し、その結果となる文字コード列を文字情報として格納するとともに対象領域に関連付けを行う。
The
このように、領域分割部301、属性情報付加部302、文字認識部303において抽出された、領域の位置や大きさや領域属性の情報、ページの情報、文字認識結果の文字情報(文字コード情報)等は、図2の記憶部211に保存される。
As described above, the region position and size, region attribute information, page information, and character recognition result character information (character code information) extracted by the
図5(b)は、図4の入力イメージデータ例を処理した場合に、図2の記憶部211に保存される情報の例を示す。図5の504については、これが、写真や図の文字画像の領域なので、『503の写真内』の属性が追加されており、これを図5(b)の504で示されているとおりである。また、その表である表502の中については、表の内部構造情報として、図2の記憶部211に保存される情報を、図5(c)に示す。
FIG. 5B shows an example of information stored in the
リンク処理部304は、属性情報付加部302で検出されたキャプション付随オブジェクト(例えば、『表』、『線画』、『写真』)と「本文中の説明表現」の間にリンクを作成するために必要な情報を生成し、図2の記憶部211に保存する。リンク処理部304の詳細については後述する。
The
対応表現追加部305は、リンク処理部304で作成されたリンク情報をもとに、この部分の操作を行う場合に、そのリンクによって対応づけられた本文の部分と図表の部分についての操作時の表現を追加する処理を行う。図表を用いて説明を行う本文と、その本文で着目すべき図表内の領域や部分の対応を強調する表現方法を決定し、そのリンク選択時や操作時などに表示される内容として、リンク情報と関連するように対応表現情報を生成し、図2の記憶部211に保存する。対応表現追加部305の詳細については後述する。
The correspondence
フォーマット変換部306は、入力されたイメージデータ300、領域分割部301、属性情報付加部302、文字認識部303、リンク処理部304から得られた情報(例えば、ページ情報、領域の位置や大きさ、属性、文字情報、メタデータ)を用いる。そして、これらから、所定の電子文書フォーマット(例えば、PDF、SVG,XPS、OfficeOpenXML等)へ変換する。フォーマット変換で生成される電子文書は、グラフィックス等によるページ表示情報(表示用画像等)と、文字等の意味記述による内容情報(メタデータ等)を含むことになる。
The
フォーマット変換部306の処理は、大きく2つある。1つは、画像領域に対して、平坦化やスムージング、エッジ強調、色量子化、2値化等のフィルタ処理を施し、画像データ(例えば、『線画』属性が付与された領域に対応する部分の画像)を所定の電子文書フォーマットに格納できるものにすることである。
There are roughly two processes of the
実際には、画像データを、ベクトルパス記述のグラフィックスデータ(ベクトルデータ)や、ビットマップ記述のグラフィックスデータ(例えばJPEGデータ)にすることである。ベクトルデータへ変換する技術は公知のベクトル化技術を用いることが可能である。また、『文字』領域部分に対しては、2値による画像切り出し処理と、イメージデータ300からの画素消去処理などを行い、文字認識の結果である文字コードを利用した文字描画のグラフィックスデータを作成する。
Actually, the image data is converted to graphics data (vector data) of vector path description or graphics data (for example, JPEG data) of bitmap description. A known vectorization technique can be used as the technique for converting to vector data. Further, for the “character” area portion, binary image cutout processing, pixel erasure processing from the
特に、文字画像の正確さが必要な特殊なフォントや文字飾り、大きな文字の『文字』領域部分に対しては、画像データ同様にベクトルパス記述やビットマップ記述でのグラフィックスデータを作成する。また、オブジェクト検索時に、リンク使用・操作時や検索結果を特定・強調する際に表示される枠などのグラフィックス記述(ベクトルパス記述)を生成することも行う。そして、それらに対して、図2の記憶部211に保管されている領域情報(位置、大きさ、属性)、領域内の文字情報から、所定の電子文書フォーマットの電子文書を作成するのである。
In particular, for special fonts, character decorations, and “character” area portions of large characters that require the accuracy of character images, graphics data in vector path description or bitmap description is created in the same manner as image data. Also, when searching for an object, a graphics description (vector path description) such as a frame displayed when a link is used / operated or when a search result is specified / emphasized is generated. Then, an electronic document having a predetermined electronic document format is created from the area information (position, size, attribute) stored in the
このようにして生成される電子文書データ310の例を図6に示す。図6は、図4のイメージデータ400の例を処理した場合に、図2の記憶部211に保存された図5(a)と(b)のようなデータに基づいて、SVG(Scalable Vector Graphics)フォーマットで記述を行った場合の例である。
An example of the
図6の電子文書データ600において、記述601〜606は、それぞれ図5(a)の領域501〜506に対するグラフィックス記述である。ここで、601、604、605および606は文字コードによる文字描画記述の例である。
602は、表502に対応するもので、表を記述したものである。その内には、511から518までのテキスト領域の文字コードによる文字描画記述の例(実際には、511から513以外に対応するものは省略されている)である。603は切り出し処理された写真画像を貼り付ける記述の例である。これらはページ内の記述であるため、611と612で、個々のページに分けて記述できるようになっている。また、613には別のページの内容が記述されている。
In the
本実施形態の電子文書では、簡単な関数型のプログラミング言語における、操作機能などの追加ができるようになっており、621や622が、その記述例となっている。621は、例えば図15の操作機能1521のようなリンク機能を提供する部分で、その識別情報が「Link1FromSentence1ToTable1」になっているものが利用者の操作などにより選択された場合の表示・動作を記す部分である。
In the electronic document of this embodiment, an operation function or the like can be added in a simple functional programming language, and 621 and 622 are examples of the description. 621 is a part that provides a link function such as the
個々には、関数「DisplayFromSentence1ToTable1」という名前のプログラム・モジュール(関数)が呼び出されて処理されることが示されている。622では、その関数「DisplayFromSentence1ToTable1」の中で行われる処理が前述の関数型プログラミング言語で記述されている(その中身は省略表現されている)。このようにして、リンク機能は、この電子文書の利用する際に、これらの関数型のプログラム言語で記述されたプログラムが実行されることにより、実現されるのである。 Individually, it is shown that a program module (function) named function “DisplayFromSensence1ToTable1” is called and processed. In 622, the processing performed in the function “DisplayFromSentence1ToTable1” is described in the above-described functional programming language (the contents are abbreviated). In this way, the link function is realized by executing a program described in these functional programming languages when using the electronic document.
なお、ここではSVGを例として説明したが、出力フォーマットはSVGに限定されるものではなく、PDF、XPS、Office Open XML、その他のPDL系のデータ形式等に変換してもよい。 Although SVG has been described as an example here, the output format is not limited to SVG, and may be converted to PDF, XPS, Office Open XML, other PDL data formats, and the like.
図7(a)は、図3のリンク処理部304の構成例を示すブロック図である。以下、7
01〜705の機能について説明する。ここで行われる処理は、図3の領域分割部301から文字認識部303で作成され、図2の記憶部211に格納された、イメージデータ710、図5(a)で示されるテキスト内容や図表に関する領域情報711と文字情報712を利用して行われる。
FIG. 7A is a block diagram illustrating a configuration example of the
The functions 01 to 705 will be described. The processing performed here is the
リンク情報付与対象選択処理部701は入力されたイメージデータに対して、リンク情報生成を行う対象としてキャプション付随オブジェクトとそのテキスト内容を選択する。
アンカー表現抽出処理部702は、リンク情報付与対象選択処理部701で選択されたキャプション付随オブジェクトに対応付けされたキャプション領域の文字情報を解析し、アンカー表現を抽出する。
The link information addition target
The anchor expression
ここで、キャプション領域の文字情報を解析し、その中からアンカー表現(例えば、「図1」、「Table.1」等)を探して、見つかった場合には、その該当部分をアンカー表現、それ以外の部分をキャプション表現として抽出する。また、文字コードの特性や辞書等を含むことで、有意でない文字列(無意味な記号列等)を排除する機能も有する。 Here, the character information in the caption area is analyzed, and an anchor expression (for example, “FIG. 1”, “Table. 1”, etc.) is searched from the text information. The part other than is extracted as a caption expression. In addition, by including character code characteristics, a dictionary, and the like, it has a function of eliminating insignificant character strings (insignificant symbol strings, etc.).
これは、文書のテキスト部分の境界に現れる飾りや、分割線、画像を文字として解釈するような文字認識の誤認識等に対応するためである。また、アンカー表現を抽出するために、図番号等の多言語の文字列パターンや、それに対する文字認識の誤認識パターンを保有することで、アンカー表現の抽出精度と、アンカー表現の文字補正を行うことが可能である。また、キャプション表現に対しても、同様である。すなわち、自然言語処理での解析や、文字認識の誤認識補正等を行うことが可能で、アンカー表現との境目や、先頭・末尾に現れる記号や文字飾り等を補正して排除したりする機能を持たせることも可能である。 This is to cope with misrecognition of character recognition that interprets decorations, dividing lines, and images that appear at the boundaries of the text portion of the document as characters. In addition, in order to extract anchor expressions, possessing multilingual character string patterns such as figure numbers and misrecognition patterns of character recognition for them, perform anchor expression extraction accuracy and anchor expression character correction It is possible. The same applies to caption expression. In other words, it is possible to perform analysis in natural language processing, correct misrecognition correction of character recognition, etc., and correct and eliminate the boundary with anchor expression, symbols and character decorations that appear at the beginning and end It is also possible to have
本文内アンカー表現検索処理部703は、アンカー表現抽出処理部702のアンカー表現抽出処理で抽出されたアンカー表現(例えば、「図1」、「Table.1」等)を文書の本文内から検索する。そして、オブジェクトに対応する本文中のアンカー表現として検出する処理を行う。これにより、アンカー表現を含みオブジェクト内の説明を行っている本文中の説明表現をオブジェクトの説明表現候補として検出する。
The in-text anchor expression
ここでは、検索を高速化するための、検索用インデックス(インデックス作成とそれを利用した高速検索の技術は公知のインデックス作成・検索技術を用いることが可能である)を作成することが可能である。また、複数のアンカー表現の特定文字列で一括検索をすることで、高速化を実現することも可能であり、こちらの方がより効果的である。また、本文中の説明表現に対しても、それだけでなく、図番号等の多言語の文字列パターンや、図番号等の表記ゆれの文字パターンや、それらに対する文字認識の誤認識パターンを保有する。そして、これらを用いた曖昧検索を行うことで、検索精度の向上、および補正を行う機能の提供が可能である。 Here, it is possible to create a search index for speeding up the search (index creation and high-speed search technology using the same can use known index creation / search technology). . In addition, it is possible to increase the speed by performing a batch search with a specific character string of a plurality of anchor expressions, which is more effective. In addition, for explanatory expressions in the text, not only that, but also possesses multilingual character string patterns such as figure numbers, distorted character patterns such as figure numbers, and misrecognition patterns for character recognition for them. . By performing an ambiguous search using these, it is possible to provide a function for improving and correcting the search accuracy.
リンク情報生成処理部704は、リンク情報付与対象選択処理部701で選択されたキャプション付随オブジェクトや、本文内アンカー表現検索処理部703で検索・抽出された本文中のアンカー表現と図や写真の間にリンクを生成するために必要な情報を作成する。リンク情報には、リンクそのものの位置とそれらの関係等が必要になる。本発明では、アンカー表現の位置情報を得るための、文字の位置情報をそのまま格納せず、段落などの単位でまとめて、すなわち、その中の文字の外接矩形をもとめて、その位置情報だけを蓄積するようにしている。
The link information
それ以外の情報と合わせて、実際にリンクを生成するようにする処理をプログラミング言語で記述したものをリンク処理制御部705が作成し、電子文書内に格納する。そして、電子文書の利用時に、この、プログラミング言語で記述した処理が、これらの情報をもとに、リンク機能を動的に生成し、そのリンク機能が、利用者に利用可能となる。これらの詳細については後述する。ここでは、図や写真と本文中に記述されているアンカー表現の間のリンク作成のための情報を生成する。
The link
リンク処理制御部705は、リンク情報生成処理部704でリンク生成に必要な情報を生成し、蓄積する処理を行う。ここで蓄積する際に、リンク生成用のプログラミング言語で記述した処理や、リンク生成に必要なグラフィックスなどの情報などを、電子文書の記述フォーマットやプログラミング言語の仕様に応じて生成を行い、その結果を蓄積する。また、ここで、必要に応じて、予め決められたリンクのトリガーやリンクアクション設定をもとに、生成を行い蓄積される。
The link
このようにして、リンク情報は生成され、その結果を、リンク情報713として、図2の記憶部211に格納する。また、リンク処理制御部705は、これら701から704の各機能を連携・制御させる機能を提供するものである。
なお、リンク処理部304の内の各部分である図7(a)の各処理部701〜705の動作については、後述の処理手順の説明の中で、再度説明する。
In this way, link information is generated, and the result is stored as
Note that the operations of the
図7(b)は、図3の対応表現追加部305の構成例を示すブロック図である。以下、721〜725の機能について説明する。ここで行われる処理は、図3の301から304で作成され、図2の記憶部211に格納された、イメージデータ710、図5(a)で示されるテキストや図表に関する領域情報711と文字情報712、リンク情報713を利用して行われる。
FIG. 7B is a block diagram illustrating a configuration example of the correspondence
本文内アンカー近傍テキスト抽出部721は、リンク情報713を取り出し、その中にあるアンカー表現間のリンクから、本文中のアンカー表現の場所と、図表などの対応するキャプションを得る。これから、アンカー表現を含む本文中から、アンカー表現の近傍のテキスト情報を抽出する処理を行う。
The in-text anchor neighborhood
ここで、抽出するテキスト情報は、本文中のアンカー表現を含む文もしくは段落程度のものであり、そのテキストの長さ・文字数や代名詞等の他の文への参照表現の含有状況などから、適度なテキストの長さ・文字数を決めて、それを目安に抽出を行う。逆に、文があまりに長い場合などには、単純に前述の目安に従い、近傍のテキストを切り出す場合もある。このようにして、アンカー表現を含む本文中から、アンカー表現の近傍のテキスト情報を抽出する機能を提供する。ここで抽出されたテキストを、本文内アンカー近傍テキストと呼ぶこととする。 Here, the text information to be extracted is about sentences or paragraphs that contain anchor expressions in the body, and it is appropriate based on the length of the text, the number of characters, the content of reference expressions in other sentences such as pronouns, etc. Determine the length of text and the number of characters and perform extraction based on that. On the other hand, when the sentence is too long, nearby text may be cut out simply according to the above-mentioned standard. In this way, the function of extracting text information in the vicinity of the anchor expression from the text including the anchor expression is provided. The extracted text will be referred to as anchor text in the body text.
本文内テキスト・図表内テキスト検索部722は、本文内アンカー近傍テキスト抽出部721で抽出された本文内アンカー近傍テキスト内の単語や文字列と、リンクにより対応する図表内のテキストに同一の単語列や文字列が含まれているものを検索する。検索方法は、単語列単位の比較や、自然言語処理での形態素解析による単語の抽出で得られた単語を得て検索を行う方法などが考えられる。
The text in text / chart
また、図表内テキストは、図表内の項目などであることが多いため、文や段落よりは、単語や短文などが多いことが容易に予想できる。したがって、検索・比較を行う際に、こちらを検索・比較のキーとする方が効果的であることも考えられる。本発明の実施形態では、どのような方法でもよい。何れにしろ、ここでは、リンクにより対応する図表内のテキストに出現する同一のテキスト表現を抽出する機能を提供する。そして、この結果として、本文内アンカー近傍テキスト内の単語や文字列と、リンクにより対応する図表内のテキストに同一のテキスト表現を抽出する。これを対応表現と呼ぶこととする。 Further, since the text in a chart is often an item in the chart, it can be easily predicted that there are more words, short sentences, etc. than sentences and paragraphs. Therefore, when performing search / comparison, it may be more effective to use this as a key for search / comparison. Any method may be used in the embodiment of the present invention. In any case, here, the function of extracting the same text expression appearing in the text in the corresponding chart by the link is provided. As a result, the same text expression is extracted from the word or character string in the text in the vicinity of the anchor in the body and the text in the diagram corresponding to the link. This is called a correspondence expression.
対応表現内容決定部723は、本文内テキスト・図表内テキスト検索部722で得られた対応表現をもとに、これらに対して、どのような強調表現などを行うのがよいかを決定する処理を行う。1つの図表に対して、複数のリンクがある場合があり、かつ、1つのリンク情報に対して、複数の対応表現がある場合がある。そして、それらの対応表現には、同じ内容のテキスト表現が含まれることがある。ここでは、このような関係をもとに、利用者にとって、個々のリンクについて、そのリンクの違いと本文中と図表中にある対応表現の違いが明確になるように、強調表現の選択を行う。
The correspondence expression
基本的には、リンク表示・使用時に、そのリンクでの対応表現同士に対しては、同一の強調表現パターンを用いる。また、同一図表に対する複数のリンクにおいて、同一の対応表現がある場合には、なるべく同じ強調表現を用いるようにする。また、対応表現が、表内の行や列のラベル(名前)等や、図中の出現場所の近さなどに応じて、これらを対応表現の属性とみなして、同一の強調表現パターンを用いるようにする。 Basically, when a link is displayed and used, the same emphasis expression pattern is used for corresponding expressions in the link. In addition, when there are the same corresponding expressions in a plurality of links to the same diagram, the same emphasized expression is used as much as possible. Also, the correspondence expression is regarded as an attribute of the correspondence expression according to the label (name) of the row or column in the table, the proximity of the appearance location in the figure, etc., and the same emphasized expression pattern is used. Like that.
ここでいう、強調表現のパターンとは、文字の下線や囲み、色、フォントの変更、文字を太くしたりするものから、文字を点滅させたり、揺らしたり、色を時間的に変更したりするような、動きのある表現でも構わない。当然、これらの組合せも含むものとする。そして、個々の強調表現としては、これらの各パターンにおいて、下線や囲み、文字の太さなどの度合いや、配色など、同一の強調パターンであっても、さまざまな設定や値があり、それらを変化させることが可能である。このようにして、各リンクの対応表現に対する強調表現を選択していく。これにより、リンク表示・利用時に、対応する本文中の表現と図表中の表現の出現位置と、その対応状況を容易に利用者に示せるような強調表現を決定する機能を提供する。 Here, the emphasis pattern is from underlining and enclosing characters, changing the color and font, and making the characters thicker, blinking, shaking, and changing the color over time. Such a moving expression is also acceptable. Of course, these combinations are also included. And as for each emphasis expression, there are various settings and values even in the same emphasis pattern such as underline, surrounding, character thickness, color scheme, etc. in each of these patterns. It is possible to change. In this way, an emphasized expression for the corresponding expression of each link is selected. This provides a function for determining an emphasized expression that can easily indicate to the user the corresponding expression in the text, the appearance position of the expression in the chart, and the corresponding situation when displaying and using the link.
対応表現追加処理部724は、個々のリンク情報に対応するように、対応表現内容決定部723で決定された対応表現に対する強調表現情報生成処理を行い、蓄積する機能を提供する。ここで蓄積する際に、リンク生成用のプログラミング言語で記述した処理や、リンク生成に必要なグラフィックスなどの情報などを、電子文書の記述フォーマットやプログラミング言語の仕様に応じて生成を行い、その結果を蓄積する。また、ここで、必要に応じて、予め決められたリンクのトリガーやリンクアクション設定をもとに、生成を行い蓄積される。
Corresponding expression
このようにして、対応表現情報は生成され、その結果を、714の対応表現情報として、図2の記憶部211に格納する。また、対応表現追加制御部725は、これら721から724の各機能を連携・制御させる機能を提供するものである。
なお、対応表現追加部305の内の各部分である図7(b)の各部721〜725の動作については、後述の処理手順の説明の中で、再度説明する。
最終的には、ここで生成されたものが、図3のフォーマット変換部306に出力され、電子文書データ310の中に格納されることになる。
In this way, the correspondence expression information is generated, and the result is stored as the correspondence expression information 714 in the
Note that the operations of the
Finally, the data generated here is output to the
次に、実施形態の文書処理システムで実行する処理全体の概要を、図8のフローチャートを用いて説明する。図8及び図9に示すフローチャートは、図2のデータ処理部218(図3の各処理部301〜306)によって実行されるものとする。本実施形態では、図2のCPU205が記憶部211(コンピュータ読取可能な記憶媒体)に格納されたコンピュータプログラムを読み取り実行することによって、データ処理部218(図3の各処理部301〜306)として機能するものとする。しかし、これに限るものではなく、例えば、図2のデータ処理部218(図3の各処理部301〜306)を、電子回路等のハードウェアで実現するように構成してもよい。
Next, an overview of the entire process executed by the document processing system of the embodiment will be described with reference to the flowchart of FIG. 8 and 9 is executed by the
図8は、図1のMFP100で入力された複数ページのイメージデータを、複数ページからなる電子文書データに変換する処理のフローチャートである。なお、複数ページのイメージデータとしては、例えば、図4のページ画像が入力されるものとする。以下、図8のフローチャートの各説明を行う。
FIG. 8 is a flowchart of processing for converting a plurality of pages of image data input by
S801において、図7(a)のリンク処理制御部705は、以降の処理のための初期化処理と、図3のフォーマット変換部306が電子文書の作成をできるようにするための準備の処理を行う。
In step S801, the link
S802において、図4のページ画像が図2の記憶部211に格納されているので、この中から処理対象となるページを、ページの先頭から順番に選んでいく処理を行う。これを行い、S807での条件分岐を利用してループ処理の形態とすることで、S802からS806までの処理を、各ページに施すことを可能としている。したがって、最初にこの処理を行った場合は先頭ページが選ばれ、以後、この処理が行われるたびに、その次のページが選ばれ、その選ばれたページの中のイメージデータ(図3の300、図7の710)が以後の処理の対象となる。
In S802, since the page image of FIG. 4 is stored in the
S803において、領域分割部301は、S802で選択された1ページ分のイメージデータから領域を抽出する領域分割を行う。例えば、図4のイメージデータ400から、図5(a)で示される各領域を抽出する。この各領域はオブジェクトという、文書内の構成要素の一部とし、その識別のためにオブジェクトIDを使用することにする。
In step S803, the
S804において、属性情報付加部302は、S803で分割された各領域に属性を付加する。図5(a)の例では、領域503には『写真』、領域505は『キャプション』の属性といったように付加する。
さらに、このキャプション505には、付随する領域が503であるという情報も付加する。この付加した結果の一部を示したのが図5(b)である。この中で、図5(a)内の各オブジェクトIDに対して、図5(b)の「属性」と「キャプションが付属するオブジェクトID」の値が、この処理の結果である。
In step S804, the attribute
Further, information that the accompanying area is 503 is also added to the
さらに、図表に対しては、その中の要素についても、オブジェクトとみなし、その属性等の情報を付加していく。表502に対して行った結果の一部が示されているのが、図5(c)である。この中に、表の中のテキスト領域である、512から518の属性等の情報が示されている(ただし、514から518までは、同様なので省略)。ここで、表内の位置として「行位置」の値、「列位置」の値、属性として「行ラベル」、「列ラベル」、「値」が付加されている。 Furthermore, elements such as elements are also regarded as objects and information such as attributes is added to the chart. FIG. 5C shows a part of the result performed on the table 502. In this, information such as attributes from 512 to 518, which are text areas in the table, is shown (however, the information from 514 to 518 is omitted because it is the same). Here, a value of “row position”, a value of “column position” are added as positions in the table, and “row label”, “column label”, and “value” are added as attributes.
なお、座標X、座標Y、幅W、高さHは、そのオブジェクトの領域に関する位置と大きさを示すものである。これらは、S812でリンク情報や対応表現情報から、プログラミング言語で記載される計算機プログラムやグラフィックスオブジェクトなどを作成し、電子文書データ310内に格納する際に使用される。具体的には、その計算機プログラムで作成される表示部品やグラフィックスオブジェクトなどにおいて、その位置や大きさなどを決める際に使用されることになる。
Note that the coordinates X, coordinates Y, width W, and height H indicate the position and size of the object area. These are used when a computer program or a graphics object described in a programming language is created from the link information and the corresponding expression information in S812 and stored in the
S805において、文字認識部303は、S804でテキスト(本文、キャプション、見出し、小見出し等)の属性を付加した領域に対して文字認識処理を実行し、その結果を文字情報として対象領域に関連付けて保持する。この結果が、図5(b)のテキスト情報に記されている。
In step S805, the
S806において、S803からS805、すなわち、領域分割部301、属性情報付加部302、文字認識部303で作成された図5(b)と図5(c)の情報を図2の記憶部211に、1ページ分の情報として蓄積を行う。
In S806, the information of FIG. 5B and FIG. 5C created by S803 to S805, that is, the
S807において、全てのページに対してS803からS806の処理を行ったかどうか確認し、まだ残っている場合には、S802に戻って、残っているページを選択し処理を行うようにする。全てのページが終わったら、S808に進む。 In step S807, it is confirmed whether or not the processing in steps S803 to S806 has been performed on all pages. If the pages remain, the process returns to step S802 to select and process the remaining pages. When all pages are finished, the process proceeds to S808.
S808において、リンク処理部304は、リンクの生成に必要となる情報を、抽出して蓄積するために、まずは、図7のリンク情報付与対象選択処理部701において、キャプション付随オブジェクトとそのテキスト情報を選択する。次に、アンカー表現抽出処理部702において、その中からアンカー表現の抽出を行う。これを、全ページのすべてのキャプション付随オブジェクトに対して行う。実際には、アンカー表現がない場合もあるので、アンカー表現が得られたものが、このあとの処理対象となる。
In step S808, in order to extract and accumulate information necessary for link generation, the
アンカー表現とは、元の文書中でこのキャプションが付随するオブジェクトを識別するための文字情報(文字列)であり、キャプション表現とはオブジェクトを説明するための文字情報(文字列)である。オブジェクトに付随するキャプションには、アンカー表現のみが記載される場合、キャプション表現のみが記載される場合、両方が記載される場合、さらにどちらでもない場合がある。 The anchor expression is character information (character string) for identifying the object accompanied by the caption in the original document, and the caption expression is character information (character string) for explaining the object. In the caption associated with the object, only the anchor expression is described, only the caption expression is described, both are described, and neither is the case.
例えば、アンカー表現は「図」や「Fig」等、特定の文字列と、番号や記号との組み合わせ表現される場合が多い。そこで、それら特定の文字列を登録したアンカー文字列用辞書を予め用意しておき、キャプション表現を該辞書と比較してアンカー部分(アンカー文字列+数記号)を特定すればよい。そして、キャプション領域の文字列のうち、アンカー表現以外の文字列をメタデータ表現として判断すればよい。 For example, the anchor expression is often expressed by a combination of a specific character string such as “figure” or “Fig” and a number or symbol. Therefore, an anchor character string dictionary in which these specific character strings are registered may be prepared in advance, and the anchor expression (anchor character string + number symbol) may be specified by comparing the caption expression with the dictionary. Then, a character string other than the anchor expression among the character strings in the caption area may be determined as the metadata expression.
例えば、「図1 AAA」というキャプションの場合には、「図1」がアンカー文字列にあたり、「AAA」がキャプション文字列に当たる。キャプション表現の文字数が極端に少なかったり、有意な文字列とは思えなかったりする場合(例えば、記号列"― ― ― ― ―"などの場合)がある。このような場合には、文書の区切りなどの印が文字列として文字認識されたり、文字ではないものが文字認識されていたりする可能性があるので、この場合には、キャプションではないと判定し、アンカー文字列の抽出は行わないようにする。 For example, in the case of the caption “FIG. 1 AAA”, “FIG. 1” corresponds to the anchor character string, and “AAA” corresponds to the caption character string. There are cases in which the number of characters in the caption expression is extremely small, or it may not be considered a significant character string (for example, in the case of a symbol string "------", etc.). In such a case, there is a possibility that a mark such as a document separator is recognized as a character string, or a character that is not a character may be recognized. In this case, it is determined that it is not a caption. The anchor character string is not extracted.
さらに、アンカー表現が、文字認識の誤りなどで文字が誤っている場合があるので、文字認識の誤り訂正用のパターン辞書を保有し、これを用いて補正を行う。たとえば数字の一「1」とアルファベットの小文字のL「l」などである(これは、人間にとっても誤りやすい)。 Furthermore, since the anchor expression may have a wrong character due to an error in character recognition or the like, a pattern dictionary for correcting the error in character recognition is held, and correction is performed using this. For example, the number “1” and the lowercase letter L “l” (this is easily mistaken for humans).
また、アンカー表現に対して、その表現だけでなく、図番号等の多言語の文字列パターンや、図番号等の表記ゆれの文字パターンや、それらに対する文字認識の誤認識パターンを保有する。そして、これらをもとに曖昧検索用のアンカー表現辞書を作成し、これを利用した検索を行う方法が考えられるが、本発明の実施形態では、どのような方法を用いてもよい。 In addition, the anchor expression has not only the expression but also a multilingual character string pattern such as a figure number, a character pattern that is notated such as a figure number, and a misrecognition pattern for character recognition. A method for creating an anchor expression dictionary for ambiguous search based on these and performing a search using the dictionary can be considered, but any method may be used in the embodiment of the present invention.
S809において、本文テキストに対して、アンカー表現の検索を行う。具体的には、リンク処理部304は、リンクの生成に必要となる情報を、抽出し蓄積するために、本文内アンカー表現検索処理部703は、アンカー表現抽出処理部702のアンカー表現抽出処理で抽出されたアンカー表現を文書の本文内から検索する。そして、オブジェクトに対応する本文中のアンカー表現として検索を行う。このときに、同一のアンカー表現が、本文中から複数発見される場合もある。これは、1つの図表が、本文中で何度も参照されている場合などに生じるものである。
In step S809, an anchor expression is searched for the body text. Specifically, the
S810において、リンク処理部304は、リンク生成処理を行う。具体的には、リンク情報生成処理部704は、リンク情報付与対象選択処理部701で選択されたキャプション付随オブジェクトや、本文中のアンカー表現と図や写真の間にリンクを生成するために必要な情報を作成する。そして、リンク処理制御部705は、リンク情報生成処理部704で生成したリンク生成に必要な情報を、図2の記憶部211に格納する。
In step S810, the
S811において、対応表現追加部305で対応表現の情報を生成し、図2の記憶部211に格納する。この処理については、以降に詳細に説明を行う。
S812において、フォーマット変換部306は、イメージデータ300、および図2の記憶部211に保存された情報に基づいて、グラフィックデータ生成などを行い、電子文書データ310への変換を行う。この際に、リンク情報とその対応表現情報をもとに、プログラミング言語で記述されたリンク作成処理及び対応表現の処理と合わせて、フォーマット変換部306に渡し、フォーマット変換部306が電子文書の中に格納されることになる。以上で、図8の説明を終了する。
In step S811, the correspondence
In step S812, the
以上の処理は、あくまでも、一般的な文書画像に対する処理であって、その順序や処理の詳細については、本発明のオブジェクトのリンク機能を実現するために、行うものであれば、何でも構わない。例えば、自然言語処理や辞書の応用で、文字認識の誤り訂正を持つ文字認識を行ったり、特定の表現を利用して情報を抽出・利用したりするものであってもよい。 The above processing is merely processing for a general document image, and the order and details of processing may be anything as long as they are performed in order to realize the object link function of the present invention. For example, character recognition with error correction of character recognition may be performed by application of natural language processing or a dictionary, or information may be extracted and used using a specific expression.
また、文書のスタイルや文書の内容の分類などで、各解析方法を最適化してもよい。また、オブジェクトは画像認識などの技術を用いて、その内容などの情報を抽出してもよい。また、入力となる文書画像は、ページ記述言語などで記載されていてもよい。このように、様々なものが考えられるが、本発明の実施形態のオブジェクトのリンク機能を実現するために本文のテキストと、オブジェクト内のキャプション表現やアンカー表現を利用するものであれば、どのようなものでも構わない。 Further, each analysis method may be optimized based on the document style, the document content classification, and the like. Further, information such as contents of the object may be extracted by using a technique such as image recognition. The input document image may be described in a page description language or the like. In this way, various things can be considered, but what is necessary is that the text of the body and the caption expression or anchor expression in the object are used to realize the object linking function of the embodiment of the present invention. It does n’t matter.
次に、図8中のS811の処理の詳細について、図9を用いて説明する。ここでの処理は、対応表現追加部305内の各部分において行われる処理であり、対応表現情報の生成を行い、これを図2の記憶部211に格納することを行うものである。説明のために、図4の文書を処理している場合を例に挙げて説明を行う。
Next, details of the processing of S811 in FIG. 8 will be described with reference to FIG. The processing here is processing performed in each part in the correspondence
S901において、図7(b)の対応表現追加制御部725は、以降の処理のための初期化処理と、図2の記憶部211に格納された情報、特に、図7(b)のリンク情報713が利用できるようにする処理を行う。
In step S901, the correspondence expression
S902において、対応表現追加制御部725は、S901で利用できるようになったリンク情報に対して、順番に1つずつ選んで取り出す処理を行う。本実施形態においては、S912での条件分岐を利用してループ処理の形態とすることで、S902からS911までの処理を、各リンク情報に施すことを可能としている。したがって、最初にこの処理を行った場合は最初のリンク情報が選ばれ、以後、この処理が行われるたびに、その次のリンク情報が選ばれ、その選ばれたリンク情報が以後の処理の対象となる。
In step S <b> 902, the correspondence expression
ここでは、まず、図10(a)のリンク情報から、その中のオブジェクトIDが1001のオブジェクトが選ばれたこととする。この図10(a)は、図4の文書に対して作成された図5(b)と図5(c)から作成されたもので、1001は、図5(a)の本文テキスト506に対して、作成されたものである。
Here, first, it is assumed that an object having an object ID of 1001 is selected from the link information in FIG. FIG. 10A is created from FIG. 5B and FIG. 5C created for the document of FIG. 4, and 1001 corresponds to the
同様に、1002は、図5(a)の表である502に対して、作成されたものである。これらが新たなオブジェクトIDを保有しているのは、このリンクの表示・機能を実現するために、電子文書の中で表示・機能する新たなオブジェクトとして作成されたことを意味している。また、両方が互いに、リンク対象のオブジェクトIDで差しあっていることから分かるように、これらは、図8の処理において、アンカー表現「Table.1」を介して、対応づけられたことを意味している。 Similarly, 1002 is created for 502 which is the table of FIG. The fact that they have a new object ID means that they are created as new objects that are displayed and functioned in the electronic document in order to realize the display and function of this link. Further, as can be seen from the fact that both are mutually linked by the object ID to be linked, these mean that they are associated via the anchor expression “Table.1” in the processing of FIG. ing.
ただし、1001は表502から本文テキスト506へのリンクであり、1002は本文テキスト506から表502へのリンクである。ここでは1対1のリンクになっているが、双方向のリンクではなく、片方向の2つのリンクになっている。これは、実際には、図表は本文中の複数の部分(文や段落など)から参照されることがあるので、1対多のリンクになることもあるためであり、また、個々のリンクに独自の機能や表現を持たせることを可能とするためでもある。
However, 1001 is a link from the table 502 to the
S903において、本文内アンカー近傍テキスト抽出部721は、S902で選択されたリンク情報から、その中にあるアンカー表現間のリンク情報をもとに、図表などの対応するキャプションや見出し、ラベルを取り出す。図4の例の場合には、これを行うことで、図10(a)の場合は、1002の基になった502が、図5(b)から表であることがわかり、図5(c)から、行ラベルや列ラベルである、「大阪支店」や「2010年」などを得ることになる。
In S903, the anchor-in-text anchor
S904において、本文内アンカー近傍テキスト抽出部721は、S902で選択されたリンク情報から、その中にあるアンカー表現間のリンク情報をもとに、本文中のアンカー表現の近傍のテキストを取り出す。図4の例の場合には、これを行うことで、図10(a)の場合は、1001の基になった506が、図5(b)から本文であることがわかり、図8の処理でのアンカー表現の近傍のテキスト情報を得て、「A社の年間売上・・・」の表現を得ることになる。
In S904, the anchor vicinity
S905において、本文内テキスト・図表内テキスト検索部722は、本文内アンカー近傍テキスト抽出部721で得た図表のキャプション、見出し、ラベルなどのテキスト表現について、アンカー表現の近傍のテキスト情報に対して検索を行う。図4の例の場合には、これを行うことで、「大阪支店」や「2010年」が含まれていることが分かる。これは、図5(b)での511と523、512と522が対応していることが分かる。この対応関係が、このリンク情報に対する対応表現追加の対象となる。
In step S <b> 905, the text-in-text / in-table
S906において、本文内テキスト・図表内テキスト検索部722で対応関係が得られたかどうかを判定し、判定結果に応じて分岐する処理を行う。対応関係が得られた場合は、S907へ進み、得られなかった場合は、S910へ進む。
In step S906, it is determined whether the correspondence is obtained by the text in text / graph in
S907において、対応表現内容決定部723は、本文内テキスト・図表内テキスト検索部722で得られた対応表現をもとに、これらに対して、どのような強調表現などを行うのがよいかを決定する強調表現方式決定処理を行う。図4の例の場合には、これを行うことで、以下のようなものが決定される。
In step S <b> 907, the correspondence expression
なお、この内容を示したものが図10の(b)である。ここでは、S905で得られた対応するテキスト表現である「大阪支店」と「2010年」に対して、その文字列部分に対して、文字列領域枠が設定される。ただし、文字列領域枠は、同じ1001に対応する者同士は、異なる色となる等、区別できるようになっており、かつ、対応する者同士は同じ色となるなど、対応していることが分かるようになる。これにより、「2010年」に対して1014、「大阪支店」に対して1015が作成されている。また、同様に、1002について、図5(a)の領域502に対して、操作ボタン1021、領域枠表示1022、文字列領域枠表示1024、1025が作成されることになる。
This content is shown in FIG. 10 (b). Here, a character string area frame is set for the character string portion of “Osaka branch” and “2010”, which are the corresponding text expressions obtained in S905. However, the character string area frames can be distinguished such that persons corresponding to the same 1001 have different colors, and the corresponding persons have the same color. I will understand. Thus, 1014 is created for “2010” and 1015 is created for “Osaka branch”. Similarly, for 1002, the operation button 1021, the area frame display 1022, and the character string area frame displays 1024 and 1025 are created for the
S908において、対応表現内容決定部723は、同一テキストの図表の配置などの関係から指し示されているものを対象に追加することを行う。これには、図表内の位置関係や配置の情報が用いられる。図4の例の場合には、図5(c)の表の情報から「大阪支店」と「2010年」がそれぞれ行と列であり、それで指示される図5(a)の513があることが分かるので、この「500万」に対して、文字列下線1023が作成されることになる。
In step S <b> 908, the correspondence expression
S909において、対応表現内容決定部723は、S908で追加されたものに対して、対応するものを作成し追加を行う。図4の例の場合には、これを行うことで、1023に対応するものが必要であることが分かる。しかし、本文中には「500万」というテキスト表現がないことが、本文内テキスト・図表内テキスト検索部722がS905で行った検索でわかっている。これに対応するものとして、アンカー表現の近傍のテキスト情報を選択することとする。これにより、文字列下線1013が作成されることになる。
In S909, the correspondence expression
S910において、対応表現内容決定部723は、図表側と本文側の全体の対応表現を決定する。強調表示のパターンとして、1001については、アンカー表現である「Table.1」の部分521に対して、図10(b)に示すように、操作ボタン1011の追加を行っている。これはリンク機能を追加する場合に、必ず行われるもので、これを操作すると、リンクで対応する先へと文書の表示が移動する機能が付加されているものである。
In step S910, the correspondence expression
次に、本文中のアンカー表現近傍全体に対して、図10(b)に示すように、領域枠表示1012が追加されている。この領域枠表示は、対応する表502に対する枠表示と同一の強調表現になるようになっていて、例えば同一の色などに設定される。また、文書内の内容と区別できるように、異なる色や点滅するなどの動きで、それらと区別できるように設定される。 Next, an area frame display 1012 is added to the entire vicinity of the anchor expression in the text as shown in FIG. This area frame display has the same emphasized expression as the frame display for the corresponding table 502, and is set to the same color, for example. In addition, it is set so that it can be distinguished from the contents in the document by different colors or movements such as blinking.
前述の条件から、オブジェクトID1011から1015は、オブジェクトID1021から1025にそれぞれ対応しており、その対応毎に異なる色や表現になるようにしてあるが、対応するもの同士は同一の色や表現になるようになっている。また、表502に対して、本文中に複数のアンカー表現があることで、複数の場所から参照されている場合がある。その場合は、別のアンカー表現に対して領域枠表示1012と領域枠表示1022に相当するオブジェクトが生じる。これらは、領域枠表示1012と領域枠表示1022と同様の表現パターンを使用するが、色などは異なるように設定されることになる。 From the above-mentioned conditions, the object IDs 1011 to 1015 correspond to the object IDs 1021 to 1025, respectively, so that different colors and expressions are used for each of the correspondences, but the corresponding objects have the same color and expression. It is like that. Further, the table 502 may be referred to from a plurality of places due to a plurality of anchor expressions in the text. In that case, objects corresponding to the area frame display 1012 and the area frame display 1022 are generated for another anchor expression. These use the same expression pattern as the area frame display 1012 and the area frame display 1022, but are set to have different colors.
S911において、対応表現追加処理部724は、これまで作成された対応表現情報をリンク情報ごとにまとめて、図2の記憶部211に記憶する。これが、図7(b)の対応表現情報714である。この情報をもとに、図8のS812で対応表現を実現する操作やグラフィックスオブジェクトや計算機プログラムを作成し、電子文書データに格納することになる。
In S911, the correspondence expression
S912は、全てのリンク情報に対して対応表現情報が付加されるように、まだ付加されていないリンク情報があるどうかを判定し、判定結果に応じて分岐する処理を行う。付加されていないリンク情報がある場合には、S902へ移動して処理を継続することになる。また、付加されていないリンク情報がない場合は、終了となる。 In step S912, it is determined whether there is link information that has not yet been added so that the corresponding expression information is added to all link information, and a process of branching according to the determination result is performed. If there is link information that has not been added, the process moves to S902 to continue the processing. If there is no link information not added, the process ends.
このようにして作成された電子文書データを利用しているところを図11に示す。これは、図10(b)の情報に従って作成されたもので、オブジェクトID1011から1015と1021から1025までが、1111から1115と1121から1125に、対応している。1111と1121はリンク機能そのものの表示で操作可能である。 FIG. 11 shows the use of the electronic document data created in this way. This is created according to the information of FIG. 10B, and object IDs 1011 to 1015 and 1021 to 1025 correspond to 1111 to 1115 and 1121 to 1125, respectively. 1111 and 1121 can be operated by displaying the link function itself.
1111と1121は、このページが利用者の操作で着目状態(フォーカスされる)状態になると表示される。さらに、その際に、1111か1121が、利用者の操作で着目状態(フォーカスされる)状態になると1112から1115と1122から1125も表示されるようになる。 1111 and 1121 are displayed when this page is in a focused state (focused) by a user operation. Further, at that time, when 1111 or 1121 becomes a focused state (focused) by the user's operation, 1112 to 1115 and 1122 to 1125 are also displayed.
ただし、同一のページにない場合には、表示されているページのものしか表示されないようになっている。1111と1121は、利用者に選択される等で機能を呼び出されると、リンク先が着目状態(フォーカスされる)状態になるように変更される。これにより、表示されるページの移動が伴う場合がある。 However, if they are not on the same page, only the displayed page is displayed. 1111 and 1121 are changed so that the link destination is in a focused state (focused) when a function is called by being selected by the user. Thereby, the displayed page may be moved.
たとえば、1111を選択すると、1121が着目状態(フォーカスされる)状態となり、1111から1115と1121から1122の表示は持続することになる。これにより、利用者は、1111の本文の表現が指示している部分の表に移動し、かつ、対応を示す1123と1124が連携している表現で、1125の強調表現もあり、この「500万」という表現を簡単に見つけることが可能となる。この内容を利用者が理解したら、1121を選択することで、1111を選択したときと同様に、また元の本文の部分へ戻ることが可能で、その該当する内容の部分が1112、1113、1114、1115で再度確認することが可能となっている。 For example, if 1111 is selected, 1121 becomes a focused state (focused) state, and the display of 1111 to 1115 and 1121 to 1122 is continued. As a result, the user moves to the table of the portion indicated by the expression of the text of 1111 and is an expression in which 1123 and 1124 indicating the correspondence are linked, and there is also an emphasis expression of 1125. It is possible to easily find the expression “ten thousand”. When the user understands this content, by selecting 1121, it is possible to return to the original body part in the same manner as when 1111 is selected, and the corresponding content part is 1112, 1113, 1114. 1115 can be confirmed again.
このようにして、複数ページの電子文書を入力として、ページ単位で「オブジェクト」と「オブジェクトの説明文」との間に相互リンクを自動的に作成し、マルチページの電子文書を生成することが可能となる。かつ、同時に、それを使用した場合の「オブジェクトの説明文」の個々の説明と、対応する「オブジェクト」内の特定の部分を容易に分かるようにする。 In this way, it is possible to generate a multi-page electronic document by automatically creating a mutual link between an “object” and an “object description” in units of pages by using a multi-page electronic document as an input. It becomes possible. At the same time, the individual description of the “object description” when it is used and the specific part in the corresponding “object” are easily understood.
また、オブジェクト内の特定の部分内の同一単語列の構造的な関係も利用して、強調表現方式やその特性を決定するようにした。これにより、対応する部分を直観的にわかりやすく示すことができるので、オブジェクト内の特定部分と、本文中のオブジェクトの説明文内の対応する部分に対して、その対応関係を容易に識別できるようにする強調表現することができる。これにより、対応する部分を探す手間が省けて、文書の可読性を向上させることが可能となった。 Also, the emphasis expression method and its characteristics are determined using the structural relationship of the same word string in a specific part in the object. As a result, the corresponding part can be shown intuitively and easily, so that the correspondence between the specific part in the object and the corresponding part in the description of the object in the text can be easily identified. Can be emphasized. As a result, it is possible to improve the readability of the document by eliminating the trouble of searching for the corresponding part.
(第2の実施形態)
第1の実施形態は、スキャナ等を使用した場合での利用や、電子文書のイメージやデータなどから利用した場合であった。これに対して、文書作成時でも、同じようなリンク機能とそれをわかりやすくするための対応表現などを付加することが可能である。これを利用することで、利用者が読む際に、わかりやすい動作と表現が伴った文書の作成を可能とする。
(Second Embodiment)
The first embodiment is used when a scanner or the like is used, or when used from an image or data of an electronic document. On the other hand, when creating a document, it is possible to add a similar link function and a corresponding expression to make it easier to understand. By using this, it is possible to create a document with easy-to-understand operations and expressions when the user reads.
図12(a)は、文書の編集時の画面の図である。作成されるのは、第1の実施形態の図4の文書で、それを作成している途中の状態の図となっている。この作成途中の文書が1200であり、1221はカーソルと呼ばれる、利用者が現在、文字などを入力している場所を示すものである。 FIG. 12A shows a screen when editing a document. What is created is the diagram of FIG. 4 of the first embodiment, which is a diagram in the middle of creating the document. The document being created is 1200, and 1221 is a cursor, which indicates a place where the user is currently inputting a character or the like.
近年の文書作成・編集用のワードプロセッサでは、このような文字入力を行っている場合に、入力内容を予測して入力候補を示す機能を有するものがある。通常は、よく使われる単語や文などの表現を学習しておき、利用者がその全部を入力する前に入力候補として示し、それが適切なものであれば利用者は、それを選択し、全部を入力することなく、その単語や文の入力を終えることができる。これは、入力予測による入力補完機能などと呼ばれている。 Some word processors for document creation / editing in recent years have a function of predicting input contents and indicating input candidates when such character input is performed. Usually, you will learn frequently used expressions such as words and sentences, and show them as input candidates before the user inputs all of them, and if it is appropriate, the user selects it, You can finish entering the word or sentence without entering everything. This is called an input complement function based on input prediction.
さらに、単純に入力された回数や頻度だけでなく、作成中の文書の中でよく使われている単語や文を、入力予測の候補として優先して使用するものがある。これは文書によって、単語や文の利用頻度が異なる場合に有効な手法である。 Furthermore, there are some which preferentially use words and sentences frequently used in a document being created as candidates for input prediction, as well as the number and frequency of simple input. This is an effective technique when the frequency of use of words and sentences varies depending on the document.
このような方法を利用する場合に、文書中の図表やその一部を指し示す入力を行った際に、近傍の図表内の表現を予測候補として提示し、それが選択された場合を考える。この時に、単に入力文字として記録するだけでなく、その入力部分と選択された表現を有する図表にリンク情報を持たせるようにするのである。 When such a method is used, when an input indicating a diagram or part thereof in a document is performed, an expression in a nearby diagram is presented as a prediction candidate, and the case is selected. At this time, not only is it recorded as an input character, but also a diagram having the input portion and the selected expression is provided with link information.
さらに、本文中の方言と、図表の対応がリンク情報として記録されるようになるので、これに対して対応表現も、推奨候補として提案し、その内容が利用可能と利用者が判断して選択したら、これを追加することにする。このようにすることで、作成された文書を読む場合に、本文内容と図表の中の対応する部分を見つけやすく、かつ、わかりやすく示すことができるようになる。 In addition, correspondence between dialects in the text and charts will be recorded as link information, so corresponding expressions are also proposed as recommended candidates, and the user decides that the contents can be used and selects them Then I will add this. In this way, when the created document is read, it is easy to find and show the corresponding contents in the text content and the chart.
図12(b)は、図12(a)の入力中の文書の内容を示しやすいように、記したものである。以下、図14のフローチャートに従って、本実施形態の文書処理装置の文書作成時の処理の内容を説明する。 FIG. 12B shows the contents of the document being input shown in FIG. In the following, the contents of the process at the time of document creation of the document processing apparatus of this embodiment will be described with reference to the flowchart of FIG.
S1401は、文書編集の開始が指示された場合の初期化処理に関するものである。これによって、文書作成を行うため必要な、文書内の情報に対して参照、追加、修正、削除などを行うことができるようになる。
S1402は、実際に文書が入力され始めた部分で、入力内容も含めて操作指示の内容として受け取る。
S1403は、操作指示が入力終了を指示したかどうかの判定を行う。ここで、入力終了と指示された場合は、S1411へ進む。そうでない場合は、操作内容は、入力指示や内容であると判断したことになり、S1404へ進む。
S1401 relates to an initialization process when an instruction to start document editing is given. This makes it possible to refer to, add, modify, and delete information in the document that is necessary for creating the document.
S1402 is the part where the document actually starts to be input, and is received as the contents of the operation instruction including the input contents.
In step S1403, it is determined whether or not the operation instruction instructs to end input. If it is instructed to end input, the process advances to step S1411. Otherwise, it is determined that the operation content is an input instruction or content, and the process proceeds to S1404.
S1404は、入力予測として、近傍の図表内のテキスト表現であるキャプションや見出し、ラベル等が予測可能かどうかを調べる。図12(a)の状況の場合だと、表の1202からの1211から1213等や1207、図の1203からの1204、1205を、近傍の図表内のテキストとして取り出し、入力内容のテキストと比較を行う。
S1405は、S1404の比較結果を利用して条件分岐する処理であり、含まれていた場合は、S1406へ進む。含まれなかった場合は、S1410へ進む。
In step S1404, as input prediction, it is checked whether captions, headings, labels, and the like, which are text expressions in nearby charts, can be predicted. In the case of the situation in FIG. 12 (a), 1211 to 1213, etc., 1207 from 1202 in the table and 1204, 1205 from 1203 in the figure are taken out as texts in the neighboring charts and compared with the text of the input contents. Do.
S1405 is a process of conditional branching using the comparison result of S1404. If it is included, the process proceeds to S1406. If not included, the process proceeds to S1410.
S1406は、S1404の比較の結果として得られた図表のキャプションや見出し、ラベル等の該当するテキストを、入力補完候補として利用者に提示する処理を行う。実際に提示している図が、図13である。図13中、1301が推奨する補完候補であり、その候補として、1302の「200万」と1303の「2010年」が表されている。これに対して、利用者は、その候補を選択する操作を行うことで補完を行い、入力していた単語や表現を完成させることができる。また、候補の選択を明示的に拒否する操作を行うか、候補表示を無視して入力を続けることで選択を行わない(拒否する)ことができる。 In step S1406, corresponding text such as captions, headings, and labels obtained as a result of the comparison in step S1404 is presented to the user as input completion candidates. FIG. 13 is a diagram actually presented. In FIG. 13, 1301 is a recommended complement candidate, and “2 million” of 1302 and “2010” of 1303 are represented as the candidates. On the other hand, the user can perform complementation by performing an operation of selecting the candidate, and can complete the input word or expression. In addition, it is possible to reject (reject) the selection by performing an operation of explicitly rejecting the selection of the candidate or ignoring the candidate display and continuing the input.
S1407は、S1406で行った表示、すなわち、推定による候補の提案に対して、利用者がどのように指示したかを判定して条件分岐する処理である。ここで、S1406で提案した候補を選択した場合には、S1408へ進む。選択されなかった場合には、S1410へ進む。 S1407 is a process of determining and branching the condition by determining how the user has instructed the display performed in S1406, that is, the candidate proposal based on estimation. If the candidate proposed in S1406 is selected, the process advances to S1408. If not selected, the process proceeds to S1410.
S1408は、S1406の表示に従い選択された入力補完候補を入力内容に加える処理を行う。図13の表示の場合で、「2010年」が選ばれた場合だと、1206の本文の最後の「20」を「2010年」で置き換えることになる。これは、通常の予測による入力補完を行っているものである。 In step S1408, the input completion candidate selected according to the display in step S1406 is added to the input content. In the case of the display in FIG. 13, when “2010” is selected, the last “20” in the text of 1206 is replaced with “2010”. This is an input supplement based on normal prediction.
S1409は、S1408で行った入力補完が行われたことに着目して、1206の本文と1202の表との間にリンク情報を作成する処理を行う。このときの処理は、第1の実施形態の図7(a)の各部701〜705が行うため、アンカー表現「Table.1」なども利用され、リンクの情報が作成される。これにより、図4のイメージデータ400程度に入力された場合には、図5(b)と図5(c)と同様の情報が蓄積されることになる。
In S1409, attention is paid to the fact that the input completion performed in S1408 has been performed, and a process of creating link information between the
S1410は、S1409において生成されたリンク情報を電子文書として格納する処理を行う。
S1411は、第1の実施形態の図8のS811と同じであり、図7(b)の対応表現追加部を使用して図9の処理を行う。これにより、対応表現が作成される。
In step S1410, the link information generated in step S1409 is stored as an electronic document.
S1411 is the same as S811 of FIG. 8 of the first embodiment, and the processing of FIG. 9 is performed using the correspondence expression adding unit of FIG. 7B. Thereby, a correspondence expression is created.
S1412は、S1411で得られた対応表現を、入力した文書を見やすくするための表現として追加するかどうかを利用者に判断してもらうために、その対応表現を表示する処理を行う。対応表現を表示する処理を行う際に、対応関係を容易に識別できるようにする強調表現情報を生成する強調表現情報生成処理を行う。入力文書が図4のイメージデータ400まで作成された場合、図11で示された対応表現の候補が示されることになる。
In S1412, processing is performed to display the corresponding expression so that the user can determine whether or not to add the corresponding expression obtained in S1411 as an expression for making the input document easy to see. When the process of displaying the corresponding expression is performed, the emphasized expression information generating process for generating the emphasized expression information that enables the correspondence relationship to be easily identified is performed. When the input document is created up to the
S1413は、S1412での対応表現追加の提案に対する利用者の操作によって、条件分岐する処理を行う。利用者によってこの対応表現が選択された場合は、S1414へ進む。利用者によって選択されなかった場合は、入力終了となる。 In step S1413, a conditional branching process is performed according to the user's operation with respect to the proposal for adding the corresponding expression in step S1412. When this correspondence expression is selected by the user, the process proceeds to S1414. If not selected by the user, the input is terminated.
S1414は、S1413で提案した対応表現を電子文書データに追加を行う処理である。第1の実施形態とは異なり、第2の実施形態においては文書編集なので、編集完了時に、電子文書ファイルなどに記録する処理となるが、その際に、第1の実施形態のような電子文書ファイルの形態に変換する処理等が行われることになる。これは、通常、文書編集時には、編集用に、文書の中身を図2のRAM206などにデータを展開し、編集に有利なデータ構造などに変換することはよく行われる手法であり、電子文書ファイルに記録する際には、その形式に戻す(変換する)のである。 S1414 is processing for adding the correspondence expression proposed in S1413 to the electronic document data. Unlike the first embodiment, since document editing is performed in the second embodiment, when editing is completed, the process is recorded in an electronic document file or the like. At that time, the electronic document as in the first embodiment is used. Processing to convert the file format is performed. Normally, when editing a document, the contents of the document are expanded into the RAM 206 in FIG. 2 or the like for editing and converted into a data structure that is advantageous for editing. When recording in the format, it is returned (converted) to that format.
このようにして対応表現を追加することで、図11に示されるような対応表現が追加される。特に、文書編集において、文字入力の予測補完機能と組み合わせてリンク情報を作成することを行うことで、自動的に対応表現候補が提示されるようになり、対応表現の追加を容易に行えるようにしている。 By adding the correspondence expression in this way, the correspondence expression as shown in FIG. 11 is added. In particular, in document editing, by creating link information in combination with a character input predictive complement function, corresponding expression candidates are automatically presented, and it is possible to easily add corresponding expressions. ing.
この文字入力の予測補完機能などの、文書編集の機能と連携させることで、文字入力が容易になるとともに、利用者は特に何も操作が増えていないのに、対応表現候補の提示が行われるようになったため、利用者の文書作成の負担を軽減することができる。文字入力の予測補完機能以外にも、文書編集装置において、文書内の文章や図表などのレイアウトや、それらをわかりやすく、あるいは美しく見せるための飾りとなる部品の追加、アンカー表現内の番号の管理など、さまざまな支援機能が提供される可能性がある。それらについても、同様に、それらの操作時に、リンク情報を抽出しておくようにすることで、本発明を適用可能であり、その効果を得ることは可能である。 By collaborating with document editing functions such as this predictive complement function for character input, character input is facilitated, and the user is presented with corresponding expression candidates even though the number of operations has not increased. As a result, the user's burden of document creation can be reduced. In addition to the predictive completion function for character input, in document editing devices, the layout of sentences and diagrams in the document, the addition of decorative parts to make them easy to understand or beautiful, and the management of numbers in anchor expressions Various support functions may be provided. Similarly, by extracting link information at the time of these operations, the present invention can be applied and the effect can be obtained.
本実施形態によれば、入力予測による文字入力を行わせる際に、同一文書内のオブジェクト中のテキスト内容と比較を行い、同一のものが入力される可能性が高まった場合に、該当する可能性のある同一文書内の図表中のテキストを入力候補として提示する。このような方法を利用する場合に、文書中の図表やその一部を指し示す入力を行った際に、近傍の図表内の表現を予測候補として提示し、それが選択された場合を考える。この時に、単に入力文字として記録するだけでなく、その入力部分と選択された表現を有する図表にリンク情報を持たせるようにすることができる。 According to the present embodiment, when performing character input by input prediction, it is possible to correspond to the case where the possibility of inputting the same thing increases by comparing with the text content in the object in the same document. The text in the diagram in the same document with the characteristics is presented as an input candidate. When such a method is used, when an input indicating a diagram or part thereof in a document is performed, an expression in a nearby diagram is presented as a prediction candidate, and the case is selected. At this time, it is possible not only to record as input characters but also to provide link information to the chart having the input portion and the selected expression.
さらに、本文中の方言と、図表の対応がリンク情報として記録されるようになるので、これに対して対応表現も、推奨候補として提案し、その内容が利用可能と利用者が判断して選択したら、これを編集中の電子文書にデータとして格納する。このようにすることで、作成された文書を読む場合に、本文内容と図表の中の対応する部分を見つけやすく、かつ、わかりやすく示すことができるようになる。また、このような文書を容易に作成できるようにすることができる。 In addition, correspondence between dialects in the text and charts will be recorded as link information, so corresponding expressions are also proposed as recommended candidates, and the user decides that the contents can be used and selects them Then, this is stored as data in the electronic document being edited. In this way, when the created document is read, it is easy to find and show the corresponding contents in the text content and the chart. In addition, such a document can be easily created.
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種のコンピュータ読み取り可能な記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other embodiments)
The present invention can also be realized by executing the following processing. That is, software (computer program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various computer-readable storage media. Then, the computer (or CPU, MPU, etc.) of the system or apparatus reads out and executes the program.
218 データ処理部、300 イメージデータ、301 領域分割部、302 属性情報付加部、303 文字認識部、304 リンク処理部、305 対応表現追加部、306 フォーマット変換部、310 電子文書データ 218 Data processing unit, 300 image data, 301 area division unit, 302 attribute information addition unit, 303 character recognition unit, 304 link processing unit, 305 corresponding expression addition unit, 306 format conversion unit, 310 electronic document data
Claims (16)
前記イメージデータを分割して分割領域を得る領域分割手段と、
前記領域分割手段により得られた分割領域の属性を判定し、領域毎に文字属性を付加する属性情報付加手段と、
前記属性情報付加手段により文字属性が付加された領域内の文字を認識する文字認識手段と、
前記オブジェクトに付随するアンカー表現と、前記電子文書の本文中のアンカー表現またはオブジェクトの説明文との対応を調べて、前記オブジェクトと、前記本文中のアンカー表現またはオブジェクトの説明文との対応関係を保持するためのリンク情報を生成するリンク情報生成処理手段と、
前記リンク情報生成処理手段により生成されたリンク情報によって対応付けられた、オブジェクト内のテキスト表現と、前記本文中のオブジェクトの説明文との対応する部分に、対応を強調表現する対応表現情報を生成して追加する対応表現追加手段と、
前記リンク情報と前記対応を強調表現する対応表現情報を含む電子文書に変換するフォーマット変換手段とを有することを特徴とする文書処理装置。 A document processing apparatus for creating a multi-page electronic document by creating a mutual link between an object and a description of an object in a page unit of a multi-page electronic document including image data,
Area dividing means for dividing the image data to obtain divided areas;
Attribute information adding means for determining the attribute of the divided area obtained by the area dividing means and adding a character attribute for each area;
Character recognition means for recognizing characters in the region to which the character attribute is added by the attribute information addition means;
The correspondence between the anchor expression associated with the object and the anchor expression or the description of the object in the text of the electronic document is examined, and the correspondence between the object and the anchor expression or the description of the object in the text is determined. Link information generation processing means for generating link information for holding;
Correspondence expression information that emphasizes the correspondence is generated in the corresponding portion between the text representation in the object and the description of the object in the body, which is associated with the link information generated by the link information generation processing means. A corresponding expression adding means to be added,
A document processing apparatus comprising: format conversion means for converting the link information into an electronic document including correspondence expression information that emphasizes the correspondence.
文字入力の際に、過去に入力された内容を利用して、入力内容を予測して候補として表示を行い、利用者に選択させることで入力予測による文字入力を行わせる入力補完手段と、
前記入力予測による文字入力を行わせる際に、同一文書内のオブジェクト中のテキスト内容と比較を行い、同一のものが入力される可能性が高まった場合に、該当する可能性のある同一文書内の図表中のテキストを入力候補として提示し、前記提示した入力候補が選択された場合に、その対応関係をリンク情報として記録する記録手段と、
前記リンク情報を利用して、前記オブジェクト内のテキスト情報と、前記電子文書の本文中のオブジェクトの説明文内のテキスト情報の比較を行い、前記電子文書の本文中のオブジェクトの説明文が説明すると推定される前記オブジェクト内の特定の部分を得て、その対応関係を容易に識別できるようにする強調表現情報を生成する強調表現情報生成手段と、
前記リンク情報と強調表現情報を含む編集中の電子文書にデータとして格納する格納手段とを有することを特徴とする文書処理装置。 A document processing apparatus that edits an electronic document using text, diagrams, and photographs as objects,
When inputting characters, input completion means for predicting input contents and displaying them as candidates using the contents input in the past, and allowing the user to select and input characters by predicting input,
When performing character input based on the input prediction, the content of the text in an object in the same document is compared, and if the possibility that the same item is input increases, Recording means for presenting the text in the chart as input candidates, and recording the corresponding relationship as link information when the presented input candidate is selected;
Using the link information, the text information in the object is compared with the text information in the description of the object in the body of the electronic document, and the description of the object in the body of the electronic document explains Emphasis expression information generating means for obtaining a specific portion in the estimated object and generating emphasis expression information that makes it possible to easily identify the correspondence relationship;
A document processing apparatus comprising: storage means for storing data in an electronic document being edited including the link information and emphasized expression information.
前記イメージデータを分割して分割領域を得る領域分割工程と、
前記領域分割工程において得られた分割領域の属性を判定し、領域毎に文字属性を付加する属性情報付加工程と、
前記属性情報付加工程において文字属性が付加された領域内の文字を認識する文字認識工程と、
前記オブジェクトに付随するアンカー表現と、前記電子文書の本文中のアンカー表現またはオブジェクトの説明文との対応を調べて、前記オブジェクトと、前記本文中のアンカー表現またはオブジェクトの説明文との対応関係を保持するためのリンク情報を生成するリンク情報生成処理工程と、
前記リンク情報生成処理工程において生成されたリンク情報によって対応付けられた、オブジェクト内のテキスト表現と、前記本文中のオブジェクトの説明文との対応する部分に、対応を強調表現する対応表現情報を生成して追加する対応表現追加工程と、
前記リンク情報と前記対応を強調表現する対応表現情報を含む電子文書に変換するフォーマット変換工程とを有することを特徴とする文書処理方法。 A document processing method for creating a multi-page electronic document by creating a mutual link between an object and a description of the object for each page of a multi-page electronic document including image data,
A region dividing step of dividing the image data to obtain a divided region;
Attribute information adding step of determining the attribute of the divided region obtained in the region dividing step and adding a character attribute for each region;
A character recognition step for recognizing characters in a region to which a character attribute is added in the attribute information addition step;
The correspondence between the anchor expression associated with the object and the anchor expression or the description of the object in the text of the electronic document is examined, and the correspondence between the object and the anchor expression or the description of the object in the text is determined. A link information generation process for generating link information for holding;
Correspondence expression information that emphasizes the correspondence is generated in a portion corresponding to the text representation in the object and the description of the object in the body, which is associated with the link information generated in the link information generation processing step. A corresponding expression adding step to be added,
A document processing method comprising: a format conversion step of converting the link information and an electronic document including correspondence expression information that emphasizes the correspondence.
文字入力の際に、過去に入力された内容を利用して、入力内容を予測して候補として表示を行い、利用者に選択させることで入力予測による文字入力を行わせる入力補完工程と、
前記入力予測による文字入力を行わせる際に、同一文書内のオブジェクト中のテキスト内容と比較を行い、同一のものが入力される可能性が高まった場合に、該当する可能性のある同一文書内の図表中のテキストを入力候補として提示し、前記提示した入力候補が選択された場合に、その対応関係をリンク情報として記録する記録工程と、
前記リンク情報を利用して、前記オブジェクト内のテキスト情報と、前記本文中のオブジェクトの説明文内のテキスト情報の比較を行い、前記本文中のオブジェクトの説明文が説明すると推定される前記オブジェクト内の特定の部分を得て、その対応関係を容易に識別できるようにする強調表現情報を生成する強調表現情報生成工程と、
前記リンク情報と強調表現情報を含む編集中の電子文書にデータとして格納する格納工程とを有することを特徴とする文書処理方法。 A document processing method for editing a document using text, charts and photos as objects,
When inputting characters, an input complementing step that predicts the input contents using the contents input in the past, displays them as candidates, and causes the user to select and input characters by predicting input,
When performing character input based on the input prediction, the content of the text in an object in the same document is compared, and if the possibility that the same item is input increases, A step of presenting the text in the chart as an input candidate, and when the presented input candidate is selected, a recording step of recording the correspondence as link information;
Using the link information, the text information in the object is compared with the text information in the text description of the object in the text, and the text in the text is estimated to be explained by the text in the text. Emphasis expression information generation step for generating emphasis expression information that makes it possible to easily identify the corresponding relationship by obtaining a specific part of
A document processing method comprising a storing step of storing the link information and the highlighted expression information as data in an electronic document being edited.
前記イメージデータを分割して分割領域を得る領域分割工程と、
前記領域分割工程において得られた分割領域の属性を判定し、領域毎に文字属性を付加する属性情報付加工程と、
前記属性情報付加工程において文字属性が付加された領域内の文字を認識する文字認識工程と、
前記オブジェクトに付随するアンカー表現と、前記電子文書の本文中のアンカー表現またはオブジェクトの説明文との対応を調べて、前記オブジェクトと、前記本文中のアンカー表現またはオブジェクトの説明文との対応関係を保持するためのリンク情報を生成するリンク情報生成処理工程と、
前記リンク情報生成処理工程において生成されたリンク情報によって対応付けられた、オブジェクト内のテキスト表現と、前記本文中のオブジェクトの説明文との対応する部分に、対応を強調表現する対応表現情報を生成して追加する対応表現追加工程と、
前記リンク情報と前記対応を強調表現する対応表現情報を含む電子文書に変換するフォーマット変換工程とをコンピュータに実行させることを特徴とするプログラム。 A program that causes a computer to execute each step of a document processing method for creating a multi-page electronic document by creating a mutual link between an object and an object description in a page unit of a multi-page electronic document including image data There,
A region dividing step of dividing the image data to obtain a divided region;
Attribute information adding step of determining the attribute of the divided region obtained in the region dividing step and adding a character attribute for each region;
A character recognition step for recognizing characters in a region to which a character attribute is added in the attribute information addition step;
The correspondence between the anchor expression associated with the object and the anchor expression or the description of the object in the text of the electronic document is examined, and the correspondence between the object and the anchor expression or the description of the object in the text is determined. A link information generation process for generating link information for holding;
Correspondence expression information that emphasizes the correspondence is generated in a portion corresponding to the text representation in the object and the description of the object in the body, which is associated with the link information generated in the link information generation processing step. A corresponding expression adding step to be added,
A program causing a computer to execute the format conversion step of converting the link information and the electronic document including correspondence expression information that emphasizes the correspondence.
文字入力の際に、過去に入力された内容を利用して、入力内容を予測して候補として表示を行い、利用者に選択させることで入力予測による文字入力を行わせる入力補完工程と、
前記入力予測による文字入力を行わせる際に、同一文書内のオブジェクト中のテキスト内容と比較を行い、同一のものが入力される可能性が高まった場合に、該当する可能性のある同一文書内の図表中のテキストを入力候補として提示し、前記提示した入力候補が選択された場合に、その対応関係をリンク情報として記録する記録工程と、
前記リンク情報を利用して、前記オブジェクト内のテキスト情報と、前記本文中のオブジェクトの説明文内のテキスト情報の比較を行い、前記本文中のオブジェクトの説明文が説明すると推定される前記オブジェクト内の特定の部分を得て、その対応関係を容易に識別できるようにする強調表現情報を生成する強調表現情報生成工程と、
前記リンク情報と強調表現情報を含む編集中の電子文書にデータとして格納する格納工程とをコンピュータに実行させることを特徴とするプログラム。 A program that causes a computer to execute each step of a document processing method that edits a document using text, diagrams, and photographs as objects,
When inputting characters, an input complementing step that predicts the input contents using the contents input in the past, displays them as candidates, and causes the user to select and input characters by predicting input,
When performing character input based on the input prediction, the content of the text in an object in the same document is compared, and if the possibility that the same item is input increases, A step of presenting the text in the chart as an input candidate, and when the presented input candidate is selected, a recording step of recording the correspondence as link information;
Using the link information, the text information in the object is compared with the text information in the text description of the object in the text, and the text in the text is estimated to be explained by the text in the text. Emphasis expression information generation step for generating emphasis expression information that makes it possible to easily identify the corresponding relationship by obtaining a specific part of
A program for causing a computer to execute a storing step of storing the link information and the emphasized expression information as data in an electronic document being edited.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012012407A JP2013152564A (en) | 2012-01-24 | 2012-01-24 | Document processor and document processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012012407A JP2013152564A (en) | 2012-01-24 | 2012-01-24 | Document processor and document processing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013152564A true JP2013152564A (en) | 2013-08-08 |
Family
ID=49048866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012012407A Pending JP2013152564A (en) | 2012-01-24 | 2012-01-24 | Document processor and document processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013152564A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015225377A (en) * | 2014-05-26 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | Document processor and document processing program |
US9740930B2 (en) | 2014-04-17 | 2017-08-22 | Fujitsu Limited | Read determining device and method |
WO2021230054A1 (en) * | 2020-05-13 | 2021-11-18 | 株式会社日立製作所 | Sentence extraction device and sentence extraction method |
KR102524124B1 (en) * | 2022-11-18 | 2023-04-20 | 주식회사 무하유 | Metadata generation apparatus and method for verifying transformation and pragiarism of the image object in documents |
-
2012
- 2012-01-24 JP JP2012012407A patent/JP2013152564A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9740930B2 (en) | 2014-04-17 | 2017-08-22 | Fujitsu Limited | Read determining device and method |
JP2015225377A (en) * | 2014-05-26 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | Document processor and document processing program |
WO2021230054A1 (en) * | 2020-05-13 | 2021-11-18 | 株式会社日立製作所 | Sentence extraction device and sentence extraction method |
KR102524124B1 (en) * | 2022-11-18 | 2023-04-20 | 주식회사 무하유 | Metadata generation apparatus and method for verifying transformation and pragiarism of the image object in documents |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5733907B2 (en) | Image processing apparatus, image processing method, and computer program | |
US11354490B1 (en) | Systems, methods, and computer readable media for creating slide presentations | |
JP5528121B2 (en) | Image processing apparatus, image processing method, and program | |
JP5274305B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP5743443B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP5676942B2 (en) | Image processing apparatus, image processing method, and program | |
RU2437152C2 (en) | Device to process images, method and computer programme to process images | |
JP5249387B2 (en) | Image processing apparatus, image processing method, and program | |
US8571359B2 (en) | Image processing device, method and storage medium for storing and displaying an electronic document | |
US9529438B2 (en) | Printing structured documents | |
JP4785655B2 (en) | Document processing apparatus and document processing method | |
CN103093252B (en) | Information output apparatus and information output method | |
CN102196130A (en) | Image processing apparatus and image processing method | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
KR20150091948A (en) | A system for recognizing a font and providing its information and the method thereof | |
JP2013152564A (en) | Document processor and document processing method | |
JP5353325B2 (en) | Document data generation apparatus and document data generation method | |
JP5500994B2 (en) | Image processing apparatus, image processing method, and program | |
JP5895828B2 (en) | Information processing apparatus and program | |
JP2012190314A (en) | Image processing device and program | |
US20210182477A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP7098897B2 (en) | Image processing equipment, programs and image data | |
CN117542056A (en) | Method, device, storage medium and processor for generating text from graphic data | |
JP2021157627A (en) | Information processing device | |
CN117707398A (en) | Data processing method and device |