JPH01258089A - Document processor - Google Patents

Document processor

Info

Publication number
JPH01258089A
JPH01258089A JP63084013A JP8401388A JPH01258089A JP H01258089 A JPH01258089 A JP H01258089A JP 63084013 A JP63084013 A JP 63084013A JP 8401388 A JP8401388 A JP 8401388A JP H01258089 A JPH01258089 A JP H01258089A
Authority
JP
Japan
Prior art keywords
line
character
lines
document
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63084013A
Other languages
Japanese (ja)
Inventor
Kaoru Suzuki
薫 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63084013A priority Critical patent/JPH01258089A/en
Publication of JPH01258089A publication Critical patent/JPH01258089A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To quickly correct the significant structure of a document by providing a display device and instructing the erroneous portion of the document being displayed on the display device, and then, processing the portion by means of an auxiliary switch. CONSTITUTION:Character rows of document pictures inputted to a picture input device 1 are extracted by mans of a character row extracting section and the extracted information is displayed on a display device 3 in a state capable of identification. The display device 3 displays each row by a circumscribing polygon and each significant group of each row by means of a color or a polygon surrounding the group. Then the connecting relations among the groups are displayed by numbers affixed to the side of each row. A user instructs a point or area of the character row information displayed on the display device 3 through an instructing device 5. When the user finds the erroneous portion, he designates the erroneous portion from the device 5 and corrects the erroneous portion by using an auxiliary switch 6. Therefore, the erroneous portion in significant structure of the document can be corrected quickly.

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) この発明は文字読み取り装置に係り、特に文書の幾何学
的構造を解析することによる文書処理装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Application Field) The present invention relates to a character reading device, and more particularly to a document processing device by analyzing the geometric structure of a document.

(従来の技術) 文書画像を入力として人間が該文書を読むのと同じ順序
で文字を読み取って結果を出力する文字認識装置は自動
翻訳装置等への入力手段として有効であるが、上記順序
に従って文字認識を行うためには1文書中の語句の意味
上のつながり方すなわち該文書の意味的構造について知
識が必要であった。多様な文書に幅広く対応するために
は、この意味的構造についての知識を文書を解析するこ
とにより得るのが望ましい、このための方法として文書
中の各文字を認識した後で各語句の意味の連続性や文法
的な整合性を解析して意味的構造を決定する方法が最も
確実であると考えられる。しかしこの処理は複雑であり
実現不可能であった。
(Prior Art) A character recognition device that inputs a document image, reads the characters in the same order as a human reads the document, and outputs the results is effective as an input means to an automatic translation device, etc. In order to perform character recognition, it is necessary to have knowledge about how words and phrases in a document are connected in meaning, that is, the semantic structure of the document. In order to deal with a wide variety of documents, it is desirable to obtain knowledge about this semantic structure by analyzing the document. One way to do this is to recognize the meaning of each word after recognizing each character in the document. The most reliable method is to determine the semantic structure by analyzing continuity and grammatical consistency. However, this process was complicated and unfeasible.

一方1文書には意味的構造の他に文書のレイアウトに見
られるような幾何学的構造がある。幾何学的構造は多く
の場合意味的構造を反映している。
On the other hand, in addition to the semantic structure, a single document has a geometric structure as seen in the layout of the document. Geometric structure often reflects semantic structure.

従って幾何学的構造を解析することによって意味的構造
をある程度正しく求めることが可能である。
Therefore, by analyzing the geometric structure, it is possible to accurately determine the semantic structure to some extent.

従来、このアプローチとして文書画像を処理して文字行
を自動抽出し、該文字行のレイアウトを解析して文字行
間の意味的結び付きを推論する方法があった。しかし入
力画像の質が悪かったり文書の段組みが複雑過ぎたりし
た場合には、文字行の抽出を誤ったり意味的結び付きの
推論に失敗するという問題点があった。
Conventionally, as an approach to this, there has been a method of automatically extracting character lines by processing a document image, and analyzing the layout of the character lines to infer semantic connections between the character lines. However, if the quality of the input image is poor or the structure of the document is too complex, there are problems in that the extraction of character lines may be incorrect or the inference of semantic connections may fail.

(発明が解決しようとする課題) 以上のように、従来の幾何学的構造から意味的構造を推
論する文字認識装置では文書のレイアウトに基く意味的
構造解析を誤る場合があるという問題点があった。ここ
で上記誤りを訂正するための修正機能が該装置に付加さ
れれば、該装置をより幅広く応用できるようになる。こ
の修正機能はその使い易さが問題となるので利用者との
対話式で活用できるのが望ましい。
(Problems to be Solved by the Invention) As described above, conventional character recognition devices that infer semantic structure from geometric structure have the problem that they may make mistakes in semantic structure analysis based on the layout of the document. Ta. If a correction function for correcting the above-mentioned errors is added to the device, the device can be applied more widely. Since the ease of use of this correction function is an issue, it is desirable that it can be used interactively with the user.

本発明の目的は上記問題点を解決するための修正機能を
与えることである。
It is an object of the present invention to provide a corrective function to solve the above problems.

〔発明の構成〕[Structure of the invention]

(課題を解決するための手段) 上記の目的を達成するため、本発明では文書画像から抽
出された文字行の情報を利用者が見ることが可能な表示
装置及び該表示装置による表示」二の点もしくは図形も
しくは領域を利用者が指示可能な指示装置及び該指示装
置に付属または別体の補助スイッチを有し、また文字行
を行外接多角形で表示する機能及び機事中の行の順序を
該多角形のわきに番号で表示する機能及び記事の区別は
該多角形の色もしくは記事を囲む多角形で表示する機能
及び記事の連鎖関係を該記事領域のわきに番号で表示す
る機能及び必要に応じてパターンを表示する機能を有し
、かつ修正作業を上記表示機能と上記指示装置及び補助
スイッチを駆使して対話的に行える機能を有する文書処
理装置を提供する。
(Means for Solving the Problem) In order to achieve the above object, the present invention provides a display device that allows a user to view information on character lines extracted from a document image, and a display device using the display device. An indicating device that allows the user to specify a point, figure, or area, and an auxiliary switch attached to or separate from the indicating device, and also has a function of displaying character lines as line circumscribing polygons and the order of the lines during the event. A function to display a number next to the polygon, a function to distinguish articles by the color of the polygon or a polygon surrounding the article, a function to display the chain relationship of articles by a number beside the article area, and To provide a document processing device which has a function of displaying a pattern as necessary and a function of interactively performing correction work by making full use of the display function, the instruction device and the auxiliary switch.

(作 用) この発明によれば利用者は表示上で誤り箇所を発見でき
、指示装置により表示上の誤り箇所を指示して補助スイ
ッチにより処理を指定することで修正作業を行える。特
に行及び記事を番号を付けた多角形で表示することによ
り、利用者はシステム内部の現在の文字行と記事の結合
状態及び文字行を指定する場合の指定すべき表示上の範
囲を容易にかつ正確に把握できる。従って修正作業を速
やかに行うことが可能となる。
(Function) According to the present invention, the user can find the error on the display, and can correct the error by indicating the error on the display using the indicating device and specifying the process using the auxiliary switch. In particular, by displaying lines and articles as numbered polygons, users can easily determine the current combination of text lines and articles within the system and the display range that should be specified when specifying a text line. and can be accurately grasped. Therefore, correction work can be carried out quickly.

(実施例) 本発明の一実施例を図に従って説明する。第1図は本発
明に係る文字認識装置の構成図である。
(Example) An example of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram of a character recognition device according to the present invention.

画像入力装置1は画像を入力する手段である。制御装置
2は全体の制御を行う手段である。表示装置3は表示を
行う手段である。記憶装置4はソフトウェアや画像デー
タ及びその他のデータを記憶する手段である。指示装置
5及び補助スイッチ6は処理命令やカーソルの移動命令
等の受は付けを行う手段である。上記の装置における処
理の流れを以下に説明する。
The image input device 1 is a means for inputting images. The control device 2 is a means for controlling the entire system. The display device 3 is a means for displaying information. The storage device 4 is a means for storing software, image data, and other data. The instruction device 5 and the auxiliary switch 6 are means for receiving processing commands, cursor movement commands, etc. The flow of processing in the above device will be explained below.

第2図に本実施例の装置における全体の処理の流れを示
す。画像入カフでは文字行を含む画像を入力する。行抽
出8では入力画像から文字行を抽出する。構造抽出9で
は抽出された文字行のレイアウトを評価することにより
該文字行を意味的に連続であると考えられる順序に統合
する。統合された文字行は1つの記事として扱われる。
FIG. 2 shows the overall processing flow in the apparatus of this embodiment. For the image cuff, input an image that includes text lines. Line extraction 8 extracts character lines from the input image. In structure extraction 9, the extracted character lines are integrated into an order that is considered to be semantically continuous by evaluating the layout of the character lines. The merged text lines are treated as one article.

修正10では上記処理により自動抽出された文字行や記
事について抽出誤りや抽出もれ及び文字行の順序誤りを
対話的に修正して、意味的な結び付きの順に文字行を統
合した記事情報を得る。認識11では上記手順により得
られた意味的結び付きの順に文字認識を行って、記事全
体にわたって意味のつながる文字列を出力する。
In modification 10, extraction errors, omissions, and errors in the order of character lines are interactively corrected for the character lines and articles automatically extracted by the above process, and article information is obtained in which the character lines are integrated in the order of their semantic connections. . In the recognition step 11, character recognition is performed in the order of the semantic connections obtained through the above procedure, and character strings that are connected in meaning throughout the article are output.

次にこの修正機能について説明する。Next, this correction function will be explained.

構造解析により自動抽出された入力文書の意味的構造に
ついての解釈は本修正機能により対話的に修正される。
The interpretation of the semantic structure of the input document automatically extracted through structural analysis is interactively modified by this modification function.

ここで問題となるのは指示装置による行及び記事の指定
方法である。以下に本実施例における3通りの指定方法
にいて説明する。
The problem here is how to specify lines and articles using the indicating device. Three methods of specification in this embodiment will be explained below.

点指定は指示装置により表示上の点位置を指示し、補助
スイッチによりその点を指定することである。点指定は
メニューの選択及び点位置の指定及び行外接矩形のよう
なシステムが抽出した領域の指定の3つに利用される指
定方法である。実際の操作は指示装置により目的の位置
に指示点を移動させて補助スイッチを押すことで行われ
る。
Point designation is to designate a point position on the display using a pointing device and designate that point using an auxiliary switch. Point designation is a designation method used for three purposes: menu selection, point position designation, and designation of an area extracted by the system, such as a row circumscribed rectangle. The actual operation is performed by moving the pointing point to the desired position using the pointing device and pressing the auxiliary switch.

線指定は表示上を指示点を移動させて描ける軌跡を指定
することである。線指示はシステムが抽出した複数領域
を連続的に指定するのと1行及び記事の分割操作におけ
る切断線を指定するのに利用される指定方法である。実
際の操作は指示装置によりまず出発位置に指示点を移動
させて、次に、補助スイッチを押しながら指示点を目的
の軌跡に沿って移動させ、終了点で補助スイッチを放す
ことで行われる。
Line specification is to specify a locus that can be drawn by moving the indicated point on the display. The line designation is a designation method used to consecutively designate multiple areas extracted by the system and to designate a cutting line in a line or article division operation. The actual operation is performed by first moving the pointing point to the starting position using the pointing device, then moving the pointing point along the desired trajectory while pressing the auxiliary switch, and releasing the auxiliary switch at the end point.

2点指定はある線分の端点を指定することである。2点
指定は文字パターン列の指定と複数行の分割に際しての
切断線の指定の2つに利用される指定方法でである。実
際の操作は指示装置により目的の2点に指示点を移動さ
せて各々の位置で補助スイッチを短く2回押すことで行
われる。
Two-point designation is to designate the end points of a certain line segment. Two-point designation is a designation method used for two purposes: character pattern string designation and cutting line designation when dividing multiple lines. Actual operation is performed by moving the pointing point to two target points using the pointing device and briefly pressing the auxiliary switch twice at each position.

第3図は該機能を実現する処理系の構成を示したブロッ
ク図である。以下各ブロックについて説明する。
FIG. 3 is a block diagram showing the configuration of a processing system that implements this function. Each block will be explained below.

主メニュー操作34は処理モジュール群から目的の処理
を選択するための機能である。利用者は表示されたメニ
ューの中から目的の処理を点指定により選択することが
可能である。上記メニューは30によって修正作業中は
常時表示される。
The main menu operation 34 is a function for selecting a target process from a group of processing modules. The user can select the desired process from the displayed menu by specifying a point. The above menu is always displayed by 30 during the correction work.

補助メニュー操作37は各処理モジュールにおいて細部
の処理を選択するための機能である。利用者は表示され
たメニューの中から目的の処理を点指定により選択する
ことが可能である。補助メニューの内容は処理モジュー
ルに応じて変化する。
The auxiliary menu operation 37 is a function for selecting detailed processing in each processing module. The user can select the desired process from the displayed menu by specifying a point. The contents of the auxiliary menu vary depending on the processing module.

また該メニューに含まれる選択肢のうち、現在選択可能
である項目を明るく、選択不可能である項目を暗くする
ことにより、利用者に指定すべき処理を状況に応じてわ
かりやすく知らせる。上記メニューは30によって表示
される。
Furthermore, by brightening currently selectable items and darkening currently unselectable items among the options included in the menu, the user is informed of the process to be specified in an easy-to-understand manner according to the situation. The above menu is displayed by 30.

行情報・記事情報メモリ32は文字行及び記事に関する
情報を記憶する機能である。行情報は各行ラベル・行中
の文字パターン列・行の文書画像上の位置等であり、記
事情報は各記事のラベル・記事中の行連鎖関係情報・記
事の連鎖関係情報等である。
The line information/article information memory 32 has a function of storing information regarding character lines and articles. The line information includes each line label, the character pattern string in the line, the position of the line on the document image, etc., and the article information includes the label of each article, line chain relationship information in the article, article chain relationship information, etc.

画像メモリ33は入力された文書画像から文字行として
抽出されたパターンを除いた画像やその他の画像を記憶
する機能である。
The image memory 33 has a function of storing images excluding patterns extracted as character lines from an input document image and other images.

レイアウト画像操作35は32に記憶されている記事及
び行の情報と33に記憶されている文字行パターンを除
いた入力文書画像とを合成してレイアウト画像を生成し
、再び33に格納する機能である。
Layout image operation 35 is a function that generates a layout image by combining the article and line information stored in 32 with the input document image stored in 33 excluding character line patterns, and stores it in 33 again. be.

上記画像情報は30によって表示される。The above image information is displayed by 30.

パターン画像操作36は32に記憶されている文字パタ
ーン列を必要に応じて1乃至数行分取り出し、該パター
ン列を拡大・縮小して見やすい大きさの行のパターン画
像を生成し、33に格納する機能である。上記画像情報
は30によって表示される。
The pattern image operation 36 extracts one to several lines of the character pattern string stored in 32 as necessary, enlarges or reduces the pattern string to generate a line pattern image of a size that is easy to see, and stores it in 33. This is a function to The above image information is displayed by 30.

行の追加20は画像中のパターン列を文字行として登録
するための機能である。この操作例を第4図に示すパタ
ーン列42は文字行として抽出されなかった文字パター
ン列であったとする。このとき行の連鎖関係は(→41
→43→)と解釈されていたとする。行追加処理を指定
するとシステムは補助メニューを表示する。補助メニュ
ーには「パターン指定」 「前付け」 r後付け」 「
独立記事」の4項目がある6点指定で該メニュー上の「
パターン指定」を選択して、2点指定で処理対象パター
ン列42を包含する長方形44の対角線を指定する。シ
ステムは該長方形44に包含されるパターンのみを抽出
し文字行としてg、録してその外接矩形を表示する。パ
ターン指定後の処理には「前付け」 「後付け」 「独
立記事」の3つがあり、追加行をどの行につなげるか、
あるいは独立した記事として登録するかを指定できる0
例えばメニュー上の「後付け」を選択して該文字行を接
続したい文字行41を点指定で指定すると、システムは
41の後に42を挿入して行連鎖関係情報を(→41→
42→43→)なる状態に変更する。上記処理を中断し
てパターン指定をし直したいときは、主メニュー上の行
追加処理を指定すれば良い。このとき、すでに終了して
いる変更は元には戻らない。また行追加処理終了後、続
けて他の処理を行いたいときは主メニュー上の他の処理
項目を指定すれば良い。
Add line 20 is a function for registering a pattern string in an image as a character line. An example of this operation is shown in FIG. 4. It is assumed that a pattern string 42 is a character pattern string that has not been extracted as a character line. In this case, the chain relationship of lines is (→41
→43→). When you specify line addition processing, the system displays a submenu. The auxiliary menu includes ``Specify pattern'', ``Front attachment'', ``Retro attachment'' and ``
If you specify 6 points with 4 items of ``Independent Article'', select ``Independent Article'' on the menu.
Select "Pattern Designation" and designate the diagonal of the rectangle 44 that includes the processing target pattern row 42 by designating two points. The system extracts only the pattern included in the rectangle 44, records it as a character line, and displays its circumscribed rectangle. There are three types of processing after specifying a pattern: "front matter", "post matter", and "independent article".
Or you can specify whether to register it as an independent article 0
For example, if you select "Retrofit" on the menu and specify the character line 41 to which you want to connect the character lines by specifying a point, the system will insert 42 after 41 and write the line chain relationship information (→41→
42→43→). If you want to interrupt the above process and respecify the pattern, just specify the line addition process on the main menu. At this time, changes that have already been made will not be undone. If you wish to continue with another process after the line addition process is complete, you can specify another process item on the main menu.

行の削除21は文字行として登録された画像中のパター
ン列を該it8から削除するための機能である。この操
作例を第5図に示す。行52は文字行ではないパターン
列であるのに誤まって文字列であると判断されたもので
あったとする。このとき行の連鎖関係は(→51→52
→53→)と解釈されていたとする。行削除処理を指定
するとシステムは補助メニューを表示する。補助メニュ
ーには1行指定」の1項目がある。点指定で該メニュー
上の「行指定」を選択してから再び点指定で処理対象行
52の矩形外周もしくは内部を指示する。システムは行
52を文字行の登録から削除して行連鎖関係情報を(→
51→53→)なる状態に変更する。上記処理を中断し
てパターン指定をし直したいときは、主メニュー上の行
削除処理を指定すれば良い、このとき、すでに終了して
いる変更は元には戻らない。また行削除終了後、続けて
他の処理を行いたいときは主メニュー上の他の処理項目
を指定すれば良い。
The line deletion 21 is a function for deleting a pattern string in an image registered as a character line from the it8. An example of this operation is shown in FIG. Assume that line 52 is a pattern string that is not a character line, but is mistakenly determined to be a character string. In this case, the chain relationship of lines is (→51→52
→53→). When you specify line deletion processing, the system displays an auxiliary menu. The auxiliary menu has one item, ``Specify 1 line.'' After specifying a point, select "line specification" on the menu, and then specifying a point again to specify the outer periphery or inside of the rectangle of the line 52 to be processed. The system deletes line 52 from the character line registration and updates the line chain relationship information (→
51→53→). If you want to interrupt the above process and respecify the pattern, just specify the line deletion process on the main menu. At this time, changes that have already been made will not be undone. Furthermore, if you wish to continue with other processing after completing line deletion, you can specify another processing item on the main menu.

行の分割22は文字行を複数の行に分割するための機能
である。この操作例を第6図に示す1行外接矩形62は
本来2つに分割されるべき文字行であるとする。このと
き行の連鎖関係は(→61→62→63→)と解釈され
ているとする。行分割処理を指定するシステムは補助メ
ニューを表示する。補助メニューには1行指定」 「左
右分割」 「上下分割」「自由分割」の4項目がある。
Line division 22 is a function for dividing a character line into a plurality of lines. An example of this operation is shown in FIG. 6, where it is assumed that a one-line circumscribed rectangle 62 is a character line that should originally be divided into two. At this time, it is assumed that the chain relationship of lines is interpreted as (→61→62→63→). Systems that specify line-splitting processing display an auxiliary menu. The auxiliary menu has four items: 1 line specification, ``left/right split,'' ``vertical split,'' and ``free split.''

点指定C咳メニュー上の「行指定」を選択してから再び
点指定で処理対象行62の矩形外周もしくは内部を指示
する。
Point designation After selecting "line designation" on the C menu, point designation is again used to designate the outer periphery or inside of the rectangle of the process target row 62.

システムは行62の文字パターン列をパターンの細部が
良くわかるように適当な大きさに拡大して表示する。次
にメニュー上の「左右分割」を選択して点指定で点64
を指示すると、システムは点64から左右に文字パター
ン列を分割して2つの文字行65と66を生成・登録し
て行連鎖関係情報を(→61→65→66→63→)な
る状態に変更する。「上下分割」も同様に分割点を指定
する。「自由分割」は線指定で切断線を指定してこの線
により分割する。
The system enlarges and displays the character pattern string in row 62 to an appropriate size so that the details of the pattern can be clearly seen. Next, select "Left and Right Split" on the menu and specify the point to 64 points.
When instructed, the system divides the character pattern string left and right from point 64, generates and registers two character lines 65 and 66, and sets the line chain relationship information to (→61→65→66→63→). change. Similarly, specify the dividing point for "vertical division". "Free division" specifies a cutting line and divides along this line.

分割の行の連鎖関係は例えば横書きの場合には位置が左
上のものほど先になるように自動的に変更される。以下
、処理の中断及び他の処理の指定については上記の各処
理と同様である。
For example, in the case of horizontal writing, the chain relationship of dividing lines is automatically changed so that the upper left side is placed first. Hereinafter, the interruption of processing and the designation of other processing are the same as in each of the above processes.

行の融合23は複数の文字行を1行に融合するための機
能である。この操作例を第7図に示す。文字行72と7
3は本来1行であるところを2行に分割されて抽出され
たものとする。このとき行の連鎖関係は(→71→72
→73→74→)と解釈されていたとする。行融合処理
を指定するとシステムは補助メニューを表示する。補助
メニューには1行指定」1行指定終了」の2項目がある
。点指定で該メニュー上の「行指定」を選択してから再
び点指定で行72と73を続けて指定する。さらに続け
て指定することもできる0行の指定が終わったら補助メ
ニュー上の「行指定終了」を指定する。システムは2行
を融合した文字パターン列に対応する行75を生成・登
録して行連鎖関係情報を(→71→75→74→)なる
状態に変更する。以下、処理の中断及び他の処理の指定
については上記の各処理と同様である。
Line merging 23 is a function for merging multiple character lines into one line. An example of this operation is shown in FIG. Text lines 72 and 7
3 is originally one line, but it is extracted by being divided into two lines. In this case, the chain relationship of lines is (→71→72
→73→74→). When you specify row merging processing, the system displays an auxiliary menu. The auxiliary menu has two items: 1 line specification and 1 line specification end. Select "line designation" on the menu by specifying a point, and then specify lines 72 and 73 in succession by specifying a point again. When you have finished specifying 0 lines, which can be specified further, specify "End line specification" on the auxiliary menu. The system generates and registers a line 75 corresponding to a character pattern string that is a combination of two lines, and changes the line chain relationship information to (→71→75→74→). Hereinafter, the interruption of processing and the designation of other processing are the same as in each of the above processes.

記事生成24は1行乃至複数行を各行が属している記事
から切り離して、まとめて1つの別の記事として登録す
るための機能である。この操作例を第8図に示す1文字
行85と88は本来記事81と82に属するのではなく
、別の記事を構成すべき行であったとする。このとき行
の連鎖関係情報は〔81=(→83→84→85)〕と
(82=(→86→87→88)〕と解釈されていたと
する。記事生成処理を指定するシステムは補助メニュー
を表示する。補助メニューには1行指定」 「行指定終
了」の2項目がある。点指定で該メニュー上の「行指定
」を選択してから再び点指定で行85と88を続けて指
定する。さらに続けて指定することもできる。また線指
定により行領域を通過する軌跡を描くことによって連続
する複数行をまとめて指定することもできる。生成され
る記事中の各行は指定された順序で連鎖関係をSf、録
される1行の指定が終わったら補助メニュー上の「行指
定終了」を指定する。システムは新しい記事89を生成
・登録して行85と88を該記事に登録し、行連鎖関係
情報を[81=(→83→84)〕と(82=(→86
→87)〕と(89=(85→88)〕なる状態に変更
する。以下、処理の中断及び他の処理の指定については
上記の各処理と同様である。
The article generation 24 is a function for separating one or more lines from the article to which each line belongs and registering them all as one separate article. An example of this operation is shown in FIG. 8, where it is assumed that single character lines 85 and 88 do not originally belong to articles 81 and 82, but are lines that should constitute another article. At this time, suppose that the line chain relationship information is interpreted as [81=(→83→84→85)] and (82=(→86→87→88)).The system for specifying the article generation process is is displayed.The auxiliary menu has two items: 1 line specification'' and ``End line specification.'' Select ``Line specification'' on the menu by specifying a point, and then continue to lines 85 and 88 by specifying a point. Specify.You can also specify it continuously.Also, you can specify multiple consecutive lines at once by drawing a trajectory passing through the line area by specifying a line.Each line in the generated article will be Sf the chain relationship in order, and when you finish specifying one line to be recorded, specify "End line specification" on the auxiliary menu.The system generates and registers a new article 89 and registers lines 85 and 88 in the article. Then, the row chain relationship information is set to [81=(→83→84)] and (82=(→86
→87)] and (89=(85→88)).The interruption of the process and the designation of other processes are the same as those described above.

記事の分割25は記事を行単位で複数の記事に分割する
ための機能である。この操作例を第9図に示す。記事9
1は行93と94の間で分割されるべき記事であるとす
る。このとき行の連鎖関係は〔91:(→92→93→
94→95→)〕と解釈されていたとする。
The article division 25 is a function for dividing an article into a plurality of articles line by line. An example of this operation is shown in FIG. Article 9
1 is an article to be split between rows 93 and 94. In this case, the chain relationship of lines is [91:(→92→93→
94→95→)].

記事分割処理を指定するとシステムは補助メニューを表
示する。補助メニューには「左右分割」「を不分割」 
「自由分割」の3項目がある。点指定で該メニュー上の
「上下分割」を選択してから再び点指定で点96を指定
すると、システムは行93と94の間で記事91を上下
に分割して記事97と98を生成・登録して行連鎖関係
情報を(97=(→92→93)〕と(98= (94
→95→)〕なる状態に変更する。なお「左右分割」 
「自由分割」についても行分割22と同様に操作すれば
良い。以下、処理の中断及び他の処理の指定については
上記の各処理と同様である。
When article division processing is specified, the system displays an auxiliary menu. The auxiliary menu includes "Split left and right" and "Unsplit"
There are three items of "free division". If you select "Vertical Split" on the menu by specifying a point and then specify point 96 again by specifying a point, the system will divide article 91 vertically between lines 93 and 94 and generate articles 97 and 98. Register the row chain relationship information (97 = (→92 → 93)) and (98 = (94
→95→)]. In addition, "left and right division"
The "free division" can also be operated in the same way as the line division 22. Hereinafter, the interruption of processing and the designation of other processing are the same as in each of the above processes.

記事の融合26は複数の記事を1つの記事に融合するた
めの機能である。この操作例を第10図に示す。記事1
01と102は本来1つの記事であるとする。このとき
行の連鎖関係は[101=(→103→104))と(
102=(105→106→)〕のように解釈されてい
たとする。記事融合処理を指定するとシステムは補助メ
ニューを表示する。補助メニューには「行指定」の1項
目がある。点指定で該メニュー上の1行指定」を選択し
てから再び点指定で行104と105を続けて指定する
。システムは行104と105を連結して記事101と
102と包含する記事107を生成・登録して行連鎖関
係情報を(107=(→103→104→105→10
6→)〕なる状態に変更する。以下、処理の中断及び他
の処理の指定については上記の各処理と同様である。
Article merging 26 is a function for merging multiple articles into one article. An example of this operation is shown in FIG. Article 1
It is assumed that 01 and 102 are originally one article. In this case, the chain relationship of lines is [101=(→103→104)) and (
102=(105→106→)]. When article fusion processing is specified, the system displays an auxiliary menu. The auxiliary menu has one item: "line specification". Select "Specify one line on the menu by specifying a point," and then specify lines 104 and 105 in succession by specifying a point again. The system connects rows 104 and 105, generates and registers article 107 that includes articles 101 and 102, and stores row chain relationship information (107=(→103→104→105→10
6→)]. Hereinafter, the interruption of processing and the designation of other processing are the same as in each of the above processes.

行連鎖関係変更27は記事内の文字行の順序を指定し直
すための機能である。この操作例を第11図に示す8行
114は行111の後に続くべきところが行113に接
続されている。このとき行連鎖関係情報は(111→1
12→113→114→115)と解釈されていたとす
る。行連鎖関係変更処理を指定するとシステムは補助メ
ニューを表示する。補助メニューには1行指定」 「前
付け」 「後付け」の3項目がある。点指定でメニュー
上の1行指定」を選択してから点指定あるいは線指定で
接続を変更したい行を指定する。この場合は114と1
15を指定する。
The line chain relationship change 27 is a function for respecifying the order of character lines within an article. An example of this operation is shown in FIG. 11, where eight rows 114 that should follow row 111 are connected to row 113. At this time, the row chain relationship information is (111→1
12→113→114→115). When you specify row chain relationship change processing, the system displays a submenu. The auxiliary menu has three items: 1 line designation, front attachment, and back attachment. Select "Specify one line by specifying a point" on the menu, then specify the line whose connection you want to change by specifying a point or line. In this case 114 and 1
Specify 15.

次に補助メニュー上の「後付け」を選択してから行11
1を指定すると、システムは行111の後に行114と
115を接続して行連鎖関係情報を(111→114→
115→112→113)なる状態に変更する。以下、
処理の中断及び他の処理の指定については上記の各処理
と同様である。
Next, select "Retrofit" on the auxiliary menu and then line 11
If you specify 1, the system connects rows 114 and 115 after row 111 and creates row chain relationship information (111→114→
115→112→113). below,
Interruption of processing and designation of other processing are the same as each processing described above.

位置情報計算28は指示装置からの入力より位置情報を
計算するための機能である。
The position information calculation 28 is a function for calculating position information from input from the pointing device.

命令解釈29は補助スイッチからの入力と上記28から
の位置情報を解釈して処理を決定する機能である。
The command interpretation 29 is a function of interpreting the input from the auxiliary switch and the position information from the above 28 to determine the processing.

表示30は利用者に向けて行情報・記事情報及び操作説
明及びメニュー等を表示する機能である。
The display 30 is a function of displaying line information, article information, operation instructions, menus, etc. to the user.

制御モジュール31は上記29によって決定された処理
に応じて、上記の各ブロックを制御する機能である。
The control module 31 has a function of controlling each of the above blocks according to the process determined in step 29 above.

なお本実施例の変形として次に例を挙げる。The following example will be given as a modification of this embodiment.

構成要素にキーボード等のキー人力装置を加え、メニュ
ーの各項目に番号を付けることにより、利用者がキー人
力装置から項目番号や処理対象となるべき行や記事の番
号を入力できるようにしても良い。
By adding a key-powered device such as a keyboard as a component and assigning a number to each item in the menu, the user can input the item number or the number of the line or article to be processed from the key-powered device. good.

また本発明を文法・意味等を解析して意味的構造を抽出
する方法を用いる文書認識装置に応用しても良い。
Further, the present invention may be applied to a document recognition device that uses a method of analyzing grammar, meaning, etc. and extracting a semantic structure.

文字例をかこむ矩形だけでなく原画像を表示しても良い
。行や記事の接続関係や順序を示すのに番号を行や記事
に隣接させて表示しても良いし。
The original image may be displayed in addition to the rectangle surrounding the example character. Numbers may be displayed adjacent to lines and articles to indicate the connection relationship and order of lines and articles.

また行間や記事間に矢印を表示することにより接続関係
を示しても良い。
Further, connection relationships may be indicated by displaying arrows between lines or between articles.

要するに本発明はその要旨を逸脱しない限り様々に変形
することが可能である。
In short, the present invention can be modified in various ways without departing from its gist.

〔発明の効果〕〔Effect of the invention〕

本発明により、自動抽出された文書の意味的構造につい
ての解釈を利用者が速やかに修正することが可能となる
According to the present invention, a user can quickly modify the interpretation of the semantic structure of an automatically extracted document.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明に係る一実施例における装置全体の構成
図。 第2図は本発明に係る一実施例の装置における処理の流
れを示した図。 第3図は本発明に係る一実施例の装置における修正処理
系の構成図。 第4図は本発明に係る一実施例の装置における行追加操
作の例を示した図。 第5図は本発明に係る一実施例の装置における行削除操
作の例を示した図。 第6図は本発明に係る一実施例の装置における行分割操
作の例を示した図。 第7図は本発明に係る一実施例の装置における行融合操
作の例を示した図。 第8図は本発明に係る一実施例の装置における記事生成
操作の例を示した図。 第9図は本発明に係る一実施例の装置における記事分割
操作の例を示した図。 第10図は本発明に係る一実施例の装置における記事融
合操作の例を示した図。 第11図は本発明に係る一実施例の装置における行連鎖
関係変更操作の例を示した図である。 1・・・画像入力装置、  2・・・制御装置。 3・・・表示装置、    4・・・記憶装置。 5・・・指示装置、    6・・・補助スイッチ代理
人 弁理士 則 近 憲 佑 同     松  山  光  之 第1図 第2図 第3図 冒■■■―■11−8 第4図   ロ二二二==]−53 第5図 I         ( 第6図    第7図 第9図
FIG. 1 is a block diagram of the entire apparatus in an embodiment according to the present invention. FIG. 2 is a diagram showing the flow of processing in an apparatus according to an embodiment of the present invention. FIG. 3 is a configuration diagram of a correction processing system in an apparatus according to an embodiment of the present invention. FIG. 4 is a diagram showing an example of a row adding operation in an apparatus according to an embodiment of the present invention. FIG. 5 is a diagram showing an example of a line deletion operation in an apparatus according to an embodiment of the present invention. FIG. 6 is a diagram showing an example of a line dividing operation in an apparatus according to an embodiment of the present invention. FIG. 7 is a diagram illustrating an example of a row merging operation in an apparatus according to an embodiment of the present invention. FIG. 8 is a diagram showing an example of an article generation operation in an apparatus according to an embodiment of the present invention. FIG. 9 is a diagram showing an example of an article dividing operation in an apparatus according to an embodiment of the present invention. FIG. 10 is a diagram showing an example of an article merging operation in an apparatus according to an embodiment of the present invention. FIG. 11 is a diagram showing an example of a row chain relationship changing operation in an apparatus according to an embodiment of the present invention. 1... Image input device, 2... Control device. 3...Display device, 4...Storage device. 5... Indication device, 6... Auxiliary switch agent Patent attorney Nori Ken Chika Hikaru Matsuyama Figure 1 Figure 2 Figure 3 Explanation■■■-■11-8 Figure 4 Roninji 2==]-53 Figure 5 I ( Figure 6 Figure 7 Figure 9

Claims (1)

【特許請求の範囲】[Claims] (1)文書画像から文字行を抽出する文字行抽出部と、
この文字行抽出部より抽出された文字行の情報を識別可
能な形状により表示する表示部と、この表示部上に表示
された文字行情報の点又は領域を指示するための指示部
と、この指示部からの指示に従って該当する文字行情報
の構造を修正する手段とを具備したことを特徴とする文
書処理装置(2)表示部は文字行を外接多角形で表示す
ると共に行の意味的まとまりを外接多角形の色又は該ま
とまりを囲んだ多角形で表示し、該まとまりでの連鎖関
係を行の傍の番号で示すものである請求項1記載の文書
処理装置。
(1) A character line extraction unit that extracts character lines from a document image;
a display section that displays information on the character line extracted by the character line extraction section in an identifiable shape; an instruction section for indicating a point or area of the character line information displayed on the display section; A document processing device characterized by comprising means for modifying the structure of the corresponding character line information according to instructions from the instruction unit (2) The display unit displays character lines as circumscribed polygons and also displays semantic groups of lines. 2. The document processing apparatus according to claim 1, wherein the document processing apparatus is configured to display the data in the color of a circumscribed polygon or a polygon surrounding the group, and to indicate the chain relationship in the group by a number beside the line.
JP63084013A 1988-04-07 1988-04-07 Document processor Pending JPH01258089A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63084013A JPH01258089A (en) 1988-04-07 1988-04-07 Document processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63084013A JPH01258089A (en) 1988-04-07 1988-04-07 Document processor

Publications (1)

Publication Number Publication Date
JPH01258089A true JPH01258089A (en) 1989-10-16

Family

ID=13818697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63084013A Pending JPH01258089A (en) 1988-04-07 1988-04-07 Document processor

Country Status (1)

Country Link
JP (1) JPH01258089A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0444185A (en) * 1990-06-12 1992-02-13 Nec Corp Document reader
US5100070A (en) * 1990-06-22 1992-03-31 Montgomery Industries International Inc. Insert teeth for a material breaker machine
JP2017204270A (en) * 2016-05-10 2017-11-16 凸版印刷株式会社 Character string area/character rectangle extraction apparatus, character string area/character rectangle extraction method, and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60169984A (en) * 1984-02-15 1985-09-03 Hitachi Ltd Composition reader
JPS61198376A (en) * 1985-02-28 1986-09-02 Toshiba Corp Optical character reader

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60169984A (en) * 1984-02-15 1985-09-03 Hitachi Ltd Composition reader
JPS61198376A (en) * 1985-02-28 1986-09-02 Toshiba Corp Optical character reader

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0444185A (en) * 1990-06-12 1992-02-13 Nec Corp Document reader
US5100070A (en) * 1990-06-22 1992-03-31 Montgomery Industries International Inc. Insert teeth for a material breaker machine
JP2017204270A (en) * 2016-05-10 2017-11-16 凸版印刷株式会社 Character string area/character rectangle extraction apparatus, character string area/character rectangle extraction method, and program

Similar Documents

Publication Publication Date Title
US6768501B2 (en) Graphic data processing apparatus using displayed graphics for program selection
US5721959A (en) Information processing apparatus for pattern editing using logic relationship representative patterns
EP0361911B1 (en) Word processor with text layout display function
US5671380A (en) Method and apparatus for creating a graphic using graphic icons
JPH05266109A (en) Method for defining geometric relation, and computer-aided design system
JP3792755B2 (en) Character recognition method and apparatus
JPH01258089A (en) Document processor
EP0100798A1 (en) Computer aided design system
JPH02250161A (en) Input character display system
JP3357760B2 (en) Character / graphic input editing device
JPH1027257A (en) Information processor
JPH08202856A (en) Picture processing method
JPH1115918A (en) Handwriting character recognizing device
JPH0652243A (en) Drawing input processor
JPS6111891A (en) Recognizing device of hand-written character/picture
JPS60217483A (en) Recognizer of character
JPH09114921A (en) Character recognizing device
JPH05266133A (en) Simultaneous display method for partial image
JP3593637B2 (en) Drawing editing system
JPH0525141B2 (en)
JPH05108867A (en) Pattern recognizing device
JP2562498B2 (en) Coordinate detection method for specified figure
JPH05101044A (en) Document processor
JP3886058B2 (en) Character processing apparatus and editing method thereof
JPH01292587A (en) Back-up device for recognition of character