WO1991006057A1 - Image display/processing method of formatted document and apparatus therefor - Google Patents

Image display/processing method of formatted document and apparatus therefor Download PDF

Info

Publication number
WO1991006057A1
WO1991006057A1 PCT/JP1990/001354 JP9001354W WO9106057A1 WO 1991006057 A1 WO1991006057 A1 WO 1991006057A1 JP 9001354 W JP9001354 W JP 9001354W WO 9106057 A1 WO9106057 A1 WO 9106057A1
Authority
WO
WIPO (PCT)
Prior art keywords
format
screen
character
displayed
document
Prior art date
Application number
PCT/JP1990/001354
Other languages
English (en)
French (fr)
Inventor
Masayuki Tsuchiya
Hiroshi Fujise
Hotoshi Suzuki
Original Assignee
Hitachi, Ltd.
Hitachi Software Engineering Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP1271687A external-priority patent/JPH0748230B2/ja
Priority claimed from JP2067149A external-priority patent/JPH03268060A/ja
Application filed by Hitachi, Ltd., Hitachi Software Engineering Co., Ltd filed Critical Hitachi, Ltd.
Priority to DE4091841A priority Critical patent/DE4091841C2/de
Priority to KR1019910700612A priority patent/KR950006410B1/ko
Publication of WO1991006057A1 publication Critical patent/WO1991006057A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging

Definitions

  • the present invention relates to a method and an apparatus for processing data of a form document using image data, and more specifically, for inputting or outputting character data and numeric data used in a general business processing field, for example.
  • the present invention relates to a method and an apparatus for automatically generating a computer processing image from a document having a blank and having a predetermined format.
  • office equipment such as workstations, office processors, computers, personal computers, or word processors, for example, various application forms, data entry slips, billing slips and receipts Issue a document or a document (form) in a prescribed format for accounting, statistics, breakdown, etc., and enter data into the database using the format of the above document displayed on the surface
  • these are generated by a batch method in which parameters are created by giving conditions from outside, and a painting method in which they are created by interacting with the screen. These methods change the format of screens and manuscript documents created by operators. Column conversion is performed while watching, and one column is drawn on the display.
  • a user's business involves a form document such as a form as input and a form as output.
  • a form document such as a form as input
  • a form as output At present, in order to create this screen or document for computer processing, the format of the document drawn on paper is converted into column units on the display and drawn on the display screen.
  • a method is conceivable in which a format is read from a recording medium such as paper on which the format of the document is described, and a program is automatically generated from the contents of the format, as disclosed in Due to the characteristics of paper, description color, misalignment, garbage, etc., it is not possible to recognize in perfect form, and erroneous recognition occurs, and this erroneous recognition needs to be confirmed and corrected on the screen. .
  • Spending time on checking and correcting work on this screen reduces the value of the above automatic generation method, despite the fact that work efficiency was improved by reading formats from paper. Result.
  • the lines may not be read correctly, and in this case, the lines may be easily read. It is necessary to be able to make corrections.
  • form documents often have blank spaces between rows and columns, and if drawn on the display as they are, they often protrude from the display surface. If a document processing job is executed with the data protruding, screen scrolling will occur during the execution of the document processing job, affecting the performance of the document processing job execution. Therefore, it is necessary to fit in the display screen as much as possible, and all of these adjustments are made by the operator while considering them. The time was enormous.
  • An object of the present invention is to provide a method and apparatus for generating a form document which solves the above problems and makes the operation of confirming and correcting a displayed document by an operator a simpler operation. It is to bring out the effect sufficiently.
  • Another object of the present invention is to automatically create a screen display document format that can reduce the amount of work performed by the clerical worker while also reducing the amount of work required by the clerical worker. It is to provide a method and an apparatus.
  • a sheet or other recording medium on which the document format is recorded a reading device for reading the document format recorded on the recording medium, and the read document format are displayed.
  • a document processing device provided with a display device for generating a document format, which is one type of document processing, as follows. That is, information describing the format is read from the recording medium in which the format of the document is described, and the read information is displayed on the screen in the same or similar format as the format described in the recording medium.
  • Allows the operator to easily correct and update the format displayed on the screen while checking it on the screen recognizes the checked format, generates an input / output area, and displays the format displayed on the screen.
  • the input / output area is displayed on the screen so that it can be modified while checking it on the screen.
  • the information read from the reading device is calculated on the basis of the ratio of the minimum unit size of the reading unit of the reading device to the minimum unit size of the screen display, and is displayed on the screen in a similar format.
  • the part of the document format displayed on the screen is specified by the operator, so that the specified part is located at a position that does not overlap with the specified part.
  • the content of the specified part is replaced with the content corresponding to the detailed information of the changed content.
  • the start position of the callout, the end position of the last callout, the number of callouts, and the vertical or horizontal designation are used to specify the start position and the end position. Based on the difference between the coordinates and the number of ⁇ lines, the interval between the lines is calculated, and the line is drawn at the calculated interval.
  • Another object of the present invention is to provide a document processing method for processing a document, which reads information describing a format from a recording medium on which the format of the document is described. Determines the character size for each character on the display from the read information, and determines the determined character size. Cells, and place extracellular information such as character or numeric data based on the arranged cells, and compress the cells and extracellular information so that they do not extend outside the display screen. Determine the processing procedure for each item of the format displayed in the display screen.
  • a cell is defined as a rectangular frame defined by four vertical lines.
  • the compression preferably includes at least one of blank line and blank column removal, synonym conversion of character string using knowledge base, and conversion from full-width character to half-width character. is there.
  • the processing procedure determination preferably involves judging the character string of each item by matching it with the knowledge base.
  • the reference character size was determined from the document, and from the position expressed in 110 millimeter units of the lines and characters, the reference line size was used to determine the line position of the display to resemble the document format. Formats can be created.
  • the part enclosed by the call line is converted to a matrix expression, this is arranged, and then the arrangement of the character strings not enclosed by the ⁇ line is converted into a table describing the arrangement of the part surrounded by the call line. Since it is performed while referencing, the position of cells and cells outside the cell is almost the same as the relative position between cells and cells outside the cell without causing the arrangement of the characters to change according to the size of the characters in the document. Information cannot be arranged, and a format that makes the user feel strange at first glance cannot be created. P TJP90 / 01354
  • FIG. 1 is a block diagram showing the overall configuration of a document processing apparatus according to an embodiment of the present invention.
  • FIG. 2 is a diagram showing an operation procedure of an operator, a change in a screen state of the present invention apparatus, and FIG. Movement
  • FIG. 3 is a diagram for explaining a detailed document processing flow of another embodiment of the present invention
  • FIG. 4 is a screen showing a format of another embodiment of the present invention.
  • FIG. 5 is a flowchart for explaining a method of density conversion in another embodiment of the present invention
  • FIG. 6 is a flowchart for explaining a method of density conversion in another embodiment of the present invention.
  • FIG. 7 is a diagram for explaining the merging method of the ⁇ line, FIG.
  • FIG. 7 is a diagram for explaining a screen display of another embodiment of the present invention
  • FIG. 8 is another diagram of the present invention.
  • 9A-9C are diagrams for explaining a method of selecting a designated character according to another embodiment of the present invention.
  • FIG. 10 is a diagram for explaining a method of selecting a designated character according to another embodiment of the present invention.
  • FIG. 11 is a diagram showing an example of a popup screen of another embodiment of the present invention.
  • FIG. 11 is a diagram for explaining the flow of character correction of another embodiment of the present invention.
  • Fig. 12 is a flow chart showing the flow of character correction according to another embodiment of the present invention.
  • Figs. 13A and 13B explain a method of determining the display of a bop-up screen according to another embodiment of the present invention.
  • FIG. 13A and 13B explain a method of determining the display of a bop-up screen according to another embodiment of the present invention.
  • FIG. 13A and 13B explain a method of
  • FIG. 14 is a diagram for explaining an example of adding a character in another embodiment of the present invention
  • FIG. 15 is a drawing of a call line in another embodiment of the present invention.
  • FIGS. 16A to 16C are diagrams for explaining the method of making
  • FIGS. 16A to 16C are a flow chart and a matrix-shaped X-ray, respectively, showing the flow of operations for line drawing in another embodiment of the present invention.
  • FIG. 17 is a diagram for explaining a flow of displaying input / output fields on a screen according to another embodiment of the present invention.
  • FIG. 18 is a diagram showing another embodiment of the present invention.
  • FIG. 19 shows an enlarged format of an input / output field of the embodiment, FIG. FIG.
  • FIG. 20 is a diagram showing an example of scaling of input / output fields according to another embodiment of the present invention.
  • FIG. 20 is a diagram for explaining an example of a pop-up screen of input / output fields of another embodiment of the present invention.
  • FIG. 21 is a flowchart showing a series of processes of another embodiment of the present invention.
  • FIG. 22A-22C is displayed on a display screen of one embodiment of the present invention.
  • FIG. 23 is a diagram showing a document format and a table of input information.
  • FIG. 23 is a flowchart showing the contents of pre-processing in one embodiment of the present invention.
  • FIG. 24 is another flowchart of the present invention.
  • FIG. 25 is a diagram for explaining the configuration of the reference character size when arranging cells, extracellular information, etc. of the embodiment.
  • FIG. 25 is a diagram for explaining a method of extracting an uppercase letter in another embodiment of the present invention.
  • FIG. 26 is a flowchart showing the flow of an arrangement process according to another embodiment of the present invention.
  • FIG. 18 is a diagram for explaining the relationship between items of another embodiment of the present invention.
  • FIG. 28 is a diagram showing a calculation method for converting input information read in another embodiment of the present invention.
  • FIG. 29 is a diagram for explaining an actual arrangement example and a form format storage table of another embodiment of the present invention.
  • FIG. 30 is a diagram showing characters outside cells of another embodiment of the present invention.
  • FIG. 31 is a flowchart for explaining a method of arranging columns
  • FIG. 31 is a flowchart of a post-processing according to another embodiment of the present invention
  • FIG. 32 is a surface of a surface of another embodiment of the present invention.
  • FIG. 33 is a detailed flowchart of storage adjustment in a plane
  • FIG. 33 is a diagram for explaining an outline of a synonym conversion method of another embodiment of the present invention
  • FIG. 34 is a diagram of the present invention.
  • FIG. 35 is a diagram for explaining a method of determining a processing procedure according to another embodiment of the present invention.
  • FIG. 1 is an overall configuration diagram of a document processing apparatus according to an embodiment of the present invention.
  • the central processor 1 which controls the entire system, has a keyboard for the operator to give instructions, a console device 2, which has a mouse as necessary, a screen for displaying the created format, and a slip.
  • a reading device 3 for reading a form is connected via a reading device controller 4.
  • a printer 6 for outputting the processed document is provided via a printer controller 5, and a storage device 8 for storing the created format and the like is provided via a storage controller 7. It is connected.
  • the document may be read as described above using an image reader such as 0CR as a reading device.
  • a word processor may be used as the reading device 3 to directly input document information.
  • a magnetic disk device may be used as the reading device 3, and the document information stored on the floppy disk of the word processor may be read. Further, a facsimile or the like may be used as the reading device 3.
  • the processor 1 reads a document from the reading device 3 and stores the obtained format information or input information in a storage device. 8 is stored in the format information storage area 10. At the same time, the document is displayed on the screen in a format similar to that of the read document, making it easy for the operator to check the document on the screen and to perform the work. When the correction work is completed, the processor 1 stores the information of the corrected part in the format information storage area 10. From the stored format information, the processor 1 uses the knowledge base 9 in the storage device 8 to recognize the format of the document and the meaning and contents of each item or term used in the document. The recognition result is stored in the recognition result storage area 11, and the processor 1 automatically creates a screen display format from the recognition result.
  • This format is a modification of the above-mentioned similar format by processor 1 so that the operator can easily input and output data to the input and output fields of this document.
  • the processor 1 sets the processing procedure from the format generated and stored in the format storage area 12 and executes the business program.
  • the processing procedure is, for example, a slip.
  • the work area 13 temporarily stores a group of tables generated during the work of the processor 1, which is necessary when displaying a later-described bopp-up screen on a screen. The upper area.
  • FIG. 2 is a flowchart illustrating a flow of a series of processes according to an embodiment of the present invention.
  • 200 is an example of a document, date 200 A, “Year”, “Month”, “Day” 200 B, Slip Number 200 C, Code 200 D, Product Name 200 E, Quantity 200 F, Money 200 G And a slip 200 on which the L line 200 L is written.
  • the slip 200 is a sheet of a manuscript, and according to the present invention, the operator can view the manuscript on the screen even if there is a defect such as a slight dirt or blurred characters or black lines. It can be easily modified, and a slip in an accurate and desired format can be generated and displayed on a surface.
  • FIG. 2 illustrates a flow of a series of processing at the time of execution of an embodiment of the present invention.
  • a sheet of a document in which the format is described as shown in 200 is read from a reading device 3 such as an OCR, and the format information is input (201).
  • the read format information such as lines, characters, images, etc.
  • an image of a pattern similar to the pattern of the document slip is displayed on the display screen of the console device 2 (202).
  • the format information may be directly input from a device such as a professional or a facsimile.
  • the operator can confirm and correct the displayed contents (203).
  • the computer recognizes the input / output fields based on the pattern of the line of call, the meaning of the term contained in the read format information, or using the input information from the operator, etc.
  • the recognized input / output field is displayed on the screen on which data such as images are displayed (204) o
  • confirmation can be made here (20 Five ) .
  • the format to be processed is automatically generated based on the read format information and the recognized input / output fields (206), and the generated result is displayed on the display screen (207). ), The operator can confirm and correct.
  • the created format is stored in the format storage area 12 in the storage device 8 (208).
  • a processing procedure is created based on the information of the created format (209), the processing procedure is executed (210), and the execution result is displayed (211).
  • FIG. 3 explains the series of flows in FIG. 2 in more detail.
  • a document may be read by an image reader, a document created by a word processor may be directly read, or a floppy disk containing the document may be read.
  • the read result, character information, black line information, and information such as the paper size of the read document are stored as format information in the format information storage area 10 of the storage device 8 (301). That is, in step 301, the read format information is stored in the format information storage area 10 as it is.
  • the processor 1 creates a format similar to the format of the read document, displays it on the screen (302), and the screen shown in 303 is displayed.
  • a sales slip 303A having columns named code 303B, product name 303C, and unit price 303D is shown. operator Then, the document format displayed on the screen is confirmed and corrected (304), and when the confirmation is completed, the process proceeds to the recognition processing of the format information stored in the format information storage nod area 10 (305).
  • the processor 1 uses the knowledge base 9 to create input / output fields from the meaning of character strings (terms) and the pattern of the vertical line, and stores the recognition information in the recognition result storage area 11 in the storage device 8 ( 306), the created input / output field is displayed on the surface on which the ⁇ line ⁇ character is already displayed (307).
  • the operator checks and corrects the input and output fields (308), and when the checking is completed, the processor 1 creates a format from the recognition information in the recognition result storage area 11 (309). ).
  • the port processor 1 stores the created format in the format storage area 12 in the storage device 8 and creates a processing procedure (310).
  • Figure 4 is a flowchart showing the flow from reading a slip or form to displaying it on a surface.
  • the document to be processed is read (400), and the paper size and character information are stored in a format information file as shown in JL. All format information is expressed in units of 1/10 mm.
  • the format information is composed of text information and line information.
  • the text information is set at a point in the upper left corner of the screen as a reference position, and the X and Y coordinates of the position of the character under consideration with respect to this reference position, and This character is enclosed in a rectangle circumscribing the character, and consists of a length in the X and Y directions starting from the upper left corner of the rectangle, and a code representing the character.
  • the report consists of the coordinates of the starting line, the coordinates of the end point, and the type of solid line or broken line.
  • Processor 1 performs density conversion for display on the screen based on the read format information (401). Although the density conversion will be described later, this conversion is a process for displaying the read form on the screen in a similar form.
  • a display character font to be displayed on the screen is created by reducing or enlarging the already set standard character font according to the information on the character size in the format information. ). The reduction or enlargement ratio is set in the character display table (403), and fonts for all characters are created.
  • merging lines having the same kind of information are merged from the line information of the format information (406), and are set in the line displaying table (407).
  • Fig. 5 is a diagram explaining the density conversion method. is there. All characters have a black dot cluster as shown in 501 as a standard character font, and this black dot cluster is replaced with the standard character font as the character information 500 in the format information. Character fonts for display are created by enlarging or reducing according to the size information. Specifically, enlargement or reduction is performed based on the ratio of the minimum unit size of reading by the reading device 3 to the minimum unit size of screen display. An example of 502 when the standard character font is reduced according to the format information Shown in
  • FIG. 6 is a diagram for explaining a processing method for merging lines.
  • the recruitment line information what is actually a line segment is recognized as a line segment at each intersection, such as 600, 601, 602, or 603, 604. May be done. This is done by connecting the same type of recruitment lines, such as 605 or 606 shown in b, and merging them into one to reduce the amount of recruitment line information to be set in the X-ray display table can do.
  • FIG. 7 is a diagram for explaining the enlargement / reduction of the screen display. Enter the slip shown in a and display it on the screen in the actual size as shown in b.
  • the guidance of the option 700 is displayed at the lower part of the displayed screen, and the operator selects this and performs processing.
  • the guidance 700 includes, for example, a magnification of 700 OA, a scale of 700 B, a scroll of 700 C, and the like.
  • the next guidance 700 like c is displayed on the screen.
  • Guidance 7 0 1 is 4 times 7 0 1 A, 2 times 7 0 1 B, 1 time 7 0 1 C, 1 time 2 times 7 0 1 D, 1 time 4 times 7 0 1 E
  • the screen display is enlarged twice and the screen shown in d is displayed.
  • the characters are enlarged twice as shown in 702, and the X-rays forming the table are also enlarged twice, as shown in 704.
  • a screen as shown in e is displayed.
  • the characters are reduced by a factor of two, and as shown in 705, the entire collection line forming the table is also reduced by a factor of two.
  • the result of this enlargement / reduction is reflected in the format information as shown in g, and the operator can correct or change the contents while the reduced / enlarged screen is displayed. If the format of the read slip or form is too small and it is difficult to see it on the screen, enlarge it.If it is too large to display on the screen, reduce it and review the whole image to correct it. We can proceed. Such scaling is performed in the same way as for the character font in Fig. 5.
  • FIG. 8 is a diagram illustrating a scale display. As the display on the screen can be enlarged or reduced, the scale is displayed, and the memory of the displayed scale is automatically adjusted according to the size of the display screen. This makes it easy to check and correct character positions and to check and correct the spacing between characters.
  • a scale display key is input on the screen 800 on which the format is displayed (800)
  • the horizontal scale of a and the vertical scale of b are displayed as shown in the screen shown in FIG. Display rules.
  • the scale is displayed in units of Iran as shown in 803.
  • the width displayed as 1 ⁇ is calculated by calculating the number of dots, which is the minimum unit on the screen, for 1 mm on the read document, and (number of items) X (minimum on the screen).
  • the minimum unit dot 809 is two, and one dot is obtained.
  • two dots 811 on the screen have a scale width of 1 mm.
  • a scale 804 is displayed on the screen, which is the width of one sculpture X on the screen and the magnification at the time of enlargement is 1 mm width.
  • the scale display at the time of reduction displays a scale 806, where the reduction rate at the time of 1 mm width X reduction at the screen is considered to be the width of one lord.
  • FIGS. 9A-9C are diagrams for explaining a method of selecting a designated character.
  • the character to be corrected is specified at the intersection of the vertical cursor 900 and the horizontal cursor 900.
  • This cursor is operated with the cursor keys as shown at 902.
  • it is possible to automatically select and specify by simply positioning the cursor near the character to be specified as shown in 904 in FIG. 9B. This may be performed by, for example, detecting a character having coordinates within a semicircle having a predetermined radius from the position of the cursor as the corresponding character, as shown at 905 in FIG. 9C.
  • a character to be corrected When a character to be corrected is specified, detailed information of the character to be corrected is displayed at a position that does not overlap with the character, as described later. By correcting the displayed content, the specified characters on the format are automatically corrected. It is. In this way, it is possible to make corrections while looking at the original screen.
  • the detail screen displayed on this surface is called a pop-up surface.
  • the bop-up screen is displayed on the screen based on the information extracted from the format information storage area by the processor 1 and temporarily formed in the form of a table on the work area 13.
  • FIG. 10 is a diagram illustrating an example of the pop-up screen. If the character a is specified on the screen 1000, the popup screen 1001 is displayed at a position that does not overlap the specified character, in this case, at the right corner.
  • the contents of the bopp-up screen include character content b, character position c, character size d, spacing e between characters, and character string direction f.
  • the position c of the character is displayed, for example, as a horizontal 1501 ⁇ 10 thigh and a vertical 2 ⁇ 501 ⁇ 10 image.
  • the size d is a size relative to the standard character font, and is displayed, for example, as 4 4 horizontally and 3 4 vertically.
  • the character spacing e is displayed, for example, as 0.13 mm.
  • a character string arranged in the horizontal direction is represented by 1
  • a character string arranged in the vertical direction is represented by 2 and (1) indicates that the character string covering the character b is arranged horizontally.
  • FIG. 11 is a diagram for explaining the flow of character correction.
  • the format of the document is displayed on the screen (110).
  • the operator specifies a correction character (1101), and positions the cursor near the corresponding character (1102).
  • the execute key is pressed by the operator, the pop-up The face is displayed in the right corner of the screen (111).
  • the operator changes the detailed information in this pop-up screen (1105).
  • the operator changes, for example, the contents of the character field as shown in b and then as shown in c, and further changes the position d of the character and the size e of the character.
  • the execution key is pressed (1 1 0 6
  • the character f specified earlier in the display screen is replaced with the content based on the changed detailed information in the bobbab screen and displayed (1 1 0 7).
  • FIG. 12 is a flowchart showing this flow.
  • 303 E indicates the amount of money.
  • the force is positioned near the character to be corrected on the screen (1 2 0 0)
  • the X and Y coordinates are obtained (1 2 0 1), and the coordinates in the format information
  • the character information a is searched, and the character information b closest to the located position is read (122).
  • a bop-up screen is created based on the read information (123).
  • the display position of the pop-up screen is set (1204), and the pop-up screen is displayed at the set position (1205).
  • the operator checks this content and corrects it.
  • the detailed information (correction data) on the corrected bopp-up screen is taken in (127).
  • the captured detailed information (correction data) 1 210 is written into the format information (1 208). After that, the character corrected based on this detailed information is replaced with the character specified on the screen and displayed (1209).
  • FIG. 7 is a diagram illustrating a setting method.
  • the screen is divided into four areas a, b, c, and d around this character. At this time, the image is divided except for the areas of character size ⁇ and e.
  • the processing flow is described with reference to Fig. 13B.
  • the screen is divided into four based on the information on the size and position of the character (1302).
  • a portion having an area in which the detailed information display screen can be entered is selected from the divided portions (1303).
  • the highest-priority area is determined from the selected areas according to a predetermined priority shown in 1301 (1304). Priority is given in the order of lower right, lower left, upper right, upper left.
  • FIG. 14 is a diagram illustrating an example of adding characters.
  • characters When adding characters, they are often added as strings instead of just one character.
  • what is required to add a character string is the contents of the character string, the starting position, the character spacing, and the direction in which the character strings are arranged.
  • the format information of each character is automatically generated from the set information and displayed on the screen.
  • the cursor is positioned on the screen only for the call line as shown at 140 0, and the pop-up screen 14 10 is displayed.
  • this pop-up screen 1410 As the contents of this pop-up screen 1410, the position where the cursor is positioned is displayed.
  • a character string 14 0 5 (in this case, the character string 1405 corresponds to the product name), check again whether the position of the character string is appropriate, move the cursor if it is inappropriate, correct it,
  • a character string is added to the specified position on the screen as shown in the screen shown in 1403. The position of each character is calculated from the contents specified in the detailed information in the format information table, and the character information for each character is set.
  • n is a value indicating the position of the character in question from the first character in the string.
  • operators can also delete, create, and change line types while viewing the screen. For example, firewood line deletion is performed by pressing the delete key, moving the cursor around the ⁇ ⁇ ⁇ line to be deleted, and pressing the enter key.
  • Fig. 15 is a diagram for explaining the method of creating a call line. Normally, when a single horizontal line is drawn, a start line and an end position are designated by points (1) and (2) as shown in (a), and a horizontal line as shown by 1500 is created. When one vertical line is created, a vertical line as shown in 1501 can be created by specifying the start position and the end position with dots 1 and 2 as shown in (b). In general, the current practice is to create lines one by one using the above method, and it is necessary to perform operations for the number of lines to be created. Most of the lines in documents are mainly in the form of a table with multiple horizontal or vertical lines of the same length, and tables are created by repeating the same operations.
  • these plural X-rays are created at once, and the interval is automatically determined. Further, the number of operations is constant even if the number of lines increases.
  • (C) and (d) of FIG. 15 show an embodiment of the present invention.
  • (c) is an example in which a plurality of horizontal straight lines are created. Specify the top position 1502 to draw a horizontal line at points 1 and 2, and the end position 1503 of multiple final horizontal lines. If the number of ⁇ lines is specified here, the intervals are calculated so that they are equally spaced, and the number of lines is created. In this example, four are specified. The distance between each line is calculated by subtracting the difference between the Y coordinate of 1 and the Y coordinate of 2 from the designated number minus one. If the number is not specified, the interval value is automatically calculated based on the value of the quasi-character size, and multiple lines are 135
  • the vertical straight line is created in the same way as the horizontal straight line. As shown in (c), the start position is specified by point 1 and the end position is specified by point ⁇ . Therefore, when creating a table frame, the table frame can be created only by specifying ⁇ horizontal lines and m vertical lines.
  • the created recruitment line information is set as format information.
  • Figures 16A and 16B are flow charts showing the flow of operations when creating a ⁇ line.
  • Fig. 16A shows the method according to the present invention
  • Fig. 16B shows the conventional one-book setting method.
  • n horizontal lines are specified at once, and then By specifying m lines at a time, you can create a format as shown in 1604 by specifying twice. More specifically, first, in step 1600, it is specified that a horizontal straight line is to be created (16610). Next, the start and end positions of the horizontal straight line are specified (16611). Next, the number of horizontal straight lines to be drawn is specified (1661 2).
  • step 1601 similarly, it is specified that a vertical straight line is to be created (16613).
  • the start and end positions of the vertical line to be drawn are specified (1614).
  • the recognition process is started, and the input / output field generation process is performed.
  • FIG. 17 is a diagram illustrating the flow of display of input / output fields on a screen.
  • recognition processing is performed to determine whether or not a blank is an input / output field based on the shape of the calling line in the document and the meaning of the term (1700).
  • 705 is stored in the recognition result storage area 11 in the storage device 8.
  • the recognized input / output fields are displayed on the screen that already displays the format information such as lines and characters (1 ⁇ 0 1).
  • a screen as shown is displayed.
  • the input and output fields generated as a result of recognition are displayed in color on the screen shown in 1702.
  • the displayed recognition result can be corrected by the operator by checking the position, attribute, length, width, etc. (1704).
  • FIG. 18 is an enlarged view of the input / output field.
  • the length and width of the input / output field are displayed in color in the display area of the input / output field as shown in 180, and the input / output is displayed in color.
  • the attribute and number of digits shown in 1801 are displayed in the display area of the field. If it has more than three digits, it is described in the form of attribute characters (number of digits) as shown in 1801, and if it has less than three digits, it is written only in the number of digits as shown in 1802 Description Shown. In the example shown in Fig. 18, the attribute is N and the number of digits is 10. Therefore, the input / output field 1800 following code 30.3B is a field containing 10 Kanji characters. Field.
  • the input and output fields of the recognition result can be enlarged or reduced in the same way as the format information lines and characters.
  • FIG. 19 is a diagram showing an example of expansion and contraction of an input / output field.
  • the blue part of the input / output field of the recognition result is displayed at the same magnification as the lines and characters of the format information, and displayed at the same magnification. it can.
  • 303 F represents a month and a day.
  • FIG. 20A is a diagram showing an example of a pop-up screen of an input / output field. Position the cursor on the blue display shown in a, and press the Enter key. Detailed information on the pop-up screen such as b is displayed. This is the result of the confirmation in the recognition process, and the input and output fields can be modified by modifying this displayed content.
  • the format can be reduced and expanded freely, and the confirmation and correction work can be performed with a size that can be easily corrected by the operator.
  • the recognized input / output field areas are displayed in color, and the attributes and the number of digits are displayed in the area so that they can be checked at a glance. If you want more detailed information, specify the area. Can be confirmed and corrected on the detailed information screen of the area.
  • 190 is a column indicating that the displayed information is item information.
  • Reference numeral 1901 denotes a column indicating an item or the like.
  • Reference numeral 1902 denotes a column indicating an item position, and the position in the horizontal direction and the position in the vertical direction are expressed in units of 10 ⁇ .
  • Reference numeral 1903 denotes a column indicating the item length, which is represented by the number of lines and the number of columns.
  • Reference numeral 1904 denotes a column indicating the character spacing, in which the spacing between rows and columns is indicated in 1/10 s units.
  • 1905 is an attribute column, 1 is a numerical value, 2 is an alphanumeric character, and 3 is a kanji.
  • 1906 is a column indicating the input / output, 1 is input, 2 is output, 3 is input / output PT / JP90 / 01354
  • 1907 is a column showing the form
  • 1 is a heading
  • 2 is a specification
  • 3 is a summary
  • 1908 indicates that the displayed information is detailed information
  • 1909 is a column indicating the number of repetitions, which indicates the number of repetitions in the vertical and horizontal directions.
  • Reference numeral 910 denotes a column indicating a repetition interval, in which a vertical interval and a horizontal interval are respectively shown in lZlOmm units.
  • 1 9 1 1 is a column showing the total number of times.
  • 1912 is a column indicating the printing direction
  • 1 indicates the vertical direction
  • 2 indicates the horizontal direction.
  • 1 913 is a column indicating that the displayed information is editing information
  • 191 4 is a column of ⁇ , 1 is present, and 2 is not.
  • 1 9 15 indicates stuffing, 1 indicates right, 2 indicates left, 3 indicates centering, and 4 indicates no stuffing.
  • 1 9 16 is a column that indicates expansion, 1 indicates horizontal, 2 vertical, 3 indicates horizontal and vertical expansion, and 4 indicates no expansion.
  • 1 9 17 indicates digit alignment, 0 indicates no alignment.
  • the format can be freely enlarged or reduced in the correction processing that occurs when a computer processing program is created from the form of a document such as a slip.
  • the work can be carried out in a size that is easy to correct, and the detailed correction of the format information can be done easily, so that the recognition result can be understood at a glance. There is an effect that time can be reduced.
  • Fig. 2 This is a specific construction of the format creation step 1006 described in Section 4.
  • the document format obtained in step 1004 and displayed on the screen is similar to the document format of the manuscript.
  • the document format displayed on the screen obtained as a result of the execution of step 106 is modified to a format that can be easily handled by the operator. Even when this embodiment is applied, the flow of a series of processing when executing document processing is completely the same as that in FIG. 2, and therefore, repeated description of FIG. 2 will be omitted. Also, the overall configuration is the same as the configuration shown in FIG. 1, and the description thereof will not be repeated.
  • FIG. 21 is a flowchart showing a flow of an automatic creation process of a screen display document format according to an embodiment of the present invention.
  • a pre-process including a process of obtaining a reference character size and extracting a character to be enlarged is performed (2100).
  • each group of information hereinafter referred to as a cell
  • a call line is arranged as shown in "customer name j3100" (2101)
  • output-of-cell information information other than the information enclosed by the above-mentioned call lines
  • Post-processing such as order processing for determining the order of processing is performed (2103).
  • FIGS. 22B, 22C, and 22A are diagrams respectively showing an example of a cell information table, an out-of-cell information table, and a document according to an embodiment of the present invention.
  • the information consists of Other than the above, for example, "customer name J3100,” code “3102,” article name “3103, etc.,” delivery note “3200,” month “3201,”
  • the date is divided into two types, such as j 3 202.
  • the above is called cell information, and the following is called out-of-cell information.
  • 33203 is out-of-cell information, which is represented by a character string and a start position and an end position expressed in units of 10 characters. It is created by the recognition process, and it is arranged and created using this information even when the format is automatically created.
  • FIG. 23 is a flowchart showing the flow of the pre-processing in the flowchart shown in FIG. 21 of one embodiment of the present invention.
  • the pre-processing (2100) consists of two processes: a process for obtaining the reference character size (2200) and a process for extracting the character to be enlarged (2201). Find the size of one character on the document that corresponds to one character of. This is because the size of the most frequently used character among all the characters in the document to be read is determined as the reference character size 3205, and as shown in Fig. 24, the line bitch and character bit Set the value to which. Cell placement processing will be performed thereafter using this size.
  • characters to be processed as enlarged characters are extracted. As shown in Fig. 25, compare the value obtained by subtracting the size of the row pitch and column pitch from the reference character size. If it is recognized as an enlarged character.
  • FIG. 26 is a flowchart showing a processing flow of the arrangement according to one embodiment of the present invention.
  • a normal document is composed of clusters of cells, and by arranging them in units of clusters, they can be arranged neatly. This group of adjacent cells is called a block.
  • Fig. 28 shows the starting matrix number and ending matrix of the reference cell. It is the figure which showed the formula which calculates the number.
  • FIG. 29 is a diagram of an example in which the arrangement of one embodiment of the present invention is performed.
  • the cell of ⁇ customer name '' 3130 on slip 3200 is the reference cell, and the starting point 3210 and the ending point 3212 are calculated in a matrix as shown in Fig. 28. , The starting matrix and the ending matrix are found, and points 3 2 2 0 and 3
  • the starting point 3 2 1 2 of the “address” 3 1 3 1 cell of the document 3 0 2 0 is the same as the 3 0 2 1 of the format because each point in the starting row and the ending column of the reference cell has the same value. Points 3 2 2 2 are set.
  • the end point 3 2 2 3 of the cell of "address" 3 1 3 1 is the end point because there is no reference
  • the starting point 3 2 1 4 and the ending point 3 2 15 of the “name j 3 1 3 2” cell of the slip 3 0 20 are the number of the end matrix of the reference cell and the cell of the “address” 3 1 3 1
  • the points 3 2 2 4 and 3 2 2 5 of the format 3 0 2 1 can be obtained from the number of termination matrices.
  • the starting point starts in the middle of the previous cell, such as the cell of “No.” 3 1 3 3, Blank 3 1 3 4
  • the start points 3 2 1 6 and 3 1 3 4 when there is an empty space are set to the start line point 3 2 10 of the reference cell. Therefore, the starting point 3 2 1 6 of “number” 3 1 3 3 is the point 3 2 2 6 of the format 3 0 2 1, and the ending point 3 2 1 7 is the point 3 2 2 7 of the format 3 0 2 1 .
  • the start point 3 2 18 of the blank cell 3 1 3 4 is converted to a point 3 2 2 8 of the format 3 0 2 1, and the end point 3 2 1 9 is converted to a point 3 2 2 9.
  • the character string in the cell of “No.” 3 2 2 8 is 2 characters, but 3 characters in the 3 1 3 8 cell of the created format 30 2 1 are empty.
  • the table 302 is created by the above method.
  • the cell number, the value of the position in the document, and the value converted into the row and column on the display are registered.
  • the character placement outside the cell is performed based on the table described above. The location of the character string outside the cell is important because of the positional relationship with the cells nearby, and a simple conversion to a matrix does not provide the correct placement.
  • FIG. 30 is a diagram for explaining an example in which an out-of-cell character string is arranged according to an embodiment of the present invention.
  • the arrangement of the character string outside the cell is based on the start position of the character string outside the cell, and the table created at the above cell position is searched to find the starting row and column of the cell having the closest value.
  • FIG. 30 it is assumed that cells of 3140 — 3143 are arranged as shown in table 3145.
  • search the start line position of the table based on the start line position of "year month day” 3144, and Find the cell with the closest value.
  • the cell is "name" 3140.
  • the number 2 of the cell starting line of this “name” 3140 is the starting line of the character string of “year / month / day j 3144.
  • the starting column of“ year / month / day :! Based on the start column position of the table, find the nearest cell “Amount” 3 1 4 3.
  • the starting column number of this cell is the number of columns to be obtained.
  • the arrangement position of the character string “year / month / day” 3144 is 2nd row and 8th column. This completes the out-of-cell character placement processing.
  • FIG. 31 is a flowchart showing a processing flow in the post-processing shown in FIG. 21 of one embodiment of the present invention.
  • the post-processing here involves adjusting the created format to fit as much as possible in the display screen (3400) and setting the order for efficient execution of business processes (3401) I do.
  • FIG. 32 shows a flowchart of the adjustment process.
  • the character string in the cell is centered (3500), and it is checked whether the created format is larger than the display screen (3501).
  • the centering of the character string in the cell is, for example, Set the interval 3 150 equal. If it is larger than the display screen, delete the blank lines and columns that are taken the most in the layout (3502). After deletion, check if the re-created format is larger than the display screen (3503), and if it is still larger, use the shortest synonym for the string with synonyms. Is converted to a character string and the character string is reduced (3504). A third check is made to see if it is larger than the device break (3505), and if it is still larger, the character string is converted from full-width characters to half-width characters (3506).
  • step 3506 the display screen is centered and the process ends, but after step 350, the created format is displayed on the display screen. If it is larger or larger by performing a check, it is possible to add a process of reducing the number of digits of one line to a plurality of lines instead of one line in the long item field.
  • FIG. 33 is a view for explaining an example of the synonymous word conversion processing in step 350 of FIG.
  • FIG. 34 is a diagram for explaining an example of the conversion process from full-width characters to half-width characters in step 3506 of FIG. 32.
  • the processing order of each item is from top to bottom and from left to right, but depending on the content of the document, it is better to perform the processing in the reverse order, such as from right to left. Sometimes it is good. For such a case, processing for automatically determining the order of processing is performed so that the processing can be performed efficiently.
  • FIG. 35 is a diagram for explaining an example of the processing order determination processing according to one embodiment of the present invention.
  • the slip 3 030 is an example in which the order is normally assigned from left to right.
  • the slip 3 031 is an example that includes a process that is opposite to the usual process from right to left.
  • the year 316, the month 316, and the day 316 7 are automatically displayed, and the operator adds a code 40000 relating to the name 4001, for example, by adding it to each customer. Enter the name code 3 1 6 8.
  • Computer is a day
  • the name corresponding to the name code 316 8 is retrieved from the database and automatically displayed in the name field 316 9.
  • the product name 4003 is automatically displayed in the product name field 3171 by inputting the product code from the operator. Therefore, the order of the slips 303 may be this processing order.
  • the fields "Name” 410, “Code j4101”, and “Product code j41012,””Productname” 4103 The position is different from the slip 3 0 3 0, and when processing it from top to bottom and from left to right, before entering the code related to the name and before entering the product code, respectively The name field and the product name field came and the processing was troublesome. Therefore, in such a case, the order of processing is 3 1 7 3 ⁇ 3 1 7 4 ⁇ 3 1 7 5 ⁇ 3 1 7 7-3 1 7 6 ⁇ 3 1 7 9 ⁇ 3 1 7 8 ⁇ 3 A process of changing the order of 180 is performed. This replacement is also performed using the knowledge base.
  • a field table 3002 is created, and based on each item name (year, month, day, name, code, product name, product code, unit price).
  • the corresponding item name is searched from the input item distinction table 3 0 3 5 of the knowledge base 3 0 3 3, and it is determined whether or not the input item requires input by the operator.
  • the name and product name are not input items, but codes are input items.
  • a format that is processed by a computer is automatically created just by reading the format of a document from a reading device, and the work process of creating by an operator is eliminated, and a large amount of work is performed. Efficiency is improved. In addition, since the adjustment is optimally made to fit within the display screen, the operator can immediately confirm and execute the business process, and the operation becomes easy.
  • a screen format that can be processed by a computer can be created by simply inputting the format of a document from a reading device such as a CR, and can be stored on a display. Since the output is adjusted optimally as described above, there is no work process for the user to create on the display, and there is an effect that the efficiency of the user can be greatly improved.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)

Description

明 柳 書式文書の画像表示 z処理方法および装置 技術分野
本発明は、 画像データを利用する書式文書のデータ処 理方法及び装置に閬し、 更に詳しく は、 例えば一般の事 務処理分野で用いられる、 文字データや数字データなど の入力あるいは出力のための空欄を持つ、 所定の書式を を備えた文書からコ ンビュータ処理用画像を自動生成し, 処理する方法及び装置に関する。
背景技術
ワークステーショ ン、 オフ ィ スプロセ ッサ、 ノ、'ーソ ナルコ ンピュータ、 あるいはワー ドプロセ ッサなどのォ フィ ス機器を利用して、 例えば、 各種の申込み書、 デー タ入力票、 請求伝票や領収書、 あるいは会計、 統計、 内 訳などのための所定の書式をもつ文書 (帳票) を発行し たり、 面面上に表示された上記文書のフォーマツ トを利 用してデータベースにデータを入力しょう とする場合、 データ入出力のための空欄をもつ帳票の書式を上述した オフィス機器の表示画面上に定義生成する必要がある。
これらの生成は、 一般的にはパラメ タで外から条件を 与えて作成するバッチ方式と、 画面と対話しながら作り 上げるペイ ンティ ング方式がとられている。 これらの方 式は、 オペレータが作成する画面や原稿の文書の形式を 見ながらカラム変換を行って、 ディスプレイ上に 1 カラ ムづっ描いてい く方式をとっている。
発明の開示
通常、 ユーザの業務には、 入力として面面、 出力とし て帳票等の書式文書が関係する。 現状において、 この画 面や文書をコ ンピュータ処理用として作成するには、 紙 上に描かれている文書のフォーマツ トをディスプレイ上 のカラム単位に変換し、 ディスプレイ画面上に描いてい
<。
しかし、 紙上からディ スプレイ画面上への変換は、 位 置合わせの計算が難しく、 カ ラムの数え誤り も多く発生 し、 作成工数がかかり、 かなりの作業時間が費やされる < そこで、 同じ譲受人の先願の米国出願第
に開示された如く の、 文書のフォーマツ トが記述され ている用紙などの記録媒体からフォーマツ トを読み込ん で、 フォーマツ トの内容からプログラムを自動生成する 方式が考えられるが、 この方式では、 文書の用紙の特徴 や記述色や、 ョゴレ、 ゴミ等の条件によって完全な形で 認識することができず、 誤認識が発生し、 この誤認識の 画面上での確認、 修正作業が必要となってく る。 この画 面上での確認、 修正作業で時間を費やすことは、 せっか く用紙からフォーマツ トを読み込むことで作業効率の向 上を図ったにもかかわらず、 上記自動生成方式の価値を 減少させてしまう結果となる。
この確認修正作業において、 一般に伝票上の用語は、 小さい文字で書かれていることが多く、 そのままのサイ ズで画面に表示すると字が見づら く なり、 修正が困難と なる。
また、 反対に読み込ませる文書の中には、 文書自身が かなり大きいものがあり、 画面上に表示しきれないよう なものが多く、 文書全体をみながらの修正ができない場 合が多い。
また、 文字の位置や間隔の補正も 1ノ 1 0讓単位の修 正になると、 ペイ ンティ ング方式のように直接その箇所 を画面上で指示する方式だと誤差を生じることが多く、 この誤差によって、 次のステップである修正後の認識処 理が正し く行われない場合がある。
さらに、 暴線の捕正に関しては、 印刷してあるフォー マツ トの印刷の色、 濃度によつては、 正し く鄞線が読み 込まれないことがあり、 この場合には簡単に鄞線の補正 を行う ことができる必要がある。
さらに、 書式文書は、 行や列の間に空欄が多く、 この ままディスプレイに描く とディスプレイ面面よりはみ出 すことが多い。 このはみ出したままで文書処理業務を実 行すると、 文書処理業務実行中に画面のスク ロールが発 生し、 文書処理業務実行性能に影響が出る。 従って、 で きるだけディスプレイ画面内に納めることが必要であり、 これらの調整を全てオペレータが考えながら作成してい このように、 ユーザのフォーマツ ト作成作業に要する 時間は、 多大なものであった。
本発明の目的は、 以上のような課題を解決し、 ォペレ ータによる表示文書の確認修正作業に関してより簡単な オペレーショ ンとする、 書式文書の生成方法及び装置を 提供し、 上記自動生成方式の効果を十分引き出すことに ある。
本発明の別の目的は、 事務業務遂行者のフォーマツ ト 作成作業を軽減し、 また、 遂行者の業務処理の効率向上 をはかり、 業務量を低滅できる画面表示用文書フォーマ ッ トの自動作成方法及び装置を提供することにある。 上記目的を達成するために、 文書のフォーマツ トが記 録された用紙その他の記録媒体と、 記録媒体に記録され ている文書フォーマツ トを読み取る読み取り装置と、 読 み取った文書フォーマツ トを表示するための表示装置を 備えた文書処理装置において、 文書処理の一つである文 書形式の生成を以下の如く に行う ことを 1つの特徴とす る。 即ち、 文書のフォーマツ トが記述されている記録媒 体からフォーマツ トを記述した情報を読み取り、 読み取 つた情報を記録媒体に記述されているフォーマツ トと同 じ或いは相似の形式で画面に表示し、 画面に表示したフ ォーマッ トをオペレータが画面上で確認しながら容易に 修正更新をできるようにし、 この確認したフォーマツ ト を認識して入出力領域を生成し、 画面上に表示されてい るフォーマッ トに重ねて表示し、 この表示した入出力領 域を画面上で確認しながら修正できるようにした。 好ましく は、 読み取り装置から読み取った情報を、 読 み取り装置の読み取りの最小単位の大きさと画面表示の 最小単位の大きさの比率をもとに計算して相似の形式で 画面上に表示する。
また、 好ましい実施例においては、 文字あるいは文字 列を修正等の編集をする場合、 編集しょう とする文字ま たは文字列の近辺をカーソル等で指定するだけで良い。 この場合、 指定した座標に一番近い文字が選択され、 指 定文字と認識される。
さ らに、 好ましい実施例によれば、 画面上に表示され ている文書フォーマツ ト上の一部分がオペレータによつ て指定されることで、 指定された部分に重ならない位置 に指定された部分の詳細な情報を表示するようにし、 表 示されている詳細な情報の内容を変更することによって、 指定された部分の内容が変更した内容の詳細な情報に応 じた内容に置き換わる。
また、 好ましい実施例において、 複数の募線作成にお いて、 募線の開始位置と最後尾の募線の終了位置と募線 本数と縦もしく は横の指定で、 開始位置と終了位置の座 標の差と鄞線本数から募線の間隔を計箕し、 計算した間 隔で募線が引かれる。
修正する文字を指定する場合、 指定する文字の近辺を 指定すれば、 指定された位置の座標からその座標に近い 文字、 複数ある場合には予め設定された優先順位に従つ て、 自動的に一つの文字を選択するこ とによってより早 く 目的の指定ができる。
また、 修正する文字や空領域 (入出力領域) の詳細を 確認する場合、 指定部分に重ならないように詳細な情報 を表示するので、 修正する文字や入出力領域を見ながら 別画面で詳細が確認でき、 前後の関係が把みやすいし、 またその面面の値を変更すれば、 もとの画面のデータや 入出力領域の属性、 位置が自動的に変更され、 効率よ く 次々と確認、 修正を行う ことができる。
文字の追加を行う場合、 1文字でなく複数の文字から 成る文字列を追加することが多いが、 この場合でも、 1 文字づっ場所を画面上に指定しながら追加していく ので はなく、 追加したい部分を指定して、 詳細な情報の画面 を表示させ、 文字列としてその詳細画面上に入力してい く ことで画面上に追加できるため、 より正確に効率よ く 追加できる。
さらによ く認識できなかった募線を修正する場合、 特 に明細部の補正は、 募線の本数が多く、 手間がかかって いたが、 作成する開始位置と終了位置、 その間に引く本 数、 横、 もしく は縦線と指定するだけで募線の本数に依 存せず一定のォペレ一ショ ンで募線作成が行なえる。
上記別の目的を達成するために、 本発明の別な特徴は- 文書の処理を行う文書処理方法において、 文書のフォー マツ トが記述されている記録媒体からフォーマツ トを記 述した情報を読み取り、 読み取った情報からディ スブレ ィ 1文字当りの文字サイ ズを決定し、 決定した文字サイ ズをもとにセルを配置し、 配置したセルをもとに文字又 は数値データなどのセル外情報を配置し、 セルとセル外 情報をディ スプレイ画面外にはみ出さないように圧縮し- ディ スプレイ画面内へ表示したフォーマツ トの各項目の 処理手順を決定する。 なお、 セルとは 4本の鄞線で定義 された四角の枠と定義される。
また、 圧縮は、 好ま しく は空白行、 空白列の削除、 知 識ベースを利用しての文字列の同意語変換、 全角文字か ら半角文字への変換の少く とも 1 つを含んだものである。 また、 処理手順決定は、 好ま し く は、 各項目の文字列 を知識ベースとのマッチングによって判断する ことを舍 んだものである。
文書から基準文字サイ ズを求め、 募線や文字の 1 1 0 ミ リ メー トル単位であらわされた位置から、 この基 準サイズによってディ スプレイ の行桁位置を求めること によって文書の形式に似せたフォーマツ トを作成するこ とができる。
まず募線で囲まれた部分の行列表現への変換を行い、 これを配置し、 その後に鄞線で囲まれていない文字列の 配置を募線で囲まれた部分の配置を記述したテーブルを 参照しながら行うため、 文書上にある文字の大きさによ る配置の伸び縮みを起こすこ となしに、 文書上にあるセ ル、 セル外情報間の相対位置とほぼ同じにセル、 セル外 情報を配置でき、 一見して違和感を覚えるようなフォー マツ トができあがらない。 P TJP90/01354
8 知識ベースを利用し、 同意語変換による文字列の圧縮 を行う ことによってディ スプレイ画面内に効率よ く納め ることができ、 また、 先に処理すべき項目を選びだし、 読み込んだフォーマツ トと照らしあわせて処理順序を決 定することによって効率のよい業務処理ができる。
なお、 本願に関連した以下の出願を示しておく。
1. 特願昭 5 9 — 1 8 0 5 1 7号 ( 1 9 8 4. 8. 3 1 ) およびこれを基礎出願とする米国特許出願第 7 6 6 9 4 3 ( 1 9 8 5. 8. 1 9 ) 、 この米国出願の鐽続出願で ある米国特許出願第 1 7 8 7 6 8 ( 1 9 8 8. 3. 2 9 )、 この米国出願の綞続出願である米国特許出願第 3 9 9 4 1 1 ( 1 9 8 9. 8. 2 5 ) 、 およびこの米国出願の継 続出願である米国特許出願第 4 8 5 9 8 6 ( 1 9 9 0. 2. 2 7 ) o
2. 特願昭 6 3 — 2 0 9 9 7 5 ( 1 9 8 8. 8. 2 4 ) およびこれを優先権主張の基礎とする米国特許出願第 3 9 7 1 1 7 ( 1 9 8 9. 8. 2 1 ) 0
3. 特願平 1 — 1 2 4 6 2 9 0 ( 1 9 8 9. 9. 2 5)、 1 - 1 7 5 4 6 9 ( 1 9 8 9. 7. 1 0 ) および 1 一 2 0 2 7 9 4 ( 1 9 8 9. 8. 7 ) を優先権主張の基礎と する米国特許出願第
図面の簡単な説明
第 1図は、 本発明の一実施例の文書処理装置の全体構 成を示すブロ ック図、 第 2図は、 オペレータの操作手順、 本発明装置における画面の状態の変化、 本発明装置の動 作を示す図、 第 3図は、 本発明の別の実施例の詳細な文 書処理の流れを説明するための図、 第 4図は、 本発明の 別の実施例の、 フォーマツ トを画面に表示するまでの処 理を示すフローチャー ト、 第 5図は、 本発明の別の実施 例の密度変換の方法を説明するための図、 第 6図は、 本 発明の別の実施例の、 鄞線のマージの処理方法を説明す るための図、 第 7図は、 本発明の別の実施例の画面表示 拡大縮小を説明すめための図、 第 8図は、 本発明の別の 実施例のスケール表示を説明するための図、 第 9 A— 9 C図は、 本発明の別の実施例の指定文字の選択方法を説 明するための図、 第 1 0図は、 本発明の別の実施例のボ ツプアップ画面の一例を示すための図、 第 1 1図は、 本 発明,の別の実施例の文字修正の流れを説明するための図、 第 1 2図は本発明の別の実施例の文字修正の流れを示す フローチャー ト、 第 1 3 A、 1 3 B図は、 本発明の別の 実施例のボップアップ画面表示の決定方法を説明するた めの図、 第 1 4図は、 本発明の別の実施例の文字の追加 の例を説明するための図、 第 1 5図は、 本発明の別の実 施例の募線の作成方法を説明するための図、 第 1 6 A— 1 6 C図は、 それぞれ本発明の別の実施例の募線作成の オペレーショ ンの流れを示すフローチヤ一ト及びマ ト リ ックス状鄞線の例を示す図、 第 1 7図は、 本発明の別の 実施例の入出力フィールドの画面上への表示の流れを説 明するための図、 第 1 8図は、 本発明の別の実施例の入 出力フ ィールドの拡大フォーマツ トを示す図、 第 1 9図 は、 本発明の別の実施例の入出力フィールドの拡大縮小 の一例を示す図、 第 2 0図は、 本発明の別の実施例の入 出力フィールドのポップアップ画面の一例を説明するた めの図、 第 2 1図は、 本発明の別の実施例の処理の一連 の流れを示すフローチャー ト、 第 2 2 A - 2 2 C図は、 本発明の一実施例のデイスプレイ画面に表示した文書フ ォーマツ トと入力した情報のテーブルを示す図、 第 2 3 図は、 本発明の一実施例の前処理の処理内容を表すフロ 一チャー ト、 第 2 4図は、 本発明の別の実施例のセル、 セル外情報等を配置する際の基準文字サイズの構成を説 明するための図、 第 2 5図は、 本発明の別の実施例の拡 大文字の抽出方法を説明するための図、 第 2 6図は、 本 発明の別の実施例の配置処理の流れを示すフローチャー ト、 第 2 7図は、 本発明の別の実施例の各項目の閬係を 説明するための図、 第 2 8図は、 本発明の別の実施例の 読み込んだ入力情報の変換を行う計算方法を示した図、 第 2 9図は、 本発明の別の実施例の実際の配置例と帳票 フォーマツ ト格納テーブルを説明するための図、 第 3 0 図は、 本発明の別の実施例のセル外文字列の配置方法を 説明するための図、 第 3 1図は、 本発明の別の実施例の 後処理のフローチャー ト、 第 3 2図は、 本発明の別の実 施例のデイ スブレイ面面内への収納調整の詳細なフロー チャー ト、 第 3 3図は、 本発明の別の実施例の同意語変 換方式の概要を説明するための図、 第 3 4図は、 本発明 の別の実施例の半角文字変換方式の概要を示す図、 第 3 5図は、 本発明の別の実施例の処理手順の決定方法を 説明するための図である。
発明を実施するための最良の形態
以下、 本発明の好ま しい実施例を図面を用いて詳細に 説明する。
第 1図は、 本発明の一実施例の文書処理装置全体構成 図である。 全体の制御を行う中央のプロセ ッサ 1 には、 オペレータが指示を行うためのキーボー ドゃ必要に応じ てマウス、 作成したフォーマツ トを表示するスク リ ーン 等を有するコ ンソール装置 2、 伝票、 帳票を読み取るた めの読み取り装置 3が読み取り装置用コ ン トローラ 4を 介して接続されている。 また、 処理した文書の出力を行 うためのプリ ンタ 6がプリ ンタコ ン ト ローラ 5を介して、 作成したフォーマツ ト等を格納するための記憶装置 8が 記憶装置用コ ン トローラ 7を介して接続されている。 な お、 読み取り装置として 0 C R等のイメージリーダを用 いて上述の如く文書を読み取っても良い。 又、 読み取り 装置 3 としてワー ドプロセ ッサを用いて文書の情報を直 接入力しても良い。 或いは、 読み取り装置 3 として磁気 ディ スク装置を用い、 ワー ドプロセ ッサのフロ ッ ピーデ イ スクに格納された文書情報を読み取るよう にしても良 い。 更には、 読み取り装置 3 としてファ ク シミ リ等を用 いても良い。
プロセ ッサ 1 は、 読み取り装置 3から文書を読み込み、 読み込んで得られた形式情報或いは入力情報を記憶装置 8内の形式情報格納領域 1 0に格納する。 それと共に読 み込んだ文書と相似なフォーマツ トで画面に文書を表示 し、 オペレータの画面上での文書の確認、 條正作業を容 易にならしめる。 修正作業が完了したらプロセッサ 1 は 修正された部分の情報を形式情報格納領域 1 0に格納す る。 格納された形式情報よりプロセッサ 1が記憶装置 8 内の知識ベース 9を使って文書の形式やその中で使用さ れている各項目又は用語の意味、 内容等の認識を行う。 認識結果を認識結果格納領域 1 1 に格納し、 認識結果か らプロセッサ 1で画面表示用フォーマツ トの作成を自動 的に行う。 このフォーマッ トはプロセッサ 1 により、 ォ ペレータのこの文書の入出力フィールドへのデータの入 出力作業がやりやすい形に前述の相似形のフォーマツ ト が修正されたものである。 プロセ ッサ 1 は、 生成され、 フォーマツ ト格納領域 1 2に格納されたフォーマッ トか ら処理手順の設定を行い、 業務プログラムの実行を行う < 処理手順とは伝票を例にとれば、 例えば金額は単価 X数 量という処理で得られるというような処理の流れを意味 する。 作業領域 1 3 は後述のボップアップ画面をスク リ ーン上に表示する時などに必要な、 プロセ ッサ 1 の作業 の途中で生成されるテーブル群を一時的に格納する、 記 憶装置 8上のエリアである。
第 2図は本発明の一実施例による一連の処理の流れを 説明するフローチャー トである。
図において、 2 0 0 は文書の 1例である、 日付 2 0 0 A、 "年" 、 "月 " 、 "日 " 2 0 0 B、 伝票番号 2 0 0 C、 コー ド 2 0 0 D、 品名 2 0 0 E、 数量 2 0 0 F、 金 額 2 0 0 G及び鄞線 2 0 0 Lが記載された伝票 2 0 0で ある。 この伝票 2 0 0 は原稿の用紙であり、 多少のよご れ、 文字或いは鄞線の不鮮明等の不具合があっても、 本 発明によれば、 オペレータが画面上の原稿の表示を見な がら容易に修正ができ、 正確な、 かつ、 所望のフォーマ ッ トの伝票を面面上に生成表示するこ とができる。
第 2図は、 本発明の一実施例の、 実行時における一連 の処理の流れを説明するものである。 2 0 0に示すよう な、 フォーマツ トが記載された文書の用紙を、 O C R等 の読み取り装置 3から読み込んで、 形式情報の入力が行 われる ( 2 0 1 ) 。 読み込んだ鄞線、 文字、 画像などの 形式情報をもとに、 原稿の伝票のパターンと相似なバタ 一ンの画像をコ ンソール装置 2のディ スプレイ画面上に 表示する ( 2 0 2 ) 。 なお、 前述の如く、 形式情報はヮ 一プロ、 ファ ックス等の装置から直接入力しても良い。 オペレータは、 この表示内容の確認修正ができる ( 2 0 3 ) 。 コ ンピュータは読み込んだ形式情報に舍まれる 募線のパターン、 用語の意味を基に、 或いはオペレータ からの入力情報等を利用して、 入出力フィールドの認識 を行い、 既に鄞線、 文字、 面像などのデータが表示され た画面上に認識した入出力フィールドの表示を行う ( 2 0 4 ) o
さらに、 ここでも確認修正を行う ことができる ( 2 0 5 ) 。 確認修正後、 読み込んだ形式情報や認識した入出 力フィールドをもとにこれから処理するフォーマツ トの 自動生成を行い ( 2 0 6 ) 、 生成した結果をディ スプレ ィ画面上に表示し ( 2 0 7 ) 、 オペレータは、 確認修正 できる。 作成したフォーマツ トは記憶装置 8内のフォー マッ ト格納領域 1 2に格納する ( 2 0 8 ) 。 作成したフ ォーマツ トの情報等をもとに処理の手続きを作成し ( 2 0 9 ) 、 処理手続きの実行を行い ( 2 1 0 ) 、 実行結果 の表示を行う ( 2 1 1 ) 。
第 3図は、 第 2図の一連の流れをさらに詳細に説明し たものである。
まず、 処理しょう とする文書の形式を入力する ( 3 0 0 ) 。 例えば、 ィメージリーダで文書を読み込んでも良 いし、 ワープロで作成された文書を直接、 又はこの文書 を収めたフロ ッ ピ一ディスクを読み込むようにしても良 い。 読み込んだ結果、 文字の情報、 鄞線の情報、 読み込 んだ文書の用紙サイズなどの情報を形式情報として記憶 装置 8の形式情報格納領域 1 0に格納する ( 3 0 1 ) 。 即ち、 ステップ 3 0 1では読み込んだ形式情報をそのま ま形式情報格納領域 1 0に格納する。 この形式情報をも とにプロセッサ 1 は読み込んだ文書の形式と相似の形式 を作成して、 画面への表示を行い ( 3 0 2 ) 、 3 0 3に 示すような画面が表示される。 画面 3 0 3には、 コード 3 0 3 B、 品名 3 0 3 C、 単価 3 0 3 Dという名前の欄 を有する売上伝票 3 0 3 Aが示されている。 オペレータ により、 画面に表示された文書形式の確認、 修正を行い ( 3 0 4 ) 、 確認が終わると形式情報格納頷域 1 0に格 納された形式情報の認識処理へ移る ( 3 0 5 ) 。 プロセ ッサ 1 は知識ベース 9を使って文字列 (用語) の意味、 鄴線のパターンから入出力フィールドを作成し、 認識情 報を記憶装置 8内の認識結果格納領域 1 1 に格納し ( 3 0 6 ) 、 既に鄞線ゃ文字が表示されている面面へ作成し た入出力フィールドの表示を行う ( 3 0 7 ) 。 オペレー タが入出力フ ィールドの確認修正を行い ( 3 0 8 ) 、 確 認が終ると、 プロセ ッサ 1 は認識結果格納領域 1 1 内の 認識情報からフォーマッ トの作成を行う ( 3 0 9 ) 。 プ 口セ ッサ 1 は作成したフォーマツ トを記憶装置 8 内のフ ォーマツ ト格納領域 1 2に格納し、 処理手続きの作成を 行う ( 3 1 0 ) 。
第 4図は、 伝票や帳票の読み込みから面面に表示する までの流れを示すフローチャー トである。 これから処理 を行う文書の読み込みを行い ( 4 0 0 ) 、 用紙サイズや 文字ゃ羅線情報を JLに示すような形式情報ファィルに格 納する。 形式情報は全て 1 / 1 0 mm単位で表現されてい る。 形式情報は、 文字情報と募線情報から成り立つてお り、 文字情報は画面左上隅の或る一点を基準位置とし、 この基準位置に対する今考慮中の文字の位置の X、 Y座 標と、 この文字をこの文字に外接する四角形で囲み、 こ の四角形の左上の角を開始点とする X、 Y方向の長さ、 及びこの文字を代表するコー ドからできている。 募線情 報は、 募線の先頭座標から終点座標及び実線か破線か等 の種別から成り立つている。 この読み込んだ形式情報を もとにプロセッサ 1 は画面へ表示するための密度変換を 行う ( 4 0 1 ) 。 密度変換については後述するが、 この 変換は読み込んだ帳票を画面上に、 相似形で表示するた めの処理である。 画面に表示するための表示用文字フォ ン トを、 既に設定されている標準文字フォ ン トを形式情 報中の文字の大きさの情報に合わせて縮小或いは拡大を 行い作成する ( 4 0 2 ) 。 文字表示テーブルにこの縮小 または拡大の比率を設定し ( 4 0 3 ) 、 全文字分のフォ ン トの作成を行う。 次に形式情報の募線情報から同種の 情報を有する募線のマージ処理を行い ( 4 0 6 ) 、 募線 表示テーブルに設定する ( 4 0 7 ) 。 募線のマージ処理 については後述する。 文字表示テーブルの設定内容と募 線表示テーブルの設定内容から画面に読み込んだ帳票と 同じ形式或いは相似のフォーマッ トを表示する ( 4 0 9 ) 第 5図は、 密度変換の方法を説明した図である。 標準 文字フォ ン トとして 5 0 1 に示すような黒い ドッ トのか たまりを全文字分持っており、 この黒い ドッ トのかたま り、 標準文字フォ ン トを形式情報中の文字情報 5 0 0の 大きさの情報に従い拡大、 もしく は縮小して、 表示用文 字フォ ン トを作成していく。 具体的には、 読み取り装置 3の読み取りの最小単位の大きさと画面表示の最小単位 の大きさの比に基づいて拡大又は縮小を行う。 標準文字 フォ ン トを形式情報に従って縮小したときの例を 5 0 2 に示す。
第 6図は、 募線のマージの処理方法を説明した図であ る。 募線情報中には実際には一線分であるものが、 6 0 0、 6 0 1、 6 0 2、 または 6 0 3、 6 0 4 のように交 点ごとの線分として区切られて認識される場合がある。 これを bに示す 6 0 5、 または 6 0 6のように同種の募 線を連結し、 マージして 1本とすることによって鄞線表 示テーブル内へ設定すべき募線情報の量を削減すること ができる。
第 7図は、 画面表示の拡大縮小を説明した図である。 aに示す伝票を入力し、 bに示すように実寸大の大きさ で画面に表示する。 表示した画面の下部には、 ォブショ ンのガイダンス 7 0 0が表示されており、 オペレータは、 これを選択して処理を行う。 ガイダンス 7 0 0 は例えば、 倍率 7 0 O A、 スケール 7 0 0 B、 スク ロール 7 0 0 C 等を舍む。 オプショ ンであるガイ ダンスの中から倍率 7 0 0 Aのキーが選択入力されると、 画面に cのような次 のガイダンス 7 0 1が表示される。 ガイダンス 7 0 1 は 4倍 7 0 1 A、 2倍 7 0 1 B、 1倍 7 0 1 C、 1ノ 2倍 7 0 1 D、 1ノ 4倍 7 0 1 Eのガイダンス 7 0 1 で、 例 えば 2倍 7 0 1 Bが選択されると、 画面表示が 2倍に拡 大されて dに示すような画面の表示が行われる。 この画 面では 7 0 2 に示すように文字は 2倍に拡大され、 表を 形成する藓線も 2倍に引き伸ばされ 7 0 4に示すような ものとなる。 また、 c のガイダンスが表示された面面で 1 Z 2倍 7 0 1 Dが選択された場合には、 eに示すよう な画面が表示される。 7 0 3に示すように文字は 1 / 2 倍に縮小され、 7 0 5に示すように表を形成する募線全 体も 1ノ 2倍に縮小される。 この拡大縮小結果は、 gに 示すように形式情報に反映され、 オペレータはこの縮少、 拡大表示された画面のまま、 内容の修正、 変更を行う こ とができる。 読み込んだ伝票、 もしく は帳票の形式が小 さ く、 画面で見づらい場合は、 拡大し、 大きすぎて画面 内に表示し切れない場合は、 縮小し、 全体像を確認しな がら修正処理を進めてい く ことができる。 このような拡 大縮小は第 5図の文字フォ ン トの場合と同様な方法で実 施する。
第 8図は、 スケール表示を説明した図である。 画面上 の表示を拡大、 縮小できることに伴い、 スケールを表示 し、 また、 表示するスケールのメ モ リ も表示画面の大き さに合わせて自動調整する。 これにより、 文字位置の確 認修正、 文字と文字の間隔の確認修正が簡単にできる。 第 8図において、 フォーマツ トが表示された画面 8 0 0でスケール表示のキーが入力される ( 8 0 1 ) と、 8 0 2に示す画面のように aの横スケールと、 bの縦スケ ールを表示する。 スケールは、 8 0 3に示すように I ran 単位で表示する。 1咖として表示する幅は、 読み込ませ た文書上の 1 mmが画面上の最小単位である ドッ ト数がい く つで構成されているかを計算し、 (その個数) X (画 面上の最小単位である ドッ トの大きさ) で画面上の 1讓 としている。 第 8図に示す例で説明すると、 文書 8 0 8 上では最小単位の ドッ ト 8 0 9が 2つで 1 讓となってい る。 画面 8 1 0上には、 画面上の ドッ ト 8 1 1 の 2個分 がスケール幅の 1 mm単位となっている。 拡大時のスケー ル表示は、 8 0 5で示すように、 画面上の 1 雕の幅 X拡 大時の倍率を、 1 咖の幅と考えたスケール 8 0 4が表示 される。 また、 縮小時のスケール表示は、 8 0 7に示す ように、 画面上の 1 咖の幅 X縮小時の縮小率を、 1 卿の 幅と考えたスケール 8 0 6が表示される。
第 9 A— 9 C図は、 指定文字の選択方法を説明した図 である。 第 9 A図の aに示す画面で修正したい文字の指 定は、 縦カーソル 9 0 0 と、 横カーソル 9 0 1 との交点 で該当の文字の指定を行うようになっている。 このカー ソルは、 9 0 2 に示すようなカーソルキーで操作する。 また、 画面上小さい図形の指定においても簡単にできる ように第 9 B図の 9 0 4 に示すように指定しょう とする 文字の近辺にカーソルを位置付けるだけで自動選択し、 指定ができる。 これは、 例えば第 9 C図の 9 0 5 に示す ようにカーソルの位置から所定半径の半円内に座標を持 つ文字を該当の文字として検知することによつて位置付 ける方法でもよい。
條正したい文字の指定がなされると、 後述の如く、 そ の文字と重ならない位置に修正する文字の詳細情報が表 示されるようになっている。 この表示された内容の修正 を行う ことで、 フォーマ ツ ト上の指定文字が自動修正さ れる。 このようにもとの画面をみながらの修正が可能と なる。 ここでは、 この面面上に表示される詳細画面をポ ッブァップ面面と呼ぶ。 ボップァップ画面はプロセッサ 1 によって形式情報格納領域から抽出され作業領域 1 3 上に一時的に表の形で形成された情報を基に画面に表示 される。
第 1 0図は、 そのポップアツプ画面の一例を説明した 図である。 画面 1 0 0 0上で文字 aを指定すると、 ボッ プアッブ画面 1 0 0 1が指定文字と重ならない位置、 こ の場合には右隅に表示される。 ボップア ッブ画面の内容 は文字の内容 b、 文字の位置 c、 文字サイズ d、 次の文 字との間隔 e、 文字列の並び方向 f がある。
文字の位置 cは、 例えば横 1 5 0 1ノ 1 0腿、 縦 2 0 5 1ノ 1 0 画の如く表示される。 大きさ dは標準文 字フ ォ ン トに対する大きさであり、 例えば横 4ノ 4、 縦 3ノ 4 の如く表示される。 文字間隔 e は、 例えば 0 . 1 3 mmの如く表示される。 並びは、 横方向に配列された文字 列を 1で、 縦方向に配列されたそれを 2で表わし、 ( 1 ) により文字 bを舍む文字列が横並びであることが示され ている。
第 1 1図は文字修正の流れを説明した図である。
まず、 画面に文書の形式が表示される ( 1 1 0 0 ) 。 オペレータは修正文字の指定を行い ( 1 1 0 1 ) 、 該当 の文字付近にカーソルを位置付ける ( 1 1 0 2 ) 。 実行 キーがオペレータにより押されると bのポップアップ画 面が、 画面の右隅に表示される ( 1 1 0 4 ) 。 このボッ プア ッブ画面中の詳細情報をオペレータが変更する ( 1 1 0 5 ) 。 オペレータが、 例えば、 文字欄の内容を bに 示されたそれから cに示すように変更し、 更に、 文字の 位置 d、 文字の大きさ e も変更する。 次いで、 実行キー が押される ( 1 1 0 6 ) と表示画面内で先に指定れさた 文字 f が、 ボッブァッブ画面中の変更された詳細情報に 基づく 内容に置き換えられて表示される ( 1 1 0 7 ) 。
第 1 2図は、 この流れを示すフローチャー トである。 なお、 同図において 3 0 3 Eは金額を表わす。 画面上で 修正する文字の近辺に力一ソルが位置付けられると ( 1 2 0 0 ) 、 位置付けられた X , Y座標が得られ ( 1 2 0 1 ) 、 この座標をもとに形式情報中の文字情報 aを検索 し、 位置付けた位置に一番近い文字情報 bを読み出す ( 1 2 0 2 ) 。 読み出した情報をもとにボップア ップ画 面を作成する ( 1 2 0 3 ) 。 ポップァ 'ンブ画面の表示位 置を設定し ( 1 2 0 4 ) 、 設定した位置にボップアッブ 画面の表示を行う ( 1 2 0 5 ) 。 オペレータは、 この内 容を確認し、 修正を行う。 修正されたボップア ップ画面 上の詳細情報 (修正データ) を取り込む ( 1 2 0 7 ) 。 この取り込んだ詳細情報 (修正データ) 1 2 1 0を形式 情報に書き込む ( 1 2 0 8 ) 。 その後この詳細情報をも とに修正した文字を画面上で指定した文字と置き換えて 表示する ( 1 2 0 9 ) 。
第 1 3 A、 1 3 Bは、 ボップア ップ画面表示位置の決 定方法を説明した図である。 第 1 3 A図で示すように、 gの示す文字を修正の対象とすると、 この文字を中心に 画面を 4つの領域 a、 b、 c、 dに分割する。 この際、 文字サイズ ί、 e の領域を除いて分割する。 第 1 3 B図 で処理の流れを説明すると、 文字のサイズと位置の情報 をもとに画面を 4分割する ( 1 3 0 2 ) 。 次に分割した 部分の中で詳細情報表示画面が入るだけの領域がある部 分を選択する ( 1 3 0 3 ) 。 選択した中から 1 3 0 1 に 示すような所定の優先順位に従って一番優先度の高い領 域を決定する ( 1 3 0 4 ) 。 優先度は、 右下、 左下、 右 上、 左上の順で優先する。 この方式を取ることによって 修正する文字の位置にかかわらずその文字が常に見える 状態で詳細情報が確認でき、 また修正を行う ことができ る。
第 1 4図は、 文字の追加の例を説明した図である。 文 字を追加する場合、 一文字の追加でなく文字列として追 加することが多い。 文字列の追加を行う場合、 一文字づ つの文字間隔を合わせ、 横、 又は縦並びに一文字づっカ —ソルを位置付け、 設定してい く方法が通常であるが、 これをより簡単に行うようにした。 即ち、 文字列を追加 するために必要なものは、 文字列の内容と開始位置と文 字の間隔と文字列の並び方向であることから、 ポップァ ップ画面内の詳細情報を示す表中にこれらの情報を設定 するだけで設定した情報から各文字の形式情報を自動作 成し画面上に表示する。 第 1 4図で、 1 4 0 0 に示すような募線だけの画面に カーソルを位置付けし、 ポップア ップ画面 1 4 1 0を表 示させる。 このボップア ップ画面 1 4 1 0の内容として はカーソルが位置付けられた位置づけが表示されている , このポップア ップ画面の文字内容の欄に 1 4 0 1で示す ようにオペレータが文字列 1 4 0 5 ( こ の場合は文字列 1 4 0 5 は商品名に相当) を設定し、 文字列の位置が適 切か否かを再度確認し、 不適切ならカーソルを移動して 修正し、 文字の大きさ b、 文字の間隔 c、 文字の並び d を指定するという操作だけで 1 4 0 3に示す画面のよう に、 画面上の指定の位置に文字列が追加される。 形式情 報のテーブルに、 この詳細情報で指定された内容から各 文字の位置を計算し、 各文字についての文字情報を設定 する。 横並びが指定された場合は、 X座標 hを先頭の文 字の X座標 + ( n— 1 ) · (文字の横幅十文字の間隔) の値で設定する。 縦並びの場合は、 Y座標 i を先頭の文 字の Y座標 + ( n— 1 ) ♦ (文字の縦幅十文字間隔) で 設定する。 nは今問題としている文字が文字列の先頭の 文字から何番目に位置しているかを示す値である。 文字 の修正だけでな く、 募線の削除、 作成、 線種変更等もォ ペレータが画面を見ながら行う ことができる。 例えば、 薪線削除はデリー トキーを押し、 カーソルを削除すべき 鄞線の周囲に沿って移動させ、 実行キーを押すことによ り行う。 又、 文書用紙上の汚れ等による画面上の不要な 表示部分も同様な操作によって容易に削除できる。 第 1 5図は、 募線の作成方法を説明した図である。 通 常、 1本の横線を引く場合は、 ( a ) に示すように点① と点②で開始位置と終了位置を指定すると 1 5 0 0に示 すような横線が作成される。 縦線を 1本作成する場合も ( b ) に示すように点①と点②で開始位置、 終了位置を 指定すれば、 1 5 0 1 に示すような縦線が作成できる。 一般に募線の作成では、 1本 1本上記の方法で作成して いく のが現状であり、 作成する募線の本数分オペレーシ ョ ンが必要となる。 文書で扱われる募線は、 主に同じ長 さの横線もしく は縦線が複数本並んだ表形式のものが多 く、 同じようなオペレーショ ンの操り返しで表が作成さ れる。
本発明ではこれらの複数本の鄞線を一度に作成し、 し かも間隔も自動的に決定し、 さらに、 本数が増えてもォ ペレーショ ン数は一定である。
第 1 5図の ( c ) 、 ( d ) に本発明の一実施例を示す。 ( c ) は横直線を複数本作成する場合の例である。 点① と点②で横直線を引く先頭位置 1 5 0 2 と、 複数本の最 終横直線の終点位置 1 5 0 3を指定する。 ここで鄞線の 本数を指定すれば、 等間隔となるように間隔を計算し、 その本数分の作成を行う。 この例では 4本指定したもの である。 それぞれの募線の間隔は、 ①の Y座標から②の Y座標を引いた差の値を指定本数から 1 引いた値で割つ たものである。 本数指定をしない場合は、 穰準文字サイ ズの値をもとに自動的に間隔値を計算し、 鄞線を複数本 135
25 自動的に作成する。 縦直線の作成も横直線の場合と同様 である。 ( c ) のように点①で開始位置、 点②で最終位 置を指定し、 本数を指定するだけで等間隔に作成される。 従って表枠を作成する場合、 横直線 η本の指定と縦直線 m本の指定をするだけで表枠の作成ができる。 また、 作 成した募線情報は、 形式情報として設定される。
第 1 6 A、 1 6 B図は、 鄞線作成時のオペレーショ.ン の流れを示すフローチャー トである。 第 1 6 A図が本発 明の方式によるものであり、 第 1 6 B図は、 従来の一本 —本設定する方式である。 第 1 6 C図の 1 6 0 4に示す ようなマ ト リ ックス型の形式を作成するのに、 第 1 6 A 図では、 横の直線 n本を一度に指定し、 その後、 縦の直 線 m本を一度に指定し、 計 2回の指定で 1 6 0 4に示す ような形式が作成できる。 詳細にはまず、 ステップ 1 6 0 0では、 まず横直線作成である旨指定する ( 1 6 1 0 ) 次に、 横直線の開始および終了位置を指定する ( 1 6 1 1 ) 。 次に引くべき横直線の本数を指定する ( 1 6 1 2 ) ステップ 1 6 0 1でも同様に、 まず、 縦直線作成である 旨指定する ( 1 6 1 3 ) 。 次に、 引くべき縦線の開始お よび終了位置を指定する ( 1 6 1 4 ) 。 最後に引 くべき 縦線の本数を指定する ( 1 6 1 5 ) 。 従来の方法で第 1 6 B図の 1 6 0 4に示すような形式を作成すると、 第 1 6 B図の 1 6 0 2のオペレーショ ンを横直線の本数分繰 り返し、 その後、 1 6 0 3のオペレーショ ンを縦直線の 本数分繰り返すことになる。 従来のオペレーショ ンだと 本数が増えれば、 それだけ繰り返す面数が多く なるが、 本方式だと常に 2回で済むことになる。
以上のような、 形式情報の修正確認終了後、 認識処理 に入り、 入出力フ ィールドの生成処理を行う。
第 1 7図は、 入出力フィールドの画面上への表示の流 れを説明した図である。 記憶装置 8内の知識ベース 9を 使って文書上の募線の形、 用語の意味から空欄が入出力 フィールドであるか否かの認識処理を行い ( 1 7 0 0 )、 その認識結果情報 1 7 0 5を記憶装置 8内の認識結果格 納領域 1 1 に格納する。 格納した認識結果をもとに、 既 に雾線ゃ文字等の形式情報が表示されている画面上に認 識した入出力フ ィールドの表示を行い ( 1 Ί 0 1 ) 、 1 7 0 2に示すような画面が表示される。 認識の結果、 生 成された入出力フィールドは、 1 7 0 2 に示すような画 面にて、 カラー表示される。 この表示された認識結果は、 位置, 属性, 長さ, 幅等を確認し、 オペレータが修正す ることができる ( 1 7 0 4 ) 。
第 1 8図は、 入出力フィールドの拡大図である。 認識 結果情報をもとに 1 8 0 0 に示すように入出力フ ィ一ル ドの長さ、 幅をその入出力フィールドの表示エリ アで力 ラー表示して示し、 さらにカラー表示した入出力フィー ルドの表示エリアの中に 1 8 0 1 に示すような属性と桁 数が表示される。 3桁以上の場合は、 1 8 0 1 に示すよ うに属性文字 (桁数) の形で記述され、 3桁以内の場合 には、 1 8 0 2に示すように属性文字を桁数分だけ記述 して示す。 第 1 8図に示された例では属性が Nであり、 桁数が 1 0であるから、 コー ド 3 0 3 Bに続く入出力フ ィールド 1 8 0 0 は 1 0文字の漢字が入るフ ィールドで あることがわかる。
また、 認識結果の入出力フィ ール ドは、 形式情報の募 線や文字と同様に拡大、 もし く は縮小表示することがで きる。
第 1 9図は、 入出力のフィールドの拡大、 縮小の一例 を示す図である。 拡大、 もしく は縮小は、 形式情報の募 線や文字と同様に認識結果の入出力フィールドの青色部 分も同じ倍率で拡大、 縮小され、 表示され、 その拡大縮 小したままで修正確認ができる。 なお、 同図において、 3 0 3 Fは月及び日をあらわす。
内容の修正、 確認は、 形式情報のときと同様、 修正確 認する認識結果の入出力フィール ド、 またはその近辺に カーソルを位置付け、 実行キーを入力し、 ボップア ップ 画面の詳細情報を画面に表示し、 そのポップアップ画面 上で修正確認を行う。
第 2 0 A図は、 入出力フ ィール ドのポップア ップ画面 の一例を示す図である。 a に示す青色表示の上にカーソ ルを位置付け、 実行キーを入力すると bのようなポップ ア ップ画面の詳細情報が表示される。 この内容が、 認識 処理で確認した結果であり、 この表示されている内容を 修正するこ とで入出力フ ィールドの修正ができる。
この方式によって、 オペレータは、 次々 と認識した内 容を確認し、 修正していく ことが可能となる。
本実施例によれば、 フォーマッ トの縮小拡大が自由に でき、 オペレータの修正し易い大きさで確認修正作業を 進めることができる。
また、 形式情報や入出力フィールドの細かい修正も、 表示された詳細情報の画面上で値の変更、 新規入力を行 う ことで容易にフォーマツ トの修正ができ、 募線も開始 点と最後尾の募線の最終点と鄞線本数を入力することで 一度に複数本を作成できるようにし、 確認修正作業の操 作性の向上を図ることができる。
また、 認識した入出力フィールドエリアをカラ一表示 し、 そのエリアの中に属性と桁数を表示することで、 一 目で確認でき、 さらに詳細な情報を知りたい場合には、 エリアを指定して、 そのエリアの詳細情報画面により確 認修正ができる。
なお、 第 2 0図の各欄の説明をすると、 1 9 0 0 は表 示された情報が項目情報であることを示す欄である。 1 9 0 1 は項目などを示す欄である。 1 9 0 2は項目位置 を示す欄で、 横方向、 縦方向の位置がそれぞれ 1ノ 1 0 鴯単位で表わされている。 1 9 0 3 は項目長を示す欄で あり、 行数及び桁数で表わされている。 1 9 0 4 は文字 間隔を示す欄であり、 行間及び列間の間隔が 1 / 1 0 讓 単位で示されている。 1 9 0 5 は属性を表わす欄で、 1 は数値、 2 は英数字、 3 は漢字を示す。 1 9 0 6 は入出 力の別を示す欄で、 1 は入力、 2は出力、 3 は入/出力 P T/JP90/01354
29 を示す。 1 9 0 7 は形態を示す欄であり、 1 は見出し、 2 は明細、 3 は総括を示す。 1 9 0 8 は表示された情報 が明細情報であることを示し、 1 9 0 9 は反復回数を示 す欄で、 縦方向及び横方向の反復回数を示す。 1 9 1 0 は反復間隔を示す欄であり、 縦間隔及び横間隔をそれぞ れ l Z l O mm単位で示す。 1 9 1 1 は合計回数を示す欄 である。 1 9 1 2 は印字方向を示す欄で、 1が縦方向を 示し、 2が横方向を示す。 1 9 1 3 は表示された情報が 編集情報であることを示す欄で、 1 9 1 4 は ¥の欄であ り、 1 はあり、 2 はなしを示す。 1 9 1 5 は詰めを示し、 1 は右に、 2 は左に、 3 は中央に詰めることを示し、 4 は詰めないことを示す。 1 9 1 6 は拡大することを示す 欄で、 1 は横に、 2 は縦に、 3は横縦共に拡大すること を示し、 4 は拡大しないことを示す。 1 9 1 7 は桁合せ を示し、 0 は桁合せしないことを示す。
以上の説明から明らかなように、 上記実施例によれば 伝票等の文書の形式からコ ンピュータ処理用のプロダラ ムを作成する際に生じる補正処理において、 フォーマツ トの拡大縮小が自由にでき、 オペレータの修正し易い大 きさで作業を進めることができ、 形式情報の細かい修正 も容易にでき、 認識結果が一目で理解できるようにした ので、 確認修正作業がより簡単なオペレーショ ンで行え、 作業時間の短縮化が図られるという効果がある。
次に本発明による画面表示用文書形式の自動作成の実 施例につき図面に言及し説明する。 本実 J¾例は、 第 2図 で説明したフォーマツ ト作成ステップ 1 0 0 6を具体的 に構成したものであり、 ステップ 1 0 0 4で得られ、 画 面上に表示された文書形式は原稿の文書形式と相似であ つたが、 ステップ 1 0 0 6の実行結果で得られる、 画面 上に表示された文書形式は本発明によってオペレータの 扱い易い形式に修正されている。 本実施例を適用した場 合でも文書処理の実行時の一連の処理の流れは、 第 2図 と全く同様であるため、 第 2図を繰返して説明すること は省略する。 又、 全体の構成も第 1図に示した構成と同 様であるのでその説明は操かえさない。
第 2 1図は、 本発明の一実施例の画面表示用文書形式 の自動作成処理の流れを示すフローチャー トである。 基準となる文字サイズを求めたり、 拡大する文字の抽 出を行う等の処理からなる前処理を行う ( 2 1 0 0 ) 。 第 2 2図に示してあるような 「顧客名 j 3 1 0 0のよう に、 募線で囲まれた情報 (以下、 セルと呼ぶ) 群の各配 置を行い ( 2 1 0 1 ) 、 また上記の募線で囲まれた情報 以外の情報 (以下、 セル外情報と呼ぶ) 群の配置を行い ( 2 1 0 2 ) 、 作成結果がディ スブレイ画面をはみ出さ ないようにする縮小処理や、 処理の順序を決定する順序 処理等の後処理を行う ( 2 1 0 3 ) 。
第 2 2 B、 2 2 C、 2 2 A図は、 本発明の一実施例に よる、 セル情報テーブルおよび、 セル外情報テーブルと 文書の一例をそれぞれ示す図である。
伝票 3 0 1 5内では、 情報は鄯線で囲まれた部分とそ れ以外、 例えば、 「顧客名 J 3 1 0 0、 「コード」 3 1 0 2、 「品名」 3 1 0 3等と、 「納品書」 3 2 0 0、 「月」 3 2 0 1、 「日 j 3 2 0 2等の 2種類に分けられ る。 前述のものをセル情報、 後述のものをセル外情報と 呼び、 3 1 0 0〜 3 1 1 0 は、 セル情報、 3 2 0 0〜 3 2 0 3 はセル外情報である。 これらの情報は、 文字列と 1ノ 1 0讓単位で表現された開始位置および、 終了位置 から表されている。 これらの情報は、 入力処理や認識処 理で作成され、 フォーマツ トの自動作成の際も、 これら の情報を利用して配置し、 作成する。
第 2 3図は、 本発明の一実施例の第 2 1図に示したフ ローチャー ト中の前処理の流れを示すフローチャー トで ある。
前処理 ( 2 1 0 0 ) は、 基準文字サイズを求める処理 ( 2 2 0 0 ) と、 拡大する文字の抽出を行う処理 ( 2 2 0 1 ) の 2つの処理からなり、 まず、 ディスプレイ画面 上の 1文字に相当する文書上の 1文字の大きさを求める。 これは、 読み込む文書中の全ての文字の中から一番多く 使用されている文字のサイズを基準文字サイズ 3 2 0 5 と決定し、 第 2 4図に示すように、 行ビッチ、 文字ビッ チを加えた値を設定する。 この大きさを使用して以降セ ルの配置処理を行っていく。
次に、 拡大文字として処理する文字の抽出を行う。 第 2 5図に示すように、 基準文字サイズから行ビッチ、 列 ピッチの大きさを引いた値とを比較し、 ある値以上あれ ば拡大文字として認識していく。
第 2 6図は、 本発明の一実施例の配置の処理の流れを 示すフローチャー トである。
こ こで、 文書内のセルの構成について、 第 2 7図によ り説明する。
通常の文書の形はセルのかたまりから成り立つており、 このかたまり単位に配置していく ことによってきれいな 形で配置できる。 この隣接したセルのかたまりをブロ ッ クと呼ぶ。
第 2 7図では 3 1 1 5 ( 「名前」 、 「郵便番号 j 、 「住所」 、 「氏名」 の各欄を含む) 、 3 1 1 6 ( 「承認 印」 の欄) 、 3 1 1 7 ( 「品名」 、 「単価」 、 「金額」 の欄を舍む) の各ブロ ックに分かれており、 それぞれの ブロ ックの一番左上の 3 1 1 8 ( 「名前」 ) 、 3 1 1 9 ( 「承認」 ) 、 3 1 2 0 ( 「品名」 ) のセルを基準セル と呼ぶ。 第 2 6図のフローチャー トで、 まず、 この基準 セルを求める ( 2 3 0 0 ) 。 この基準セルの開始点、 終 了点をディ スプレイ画面上の行、 列数に変換し、 これを もとにして、 ブロ ック内の各セルについても位置計算を 行い、 配置を行う ( 2 3 0 1 ) 。 上下左右の微調整を行 い ( 2 3 0 2 ) 、 全セルについて配置を行ったか判定し ( 2 3 0 3 ) 、 全てのセルについて配置が行われていれ ば終了し、 行われていなければ、 次のセルについて配置 を ΐ丁つ。
第 2 8図は、 基準セルの開始行列数、 および終了行列 数を求める計箕式を示した図である。
文書の 1ノ 1 0麵単位で表現されている位置の値を基 準文字サイズで割算して得られた商として求めていく。 これによりディ スプレイ画面上の行、 列数が求められる。 この結果、 文書上の 「顧客名」 の位置 3 1 2 5が画面上 では 3 1 2 6の位置に表示される。
第 2 9図は、 本発明の一実施例の配置を行った例の図 である。
伝票 3 0 2 0の 「顧客名」 3 1 3 0のセルが基準セル となり、 開始点 3 2 1 0、 終了点 3 2 1 2を第 2 8図に 示したような計算方法で行列計算し、 開始行列と、 終了 行列を求め、 フォーマツ ト 3 0 2 1 の点 3 2 2 0 と点 3
2 2 1 に変換される。 文書 3 0 2 0の 「住所」 3 1 3 1 のセルの開始点 3 2 1 2 は、 基準セルの開始行と終了列 の各点が同じ値であることからフォーマツ トの 3 0 2 1 の点 3 2 2 2が設定される。 「住所」 3 1 3 1 のセルの 終了点 3 2 2 3は、 基準となるものがないため、 終了点
3 2 2 3の値をもとに行列数の計算をし、 終了行数、 終 了列数を求める。 伝票 3 0 2 0の 「氏名 j 3 1 3 2のセ ルの開始点 3 2 1 4 と終了点 3 2 1 5 は、 基準セルの終 了行列数と 「住所」 3 1 3 1 のセルの終了行列数により、 フォーマツ ト 3 0 2 1 の点 3 2 2 4 と点 3 2 2 5が求め られる。
「番号」 3 1 3 3、 空欄 3 1 3 4 のセルのように開始 点が前のセルの途中から始まつていて基準文字サイ ズ以 内の空きがある場合の開始点 3 2 1 6、 3 1 3 4 は、 基 準セルの開始行点 3 2 1 0 に合わせる。 従って 「番号」 3 1 3 3の開始点 3 2 1 6 はフォーマツ ト 3 0 2 1 の点 3 2 2 6、 終了点 3 2 1 7 はフォーマッ ト 3 0 2 1 の点 3 2 2 7 となる。 同様に空欄セル 3 1 3 4 の開始点 3 2 1 8 は、 フォーマッ ト 3 0 2 1 の点 3 2 2 8、 終了点 3 2 1 9 は点 3 2 2 9 と変換される。 この場合 「番号」 3 2 2 8 のセル内の文字列は、 2文字であるが、 作成され たフォーマツ ト 3 0 2 1 の 3 1 3 8のセルでは 3文字分 空いている。
このように調整して大き く なつた場合、 セル内の文字 列は、 バランスよ く なるようセンタ リ ングされる。 以上 のような方法によってテーブル 3 0 2 2が作成される。 テーブル 3 0 2 2には、 セルの番号と文書上の位置の値、 ディ スプレイ上の行、 列に変換した値が登録される。 セ ルの配置の後は、 セル外の文字の配置である。 セル外の 文字の配置は、 上述したテーブルをもとに行う。 セル外 の文字列の配置位置は、 その近く にあるセルとの位置関 係が重要であり、 単純に行列に変換しただけでは、 正し い配置が得られない。
第 3 0図は、 本発明の一実施例のセル外文字列の配置 を行った例を説明するための図である。
セル外文字列の配置はセル外文字列の開始位置を基に 上述のセルの位置で作成したテーブルを検索し、 一番近 い値をもつセルの開始行、 および開始列を求める。 例えば、 第 3 0図で 3 1 4 0 — 3 1 4 3のセルがテ 一ブル 3 1 4 5 のように配置されているとする。 「 年 月 日」 3 1 4 4 のセル外文字列の開始位置を求めるに は、 「 年 月 日」 3 1 4 4 の開始行位置をもとにテ 一ブルの開始行位置を検索し、 一番近い値のセルを見つ ける。 この例では、 「氏名」 3 1 4 0 のセルとなる。 こ の 「氏名」 3 1 4 0 のセル閲始行数 2が 「 年 月 日 j 3 1 4 4の文字列の開始行となる。 同様に 「 年 月 日:! 3 1 4 の開始列をもとにテーブルの開始列位置を 検索し、 一番近いセル 「金額」 3 1 4 3 のセルを見つけ る。 このセルの開始列数が求める列数である。 結果とし て、 この例では 「 年 月 日」 3 1 4 4 の文字列の配 置位置は、 2行 8列目ということになる。 これで、 セル 外文字の配置処理が終了する。
第 3 1図は、 本発明の一実施例の第 2 1図に示した後 処理の中の処理の流れを示すフローチヤ一トである。
ここでの後処理では、 ディスプレイ画面内にできるだ け納めるための作成したフォーマツ トの調整処理 ( 3 4 0 0 ) と、 業務処理を効率よ く実行するための順序設定 ( 3 4 0 1 ) を行う。
第 3 2図に、 調整処理のフローチヤ一トを示す。
まず、 セル内文字列のセンタ リ ングを行い ( 3 5 0 0 )、 作成したフォーマッ トがディスプレイ画面より大きいか チェ ックを行う ( 3 5 0 1 ) 。 セル内文字列のセンタ リ ングは、 例えばフォーマツ ト 3 0 2 5において、 文字間 隔 3 1 5 0を等しく設定して行う。 ディ スプレイ画面よ り大きい場合は、 配置上一番多く とられている空白行、 列の削除を行う ( 3 5 0 2 ) 。 削除した後、 再び作成し たフォーマツ トがディ スプレイ画面より大きいかチェ ッ クを行い ( 3 5 0 3 ) 、 まだ大きい場合は、 文字列で同 意語があるものについて、 一番短い同意語の文字列に変 換し、 文字列の縮小を行う ( 3 5 0 4 ) 。 三度、 デイ ス ブレイ より大きいかチェ ックを行い ( 3 5 0 5 ) 、 まだ 大きい場合には、 文字列の全角文字から半角文字への変 換を行う ( 3 5 0 6 ) 。 最後に、 作成したフォーマッ ト のディ スプレイ画面内へのセンタリ ング調整をフォーマ ッ ト 3 0 2 6 に示す如く行い ( 3 5 0 7 ) 、 終了する。 なお、 第 3 2図のフローチャー トでは、 ステップ 3 5 0 6の後はディスプレイ画面内のセンタ リ ングを行って 終了するが、 ステップ 3 5 0 6の後に、 作成したフォー マツ トがディスプレイ画面より大きいかチヱ ックを行つ て大きい場合には、 長い項目欄で 1行だったものを複数 行とし、 1行分の桁数の縮小を行う処理も付加すること ができる。
第 3 3図は、 第 3 2図のステップ 3 5 0 の同意語変 換処理の一例を説明するための図である。
「御客様御住所」 1 5 5 は、 入力桁数より項目文字列 の方が大き く、 ディスプレイ画面よりはみ出している。 このような場合、 「御客様御住所」 1 5 5の文字列を知 識ベース 1 5 6を利用して、 「御客住所」 1 5 7 のよう なより短い文字列に同意語変換する。 これによつてディ スプレイ画面に納まるように縮小することができる。 - 第 3 4図は、 第 3 2図のステップ 3 5 0 6の全角文字 から半角文字への変換処理の一例を説明するための図で ある。
カタカナ文字等、 半角文字が存在する文字に関しては. 該当する半角文字に変換する。 「顧客コー ド」 3 1 6 0 の文字列では、 「コー ド」 が半角文字に変換されること によって、 「顧客コー ド」 3 1 6 1 のようにディスプレ ィ画面内に納めることが可能となる。
通常、 各項目の処理順は、 上から下、 左から右といつ た順に処理されていく が、 文書の内容によっては、 右か ら左へといった具合に逆の順で処理を行った方がよい場 合もある。 このような場合のために、 自動的に処理の順 序を決定する処理を行って、 効率よ く処理できるように してある。
第 3 5図は、 本発明の一実施例の処理順序の決定処理 の一例を説明するための図である。
伝票 3 0 3 0 は、 通常に左から右に順番を付けた例で ある。 それに対して、 伝票 3 0 3 1では右から左といつ た具合に通常とは逆の処理を含んだ例である。
通常の処理手順では、 まず、 年 3 1 6 5、 月 3 1 6 6、 日 3 1 6 7が自動表示され、 オペレータが氏名 4 0 0 1 に関するコード 4 0 0 0、 例えば顧客別に付加してある 氏名コー ド 3 1 6 8 の入力を行う。 コ ンピュータはデー タベースよ り氏名コード 3 1 6 8に対応する氏名を検索 して、 氏名フィール ド 3 1 6 9 に自動表示する。 同様に 品コー ド 4 0 0 2についてもオペレータからの品コード の入力で品名 4 0 0 3が品名フィール ド 3 1 7 1 に自動 表示される。 従って、 伝票 3 0 3 0についてはこの処理 順番でよい。 しかし、 伝票 3 0 3 1 の場合は、 「氏名」 4 0 1 0、 「コード j 4 0 1 1、 および 「品コード j 4 0 1 2、 「品名」 4 0 1 3 のフ ィ ール ド位置が伝票 3 0 3 0 とは異なっており、 これを上から下、 左から右に処 理した場合には、 氏名に関するコードを入力する前に、 また、 品コードを入力する前に、 それぞれ氏名フィール ド、 品名フィール ドがきてしまい処理が面倒である。 こ のため、 このような場合は、 処理の順序を 3 1 7 3→ 3 1 7 4→ 3 1 7 5→ 3 1 7 7 - 3 1 7 6→ 3 1 7 9→ 3 1 7 8→ 3 1 8 0の順に入れ替える処理を行う。 この入 れ替えについても、 知識ベースを利用して行う。
配置調整の処理終了後、 まず、 フ ィ ール ドテーブル 3 0 3 2が作成され、 各項目名称 (年、 月、 日、 氏名、 コ 一ド、 品名、 品コード、 単価) をもとに知識ベース 3 0 3 3の入力項目区別テーブル 3 0 3 5中から、 該当する 項目名称の検索を行い、 オペレータが入力を行わなけれ ばならない入力項目かどうかの区別の判定を行う。 図示 したテーブル 3 0 3 5では、 氏名、 品名は入力項目では なく、 コー ドが入力項目となっている。 入力項目と関係 する表示項目で、 入力項目の前に表示項目があるかをチ ユ ック し、 ある場合には、 順序を入れ替える。 文書 3 0 3 1 の例では、 フ ィール ドテ一ブル 3 0 3 2 の項目の中 から入力項目となるものとして、 「コー ド」 と 「品コ一 ド」 がある。 この 2つの項目の前には、 「氏名」 と 「品 名」 という、 それぞれの入力項目に閬係する表示項目が あるため、 順序の入れ替えが行われ、 処理順番テーブル 3 0 3 4 の順となる。 即ち、 年、 月、 日、 氏名、 コー ド- 品名、 品コー ド、 単価の順である。 このようにして、 知 識ベースを使いながら、 正しい処理順序の設定を行う こ とが可能となる。
本実施例によれば、 文書のフォーマツ トを読み取り装 置から読み取らせるだけで、 コ ンピュータで処理するフ ォーマツ 卜が自動作成され、 オペレータが作成するとい う作業工程がな く なり、 大幅な作業効率の向上となる。 また、 ディ スプレイ画面内に納まるように最適に調整 されるため、 オペレータが業務処理を実行していく上で、 確認等がすぐにでき、 オペレーティ ングが容易となる。 以上の説明から明らかなように、 本実施例によれば、 文書のフォーマツ トを◦ C R等の読み取り装置から入力 するだけで、 コ ンピュータで処理する画面フォーマ ッ ト が作成でき、 しかもディスプレイに納まるように最適に 調整されて出力されるこ とで、 利用者がディ スプレイ上 に作成していく という作業工程がなく なり、 大幅な利用 者の効率向上がはかられるという効果がある。

Claims

請 求 の 範 囲
1 . 文字または数値データを書き込む—ための少く とも 1 つの空フィ一ルドを舍む書式文書の表示を画面上に生成 する方法であって、 以下のステップを有する :
前記書式文書のフォーマツ トが記述されている記録媒 体から前記フォーマツ トを記述している情報を読み取る 第 1 ステップ ;
前記読み取った情報を基に前記記録媒体に記述された フォーマツ トと同じ或いは相似のフォーマツ トで前記画 面に表示する第 2ステップ ;
前記画面に表示した前記フォーマツ トをユーザのキー 操作に応じて修正する第 3ステップ ;
前記修正されたフォーマッ トを認識して空フィールド を生成し、 前記画面に表示されている前記修正されたフ ォーマツ トに重ねて表示する第 4ステップ ;
および
前記画面に表示した前記空フィ一ルドをユーザのキ一 操作に応答して修正する第 5ステップ.
2 . 請求の範囲第 1項記載の方法において、 前記第 2ス テツプは前記記録媒体から前記フォーマツ トを読み取る 読み取り装置の読み取りの最小単位の大きさと画面表示 の最小単位の比率に基づいて、 前記記録媒体に記述され たフォ一マ ッ トと相似のフォ一マツ トで前記文書を前記 画面に表示するステップを舍む。
3 . 請求の範囲第 1項記載の方法において、 前記第 3 ス テッブは修正すべき文字列の近く にカーソルが位置づけ られたことに応答して、 前記力一ソルの座標に一番近い 文字が修正されるべき文字として認識されるステツプを 含む。
4 . 請求の範囲第 4項記載の方法において、 前記第 3 ス テツブは画面上に表示されている帳票フォーマツ ト上の 一部分がユーザによって指定されたことに応答し、 指定 された一部分に重ならない位置に指定された部分の詳細 な情報を表示するステップを舍む。
5 . 請求の範囲第 4項記載の方法において、 ユーザによ つて表示されている詳細な情報の内容が変更されたこと に応答して、 指定された部分の内容が、 変更した内容の 詳細な情報に応じた内容に置き換えられる。
6 . 請求の範囲第 1項記載の方法において、 前記第 3 ス テツプは、 鄞線の開始位置と最後尾の募線の終了位置と 鄞線本数と縦もしく は横の指定で、 開始位置と終了位置 の座標の差と募線本数から霎線の間隔を計箕し、 計算し た間隔で鄴線を引く ステツプを舍む。
7 . 文字または数値データが書き込まれるべき少く とも 1つのセルと、 前記セルの外部に記述さるべき文字また は数値データと、 を少く とも舍む書式文書の表示を画面 上に生成し処理する方法であって、 以下のステップを有 する :
前記書式文書のフォーマツ トが記述された記録媒体か ら前記フォーマツ トを記述した情報を読み取る第 1 ステ ップ ;
読み取った情報から画面表示 1文字当りの文字サイズ を決定する第 2 ステップ ;
該決定した文字サイズをもとに前記セルを前記画面に 配置する第 3 ステップ ;
該配置したセルを基に該セルの外部の前記文字または 数値データを前記画面に配置し、 前記フォーマツ 卜に似 せたフォーマツ トを面面上に表示する第 4ステップ ; 前記似せたフォーマツ トが前記画面からはみださない よう前記セルおよび前記文字または数値データのうちの 少く とも一方を圧縮する第 5 ステップ ;
および
前記画面に表示した前記似せたフォーマツ トの各項目 の処理手順を決定する第 6 ステツブ.
8 . 請求の範囲第 7項記載の方法において、 前記第 5 ス テツブは、 空白行、 空白列の削除をする第 7のステップ と、 知識:ベースを利用しての文字列の同意語変換をする 第 8のステップと、 全角文字から半角文字への変換をす る第 9 のステップの少く とも 1っを舍む。
9 . 請求の範囲第 7項記載の方法において、 前記第 6の ステップは、 各項目の文字列を知識ベースとのマ ツチン グによって判断する第 7 のステップを舍む。
1 0 . 文字または数値データを書き込むための少く とも 1つの空フィ一ルドを舍む書式文書の表示を画面上に生 成し処理する方法であって、 以下のステップを有する : 前記書式文書のフォーマツ トが記述されている記録媒 体から前記フォーマツ トを記述している情報を読み取る 第 1 ステップ ;
前記読み取った情報を基に前記記録媒体に記述された フォーマツ 卜と相似のフォーマツ トで前記画面に表示す る第 2 ステップ ;
前記画面に表示した前記フォーマツ トをユーザーのキ 一操作に応じて修正する第 3 ステップ ;
前記修正されたフォーマツ トを認識して空フィールド を生成し、 前記画面に表示されている前記修正されたフ ォーマツ トに重ねて表示する第 4ステップ ;
前記面面に表示した前記空フィールドをユーザのキー 操作に応答して修正する第 5ステップ ;
前記読み取った情報から画面表示 1文字当りの文字サ ィズを決定する第 6ステップ ;
該決定した文字サイ ズをもとに前記セルを前記画面に 配置する第 7 ステップ ;
該配置したセルを基に該セルの外部の前記文字または 数値データを前記画面に配置し、 前記フォーマ ツ トに似 せたフォーマツ トを画面上に表示する第 8ステップ ; 前記似せたフォーマツ トが前記画面からはみださない よう前記セルおよび前記文字または数値データのう ちの 少く とも一方を圧縮する第 9ステップ ;
および 前記画面に表示した前記似せたフォーマ ツ トの各項目 の処理手順を決定する第 1 0 ステップ.
1 1 . 文字または数値データを書き込むための少く とも 1つの空フィールドを舍む書式文書を画面上に生成する 装置であって :
前記書式文書のフォーマツ トが記述されている記録媒 体から、 前記フォーマツ トを記述した情報を読み取る手 段と ;
読み取ったフォーマツ トを表示する手段と ; 前記読み取ったフォーマツ トを記述した前記情報を格 納する手段と ;
前記格納手段に格納された前記情報に基づき前記表示 手段に前記読み取ったフォーマツ トと相似のフォーマツ トを表示する制御手段と ;
ユーザのキ一操作に応答し、 前記表示されたフォーマ ッ トを修正する手段と ;
前記修正されたフォーマツ トを認識し、 前記空フィー ルドを作成し、 表示された前記修正フォーマツ トに重ね て表示する手段と ;
ユーザのキー操作に応答し前記空フィールドを修正す る手段と、 を有し、
前記制御手段は前記読み取ったフォーマツ トを前記読 み取り手段の読み取りの最小単位と前記表示手段の表示 の最小単位の大きさの比率に基づいて表示する。
1 2 . 請求の範囲第 1 1項記載の装置において、 前記記 録媒体は文書用紙を舍む。
1 3 . 請求の範囲第 1 1項記載の装置において、 前記記 録媒体はヮー ドプロセ ッサのフロ ッ ビディ スクを舍む。
1 4 . 文字または数値データが書き込まれるべき少く と も 1つのセルと、 前記セルの外部に記述さるべき文字ま たは数値データとを少く とも含む書式文書を画面上に生 成し処理する文書作成装置であって :
前記書式文書のフォーマツ トが記述された記録媒体か ら前記フォーマツ トを記述した情報を読み取る手段と ; 読み取った情報から画面衷示 1文字当りの文字サイズ を決定する手段と ;
該決定した文字サイ ズをもとに前記セルを前記画面に 配置する手段と ;
該配置したセルを基に該セルの^部の前記文字または 数値データを前記画面に配置し、 前記フォーマツ 卜に似 せたフォーマツ トを画面上に表示する手段と ;
前記似せたフォーマツ トが前記画面からはみ出さない ように前記セルおよび前記文字または数値データのう ち 少く とも一方を圧縮する手段と ;
前記画面に表示した前記似せたフォーマツ 卜の各項目 の処理手順を決定する手段と、 を有する。
1 5 . 請求の範囲第 1 4項記載の装置において、 前記記 録媒体は文書用紙を舍む。
1 6 . 請求の範囲第 1 4項記載の装置において、 前記記 録媒体はワー ドプロセ ッサのフロ ッ ピ一デイ スクを舍む。
PCT/JP1990/001354 1989-10-20 1990-10-19 Image display/processing method of formatted document and apparatus therefor WO1991006057A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE4091841A DE4091841C2 (de) 1989-10-20 1990-10-19 Verfahren zum Erzeugen einer Formulardarstellung und Bildschirm-Formularerzeugungssystem
KR1019910700612A KR950006410B1 (ko) 1989-10-20 1990-10-19 서식문서의 화상표시/처리방법 및 장치

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP1271687A JPH0748230B2 (ja) 1989-10-20 1989-10-20 画面帳票形式の自動作成方法
JP1/271687 1989-10-20
JP2067149A JPH03268060A (ja) 1990-03-19 1990-03-19 帳票形式の補正方法
JP2/67149 1990-03-19

Publications (1)

Publication Number Publication Date
WO1991006057A1 true WO1991006057A1 (en) 1991-05-02

Family

ID=26408326

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1990/001354 WO1991006057A1 (en) 1989-10-20 1990-10-19 Image display/processing method of formatted document and apparatus therefor

Country Status (4)

Country Link
US (1) US5231579A (ja)
KR (1) KR950006410B1 (ja)
DE (2) DE4091841C2 (ja)
WO (1) WO1991006057A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583655A (en) * 1991-04-05 1996-12-10 Canon Kabushiki Kaisha Creation and processing of documents containing destination information
US5282267A (en) * 1991-08-09 1994-01-25 Woo Jr John Data entry and error embedding system
US5450538A (en) * 1991-11-08 1995-09-12 International Business Machines Corporation Graphical user interface control for expansion and re-sizing of data fields in forms
US5848187A (en) * 1991-11-18 1998-12-08 Compaq Computer Corporation Method and apparatus for entering and manipulating spreadsheet cell data
JP3179569B2 (ja) * 1992-06-12 2001-06-25 キヤノン株式会社 印刷制御装置
US5450536A (en) * 1993-01-07 1995-09-12 Microsoft Corporation Technique for automatically resizing tables
US7203903B1 (en) 1993-05-20 2007-04-10 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
US5682541A (en) * 1994-05-26 1997-10-28 Canon Business Machines, Inc. Preview system for printed documents
US5623406A (en) * 1995-03-06 1997-04-22 Jean D. Ichbiah Method and system for entering text in computer equipment
JPH08292755A (ja) * 1995-04-20 1996-11-05 Fuji Xerox Co Ltd 文書出力制御装置及び制御方法
US6525734B2 (en) * 1996-09-17 2003-02-25 Fujitsu Limited Display control apparatus, display control method and computer program product
US6226402B1 (en) 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6083280A (en) * 1997-09-25 2000-07-04 Eitel; Robert T. Method of improving a processing efficiency of an automatic data processing system
JP4071328B2 (ja) * 1997-11-18 2008-04-02 富士通株式会社 文書画像処理装置および方法
US6279018B1 (en) 1998-12-21 2001-08-21 Kudrollis Software Inventions Pvt. Ltd. Abbreviating and compacting text to cope with display space constraint in computer software
US6594405B1 (en) 1998-12-28 2003-07-15 Gateway, Inc. Method and apparatus for preprinted forms completion
US6452597B1 (en) * 1999-08-24 2002-09-17 Microsoft Corporation Displaying text on a limited-area display surface
JP3756719B2 (ja) * 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置
JP2002149152A (ja) * 2000-11-10 2002-05-24 Fujitsu Ltd 画像表示制御装置
US8001465B2 (en) * 2001-06-26 2011-08-16 Kudrollis Software Inventions Pvt. Ltd. Compacting an information array display to cope with two dimensional display space constraint
US20030023627A1 (en) * 2001-07-26 2003-01-30 Kerr John M. System and method for indicating a measure of content copy fitting
AUPR962001A0 (en) * 2001-12-19 2002-01-24 Redbank Manor Pty Ltd Document display system and method
EP1387291A3 (en) * 2002-07-30 2005-10-19 Canon Kabushiki Kaisha Apparatus, method, recording medium and program for form processing
US7315902B2 (en) * 2002-12-19 2008-01-01 International Business Machines Corporation Compression and abbreviation for fixed length messaging
JP4113047B2 (ja) * 2003-05-30 2008-07-02 富士通株式会社 帳票処理装置、及びプログラム
US7500179B2 (en) * 2004-08-04 2009-03-03 Microsoft Corporation Method for optimizing space allocation in table layout
US7788592B2 (en) * 2005-01-12 2010-08-31 Microsoft Corporation Architecture and engine for time line based visualization of data
US7716194B2 (en) * 2005-01-12 2010-05-11 Microsoft Corporation File management system employing time line based representation of data
US7479970B2 (en) * 2005-01-12 2009-01-20 Microsoft Corporation Systems and methods that facilitate process monitoring, navigation, and parameter-based magnification
US20060156237A1 (en) * 2005-01-12 2006-07-13 Microsoft Corporation Time line based user interface for visualization of data
US7653244B2 (en) * 2005-02-22 2010-01-26 Potts Wesley F Intelligent importation of information from foreign applications user interface
CN101286154B (zh) * 2007-04-09 2016-08-10 谷歌股份有限公司 输入法编辑器用户档案
JP4706764B2 (ja) * 2009-01-29 2011-06-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62143758A (ja) * 1985-12-18 1987-06-27 Nippon Air Brake Co Ltd 鉄道車両用ブレ−キ制御方法
JPS6339077A (ja) * 1986-08-02 1988-02-19 Syst Planning:Kk フオ−ムエデイタ処理方式
JPS63244272A (ja) * 1987-03-31 1988-10-11 Fuji Xerox Co Ltd 画像編集装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5781670A (en) * 1980-11-07 1982-05-21 Hitachi Ltd Editing method of document
US4555759A (en) * 1981-05-18 1985-11-26 International Business Machines Corp. Selective use of restored file setups
US4789962A (en) * 1984-10-31 1988-12-06 International Business Machines Corporation Methods of displaying help information nearest to an operation point at which the help information is requested
EP0251098B1 (de) * 1986-06-25 1990-08-29 Siemens Aktiengesellschaft Verfahren zum Erstellen und Ausfüllen von Formularen mittels einer Textstation
US4992954A (en) * 1987-08-05 1991-02-12 Hitachi, Ltd. Method of storing character patterns and character pattern utilization system
DE3838934A1 (de) * 1987-11-16 1989-06-01 Canon Kk Dokumentationsverarbeitungsanlage

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62143758A (ja) * 1985-12-18 1987-06-27 Nippon Air Brake Co Ltd 鉄道車両用ブレ−キ制御方法
JPS6339077A (ja) * 1986-08-02 1988-02-19 Syst Planning:Kk フオ−ムエデイタ処理方式
JPS63244272A (ja) * 1987-03-31 1988-10-11 Fuji Xerox Co Ltd 画像編集装置

Also Published As

Publication number Publication date
US5231579A (en) 1993-07-27
DE4091841T (ja) 1991-10-10
KR950006410B1 (ko) 1995-06-15
KR920701909A (ko) 1992-08-12
DE4091841C2 (de) 1999-04-08

Similar Documents

Publication Publication Date Title
WO1991006057A1 (en) Image display/processing method of formatted document and apparatus therefor
KR930009639B1 (ko) 화상데이타를 이용하는 문서데이타 처리방법 및 장치
US20090049375A1 (en) Selective processing of information from a digital copy of a document for data entry
US20020184261A1 (en) Process of inputting and outputting a display table derived from a worksheet and data storage media programmed to perform the same
CN111860450A (zh) 票证识别装置以及票证信息管理系统
JP3663865B2 (ja) 帳票処理装置及び記憶媒体
JPH1173288A (ja) 表示装置、表示制御方法及び記録媒体
JPH0520494A (ja) 帳票属性認識・表示方法
JPH10254984A (ja) 帳票作成方法
JPH08263576A (ja) 文書情報データベースを作成するシステム
JP2947286B2 (ja) 光学式読取装置の制御プログラム作成装置
JPH0452866A (ja) 業務プログラム自動生成方式
JP4405604B2 (ja) 情報処理装置及び定義方法
JPH0748230B2 (ja) 画面帳票形式の自動作成方法
JP2723159B2 (ja) イメ−ジ・キャラクタ変換法
JP2000132542A (ja) 情報処理装置およびその処理プログラムを記憶した記憶媒体
JPH087012A (ja) データの出力様式編集方法および装置
JP2024025219A (ja) Pdf帳票の読取装置、読取方法及び読取プログラム
JP2000076370A (ja) 帳票認識方法および装置
JPH11316792A (ja) 情報処理装置及び帳表作成方法
JPS61100873A (ja) 光学文字/図形読み取り装置
JP2000163271A (ja) 情報処理方法および装置
JPH06222895A (ja) 印字フォーマット作成装置
JPH07129393A (ja) プログラム作成方法及び装置並びにプリントイメージデータ作成方法及び装置
JP2001357342A (ja) 情報処理方法および装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): DE KR US

RET De translation (de og part 6b)

Ref document number: 4091841

Country of ref document: DE

Date of ref document: 19911010

WWE Wipo information: entry into national phase

Ref document number: 4091841

Country of ref document: DE