JPH01306958A - Information expressing method and document processing system - Google Patents

Information expressing method and document processing system

Info

Publication number
JPH01306958A
JPH01306958A JP63137526A JP13752688A JPH01306958A JP H01306958 A JPH01306958 A JP H01306958A JP 63137526 A JP63137526 A JP 63137526A JP 13752688 A JP13752688 A JP 13752688A JP H01306958 A JPH01306958 A JP H01306958A
Authority
JP
Japan
Prior art keywords
information
document
machine
readable
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63137526A
Other languages
Japanese (ja)
Inventor
Toshinori Watanabe
俊典 渡辺
Shinichi Hayashi
林 晋一
Koichiro Ino
伊能 弘一郎
Fumihiko Mori
文彦 森
Hiroshi Watanabe
坦 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63137526A priority Critical patent/JPH01306958A/en
Publication of JPH01306958A publication Critical patent/JPH01306958A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To make duplex management of information in which documents are prepared by using paper for humans and floppy disks are used and mechanical codes of the documents are kept for machines unnecessary by preparing documents containing texts and graphics by using information which is visible to humans and information which is hardly visible to humans, but readable by machines. CONSTITUTION:A text 200 and graphic 210 which are visible by humans are described on a document 160 and, at the same time, information described with magnetized ink which is transparent or has the same color as the surface color of the paper 160 so that a machine can read the information is also recorded on the paper 160. Therefore, when, for example, the code 2-7 for machine is implicitly displayed on the display of the English word 'HOUSE' which is the visible information for humans by a concealing method, numerous codes for machine are repeatedly displayed in the area where the word 'HOUSE' is displayed. Even when, for example, the part 'HO' of the 'HOUSE' becomes stained, the word 'HOUSE' can be restored easily on a computer if even one of the codes for machine is left in a readable state in the remaining part. Therefore, duplex information management becomes unnecessary.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は人間と計算機とのインタフェイスの改良に係り
、特に一般社会で従来使用されてきた文書や図面を、人
間のみでなく計算機にも理解可能なものとすることによ
り、インタフェイスの容易化及び高度化を図る文書の表
現方法およびその表現方法の文書を処理する処理方法に
関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to the improvement of the interface between humans and computers, and in particular allows documents and drawings conventionally used in general society to be read not only by humans but also by computers. The present invention relates to a method of representing a document that facilitates and improves the interface by making it understandable, and a method of processing a document using the method of representation.

〔従来の技術〕[Conventional technology]

すかし絵は人間のみが見ること、及び表現される情報が
お札の持つ情報と対応していない、あらかじめ紙面に作
り込んでおく等の点とで本発明の目的には使用できない
。盲人用点字含み文書は人間の視覚と触覚とに関する2
重情報を同時表現したものであり、人間用とM11重用
の2重情報表現法と異なる。バーコードは商品売価等を
コード化して、商品名のとなりに表示しておき、削算機
にこれを直接読み取らせて支払計算のための売価入力の
手間をはふいたものであるが、人間の目に見える様式で
バーコードを表現している。
Watermarks cannot be used for the purpose of the present invention because they can only be seen by humans, and the information expressed does not correspond to the information on the banknotes, or because they are created on paper in advance. Documents containing Braille for the blind are related to human vision and tactile sense2.
This is a simultaneous representation of multiple information, and is different from the dual information representation methods for humans and M11. A barcode encodes the selling price of a product, displays it next to the product name, and allows a calculator to read it directly, eliminating the hassle of inputting the selling price for payment calculations. The barcode is expressed in a visible format.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

従来、計算機で作成した文書や図形情報はフロッピーテ
ィスフや磁気カードあるいは磁気テープなど、人間が直
接読めないが計算機には読みとれる形で保存あるいは伝
達されてきた。内容を目でみるために別途、デイスプレ
ィ装置やラインプリンタ装置が使用されてきた。この状
況では、同一の情報を計算機のみに可読な媒体と、人間
には可読であるが計算機には可読困難な媒体とで二重管
理する必要が生じ、社会一般で多用される文書の表現方
法としては改良の余地がある。
Conventionally, documents and graphical information created by computers have been stored or transmitted on floppy disks, magnetic cards, or magnetic tapes in a form that cannot be directly read by humans but can be read by computers. Separate display devices and line printer devices have been used to visually view the content. In this situation, it becomes necessary to manage the same information in a medium that is readable only by computers, and a medium that is readable by humans but difficult to read by computers. There is room for improvement.

改良のひとつの方向として、人間には可読な情報すなわ
ち紙面に書かれたテキストや図形を、直接計算機で読め
込む技術が、既に数10年間に渡って研究開発されてき
た。しかしながら、これらの一般に文字認識あるいは画
像認識の研究は、諸般の研究分野の中でも最も困難な研
究といわれており、郵便番瀉等のごく限定された領域で
のみ実用化されているにすぎない。この限定された例に
おいても、文字が汚されていたりすると計算機には直ち
に不可能となってしまう。図形や画像情報についてはさ
らに困難であり、回路図面の自動入力すなわちディジタ
イザの開発も遅々として進まないのが実情である。この
方面の研究の現段階での結論として、計算機が、読み取
ろうとしている文字や図形の意味、ひいてはそれらを含
む文章や図面の意味を理解せぬ限り、本格的な文字や画
像の認識は無理であろうと言われている。そこで、取り
あえず、紙面上の情報をビットパターンとして単純に入
力するだけの、スキャナー技術等がパーソナルコンピュ
ータ等で利用され始めているが、入力対象のもつ意味情
報等を考慮しているわけではないので、入力ビツトプレ
ーンに相応する大規模メモリを使用している割には、入
力後の画質はノイズや入力文書上の汚れ等によって大幅
に劣下してしまうという状況である。現在、異国語間の
自動翻訳への期待が大きい。その理想は人間社会で一般
に使用されている文書を与えるのみで、自動翻訳結果の
文書を、テキストのみでなく図形等も含めて作成してく
れる自動翻訳機の実現である。
As one direction for improvement, technology that allows computers to directly read human-readable information, such as text and graphics written on paper, has been researched and developed for several decades. However, research into character recognition or image recognition is generally said to be the most difficult of all research fields, and has only been put to practical use in very limited areas such as postal code classification. Even in this limited example, if the characters are smeared, it will immediately become impossible for a computer to do so. It is even more difficult to obtain graphic and image information, and the reality is that the development of automatic input of circuit drawings, that is, digitizers, is progressing slowly. The current conclusion of research in this direction is that unless a computer understands the meaning of the characters and figures it is trying to read, and by extension the meaning of the texts and drawings that contain them, full-fledged character and image recognition is impossible. It is said that it will be. Therefore, scanner technology that simply inputs information on paper as a bit pattern has begun to be used in personal computers, but it does not take into account the semantic information of the input object. Although a large-scale memory corresponding to the input bit plane is used, the image quality after input is significantly degraded due to noise, dirt on the input document, etc. Currently, there are high expectations for automatic translation between foreign languages. The ideal is to create an automatic translation machine that can create an automatically translated document that includes not only text but also graphics, etc., by simply providing a document that is commonly used in human society.

これを可能にするには、前述した文書自動入力という困
難な課題の解決のあと、さらに文書理解と自動翻訳とい
う2つの困難な課題を解決せねばならず、実現は遠い将
来のものになると予想される。
In order to make this possible, after solving the difficult problem of automatic document input mentioned above, we must solve two more difficult problems: document understanding and automatic translation, and it is expected that this will not become a reality in the distant future. be done.

問題の根源は、生命の起源に遡る数億年の歴史の中で進
化してきた人間の目と脳の機能を計算機に無理矢理に真
似させようとしている所にある。
The root of the problem lies in trying to force computers to imitate the functions of the human eye and brain, which have evolved over hundreds of millions of years, dating back to the origin of life.

計算機側ではその起源以来、計算機言語はそれなりに発
達し、文書や図形の意味をメモリ上に表現する手段とし
てのデータ構造技術などの発展によって文字9文章9図
形などの計算機処理は容易に可能な状況になって来た。
On the computer side, since its origin, computer languages have developed to a certain degree, and with the development of data structure technology as a means of expressing the meaning of documents and figures in memory, computer processing of characters, 9 sentences, 9 figures, etc. is now easily possible. The situation has come.

このことから、人間と計算機という大いに起源やその内
部処理メカニズムの異なる2つの存在に応した情報表現
を同−文書上に混用することによって、人間と人間2人
間と計算機、泪算機と計算機との間のコミュニケーショ
ンが大幅に容易化されると考えられる。
Therefore, by mixing information representations in the same document that correspond to two entities, humans and computers, which have very different origins and internal processing mechanisms, it is possible to It is believed that communication between the parties will be greatly facilitated.

本発明の目的は、人間と計算機間のインタフェースの容
易化および高度化を実現した文書の表現方法を提供する
ことにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a document representation method that facilitates and improves the interface between humans and computers.

〔課題を解決するための手段〕[Means to solve the problem]

上記目的を達成するために、本発明では、文書上に人間
には容易に読めるが機械には必ずしも容易に読めない従
来の文字や図形情報と、人間が上記情報を読むのに妨害
とならない形式にて、すなわち人間には可読困難な形式
で書かれた情報とを同−文書上に並記しておき、人間が
文書を利用する場合には前者を、機械が文書を処理する
場合には後者をみるようにする。微細化表示技術の進歩
がめざましい現状では人間の目視可能域にきわめて大容
量の計算機用の情報を記述することは容易である。従っ
て、文字や図形の表示手段としてのフォント情報のみで
なく、1語や文章の意味構造、あるいは風景図■1や回
路図面の意味情報まで表現できる。このことを利用して
、あらかじめ文書上に、その文書の意味構造情報を並記
しておき、これを読み取って翻訳に活用させることで、
先に述べたある国語の文書から別の国語の文書に自動翻
訳をおこなうこともきわめて容易となる。
In order to achieve the above object, the present invention includes conventional character and graphic information that is easily readable by humans but not necessarily easily readable by machines on a document, and a format that does not interfere with humans reading the above information. In other words, information written in a format that is difficult for humans to read is written on the same document, and the former is written when a human uses the document, and the latter is written when a machine processes the document. Try to look at it. In the current state of remarkable progress in miniaturized display technology, it is easy to write extremely large amounts of information for computers in an area that is visible to the human eye. Therefore, it is possible to express not only font information as a means of displaying characters and figures, but also the semantic structure of a single word or sentence, or even the semantic information of landscape drawings 1 and circuit drawings. By taking advantage of this, you can write the semantic structure information of the document on the document in advance, read it, and use it for translation.
It is also extremely easy to perform automatic translation from a document in one Japanese language to a document in another Japanese language as mentioned above.

以上の基本的アイデアを現実化するには、文書上への画
情報の記述方式、計算機による諌記述の作成方式、ある
いは読み取り方式などを実現する必要かある。
In order to make the above basic idea a reality, it is necessary to develop a method for writing image information on a document, a method for creating a written explanation using a computer, or a method for reading it.

〔作用〕 本発明では、同一の文書上に、人間の視覚用の情報ツー
1ミと機械が読み取るための情報コードとを並記し、お
互いが相手の情報を判読不可能とすることが無いように
しておくことにより、人間は従来通り文書を読むことが
でき、さらに機械は機械用の情報コードを通して容易に
文書を入力することができるようになる。この方法は、
人間の視覚用の情報コードを直接、機械にも読み取らせ
ようとする従来の文字や図形認識技術よりもはるかに容
易かつ安価に実現できるし、その性能ははるかに高いも
のになる。たとえば、人間の視覚用の情報コード“Ho
use”という英単語の表示上に、2−7コー1−を陰
伏させる方法で機械用ロー)・を表示する場合、”Mo
use”の表示rfI積内に、多数の機械用コードを繰
り返し表示しておけば、仮にII HOI+の部分がシ
ミなどで汚れた場合でも、残余分にひとつでも機械コー
ドが可読状態であれば、容易に”Mouse”という英
単語を計算機内に復元できる。これは上記従来の文字認
識技術では不可能であった。
[Operation] In the present invention, an information code for human vision and an information code for machine reading are written side by side on the same document so that neither makes the other's information unreadable. By setting this to , humans can read documents as before, and machines can easily input documents through machine information codes. This method is
It is much easier and cheaper to realize this technology than conventional character and graphic recognition technology, which allows machines to directly read human visual information codes, and its performance is much higher. For example, the information code for human vision “Ho
When displaying the English word "use" by obscuring 2-7 ko 1-, the word "Mo
If a large number of machine codes are repeatedly displayed in the display rfI product of "use", even if the II HOI+ part becomes dirty with stains, as long as at least one machine code remains readable, The English word "Mouse" can be easily restored into the computer. This was not possible with the conventional character recognition technology described above.

同一の文書上には、テキストや図形が混在していること
が一般的であり、これらを、その意味まで含めて機械で
認識させることは、単なる文字認識よりもさらに困難な
課題であり、人間用の表示を直接機械に読み取らせる方
向での研究は、はとんど手についていない状況であるが
、本発明の方法を用いると、図形表示に陰伏させる方法
で、その図形の表示原点9図形の種別(円、長方形等)
、図形のサイズ、回転角度2周囲線の幅、内部の模様2
色などを機械用コードで表示しておくことにより、容易
に図形読み取りが実用1できる。図形の一部が汚れたり
切断されていても、既述の繰り返し表示法を用いること
で、容易に原情報の読み取りが可能となる。
It is common for the same document to contain a mixture of text and figures, and making a machine recognize these, including their meaning, is an even more difficult task than simple character recognition. Although research into making machines read the display directly has not yet been carried out, the method of the present invention allows the display origin 9 of the figure to be read by shadowing the figure display. Type of shape (circle, rectangle, etc.)
, size of figure, rotation angle 2 width of surrounding line, internal pattern 2
By displaying colors and other information using mechanical codes, figures can be easily read for practical purposes. Even if a part of the figure is dirty or cut, the original information can be easily read by using the above-described repeat display method.

文書の単語レベルよりもさらに上位の、文章を−括して
みた場合の意味情報を、例えば構文解析木の形式で機械
用コード化して文書上に陰伏させておくことにより、機
械は容易に文章の意味構造を認識できることになるので
、これを利用して文全体を別の旨語に変換することが楽
に実現できることになる。すなわち、文書の異国語への
翻訳が容易に実現できる。ただし、この例の場合、最初
に文章を作成する段階でその構文解析木データを何らか
の方法で(例えば文章作成エディタの機能の一部に構文
解析木データ作成機能をもうけておく方法など)文章と
対応させて作成する機能が必要となる。
Machines can easily interpret semantic information that is higher than the word level of a document by encoding it in the form of a parse tree and obscuring it on the document. Since the semantic structure of a sentence can be recognized, it becomes possible to easily convert the entire sentence into another sentence using this recognition. In other words, it is possible to easily translate a document into a foreign language. However, in this example, when the sentence is first created, the parse tree data is converted into a sentence in some way (for example, by adding a parse tree data creation function as part of the sentence creation editor's functions). A function is required to create a corresponding one.

〔実施例〕〔Example〕

以下、本発明の一実施例を、以下、図面を用いて説明す
る。
An embodiment of the present invention will be described below with reference to the drawings.

第1図において100及び100′は本発明を採用した
異種表示手段の同時表現文書を出力あるいは入力するこ
とのできる計算機システムであり、110はその本体部
の計算機、120は文書入出力装置、i 30はデイス
プレィ、140はマウス、(1]) 150はキーボードである。本発明の表現方法を採用し
た文書160が計算機システム100によって出力され
、100′によって入力される状況が図に示しである。
In FIG. 1, 100 and 100' are computer systems capable of outputting or inputting documents for simultaneous expression of different types of display means employing the present invention, 110 is a main body computer, 120 is a document input/output device, i 30 is a display, 140 is a mouse, and (1) 150 is a keyboard. The figure shows a situation in which a document 160 employing the representation method of the present invention is output by the computer system 100 and input by the computer system 100'.

第2図(a)は本発明の異種表示手段同時表現文書を作
成する方法の1例を示す。図の文書: i 60上には
、人間が視覚可能なテキスl−200と図形210とが
記述されているが、同時にたとえば磁気をおびた透明あ
るいは紙160の表m′j色と同色のインクによる機械
可読情報が並記されている。
FIG. 2(a) shows an example of a method for creating a document for simultaneous expression of different types of display means according to the present invention. The document in the figure: i 60 has human-visible text l-200 and a figure 210 written on it, but at the same time, for example, magnetic transparent or ink of the same color as the surface m'j of the paper 160. machine-readable information is also included.

この状況をA−A’断面線220及びB−B’断面線2
30に沿った断面図(第4図(b)および(C))で示
す。第2図(b)断面図240においては、紙242の
上にテキスト” House”の、視覚により可読な物
質252を用いた表示の下部に機械可読視覚不可読物質
250を用いた” T−101188”のコードによる
表示が、繰り返し7て2.44,246゜248部に作
成されている。ここで、繰り返し表示しているわけは、
一部分の表示が汚れなどによって読み取れなくなった場
合にも、原情報を読み取れるように配慮したためである
。第2図のB−B′断面図260には、同様に視覚可読
物質252による長方形の表示と並んで、機械可読視覚
不可読物質250を用いた長方形のコード表現が264
゜266部に繰り返し作成されている。機械可読視覚不
可読物質による情報表現コードは、開始」−F 270
 、コード本体部272.終了コード274という組み
で形成され機械読み取りを簡単化している。図でロー+
:27o、272,274等は、図示を簡略化したが、
実際にはもつと多くのビット数を用いて充分に情報を表
現できるようになっているものとする。
This situation is expressed as A-A' section line 220 and B-B' section line 2.
30 (FIGS. 4(b) and (C)). In the cross-sectional view 240 of FIG. 2(b), a machine-readable visually non-readable material 250 is used below the display of the text "House" on the paper 242 using a visually readable material 252."T-101188 ” was created in 248 copies of 2.44,246° by repeating 7 times. The reason why it is displayed repeatedly here is
This is to ensure that even if part of the display becomes unreadable due to dirt, etc., the original information can be read. 2, a rectangular code representation 264 using machine-readable visually non-readable material 250 is shown in a cross-sectional view 260 along line BB′ of FIG.
゜It has been repeatedly created in 266 copies. Machine-readable visually-unreadable material information representation code begins”-F 270
, cord body portion 272. It is formed of a set of termination codes 274 to simplify machine reading. Low + in the diagram
:27o, 272, 274, etc. are simplified in illustration, but
In reality, it is assumed that information can be expressed sufficiently using a large number of bits.

第3図は、異種表示手段同時表現文書の別の実施例を示
している。本方法は、一般にMNコード化法とよばれる
、ビット1とOの頻度がコード同志で比較的均一なコー
ド化法を用いるものである、文字N HI+を視覚可読
物質によって表示する際に視覚困gICであるが機械可
読な微細化レベルで、機械用の文字II HI+のコー
ドが300部と310部とに2サイクル分記述されてい
る。コード340部は無情報コード部分である。各サイ
クルで、開始コード320,322、コード本体325
゜327、終了コード330,332が表示しである。
FIG. 3 shows another embodiment of a simultaneous representation document with different display means. This method uses an encoding method, generally called MN encoding method, in which the frequency of bits 1 and 0 is relatively uniform among codes. Although it is a gIC, it has a machine-readable miniaturization level, and two cycles of code for machine characters II HI+ are written in copies 300 and 310. The code portion 340 is a non-information code portion. In each cycle, start code 320, 322, code body 325
327, and end codes 330 and 332 are displayed.

A−A’断面線360に沿った断面図が第3図(b)で
ある。この実施例の場合には、紙面242上に、視覚可
読物質のみによって人間用と機械用の情報が並記しうる
ので、第2図の実施例に比較して、文書入出力のための
装置120が安価に実現できることになる。
A cross-sectional view taken along the AA' cross-sectional line 360 is shown in FIG. 3(b). In this embodiment, information for humans and machines can be written on the paper surface 242 using only visually readable materials, so that the device 120 for inputting and outputting documents is different from the embodiment shown in FIG. can be realized at low cost.

第4図(a)、(b)および(c)は機械可読物質によ
るテキスト表現コード400.図形表税1コード430
9文章表現コード460の詳細を示す。
FIGS. 4(a), (b), and (c) show a machine-readable text representation code 400. Figure table tax 1 code 430
9 shows the details of the sentence expression code 460.

いずれも開始コード270と終了コード274の間にコ
ード本体部を持っている。テキスト表現コード400は
、表示物がテキストであることを表示物タイプ指定コー
ド410で表示したあと、テキスト指定コード412に
よって表示内容、例えば”House”を表示し、表示
色指定コード414によって色を、フォントタイプ指定
コード416によって表示フォントの種別を、テキスト
座標コ−ド418によって文書上の視覚可能テキストの
表示位置の文書中での座標点を表示している。最後に、
誤り訂正符号420が付加されている。図形コード43
0では、表示物タイプ指定コード4S31によって、表
示物が図形であることを表示したあと、図形タイプ指定
コード432によって表示図形が長方形か円かといった
区別を指定し、表示色指定ロー+:434によって図形
の色を、図形外周幅指定コード436によって外周境界
線の幅を表示し、図形座標指定コード438によって文
書上での当該図形の表示位置座標を表示している。さら
に図形意味指定ロー1−; 440によって、当該図形
が例えば家の壁を表わすといった情報を表示している。
Both have a code body between the start code 270 and the end code 274. The text expression code 400 indicates that the display object is text using the display object type specification code 410, then displays the display content, for example, "House" using the text specification code 412, and changes the color using the display color specification code 414. A font type designation code 416 indicates the type of display font, and a text coordinate code 418 indicates the coordinate point in the document of the display position of visible text on the document. lastly,
An error correction code 420 is added. Figure code 43
0, the display object type specification code 4S31 indicates that the display object is a figure, the figure type specification code 432 specifies whether the display figure is a rectangle or a circle, and the display color specification row +:434 specifies whether the display figure is a rectangle or circle. As for the color of the figure, the width of the outer boundary line is displayed by the figure outer width designation code 436, and the coordinates of the display position of the figure on the document are displayed by the figure coordinate designation code 438. Further, a figure meaning designation row 1-; 440 displays information such that the figure represents, for example, a wall of a house.

文章表現コード460の例では、文書全体が例えば“T
hj、s :is a House、”というテキスト
であることを462で表示したあと、この文章の動詞、
主語、目的語を各々、464゜466.4−68のコー
ドで表示している。ここで示した例は、他にも種々可能
なコード表現方法の一例にすぎず、文字、単語2文章9
図形をはしめ(]5) 種々の対象をコードで表現する方法であれば何であって
も利用できる。
In the example of the text expression code 460, the entire document is, for example, “T
hj, s :is a House,” after displaying the text with 462, the verb of this sentence,
The subject and object are each displayed using a code of 464°466.4-68. The example shown here is only one example of various other possible code representation methods, and includes characters, words, 2 sentences, 9
Putting the shapes together (]5) Any method can be used as long as it expresses various objects in code.

なお、以上の説明では、人間に目視可能な情報、例えば
、”Th1s is a House、”とこれに対応
した機械可読情報とが文書上で重複した位置に表現され
る場合を示したが、両者は必すしも重複した位置に表示
される必要はなく、両者が別々の位置に表示されていて
も良い。
Note that in the above explanation, the case where human-visible information such as "Th1s is a House" and the corresponding machine-readable information are expressed in overlapping positions on the document was shown, but both are not necessarily displayed in overlapping positions, and both may be displayed in separate positions.

第5図は、本発明の文書の出力及び入力処理機構500
の実施例である。文書処理機能を持った計算機110は
、信号線520によって文書入出力装置120を構成す
る入出力機構500と接続されている。入出力機構50
0は信号線530を介して入出力ヘッド540と接続さ
れている。
FIG. 5 shows a document output and input processing mechanism 500 of the present invention.
This is an example. A computer 110 having a document processing function is connected to an input/output mechanism 500 forming a document input/output device 120 via a signal line 520. Input/output mechanism 50
0 is connected to the input/output head 540 via a signal line 530.

550はヘッドの移動アームである。ヘット上には、文
書作成時に使用する磁気含有インクを射出するためのノ
ブ95602通常のインクを射出するためのノズル5フ
02文書入力時に使用する磁気センサーとが備えられて
いる。ヘッド540は文書150上のスキャンベルト5
90を一回のストロークでスキャンし、出力モードの場
合にはノズル560と570を用いて各々磁気含有イン
クで機械可読用のコードを、通常のインクで目視可読情
報を文書上に出力し、第2図実施例の文書を作成する。
550 is a head moving arm. The head is provided with a knob 95602 for ejecting magnetic ink used when creating a document, a nozzle 5 f02 for ejecting normal ink, and a magnetic sensor used when inputting a document. The head 540 scans the scan belt 5 on the document 150.
90 in one stroke, and in the output mode outputs a machine-readable code with magnetically-containing ink and visually readable information with regular ink onto the document using nozzles 560 and 570, respectively. Figure 2 Creates a document for the embodiment.

入力モードの場合には、磁気センサー580を用いて文
書上の機械可読コードを読み込む。文書処理機能付き計
算機110では、文書編集ソフi・ウェアによって、テ
キストや図形含みの文書が作成され、その高次情報コー
ド、例えばテキストについてはアスキーコード表現が、
開始マークと終了マークとではさまれたひとつのレロー
1くとして信号線520を介して、入出力処理機構50
0に伝えられる。入出力処理機構500ではこの高次情
報レコードの各要素たとえばテキストの場合、−文字ず
つを、変換辞書を用いてプリンタ出力用の低次情報ロー
:(に変換する。この時、目視可読情報と機械可読情報
とのペアとなったコードを作成し、これらによってプリ
ンタヘッド540を制御し、文書上に画情報を印刷する
。文書を読み込む場合には、磁気センサーによって得ら
れる機械可読な低次情報を、入出力処理機構500によ
って辞書を用いて高次情報に変換し、計算機110に送
る。文書上への情報並記方式として第3図実施例を用い
る場合のプリンタヘッドを595に示す。この場合には
、通常インクノズ  ′ル570と光学センサー598
とをヘッド上に備けておいて、目視可能情報印刷時に、
通常インクノズルからのインク射出を、機械可読コード
のビットパターン配列に合わせてオンオフ制御すること
により文書上にMNコードを陰伏させた目視可能情報を
作成させる方式が可能である。逆に文書読み込み時には
、光学センサー598によってMNコードを低次情報と
して読み込み、入出力処理機構500によって高次情報
に変換し、これを計算機110に転送する。
In the input mode, the magnetic sensor 580 is used to read the machine readable code on the document. In the computer 110 with a document processing function, a document containing text and figures is created using document editing software i-ware, and its higher-order information code, for example, an ASCII code representation of the text, is
The input/output processing mechanism 50 is connected to the input/output processing mechanism 50 via the signal line 520 as one recorder sandwiched between the start mark and the end mark.
0 can be communicated. The input/output processing mechanism 500 uses a conversion dictionary to convert each element of this high-level information record, such as the - character in the case of text, into low-level information row: ( for printer output. At this time, visually readable information and A code paired with machine-readable information is created to control the printer head 540 and print image information on the document.When reading the document, machine-readable low-order information obtained by a magnetic sensor is used to control the printer head 540 and print image information on the document. is converted into high-order information using a dictionary by the input/output processing mechanism 500 and sent to the computer 110.A printer head 595 is shown when the embodiment shown in FIG. 3 is used as a method for writing information on a document. In this case, the ink nozzle 570 and the optical sensor 598 are usually used.
and on the head, when printing visible information,
Normally, by controlling on/off ink ejection from an ink nozzle in accordance with the bit pattern arrangement of the machine-readable code, it is possible to create visually visible information in which the MN code is hidden on the document. Conversely, when reading a document, the optical sensor 598 reads the MN code as low-order information, the input/output processing mechanism 500 converts it into high-order information, and transfers this to the computer 110.

第6図は、入出力処理機構500の機能ブロック図であ
る。計算機110とは高次情報路520を介して接続さ
れており、プリンタ側とは低次情報路530を介して接
続されている。出力時には高次情報は一旦、データバッ
ファ612に蓄積される。計算機110から送られる高
次〜低次変換辞書は辞書メモリ610に記憶される。高
次→低次変換部614では辞書メモリ610内の辞書を
用いてデータバッファ612上の高次情報を低次情報に
変換し、低次情報データバッファ616に蓄積する。6
16内の低次情報にはパリティコード及び印刷制御フォ
ーマツ1へコードがパリティ付加及びフォーマット生成
部617によって添付されたのち、出力データ生成部6
19によって印刷信号に変換され、D/A変換器618
を通してプリンタに送られる。
FIG. 6 is a functional block diagram of the input/output processing mechanism 500. It is connected to the computer 110 via a high-order information path 520, and to the printer side via a low-order information path 530. At the time of output, the high-order information is temporarily stored in the data buffer 612. The high-order to low-order conversion dictionary sent from the computer 110 is stored in the dictionary memory 610. The high-order to low-order conversion unit 614 uses the dictionary in the dictionary memory 610 to convert the high-order information on the data buffer 612 to low-order information, and stores it in the low-order information data buffer 616. 6
After a parity code and a code are attached to the print control format 1 by the parity addition and format generation unit 617, the low-order information in the output data generation unit 6
19 into a print signal, and the D/A converter 618
is sent to the printer through

文書人力時には、文書上の機械可読な低次情報のアナロ
グ信号が先ずA/D変換器620によってディジタル化
され誤り訂正部621で誤り訂正を受けたのちデータバ
ッファ622に蓄積される。
When a document is manually processed, an analog signal of machine-readable low-order information on the document is first digitized by an A/D converter 620, subjected to error correction by an error correction section 621, and then stored in a data buffer 622.

訂正部612内には文書上に多重表現された機械可読コ
ードが全て読み込まれるため、重複削除処理部624に
よって重複を削除し、重複を徐いたデータが一時メモリ
626に蓄積される。このあと辞書を用いた低次→高次
変換部628で低次→高次変換処理が実施され、得られ
た高次情報はデータバッファ630に蓄積され、計算機
110に送られる。
Since all the machine-readable codes expressed multiplexed on the document are read into the correction unit 612, the duplications are deleted by the duplication deletion processing unit 624, and the data from which the duplications have been removed is stored in the temporary memory 626. Thereafter, a low-order to high-order conversion unit 628 using a dictionary performs low-order to high-order conversion processing, and the obtained high-order information is stored in a data buffer 630 and sent to the computer 110.

図では出力処理と入力処理とを判り易く説明するために
、入出力の双方の処理で共有できる処理ブロックを別々
に図示したが、実際に実現する場合には、高次情報デー
タバッファ612と630、低次情報データバッファ6
16と622などは同一のものを並用してもよい。また
、各部614゜616.617,619,621,62
4,624等を1つ又は複数のマイクロプロセッサで実
現できる。
In the figure, in order to explain output processing and input processing in an easy-to-understand manner, processing blocks that can be shared by both input and output processing are shown separately. , low-order information data buffer 6
16 and 622 may be the same. In addition, each part 614゜616, 617, 619, 621, 62
4,624, etc. can be implemented with one or more microprocessors.

第7図は計算機110側での文書編集処理の概要を示す
。処理モード判定700ののち、利用者のモード選択が
文書編集であれば、文書編集ソフトウェア710を起動
してテキストや図を対話形で作成する。この時、作成さ
れたテキス1へや図形は文書上での表示位置、テキスト
や図形の性質等の様々な情報をアスキーコード等の高次
表現形式で計算機110内のメモリ上に記憶する。また
、ひとまとまりの情報ブロック、たとえば”House
”という単語、あるいは長方形という形状ごとに、高次
情報には開始マークと終了マークがつけられ、以降の出
力処理時の単位レコードとされる。翻訳などをおこなわ
せたい場合には、ひとつの文章全体を単位レコードと定
義し、その文の構文木情報、たとえば主語、a詞、目的
語などを、視覚可能情報と共にレコード内に定義する。
FIG. 7 shows an overview of document editing processing on the computer 110 side. After processing mode determination 700, if the user's mode selection is document editing, document editing software 710 is activated to interactively create text and figures. At this time, the created text 1 and graphics store various information such as the display position on the document and the properties of the text and graphics in a high-level representation format such as ASCII code on the memory in the computer 110. Also, a set of information blocks, such as “House
” or for each shape such as a rectangle, a start mark and an end mark are attached to the higher-level information, and it is used as a unit record for subsequent output processing.If you want to perform translation etc., one sentence The entire sentence is defined as a unit record, and the syntax tree information of the sentence, such as the subject, a-word, object, etc., is defined in the record along with visual information.

利用者が出力処理モードを選択した場合には処理720
をおこなう。すなわち、先ず高次情報を低次情報に変換
するだめの辞書を入出力処理機構500に出力し、その
あと計算機メモリ上の高次情報レコードを第6図のデー
タバッファ612に転送し、第6図処理部614〜61
8によって印刷処理をおこなう。
If the user selects the output processing mode, process 720
will be carried out. That is, first, a dictionary for converting high-order information into low-order information is output to the input/output processing mechanism 500, and then the high-order information record on the computer memory is transferred to the data buffer 612 in FIG. Diagram processing units 614 to 61
8 performs printing processing.

利用者が入力処理モードを選択した場合には、先ず入出
力処理機構500に変換辞書を転送する。
When the user selects the input processing mode, the conversion dictionary is first transferred to the input/output processing mechanism 500.

次に第6図処理部620〜628によって低次情報の読
み込みと高次情報への変換をおこなったのち、データバ
ッファ630内の全レコードを計算機メモリ内に取り込
む。
Next, after reading the low-order information and converting it into high-order information by the processing units 620 to 628 in FIG. 6, all records in the data buffer 630 are taken into the computer memory.

第8図は第6図610の辞書メモリに転送して高次・低
次情報間の変換をおこなわせる変換辞書の内容説明であ
る。ヘッダ800部は、辞書がメモリ上に配置された時
のフィールド内容を示しており、802の部分はアドレ
ス、804部は辞書  ′種別たとえばテキス1〜用か
図形用がといったことをビット情報で記述する部分であ
る。806部は高次情報フィールドであり例えばアスキ
ーコードが記入される。808部は各々の高次情報に対
する低次視覚可能情報のニー1・、810部は視覚不可
機械可読情報コードであり、812部全体が低次情報コ
ードを記述するフィールドとなっている。
FIG. 8 is an explanation of the contents of the conversion dictionary that is transferred to the dictionary memory 610 in FIG. 6 to perform conversion between high-order and low-order information. The header part 800 shows the field contents when the dictionary is placed in memory, the part 802 is the address, and the part 804 is the dictionary type. This is the part to do. The field 806 is a higher-order information field in which, for example, an ASCII code is written. Part 808 is the knee 1 of low-order visual information for each high-order information, part 810 is an invisible machine-readable information code, and the entire part 812 is a field for writing the low-order information code.

図で814部は文字11 A +1に関する辞書内容で
ある。ある高次情報を低次情報に変換するには、図中の
フィールド806のビットパターンとマツ≠ンクさせ、
マツチする行の低次情報フィールド内のビットパターン
を取り出せば良い。逆に機械可読低次情報を高次情報に
変換するには図中のコード810のビットパターンとマ
ツチングさせ、マツチする行の高次情報フィールドの内
容を取り出せば良い。
In the figure, part 814 is the dictionary content regarding the character 11 A +1. To convert certain high-order information to low-order information, match it with the bit pattern of field 806 in the figure,
All you have to do is extract the bit pattern in the low-level information field of the row that matches. Conversely, to convert machine-readable low-order information into high-order information, it is sufficient to match the bit pattern of code 810 in the figure and extract the contents of the high-order information field of the matching row.

第9図は文書出力時の高次情報から低次情報への変換処
理を詳細に説明したものである。データバッファ612
内のレコードはレコードを構成する単位情報ごとに高次
→低次変換部614内のメモリ上の900部に取り出さ
れ、辞書メモリ610の804.’806部とマツチン
グ(処理912)され、マツチした行914の低次情報
部808.810のビットパターンがメモリ上の920
部に取り出され(処理916)、低次情報データバッフ
ァ616に転送される。流れ図で示すと、先ずデータバ
ッファ6]2が空か否か調べ(処理930)、空でなけ
れば、低次レコード開始コードをデータバッファ616
に転送しく処理932)、引続いてデータバッファ61
2内のひとつのレコードを読み出して、その構成単位た
とえばテキストレコードの場合、その−文字ずつを辞書
を用いて低次情報に変換し、次々にデータバッファ61
6に転送する(処理940)。ひとつのレコードを変換
したのち低次レコードの終了コ一ドをデータバッファ6
16に転送しく処理942)、データバッファ616内
に開始コードと終了コードで囲まれたひとつの低次情報
レコードを作成する。最後にこうして作成したひとつの
低次情報レコードに出力形式命令コードを書き込む(処
理944)。これは例えば、視覚可能情報、” Hou
 se I+に並記すべき機械可読コードの出力重複回
数等を指定するためである。以下同様にデータバッファ
612内の全レコードを処理したあと終了する。
FIG. 9 is a detailed explanation of the conversion process from high-order information to low-order information when outputting a document. data buffer 612
The records in 900 copies of the memory in the high-order → low-order conversion unit 614 are taken out for each unit information that constitutes the record, and are stored in 804 copies of the dictionary memory 610. '806 part is matched (processing 912), and the bit pattern of the low-order information part 808.810 of the matched row 914 is
(process 916) and transferred to the low-order information data buffer 616. As shown in the flowchart, first, it is checked whether the data buffer 6]2 is empty (processing 930), and if it is not empty, the low record start code is sent to the data buffer 616.
932), and then the data buffer 61
2, and in the case of a text record, its constituent unit, for example, a text record, is converted into low-level information using a dictionary, and then sent to the data buffer 61 one after another.
6 (processing 940). After converting one record, the end code of the lower record is sent to the data buffer 6.
16, a single low-order information record surrounded by a start code and an end code is created in the data buffer 616 (step 942). Finally, an output format instruction code is written into one low-order information record created in this way (processing 944). This can be, for example, visual information, “Hou
This is to specify the number of times the machine-readable code to be outputted is duplicated in se I+. After all records in the data buffer 612 are processed in the same manner, the process ends.

第10図(、)および(b)は文書入力時の低次情報の
高次情報への変換処理の詳細を示す。データバッファ6
22内の開始コードと終了コードで囲まれた低次情報レ
コードはひとつづつ重複データ削除部624に取り込ま
れる(処理1000)、開始コードあるいは終了コード
が脱落しているレコードは、紙面上のシミなどで破損さ
れた情報とみて廃却(処理1006)する。そうでない
レコードについては、−時メモリ626内に記憶されて
いるレコード1¥:1002との間で同一性判定処理1
004をおこない、同一データの場合には重複データで
あるとみて廃却(処理1006)する。
FIGS. 10(,) and (b) show details of the process of converting low-level information into high-level information when inputting a document. data buffer 6
The low-level information records surrounded by the start code and end code in 22 are taken into the duplicate data deletion unit 624 one by one (process 1000). Records with missing start codes or end codes are removed from the paper due to stains, etc. The information is considered to be corrupted and discarded (processing 1006). For other records, identity determination processing 1 is performed between the records 1 and 1002 stored in the -time memory 626.
004, and if the data is the same, it is considered to be duplicate data and discarded (processing 1006).

同一でない場合には一時メモリ内に記憶させる(処理1
008)。同一性判定のためには、レコード1001の
ビットパターンと1002のレロー)〈各々のビットパ
ターンとの排他的論理和(FOR)演算をビットごとに
実施し、全ピッ1−が0ならば同一データと判断する方
式が簡便である。なお、全提条件として、文書入力に先
立って一時メモリ626はクリアしておく必要がある。
If they are not the same, store them in temporary memory (processing 1)
008). To determine the identity, perform an exclusive OR (FOR) operation between the bit pattern of record 1001 and the bit pattern of record 1002 for each bit, and if all the bits are 0, the data is the same. The method of determining this is simple. Note that, as a prerequisite, it is necessary to clear the temporary memory 626 before inputting a document.

同一文書の異る場所から同一内容、例えば”House
”というテキストが入力された場合には、入力された低
次レコード上には、例えば第4図に示したような表示位
置座標コード418も含まれているため、EOR演算に
よって同一性判定をおこなう際に異る入力データである
と判定される。よって、上記の重複レコード削除処理に
よって削除されるのは、文書上の同一場所に表示された
可視情報ひとつに対して文書の汚れなどへの対応力向上
のためにわざと複数並記されていた機械可読情報の内の
余分なものだけとなる。データバッファ622のレコー
ドを全て処理し、データバッファ622が空になったら
、1時メモリ内のレコードをひとつづつ選び、各レコー
ド上の単位データ並び(1010,1011なと)ごと
に、ひとつづつ変換部628内のメモリ上しこよみこみ
(処理1012)、これを辞書内の低次情報フィールド
の内の機械可読情報フィールド810部のビットパター
ンとマツチングさせ(処理1.020)、マツチした行
1022の高次情報フィールド804,806部のビッ
トパターンをメモリ1030に取り出す。
The same content from different locations in the same document, for example "House"
” is input, the input low-level record also includes a display position coordinate code 418 as shown in FIG. 4, so identity is determined by EOR operation. Therefore, the duplicate record deletion process described above deletes only one piece of visible information displayed at the same location on the document when the document is dirty, etc. Only the redundant pieces of machine-readable information that were intentionally written in parallel in order to improve performance will be stored.When all the records in the data buffer 622 are processed and the data buffer 622 becomes empty, the records in the temporary memory will be are selected one by one, and are read into the memory in the conversion unit 628 one by one for each unit data array (1010, 1011, etc.) on each record (processing 1012), and this is stored in the lower-level information field in the dictionary. (process 1.020), and the bit patterns of the higher-order information fields 804 and 806 of the matched row 1022 are taken out to the memory 1030.

次にメモリ1030の内容を高次情報データバッファ6
30に送る。なお、ひとつのレコードをデータバッファ
630内に転送するに先立ってレコード開始コードをデ
ータバッファ630に送っておき、ひとつのレコードの
処理を全て終了した時点で終了コードを送り、データバ
ッファ630内にひとつの高次情報レコードを作成する
。第10  ′図(b)には以上が流れ図として説明さ
れている。
Next, the contents of the memory 1030 are transferred to the higher-order information data buffer 6.
Send it to 30. Note that before transferring one record to the data buffer 630, a record start code is sent to the data buffer 630, and when all processing of one record is completed, an end code is sent, and one record is transferred to the data buffer 630. Create higher-level information records. The above is explained as a flowchart in FIG. 10'(b).

以上によってデータバッファ630には入力文書上の機
械可読情報が、重複を省いて高次情報レコ−ドの形で読
み取られたことになる。
As a result, the machine-readable information on the input document has been read into the data buffer 630 in the form of higher-order information records without duplication.

第11図は高次情報と低次情報との関係を説明したもの
である。本例では高次情報の単位ブロックとして英文テ
キスト”Th1s js a House、”を用いて
いる。もちろん、単位ブロックとして複数個の文からな
る文章全体を採用することもできるが、その定義のh法
は文書編集の都合によって任意に決めれば良いものであ
って、ここで示す例が絶対的なものではない。ここでは
、高次情報の単位ブロックがいくつかの単位レコード1
102の集合で形成されており、単位レコードは開始コ
ード]−110と終了コード1114の間に高、数情報
本体部1112を持ち、本体部1112の中にレコード
内単位情報11o3をいくつか保持していることを例と
してあげている。高次情報レコード1102に対応する
低次情報レコードを1104に示す。開始ロー+: 1
120と終了コード1130の間に、出力フオーマッド
コード1122.コード本体部1124.パリティコー
ド1128を持っている。コード本体部1124内の単
位情報1106は、例えばテキストの一文字に対する可
視情報コード1132と機械可読情報コード1134の
ペアとして定義されている。低次情報単位レコード11
04は、いくつか集まって低次情報の単位ブロック11
08を形成している。
FIG. 11 explains the relationship between high-order information and low-order information. In this example, the English text "Th1s js a House" is used as a unit block of higher-order information. Of course, an entire sentence consisting of multiple sentences can be used as a unit block, but the h-method of definition can be arbitrarily determined depending on the convenience of document editing, and the example shown here is an absolute one. It's not a thing. Here, the unit block of higher-order information is several unit records 1
102, and the unit record has a high and number information body part 1112 between the start code ]-110 and the end code 1114, and the body part 1112 holds some intra-record unit information 11o3. I am giving an example of what is happening. A low-order information record corresponding to the high-order information record 1102 is shown at 1104. Starting low +: 1
120 and the end code 1130, an output format code 1122. Code body part 1124. It has a parity code of 1128. The unit information 1106 in the code body section 1124 is defined, for example, as a pair of a visible information code 1132 and a machine-readable information code 1134 for one character of text. Lower information unit record 11
04 is a unit block 11 of lower-order information that is assembled in several pieces.
08 is formed.

次に第6図の出力データ生成部619の処理の内容を第
12図で詳述する。先ず、データバッファ616内の低
次情報レコードが、パリティ及び出力フォーマット情報
を付加されて、処理機構617より出力されて来たもの
を入力として受理する(処理1200)、次にこの入力
情報」二に記述されている低次情報本体部(例えは第1
1図中の1124)の内容及びフォーマットコードの内
容(例えば第11図1122)により出力するテキスト
や図形のビットパターンを作成する(処理1202)。
Next, the contents of the processing of the output data generation section 619 shown in FIG. 6 will be explained in detail with reference to FIG. 12. First, the low-level information record in the data buffer 616, with parity and output format information added, is received as input from the processing mechanism 617 (process 1200), and then this input information is processed. The lower information main body part (for example, the first
A bit pattern of text and figures to be output is created based on the contents of 1124 in FIG. 1 and the contents of the format code (for example, 1122 in FIG. 11) (process 1202).

続いて、作成したビットパターンを、印刷器の1行分ず
つD/A変換器に出力する(処理1204)。処理12
02では、視覚用の出力情報と機械用の出力情報との双
方がビットパターン化され、処理1204の出力では双
方が出力される。この出力信号によって第5図の印刷用
ヘッド540あるいは595の動作が制御され、目視可
能情報と機械可読情報との双方とが同−文書上に表示さ
れる。
Subsequently, the created bit pattern is output to the D/A converter line by line of the printer (process 1204). Processing 12
In step 02, both visual output information and mechanical output information are converted into bit patterns, and both are output in the output of process 1204. This output signal controls the operation of printing head 540 or 595 in FIG. 5 to display both visible and machine readable information on the same document.

第13図は本発明の応用例として一部が汚れた文書を入
力し編集する場合を示している。本発明にもとづく文書
1300 (文書1)は、1部が汚されているとする。
FIG. 13 shows a case where a partially soiled document is input and edited as an applied example of the present invention. It is assumed that one copy of document 1300 (document 1) based on the present invention is stained.

別に文書1304 (文書2)も使用する。先ず両文書
上の機械可読情報をスキャンして入力する(処理130
6)。汚れ13o2が存在していても、本発明における
機械可読情報の重複化出力表示方式により、汚れていな
い1個の情報が存在すれば原情報は復元できる。入力さ
れた低次情報は高次情報に変換され(処理1308)、
計算機本体上の主メモリに取り込まれ、文書編集ソフト
ウェアを用いて編集がほどこされる(処理1310)。
Separately, a document 1304 (document 2) is also used. First, machine readable information on both documents is scanned and input (process 130).
6). Even if dirt 13o2 exists, the original information can be restored as long as there is one clean piece of information using the machine-readable information duplication output display method of the present invention. The input low-order information is converted to high-order information (processing 1308),
The information is imported into the main memory of the computer and edited using document editing software (processing 1310).

入力した低次情報には文書上のテキストや図形の表示位
置座標等も含まれているので、低次→高次変換処理13
08で、それらの情報も高次情報に変換しておけば、例
えば文書2の中の太陽の図面を対話処理によって文書1
の座標系内に移動させることは容易である。この他、文
書1内の文字タイプの変更、家の図形の屋根の部分を黒
くぬりつぶすといった変更も対話によって容易に実現で
きる。文書編集の終了後、計算機メモリ上に作成された
新文書の高次情報を低次情報に変換し〔処理1312)
低次情報をプリンタ装置によって出力表示させると(処
理1.314)、目視可能情報と機械可読情報が並記さ
れた新文書]3〕6が得られる。本応用例で証明される
本発明の、従来技術に比較した大きな特徴は、1部分が
汚れなどによって破損された文書を直接入力しても、原
情報が容易に復元できること、テキストや図形を含む一
般文書の、文書上に表記された情報の意味までを含めた
直接的読み取りが容易に実現でき、従来のようにフロッ
ピィ−ディスク等と印刷用紙の2重所有や管理が不要と
なることなどである。
Since the input low-order information includes display position coordinates of texts and figures on the document, low-order → high-order conversion processing 13
If you convert that information into higher-order information in step 08, for example, you can convert the drawing of the sun in document 2 to document 1 through interactive processing.
It is easy to move it within the coordinate system of In addition, changes such as changing the character type in the document 1 and coloring the roof of a house shape in black can be easily accomplished through dialogue. After the document editing is completed, the high-level information of the new document created on the computer memory is converted to low-level information [processing 1312].
When the low-level information is output and displayed by the printer device (process 1.314), a new document [3]6 in which visually visible information and machine-readable information are written side by side is obtained. The major feature of the present invention compared to the prior art, as demonstrated by this application example, is that even if a document in which one part is damaged due to dirt or the like is input directly, the original information can be easily restored, and the original information can be easily restored. Direct reading of general documents, including the meaning of the information written on the documents, can be easily realized, and there is no need for dual ownership and management of floppy disks, etc. and printing paper as in the past. be.

現在、多用されるようになってきたスキャナーは白黒の
単純なドツトパターンとして文書を入力できるのみであ
り、テキストや図形の意味情報までを復元入力すること
は不可能であり、本応用例に比較しうる高度な編集機能
を実現することはできない。
Scanners, which are now widely used, can only input documents as simple black and white dot patterns, and it is impossible to restore and input the semantic information of text and figures. It is not possible to realize the advanced editing functions that can be achieved.

第14図は、本発明を応用した異−涌語文書間の直接自
動翻訳方式の説明図である。本例の場合には、原文書1
400上には目視可能情報に並記して機械可読コードに
よって目視可能情報の意味構造が論理学で使用される述
語の形式で除法記載されているものとする。入力処理に
よって、容易に家(赤)。
FIG. 14 is an explanatory diagram of a direct automatic translation method between documents in different languages to which the present invention is applied. In this example, original document 1
400, the semantic structure of the visible information is written in a machine-readable code along with the visible information in the form of a predicate used in logic. Easy home (red) by input processing.

という、″赤い家″という文章の述語表現が高次情報と
して計算機内部のメモリ上に復元できる(処理1402
)。こうして復元された述語の各各の要素、すなわち″
家′″と″赤′″とを翻訳辞書1406を用いて翻訳し
、別言語で記述した述語、house(red)。
The predicate expression of the sentence "Red House" can be restored on the computer's internal memory as higher-order information (process 1402).
). Each element of the predicate thus restored, i.e.
The predicate ``house'' and ``red'' are translated using the translation dictionary 1406 and written in another language, ``house(red'').

を得る。get.

次に、この新しく得られた高次情報を出力処理すること
により、Red houseという異語゛語テキストを
持った新文書1408をプリントアウトさせることかで
きる。
Next, by outputting this newly obtained high-order information, it is possible to print out a new document 1408 having the foreign language text "Red house".

本応用例で示される本発明の意義は、従来不可能である
とされてきた、図形やテキストを含む一般文書の、異言
語文書への直接的変換が容易に実現できるという点であ
る。従来の言語翻訳においては、目視可能なテキスト、
すなわち本例の場合には“赤い家”という、ある評語で
記述された情報を先ず構文解析によって家(赤)″とい
う述語に変換し、次にこれを異国語に変換するという方
式を取っている。構文解析段階はきわめて困難な処理で
あり、未だ正しい翻訳をおこなえる状況ではなく、将来
ともに不可能であろうとの予想もされている。ところが
、文書編集用ラフ1−ウェアに、文書を作成する途中で
文書作成者との対話により、作成者が意図している文の
真の意味構造を抽出して述語等の形式で記述し、文その
ものとは別に保持することは現在の技術で容易に可能で
ある。本応用例では、この方式を利用して取得した述語
家(赤)′″と、表示文赤い家″とが原文書1400上
に並記しであると想定して説明をおこなった。
The significance of the present invention shown in this application example is that it is possible to easily directly convert a general document containing figures and text into a document in a different language, which has been thought to be impossible in the past. In traditional language translation, visible text,
In other words, in the case of this example, the information described in a certain review word, ``red house,'' is first converted into the predicate ``house (red)'' through syntactic analysis, and then this is converted into a foreign language. The parsing stage is an extremely difficult process, and it is not yet possible to perform a correct translation, and it is predicted that it will not be possible in the future. With current technology, it is easy to extract the true meaning structure of the sentence intended by the document creator through dialogue with the document creator during the process, write it in the form of predicates, etc., and store it separately from the sentence itself. In this application example, the explanation will be made assuming that the predicate (red)'' obtained using this method and the display sentence "red house" are written side by side on the original document 1400. Ta.

第15図は、異言語文書間の自動翻訳において。Figure 15 shows automatic translation between documents in different languages.

格文法によって意味表現する例を示すものである。This is an example of expressing meaning using case grammar.

格文法では、第15図の原文「私は8時に電車で学校へ
行く」に対して、「行く」という動詞を中心として、そ
の動作主は「私」9時は「8時」。
In case grammar, for the original sentence in Figure 15, ``I go to school by train at 8 o'clock,'' the verb ``go'' is the main character, and the action is ``I'' and 9 o'clock is ``8 o'clock.''

手段は「電車」、終点は「学校」であるというように、
文の中の語の持つ意味的役割りを明示する形で文全体の
意味を表わす。この意味表現を同図(c)のような形で
高次情報として、人間向けの原文と並記しておけば、そ
の機械可読情報から同図(d)のように、訳文” ■g
o to the 5choolat 8 o’clo
ck by trajn、”を自動生成することができ
る。
The means is "train" and the end point is "school".
The meaning of the entire sentence is expressed by clearly indicating the semantic roles of the words in the sentence. If this semantic expression is written as higher-level information in the form shown in Figure (c) and written alongside the original text for humans, then the machine-readable information can be used to generate a translated text as shown in Figure (d).
o to the 5choolat 8 o'clo
ck by trajn," can be automatically generated.

情報媒体の汚染や欠損に対する情報保護方法としては、
幾種類かの異なる方法によって機械可読情報を表現して
並記する形もとる。例えば、光でのスキャン用のバーコ
ードと磁気読取り用の磁気インクによる方法、情報媒体
中の一部分をマイクロフィルム化する方法や、半導体記
憶装置を情報媒体に埋め込むノブ法と上記方法との組合
わせ等である。
Information protection methods against contamination or loss of information media include:
Machine-readable information may be expressed and written in several different ways. For example, a method using a bar code for optical scanning and magnetic ink for magnetic reading, a method for turning a part of an information medium into microfilm, a combination of the knob method and the above method for embedding a semiconductor storage device in an information medium. etc.

第14図では、本発明をテキストと図形の双方を含む文
章の異国語間翻訳処理に適用する例を示したが、もつと
簡単な例で、かつ最近の文書処理の中で技術開発課題と
なっている、文書からの特定情報の切り出し処理への適
用について第16図を用いて説明する。
Fig. 14 shows an example in which the present invention is applied to interlingual translation processing of a document containing both text and figures, but this is a simple example and one of the most important technological development issues in recent document processing. The application to the process of extracting specific information from a document will be explained using FIG. 16.

第16図1500はテキスト部1504と図形部150
2を共に持った文書である。テキスト部の開始列の部位
(1510,1512)に本発明の機械可読コードによ
るテキスト開始記号を記入し、終了列部位(1514,
1516,1518)にテキスト終了記号を記入する。
FIG. 16 1500 shows a text section 1504 and a graphic section 150.
It is a document that has both. A text start symbol based on the machine-readable code of the present invention is entered in the start column portion (1510, 1512) of the text portion, and the end column portion (1514,
1516, 1518), enter the text end symbol.

また、図形部の開始列部位(1520,1522)に図
形開始記号を、終了列部位(1524,1526)に図
形終了記号を各々記入する。以」二のように作成された
文書を例えば第5図実施例に示した装置によって、図で
水平力向にスキャンすることにより、容易に文書中のテ
キスト部と図形部を認識でき、例えば図形だけを選択的
に取り出すといった機能を実現できる。図中で1510
.1514部などに記入する機械可読コードによる開始
あるいは終了記号のかわりに、目視可能情報とは別の場
所に、テキスト部位や図形部位に関する情報を記憶して
おく方法も考えられるが、これらに比べて、上記実施例
では、人間用と機械用の情報を重ね書きできる方式が有
利である。
Further, a figure start symbol is written in the start column part (1520, 1522) and a figure end symbol is written in the end column part (1524, 1526) of the figure part. By scanning the document created as described above in the horizontal direction using, for example, the apparatus shown in the embodiment in FIG. It is possible to realize functions such as selectively extracting only the 1510 in the diagram
.. Instead of starting or ending symbols using machine-readable codes written in the 1514th copy, etc., it is possible to store information about text parts and graphic parts in a place different from the visible information, but compared to these methods, In the above embodiments, it is advantageous to use a method in which information for humans and information for machines can be overwritten.

(1)文書面積の有効活用ができる。(1) Document area can be used effectively.

(2)文書上に情報を印刷する時に、原紙面に対する印
刷情報の位置が予定通りにならずに、ずれたり、回転し
たりすることが一般的である。別の部位に人間用と機械
用の情報を記載する方式だと、このような外乱への耐久
力が弱くなる。
(2) When printing information on a document, it is common for the printed information to be misaligned or rotated rather than being positioned as planned with respect to the original paper surface. If the information for humans and machines is written in separate parts, the durability against such disturbances will be weakened.

例えば紙面左上点を起点と約束して機械用コードで表示
したテキスト部15o4の原点位置が実際の原点位置と
ずれてしまい、文書を再度読み取る際にエラーを起こす
。これに対して、機械用と人間用の情報を同一部所に重
ねて記述する実施例では、双方の情報が同一の外乱を等
しく35) く受けるため再度読み取る際のエラーは少くなる。すな
わち外乱への耐久力が強いと昌える。
For example, the origin position of the text portion 15o4, which is displayed in a machine code with the upper left point of the page as the starting point, deviates from the actual origin position, causing an error when the document is read again. On the other hand, in an embodiment in which information for machines and information for humans are written overlappingly in the same place, both pieces of information are equally subjected to the same disturbance35), so errors when rereading are reduced. In other words, the ability to withstand external disturbances is strong.

〔発明の効果〕〔Effect of the invention〕

本発明によれば、人間が目視可能な情報と、人間には目
視困難であるが機械には可読な情報とによってテキスト
や図形を含む文書を作成することによって、次のような
効果かある。
According to the present invention, by creating a document including text and graphics using information that is visible to humans and information that is difficult for humans to see but is readable to machines, the following effects can be achieved.

(1)従来のように人間用に紙髪使用した文書を作成し
、機械用にフロッピーディスクを使用して文書の機械コ
ードを保管するという2重管理か不要となる。
(1) There is no longer a need for double management, as in the past, in which a paper document is created for humans and a floppy disk is used to store the machine code of the document for machines.

(2)文書をその意味情報まで含めて直接機械に読み取
られることが可能となる。しかも、機械用の情報を多重
化して文書上に表現することによって、文書の一部が破
損した場合でも容易に原文書を復元できる。以上は、従
来大変困難であるとされてきた、一般文書の機械による
直接解読が可能となることを意味する。回路図■Iの自
動読み取りも同等に可能となる。
(2) It becomes possible to directly read a document, including its semantic information, by a machine. Furthermore, by multiplexing machine information and expressing it on a document, even if part of the document is damaged, the original document can be easily restored. The above means that it is now possible to directly decipher general documents by machine, which has been considered extremely difficult in the past. It is also possible to automatically read the circuit diagram ■I.

(3)文書上に文や図形の意味情報を機械可読な形で並
記しておくことにより、異国語間文書自動翻訳が容易に
実現できる。従来はこれは不可能であった。
(3) Automatic translation of documents between different languages can be easily realized by writing semantic information of sentences and figures on documents in a machine-readable form. Previously this was not possible.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の全体概要を示す概念図、第2図は本発
明文書表現方法による一実施例を示す図、第3図は本発
明文書表現方法による他の実施例を示す図、第4図は本
発明文書表現における機械可読情報のコード化実施例を
示す図、第5図は本発明文書の入出力部の説明図、第6
図は本発明文書の入出力機能のブロック図、第7図は本
発明における文書編集ソフトウェアの一例を示す図、第
8図は本発明で用いる高次・低次情報変換辞書の一実施
例図、第9図は本発明での出力処理主要部の一実施例の
説明図、第10図(a)、(b)は本発明での入力処理
主要部の一部実施例の説明図、第11図は本発明で使用
する高次情報と低次情報との関係説明図、第12図は本
発明での末端出力処理部の処理内容説明図、第13図は
本発明を応用した部分破損文書直接入力による文書編集
方式の一実施例を示す図、第14図は本発明を応用した
、異国語文書間自動翻訳方式の一実施例を示す図、第1
5図は本発明を応用した異国語文書間自動翻訳方式の他
の実施例を示す図、第16図は本発明の文書切り出し処
理への適用例を示す図である。
FIG. 1 is a conceptual diagram showing the overall outline of the present invention, FIG. 2 is a diagram showing one embodiment of the document representation method of the present invention, FIG. 3 is a diagram showing another embodiment of the document representation method of the present invention, and FIG. FIG. 4 is a diagram showing an example of encoding machine-readable information in the document expression of the present invention, FIG. 5 is an explanatory diagram of the input/output section of the document of the present invention, and FIG.
The figure is a block diagram of the input/output function of the document of the present invention, Figure 7 is a diagram showing an example of the document editing software of the present invention, and Figure 8 is a diagram of an embodiment of the high-order/low-order information conversion dictionary used in the present invention. , FIG. 9 is an explanatory diagram of an embodiment of the output processing main part in the present invention, FIGS. 10(a) and (b) are explanatory diagrams of a partial embodiment of the input processing main part in the invention, and FIG. Fig. 11 is an explanatory diagram of the relationship between high-order information and low-order information used in the present invention, Fig. 12 is an explanatory diagram of the processing contents of the terminal output processing unit in the present invention, and Fig. 13 is a diagram showing partial damage to which the present invention is applied. FIG. 14 is a diagram showing an embodiment of a document editing method using direct document input; FIG.
FIG. 5 is a diagram showing another embodiment of the automatic translation system between foreign language documents to which the present invention is applied, and FIG. 16 is a diagram showing an example of application of the present invention to document extraction processing.

Claims (1)

【特許請求の範囲】 1、人間が目視できる情報表現様式の情報と人間には目
視困難であるが機械には可読な情報表現様式の情報との
両者の文書上での表示位置が重複する文書上での情報表
現方法。 2、目視困難機械可読表現物質として、磁気を含む物質
あるいは光の反射特性に特徴を有する物質を使用する請
求項第1項の情報表現方法。 3、人間に目視可能な情報表現物質を用いて人間には目
視困難であるが機械には可読な情報を表現する請求項第
1項の情報表現方法。 4、2−7コードに代表されるMNコードとよばれるコ
ード化方式によつて、目視可能物質の文書への付着状況
を変化させることにより、見た目の文書上の文字等の濃
淡を均一化しつつ、かつ機械可読情報を併記する請求項
第1項の情報表現方法。 5、請求項第1項の情報表現方法により文書を作成する
手段を備えた処理システム。 6、請求項第1項の情報表現方法により作成された文書
を読み取る手段を備えた処理システム。 7、目視可能情報と目視困難機械可読情報とを文書上に
同時表示する手段と、目視困難機械可読情報を読み取る
手段とを備えた計算機システム。 8、目視可能情報及び目視困難機械可読情報生成用デー
タのペアを、文字や図形に対して定義した辞書を使用し
て請求項第1項の文書を計算機システムに入出力する方
法。 9、目視可能情報のひとつの表示に対して、対応する目
視困難機械可読情報を複数個表示するようにした請求項
第1項の情報表現方法。 10、請求項第9項記載の文書上の複数表現された機械
可読情報から、同一情報についてはひとつのみの情報を
選出する機能を備えた情報表現方法。 11、請求項第1項の表現方法により、テキスト及び図
形情報を同時表示した文書の読み取り、編集、編集結果
の出力のいずれかをおこなう文書編集装置。 12、請求項第1項記載の表現方法による文書において
、目視可能文章及び図形の一方あるいは双方の意味情報
を目視困難機械可読情報として保持させ、これを利用す
ることによつて異言語文書間の機械翻訳をおこなわせる
翻訳装置。 13、意味情報記述手段として述語論理学における項の
概念を使用する請求項第12項の翻訳装置。 14、請求項第12項記載の意味情報記述手段を用いて
、文書入力によつて、計算機システムの動作制御をおこ
なわせる処理システム。 15、医療相談、法律相談、住民表管理、特許管理、設
計図管理、プロジエクト管理、絵画管理、楽曲管理、生
産管理、図書館管理または教育の分野に適用した請求項
第14項の処理システム。 16、大規模記憶装置と請求項第6項のシステムとを組
合せて使用する文書管理システム。 17、機械可読情報を複数の異なる記録手段によつて記
録し、読みとる手段を有する請求項第7項の計算機シス
テム。
[Scope of Claims] 1. A document in which the display positions of both information in an information expression format that is visually visible to humans and information in an information expression format that is difficult for humans to see but readable to machines are overlapped. How information is expressed above. 2. The method for representing information according to claim 1, wherein a material containing magnetism or a material having characteristics of light reflection properties is used as the hard-to-see, machine-readable representation material. 3. The information expression method according to claim 1, wherein information that is difficult for humans to see visually but is readable by machines is expressed using an information expression substance that is visible to humans. A coding method called the MN code, which is typified by the 4, 2-7 code, is used to uniformize the appearance of the shading of characters, etc. on the document by changing the adhesion status of visible substances to the document. and machine-readable information. 5. A processing system comprising means for creating a document using the information representation method according to claim 1. 6. A processing system comprising means for reading a document created by the information representation method according to claim 1. 7. A computer system comprising means for simultaneously displaying visually visible information and difficult-to-see machine-readable information on a document, and means for reading the difficult-to-see machine-readable information. 8. A method for inputting and outputting the document according to claim 1 into a computer system using a dictionary in which pairs of visually visible information and data for generating difficult-to-visibly machine-readable information are defined for characters and figures. 9. The information representation method according to claim 1, wherein for each display of visually visible information, a plurality of pieces of corresponding difficult-to-visibly machine-readable information are displayed. 10. An information expression method having a function of selecting only one piece of information for the same piece of information from a plurality of pieces of machine-readable information expressed on a document according to claim 9. 11. A document editing device that reads, edits, or outputs an editing result of a document in which text and graphic information are displayed simultaneously using the expression method according to claim 1. 12. In a document using the expression method set forth in claim 1, semantic information of one or both of visually visible text and figures is retained as difficult-to-visibly machine-readable information, and by using this, it is possible to transfer between documents in different languages. A translation device that performs machine translation. 13. The translation device according to claim 12, wherein the term concept in predicate logic is used as the semantic information description means. 14. A processing system for controlling the operation of a computer system through document input using the semantic information description means according to claim 12. 15. The processing system according to claim 14, which is applied to the fields of medical consultation, legal consultation, resident list management, patent management, blueprint management, project management, painting management, music management, production management, library management, or education. 16. A document management system using a large-scale storage device in combination with the system of claim 6. 17. The computer system according to claim 7, further comprising means for recording and reading machine-readable information using a plurality of different recording means.
JP63137526A 1988-06-06 1988-06-06 Information expressing method and document processing system Pending JPH01306958A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63137526A JPH01306958A (en) 1988-06-06 1988-06-06 Information expressing method and document processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63137526A JPH01306958A (en) 1988-06-06 1988-06-06 Information expressing method and document processing system

Publications (1)

Publication Number Publication Date
JPH01306958A true JPH01306958A (en) 1989-12-11

Family

ID=15200739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63137526A Pending JPH01306958A (en) 1988-06-06 1988-06-06 Information expressing method and document processing system

Country Status (1)

Country Link
JP (1) JPH01306958A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04232564A (en) * 1990-05-30 1992-08-20 Xerox Corp Data storage and communication apparatus without hard-copy loss for electronic document processing apparatus
JPH07295958A (en) * 1994-04-27 1995-11-10 Ricoh Co Ltd Paper media system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5329025A (en) * 1976-08-31 1978-03-17 Oki Electric Ind Co Ltd Chinese-character input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5329025A (en) * 1976-08-31 1978-03-17 Oki Electric Ind Co Ltd Chinese-character input device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04232564A (en) * 1990-05-30 1992-08-20 Xerox Corp Data storage and communication apparatus without hard-copy loss for electronic document processing apparatus
JPH07295958A (en) * 1994-04-27 1995-11-10 Ricoh Co Ltd Paper media system

Similar Documents

Publication Publication Date Title
JP3219251B2 (en) Electronic document processing device
US6035308A (en) System and method of managing document data with linking data recorded on paper media
Finneran The literary text in the digital age
CA2365937C (en) System and method for distributing multilingual documents
US5133024A (en) Image data bank system with selective conversion
US5991469A (en) System for reading a form utilizing encoded indications for form field processing
US5787449A (en) Method and system for manipulating the architecture and the content of a document separately from each other
Bornschein et al. Collaborative creation of digital tactile graphics
Landoni The Visual Book system: A study of the use of visual rhetoric in the design of electronic books
JPH01306958A (en) Information expressing method and document processing system
JP2002352217A (en) Document managing device, document managing method and storage medium in which program to make computer perform processing on the document managing device is stored
Esteras English for computer users
JP2004072558A (en) Electronic whiteboard and method for outputting data of electronic whiteboard
JPH0451871B2 (en)
Beebe A Bibliography of Publications about Typographic Fonts
JPH08127152A (en) Printer and translation printing method thereof
Forrest Approaches to digital preservation: re-examining the recovery of the Chora of Metaponto, The Necropoleis
Rinaldi Internet Architecture and News Design: How Language and Cultural Context Affect the Transition of Chinese Language Newspapers from Print to Online
JPS61234464A (en) Documentation device
De La Beaujardiere Well-established document interchange formats
Sanderson Linking past and future: an application of dynamic HTML for medieval manuscript editions
Brüggemann-Klein et al. How to please authors and publishers: a versatile document preparation system at Karlsruhe
Rood et al. The comparative Siouan dictionary project
Bear " The Lady of May" and the Rhetoric of Electronic Text
Hannemyr High quality document production on a personal computer