JPH0778797B2 - Automatic numbering method for sentence numbers in document processing - Google Patents

Automatic numbering method for sentence numbers in document processing

Info

Publication number
JPH0778797B2
JPH0778797B2 JP59198536A JP19853684A JPH0778797B2 JP H0778797 B2 JPH0778797 B2 JP H0778797B2 JP 59198536 A JP59198536 A JP 59198536A JP 19853684 A JP19853684 A JP 19853684A JP H0778797 B2 JPH0778797 B2 JP H0778797B2
Authority
JP
Japan
Prior art keywords
sentence
input
english
screen
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59198536A
Other languages
Japanese (ja)
Other versions
JPS6177955A (en
Inventor
健治 大倉
和彦 深作
寛美 中島
敬博 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59198536A priority Critical patent/JPH0778797B2/en
Publication of JPS6177955A publication Critical patent/JPS6177955A/en
Publication of JPH0778797B2 publication Critical patent/JPH0778797B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Record Information Processing For Printing (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、自然言語の文書を一文一文識別しなければな
らない分野(例えば、機械翻訳システム)のために、各
文に、識別番号を効率的に自動採番する方式に関するも
のである。
DETAILED DESCRIPTION OF THE INVENTION Field of Use of the Invention The present invention efficiently assigns an identification number to each sentence for a field in which a natural language document must be identified sentence by sentence (for example, a machine translation system). It is related to the automatic numbering system.

〔発明の背景〕[Background of the Invention]

従来、自然言語で書かれた文章は、特開昭57−121765で
示されるような文章編集装置(ワードプロセッサ)で処
理されているが、これは複数の文を一つの処理単位とし
てまとめて処理をしている。従って、一文一文を認識し
て処理は行われていない。また特開昭56−42876で示さ
れるような電子式翻訳装置においては、単語もしくは一
文を即時に翻訳し、表示するため、入力となる各文ある
いは各単語に認識番号を付与する必要がなかった。しか
し、特開昭58−40684で開示された方式による英語から
日本語への機械翻訳においては、一文一文を識別して処
理をしなければならないシステムも現われ出している。
このようなシステムでは入力となる一文(以後−センテ
ンスという)毎に識別番号を付与しなければならない
が、従来は、入力者が各センテンスに意識的に識別番号
を付与して、キー付データを作成しなければならなかっ
た。
Conventionally, texts written in natural language are processed by a text editing device (word processor) as shown in Japanese Patent Laid-Open No. 57-121765. This is done by processing a plurality of texts as one processing unit. is doing. Therefore, each sentence is not recognized and processed. Further, in the electronic translation device as shown in JP-A-56-42876, since a word or a sentence is immediately translated and displayed, it is not necessary to give an identification number to each sentence or word to be input. . However, in the machine translation from English to Japanese according to the method disclosed in Japanese Patent Laid-Open No. 58-40684, a system that has to identify and process each sentence has appeared.
In such a system, an identification number must be given to each sentence (hereinafter-sentence) to be input, but conventionally, the input person intentionally gives an identification number to each sentence and sends the keyed data. Had to create.

〔発明の目的〕[Object of the Invention]

本発明は、上記の点に鑑み、自然言語で書かれた文書の
入力において、各センテンスの採番を、機械的かつ効率
的に付加する方式を提供することを目的とする。
In view of the above points, an object of the present invention is to provide a method of mechanically and efficiently adding the numbering of each sentence when inputting a document written in natural language.

〔発明の概要〕[Outline of Invention]

上記の目的を達成するため、本発明は、自然言語で書か
れた文書に文書の構造に則して特殊記号を付加すること
により各センテンスに、物理的な概念に合致した番号す
なわち、センテンスの検索の際、連想し易いような番号
を自動的に採番する方式を提供したものである。
In order to achieve the above object, the present invention provides each sentence with a number corresponding to a physical concept, that is, by adding a special symbol to a document written in natural language according to the structure of the document. It provides a method of automatically assigning a number that is easy to associate when searching.

〔発明の実施例〕Example of Invention

以下、本発明の実施例を詳細に説明する。 Hereinafter, examples of the present invention will be described in detail.

第1図は、本発明による自動採番方式を実施するための
装置の一実施例を示すブロック図を表わす。図において
1はディスプレイ装置、2はキーボード等の入力装置、
3はプロセッサ、4はメモリ、5は画面バッファ、6は
磁気ディスク等の外部メモリを表わしている。本実施例
では説明の都合上、自然言語を英語として採番方式およ
び、入力方式について説明する。
FIG. 1 is a block diagram showing an embodiment of an apparatus for implementing an automatic numbering system according to the present invention. In the figure, 1 is a display device, 2 is an input device such as a keyboard,
3 is a processor, 4 is a memory, 5 is a screen buffer, and 6 is an external memory such as a magnetic disk. In the present embodiment, for convenience of explanation, the numbering system and the input system will be described with the natural language being English.

自然言語で書かれた文書は、第2図で示すような本や新
聞等の形で存在することが多い。これらの文書を説明す
る際、『何という本の、何ページの何行目に書かれてい
る文章はとか、何という新聞の、何面に載っている何カ
ラムの記事は何々だ』という具合に、文書の位置付けを
することが多い。この物理的に付けた名称(例えば、第
2図に示すようなドキュメント,ページ,パラグラフ,
センテンスという名称)を利用し、特定の1センテンス
にドキュメント名(9桁)、ページ数(4桁)、パラグ
ラフ番号(2桁)、センテンス番号(2桁)の合わせて
17桁の識別番号を付与し、この識別番号付きで外部メモ
リ6の英文ファイルに格納した例が第3図である。この
ファイルは、識別番号の指定により、センテンスデータ
の入出力が可能であり、かつ識別番号の上昇順、下降順
でもデータの入出力が可能である。この詳細を第4図に
示す。
Documents written in natural language often exist in the form of books, newspapers, etc., as shown in FIG. When explaining these documents, he said, "What book, what page, what line is written, what newspaper is, what column is on which page?" In many cases, the document is positioned. This physically assigned name (for example, document, page, paragraph, as shown in Figure 2)
Use the document name (9-digit), page number (4-digit), paragraph number (2-digit), sentence number (2-digit) in one specific sentence.
FIG. 3 shows an example in which a 17-digit identification number is given and stored in an English file in the external memory 6 with this identification number. This file can input / output sentence data by designating an identification number, and can also input / output data in ascending or descending order of identification numbers. The details are shown in FIG.

外部メモリ6の英文ファイルは、第4図に示すように、
識別番号と、どこのデータ部にデータが格納してあるか
を位置付けるポインタ群からなるインデックス部と、識
別番号と英文または和文データを格納するデーター部か
らなるファイルである。
The English file in the external memory 6 is, as shown in FIG.
It is a file consisting of an identification number, an index portion including a group of pointers for locating the data portion where the data is stored, and a data portion storing the identification number and English or Japanese text data.

第4図のインデックスセット(IS)1101は、各シーケン
スセット(SS)1102に格納している識別番号の最大番号
と、どのシーケンスセットかを示すポインタが格納して
あり、シーケンスセット1102には、各コントロールエリ
ア(CA)1103の中のコントロールインターバル(CI)の
中の最大識別番号と、どのコントロールインターバルか
を示すポインターが格納されている。ここではコントロ
ールインターバルは、磁気ディスク装置の1トラックに
相当する。インデックス部を検索することにより、任意
のデータを読み出すことができ、かつ上昇順あるいは下
降順にも読み出しすることができる。また、上昇順,下
降順に読み出したとき、データ部のレコード1104には識
別番号を持っているため、読み出したデータの識別番号
を知ることが可能である。
The index set (IS) 1101 of FIG. 4 stores the maximum number of identification numbers stored in each sequence set (SS) 1102 and a pointer indicating which sequence set, and the sequence set 1102 includes The maximum identification number in the control interval (CI) in each control area (CA) 1103 and a pointer indicating which control interval is stored. Here, the control interval corresponds to one track of the magnetic disk device. By searching the index portion, it is possible to read out arbitrary data, and it is also possible to read out in ascending order or descending order. Further, when the data is read in the ascending order and the descending order, the record number 1104 of the data section has the identification number, so that the identification number of the read data can be known.

また、このファイルは、第5図に示すような管理情報を
第4図のデータレコード部中にレコードとして持ってい
る。ページ管理情報1201は蓄積されているドキュメント
毎にあり、ページ管理情報であることを示すためにレコ
ード識別番号のページ,パラグラフ,センテンスのエリ
アにはすべて0が書き込まれている。パラグラフ管理情
報1202はページ毎に用意され、パラグラフとセンテンス
のエリアが0であることにより識別される。同様にセン
テンス管理情報1203が用意されている。これらには現在
蓄積されているページやパラグラフやセンテンスの最大
の番号と、蓄積されている(ファイルに登録されてい
る)ページやパラグラフやセンテンスの数などが格納さ
れている。例えばページ管理情報では、そのドキュメン
トにおいて登録されているページの最大のページ番号と
ページ数などである。
Further, this file has management information as shown in FIG. 5 as a record in the data record section of FIG. There is page management information 1201 for each stored document, and 0 is written in all of the page, paragraph, and sentence area of the record identification number to indicate that it is page management information. The paragraph management information 1202 is prepared for each page, and is identified by the paragraph and sentence areas being 0. Similarly, sentence management information 1203 is prepared. These include the maximum number of pages, paragraphs, and sentences currently accumulated, and the number of pages, paragraphs, and sentences accumulated (registered in the file). For example, the page management information includes the maximum page number and the number of pages registered in the document.

この管理情報を使用することにより、以下で説明するセ
ンテンスの自動採番にて直接センテンスを検索すること
なしに、最大ページ数、最大パラグラフ数、最大センテ
ンス数などを知ることができる。なお、管理情報レコー
ドは、英文ファイルの中に存在しなくても良い。すなわ
ち、外部ファイルとして一つのファイルとして存在して
も良い。
By using this management information, it is possible to know the maximum number of pages, the maximum number of paragraphs, the maximum number of sentences, etc. without directly searching for a sentence with automatic sentence numbering described below. The management information record does not have to exist in the English file. That is, it may exist as one file as an external file.

文書を機械処理にて利用可能にするために、被処理文書
は外部メモリの英文ファイルに第1図の入力装置2から
入力される。この場合、新規に入力する場合と、追加的
に入力する場合の2通りが考えられる。なお、英文では
文末に、第6図に示す文末記号と空白がつけられるのが
一般的なので、これらを認識することによって文末を認
識するものとする。(例えば、This is a pen.△△…△
は空白を示す。) 以上の構成から成る実施例の作動を第7図の処理フロー
図および、第8図の処理過程を示す画面を用いて説明す
る。
In order to make the document available for machine processing, the processed document is input to the English file in the external memory from the input device 2 of FIG. In this case, there are two possibilities: a new input and an additional input. In addition, in the English sentence, since the sentence end symbol and the space shown in FIG. 6 are generally added to the sentence end, the sentence end is recognized by recognizing these. (For example, This is a pen. △△… △
Indicates a blank. The operation of the embodiment having the above configuration will be described with reference to the process flow chart of FIG. 7 and the screen showing the process steps of FIG.

まず、プロセッサ3は第8図(a)のガイダンス画面を
ディスプレイ装置1へ表示する。入力者は、この画面に
対して、キーボード2から英文の文書の新規入力か追加
入力かの指示データを入力する(501)。この指示デー
タによりプロセッサ3はモード(新規入力モードまたは
追加入力モード)を設定する(502)。
First, the processor 3 displays the guidance screen of FIG. 8 (a) on the display device 1. The input person inputs instruction data for new input or additional input of the English document from the keyboard 2 to this screen (501). The processor 3 sets the mode (new input mode or additional input mode) by this instruction data (502).

新規入力モードの場合、プロセッサ3は、ドキュメント
名を問い合わせる画面を作成し、画面バッファ5へ転送
する。ディスプレイ装置に表示された画面(第8図
(b))に対して、入力者は、ドキュメント名のみをキ
ーボード2から指定する(503)。プロセッサ3は、指
定されたドキュメント名が外部メモリ6の英文ファイル
に存在するかどうか調べ(504)、存在するならばドキ
ュメント名指定誤りとして処理をステップ503へもど
す。存在しなければ、新規入力としてステップ507の処
理へ制御を移す。
In the case of the new input mode, the processor 3 creates a screen for inquiring the document name and transfers it to the screen buffer 5. On the screen (FIG. 8 (b)) displayed on the display device, the input person specifies only the document name from the keyboard 2 (503). The processor 3 checks whether or not the specified document name exists in the English file in the external memory 6 (504), and if there is, the document name designation error and returns the process to step 503. If it does not exist, the control is transferred to the processing of step 507 as a new input.

追加入力モードの場合、プロセッサ3は、ドキュメント
名,ページ数,パラグラフ番号を問い合わせる画面を作
成し、画面バッファ5へ転送する。ディスプレイ装置に
表示された画面(第8図(b))に対して、入力者は、
ドキュメント名,ページ数パラグラフ番号をキーボード
2より指定する。ページ数,パラグラフ番号は、追加入
力を行う位置に応じて設定する(505)。プロセッサ3
は、指定されたドキュメント名,ページ数,パラグラフ
番号を識別番号に持つデータが、外部ファイルの英文フ
ァイルに存在するかどうか調べ(506)、存在しなけれ
ば指定誤りとして505の処理へもどす。存在するなら
ば、507の処理へ制御を移す。プロセッサ3は第8図
(c)の英文入力画面を作成し、画面バッファ5へ転送
する。第8図(c)は、ドキュメント名,ページ数,パ
ラグラフ番号等を表示するインデックス表示領域、前画
面の情報の一部もしくは、外部メモリ6の英文ファイル
の情報の一部を表示する前画面情報表示領域、英文デー
タを入力するための英文データ入力領域、入力時のエラ
ー情報を表示するエラーメッセージ表示領域から成って
いる。
In the additional input mode, the processor 3 creates a screen for inquiring the document name, the number of pages, and the paragraph number, and transfers it to the screen buffer 5. For the screen (FIG. 8 (b)) displayed on the display device, the input person
Specify the document name and page number paragraph number from the keyboard 2. The page number and paragraph number are set according to the position where additional input is made (505). Processor 3
Checks whether data having the specified document name, the number of pages, and the paragraph number as the identification number exists in the English file of the external file (506), and if there is not, returns to the processing of 505 as a specification error. If it exists, control is passed to the processing of 507. The processor 3 creates the English input screen of FIG. 8 (c) and transfers it to the screen buffer 5. FIG. 8 (c) shows an index display area for displaying the document name, the number of pages, paragraph numbers, etc., a part of the information of the previous screen, or the previous screen information for displaying a part of the information of the English file in the external memory 6. It consists of a display area, an English data input area for inputting English data, and an error message display area for displaying error information at the time of input.

前画面情報表示領域には、新規入力時の最初の英文入力
画面の場合、何も表示しないが、追加入力時の英文入力
画面の場合には、外部メモリ6の英文ファイルの追加入
力しようとするセンテンスの直前のセンテンスの情報を
表示する。入力者は英文データ入力領域に英文の文書を
入力する。(507)このとき各センテンスの文末は、第
6図に示す文末記号の一つと、2つ以上の空白が入力さ
れる。プロセッサ3は、この文末記号と二つ以上の空白
によりセンテンスの区切りを認識し各センテンスに識別
番号を付与する。英文の文書は、第9図の新規入力時の
採番方法および第10図の追加入力時の採番方法における
入力方法の欄に記述してある特殊記号を文頭に付加する
ことにより、採番されるページ数やパラグラフ番号を変
更することができる。
In the previous screen information display area, nothing is displayed in the case of the first English input screen at the time of new input, but in the case of the English input screen at the time of additional input, an attempt is made to additionally input the English file in the external memory 6. Display information about the sentence immediately before the sentence. The input person inputs an English document in the English data input area. (507) At this time, as the sentence end of each sentence, one of the sentence end symbols shown in FIG. 6 and two or more blanks are input. The processor 3 recognizes a sentence delimiter by the sentence end symbol and two or more blanks, and gives an identification number to each sentence. Documents in English can be numbered by adding the special symbols described in the input method column in the numbering method for new input in Fig. 9 and the numbering method for additional input in Fig. 10 to the beginning of the sentence. You can change the number of pages displayed and the paragraph number.

第9図、第10図における符号の意味は下記のとおりであ
る。
The meanings of symbols in FIGS. 9 and 10 are as follows.

△:1個以上の空白、▲:0個以上の空白 p:指定ページ数(4桁以内:1〜9999) h:指定パラグラフ番号(2桁以内:1〜99) p0:1英文前のページ数 h0:1英文前のパラグラフ番号 s0:1英文前のセンテンス番号 P1:外部メモリの英文ファイル中の既存ページ数の集合 P2:画面バッファメモリ中の既存ページ数の集合 H1:外部メモリの英文ファイル中の既存パラグラフ番号
の集合 H2:画面バッファメモリ中の既存パラグラフ番号の集合 h1:外部メモリの英文ファイル中のpページの最大パラ
グラフ番号 *1:採番条件を満足しないとエラー 条件式の説明:a∈A…aが集合Aの要素である。
△: 1 or more blanks, ▲: 0 or more blanks p: Specified page number (up to 4 digits: 1 to 9999) h: Specified paragraph number (up to 2 digits: 1 to 99) p 0 : 1 before the English sentence Number of pages h 0 : 1 Paragraph number before English sentence s 0 : 1 Sentence number before English sentence P 1 : Set of existing page number in English file in external memory P 2 : Set of existing page number in screen buffer memory H 1 : Set of existing paragraph numbers in English file in external memory H 2 : Set of existing paragraph numbers in screen buffer memory h 1 : Maximum paragraph number of page p in English file in external memory * 1: Satisfy the numbering conditions Error if not done Explanation of conditional expression: a ∈ A ... a is an element of the set A.

aA…aが集合Aの要素でない。 aA ... a is not an element of set A.

第9図、第10図の説明として、第11図〜第12図を用いて
説明する。この例は新規登録の例である。第11図、第12
図は、あるマニアルの135ページと136ページの内容をそ
のまま抜粋したものであり、第13図は、このマニアルの
センテンスを第9図に示す特殊記号を付加して入力した
例である。
The description of FIGS. 9 and 10 will be made with reference to FIGS. 11 to 12. This example is an example of new registration. 11 and 12
The figure is an excerpt of the contents of pages 135 and 136 of a certain manual as it is, and FIG. 13 is an example in which the sentence of this manual is input with the special symbols shown in FIG. 9.

まず、第11図の下から五行目以降から、第12図にかけて
入力する場合を例としている。ドキュメント名としては
“DOCφφφ1"をすでに指定してある。第13図の英文入
力画面の先頭の英文は135ページの第三パラグラフの第
1番目のセンテンスであることを指定するために、特殊
記号の“@”(アットマーク)を付加し、“@@135△
@3△Scheduling job…”の入力形式になっている。こ
の“@@”(アットマークの2個連続)はページ変更を
指定する記号であり、直後の数値135により、ページ数
を135に変更したことを意味する。これは第5図のペー
ジ管理情報1201に格納される。“@”(アットマーク1
個)は、パラグラフ変更を指定する記号であり、直後の
数値3により、パラグラフ番号を3に変更したことを意
味する。これもパラグラフ管理情報1202に格納される。
△は空白を意味する。上記の指定により、先頭の英文セ
ンテンスの識別番号は、第3図の例で示した識別番号の
ようになる。また、先頭の文(Scheduling Job Outpu
t)は、第11図の元の文書では文末記号がつけられてな
いので、入力時にオペレータによって“:"(コロン)と
二つの空白が補って入力されている。これによって、セ
ンテンスの区切りをプロセッサ3に認識させることが可
能となっている。次の英文センテンスには、特殊記号の
“@”が付加していないが、この場合、一つ前のセンテ
ンスのセンテンス場合に数値1が加えられた識別番号を
付与されることになる。これは第5図のセンテンス管理
情報1203の最大ページ番号を読み出しそれに1を加える
ことにより得られる。この更新された番号はセンテンス
管理情報1203にも書き込まれる。以上のような採番方法
についてまとめた表が、第9図、第10図である。
First, the case of inputting from the fifth row onward in FIG. 11 to FIG. 12 is taken as an example. "DOCφφφ1" has already been specified as the document name. To specify that the first English sentence on the English sentence input screen in Fig. 13 is the first sentence of the third paragraph on page 135, the special symbol "@" (at mark) is added, and "@@" is added. 135 △
The input format is "@ 3 △ Scheduling job ...". This "@@" (two consecutive at-marks) is a symbol that designates a page change. The number 135 immediately after is changed to 135. This means that it is stored in the page management information 1201 in Fig. 5. "@" (at mark 1
Is a symbol that designates a paragraph change, and means that the paragraph number is changed to 3 by the numerical value 3 immediately after. This is also stored in the paragraph management information 1202.
△ means blank. With the above designation, the identification number of the first English sentence becomes like the identification number shown in the example of FIG. Also, the first sentence (Scheduling Job Outpu
In the original document shown in FIG. 11, the end character is not added to t), so ":" (colon) and two spaces are supplemented when input by the operator. This allows the processor 3 to recognize sentence delimiters. The special character "@" is not added to the next English sentence, but in this case, the identification number to which the numerical value 1 is added is added to the sentence of the preceding sentence. This is obtained by reading the maximum page number of the sentence management information 1203 in FIG. 5 and adding 1 to it. This updated number is also written in the sentence management information 1203. Tables summarizing the numbering methods as described above are shown in FIGS. 9 and 10.

続いて、画面バッファ5からメモリ4へ転送された英文
の入力データをプロセッサ3は、特殊記号および文末記
号(第6図)により、第9図、第10図の採番方法にもと
づいて、各センテンスに識別番号を付与する。ページ,
パラグラフ,センテンスの番号の更新は上記のように特
に番号の指定がなければ第9図、第10に示すページ変
更,パラグラフ変更,センテンス変更の記号に応答し
て、前記管理情報を読みとりそこに記憶された最大番号
に1を加えたものを識別番号として与える。
Then, the processor 3 receives the English input data transferred from the screen buffer 5 to the memory 4 by using the special symbols and the end-of-sentence symbols (FIG. 6) according to the numbering method of FIGS. 9 and 10. Assign an identification number to the sentence. page,
As described above, if the number of the paragraph or sentence is not specified, the management information is read and stored in response to the page change, paragraph change, and sentence change symbols shown in FIGS. 9 and 10. The maximum number obtained by adding 1 is given as the identification number.

一方、更新された最大番号は管理情報中に格納される。
この際、外部メモリ6の英文ファイルに同じ識別番号を
持ったセンテンスが存在するかどうか(同じものがあれ
ばエラー)、また英文入力画面内の各センテンスの識別
番号が重複しないか等の論理チェックを行う(508)。
入力英文の採番条件、採番チェック条件については、第
9図、第10図に記述してある。入力英文の採番チェック
にてのエラーがある場合、ステップ510へ制御を移し、
無ければステップ511へ制御を移す(509)。
On the other hand, the updated maximum number is stored in the management information.
At this time, a logical check is made to see if there is a sentence with the same identification number in the English file in the external memory 6 (if there is the same one, it is an error), and if the identification numbers of the sentences in the English input screen do not overlap. Do (508).
The numbering conditions and numbering check conditions for input English sentences are described in FIGS. 9 and 10. If there is an error in the numbering check of the input English sentence, transfer control to step 510,
If not, control is transferred to step 511 (509).

入力英文データにエラーが有る場合、エラーを発見した
最初の位置を明示する情報(カーソルの位置情報等)と
エラーメッセージを画面バッファ5へ転送する。英文入
力者は、エラーメッセージを参考にして、画面に明示さ
れた位置から、入力データの修正を行う(510)。
When there is an error in the input English text data, the information indicating the first position where the error is found (cursor position information etc.) and the error message are transferred to the screen buffer 5. The English-language input person corrects the input data from the position clearly indicated on the screen by referring to the error message (510).

入力英文のエラーが無い場合、ステップ508の処理にて
自動採番された識別番号と共に、各英文センテンスを外
部メモリ6の英文ファイルへキー付きデータとして書き
込む(511)。
If there is no error in the input English sentence, each English sentence is written to the English file in the external memory 6 as keyed data together with the identification number automatically assigned in the process of step 508 (511).

英文入力処理がすべて終了した場合、入力操作は終りと
なる。しかし引き続き入力する場合には513へ制御を移
す(512)。
When all the English text input processing is completed, the input operation ends. However, when inputting again, control is transferred to 513 (512).

プロセッサ3は、現在処理した画面の情報の一部を利用
して、次の英文入力画面を作成し、画面バッファへ転送
する(513)。この具体的な例を第14図に示す。英文入
力画面の作成にあたっては、前画面に表示している最終
センテンスを前画面情報表示領域に表示する(第14図
(a))。前画面が1401で次画面が1402で示される。前
画面情報表示領域に、表示すべき一センテンスが、全て
納まらない場合には、センテンスの後から、納まる長さ
のデータだけ表示する。前画面に表示している最後のセ
ンテンスに文末記号および二つ以上の空白がない場合、
そのセンテンスは、最終センテンスとは認識されず、未
入力の扱いとし、英文データ入力領域に表示する(第14
図(b))。前画面が1403次画面が1404で示される。こ
のように、前画面情報の一部を英文入力画面に表示する
ことにより、円滑な入力操作が可能となる。
The processor 3 creates a next English input screen by using a part of the information of the currently processed screen and transfers it to the screen buffer (513). A concrete example of this is shown in FIG. When creating the English input screen, the final sentence displayed on the previous screen is displayed in the previous screen information display area (Fig. 14 (a)). The previous screen is shown as 1401 and the next screen is shown as 1402. If all the sentences to be displayed cannot be stored in the previous screen information display area, only the data of the length that can be stored after the sentence is displayed. If the last sentence displayed on the previous screen does not have an end-of-sentence character or two or more spaces,
The sentence is not recognized as the last sentence and is treated as uninput and displayed in the English data input area (14th sentence).
Figure (b)). The previous screen is shown at 1403 and the next screen is shown at 1404. In this way, by displaying a part of the previous screen information on the English input screen, a smooth input operation becomes possible.

〔発明の効果〕〔The invention's effect〕

以上説明したごとく、本発明によれば、自然言語の文書
入力において、自然に近い入力方法により、各センテン
スに効率的な自動採番が行え、しかも識別番号は、物理
的なものから容易に連想することが可能な形式となって
いる。
As described above, according to the present invention, in natural language document input, an efficient natural number input method can be used to efficiently and automatically number each sentence, and the identification number can be easily associated with a physical one. It is a format that can be done.

【図面の簡単な説明】[Brief description of drawings]

第1図は、本発明による一実施例を示すブロック図、第
2図は、自然言語で書かれた文書の例を示す図、第3図
は、本発明による一実施例における英文ファイルの説明
図、第4図はファイルの構成を示す図、第5図は管理情
報を説明する図、第6図は英文における文末記号を示す
図、第7図は本発明による一実施例の処理フローを示す
フロー図、第8図は本発明による一実施例におけるディ
スプレイ画面を示す図、第9図、第10図は本発明による
一実施例の自動採番方法を示す図、第11図、第12図は、
あるマニアルを抜粋した文書を示す図、第13図は、本発
明による一実施例の英文入力画面の例を示す図、第14図
は、本発明による一実施例である入力方式の処理概要を
示す説明図である。 〔符号の説明〕 1…ディスプレイ装置 2…キーボード等の入力装置 3…プロセッサ、4…メモリ 5…画面バッファ 6…磁気ディスク等の外部メモリ
FIG. 1 is a block diagram showing an embodiment according to the present invention, FIG. 2 is a diagram showing an example of a document written in natural language, and FIG. 3 is an explanation of an English file in an embodiment according to the present invention. FIG. 4, FIG. 4 is a diagram showing the structure of a file, FIG. 5 is a diagram for explaining management information, FIG. 6 is a diagram showing sentence endings in English, and FIG. 7 is a processing flow of one embodiment according to the present invention. FIG. 8 is a flowchart showing the display screen in one embodiment according to the present invention, FIGS. 9 and 10 are drawings showing an automatic numbering method in one embodiment according to the present invention, FIG. 11, and FIG. The figure is
FIG. 13 is a diagram showing a document excerpting a certain manual, FIG. 13 is a diagram showing an example of an English text input screen of an embodiment according to the present invention, and FIG. 14 is a processing outline of an input method according to an embodiment of the present invention. It is an explanatory view shown. [Explanation of Codes] 1 ... Display device 2 ... Input device such as keyboard 3 ... Processor 4 ... Memory 5 ... Screen buffer 6 ... External memory such as magnetic disk

フロントページの続き (72)発明者 深作 和彦 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウエア工場内 (72)発明者 中島 寛美 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウエア工場内 (72)発明者 中野 敬博 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウエア工場内 (56)参考文献 特開 昭58−16341(JP,A) 特開 昭59−724(JP,A)Front page continued (72) Inventor Kazuhiko Fukasaku 5030 Totsuka-cho, Totsuka-ku, Yokohama-shi, Kanagawa Inside the Hitachi Software Factory, Ltd. (72) Hiromi Nakajima 5030 Totsuka-cho, Totsuka-ku, Yokohama, Kanagawa Hitachi Ltd. Software Factory (72) Inventor Takahiro Nakano 5030 Totsuka-cho, Totsuka-ku, Yokohama City, Kanagawa Prefecture Hitachi Ltd. Software Factory (56) Reference JP-A-58-16341 (JP, A) Kai 59-724 (JP, A)

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】入力された自然言語の一文ごとに内部処理
のための文番号を取得する文書処理における文番号の自
動採番方法において、 1)自然言語の文末を示す記号を認識することによって
1つの文を認識し、 2)該認識された文に対応して、 自動採番の番号をコントロールするための付加情報が付
されているときは、該付加情報に基づいて文番号を設定
し、 上記付加情報が付されていないときは、その前の文に付
された文番号に基づいて文番号を設定し、 3)設定された文に続く文について上記1)と2)の手
順を繰り返す、 ことを特徴とする文書処理における文番号の自動採番方
法。
1. An automatic numbering method for sentence numbers in document processing for obtaining a sentence number for internal processing for each sentence of an input natural language, 1) by recognizing a symbol indicating the end of a sentence in natural language 1) Recognize one sentence, and 2) When the additional information for controlling the automatic numbering number is attached to the recognized sentence, set the sentence number based on the additional information. If the above additional information is not added, the sentence number is set based on the sentence number given to the sentence before that, and 3) follow the steps 1) and 2) for the sentence following the set sentence. An automatic numbering method for sentence numbers in document processing characterized by repeating.
JP59198536A 1984-09-25 1984-09-25 Automatic numbering method for sentence numbers in document processing Expired - Lifetime JPH0778797B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59198536A JPH0778797B2 (en) 1984-09-25 1984-09-25 Automatic numbering method for sentence numbers in document processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59198536A JPH0778797B2 (en) 1984-09-25 1984-09-25 Automatic numbering method for sentence numbers in document processing

Publications (2)

Publication Number Publication Date
JPS6177955A JPS6177955A (en) 1986-04-21
JPH0778797B2 true JPH0778797B2 (en) 1995-08-23

Family

ID=16392781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59198536A Expired - Lifetime JPH0778797B2 (en) 1984-09-25 1984-09-25 Automatic numbering method for sentence numbers in document processing

Country Status (1)

Country Link
JP (1) JPH0778797B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5416196B2 (en) * 2011-12-16 2014-02-12 京セラドキュメントソリューションズ株式会社 Data processing program and data processing apparatus

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816341A (en) * 1981-07-20 1983-01-31 Sharp Corp Editing device of sentence
JPS59724A (en) * 1982-06-26 1984-01-05 Fujitsu Ltd Automatic item numbering system in japanese word processor

Also Published As

Publication number Publication date
JPS6177955A (en) 1986-04-21

Similar Documents

Publication Publication Date Title
JP2001344562A (en) Device and method for reading document
JPS62267876A (en) Picture register system
JPH0776969B2 (en) Document processor
JPH0778797B2 (en) Automatic numbering method for sentence numbers in document processing
JPH0719261B2 (en) How to display the next screen in machine translation
JPH0612548B2 (en) Document processor
JPS61190653A (en) Document processor
JP2001067368A (en) Multilanguage document processor, multilanguage processing method and recording medium
JPS6134668A (en) Kana (japanese syllabary) to kanji (chinese character) converting system
JPH0962700A (en) Method and device for constructing dictionary
JP2634926B2 (en) Kana-Kanji conversion device
JPH04330565A (en) Natural language processing system using universal file
Kaufman The IBM information retrieval center-(ITIRC) system techniques and applications
JPS61151738A (en) Keyword extracting device
JP2002297574A (en) System and program for kana putting along side chinese characters
JPS6229833B2 (en)
JPS6366663A (en) Control system for document structure
JPH01304574A (en) Index builder for table of contents
JPS58217046A (en) Term editing device
GB2130772A (en) Electronic typewriter and word processor
JPH04253262A (en) Reading kana addition system
JPH02136956A (en) Extracting method for layout information
JPS63138479A (en) Character recognizing device
JPH0535794A (en) Generating retrieval keyword for knowledge data base
JPS6312292B2 (en)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term