JPH103469A - Japanese hyphenation processing method and document processor - Google Patents

Japanese hyphenation processing method and document processor

Info

Publication number
JPH103469A
JPH103469A JP8153641A JP15364196A JPH103469A JP H103469 A JPH103469 A JP H103469A JP 8153641 A JP8153641 A JP 8153641A JP 15364196 A JP15364196 A JP 15364196A JP H103469 A JPH103469 A JP H103469A
Authority
JP
Japan
Prior art keywords
word
line
character
character pitch
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8153641A
Other languages
Japanese (ja)
Inventor
Yumiko Kaneko
由美子 金子
Masami Saito
真佐美 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIIGATA NIPPON DENKI SOFTWARE KK
NEC Software Niigata Ltd
Original Assignee
NIIGATA NIPPON DENKI SOFTWARE KK
NEC Software Niigata Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIIGATA NIPPON DENKI SOFTWARE KK, NEC Software Niigata Ltd filed Critical NIIGATA NIPPON DENKI SOFTWARE KK
Priority to JP8153641A priority Critical patent/JPH103469A/en
Publication of JPH103469A publication Critical patent/JPH103469A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To produce an easy-to-read and decent-looking document by calculating the character pitches to decide to perform the 'run-on' or 'run-off' processing. SOLUTION: At a preprocessing part (S1 to S4), a range of character pitches to be set in a Japanese hyphenation processing mode is decided. Then the length of character display width of a Japanese hyphenation object line is stored together with the total width of characters covering the first one through the final one within the line and the number of characters included in the line respectively. At a retrieval part (S5 to S8), the punctuation and the part of speech of the word that includes the final character are retrieved. If the final character shows a noun, the next part of speech is retrieved. If this part of speech is a postpositional word functioning as an auxiliary to a main word, 'a noun + the postpositional word' is recognized as a word. At a Japanese hyphenation processing part (S9 to S10), it's decided whether a word is divided at the end of a line or at the head of the next line. If the word is divided, the Japanese. hyphenation processing is carried out to correct the character pitches and to display these characters. If the word is not divided, the relevant processing ends.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、日本語文書処理に
よるワードプロセッサやコンピュータなどの文書作成装
置における禁則処理方法に関し、特に一つの単語が分割
されることのない禁則処理方法及びこれを用いた文書処
理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a prohibition processing method in a document processing device such as a word processor or a computer using Japanese document processing, and more particularly to a prohibition processing method in which one word is not divided and a document using the same. It relates to a processing device.

【0002】[0002]

【従来の技術】ワードプロセッサやコンピュータなどの
文書作成装置では、一般的に句読点や“かっこ”などが
行頭もしくは行末にあると不適切な文字を、前の行の末
尾に「追込む」か、または次の行の先頭に「追い落と
す」という処理が行われている。
2. Description of the Related Art In a word processing device such as a word processor or a computer, characters that are inappropriate if punctuation or "parentheses" are present at the beginning or end of a line are generally "added" to the end of the previous line, or At the head of the next line, a process of “being overtaken” is performed.

【0003】これは、禁則処理と呼ばれるものであり、
従来の禁則処理方式では、特開昭58−195248号
公報に示されているように、対象となる文字は句読点や
“かっこ”など特定の文字に限られていた。この禁則処
理方式では、単語は禁則処理の対象としていないため、
1つの単語が2行に分割される場合が生じ、文書として
は読みにくいものとなっていた。すなわち、1行文の文
字数が、規格化された状態で文書を作成する場合、禁則
処理を行っている行の前行の行末およびその直前の2文
字を禁則判定して禁則処理をすることにより、行末禁則
文がほとんど行末に残らないように処理することを目的
とし、キーボードより入力される文書データに基づい
て、制御部が内部記憶部で該文書データから文書を作成
すると共に、文書作成状態で画面表示部で表示させる。
そして制御部は、記憶部に記憶されている文書の行頭文
字が予め定められている行頭禁則文字に該当する場合、
前行の少なくとも行末およびその直前の2文字を判定す
ることにより、それぞれの禁則処理を文書に対して行
う。これにより行末禁則文がほとんど行末に残らないよ
うにし、かつ残りの文字の各間隔を、禁則処理記号等の
数に応じて均等に拡げ、行末に空白が残らないように印
字することができる。
[0003] This is called prohibition processing.
In the conventional prohibition processing method, as shown in JP-A-58-195248, target characters are limited to specific characters such as punctuation marks and "parentheses". In this prohibition processing method, words are not subject to prohibition processing,
In some cases, one word is divided into two lines, which makes the document difficult to read. That is, when a document is created in a state where the number of characters in one line sentence is standardized, the end of the line preceding the line on which the prohibition processing is performed and the two characters immediately before the line are prohibited and the prohibition processing is performed. The control unit creates a document from the document data in the internal storage unit based on the document data input from the keyboard, and processes the document in a document creation state. Display on the screen display.
Then, the control unit, if the first character of the document stored in the storage unit corresponds to a predetermined non-starter character,
By determining at least the end of the previous line and the two characters immediately before it, each prohibition process is performed on the document. As a result, almost no end-of-line prohibition sentence remains at the end of the line, and the intervals between the remaining characters can be evenly expanded according to the number of prohibition processing symbols and the like, and printing can be performed so that no blank space remains at the end of the line.

【0004】この従来例の構成を図6に示す。図6にお
いて、キーボード10より入力される文書データに基づ
いて制御部11が内部記憶部12で文書を作成すると共
に、かかる文書作成装置をCRT等の画面表示部13で
表示させる。制御部11は更に、キーボード10からの
指示に従って作成された上記文書を外部記憶部14に格
納し、また内部記憶部12内の文書を、或いは外部記憶
部14内の文書を内部記憶部12を通してプリンタ部1
5でプリントアウトする。キーボード10から禁則処理
の指示があると、制御部11は内部記憶部12の文書に
対して禁則処理を実施し、かつその処理状態を画面表示
部13で表示せしめる。また制御部11は、内部記憶部
12に格納されているプログラムに従って禁則処理を実
行する。
FIG. 6 shows the configuration of this conventional example. In FIG. 6, the control unit 11 creates a document in the internal storage unit 12 based on the document data input from the keyboard 10, and displays the document creation device on a screen display unit 13 such as a CRT. The control unit 11 further stores the document created according to the instruction from the keyboard 10 in the external storage unit 14, and stores the document in the internal storage unit 12 or the document in the external storage unit 14 through the internal storage unit 12. Printer unit 1
Print out with 5. When an instruction for prohibition processing is issued from the keyboard 10, the control unit 11 executes prohibition processing on the document in the internal storage unit 12 and causes the screen display unit 13 to display the processing state. Further, the control unit 11 executes a prohibition process according to a program stored in the internal storage unit 12.

【0005】また、特開昭63−286962号公報で
は、このように1つの単語が2行に分割されるという問
題点を改善するため、単語も禁則処理の対象として禁則
処理を行っている。すなわち、出力文字が文節の始めま
たは単語の始めに位置するか否かの判別を行うことによ
り、単語または文節が2行にわたった時に、その単語ま
たは文節をどちらかの行に移動させ、読み易い文字列を
出力する。構成的には、日本語処理において、出力要求
部から出力の要求がくると、まず出力文字が行頭である
か否かが判別され、行頭であれば次に出力文字が句読点
であるか否かが判別される。その結果句読点でなければ
出力文字が文節の始めに位置しているか否かの判別が行
われ、その結果文節の始めでなければ出力文字が単語の
始めであるか否かが判別され、単語の始めでない場合
は、禁則処理が行われる。すなわち前行と次行の2行に
わたる単語あるいは文節を、どちらかの行に移動させて
2行にわたることがないように処理される。これにより
例えば「東京地方」の方の出力要求があった場合、2行
目の行頭から1行目の行末に移動が行われ、読み易い文
字列として出力できる。
In Japanese Patent Application Laid-Open No. 63-286962, in order to improve the problem that one word is divided into two lines, a prohibition process is performed on a word as a target of the prohibition process. That is, by determining whether the output character is located at the beginning of a phrase or at the beginning of a word, when the word or phrase extends over two lines, the word or phrase is moved to either line and read. Outputs a character string that is easy to use. Structurally, in Japanese language processing, when an output request comes from the output request unit, it is first determined whether or not the output character is the beginning of a line, and if it is the beginning of the line, then whether or not the output character is a punctuation mark is determined. Is determined. As a result, if it is not a punctuation mark, it is determined whether or not the output character is located at the beginning of the phrase. If the result is not at the beginning of the phrase, it is determined whether or not the output character is at the beginning of the word. If not, prohibition processing is performed. That is, a word or a phrase extending over two lines, the previous line and the next line, is moved to one of the lines so that the word or phrase does not extend over two lines. Thus, for example, when an output request for “Tokyo region” is made, the movement is performed from the beginning of the second line to the end of the first line, so that a character string that is easy to read can be output.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上述し
たように、禁則処理で設定できる文字は1文字や特定の
記号だけであり、単語単位で設定を行うことができなか
った。そのため、一つの単語が行末・次行頭と分割され
てしまい、文章として読みにくく、また体裁が悪いこと
があった。
However, as described above, only one character or a specific symbol can be set in the prohibition processing, and it cannot be set in word units. As a result, one word is divided into the end of the line and the beginning of the next line, which makes it difficult to read as a sentence and has a bad appearance.

【0007】また、次の問題点として、上記の禁則処理
では、1つの単語が2行に分割されるという問題点は改
善されたが、1行の文字数や文字幅については特に考慮
していないため、禁則処理が行われた行の文字ピッチが
小さくなり過ぎ、逆に読みにくくなる恐れがあることで
ある。
As the next problem, in the above-described prohibition processing, the problem that one word is divided into two lines has been improved, but the number of characters and the character width of one line are not particularly considered. Therefore, the character pitch of the line on which the prohibition processing has been performed becomes too small, and conversely, it may be difficult to read.

【0008】その理由は、禁則処理が行われると、分割
されていた文字が禁則対象行に「追込み」または次の行
に「追込まれる」ため、禁則対象行の文字数が増減す
る。そのため、1行の文字数と文字幅を考慮し、どちら
の処理をするか随時判断しないと、禁則処理が行われた
行の文字ピッチが小さくなり過ぎる場合があるからであ
る。
The reason is that, when the prohibition processing is performed, the divided characters are “added” to the prohibition target line or “added” to the next line, so that the number of characters on the prohibition target line increases or decreases. For this reason, the character pitch of the line on which the prohibition process has been performed may be too small unless the process to be performed is determined as needed in consideration of the number of characters and the character width of one line.

【0009】本発明では、通常の禁則処理は勿論、品詞
による禁則処理を行うことにより、読み易く、体裁の整
った文書を作成することを目的とする。
An object of the present invention is to create a document which is easy to read and is well-formed by performing prohibition processing based on part of speech as well as normal prohibition processing.

【0010】なお、ここで、「品詞」とは、文法上の性
質や働きから単語を分類した呼び名であって、日本語で
はふつう、名詞、代名詞、動詞、形容詞、副詞、連体
詞、接続詞、感動詞、助詞にわける。また、「単語」と
は、一つの言葉、文法で文節または文を構成する単位と
しての個々の語をいい、単一の造語成分からなる単純語
と、造語成分の複合かなる複合語とがある。さらに、
「名詞」とは、品詞の一つで、人や物や事柄の名を表す
言葉をいい、活用のない自立語で、主語になることがで
きる。また「助詞」とは、品詞の一つで、活用のない付
属語で、いろいろな語に付いて、語と語との関係を示し
たり、種々の意味を付け加えたりするものをいう。(以
上、講談社:日本語大辞典) 以下、使用語句は上記意
味で用いる。
[0010] Here, the "part of speech" is a nickname that categorizes words according to their grammatical properties and functions. Divided into verbs and particles. In addition, "word" refers to a single word, an individual word as a unit constituting a phrase or sentence in grammar, and a simple word consisting of a single coined component and a compound word consisting of a combination of coined components is there. further,
"Noun" is one of the parts of speech, which is a word that expresses the name of a person, object, or matter. The "particle" is one of the parts of speech and is an unconventional auxiliary word that refers to various words, indicates the relationship between words, and adds various meanings. (The above is Kodansha: Japanese Dictionary.) Hereinafter, the terms used are used in the above meaning.

【0011】[0011]

【課題を解決するための手段】本発明は、上記問題点の
解決を図り、特定の文字だけでなく単語も分割されるこ
とをなくし、読み易く体裁の整った文書を容易に作成で
きることを目的としている。そのため、本発明による禁
則処理方法及びこれを用いた文書処理装置は、品詞とし
て認識した単語を禁則処理の対象とすることにより、単
語が2行に分割されるという問題点を改善している。ま
た、1行の文字数や文字幅より禁則処理後の文字ピッチ
を算出し、「追込み」と「追い落とし」のどちらの処理
を行うか判断することにより、読み易く体裁の整った文
章作成が可能となる。
SUMMARY OF THE INVENTION It is an object of the present invention to solve the above-mentioned problems, to eliminate the division of words as well as specific characters, and to easily create a readable and well-formed document. And Therefore, the prohibition processing method and the document processing apparatus using the same according to the present invention improve the problem that the word is divided into two lines by subjecting the word recognized as the part of speech to the prohibition processing. Also, by calculating the character pitch after prohibition processing from the number of characters and the character width of one line, and determining whether to perform “add-in” or “drop-out”, it is possible to create an easy-to-read and well-formatted sentence. Become.

【0012】具体的には、本発明による禁則処理方法
は、1行分の文字ピッチの許容範囲が規定化された状態
で文書を複数行分入力し、当該行の行末の語を含む品詞
の1単語を抽出し、当該行に1単語を含めた場合の文字
ピッチを算出し、当該文字ピッチが前記許容範囲内であ
れば、当該文字ピッチで当該行の文書を表示器に表示す
ることを特徴とする。
Specifically, in the prohibition processing method according to the present invention, a plurality of lines of a document are input in a state in which the allowable range of the character pitch for one line is specified, and the part of speech including the word at the end of the line is specified. One word is extracted, the character pitch when one word is included in the line is calculated, and if the character pitch is within the allowable range, the document on the line is displayed on the display at the character pitch. Features.

【0013】また、本発明による禁則処理方法は、1行
分の文字ピッチの許容範囲が規定化された状態で文書を
入力し、当該行末の語と組み合わされる単語を抽出し、
該単語が名詞の場合、次の語が助詞でなければ、当該名
詞で1単語を形成し、該1単語が当該行内に存在する場
合の文字ピッチを算出し、該文字ピッチが前記許容範囲
内であれば、該1単語を当該行に含め、該文字ピッチが
前記許容範囲外であれば、当該1単語を次行に移動する
ことを特徴とする。さらに、1行分の文字ピッチの許容
範囲が規定化された状態で文書を入力し、当該行末の語
と組み合わされる単語を抽出し、該単語が名詞の場合、
次の語が助詞であれば、当該名詞と助詞とで1単語を形
成し、該1単語が当該行内に存在する場合の文字ピッチ
を算出し、該文字ピッチが前記許容範囲内であれば、該
1単語を当該行に含め、該文字ピッチが前記許容範囲外
であれば、当該1単語を次行に移動することを特徴とす
る。さらに、文書処理装置は、この禁則処理方法を用い
ることを特徴とする。
[0013] In addition, the prohibition processing method according to the present invention is to input a document in a state where the allowable range of the character pitch for one line is specified, and extract a word combined with the word at the end of the line.
When the word is a noun, if the next word is not a particle, a word is formed by the noun, and a character pitch when the one word is present in the line is calculated. If so, the one word is included in the line, and if the character pitch is outside the allowable range, the one word is moved to the next line. Further, a document is input in a state where the allowable range of the character pitch for one line is specified, and a word combined with the word at the end of the line is extracted. If the word is a noun,
If the next word is a particle, a word is formed by the noun and the particle, a character pitch is calculated when the one word is present in the line, and if the character pitch is within the allowable range, The one word is included in the line, and if the character pitch is outside the allowable range, the one word is moved to the next line. Further, the document processing apparatus is characterized by using this prohibition processing method.

【0014】[作用]本発明により、1つの単語が2行
に分割されることがなくなり、また、その単語がいずれ
かの行に移行した場合には、その移行された行の文字数
は増えるが、表示又は印字範囲が引っ込んだり、飛び出
したりすることが無く、読み易く、体裁の整った文章を
容易に作成することが可能となる。また、この禁則処理
方法を用いた文書処理装置は、算出された当該行内の文
字ピッチに応じて文書を作成し、表示器やプリンタに見
栄えのする整った文書を提供できる。
[Operation] According to the present invention, one word is not divided into two lines, and when the word is shifted to one of the lines, the number of characters in the shifted line increases. It is possible to easily create a well-read and well-formatted sentence without the display or print range being retracted or jumping out. Further, the document processing apparatus using this prohibition processing method can create a document according to the calculated character pitch in the line, and provide a display and a printer with a good-looking document.

【0015】[0015]

【発明の実施の形態】BEST MODE FOR CARRYING OUT THE INVENTION

[1]構成・動作の説明 本発明の実施形態による基本的な構成は、図6に示すよ
うに、キーボード又はマウス等の入力手段10と、CP
U等の制御部11と、キャッシュメモリ、ROM、RA
M等の内部記憶部12と、液晶表示やCRT等の表示部
13と、ハードディスクやフロッピーディスク、ICカ
ード等の外部記憶部14と、印刷用のレーザプリンタや
感熱式プリンタ等のプリント部15とからなり、従来例
とは特に内部記憶部12に記憶されている禁則処理のプ
ログラムが異なり、制御部11が以下に詳述するプログ
ラムに従って、他の各部を制御する。
[1] Description of Configuration / Operation The basic configuration according to the embodiment of the present invention is as shown in FIG.
U, etc., and a cache memory, ROM, RA
M, an internal storage unit 12 such as a liquid crystal display or a CRT, an external storage unit 14 such as a hard disk, a floppy disk, or an IC card, and a printing unit 15 such as a laser printer for printing or a thermal printer. The program of the prohibition processing stored in the internal storage unit 12 is different from the conventional example, and the control unit 11 controls the other units according to a program described in detail below.

【0016】図1は、本発明の実施例である品詞による
禁則処理方法を示すフローチャートである。図2は、図
1の[禁則処理部]における禁則処理の詳細を示すフロ
ーチャートである。
FIG. 1 is a flowchart showing a part-of-speech prohibition processing method according to an embodiment of the present invention. FIG. 2 is a flowchart showing details of the prohibition processing in the [prohibition processing unit] of FIG.

【0017】まず、文字を入力手段10により入力し、
一行分入力を終えたときから禁則処理が実行される。但
し、S1,S2については事前に実行してもよい。 (a)禁則処理に設定する文字と文字間の文字ピッチの
範囲を決定する。(図1のS1)(この範囲外の場合
は、以下の禁則処理を行わない。) (b)禁則処理の対象行の長さを記憶する。(図1のS
2) (c)行内先頭文字から行内最終文字までの各文字の文
字幅を加算し、記憶する。(図1のS3)また、行内文
字数もカウントし記憶する。(図1のS4) (d)行内最終文字に対して、単語としての区切りを検
索する。(図1のS5) (I)単語の品詞を検索する。(図1のS6) (II)(I)の結果、単語の品詞が名詞の場合のみ、次
の単語の品詞を検索する。(図1のS7) (III)次の単語の品詞が助詞の場合は、“名詞+助
詞”を一つの単語として認識する。(図1のS8) (e)単語が行末・次行頭と分割されている場合は、
[禁則処理部]の処理を行う。(図1のS9)単語が行
末・次行頭と分割されていない場合は、対象行に対し、
禁則処理を行わずに終了する。
First, characters are input by the input means 10,
The prohibition processing is executed from when one line has been input. However, S1 and S2 may be executed in advance. (A) The range of the character pitch between the characters to be set in the prohibition processing and the characters is determined. (S1 in FIG. 1) (If it is out of this range, the following prohibition processing is not performed.) (B) The length of the line subject to the prohibition processing is stored. (S in FIG. 1
2) (c) Add and store the character width of each character from the first character in the line to the last character in the line. (S3 in FIG. 1) The number of characters in the line is also counted and stored. (S4 in FIG. 1) (d) A delimiter as a word is searched for the last character in the line. (S5 in FIG. 1) (I) The part of speech of the word is searched. (S6 in FIG. 1) (II) As a result of (I), only when the part of speech of the word is a noun, the part of speech of the next word is searched. (S7 in FIG. 1) (III) If the part of speech of the next word is a particle, "noun + particle" is recognized as one word. (S8 in FIG. 1) (e) When the word is divided into the end of the line and the beginning of the next line,
The processing of the [prohibition processing section] is performed. (S9 in FIG. 1) If the word is not divided into the end of the line and the beginning of the next line,
The processing ends without performing the prohibition processing.

【0018】次に、[禁則処理部]のフローチャートに
ついて説明する。 (f)以下の情報を記憶する。(図2のS11) (I)対象行に存在する単語の文字幅と文字数を記憶す
る。 (II)次に、対象行の次の行に残っている単語の文字幅
と文字数を記憶する。 (III)また、単語の先頭文字と単語の最終文字を記憶
する。 (g)行内最終文字が含まれている単語を対象行に入れ
た場合の文字ピッチを算出するため、以下の計算を行
う。(図2のS12) ((b)で記憶した対象行の長さ)−((c)で記憶し
た対象行の行内先頭文字から行内最終文字までの文字幅
+(f)(II)で記憶した次行に残っている単語の文字
幅) (h)(g)での計算結果に対し、以下の計算を行う。
(図2のS12) ((g)での計算結果)÷{((c)で記憶した行内文
字数+(f)で記憶した対象行の次の行に残っている単
語の文字数)−1} (g)での計算結果が(b)で決定した文字ピッチの範
囲内かチェックする。(図2のS13) 範囲内の場合、行内先頭文字から(e)で記憶した単語
の最終文字までの文字を、行内に均等に割り付けるた
め、文字ピッチを設定する。(図2のS16) 範囲外の場合、対象行から行内最終文字が含まれている
単語を除いた場合の文字ピッチを算出するため、以下の
計算を行う。(図2のS14) (I)((b)で記憶した対象行の長さ)−{((c)
で記憶した行内先頭文字から行内最終文字までの文字
幅)−((f)で記憶した対象行に存在する単語の文字
幅)} (II)(I)での計算結果に対し、以下の計算を行う。
(図2のS14) ((f)での計算結果)÷{((c)で記憶した対象行
内の文字数−(f)で記憶した対象行に残っている単語
の文字数)−1} (III)(II)での計算結果が(b)で決定した文字ピ
ッチの範囲内かチェックする。(図2のS15) 範囲内の場合は、行内先頭文字から単語の先頭文字の前
の文字までを、行内に均等に割り付けるため、文字ピッ
チを設定する。(図2のS16) 範囲外の場合は、対象行に対し、禁則処理を行わずに終
了する。 (i)文字ピッチの変更を行った行の再表示を行う。
(図1のS10) 本発明は、図2の禁則処理において必要となる値を記憶
する前処理部(S1〜S4)、行末の単語を品詞により
認識する検索部(S5〜S8)、実際の禁則処理を行
い、画面に表示する禁則処理部(S9〜S10)から構
成される。
Next, the flowchart of the [prohibition processing section] will be described. (F) The following information is stored. (S11 in FIG. 2) (I) The character width and the number of characters of the word existing in the target line are stored. (II) Next, the character width and the number of characters of the word remaining on the line following the target line are stored. (III) The first character of the word and the last character of the word are stored. (G) The following calculation is performed to calculate the character pitch when a word including the last character in the line is included in the target line. (S12 in FIG. 2) (Length of target line stored in (b))-(Character width from first character in line to last character in line of target line stored in (c) + stored as (f) (II)) The following calculation is performed on the calculation results in (h) and (g).
(S12 in FIG. 2) (Calculation result in (g)) {(number of characters in line stored in (c) + number of characters of word remaining in target line next to target line stored in (f))-1} It is checked whether the calculation result in (g) is within the range of the character pitch determined in (b). (S13 in FIG. 2) In the case of the range, the character pitch is set in order to equally allocate the characters from the first character in the line to the last character of the word stored in (e) in the line. (S16 in FIG. 2) In the case of being out of the range, the following calculation is performed to calculate the character pitch when the word including the last character in the line is excluded from the target line. (S14 in FIG. 2) (I) (length of target row stored in (b)) − {((c)
(Character width from the first character in the line to the last character in the line stored in)-(Character width of the word existing in the target line stored in (f))} (II) The following calculation is performed on the calculation result in (I). I do.
(S14 in FIG. 2) (Result of calculation in (f)) {(number of characters in target line stored in (c) −number of characters in word remaining in target line stored in (f)) − 1} (III ) Check whether the calculation result in (II) is within the range of the character pitch determined in (b). (S15 in FIG. 2) In the case of the range, the character pitch is set in order to equally allocate the characters from the first character in the line to the character before the first character of the word in the line. (S16 in FIG. 2) When the value is out of the range, the process ends without performing the prohibition process on the target line. (I) Redisplay the line where the character pitch has been changed.
(S10 in FIG. 1) The present invention provides a pre-processing unit (S1 to S4) for storing values required in the prohibition processing in FIG. It is composed of a prohibition processing section (S9-S10) that performs prohibition processing and displays it on the screen.

【0019】[2]機能の説明 前処理部(S1〜S4)では、禁則処理時に設定する文
字ピッチの範囲を決定し(S1)、禁則処理対象行の文
字表示巾の長さ(S2)、行内先頭文字から行内最終文
字までの各文字幅の合計(S3)、行内文字数(S4)
を記憶する。
[2] Description of Function In the pre-processing unit (S1 to S4), the range of the character pitch to be set at the time of the prohibition processing is determined (S1), and the length of the character display width of the prohibition processing target line (S2); Total of each character width from the first character in the line to the last character in the line (S3), the number of characters in the line (S4)
Is stored.

【0020】検索部(S5〜S8)では、行内最終文字
が含まれている単語の区切り(S5)とその品詞(S
6)を検索する。最終文字の品詞が名詞の場合、次の品
詞を検索(S7)し、その品詞が助詞の場合は、「名詞
+助詞」を単語として認識する(S8)。
In the search section (S5 to S8), the delimiter (S5) of the word containing the last character in the line and the part of speech (S5)
6) Search. If the last part of speech is a noun, the next part of speech is searched (S7). If the last part of speech is a particle, "noun + particle" is recognized as a word (S8).

【0021】禁則処理部(S9〜S10)では、単語が
行末・次行頭とに分割されているか判断する(S9)。
単語が行頭・行末に分割されている場合は、図2の禁則
処理を行い、文字ピッチを修正し表示する(S10)。
分割されてない場合は、終了する。
The prohibition processing section (S9 to S10) determines whether the word is divided into the end of the line and the beginning of the next line (S9).
If the word is divided at the beginning and end of the line, the prohibition process shown in FIG. 2 is performed to correct and display the character pitch (S10).
If not, the process ends.

【0022】次に、図2において禁則処理部の禁則処理
の機能について説明する。
Next, the function of the prohibition processing of the prohibition processing section will be described with reference to FIG.

【0023】S11では、対象行および対象行の次の行
に存在する単語の文字数、文字幅、単語の先頭文字と最
終文字を記憶する。
At S11, the number of characters, the character width, the first character and the last character of the word existing in the target line and the line following the target line are stored.

【0024】S12では、対象行内最終文字が含まれて
いる単語を対象行に入れた場合の文字ピッチを算出す
る。S13において算出した文字ピッチがS1で決定し
た文字ピッチの範囲内であるか否かのチェックを行う。
文字ピッチが範囲内であれば、S16に移行し、対象行
内の先頭文字からS5で記憶した単語の最終文字までの
文字を対象行内に均等に割り付けるように、文字ピッチ
を変更する。
In S12, a character pitch is calculated when a word including the last character in the target line is put in the target line. It is checked whether the character pitch calculated in S13 is within the range of the character pitch determined in S1.
If the character pitch is within the range, the process proceeds to S16, and the character pitch is changed so that characters from the first character in the target line to the last character of the word stored in S5 are evenly allocated in the target line.

【0025】S13により文字ピッチが範囲外の場合
は、S14により対象行から対象行内の最終文字が含ま
れている単語を除いた場合の文字ピッチを算出し、S1
5にてS1で決定した文字ピッチの範囲内かチェックを
行う。算出した文字ピッチが、範囲内の場合、S16に
移行し、対象行内の先頭文字から最終文字である単語の
先頭の前の文字までを行内に均等に割り付けるため、文
字ピッチを変更する。次に、S10に移行し、当該最終
文字が含まれている単語を対象行の次の行に移動して再
表示を行う。
If the character pitch is out of the range in S13, the character pitch in the case where the word including the last character in the target line is excluded from the target line is calculated in S14.
At 5, it is checked whether the character pitch is within the range of the character pitch determined at S1. If the calculated character pitch is within the range, the process shifts to S16, and the character pitch is changed in order to equally allocate the characters from the first character in the target line to the character before the head of the word which is the last character in the line. Next, the process proceeds to S10, in which the word including the final character is moved to the line next to the target line and redisplayed.

【0026】[3]動作の説明 次に図5を用いて、本実施形態の実際の動作例について
説明する。
[3] Description of Operation Next, an actual operation example of the present embodiment will be described with reference to FIG.

【0027】S17は、禁則処理実施前の画面表示であ
り、3行以上に亘って文字入力している例を示してい
る。図1のS5,S6により、1行目の行末文字「特」
が含まれている単語の区切りと品詞を検索する。検索さ
れた単語「特売」の品詞は、名詞であるため、S7によ
り次の単語「価格」の品詞を検索する。検索結果が名詞
であり助詞以外であるため、禁則処理部に処理が移行す
る。図2のS12により、行内最終文字が含まれている
単語「特売」を1行目に入れた場合の文字ピッチを図3
の計算方法、 {(対象行の長さ)−(対象行の行内先頭文字から行内
最終文字までの文字幅の合計+次行に残っている単語の
文字幅)}÷{(対象行内の文字数)+(対象行の次の
行に残っている単語の文字数)−1} により算出し、S13にて文字ピッチの範囲内かどうか
のチェックを行う。文字ピッチが図1のS1で設定した
範囲内であるので、S16にて文字ピッチの変更を行い
1行目に均等に割り付け、S10にて再表示する。この
時、S18が画面表示される。
S17 is a screen display before the prohibition processing is performed, and shows an example in which characters are input over three or more lines. According to S5 and S6 in FIG.
Search for word breaks and parts of speech that contain. Since the part of speech of the searched word "sale" is a noun, the part of speech of the next word "price" is searched in S7. Since the search result is a noun and not a particle, the process proceeds to the prohibition processing unit. By S12 in FIG. 2, the character pitch when the word "special sale" including the last character in the line is put in the first line is shown in FIG.
計算 (Length of target line)-(Total character width from the first character in the target line to the last character in the line + Character width of the word remaining in the next line) 数 (Number of characters in the target line) ) + (The number of characters of the word remaining in the line next to the target line) -1}, and it is checked in S13 whether or not the character pitch is within the range. Since the character pitch is within the range set in S1 of FIG. 1, the character pitch is changed in S16, and the characters are evenly allocated to the first line, and displayed again in S10. At this time, S18 is displayed on the screen.

【0028】次に、1行目の禁則処理結果であるS18
の2行目に対し処理を行う。まず、S5において2行目
の行末の最終文字「煩」が含まれている単語の区切りと
品詞を検索する。S6により検索された単語「煩わし
さ」は名詞であるので、S7により品詞の次の文字
「を」が助詞であり、S8により「煩わしさを」を一つ
の単語として認識する。S9により行末の単語「煩わし
さを」が次行頭とで分割されているので、禁則処理部に
処理が移行する。S12により、2行目の最終文字が含
まれている単語「煩わしさを」を2行目入れた場合の文
字ピッチを図3の計算方法より算出し、S13にて文字
ピッチの範囲内かどうかチェックを行う。文字ピッチが
小さすぎて範囲外であるため、S14により2行目から
「煩わしさを」を除いた文字ピッチを図4の計算方法、 [(対象行の長さ)−{(対象行内の先頭文字から最終
文字までの文字幅の合計)−(対象行に存在する単語の
文字幅)}]÷{(対象行内の文字数)−(対象行に残
っている単語の文字数)−1} により算出し、S15にて文字ピッチが範囲内かどうか
チェックする。算出した文字ピッチはS1の設定範囲内
であるので、S16,S10にて「価格〜変更時の」ま
でを2行目に均等に割り付けると、S19のように画面
に表示される。
Next, S18, which is the result of the prohibition processing on the first line
The processing is performed on the second line. First, in step S5, a search is made for the delimiters and the parts of speech of the words that include the final character "an" at the end of the second line. Since the word "annoyance" searched in S6 is a noun, the character "o" next to the part of speech is recognized as a particle in S7, and "annoyance" is recognized as one word in S8. Since the word "annoyance" at the end of the line is divided at the beginning of the next line by S9, the processing shifts to the prohibition processing unit. In S12, the character pitch when the word "annoyance" including the last character in the second line is inserted in the second line is calculated by the calculation method of FIG. 3, and in S13, whether the character pitch is within the range of the character pitch is determined. Perform a check. Since the character pitch is too small and out of the range, the character pitch obtained by removing “annoyance” from the second line in S14 is calculated by the calculation method of FIG. 4, [((length of target line) − {(head of target line) Calculated as (total character width from character to last character)-(character width of word existing in target line) {] {(number of characters in target line)-(number of characters of word remaining in target line) -1} Then, it is checked in S15 whether the character pitch is within the range. Since the calculated character pitch is within the setting range of S1, if “Price to change” is equally allocated to the second line in S16 and S10, it is displayed on the screen as in S19.

【0029】次に、2行目を禁則処理した結果であるS
19の3行目に対し処理を行う。S5により、行末文字
“乱”が含まれている単語の区切りと品詞を検索する。
検索された単語「混乱」は名詞であるため、S7により
次の単語「が」の品詞を検索する。「が」は助詞である
ため、S8より「混乱が」を一つの単語として認識す
る。S12により、3行目の最終文字が含まれている単
語「混乱が」を3行目入れた場合の文字ピッチを図3の
計算方法より算出し、S13にて文字ピッチの範囲内か
どうかチェックを行う。文字ピッチが範囲内であるた
め、S16,S10にて「煩わしさ〜混乱が」までを3
行目に均等に割り付けると、S20のように画面表示さ
れる。
Next, S which is the result of performing the prohibition processing on the second line
Processing is performed on the third line of the nineteenth line. In step S5, a search is made for the delimiter and the part of speech of the word containing the end-of-line character "ran".
Since the searched word "confused" is a noun, the part of speech of the next word "ga" is searched in S7. Since "ga" is a particle, "confused" is recognized as one word from S8. In S12, the character pitch when the word “confused” including the last character in the third line is inserted in the third line is calculated by the calculation method of FIG. 3, and it is checked in S13 whether the word is within the range of the character pitch. I do. Since the character pitch is within the range, in S16 and S10, “the annoyance to confusion” is reduced by 3
If the lines are evenly allocated, the screen is displayed as in S20.

【0030】上記実施形態で、具体例として図5に示す
3行以上の文字入力について本発明の禁則処理を説明し
たが、1行目に続いて名詞又は助詞の複数文字を入力し
た段階で禁則処理を行ってもよく、リアルタイムに禁則
処理してもよい。
In the above embodiment, as a specific example, the prohibition processing of the present invention has been described for the character input of three or more lines shown in FIG. 5, but the prohibition processing is performed when a plurality of characters of nouns or particles are input following the first line. Processing may be performed, or prohibition processing may be performed in real time.

【0031】また、上記実施形態では、品詞のうち特に
名詞について説明したが、これは他の相当する単語であ
ってもよく、上記実施形態に限られるものではない。
Further, in the above-described embodiment, particularly the noun in the part of speech was described, but this may be another corresponding word, and is not limited to the above-described embodiment.

【0032】また、従来の禁則処理対象であ
る「。、()」等の句読点が行末の語を含む単語と混在
する場合には、当該単語と句読点とで1単語を形成し
て、文字ピッチを算出し、この文字ピッチが当初規定し
た文字ピッチの許容範囲内にあるか否かを判断してもよ
く、本発明の技術範囲内にあれば、この点を問わない。
When punctuation marks such as "., ()" Which are the subject of the conventional prohibition processing are mixed with a word including a word at the end of a line, the word and the punctuation mark form one word, and the character pitch is changed. May be calculated to determine whether or not this character pitch is within the allowable range of the character pitch initially defined. This is not a problem as long as it is within the technical scope of the present invention.

【0033】[0033]

【発明の効果】第1の効果は、単語が2行に分割されて
読みにくいということがなくなる。
The first effect is that the word is not divided into two lines and is difficult to read.

【0034】その理由は、句読点やかっこだけではな
く、単語も禁則処理の対象としているからである。
The reason is that not only punctuation marks and parentheses but also words are subject to prohibition processing.

【0035】第2の効果は、体裁の整った文書を容易に
作成することができる。
The second effect is that a well-formed document can be easily created.

【0036】その理由は、1行の文字数や文字幅より禁
則処理後の文字ピッチを算出し、「追込み」か「追い落
とし」のどちらの処理を行うかを判断することにより、
禁則処理が行われた行の文字ピッチが小さくなり過ぎ、
読みにくいということがなくなるからである。また、禁
則処理を行い文字数が増えた行の文字を均等に割り付け
る処理も同時に行っているため、体裁の整った読み易い
文書の作成が容易となる。
The reason is that the character pitch after the prohibition processing is calculated from the number of characters and the character width of one line, and it is determined whether to perform “add-in” or “drop-out”.
The character pitch of the line where the prohibition processing was performed is too small,
This is because it is no longer difficult to read. In addition, since the process of performing the prohibition process and equally allocating the characters in the line where the number of characters has increased is also performed at the same time, it is easy to create a well-formatted and readable document.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による実施例を示すフローチャートであ
る。
FIG. 1 is a flowchart showing an embodiment according to the present invention.

【図2】本発明による禁則処理の詳細フローチャートで
ある。
FIG. 2 is a detailed flowchart of a prohibition process according to the present invention.

【図3】本発明による図2のS12における文字ピッチ
算出方法である。
FIG. 3 shows a character pitch calculation method in S12 of FIG. 2 according to the present invention.

【図4】本発明による図2のS14における文字ピッチ
算出方法である。
FIG. 4 is a method of calculating a character pitch in S14 of FIG. 2 according to the present invention.

【図5】本発明による画面表示状態を示す図である。FIG. 5 is a diagram showing a screen display state according to the present invention.

【図6】本発明及び従来例による禁則処理方法を達成す
る構成図である。
FIG. 6 is a configuration diagram for achieving a prohibition processing method according to the present invention and a conventional example.

【符号の説明】[Explanation of symbols]

10 入力手段 11 制御部 12 内部記憶装置 13 表示器 14 外部記憶装置 15 プリンタ DESCRIPTION OF SYMBOLS 10 Input means 11 Control part 12 Internal storage device 13 Display 14 External storage device 15 Printer

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 1行分の文字ピッチの許容範囲が規定化
された状態で文書を複数行分入力し、当該行の行末の語
を含む品詞の1単語を抽出し、当該行に1単語を含めた
場合の文字ピッチを算出し、当該文字ピッチが前記許容
範囲内であれば、当該文字ピッチで当該行の文書を表示
器に表示することを特徴とする禁則処理方法。
1. A document is input for a plurality of lines in a state where the allowable range of the character pitch for one line is specified, and one word of the part of speech including the word at the end of the line is extracted, and one word for the line is extracted. Is calculated, and if the character pitch is within the allowable range, the document of the line is displayed at the character pitch on the display device.
【請求項2】 1行分の文字ピッチの許容範囲が規定化
された状態で文書を入力し、当該行末の語と組み合わさ
れる単語を抽出し、該単語が名詞の場合、次の語が助詞
でなければ、当該名詞で1単語を形成し、該1単語が当
該行内に存在する場合の文字ピッチを算出し、該文字ピ
ッチが前記許容範囲内であれば、該1単語を当該行に含
め、該文字ピッチが前記許容範囲外であれば、当該1単
語を次行に移動することを特徴とする禁則処理方法。
2. A document is input in a state where the allowable range of the character pitch for one line is specified, a word combined with the word at the end of the line is extracted, and when the word is a noun, the next word is a particle. If not, one word is formed by the noun, and the character pitch when the one word exists in the line is calculated. If the character pitch is within the allowable range, the one word is included in the line. If the character pitch is outside the allowable range, the one word is moved to the next line.
【請求項3】 1行分の文字ピッチの許容範囲が規定化
された状態で文書を入力し、当該行末の語と組み合わさ
れる単語を抽出し、該単語が名詞の場合、次の語が助詞
であれば、当該名詞と助詞とで1単語を形成し、該1単
語が当該行内に存在する場合の文字ピッチを算出し、該
文字ピッチが前記許容範囲内であれば、該1単語を当該
行に含め、該文字ピッチが前記許容範囲外であれば、当
該1単語を次行に移動することを特徴とする禁則処理方
法。
3. A document is input in a state where the allowable range of the character pitch for one line is specified, a word combined with the word at the end of the line is extracted, and when the word is a noun, the next word is a particle. If so, one word is formed by the noun and the particle, and the character pitch in the case where the one word exists in the line is calculated. If the character pitch is outside the allowable range, the one word is moved to the next line.
【請求項4】 請求項1又は2、3に記載の禁則処理方
法において、前記文書は日本語であることを特徴とする
禁則処理方法。
4. The prohibition processing method according to claim 1, wherein said document is in Japanese.
【請求項5】 請求項3に記載の禁則処理方法におい
て、前記文字ピッチが前記許容範囲外であれば、当該1
単語を次行に移動するステップの後、前記当該行の文字
ピッチを算出し、算出された文字ピッチで当該行の前記
文書を表示器に表示することを特徴とする禁則処理方
法。
5. The prohibition processing method according to claim 3, wherein if the character pitch is out of the permissible range,
After the step of moving a word to the next line, a character pitch of the line is calculated, and the document of the line is displayed on the display at the calculated character pitch.
【請求項6】 請求項1又は5に記載の禁則処理方法に
おいて、前記表示器に表示した文書をプリンタにより印
刷することを特徴とする禁則処理方法。
6. The prohibition processing method according to claim 1, wherein the document displayed on the display is printed by a printer.
【請求項7】 請求項1乃至6のいずれか1項に記載の
禁則処理方法を用いたことを特徴とする文書処理装置。
7. A document processing apparatus using the prohibition processing method according to claim 1. Description:
JP8153641A 1996-06-14 1996-06-14 Japanese hyphenation processing method and document processor Pending JPH103469A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8153641A JPH103469A (en) 1996-06-14 1996-06-14 Japanese hyphenation processing method and document processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8153641A JPH103469A (en) 1996-06-14 1996-06-14 Japanese hyphenation processing method and document processor

Publications (1)

Publication Number Publication Date
JPH103469A true JPH103469A (en) 1998-01-06

Family

ID=15566969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8153641A Pending JPH103469A (en) 1996-06-14 1996-06-14 Japanese hyphenation processing method and document processor

Country Status (1)

Country Link
JP (1) JPH103469A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002502066A (en) * 1998-02-02 2002-01-22 シー. ウォーカー、ランダル Text processor
JP2017117149A (en) * 2015-12-24 2017-06-29 シナノケンシ株式会社 Electronic book display device
JP2020016781A (en) * 2018-07-26 2020-01-30 京セラドキュメントソリューションズ株式会社 Display processing apparatus

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01128159A (en) * 1987-11-13 1989-05-19 Nippon Telegr & Teleph Corp <Ntt> Japanese word document producer
JPH04205250A (en) * 1990-11-30 1992-07-27 Toshiba Corp Document preparing device
JPH05135025A (en) * 1991-11-14 1993-06-01 Matsushita Electric Ind Co Ltd Document editor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01128159A (en) * 1987-11-13 1989-05-19 Nippon Telegr & Teleph Corp <Ntt> Japanese word document producer
JPH04205250A (en) * 1990-11-30 1992-07-27 Toshiba Corp Document preparing device
JPH05135025A (en) * 1991-11-14 1993-06-01 Matsushita Electric Ind Co Ltd Document editor

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002502066A (en) * 1998-02-02 2002-01-22 シー. ウォーカー、ランダル Text processor
JP4790119B2 (en) * 1998-02-02 2011-10-12 シー. ウォーカー、ランダル Text processor
JP2017117149A (en) * 2015-12-24 2017-06-29 シナノケンシ株式会社 Electronic book display device
JP2020016781A (en) * 2018-07-26 2020-01-30 京セラドキュメントソリューションズ株式会社 Display processing apparatus

Similar Documents

Publication Publication Date Title
EP0953192B1 (en) Natural language parser with dictionary-based part-of-speech probabilities
US9400786B2 (en) Computer-implemented method, computer software and apparatus for use in a translation system
US5708822A (en) Methods and apparatus for thematic parsing of discourse
EP0907924B1 (en) Identification of words in japanese text by a computer system
US5257186A (en) Digital computing apparatus for preparing document text
US4674065A (en) System for detecting and correcting contextual errors in a text processing system
EP0361464A2 (en) Method and apparatus for producing an abstract of a document
JPH06195373A (en) Machine translation system
JPH04229364A (en) Method and system for changing emphasizing characteristic
US6754875B1 (en) Applying a computer-implemented test to determine whether to replace adjacent characters in a word with a ligature glyph
EP0093249A2 (en) System for detecting and correcting contextual errors in a text processing system
JPH103469A (en) Japanese hyphenation processing method and document processor
Phan et al. A more perfect unification
Emery Compound words in modern standard Arabic
JPH04167049A (en) Document processor
JP3408830B2 (en) Japanese sentence parser
JPS61141078A (en) Electronic french word dictionary
JPH0581247A (en) Method for shaping document
Mustafa PHONOLOGY OF ACEHNESE REDUPLICATION: APPLYING OPTIMALITY THEORY
JPH0227473A (en) Document improvement supporting means
JP3477739B2 (en) Document processing device
JP3061855B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JPH0157829B2 (en)
JP4071657B2 (en) Text processing device
JP3386520B2 (en) Kana-kanji conversion apparatus and method