JPH0540750A - Automatic word punctuation inserting circuit - Google Patents

Automatic word punctuation inserting circuit

Info

Publication number
JPH0540750A
JPH0540750A JP3196520A JP19652091A JPH0540750A JP H0540750 A JPH0540750 A JP H0540750A JP 3196520 A JP3196520 A JP 3196520A JP 19652091 A JP19652091 A JP 19652091A JP H0540750 A JPH0540750 A JP H0540750A
Authority
JP
Japan
Prior art keywords
delimiter
word
term
katakana
foreign language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3196520A
Other languages
Japanese (ja)
Inventor
Matsutaka Ito
松孝 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3196520A priority Critical patent/JPH0540750A/en
Publication of JPH0540750A publication Critical patent/JPH0540750A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To automatically detect the punctuation of words inputted and to automatically insert punctuation code according to kinds of words. CONSTITUTION:A punctuation detecting part 3 decides whether the converted word string is KATAKANA(Japanese syllabary) or not, and by referring to the words stored in a KATAKANA dictionary 4, detects delimiting positions of the KATAKANA words. in response to this detecting result, an intermediate point generating part 7 generates the signal for generating an intermediate point, and an inserting/synthesizing part 9 inserts the intermediate point between words. When words are of foreign language, a space generating part 8 generates the signal for generating a space and the inserting/synthesizing part 9 inserts a space between words.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文書処理装置に適用し
て好適な、入力された単語の間の区切りを自動的に検出
して、単語を自動的に区切ることができる自動単語区切
り挿入回路に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is suitable for application to a document processing apparatus and automatically detects a break between input words to automatically break the words. It is about circuits.

【0002】[0002]

【従来の技術】従来、文書処理装置においては、文書処
理装置に入力された単語(平仮名・カタカナ・漢字・ロ
ーマ字を問わない)をそのまま登録処理して、そのま
ま、漢字等の指示された文字の種類に変換して、表示し
ていた。このため、長い単語の場合には、即座に単語の
意味を理解しずらい点があった。例えば、以下の例にて
説明する。
2. Description of the Related Art Conventionally, in a document processing device, a word (whether hiragana, katakana, kanji, or romaji) input to the document processing device is registered as it is, and a kanji or other designated character is directly registered. It was converted to the type and displayed. Therefore, in the case of a long word, it is difficult to immediately understand the meaning of the word. For example, the following example will be described.

【0003】例1:平仮名の入力単語が「じょうほうし
すてむ」であって、指示された変換後の単語が、「情報
システム」。
Example 1: The input word of hiragana is "johoshisutemu", and the designated word after conversion is "information system".

【0004】例2:平仮名の入力単語が「えこのみっく
あにまる」であって、指示された変換後の単語が、「エ
コノミックアニマル」。
Example 2: The input word of Hiragana is "Economic Mikunimaru", and the designated converted word is "economic animal".

【0005】例3:平仮名の入力単語が「わーるどかっ
ぷさっかー」であって、指示された変換後の単語が、
「WORLDCUPSOCCER」。
Example 3: The input word of the hiragana is "World Cup Sukka", and the designated converted word is
"WORLDUP SOCCER".

【0006】尚、上記の例では、「情報」、「システ
ム」、「エコノミック」、「アニマル」、「WORL
D」、「CUP」、「SOCCER」はいずれも、文書
処理装置内の辞書に含まれた単語であると仮定する。
In the above example, "information", "system", "economic", "animal", "WORL"
It is assumed that all of "D", "CUP", and "SOCCER" are words included in the dictionary in the document processing device.

【0007】上記の例では、例1の変換結果は、容易に
判読可能である。しかし、例2の場合はやや判読が困難
であり、「エコノミック・アニマル」と、単語の間に
「・」を挿入して表記すらのが望ましい。更に、例3の
場合には、「WORLD CUP SOCCER」と単
語の間に、スペースを挿入して表記すらのが望ましい。
ところが、こうした単語間の区切りを自動的に検出する
ような文書処理装置は従来提案されてはいなかった。
In the above example, the conversion result of Example 1 is easily readable. However, in the case of Example 2, it is somewhat difficult to read, and it is desirable to insert "." Between the words "economic animal" and the word. Further, in the case of Example 3, it is desirable to insert a space between the word “WORLD CUP SOCCER” and the word.
However, no document processing device that automatically detects such a break between words has been proposed.

【0008】[0008]

【発明が解決しようとする課題】以上のように、従来、
入力された単語の間の、単語の区切りを自動的に検出
し、検出された区切りの箇所に、その区切りを表す文字
や記号を自動的に挿入する回路は存在しなかったので、
そのような回路を持たない文書処理装置を利用している
場合においては、単語が特に長い場合には、その文書処
理装置が出力した表示の判読が困難であるという欠点が
あった。
As described above, as described above,
Since there is no circuit that automatically detects word breaks between input words and automatically inserts characters or symbols that represent the breaks at the detected breaks,
In the case of using a document processing device without such a circuit, there is a drawback that it is difficult to read the display output by the document processing device when the word is particularly long.

【0009】[0009]

【課題を解決するための手段】本発明は、上記課題の解
決を目的としてなされたもので、請求項1記載の発明で
は、単語を入力する入力手段と、前期入力手段に応答
し、入力された単語を所定の文字形式に変換する変換手
段と、所定の文字形式にて単語を記憶している辞書手段
と、前期変換手段に応答し、前期辞書手段の単語を参照
して、前期変換された単語の間の区切りを検出する検出
手段と、前期区切り検出手段に応答し、区切り記号を発
生する区切り発生手段と、前期変換手段、前期区切り検
出手段及び前期区切り発生手段に応答して、前期変換さ
れた単語に前期検出された区切りを挿入する挿入手段と
から構成される自動単語区切り挿入回路である。
SUMMARY OF THE INVENTION The present invention has been made for the purpose of solving the above problems. According to the invention of claim 1, a word is input in response to the input means and the previous term input means. Conversion means for converting the word into a predetermined character format, dictionary means for storing the word in a predetermined character format, and previous conversion means in response to the previous conversion means, referring to the word in the previous conversion dictionary, Detecting means for detecting a delimiter between the words, the delimiter generating means for generating a delimiter in response to the preceding term delimiter detecting means, and the preceding term conversion means, the preceding term delimiter detecting means and the preceding term delimiter generating means for responding to the term It is an automatic word break insertion circuit composed of inserting means for inserting a break detected in the previous period into a converted word.

【0010】請求項2記載の本発明では、単語を入力す
る入力手段と、前期入力手段に応答し、入力された単語
をカタカナ文字及び外国語に変換する変換手段と、カタ
カナ文字の文字形式にて単語を記憶しているカタカナ辞
書手段と、外国語文字の文字形式にて単語を記憶してい
る外国語辞書手段と、前期変換手段に応答し、前期カタ
カナ辞書手段に記憶されているカタカナ文字を参照し
て、前期変換されたカタカナ文字の間の区切りを検出す
る第1の検出手段と、前期変換手段に応答し、前期外国
語辞書手段に記憶されている外国語文字を参照して、前
期変換された外国語文字の間の区切りを検出する第2の
検出手段と、前期カタカナ文字の第1の区切り検出手段
に応答し、第1の区切り記号を発生する第1の区切り発
生手段と、前期外国語文字の第2の区切り検出手段に応
答し、第2の区切り記号を発生する第2の区切り発生手
段と、前期変換手段、前期第1の区切り検出手段、及び
前期第1の区切り発生手段に応答して、前期変換された
カタカナ文字に前期検出された第1の区切りを挿入する
第1の挿入手段と、前期変換手段、前期第2の区切り検
出手段、及び前期第2の区切り発生手段に応答して、前
期変換された外国語文字に前期検出された第2の区切り
を挿入する第2の挿入手段とから構成される自動単語区
切り挿入回路である。
According to the second aspect of the present invention, an input means for inputting a word, a converting means for responding to the input means for the previous term to convert the input word into katakana characters and a foreign language, and a character format of katakana characters are provided. Katakana character dictionary stored in the first term Katakana dictionary means in response to the first term conversion means and the foreign language dictionary means that stores words in the character format of the foreign language character Referring to the foreign language characters stored in the previous term foreign language dictionary means in response to the first detecting means for detecting a delimiter between the katakana characters converted in the previous term and the previous term conversion means, Second detecting means for detecting a delimiter between the foreign characters converted in the previous period, and first delimiter generating means for generating the first delimiter in response to the first delimiter detecting means for the katakana character in the previous period. , First half foreign countries Responsive to the second delimiter generating means for generating a second delimiter in response to the second character delimiter detecting means, the first term converting means, the first term delimiter detecting means, and the first term delimiter generating means. And then responds to the first inserting means for inserting the first delimiter detected in the previous term into the katakana character converted in the previous term, the first converting means, the second delimiter detecting means, and the second delimiter generating means. Then, the automatic word segment insertion circuit is composed of the second segment inserting unit for inserting the second segment detected in the previous period into the foreign language character converted in the previous period.

【0011】[0011]

【作用】上記の構成により、本発明の自動単語区切り挿
入回路では、入力手段にて入力された全ての単語の文字
列の区切りを自動的に検出し、単語の種類(カタカナ・
外国語)に応じて、適当な区切り記号を自動的に挿入す
る。
With the above construction, the automatic word break insertion circuit of the present invention automatically detects the breaks in the character strings of all the words input by the input means, and detects the word type (katakana
The appropriate delimiter is automatically inserted according to the foreign language).

【0012】本発明の文書処理装置においては、入力手
段によって入力され、所定のカタカナや外国語への変換
手段によって変換された、単語の文字列の種類が順次検
査される。
In the document processing apparatus of the present invention, the type of the character string of the word input by the input means and converted by the predetermined katakana or the conversion means into a foreign language is sequentially inspected.

【0013】区切り検出部は、変換された単語の文字列
がカタカナであるかどうかを判断する。変換された単語
の文字列がカタカナであれば、後続の単語もカタカナで
あるかどうかを判断する。
The delimiter detection unit determines whether the character string of the converted word is katakana. If the character string of the converted word is katakana, it is determined whether the following word is also katakana.

【0014】後続の単語もカタカナであれば、区切り検
出部は、カタカナ辞書に記憶されている単語を参照する
ことで、カタカナの単語の区切りを検出する。その検出
に応じて、中点発生部は中点「・」を発生する信号を発
生する。
If the succeeding word is also katakana, the delimiter detection unit detects the delimiter of the katakana word by referring to the word stored in the katakana dictionary. In response to the detection, the midpoint generating section generates a signal for generating the midpoint ".".

【0015】中点発生部からの信号に応じて、合成部
は、2単語の文字列の間に中点「・」を挿入することに
なる。
In response to the signal from the midpoint generator, the synthesizer inserts the midpoint "." Between the character strings of two words.

【0016】区切り検出部は、変換された単語の文字列
が外国語であるかどうかを判断する。変換された単語の
文字列が外国語であれば、後続の単語も外国語であるか
どうか判断する。
The delimiter detection unit determines whether the character string of the converted word is a foreign language. If the character string of the converted word is a foreign language, it is determined whether the following word is also a foreign language.

【0017】後続の単語が外国語であれば、区切り検出
部は、外国語辞書に記憶されている単語を参照すること
で、外国語の単語の区切りを検出する。その検出に応じ
て、スペース発生部はスペースを発生する信号を発生す
る。
If the subsequent word is a foreign language, the delimiter detection unit detects the delimiter of the foreign language word by referring to the word stored in the foreign language dictionary. In response to the detection, the space generation unit generates a signal for generating a space.

【0018】スペース発生部からの信号に応じて、合成
部は、2単語の文字列の間にスペースを挿入することに
なる。
In response to the signal from the space generator, the synthesizer inserts a space between character strings of two words.

【0019】この動作は単語の数が終了するまで続行さ
れ、次の単語があれば、上記の動作を繰り返して、最終
的に、全ての単語の区切りを自動的に検出し、必要な区
切り記号を自動的に挿入する。
This operation is continued until the number of words is completed, and if there is a next word, the above operation is repeated, and finally, all the word delimiters are automatically detected and the necessary delimiter symbols are generated. Is automatically inserted.

【0020】[0020]

【実施例】以下、図面に示した本発明の実施例に基ず
き、本発明における、自動的にカタカナや外国語(例え
ば、英語)の単語の区切りを検出して、その区切りの箇
所に自動的に区切りの記号を挿入する文書作成装置を詳
細に説明する。尚、これによって、これらの実施例に本
発明は限定されるものではないことは勿論である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Based on the embodiments of the present invention shown in the drawings, word breaks of katakana or foreign language (for example, English) in the present invention are automatically detected, and the positions of the breaks are detected. A document creating apparatus for automatically inserting a delimiter will be described in detail. Needless to say, the present invention is not limited to these embodiments.

【0021】図1は、本発明の実施例における文書作成
装置の回路構成をしめすブロック図である。前期回路
は、入力手段1、変換手段2、区切り検出部3、カタカ
ナ外来語辞書4、外国語辞書5、漢字辞書6、中点
「・」発生部7、スペース発生部8、挿入/合成部9、
及び表示手段10から構成される。
FIG. 1 is a block diagram showing a circuit configuration of a document creating apparatus according to an embodiment of the present invention. The first half circuit includes an input unit 1, a conversion unit 2, a delimiter detection unit 3, a Katakana foreign word dictionary 4, a foreign language dictionary 5, a Kanji dictionary 6, a midpoint "." Generation unit 7, a space generation unit 8, and an insertion / synthesis unit. 9,
And display means 10.

【0022】入力手段1は、文書処理装置に通常は平仮
名の文字列の形で、文字の入力を行うための、多数の入
力スイッチを含む。入力された文字列はその後、変換を
指示することにより、変換手段2にて、カタカナ・漢字
・ローマ字等の適当な文字列の形で、カタカナ辞書4、
漢字辞書6、外国語辞書5から抽出、出力される。平仮
名の場合は変換は行われない。平仮名・カタカナ・漢字
・ローマ字等に、適当に変換された文字列は、そのまま
挿入/合成部9に入力される。
The input means 1 includes a large number of input switches for inputting characters, usually in the form of a hiragana character string, to the document processing apparatus. The input character string is then instructed to be converted, so that the converting means 2 outputs an appropriate character string such as katakana, kanji, or roman characters in the katakana dictionary 4,
It is extracted and output from the Kanji dictionary 6 and the foreign language dictionary 5. No conversion is performed for Hiragana. A character string appropriately converted into hiragana, katakana, kanji, romaji, etc. is directly input to the inserting / synthesizing unit 9.

【0023】区切り検出部3は、変換手段2にて変換さ
れた文字列の単語の間にある区切りを、辞書を参照しな
がら検出する回路である。すなわち、カタカナ文字列に
変換された場合には、カタカナ辞書4に記憶させてある
多数のカタカナ(外来語)と比較することにより、カタ
カナの文字列の単語の間での区切りを検出する。
The delimiter detection unit 3 is a circuit for detecting a delimiter between the words of the character string converted by the conversion means 2 with reference to a dictionary. That is, when converted into a katakana character string, the delimiter between the words of the katakana character string is detected by comparing with a large number of katakana (foreign words) stored in the katakana dictionary 4.

【0024】そのためには、変換されたカタカナ文字列
の単語の先頭部分からの一致を、変換された文字列とカ
タカナ辞書4との間で検出し、最終的に一致したカタカ
ナの単語の文字列までの所で、最初の単語が区切られる
と仮定する。第2の単語として、今検出された単語の文
字列は除外して、次の文字列の先頭の部分から文字列で
の比較を、カタカナ辞書4との間で行う。検出された単
語までの文字列があれば、その単語の終了部分で、第2
の単語は区切られると判定する。
For that purpose, a match from the beginning of the word of the converted katakana character string is detected between the converted character string and the katakana dictionary 4, and the character string of the finally matched katakana word is detected. So far, suppose the first word is separated. As the second word, the character string of the word just detected is excluded, and the comparison with the katakana dictionary 4 is performed with the character string from the beginning of the next character string. If there is a character string up to the detected word, at the end of that word, the second
The words are judged to be separated.

【0025】更に、第3の単語として、今検出された第
1と第2の単語の文字列は除外して、第3の文字列の先
頭の部分から文字列での比較を、カタカナ辞書4との間
で行う。検出された単語までで、第3の単語の区切りで
あると判定する。こうした区切り検出の動作を、文字列
が残っている以上は繰り返し、入力手段1にて入力さ
れ、変換手段2にて変換されたカタカナの文字列の区切
りの箇所を全て検出する。
Furthermore, as the third word, the character strings of the first and second words that have just been detected are excluded, and the katakana dictionary 4 is used to compare the character strings from the beginning of the third character string. To and from. Up to the detected word, it is determined to be the delimiter of the third word. The operation of the delimiter detection is repeated as long as the character string remains, and all the delimiter positions of the katakana character string input by the input unit 1 and converted by the conversion unit 2 are detected.

【0026】変換手段2にて変換された文字列が外国語
の場合には、外国語辞書5に記憶させてある多数の外国
語と比較することにより、外国語の文字列の単語の間で
の区切りを、区切り検出部3は全て検出する。
When the character string converted by the converting means 2 is a foreign language, it is compared with a large number of foreign languages stored in the foreign language dictionary 5 to find a difference between the words of the foreign language character string. The delimiter detection unit 3 detects all the delimiters.

【0027】そのためには、変換された外国語の文字列
の単語の先頭部分からの一致を、変換された文字列と外
国語辞書5との間で検出し、最終的に一致した外国語の
単語の文字列までの所で、最初の単語が区切られると仮
定する。第2の単語として、今検出された単語の文字列
は除外して、第2の文字列の先頭の部分から文字列での
比較を、外国語辞書5との間で行う。検出された単語ま
での文字列があれば、その単語の終了部分までで、第2
の単語は区切られると判定する。
To this end, a match from the beginning of a word in the converted foreign language character string is detected between the converted character string and the foreign language dictionary 5, and the finally matched foreign language character string is detected. Suppose the first word is delimited up to the word string. As the second word, the character string of the word just detected is excluded, and the comparison with the character string from the beginning of the second character string is performed with the foreign language dictionary 5. If there is a character string up to the detected word, add up to the end of that word
The words are judged to be separated.

【0028】更に、第3の単語として、今検出された第
1と第2の単語の文字列は除外して、第3の文字列の先
頭の部分から文字列での比較を、外国語辞書5との間で
行う。検出された単語までで、第3の単語の区切りであ
ると判定する。こうした区切り検出の動作を、文字列が
残っている以上は繰り返し、入力手段1にて入力され、
変換手段2にて変換された外国語の文字列の区切りの箇
所を、区切り検出部3は全て検出する。変換手段2にて
変換された文字列が漢字の場合には、漢字辞書6に記憶
されている漢字が取り出され、挿入/合成部9に出力さ
れる。
Further, as the third word, the character strings of the first and second words that have just been detected are excluded, and the comparison with the character string from the beginning of the third character string is performed in the foreign language dictionary. Between 5 and. Up to the detected word, it is determined to be the delimiter of the third word. The operation of detecting the delimiter is repeated as long as the character string remains, and is input by the input means 1,
The delimiter detection unit 3 detects all the delimiters of the foreign language character string converted by the conversion unit 2. When the character string converted by the converting means 2 is a Chinese character, the Chinese character stored in the Chinese character dictionary 6 is extracted and output to the inserting / synthesizing unit 9.

【0029】区切り検出部3にて検出された、カタカナ
の文字列での区切り情報は、中点発生部7に出力され
る。中点発生部7は、それに応じて中点「・」を、検出
された区切りの箇所に挿入する信号を、挿入/合成部9
に出力する。
The delimiter information in the character string of katakana detected by the delimiter detector 3 is output to the midpoint generator 7. The midpoint generating unit 7 accordingly inserts a signal for inserting the midpoint “·” into the detected delimiter, and inserts / synthesizes the signal.
Output to.

【0030】区切り検出部3にて検出された、外国語の
文字列での区切り情報は、スペース発生部8に出力され
る。スペース発生部8は、それに応じてスペースを、検
出された区切りの箇所に挿入する信号を、挿入/合成部
9に出力する。
The delimiter information in the foreign language character string detected by the delimiter detection unit 3 is output to the space generation unit 8. The space generation unit 8 outputs to the insertion / synthesis unit 9 a signal for inserting a space at the detected delimiter in accordance therewith.

【0031】挿入/合成部9では、中点発生部7から出
力された信号に応答して、変換手段2にて変換されたカ
タカナに、区切り検出部3にて検出された区切り箇所に
て、中点を挿入して合成する。
In the inserting / combining section 9, in response to the signal output from the midpoint generating section 7, the katakana converted by the converting means 2 is added to the division position detected by the division detecting section 3. Insert the midpoint and synthesize.

【0032】同様に、挿入/合成部9では、スペース発
生部8から出力された信号に応答して、変換手段2にて
変換された外国語に、区切り検出部3にて検出された区
切り箇所にて、スペースを挿入して合成する。
Similarly, in the inserting / combining unit 9, in response to the signal output from the space generating unit 8, the foreign language converted by the converting unit 2 is added to the delimiter position detected by the delimiter detecting unit 3. At, insert a space and synthesize.

【0033】合成され区切られた、カタカナあるいは外
国語は、挿入/合成部9から表示手段10に出力され、
表示される。
The katakana or the foreign language which is synthesized and separated is output from the inserting / synthesizing unit 9 to the display means 10.
Is displayed.

【0034】変換手段2にて変換されたのが、漢字であ
れば、漢字出力はそのまま、挿入/合成部9に入力さ
れ、そのまま表示手段10にて表示される。
If the conversion means 2 converts the kanji, the kanji output is input to the insertion / synthesis section 9 as it is and displayed on the display means 10 as it is.

【0035】例えば、以下の例のように、カタカナや外
国語は区切られ、区切りを表す中点「・」やスペースが
挿入/合成された形で表示される。すなわち、変換され
た単語がカタカナの「エコノミックアニマル」の場合
は、「エコノミック・アニマル」として表示される。変
換された単語が外国語の「WORLDCUPSOCCE
R」の場合は、「WORLD CUP SOCCER」
として、表示される。この場合、カタカナ辞書4が、
「エコノミック」、「アニマル」という単語を記憶して
いるものとする。又、外国語辞書5が、「WORL
D」、「CUP」、「SOCCER」という単語を記憶
していると仮定する。
For example, as in the following example, katakana and foreign languages are separated and displayed in a form in which a middle point "." Representing a separation and a space are inserted / combined. That is, when the converted word is katakana “economic animal”, it is displayed as “economic animal”. The translated word is the foreign language "WORLD CUP SOCCE
In the case of "R", "WORLD CUP SOCCER"
Is displayed as. In this case, the Katakana dictionary 4
It is assumed that the words "economic" and "animal" are remembered. In addition, the foreign language dictionary 5 is "WORRL
Suppose we have stored the words "D", "CUP", "SOCCER".

【0036】図2は、本発明の区切り検出の動作ステッ
プを表すフローチャートである。図2のフローチャート
はステップS1ないしS7から構成される。
FIG. 2 is a flow chart showing the operation steps of the delimiter detection of the present invention. The flowchart of FIG. 2 includes steps S1 to S7.

【0037】ステップS1では、上述したように、変換
手段2にて変換された単語の文字列の種類を順次検査す
るステップで、変換手段2や区切り検出部3の動作がそ
れに相当する。
In step S1, as described above, the type of the character string of the word converted by the conversion means 2 is sequentially inspected, and the operations of the conversion means 2 and the delimiter detection section 3 correspond to this.

【0038】ステップS2では、変換された単語の文字
列がカタカナであるかどうかが判断される。変換された
単語の文字列がカタカナであれば、YESが選択されて
ステップS5が選択される。もし、否であれば、次のス
テップS3が選択される。
In step S2, it is determined whether the character string of the converted word is katakana. If the converted character string is katakana, YES is selected and step S5 is selected. If not, the next step S3 is selected.

【0039】ステップS5では、後続の単語がカタカナ
であるかどうかが判断される。この判断がYESであれ
ば、ステップS7が選択される。ステップS7では、区
切り検出部3は、カタカナ辞書4と上述の関連した動作
を行い、2単語の文字列の間に中点を挿入することにな
る。
In step S5, it is determined whether the succeeding word is katakana. If this determination is YES, step S7 is selected. In step S7, the delimiter detection unit 3 performs the above-described related operation with the katakana dictionary 4 and inserts a midpoint between the character strings of two words.

【0040】ステップS3では、変換された単語の文字
列が外国語であるかどうかが判断される。変換された単
語の文字列が外国語であれば、YESが選択されてステ
ップS4が選択される。もし、否であれば、図示しない
次のステップが選択されて、他の動作が開始される。
In step S3, it is determined whether the character string of the converted word is a foreign language. If the character string of the converted word is a foreign language, YES is selected and step S4 is selected. If not, the next step (not shown) is selected and another operation is started.

【0041】ステップS4では、後続の単語が外国語で
あるかどうかが判断される。この判断がYESであれ
ば、ステップS6が選択される。ステップS6では、区
切り検出部3は、外国語辞書5と上述の関連した動作を
行い、2単語の文字列の間にスペースを挿入することに
なる。
In step S4, it is determined whether the following word is a foreign language. If this determination is YES, step S6 is selected. In step S6, the delimiter detection unit 3 performs the above-mentioned related operation with the foreign language dictionary 5 and inserts a space between character strings of two words.

【0042】図2のフローチャートは単語の数が終了す
るまで続行され、次の単語があれば、上記のステップS
1からS7を繰り返して、最終的に、全ての単語の区切
りを検出し、必要な区切り記号を挿入する。
The flow chart of FIG. 2 continues until the number of words is exhausted, and if there is a next word, then step S above
By repeating steps 1 to S7, all word delimiters are finally detected, and necessary delimiters are inserted.

【0043】上記の本実施例では、単語の種類を、外来
語を表すカタカナと外国語(特に英語)として、単語の
文字列の区切りを自動的に検出し、区切り記号を自動的
に挿入して合成して、表示する例をしめしたが、単語の
種類はこれ以外でも、適用可能であり、又、そのように
実施出来ることは、上記の記載から明らかである。
In the above-described embodiment, the word types are katakana representing a foreign word and a foreign language (especially English), and the delimiters of the character strings of the words are automatically detected and the delimiters are automatically inserted. Although an example in which they are combined and displayed is shown, it is apparent from the above description that other kinds of words can be applied and can be implemented as such.

【0044】その他、本発明は上記しかつ図面に示した
実施例のみに限定されるものではなく、要旨を逸脱しな
い範囲内で適宜変形して実施できることは勿論である。
Besides, the present invention is not limited to the embodiments described above and shown in the drawings, and it is needless to say that the present invention can be appropriately modified and implemented without departing from the scope of the invention.

【0045】[0045]

【効果】以上のように本発明の自動単語区切り挿入回路
では、入力手段にて入力された全ての単語の文字列の区
切りを自動的に検出し、単語の種類(カタカナ・外国語
等)に応じて、適当な区切り記号を自動的に挿入される
ため、文書処理装置への文字の入力操作が容易になり、
操作者が入力しながら区切りを考慮することが不要とな
る。表示された情報も、そのままですぐ理解し易いもの
となる。
[Effect] As described above, in the automatic word break insertion circuit of the present invention, the breaks of the character strings of all the words input by the input means are automatically detected and the word type (katakana, foreign language, etc.) is detected. Accordingly, the appropriate delimiter is automatically inserted, making it easy to input characters to the document processing device.
It is not necessary for the operator to consider the division while inputting. The displayed information is easy to understand as it is.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例における自動単語区切り挿入回
路のブロック図である。
FIG. 1 is a block diagram of an automatic word break insertion circuit according to an embodiment of the present invention.

【図2】本発明の実施例における自動単語区切り挿入回
路の動作ステップのフローチャートである。
FIG. 2 is a flow chart of operation steps of an automatic word segment insertion circuit in the embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 入力手段 2 変換手段 3 区切り検出部 4 カタカナ辞書 5 外国語辞書 6 漢字辞書 7 中点発生部 8 スペース発生部 9 挿入/合成部 10 表示手段 DESCRIPTION OF SYMBOLS 1 Input means 2 Conversion means 3 Separation detection section 4 Katakana dictionary 5 Foreign language dictionary 6 Kanji dictionary 7 Midpoint generation section 8 Space generation section 9 Insertion / synthesis section 10 Display means

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】単語を入力する入力手段と、 前期入力手段に応答し、入力された単語を所定の文字形
式に変換する変換手段と、 所定の文字形式にて単語を記憶している辞書手段と、 前期変換手段に応答し、前期辞書手段の単語を参照し
て、前期変換された単語の間の区切りを検出する検出手
段と、 前期区切り検出手段に応答し、区切り記号を発生する区
切り発生手段と、 前期変換手段、前期区切り検出手段及び前期区切り発生
手段に応答して、前期変換された単語に前期検出された
区切りを挿入する挿入手段と、 から構成されることを特徴とする自動単語区切り挿入回
路。
1. An input means for inputting a word, a converting means for responding to the previous input means, for converting the input word into a predetermined character format, and a dictionary means for storing the word in the predetermined character format. And a detection means for responding to the previous term conversion means, referring to a word in the previous term dictionary means, for detecting a delimiter between the previously converted words, and a delimiter generation for generating a delimiter symbol in response to the previous term delimitation detection means An automatic word, characterized in that it comprises: means for inserting the term detected in the previous term into the word converted in the earlier term in response to the means for converting the term earlier, the means for detecting the term earlier, and the means for generating the term earlier. Break insertion circuit.
【請求項2】単語を入力する入力手段と、 前期入力手段に応答し、入力された単語をカタカナ文字
及び外国語に変換する変換手段と、 カタカナ文字の文字形式にて単語を記憶しているカタカ
ナ辞書手段と、 外国語文字の文字形式にて単語を記憶している外国語辞
書手段と、 前期変換手段に応答し、前期カタカナ辞書手段に記憶さ
れているカタカナ文字を参照して、前期変換されたカタ
カナ文字の間の区切りを検出する第1の検出手段と、 前期変換手段に応答し、前期外国語辞書手段に記憶され
ている外国語文字を参照して、前期変換された外国語文
字の間の区切りを検出する第2の検出手段と、 前期カタカナ文字の第1の区切り検出手段に応答し、第
1の区切り記号を発生する第1の区切り発生手段と、 前期外国語文字の第2の区切り検出手段に応答し、第2
の区切り記号を発生する第2の区切り発生手段と、 前期変換手段、前期第1の区切り検出手段、及び前期第
1の区切り発生手段に応答して、前期変換されたカタカ
ナ文字に前期検出された第1の区切りを挿入する第1の
挿入手段と、 前期変換手段、前期第2の区切り検出手段、及び前期第
2の区切り発生手段に応答して、前期変換された外国語
文字に前期検出された第2の区切りを挿入する第2の挿
入手段と、 から構成されることを特徴とする自動単語区切り挿入回
路。
2. An input means for inputting a word, a conversion means for responding to the input means for the previous term, converting the input word into katakana characters and a foreign language, and storing the word in a character format of katakana characters. Katakana dictionary means, a foreign language dictionary means that stores words in the character format of foreign language characters, and the previous term conversion means in response to the katakana character stored in the katakana dictionary term means The first detecting means for detecting a delimiter between the katakana characters that have been converted and the first conversion means, and referring to the foreign language character stored in the first foreign language dictionary means, the first converted foreign language character Second detecting means for detecting a delimiter between the first and second delimiters, and a first delimiter generating means for generating a first delimiter in response to the first delimiter detecting means for the first half katakana character; 2 division inspection Second, in response to the means
Second delimiter generating means for generating the delimiter symbol, the first term converting means, the first term delimiter detecting means, and the first term delimiter generating means, and the first term detected in the previously converted katakana character. In response to the first insertion means for inserting the first delimiter, the first term conversion means, the second term delimiter detection means, and the second term delimiter generation means, the first term is detected as a foreign language character that has been previously transformed. A second insertion means for inserting a second delimiter, and an automatic word delimiter insertion circuit comprising:
JP3196520A 1991-08-06 1991-08-06 Automatic word punctuation inserting circuit Pending JPH0540750A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3196520A JPH0540750A (en) 1991-08-06 1991-08-06 Automatic word punctuation inserting circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3196520A JPH0540750A (en) 1991-08-06 1991-08-06 Automatic word punctuation inserting circuit

Publications (1)

Publication Number Publication Date
JPH0540750A true JPH0540750A (en) 1993-02-19

Family

ID=16359107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3196520A Pending JPH0540750A (en) 1991-08-06 1991-08-06 Automatic word punctuation inserting circuit

Country Status (1)

Country Link
JP (1) JPH0540750A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002101578A1 (en) * 2001-06-11 2002-12-19 Hiroshi Ishikura System for assisting input of text through automatic generation of space
JP2015118597A (en) * 2013-12-19 2015-06-25 キヤノンマーケティングジャパン株式会社 Information processing apparatus, information processing method, and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002101578A1 (en) * 2001-06-11 2002-12-19 Hiroshi Ishikura System for assisting input of text through automatic generation of space
US7475009B2 (en) 2001-06-11 2009-01-06 Hiroshi Ishikura Text input support system and method
JP2015118597A (en) * 2013-12-19 2015-06-25 キヤノンマーケティングジャパン株式会社 Information processing apparatus, information processing method, and program

Similar Documents

Publication Publication Date Title
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
JP2004220616A (en) Machine translation system for simultaneously displaying and editing three or more parallel translation screens
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0540750A (en) Automatic word punctuation inserting circuit
JP3895797B2 (en) Conversion candidate generation method
JP2798683B2 (en) Natural language processing system
JPH08180064A (en) Document retrieval method and document filing device
JP3244286B2 (en) Translation processing device
JP3220133B2 (en) Kana-Kanji conversion device
JP2702443B2 (en) Japanese input device
JP2608384B2 (en) Machine translation apparatus and method
JPH0668070A (en) Compound word dictionary registering device
JPS6327945A (en) Documentation device
JP4319851B2 (en) Reading apparatus, reading method and reading processing program
JPH01228057A (en) Kana/kanji converter
JPS5880771A (en) Kana (japanese syllabary)-chinese character conversion processor
KR960032435A (en) Dual Caption Processing System and Method
JPS61182186A (en) Character recognizing device
JPS62271172A (en) Kana/kanji conversion processing system
JPH0350306B2 (en)
JPH04333965A (en) Kana/kanji converting device
JPH11134337A (en) Notation indicating device and recording medium
JPH0644218A (en) Document preparing device and conversion control method used for the same
JPH0251764A (en) Index production system
JPH04139568A (en) Document processor