JPS5880771A - Kana (japanese syllabary)-chinese character conversion processor - Google Patents

Kana (japanese syllabary)-chinese character conversion processor

Info

Publication number
JPS5880771A
JPS5880771A JP56179519A JP17951981A JPS5880771A JP S5880771 A JPS5880771 A JP S5880771A JP 56179519 A JP56179519 A JP 56179519A JP 17951981 A JP17951981 A JP 17951981A JP S5880771 A JPS5880771 A JP S5880771A
Authority
JP
Japan
Prior art keywords
words
kana
independent
suffix
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56179519A
Other languages
Japanese (ja)
Other versions
JPH0319579B2 (en
Inventor
Katsuhide Morimoto
克英 森本
Sadao Asahi
旭 貞男
Mitsuyuki Okada
岡田 潤之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP56179519A priority Critical patent/JPS5880771A/en
Publication of JPS5880771A publication Critical patent/JPS5880771A/en
Publication of JPH0319579B2 publication Critical patent/JPH0319579B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To facilitate an easy conversion into a desired sentence including Chinese characters, by selecting and deciding successively the candidate words of the suffix and plural independent words and their accessory words which can form a clause within a range where the relation of connection is grammatical among those above-mentioned words. CONSTITUTION:A connection inspecting circuit 6 inspects the connection between independent words and accessory words and delivers an inspection output E. A character train coincidence detecting circuit 7 checks whether or not the suffix, independent words and suffix candidate in the KANA letter train exist in the independent, suffix and prefix tables 3-5. At the same time, a control circuit 2 feeds the residual character trains which function as the conjugation D of parts of speech and the candidates of accessory words to the circuit 6 by the output E of the circuit 6 and an indication given from a keyboard 1. Thus the independent words are selected or fixed independently of each other while abbreviating properly the suffix, independent words and prefix candidate of the KANA letter train and at the same time satisfying the relation of grammatical connection among these words.

Description

【発明の詳細な説明】 この発明は、例えばかなキーボードのようなかな文字入
力部から入力されるかな文字列をかな漢字混り文に変換
出力するかな漢字変換処理装置において、文節を構成し
うる接辞語、複数個の自立語及び付属語の各候補の語を
それらの接続関係が文法にかなう範囲内で順次選択・決
定しうる様に構成したかな漢字変換処理装置に関するも
のである。
Detailed Description of the Invention The present invention provides a kana-kanji conversion processing device that converts and outputs a kana character string input from a kana character input unit such as a kana keyboard into a sentence containing kana-kanji. The present invention relates to a kana-kanji conversion processing device configured to sequentially select and determine a plurality of candidate words for independent words and adjunct words within a range in which their connection relationships comply with the grammar.

一般に、文節を構成する代表的体形は(接頭語)+(自
立語)n+(接尾語)+(付属語福であることは周知の
通りである。ここで()は上記接頭語、自立語、接尾語
、付属語の各語が文節の一部として存在するかもしくは
存在しないこと、()nは最低1個以上存在すること、
(′)mはそれぞれ複数個存在するか又は存在しないこ
とを示す。
In general, it is well known that the typical form that makes up a clause is (prefix) + (independent word) n + (suffix) + (adjunct word).Here, () is the prefix mentioned above, the independent word , suffixes, and adjuncts exist or do not exist as part of the clause; ()n must exist at least once;
(') m indicates that there is a plurality of each or there is no presence.

さて、従来のかな漢字変換処理装置において例えばかな
キーボードから入力されたかな文字列を漢字かな混り文
に変換する場合の基本的変換手順を第1図に示すフロー
チャートを参照して説明する。
Now, the basic conversion procedure for converting a kana character string input from a kana keyboard into a kanji-kana mixed sentence in a conventional kana-kanji conversion processing device will be explained with reference to the flowchart shown in FIG.

ステップS1において、入力されたかな文字列に対して
最長一致の原則に従って、自立語テーブル内より候補と
なりうる自立語を検索し、この自立語が発見できればス
テップS2においてその残りの文字列より付属語を抽出
し、先に抽出した自立語との接続の妥当性をステップS
3においてチェックする。そしてこの妥当柱が良の場合
は、ここで発見した自立語と付属語の各候補をかな漢字
変換結果の文節語の候補としてただちに出力する。
In step S1, an independent word that can be a candidate is searched in the independent word table according to the longest match principle for the input kana character string, and if this independent word is found, in step S2, an adjunct word is searched from the remaining character strings. , and check the validity of the connection with the independent word extracted earlier
Check in step 3. If this validity pillar is good, each independent word and attached word candidate found here is immediately output as a clause word candidate as a result of kana-kanji conversion.

一方、候補となりうる付属語を見出しても先に発見した
自立語との接続検定に失敗すると、さらにステップS4
において付属語となりうる他の文字列に対しても上記ス
テップs2.s3の処理が終了したか否かを判定する。
On the other hand, if an attached word that can be a candidate is found but the connection test with the previously discovered independent word fails, further step S4
The above step s2. It is determined whether the process of s3 has ended.

この判定が否であれはステップS2に戻ってさらに付属
語となりうる他の候補を検索し、同様の処理を行う。ま
た、先に発見した自立語に対して残りの文字列から適切
な付属語が発見できなかったときは、他の自立語。
If this determination is negative, the process returns to step S2 to further search for other candidates that can be used as adjunct words, and performs the same process. Also, if an appropriate adjunct cannot be found from the remaining character strings for the previously discovered independent word, use another independent word.

例えば同一のかな見出しを構成する同音異義語群に対し
て、その候補がないときは対象とする自立語かな文字長
をさらに短くして他の自立語を検索し、上述の如く付属
語と自立語との検定を行なう1そして、ステップS5に
おいて、全ての自立語候補に対して付属語との検定に失
敗すると、次はステップS6において自立語を抽出し、
自立語候補を除いたかな文字列、即ち上記付属語候補を
検定しようとするかな文字列の頭部部分に接尾語が存在
しないか否かを検出すべく、ステップS7において接尾
語テーブル群を検索し、接尾語が発見できた場合はこれ
を接尾語と付属語とに失孟分解し、ステップS8におい
て残余かな文字列に対して付属語検定を一行なう。ここ
で接続検定に失敗すればステップS9において全ての接
尾語、付属語に対してチェックされたか否かが判定され
、否であればステップS7に戻り、そうでなければステ
ップS10に進み、後者の場合全ての自立語に対して検
定されたか否かを判定する。そして、この判定の結果が
否であればステップS6に戻り、そうでなければステッ
プ513に進み、ステップ513において入力文字列の
先頭部分に対して接頭語が有るか否かを求め、有る場合
には1接頭語候補に対して入力文字列の残余部分に対し
て自立語士付属語、自立語士接尾語+付属語の接続検定
を行い、全ての検定に失敗すると他の接頭語候補を求め
、この接頭語候補に対し上記一連の処理を行う。
For example, if there are no candidates for a group of homophones that make up the same kana heading, the target independent word kana character length is further shortened and other independent words are searched, and as mentioned above, the independent word and independent word are searched for. 1. Then, in step S5, if all independent word candidates fail in testing with adjunct words, the next step is to extract independent words in step S6,
In step S7, the suffix table group is searched to detect whether a suffix exists in the head part of the kana character string excluding independent word candidates, that is, the above-mentioned adjunct word candidate. However, if a suffix is found, it is decomposed into a suffix and an adjunct, and in step S8, an adjunct test is performed on the remaining kana character string. If the connection test fails here, it is determined in step S9 whether or not all suffixes and adjuncts have been checked. If not, the process returns to step S7; if not, the process proceeds to step S10; In this case, it is determined whether all independent words have been tested. If the result of this determination is negative, the process returns to step S6; otherwise, the process proceeds to step 513, in which it is determined whether or not there is a prefix for the beginning part of the input character string; For one prefix candidate, the remaining part of the input string is tested for the connection of the independent linguist adjunct and the independent linguist suffix + adjunct, and if all tests fail, it searches for other prefix candidates. , perform the above series of processes on this prefix candidate.

なお、第1図において811は上記ステップ51〜S5
により構成され、かな文字列より自立語および付属語を
抽出し両者の接続検定を行うステップである。また、5
12は上記ステップ56〜S10により構成され、かな
文字列を自立語士接尾語士付属語に分解しかつ付属語に
関して接続検定を行うステップであり、813はかな文
字列から接頭・ 語を抽出しかつその残余部分に関して
上記両ステップSll、312の処理を行うステップで
ある。
In addition, in FIG. 1, 811 is the step 51 to S5 described above.
This step consists of extracting independent words and attached words from a kana character string and testing the connection between the two. Also, 5
12 is a step consisting of the above-mentioned steps 56 to S10, which decomposes the kana character string into independent linguist suffix adjunct words and performs a connection test on the adjunct words; 813 extracts prefixes and words from the ephemeral character string; This is a step in which the remaining portion is subjected to the processing of both steps Sll and 312 described above.

814はカナ漢字変換に成功した旨を出力するステップ
、S15はカナ漢字変換に失敗した旨を出力するステッ
プである。
814 is a step of outputting that the kana-kanji conversion has been successful, and S15 is a step of outputting that the kana-kanji conversion has failed.

また、ここでいう検定の失敗とは、語・語相互間の接続
関係2例えば文法的に日本語として語の継がりが成立し
得ないもの以外に、文法的に接続関係は成立しても例え
ばオペレータの意図する語構成が得られないといった場
合をも意味するものである。この様なときにはオペレー
タにより次の検定に移るべしの指令を与えることにより
、システムに対し検定の失敗を指示する方法が通常採ら
れている。
In addition, the failure of the test here refers to the connection relationship between words 2, for example, in addition to cases in which word succession cannot be established grammatically in Japanese, even if the connection relationship is established grammatically. For example, it also means a case where the word structure intended by the operator cannot be obtained. In such cases, a method is usually adopted in which the operator instructs the system that the test has failed by giving a command to proceed to the next test.

従来のかな漢字変換処理装置は以上のような処理を行い
漢字かな混り文を得るものであるが、日本語には同一か
な見出しに対して異なる意味を有する同音異義語があり
、かつこれは自立語の他、接頭語、接尾語についても同
様である。いま、口語+接尾語の組合わせだけでもP。
Conventional kana-kanji conversion processing devices perform the above processing to obtain kanji-kana mixed sentences, but in Japanese there are homophones with different meanings for the same kana heading, and these are independent words. The same applies to prefixes and suffixes in addition to words. Now, just the combination of colloquial language + suffix is P.

X PIxP2もの組合わせがあり、オペレータの意図
する漢字かな混り文を見出すには多大の時間と手間とが
かかる欠点がある。
There are as many combinations as XPIxP2, and there is a drawback that it takes a lot of time and effort to find the kanji/kana mixed sentence that the operator intends.

本発明は上記のような従来のものの欠点を除去するため
になされたもので、文節を構成する自立語、接頭語、接
尾語および付属語の候補となりうる各要素を自立語、付
属語間の接続関係を満足しつる状態で各々独立に選択、
確定しうる部分確定入力手段を設けることにより、かな
漢字変換に要する時間を大幅に短縮できるかな漢字変換
処理装置を提供することを目的としている。
The present invention has been made in order to eliminate the drawbacks of the conventional methods as described above. Select each independently in a state that satisfies the connection relationship,
It is an object of the present invention to provide a kana-kanji conversion processing device that can significantly reduce the time required for kana-kanji conversion by providing a partial confirmation input means that can be confirmed.

以下、この発明の一実施例を図について説明する。An embodiment of the present invention will be described below with reference to the drawings.

第2図は本発明の一実施例によるかな漢字変換処理装置
を示し、図において(1)はかな文字列入力部としての
キーボードであり、これはオペレータとしての部分確定
入カキ−および上記候補を変更するための候補変更入力
手段としての候補変更入カキ−を有している。また(3
)は自立語テーブルであり、これはかな見出し部、漢字
見出し部からなるかな一漢字変換対および品詞、活用形
等の情報を各自立語毎に有するものである。+41 +
51は接尾語テーブルおよび接頭語テーブルで、これら
はかな見出し部および漢字見出し部より成るかな一漢字
変換対のみを有する。なお、各テーブル(3)〜(5)
ともかな見出しは50音の昇順にコードが与えられてい
るとともにテーブル内も50音順に配列されている。(
6)は上記自立語、付属語間の接続検定を行い検定出力
Eを出力する接続検定回路、(7)は文字列一致検出回
路であり、これは上記かな文字列中の接尾語、自立□語
および接頭語候補が上記テーブル(3)〜(5)中に存
在するか否かを検出するものである。また(2)は上記
接続検定回路(6)の検定出力Eて、かな文字列の接尾
語、自立語、接頭語候補を適宜短縮しかつその文法的接
続関係を満たしながら上記自立語等をそれぞれ独立して
選択あるいは確定する制御回路である。
FIG. 2 shows a kana-kanji conversion processing device according to an embodiment of the present invention. In the figure, (1) is a keyboard as an ephemeral character string input section, which is used as an operator to enter partial confirmation and change the above candidates. It has a candidate change input key as a candidate change input means for inputting a candidate change. Also (3
) is an independent word table, which has a kana-to-kanji conversion pair consisting of a kana header section and a kanji header section, as well as information such as part of speech and conjugation form for each independent word. +41 +
Reference numeral 51 denotes a suffix table and a prefix table, which have only kana and kanji conversion pairs consisting of a kana header part and a kanji header part. In addition, each table (3) to (5)
Tomokana headings are given codes in ascending order of the 50 syllabary, and the tables are also arranged in the order of the 50 syllabary. (
6) is a connection test circuit that tests the connection between the above independent word and adjunct word and outputs the test output E, and (7) is a character string match detection circuit, which detects the suffix and independent □ in the above kana character string. It is detected whether word and prefix candidates exist in the above tables (3) to (5). In addition, (2) uses the test output E of the connection test circuit (6) to appropriately shorten the suffix, independent word, and prefix candidates of the kana character string, and to convert the above independent words, etc., while satisfying the grammatical connection relationship. This is a control circuit that selects or confirms independently.

第3図は上記実施例装置の処理手順の概略をフローチャ
ートとして示したもので、図において、821は制御ス
ティタスSTおよびiの初期化を行うステップ、S22
は自立語を抽出するステップ、823は上記制御スティ
タスSTが2もしくは4であるか否かを判定するステッ
プ、S24は接尾語を抽出するステップ、S25は自立
語と付属語との接続検定を行うステップ、S26はかな
漢字変換結果を出力するステップ、S27.S28゜S
29はそれぞれ上記変換結果を変更すべきか部分的に確
定すべきかあるいは全面的に確定すべきかをそれぞれオ
ペレータの指示に従って決定するステップ、529aは
ステップ829において全面的な確定を決定した後かな
漢字変換成功の旨を出力するステップ、S30は制御ス
ティタスiの値を1だけ増加するステップ、531は制
御スティタスSTが4以上であるか否かを判定するステ
ップ、531aはステップ531においてYES”の時
かな漢字変換失敗の旨を出力するステップ、832は上
記制御スティタスSTの値を1増加させるステップ、S
33は上記制御スティタスSTが3もしくは4であるか
否かを判定するステップ、S34は接頭語を抽出するス
テップ、S35は制御スティタスiの値を強制的に1に
するステップである。
FIG. 3 is a flowchart showing an outline of the processing procedure of the apparatus of the above embodiment, and in the figure, 821 is a step for initializing control statuses ST and i, S22
823 is a step of determining whether the control status ST is 2 or 4, S24 is a step of extracting a suffix, and S25 is a test of connection between an independent word and an attached word. Step, S26, step of outputting the result of kana-kanji conversion, S27. S28゜S
29 is a step of determining whether the above conversion result should be changed, partially confirmed, or fully confirmed according to the instructions of the operator, and 529a is a step of determining whether the conversion result should be changed, partially confirmed, or fully confirmed, respectively, and 529a is a step of determining whether the Kana-Kanji conversion is successful after determining the complete confirmation in step 829. S30 is a step of increasing the value of control status i by 1, 531 is a step of determining whether control status ST is 4 or more, and 531a is a failure of kana-kanji conversion when "YES" in step 531. 832 is a step of increasing the value of the control status ST by 1, S
33 is a step of determining whether the control status ST is 3 or 4, S34 is a step of extracting a prefix, and S35 is a step of forcibly setting the value of control status i to 1.

第4図は上記実施例装置における文字列一致検出回路の
一構成例を示す。図において、(1旧ま制御回路(2)
よりかな文字列が入力されるバッファレジスタ、(12
は各テーブル(3)〜(5)のアドレスがセットされる
アドレスレジスタ、(131は上記各テーブル(3)〜
(5)の内容が上記バッファレジスタfillの内容に
含まれるか否かを判定する一致回路であり、これは上記
テーブル(31(4)または(5)中に上記バッファレ
ジスタ+Illの内容と一致するものが有る時出力線(
13a)を介して検出成功の旨の出力Sを出し、また無
い時にはアドレスレジスタ(121に記憶しているアド
レスを1進める出力を出力線(13b)を介して出力す
る。圓はかな文字列より自立語、接尾語もしくは接頭語
をそれぞれ除去し、該除去に失敗した時、即ち入力かな
文字列より上記自立語等の方が長い時、その出力線(1
4a)より検出失敗の旨の出力Fを出力する除去回路で
ある。
FIG. 4 shows an example of the configuration of the character string match detection circuit in the apparatus of the above embodiment. In the figure, (1 old control circuit (2)
A buffer register into which a character string is input (12
is an address register in which the address of each table (3) to (5) is set, (131 is each table (3) to (5) above)
This is a matching circuit that determines whether the contents of (5) are included in the contents of the buffer register fill, and this matches the contents of the buffer register +Ill in the table (31 (4) or (5)). When there is something, the output line (
13a), outputs an output S indicating successful detection, and if there is no output, outputs an output that increments the address stored in the address register (121 by 1) via the output line (13b). When an independent word, suffix, or prefix is removed, and the removal fails, that is, when the independent word, etc. is longer than the input kana character string, the output line (1
4a) is a removal circuit that outputs an output F indicating a detection failure.

次に第2図ないし第4図を用いて動作について説明する
Next, the operation will be explained using FIGS. 2 to 4.

まず、キーボード(1)より入力されたかな文字列は制
御回路(2)の入力バッファレジスタ(図示せず)に記
憶される。次にかな漢字変換トリがが与えられると、ス
テップS21においてまず制御スティタスST及びiが
各々S T = l 、  i = 2にセットされ、
入力バッファレジスタの内容が文字列一致検出回路(7
)に送られ、テーブル選択信号はTSlのみが有意とな
る。さて、文字列一致検出回路(7)の一実施例を第4
図に示したが、本回路(7)では、制御回路(2)から
送られてきた文字列は第2のバッファレジスタ(11)
に一旦格納される。次に検索テーブルの検索開始アドレ
ス(本実施例では説明を簡単にするためにテーブルの先
頭から検索するものとする。)がアドレスレジスタ(1
21にセットされ、その出力TAが検索指定テーブル、
即ち今の場合は自立語テーブル(3)に送られる。する
と、この自立語テーブル(3)から読み出された出力情
報T I)のうちかな見出し部(以下これをBと記す)
のみが一致回路(13)に送られ、この一致回路(]3
)において、第2のバッファレジスタ(11)の内容(
以下これをAと記す)の先頭文字を基準としてバッファ
レジスタ(11)の文字列A中に文字列Bが存在するか
否かがチェックされる。そして、文字列Bが文字列A中
に存在しないとき、一致回路(13)は出力線(13b
)を介して指令を発しアドレスレジスタ(12)の内容
を+1加算して、自立語テーブル(3)中の次の自立語
が読み出され、以下順次同じことが繰返される。
First, a kana character string input from the keyboard (1) is stored in an input buffer register (not shown) of the control circuit (2). Next, when the kana-kanji conversion trie is given, in step S21, the control status ST and i are set to ST = l and i = 2, respectively, and
The contents of the input buffer register are processed by the string match detection circuit (7
), and only TSL is significant as a table selection signal. Now, an example of the character string match detection circuit (7) will be explained in the fourth example.
As shown in the figure, in this circuit (7), the character string sent from the control circuit (2) is stored in the second buffer register (11).
is temporarily stored. Next, the search start address of the search table (in this example, to simplify the explanation, the search is assumed to start from the beginning of the table) is set in the address register (1
21, and its output TA is the search specification table,
That is, in this case, it is sent to the independent word table (3). Then, the output information T I) read from this independent word table (3) is the kana heading part (hereinafter referred to as B).
is sent to the matching circuit (13), and this matching circuit (]3
), the contents of the second buffer register (11) (
It is checked whether or not character string B exists in character string A in the buffer register (11) using the first character of character string A (hereinafter referred to as A) as a reference. Then, when the character string B does not exist in the character string A, the matching circuit (13) outputs the output line (13b
), the contents of the address register (12) are incremented by +1, the next independent word in the independent word table (3) is read out, and the same process is repeated one after another.

さて、バッファレジスタ(11)の内容が自立語テーブ
ル(3)内に存在しない時、即ちバッファレジスタ01
)の文字列中に出力情報T Dのかな見出し部、即ち文
字列Bがなく、かつバッファレジスタ(11)の内容即
ち文字列Aと上記文字列Bとの差A−BがA −B (
Qとなるときは、検出失敗の旨の出力Fが出力線(14
a)を介して制御回路(2)に知らされる。
Now, when the contents of buffer register (11) do not exist in the independent word table (3), that is, buffer register 01
), there is no kana heading part of the output information TD, that is, the character string B, and the difference A-B between the content of the buffer register (11), that is, the character string A, and the above character string B is A-B (
When Q, the output F indicating detection failure is connected to the output line (14
a) to the control circuit (2).

一方、バッファレジスタ(11)の中に文字列Bが発見
できたときは検出成功としてテーブルの検索を一旦中止
して上記出力情報TDとともに検出成功の旨の出力Sを
出力線(13a)を介して制御回路(2)に送る。即ち
、これがステップS22における処理の詳細である。こ
のように、自立語の抽出に成功すると、ステップS23
において今5T=1であるので、ステップ824をパス
する経路が選択され、次にステップ525において自立
語と付属語との接続検定が接続検定回路(6)で行われ
る。
On the other hand, when the character string B is found in the buffer register (11), it is determined that the detection is successful, the table search is temporarily stopped, and an output S indicating that the detection is successful is sent along with the output information TD through the output line (13a). and sends it to the control circuit (2). That is, this is the details of the process in step S22. In this way, if the independent words are successfully extracted, step S23
Since 5T=1 now, a path passing step 824 is selected, and then in step 525, the connection test between the independent word and the attached word is performed in the connection test circuit (6).

この接続検定には読み出された自立語情報のうちの品詞
と活用形り及び文字列Aから文字列Bを取り除いた残余
文字列(以下これをCとする)及び接続検定テーブルが
使用される。この接続検定テーブルとは、例えば品詞と
活用形とを横軸に、付属語を縦軸に配置し、両者が文法
的に又は慣用的に接続関係にあるときは1.無いときに
はOとし致の原則に従ってチェックされる文字列が決定
される。
For this connection test, the parts of speech and inflected forms of the read independent word information, the remaining character string (hereinafter referred to as C) obtained by removing character string B from character string A, and the connection test table are used. . This connection test table, for example, arranges parts of speech and conjugations on the horizontal axis and adjuncts on the vertical axis, and when the two are connected grammatically or idiomatically, 1. If there is no character string, the character string to be checked is determined according to the principle of O.

そして、ステップ825において接続検定に成功し、か
な漢字変換結果がステップS26において出力されると
、オペレータは表示器(8)を見てそれがオペレータの
所望するものであるときは確定式カキ−を押下し、それ
が一部所望のものであるときは部分確定式カキ−を押下
し、それが所望のものでなく候補を変更したいときは候
補変更入カキ−を押下する。そして本装置はステップ8
29の確定式カキ−の押下があったときはステップ52
9aに到達し、カナ漢字変換成功の旨を出力する。また
ステップ828の部分確定式カキ−の押下があったとき
は上記抽出された自立語は正しいものと確定し、ステッ
プ530において制御スティクスi = 3とし、ステ
ップS23からステップS24をパスしてステップ82
5において上記圧しいものと確定した自立語とその残余
部分である付属語との接続検定を行なう。さらにステッ
プS27の候補変更入カキ−の押下があったときはステ
ップS22に戻って自立語の再検出を行い、アドレスレ
ジスタ(121が+1加算され、他の自立語を検索し、
以下同様にその残余部分、即ち付属語に対してステップ
S25において自立語と付属語との接続検定を行う。そ
して、全ての自立語に対して接続検定に失敗すると、ス
テップS3]を経てステップ832で5T−2とし、自
立語士接尾語士付属語の接続検定に移行する。5T−2
となったときはステップS33から直ちにステップ82
2に入り、ステップ322において入力文字列全体に対
して自立語を抽出した後、ステップS23においてステ
ップS24の実行が決定され、このステップS24にお
いて残余部分に接尾語となりうるかな文字列が存在する
か否かを接尾語テーブル(4)(この場合テーブル選択
信号はrS2の上記ステップ824において接尾語の候
補が抽出されなかったときは他の自立語を検索する。ス
テップS24において接尾語の候補が抽出されると、ス
テップS25において残余部(付属語)に対して自立語
との接続検定が行われる。この抽出された自立語、接尾
語に対して付属語との接続検定に失敗すると、ステップ
S24においてます他の接尾語候補を検索し、残余部分
に対して同様の接続検定を行なう。このようにして次々
と接尾語候補を検定してゆき、全ての接尾語候補に対し
て、先に自立語の候補として抽出した自立語と付属語と
の接続検定に失敗すると、さらに他の自立語候補を検索
する。そして、全ての自立語候補、接尾語候補の検定に
失敗するとステップ532において5T=3となり、ス
テップS33においてステップS34の実行が選択され
、接頭語+自立語」−付属語の検定処理に移行する。さ
て上記において自立語と接尾語との検定に成功すると、
ステップS26においてその結果が表示器(8)に出力
される。
Then, when the connection test is successful in step 825 and the kana-kanji conversion result is output in step S26, the operator looks at the display (8) and if the result is what the operator desires, presses the confirmation key. If some of the candidates are desired, the user presses the partial confirmation key, and if the candidates are not desired and the candidate is to be changed, the candidate change input key is pressed. Then, this device performs step 8.
When the confirmation type key of 29 is pressed, step 52
9a is reached, and a message indicating that the kana-kanji conversion was successful is output. Further, when the partially determined key is pressed in step 828, the extracted independent word is determined to be correct, the control stick i=3 is set in step 530, steps S23 and S24 are passed, and step 82 is performed.
In step 5, a connection test is performed between the independent words determined to be overwhelming and the attached words that are the remaining parts thereof. Furthermore, when the candidate change entry key in step S27 is pressed, the process returns to step S22 to re-detect the independent word, add 1 to the address register (121), search for another independent word,
Similarly, in step S25, the remaining portion, that is, the attached word, is tested for connection between the independent word and the attached word. If the connection test fails for all the independent words, the process goes to step S3] and is set to 5T-2 in step 832, and the process moves to the connection test for the independent word suffix adjunct words. 5T-2
When this happens, the process immediately proceeds from step S33 to step 82.
2, after extracting independent words from the entire input character string in step 322, it is decided in step S23 to execute step S24, and in this step S24, it is determined whether there is a character string that can be a suffix in the remaining part. suffix table (4) (in this case, the table selection signal is used to search for another independent word when no suffix candidate is extracted in the above step 824 of rS2. In step S24, a suffix candidate is extracted) Then, in step S25, the residual part (attached word) is tested for connection with an independent word.If the extracted independent word or suffix fails in the connection test with an attached word, the test is performed in step S24. Search for other suffix candidates in If the connection test between the independent word extracted as a word candidate and an adjunct word fails, another independent word candidate is searched for.If the test of all independent word candidates and suffix candidates fails, 5T= 3, execution of step S34 is selected in step S33, and the process moves to the prefix+independent word"-adjunct word verification process.Now, if the independent word and suffix test is successful in the above,
In step S26, the result is output to the display (8).

ここで、オペレータはこの表示器(8)を見ながら所望
のかな漢字変換が行われたか否かを判断する。
Here, the operator judges whether or not the desired kana-kanji conversion has been performed while looking at the display (8).

そして、オペレータによりステップ827の候補変更入
力キー操作があると、本システムはあたかも接続検定に
失敗したかの如く、ステップS22に戻り他の自立語の
検索にかかる。又、ここでステップ828の部分確定入
力キー操作があると、先に抽出した自立語は正しいと判
断し、ステップ530においてi = 3にセットして
ステップS24に戻り、入力残余文字列中から接尾語を
抽出する処理に移る。そして、このモードに入りステッ
プ825において接尾語を除いた残余部分(付属語)と
先に確定した自立語間の接続検定に失敗するか。
Then, when the operator operates the candidate change input key in step 827, the system returns to step S22 and starts searching for another independent word as if the connection test had failed. Also, if there is a partial confirmation input key operation in step 828, it is determined that the independent word extracted earlier is correct, and i=3 is set in step 530, and the process returns to step S24, and the suffix is selected from the input remaining character string. Let's move on to the process of extracting words. Then, after entering this mode, in step 825, does the connection test between the remaining part (adjunct word) after removing the suffix and the previously determined independent word fail?

又は成功してもオペレータによりステップS27の他の
接尾語を検索する旨の指示(候補変更入カキ−による)
があると、本システムは他の接尾語候補を求めて上記と
同様の処理を行なう。ところで、自立語が部分的に確定
したか入力残余文字列に対するすべての接尾語、付属語
と自立語との間の接続検定に失敗した時は、先に部分確
定した自立語は正しいものとして処理する(但しこの場
合、先に部分確定させた自立語も誤りとしてs −r 
= 3に移行させてもよい。) ST=3では、ステップS34においてます入力文字列
の先頭部分に接頭語があるか否かの接頭語抽出に入る。
Or even if it is successful, the operator instructs to search for another suffix in step S27 (using the candidate change input key).
If there is, the system searches for other suffix candidates and performs the same process as above. By the way, when an independent word is partially confirmed or the connection test between all suffixes, adjuncts, and independent words in the input residual string fails, the independent word that was partially confirmed first is treated as correct. (However, in this case, the independent word that was partially determined earlier is also treated as an error and s −r
= 3. ) When ST=3, prefix extraction is started in step S34 to determine whether there is a prefix at the beginning of the input character string.

ここで、接頭語が存在しない時はかな漢字変換に失敗し
たものとしてかな漢字変換を終了する。一方、ステップ
S34において接頭語が発見されると、接頭語を除いた
入力かな文字列に対し、ステップS25において自立語
士付属語の接続検定に入る。ここで、候補となった接頭
語に対して自立語、付属語の接続検定に成功すると、ス
テップ526においてその結果を表示器(8)に出力す
る。ここで、ステップS27の候補変更入カキ−が押下
された時は他の接頭語候補を求め、その残余部分に対し
同様の処理を行なう。一方、ステップ828の部分確定
入カキ−か押下された時は先に抽出された接頭語は正し
いものとし、残余部分に対してS T:1と同じ処理を
行なう。
Here, if the prefix does not exist, it is assumed that the kana-kanji conversion has failed and the kana-kanji conversion is terminated. On the other hand, if a prefix is found in step S34, the input kana character string from which the prefix has been removed is tested for connection of independent linguists' adjuncts in step S25. Here, if the independent word and adjunct word connection test is successful for the candidate prefix, the result is outputted to the display (8) in step 526. Here, when the candidate change input key in step S27 is pressed, another prefix candidate is found and the same process is performed on the remaining part. On the other hand, when the partial confirmation key in step 828 is pressed, the previously extracted prefix is determined to be correct, and the remaining portion is subjected to the same processing as ST:1.

最後に、全ての接頭語、自立語の候補に対して接続検定
に失敗すると、s −r = 4に移行する。これは接
頭語士自立語士接尾語+付属語の構成について検定を行
なうものである。即ち、先ずステップS34において接
頭語を抽出し次にステップS22.S24において自立
語および接尾語をそれぞれ抽出しステップS25におい
て自立語士付属語の接続検定を行う。そして、ここで接
続検定に失敗すればそれはかな漢字変換に失敗したもの
であり、一方接続検定が良好であればステップS26に
おいて変換結果を出力し、ここでステップS29の確定
入カキ−の押下があればかな漢字変換は成功であり、ま
たステップ827あるいは828の候補変更入カキー2
部分確定入カキ−の押下があればそれぞれステップS3
4およびステップS22に戻り接頭語および自立語の再
抽出を行う。
Finally, if the connection test fails for all prefix and independent word candidates, the process moves to s - r = 4. This is an examination of the composition of prefix masters, independent language masters, suffixes + adjuncts. That is, first, the prefix is extracted in step S34, and then in step S22. In step S24, independent words and suffixes are extracted, and in step S25, a connection test of independent language expert adjunct words is performed. If the connection test fails here, it means that the kana-kanji conversion has failed.On the other hand, if the connection test is good, the conversion result is output in step S26, and if the confirmation key is pressed in step S29. The stupid kanji conversion was successful, and the candidate change input key 2 in step 827 or 828
If the partial confirmation key is pressed, step S3 is executed.
4 and step S22 to re-extract the prefix and independent word.

以上の、全ての処理の結果接続検定に失敗した時は、か
な漢字変換に失敗したものとしてステップ531aにお
いてその防出力すると共に全てを入力文字列のまま出力
する。又途中においてステップS29において確定入力
キー操作があればステップ529aにおいてカナ漢字変
換に成功し7た防出力すると共にその時の接頭語、自立
語、接尾語、付属語を漢字かな混り文で出力する。
If the connection test fails as a result of all of the above processing, it is assumed that the kana-kanji conversion has failed, and in step 531a, this is prevented and the entire input character string is output as is. Also, if there is a confirmation input key operation in step S29 during the process, in step 529a, the kana-kanji conversion is successful and the prefix, independent word, suffix, and attached word are output as a mixed sentence of kanji and kana. .

なお、上述のテーブル選択信号TSの切換え、入力文字
列から自立語部分を取除いた残余部分の文字列一致検出
回路(7)内のバッファレジスタ(11)へのセット及
び接尾語をも抽出した文字列の残余部分の接続検定回路
(6)へのセット等はすべて制御回路(2)にて制御さ
れる。
In addition, the above-mentioned switching of the table selection signal TS, setting of the remaining part after removing the independent word part from the input character string to the buffer register (11) in the character string match detection circuit (7), and extraction of the suffix were also carried out. The setting of the remaining part of the character string to the connection verification circuit (6), etc. are all controlled by the control circuit (2).

以上のようにこの発明によれば、接頭語、自立語、接尾
語の各候補の出現(抽出)にあたり、各々部分確定式カ
キ−を設け、この部分確定式カキ−を入力かな文字列中
に複数個存在しうる接頭語。
As described above, according to the present invention, when each candidate of a prefix, an independent word, and a suffix appears (extracts), a partially definite formula key is provided for each candidate, and this partially definite formula key is inserted into the input kana character string. A prefix that can exist multiple times.

自立語または接尾語のうちオペレータの意図するものを
それぞれ部分確定させるようにしたので、入力文字列を
、該文字列を構成する接頭語、自立語、接尾語の候補数
が各々p、p、p、・・・であっても、それらから構成
される文節をほぼP。+p、十p2+・・・又はそれ以
下の選択操作で容易に目的とするかな漢字混り文に変換
することができる効果がある。
Since the independent words or suffixes intended by the operator are partially determined, the input character string is divided into two groups, each with p, p, and suffix candidates, respectively. Even if p,..., the clause composed of them is almost P. +p, 10p2+, . . . or less can be easily converted into a desired sentence containing kana and kanji.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来装置で行われる処理を示すフローチャート
図、第2図は本発明の一実施例によるかな漢字変換処理
装置を示すブロック図、第3図は上記実施例装置で行わ
れる処理を示すフローチャート図、第4図は上記実施例
装置の文字列一致検出回路の一回路構成例を示すブロッ
ク図である。 (1)・・・かな文字入力部、部分確定入力手段、候補
変更入力手段(キーボード) 、+31・・・自立語テ
ーブル、(4)・・・接尾語テーブル、(5)・・・接
頭語テーブル、(7)・・・文字列一致検出回路、(6
)・・・接続検定回路、(2)・・・制御回路、(8)
・・・表示器。 なお図中同一符号は同−又は相当部分を示す。 代理人 葛野信− 第3図 第2図 第4図
FIG. 1 is a flowchart showing the processing performed by a conventional device, FIG. 2 is a block diagram showing a kana-kanji conversion processing device according to an embodiment of the present invention, and FIG. 3 is a flowchart showing the processing performed by the device of the above embodiment. FIG. 4 is a block diagram showing an example of the circuit configuration of the character string match detection circuit of the above embodiment device. (1)...Kana character input section, partial confirmation input means, candidate change input means (keyboard), +31...Independent word table, (4)...Suffix table, (5)...Prefix Table, (7)...Character string match detection circuit, (6
)... Connection verification circuit, (2)... Control circuit, (8)
···display. Note that the same reference numerals in the figures indicate the same or equivalent parts. Agent Makoto Kuzuno - Figure 3 Figure 2 Figure 4

Claims (1)

【特許請求の範囲】[Claims] (1)かな文字列を入力するためのかな文字入力部と、
自立語、接尾語および接頭語に関するかな−漢字変換対
を記憶している自立語、接尾語および接頭語テーブルと
、上記入力かな文字列における自立語、接尾語および接
頭語の候補が上記テーブルのそれぞれに存在する時該候
補を該テーブルから読み出し出力する文字列一致検出回
路と、後述する表示器に表示された上記文字列一致検出
回路べき指示を与えるための部分確定入力手段と、上記
表示器に表示された候補を変更すべき指示を与と 自立語、接尾語、接頭語を除いた付属語候i相互の接続
関係が文法的に正しいか否かを検定する接続検定回路と
、上記部分確定入力手段もしくは候補変更入力手段から
の指示あるいは上記接続検定回路の検定結果に応じて文
法的接続関係を満足しうる状態で上記自立語1.接尾語
あるいは接頭語の候補を必要に応じて他の候補に変更さ
せながらそれぞれ独立に確定する制御回路と、この制御
回路の出力であるかな漢字混り文を表示する表示器とを
備えたことを特徴とするかな漢字変換処理装置。
(1) A kana character input section for inputting a kana character string,
An independent word, suffix, and prefix table that stores kana-kanji conversion pairs related to independent words, suffixes, and prefixes, and candidates for independent words, suffixes, and prefixes in the above input Kana character string are stored in the above table. a character string match detection circuit that reads out and outputs the candidate from the table when it exists in each of the above characters; a partial confirmation input means for giving an instruction to the character string match detection circuit displayed on a display device to be described later; and the display device. a connection testing circuit that tests whether or not the connection relationship between adjunct word candidates i excluding independent words, suffixes, and prefixes is grammatically correct, and the above-mentioned part The above-mentioned independent words 1. It is equipped with a control circuit that independently determines the suffix or prefix candidates while changing them to other candidates as necessary, and a display that displays the output of this control circuit, which is a sentence containing kana and kanji. Features: Kana-Kanji conversion processing device.
JP56179519A 1981-11-06 1981-11-06 Kana (japanese syllabary)-chinese character conversion processor Granted JPS5880771A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56179519A JPS5880771A (en) 1981-11-06 1981-11-06 Kana (japanese syllabary)-chinese character conversion processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56179519A JPS5880771A (en) 1981-11-06 1981-11-06 Kana (japanese syllabary)-chinese character conversion processor

Publications (2)

Publication Number Publication Date
JPS5880771A true JPS5880771A (en) 1983-05-14
JPH0319579B2 JPH0319579B2 (en) 1991-03-15

Family

ID=16067196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56179519A Granted JPS5880771A (en) 1981-11-06 1981-11-06 Kana (japanese syllabary)-chinese character conversion processor

Country Status (1)

Country Link
JP (1) JPS5880771A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62251960A (en) * 1986-04-25 1987-11-02 Seiko Epson Corp Kana-kanji converting device
JPH0844730A (en) * 1995-05-08 1996-02-16 Seiko Epson Corp Japanese syllabary-chinese character converting device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62251960A (en) * 1986-04-25 1987-11-02 Seiko Epson Corp Kana-kanji converting device
JPH0844730A (en) * 1995-05-08 1996-02-16 Seiko Epson Corp Japanese syllabary-chinese character converting device

Also Published As

Publication number Publication date
JPH0319579B2 (en) 1991-03-15

Similar Documents

Publication Publication Date Title
JPS61150068A (en) Translating and editing device
JPH034946B2 (en)
GB2197510A (en) Translation apparatus
JPS5880771A (en) Kana (japanese syllabary)-chinese character conversion processor
JPS6118074A (en) Pre-editing system
JPS6026997A (en) Character phoneme converter
JPS59127139A (en) Sentence fault detecting and correcting device
JPS60195664A (en) Kana-to-kanji-converting system
JPS5818730A (en) Character processing device
JPS58103022A (en) Sentence input device
JPH0452963A (en) Japanese language morpheme analyzer
JPH05151256A (en) Machine translation method and its system
JPH0540750A (en) Automatic word punctuation inserting circuit
JPH0131229B2 (en)
JPS6172361A (en) Kana-to-kanji converter
JPH11224250A (en) Dictionary device
JPS59127150A (en) Sentence reading and checking device
JPS62271172A (en) Kana/kanji conversion processing system
JPH07121538A (en) Spelling checking device
JPH02309448A (en) Error detecting device
JP2895137B2 (en) Japanese sentence error automatic detection and correction device
JPH0544056B2 (en)
JPH08272798A (en) Japanese syllabary and chinese character convert device
JPS6097426A (en) Japanese input device
JPS59197929A (en) Device for processing "kana"-"kanji" conversion