JPS6398767A - Check system for chinese sentence - Google Patents

Check system for chinese sentence

Info

Publication number
JPS6398767A
JPS6398767A JP61245855A JP24585586A JPS6398767A JP S6398767 A JPS6398767 A JP S6398767A JP 61245855 A JP61245855 A JP 61245855A JP 24585586 A JP24585586 A JP 24585586A JP S6398767 A JPS6398767 A JP S6398767A
Authority
JP
Japan
Prior art keywords
character
chinese
phonetic
key
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61245855A
Other languages
Japanese (ja)
Inventor
Hidetoshi Ito
英俊 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61245855A priority Critical patent/JPS6398767A/en
Publication of JPS6398767A publication Critical patent/JPS6398767A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To check justice of a pin-in character string by comparing a specific character of a phonetic symbol string or the attribute of arrangement of >=2 specific characters with the spelling rule of phonetic symbols and deciding the justice of said phonetic symbol string when coincidence is obtained from said comparison. CONSTITUTION:In a process 11 a phonetic symbol, e.g., 'pin-in' of a Chinese language is supplied with a key and the attribute of the phonetic symbol is checked in a process 12. This attribute is compared with the spelling rule in a process 14. A process 16 is shifted to a process 18 and to a process 17 when the key-in justice is decided and not respectively. In the process 17 an alarm display is performed to point out an operating error; while the justice of a key-in phonetic symbol string is checked in the process 18 before the phonetic symbol character is converted into a Chinese character string. The arrangement of the 1st and 2nd characters of finals of a syllable consisting of initials and finals is extracted. The type of the 2nd character is limited by the type of the 1st character and therefore the wrong key-in actions are excluded. Then it is possible to exclude the wrong key-in actions by making use of a fact that the 1st character of the finals following to a specific initials.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は中国文(以下、中文という。)入力チェック方
式、特に中文入力において中国語の表音文字列の正当性
をチェ、りする中文入力チェック方式に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a Chinese text (hereinafter referred to as "Chinese text") input check method, particularly a Chinese text method for checking the validity of Chinese phonetic character strings in Chinese text input. Regarding input checking method.

〔従来の技術〕[Conventional technology]

中国語文を処理する情報処理システムにおいては中文入
力装置が必須である。このような中文入力装置の入力方
式としては一般に中国語文字をその形態や読み方、ある
いはそれらを組合せてコード化する方法が行なわれてい
る。
A Chinese input device is essential in an information processing system that processes Chinese sentences. As an input method for such a Chinese input device, a method is generally used in which Chinese characters are encoded based on their form, reading method, or a combination of these.

中国語の読み方を表わす表音文字には中国政府が制定し
た併音(ピンイン)と、それが判定される以前から使用
されていた往昔とがある。現在の中国ではピンインが主
流となっておシ、往昔は主として台湾などの一部の地域
に限られている。
There are two types of phonetic characters that represent the reading of Chinese: pinyin, which was established by the Chinese government, and pinyin, which was used in the past even before pinyin was established. Pinyin is the mainstream in China today, but in the past it was mainly limited to some regions such as Taiwan.

上記のピンインによる記述に従って入力しそれを中国語
文に変換する中文入力装置においては、ピンイン字母を
1つずつキーインする方法または声母キーおよび韻母キ
ーを設は原則として2回のキータッチによって1音節を
キーインする方法があり、いずれも数十個程度のキーに
よって膨大な種類の中国語文字を入力できるようにして
いる。
In a Chinese input device that inputs data according to the Pinyin description described above and converts it into Chinese sentences, one method is to key in Pinyin characters one by one, or to set a voice initial key and a rhyme final key. There is a key-in method, and each method allows you to enter a huge variety of Chinese characters using about a dozen keys.

しかしながらピンインによる中国語の記述には同類の発
音や類似の発音を区別する規則や実際には存在しない音
節についての禁則などがあり、キーボードを自由に操作
して高速に中文入力するにはピンインに関する豊富な知
識と熟練を必要とする。すなわちピンインによる中文入
力装置は中国人にとっても容易に使いこなせるものでは
ないという欠点がある。さらにピンインや中国に関する
知識の乏しい外国人にとってはほとんど役に立たないと
いうことができる。
However, when writing Chinese using Pinyin, there are rules for distinguishing between similar or similar pronunciations, and prohibitions against syllables that do not actually exist. Requires extensive knowledge and skill. In other words, the pinyin-based Chinese input device has the disadvantage that it is not easy to use even for Chinese people. Furthermore, it can be said to be of little use to foreigners who have little knowledge of Pinyin or China.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

本発明が解決しようとする問題点、換言すれば本発明の
目的はキーインしたピンイン文字列の正当性をチェック
することによって曖昧な入力を排除して上記の欠点を改
善する中文入力チェック方式を提供することにある。
The problem to be solved by the present invention, in other words, the purpose of the present invention is to provide a Chinese input checking method that eliminates ambiguous input by checking the validity of the keyed-in Pinyin character string and improves the above drawbacks. It's about doing.

〔問題点を解決するための手段〕[Means for solving problems]

本発明の中文入力チェック方式は、中国語の表音文字列
を中国文字列に変換する場合などに前記表音文字列の正
当性をチェックする中文入力チェック方式において、前
記表音文字列の特定の文字の属性または特定の二文字以
上の並びの属性を抽出して前記属性と表音文字の綴字規
則とを比較する手段と、前記手段によって両者が一致し
たときに前記表音文字列が正当であると判断する手メミ
とを具備して構成される。
The Chinese input checking method of the present invention is a Chinese input checking method for checking the validity of the phonetic string when converting a Chinese phonetic string into a Chinese character string. means for extracting the attributes of characters or the attributes of a specific sequence of two or more characters and comparing the attributes with spelling rules for phonetic characters; and when the two match by the means, the phonetic string is valid. It is configured with a hand memi that determines that it is.

〔実施例〕〔Example〕

以下、本発明による中文入力チェック方式について図面
を参照しながら説明する。
Hereinafter, the Chinese input checking method according to the present invention will be explained with reference to the drawings.

第1図は本発明の処理手JIQの概要を示す流れ図であ
る。処理11は中国語の表音文字(たとえばピンイン)
をキーインする操作であり、処理12は上記の表音文字
の属性を調査する。こ輩で属性とは声母/韻母、字種の
特長などであシ、詳細を後述する。上記の属性は属性情
報ファイル13に格納されている。
FIG. 1 is a flowchart showing an overview of the processing method JIQ of the present invention. Process 11 is Chinese phonetic characters (for example, Pinyin)
This is an operation of keying in , and the process 12 investigates the attributes of the above-mentioned phonetic characters. Attributes include initials/finals, features of character types, etc., details of which will be described later. The above attributes are stored in the attribute information file 13.

処理14は上記の属性を綴字規則と比較する。Process 14 compares the above attributes with spelling rules.

綴字規則は綴字規則ファイル15に格納されている。The spelling rules are stored in a spelling rule file 15.

処理16は上記の比較結果の判断を示し、キーインが正
しいと判断したときには処理18に移行し、不正と判断
したときには処理17に移行する。
Process 16 indicates a judgment based on the above comparison results, and when it is determined that the key-in is correct, the process moves to process 18, and when it is judged that the key-in is incorrect, the process moves to process 17.

処理17は操作の誤りを指摘して正しいキーインを促が
すアラーム表示であシ、処理18は続けて次の表音文字
をキーインするか、または中国語文字への変換動作を指
示する。
Process 17 is an alarm display that points out the error in operation and prompts correct key-in, and process 18 instructs to continue key-in the next phonetic character or to instruct conversion to Chinese characters.

このような中文入力チェック方式は表音文字列を中国語
文字列に変換する以前に、キーインされた表音文字列の
正当性をチェックする。中国語の音節は一般に「声母+
韻母」で構成されるが、声母がない「韻母」のみの音節
も若干存在する。しかし「声母」のみの音節や「声母+
声母」の音節は存在しない。したがって声母のキーイン
に関するチェックとしては声母を二個以上続けてキーイ
ンすることを排除することであシ、具体的にはローマ字
入力式の日本語ワードプロセッサにおいては最後にキー
インした文字のみを有効とするようKして既に実施され
ている。そしてこの方法はピンインによる中文入力のチ
ェックについても活用できる。
This Chinese input checking method checks the validity of a keyed-in phonetic string before converting the phonetic string into a Chinese character string. Chinese syllables are generally expressed as
There are some syllables that are composed of the final word, but there are also some syllables that only have the final word. However, some syllables with only a “voice initial” or “voice initial +
There are no syllables with the ``vocal mother''. Therefore, as a check regarding the key-in of initials, it is necessary to exclude the key-in of two or more initials in succession, and specifically, in Japanese word processors that use Roman alphabet input, only the last keyed-in character should be valid. K has already been implemented. This method can also be used to check Chinese input using Pinyin.

第2図は「声母+韻母」で構成される音節の韻母につい
てその第一文字と第二文字の並びを抽出した一覧を示す
。同図において第一文字11Ca、、o。
FIG. 2 shows a list of the extracted sequences of the first and second letters of the finals of syllables consisting of "vocal initial + final". In the figure, the first characters 11Ca,,o.

e、i、u、およびUの6種であシ、これらに続く第二
文字は2〜4種である。すなわち第一文字の種類に従っ
て第二文字の種類が限定されるので、この特長を利用し
て不正なキーインを排除する。
There are six types: e, i, u, and U, and there are two to four types of second letters following these. In other words, since the type of the second character is limited according to the type of the first character, this feature is utilized to eliminate unauthorized key-ins.

なおピンインによる中国語音節の表示uei 、uen
In addition, the display of Chinese syllables in Pinyin is uei, uen.
.

およびuengは声母に連なる実際の音節記述ではそれ
ぞれui、un、およびwengである。これについて
は()内に示す。したがって大刀チェックは()内の韻
母記述について行なうようにする。
and ueng are ui, un, and weng, respectively, in the actual syllable descriptions that follow the initial. This is shown in parentheses. Therefore, the long sword check should be performed on the final description in parentheses.

第3図は「韻母」のみで構成される音節について声母が
ない場合に記述を異にするものを抽出した一覧を示す。
FIG. 3 shows a list of extracted syllables that have different descriptions when there is no initial for syllables that consist only of a "final".

同図において第一文字がi 、u。In the figure, the first letter is i, u.

またはi゛の韻母はそのま\の記述で「韻母」のみの音
節となることはない。すなわちiはyiK。
Or, if the final word of i゛ is written as \, it will not be a syllable consisting only of the final word. In other words, i is yiK.

Uはwuに、Uはyuに変更になる(一部に不規則なも
のもある。)。このような音節のyまたはWを除いた部
分について第2図の特長が存在する。
U is changed to wu, and U is changed to yu (some of them are irregular). The features shown in FIG. 2 exist for the parts of such syllables excluding y or W.

したがってyまたはWが第一文字の音節はyまたはWを
除いた部分を韻母と見なすことによって上述のチェック
全行なうことができる。なおongは単独で音節になる
ことはない。
Therefore, for syllables where y or W is the first letter, all of the above checks can be carried out by regarding the part excluding y or W as the final word. Note that ong cannot be a syllable by itself.

第4図は特定の声母に続く韻母の第一文字は限定される
ことを示す。すなわち声母j、qまたはXに続く韻母の
第一文字はiまたはUに限られる。
FIG. 4 shows that the first letter of the final that follows a particular initial is limited. In other words, the first letter of the final after the initial j, q or X is limited to i or U.

さらに声母g+kまたはhに続く韻母の第一文字はa、
e、oまたはUである。したがってこのような特長を利
用して不正なキーインを排除することができる。
Furthermore, the first letter of the final after g+k or h is a,
e, o or U. Therefore, by utilizing such features, unauthorized key-in can be eliminated.

第5図は上述の中文入力チェック方式の動作手順を示す
流れ図である。同図において処理31は入力部lを操作
して声母または韻母をキーインする動作を示す。そして
処理32はキーインされたピンインが声母か、韻母かを
判断し、声母のときは処理33へ、韻母のときは処理4
1へそれぞ扛移行する。
FIG. 5 is a flowchart showing the operation procedure of the above-mentioned Chinese input checking method. In the figure, process 31 indicates an operation of keying in a vocal initial or a rhyming final by operating the input unit l. Processing 32 then determines whether the keyed-in pinyin is a vocal initial or a rhyming final, and if it is a vocal initial, the process goes to processing 33, and if it is a rhyming final, processing goes to process 4.
1 respectively.

処理33は処理31においてキーインした声母をチェッ
クし、それがj、q%またはXのときは処理34へ、そ
れが他の声母のときは処理36へそれぞれ移行する。そ
しそ処理34は上記のj。
Process 33 checks the initial keyed in in process 31, and if it is j, q% or The process 34 is the above j.

q%またはXに続く韻母をキーインする。さらに処理3
5は処理34においてキーインした韻母の第一文字をチ
ェックし、それがitたはUのときは処理45へ移行し
、それが他の文字のときには正しい韻母のキーインを促
がすアラームを表示して処理34へ戻る。
Key in the final word following q% or X. Further processing 3
Step 5 checks the first character of the final word keyed in in process 34, and if it is it or U, the process moves to process 45, and if it is any other character, an alarm is displayed to prompt the user to key in the correct final character. Return to process 34.

処理36は処理37においてキーインした声母をチェッ
クし、それがgsk−またはhのときは処理37へ、そ
れがJ tqsX sg *に1またはh以外のときは
処理39へそれぞれ移行する。そして処理37は上記の
g、に%またはhに続く韻母をキーインする。さらに処
理38は処理37においてキーインした韻母の第一文字
をチェ、りし、それがa、e、o、またはUのときは処
理45へ移行し、それが他の文字のときKは正しい韻母
のキーインを促がすアラームを表示して処理37へ戻る
Process 36 checks the initial keyed in in process 37, and if it is gsk- or h, the process goes to process 37, and if it is other than 1 or h in J tqsX sg *, the process goes to process 39. Then, in step 37, the final word following % or h is keyed into g. Furthermore, process 38 checks the first letter of the final word that was keyed in in process 37, and if it is a, e, o, or U, the process moves to process 45, and if it is any other character, K is the correct final character. An alarm prompting key-in is displayed and the process returns to step 37.

同様にして処理39はj tqsX sg skiまた
はh以外の声母に続く韻母をキーインする。そして処理
40は処理39においてキーインした韻母の第一文字を
チェ、りし、それが正当であるときは処理45−\移行
し、正当でないときは正しい韻母のキーインを促がすア
ラームを表示して処理39へ戻る。
Similarly, the process 39 keys in the final that follows the initial other than j tqsX sg ski or h. Then, a process 40 checks the first character of the final word that was keyed in in the process 39, and if it is valid, moves to process 45-\, and if it is not valid, displays an alarm to prompt the user to key in the correct final character. Return to process 39.

処理45は上記のようにしてキーインした韻母をチェッ
クし、それが−文字のときは処理48へ、それが二文字
以上のときは処理46へそれぞれ移行する。
Process 45 checks the final keyed in as described above, and if it is a - character, the process goes to process 48, and if it is two or more characters, it goes to process 46.

処理46は韻母の第一文字および第二文字の組合せを調
べてその正当性をチェックする。そして処理47は上記
の二文字の並びを正当と判断したときは処理48へ、正
当で逢いときは処理31へそれぞれ移行する。なお処理
48は一音節のキーインとチェ、りを終了した後の次の
操作を示す。
Process 46 examines the combination of the first and second letters of the final to check its validity. When the process 47 determines that the above-mentioned two-character sequence is valid, the process proceeds to process 48, and when the sequence is valid, the process proceeds to process 31. Process 48 indicates the next operation after completing the key-in and check-in of one syllable.

処理41は処理31においてキーインしたピンインが韻
母のときそれをチェ、りし、それがongであるか、ま
たはその第一文字がi 、u、またはiのときには正し
い韻母のキーインを促がすアラームを表示して処理31
へ戻る。モして韻母のチェ、り結果が上記以外のときに
は処理42へ移行する。
Process 41 checks the pinyin keyed in in process 31 when it is the final word, and when it is ong or the first character is i, u, or i, an alarm is generated to prompt the user to key in the correct final word. Display and process 31
Return to If the final result is other than the above, the process moves to step 42.

処理42は処理31においてキーインした韻母を再びチ
ェックし、その第一文字がytたはWのときは処理43
へ、それがyまたはW以外のときは処理45へそれぞれ
移行する。
Process 42 checks the final keyed in in process 31 again, and if the first character is yt or W, process 43
, if it is other than y or W, the process moves to step 45, respectively.

処理43は上記の第一文字のyまたはWを除いた部分を
韻母と見なす処理であシ、処理44は処理43において
韻母と見なした文字列をチェックし、その第一文字がa
、e、i、o、またはUのときは処理45へ移行し、そ
れが上記と異なるときは正しい韻母のキーインを促がす
アラームを表示して処理31へ戻す。処理45以降は既
述の通シであシ、声母會有する音節の韻母と同じチェッ
クを行なう。
Process 43 is a process in which the part of the first character excluding y or W is regarded as the final part, and process 44 is a process in which the character string regarded as the final part in process 43 is checked, and the first character is a.
, e, i, o, or U, the process moves to step 45, and if it is different from the above, an alarm is displayed to prompt the user to key in the correct final word, and the process returns to step 31. In the process 45 and subsequent steps, the same checks as for the final of syllables having a vocal initial meeting are carried out in accordance with the above-mentioned routine.

〔発明の効果〕〔Effect of the invention〕

以上、詳細に説明したように本発明の中文入力チェック
方式によればキーインしたビンイン文字列の特長を利用
してその正当性をチェックしているので、曖昧なキーイ
ン操作を排除して正しい中文入力を行なうことができる
という効果がある。
As explained in detail above, according to the Chinese input checking method of the present invention, the validity of the keyed-in character string is checked using the features of the keyed-in character string, so ambiguous key-in operations are eliminated and Chinese input is correct. It has the effect of being able to do the following.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明による中文入力チェック方式の一実施例
の概要を示す流れ図、第2図〜第4図はピンイン文字列
の並びの特長を抽出した説明図、第5図は中文入力チェ
ック方式の動作手順を示す流れ図である。 12・・・・・・属性抽出手段、14・・・・・・比較
手段、第 1図 第 Z図 消4図
Figure 1 is a flowchart showing an overview of an embodiment of the Chinese input checking method according to the present invention, Figures 2 to 4 are explanatory diagrams extracting the features of the arrangement of Pinyin character strings, and Figure 5 is the Chinese input checking method 2 is a flowchart showing the operating procedure. 12... Attribute extraction means, 14... Comparison means, Figure 1, Figure Z, erased Figure 4

Claims (4)

【特許請求の範囲】[Claims] (1)中国語の表音文字列を中国1文字列に変換する場
合などに前記表音文字列の正当性をチェックする中文入
力チェック方式において、 前記表音文字列の特定の文字の属性または特定の二文字
以上の並びの属性を抽出して前記属性と表音文字の綴字
規制とを比較する手段と、前記手段によって両者が一致
したときに前記表音文字列が正当であると判断する手段
とを具備したことを特徴とする中文入力チェック方式。
(1) In a Chinese input check method that checks the validity of the phonetic string when converting a Chinese phonetic string into a Chinese 1 character string, the attributes of specific characters in the phonetic string or means for extracting attributes of a specific sequence of two or more characters and comparing the attributes with spelling regulations for phonetic characters; and determining that the phonetic character string is valid when the two match by the means; A Chinese input checking method characterized by comprising means.
(2)鎖骨の第一文字および第二文字の並びを表音文字
の綴字規制と比較する手段を具備したことを特徴とする
特許請求の範囲第一項記載の中文入力チェック方式。
(2) The Chinese input checking method according to claim 1, further comprising means for comparing the arrangement of the first and second letters of the clavicle with the spelling regulations of phonetic characters.
(3)表音文字の綴字規制において存在しない鎖骨を排
除する手段を具備したことを特徴とする特許請求の範囲
第一項または第二項記載の中文入力チェック方式。
(3) The Chinese input checking method according to claim 1 or 2, characterized in that the method includes means for excluding non-existent clavicle bones in the spelling regulation of phonetic characters.
(4)特定の声母に続く韻母の第一文字は特定の文字で
あることを利用して表音文字列の正当性をチェックする
手段を具備したことを特徴とする特許請求の範囲第一項
、第二項または第三項記載の中文入力チェック方式。
(4) Claim 1, characterized by comprising means for checking the validity of the phonetic character string by utilizing the fact that the first letter of the rhyming final following a specific initial is a specific character; Chinese input check method described in paragraph 2 or 3.
JP61245855A 1986-10-15 1986-10-15 Check system for chinese sentence Pending JPS6398767A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61245855A JPS6398767A (en) 1986-10-15 1986-10-15 Check system for chinese sentence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61245855A JPS6398767A (en) 1986-10-15 1986-10-15 Check system for chinese sentence

Publications (1)

Publication Number Publication Date
JPS6398767A true JPS6398767A (en) 1988-04-30

Family

ID=17139839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61245855A Pending JPS6398767A (en) 1986-10-15 1986-10-15 Check system for chinese sentence

Country Status (1)

Country Link
JP (1) JPS6398767A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6048533A (en) * 1983-08-26 1985-03-16 Toshiba Corp Language input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6048533A (en) * 1983-08-26 1985-03-16 Toshiba Corp Language input device

Similar Documents

Publication Publication Date Title
US7802184B1 (en) Method and apparatus for processing text and character data
CN1779783B (en) Generic spelling mnemonics
JP2004046807A (en) Multi-modal input of ideographic language
WO2007002377A2 (en) Handwriting recognition using neural networks
CN101133411A (en) Fault-tolerant romanized input method for non-roman characters
Na Conditional random fields for Korean morpheme segmentation and POS tagging
CN112002323A (en) Voice data processing method and device, computer equipment and storage medium
US9965045B2 (en) Chinese input method using pinyin plus tones
CN113642316A (en) Chinese text error correction method and device, electronic equipment and storage medium
JPS6398767A (en) Check system for chinese sentence
JPH08166966A (en) Dictionary retrieval device, database device, character recognizing device, speech recognition device and sentence correction device
JP3274014B2 (en) Character recognition device and character recognition method
KR102550868B1 (en) verification system for achievements of faculty
CN117764694A (en) Risk account identification method, apparatus, electronic device and storage medium
JP2001109740A (en) Device and method for preparing chinese document
JPH0441399Y2 (en)
JP2989387B2 (en) Term recognition device and term recognition method in input character processing device
CN115270769A (en) Text error correction method and device, electronic equipment and storage medium
JPS63153669A (en) Translation system from japanese sentence into chinese sentence
JPH0441398Y2 (en)
JP3344793B2 (en) Kana-Kanji conversion device
JPH03244071A (en) Document proofreading back-up system
JPS6120176A (en) Roman character/chinese character converter
JPH06103457B2 (en) Voice typewriter
JPS6356756A (en) Western language preparing device with correcting function