JPH0625990B2 - 中文自動区切入力方式 - Google Patents

中文自動区切入力方式

Info

Publication number
JPH0625990B2
JPH0625990B2 JP61310885A JP31088586A JPH0625990B2 JP H0625990 B2 JPH0625990 B2 JP H0625990B2 JP 61310885 A JP61310885 A JP 61310885A JP 31088586 A JP31088586 A JP 31088586A JP H0625990 B2 JPH0625990 B2 JP H0625990B2
Authority
JP
Japan
Prior art keywords
syllable
scanning
chinese
syllables
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61310885A
Other languages
English (en)
Other versions
JPS63163570A (ja
Inventor
英俊 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61310885A priority Critical patent/JPH0625990B2/ja
Priority to CN87101277.4A priority patent/CN1006093B/zh
Publication of JPS63163570A publication Critical patent/JPS63163570A/ja
Publication of JPH0625990B2 publication Critical patent/JPH0625990B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は中国語文(以下、中文という。)自動区切入力
方式、特に表音文字列を区切りながら中国語列に変換す
る中文自動区切入力方式に関する。
〔従来の技術〕
中国語文を処理する情報処理システムにおいては中文入
力装置が必須である。このような中文入力装置の入力方
式としては一般に中国語文字をその形態や読み方、ある
いはそれらを組合せてコード化する方法が行なわれてい
る。
中国語の読み方を表わす表音文字には中国政府が判定し
と、それが判定される以前から使用されていた注音とが
ある。現在の中国ではピンインが主流となっており、注
音は主として台湾などの一部の地域に限られている。
上記のピンインによる記述に従って中国語文を入力する
とき、一般に声母キーおよび韻母キーに各1回タッチす
ることによって中国語1音節(すなわち中国語1文字)
をキーインする方法がある。この方法によれば単純な走
査の繰返しによってピンインをキーインすることができ
るが、ピンイン文字列を単語または有意の語列に区切る
ための手段を設ける必要がある。すなわち中文入力装置
はピンイン文字列の区切りを単位としてピンイン文字を
中国語文字に変換する。
従来、上記の区切りとして句読点など(中国語では標点
符号という。)が使用されるが、変換のための区切りと
しては句読点のみでは不十分である。すなわち句読点の
みでは区切りの間隔が長くなり過ぎることが多いので、
ピンイン文字列を中国語文字列に変換(たとえば一括連
語変換)するとき区切区間の前部で発生した語区切の誤
りがその後部に順次波及してさらに語区切の誤りが増加
したりする。したがって変換処理時間が長くなり効率的
な中文入力を期待できないという欠点がある。
上記の欠点を補うためには区切キーを設け、句読点以外
の任意の音節において区切りを指示できるようにしてい
る。しかしながらこの方法ではオペレータは区切キーの
操作を常に意識する必要があるので、ピンインによるキ
ーインの流れを乱して能率低下の原因となっている。
〔発明が解決しようとする問題点〕
本発明が解決しようとする問題点、換言すれば本発明の
目的はキーインした表音文字に従って変換辞書を検索し
ながら句読点以外の区切りを決定するようにして上記の
欠点を改善した中文自動区切入力方式を提供することに
ある。
〔問題点を解決するための手段〕
本発明の中文自動区切入力方式は、ピンイン文字列を走
査する走査窓の大きさをそれぞれ連続した4音節、3音
節、2音節、または1音節に順次に変更する手段と、前
記走査窓によって前記ピンイン文字列を1音節ずつシフ
トしながら走査する手段と、前記走査窓が示すピンイン
文字列をキーとして中国語辞書を検索する手段とを有
し、前記走査窓の大きさを1音節ずつ変更し走査位置を
1音節ずつシフトしながら前記の走査と検索を繰り返
し、前記中国語辞書に4音節の該当語が存在するときは
前記該当語を確定語とし、前記中国語辞書に3音節語ま
たは2音節語の複数個の該当語が存在するときは前記複
数個の該当語を全て候補語とし、前記候補語の特定の音
節が2語以上の候補語に重なって存在するとき、または
同音異字語が存在するときには、それらをすべて表示し
てオペレータがそれらの中から最適な1語または2語以
上の組合せを選択して確定語とすることを特徴とする。
〔実施例〕
以下、本発明の中文自動区切入力方式について図面を参
照しながら説明する。
第1図は本発明の第一の実施例を示す概要ブロック図で
ある。同図において中文自動区切入力方式1は処理10
によってキーインした表音文字列を長さを変更できる走
査窓から走査する処理11と、上記走査窓から見える長
さの表音文字列を1語として中国語辞書16を検索する
処理12と、上記の中国語辞書に該当語があったときそ
れを一時記憶する処理13と、表音文字列を走査する位
置を一音節ずつシフトする処理14と、走査窓の長さを
一音節ずつ変更する処理15とを有して構成されてい
る。なお処理17は上記のようにして検索し一時記憶し
た中国語列を順次に読出し、キーインした表音文字列に
対応して組立て表示する。
第2図(a)〜(d)は上記の中文自動区切入力方式1の動作
を示す流れ図である。同図(a)においてステップ21で
キーインしたピンインを入力バッファに格納する(ステ
ップ22)。ステップ23は上記の入力バッファから連
続する4音節を読出す。そしてステップ24はその4音
節をキーとして変換辞書25を検索する。変換辞書2語
はピンイン文字列と中国語文字列との対応を示すテーブ
ルである。続いてステップ26は上記の検索において変
換辞書の中に対応する中国語列があったか否かを判断す
る。そしてそのような該当語がないときにはステップ2
9に移行し、該当語があったときにはステップ27に移
行する。ステップ27は上記の該当語とそれのピンイン
文字列における位置を記憶する。続いてステップ28は
4音節をキーとする検索が終了したか否かを判断する。
そしてそれが終了していないときにはステップ29へ移
行し、終了しているときにはステップ23a(第2図
(b)参照)へ移行する。
ステップ29は入力バッファのなかのピンイン文字列か
ら上記の4音節を読出す位置を一音節だけシフトしてス
テップ23へ戻り、上述の検索動作をピンイン文字列の
最後まで繰返えす。
このようにして4音節をキーとする検索を終了したとき
続いて3音節をキーとする検索を開始する。
第2図(b)は3音節をキーとする検索の処理手順を示す
流れ図である。同図においてステップ23aは上記の検
索によってヒットした部分を除いて入力バッファから連
続する3音節を読出す。そしてそのあと上記の4音節を
キーとする検索と同様にして3音節をキーとする検索を
繰返えし、ステップ28aが3音節をキーとする検索が
終了したことを判断したときステップ23b(第2図
(c)参照)へ移行する。
このようにして3音節をキーとする検索を終了したとき
続いて2音節をキーとする検索を開始する。
第2図(c)は2音節をキーとする検索の処理手順を示す
流れ図である。同図においてステップ23bは4音節語
としてヒットした部分を除いて入力バッファから連続す
る2音節を読出す。そしてそのあと上記の4音節または
3音節をキーとする検索と同様にして2音節をキーとす
る検索を繰返えし、ステップ28bが2音節をキーとす
る検索が終了したことを判断したときステップ30(第
2図(d)参照)へ移行する。
上述のようにして4音節、3音節、および2音節をそれ
ぞれキーとする検索を終了する。
第2図(d)は1音節語の処理と該当語の組立を示す流れ
図である。同図においてステップ30は上述までの検索
で該当語に含まれなかった音節を入力バッファから読出
し、それを1字語として検索する。ステップ31は該当
語とそれのピンイン文字列における位置を一時記憶す
る。
ステツプ32は上記のようにして一時記憶した該当語を
読出し、最初にキーインしたピンイン文字列を対応する
中国語文字列に組立てる。このとき2語以上の該当語に
含まれる音節が存在する場合にはそれらの該当語を候補
語なして列挙する。
ステップ33は上記のようにして組立てた中国語文字列
を表示する。そしてステップ34は表示された中国語文
字列のなかに上記の候補語や同音語があるときにはオペ
レータがその選択を行なうことを示す。
つぎに中文入力の具体的な例に従って上記の中文自動区
切入力方式の処理動作を説明する。
第3図は中国語文とそのピンインによる記述を示す。同
図において(A)欄は入力したい中国語文であり、実際に
はピンインによって(B)欄に示すようにキーインする。
通常、中文入力では句読点をキーインすることによって
その直前までにキーインしたピンイン文字列を中文文字
列に変換することを開始するので、本例では第十九音節
までキーインしたとき自動区切動作を開始する。
第4図(a)〜(d)は可変長の走査窓によるピンイン文字列
の走査と変換辞書の検索結果を示す。同図(a)は4音節
の走査窓による走査と検索の結果である。第3図の(B)
欄に示したピンイン文字列を左端の第一音節から一音節
ずつシフトしながら4音節を単位として走査と検索を繰
返えす。このとき第五音節から第八音節までの4音節語
が変換辞書の検索によってヒットするので、その位置と
中国語文字列を記憶する。上記のようにして4音節窓に
よる走査と検索を第十九音節まで実行したとき、b部に
4音節語が1個存在し他のa部およびc部には存在しな
いことがわかる。
第4図(b)は上記のa部とc部について3音節の走査窓
による走査と検索の結果である。なおb部は4音節語と
して確定し3音節以下の走査窓による走査と検索は行な
わない。3音節を単位として走査と検索を繰返えしたと
き、a1部の3音節語がヒットし他のa2部およびc部
ではヒットしない。ヒットした中国語文字列とその位置
を記憶しておく。
第4図(c)はa部とc部について2音節の走査窓による
走査と検索の結果である。なおa部には3音節語がヒッ
トしているが一般に2音節語が存在する確度も高いの
で、2音節窓による走査と検索も行なう。a部とc部つ
いて2音節を単位として走査と検索を繰返えしたとき、
それぞれc2部、c4部、c5部、およびc7部の各2
音節語がヒットし、a部、c1部、c3部、およびc6
部はヒットしない。上記と同様にしてヒットした中国語
文字列とその位置を記憶しておく。
第4図(d)は前述の処理によってヒットしなかった部分
について1音節の走査窓による走査と検索の結果であ
る。すなわちa2部、c1部、c3部、およびc6部に
ついて1字語として検索するので多数の同音字が存在す
るが、同図ではオペレータが最終的に選択すべき文字を
示す。
上記のようにして検索しヒットした中国語を組立てるこ
とによって第3図の(A)欄に示した中国語文を第一文字
から第十九文字まで入力することができる。第二十文字
以降についても上記と同様な操作によって順次に中文入
力できる。
第5図は本発明による中文自動区切入力方式の第二の実
施例を示す概要ブロック図である。同図において中文自
動区切入力方式1aは中国語を1字語、2字語、3字
語、および4字語に分類して編集した変換辞書16aを
備えている。他の構成要素は第1図に示した第一の実施
例と同様である。中国語を上記のように分類して変換辞
書16aを構成することによって走査窓の長さに対応し
て検索範囲を限定することができるので、より高速な中
文自動区切入力方式を実現することができる。
またそれぞれの辞書部の表記部分は固定長となるので、
辞書の構造および検索のロジックを単純にすることがで
き迅速な中文入力に寄与する。
中国語の単語数は1字語を除くと2字語、3字語、4字
語の順に多い。5文字以上の語は地名などの固有名詞以
外にはほとんどなく、あっても2字語や3字語などを組
合せた合成語が多い。また4字語には同音異字語が皆無
といえるので、それによる区切りにはミスがないと考え
てよい。
したがって前述の実施例では最初に4音節窓によってピ
ンイン文字列を走査し、これをキーにして変換辞書を検
索する。そして該当する4字語があればそれを確定し、
残りの部分のピンイン文字列については3音節窓および
2音節窓によって走査と検索を順次に行なう。この場合
には特定の音節が2語以上の該当語に重なってヒットす
ることがあるので、そのときにはそれらを候補語として
留保する。次にこれらの処理によって残った部分を1音
節窓によって走査し検索する。このときには多数の同音
語が存在することが多いので、それらを同音語として留
保する。上記の走査と検索を終了後、当初のピンイン文
字列に対応する中文文字列を組立てる。このとき上記の
候補語や同音語を列挙して表示し、オペレータが区切り
工合を見ながら適切な語を選択して中文を完成させる。
〔発明の効果〕 以上、詳細に説明したように本発明の中文自動区切入力
方式によれば走査窓の長さを変更しながら表音文字列を
走査すると共に変換辞書を検索して中文文字列に変換す
るので、オペレータは中国語文の区切りに配慮しないで
表音文字列をキーインできるという効果がある。したが
ってオペレータの負担を軽減するので、迅速な中文入力
を期待できる。
【図面の簡単な説明】
第1図は本発明による中文自動区切入力方式の第一の実
施例を示す概要ブロック図、第2図(a)〜(d)はその動作
を示す流れ図、第3図は処理の具体例を示す説明図、第
4図は第3図の具体例の処理手順を示す説明図、第5図
は本発明の第二の実施例を示す概要ブロック図である。 1…中文自動区切入力方式、11…走査手段、12…検
索手段、14…シフト手段、15…走査窓変更手段、1
6…変換辞書。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】ピンイン文字列を走査する走査窓の大きさ
    をそれぞれ連続した4音節、3音節、2音節、または1
    音節に順次に変更する手段と、 前記走査窓によって前記ピンイン文字列を1音節ずつシ
    フトしながら走査する手段と、 前記走査窓が示すピンイン文字列をキーとして中国語辞
    書を検索する手段とを有し、 前記走査窓の大きさを1音節ずつ変更し走査位置を1音
    節ずつシフトしながら前記の走査と検索を繰り返し、前
    記中国語辞書に4音節の該当語が存在するときは前記該
    当語を確定語とし、前記中国語辞書に3音節語または2
    音節語の複数個の該当語が存在するときは前記複数個の
    該当語を全て候補語とし、前記候補語の特定の音節が2
    語以上の候補語に重なって存在するとき、または同音異
    字語が存在するときには、それらをすべて表示してオペ
    レータがそれらの中から最適な1語または2語以上の組
    合せを選択して確定語とすることを特徴とする中文自動
    区切入力方式。
  2. 【請求項2】ピンイン文字列を走査する走査窓の大きさ
    をそれぞれ連続した4音節、3音節、2音節、または1
    音節に順次に変更する手段と、前記走査窓によって前記
    ピンイン文字列を1音節ずつシフトしながら走査する手
    段と、前記走査窓が示すピンイン文字列をキーとして中
    国語辞書を検索する手段とを有する中文自動区切入力方
    式において、 前記中国語辞書を4字語群、3字語群、2字語群、およ
    び1字語群に分類して構成した特許請求の範囲第一項記
    載の中文自動区切入力方式。
JP61310885A 1986-12-25 1986-12-25 中文自動区切入力方式 Expired - Lifetime JPH0625990B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61310885A JPH0625990B2 (ja) 1986-12-25 1986-12-25 中文自動区切入力方式
CN87101277.4A CN1006093B (zh) 1986-12-25 1987-12-24 中文自动分隔输入方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61310885A JPH0625990B2 (ja) 1986-12-25 1986-12-25 中文自動区切入力方式

Publications (2)

Publication Number Publication Date
JPS63163570A JPS63163570A (ja) 1988-07-07
JPH0625990B2 true JPH0625990B2 (ja) 1994-04-06

Family

ID=18010554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61310885A Expired - Lifetime JPH0625990B2 (ja) 1986-12-25 1986-12-25 中文自動区切入力方式

Country Status (2)

Country Link
JP (1) JPH0625990B2 (ja)
CN (1) CN1006093B (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61190655A (ja) * 1985-02-20 1986-08-25 Toshiba Corp ピンイン漢字変換装置

Also Published As

Publication number Publication date
CN1006093B (zh) 1989-12-13
CN87101277A (zh) 1988-09-07
JPS63163570A (ja) 1988-07-07

Similar Documents

Publication Publication Date Title
JP2633824B2 (ja) 仮名漢字変換装置
JPH0625990B2 (ja) 中文自動区切入力方式
JP2007257188A (ja) 辞書検索装置およびその制御プログラム
JPH045224B2 (ja)
JPH0452500B2 (ja)
JPS6246029B2 (ja)
JP2729342B2 (ja) 仮名漢字変換方法および装置
JP2634596B2 (ja) かな漢字変換装置
JPH0697455B2 (ja) 仮名漢字変換装置
JP2688651B2 (ja) 文字列変換装置
JP2771020B2 (ja) 文字処理装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPH0736878A (ja) 同音異義語選択装置
JPS6175467A (ja) 仮名漢字変換方式
JPH0131229B2 (ja)
JPH05324610A (ja) 住所表記漢字入力装置
JPH07287715A (ja) 文字列の検索装置及び指定装置
JPH0778795B2 (ja) 文字処理装置
JPS5998236A (ja) 日本文入力装置
JPH01106162A (ja) 文書編集装置
JPH07129562A (ja) 文書作成装置およびその方法
JPH0695330B2 (ja) 文書作成装置
JPH05282290A (ja) 文章作成支援装置
JPS6069723A (ja) 文書作成装置
JPH06309302A (ja) 漢字変換装置