JPH06290182A - 重辞変換装置と漢字変換装置 - Google Patents

重辞変換装置と漢字変換装置

Info

Publication number
JPH06290182A
JPH06290182A JP5075911A JP7591193A JPH06290182A JP H06290182 A JPH06290182 A JP H06290182A JP 5075911 A JP5075911 A JP 5075911A JP 7591193 A JP7591193 A JP 7591193A JP H06290182 A JPH06290182 A JP H06290182A
Authority
JP
Japan
Prior art keywords
unit
dictionary
word
syllable
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5075911A
Other languages
English (en)
Inventor
Shiyunkei Shiyuu
峻慧 周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5075911A priority Critical patent/JPH06290182A/ja
Priority to CN93119115A priority patent/CN1043490C/zh
Publication of JPH06290182A publication Critical patent/JPH06290182A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 中国語の特徴たる重辞を持っている表音文字
列を正確に単語に変換する重辞変換装置と漢字変換装置
を提供する。 【構成】 漢字変換の対象として切り出された連続した
音節のうち、連続した4個の音節の読音が「P1」、
「P2」、「P3」を異なる読み音、かつ「P3」を
「不」又は「一」の読み音とした場合において、「P1
P1 P2 P2 」、「P1 P2 P1 P2 」又は「P1 P3
P1 P2 」の構成であるという重辞の特徴があるか否か
を検査する。もしこの特徴が検出されたならば、辞書部
の検索キーとして「P1 P2 」が設定される。これらの
音節「P1」、「P2」に対応する漢字「W1」、「W
2」からなる単語「W1 W2 」が検索されたならば、こ
れをもとに「W1 W1 W2 W2 」、「W1 W2 W1 W2
」、「W1 不W1 W2 」又は「W1 一W1 W2 」の形
の重辞を生成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は漢字変換に関し、特に中
国語等の発音をあらわす表音文字列を相応する漢字列に
変換する重辞変換装置と漢字変換装置に関する。
【0002】
【従来の技術】中国語で使われている漢字は一万字以上
ある。その中から如何に漢字を正しく高速に入力するか
が中国語ワードプロセッサーを含む中国語に対する計算
機処理で最重要な課題である。ところで、従来の漢字入
力の手段としては、音声認識、文字認識、キーボードな
どがある。その内、キーボードによる入力は最も確実で
あり、このため広く実用化されている。さて、キーボー
ドを利用する漢字の入力は、大別して読みによる方式と
字形による方式に分けられる。ところで、字形による方
式は、字形による入力規則を予め暗記しておかなければ
ならず、また暗記するには相当の時間が必要であり、慣
れるまでには時間もかかる。一方、読みによる方式は自
然であり、また習い易いと思われている。このため、将
来のキーボードによる漢字入力のみならず入力手段の主
流になるものと予想されている。
【0003】ところで、この読みによる入力方式を採用
した漢字変換装置としては、例えば、中華民国特許出願
番号75105838に示されているようなものがあ
る。図5は、この漢字の読みによる入力方式を採用した
漢字変換装置の構成図である。本図に示すように、この
漢字変換装置は、入力部100、レジスタ初期化部11
0、PTRレジスタ120、NPレジスタ130、NC
HARレジスタ140、比較部150、変換制御部16
0、辞書検索部170、辞書部180、及び出力部19
0よりなる。以下、これらの作用について説明する。
【0004】入力部100はキーボードを主構成要素と
し、へい音、注音、ローマ字などからなる任意の長さの
表音文字列を入力する。PTRレジスタ120とNPレ
ジスタ130は、それぞれ表音文字列を単語に変換する
ときに使用されるものであり、PTRレジスタ120は
入力された表音文字列のどの位置から変換を行なうかと
いう位置を記憶し、NPレジスタ130は入力された表
音文字列を単語に変換する際の単語長を記憶する。(な
お、本明細書における「表音文字列」とは、単数及び複
数の表音文字若しくは字音(発音)記号を指す。また、
「単語」とは漢字複数のみならず一字のみからなるもの
をも含む概念である。更に、「単語長」とは単語を構成
する漢字数のことである。)比較部150は、ある長さ
を持っている単語の変換処理が行なわれた後に、上記N
Pレジスタの値を一つ減らし、これによって次の長さの
単語を変換対象とすることにより、入力された変換対象
となる単語の中から文字数の多い単語を優先して変換す
ることとなるよう変換対象となる単語数を制御する。変
換制御部160は、上記PTRレジスタの設定位置を入
力表音文字列の最初の位置より順次後方へずらすように
し、これによりすでに変換された音節があるか否かを検
査し、どれもまだ変換されておらず、また辞書部180
内に変換されていない音節に対応する単語があったなら
ば、それを変換対象とさせることとするものである。辞
書検索部170は、上記変換制御部160から送ってき
た表音文字列を検索のキーとして辞書部内180を検索
し、該当する単語を検出したならばこれを取り出した上
で変換制御部160にわたす。辞書部180はディスク
を主構成要素とし、変換の結果出力される単語が音節列
と対応して登録(半永久的な記憶)されている。なお、
同一の音節列に対応する単語が複数個存在する場合に
は、使用頻度、字画数、文字コード等によって配列順序
が定められている。NCHARレジスタ140は高速半
導体メモリを主構成要素とし、入力された表音文字列の
音節数を記憶する。出力部190は、上記変換制御部1
60によって変換された結果を出力する。
【0005】
【発明が解決しようとする課題】しかしながら、以上の
ような漢字変換装置においては以下の問題点がある。漢
字変換は原則として辞書に登録されている単語を変換単
位としてなされ、その際文字(漢字)数の多い単語が優
先して変換され、その単語が変換された後に、残った単
語(多くの場合、一文字)の変換が行われる。しかしな
がらこの方法では、中国語特有の重辞表現方式の単語を
変換する場合には、辞書部内に当該単語が登録されてい
ないことが多いため、間違った変換がなされ易い。例え
ば、 1.「喜不喜歡」の読み音が入力された場合に、この
「喜不喜歡」自体が辞書に登録されていないときには、
1番目の「喜」は一文字を単位とする変換としては
「洗」の後位に配列されているため「洗」が優先され、
その結果、「洗不喜歡」に変換される。同様に、「睡一
睡覺」の読み音が入力された場合には、「税一睡覺」に
変換される。
【0006】2.「喜喜歡歡」の読み音が入力された場
合には、同じく2番目の読み音と3番目の読み音とから
「喜歡」という単語が構成されるため、これらは正しく
変換される。しかし、次の1番目の読み音は一文字を単
位として変換されることとなるため、その結果は「洗喜
歡歡」となる。 3.「稍加研究研究」の読み音が入力された場合には、
同じく2番目の読み音と3番目の読み音から構成された
単語「家嚴」は、3番目の読み音と4番目の読み音から
構成される単語「研究」より先の位置にある上に文字数
は同じく2であるため優先して変換される。さらにこの
場合、4番目の読み音は一文字を単位として変換される
こととなるが、このときも「究」よりも「就」が先に配
列されているため変換結果は「稍家厳就研究」になる。 等である。
【0007】しかしながら、中国語で使用される重辞の
多くを辞書に登録するのは辞書の内容が複雑となるだけ
でなく副次的に漢字変換装置が高価となりかねない。本
発明は、以上の課題に鑑みなされたものであり、重辞を
も適切に変換しえる重辞変換装置と漢字変換装置を提供
する目的でなされたものである。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明においては、表音文字列及びこれに
相応する中国語単語が対応して登録されている辞書部
と、入力された表音文字列を検索キーとして前記辞書部
内を検索する辞書検索部と、表音文字列として入力され
た音節列の内、連続した四個の音節の読み音が、「P
1」、「P2」、「P3」を異なる読み音とし、かつ
「P3」を「不」又は「一」の読み音とした場合におい
て、「P1 P1 P2 P2 」、「P1 P2 P1 P2 」又は
「P1 P3 P1P2 」という構成であるという重辞の特
徴を有しているか否かを検査する重辞検査部と、前記重
辞検査部によって重辞の特徴が検出された場合には、前
記辞書検索部に「P1 P2 」を検索キーとして送って前
記辞書部内を検索させ、各読み音「P1」、「P2」に
対応する漢字「W1」、「W2」からなる単語「W1 W
2」を検出したならばこれを得て次の漢字変換の対象と
なる所定の重辞を生成する重辞生成部とを有しているこ
とを特徴とする重辞変換装置としている。
【0009】請求項2の発明においては、任意の長さの
表音文字列を入力する入力部と、表音文字列及びこれに
相応する中国語単語が対応して登録されている辞書部
と、入力された表音文字列を検索キーとして、前記辞書
部内を検索する辞書検索部と、入力された表音文字列に
おけるまだ変換されていない表音文字列に相応する音節
を切り出した上でこれを次の漢字変換の対象とする音節
切り出し部と、該切り出された連続した音節の内、連続
した四個の音節の読み音が、「P1」、「P2」、「P
3」を異なる読み音とし、かつ「P3」を「不」又は
「一」の読み音とした場合において、「P1 P1 P2 P
2 」、「P1 P2 P1 P2 」又は「P1 P3P1 P2 」
という構成であるという重辞の特徴を有しているかを検
査する重辞検査部と、前記重辞検査部によって重辞の特
徴が検出された場合には、前記辞書検索部に「P1 P2
」を検索キーとして送り辞書部内を検索させ、各読み
音「P1」、「P2」に対応する漢字「W1」、「W
2」からなる単語「W1 W2 」を検出したならばこれを
得て所定の重辞を生成する重辞生成部と、前記音節切り
出し部によって切り出された変換しようとする連続した
音節の内、前記辞書検索部と前記重辞生成部での処理対
象となった重辞を含む単語があったならば、次の漢字変
換として検出された重辞を優先した上で該重辞を含む単
語の変換を行う変換処理部とを備えたことを特徴とする
漢字変換装置としている。
【0010】
【作用】上記構成により、請求項1の発明においては、
辞書部に表音文字列及びこれに相応する中国語単語が対
応して登録されている。辞書検索部が入力された表音文
字列を検索キーとして前記辞書部内を検索する。重辞検
査部が、入力された音節列の内、連続した四個の音節の
読み音が、「P1」、「P2」、「P3」を異なる読み
音とし、かつ「P3」を「不」又は「一」の読み音とし
た場合において、「P1 P1 P2 P2 」、「P1 P2 P
1 P2 」又は「P1 P3 P1 P2 」という構成であると
いう重辞の特徴を有しているか否かを検査する。重辞生
成部が前記重辞検査部によって重辞の特徴が検出された
場合には、前記辞書検索部に「P1P2 」を検索キーと
して送って前記辞書を検索させ、各読み音「P1」、
「P2」に対応する漢字「W1」、「W2」からなる単
語「W1 W2 」が検出されたならばこれを得て、次の漢
字変換の対象とすべく所定の重辞を生成する。
【0011】請求項2の発明においては、辞書部に表音
文字列及びこれに相応する中国語単語を対応して登録さ
れている。入力部より、任意の長さの表音文字列が入力
される。辞書検索部が、入力された表音文字列を検索キ
ーとして辞書部内を検索する。音節切り出し部が、入力
された表音文字列からまだ変換されていない表音文字列
に相応する音節を切り出し、それを次の漢字変換の対象
とする。重辞検査部が、前記音節切り出し部で切り出さ
れた連続した音節のうち、連続した四個の音節の読み音
が、「P1」、「P2」、「P3」を異なる読み音と
し、かつ「P3」を「不」又は「一」の読み音とした場
合において、「P1 P1 P2 P2 」、「P1 P2 P1 P
2 」又は「P1 P3 P1 P2 」という構成であるという
重辞の特徴を有しているか否かを検査する。重辞検査部
によりもし重辞の特徴が検出されたならば、重辞生成部
は辞書検索部に「P1 P2 」を検索キーとして送り、辞
書部内を検索させる。そして、各読み音「P1」、「P
2」に対応する漢字「W1」、「W2」からなる単語
「W1 W2 」が検出されたならばこれを得てこの重辞を
含む変換対象となっている単語を検出された重辞を優先
した上で次の漢字変換の対象とし、所定の単語を生成す
る。
【0012】
【実施例】以下、本発明を実施例にもとづき説明する。
図1は、本発明に係る漢字変換装置の一実施例の構成図
である。本図に示すように、本漢字変換装置は、入力部
10、レジスタ初期化部11、PRTレジスタ12、N
Pレジスタ13、NCHARレジスタ14、比較部1
5、変換処理部16、辞書検索部17、辞書部18、重
辞検査部19、重辞生成部20、出力部21より構成さ
れている。次に、これら各部の作用について説明する。
入力部10は、へい音、注音、ローマ字などの表音文字
(本実施例では、後に「n/」等具体的に示す。表音文
字が1つ又は複数集まって一音節を表現する。)を入力
する。辞書部18には、表音文字列及びこれに音が対応
する中国語単語が登録(永久記憶)されている。NCH
ARレジスタ14は、入力された表音文字列の音節数を
表わす。なお、中国語では一つの漢字(特許請求の範囲
では「W1」、「W2」という記号で抽象的に、実施例
では更に能、不、一、徹等の具体的な漢字で示す。)に
は一つの音節(特許請求の範囲では「P1」、「P
2」、「P3」と抽象的に、実施例では更に「neng
/」等の記号等で具体的に示す。)が対応しているの
で、入力された表音文字列の音節の数はそのまま変換対
象の漢字の数となる。PTRレジスタ12とNPレジス
タ13は、それぞれ表音文字列を単語に変換するときに
使用される。PTRレジスタ12は、入力された表音文
字列のどの位置から変換を行うかの位置を記憶する。N
Pレジスタ13は、入力された表音文字列を単語(漢字
一字も含む)に変換する際の変換単語長(単語を構成す
る漢字そして音節の数)を記憶する。なお、ここにそれ
ぞれのレジスタの内容ptr、npの意味するところ
は、入力された表音文字列のptr番目から以下連続し
たnp個の音節が次の辞書検索時の検索キーであること
を示すものである(以下、nchar、np、ptr
は、それぞれNCHARレジスタ、NPレジスタ、PT
Rレジスタの値を表わすものとする)。レジスタ初期化
部11は、入力された表音文字列の音節数を計算し、そ
の値をNCHARレジスタ14に設定すると共に、もし
その値が辞書部18に登録されている最長単語の文字数
max(本実施例においては8とする)より大ならばこ
のmaxをNPレジスタ13に設定し、以下であるなら
ば、上記入力された表音文字列の音節数をNPレジスタ
13に設定し、更に、PTRレジスタ12の値を1に設
定することにより、NCHARレジスタ14、NPレジ
スタ13、PTRレジスタ12の内容を初期化するもの
である。なお、その際の動作流れを後に詳しく説明す
る。比較部15は、常に(np+ptr)>(ncha
r+1)が成立するか否かを検査し、もし成立するなら
ば、NPレジスタ13の値を一つ減らし、PTRレジス
タ12の値を再度1に設定する。重辞検査部19は、上
記PTRレジスタとNPレジスタの値による指示する変
換しようとする連続した音節のうち、連続した4個の音
節の読み音は「p1 p1 p2 p2 」若しくは「P1 P2
P1 P2 」という構成又は「p1 p3 p1 p2 」という
構成かつ「P3 」の読み音は「不」或いは「一」である
という重辞特徴の有無を検査する。重辞生成部20は、
もし上記重辞検査部19によって重辞特徴が検出された
場合には、「P1 P2 」を検索キーとして上記辞書検索
部17に送り、辞書部18内を検索させ、対応する単語
「W1 W2」が登録されているならばこれを検出した上
で、「W1 W1 W2 W2 」、「W1W2 W1 W2 」、
「W1 不W1 W2 」或いは「W1 一W1 W2 」の重辞を
生成する。変換処理部16は、入力された表音文字列の
PTR番目から以下連続したNP個の音節の内にすでに
変換された音節があるか否かを検査する。もし、すでに
変換された音節が有るならば、PTRレジスタの値を一
つ増やし、無ければ、辞書部18に対応する単語或いは
重辞生成部20で生成する単語が登録されているならば
その変換を行ない、同時にPTRに4を加える。そうで
ない場合には、PTRレジスタ12の値を一つ増やすだ
けであり、変換処理は行なわない。なお、この動作流れ
については、後に詳しく説明する。辞書検索部17は、
上記変換処理部16或いは重辞生成部20から送ってき
た音節を検索キーとして、辞書部内18から該当する候
補の単語の内で一番可能性の高い単語を取り出し、上記
変換処理部16或いは重辞生成部20に送る。なお、辞
書部18内における同一音節の複数の単語の登録に際し
ての配列は、本実施例では通常のワードプロセッサーと
同じく使用頻度が高い順、すなわち一番可能性の高い順
としている。出力部21は、上記変換処理部16によっ
て変換された結果を出力する。
【0013】次に、レジスタの初期化の動作を図2に示
す流れ図を参照しつつ説明する。(S1)では、音節数
を計算するレジスタを0(零)にする。(S2)では、
表音文字列を入力する。(S3)では、現在入力された
表音文字は声調キーか否かを検査する。音調キーならば
(S4)へ行く。そうでなければ(S5)へ行く。
【0014】(S4)では、音節数を計算するレジスタ
の内容を一つ増やし(S2)へ戻る。(S5)では、現
在入力された表音文字は入力終了キーか否かを検査す
る。入力終了キーならば(S6)へ行く。そうでなけれ
ば(S2)へ戻る。次いで、次の表音文字を入力する。
【0015】(S6)では、現在入力された音節数が8
以下か否かを検査する。8以下であるならば(S8)に
行く。8より大(9以上)であるならば(S7)に行
く。(S7)では、 NPレジスタの値を8に設定す
る。(S8)では、NPレジスタの値を現在入力された
音節数に設定する。(S9)では、NCHARレジスタ
の値を現在入力された音節数に設定する。
【0016】(S10)では、PTRレジスタの値を1
に設定する。なお、この設定は入力された音節の先頭か
ら漢字変換するためなされるものである。次に、変換処
理部を中心とする動作を、図3と図4に示す流れ図を参
照しつつ説明する。(なお、図3と図4は図2と併せて
本実施例の一連の動作の流れを示すものであるが、図面
の大きさの制限のため分割したものである。) (S11)では、表音文字列のPTR番目から以下連続
したNP個の音節を切り出す。(従って、一番最初は入
力された表音文字列全てに対応する単語が検索対象とな
る。) (S12)では、(S11)で切り出された音節の内に
変換された音節があるか否かを検査する。もし、あるな
らば(S25)へ行き、なければ(S13)へ行く。
【0017】(S13)では、(S11)で切り出され
た音節に対応する単語が辞書部内に登録されているか否
かを検査する。もし登録されているならば、(S14)
では(S11)で切り出された音節を辞書の対応する単
語に変換する。登録されていなければ(S15)へ行
く。(S15)では、(S11)で切り出された音節は
その値が4か否かを検査する。もし4でない場合には、
(S25)へ行ってPTRレジスタの値を一つ増やす。
4ならば重辞の可能性があるため、これを検査すべく
(S16)へ行く。
【0018】(S16)では、(S11)で切り出され
た4個の音節のうち、まず1番目の音節と2番目の音節
は同じか否か、もし同じなら次に3番目の音節と4番目
の音節は同じか否かを検査する。もし、両方とも同じな
らば「P1 P1 P2 P2 」の重辞の可能性があるため
(S17)へ行く。そうでないならば、(S19)へ行
く。
【0019】(S17)では、(S11)で切り出され
た4個の音節のうち、2、3番目の2つの音節に対応す
る単語の辞書部内での有無を検査する。もし、対応する
単語が登録されているならば(S18)へ行く。なけれ
ば(S25)へ行く。(S18)では、4個文字からな
る単語を組み合わせる。そのうち、1、2番目の文字は
(S17)で検出された単語の1番目の文字をあて、
3、4番目の文字は(S17)で検出された単語の2番
目の文字をあてる。このようにして4個の文字が単語と
して組み合わせられてから、(S11)で切り出された
4個の音節を当該単語に変換し、しかる後、次の音節を
漢字変換の対象とすべく(S26)へ行く。
【0020】(S19)では、(S11)で切り出され
た4個の音節のうち、まず1番目と3番目の音節は同じ
か否か、そして同じなら次に2番目と4番目の音節は同
じか否かを検査する。もし、両方とも同じならば「P1
P2 P1 P2 」の重辞の可能性があるため(S20)へ
行く。同じでなければ(S22)へ行く。(S20)で
は、(S11)で切り出された4個の音節のうち、1、
2番目の音節に対応する単語の有無を検査する。もし、
対応する単語があれば「P1 P2P1 P2 」の重辞の可
能性があるため(S21)へ行く。なければ(S25)
へ行く。
【0021】(S21)では、4個の文字からなる単語
を組み合わせる。そのうち、1、3番目の文字は(S2
0)で検出された単語の1番目の文字、2、4番目の文
字は(S20)で検出された単語の2番目の文字であ
る。以上の操作で4個の文字からなる単語が組み合わせ
られてから、(S11)で切り出された4個の音節を当
該単語に変換し、しかる後、次の音節を漢字変換の対象
とすべく(S16)へ行く。
【0022】(S22)では、(S11)で切り出され
た4個の音節のうちに、1番目の音節と3番目の音節が
同じであるか否か、そして若し同じならば次に、2番目
の音節の読み音は「不」或いは「一」であるか否かを検
査する。もし、該当するならば、「P1 P3 P1 P2 」
そしてP3が「不」又は「一」の重辞の可能性があるた
め(S23)へ行く。該当しなければ次の音節を漢字変
換の対象とすべく(S25)へ行く。
【0023】(S23)では、(S11)で切り出され
た4個の音節のうち、3、4番目の音節に対応する単語
の有無を検査する。もし、対応する単語があるならば
(S24)へ行く。なければ(S25)へ行く。(S2
4)では、4個文字からなる単語を組み合わせる。その
うち、1番目の文字は(S23)で検出された単語の1
番目の文字であり、2番目の文字は「不」或いは「一」
であり、3、4番目の文字はそれぞれ(S23)で検出
された単語の1番目、2番目の文字である。4個の文字
からなる単語が組み合わせられてから、(S11)で切
り出された4個の音節を当該単語に変換する。しかる
後、(S26)へ行く。なお、ここに「不」若しくは
「一」のいずれに変換するかは、入力された音節文字列
の発音による。
【0024】(S25)では、未変換の音節を先頭から
漢字変換の対象とすべくPTRレジスタの値を一つ増や
す。しかる後(S27)へ行く。(S26)では、(S
25)と同じ趣旨ではあるが、重辞により4つの音節が
漢字変換されているため、PTRレジスタの値にNPレ
ジスタの値を加えてから、これをPTRレジスタに記憶
した上で(S27)へ行く。
【0025】(S27)では、(np+ptr)>(n
char+1)が成立するか否かを検査する。成立する
ならば(S28)へ行く。しなければ(S11)へ戻
る。(S28)では、NPレジスタの値を一つ減らし、
PTRレジスタの値を1に設定してから(S29)へ行
く。(S29)では、NPレジスタの値が0か否かを検
査する。もし0であるならば入力された表音文字列の漢
字変換処理を終える。0でなければ(S11)へ戻る。
【0026】以下に、以上のように構成された本実施例
の漢字変換装置について、具体的に入力列として「ne
ng/bu\neng/gou\che\che\di
VdiVde.gaiVjin\」を例にとって、その
動作を説明する。(本文の「」内の「/」、「\」、
「V」、「.」は正確には各々図6の(a)、(b)、
(c)、(d)に示すような記号であり、中国において
表音文字、字音記号あるいは注音記号等とよばれる中国
語の音を表す記号である。しかしながら、これらの文字
は電子情報処理システムでは入力できないこと、電子情
報処理システムの施行規則でも本発明の中国語ワードプ
ロセッサーのごとく外字が連続して煩雑に使用されるこ
とは想定していなかったと思われること及び明細書の読
み易さを考慮の上、本明細書では形状のかなり似た上記
「/」、「\」、「V」、「.」で代用する。更に、図
6の(e)に示す漢字を、本明細書では同じく読み易さ
を考慮の上(外e)と表示するものとする。なお、(外
e)は本明細書では後に使用される。) 説明をわかり
易くするために、今この入力列に対応する辞書部内にあ
る全ての可能な単語は「neng/gou\能(外
e)」,「che\diV徹底」「gaiVjin\改
進」であり、また辞書部内に登録されている最長単語の
文字数は8であるものとする。
【0027】上記の表音文字列が入力されると、レジス
タ初期化部で、含まれる声調の数を計算することによっ
て音節数を求め、その値11をNCHARレジスタ(S
9)に設定すると共に、その値が辞書部内の最長単語の
文字数8より大なので(S6)、NPレジスタの初期化
として8を設定し(S7)、PTRレジスタを1に設定
する(S10)。NPレジスタは、現在変換しようとす
る単語を単位としてその構成文字数を記憶する。辞書部
に登録の上収容されている最長単語の文字数は8である
ので、如何なる長さの入力列に対しても単語変換の最大
単位の単語の文字数は当然8である。又、PTRレジス
タの値ptrは現在の辞書検索の開始位置が上記入力さ
れた表音文字列のptr番目の音節であることを表わ
す。
【0028】入力された音節数によってPTRレジス
タ、NPレジスタ、NCHARレジスタの初期値が設定
された後、変換処理部でPTRレジスタとNPレジスタ
の値をもとに、入力部から送られてきた表音文字列の1
〜8番目の連続した音節列「neng/bu\neng
/gou\che\che\diVdiV」を切り出し
(S11)、この上で、変換された音節の有無を検査す
る(S12)。全ての音節がまだ変換されていないた
め、それらを検索キーとして、辞書検索部に送り、辞書
部内を検索する(S13)。対応する単語が検出され
ず、また現在NPレジスタの値が4ではないので(S1
5)、PTRレジスタの値を一つを増やすだけで変換処
理を行なわない(S25)。同様に、PTRレジスタの
新しい値とNPレジスタの値によって順に「bu\ne
ng/gou\che\che\diVdiVd
e.」、「neng/gou\che\che\diV
diVde.gai 」、「gou\che\che\
diVdiVde.gaiVjin\」を切り出し、全
てがまだ変換されていない音節であるが、辞書部に対応
する単語が登録されていないので、変換処理を行なわな
い。ただ、PTRレジスタの値を一つ増やす(S2
5)。「che\che\diVdiVde.gaiV
jin\」が処理された後、PTRレジスタの値が5と
なる。この場合、比較部により、(np+ptr)>
(nchar+1)であり、長さが8の該当する単語が
ないことが検出される。このためNPレジスタの値を一
つ減らし7とする。PTRレジスタの値を1に設定する
(S28)。この場合、NPレジスタの値は0でないの
で(S29)、次の連続した音節の切り出しと変換を処
理する。
【0029】同様に、NPレジスタの値が7、6、5の
ときには、PTRレジスタとNPレジスタの値で入力さ
れた文字列から切り出された連続した音節列は全てがま
だ変換されていないので、それを検索キーとして辞書検
索部に送り、辞書部内を検索する。それに対応する単語
が検出されないので、NPレジスタの値を減らし4とす
る。そして、PTRレジスタの値を再度1に設定する
(S28)。この場合、NPレジスタの値が0ではない
ので(S29)、次の連続した音節の切り出しと変換を
処理する。
【0030】NPレジスタの値が4であり、PTRレジ
スタの値が1である場合、入力された表音文字列から
「neng/bu\neng/gou\」を切り出す
(S11)。全てがまだ変換されていない音節であるの
で(S12)、辞書検索部はそれを検索キーとして辞書
部内を検索する。その結果、対応する単語が登録されて
いないのが判明する(S13)。この場合、現在NPレ
ジスタの値が4であるので(S15)、重辞検査部によ
り、まず1番目の音節と2番目の音節は同じか否か、次
いで、3番目の音節と4番目の音節は同じか否かを検査
する(S16)。両方とも否であるため更に、1番目と
3番目の音節は同じか否か、次いで、2番目の音節と4
番目の音節は同じか否かを検査する(S19)。両方と
も異なるため、1番目の音節と3番目の音節は同じか否
か、そしてもし同じならば、2番目の音節の読み音は
「不」若しくは「一」か否かを検査する(S22)。現
在切り出された音節列「neng/bu\nen/go
u\」はこの条件を満たすので、重辞生成部により、
「neng/gou\」を検索キーとして辞書検索部に
送り、辞書部内を検索する。この場合、辞書部内に対応
する単語「能(外e)」が登録されているので(S2
3)、「能不能(外e)」が生成され、それを変換処理
部に送り、「neng/bu\neng/gou\」を
「能不能(外e)」に変換する(S24)。そのうえ
で、PTRレジスタの値に4を加えて5とする(S2
6)。この場合、比較部により、(np+ptr)は
(nchar+1)より小さいと判断されたので、残っ
た未処理の音節は長さ4である単語を変換できることを
示す(S27)。
【0031】NPレジスタの値もPTRレジスタの値も
4である場合、入力された表音文字列から切り出された
音節列が「che\che\diVdiV」である(S
11)。全てがまだ変換されていない音節であるので
(S12)、辞書部内に対応する単語が登録されている
か否かを検索する(S13)。対応する単語がない、そ
して、現在NPレジスタの値が4であるので(S1
5)、重辞検査部により、まず1番目の音節と2番目の
音節は同じか否か、同じなら次いで、3番目の音節と4
番目の音節は同じか否かを検査する(S16)。両方と
も同じであり、重辞の特徴を持っていると判断されたの
で、重辞生成部により、2番目の音節と3番目の音節
「che\diV」を検索キーとして、辞書検索部に送
り、辞書部内を検索する。辞書部内に対応する単語「徹
底」が登録されているのが検出されたならば(S1
7)、「徹徹底底」が生成され、それを変換処理部に送
り、「che\che\diVdiV」を「徹徹底底」
に変換する(S18)。そのうえで、PTRレジスタの
値に4を加えて9とする(S26)。この場合、比較部
により、(np+ptr)は(nchar+1)より大
きいと判断されるので、残った未処理の音節「de.g
aiVjin\」は長さ4である単語を変換できないこ
とを示す(S27)。このため、NPレジスタの値を1
つ減らし3とする。PTRレジスタの値を再度1に設定
する(S28)。この場合、NPレジスタの値は0でな
いので(S29)、次の連続した音節の切り出しと漢字
変換処理を行う。
【0032】NPレジスタの値が3であり、PTRレジ
スタの値が1〜8における任意値である場合には、入力
された表音文字列から切り出された音節列は変換された
音節を含むので、辞書検索も変換処理も行なわない。P
TRレジスタの値が9であるとき、切り出された音節列
は「de.gaiVjin\」(S11)である。辞書
部内を検索しても対応する単語がない(S13)。NP
レジスタの値が4ではないので(S15)、PTRレジ
スタの値を1増やし10とする(S25)。この場合、
比較部により、(np+ptr)は(nchar+1)
より大きいと判断されるので、NPレジスタの値を1減
らし2とする。PTRレジスタの値を再度1に設定する
(S28)。この場合、NPレジスタの値は0でないの
で(S29)、次の連続した音節の切り出しと変換処理
を行う。
【0033】NPレジスタの値が2であり、PTRレジ
スタの値が1から8までの任意値である場合には、入力
された表音文字列から切り出された音節列は変換された
音節を含むので、辞書検索も変換処理も行なわない。P
TRレジスタの値が9であるとき、切り出された音節列
は「de.gaiV」(S11)である。辞書部内を検
索しても対応する単語がない。このため、PTRレジス
タの値を1つ増やし10とする(S25)。この場合、
切り出された音節列「gaiVjin\」(S11)を
検索キーとして、辞書検索部により辞書部内を検索す
る。辞書部に対応する単語「改進」が記憶されているの
が検出されたならば、「改進」が生成され、それを変換
処理部に送り、「gaiVjin\」を「改進」に変換
する(S14)。そのうえで、PTRレジスタの値に2
を加えて12とする(S26)。この場合、比較部によ
り、(np+ptr)は(nchar+1)より大きい
と判断されたので、NPレジスタの値を1つ減らし、1
とする。PTRレジスタの値を再度1に設定する(S2
8)。この場合、NPレジスタの値は0でないので(S
29)、次の連続した音節の切り出しと変換を処理す
る。
【0034】NPレジスタの値が1であり、PTRレジ
スタの値が1から8までの任意値である場合、入力され
た表音文字列から切り出された音節列は変換された音節
を含むので、辞書検索も変換処理も行なわない。PTR
レジスタの値が9であるとき、切り出された音節は「d
e.」(S11)である。まだ変換されていないので、
それを検索キーとして、辞書検索部に送り、辞書部内を
検索する。検索された結果は「的」の使用頻度が一番高
い。そこで、これを変換処理部に送り、「de.」を
「的」に変換する(S14)。そのうえで、PTRレジ
スタの値に1を加えて10とする(S26)。続いてP
TRレジスタの値は10か11でも、入力された表音文
字列から切り出された音節は既に変換された。この場
合、PTRレジスタの値は12となる。(np+pt
r)は(nchar+1)より大きいので、比較部はN
Pレジスタの値を1つ減らして0とする(S28)。こ
の時、変換処理部により、変換処理が終了したと判定さ
れ、この変換結果として「能不能(外e)徹徹底底的改
進」が出力部に送り出される。
【0035】尚、PTRレジスタとNPレジスタと比較
部と変換処理部の一部は音節切り出し部に相当する。以
上、本発明を実施例にもとづき説明してきたが、本発明
は上記実施例に限定されないのは勿論である。例えば、 入力された表音文字列の入力終了キーが押されてから
初めて入力された全部の表音文字列を漢字に変換し始め
るのでなく、声調キーが入力される度に、即ち、一つの
音節が入力される度に、前回入力された表音文字列の入
力終了位置から現在入力された表音文字列までを変換す
るようにしてもよい。 中国の文化的影響を受けた国々では、その国語におい
て重辞に似た単語が使用されることがある。例えば日本
語では「努力努力」、「悠悠閉閉」、「唯唯諾諾」「時
時刻刻」、「奇奇怪怪」等、また日本語としての漢文に
おける「多多益益弁ズ」等である。従って、本発明を日
本語ワードプロセッサー等に応用してもよいのは勿論で
ある。更に、この場合「P1、P1、P2、P2」形の
場合で横書きの場合には、2番目の「P1」と「P2」
の部分には「々」が印字されるようになっていてもよ
い。更にまた、これらの機能発揮は入力者の選択により
成されるようされていてもよい。(このため、前掲の
「悠悠閉閉」は「悠々閉々」となる。)なお、特許請求
の範囲における中国語単語は他国語化していても本来は
中国語であるものや逆に中国語化した外国語を含み、ま
た表音文字とは日本語の「カナ」や朝鮮語の「オンモ
ン」をも含むのは勿論である。 製造等の都合で、請求の範囲に記載された本発明の一
の構成要素を物理的に複数のものとしてもよいし、逆に
複数の構成要素を一体の物に組み込んでもよいし、更に
これらのことを適宜組み合わせてもよい。 一の文章の入力に際して、使用される頻度の高い重辞
は別置きのRAMに記憶することにより、即変換される
ようにする等の学習記号を付加されていてもよい。 「P3」の音に「不」、「一」以外の読み音であって
も重辞変換をする機能及びこの機能を発揮するか否かの
選択機能を付加されていてもよい。
【0036】
【発明の効果】以上説明したように、本発明によれば、
中国語文章における「歡歡喜喜」、「研究研究」、「睡
一睡覺」、「能不能(外e)」等の重辞表現方式に対し
て、たとえ当該単語は計算機内の変換用の辞書部に登録
されていなくても、当該単語の特徴を検出することによ
って重辞であることを識別し、この上で辞書に登録され
ている短単語を利用して正確に重辞変換をすることが可
能である。このため、その実用的効果は極めて大きい。
【図面の簡単な説明】
【図1】本発明に係る漢字変換装置の一実施例のブロッ
ク図である。
【図2】上記実施例におけるレジスタ初期化部の動作を
中心とする動作流れ図である。
【図3】上記実施例における変換処理部を中心とする動
作流れ図である。(図2の続き)
【図4】上記実施例における変換処理部を中心とする動
作流れ図である。(図3の続き)
【図5】従来の漢字変換装置のブロック図である。
【図6】外字の一覧である。
【符号の説明】
10 入力部 11 レジスタ初期化部 12 PTRレジスタ 13 NPレジスタ 14 NCHARレジスタ 15 比較部 16 変換処理部 17 辞書検索部 18 辞書部 19 重辞生成部 20 重辞検査部 21 出力部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 表音文字列及びこれに相応する中国語単
    語が対応して登録されている辞書部と、入力された表音
    文字列を検索キーとして前記辞書部内を検索する辞書検
    索部と、表音文字列として入力された音節列の内、連続
    した四個の音節の読み音が、「P1」、「P2」、「P
    3」を異なる読み音とし、かつ「P3」を「不」又は
    「一」の読み音とした場合において、「P1 P1 P2 P
    2 」、「P1 P2 P1 P2 」又は「P1 P3 P1 P2 」
    という構成であるという重辞の特徴を有しているか否か
    を検査する重辞検査部と、前記重辞検査部によって重辞
    の特徴が検出された場合には、前記辞書検索部に「P1
    P2 」を検索キーとして送って前記辞書部内を検索さ
    せ、各読み音「P1」、「P2」に対応する漢字「W
    1」、「W2」からなる単語「W1 W2 」を検出したな
    らばこれを得て次の漢字変換の対象となる所定の重辞を
    生成する重辞生成部とを有していることを特徴とする重
    辞変換装置。
  2. 【請求項2】 任意の長さの表音文字列を入力する入力
    部と、表音文字列及びこれに相応する中国語単語が対応
    して登録されている辞書部と、入力された表音文字列を
    検索キーとして、前記辞書部内を検索する辞書検索部
    と、入力された表音文字列におけるまだ変換されていな
    い表音文字列に相応する音節を切り出した上でこれを次
    の漢字変換の対象とする音節切り出し部と、該切り出さ
    れた連続した音節の内、連続した四個の音節の読み音
    が、「P1」、「P2」、「P3」を異なる読み音と
    し、かつ「P3」を「不」又は「一」の読み音とした場
    合において、「P1 P1 P2 P2 」、「P1 P2 P1 P
    2 」又は「P1 P3 P1 P2 」という構成であるという
    重辞の特徴を有しているか否かを検査する重辞検査部
    と、前記重辞検査部によって重辞の特徴が検出された場
    合には、前記辞書検索部に「P1 P2 」を検索キーとし
    て送り辞書部内を検索させ、各読み音「P1」、「P
    2」に対応する漢字「W1」、「W2」からなる単語
    「W1 W2 」を検出したならばこれを得て所定の重辞を
    生成する重辞生成部と、前記音節切り出し部によって切
    り出された変換しようとする連続した音節の内、前記辞
    書検索部と前記重辞生成部での処理対象となった重辞を
    含む単語を検出したならば、次の漢字変換として検出さ
    れた重辞を優先した上で該重辞を含む単語の変換を行う
    変換処理部とを備えたことを特徴とする漢字変換装置。
JP5075911A 1993-04-01 1993-04-01 重辞変換装置と漢字変換装置 Pending JPH06290182A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5075911A JPH06290182A (ja) 1993-04-01 1993-04-01 重辞変換装置と漢字変換装置
CN93119115A CN1043490C (zh) 1993-04-01 1993-10-13 叠词变换方法和汉字变换装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5075911A JPH06290182A (ja) 1993-04-01 1993-04-01 重辞変換装置と漢字変換装置

Publications (1)

Publication Number Publication Date
JPH06290182A true JPH06290182A (ja) 1994-10-18

Family

ID=13589996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5075911A Pending JPH06290182A (ja) 1993-04-01 1993-04-01 重辞変換装置と漢字変換装置

Country Status (2)

Country Link
JP (1) JPH06290182A (ja)
CN (1) CN1043490C (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949289A (zh) * 2019-12-11 2021-06-11 北大方正集团有限公司 检测叠词错误的方法、装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02165375A (ja) * 1988-12-20 1990-06-26 Sharp Corp 中国語文章入力装置

Also Published As

Publication number Publication date
CN1093185A (zh) 1994-10-05
CN1043490C (zh) 1999-05-26

Similar Documents

Publication Publication Date Title
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP2000298667A (ja) 構文情報による漢字変換装置
JPH06290182A (ja) 重辞変換装置と漢字変換装置
JP3589972B2 (ja) 音声合成装置
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
CN1323004A (zh) 汉语盲文到汉字的自动转换方法
JPH11338498A (ja) 音声合成装置
JP3084864B2 (ja) 文章入力装置
JPH0350668A (ja) 文字処理装置
JP3234338B2 (ja) 漢字変換装置
JPH0350669A (ja) 情報処理装置
JP2000330998A (ja) 発音電子辞書
JPS6160167A (ja) 日本語ワ−ドプロセツサ
JPS6340936A (ja) 音声カナ漢字変換方式
JP2009098328A (ja) 音声合成装置及び方法
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPS63316160A (ja) 文書作成装置
JPS63167956A (ja) 敬語表現への変換装置
JPH0991278A (ja) 文書作成装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JP2001034606A (ja) 中国語入力装置及び中国語入力方法
JPH10154141A (ja) かな漢字変換装置
JPS63214872A (ja) かな漢字変換方式
JPH0749858A (ja) 漢字変換装置
JPS60176167A (ja) 音声入力式辞書検索装置