JPH06208560A - 曖昧漢字変換装置 - Google Patents

曖昧漢字変換装置

Info

Publication number
JPH06208560A
JPH06208560A JP5002785A JP278593A JPH06208560A JP H06208560 A JPH06208560 A JP H06208560A JP 5002785 A JP5002785 A JP 5002785A JP 278593 A JP278593 A JP 278593A JP H06208560 A JPH06208560 A JP H06208560A
Authority
JP
Japan
Prior art keywords
ambiguous
kanji
glyph
symbol
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5002785A
Other languages
English (en)
Inventor
Keiken Hayashi
啓軒 林
Kaka Chiyou
家華 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5002785A priority Critical patent/JPH06208560A/ja
Priority to CN93105336A priority patent/CN1048341C/zh
Publication of JPH06208560A publication Critical patent/JPH06208560A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 字音の類似する漢字列に対し効果的に曖昧変
換処理を行う中国語ワードプロセッサー用の曖昧漢字変
換装置を提供する。 【構成】 中国語ワードプロセッサーにおいて、曖昧字
音記号若しくは曖昧字音記号となりえる字音記号を有す
る字音記号列毎に、それらに対応する字音記号列を格納
する曖昧辞書と、曖昧位置及び検出可能な字数を指定す
る曖昧範囲指定部と、曖昧範囲指定部にて指定された位
置に相応する字音記号列毎に、曖昧辞書から対応する字
音記号列を検出する曖昧情報検出部と、曖昧情報検出部
によって検出された全ての字音記号列を変換部に送っ
て、これらに対応する漢字若しくは検出可能な範囲内の
字数の漢字列への変換を行わせる変換制御部と、変換制
御部の作用のもとで変換されたものから入力者の意図す
る漢字列を選択可能とする選択部とを有している。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、中国語ワードプロセッ
サに関し、特に入力される曖昧字音を処理する漢字変換
装置に関する。
【0002】
【従来の技術】中国語では、原則として一つの漢字が一
つの字音に対応している。そして、字音は声母、韻母及
び声調から構成され、更に韻母は介音及び主韻母に細分
されるので、結局 声母+介音+主韻母+声調 の組合
せで構成されることとなる。なお、声母、介音等につい
ては中国語の入門書はもとより少し大きい漢和辞典にも
記載されているため、それらの説明は省略する。さて、
中国語ワードプロセッサーにおいては、これらの字音を
表す記号が入力されたならば、一つの漢字の音が入力し
終ったこととなる。ところで、中国語での漢字(「峠」
等日本の国字である等のため中国語で使用しない漢字の
存在、日本語と同じく中国語でも文章中に漢字以外の文
字や記号を使用することが有りえること、単語特に固有
名詞における特殊な事情や中国語固有の略字やかな的漢
字の存在等もあり、ここにいう「漢字」とは、厳密には
「日本語にいう漢字」とは限らない。「中国語文章にお
ける漢字を中心とする文字や記号若しくは文字列や単
語」とでも言う概念であるが、以下原則として「漢字」
という。)の読み記号を中華民国で用いられている注音
符号で表わすならば、図6に主なものを示すように、声
母、介音、主韻母及び声調を含み、合計四十二個があ
る。(なお、現在よく使用されている漢字の読み記号に
はこの他に、注音符号第二式と中国大陸のローマ字へい
音記号がある。)本発明は、この注音符号(特許請求の
範囲にいう「字音記号」の一種。)で全ての読み記号を
表わすことを採用したワードプロセッサーに関する。と
ころで、中国語の発音は国土は広く、人口も多い上にそ
の生活環境や歴史的由来の大きな相違のため、漢字の読
み記号を正確に表現できない若しくは不統一な場合も多
々ある。これは、ただ単に使用される漢字の種類が多い
だけでなく、そもそも中国語自体が北京語、広東語等大
きく5つに分けられるほど多様であり、またこのため、
日本人はもとよウラル語族やアルタイ語族の人々がLと
Rの音を聞き分けるのが困難、あるいは日本語における
方言の存在以上に言葉やその発音が大きく相違している
ことによる。従って、例えば巻舌声母「図7に示す〔外
1〕」(以下、電子情報処理システム、ワードプロセッ
サーの入力の制限もあるため、本明細書で使用する中国
語固有の外字、発音記号は図7にまとめて図示し、「図
7〔外1〕、「図7〔外2〕」のごとく記載する。)は
発音が類似しているため、よく非巻舌声母「図7〔外
2〕」と間違えられ、主韻母「図7〔外3〕」は同じく
よく「図7〔外4〕」と間違えられる。そのため、曖昧
処理を行わなければならない。従来の漢字変換装置によ
る曖昧処理として例えば、中華民国特許75105839に載せ
られている漢字変換装置がある。図5の(a)はこの装
置のブロック図である。本図5(a)において、10は
表音文字及び辞書検索モードを指定する辞書検索モード
キーを有する入力部であり、11は入力部から送られて
きた表音文字列を音節符号に変換する音節符号変換部で
あり、12は音節符号変換部11から送られてきた音節
符号を変換単位毎に次に説明する辞書検索部13に送る
と共に、辞書検索部13から送られてきた単語候補を使
用者に選択させ、最終的に対応すると判断された単語候
補を出力部15に送る漢字変換部であり、13は入力部
から送られてきた辞書検索モードの指定によって単語候
補を次に説明する辞書14から取り出す辞書検索部であ
り、14は音節符号を用いて表わされた中国語の単語の
読みとその単語に対応する漢字コードとの組を格納した
辞書である。
【0003】次に、以上のように構成された漢字変換装
置の内部処理に使われる音節符号について説明する。そ
れぞれの声母、介母、主韻母、声調毎に割り当てられる
ビットパターンを図5の(b)に示す。これらのビット
パターンは2バイトで定義されている。第1、第2byte
ともその最初のビット(bit 0)は0であり、結合韻母
のビットパターンは介音と主韻母とのビットパターンの
組合せで表わされる。例えば、「図7〔外5〕」、「図
7〔外6〕」、「図7〔外7〕」、「図7〔外8〕」等
の類似した音韻要素同士のビットパターン間の距離は1
となっている。即ち、第1byteのbit 5、bit 7、第2
byteのbit 7を無視するとそれぞれ類似した声母、介
音、主韻母を同一視することができる。図5の(c)に
示すのは、この従来例における類似した音韻要素同士の
ビットパターン間の距離が1となっている、そしてよく
間違えられる24組の音韻要素である。入力者が曖昧変
換を設定する場合、検索モードキーによって辞書を検索
する際、辞書に登録される単語の読みの各音節の第1by
teのbit 5、bit 7、第2byteのbit 7が無視され、関
連曖昧漢字セット或いは関連曖昧単語セットが検出され
る。(ただし、プログラム的には、これらのビットは無
視されるのではなく、逆に注目される。)例えば、使用
者が「図7〔外9〕」を入力したいとき、介音及び声調
を無視するために設けられるキーを押すと、「図7〔外
10〕」、「図7〔外11〕」等が検出される。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
従来技術に係る装置においては次のような問題点があ
る。ただし、その問題点をいきなり中国語を例にとって
具体的に説明するに先立ち、理解の容易のため日本語を
例に概念的に説明する。日本語で「こう」とかな表記さ
れる漢字は「考」、「公」、「皇」、「光」等多数あ
り、「こうあん」とかな表記される単語は「考案」、
「公案」、「公安」等幾つもある。また、「田」という
漢字は、前後の文字や漢字の如何によって「美田」のご
とく「でん」、「稲田」のごとく「だ」、あるいは「田
畑」のごとく「た」と発音されたりする等読み方も多様
である。また、逆に種類が少ない上に使用頻度もあまり
ないが、「ぢ」と「じ」のごとく同一の発音に対して複
数のかな表記もある。
【0005】ところが、これらはあくまでも音節文字た
る「かな」と表語(意)文字たる「漢字」の対応、しか
も長い伝統でうまく対応づけられたものであるためまだ
取り扱い易い。現に、日本語ワードプロセッサーでは、
例えばかなで「こう」と入力されたときには、その音を
有する漢字を順に若しくは一度にCRTに表示した上
で、入力者に意図するものを選択させる等の手法でうま
く処理している。しかしこれが、実際に話されている状
態を基準にしての「音素文字」と「漢字」の対応関係と
なると相当複雑になる。すなわち、例えば、前述の
「考」、「公」等の漢字は人によってはこれを音素文字
たるアルファベットで英米式の発音、つづりで表記する
なら「KOU」であったり「KOO」であったりする程
度であるが、他の語や漢字ではこの程度ですまない。例
えば、「靴」はこの語のみを発音する場合には「KUT
SU」であるが、「おい、靴を持って来い。」等前後に
語句があると通常は「KTSU」と発音され、「u」の
音は省略される。しかも通常の人はこのことに気付いて
いない。「雲」と「蜘蛛」のごとくアクセントの相違に
至っては、若しも人に聞かれていざ指摘する(返事す
る)となるとほとんどの人が迷う。しかも、この強調部
も前後の単語の如何によって複雑に変化する。
【0006】更には、これに方言等が加わる。このた
め、若し、音節文字たる「かな」でなく、実際に話され
ている状態を基準に音素文字たる「アルファベット」と
アクセントを使用して、極めて正確に日本語文章を入力
しようとするならば「東京」のようなありふれた地名を
表示させる場合でも「TOOKYOO」、「TOUKY
OU」、「TOKIO」等多様であり、かなりの困難が
生じる。しかるに、中国語においては、入力手段とし
て、長い伝統でうまく対応づけられた音節文字たる「か
な」が存在しない上に、方言も大きく異なり、またいわ
ゆるアクセント(中国語におけるアクセント)が重要な
役割を課すため、入力手段として前述の発音記号とアク
セントに相応する注音符号を用いざるをえないが、この
上更に用いられる注音符号、漢字の種類も多いことがあ
り、ワードプロセッサーにおける正確な漢字変換の困難
性は大変なものである。
【0007】以下、中国語をもとに、具体的に説明す
る。第1の問題点。ただ単に、図5の(b)に示す単一
の曖昧情況のみを考えるため、中国語における字音の多
重類似情況、単一の字音ならば曖昧ではないが他の字音
との関係で曖昧となる、しかもこの際一対一の関係で曖
昧となるとは限らない現象を処理できない。例えば、字
音記号「図7〔外12〕」はよく「図7〔外13〕」と
間違える。しかし、「図7〔外14〕」と「図7〔外1
5〕」は従来例における類似音韻同士ではないので、従
来の変換方式によって曖昧処理をすることができない。
また、例えば、字音記号「図7〔外16〕」はよく「図
7〔外17〕」と、「図7〔外18〕」と、「図7〔外
19〕」と間違える。しかしながら、上記従来例におけ
る対応bit を無視する方式によっては、同時に曖昧処理
をできない。
【0008】第2の問題点。音節符号の配置位置によっ
て曖昧変換方式を制御するため、使用にあたり不便であ
る。例えば、特定使用者は字音記号「図7〔外16〕」
をよく「図7〔外19〕」と間違える。従来の音節符号
配置方式ではこのような離れた位置の字音が曖昧となっ
たり、曖昧な字音が出現したりする情況を想定していな
いうえに、使用者も自分でその位置を設定することによ
り対処することができない。
【0009】以上、2つの問題点のため、従来技術に係
る曖昧漢字変換装置はその実用価値がそんなに高くない
ともいえる。本発明は以上の問題点に鑑みなされたもの
であり、多重複雑な曖昧情況に有効に対処しえる曖昧漢
字変換装置を提供することを目的としてなされたもので
ある。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、請求項1の発明においては、字音記号を入力する入
力部と、前記入力部より入力された字音記号若しくは字
音記号列を内蔵する辞書をもとにその字音を有する漢字
若しくは漢字列に変換する変換部とを有する中国語ワー
ドプロセッサーにおいて、曖昧字音記号若しくは曖昧字
音記号となりえる字音記号を有する字音記号列毎に、そ
れらに対応する字音記号若しくは字音記号列を格納する
曖昧辞書と、前記変換部によって変換された漢字若しく
は漢字列に対して、曖昧位置及び検出可能な字数を指定
する曖昧範囲指定部と、前記曖昧範囲指定部にて指定さ
れた曖昧位置内の漢字若しくは漢字列に相応する字音記
号若しくは字音記号列毎に、前記曖昧辞書からそれらに
対応する字音記号若しくは字音記号列を検出する曖昧情
報検出部と、前記曖昧情報検出部によって検出された全
ての対応する字音記号若しくは字音記号列を前記変換部
に送った上で、これらの字音記号若しくは字音記号列に
対応する漢字若しくは前記曖昧範囲指定部で指定された
検出可能な範囲内の字数の漢字列への変換を行わせる変
換制御部と、前記変換制御部の作用のもとで前記変換部
により変換された漢字若しくは漢字列の中から入力者の
意図する漢字若しくは漢字列を選択可能とさせる選択部
とを有していることを特徴とする曖昧漢字変換装置とし
ている。
【0011】請求項2の発明においては、前記曖昧範囲
指定部に換えて、前記入力部から入力された字音記号若
しくは字音記号列に対して曖昧位置及び検出可能な字数
を指定する字音記号用曖昧範囲指定部と、前記曖昧情報
検出部に換えて、前記字音記号用曖昧範囲指定部にて指
定された曖昧位置内の字音記号若しくは字音記号列毎に
前記曖昧辞書からそれらに対応する字音記号若しくは字
音記号の組合せを検出する曖昧情報検出部とを有するこ
とを特徴とする請求項1記載の曖昧漢字変換装置として
いる。
【0012】請求項3の発明においては、前記選択部
は、前記曖昧範囲指定部若しくは字音記号用曖昧範囲指
定部により指定された字音記号若しくは字音記号列に対
し複数の対応する字音記号若しくは字音記号列が存在
し、更にこれらの各字音記号若しくは字音記号列に対し
てその音を有する漢字若しくは漢字列が複数存在する場
合に、入力者に第一段階として対応する字音記号若しく
は字音記号列を選択可能とし、第二段階として前記第一
段階で選択された字音記号若しくは字音記号列に対応す
る漢字若しくは漢字列を選択可能とさせる機能を有して
いることを特徴とする請求項1若しくは請求項2記載の
曖昧漢字変換装置としている。
【0013】請求項4の発明においては、前記曖昧情報
検出部は、前記曖昧範囲指定部若しくは字音記号用曖昧
範囲指定部により指定された曖昧位置に相応する漢字若
しくは漢字列に相応する字音記号若しくは字音記号列又
は指定された字音記号若しくは字音記号列中から非曖昧
なものを削除する機能と、複数の曖昧字音記号若しくは
曖昧字音記号列が存在する場合にはこれらを所定の手順
で組み合わせて指定された曖昧位置に対応する字音記号
列を全て検出する能力の少なくも一方を有していること
を特徴とする請求項1若しくは請求項2若しくは請求項
3記載の曖昧漢字変換装置としている。
【0014】
【作用】上記構成により、請求項1の発明においては、
入力者がいくつかの中国語文字の字音記号を入力した
後、変換部はこの入力された字音記号若しくは字音記号
列を索引として、内蔵する辞書をもとにその字音を有す
る漢字或いは漢字列、具体的には中国語の単語等に変換
する。この際、字音が類似しているため、結果的に入力
された字音記号が誤っており、ひいては、変換された漢
字、漢字列或いは単語が入力者の意図するものではない
場合には、入力者は曖昧範囲指定部によって曖昧位置と
検出可能な字数を入力する。曖昧辞書は、曖昧字音記号
若しくは曖昧字音記号となりえる字音記号を有する字音
記号列毎に、それらに対応する全ての字音記号若しくは
字音記号列を格納している。曖昧情報検出部は曖昧範囲
指定部によって入力された曖昧位置内の漢字若しくは漢
字列に相応する字音記号若しくは字音記号列毎に曖昧辞
書からそれらに対応する字音記号若しくは字音記号列を
全て検出する。変換制御部は曖昧情報検出部によって検
出された対応する字音記号若しくは字音記号列を変換部
に送った上で、これらに対応する漢字若しくは前記曖昧
範囲指定部で指定された検出可能な範囲内の字数の漢字
列への変換を行わせる。それから、選択部は入力者にこ
れらの曖昧漢字若しくは漢字列から意図した漢字若しく
は漢字列を選択させる。
【0015】請求項2の発明においては、字音記号用曖
昧範囲指定部が、前記入力部から入力された字音記号若
しくは字音記号列に対して曖昧位置及び検出可能な字数
を指定する。曖昧情報検出部が、前記字音記号用曖昧範
囲指定部にて指定された曖昧位置内の字音記号若しくは
字音記号列毎に前記曖昧辞書からそれらに対応する字音
記号若しくは字音記号列を検出する。
【0016】請求項3の発明においては、選択部は、前
記曖昧範囲指定部若しくは字音記号用曖昧範囲指定部に
より指定された字音記号若しくは字音記号列に対し複数
の対応する字音記号若しくは字音記号列が存在し、更に
これらの各字音記号若しくは字音記号列に対してその字
音を有する漢字若しくは漢字列が複数存在する場合に、
入力者に第一段階として対応する字音記号若しくは字音
記号列を選択可能とし、第二段階として前記第一段階で
選択された字音記号若しくは字音記号列に対応する漢字
若しくは漢字列を選択させる。
【0017】請求項4の発明においては、曖昧情報検出
部は前記曖昧範囲指定部若しくは字音記号用曖昧範囲指
定部にて指定された曖昧位置に相応する漢字若しくは漢
字列に相応する字音記号若しくは字音記号列又は指定さ
れた字音記号若しくは字音記号列中から、非曖昧なもの
が存在する場合にはこれを削除する若しくは複数の対応
する曖昧字音記号若しくは曖昧字音記号列が存在する場
合にはこれらを所定の手順で組み合わせて指定された曖
昧位置に対応する字音記号列を全て検出すること、の少
なくも一の機能を発揮する。
【0018】
【実施例】本発明を実施例に基づき説明するに先立ち、
本発明に係る曖昧漢字変換装置が組み込まれている中国
語ワードプロセッサーについて、まず概略説明する。中
国語ワードプロセッサーは、キーボード、CRT、辞
書、印字手段、フロッピーディスク、マイクロコンピュ
ータ等より構成され、中国語文章作成者(入力者)がキ
ーボードより入力する注音符号(以下、実施例ではより
広い概念である「字音記号」という。)に相応する発音
の漢字若しくは漢字列(複数の漢字という意味であり、
固有名詞を含み、中国語の単語に限定されない。)をマ
イクロコンピュータの作用のもとで辞書から検索し、そ
の上でこれをCRTに表示する。この際、入力された字
音記号に相当する漢字若しくは漢字列が複数存在し、C
RTに表示された漢字が入力者の意図するものでなかっ
た場合には、入力者の別途の指示のもと、他の漢字等を
一度に若しくは順次CRTに表示し、意図するものをキ
ーボードからの数字の指定又はカーソル等により入力者
に選択させる。このため、基本的構成は日本語ワードプ
ロセッサーと何等異ならない。
【0019】以下、請求項1の発明を主に請求項4の発
明を従として、両発明に係る曖昧漢字変換装置を説明す
る。さて、本発明に係る曖昧漢字変換装置はこの中国語
ワードプロセッサーに一体に組み込まれている。従っ
て、両者の関係に留意しつつ具体的構成要素と機能を説
明する。
【0020】図1は、この実施例のブロック図である。
本図において、11は入力者が字音記号を入力する入力
部であり、CRT、キーボード等を構成要素とする。1
2は、前記入力部11より入力された字音記号若しくは
字音記号列(複数の字音記号という意味であり、また必
ずしも特定の漢字等に対応するとは限らない。)をその
発音を有する漢字若しくは漢字列に変換する変換部であ
り、辞書等を構成要素とする。ここに辞書は、字音記号
若しくは字音記号列に対応してその発音を有する漢字若
しくは漢字列が格納されている。13は、曖昧字音記号
若しくはそれになりえる字音記号を有する字音記号列毎
に、それらに対応する字音記号若しくは字音記号列を格
納する曖昧辞書であり、その格納するデータを図3に示
す。14は、CRTに表示された漢字よりなる中国語文
章に対して、その位置からなる曖昧変換範囲と曖昧変換
結果として検出すべき字数が入力者によって指定され、
これをもとに任意の曖昧変換すべき字音記号及び検出可
能な字数が入力される曖昧範囲指定部であり、CRT、
キーボード等を構成要素とする。なお、ここに曖昧変換
結果として検出すべき字数を指定可能としているのは、
中国語文章中の文の一部として入力者が入力を意図する
漢字列の字数は入力者自身が知っていることが多いた
め、曖昧情報検出部による検出の高速化と入力者による
選択部に対する操作の節減を考慮したものである。15
は、曖昧範囲指定部11から入力された漢字若しくは漢
字列の字音記号を基に対応する曖昧変換すべき字音記号
若しくはこの字音記号を有する字音記号列を曖昧辞書か
ら検出する曖昧情報検出部であり、マイクロコンピュー
タ等を構成要素とする。なお、曖昧範囲の指定は漢字や
漢字列に対してなされること、入力者の過誤等により、
曖昧を生じえるとされた字音記号列中にも、特にその前
部と後部、曖昧を生じないものが存在することがある。
このためこの場合には、当該非曖昧部の字音記号は、曖
昧辞書による検出対象外とされることにより検出の高速
化が図られている。16は、曖昧情報検出部15で検出
された字音記号若しくは字音記号列に対応して、その発
音をなす漢字若しくは漢字列を、曖昧範囲指定により指
定された検出可能な字数の範囲内で検出した上でその漢
字若しくは漢字列に変換させる変換制御部である。なお
この検出の際、曖昧範囲指定部14で指定された数値を
超える漢字列は検索対象外とされる。17は変換制御部
16の作用のもと、変換部12で検索され、変換された
漢字若しくは漢字列を対応する字音記号若しくは字音記
号列と対応づけて内蔵のバッファメモリに記憶させた上
でCRTの所定位置に表示させ、入力者に意図したもの
を選択させる選択部であり、バッファメモリ、CRT、
キーボード等を構成要素とする。そして、この曖昧変換
の結果CRTに表示された漢字若しくは漢字列中から入
力者が意図するものを選択することとなる。なお、入力
者による選択がなされた後は、この選択部17からの通
知のもとバッファメモリ中の記憶内容は消去され、また
選択結果がCRT上面に表示されている入力中の中国語
文章の一部として追加表示され、併せて高速半導体メモ
リ及びフロッピーディスクよりなる中国語ワードプロセ
ッサー中の中国語文章記憶部(図示せず)に記憶される
こととなる。このため、ハード面についていうならば、
請求項1の発明における曖昧範囲指定部はキーボードと
CRTを、選択部は同じくキーボードとCRTを、曖昧
辞書は辞書を含む記憶装置を、請求項4の発明のものも
含めて曖昧情報検出部と変換制御部はマイクロコンピュ
ータをそれぞれ中国語ワードプロセッサーと共有してい
る。更に、入力者によるキー操作等は、この共有するキ
ーボードに対して、所定の手順でなされることも共通す
る。ひいては、これらの操作に係るハード面、ソフト面
は中国語ワードプロセッサーのみならず、極く普通の日
本語ワードプロセッサーにも採用されている技術であ
る。例えば、曖昧辞書の検出や変換部の変換は、日本語
ワードプロセッサーにおける入力されたかなから対応す
る漢字を検出するのと同じであり、曖昧辞書と変換部の
二段変換はかな入力でなくアルファベット入力で入力さ
れたアルファベット入力を一旦かな入力に自動変換後漢
字を検出するのと同じである。このため、その説明は省
略する。
【0021】次に曖昧辞書の構成について説明する。中
国語では、漢字は、一つ或いは複数の字音を持ってい
る。ところで、中国語の字音は「図7〔外20〕」から
「図7〔外21〕」まで字音記号順序によって千三百強
の種類がある。この際、中国語の読み記号が類似してい
る様子は大体、図5の(c)に示されている。中国語の
千三百強の種類の字音に対して字音の類似する様子に応
じて曖昧分類を行う。即ち、ある字音に類似した全ての
字音の記号を同じ曖昧字音記号とする。そして、当該字
音と曖昧発生の可能性によってその曖昧順序を与える。
図3に示すのはこのような方式によって構成された部分
の内容である。そのうち、「対応曖昧字音記号セット」
には、曖昧可能性の大きさにより、字音記号の順序を配
置する。一番前の字音記号はその曖昧可能性が一番大き
い。曖昧情報検出部15は、このような分類情況のもと
で、入力された字音記号に対応して曖昧変換を行う場合
に、該当する可能性が大きい順に、それに対応する字音
記号若しくは字音記号列を取り出すこととなる。この場
合、曖昧範囲として指定された全ての漢字に対応する字
音記号の曖昧のセットから曖昧性が対応する字音記号を
組み合わせ、この上で辞書18を検索して曖昧変換を行
う。
【0022】次にこの曖昧漢字変換装置の動作を図2に
示すフロー図を参照しつつ説明する。中国語ワードプロ
セッサーの使用者たる入力者によってキーボードから字
音記号が入力される(S1)。次に、当該中国語文字の
字音記号の変換処理に入り、入力された字音記号の組合
せにより、辞書を検索し、対応する漢字或いは漢字列に
変換する(S2)。入力者により変換結果が入力者の意
図したものであるか否か判断される(S3)。もし、変
換結果が入力者の意図したものであったと判断される場
合には、もとにもどって次のキー入力がなされる(S
1)。逆に、曖昧範囲指定部の入力が有りと判断された
ら、曖昧情報検出部の処理に入る(S4)。曖昧範囲指
定部の指定している曖昧位置(曖昧辞書を検索する場合
に、指定された位置の漢字に相応する字音記号が検索さ
れる)に対応して曖昧変換区間を設定し、当該変換区間
における漢字若しくは漢字列に対応する曖昧性を有する
字音記号若しくは字音記号列から曖昧辞書を使用して全
ての可能な曖昧情況を有する字音記号若しくは字音記号
列を組み合わせてから、これに対応する字音記号若しく
は字音記号列を検出する(S5)。次いで、検出された
字音記号若しくは字音記号列を変換部に送る。変換部
が、変換制御部を介して入力された字音記号若しくは字
音記号列によって辞書を検索し、曖昧範囲指定部により
入力された検出文字数の範囲内でそれに対応する漢字若
しくは漢字列に変換する(S6)。選択部は、変換結果
を優先度の順にバッファメモリに記憶し、この上で優先
度の最も高いものを変換された漢字若しくは漢字列のう
ち最優先順位のものをCRTに出力する(S7)。入力
者は、この表示結果が自分の意図するものか否か判断し
(S8)、もし意図するものでなければ、意図するもの
が表示されるまで順次、次の対応漢字若しくは漢字列を
表示させる(S9)。入力者の意図した漢字若しくは漢
字列が正しく表示されると、入力者はそれを選択部を通
じて選択し、これによりその漢字若しくは漢字列が中国
語文章に入力され、曖昧変換結果はバッファメモリから
消去される(S10)。
【0023】次に、以上説明したこの曖昧漢字変換装置
の作用を具体例を使用して説明する。例えば、入力者が
「中国人」を入力したいとき、捲舌音「図7〔外2
2〕」、を「図7〔外23〕」として「図7〔外2
4〕」のような間違った読みを入力すると、「中国人」
と正しく変換できない。図2を参照しながら、字音記号
の組合せ「図7〔外24〕」の入力を例として、本発明
の動作を説明する。「図7〔外24〕」が入力されてか
ら、入力部における(S1)のステップと変換部におけ
る(S2)のステップを経て、「宗國人」に変換され
る。これは入力者の意図する漢字ではない(S3)。こ
のため入力者は曖昧範囲指定部で「宗」を指定すること
により(S4)、曖昧変換のための処理に入る。なお、
別途、曖昧範囲指定部より入力された字音記号の曖昧変
換により検出されるのは三つの漢字であると指定され
る。
【0024】さて、図4(a)に示すように、この三つ
の漢字の字音記号に対応する曖昧字音記号列は「図7
〔外23〕」の対応曖昧字音セットが「図7〔外2
5〕」、「図7〔外26〕」は対応する曖昧字音がな
い、「図7〔外27〕」の対応曖昧字音が「図7〔外2
8〕」である。以上の曖昧字音記号の組合せにより、当
該曖昧変換区間における全ての可能な曖昧字音記号列は
図4の(b)になる(S5)。
【0025】そして、上記の各曖昧字音記号の組合せが
それぞれ変換制御部の作用により、検出字数についての
情報と共に変換部に送られる。上記の曖昧字音記号組合
せの辞書に対応する内容を図4の(c)に示す。変換部
では辞書の検索により、送られてきた字音記号における
全ての単語をひろいだす。この上で、これらの単語は全
て選択部に送られ、そのバッファメモリ内に優先度順に
記憶される。そして、最優先の漢字列がCRTに表示さ
れる(S7)。例えば、上記の曖昧字音記号組合せ
(1)〜(6)中から最初に(1)の「中國人」を検索
できる。もし、これが自分の意図した結果ではない場合
には(S8)、入力者は続いて選択部用のキーを押す
(S9)。これにより、バッファ・メモリから次順位の
曖昧字音記号組合せに対応する「尊國人」と取り出し表
示する。やはり、自分の思った結果ではない。この場
合、また、選択用のキーを押し(S9)、(6)番目の
曖昧字音記号組合せを検索し終わるまで次に対応する漢
字或いは単語を検索する。最終的に「中国人」が得ら
れ、バッファの全曖昧変換結果は消去される(S1
0)。しかる後、次の漢字への字音記号の入力がなされ
る。
【0026】次に、請求項2の発明について説明する。
請求項2の発明は、請求項1の発明と比較した場合に曖
昧範囲の指定が漢字若しくは漢字列に対してなされるの
に対して、字音記号若しくは字音記号列に対してなされ
るのが異なるのみである。このため、本発明に係る曖昧
漢字変換装置の構成、作用は請求項1のものと基本的に
は同じである。従って、相違する構成、作用、操作内
容、効果についてのみ説明する。
【0027】字音記号、字音記号列によっては、入力者
がどの字音記号若しくは字音記号列で正しく入力されな
かったか容易に判明しえる場合がある。かかる場合に
は、曖昧変換すべき範囲を誤って表示された漢字若しく
は漢字列に対して指定するよりも、入力した字音記号に
対してなした方が検出が早くなる。本発明はこのことを
考慮の上なされたものである。図8は、本発明に係る曖
昧漢字変換装置における、CRT上に表示された中国語
文章、誤った字音記号列及びこの誤った字音記号列に対
する「〔」、「〕」内に示された曖昧位置の指定、誤っ
た字音記号列に基づき変換された漢字列並びに検出可能
な文字数として指定された整数「1」の様子を概念的に
示したものである。本実施例においては、作成入力中の
中国語文章として次に入力される漢字列は3字、そのう
ち後の2字は「国人」として入力されるのが正しいこと
が字音記号列に対する曖昧範囲の位置の指定及び検出可
能な漢字数より判明しているため、既にCRT上の中国
文の表示では、該当する位置に「国人」が表示されてい
る。なお、入力した字音記号列に対する曖昧範囲の指定
のためには、この字音記号列がCRTに表示されること
が必要であるが、これは中国語ワードプロセッサーのみ
ならず極く普通の日本語ワードプロセッサーにおいて
も、漢字表示のために入力したかな文字がCRT下部に
小さく表示される、というよりも正しく字音記号を入力
するために必要不可欠かつ周知の技術であるため、その
内容の説明は省略する。
【0028】次に、請求項3の発明について説明する。
本発明は、一の曖昧性を有する字音記号若しくは字音記
号列に対して複数の対応する字音記号若しくは字音記号
列があり、更にこれらの対応する字音記号若しくは字音
記号列毎に複数の検出されるべき漢字若しくは漢字列が
ある場合の便宜のため、請求項1の発明と請求項2の発
明を組み合わせたものである。さて、曖昧漢字変換装
置、特にその曖昧辞書はあくまでも一般的な中国人を対
象として、多少限定しても上海語、広東語等を話す人を
対象として作成される。ところが、使用者によっては、
自分固有の若しくは自分の使用する中国語方言固有の曖
昧性の傾向が判明している場合がある。この場合には、
曖昧性の親密な順に検出するよう作成された辞書をもと
に順に検出していくよりも、入力者にいわば検出の手助
けをなさせた方が早くなる。そこで、なされたものであ
る。このためその基本は、端末機に広く採用されている
メニュー選択と異ならない。ただし、技術的にはずっと
容易であるため、ハード面、ソフト面の説明は省略し、
その操作のみ説明する。
【0029】図9は、本発明に係る曖昧漢字変換装置に
おけるCRT上に表示された中国語文章及びこの文章中
の漢字列に対する曖昧範囲の指定並びに誤った字音記号
列及びこれに対応した曖昧辞書内の6種の字音記号列の
表示を概念的に示したものである。入力者は、中国文章
中に表示された「宗国人」に対し「〔」、「〕」で曖昧
位置をCRT右下に示すように検出字数で曖昧範囲を指
定している。これに対応して曖昧辞書内の検出結果とし
て(1)〜(6)の曖昧字音記号列が表示されている。
入力者はこの表示結果から第1段の選択として(6)を
選択している。なお、この次に続く操作であるが、この
選択の結果としてCRT上に(6)の字音記号列に相当
する3字からなる漢字列が全て今度は辞書から検出の上
表示され、この表示された漢字列から入力者が入力を意
図する漢字列を選定する第2段の選択操作がなされるこ
ととなる。
【0030】以上、本発明を実施例にもとづき説明して
きたが、本発明は何も上記実施例に限定されないのは勿
論である。すなわち、その要旨を変更しない範囲内で適
当に変形して実施してもよい。例えば、 曖昧辞書における字音記号は中華民国で用いられてい
る注音記号に限らず、その他注音符号第二式は勿論ロー
マ字のへい音符号のように、中国語文字の字音記号を表
わすことができるものなら他のものでもよい。 曖昧字音記号に対応する字音記号の組合せによって曖
昧辞書を検索した上で入力者に選択させる場合、逐次対
話式、一度に全ての対応する曖昧字音記号或いは漢字を
表示しその上で使用者に自分の意図するものを選択させ
る方式等、その内容は問わない。 漢字若しくは漢字列に対する曖昧位置の指定は、入力
中の中国語文章、CRT下部等その位置、態様を問わな
い。 曖昧範囲指定部で指定される検出可能な字数は、特定
の整数値でなく、○字以上、○字以下、○字以上×字以
下等であってもよい。勿論、検出可能な字数の指示がな
くても検出可能、特に曖昧範囲として設定された漢字別
の字数と同じものが優先して検出される等してもよい。 日本語ワードプロセッサーのごとく、学習能力を有し
ていてもよい。 曖昧辞書の配列順序は、中国語ワードプロセッサーの
販売場所に対応して適宜最善のものに変更されていても
よい。あるいは中国語方言に相応して入力者で選択可能
等なされていてもよい。なお、この場合には、北京語
用、上海語用等、複数種類の辞書を内蔵しておき、カー
ソルによるメニューの選択で指定された辞書が利用され
るようにするのがよいであろう。
【0031】
【発明の効果】以上説明したように、本発明に係る曖昧
漢字変換装置によれば、中国語ワードプロセッサーにお
いて、漢字の字音記号の曖昧処理を行う場合に、複雑な
曖昧情況を考慮するため複雑な曖昧情況に柔軟に対応可
能となり、その実用性が高くなる。
【図面の簡単な説明】
【図1】請求項1の発明に係る曖昧漢字変換装置の一実
施例のブロック図である。
【図2】上記実施例の処理過程を示す流れ図である。
【図3】上記実施例における曖昧辞書の構成図である。
【図4】(a)は上記実施例における曖昧辞書の部分構
造図である。(b)は上記実施例における曖昧字音記号
組合せである。(c)は上記実施例における辞書の部分
構造図である。
【図5】(a)は従来技術に係る曖昧漢字変換装置のブ
ロック図である。(b)は従来例における類似した音韻
要素のビットパターンを示す図である。(c)は従来例
における中国語注音符号の類似する読み符号の組合せを
示す図である。
【図6】注音符号による中国語の読み記号表である。
【図7】明細書における中国語に係る外字の一覧であ
る。
【図8】請求項2の発明に係る曖昧漢字変換装置におけ
るCRT上での表示の一例を概念的に示した図である。
【図9】請求項3の発明に係る曖昧漢字変換装置におけ
るCRT上での表示の一例を概念的に示した図である。
【符号の説明】
11 入力部 12 変換部 13 曖昧辞書 14 曖昧範囲指定部 15 曖昧情報検出部 16 変換制御部 17 選択部
フロントページの続き (72)発明者 張 家華 台湾タイ・ペイ・シ・ター・アン・チー・ 10628・レン・アイ・ル・サン・トォア ン・136・ハオ・10・ロウ スン・シャ・ ティエン・チ・チ・シュー・カイ・ファ ー・クゥー・フェン・ユウ・シエン・コ ン・スー内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 字音記号を入力する入力部と、該入力部
    より入力された字音記号若しくは字音記号列を内蔵する
    辞書をもとにその字音を有する漢字若しくは漢字列に変
    換する変換部とを有する中国語ワードプロセッサーにお
    いて、 曖昧字音記号若しくは曖昧字音記号となりえる字音記号
    を有する字音記号列毎に、それらに対応する字音記号若
    しくは字音記号列を格納する曖昧辞書と、 前記変換部によって変換された漢字若しくは漢字列に対
    して、曖昧位置及び検出可能な字数を指定する曖昧範囲
    指定部と、 前記曖昧範囲指定部にて指定された曖昧位置内の漢字若
    しくは漢字列に相応する字音記号若しくは字音記号列毎
    に、前記曖昧辞書からそれらに対応する字音記号若しく
    は字音記号列を検出する曖昧情報検出部と、 前記曖昧情報検出部によって検出された全ての対応する
    字音記号若しくは字音記号列を前記変換部に送った上
    で、これらの字音記号若しくは字音記号列に対応する漢
    字若しくは前記曖昧範囲指定部で指定された検出可能な
    範囲内の字数の漢字列への変換を行わせる変換制御部
    と、 前記変換制御部の作用のもとで前記変換部により変換さ
    れた漢字若しくは漢字列の中から入力者の意図する漢字
    若しくは漢字列を選択可能とさせる選択部とを有してい
    ることを特徴とする曖昧漢字変換装置。
  2. 【請求項2】 前記曖昧範囲指定部に換えて、前記入力
    部から入力された字音記号若しくは字音記号列に対して
    曖昧位置及び検出可能な字数を指定する字音記号用曖昧
    範囲指定部と、 前記曖昧情報検出部に換えて、前記字音記号用曖昧範囲
    指定部にて指定された曖昧位置内の字音記号若しくは字
    音記号列毎に前記曖昧辞書からそれらに対応する字音記
    号若しくは字音記号列を検出する曖昧情報検出部とを有
    することを特徴とする請求項1記載の曖昧漢字変換装
    置。
  3. 【請求項3】 前記選択部は、前記曖昧範囲指定部若し
    くは字音記号用曖昧範囲指定部により指定された字音記
    号若しくは字音記号列に対し複数の対応する字音記号若
    しくは字音記号列が存在し、更にこれらの各字音記号若
    しくは字音記号列に対してその音を有する漢字若しくは
    漢字列が複数存在する場合に、入力者に第一段階として
    対応する字音記号若しくは字音記号列を選択可能とし、
    第二段階として前記第一段階で選択された字音記号若し
    くは字音記号列に対応する漢字若しくは漢字列を選択可
    能とさせる機能を有していることを特徴とする請求項1
    若しくは請求項2記載の曖昧漢字変換装置。
  4. 【請求項4】 前記曖昧情報検出部は、前記曖昧範囲指
    定部若しくは字音記号用曖昧範囲指定部により指定され
    た曖昧位置に相応する漢字若しくは漢字列に相応する字
    音記号若しくは字音記号列又は指定された字音記号若し
    くは字音記号列中から非曖昧なものを削除する機能と、
    複数の対応する曖昧字音記号若しくは曖昧字音記号列が
    存在する場合にはこれらを所定の手順で組み合わせて指
    定された曖昧位置に対応する字音記号列を全て検出する
    能力の少なくも一方を有していることを特徴とする請求
    項1若しくは請求項2若しくは請求項3記載の曖昧漢字
    変換装置。
JP5002785A 1993-01-11 1993-01-11 曖昧漢字変換装置 Pending JPH06208560A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5002785A JPH06208560A (ja) 1993-01-11 1993-01-11 曖昧漢字変換装置
CN93105336A CN1048341C (zh) 1993-01-11 1993-04-30 模糊汉字变换装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5002785A JPH06208560A (ja) 1993-01-11 1993-01-11 曖昧漢字変換装置

Publications (1)

Publication Number Publication Date
JPH06208560A true JPH06208560A (ja) 1994-07-26

Family

ID=11539008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5002785A Pending JPH06208560A (ja) 1993-01-11 1993-01-11 曖昧漢字変換装置

Country Status (2)

Country Link
JP (1) JPH06208560A (ja)
CN (1) CN1048341C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840326A (zh) * 2019-01-31 2019-06-04 浪潮软件集团有限公司 一种汉字字义、字音、字形的相似度比对系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1003326B (zh) * 1985-04-01 1989-02-15 王永民 优化五笔字型编码法及其键盘
JPH0656609B2 (ja) * 1985-10-18 1994-07-27 日本電気株式会社 中文入力装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840326A (zh) * 2019-01-31 2019-06-04 浪潮软件集团有限公司 一种汉字字义、字音、字形的相似度比对系统及方法

Also Published As

Publication number Publication date
CN1048341C (zh) 2000-01-12
CN1089736A (zh) 1994-07-20

Similar Documents

Publication Publication Date Title
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP3795692B2 (ja) 文字処理装置および方法
JPS634206B2 (ja)
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JPS58123129A (ja) 仮名漢字変換装置
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
JPH06208560A (ja) 曖昧漢字変換装置
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JP3234338B2 (ja) 漢字変換装置
JPS5818730A (ja) 文字処理装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP3888701B2 (ja) 文字変換装置
JPS62212870A (ja) 文章読み上げ校正装置
JPH0630052B2 (ja) 音声認識表示装置
JP2862236B2 (ja) 文字処理装置
JPH0350668A (ja) 文字処理装置
JPH0625988B2 (ja) 日本語情報入力方式
JPS60205594A (ja) 認識結果表示方式
JPS62154022A (ja) 音声タイプライタ
JP2004053871A (ja) 音声認識システム
JPS608922A (ja) 日本語処理装置
JPH03212762A (ja) かな漢字変換装置
JPH027160A (ja) 文字処理装置
JPS62226270A (ja) 文章作成装置
JPS61177573A (ja) 日本語文章作成装置