JPS6312060A - 東洋言語処理システム - Google Patents

東洋言語処理システム

Info

Publication number
JPS6312060A
JPS6312060A JP62120986A JP12098687A JPS6312060A JP S6312060 A JPS6312060 A JP S6312060A JP 62120986 A JP62120986 A JP 62120986A JP 12098687 A JP12098687 A JP 12098687A JP S6312060 A JPS6312060 A JP S6312060A
Authority
JP
Japan
Prior art keywords
symbols
codes
code
group
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62120986A
Other languages
English (en)
Inventor
ミーン ジェー ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JPS6312060A publication Critical patent/JPS6312060A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 1匪立1遣 (タイプライタ、コンピュータ、テレックス、タイプセ
ッターおよび同等品を含む)情報プロセッサを介して人
が効率的に相互に通信するには、例えば英語のローマ字
のアルファベットのような少ない数の符号を有する理解
可能なコーディングシステムを有することが重要である
。しかしなから、中国語、日本語および朝鮮語の場合、
従来の書かれる記号は、何千もの異なる文字から成るの
で、コーディングマニュアルまたは装置を用いずに平均
的な識学者がコーディングされた符号を読み取りかつ理
解でき、コーディングが従来の個々の文字を正確に識別
し、従来の米国のタイプライタ−のキーボード程大きく
ないキーボードでコーディングを入力でき、英語を筆記
するのに現在用いられている情報処理技術にコーディン
グが適すようにこれらの言語の各々ではこれら文字をコ
ーディングするためのシステムが長い間型まれてきた。
過去におけるこれら問題を処理する努力がなされたため
、これら問題を全体として解決することなくこれら問題
のいくらかに焦点を合わせた解決方法が得られた。
i肌二皇1 本発明によれば、東洋で使用されている何千もの表意文
字は、より少ない数の符号の組合わせにより正確かつ理
解可能に表示されている。この符号の表示は、直接読み
取り、かつ理解し得るので、書かれた言葉と同じように
情報を伝達できる。この符号の組合わせは、発音部分と
意味表示部分とから成る0発音符号は、辞書におけるよ
うに文字の発音を表示するための当該東洋の言語の従来
のフォネテックスであることが好ましい、意味表示符号
は、前記発音の同音異義文字を区別するため使用される
。各文字をコーディングするために通常一つの意味表示
符号が使用されるが、時々最大2つまでの意味表示符号
が必要となる。意味表示符号は、当該文字を書くとき書
き順に実質的に従がいコーディング中に入れられる0本
発明のため、限定された数の意味表示符号をM4集して
、使用する0選択された意味表示符号はかかる直接的理
解を助けるため文字の選択した限定された数の従来の基
本記号に実質的に対応することが好ましい。
情報プロセッサへの入力は、適当な手段、例えば音声命
令を介して行なうことができる。しかしなから入力手段
は、特定の文字を表示する一つ以上の連続する符号の各
グループを離間するためのキーを共に備えた前記選択さ
れた符号を示すキーを有するキーボードであることが好
ましい、このシステムには、前記グループの各々を対応
する文字で識別する情報を記憶するためのメモリおよび
入力する際の符号およびスベ゛−スのいずれかまたは対
応する従来の文字を任意にディスプレイするための手段
を備えることが好ましい。
本発明の上記以外の目的、利点および細部は、次の開示
内容から明らかとなろう。
口の 在 ましい−施 様の=明 表意文字は、発音表示部分と、意味表示部分にコーディ
ング(暗号化)される、従って、本発明のコーディング
は、表意文字を元の文字の完全な発音と対象の分類を表
わす構成要素である意味表示符号と発音表示符号の理解
可能なストリングに正しく変換する。この意味表示部分
と発音表示部分のコーディングは、元の表意文字を正確
に識別するようにデコード(解読)できる。
第8図に実行装置を示す、この図はディスプレイスクリ
ーン46上に意味表示部分と発音表示部分のストリング
のコーディングされたテキストをディスプレイするよう
キーボード30からの信号を伝送するケーブル44を示
す、キー38を押すと、ケーブル48は、コーディング
されたテキストまたは、従来の文字状態のテキストをプ
リントするための出力装置50ヘキーボード30を接続
する。コーディングされたテキストの編集は、修正を入
力するようキーボード30を使用することによりスクリ
ーン46上で行うことができる。
コーディングストリングは、ケーブル52を通してデー
タ処理および通信装置54へ送られ、この装置で処理さ
れ、更に伝送される。伝送は、有線または無線通信チャ
ンネル56を通して受信装置58まで行なわれ、受信波
=58は、ケーブル60を通して出力装置に所望のテキ
ストをプリントアウトさせる。キーボードの記号を除く
佑報処理システムのこの部分は、アルファベットを使用
する言語、例えば英語用の従来のシステムと同じである
本発明の現在好ましい実施態様は、所望のすべての表意
文字に関する情報を各々の文字の指定番号およびそれに
対応する活字コーディングストリングで記憶する別の辞
書用メモリおよびデコーダ64を必要とする。ケーブル
62を通してメモリおよびデコーダ64がディスプレイ
装置46上のコーディングされたテキストを文字テキス
トに変換したり、または文字テキストをコーディングさ
れたテ・キストに変換するよう第3図中のr文字」キー
38を作動できる。この時の変換命令は、メモリユニッ
ト64からケーブル66を通してディスプレイユニット
46へ送られる。対応する文字テキストをプリントする
ための信号は、データ処理および通信装置54へ転送さ
れ、更に処理して、文字テキストのプリントを出力する
こともできる。
次にコーディングについて説明する0選択される発音記
号は、従来のものであり、好ましくは、中国語に対して
は、中国語国定往昔字母(中国語音声符号とも称される
)プラス声調符号、日本語に対してはカナ文字プラス分
音符号、朝鮮語に対してはハングル文字である。前記発
音、特にローマ字の音訳には、東洋でローマ字がより多
く使用されるにつれて音価を有する他の記号も使用でき
る。かかるローマ字の音訳の一例として、中国で公式に
採用され、全世界に知られている「フル音」がある。声
調符号を含む7N音により表わされる発音は、中国語国
定注意字母プラス声調符号により表わされる発音に一対
に対応する。いずれの場合でも、当該東洋言語中の文字
の称呼される完全な発音を記述するのに発音符号が用い
られる0文字の前記称呼は、従来通りであり、当該言語
の辞書に表示されている。(一つの文字は異なる東洋の
言語間で、全く別の称呼を有する。)シの称呼は文字を
理解可能に表示できる。しかしなからこれらの東洋言語
のいずれでも多数の同意異義語があるので、称呼は、一
つの文字を正確に表示できない。
これらの発音が同意異義語のグループのうちのいずれの
一つを意味するのかを正確に表示するため、本発明は識
別のため発音部分の横に添えられる一組の意味表示符号
を使用する。
意味表示符号の必要な組は、東洋言語を記述するのに使
用される同士もの表意文字を分類しかつ整理する際に従
来より東洋言語の辞書で使用されている214個の基本
記号の組から選択し得る。ある場合には、選択された基
本記号は、認識可能な識別性を失うことなく改変する。
従来対象の分類を表わしていた基本記号を選択した結果
、この組のうちの意味表示記号の各々は簡約された対象
の分類を表示することになる6本発明の目的のためには
、一つの組で64個の意味表示記号が好ましい。
本発明は、意味表示記号の組を選択するための規則およ
び方法を更に提供する。まず最初に従来の214個基本
記号からグループ分けによりほとんどの文字をカバーす
る少ない組の基本記号を選択する。残りの基本記号のい
くつかも、選択した組に含める0選択した基本記号のほ
とんどは、元の形を保持している一方、残りの基本記号
は改変されでいるが、所属する基本記号を良好に表示す
るよう認識できる形となっている。非選択基本記号が次
の条件の一つ以上を満す場合、非選択基本記号をカバー
するグループ自体を一表示するのに一つの選択された基
本記号を使用できる。すなわち(1)非選択基本記号の
表意上の語源が同一である場合、(2)表意的変遷のあ
る段階で意味が同じであった場合、(3)同様または関
連する意味または形を有している場合、(4)相手の一
部となっている場合、(5)通常の使用でまたは大衆の
誤用により相互に置き換えできるようになっている場合
である。
後に説明するコーディング規則と共に辞書中のすべての
文字の説明的コーディングをする。意味表示記号のため
の選択された基本記号の所望め組が得られるまで選択を
繰り返す、この目的は、直接読み取りできる言語状態の
コーディングとして理解度を最大にしかつ選択される意
味表示記号を最少にすることである。
同士もの文字は、異種のグループになっており、良好な
言語体系内に位置付けられるよう分類される余地はない
0発音符号の前に単に基本記号を前置するような、極め
て簡単な方法を取れば、全体で214個の従来の基本記
号でもすべての同意異義文字を区別できるわけではない
本発明は、発音および意味表示記号を選択するだけでな
く、スペースで区切られるスタンドアロン符号の形態を
取ることができる上記記号の相対的位置またはスペース
間に選択したシーケンスで並置された符号の組合わせを
選択することにより文字を表示することを意図するもの
である。識別目的のための現在好ましい相対的位置は次
のように数が6である。
(1)発音符号の前に意味表示符号を置く場合(2)発
音符号の後に意味表示記号を置く場合(3)意味表示符
号のない発音符号のみの場合(4)発音符号の前後に一
つずつ意味表示符号を置く場合 (5)意味表示符号のみの場合 (6)発音表示符号を用いないで2つの意味表示符号を
並置する場合 これらの位置上の識別条件は、予想される利用頻度の順
にリストされている。95%を越える文字が最初の4つ
の識別条件により表示される。RL後の2つの識別条件
は発音符号を含んでいない。
第5番目の識別条件では、意味符号自体が当然に発音を
有する文字となっている。2つの意味符号しか有しない
6番目の識別条件では、それ自体文字となっている第2
番目の意味符号が発音を示している。第4番目または第
6番目の識別条件では同一または異種の符号から成る2
つの意味符号が存在している。
次の規則A、BおよびCは、前記6つの識別条件の一つ
を使用することによる一つの文字のコード化された表示
への変換を制御する。
^、意味表示符号のための規則 1、意味表示および発音符号の他に、更に区別を要する
同意異義語の間では、あまりよく使用されない文字には
マーカー意味符号が付けられる(第9B図中の実施例1
4および15)。例14および15内の双方の表意文字
は同じ発音を有し、同じ基本記号グループに属している
。例14内の文字(「低木の生い茂る」を意味する)は
古語になりつつあり、この文字の刊行物での使用頻度は
例15内の文字(「日除けjを意味する)に比較して少
ない、前者の文字は、マーカーとして別の意味符号を有
する。
2、辞書中のいくらかの文字の元の基本記号は、文字に
より近い意味を表わすよう改変する必要がある。当然な
から、文字(第9B図中の例16)から新しい意味表示
符号を選択する。
3、 多数の意味表示符号は、同じ意味を有する余り使
用されない基本記号のいくつかを表示するか、後の基本
記号によりカバーされるものを含む。
例えば、「脚付容器」 (第9B図中の実施例17)の
基本記号は「容器」 (第9B図中の例18)を表わす
意味表示部分と置換し、この中に含められる0文字の分
類の際にかかる表示の分類が容易に′明らかとならなけ
れば、可能な限り意味表示記号の使用は避けるべきであ
る。かかる意味表示記号は同意異義語を区別するために
使用するかまたはマーカー意味表示記号として使用でき
る(第9B図中の例19対20) 4、 同意異義語のため意味表示記号を選択する良好な
方法がない場合、画数の多い文字の方が、意味表示記号
が多くなる。(第9B図中の例21対22)。
6、意味表示記号および発音表示記号のコーディングの
際に文字ごとに意味表示記号が多くて2つになケ得る。
中国語または日本語では、発音字の前に1つの意味表示
記号しか前置されず後には一つの意味表示記号しか後置
されなく、朝鮮語では、並置するよう隣接した4つの固
定位置の各々に一つの記号しか入らない。
B0発音表示符号のための規則 1、意味表示符号および発音表示コーディングの発音部
分は、コーディングされる文字の完全な発音を識別し、
(中国語における声調符号および日本語における分音符
号を含む)当該言語の発音符号から構成される。中国の
第1声はできるだけ省略すべきであるが、(1)複合語
中の単語の境界を表示するため、(2)正しい声調のた
めの意味表示符号を表示するため、(3)ある場合には
軟声調を表示するために使用すべきである。声調符号の
ない日本語の場合、文字コーディングと次に来る文字と
の間の境界を表示↓るのに特別な符号、例えば複合語の
間のダッシュおよびコーディングストリングの間のスペ
ースが使用される。朝鮮語のコーディングは、自然の境
界を有する並置され央構成分離される。
2、各意味表示符号には、一つの適当な発音が指定され
る。意味表示−発音コーディングは、発音符号を有しな
いで意味表示符号のみ(2つまで)を有することがある
。最後の意味表示符号は、発音を表わす音符号(第9A
図中の例6)となる。
3、異なる発音を有する文字は、多くの異なる意味表示
−発音コーディングへ変換され、このコーディングは時
々異なる意味表示符号(第9B図中の例25および26
)を有することさえある。
C0優先規則 表意文字をコーディングするための意味表示−発音符号
を選択する際には、選択優先度の順に次の規則に従う。
1.0  文字が意味表示符号と同一のときは、その文
字はその意味表示符号(第9A図中の例1)のみにより
コーディングされる。
1.1  文字が2つの意味表示符号から成るとき、こ
の文字は同じ書き順で2つの意味表示符号によりコード
化され、第2の符号に従って発音される(第9A図中の
例2)。
2.0  文字のための優先度は、意味表示符号、次に
発音表示符号となる。意味表示符号を発音符号の前に置
くか、後に置くかは、その文字を書くときの元の書き順
によって決める(第9八図中の例3および4)。
2.1  明らかな書き順を見付けることができない場
合、意味表示符号は、発音符号に先行する(第9A図中
の例5)。
3、 次の優先度は、意味表示符号であり、その後に発
音符号として使用される別の意味表示符号が続く(第9
八図中の例6)。
4、次の優先度は、意味表示符号のない発音符号である
。どの意味表示符号にも明らかに分類されない文字は、
この優先度に入る(第9A図中の例8)。
5、OA後の優先度は、先の規則2.0または2.1に
より区別できない文字を識別するためマーカーとして第
2意味表示符号を使用することである。
5.1° マーカー符号は、書き順規則に従う(第9A
図中の例11)。
6、文字をより多く使用することは、選択優先度を高め
る(第9A図中の例12および13)。
上記規則を説明するため上に示した例は、中国語におけ
るものである。これら規則は、同じよう。
な例が容易に明らかになる日本語および朝鮮語の意味表
示−発音符号コーディングにも適用できる。
これら規則は、必要かつ避けることができないときに限
り例外が生じ得る一般的な文法的規則と同じように適用
されるべきである。
シンボルは、コーディングされ、一つをディスプレイし
た後に次のシンボルを直線(水平(好ましい)または垂
直)状にディスプレイする。しかしなから朝鮮語のハン
グル文字は、直線状でない長方形(並WfIII成と称
す)に従来通り綴られ、ここでは、発音符号の左右また
は上下に別の一つまたは2つの基本記号が並置される。
本発明の好ましい実施例では、第1A図および第1B図
中の第1コラムにリストしたような64個の意味表示符
号が選択される。第1A図および第1B図中のコラム2
は、対応する意味をリストアップしたものである。これ
ら意味表示符号のいくつかは、日本語のかなまたは朝鮮
語のハングル符号と混同されることがある。混同を避”
けるため第1A図および第1B図は、それぞれコラム3
お妻よび4に日本語および@鮮語のためのいくつかの代
わりの意味表示符号をリストアップした。第1A図およ
び第1B図中の最後のコラムは、いくつかの代わりの簡
略化符号を示したもので、そのうちのほとんどは、中国
、日本および韓国で公式に採用されているものである。
第1C図および第1D図中のコラム1は、第1A図およ
び第1B図中の意味表示符号を繰返すが、コラム2は対
応する 音による発音をリストアップしている。第1C
図および第1D図中のコラム3は沓音からの好ましい略
語を大文字でリストアップしたものである。これら文字
の略語は、コーディング内に並置されると、下方の文字
内にある唐音の発音から区別できる。第1C図および第
1D図は第1コラム中の適当な意味表示符号に含まれ、
これら符号に示される約153の基本記号をリストアッ
プしている。第1C図および第1D図中で括弧に囲まれ
た基本記号を示すとき、マーカーのみのため一つの意味
表示記号を使用すべきである。このタイプのコーディン
グは、最後の手段として使用すべきて°゛ある。
中国語の文字、例えば「暮」 (第2図中の21を参照
)をコーディングするため、発音体系におけるその発音
、例えば中国国定往昔字母プラス声調符号をまずコーデ
ィングする(第2図中の20を参照)、この発音のコー
ディングは従来通りであり、辞書で見付けることができ
る。この基本符号は、この文字が辞書で属している基本
グループから通常取り出される。しかしなから、誤まり
によりこの文字は辞書内で基本符号「”」に分類される
。この文字の基本的要素の構成を更に解析すると、この
文字は、基本符号「日」または基本符号r大Jを基礎と
もできることが判る。「暮」は「叶」または「大」より
も1日」に関連しているので、本目的のため基本符号「
日」が選択される。
この符号は、この文字の書き順に従って発音符号に加え
られ、第2図のコーディング22に示されるようにコー
ディングストリングの最後の非声調符号にマークするた
め声調符号が移動される。一般にこれでコーディングプ
ロセスが完了する。
第2図は、符号20により表示される発音の同意”sn
語(コラム1)および国定発音記号(コラム2)および
夜前(コラム3)におけるそれらに対応する意味−発音
符号コーディングをリストアップしたものである。第2
図中の文字23は、意味表示符号であるので、それ自体
でコーディングされる0文字28も同様にそれ自体でコ
ーディングされる。第2図中の文字24は、2つの複合
した意味表示符号、すなわち基本符号「シJと基本符号
「木」 (第2図中の番号26で表示)によりコーディ
ングされる。後者の基本符号は、上記の発意規則8.2
に従いこのコーディングの発音を表わす、第2図中の他
の文字の各々には、意味表示符号および発音符号の双方
でコーディングされている。第2図における番号25で
示される文字「状°」は、意味表示符号「犬」で表現さ
れた、基本符号「牛」に属す、この文字25は、第2図
中のコーディングストリング27に示されるようにコー
ディングされる。この例ではコーディングにはあいまい
性はない、このコーディングの例によリ、一つの文字は
、その構成要素である意味表示−発音符号のストリング
へ正しくコーディングされることおよびこの構成要素で
ある意味表示−発音符号のストリングは、一義的に一つ
の文字しか表わさないことが明らかとなる。 ′ 第9A図の例12および13の表意文字は、2種類の植
物を意味する。いずれの文字も同じ基本符号「 」に属
し、同じ発音符号を共有する0例13の意味表示−発音
符号コーディングは、本明細書でマーカーと称す別の意
味表示符号が付いている。この余分な意味表示符号は、
これら同じコーディングストリングを区別する。しかし
なから辞書全体にはマーカー意味表示符号を必要とする
表意文字はほとんどない、第2図中のコラム2内の意味
表示符号も第2図のコラム4に示すように第1C図およ
び第1D図のコラム3にリストアップされている対応す
る大文字の略語と置換できる。
中国語の意味表示−発音符号のコーディングされたスト
リングは、第3A図に略図で示すような中国語用キーボ
ード上の対応するキーを介して入力される。第3A図に
示すキーボード30は、意味表示−発音符号のため5つ
の水平列としての垂直コラムに配置されたキー32を有
する。スペースパー34は、スペースを入力し、シフト
キー36は、キー32上の下方および上方マーキングに
対応して下方の非シフト位置と上方のシフト位置との間
でシフトする。従来の文字でディスプレイまたはプリン
トアウトするには、文字キーと称されるキー38を押せ
ばよい。
句読点および数字のような他の従来のキーは図示してい
ない(数字は、いくつかのキーボードで一般的に使用さ
れているコンパクトな長方形の整列内の内側に表示する
ことが好ましく、アラビア数字の0〜9は、キーの非シ
フト位置に表示され、対応する漢字の数字は、シフト位
置にあるキーに表示される)、シかしなから、下記の符
号に不要なキー32の部分(Cのマークを付けた)にい
くらかの従来の符号を配置してもよい。
次の記載では、水平列は、上方から下方へカウントし、
垂直コラムは左から右へカウントすることにする。
意味表示−発音符号の間で、声調符号が最も頻繁に使用
されるので、これら符号は、右手の人差し指で制御すべ
きである。これら符号は、第2列から第5列の第8コラ
ムにあるキー32の非シフト(下方)位置にある。中国
語往昔字母は、声調符号キーおよび第5(底部)列内の
従来の符号用の「c」マークの付いたキーを除き、すべ
てのコラムの第2列から第5列に位置する。
シフトされた(上部)位置にあるすべてのキー32は、
それぞれ意味表示符号を含む、「C」マークの付いてい
ない第1列すなわち第7〜第10コラムの非シフトキー
32に4つの最も頻度の高い4つの意味表示符号が位置
する。
発音符号を入力するには、適当な符号を備えたキー32
を作動させる。キー上に表示された意味符号を入力する
には、シフトされたキー36と共に適当な意味符号を備
えたキー32を作動させる。
意味表示−発音符号のストリングをコーディングと同じ
順でキーインする。声調符号は、文字のためキーインす
る最後符号であり、その後、スペースパー34を押して
信号を送るスペースが続く。
これら入力方法は、次の文字に対しても繰返される。複
合語または人名のようなある特別なファンクションに対
しては、間にスペースを入れることなく意味表示−発音
符号の2つ以上のストリングを連続して入力できる。こ
の場合、先のストリングからの声調符号は、2つの隣接
ストリング内の境界マークとして働く。
第4A図は、従来のいくつかの句読マークにより句読さ
れる本発明のコーディングストリングの例を示す、この
意味表示−発音符号コーディングのテキストは、中国語
および中国語の往昔字母を知っている平均的な者であれ
ば容易に理解できる。
第4B図には同じテキストを従来の中国語の表意文字で
表わした。これの大体の和訳は次のとおりである。
色−!−上 美獣王、孫悟空は「量水法」を使って、海底の水晶宮に
行き、海龍王か4いくつかの武器を借りようとした。
第4C図は、本発明の意味表示−発音コーディングによ
る上記物語りを示すが、第4D図は従来の日本語のテキ
ストによる対応する翻訳を示す。
従来の日本のテキストは、(より簡単な)かな文字と(
より複雑な)漢字の双方を含んでいる。第4E図は、本
発明の朝鮮語の意味表示−発音コーディングによる同じ
物語りを示すが、第4F図は従来のテキストによる対応
する翻訳を示す、また従来の朝鮮語のテキストは、ハン
グル文字と漢字の双方を含み、いずれも並置されて表示
されている。
日本語のテキストは、漢字と片かなおよび平がなの双方
を含むことができる。かかる漢字の各々は、2つの異な
る態様で日本語に用いられている。
「音読み」と称される借用語と、「訓読み」と称される
固有語として用いられる。訓はその意味のみのため中国
語から採用されたものであるが、日本語本来の音で発音
される。一つの同じ漢字でも、これら異なる読み方で発
音されるとき全く非類似の発音を有する1日本人は交軸
からこれら読み方を一般に区別できる。辞書には、音の
読み方は、通常片かな文字で表示され、訓の読み方は平
がな文字で表示されている。音の語(例えば第5図の6
8で表示されている泳)をコーディングするには、辞書
からのその発音および片かなの綴りをまずコーディング
する(第5図中の70を参照のこと)、書き順に従って
、意味表示部分として更に辞書から意味表示符号のさん
ずいであるrシ」をかな綴りの前に置く(第5図中の7
2を参照)。
第5図は、この発音の同音異義語をリストアップしてい
る。同音異義語のあいまい性はないので、この意味表示
符号のストリングは(第5図中の72参照)前記漢字(
第5図中の68を参照)のための一義的なコーディング
となる。続けて同様な手法を使って「標」 (第6図中
の74を参照)のような訓をコーディングし、辞書から
の基本符号「木」 (意味表示符号)を(辞書からの)
平がな綴りに前置してコーディング(第6図中の76を
参照)を完成する。第6図は、この発音の同音意n語を
リストアップしている。同音意義上のあいまい性はない
ので、またこれによってコーディングが完了する。数回
あいまい性が生じた場合には、一つのストリングを他の
ストリングから更に区別するようマーカー表示符号を3
択する。一つの文字のためのコーディング符号のストリ
ングは、複合語のような特別な理由を除き、区別のため
隣接する符号からスペースで分離される。
小さな違いはあるが、中国語用の第8図に示した情報処
理システムは、日本語にも使用できる。
第3B図は、日本語の意味表示−発音コーディング用キ
ーボード30Jを略図で示す、このキーボードは、アッ
プシフトキー36“、ダウンシフトキー36°°を同時
に作動させることによるまたは中間ポジションのためい
ずれのキーも作動させないで、(2つのポジションのか
わりに)3つのシフトポジションを使用することを除け
ば第3A図に示すキーボードと同じである。さらに最も
頻繁に使用される平がな文字が第4コラムの第1列およ
び第3コラムの第2列内の2つのキーを除く、第2コラ
ム〜第11コラム内のそれぞれのキーの非シフトポジシ
ョンにある左側に示されている。除かれたこれら2つの
キーは分音符号のためのものである。平がな文字を示す
キーは、キー36により制御されるダウンシフトポジシ
ョンにある対応する片かな文字を示す、これらのそれぞ
れのキーは、キーの上方右側部分にある意味表示符号を
示すがこの意味表示符号は、上方にシフトしなからキー
を押すと登録される。しかしなから、最も多く使用され
る4つの意味表示符号は、第12コラムの第2〜第5列
内の非シフトポジションのキーにある。
朝鮮語のテキストは、漢字とハングル文字の双方を含む
ことができる。これらハングル文字も漢字と同じように
「並置」と呼ばれる並置される非直線状の正方形内に構
成される。ハングル文字の並置は、漢字と同じように見
える。ハングル文字は、全く別の機能を有する。前者の
機能は、表音的すなわちアルファベット式であり、後者
の機能はシンボリックすなわち表意的である。一つの漠
字の発音は、朝鮮語の辞書では、ハングル文字を並置し
て表示されている。
漢字を朝鮮語でコーディングするには、一つの意味表示
符号を4つの可能な位置、すなわち上部または下部にて
左右の位置に並置した状態にできる。一つの文字をコー
ディングする際、多くて2つの意味表示符号を使用すべ
きである。一つの意味表示符号は、コーディングすべき
元の漢字内の相対的位置に従ってこれら位置の一つを占
める。
明ら、かに分離される位置が決定されないとき、まず左
の位置を選択し、次の上部の位置を選択する。
一つの漢字(例えば、第7図中の番号80で表示される
r旦」を朝鮮語でコーディングするには、いずれも辞書
からのハングルの発音(第7図中の番号86を参照)の
上部に基本符号r日」 (意味表示符号)を固定する。
従って、最終的な意味表示−発音符号は、第7図中の番
号84で示すようなものとなる0元の漢字「旦」は「−
」で表示される「水平」の上部にある1日」を示すので
、このコーディングでは並置表示の上部に、基本符号「
日」を固定する。第7図は、この発音86の同音異義語
およびそれに対応する意味表示−発音符号のコーディン
グをリストアップするものである。
コーディング上のあいまい性は存在していない。
一つの漢字の並置コーディングは、他の並置コーディン
グから自動的に分離される。このコーディングは、第7
図の82のように一つずつ直線状にすることもできる。
この発明の並置コーディングフオームを入力するため従
来の朝鮮語キーボードを改良できる。第3C図は、朝鮮
語の意味表示−発音コーディングキーボード30Kを略
図で示すものである。このキーボードは、ハングル文字
の各々が第2〜11コラムの第4〜5列および第5〜8
コラムの第3列にあるキーの非シフトポジションにある
ことを除けば第3A図に示されるキーボードと同じであ
る。従来の並置用キーの各々は、第2〜11コラムの第
2列およびコラム3,4,9.10および11の第3コ
ラムの非シフトポジションにある1、4つの接辞添加用
キーの各々は、第1コラムの0列3.4および5および
第2コラムの第3列に位置する。キーのすべてのシフト
ポジションは、意味表示符号の各々を含む、4つの最も
多く使用される意味表示符号は、第7〜第10のコラム
の第1列にあるキーの非シフトポジションに位置する。
朝鮮語の意味表示−発音コーディングを入力するには、
並置キーを入力した後に組合わせたハングル文字を入力
することにより、まず従来の朝鮮語の発音の綴りをキー
インする。並置キーは、押されると、ハングル文字の数
、大きさおよび相対的位置を示す、これは従来通りであ
り、実際に種々の朝鮮語のタイプライタ−およびコンピ
ュータで使用されている。すべてのハングル文字を入力
した後、本発明は接辞添加ポジションキーを更に容易に
するが、このキーはシフトキー36と共に適当な意味表
示符号キーの前に押すべきである。
このことは、キー上の新しい並置構成の影付領域に表示
される接辞添加ポジションを占めるよう意味表示符号用
の元の並置構成を圧縮することによりコンピュータに場
所を明けさせる。別の意味表示符号が必要な場合、別の
接辞添加キーおよび意味表示符号キーに加えてシフトキ
ーを繰返す。コーディングストリングの端を表示するに
は、スペースパー34を押す。
必要であれば、第7図中の第3コラムに示すように1つ
ずつ直線状にディスプレイすることもできる。若干の違
いがあるが、第8図に示すような中国語用の情報処理シ
ステムのバランスを朝鮮語にも使用できる。
本発明の現に好ましい実施態様について説明したが、本
発明はこれら実施態様だけに限定されず、特許請求の範
囲内でそれ以外の態様で実施できると解されよう。
【図面の簡単な説明】
第1A図および第1B図は、コーディングのため本明細
書で用いられる意味表示符号、その概略の意味、および
日本語、朝鮮語および簡略化のなめ異なる態様の好まし
い符号を示し、第1C図および第1D図は、大文字の略
語および含まれるその他の基本符号と共に第1A図およ
び第1B図から繰返される対応する意味表示符号の1音
発音を示し、第2図は、中国国定往昔字母およびT7T
音の双方で表示した、本発明の意味表示−発音符号コー
ディングに従ってコーディングされた中国語の発音の同
音異義漢字の例を示し、第3A図は意味表示符号、中国
国定往昔字母および声調を含む中国語の意味表示−発音
符号コーディング用キーボードの一例を示し、第3B図
は意味表示符号および日本語のかな文字プラス分音符号
を含む日本語の意味表示−発音符号コーディング用のキ
ーボードの一例を示し、第3C図は意味表示符号、朝鮮
語のハングル文字、並置構成および並置構成に対する意
味表示符号の接辞添加ポジションを含む朝鮮語の意味表
示−発音符号コーディング用キーボードの一例を示し、
第4A図は、情報プロセッサによりディスプレイまたは
プリントされる本発明の中国語の意味表示−発音符号コ
ーディングの一例を示し、第4B図は第4A図のコーデ
ィングされたテキストに対応する従来の中国語の表音文
字によるテキストを示し、第4C図は、情報プロセッサ
によりディスプレイまたはプリントされる本発明の日本
語の意味表示−発音符号コーディングの一例を示し、第
4D図は第4C図のコーディングされたテキストに対応
する漢字およびかな文字め双方を含む従来の日本語のテ
キストを示し、第4E図は情報プロセッサでディスプレ
イまたはプリントされる本発明の朝鮮語の意味表示−発
音コーディングの一例を示し、第4F図は第4E図のコ
ーディングされたテキストに対応する漢字およびハング
ル文字の双方を含む、従来の朝鮮語のテキストを示し、
第5図は日本語の音読み同音異義語の一例および第3図
に示す意味表示符号および片かな符号を使用することに
よる本発明に従った対応するコーディングを示し、第6
図は日本語の訓読みの同音異義語の一例および第3図に
示す意味表示符号および平がな符号を使用することによ
る。 本発明に従った対応するコーディングを示し、第7図は
朝鮮語の同音異義語の一例および第3C図に示す好まし
い朝鮮語の異議表示符号およびハングル符号を使用する
ことによる1本発明に従った対応するコーディングを並
置構成および一列表示の双方で示し、第8図は本発明に
従って使用する情報プロセッサを略図で示し、第9A図
および第9B図は本発明の意味表示符号および発音符号
コーディング用の規則の例を示す。 3〇−人力 46−ディスプレイ 5〇−出力 54−プロセッサ/伝送器 58−受信器コンバータ 64−メモリ/デコーダ

Claims (22)

    【特許請求の範囲】
  1. (1)各々の文字が所定の書き順で従来通り書かれる東
    洋の言語の書かれた状態にある一連の表意文字の表示を
    情報処理装置のキーボードへ入力する方法であって、 連続する各文字の場合において、 a)音価を有し、前記言語の話された状態を表示するキ
    ーボード上の第1グループの符号および意味表示価を有
    し、表意文字の種類を表示する第2グループの符号を参
    照し、 b)前記言語における前記表意文字の発音を表示するの
    に充分な符号を第1グループから選択し、 c)第1グループの選択の後に同意異義語のあいまい性
    が残っている場合、前記表意文字の種類を表示する符号
    を前記第2グループから選択し、 d)まだあいまい性が残っている場合、前記表意文字を
    更に識別するための第2符号を前記第2グループから選
    択し、 e)選択された第2グループの符号、各選択された第2
    グループの符号および選択された第2グループの符号の
    うち適用可能な程度のシーケンスで前記情報処理装置へ
    選択した符号を入力するようキーボードを作動し、 f)前記表意文字を書<ときの前記書き順と一致する前
    記シーケンスで選択された第2グループの各符号を配置
    する諸工程から成る方法。
  2. (2)連続した表意文字のための符号間のスペースの表
    示を入力し、情報システムをして選択した符号およびス
    ペースを入力した状態および配置にて見えるようにしせ
    しめる工程を含む特許請求の範囲第1項記載の方法。
  3. (3)前記第1グループの符号は、中国の国定往昔字母
    および声調符号である特許請求の範囲第1項記載の方法
  4. (4)前記第1グループの符号は、日本語のかな文字お
    よび分音符号である特許請求の範囲第1項記載の方法。
  5. (5)前記第1グループの符号は、朝鮮のハングル文字
    である特許請求の範囲第1項記載の方法。
  6. (6)一つの文字の朝鮮語の発音を表示する前記ハング
    ル文字は、従来のように正方形に並置された状態に入力
    されかつディスプレイされ、選択された第2グループの
    符号は、前記並置状態に対する相対的位置を示す接辞添
    加識別符号と共に入力され、前記相対的位置は、前記文
    字内の従来の相対的位置と実質的に一致しており、前記
    文字のためのすべての入力符号は従来の文字と同じよう
    に正方形に並置された状態にディスプレイされる特許請
    求の範囲第5項記載の方法。
  7. (7)前記第1グループの符号の実質的にすべては、ロ
    ーマ字である特許請求の範囲第1項記載の方法。
  8. (8)前記第2グループの符号は、基本符号である特許
    請求の範囲第1項記載の方法。
  9. (9)前記第2グループの符号の実質的にすべては、第
    1A図および第1B図の符号から選択され、形態は実質
    的にこれら符号に対応する特許請求の範囲第1項記載の
    方法。
  10. (10)前記第2グループの符号は、意味表示価を表示
    するよう区別マークを備えた前記第1グループ内のいく
    つかの符号を含む特許請求の範囲第1項記載の方法。
  11. (11)前記第1および第2グループの符号はローマ字
    を含み、前記ローマ字は、前記グループの一方のため上
    方に示され、前記のグループの他方のため下方に示され
    る特許請求の範囲第10項記載の方法。
  12. (12)前記符号のほとんどは、形態が第3A図に示し
    た符号に実質的に対応する特許請求の範囲第1項記載の
    方法。
  13. (13)前記符号のほとんどは、形態が第3B図に示し
    た符号に実質的に対応する特許請求の範囲第1項記載の
    方法。
  14. (14)前記符号のほとんどは、形態が第3C図に示す
    符号に実質的に対応する特許請求の範囲第1項記載の方
    法。
  15. (15)スペーシング入力により区切られた前記入力の
    グループと特許請求の範囲第1項に従つて入力された符
    号への従来の文字のメモリに記憶された変換とを比較し
    、前記入力グループに対応した従来の文字を識別し、識
    別された文字を見ることができるようにする工程を含む
    特許請求の範囲第2項記載の方法。
  16. (16)東洋の言語で使用されている従来の表意文字を
    直接読取可能な形態で表現できる符号のマークが付けら
    れ、これら符号の入力ができるキーを含み、前記文字は
    前記符号の百倍よりも多く、更に入力された符号間のス
    ペースを入力するためのキーと、前記符号を入力した形
    態、シーケンスおよびスペースにて前記符号を見ること
    ができるよう出力するためのキーと、他符号から離間さ
    れた前記一つ以上の符号の特定グループへ変換すること
    により前記文字の各々を識別する情報を記憶するための
    手段と、入力された符号の離間したグループと前記記憶
    された情報とを比較し、前記グループにより表示された
    文字を識別すると共に識別された文字を見ることができ
    るように表示せしめるよう作動できる手段とを含む情報
    処理装置。
  17. (17)キーは、第1A図および第1B図にリストアッ
    プされた意味表示符号に実質的に対応する約64の符号
    のためのマークを有するキーから成る特許請求の範囲第
    16項記載の装置。
  18. (18)キーに表示された符号は、実質的に第3A図中
    の円内に示された符号である特許請求の範囲第16項記
    載の装置。
  19. (19)キーに表示された符号は実質的に第3B図に示
    された符号である特許請求の範囲第16項記載の装置。
  20. (20)キーに表示された符号は、実質的に第3C図に
    示された符号である特許請求の範囲第16項記載の装置
  21. (21)ワードプロセッサに入力可能かつ東洋の表意文
    字および言語に精通した人が直接理解できる形態にて東
    洋の何千もの従来の表意文字を表示できるコードであっ
    て、 前記言語の従来の発音符号に実質的に対応する第1の組
    の符号と、前記文字の基本符号に実質的に対応する第2
    の組の符号を含み、各文字は前記第2の組からの多くて
    2つの符号により表示され、一つ以上の発音符号を有す
    る前記何千もの文字のうちの各文字が第2の組からの多
    くて一つの符号の後でかつ第2の組からの多くて一つの
    別の符号の前に位置する前記第1の組からの多くの対応
    する符号により表示され、第1の組からの前記符号に対
    する第2の組からの各符号の前記配置は、実質的に前記
    文字の書き順に従い、一つの表意文字を表示する符号の
    各グループは、別の表意文字の次の符号からのスペース
    により分離されるよう前記符号が配置され、前記スペー
    スは一つの表意文字を表示する符号間のスペースよりも
    大きいコード。
  22. (22)言語は朝鮮語であり、従来の発音符号は従来の
    正方形の並置状態にディスプレイされるハングル文字で
    あり、前記基本符号は、実質的にそれぞれの文字内の相
    対的位置に従って前記並置状態へ添加される特許請求の
    範囲第21項記載のコード。
JP62120986A 1986-05-19 1987-05-18 東洋言語処理システム Pending JPS6312060A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US86430586A 1986-05-19 1986-05-19
US864305 1986-05-19

Publications (1)

Publication Number Publication Date
JPS6312060A true JPS6312060A (ja) 1988-01-19

Family

ID=25342967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62120986A Pending JPS6312060A (ja) 1986-05-19 1987-05-18 東洋言語処理システム

Country Status (2)

Country Link
JP (1) JPS6312060A (ja)
CN (1) CN1008013B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63259310A (ja) * 1987-04-13 1988-10-26 Rinnai Corp ガスバ−ナ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63259310A (ja) * 1987-04-13 1988-10-26 Rinnai Corp ガスバ−ナ
JPH041250B2 (ja) * 1987-04-13 1992-01-10 Rinnai Kk

Also Published As

Publication number Publication date
CN1008013B (zh) 1990-05-16
CN87103491A (zh) 1988-03-30

Similar Documents

Publication Publication Date Title
US4951202A (en) Oriental language processing system
US5164900A (en) Method and device for phonetically encoding Chinese textual data for data processing entry
US7257528B1 (en) Method and apparatus for Chinese character text input
US5212638A (en) Alphabetic keyboard arrangement for typing Mandarin Chinese phonetic data
US5175803A (en) Method and apparatus for data processing and word processing in Chinese using a phonetic Chinese language
US5109352A (en) System for encoding a collection of ideographic characters
US6292768B1 (en) Method for converting non-phonetic characters into surrogate words for inputting into a computer
US7636083B2 (en) Method and apparatus for text input in various languages
EP0028533A2 (en) Method and apparatus for producing ideographic text
US5475767A (en) Method of inputting Chinese characters using the holo-information code for Chinese characters and keyboard therefor
US5410306A (en) Chinese phrasal stepcode
US3852720A (en) Method and apparatus for automatically generating korean character fonts
US5331557A (en) Audio-video coding system for Chinese characters
CA1279128C (en) Means and method for electronic coding of ideographic characters
JPS61240365A (ja) コ−ド化システムを用いる、特定のキイボ−ドを有する文字印書装置
US6604878B1 (en) Keyboard input devices, methods and systems
US5378068A (en) Word processor for generating Chinese characters
US6462678B1 (en) Phonetic Korean Hangul keyboard system
JPS6119045B2 (ja)
JPS6139152A (ja) 平面文字の選択方式
WO2000043861A1 (en) Method and apparatus for chinese character text input
US7359850B2 (en) Spelling and encoding method for ideographic symbols
JPS6312060A (ja) 東洋言語処理システム
EP0271619A1 (en) Phonetic encoding method for Chinese ideograms, and apparatus therefor
US5079702A (en) Phonetic multi-lingual word processor