JPH04270448A - 漢字ホロー・インフォメーションコード - Google Patents

漢字ホロー・インフォメーションコード

Info

Publication number
JPH04270448A
JPH04270448A JP90419294A JP41929490A JPH04270448A JP H04270448 A JPH04270448 A JP H04270448A JP 90419294 A JP90419294 A JP 90419294A JP 41929490 A JP41929490 A JP 41929490A JP H04270448 A JPH04270448 A JP H04270448A
Authority
JP
Japan
Prior art keywords
radical
kanji
code
radicals
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP90419294A
Other languages
English (en)
Inventor
Bin Chyan Tou
トウ ビン チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4858138&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH04270448(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Individual filed Critical Individual
Publication of JPH04270448A publication Critical patent/JPH04270448A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、漢字のエンコーディン
グ、より詳細には、漢字ホロー・インフォメーションコ
ードに関する。
【0002】
【従来の技術】周知のように、入力方法及びエンコーデ
ィングの方法は、漢字情報処理の自動化技術におけるキ
ーポイントの1つである。しかし、5千年以上の歴史を
もち、何億万人の中で通用されてきた面倒な角形の漢字
を国際的に通用されているラテン文字、又はアラビヤ数
字コードに変えて、エレクトロニクス、有線又は無線ラ
ジオ技術で国際的な情報交流を行うことは、今日、世界
中で解決を期待されている問題である。そのため、国内
外の多くの専門家、学者たちがこの方面に関する研究や
探究を行ってきた。報道によると、既に公開になった漢
字のエンコーディングの方法は、4百種以上にも達して
いるとのことである。漢字検索用の入力コードのプラン
が既に数百も提出されたにも拘わらず、実際に使用され
たものはまだ少なく、実用され且つ多くの使用者に簡単
に取り扱われるものは更に少ない。その原因を究明する
と、それは人々に公認され、習慣的に受け入れられてい
る漢字の筆順規則や漢字の構成規則と違った、人為的に
定義した規則を多く立てたため、人々が新たに覚えなけ
ればならない内容をふやしたばかりでなく、コードの重
複率や誤植率も高いため、オペレーターに不便を感じさ
せ、適切に使用することが難しく、且つ操作速度が低く
、操作能率も上がらないからである。
【0003】 というのがその1つである。その利点は、漢字の表音知
識を基本的に把握し且つ筆順に従って漢字を“字元”に
分解することが出来れば、容易にキーボードに用いられ
、小型のキーボードにも通用でき、コードの重複率が低
いなどである。ところが、その欠点は、多くの関係字を
暗誦し、速記に必要な単語の声母、韵母を的確に把握し
なければならないことである。これができるようにする
ためには、1,2か月の専門的な訓練を受けるのが通常
であるが、やはり間違う場合がある。特許使用権を獲得
したアメリカの王安株式会社の“三角のエンコーディン
グ方法”がそのもう1つの例である。その長所は、“九
九表”が暗誦出来れば、片手でめくら打ちすることが出
来、数字キーだけ設ける小型キーボードに適用され、且
つコードの重複率が低い。しかし、その短所として、(
1)  “九九表”の暗誦が難しいため、実際の使用に
際してキーボードの傍に置いておかなければならず、そ
のため打鍵速度を減少すること、いるのは、習慣にも合
わず、その必要もない;また、“舎”という部首をふ るのも漢字の音義に合わないこと、(3)  本質的に
は、漢字は4つの角を持つ方形文字であるが、コードの
打鍵回数を減少するため、その1角をなくすには、人為
的に1組の規則を立てるべきで、使用者に誤ったコード
を打たせることは避けがたいこと、などが挙げられる。
【0004】朱邦復先生が発明した“天龍倉頡の造字法
”は、該造字法が小型キーボードに適用でき、コードの
重複が少ないことがその利点であるが、そのために人為
的に作った1組の口訣と分類と補助字形などが甚だしく
繁雑で、それを全部記憶するのが難しく、学んでも忘れ
やすいのがその不利点である。王永明氏が発明した“五
筆筆画”“五筆画の橋”や“五筆画の字型”の入力コー
ドは、小型キーボードに適用されるし、その重複率が低
く、すべての漢字の音を把握しなくてもよいのがメリッ
トであるが、25の口訣を暗誦しなければ、的確に打鍵
することができないのが欠点である。この外、英文文字
と中国語の表音字母とを統一しなかったため、漢字の形
、音、義という3つの要素の中の音という大切な要素を
利用することができず、それに利用された情報も“ホロ
ー・インフォメーション”とは言えない。銭偉長教授が
発明した“銭氏コード”の特徴は、漢字構成をマクロ的
にまとめて、英文文字の形体と近似類比をすることにあ
る。 其、頁、見、自、貝”などを“I”に帰納類比すること
がそれであるが、方形の漢字の形体と構造は、なんとい
っても、ラテン化した字母の曲線、直線、円弧線、角の
形で構成された非方形のそれとの間には、極めて大きな
差別が存在するので、近似類比法になれていない使用者
には種々様々なコードの誤植をさせやすい。
【0005】広西省民族学院の李冠盛氏が発明した“杞
”コードの利点は、簡単で、把握しやすいことにあるが
、その欠点は、(1)部首と筆画を別々に分類し、部首
があまりにも簡単だから、部首を15の表音字母に分類
すれば、その筆画が5つの筆画より一つだけ多くなるが
、又、部首を数字に分類すれば、その分類が一貫性が欠
くこと、(2)左まがりと右まがりを実際上区別するこ
とは往々にして難しく、例えば、“乙”という漢字は左
まがりと右まがりの結合したもので、分解出来ないから
、コードの誤植をきたしやすいこと、(3)26の文字
キーを十分に利用していない上、又、0〜9の数字キー
も十分に利用していないため、離散度が低く、コードの
重複率が高くなること、(4)エンコーディングの場合
、テラン字母と数字コードを混用したため等長でなく、
コードとしての調和度と均整度が欠けているから、漢字
の分解が難しくなること、(5)一字の語の検索にだけ
適用されるが、2字以上の語の急速な検索ができないこ
と、などにある。上述のことに鑑み、本発明の目的は、
周知されている常識と習慣を基にして、いかなる口訣も
要らない、まる暗誦の必要もない漢字のホロー・インフ
ォメーションコードを提供することにある。
【0006】本発明の漢字ホロー・インフォメーション
コードは、部首筆順に基づき、部首或いは筆画の分類集
約化によって、その対応する表音或いは数字コードで漢
字の区画部位を定めて、漢字をエンコーディングするも
のである。先に横画、後に縦画;先にはね、後に右払い
;先に左、後に右;先に上、後に下;先に外側、後に内
側;先に外側、後に内側それから閉じる;先に中央、後
に両側という筆順の習慣的な規則に従って、漢字を部首
或いは筆画に分解して、エンコーディングするのである
。本発明の部首は、その中国語表音字母の1番目の字母
の順序で配列されることができるが2桁数字コードの配
列でもよい。本発明においては、漢字構成の能力が最も
強い小学校1年生でも皆読める100の部首を優先に採
用して、つぎの2つの表を作成した。第1表の100の
部首表(  )は、表音字母の1番目の文字の順序に従
って配列されたものであるが、第2表の100の部首表
(II)は、起筆の8種類の筆画と筆画数によって配列
された01−00の2桁数字のコードである。これによ
って編成した“ホロー・インフォメーションコード(I
)”と“ホロー・インフォメーションコード(II)”
は各々異なったユーザー向で、通用している機上で操作
することができる。
【0007】従来の漢字情報検索用入力コードに比べて
、本発明の利点や効果は著しい。本発明は、的確な、は
っきりとした境界線を持つ漢字情報、例えば、表音と部
首と筆順と筆画との4つの大切な要素を充分に利用し、
境界線があいまいで的確でない漢字情報、例えば漢字の
型、角などを放棄するものである。本発明は、従来の入
力コードに比べて、100の常識の部首の1番目の表音
字母を把握すれば、それに対応する外国語(英語、ロシ
ヤ語、ドイツ語、フランス語、イタリア語、日本語、国
際音声記号など。)のキーボードに組み合わせて、世界
中で中国語を勉強または使用している人々にも共に使わ
せることができる。本発明の創造性は、そのコードの簡
略化にもある。一切を簡単且つ容易なものにし、あらゆ
るまる暗誦でなければ覚えられない人為的な口訣と、主
観的に漢字の角、上下、区画部位を定める繁文縟礼を捨
てて、敏活に、調和的に、字母コードと数字コードとを
結合して、あらゆるユーザーとコンピューターに通用さ
れるようになった。
【0008】本発明は、小型の通用しているキーボード
コンピューターとさまざまな中国語辞書や参考書類にも
広く使用されて、コンピューターの一致性が取られた。 又、本発明は、目下、上海翻訳出版公司に本格的に採用
されることになっている。(出願された後、本発明が公
開される予定である。)本発明を利用すれば、専門的な
訓練が要らなくて、半日或いは1日だけでエンコーディ
ングを身につけて機械で操作することができる。この外
、そのハードウェアやソフトウェアのコストが低いこと
、通用している小型キーボードに適用され、平均打鍵回
数が少ない(平均は約1.33打鍵数/字。)こと、な
どがその利点である。また、本発明は、少なくとも次の
10方面に応用される。 (1)中国語のコンピュータータイプ、編集や組版; 
 (2)ラテン化字母電報とテレクスのコードが統一さ
れ、コンピューターでの中国語の翻訳自動化の実現; 
 (3)全国の郵便番号のコーディング;  (4)中
国語と外国語のコンピューターでの翻訳;  (5)旧
中国語と現代中国語のコンピューターでの翻訳;(6)
速記;  (7)書き方の短縮;  (8)図書カタロ
グ作成と辞典索引用のホロー・インフォメーションコー
ド;  (9)迅速な転写と即時記録;  (10)医
薬の自己諮問、及び農業、林業、牧畜業、副業、漁業、
工業、金融業、文化上、軍事上、行政上の管理諮問。本
発明は、複雑な方形の漢字を如何なる外国語よりも優れ
ている1種のホロー・インフォメーションコードに変え
、且つその固有の美点を見出して、中国語を科学的な、
標準的な、簡潔な、均整が取れた、優美なコードにする
ことによって、東西文化交流上の、立派な架け橋になっ
た。
【0009】
【実施例】以下の実施例を参照して、本発明をさらに詳
細に説明する。 実施例1 ホロー・インフォメーションコード(I)〔以下、コー
ド(I)と略称する。〕 1)100の部首の表(I):(添付の表I。)100
の部首字が中国語の表音字母の1番目の順序に従って配
列されるものである。又、26の字母の中で、VはUに
利用され、Oはされに対応する部首がないから、機能キ
ーに利用されるために残す。且つ、100の部首字の全
部が常用のもので、その1番目の表音字母がユーザーに
広く熟知されている。一方、100部首の基本的な筆画
は、唐、宋時代から1千年以上も踏襲されてきた“永字
の八法”から出て来たもので、それぞれ、横画、縦画、
左払い、点、右払い、はね(挑)、曲がり、鈎である。 鈎のある漢字は、すべて鈎の筆画とするから、8つの筆
画をとるのは、5つ或いは6つの筆画を取るよりも、明
らかに漢字の実状に合い、且つ、コードの重複率を区別
する離散度をも大幅に拡大することができる。
【0010】2)筆順の7つの規則 5万余りの漢字は、その変化が窮まりないが、書き方の
筆順は下記の7つの簡単な規則しかない。(“杞”字コ
ード等のエンコーディングが筆順規則を10以上まで増
加したのは無理である。)この規則は、視覚的にも、習
慣的にも最も識別されやすい起筆部首、続筆部首、末尾
から2番目の部首と最終部首を取るから、何千年来あら
ゆる人々に守られ、使いこなされてきた。且つ、漢字の
80%以上が形声字で、形の偏傍と声の偏傍で構成され
るから、起筆部首、続筆部首、末尾から2番目の部首と
最終部首の採用で、1つの偏傍に集中するのではなくて
、左と右、上と下との2つの偏傍を充分に利用して、離
散度の拡大、コードの重複除去の役割を充分に発揮する
ことができた。本発明は、筆順の7つの習慣的な規則(
先に横画後に縦画、先に左払い後に右払い、先に左後に
右、先に上後に下、先に外側後に内側、先に外側後に内
側それから閉じる、先に中央後に両側)に従って、漢字
を部首(筆画も含めて。)に分解して、且つ、筆画の最
も多いのを取ったのである。
【0011】漢字の筆順規則を挙げると次の通りである
。 以上の例は、筆順の規則を説明するために、例字を筆画
に分解したものであるが、本発明のエンコーディング表
においては、いずれの段階でも、筆画が最も多いのを部
首として筆順に従って、漢字を分解するのが原則である
。 などの分解ではない。且つ、漢字の中で、ごく少数の字
例えば“或”が書用紙を て部首の分解をするものである。
【0012】3.エンコーディングの実例(1)  単
部首字:100の部首の表の中の部首は、最もよく使用
されている部首であるとともに、又、その大多数が独立
した常用漢字でもある。本発明者は、部首を切りはなし
て、専門のエンコーダの他、だれもわからない、ちりぢ
りとした、まとまりがない“字根”或いは“字元”にす
ることには反対する。その代わり、部首を音で分類して
、一筆の部首と漢字構成の能力が強い鍵名部首と一般部
首とに分けることを主張するものである。 このような区分の目的は、次に複合字をエンコーディン
グする時、重複字を減少するにある。ところが、単部首
の字を検索する場合、上述の区分の必要がなく、部首表
音の声母或いは韵母の1番目の字母、起筆筆画、続筆筆
画、最終筆画のコードでキーを叩き、正体、変体、簡体
又は旧体の漢字の場合も、上述のようなエンコーディン
グをすることが出来、もしも、漢字を更に分解すること
が不可能であれば、“0”のキーを叩くことになる。1
つの表音字母には、いくつかの部首が含められているか
ら、上述の3つの筆画で8×8×8=512の離散度を
もち、コードの重複を避けることができる。例えば、同
じ表音字母のもとで離散度が大きく、部首は基本的にコ
ードの重複はない。
【0013】(2)  2つの部首の複合字2つの部首
の複合字も、4つの表音字母コードでエンコーディング
され、打鍵は4回である。本発明によれば、エンコーデ
ィングは、王永明氏が発明した“5筆画の字型”のと違
って、字型の区分を利用しないものである。 というのは、王氏は字型を左右型、上下型、雑型の三種
類に分類しているが、事実上、漢字の字型が多く、この
3種に限らず、この外、左−中−右、上−中−下、対角
、交差、半ば閉じ、全部閉じなど多種類あって、時には
、実に区別し難い。一方、情報利用の価値は、情報の確
実度にあるため、境界線が曖昧な、区別し難い情報を利
用すれば、かえって間違い易い。そのため、本発明のホ
ロー・インフォメーションコードにおいては、字型に関
する区分を除いている。2部首の複合字は、次のように
コーディングされる。 斯くして、2つの部首のコードが同じである場合、尚、
8×8=64の離散度があるから、王永民氏の3種の字
型と5筆画の区分である3×5=15の離散度よりも4
倍以上も達しているので、コードの重複も少なくなった
。もしも、起筆、最終の2部首が鍵名部首の場合、特別
に取り扱い、その区分は、筆画のコードを加える必要が
なく皆“0”で叩くことに変更し、又“0”の打鍵位置
を移すことなどによって、コードが重複的でないコード
にすることができる。2部首の複合字の例を挙げると、
次の通りである。
【0014】(3)3つの部首の複合字3部首の複合字
の4つのコードはそれぞれ、起筆部首、起筆部首の終筆
筆画、続筆部首、最終部首のコードを取る。もしも、起
筆部首が鍵名部首の場合、続いて“0”キーを打ち、起
筆部首の終筆筆画のコードを打たない。 例えば、 もし、極く少ない重複コードに出合った場合、“0”の
挿入で重複を除去することが出来る。“0”キーでの重
複除去の役割が大変大きく、それは26の字母コードで
エンコーディングするのは25のそれよりも264−2
54=66,351の離散度が増加し、重複字を大幅に
減少することができる。
【0015】(4)4つの部首以上の複合字4つの部首
以上の複合字は、起筆部首、起筆部首の終筆筆画、末尾
から2番目の部首、最終部首のコードを採用するのが普
通である。もしも、起筆部首が鍵名部首或いは1筆画部
首の場合、2番目のコードは、起筆部首の終筆部首の終
筆筆画のをとらないので、続筆部首のをとるべきである
。本発明において、26の字母を利用して、その総離散
度が26×26×26×26=456,976になるか
ら、6万の漢字を区別するにはもう充分である。例えば
: (5)語、文献の快速なエンコーディング本発明のホロ
ー・インフォメーションコードの離散度が456,97
6にも達するから、5万あまりの漢字を入力する外、尚
、40万ぐらいの語を入力することもでき、語を入力す
る場合、上述のように4つの表音字母で、4回打鍵する
から、語の入力速度が大幅に高められる。また、漢字の
語の中には、2,3,4,5・・・・など、一字の語が
多くあるから、40万の語は大体、120万の漢字に相
当する。従って、もとは、120×4=480万回の打
鍵が必要だったのに対して、今は、ただ160万回の打
鍵でよい。即ち、1字で語を構成できる漢語は、1漢字
の入力打鍵が1.33回だけで済む点で、あらゆる西洋
文にも優れているものである。 1)2漢字の語のエンコーディングにおいて、2字とも
、その起筆部首と最終部首(最終部首が単部首の場合は
、起筆部首の終筆筆画を取る。)で4つの字母の等長コ
ードでエンコーディングする。2字の中、1つの字が鍵
名の単部首字の場合、特別の取り扱いをし、それに続く
2番目のコードは“0”で叩くことによって、区別する
。例えば、
【0016】2)3つの漢字の語のエンコーディングに
おいて、1番目の漢字は、その起筆、最終2部首のコー
ドを取った後、2,3番目の漢字の起筆部首を取る。も
しも、1番目の漢字が単部首字の場合、起筆部首とその
終筆部首を取り、もしも1番目の漢字が鍵名単部首の場
合、その起筆部首のコードの後に“0”を打つ。例えば
、 3)4漢字以上の語において、その1乃至3番目及び末
尾漢字の起筆部首をとる。例えば: いうまでもなく、固有名詞は更に語に分解されてエンコ
ーディングすることができる。例えば、“中華人民共和
国”は“KSRS  ROGG  NBHK  KWD
NH”のようにエンコーディングされるが、分解したの
ち、翻訳された漢字は“中華人民共和国(KRRK)”
のと同様である。
【0017】実施例2 ホロー・インフォメーションコードII(コードIIと
略称する。) 1.100の部首の表(II)(添付の表II。)ホロ
ー・インフォメーションコードIIは、“100の部首
表(II)”を“100の部首表(I)”に2桁数字コ
ードを表音字母に取って代わるものである。その他のエ
ンコーディング順序は“ホロー・インフォメーションコ
ードI”と同様であるが、異なるところはただ、各々の
部首がその唯一のコードをもち、起筆と終筆筆画で分解
する必要がないことにある。“100の部首表(II)
”は、筆画、筆画数によって配列されて、覚えやすいも
のである。ホロー・インフォメーションコードIIとホ
ローインフォメーションコードIは、総合的には一致し
ていて、どちらも、表音という情報を出来るだけ少なく
利用し、人々の部首、筆順や筆画に関する常識や習慣に
合うものであるから、西洋文と表音字母を知らない使用
者に、まったく相応しい。“コードII”は10の数字
キーだけある小型キーボードに利用されるばかりでなく
、又、数字コードを使用する電報コードにも利用するこ
とができる。この外、その離散度がより大きく、100
×100×100=100万で、“コードI”の約46
万の2.2倍であり、その収容できる漢字及びその語の
数はさらに多いが、コードの重複は少なくなるというの
がそのもう一つの特徴である。
【0018】2.エンコーディングの実例“コードII
”の規則は、基本的には、“コードI”のと同様である
が、“コードII”においては、2桁数字コードで1つ
の部首をコーディングするので、“コードI”のように
、1つの表音字母コードの後に、起筆、終筆筆画のコー
ドを加えて、選定する必要がないことに鑑み、*(アス
テリスク)で空白格を打ち、コードの重複した字にも*
が用いられ、且つ、その位置の変更で区別し、括弧内の
変体や旧体字については、起筆、続筆の筆画のコードの
打鍵で区別する。 (1)単部首の漢字は、6桁数字の1番と2番目の数字
はその番号で打ち、その後4つの*を続いて打ち、括弧
内の変体、旧体字は、起筆筆画と続筆筆画のコードを打
ち加えエンコーディングすればよい。例えば、(2)2
つの部首の複合字は、6桁数字の1〜4番目の数字をそ
の2つの部首の番号で打ち、その後*を続いて打つこと
によってエンコーディングする。 (3)3つ以上の部首の複合字は、6桁数字の1〜6番
目の数字をその起筆部首、末尾から2番目の部首、最終
部首の番号で打ち。例えば、
【0019】(4)語や文献の快速エンコーディング(
1)2つの漢字の語は、1番目の字の起筆、最終部首(
1番目の字が単部首字の場合、2番目の字の起筆部首を
取る。)、及び2番目の字の最終部首のコードを取る。 例えば: (2)3つの漢字以上の語は、1番目の字の起筆部首と
2番目の字の部首と末字の最終部首のコードをとる。例
えば: (3)部首の調整、コード重複の除去及び機能キー
【0
020】3.部首の調整、コードの重複の除去及び機能
キー 1)部首の調整:部首は調整できるものである。“コー
ドI”と“コードII”を統一するために、本発明は、
統一した“100の部首”を採用したが、“コードI”
と“コードII”は統一しなくてもよい。“コードI”
は、部首を増減でき、更には、「康煕字典」に記載の2
14の部首を使うこともでき、王竹渓氏の56の新しい
部首、或いは、もっと少ない部首を採用してもさしつか
えないのであるが、100の部首を採用する方が望まし
い。“コードII”は、部首を100以下に減少して、
2桁数字を保ってもいいが、反対に3桁数字で、部首と
数百の常用的な偏傍をコーディングし、且つ2つの部首
、偏傍を取って、6桁数字のコードに作成し、または、
3つの部首、偏傍を取って、9桁数字のコードに作成す
ることもできる。コードの検出が便利で充分の離散度が
あれば、いずれの方法を採用してもさしつかえない。 その他は類推できる。 2)重複コードの除去 コードの重複する蓋然率がいくら低くても、個別的なコ
ードや語の重複は避けがたい。“コードI”は“0”を
打鍵し且つ位置を移すこと或いは“1,2・・・7,8
,9”の数字コードの打鍵で重複を除去出来るが、“コ
ードII”は*(アステリスク)の打鍵でコードの重複
を除去する。重複の除去はまず使用頻度が高い漢字につ
いて行う。
【0021】3)機能キー 提示、訂正、簡体、旧体、正字体、異体、誤った字体な
どの区分、漢語と西洋文の混植などの場合には、余剰の
キーを利用することができる。上記のような、本発明の
特徴は、推し広めやすい、用途が広いことにある。また
、少なくとも下記の10の方面で、本発明が利用される
。 (1)漢語のコンピューターでのタイプ、編集及び植字
(2)電報やテレックスのコードはラテンの字母の平分
コードに統一されていて、西洋文より簡単で、集約的に
なったため、コンピューターで自動的に漢語に翻訳され
ることができるから、それに要する人力と支出も大幅に
減少される。 (3)全国の郵便番号が統一したため、誰でも自分で編
集することができ、かつ、アドレスの字母で略化したも
のと、郵便番号とを一致した。中国全土の数百の省、市
、何千の県は、基本的には、重複しなくて、エンコーデ
ィングされるが、省、市、自治区、市、県、郷鎮などの
行政区画単位は別々にエンコーディングすることができ
る。
【0022】(4)中国語と外国語のコンピューターで
の助訳。中国人が外国語を学び、外国人が中国語を学ぶ
には、主な困難は文法ではなくて、大量の単語を記憶す
ることにある。ホロー・インフォメーションコードは、
漢字と漢語の単語を4つのラテン字母に単語化したため
、西洋文を記憶するに比べて、その記憶が容易になった
。ホロー・インフォメーションによって、極く短い時間
で、文法、字母の表音法則、エンコーディングの方法を
把握すれば、中国人も、外国人も、コンピューターの単
語翻訳によって、対話の交流をすることができる。 又、一人が数国の言語を身につけることも容易になり、
翻訳者も大量の辞典を引く時間を省くことができる。 (5)古漢語と現代漢語のコンピューターのでの助訳、
その原理は上記同様である。 (6)速記、ホロー・インフォメーションによる速記は
統一性が強く、標準的で、高速である。それに関する整
理、翻訳もコンピューターによってでき、時間を大量に
省く。 (7)書き方の短縮、ホロー・インフォメーションコー
ドは1つの方形漢字を1.33のラテン字母で代えるこ
とによって、紙面と時間を大量に節約できる。 (8)図書のカタログ、辞典の索引にホロー・インフォ
メーションコードを使えば、規範的で簡単にコードの重
複がなく、検出しがたい字もなくなる。 (9)快速な転写と即時記録、その原理は上記のと同様
である。 (10)医薬上の自己諮問、及び農業、林業、牧畜業、
副業、漁業、商業、工業、文化上、軍事、行政上などの
管理諮問。 例えば、(1)風邪を引いたかどうか、(2)年齢、(
3)性別、(4)脈搏、(5)体温、(6)痰の濃淡、
(7)せきが出るか否かなどの情報を入力すれば、名医
の診断と処方が出力される。その外、ホロー・インフォ
メーションは色々なコンサルティング用漢字カードを作
成することができる。上記の10の用途はみな厄介な方
形漢字を如可なる西洋文より優れているホロー・インフ
ォメーションコードにする本発明と関係がある。本発明
は、漢字の内在的な美しい点を発掘して、漢字を科学的
な、標準的な、簡潔な、優美な集約化したコードにした
ことによって、東西文化交流上のりっぱなかけ橋となっ
た。
【表1】
【表2】

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】部首、筆順に基づき、表音或いは筆画によ
    る部首の分類や集約化で、漢字の区画部分を定めること
    を特徴とする漢字ホロー・インフォメーションコード。
  2. 【請求項2】上記の部首は、その漢語表音の1番目の字
    母の順序で配列されることを特徴とする、請求項1に記
    載の漢字ホロー・インフォメーションコード。
  3. 【請求項3】上記の部首は、2桁数字コードで配列され
    ることを特徴とする、請求項1に記載の漢字のホロー・
    インフォメーションコード。
  4. 【請求項4】上記の部首は、100の部首を採用するの
    が好ましいことを特徴とする、請求項1,2または3の
    いずれかに記載の漢字ホロー・インフォメーションコー
    ド。
  5. 【請求項5】先に横画後で縦画、先にはね後で右払い、
    先に左後で右、先に上後で下、先に外側後で内側それか
    ら閉じる、先に中央後で両側という筆順の習慣的な規則
    に従って、漢字を部首(筆画も含めて。)に分解してエ
    ンコーディングすることを特徴とする、請求項1,2ま
    たは3のいずれかに記載の漢字ホロー・インフォメーシ
    ョンコード。
  6. 【請求項6】いずれの分解の段階においても、筆画が最
    も多い部首を採用することを特徴とする、請求項5に記
    載の漢字ホロー・インフォメーションコード。
  7. 【請求項7】単部首の漢字に対しては、それぞれ表音コ
    ード、起筆筆画、続筆筆画(起筆筆画の次の筆画。)、
    終筆筆画に対応する4つの表音字母でエンコーディング
    し、もしも、単部首の字が鍵名部首の字の場合、第2乃
    至第4のコードが“0”、もしも字が筆画で完全に分解
    されることができない場合、空白なコードは“0”で叩
    くことを特徴とする、請求項5に記載の漢字ホロー・イ
    ンフォメーションコード。
  8. 【請求項8】二つの部首の複合字に対しては、順序的に
    、起筆部首、起筆部首の終筆筆画、続筆部首(起筆部首
    の次の部首。)、続筆部首の終筆筆画に対応する4つの
    表音字母でエンコーディングし、鍵名部首の場合であれ
    ば、部首コードの後に“0”が加えられることを特徴と
    する、請求項5に記載の漢字ホロー・インフォメーショ
    ンコード。
  9. 【請求項9】3つの部首の複合字に対しては、それぞれ
    起筆部首、起筆部首の終筆筆画、続筆部首、最終部首に
    対応する4つの表音字母で順序にエンコーディングし、
    もしも、起筆部首が鍵名部首の場合であれば、2番目の
    コードを続筆部首に変えることを特徴とする、請求項5
    に記載の漢字ホロー・インフォメーションコード。
  10. 【請求項10】4つの部首以上で構成された複合字に対
    しては、普通、起筆部首、起筆部首の終筆筆画、末尾か
    ら2番目の部首、最終の部首にそれぞれ対応する4つの
    表音字母でエンコーディングし、もしも、起筆部首が鍵
    名部首或いは、単筆画部首の場合、2番目のコードを続
    筆部首の表音字母にするこを特徴とする、請求項5に記
    載の漢字ホロー・インフォメーションコード。
  11. 【請求項11】2つの漢字の語に対しては、2つの漢字
    の起筆部首と最終部首とにそれぞれ対応する4つの表音
    字母でエンコーディングし、もしも、上記の字が単部首
    字の場合、部首のコードの後に終筆筆画のコードを加え
    、もし、単部首字が鍵名の部首字である場合、部首のコ
    ードの後に“0”を叩くことを特徴とする、請求項5に
    記載の漢字ホロー・インフォメーションコード。
  12. 【請求項12】3つの漢字の語に対しては、それぞれ1
    番目の字の起筆部首と最終部首、2番、3番目の字の起
    筆部首に対応する4つの表音字母でエンコーディングし
    、もしも、字が単部首字の場合、部首コードの後に終筆
    筆画のコードを叩き、もし、字が鍵名部首字の場合、部
    首コードの後に“0”を叩くことを特徴とする、請求項
    5に記載の漢字ホロー・インフォメーションコード。
  13. 【請求項13】4つの漢字以上の語に対しては、それぞ
    れ1番ないし3番目の漢字と最終の漢字との起筆部首に
    対応する4つの表音字母でエンコーディングすることを
    特徴とする、請求項5に記載の漢字ホロー・インフォメ
    ーションコード。
  14. 【請求項14】先に横画、後に縦画、先にはね、後に右
    払い、先に左、後に右、先に上、後に下、先に外側、後
    に内側、先に外側、後に内側それから閉じる、先に中央
    後に両側という筆順の習慣的な規則に従って、漢字を部
    首(筆画も含める。)に分解して、エンコーディングす
    ることを特徴とする、請求項1,3または4のいずれか
    に記載の漢字ホロー・インフォメーションコード。
  15. 【請求項15】いずれの段階の分解においても、筆画が
    最も多い部首を採用することを特徴とする、請求項14
    に記載の漢字ホロー・インフォメーションコード。
  16. 【請求項16】単部首の字に対しては、起筆部首に対応
    する2桁数コードでエンコーディングし、その後に空白
    キーを加え、6桁の等長コードでエンコーディングする
    ことを特徴とする、請求項14に記載の漢字ホロー・イ
    ンフォメーションコード。
  17. 【請求項17】2部首の複合漢字に対しては、起筆部首
    と続筆部首とに対応する4桁の数字コードでエンコーデ
    ィングし、その後の空白キーがアステリクを打つ6桁数
    字の等長コードを特徴とする、請求項14に記載の漢字
    のホロー・インフォメーションコード。
  18. 【請求項18】3つの部首以上の漢字に対しては、それ
    ぞれ起筆部首、最終部首に対応する6桁数字のコードで
    エンコーディングすることを特徴とする、請求項14に
    記載の漢字ホロー・イシフォメーションコード。
  19. 【請求項19】2漢字の語に対しては、1番目の漢字の
    起筆部首、最終部首(1番目の漢字が単部首字の場合、
    続字の起筆部首に変える。)、続字の最終部首に対応す
    る6桁数字のコードでエンコーディングすることを特徴
    とする、請求項14に記載の漢字ホロー・インフォメー
    ションコード。
  20. 【請求項20】3つの漢字以上の語に対しては、1番目
    の漢字の起筆部首、続字の最終部首、末字の最終部首に
    対応する6桁数字のコードでエンコーディングすること
    を特徴とする、請求項14に記載の漢字ホロー・インフ
    ォメーションコード。
  21. 【請求項21】採用する部首と偏旁が100以上になる
    場合であれば、3桁数字で、左から右、上から下へとの
    筆順に従って、部首と偏旁を分解して、それに対応する
    数字コードでエンコーディングし、部首数100を適当
    に減少、調整する場合も、上記法則を用いてエンコーデ
    ィングすることを特徴とする、請求項1に記載の漢字ホ
    ロー・インフォメーションコード。
JP90419294A 1989-12-30 1990-12-27 漢字ホロー・インフォメーションコード Pending JPH04270448A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN89109707A CN1028680C (zh) 1989-12-30 1989-12-30 汉字全息码
CN89109707.4 1989-12-30

Publications (1)

Publication Number Publication Date
JPH04270448A true JPH04270448A (ja) 1992-09-25

Family

ID=4858138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP90419294A Pending JPH04270448A (ja) 1989-12-30 1990-12-27 漢字ホロー・インフォメーションコード

Country Status (4)

Country Link
JP (1) JPH04270448A (ja)
CN (1) CN1028680C (ja)
CA (1) CA2026228A1 (ja)
GB (1) GB2239542B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529394A (ja) * 2002-06-05 2005-09-29 ス、ロンビン 各国語文字情報の最適化デジタル操作的コード化及び入力の方法、そして、その情報処理システム
JP2009066457A (ja) * 2009-01-08 2009-04-02 Taiyo Elec Co Ltd 組合せ式遊技機
JP2009066456A (ja) * 2009-01-08 2009-04-02 Taiyo Elec Co Ltd 組合せ式遊技機

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094666A (en) * 1998-06-18 2000-07-25 Li; Peng T. Chinese character input scheme having ten symbol groupings of chinese characters in a recumbent or upright configuration

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2165677B (en) * 1984-10-13 1988-07-20 Mitac Inc Input/output method for computerized chinese characters
GB8427281D0 (en) * 1984-10-29 1984-12-05 Wong K F Materialistic system
CA1279128C (en) * 1986-08-18 1991-01-15 Andrew Chiu Means and method for electronic coding of ideographic characters
GB8629908D0 (en) * 1986-12-15 1987-01-28 Kemano Ltd Words & characters computer input device
GB2212956B (en) * 1987-11-30 1991-10-30 Jeff Wang Method of inputting chinese characters and keyboard for use with same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529394A (ja) * 2002-06-05 2005-09-29 ス、ロンビン 各国語文字情報の最適化デジタル操作的コード化及び入力の方法、そして、その情報処理システム
JP2009066457A (ja) * 2009-01-08 2009-04-02 Taiyo Elec Co Ltd 組合せ式遊技機
JP2009066456A (ja) * 2009-01-08 2009-04-02 Taiyo Elec Co Ltd 組合せ式遊技機

Also Published As

Publication number Publication date
GB2239542A (en) 1991-07-03
CN1028680C (zh) 1995-05-31
GB9024054D0 (en) 1990-12-19
GB2239542B (en) 1994-06-29
CN1043016A (zh) 1990-06-13
CA2026228A1 (en) 1991-07-01

Similar Documents

Publication Publication Date Title
US5475767A (en) Method of inputting Chinese characters using the holo-information code for Chinese characters and keyboard therefor
US5187480A (en) Symbol definition apparatus
US7257528B1 (en) Method and apparatus for Chinese character text input
US5119296A (en) Method and apparatus for inputting radical-encoded chinese characters
TW411421B (en) System and method for processing chinese language text
US4951202A (en) Oriental language processing system
JPS61502495A (ja) 暗号解析装置
WO2003104963A1 (fr) Procede de saisie d'optimisation d'un code operationnel de numerisation pour des caracteres mondiaux et son systeme de traitement d'information
KR100344947B1 (ko) 한자입력장치 및 방법
US6604878B1 (en) Keyboard input devices, methods and systems
US5378068A (en) Word processor for generating Chinese characters
CN1003326B (zh) 优化五笔字型编码法及其键盘
JPH04270448A (ja) 漢字ホロー・インフォメーションコード
WO2000043861A1 (en) Method and apparatus for chinese character text input
JP3803253B2 (ja) 漢字入力のための方法および装置
CN1018205B (zh) 计算机中文声数编码输入技术
WO2001093180A1 (fr) Procede de saisie de codes operationnels par numerisation des informations concernant les differents alphabets ou symboles graphiques et systeme connexe de traitement desdites informations
WO1990002992A1 (en) Symbol definition apparatus
CN1196057C (zh) 一码二形数字编码汉字输入方法
CN1022350C (zh) 汉字字母编码输入法
JP2680845B2 (ja) 文字入力コード化方式
CN1752899B (zh) 汉语编码及其汉字输入法和汉字检索法
CN101706685A (zh) 一种汉字输入法
AU665293B2 (en) Apparatus for encoding and defining symbols and assembling text in ideographic languages
CN101470535A (zh) 优化汉字码输入法