JP2002516004A - 非音標文字を代用単語に変換しコンピュータに入力する方法 - Google Patents

非音標文字を代用単語に変換しコンピュータに入力する方法

Info

Publication number
JP2002516004A
JP2002516004A JP52133498A JP52133498A JP2002516004A JP 2002516004 A JP2002516004 A JP 2002516004A JP 52133498 A JP52133498 A JP 52133498A JP 52133498 A JP52133498 A JP 52133498A JP 2002516004 A JP2002516004 A JP 2002516004A
Authority
JP
Japan
Prior art keywords
substitute
computer
phonetic
phrase
suffix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP52133498A
Other languages
English (en)
Inventor
チャン,クン,チュン
Original Assignee
カンジ ソフトウェア,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/744,021 external-priority patent/US5903861A/en
Application filed by カンジ ソフトウェア,インコーポレイテッド filed Critical カンジ ソフトウェア,インコーポレイテッド
Publication of JP2002516004A publication Critical patent/JP2002516004A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 言語の語彙を表す非音標文字を代用単語に特定的に変換し、コンピュータに入力する方法は、(a)各言語において各文字の象形/表意部首をその発音にしたがってアルファベット化し、得られた綴字を新たに作成した代用単語の接頭語として用いるステップと、(b)各言語において音標部首をその発音にしたがってアルファベット化し、得られた綴字を新たに作成した代用単語の接尾語として用いるステップと、(c)接頭語および接尾語を共に結合すると共に、ハイフン「−」のような分離マークでこれらを分離し、各言語の筆記形態に用いる特定の各「文字」に対する代用単語を作成するステップを含む。このように新たに作成した単語は、中国語、日本語、韓国語およびインド語のような筆記東洋言語において用いられる非音標文字に対して一意であるとともにそれらを正確に表すことができる。したがって、これらの言語で書かれた情報をコンピュータに入力する際に、手作業による入力または音声入力のいずれにおいても簡便化される。

Description

【発明の詳細な説明】 非音標文字を代用単語に変換しコンピュータに入力する方法 本発明の背景 本発明は、中国語、日本語、韓国語、インド語等のような東洋言語の非音標筆 記文字(written non-phonetic characters)に関し、更に特定すれば、新たな代 用単語(surrogate word)を作成し、筆記東洋言語に用いられるかかる非音表文字 を正確に表現する変換方法に関するものである。代用単語とは、本発明において 英語型アルファベットまたは自国のアルファベットのいずれかによって作成し、 中国語、日本語および韓国語に用いられる非音標文字を表すものである。したが って、非音標文字は、英語型または自国のアルファベット用キーボード、マウス またはその他の音標入力方法によってコンピュータに容易に入力することができ る。更に、かかる新たな代用単語は、コンピュータに記憶し、E−メール(電子 メール)によって正確に送信することも可能である。 中国語の非音標文字は、古代中国人によって、数千年前に自己表現するために 、絵から派生したものである。これらの文字は、その長い歴史の間に多くの変化 を受け、古代に彼らが記述した主題の絵から、今日の均一な正方形状となった。 韓国語および日本語は、中国語文字を彼らの言語に採用し組み込んだが、これら は全ての文字を必ずしも中国語と同じように発音し使用する訳ではない。これら 2カ国の国民が用いる文字の大部分は、中国語におけると同一または同様の意味 を有する。今日、これらの文字の殆どは2つの部分から成る。即ち、一方は意味 を示し、この部分が何かに似ている場合には象形文字と呼び、あるいはこの部分 が当該文字の何らかの意味を有する場合表意文字と呼ぶ。他方は発音を意味し、 通常音標部首(phonetic radical)と呼ぶ。中国語では、文字の発音は単音節であ り、これは各文字毎に1つの音を意味する。 表意文字は、文字または文字の一部となり得るシンボルであり、推測(inferen ce)によって当該文字の意味を示す。純粋な表意文字は稀である。しかしながら 、これらは、音標部首を有さないが、代わりに2つ以上の象形文字を組み合わせ 、読 者が理解できる意味を推測させる多くの文字に見ることができる。この種の文字 の発音は、記憶しなければならない。何故なら、この種の文字には音標部首がな いからである。表意文字をある文字の部首として用いる場合、これは無音となる 。以下に示すのは、表意文字のいくつかの例である。 (1)「明」は、「日」(sun)および「月」(moon)で構成されており、したが って明るい(bright)ことを意味する。(2)「艶」は「豊か」(abundant)および「 色」(color)から成り、したがって「すばらしく美しい」という意味となる。( 3)「好」は「子」(son)および「女」(daughter)の組み合わせであり、したが って良い(good)という意味である。(4)「細」は、「絲」(silk)および田圃の 小さな正方形「田」の組み合わせであり、したがって小さく細かいことを意味す る。(5)「林」は2つの木(tree)で構成され、したがって林を意味する。 象形文字は、1つの文字または1つの文字の一部であるシンボルであり、当該 文字が記述する対象の大体の様子を示す。象形文字は表意文字よりも一般的であ る。何故なら、中国語の文字は絵から進化したからである。象形文字をある文字 の一部として用いる場合、それは無音となる。例えば、「鳥」(bird)、「馬」(hor se)および「木」(wood,tree)がある。 象形文字は、それが一部をなす文字の意味を有するだけでなく、当該文字が記 述する対象の物理的な様子を示すことによって、その意味を表現する。これによ って、文字の認識および理解が容易となる。 部首(radical)とは、文字の一部のことである。通常、1つの文字には2種類 の部首がある。一方は意味を表し、他方は当該文字の発音を表す。前者は、その 形状またはそれが意味するものに応じて象形文字または表意文字として知られて いる。形状がある物体に似ている場合、これを象形文字と呼ぶ。何にも似ていな いが、他の使用または推測から派生した意味を有する場合、表意文字と呼ぶ。こ れらは、文字を発声する場合、無音のままである。別の種類の部首に、音標部首 として知られているものがある。これは、当該文字の実際の発音または大体の発 音を有し、したがって発音される。 ときとして、(1)「嫁」、「稼」における「家」、(2)「飄」、「漂」、 「嫖」における「票」のように、文字を部首として用いることができる。この種 の部首は、殆ど音標部首として用いられている。「女」、「子」、「木」のよう に、多くの場合部首は文字として用いることができる。 口語中国語における別の独特な特徴として、所与の表音文字に4つの発音法、 即ち、四声(four intonations)の発音を可能にすることがあげられる。中国語の 発音および声(intonation)の組み合わせ総数は、約1,544である。これは、 一般的に用いられる約13,200個の文字に匹敵する。理論的に言うと、各発 音/声の組み合わせは、8ないし9個の文字を表す。実際には、多数の発音/声 の組み合わせが適当に用いられたり、あるいは全く用いられていないこともある 。更に、中国人は、ji、qiおよびxiのように、いくつかの組み合わせを過剰に使 用するように思われる。このような不均一な使用のため、ある種の組み合わせは 50文字以上を表現することもある。これが、東洋言語(中国語、日本語、韓国 語、およびインド語を含む)を、その原始形態でのコンピュータ化を極めて困難 にしている問題であり、出願人はこの現象を過剰表現(over representation)と 呼んでいる。 例えば、飢、几、蹟、貶、革、給、撃、坂、基、機、蹟、畸、稽、積、箕、肌 、 じ発音/声の組み合わせを有する中国語の文字は、99個ある。また、稽、緝、 騎、起、豈、乞、企等のように、「qi」という同じ発音/声の組み合わせを有す 有する中国語の文字は67個ある。 現在、中国語、日本語、韓国語、およびインド語のような東洋言語は、英語の 26アルファベットとは対象的に、数千の文字を用いている。したがって、この ような東洋言語のコンピュータ化は、大きな問題である。明らかに、数千ものキ ーを備えたタイプライタ・キーボードを有することは絶対的に非現実的である。 このように、東洋言語をコンピュータまたはワード・プロセッサに入力すること は、非常に厳しい作業である。 一般的に言うと、東洋言語の入力方法には、2種類の主要なコンピュータ・シ ステムがある、即ち、「形状」システムおよび「音声」システムである。中国語 の「CHANGJEI」または「DA YI」入力システムのような「形状」システムは、文 字の部首の形状に応じて、複数の形状シンボルを指定する。形状シンボルの各々 の組み合わせは、一意の文字を表す。「形状」システムの欠点は、習得および使 用が非常に難しいことである。ユーザは、各文字を所定の形状シンボルに分割す る具体的な方法を勉強し、異なる文字を表す数千もの形状シンボルを暗記しなけ ればならない。形状システムによって、ユーザは特定の文字を正確にコンピュー タまたはワード・プロセッサに入力することが可能になるが、このような「形状 」システムを利用できるのは、特別な集中的訓練を受けた職業としてのタイピス トのような、ごく一部の熟練者に限られる。通常の人々は、「形状」システムを 利用することによって1つの文字を入力することでさえできない。その上、「形 状」システムの学習プロセスは非常に複雑であり、殆どの実務者は、「形状」シ ステムの全ての入力コードを暗記するために、多量の時間を費やすことはできな い。言い換えると、「形状」システムは、職業がコンピュータ・データ・タイピ ストである人のみに設計されたものである。更に、「形状」システムは、各文字 を2バイトで入力し格納する。しかしながら、E−メールのような電子送信では 、送信単位は単一ビットのみであるので、「形状」システムによって入力された 情報やデータは、インターネットを通じてE−メールによって送ることができな い。言い換えると、筆記言語が英語のような音標言語でない東洋の人々は、E− メールやインターネットの利便性を享受する機会が殆どまたは全くない。 中国語の「PIN YIN」または「ZHUYIN」入力システムのような「音標」システ ムは、図1に示すように、ユーザが、中国語即ちzhuyin zimuの子音および母音 を表すために採用され、対応するラテン形式アルファベット(Latin-style alpha bet)をコンピュータにタイプ入力することにより、文字の発音を入力可能とする ものであり、したがって、殆どの人々は、訓練を全く受けずにこれらの方法を利 用することができる。基本的に、pin yinは正字用の中国語発音である。ここで 、この用語は、「ラテン形式アルファベットによる正字法」を意味する。概略的 に、pin yinシステムは、1956年2月の中国語文字改革委員会(Committee fo r Chinese Characters Reform)が発表した中国語音標正字法の草案を基本とす る。これらのアルファベットを、図1にzhuyin zimuに沿って纏めておく。zhuyi n zimuは、各々非常に少ないストロークを有する36個の中国語文字から成り、 中国語の子音および母音を表現するものであり、1913年春に中国教育省によ って選択された。zhuyin zimuは、未だに台湾では、中国語文字の発音を教える 目的で一般に使用されている。中国本土では、しかしながら、zhuyin zimuはpin yinシステムによって取って代わられている。図1ないし図4を参照されたい。 前述のように、東洋言語では、複数の異なる文字が同じ発音を有することはあ たりまえのことである。言い換えると、pin yinまたはzhuyin zimuコードの単一 集合が、複数の異なる文字を表す場合もある。したがって、1組のzhuyin zimu コードをキー入力した後、「PIN YIN」システムまたは「ZHUYIN ZIMU」システム のいずれかが、ユーザに多数の文字を与え、その中から正しい文字を選択する。 例えば、「及」のpin yinは「ji」である。したがって、ユーザが「and」を意味 する文字「及」をキー入力したい場合、ユーザは、アルファベットのjおよびiを キー入力することができる。しかしながら、中国語には、jiと同一の発音 約99個もある。更に、ユーザは、コンピュータ・スクリーン上に現れた99個 の同音文字から、正確な文字「及」を探し出す必要がある。明らかに、「PIN YI N」システムおよび「ZHUYIN」システムは、厄介で非実用的である。更に、前述 の理由のために、「PIN YIN」システムおよび「ZHUYIN」システムのいずれもが 、E−メールを通じた伝送には適していない。 今日、情報伝送に用いられる最も効率的かつ一般的なツールはE−メールであ る。大量のデータおよび情報を世界中に瞬時に送信することができる。人々は、 E−メールを通じて瞬時に無限の情報および知識を送信したり、あるいは得るこ とができる。しかしながら、これら東洋言語を用いる国々および人々は、E−メ ールに適した入力方法を未だに全く発見することができない。この未解決の状況 は、アジア社会と西洋社会との間の文化的および通商的発展に対する大きな足か せとなる可能性がある。 更に、数千年にわたり、中国文化は巨大な数の成句や諺を生み出しており、こ れらは、東アジア全体、ならびに中国語、日本語および韓国語が教えられている または使用されているその他の地域における数億の人々によって日常的に引用さ れている。これらの言語の1つを繰り返し処理するコンピュータ・ユーザにとっ て、これら頻繁に引用される成句や文をコンピュータに入力するために、素早く しかも正確な手段を有することは1つの恩恵であろう。 中国語即ち漢字で書かれ共通に使用される句や文を入力するためのこれら既存 の方法は、以下のステップから成る。 (1)各言語における発音にしたがって、中国語即ち漢字文字をアルファベッ トで表現する。 (2)頭字語を解釈し対応する中国語文字を表示することができるソフトウエ アを装備したコンピュータのキーボード上で、句の各中国語即ち漢字文字の綴り の最初のアルファベットをタイプして、頭字語を形成する。 この方法は、句の発音が唯一である場合にはうまく作用するが、実際の生活で は、同じ発音を有する句、特に4文字未満を含む句(同音異義語)は多数ある。 この多数の同音異義語の問題を補償するために、ソフトウエア・エンジニアは、 画面の下部にタイピストが所望の1つを選択するために、中国語文字で句を表示 するように、彼らのプログラムを設計した。そこに所望の句または文がない場合 、タイピストは、下向きの矢印キーを押して、所望のものが見つかるまで、次の 句または文を呼び出すことができる。この検索即ち選択プロセスのため、既存の 方法は厄介で、時間がかかり、ときとして苛立たしいこともある。 このように、中国語即ち漢字文字の学習および記憶は、非常に非効率的であり 、中国または台湾の第4学年の平均的な学生でも、彼自身または彼女自身を明確 に中国語文字で表現することはできない。これは、中国語文字の「複雑さ」に負 うところが大きく、国民はこの理論を1000年以上にわたって受け入れてきた 。この状況は、オーディオ・ビジュアル即ちマルチメディア・ツールを用いて、 学習プロセスを利用し既に習得したものを定着することによってのみ劇的な改善 が可能となる。 本発明の概要 本発明の主な目的は、言語における語彙を表す非音標文字を、特定的に代用単 語に変換し、コンピュータに入力する方法を提供することである。このように新 たに作成された代用単語は、中国語、日本語、韓国語、およびインド語のような 筆記東洋言語に用いられる非音標文字に対して一意であり、正確に表現すること ができるので、これらの言語で書かれた情報の容易なコンピュータ入力を促進す る。 本発明の別の目的は、言語における語彙を表す非音標文字を代用単語に特定的 に変換してコンピュータに入力し、情報を全く失うことなく、このように新たに 作成された代用単語を、E−メールによる伝送に適合させる方法を提供すること である。 本発明の別の目的は、言語における語彙を表す非音標文字を代用単語に特定的 に変換し、コンピュータに入力する方法を提供し、音声認識および発生技術を、 東洋言語で書かれたコンピュータ処理情報に組み込む方法に道を作ることである 。 本発明の他の目的は、言語における語彙を表す非音標文字を代用単語に特定的 に変換し、コンピュータに入力する方法を提供し、通常通りにサウンド・カード およびソフトウエアを用いて音声認識コンピュータを構築し、最初に接頭語、次 いで入力された場合には指標、次に分離マーク(ハイフン)、次いで接尾語、次 いで入力可能な場合にマーカ(群)というように、人の各単語の発音を理解する ようにこれを訓練することである。勿論、ハイフンまたは*を最初に発音し、次 いで接尾語、次いでハイフンまたは*、次いで接頭語を発音するのである限り、 前述とは逆の組み合わせも、この目的のために使用可能である。したがって、ユ ーザは、音声によって、音節(article)をコンピュータに入力することができる 。 本発明の別の目的は、言語における語彙を表す非音標文字を、代用単語に特定 的に変換し、同一のサウンド・カードおよびソフトウエアを有し代用単語の接尾 語を精度高く発音することができる音声発生システムを装備したコンピュータに 入力し、ユーザが編集や印刷を行うためにコンピュータが文書を音読することを 可能にする方法を提供することである。これにより、ユーザは、一文字ずつ文書 をチェックして、可能なタイプ・エラーを見つける時間や手間をかける必要がな くなる。また、この機能は、各非音標言語を発声することはできるが書くことや 読むことができない人々が、本発明の変換方法によってコンピュータに入力した 彼らの文書をチェックする際にも役立つ。 本発明の別の目的は、言語における語彙を表す非音標文字を代用単語に特定的 に変換し、コンピュータに入力する方法を提供することである。かかる方法によ り、西洋人および東洋人双方が、複雑な学習プロセスを全く必要とせずに、東洋 言語を容易にかつ正確に入力することが可能となる。 本発明の別の目的は、言語における語彙を表す非音標文字を、コンピュータに 入力するための代用単語に特定的に変換し、句や文のコンピュータへの入力を容 易にする方法を提供することである。 本発明の別の目的は、言語における語彙を表す非音標文字を代用単語に特定的 に変換し、コンピュータに入力する方法を提供し、本発明の理論および論理を用 いることにより、筆記形態が非音標的な言語の発声、読解、筆記を教える際にか かる方法の利用を可能とすることである。 本発明の別の目的は、言語における語彙を表す非音標文字を代用単語に特定的 に変換し、コンピュータに入力する方法を提供し、本発明の変換方法に基づいて 、象形的/表意的部首を代用単語の接頭語として使用することにより、子供が中 国語即ち漢字文字を容易に暗記するために役立つプロセスを確立可能とすること である。 したがって、言語の語彙を表す非音標文字を代用単語に変換し、コンピュータ に入力する方法は、 (a)各言語において各文字の象形/表意部首をその発音にしたがってアルフ ァベット化し、得られた綴字を新たに作成した代用単語の接頭語として用いるス テップと、 (b)各言語において文字をその発音にしたがってアルファベット化し、得ら れた綴字を新たに作成した代用単語の綴字接尾語として用いるステップと、 (c)接頭語および接尾語を共に結合し、各言語の筆記形態に用いる特定の「 文字」に対する代用単語を作成するステップを含む。 代用単語において接頭語と接尾語とを区別し、ユーザに対するあらゆる混乱を 回避するために、前述のステップ(c)は、更に、ハイフン「−」または空白の ような分離マークを代用単語の接頭語と接尾語との間に挿入し、接頭語と接尾語 とを分離する区別ステップを含む。 声を有する中国語に関して、中国語の新たな代用単語には、選択した子音を標 識(indicator)として用いて、接頭語および接尾語の発音の声を示す。 同じ発音および声の象形文字/表意文字について、特定の象形文字/表意文字 に対する綴字の最後のアルファベットを、1回、2回または3回のいずれかだけ 繰り返す。繰り返したアルファベットは、これらが表す部首を区別するが部首の 発音には何ら関係しない、特別なアルファベットとして扱う。 新たな代用単語を発音する場合、接頭語は、無音を表す象形文字または表意文 字のように扱う。これらが表す音標部首と全く同じように、接尾語を発音する。 中国語の接頭語の発音が唯一の場合、その声の標識は省略する。接尾語が発音さ れるので、声が4つの内最初のものである場合を除いて、精度の要求のために、 声に対する標識を接尾語によって常時提示する。 図面の簡単な説明 図1は、Pin YinアルファベットおよびZhuyin Zimuを示す図表である。 図2は、カタカナ、平仮名およびそれらの英語における同等物を示す図表であ る。 図3は、ハングルおよびそれらの英語における同等物を示す図表である。 図4−1ないし図4−11は、中国語の214p/i部首、および各p/i部 首毎に綴った代用接頭語を示すための連続図表であり、文字による発音、習慣的 な発音、コンピュータ入力のための簡略化した特殊キー(群)(pinyinアルファ ベットおよびzhuyin zimu双方)、およびコンピュータ入力のための簡略化した いくつかのオプション・キーによって種々の代用接頭語システムをが得られるこ とを示す図表である。 図5は、jiという同一発音を有する複数の中国語文字を示し、各文字は、本発 明の変換方法の3ステップによって得られる一意の代用単語によって正確に表さ れることを示す図表である。 図6は、本発明にしたがって、中国語文字を英語形式のアルファベットおよび Zhuyin Zimuの代用単語に変換するために用いる5つのステップを示す図表であ る。 図7は、本発明にしたがって、日本語文字を英語形式のアルファベット、カタ カナおよび平仮名の代用単語に変換するために用いる5つのステップを示す図表 である。 図8は、本発明にしたがって、韓国語文字を英語形式のアルファベットおよび ハングルの代用単語に変換するために用いる5つのステップを示す図表である。 図9は、本発明にしたがって、Pin Yinシステムにおいて用いられるアルファ ベットに対して行われる変更を示す図表である。 図10は、本発明にしたがって、中国語句を英語形式のアルファベットの代用 句に変換するために用いるステップを示す図表である。 図11は、本発明にしたがって、中国語句をZhuyin Zimuの代用句に変換する ために用いるステップを示す図表である。 図12は、本発明にしたがって、日本語句が使用する中国語文字の句を、英語 形式のアルファベット、平仮名およびカタカナの代用句に変換するために用いる ステップを示す図表である。 図13は、本発明にしたがって、韓国語句が使用する漢字の句を、英語形式の アルファベットおよびハングルの代用句に変換するために用いるステップを示す 図表である。 図14は、象形/表意部首をいかにして視覚的に示すかについて紹介する図表 である。 詳細な説明 中国語、中国語から派生した日本語および韓国語の筆記形態、更にインド語ま でもが非音標文字で構成される。本発明は、既存のまたは新たに作成する音標シ ンボルを用いることにより、かかる非音標文字を音標成分に変換する方法を提供 する。音標シンボルとは、音標成分、即ち、子音および母音を表す視覚的符号の ことである。これらは、ラテン形式または英語形式のアルファベット、およびZh uyin Zimu、カタカナ、平仮名、ハングルのような自国のアルファベットとする ことができる。また、音標シンボルは、いずれの言語でもその子音、母音および 声を表現する1組の符号を指定することによって作成することができる。 本発明の変換方法の目的は、これらの言語のコンピュータ化を可能にすること である。音標シンボルは、英語形式のアルファベット、Zhuyin Zimu、カタカナ 、平仮名、ハングルのような自国のアルファベット、あるいは新たに作成する符 号またはシンボルとすることができる。次いで、本発明において開示する変換プ ロセスによって、各非音標文字を一意の新たな綴字「代用単語」(spelled surroga te word)に変換する。新たな綴字代用単語は、各言語において用いられる文字を 正確に表現することができる。これらの音標シンボルについては図1,図2およ び図3を参照し、これら音標シンボルで構成された綴字代用単語については図6 、図7および図8を参照されたい。これら3つの図は、図6、図7および図8に 示すように、この変換プロセスの概要として見ることができる。 概して言えば、典型的な各中国文字のように、各非音標文字は、当該文字の意 味を示す象形部首または表意部首(以下の説明では、「p/i部首」として引用 する)と、当該文字の発音またはおおよその発音を示す音標部首とで構成される 。p/i部首はわずか214個に過ぎない。実際には、214個のp/i部首は 、別の214組のコードによって正確にコード化され、それぞれ、対応するp/ i部首を表すことができる。図4を参照すると、実際に、各p/i部首は特定の 発音を有する。例えば、漢字「西」は、xiと発音し、「支」はzhiと発音する。 言い換えると、代用単語「xi」および「zhi」は、正確にp/i部首「西」およ び「支」をそれぞれ表す。 数千組のコードを代用単語として割り当て、ある東洋言語、例えば中国語の全 ての非音標文字を正確に表すことは、可能な範囲を超えるものである。しかしな がら、「形状」入力システム(本発明の背景において述べた、中国語のための「 CHANGJEI」または「DA YI」入力システムのような)がそうであったように、一 般の非職業ユーザにとって、何千ものなじみのないコードを記憶することはほぼ 不可能である。実際、人が書き方を習得する前に、彼または彼女は話し方、即ち 、文章内の文字をどのように発音するのかを習得する。したがって、発音から派 生するアルファベット表記(alphabetization)は、最も親しみがありかつ論理的 な文字を形成するための方法の1つである。英語は26個のアルファベットを異 なる組み合わせで用いて、この言語の単語全てを構成する。また、殆どの中国語 文字も、音標部首をそれらの主要構成要素として備えている。 中国語、日本語または韓国語のいずれにしても、同音異義語は、文字および部 首を発音する際の共通の現象である。2つ以上の文字または部首が同じ発音、ま たは発音および声の同じ組み合わせを共有する場合、これらは同音異義語である と言う。 本発明によれば、1つの文字を2つの部首に分解する。次いで、部首をアルフ ァベット化して接頭語(prefix)および接尾語(suffix)とし、所与の文字を表す代 用単語を形成する。しかしながら、本発明の背景において開示したように、非音 標文字には、同一の発音を共有する多くの同音異義語がある。本発明は、新たな 代用単語を作成し、筆記東洋言語に用いられるかかる非音標文字をそれぞれ正確 に表す変換方法を提供する。かかる変換方法は、このような同音異義語の問題を 完全に解決することができるので、文字に対応して作成された代用単語を順次キ ー入力することにより、通常のアルファベット・キーボード、マウスまたはその 他の音標入力方法を通じて、非音標文字をコンピュータに容易に入力することが 可能となる。 中国語では、最も一般的な綴字に対する発音の音標システムは、Pinyin、Zhuy in Zimu、およびYueyinである。Pinyinは、綴字用中国語発音である。ここで、 この用語は、「ラテン形式アルファベットによる綴字」を意味する。Zhuyinは、 各々少数のストロークを有する36個の中国語文字から成る。これらは、図1に 示すように、中国語の子音および母音を表すために選択されたものである。Yuey inは、広東地方の方言のためのPinyinの使用である。 日本語では、最も一般的な綴字に対する発音の音標システムは、図2に示すよ うに、平仮名およびカタカナであり、平仮名は、本発明では複数であるかのよう に扱われ、子音および母音として日本人によって借用された特殊な漢字の1群で あり、日本語起源の語彙の発音を示す。平仮名は、手書きの漢字に類似している 。これらも、日本語のアルファベットの一形態である。カタカナは、本発明では 複数であるかのように扱われ、子音および母音として日本人によって借用された 特殊な漢字の1群であり、漢字および外国起源の語彙の発音を示す。カタカナは 、印刷した文字の形状に類似している。実際には、カタカナも日本語のアルファ ベットである。 韓国語では、図3に示すように、ハングルが韓国語の子音および母音を表すシ ンボルである。実際に、これらは韓国人によってアルファベットと呼ばれている 。 言語における語彙を表す非音標文字を代用単語に特定して変換し、コンピュー タに入力する本発明の変換方法は、以下のようなステップから成る。 ステップ1。各言語において、各文字の象形/表意部首を、その発音にしたが って、アルファベット化し、得られた綴字を、新たに作成する代用単語の接頭語 として用いる。 例えば、英語形式のアルファベットを用いる場合、以下の例は、中国語、日本 語および韓国語において、それぞれ、どのようにして文字のp/i部首を音標化 (phoneticalize)するのかについて、それらの発音にしたがって綴ることによっ て示すものである。 A.中国語:1.木に対してmu。2.馬に対してma。3.鳥に対してniao。4 .水に対してshui。5.心に対してxin。 B.日本語:1.木に対してki。2.馬に対してuma。3.鳥に対してtori。 4.水に対してsuiまたはmizu。5.魚に対してsakanaまたはuo。 C.韓国語:1.水に対してmoolまたはsoo。2.木に対してnahmoohまたはmu k。3.金に対してkim。4.手に対してsoonまたはsoo。 勿論、p/i部首は多くの方法で表現可能であることは、再度述べるに値する 。 1つの方法は、一意の番号を各p/i部首に割り当てることである。こうすると 、綴字の代わりに、214個のp/i部首に対して、全部で214個の番号を用 いることができる。別の方法は、コンピュータ・キーボード上のキーの組み合わ せを用い、部首に割り当てられる番号を表現することである。例えば、Ctrl、Al t、およびShiftの内1つまたは2つあるいは全てを押圧し、次いでアルファベッ ト・キーのいずれか1つを押圧することにより、214通りのキーの組み合わせ を容易に得て、214個のp/i部首全てを表現することができる。しかし、本 出願人は、音標表現が、全ての方法の中で最もユーザに使いやすいものであると 考える。何故なら、これらの部首の大部分は、容易に発音し綴ることができるか らである。番号またはキーを記憶するための手間は、殆どまたは全く必要としな い。 ステップ2。各言語における各文字の発音にしたがって、その音標部首(phon etic radical)をアルファベット化する。あるいは、当該文字が音標部首を有さ ない場合または音標部首がその文字の実際の発音に対応しない(bear)場合、この 文字の発音をアルファベット化する。次いで、得られた綴字を、新たに作成する 代用単語の接尾語として用いる。 例えば、英語形式のアルファベットを用いる場合、以下の例は、中国語、日本 語および韓国語における複数の文字の発音にしたがって綴ることにより、当該文 字の音標部首をいかにして音標化するかについて示す。 A.中国語:1.「鴉」や「鴨」におけるような「牙」および「甲」に対して ya。この場合、「牙」は文字「鴉」の音標部首であり、「鴉」は「牙」(即ち、 ya)と発音する。また、「甲」は文字「鴨」の音標部首であり、「鴨」は「甲」 (即ち、ya)と発音する。2.「美」、「毎」、「眉」、および「妹」における ような「未」に対してmei。3.「騎」におけるような「奇」に対してqi。 B.日本語:「檢」、「驗」におけるような「檢」、および「涓」および「鵑 」におけるような「員」に対してken。2.「鶴」および「蔓」に対してtsuru。 3.「楷」におけるような「皆」、「鮭」におけるような「圭」、「潰」におけ る「貴」に対してkai。 C.韓国語:1.「港」におけるような「巷」、「江」におけるような「工」 、「抗」におけるような「亢」、および「鋼」におけるような「岡」に対してka ng。 2.「桃」におけるような「兆」、および「淘」におけるような「淘」に対して to。 ステップ3。接頭語および接尾語を共に結合し、各言語の筆記形態に用いられ る特定の各「文字」毎に新たな綴字代用単語を作成する。 非音標文字を表す代用単語をコンピュータに入力するには、コンピュータのス クリーン上に入力ツール・バーを提示するようにプログラムを組む。入力ツール ・バーは、2つの別個の入力ウインドウを備え、一方の入力ウインドウは、代用 単語の接頭語のアルファベット化綴字をキー入力するための接頭語入力ウインド ウであり、他方の入力ウインドウは、代用単語の接尾語のアルファベット化綴字 をキー入力するための接尾語入力ウインドウである。代用単語の接頭語および接 尾 語を接頭語入力ウインドウおよび接尾語入力ウインドウに入力することによって 、表す文字のために、代用単語をコンピュータに入力する。 代用単語において接頭語および接尾語を区別して、ユーザに対するあらゆる混 乱を避けるために、前述のステップ3は、更に、ハイフン「−」またはスペース のような分離マークを用いて接頭語および接尾語を分離する区別ステップも備え る。分離マークは、接頭語と接尾語との間に挿入する。 例えば、 A.中国語: 1.p/i部首がmuと発音する「木」であり、音標部首がmeiと発音する「毎 」である「梅」に対して、mu-mei(文字「梅」はmeiとも発音する)。 2.p/i部首がniaoと発音する「鳥」であり、音標部首がyaと発音する「牙 」である「鴉」に対して、niao-ya(文字「鴉」はyaとも発音する)。 3.p/i部首がmaと発音する「馬」であり、表音部首がqiと発音する「奇」 である「騎」に対して、ma-qi(文字「騎」はqiとも発音する)。 B.日本語: 1.「檢」に対して、ki-ken。2.「驗」に対して、uma-ken。3.「涓」に 対してsui-ken。4.「鵑」に対して、tori-ken。5.「蔓」に対して、kusa-ts uru。6.「鶴」に対して、tori-turu。7.「楷」に対して、ki-kai。8.「鮭 」に対して、sakana-kai。9.「潰」に対してsui-kai。 C.韓国語:1.「江」に対して、mool-kang。2.「抗」に対して、soo-kan g。3.「鋼」に対して、kim-kang。4.「桃」に対して、nahmooh-to。6.「 淘」に対して、mool-to。 前述のステップ1ないしステップ3を処理することにより、特定の文字を正確 に表す、一意で新たな綴字代用単語が作成される。通常、代用単語は、分離マー クによって結合された接頭語および接尾語から成り、接頭語は当該文字のp/i 部首の発音の綴字であり、接尾語は当該文字音標部首の発音または当該文字の発 音の綴字である。ユーザが代用文字を綴っているとき、これは、ユーザが文字を 発声しているのと全く同じである。言い換えると、中国人、日本人または韓国人 は、本発明の前述のステップによって作成されたどの代用単語が、どの文字を表 すのかを、あたかも彼らが当該文字を書いているかのように、単純かつ容易に区 別することができる。 しかしながら、「衣」、「一」、「言」、「人」、「土」、「大」、「口」、 「女」、「力」等のように、入力する特定文字がp/i部首自体である場合、ユ ーザは、接頭語(p/i部首に対する綴字)および分離マークのみを入力した後 、直ちに前述の正確な文字を得ることができ、接尾語をキー入力する必要はない 。場合によっては、分離マークも省略可能である。 中国語に関して、代用単語は、筆記中国文字のようには見えないが、これは1 00%漢字から派生したものである。本発明の変換ステップの前述の3ステップ によれば、約95%の漢字は、それぞれの対応する一意の代用単語によって、正 確に表現される。言い換えると、ユーザが前述の3ステップによって作成した代 用単語を、コンピュータまたはワード・プロセッサに入力する場合、特定の漢字 を正確に得ることができる。したがって、この変換方法は、入力精度、および漢 字の入力速度を著しく高める。更に、代用単語はアルファベットで構成され、そ れぞれの単語を正確に表現することができるので、代用単語は、非音標文字、即 ち、中国語、日本語および韓国語をE−メールを通じて送ることを可能とし、し かも混乱や情報の損失は全く生じない。 一般的に、同じ発音を有する多数の漢字がある。例えば、yiという発音は約9 9個の同音異義の文字を有する。これは、非音標文字のコンピュータ化を困難ま たは不可能にさえもし得る重大な問題である。図5に示すように、全ての文字が jiという発音である、中国語の同音異義語のリストを示す。本発明によれば、図 5に示す各同音異義語の発音jiの綴字を、代用単語の接尾語に変換する。非音標 文字は、同一の文字はないという共通の特徴を有する、即ち、各文字は異なる外 観を有するので、この特徴は、非音標文字を区別する重要な因子となる。実際に は、2つの文字が同一の発音を有する場合でも、これらは異なるp/i部首を有 したり、あるいは音標部首が異なって書かれることもある。言い換えると、これ らは同一のp/i部首を有し同じ発音である場合もあるが、全く異なる形状を有 するので、読者が誤解することはない。この点によって、非音標文字は視覚に基 づくということを推測したであろう。視覚に基づく筆記言語において同音異義語 を分類する要領は、それらを互いに異なるように見せることである。したがって 、本発明によれば、各同音異義語のp/i部首の発音の綴字または割り当てたア ルファベットまたは数字のコードを、代用単語の接頭語として用いる。接頭語お よび接尾語を分離マークによって結合し、当該文字を一意に表す綴字代用単語全 体を構成する。図5に示すように、各同音異義語文字は、対応する一意の綴字代 用単語を有し、したがって、これらの代用単語をコンピュータまたはワード・プ ロセッサに入力することにより、特定の文字を得ることができる。 基本的に、本発明の変換方法の3ステップを処理することにより、文字に対応 する一意の代用単語をタイプすれば、中国語文字の5%ならびに日本語文字およ び韓国語文字の10ないし15%を除いて、ほぼ全てを正確にコンピュータに入 力することが可能となる。勿論、ユーザは、単にコンピュータの画面上の表示か ら所望の文字を選択すればよい。何故なら、多数の同音異義語文字はわずか数個 の文字に減少するからである。本発明は、既に、選択時間を大幅に短縮し、作業 を削減した。本発明は、更に、前述の3つの基本ステップに、残りの同音異義語 文字を100%正確に表すことを可能にする一意の代用単語を作成する2つの追 加ステップを備える。言い換えると、本発明の5ステップ全てを処理することに より、いずれの2つの文字でも、同じ代用単語を有するという可能性は全くなく なる。 声を有する中国語に関して、中国語の新たな代用単語では、接頭語および接尾 語の発音の声を表記するには、子音を選択して標識として用いる。したがって、 第1の追加ステップは、前述のステップ3の前に処理する。第1の追加ステップ において、中国語の新たな綴字代用文字について、接頭語および接尾語の発音の 声を、綴字の終端に配置する子音によって示す。最初の声は標識を有さない。2 番目の声は、pinyinアルファベットでは第2の中国語の子音「p」、zhuyin zimu 例えば、 「矢」に対してはshim。4.「示」に対してはshif。 shui-meiとなる。この場合、そのp/i部首はshuiと発音する「水」であり、 公式な口語中国語、即ち、マンダリン方言(Mandarin dialect)では、pinyinシ ステムに明記されている規則によれば、nまたはrを除いて、子音は決して母音 の後には現れないことを注記するのは重要である。したがって、読者またはタイ ピストにとっては、これら3つの終端子音p,m,fを声の標識として認識するの は容易である。日本語および韓国語では、その口語形態に声がないので、この第 1の追加ステップは、これらの言語には適用されないことを再度注記しておくべ きであろう。基本的に、上述の4ステップを処理することによって、約98%の 漢字を、それらの対応する特定代用単語によってそれぞれ正確に表すことができ る。 中国語には、同じ発音および声を有する象形文字または表意文字が多数あるの で、図6に示すような極端な例がいくつかある。ここでは、shiという同じ発音 を有する4つの漢字の同音異義語を示す。第2の追加ステップは、ステップ3の 後に処理する。第2の追加ステップでは、代用単語の最後のアルファベットの後 ろに、マーカを付加し、中国語辞書の象形文字/表意文字の索引に補助的に現れ る、次の同音異義象形文字または表意文字を表す。マーカは、キーボード上のい ずれのキーでもよい。しかしながら、効率および精度のためには、このマーカは 綴字の最後のアルファベットとすべきである。言い換えると、綴字の最後のアル ファベットの繰り返しによって、同音異義語の象形文字または表意文字を区別す る。コンピュータの画面上または標準的な辞書の索引(選択バー)に2番目に現 れる同音異義語の象形文字または表意文字について、これを1回繰り返し、3番 目に現れるものについて2回繰り返し、コンピュータの画面上または標準的な辞 書の索引(選択バー)に4番目に現れるものについて3回繰り返す。しかしなが ら、数値1,2,3,4,5,...、または「ホーム・キー」:a,s,d, f,g,h,j,l等、またはその他のいずれかの所定のシンボルをマーカとし て用いることができる。ホーム・キーとは、数値1ないし10を表すためにタイ ピストの指が通常位置する、コンピュータのキーボード上に備えられているキー である。 例えば、 A.中国語では、1.「一」に対してy。2.「乙」に対してyy。3.「弋」 に対してyyy。4.「衣」に対してyyyy。または、 1.「一」に対して「1」。2.「乙」に対して「2」。3.「弋」に対して 「3」。4.「衣」に対して「4」。または、 「一」に対して「a」。2.「乙」に対して「s」。3.「弋」に対して「d 」。 4.「衣」に対して「f」。 B.日本語では、1.「木」に対してki。2.「黄」に対してkii。 C.韓国語では、1.「城」に対してsin。2.「身」に対してsinn。3.「 辛」に対してsinnn。4.「辰」に対してsinnnn。 繰り返されるアルファベットは、同音異義の部首を区別するために、単に余分 なアルファベットまたはマーカとして処理し、これらは部首の発音には全く関係 がない。前述と同じ手順を、同一の接頭語を有する同音異義語に、辞書において それらが出て来る順にしたがって適用する。 図6ないし図8に示す例。 A.中国語(図6に示す):1.「試」に対してyan-shif。2.「誓」に対し てyan-shiff。3.「言是」に対してyan-shifff。4.「識」に対してyan-shiff ff。または、 1.「試」に対してyan-shi1。2.「誓」に対してyan-shi2。3.「言是」に 対してyan-shi3。4.「識」に対してyan-shi4。または、(1.「試」に対して yan-shia。2.「誓」に対してyan-shis。3.「言是」に対してyan-shid。4. 「識」に対してyan-shif。) B.日本語(図7に示す):1.「杠」に対してki-ko。2.「杞」に対してk i-koo。3.「杭」に対してki-kooo。4.「枯」に対してki-koooo。 C.韓国語(図8に示す):1.「杞」に対してmuk-ki。2.「枝」に対して muk-kii。3.「棋」に対してmuk-kiii。4.「機」に対してmuk-kiiii。 新たな代用単語を発音するとき、接頭語は、それらが無音を表す象形文字また は表意文字のように扱う。丁度これらが表す音標部首のように、接尾語を発音す る。中国語の接頭語の発音が唯一である場合、その声に対する標識は省略される 。接尾語が発音されるので、精度の要求のために、声が4つの内最初のものであ る場合を除いて、声の標識を接尾語によって常時提示する。 図6ないし図8を参照されたい。これらは、本発明に関する5つのステップ全 てを示すことができる、4つの極端な文字の例に対する変換プロセス全体を纏め たものである。図6は、4つの中国語文字を一例として示す。図7は、4つの日 本語の文字を一例として示す。図8は4つの韓国語文字を一例として示す。図6 ないし図8におけるこれらの図表は、同じフォーマットを共有しており、各々、 5つの列および少なくとも8つの行を有する。左側から始めると、列1は、変換 プロセスの5つのステップ、即ち、右側の列の記述を含む。右側の4つの列には 、各列に1つずつ、前述の例で述べた4つの文字が入っており、更にこれらに行 われる変換が行毎に含まれている。行1には、4つの文字がその原始形態で入っ ており、発音が英語形式のアルファベットで表されている。行2には、各文字か ら得た部首が入っている。行3は、各部首全てについて綴字を示す。この行は、 実際には、ステップ1および2の効果を詳細に表す。行4は、ステップ3の効果 を示し、中国語にのみ適用される。行5は、ステップ4がどのように文字に影響 を及ぼすかについて示し、説明が列2にある。行6は、ステップ5がどのように 変換プロセスを完了するかについて例証する。各列内にコメントがあり、2番目 の規則を呼び出す。行7は、プロセスの最終生成物を、それ自体によって示し、 特に説明はない。このように行うことにより、読者は、同じ接頭語、発音および 声を共有する文字について、新たな綴字代用単語またはコードの一意性を明確に 確認することができる。行8は、実験的に自国のアルファベットで綴った代用単 語を示す。図7には行が1つ多い。何故なら、日本人は2組の自国アルファベッ ト、即ち、カタカナおよび平仮名を有するからである。行8には、カタカナで作 ったコードが入っている。平仮名で作ったコードを行9に配置した。また、図8 も行が1つ多い。出願人は、この追加の行を用いて、英語のように水平な直線上 に組織化したハングルのコードを綴ろうとしたのである。各図表の下には、以下 に述べる規則を思い出す目的のために纏めてある。 本発明によれば、変換方法は、発明した代用単語を発音するための2つの規則 を更に有する。 1.本発明の綴字代用単語を発音する場合、接頭語は無音である(それらが表す 象形文字または表意文字と同様)。丁度それらが表す音標部首のように、接尾語 を発音する。 2.接頭語の発音が唯一である場合、その声に対する標識を省略することができ る。接尾語が発音されるので、精度に対する要求のために、声が4つの内最初の ものである場合を除いて、声に対する標識を常時提示する。 本発明のステップ3において先に説明したように、代用単語は、以下のように 組織化される。最初に接頭語が来て、次いで分離マーク(分離マークは、ラテン アルファベットにおけるハイフンとすることができるが、自国のアルファベット を用いて代用単語を綴る場合は、ハイフンを「*」のような他のシンボルで置き 換えることができる)、そして接尾語が来る。しかしながら、前述のように、ス テップ1およびステップ3は逆にすることができる。即ち、接尾語が接頭語の前 に来る。したがって、代用単語は、「接尾語−接頭語」という構造になる。この ような代替モードも、コンピュータにこの状況を指示する限り、動作する。例え ば、特定の漢字「績」の一意の代用単語は、この第2実施形態によれば、「ji-x i」となる(第1実施形態では、「績」の代用単語は、「xi-ji」である)。第1 実施形態および第2実施形態から作成された代用単語は双方共同じアルファベッ トから成るので、これら双方は、同じ文字を正確に表すために用いることができ る。その他にも、ユーザが「切り替えキー」によってコンピュータを予めプログ ラムしておき、ユーザがコンピュータを自由に切り替えて、いつでも第1および 第2実施形態に適応させることも可能である。 実際に、場合によっては第2実施形態の方がよいこともある。これは、特定の ユーザが、象形文字/表意文字の部首が発音しにくいと感じる場合、したがって タイプしにくい場合である。稀で難しい部首の発音のために辞書を引く代わりに 、ユーザは先に進んで接尾語をタイプすることができる。コンピュータは、ユー ザが選択するために同音異義文字を表示することができる。これは、例えば、自 国のアルファベットの場合、単にハイフンまたは「*」を最初にタイプし、次い で 接尾語をタイプすることによって行うことができる。ユーザが突然接頭語の綴字 、即ち、p/i部首の発音の綴字を思い出した場合、ハイフン(または、自国の アルファベットを用いる場合、「*」)をタイプし、次いで接頭語をタイプする ことができる。この逆の組み合わせも、第1実施形態のステップ4において説明 した「正常な」組み合わせと同様一意であるので、この場合も所望の文字を正確 に得ることができる。あるいは、ユーザが所望の文字を選択するために、同音異 義文字を表示する。同音異義語を数値化(numeralize)する代わりに、「ホーム・ キー」のアルファベットを用いて、同音異義語の順番を指示することができる。 ユーザは、最初の文字には「a」、二番目の文字には「b」、三番目の文字には 「d」というように、キーをタイプ入力することにより、所望の文字を選択する ことができる。これは、単にソフトウエアの設計事項に過ぎない。 更に、前述の逆の組み合わせを含む、これら5ステップの組み合わせおよび2 つの規則は、中国人、日本人、韓国人や東インド人にも、アメリカ人と同様にコ ンピュータの使用を可能にするだけでなく、音声認識/発声技術を容易に彼らに もたらすことができる。音声認識コンピュータは、通常通りにサウンド・カード およびソフトウエアを用いて構築し、最初に接頭語、次いで適用する場合には標 識、次に適用する場合にはマーカ、次に分離マーク(ハイフンまたはアステリス ク)、次いで接尾語、次いで適用する場合には標識、次いで適用可能な場合には マーカ(群)というようなシーケンスで、人の各単語の発音を理解するようにこ れを訓練することができる。勿論、ハイフンまたはアステリスク(*)を最初に 発音し、次いで接尾語、次いでハイフンまたはアステリスク(*)、次いで接頭 語と発音する限り、前述の逆の組み合わせも、この目的のために使用可能である 。 本発明において開示する変換方法は、各非音標言語を発声することはできるが 書くことができない人々が、文字をコンピュータに入力し、その言語で書かれた 小論(essay)を印刷することを可能にする。本発明の別の注目すべき機能として 、音声発生コンピュータを利用することにより、精度高く接尾語を発音すること ができる同じサウンド・カードおよびソフトウエアを用いて、コンピュータが文 書を読み上げてユーザが編集および印刷を行うようにすれば、ユーザは、文書を 1文字づつチェックして、あり得るタイプ・エラーを見つけるために時間やエネ ル ギを費やす必要がなくなることがあげられる。また、この機能は、各非音標言語 を発声することはできるが書くことも読むこともできない人々が、本発明の変換 方法によってコンピュータに入力された彼らの文書をチェックする際に役立てる こともできる。 以下に、本出願人が更に開示したいいくつかの草稿を記す。 筆記中国語での文字を正確に表すための代用単語を作成するために用いた英語 形式アルファベットは、中国において正式なPinyinシステムで用いられており、 それに多少変更を加えたものである。これらの変更は、Pinyinシステムにおける 例外を除去し、より簡単に使用することを意図している。1組のPinyinアルファ ベット全体については図1を参照し、前述の変更については図9を参照されたい 。Zhuyin Zimuを用いて新たに発明した代用単語を綴る場合、接頭語および接尾 語は、ハイフンの代わりに、アステリスクによって分離しなければならない。 筆記日本語での文字を正確に表すための代用単語を作成するために用いたアル ファベットは、日本語の音声を英語形式のアルファベットに変換する場合に日本 人に一般的に受け入れられているヘボン式ローマ字化(Hepburn system of roman ization)に提案されたものである。カタカナまたは平仮名によって新たな代用単 語を綴る場合、同様にハイフンをアステリスクと置き換えなければならない。 筆記韓国語での文字を正確に表すための代用単語を作成するために用いたアル ファベットは、韓国語の音声を英語形式のアルファベットに変換する場合に韓国 人に一般的に受け入れられているものである。自国のアルファベットを用いて、 韓国語に用いられる文字の代用単語を綴る場合、同様にハイフンの代わりにアス テリスクを用いる。 これらの言語を対象とした代用単語を英語から区別するために、本出願におけ るように、英語でない綴字をイタリック体とすることができる。 Pinyinシステムによれば、中国語の子音の順序は、以下の通りである。B,P ,M,F,D,T,L,N,G,K,H,J,Q,X,ZH,CH,SH,R, Z,C,S。 接頭語は、多くの人が熟知した後には、短縮することができる。その短縮形態 では、接頭語の子音、最初のアルファベットまたは最後のアルファベットは、殆 どの接頭語を表すのに適当なものとしなければならない。音声認識技術を用いれ ば、短縮は不要な場合もある。 この説明では、中国語、日本語および韓国語について、自国のアルファベット を用いて音声を表す綴字代用単語の例によって、本発明の概念を示した。自国の アルファベットまたは英語形式のアルファベットを用いて同じ文字を実際に綴る 場合、この説明において用いたものとは異なる場合もある。更に、あらゆる種類 の符号をいつでも創作して、既存の音声シンボルと置き換えることができる。し かし、文字を正確に表す一意の新たな代用単語を効果的に作成するためには、本 発明において開示した5つのステップおよび2つの規則を用いなければならない 。 新たな綴字代用単語は、英語形式のアルファベットで作成するかあるいは自国 のアルファベットで作成するかには関わらず、両種共部首、即ち、象形または表 意部首および音標部首で構成されているという点で、文字に似ている。これらの 代用単語は、少なくとも2つの面で、文字とは異なる。第1に、新たな綴字代用 単語の部首は音標化されているが、文字の部首、特に象形/表意部首は音標化さ れていない。第2に、象形/表意部首が常に代用単語の左側部分を接頭語として 占めており、音標部首が常に代用単語の右側部分を接尾語として占めているとい う点で、本発明の綴字代用単語の方がその構造が均一化している。一方、文字に おける象形/表意部首は、文字と左、右、上または下を占める場合がある。前述 の類似のために、新たな代用単語は、ユーザに一層なじみ深くなる一方、相違は 、音声学の見地から新たな代用単語を論理的かつ一層科学的にする。その結果、 これらの代用単語を学習するのは非常に簡単となる。実際には、ユーザは、キー ・ボードを通じて特定の非音標文字を表す代用単語を単にタイプすれば、特定の 非音標文字を正確にコンピュータにキー入力することができる。 本発明の非音標文字を代用単語に変換するための変換方法によれば、ユーザは 、変換方法を実行した後に、手入力方法を処理することによって、所定の文字を コンピュータに単に入力すればよい。 手入力方法は、以下のステップから成る。 (1)変換方法によって作成した代用単語の接頭語をタイプする。 (2)適用可能であれば、接頭語の標識をタイプする。 (3)適用可能であれば、接頭語のマーカをタイプする。 (4)適用可能であれば、代用単語の分離マークをタイプする。 (5)代用単語の接尾語をタイプする。 (6)適用可能であれば、接尾語の標識をタイプする。 (7)適用可能であれば、接尾語のマーカをタイプする。 加えて、ユーザは、先に開示した変換方法を実行した後に音声入力方法を処理 することによって、音声認識システムを装備したコンピュータに、所定の文字を 簡単に入力することも可能である。音声入力方法は、以下のステップから成る。 (1)変換方法によって作成した代用単語の接頭語を発音する。 (2)適用可能であれば、接頭語のマーカを発音する。 (3)代用単語の分離マークを発音する。 (4)代用単語の接尾語を発音する。 (5)適用可能であれば、接尾語のマーカを発音する。 図10ないし図13を参照すると、代用単語によって、中国語、日本語および 韓国語で用いられる筆記中国語即ち漢字の1組の多音節語彙、句または文を、1 組の一意のコード(USC:unique set of codes)である代用句または文を利用 する簡略化方法によってキー入力する。 1組の一意のコード(USC)は、句または文を正確に表すための頭字語、ラ ベルおよびマーカから成るアルファベットの1群であり、ここで頭字語は、所与 の句または文における複数の漢字を表す複数の代用単語の接尾語の短縮を意味し 、ラベルは、前述の所与の句または文における複数の漢字を表す複数の代用単語 の接頭語の短縮を意味する。更に、マーカは、頭字語またはラベルの最後のアル ファベットの繰り返しまたは複数回の繰り返しのことである。 複数の非音標文字から成る一意の代用句または文は、以下のステップによって 得ることができる。 (a)非音標文字の発音にしたがって、句の各非音標文字をアルファベット化 し、当該非音標文字の代用単語に対する綴字接頭語を形成する。 (b)句の各非音標文字の各接頭語から、最初または最後のアルファベットを 選択し、句の各音標文字の各接頭語の選択したアルファベットを集合化し、代用 単語の頭字語を形成する。 通常、非音標文字は、非音標文字の音標部首の発音で発音する。4文字より多 い中国語の句または文の殆どでは、先の2つのステップによって得られる、代用 句または文の頭字語を単にコンピュータにキー入力するだけで、特定の句または 文を得ることができる。なおもいくつかの同音異議句または文が発生する場合、 頭字語の最後のアルファベットをマーカとして繰り返す追加のステップを処理す ることができる。 漢字4文字以上の句または文では、頭字語の最後のアルファベットをマーカと して単純に繰り返すことが、同音異義頭字語を互いに分離するのに適当となり得 る。何故なら、長い句または文の同音意義頭字語である程、4文字未満で構成さ れた句よりも頻度が減るからである。 漢字4文字未満の句については、以下のような追加のステップを処理しなけれ ばならない。 (c)非音標文字の象形/表意部首の発音または象形/表意部首の発音の短縮 形に応じて、句の各非音標文字の象形/表意部首をアルファベット化し、非音標 文字の綴字接尾語を形成する。 (d)各非音標文字の接尾語の最初または最後のアルファベットを集合化し、 代用句のラベルを形成する。 (e)頭字語およびラベルを共に結合し、図10ないし図13の列6に示すよ うな、一意の代用句を形成する。 代用句をコンピュータに入力することにより、通常、正確な句または文を文字 で得ることができる。しかしながら、代用句の頭字語およびラベルの誤解を防ぐ ために、頭字語やラベルをPinyinシステムにしたがって英語形式のアルファベッ トで発音する場合、頭字語を大文字のアルファベットでキー入力し、ラベルを小 文字のアルファベットでキー入力することができる。勿論、頭字語を小文字でキ ー入力し、ラベルを大文字でキー入力することも可能である。 かかる代用句でも特定の句または文を表す1組の一意のコードを未だ生成する ことができない場合、1組の一意のコード(USC)を作成するまで、以下のス テップを処理することができる。 (f)ラベルの最後のアルファベットをマーカとして繰り返す。 基本的に、頭字語およびラベルは、Zhuyin Zimu、平仮名、カタカナまたはハ ングルによって発音することも可能である。本実施形態によれば、ラベルの前に 頭字語をキー入力する。また、頭字語の前にラベルを置き、次いで頭字語の最後 のアルファベットをマーカとして繰り返すことも可能である。 あるいは、前述のステップ(e)を、頭字語の各アルファベットの前にラベル の各アルファベットを置くステップ(e’)、またはラベルの各アルファベット の前に頭字語の各アルファベットを置くステップ(e”)と交換することもでき る。例えば、前述のように代用句を「ABCDEstuvw」または「STUVWabcde」として 形成する代わりに、頭字語「ABCDE」およびラベル「stuew」を有する場合、「Sa TbUcVdWe」または「AsBtCuDvEw」というように、代替代用句を作成することがで きる。 本発明に基づくソフトウエアを用いれば、丁度英単語を処理するように、画面 上で中国語、日本語および韓国語の一般的に用いられる句全てを正確に生成する ことができる。新たに作成した世間一般の句または文について、タイピストは、 それらに新たな一意の代用句をそれぞれ作成することができる。更に、従来の音 声認識ソフトウエアを用いて、コンピュータがアルファベットの発音を理解する のを補助することにより、代用句を音声入力することができる。句の入力を開始 することをコンピュータに知らせた後、ユーザは、アルファベットの大文字およ び小文字を含む、1組の一意のコード(代用句)を読み始め、句を入力すること ができる。すると、コンピュータは、音声を漢字に変換することができる。 前述の頭字語を作成する順序を決めるために、変更した別の方法があることは 、述べるに値しよう。これらは、句または文のいずれかの文字の接頭語または接 尾語のいずれかのアルファベットを基準にすることができる。以下にいくつかの 例を示す。 1.自国のアルファベットの順序では、 A.句または文の最初の漢字の接頭語の最初のアルファベット、または B.句または文の最初の漢字の接頭語の最後のアルファベット、または C.句または文の最後の漢字の接頭語の最初のアルファベット、または D.句または文の最後の漢字の接頭語の最後のアルファベット、または E.句または文の最初の漢字の接尾語の最後のアルファベット、または F.句または文の最後の漢字の接尾語の最後のアルファベット。 2.ラテン形式のアルファベットを用いてUSCを作成する場合、先の全て、 および前述の頭字語に対する英語のアルファベットの順序も同様に用いることが できる。 3.順序は、句または文のいずれかの文字に含まれる部首の1つのストローク 数またはいずれかの文字のストローク数に基づくことができる。例えば、以下の 多数のストロークをこの目的のために用いることができる。 A.句または文の最初の中国語即ち漢字、または B.句または文の最後の漢字、または C.句または文の最初の文字の象形/表意部首、または D.句または文の最後の文字の象形/表意部首、または E.句または文の最初の文字の音標部首、または F.句または文の最後の文字の音標部首。 これ以外に、実際には、ラベルは、句のいずれかの文字の接頭語または接尾語 のいずれかのアルファベットとすることができる。例えば、以下の1つをラベル として用いることができる。 A.句または文の最初の文字の接頭語の最初のアルファベット、 B.句または文の最初の文字の接頭語の最後のアルファベット、 C.句または文の最初の文字の接尾語の最初のアルファベット、 D.句または文の最初の文字の接尾語の最後のアルファベット、 E.句または文の最後の文字の接頭語の最初のアルファベット、 F.句または文の最後の文字の接頭語の最後のアルファベット、 G.句または文の最後の文字の接尾語の最初のアルファベット、 H.句または文の最後の文字の接尾語の最後のアルファベット。 また、ラベルは、句または文内のいずれかの文字のストローク数、あるいはそ の部首の1つとすることができる。 好ましいラベルは、接頭語の最初のアルファベットの規則的な形態で作る。何 故なら、これはタイピストの思考の順序と共に流れるからである。また、ラベル は常に小文字のアルファベットとし、一方頭字語自体は常に大文字のアルファベ ットとする。この構成によって、コンピュータだけでなく、人の側の混乱も避け ることができる。文字の綴字は常に小文字のアルファベットなので、キーボード 上の「シフト」キーは、ユーザが句または文を入力しようとしていることを、コ ンピュータに知らせる信号として機能する。 実際、代用句の理論は、インド語のある種の方言のように、同音異義語の問題 があるいずれの言語にも適用可能である。 この場合も、非音標文字の所定の句または文は、ある言語の句の複数の非音標 文字を前述のような代用句に変換するための変換方法を実行した後に、手入力方 法を処理することによって、コンピュータに入力可能である。 この手入力方法は、以下のステップから成る。 (1)変換方法で作成した代用句または文をタイプする。 (2)適用可能であれば、代用句または文のマーカをタイプする。 また、コンピュータに音声認識システムが装備されている場合、ユーザは、先 に開示した変換方法を実行した後に、音声入力方法を処理することによって、所 定の句または文をコンピュータに単純に入力することも可能である。音声入力方 法は、以下のステップから成る。 (1)変換方法によって作成し、適用可能であればアルファベットの大文字お よび小文字を含む代用句または文を、1アルファベットずつ、発音する。 (2)適用可能であれば、代用句または文のマーカを発音する。 受信側に代用単語およびUSCを解釈できる同じソフトウエアが1本インスト ールされていれば、これらの代用単語および代用句(1組の一意のコード(US C))を用いて、中国語文字から成る文書を、インターネットを通じたE−メー ルまたはその他の同様のメディアによって送ることができる。実際には、代用単 語およびUSCの恩恵を受けずに生成した文書は、インターネット・プロトコル と完全な適合性がない。何故なら、文字の1つ1つを表すために2バイトを必要 とするのに対し、インターネットは一度に1バイト(実際には7ビット)しか認 識しないからである。これは、漢字の膨大な数によるものであり、これら全てを 表現するには1バイトでは適当でないからである。1バイトで表現可能な最大数 は256であり、これは、英語のアルファベット、句読点および数の全てを網羅 するには十分な数である。数千もの漢字に対処するには、4桁以上の数を構成す るために2バイトが必要となる。この矛盾のために、この種の文章はインターネ ット・プロトコルとの相性が悪い。この非適合性を有する文章は、インターネッ トを通過した後、「掻き混ぜ」られて認識できない可能性がある。しかしながら 、これらの文章の内容を、代用単語または代用句(USC)の形態でE−メール を通じて送れば、これらは無傷でその宛先に到達する。何故なら、インターネッ ト・プロトコルは、代用単語および句を、インターネットと完全に適合性がある 英語として処理するからである。 先に開示した非音標文字を代用単語に変換する方法に基づいて、象形/表示部 首を代用単語の接頭語として用いることにより、子供が中国語即ち漢字文字を容 易に暗記するための補助プロセスを確立することができる。あらゆる文字は象形 /表意部首を有するか、あるいは象形または表意部首のみで構成されている(多 くの象形/表意部首自体が文字である)ので、象形/表意部首は、文字を記憶す るための非常に重要な役割を担っている。一旦ある文字の象形/表意部首を認識 したなら、その文字の意味または形状を理解することができる。これは、中国語 即ち漢字の重要な構造および特徴である。更に、視覚画像は、記憶が最も容易な ものである。 言い換えると、あらゆる象形/表意部首は、視覚的な図によって示すことがで き、ユーザにとっては一層簡単にしかもすんなりと(familiarly)記憶できる。例 えば、図14に示すように、「mu」と発音し音標単語「eye」の意味を有する「 目」は、目の絵で示すことができる。「mu」と発音し音標文字「wood」の意味を 有する「木」は、緑の木の絵で示すことができる。「shen」と発音し、音標文字 「body」の意味を有する「身」は、人の身体の絵で示すことができる。「gu」と 発音し音標文字「bone」の意味を有する「骨」は、骨の絵で示すことができる。 つまり、各象形/音標部首は一意の意味を有するので、各象形/表意部首の意 味の綴字も、代用単語の接頭語のアルファベット化した綴字として用いることが できる。例えば、「目」に対して「eye」、「木」に対して「tree」、「身」に 対 して「body」、および「骨」に対して「bone」がある。したがって、例えば、中 国語文字の代用単語では、 「眠」(「sleep」を意味する)は「eye-mian」であり、「根」(「root」を 意 あるいは、214個の部首を表す214個の異なる絵画状で有色のアイコンを それぞれ指定し、コンピュータにプログラムすることも可能である。したがって 、ユーザは、コンピュータのマウスを用いて、所望のアイコン上で正確にクリッ クし、代用単語の接頭語を入力することができる。 これら絵画的アイコンの指定は、ユーザまたは学生が象形/表意部首を記憶す るのを助けるという追加の機能も有する。ユーザに象形/表意部首の綴字を思い 出させるために、各象形/表意部首の発音の綴字も、それを表す絵画的アイコン の次に示すことができる。 したがって、前述の変換方法の基本ステップに、記憶プロセスを追加すること が可能である。このプロセスは次のステップから成る。 (a)ある言語の非音標文字の象形/表意部首を表す一意のコードを割り当て 、この一意のコードを代用単語の接頭語として用いる。 (b)非音標文字の発音にしたがって、各言語の非音標文字をアルファベット 化し、代用単語に対する綴字接尾語を形成する。 (c)接頭語および接尾語を共に結合し、各言語の非音標文字を表す代用単語 を構成する。 記憶プロセスは、先のステップ(c)の後に追加する以下のステップから成る 。 (d1)代用単語の接頭語が表す象形/表意部首の意味を表す視覚画像によっ て、接頭語を示す。 (d2)対応する意味の視覚画像によって、非音標文字の意味を示す。 (d3)接頭語の視覚画像を、視覚画像を意味する文字と結合する。 実際には、ビデオ・テープのような動画補助具(animated visual aids)を用い 、どのようにして視覚画像がある中国語文字に、そして象形文字に変換され、更 にそれらがカラー・コード化されたかを記述することができる。表意文字がどの よ うにして派生したかを説明するためにも、同じことを行うことができる。これは 、p/i部首を学生の頭に確実に擦り込むことができる。 一旦学生が各p/i部首を理解したなら、各p/i部首に基づく文字は、以下 のように示すことができる。 1.ビデオを用いて、動詞が記述する動作を示す。 2.静止画像を用いて、名詞が記述する物体を示す。 一例として、「火」(「huo」(fire))を用いる。 最初に、ビデオが、オレンジ−赤色の焚火(bond fire)を囲んで座っている1 群の人々を示す。次いで、焚火の近接画像を示す。次に、ビデオは、うなる火の 炎を示して「huo」の発音を真似たノイズを発し、踊りながら同じオレンジ−赤 色を有する文字「火」の形状を形成する。ビデオは、代書人(calligrapher)がど のようにして画像の込み入ったエッジ(fussy edges)を滑らかにするかを示し、 それに同じ色を有する「火」として、現在の形を与える。次に、文字の右半分を 縮小し、同じオレンジ−赤色で、象形部首としてこの文字をどのように使用でき るかを示す。 ビデオは、オレンジ−赤色の火の上で、食べ物を掻き混ぜ炒めている女を示し 、ノイズを出して、「chao」を真似た鉄のへらを、文字「炒」(中国語でchaoと 発音する)と共に示し、その象形部首「火」をオレンジ−赤色とすることができ i部首はオレンジ−赤色のまま残しておくことができる。 色のみでは効果的に表現できないような部首については、この種の部首のスト ロークを「中空」にすることができる。即ち、ストロークを黒インクでなぞるが 、残りの部分を空白のまま残しておく。次に、部首が表す対象の小さいが視覚的 に識別可能な有色画像を用いて、空白の空間を埋めることができる。勿論、これ らの画像は、静止画像としておき、部首を説明するために用いなければならない 。例えば、「骨」(gu(bone))は、骨の小さな画像で満たした輪郭だけで示すこ とができる。部首の部分的なリストおよびその図示方法を図1に示す。このリス トは、部首を容易に認識しかつ思い出せるようにするには何をすればよいかを示 そうとしたものである。 残りの部首は、有形の物体に関係する場合、同様に図示することができる。無 形の概念に関係する部首もいくつかある。これら無形の部首は、最初にストロー ク内に「空白の空間」を有するように、輪郭を描くことができる。次いで、自国 のアルファベットによるその発音を、空白の空間内に入力することができる。 図面では、「図示の方法」と呼ぶ列がある。この列では、単語「picture」( 画像)は、この節で先に述べた、「小さいが視覚的に識別可能な有色画像」を意 味する。当該列では、大部分が特定の色について述べている。色について述べて いない場合、部首に関連する物体の自然な色を用いる。 前述の例は全て中国語の発音としたが、これらは、日本語や韓国語のような、 他のあらゆる言語にも適用可能であることは明白である。なすべきことは、中国 語の発音を、選択した言語、例えば、日本語または韓国語の発音と交換すること である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(KE,LS,MW,SD,S Z,UG),EA(AM,AZ,BY,KG,KZ,MD ,RU,TJ,TM),AL,AM,AT,AU,AZ ,BB,BG,BR,BY,CA,CH,CN,CZ, DE,DK,EE,ES,FI,GB,GE,HU,I S,JP,KE,KG,KP,KR,KZ,LK,LR ,LS,LT,LU,LV,MD,MG,MK,MN, MW,MX,NO,NZ,PL,PT,RO,RU,S D,SE,SG,SI,SK,TJ,TM,TR,TT ,UA,UG,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.非音標文字を代用単語に変換し、コンピュータに入力する方法であって、 (a)ある言語の非音標文字の象形/表示部首を表す一意のコードを割り当て 、該一意のコードを、代用単語の接頭語として用いるステップと、 (b)前記各言語の前記非音標文字を、前記非音標文字の発音にしたがってア ルファベット化し、前記代用単語に対する綴字接尾語を形成するステップと、 (c)前記接頭語と前記接尾語を共に結合し、前記各言語の前記非音標文字を 表す前記代用単語を構成するステップと、 から成る方法。 2.ステップ(a)において、前記代用文字の前記接頭語の前記一意のコードが 数値コードである請求項1記載の非音標文字を代用単語に変換しコンピュータに 入力する方法。 3.ステップ(a)において、前記代用単語の前記接頭語の前記一意のコードが 、前記象形/表意部首の意味を有する音標単語のアルファベット綴字である請求 項1記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 4.ステップ(a)において、前記代用単語の前記接頭語の前記一意のコードが 、前記象形/表意部首の発音のアルファベット綴字である請求項1記載の非音標 文字を代用単語に変換しコンピュータに入力する方法。 5.ステップ(a)において、前記代用単語の前記接頭語の前記一意のコードが 、前記象形/表意部首の発音のアルファベット綴字の短縮形態である請求項1記 載の非音標文字を代用単語に変換しコンピュータに入力する方法。 6.前記代用単語の前記接頭語の前記短縮形態は、前記象形/表意部首の前記発 音の子音である請求項5記載の非音標文字を代用単語に変換しコンピュータに入 力する方法。 7.前記代用単語の前記接頭語の前記短縮形態は、前記象形/表意部首の前記発 音の前記アルファベット綴字の第1アルファベットである請求項5記載の非音標 文字を代用単語に変換しコンピュータに入力する方法。 8.前記代用単語の前記接頭語の前記短縮形態は、前記象形/表意部首の前記発 音の前記アルファベット綴字の最後のアルファベットである請求項5記載の非音 標文字を代用単語に変換しコンピュータに入力する方法。 9.ステップ(b)において、前記文字の音標部首を発音し前記代用単語の前記 接尾語を形成することによって、前記各言語の前記文字をアルファベット化する 請求項1記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 10.ステップ(c)において、更に、前記接尾語の声を、該接尾語の前記綴字 の終端に位置する標識として、所定の子音で示す、第1の追加ステップを含む請 求項1記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 11.ステップ(c)において、更に、前記接頭語および前記接尾語の声を、該 接頭語および該接尾語の前記綴字の終端に位置する標識として、それぞれ所定の 子音で示す、第1の追加ステップを含む請求項4記載の非音標文字を代用単語に 変換しコンピュータに入力する方法。 12.前記接頭語および前記接尾語の第1声は標識を有さず、前記接頭語および 前記接尾語の第2声は第2の子音によって示され、前記接頭語および前記接尾語 の第3声は第3子音によって示され、前記接頭語および前記接尾語の第4声は第 4子音によって示される請求項11記載の非音標文字を代用単語に変換しコンピ ュータに入力する方法。 13.前記ステップ(c)の後に、更に、前記綴字代用単語の前記接頭語の最後 のアルファベットおよび前記接尾語の最後のアルファベットの後に、少なくとも 1つのマーカをそれぞれ追加し、同音異義文字を区別する追加ステップを含む請 求項1記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 14.前記ステップ(c)の後に、更に、前記綴字代用単語の前記接頭語の最後 のアルファベットおよび前記接尾語の最後のアルファベットの後に、少なくとも 1つのマーカをそれぞれ追加し、同音異義文字を区別する追加ステップを含む請 求項12記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 15.ステップ(c)において、更に、前記接頭語および前記接尾語を分離マー クで分離する追加ステップを含む請求項1記載の非音標文字を代用単語に変換し コンピュータに入力する方法。 16.ステップ(c)において、更に、前記接頭語および前記接尾語を分離マー クで分離する追加ステップを含む請求項12または14記載の非音標文字を代用 単語に変換しコンピュータに入力する方法。 17.ステップ(c)の後に、更に、 (d1)前記接頭語が表す前記象形/表意部首の意味を表す視覚画像によって 、前記代用単語の前記接頭語を図示するステップと、 (d2)対応する意味の視覚画像によって、前記非音標の意味を図示するステ ップと、 (d3)前記接頭語の視覚画像を前記文字の意味の視覚画像と組み合わせるス テップと、 を含む請求項1記載の非音標文字を代用単語に変換しコンピュータに入力する方 法。 18.前記接頭語の綴字、次いで前記接尾語の綴字をコンピュータに入力するこ とによって、前記代用単語の各々をコンピュータに入力する請求項1記載の非音 標文字を代用単語に変換しコンピュータに入力する方法。 19.ステップ(c)の後、更に、代用単語を前記コンピュータにタイプ入力す ることによって、前記非音標文字を前記コンピュータに入力する入力方法を備え る、請求項1、13または15記載の非音標文字を代用単語に変換しコンピュー タに入力する方法。 20.前記入力方法が、(1)前記代用単語の前記接頭語を前記コンピュータに タイプ入力するステップと、(2)前記代用単語の前記接尾語を前記コンピュー タにタイプ入力するステップと含む請求項19記載の非音標文字を代用単語に変 換しコンピュータに入力する方法。 21.ステップ(c)の後に、更に、前記代用単語を発音して前記コンピュータ の音声認識システムに入力することにより、前記非音標文字を前記コンピュータ に入力する入力方法を備える、請求項1、13または15記載の非音標文字を代 用単語に変換しコンピュータに入力する方法。 22.前記入力方法が、(1)前記代用単語の前記接頭語を発音して前記コンピ ュータの音声認識システムに入力するステップと、(2)前記代用単語の前記接 尾語を発音して前記コンピュータの前記音声認識システムに入力するステップと を含む請求項21記載の非音標文字を代用単語に変換しコンピュータに入力する 方法。 23.非音標文字を代用単語に変換し、コンピュータに入力する方法であって、 (a)ある言語の非音標文字の発音にしたがって、当該音標文字をアルファベ ット化し、代用単語の綴字接頭語を形成するステップと、 (b)前記各言語の前記非音標文字の象形/表意部首を表す一意のコードを割 り当て、該一意のコードを前記代用単語の接尾語として用いるステップと、 (c)前記接頭語と前記接尾語とを共に結合し、前記各言語の前記文字を表す 前記代用単語を構成するステップと、 から成る方法。 24.ステップ(b)において、前記代用文字の前記接尾語の前記一意のコード が数値コードである請求項23記載の非音標文字を代用単語に変換しコンピュー タに入力する方法。 25.ステップ(b)において、前記代用単語の前記接尾語の前記一意のコード が、前記象形/表意部首の意味を有する音標単語のアルファベット綴字である請 求項23記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 26.ステップ(b)において、前記代用単語の前記接尾語の前記一意のコード が、前記象形/表意部首の発音のアルファベット綴字である請求項23記載の非 音標文字を代用単語に変換しコンピュータに入力する方法。 27.ステップ(b)において、前記代用単語の前記接尾語の前記一意のコード が、前記象形/表意部首の発音のアルファベット綴字の短縮形態である請求項2 3記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 28.前記代用単語の前記接尾語の前記短縮形態は、前記象形/表意部首の前記 発音の子音である請求項27記載の非音標文字を代用単語に変換しコンピュータ に入力する方法。 29.前記代用単語の前記接尾語の前記短縮形態は、前記象形/表意部首の前記 発音の前記アルファベット綴字の第1アルファベットである請求項27記載の非 音標文字を代用単語に変換しコンピュータに入力する方法。 30.前記代用単語の前記接尾語の前記短縮形態は、前記象形/表意部首の前記 発音の前記アルファベット綴字の最後のアルファベットである請求項27記載の 非音標文字を代用単語に変換しコンピュータに入力する方法。 31.ステップ(a)において、前記文字の音標部首を発音し前記代用単語の前 記接頭語を形成することによって、前記各言語の前記文字をアルファベット化す る請求項23記載の非音標文字を代用単語に変換しコンピュータに入力する方法 。 32.ステップ(c)において、更に、前記接尾語の声を、該接尾語の前記綴字 の終端に位置する標識として、所定の子音で示す、第1の追加ステップを含む請 求項23記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 33.ステップ(c)において、更に、前記接頭語および前記接尾語の声を、該 接頭語および該接尾語の前記綴字の終端に位置する標識として、それぞれ所定の 子音で示す、第1の追加ステップを含む請求項26記載の非音標文字を代用単語 に変換しコンピュータに入力する方法。 34.前記接頭語および前記接尾語の第1声は標識を有さず、前記接頭語および 前記接尾語の第2声は第2の子音によって示され、前記接頭語および前記接尾語 の第3声は第3子音によって示され、前記接頭語および前記接尾語の第4声は第 4子音によって示される請求項33記載の非音標文字を代用単語に変換しコンピ ュータに入力する方法。 35.前記ステップ(c)の後に、更に、前記綴字代用単語の前記接頭語の最後 のアルファベットおよび前記接尾語の最後のアルファベットの後に、少なくとも 1つのマーカをそれぞれ追加し、同音異義文字を区別する追加ステップを含む請 求項23記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 36.前記ステップ(c)の後に、更に、前記綴字代用単語の前記接頭語の最後 のアルファベットおよび前記接尾語の最後のアルファベットの後に、少なくとも 1つのマーカをそれぞれ追加し、同音異義文字を区別する追加ステップを含む請 求項34記載の非音標文字を代用単語に変換しコンピュータに入力する方法。 37.ステップ(c)において、更に、前記接頭語および前記接尾語を分離マー クで分離する追加ステップを含む請求項23記載の非音標文字を代用単語に変換 しコンピュータに入力する方法。 38.ステップ(c)において、更に、前記接頭語および前記接尾語を分離マー クで分離する追加ステップを含む請求項34または36記載の非音標文字を代用 単語に変換しコンピュータに入力する方法。 39.ステップ(c)の後に、更に、 (d1)前記接頭語が表す前記象形/表意部首の意味を表す視覚画像によって 、前記代用単語の前記接頭語を図示するステップと、 (d2)対応する意味の視覚画像によって、前記非音標の意味を図示するステ ップと、 (d3)前記接頭語の視覚画像を前記文字の意味の視覚画像と組み合わせるス テップと、 を含む請求項23記載の非音標文字を代用単語に変換しコンピュータに入力する 方法。 40.前記接頭語の綴字、次いで前記接尾語の綴字をコンピュータに入力するこ とによって、前記代用単語の各々をコンピュータに入力する請求項23記載の非 音標文字を代用単語に変換しコンピュータに入力する方法。 41.ステップ(c)の後、更に、代用単語を前記コンピュータにタイプ入力す ることによって、前記非音標文字を前記コンピュータに入力する入力方法を備え る、請求項23、35または37記載の非音標文字を代用単語に変換しコンピュ ータに入力する方法。 42.前記入力方法が、(1)前記代用単語の前記接頭語を前記コンピュータに タイプ入力するステップと、(2)前記代用単語の前記接尾語を前記コンピュー タにタイプ入力するステップと含む請求項41記載の非音標文字を代用単語に変 換しコンピュータに入力する方法。 43.ステップ(c)の後に、更に、前記代用単語を発音して前記コンピュータ の音声認識システムに入力することにより、前記非音標文字を前記コンピュータ に入力する入力方法を備える、請求項23,25または37記載の非音標文字を 代用単語に変換しコンピュータに入力する方法。 44.前記入力方法が、(1)前記代用単語の前記接頭語を発音して前記コンピ ュータの音声認識システムに入力するステップと、(2)前記代用単語の前記接 尾語を発音して前記コンピュータの前記音声認識システムに入力するステップと を含む請求項43記載の非音標文字を代用単語に変換しコンピュータに入力する 方法。 45.ある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力す る方法であって、 (a)各前記非音標文字の発音にしたがって前記句の前記非音標文字をアルフ ァベット化し、各前記非音標文字の代用単語に対する綴字接頭語を形成するステ ップと、 (b)前記句の各前記非音標文字の各前記接頭語から所定のアルファベットを 選択し、前記複数の選択したアルファベットを集合化して、前記代用句の頭字語 を形成するステップと、 (c)前記句の各前記非音標文字の象形/表意部首の発音にしたがって、各前 記非音標文字の前記象形/表意部首をアルファベット化し、前記句の前記非音標 文字の綴字接尾語を形成するステップと、 (d)前記句の各前記非音標文字の各前記接尾語から所定のアルファベットを 選択し、前記句の前記非音標文字の前記接尾語の前記複数の選択したアルファベ ットを集合化して、前記代用句のラベルを形成するステップと、 (e)前記頭字語および前記ラベルを互いに結合し、前記代用句を形成するス テップと、 から成る方法。 46.ステップ(e)において、前記頭字語を前記ラベルの前に置き、前記代用 句を形成する請求項45記載のある言語の句の複数の非音標文字を代用句に変換 しコンピュータに入力する方法。 47.ステップ(e)において、前記ラベルを前記頭字語の前に置き、前記代用 句を形成する請求項45記載のある言語の句の複数の非音標文字を代用句に変換 しコンピュータに入力する方法。 48.ステップ(e)において、前記ラベルの各前記アルファベットを前記頭字 語の各前記アルファベットよりも前に置き、前記代用句を形成する請求項45記 載のある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力する 方法。 49.ステップ(e)において、前記頭字語の各前記アルファベットを前記ラベ ルの各前記アルファベットよりも前に置き、前記代用句を形成する請求項45記 載のある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力する 方法。 50.ステップ(d)において、前記句の各前記非音標文字の各前記接尾語から 第1アルファベットを選択し、前記代用句の前記ラベルを形成する請求項45記 載のある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力する 方法。 51.ステップ(d)において、前記句の各前記非音標文字の各前記接尾語から 最後のアルファベットを選択し、前記代用句の前記ラベルを形成する請求項45 記載のある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力す る方法。 52.ステップ(e)の後、更に、前記ラベルの前記最後のアルファベットをマ ーカとして繰り返す、追加ステップ(f)を含む請求項45,50または51記 載のある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力する 方法。 53.ある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力す る方法であって、 (a)各前記非音標文字の発音にしたがって前記句の前記非音標文字をアルフ ァベット化し、各前記非音標文字の代用単語に対する綴字接頭語を形成するステ ップと、 (b)前記句の各前記非音標文字の各前記接頭語から所定のアルファベットを 選択し、前記複数の選択したアルファベットを集合化して、前記代用句の頭字語 を形成するステップと、 (c)前記句の各前記非音標文字の象形/表意部首の発音の短縮形をアルファ ベット化し、前記句の前記非音標文字の綴字接尾語を形成するステップと、 (d)前記句の各前記非音標文字の各前記接尾語から所定のアルファベットを 選択し、前記句の前記非音標文字の前記接尾語の前記複数の選択したアルファベ ットを集合化して、前記代用句のラベルを形成するステップと、 (e)前記頭字語および前記ラベルを互いに結合し、前記代用句を形成するス テップと、 から成る方法。 54.ステップ(e)において、前記頭字語を前記ラベルの前に置き、前記代用 句を形成する請求項53記載のある言語の句の複数の非音標文字を代用句に変換 しコンピュータに入力する方法。 55.ステップ(e)において、前記ラベルを前記頭字語の前に置き、前記代用 句を形成する請求項53記載のある言語の句の複数の非音標文字を代用句に変換 しコンピュータに入力する方法。 56.ステップ(e)において、前記ラベルの各前記アルファベットを前記頭字 語の各前記アルファベットよりも前に置き、前記代用句を形成する請求項53記 載のある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力する 方法。 57.ステップ(e)において、前記頭字語の各前記アルファベットを前記ラベ ルの各前記アルファベットよりも前に置き、前記代用句を形成する請求項53記 載のある言語の句の複数の非音標文字を代用句に変換しコンピュータに入力する 方法。 58.ステップ(e)の後、更に、前記ラベルの前記最後のアルファベットをマ ーカとして繰り返す、追加ステップ(f)を含む請求項53記載のある言語の句 の複数の非音標文字を代用句に変換しコンピュータに入力する方法。
JP52133498A 1996-11-05 1996-12-10 非音標文字を代用単語に変換しコンピュータに入力する方法 Pending JP2002516004A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/744,021 US5903861A (en) 1995-12-12 1996-11-05 Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer
US08/744,021 1996-11-05
PCT/US1996/019780 WO1998020429A1 (en) 1996-11-05 1996-12-10 Method for converting non-phonetic characters into surrogate words for inputting into a computer

Publications (1)

Publication Number Publication Date
JP2002516004A true JP2002516004A (ja) 2002-05-28

Family

ID=24991115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52133498A Pending JP2002516004A (ja) 1996-11-05 1996-12-10 非音標文字を代用単語に変換しコンピュータに入力する方法

Country Status (6)

Country Link
EP (1) EP1012745A1 (ja)
JP (1) JP2002516004A (ja)
KR (1) KR20000053095A (ja)
AU (1) AU1462097A (ja)
CA (1) CA2270956A1 (ja)
WO (1) WO1998020429A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8862988B2 (en) 2006-12-18 2014-10-14 Semantic Compaction Systems, Inc. Pictorial keyboard with polysemous keys for Chinese character output
US11017771B2 (en) 2019-01-18 2021-05-25 Adobe Inc. Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets
DE102019007797B4 (de) 2019-01-18 2023-11-30 Adobe Inc. Abgleichen von Stimmbefehlen während des Testens von stimmunterstützten App-Prototypen für Sprachen mit nichtphonetischen Alphabeten

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57501254A (ja) * 1980-08-01 1982-07-15
US5164900A (en) * 1983-11-14 1992-11-17 Colman Bernath Method and device for phonetically encoding Chinese textual data for data processing entry
GB2157864B (en) * 1984-03-07 1987-09-23 Hing Sun Chan A method of coding chinese characters according to phonetic transcriptions
EP0271619A1 (en) * 1986-12-15 1988-06-22 Yeh, Victor Chang-ming Phonetic encoding method for Chinese ideograms, and apparatus therefor
US5175803A (en) * 1985-06-14 1992-12-29 Yeh Victor C Method and apparatus for data processing and word processing in Chinese using a phonetic Chinese language
US4951202A (en) * 1986-05-19 1990-08-21 Yan Miin J Oriental language processing system

Also Published As

Publication number Publication date
AU1462097A (en) 1998-05-29
KR20000053095A (ko) 2000-08-25
CA2270956A1 (en) 1998-05-14
EP1012745A1 (en) 2000-06-28
WO1998020429A1 (en) 1998-05-14

Similar Documents

Publication Publication Date Title
US6292768B1 (en) Method for converting non-phonetic characters into surrogate words for inputting into a computer
US5903861A (en) Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer
McGuinness Early reading instruction: What science really tells us about how to teach reading
Sampson Writing systems
D. Becker Multilingual word processing
US20120259614A1 (en) Transliterating methods between character-based and phonetic symbol-based writing systems
KR20070024498A (ko) 언어 교습방법
Kessler et al. Writing systems: Their properties and implications for reading
CN110442839A (zh) 英语文本的拼读标注方法、拼读方法、存储介质和电子设备
WO2005022296A2 (en) Method and system for mutely communication in a spoken language
WO2000060560A1 (en) Text processing and display methods and systems
RU2470354C2 (ru) Способ изучения системы письма китайскими иероглифами и основанных на китайских иероглифах систем письма других языков
Sproat English among the writing systems of the world 1
KR101831717B1 (ko) 중국어 학습방법 및 그 기록매체
CN105045410A (zh) 一种形式化拼音和汉字对应识别的方法
JP2002516004A (ja) 非音標文字を代用単語に変換しコンピュータに入力する方法
Helms-Park et al. From proto-writing to multimedia literacy: Scripts and orthographies through the ages
Cruttenden Writing systems and phonetics
KR100351585B1 (ko) 파자방식에 의한 한자 입력방법
Sproat Writing Systems
JP2002535768A (ja) 漢字入力のための方法および装置
CN104598046A (zh) 首音码汉字输入法
Hosken Creating an orthography description
KR20060021721A (ko) 외국어 단어의 한글 표기와 이를 통한 사전 검색 방법
CN114185441A (zh) 全部汉词简易无重码普适输入法