JP6069211B2 - テキスト変換及び表現システム - Google Patents

テキスト変換及び表現システム Download PDF

Info

Publication number
JP6069211B2
JP6069211B2 JP2013541155A JP2013541155A JP6069211B2 JP 6069211 B2 JP6069211 B2 JP 6069211B2 JP 2013541155 A JP2013541155 A JP 2013541155A JP 2013541155 A JP2013541155 A JP 2013541155A JP 6069211 B2 JP6069211 B2 JP 6069211B2
Authority
JP
Japan
Prior art keywords
word
phoneme
encoded
words
rendering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013541155A
Other languages
English (en)
Other versions
JP2014504398A (ja
Inventor
クリストファー コリン スティーブン、
クリストファー コリン スティーブン、
アン エリザベス フィッツ、
アン エリザベス フィッツ、
Original Assignee
アクセシブル パブリッシング システムズ プロプライアタリー リミテッド
アクセシブル パブリッシング システムズ プロプライアタリー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2010905304A external-priority patent/AU2010905304A0/en
Application filed by アクセシブル パブリッシング システムズ プロプライアタリー リミテッド, アクセシブル パブリッシング システムズ プロプライアタリー リミテッド filed Critical アクセシブル パブリッシング システムズ プロプライアタリー リミテッド
Publication of JP2014504398A publication Critical patent/JP2014504398A/ja
Application granted granted Critical
Publication of JP6069211B2 publication Critical patent/JP6069211B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

本願発明は、一般に、テキスト変換及び表現に関し、特に、英語テキストを読み易さを支援するように適合されたフォーマットに変換するためのシステム及び方法に関する。
読むことは現代の生活に不可欠な技能である。文章を思考により意味のあるものに変換する能力によって、場所又は時間的に離れた人々が互いに効率的に連絡することができる。教育を必要とせずに人生の早い段階で誰もが身につける「自然な」能力である話すこととは異なり、読み書きの能力は、集中して教育が行われる必要がある比較的最近発達した能力である。
英語等のアルファベット言語において、テキスト文字は、発話される音声の基本単位である音素を表す。音素は音節を構成し、音節は同様に単語を構成して、単語はグループ化されて意味を含む句及び文になる。アルファベット言語を読む最初の段階は音韻に関し、テキスト文字を復号して音素にすることを含む。音素はグループ化されて音節になり、音節は単語になる。この復号及びグループ化が完了すると、読み手には各単語が内部で「聞こえる」。これは、単語の意味を取得することによって単語を含む句を理解するために、脳の音声理解部分を活性化する。テキスト文字を音素に復号する能力は、「音素認識(phonemic awareness)」と名付けられている。研究によって、全ての言語グループの約20パーセントの人々は、主に脳の機能性に関する理由で、読むことを学習するときに音素認識を発達させることが困難であることが示されている。さらに上達してくると、読み手は、形状によって単語全体、及び句でさえも認識し始める。脳の視覚処理部分に関し、流暢に読むことを可能にする「視覚単語認識(sight word recognition)」として知られる機能である。音素認識を発達させることは、自分自身で読むことを練習することを可能にし、外部で発音されるよく知らない単語を聞き取る必要なく視覚単語認識を発達させることができる。ほとんどの学習者は、単語の復号を5回成功させた後で(人によっては10回以上それを見る必要がある)、視覚単語認識を発達させる。従って、視覚単語認識を発達させるには練習が不可欠である。
英語は、歴史的な理由により、音素綴り字法(phonemic orthography)、即ち、どのように単語が綴られるかとどのようにそれらが話されるかとの対応が比較的乏しいので、未熟な読み手に特有の問題を提起する。英語の綴り字法には二元的な多義性が存在する。第1に、多くの音素は一元的以上に綴られ得る(例えば、“me”という単語の中の長音“e”は 、“e”、“ey”、“ee”、“ei”、“ea”、“y”、又は “ie”とも綴ることもできる)。この多義性は、同じ発音であるが異なる綴りを有する同音異字の単語(例えば、“steel”及び“steal”)を生じさせるので、同音異字的多義性と呼ばれる。第2に、多くの文字及び文字の組み合わせ(又は書記素(grapheme))によって多くの音素が表される。例えば、“a”という書記素は、その「基本」音素、即ち書記素が最も頻繁に発音される音素(“at”の中の短音“a”)を表すことに加えて、少なくとも3つの他の音素(“ate”、“wash”、及び“about”等)を表す。これは、同じつづりを有するが異なって発音される同綴意義語(例えば、“cow”と韻が合う“bow”、及び“show”と韻が合う“bow”)を生じさせるので、同綴意義的多義性と呼ばれる。未熟な読み手に困難を提起するのは同綴意義的多義性である。ある概算によれば、標準的な英文の任意の一節の中の単語の半分以上は、基本音素以外の音素を表す書記素を含むという意味で、非音素表記的である。この割合は、固有名詞、例えば、“Chumley”と発音される“Cholmondeley”において更に大きくなる。熟練した読み手であっても、馴染みのない固有名詞を音素表記的に正確に復号するのには骨が折れる。このような単語を正確に読むことを学習するために、未熟な読み手は、文脈によってどのように音素が変化するかについて多くの場合一貫性がなく常に不完全な一連の規則を学習しようとする場合がある。代わりに、彼らは読むことの「視覚単語認識」段階に突き進む場合もある。こうした作業はいずれも多くの人にとって、特に大人に取っては面倒である。未熟な読み手が単語の音及び意味をまだ知らなければ、音素復号の作業はより困難になる。従って、通常の音素認識を有する子供又は大人であっても、高学歴の人よりは語彙が貧困であれば、最も単純な標準の英語テキスト以外の何かを音素表記的に復号するには骨が折れるであろう。
また、英語は、第2言語として何らかの形で英語を話す一方で読み書きができないという人の数が母語話者の数を大きく上回るという点でも独特である。また、特にアジアの国々において、文語英語を理解できるが、発音することができない多数の人達が存在する。このような人達は、母語である絵文字的言語でするように、視覚単語認識のみに依存する。
従って、母語話者の子供に加えて、英語の音素表記的な復号を学習するのを支援することによって恩恵を受ける多数の大人が存在する。
英語の綴りを改良して多義性を減らすことにより、文語英語をより音素表記的にしようとする多くの試みが行われてきた。こうした試みは2つの基本カテゴリに分類される。1つは既存のローマ字の中で作用するもの、もう1つは新しい文字又は既存の文字の変種を導入するものである。様々な理由により、こうした提案はいずれも広く採用されるには至ってない。既存のアルファベットの中で作用するものは、実質的な適合費用がかからないが、改良の努力を価値あるものにするほど十分に多義性を減らすことができない傾向がある。さらに、過去のバージョンの改良された英語を使用して読むように新たな読み手を教えることは、常に優勢であろう標準的な英語テキストを読むことをこうした読み手にとってより困難にする。
電子出版の到来により、カスタマイズフォーマットで文書、特に本を配布することが経済的に妥当になった。これまでは、あらゆる種類の読字困難性を持つ人達が読むことを支援するための「特殊フォーマット」は大きな活字の本に限定されていたが、今日では、あらゆる種類の読字困難性に適合するように様々な視認性支援フォーマットで本及び他の文書を作成及び配布することが可能になった。このようなフォーマットの例は、短い行、長い行間隔、単語及び行上のフォントサイズの等級、及び視標追跡ガイドライン等を含む。しかしながら、このようなフォーマットは、乏しい音素認識の特殊な読字困難性に、又は大人の英語非母語話者の要求に応えていない。
本願発明の目的は、既存の構成の1つ以上の不都合を実質的に克服し、又は少なくとも改良することである。
本発明の第1の態様によれば、コンピュータ装置でテキスト文書を音素表記的に符号化するコンピュータ実装方法が提供される。この方法は、前記テキスト文書における現在の単語を識別するステップと、前記現在の単語に基づいて、音素表記的に等価に符号化される単語を生成するステップであって、それぞれの現在の単語又は前記現在の単語の音節に対して、前記コンピュータ装置と通信するデータベースにおいて、既定の音素の組からの前記現在の単語又は前記現在の単語の音節と関連付けられる符号化された音素のシーケンスを参照することであって、前記シーケンスは前記現在の単語又は前記現在の単語において対応する音節と音素表記的に等価であり、前記音素の組における各音素は1つ以上の英単語において前記音素として発音される基本書記素であること、符号化された音素の前記シーケンスを使用して前記現在の単語又は前記現在の単語における各音節を変換することであって、変換された単語又は変換された音節のそれぞれは前記現在の単語又は前記現在の単語における音節の視覚的構造情報を保持すること、及び前記変換に基づいて、前記音素表記的に等価に符号化される単語を生成することを含むステップと、前記音素表記的に符号化されたテキスト文書内の現在の位置において、前記音素表記的に等価に符号化された単語を追加するステップと、前記音素の組に基づいて前記音素表記的に等価に符号化される単語を含む前記音素表記的に符号化されたテキスト文書を生成するステップとを含む。
本発明の第2の態様によれば、テキスト文書を音素表記的に符号化する装置が提供される。この装置は、メモリと、前記メモリに記憶される命令を実行するように適合されるプロセッサであって、前記命令はテキスト文書を音素表記的に符号化する方法を前記プロセッサに実行させるように構成されるプロセッサとを備え、前記方法は、前記テキスト文書における現在の単語を識別するステップと、前記現在の単語に基づいて、音素表記的に等価に符号化された単語を生成するステップであって、それぞれの現在の単語又は前記現在の単語の音節に対して、前記コンピュータ装置と通信するデータベースにおいて、既定の音素の組からの前記現在の単語又は前記現在の単語の音節と関連付けられる符号化された音素のシーケンスを参照することであって、前記シーケンスは前記現在の単語又は前記現在の単語において対応する音節と音素表記的に等価であり、前記音素の組における各音素は1つ以上の英単語において前記音素として発音される基本音素であること、符号化された音素の前記シーケンスを使用して前記現在の単語又は前記現在の単語における各音節を変換することであって、変換された単語又は変換された音節のそれぞれは前記現在の単語又は前記現在の単語における音節の視覚的構造情報を保持すること、及び前記変換に基づいて、前記音素表記的に等価に符号化される単語を生成することを含むステップと、前記音素表記的に符号化されたテキスト文書内の現在の位置において、前記音素表記的に等価に符号化された単語を追加するステップと、前記音素の組に基づいて前記音素表記的に等価に符号化される単語を含む前記音素表記的に符号化されたテキスト文書を生成するステップとを含む。
本発明の第3の態様によれば、音素表記的に符号化されたテキスト文書をレンダリングするコンピュータ実装方法が提供され、レンダリングされると前記音素表記的に符号化されたテキスト文書は1つ以上の音素表記的に符号化された単語及び1つ以上の未符号化としてタグ付けされた単語を含み、各音素表記的に符号化された単語は1つ以上の音節を含み、各音節は既定の音素の組からの音素のシーケンスを含み、前記音素の組における各音素は1つ以上の英単語における前記音素として発音される基本書記素に関連付けられる。この方法は、前記音素表記的に符号化されたテキスト文書における各単語に対して、前記単語が未符号化の単語としてタグ付けされているかどうかを決定するステップと、前記決定に基づいて前記音素表記的に符号化されたテキスト文書からの前記単語をレンダリングするステップであって、コンピュータ装置と通信するデータベースにおいて、既定の音素の組からの前記未符号化の単語又は前記未符号化の単語の音節と関連付けられる符号化された音素のシーケンスを参照することであって、前記シーケンスは前記未符号化の単語又は前記未符号化の単語の音節と音素表記的に等価であること、及び符号化された音素の前記シーケンスを使用して前記未符号化の単語又は前記未符号化の単語の音節をレンダリングすることであって、レンダリングされた単語又は変換された音節のそれぞれは前記未符号化の単語又は前記未符号化の単語の音節の構造情報を保持することを含むステップとを含む。
本発明の第4の態様によれば、音素表記的に符号化されたテキスト文書をレンダリングする装置が提供される。この装置は、メモリと、前記メモリに記憶された命令を実行するように適合されるプロセッサであって、前記命令は音素表記的に符号化されたテキスト文書をレンダリングする方法を前記プロセッサに実行させるように構成されるプロセッサとを備え、レンダリングされると前記音素表記的に符号化されたテキスト文書は1つ以上の音素表記的に符号化された単語及び1つ以上の未符号化としてタグ付けされた単語を含み、各音素表記的に符号化された単語は音節境界によって分離される1つ以上の音節を含み、各音節は既定の音素の組からの音素のシーケンスを含み、前記音素の組における各音素は1つ以上の英単語における前記音素として発音される基本書記素に関連付けられ、前記方法は、前記音素表記的に符号化されたテキスト文書における各単語に対して、前記単語が未符号化の単語としてタグ付けされているかどうかを決定するステップと、前記決定に基づいて前記音素表記的に符号化されたテキスト文書からの前記単語をレンダリングするステップであって、コンピュータ装置と通信するデータベースにおいて、既定の音素の組からの前記未符号化の単語又は前記未符号化の単語の音節と関連付けられる符号化された音素のシーケンスを参照することであって、前記シーケンスは前記未符号化の単語又は前記未符号化の単語の音節と音素表記的に等価であること、及び符号化された音素の前記シーケンスを使用して前記未符号化の単語又は前記未符号化の単語の音節をレンダリングすることであって、レンダリングされた単語又は変換された音節のそれぞれは前記未符号化の単語又は前記未符号化の単語の音節の構造情報を保持することを含むステップとを含む。
人間に可読な形態にレンダリングされる場合に未熟な読み手のために視認性を支援するように適合される、読みやすい英語(Readable English、RE)として知られているフォーマットに標準英語(standard English、SE)を符号化する方法及び装置が開示される。デフォルトでは、レンダリングされたREは、音素表記的に等価の元のSEの全体的な形状又は綴りを実質的に保持する。その結果、時間と共に、デフォルトでレンダリングされたREの読み手は、非音素表記単語の「視覚単語認識」を発達させることで、実質的に同じ形状を有する等価なSE単語を認識することができる。このようにして、デフォルトでレンダリングされたREは、人がSEテキストを読むことの学習を支援するように適合された中間フォーマットとして機能する。更に、SEの熟練の読み手は、デフォルトでレンダリングされたREの形状とよく知っている等価なSE単語との類似性により視覚単語認識技術を効果的に働かせることができるので、デフォルトでレンダリングされたREを容易に読むことができる。
外国語を話す読み手に対して、RE音声は、英語の発音の学習を支援するために、その言語でのRE音声と等価な又は略等価な音声とのマッピングテーブルを使用して読み手の母語言語で表されてもよい。
本開示の第1の態様によれば、テキスト文書の音素表記的復号の方法が提供される。方法は、テキスト文書の現在の単語に対して、1つ以上の音節を含む音素表記的に等価に符号化された単語を提供するステップであって、各音節は既定の音素の組からの音素のシーケンスを含み、シーケンスは現在の単語において対応する音節と音素表記的に等価であるステップと、音素表記的に等価に符号化された単語又は音素表記的に符号化された文書における現在の位置にある現在の単語を追加するステップとを含む。音素の組の中の各音素は、1つ以上の英単語における音素として発音される基礎書記素と関連付けられる。
次に本願発明の少なくとも1つの実施形態が図面及び付録を参照して記載される。
付録Aは、RE符号化されたXML文書の一部を含む。
添付Bは、図6の方法を使用してレンダリングされたREのサンプルを含む。
標準英語(SE)のテキスト文書を読みやすい英語(RE)のテキスト文書に変換する方法を例示する流れ図である。 図1の方法が実施され得る汎用コンピュータシステムの概略ブロック図を共同で形成する。 図1の方法が実施され得る汎用コンピュータシステムの概略ブロック図を共同で形成する。 図1の方法で使用される、SEのXML文書をRE符号化文書に符号化する方法を示す流れ図である。 図1のREデータベースの構造を例示するエンティティ関係図である。 SE単語を図1のREデータベースに追加する方法を示す流れ図である。 図1の方法で使用される、RE符号化文書をレンダリングする方法を表す流れ図である。 図6の方法が実行され得る電子装置の概略ブロック図を共同で形成する。 図6の方法が実行され得る電子装置の概略ブロック図を共同で形成する。 図6の方法で使用される、RE符号化文書のRE単語をレンダリングする方法を表す流れ図である。 一実施形態に従って表示するためにRE符号化文書をレンダリングされたRE文書にレンダリングした図7のレンダリング装置のディスプレイのメインウィンドウを例示する。 一実施形態に従って表示するために改良されたRE符号化文書をレンダリングされたRE文書にレンダリングした図7のレンダリング装置のディスプレイのメインウィンドウを例示する。
1つ以上の添付の図面において、同じ参照番号を有するステップ及び/又は特徴への参照が行われているが、こうしたステップ及び/又は特徴は、反対の意図が示されない限り、本説明の目的で同じ機能又は動作を有する。
図1は、標準英語(SE)のテキスト文書を読みやすい英語(RE)のテキスト文書に変換する方法100を例示する流れ図である。方法100は以下に詳細に記載される。
図2A及び2Bは、方法100が実施され得る汎用コンピュータシステム200の概略ブロック図を共同で形成する。図2Aに見られるように、コンピュータシステム200は、コンピュータモジュール201、キーボード202、マウスポインタ装置203、スキャナ226、カメラ227及びマイクロホン280等の入力装置、並びにプリンタ215、ディスプレイ装置214及びラウドスピーカ217を含む出力装置によって形成される。外部モデム(Modulator-Demodulator)トランシーバ装置216が、接続221を介して通信ネットワーク220に及び通信ネットワーク220から通信するためにコンピュータモジュール201によって使用されてもよい。ネットワーク220は、インターネット又はプライベートWAN等のWAN(wide-area network)であってもよい。接続221が電話回線である場合、モデム216は従来の「ダイヤルアップ」モデムであってもよい。代替的に、接続221が大容量(例えば、ケーブル)接続である場合、モデム216はブロードバンドモデムであってもよい。また、ネットワーク220への無線接続に無線モデムが使用されてもよい。
コンピュータモジュール201は、一般的に、少なくとも1つのプロセッサ装置205、及び例えば、半導体RAM(random access memory)及び半導体ROM(Read only memory)から形成されるメモリ装置206を含む。また、モジュール201は、ビデオディスプレイ214、ラウドスピーカ217及びマイクロホン280に結合するオーディオ−ビデオインターフェース207、キーボード202、マウス203、スキャナ226、カメラ227及び選択的にジョイスティック(図示せず)に対するI/Oインターフェース213、並びに外部モデム216及びプリンタ215に対するインターフェース208も含む。一部の実装において、モデム216は、コンピュータモジュール201内に、例えば、インターフェース208内に組み込まれてもよい。また、コンピュータモジュール201は、接続223を介して、コンピュータシステム200をLAN(Local Area Network)として知られるローカルコンピュータネットワーク222に結合させるローカルネットワークインターフェース211も有する。また例示のように、ローカルネットワーク222は、一般的に、所謂「ファイアウォール」装置又は類似機能を有する装置を含む接続224を介してワイドネットワーク220に結合されてもよい。インターフェース211は、EthernetTM回路カード、BluetoothTM無線配置又はIEEE802.11無線配置によって形成されてもよい。
インターフェース208及び213は、直列及び並列接続の何れか又は両方を利用可能にしてもよく、前者は一般的にUSB(Universal Serial Bus)標準によって実装され、対応するUSBコネクタ(図示せず)を有する。記憶装置209が設けられ、一般的にはHDD(hard disk drive)210を含む。フロッピー(登録商標)ディスクドライブ及び磁気型ドライブ(図示せず)等の他の記憶装置が使用されてもよい。データの外部不揮発性ソースとのインターフェースにインターフェース212が設けられる。例えば、光学ディスク(例えば、CD−ROM、DVD)、USB−RAM及びフロッピーディスク等の携帯型コンピュータ可読記憶装置225が、システム200への適切なデータのソースとして使用されてもよい。
コンピュータモジュール201の構成要素205から213は、一般的には、相互接続バス204を介して、関連技術の分野では周知のコンピュータシステム200の従来のモードの動作を生じさせるように通信する。記載された配置が実施され得るコンピュータの例は、IBM−PC及び互換機、Sun SPARCstation、Apple MacTM又はノートブック、タブレット及び携帯型「スマートフォン」システム等のこれらかは発展したコンピュータシステムを含む。
方法100は、コンピュータシステム200内で実行可能な1つ以上のソフトウェアアプリケーションプログラム233等のコンピュータシステム200を使用して実装されてもよい。特に、図2Bを参照すると、方法100のステップは、コンピュータシステム200内で実行されるソフトウェア233における命令231によって実行される。ソフトウェア命令231は、各々が1つ以上の特定のタスクを実行する1つ以上のコードモジュールとして形成されてもよい。また、ソフトウェアは2つの別の部分に分割されてもよい。第1の部分及び対応するコードモジュールは記載の方法を実行し、第2の部分及び対応するコードモジュールは第1の部分とユーザとの間のユーザインターフェースを管理する。
ソフトウェア233は、一般的にコンピュータ可読媒体からコンピュータシステム200にロードされて、典型的には図2Aに示されたHDD210又はメモリ206に記憶され、その後、ソフトウェア233はコンピュータシステム200によって実行され得る。一部の例では、アプリケーションプログラム233は、1つ以上の記憶媒体225に符号化されてユーザに供給され、メモリ210又は206に記憶される前に対応するインターフェース212を介して読み込まれる。コンピュータ可読記憶媒体は、実行及び/又は処理のためにコンピュータシステム200に命令及び/又はデータを提供することに関与する任意の一時的でない有形の記憶媒体を意味する。このような記憶媒体の例は、以下の装置がコンピュータモジュール201内側か外側かにかかわらず、フロッピーディスク、磁気テープ、CD-ROM、DVD、ハードディスクドライブ、ROM又は集積回路、USBメモリ、磁気光学ディスク、半導体メモリ、又はPCMCIA等のコンピュータ可読カードを含む。このようなソフトウェア又はコンピュータプログラム記憶されているコンピュータ可読記憶媒体225はコンピュータプログラム製品である。コンピュータモジュール201におけるこのようなコンピュータプログラム製品の使用は、テキスト文書を変換する装置をもたらす。
代替的に、ソフトウェア233は、ネットワーク220又は222からコンピュータシステム200によって読み込まれ、又は他のコンピュータ可読媒体からコンピュータシステム200にロードされてもよい。ソフトウェア、アプリケーションプログラム、命令及び/又はデータをコンピュータモジュール201に提供することにも関与する一時的又は一時的でないコンピュータ可読伝送媒体の例は、別のコンピュータ又はネットワーク化装置とのネットワーク接続に加えて無線又は赤外線伝送チャネル、並びにEメール送信及びウェブサイト等に記録された情報を含むインターネット又はイントラネットを含む。
上述のアプリケーションプログラム233及び対応するコードモジュールの第2の部分は実行されると、1つ以上のグラフィカルユーザインターフェース(GUI)がディスプレイ214上にレンダリングされ又は表されるように実装してもよい。コンピュータシステム200及びアプリケーションのユーザは、一般的にはキーボード202及びマウス203の操作を介して、GUIに関連付けられるアプリケーションへの制御コマンド及び/又は入力を提供するように機能的に適合可能にインターフェースを操作してもよい。また、ラウドスピーカ217を介して出力される音声プロンプト及びマイクロホン280を介して入力されるユーザ音声コマンドを利用するオーディオインターフェース等の、機能的に適合可能なユーザインターフェースの他の形態が実装されてもよい。
図2Bは、プロセッサ205及び「メモリ」234の詳細な概略ブロック図である。メモリ234は、図2Aのコンピュータモジュール201によってアクセス可能な全てのメモリ装置(HDD210及び半導体メモリ206を含む)の論理集約を表す。
コンピュータモジュール201が最初に電源投入されると、POST(power-on self-test)プログラム250が実行される。POSTプログラム250は、典型的には半導体メモリ206のROM249に記憶される。ROM249等のハードウェア装置に恒久的に記憶されるプログラムは、ファームウェアと呼ばれる場合がある。POSTプログラム250は、適切な機能性を確保するためにコンピュータモジュール201内のハードウェアを調査して、適切な動作のために、典型的にはプロセッサ205、メモリ(209、206)、及び同様にROMに記憶されているBIOS(basic input-output systems software)モジュール251を確認する。一旦POSTプログラム250の実行が成功すると、BIOS251はハードディスクドライブ210を起動する。ハードディスクドライブ210の起動により、ハードディスクドライブ210に常駐するブートストラップローダープログラム252がプロセッサ205を介して実行される。これによりRAMメモリ206にオペレーティングシステム253がロードされて、オペレーティングシステム253が動作を開始する。オペレーティングシステム253は、プロセッサ管理、メモリ管理、装置管理、記憶管理、ソフトウェアアプリケーションインターフェース、及び汎用ユーザインターフェースを含む様々な高レベル機能を遂行するためにプロセッサ205によって実行可能なシステムレベルアプリケーションである。
オペレーティングシステム253は、コンピュータモジュール201で実行中の各工程又はアプリケーションが別の工程に割り当てられたメモリと衝突することなく実行するのに十分なメモリを有することを確実にするためにメモリ(209、206)を管理する。更に、各工程が効果的に実行されるように、システム200で利用可能な異なる種類のメモリが適切に使用されなければならない。従って、集合メモリ234は、どのようにメモリの特定のセグメントが分割されているか(それ以外に記述されない限り)を示すことが意図されておらず、コンピュータシステム200によって利用可能なメモリの一般ビューを提供してどのように使用されているかを提供することが意図されている。
プロセッサ205は、制御装置(CU;control unit)239、演算論理装置(ALU;arithmetic logic unit)240、及びキャッシュメモリと呼ばれることがあるローカル又は内部メモリ248を含む多数の機能モジュールを含む。キャッシュメモリ248は、一般的には、レジスタ部分に多数の記憶レジスタ244−246を含む。1つ以上の内部バス241は、こうした機能モジュールを機能的に相互接続する。また、プロセッサ205は、接続218を使用して、システムバス204を介して外部装置と通信する1つ以上のインターフェース242も有する。
アプリケーションプログラム233は、条件分岐及びループ命令を含み得る命令231のシーケンスを含む。また、プログラム233は、プログラム233の実行に使用されるデータ232を含んでもよい。命令231及びデータ232は、それぞれメモリの場所228-230及び235-237に記憶される。命令231及びメモリの場所228-230の相対的サイズに応じて、メモリの場所230で示される命令によって示されようにる単一のメモリの場所に特定の命令が記憶されてもよい。代替的に、メモリの場所228-229に示される命令部分によって示されるように、命令は、各々が別のメモリの場所に記憶される多数の部分に分割されてもよい。
一般に、プロセッサ205はその中で実行される一組の命令が与えられる。その後、プロセッサ205は、後続の入力を待ち、別の組の命令を実行することによってそれに応答する。各入力は、入力装置202、203の1つ以上によって生成されるデータ、ネットワーク220、222の1つを介して外部ソースから受信されるデータ、記憶装置206、209の1つから取得されるデータ、又は対応するインターフェース212に挿入される記憶媒体225から取得されるデータを含む、多数のソースの1つ以上から提供されてもよい。場合によっては、一組の命令を実行することにより、データの出力がもたらされてもよい。また、実行はデータ又は変数をメモリ234に記憶することを含んでもよい。
本開示の方法は、対応するメモリの場所255-258におけるメモリ234に記憶される入力変数254を使用する。本開示の方法は、対応するメモリの場所262-265におけるメモリ234に記憶される出力変数261を生成する。中間変数がメモリの場所259、260、266及び267に記憶されてもよい。
プロセッサ205のレジスタ部分244-246、演算論理装置(ALU)240及び制御装置239は、プログラム233を構成する命令セットにおける命令ごとに「フェッチ、解読、及び実行」サイクルを実行することが必要とされるマイクロオペレーションのシーケンスを実行するように連携する。各フェッチ、解読及び実行サイクルは、以下の実行動作を含む。
(a)メモリの場所228から命令231をフェッチ又は読み取るフェッチ動作、
(b)制御装置239がどの命令がフェッチされたかを決定する解読動作、及び
(c)制御装置239及び/又はALU240が命令を実行する
その後、次の命令に対して更なるフェッチ、解読及び実行サイクルが実行されてもよい。同様に、制御サイクルが実行されることによって、制御装置239は値をメモリの場所232に保存し又は書き込んでもよい。
図1の方法100における各ステップ又は下位工程は、プログラム233の1つ以上の部分に関連付けられて、プログラム233の上記部分に対して命令セットにおける命令ごとにフェッチ、解読及び実行を行うために連携するプロセッサ205におけるレジスタ部分244-247、ALU240、及び制御装置239によって実行される。
代替的に、図1の方法100は、方法100の機能又は下位機能を実行する1つ以上の集積回路等の専用ハードウェアで実装されてもよい。このような専用ハードウェアは、グラフィックプロセッサ、デジタル信号プロセッサ、又は1つ以上のマイクロプロセッサ及び関連メモリを含んでもよい。
方法100は、標準英語(SE)テキストの「ソース」文書に対して動作する。ソース文書は電子又は印刷形態である。マークアップ工程120がSEテキスト文書に適用されて、SEテキスト文書をXMLフォーマットのSE文書130に変換する。ソース文書が印刷形態又はASCIIテキスト等の非構造化データ形態である場合、マークアップ工程120は、ソース文書110に含まれる暗示的構造情報を明確にするXMLスキーマ125によって実行される。例えば、節の見出しは、SEのXML文書130において明示的にタグ付けされる。同様に、段落もSEのXML文書130において明示的にタグ付けされる。ソース文書110が電子ブック(e-book)等の構造化電子形態である場合、マークアップ工程は同様にSEのXML文書130が符号化工程140によって期待される形態であることを確実にするためにXMLスキーマ125に従って実行される。いずれの場合も、SEのXML文書130は、ソース文書110におけるSEの各単語をそれぞれ識別可能にする。
次に、符号化工程140は、SEのXML文書130をRE符号化文書160に符号化する。1つの実装において、RE符号化文書160もXMLフォーマットである。符号化工程140はREデータベース150を参照する。REデータベース150は、典型的には、方法100を実行するコンピュータシステム210のハードディスクドライブメモリ210に記憶されている。代替的に、REデータベース150は、異なるコンピュータシステムのハードディスクドライブメモリに記憶されて、方法100を実行するコンピュータシステム210は、ネットワーク上のデータベースに問い合わせを行う従来のプロトコルに従ってネットワーク接続220又は222を介してREデータベース150にアクセスする。
符号化工程140及びREデータベース150の双方が以下に詳細に記載される。SEのXML文書130における構造及び句読点情報は、符号化工程140によってRE符号化文書160に保存される。
方法100の代替的な実装において、ソース文書110は既に期待されるSEのXMLフォーマットであり、マークアップ工程120は実行されない。そのためマークアップ工程120は図1では破線で示されている。この代替形態において、符号化工程140はソース文書110に直接作用する。
図1では破線で示されている選択的なステップ170において、RE符号化文書160は人間可読形態であるレンダリングされたRE文書180にレンダリングされる。以下でより詳細に説明されるレンダリングステップ170もREデータベース150を参照する。RE符号化文書160における構造及び句読点情報は、レンダリング工程170によってレンダリングされたRE文書180に実質的に保持される。ソースSEとレンダリングされたREとの主要な相違点は単語の表現にある。
1つの実装において、レンダリングステップ170はSEソース文書110へのアクセスを有し、レンダリングステップ170はSEソース文書110でインタリーブされたRE符号化文書160をレンダリングする。インタリーブは対応するSE単語と垂直に整列したレンダリングされたRE単語によってページごと又は行ごとに行われ得る。行インタリーブを使用して、読み手は、SEのソース文書110における任意のSE単語に対応するレンダリングされたRE単語を容易に見つけることができる。
図3は、図1の方法100のステップ140で使用される、SEのXML文書、例えばSEのXML文書130をRE符号化文書に符号化する方法300を例示する流れ図である。方法300は、SEのXML文書内の連続する単語ごとに実行される。SE文書内の現在のSE単語に対して、方法300は、等価なRE単語を取得するためにREデータベース150内の現在のSE単語を調べるステップ310で開始する。以下で詳細に説明されるように、現在のSE単語が1つ以上の同綴意義語を有する場合、REデータベース150は、現在のSE単語に対して1つ以上の等価なRE単語を含む。ステップ320は、現在のSE単語の特徴、取得された等価なRE単語の特徴、例えば発話の一部(名詞、動詞等)、及び現在のSE単語の文脈に基づいて取得された等価なRE単語のうち正しいものを選択する。例えば、現在のSE単語に先行する単語が“to”である場合、取得される等価なRE単語は動詞であるものが選ばれる。代替的に、先行するSE単語が冠詞又は形容詞である場合、取得される等価なRE単語は名詞であるものが選ばれる。1つの実装において、ステップ320は、文脈に対して正しい取得される等価なRE単語を選択するために、発話及び文脈の一部に基づいて上記の規則等の規則の組を呼び出す。規則は、人間のオペレータによってステップ320で手動で作られた過去の多数の選択肢から推測される。
代替的な実装において、ステップ320は、ルールの組を呼び出して、1つを選択する代わりに、文脈に対して可能性のある正しさの順に取得される等価なRE単語をランク付けする。次に、文脈に対して可能性のある正しさの順に取得される等価なRE単語ごとに、残りのステップ330、340、350、360、370が実行される。この実装では、全ての等価なRE単語が、その順番で出力されたRE符号化文書に符号化される。レンダリングすると、全ての等価なRE単語は、発話された英語の知識又は母語言語における意味に基づいて複数の代替的なレンダリングを選ぶように読み手に提示されるであろう。レンダリング工程の更なる詳細が以下で示される。
現在のSE単語が同綴意義語を持たない場合、唯一の等価なRE単語がステップ310で取得されて、ステップ320では何も行われない。
次のステップ330は、選択されたRE単語の出力分類を調べる。これはステップ310でREデータベース150からも取得されている。次に、方法300は、選択されたRE単語の出力分類によりステップ340、350及び360の1つに進む。出力分類が“U”である場合、ステップ340は符号化されないSE単語としてタグ付けされた現在のSE単語を出力されるRE符号化文書における現在の位置に挿入する。出力分類が“R”である場合、ステップ350は選択されたRE単語を出力されるRE符号化文書における現在の位置に挿入する。出力分類が“A”である場合、ステップ360は符号化されないSE単語としてタグ付けされる現在のSE単語を出力されるRE符号化文書における現在の位置に挿入し、その後、出力されるRE符号化文書160が(例えば、レンダリングステップ170によって)人間可読形態180にレンダリングされるときに、「特殊」フォーマットでタグ付けされた選択されたRE単語が使用される。3つの出力分類は以下で詳細に説明される。
方法300はステップ370で終了し、(文書内で以前に遭遇していない場合)選択されたRE単語に関連する部分がREデータベースから抽出されて、出力されるRE符号化文書160に含まれる。ステップ370でRE符号化文書に含まれるREデータベース150の、本明細書では補足情報と呼ばれる関連する部分の性質が以下に詳細に説明される。補足情報を含むRE符号化文書160は本明細書では「強化」RE符号化文書160と呼ばれる。
方法300の代替的な実装では、ステップ370は実行されず、結果として生ずるRE符号化文書160は補足情報を含まず、「基本」RE符号化文書160と呼ばれる。
「強化」工程は、強化RE符号化文書160を生成するために補足情報を基本RE符号化文書に追加するように適合される。強化工程において、基本RE符号化文書160内の各々独自のRE符号化単語に関連する補足情報がREデータベース150から抽出されて、強化RE符号化文書を生成するために基本RE符号化文書160に追加される。
RE符号化文書160を生成する中間段階無しで、SEソース文書110から直接レンダリングされたRE文書180を生成するために、変換方法100の代替方法が実行される。方法100と同様に、代替方法はSEソース文書110における明示又は黙示構造を保持する。代替方法は、方法300の変種を使用して、SEソース文書110内のSE単語をレンダリングされたRE単語に変換する。上記方法300と変種方法との相違は、出力分類が“R”である場合にステップ350でRE符号化文書160に選択されたRE符号化単語を追加する代わりに、変種方法はレンダリングされたRE文書180に選択されたRE単語のレンダリングバージョンを直接追加することである。また、選択されたRE単語のレンダリングバージョンは、以下でより詳細に説明されるように、REデータベース150からも取得可能である。出力分類が“A”である場合、ステップ360で変種方法は、レンダリングされたRE文書180に現在のSE単語を追加して、「特殊」フォーマットでタグ付けされた選択されたRE単語のレンダリングバージョンが後に続く。出力分類が“U”である場合、ステップ360で変種方法は、レンダリングされたRE文書180に現在のSE単語を追加する。3つの出力分類(U/R/A)が以下で詳細に説明される。
また、変種方法はステップ370を省略するので、方法300とは異なり、レンダリングされたRE文書180に補足情報を追加しない。
読みやすい英語への鍵は、SE書記素(文字の組み合わせ)の曖昧性を除去して明確な音素にすることである。SE単語はRE音素のシーケンスによって表される。以下の表1は6つの行を有し、各行がSEの母音書記素に対応する。各行に沿ってエントリを含むセルは、対応する書記素と「等価」のRE音素である。即ち、対応する書記素が1つ以上の英単語で発音され得る書記素である。各RE音素は、等価な書記素として発音される場合にその書記素を含む例示の単語によってセル内で表される。RE音素が現れる行に対応する、即ちRE音素が等価の書記素は、RE音素に関連付けられる「基本」書記素と呼ばれる。
表1の第1列は、基本書記素に対応する基本RE音素、即ち基本書記素が最も頻繁に発音される音素を表す。“schwa”(第3列)は、弱勢母音の「ニュートラル」音であり、音素表記アルファベットで
Figure 0006069211
と表される。「基本」y音が子音であるので(“yes”におけるように)基本書記素“y”に対応する行の第1列にはエントリがないことに留意すべきである。「無音(silent)」列(第9列)は、“eat”における“a”のように、無音である場合に対応する書記素を表すために使用される「無音」書記素を含む。
Figure 0006069211
以下の表2は21個の行を有し、各行がSEの子音書記素に対応する。各行に沿ってエントリを含むセルは、対応する子音書記素と等価であるRE音素である。即ち、対応する子音書記素が1つ以上の英単語で発音され得る書記素である。各RE音素は、等価な書記素として発音される場合にその書記素を含む例示の単語によってセル内で表される。表1と同様に、第1の「基本」列は、基本書記素に対応する基本音素を表し、第9の「無音」列は“debt”における“b”のように、無音である場合に対応する書記素を表すために使用される「無音」音素を含む。基本書記素“y”に対応する行の第1列のエントリは子音“y”音(“yes”のように)である。
Figure 0006069211
表1及び2に示されたRE音素の組のうち89個のRE音素は、2つの相反する目的間のトレードオフとして選択されている。即ち、発話された英語の音素表記を正確に符号化すること及び未熟な読み手による学習の容易さである。より多くの音素を追加することにより、多数の単語のより正確な音素表記の符号化が可能になる。例えば、表1は単語“medium”で聞こえ得る“u-schwa”音を含まない。原則として、各々異なるRE音素(又はそのレンダリングされた表現)は、未熟な読み手によって学習される必要があり、その結果RE音素の数の増加はREの学習の困難性を増加する傾向がある。従って、ほとんど使われない音素、又は同じ基本書記素を有するRE音素と同様に発音される音素は、このRE音素の組の一部とはなっていない。例えば、上記“medium”の中の“u-schwa”音は基本“u”音(“up”の中の短音“u” )と非常に似ているので、“medium”の中の“u-schwa”音は音素表記の正確性を大きく損なわずに基本“u”音として符号化され得る。
各RE音素は、それが現れる行及び列のラベルによって符号化される。例えば、“ate”の中の長音“a”音は“a2”として符号化される。しかしながら、所定のRE音素又はRE音素のペアは、同じ音にマッピングされる。例えば、“to”の中の“oo”音は、“e5”、“o5” 又は “u5”として符号化されてもよい。従って、一部の同音異字的多義性は符号化REに残る。
更に、RE音素の一部は、ペアとして結合されて、単一音として発音される音素の組を形成してもよい。以下の表3は、対応する行及び列においてRE音素のペアによって形成される22個の音素ペアを示す。各音素ペアは、音素ペアの発音を例示する単語によって表される。読みやすい英語
Figure 0006069211
所定のRE音素が文脈によって1つ以上のやり方で発音され得ることは表3から明らかである。例えば、“c1”は、その後に“h1”が続くと、“chin”の中の“ch”として発音されるが、そうでなければ“cat”の中の“c”として発音される。同様に、一部のRE音素は、別のRE音素とペアになる場合にのみ発音を有するという意味で「半音素」のみである。例えば、“t2”は、“the”の中で声に出される“th”音を作るために“h2”が後に続かない限り発音がない。しかしながら、音節内にRE音素シーケンスの同綴意義的多義性はない。例えば、“hot”の“h”が後に続く“cat”の“c” として“c1h1”が発音される音節を含む英単語は存在しない。従って、未熟な読み手は、例えば、“c”及び“h”の別の音としてではなく“chin”における“c1h1”を発音するために表3の特定の音素ペアの認識するように訓練されると、適切に挿入される音節境界を有するRE符号化単語に同綴意義的多義性を見つけないであろう。
また、所定のRE音素ペアは、表1又は表2で既に表されている音を表すことも表3から明らかである。例えば、RE音素ペア“p1h1”はRE音素“f1”と同じ音を表す。この冗長性は、少し余分の学習コストで、今まで可能であったよりも、RE符号化において更に多くの英単語の綴り/形状を保持するという利点を有する。
文脈に関係なく一意の音への(任意の音節内の)曖昧さのないマッピングのために、表1及び表2の音素と表3の音素ペアは、単純なゲーム(simples games)及び他の反復形態によって分離して教えられてもよい。
付録Aは“I am happy to join with you today in what will go down in history as the greatest demonstration for freedom in the history of our nation”というSEテキストを符号化するRE符号化XML文書の断片を含む。付録AのXMLの断片は、各単語の音節境界及び各音節がマッピングされているRE音素のシーケンスを示す。また、付録AのXMLの断片は、句読点を保持し、段落、分及び書式行を示すタグを含む。
図4は、図1のREデータベース150の構造400を例示するエンティティ関係図である。構造400内の各ボックス、例えば、ボックス410は、REデータベース150内の異なるテーブルを表す。
表4は、各テーブルに対する主キー制約、主キー列の番号、列の総数、及びテーブル内容の簡略説明と一緒に図4に例示されたREデータベース構造400のテーブルをリストする。
Figure 0006069211
Figure 0006069211
en_Wordsテーブル410は複数のSE単語を含み、各々がSE単語に対応する行にあるen_word_id列に記憶された一意の識別子を有する。en_Wordsテーブル410は、通常の単語と共に固有名詞も含む。同様に、re_Wordsテーブル420は複数のRE符号化単語を含み、各々がRE符号化単語に対応する行にあるen_word_id列に記憶された一意の識別子を有する。方法300のステップ370においてREデータベース150から抽出された補足情報が、RE符号化文書内の一意に符号化された各RE単語の識別子を使用して抽出される。
REデータベース構造400内のテーブル間のリンク、例えば415は、REデータベース150を構成する様々なテーブル間の関係を示す。例えば、en_Wordsテーブル410における各SE単語は、リンク415で示されるようにre_Wordsテーブル420内の1つ以上の「チャイルド」RE単語を有する。SE単語の「チャイルド」RE単語は、方法300のステップ310で取得されるSE単語のRE等価である。そのSE単語に対する一意の識別子を介して「ペアレント」SE単語に戻ってRE単語を参照するre_Wordsテーブル420におけるen_word_id列を介して関連付けが行われる。例えば、“minute”というSE単語は、en_Wordsテーブル410のen_word_id列における所定の一意の識別子を有する。“minute”と等価な2つのRE単語が方法500で以下に記載されるように“m1i1n1-u1t1e9”(60秒又は会議の文書記録を意味する)及び“m1i2-n1u2t1e9”(小さいことを意味する)と符号化される。こうした2つのRE符号化単語の各々は、re_Wordsテーブル420内の対応する行のen_word_id列にあるSE単語“minute”の一意の識別子を有する。この関連付けによって、SE単語“minute”の発生に応じて方法300のステップ310で2つのRE符号化単語を迅速に取得することが可能になる。
re_Wordsテーブル内の各RE符号化単語は、(re_syllable列において)1つ以上のRE符号化音節を備える。また、RE符号化単語内の各RE符号化音節も、(re_lang_code列において)音節のSE綴りと同時にre_syllablesテーブル430に現れる。従って、REデータベース構造400には重複している部分がある。代替的な実装において、re_Wordsテーブル420における各RE符号化単語は、RE符号化音節を含むのではなく、re_syllablesテーブル430のre_syllable_id列に見つかるRE符号化音節の識別子の順序付けられたシーケンスを含む。この実装において、各RE符号化音節は、REデータベース構造400に一度だけ現れる。この代替的な実装は、記憶空間をあまり必要としないが、問い合わせが遅い。
また、re_Wordsテーブル420内の各RE符号化単語は、どの音節がその単語内で強勢されるかの指示も含む。
re_codeテーブル440は、re_Wordsテーブル420に記憶されたレンダリングされたバージョンのRE符号化単語を含む。re_code_displayテーブル450及びre_misc_displayテーブル460を利用するRE符号化単語のレンダリングは、図8を参照して以下により詳細に記載される。re_codeテーブル440は、上記の「代替方法」におけるSEソース文書110から直接レンダリングされたRE文書180を生成する場合に、レンダリングされたバージョンの選択されたRE単語を取得するために、上記の方法300の変種によって使用される。
また、re_codeテーブル440は、re_class_inフィールドにおいて、re_Wordsテーブル420に記憶されたRE符号化単語の入力分類(U/S/T/X)も含む。入力分類は以下により詳細に記載される。また、re_codeテーブル440は、re_class_outフィールドにおいて、re_Wordsテーブル420に記憶されたRE符号化単語の出力分類(U/R/A)も含む。出力分類は、どのようにRE符号化文書160又はレンダリングされたRE文書180に追加されるかを管理するために上記の方法300のステップ330で使用される。
re_mediaテーブル470は、re_Wordsテーブル420における各RE符号化単語のオーディオ及び/又はビデオ表現を含む。1つの実装において、re_mediaテーブル470は、re_syllablesテーブル430における各RE符号化音節のオーディオ及び/又はビデオ表現も含む。オーディオ表現は、mp3等の標準に従ってデジタル符号化及び圧縮されたオーディオファイルとして記憶された、RE符号化単語又は音節の発音の記録である。ビデオ表現は、単語又は音節の発音の間に人間音声システムの動的画像であり、単語又は音節の発音の間に唇及び舌等のシステムの様々な部分の位置がどのように変化するかを示す。ビデオ表現は、MPEG等の標準に従ってデジタル符号化及び圧縮されたビデオファイルとして記憶される。
en_definitionテーブル480は、re_Wordsテーブル420における各RE符号化単語に対して1つ以上の英語定義を含む。更に、en_definitionテーブル480は、定義された単語の品詞(名詞、動詞等)を記憶する。例えば、re_Wordsテーブル420におけるRE符号化単語“m1i1n1-u1t1e9”は、リンク425を介してen_definitionテーブル480内の2つの定義にリンクされる。1つ(名詞)は“sixty SEconds”であり、1つ(同様に名詞)は“a documentary record of a meeting”である。
同綴意義語テーブル490は、同綴意義語である、即ちSEで同じように綴られるRE単語のペアを含む。各ペアは、re_Wordsテーブル420内のRE符号化単語の2つの識別子によって定義される。例えば、同綴意義語テーブル490内の1つのエントリは、2つのRE符号化単語“m1i1n1-u1t1e9” 及び“m1i2-n1u2t1e9”の識別子を含み、これらは双方共にword_id_1及びword_id_2列におけるre_Wordsテーブル420からSEで“minute”と綴られる。
translation テーブル495は、re_Wordsテーブル420における各RE符号化単語に対して1つ以上の英語以外の言語への翻訳を含む。
re_phonemeテーブル435は、英語以外の言語で各RE音素又は音素ペアに対して等価な言語固有音素、又は独自のアルファベットで表現されるその言語で最も近い等価音素を含む。例えば、フランス語は、RE音素“t2h2”(“this”における“th”の発声)と等価の音素を持たない。この音素は、一般的には、フランス語の教科書では“tz”と音素表記的に表されるので、re_phonemeテーブル435内のre_lang_code列はRE音素“t2h2”に対応する行に“tz”を含む。
表5は、表1、表2及び表3におけるRE音素及び音素ペアのフランス語の等価物を含むre_phonemeテーブル435からの抽出である。第1の列は同音異字音素及び音素ペアが同じ行にリストされるようにRE音素及び音素ペアをリストし、第2列はフランス語で説明されたre_phonemeテーブル435内のre_lang_code列からフランス語の音素の等価物又は略等価物をリストする。
Figure 0006069211
Figure 0006069211
Figure 0006069211
言語列は、RE音素表現の言語を示す2文字のコードを含む。re_phonemeテーブル435における各言語固有の等価音素は、re_syllablesテーブル430内の1つ以上のRE符号化音節の対応する言語固有音素表現を生成するために使用される。RE音素及びRE符号化音節の言語固有の音素表記等価物は、今度はRE符号化文書における各単語の言語固有の音素表記的表現を生成するために使用されてもよい。
また、re_phonemeテーブル435は、IPA(International Phonetic Alphabet)における各RE音素ペア又は音素ペアに対する音素表記等価物又は略等価物も含む。表5の第3列は、IPAにおける各RE音素又は音素ペアの略等価物をリストする。re_phonemeテーブル435におけるIPA等価物は、re_phonemeテーブル435で既に直接的に表されている言語以外の言語でRE符号化文書における各単語の言語固有の音素表記的表現を生成するために使用されてもよい。RE音素からre_phonemeテーブル435におけるIPAへのマッピングは、IPAにおけるRE符号化文書の中間表現を生成するために使用され得る。次に、IPA音素をその言語での書記素にマッピングする更なるテーブルが中間表現からその言語での音素表記的表現を生成するために使用され得る。
図5は、SE単語を図1のREデータベース150に追加する方法500を示す流れ図である。方法100と同様に、方法500は、プロセッサ205によって制御及び実行されるソフトウェア233としてコンピュータシステム200に実装されてもよい。1つの実装において、REデータベース150は、コンピュータシステム200のハードディスクドライブメモリ210に記憶される。REデータベース150が遠隔コンピュータシステムのハードディスクドライブメモリに記憶される場合に適切な代替的な実装において、方法100を実行するコンピュータシステム200は、ネットワーク上のデータベースにアクセスするための従来のプロトコルに従ってネットワーク接続220又は222を介してREデータベース150への問い合わせ及び更新を行う。このような実装では、遠隔コンピュータシステムは、“Wiki”等のサーバアプリケーションを介してREデータベース150へのアクセスを提供してもよい。それによって、REデータベース150は、全員が別個のコンピュータシステム200上のウェブブラウザを介して方法500の別個のインスタンスを実行している複数のユーザによって迅速に構築されてもよい。このようなモデルは、REデータベース150に固有名詞を追加するのに特に適している。
方法500はステップ510で開始し、SE単語を音節に分ける。ステップ510は、英語で一般の接頭辞及び接尾辞を単にリストするテーブルである接頭辞/接尾辞データベース515を利用する。例えば、ステップ510では、SE単語“thinking”を音節に分けることは、接頭辞/接尾辞データベース515内の接尾辞“ing”を特定することによって支援される。SE単語が音節を1つだけ有する場合、ステップ510は効果がない。1つの実装において、ステップ510は、接頭辞/接尾辞データベース515を使用して特定される任意の接頭辞又は接尾辞に後続の又は先行するものに加えて手動で音節境界を特定するために人間の操作者の介入を含む。
例えば、“mi-nute”(小さいことを意味する)又は“min-ute”(60秒を意味する)としての“minute”のように、SE単語を音節に分ける複数の有効な方法がある場合、方法500の残りのステップはこのような境界ごとに実行される。代替的に、人間の操作者は、SE単語の文脈が提供されて、この文脈に基づいて、文脈に対して正しいものである複数の境界(breaking)を推論する。方法500の残りのステップは、その境界に対してのみ実行される。
後続のステップ520では、SE単語における各音節の各書記素は、等価なRE音素にマッピングされる。1つの実装において、ステップ520は、手動で音節を書記素に分割して、SE書記素から等価なRE音素を特定するために人間の操作者による介入を含む。ステップ520の結果は、SE単語のRE符号化である。
ステップ520の1つの実装において、REデータベース150内のre_syllablesテーブル430は、SE音節の以前の全てのREマッピングを取得するために問い合わせを受ける。取得されたREマッピングは、グラフィカルユーザインターフェースを介して、SE単語の文脈で音節の正しいマッピングとして提示されたマッピングの1つを選択し得る操作者に提示される。代替的に、取得されたマッピングがいずれも正しくない場合、人間の操作者は、SE音節に対して新しいREマッピングを定義してもよい。
多くの場合、SE音節に対して複数のREマッピングが存在する。例えば、SE単語“row”は、“r1o2w9”(“no”と韻が合うように)又は“r1o1w1”(“how”と韻が合うように)としてREにマッピングされてもよい。この場合、方法500bの残りのステップは、このような可能なマッピングごとに実行される。代替的に、人間の操作者は、SE単語の文脈が提供されて、この文脈に基づいて、文脈に対して正しいものである複数のマッピングを推論する。方法500の残りのステップは、その境界に対してのみ実行される。
ステップ520からのREマッピングに基づいて、ステップ530はRE符号化単語を“U”(変化なし)、“S”(音節)、“T”(翻訳)、及び“X”(例外)としてラベル付けされる4つの入力分類の1つに分類する。1つの実装において、ステップ520は、RE単語を手動で分類するために人間の操作者による介入を含む。入力分類は、SE単語と等価なそのRE単語又は各RE単語の出力分類を決定して、今度は、SE単語と等価なRE単語が上記の符号化工程300によってどのようにRE符号化文書160に符号化されるかを管理する。
入力分類“U”は、SE単語が音節を1つだけ有し、SE単語における全ての書記素が対応する基本音素にマッピングされるという意味で「音素表記的」であることを示す。他の単語では、RE等価単語は、音節境界を持たず、基本音素だけを使用して符号化される。即ち、それぞれのSE書記素に対応する表1及び表2の第“1”列内のエントリである。例えば、単語“bat”は、1つの音節を有し、書記素“b”は“b1”としてREに符号化され、書記素“a”は“a1”としてREに符号化され、“t”は“t1”としてREに符号化されるので、“U”と分類される。入力分類が“U”である場合、同等のREの単語がデフォルトでSE単語の外見と同一にステップ170でレンダリングされるので、ステップ340は、RE符号化文書にSE単語自体を単に加える。(方法170は以下により詳細に記載される。)
入力分類“S”は、SE単語が音節を1つ以上有し、従って音節境界を必要とするが、各音節は音節における全ての書記素が対応する基本音素にマッピングされるという意味で「音素表記的」であることを示す。言い換えれば、RE等価単語の各音節は、各SE書記素に対応する基本音素だけを使用して符号化される。例えば、単語“cannot”は“can-not”として音節に分けられ、各音節は各SE書記素に対応する表1又は表2の“1”列におけるエントリだけを使用して符号化される。入力分類が“S”である場合、レンダリングステップ170はREの単語をレンダリングするために音節境界を必要とするので、ステップ350は、RE符号化文書に音節境界を含むRE等価単語を加える。
入力分類“T”は、音節内の少なくとも1つの書記素が「非基本」音素にマッピングされたという意味で、SE単語が「非音素表記的」である少なくとも1つの音節を有することを示す。例えば、SE単語“grow”において、書記素“o”は“o2”としてREで符号化される“長音o”の音素にマッピングされ、書記素“w”は無音である(“w9”としてREで符号化される)。しかしながら、SE単語における各非音素表記的音節は、各SE書記素に対応するRE音素にマッピングされている。言い換えれば、各RE音素に対応する基本書記素は音節を綴る。例えば、非音素表記的書記素“o” 及び“w”が“o2”及び“w9”と符号化され、表1及び表2における基本書記素“o” 及び“w”の双方が音節の非音素表記的部分を綴るので、SE単語“grow”は“T”に分類される。入力分類が“T”である場合、ステップ350はRE符号化文書にRE等価単語(任意の音節境界を含む)を加える。
U、S及びTに分類されるRE等価な符号化は、マッピングされたRE音素に対応する基本音素が各SE書記素に対応するという点で、SE単語の「綴りを保持」する。
入力分類“X”は、SE単語が各SE書記素に対応するRE音素にマッピングされなかった少なくとも1つの音節を有することを示す。言い換えれば、REマッピングはSE単語の「綴りを保持」しない。例えば、SE単語“one”は、その単一の音節が非音素表記的であり、基本書記素“w”、“u”及び“n”が音節を綴らない“w1u1n1”にマッピングされるので、“X”に分類される。入力分類が“X”である場合、ステップ360は、RE符号化文書にSE単語及びRE等価単語(任意の音節境界を含む)を加え、SE単語は「特殊」フォーマットでタグ付けされる。ステップ360においてXに分類される単語のこの2重符号化の理由は以下で説明される。
一部のSE単語は、特定のREマッピングに応じて異なる分類を有する。例えば、廃水用のパイプの意味を持つSE単語“sewer”は、“T”に分類されて、RE音素“s1e5w1e1r1”にマッピングされる。しかしながら、縫い物をする人の意味を持つSE単語“sewer”は、“X”に分類されて、RE音素“s1o2w1e1r1”にマッピングされる。
ステップ530に続いて、方法500は、ステップ540に進み、ステップ530で決定された入力分類を検査して次に実行すべきステップを決定する。入力分類が“U”である場合、ステップ550は、出力分類を“U”に設定して、REデータベース150に現在の単語を加える。入力分類が“S”又は“T”である場合、ステップ560は、出力分類を“R”に設定して、REデータベース150に現在の単語を加える。入力分類が“X”である場合、ステップ570は、出力分類を“A”に設定して、REデータベース150に現在の単語を加える。
ステップ550、560及び570の各々は以下の複数の下位ステップを含む。
・現在のSE単語をen_Wordsテーブル410に加える。
・現在のRE符号化単語をre_Wordsテーブル420に加える。
・re_syllablesテーブル430においてまだマッピングされていないRE音節をre_syllablesテーブル430にくわえる。
・レンダリングされたバージョンのRE符号化単語及びその入力分類(U/S/T/X)をre_codeテーブル440に加える(RE符号化単語のレンダリングは図8を参照して以下により詳細に記載される)。
・RE符号化単語の出力分類(U/R/A)をre_codeテーブル440に加える。
・RE符号化単語のオーディオ及びビデオ表現をre_mediaテーブル470に加える。
・RE符号化単語の定義をen_definitionテーブル480に加える。(RE符号化単語に複数の定義が存在する場合、対応する品詞(名詞、動詞等)と共に各定義がen_definitionテーブル480に加えられる。
・ステップ510でSE単語を音節に分ける複数の有効な方法、又はステップ520で任意のSE音節に対する複数の可能な正しいマッピングが見つかった場合、SE単語の複数のRE符号化を同綴意義語テーブル490に加える。
ステップ520においてSE単語内の音節をRE音素の音素表記的に等価なシーケンスにマッピングすることは、所与の地方訛りに従って実行される。好ましい実装では、選択された地方訛りは、読み手の対象とする聴取者が最もよく知っているものである。REデータベース150は、SE単語のRE音節へのマッピングが異なる地方訛りに適するように変更できるように、編集可能に構成される。
1つの実装において、REデータベース150は、標準英語以外の言語の単語、及びRE符号化等価物又は略等価物を含むように構成される。このような実装において、方法500は、例えば、“good day”を意味するフランス語“bonjour”、及び略RE等価シーケンス、例えば、“b1o2n1-j1o9u2r1”をREデータベース150に加えることができるであろう。この実装において、標準英語以外の言語のテキスト文書のRE符号化バージョンは、上記の方法100を使用して生成され得る。
上記のように、RE符号化単語のレンダリングの間、例えば、図1の方法100におけるステップ170の間、データベース構造400におけるre_code_displayテーブル450が参照される。re_code_displayテーブル450は、表1及び表2にリストされたRE音素の各々に対して1行を含む。表6は、re_code_displayテーブルからの抜粋を示す。
Figure 0006069211
“phone”列は、国際音素表記アルファベットにおける音素の表現を含む。display_web列は、ウェブ及びHTML出力に対する音素の表現を含む。display_print列は、PDF及び他の印刷フォーマット出力に対する音素の表現を含む。一般に、display_web及びdisplay_print列は、各行において同一のエントリを有する。言語列は、特定言語のレンダリング用の2文字の言語コードを含む。
個人設定に従ってREのレンダリングをカスタマイズするために、ユーザはdisplay_web及びdisplay_print列のコンテンツを変更してもよい。しかしながら、display_web及びdisplay_print列におけるデフォルト表現は、以下に記載されるように慎重に選ばれる。
図6は、図1の方法100のステップ170で使用される、RE符号化文書、例えば図1におけるRE文書160をレンダリングする方法600を例示する流れ図である。
図7A及び7Bは、方法600が実施され得る組み込み部品を含む汎用電子装置701の概略ブロック図を共同で形成する。電子「レンダリング装置」701は、例えば、処理リソースが制限されている電子ブックリーダ(e-reader)であってもよい。また、電子「レンダリング装置」701は、ノートブック、タブレットコンピュータ装置、又は「スマートフォン」等の携帯型コンピュータ装置であってもよい。それにもかかわらず、方法600は、デスクトップコンピュータ、サーバコンピュータ、及び非常に大きな処理リソースを有する他の装置、例えば、図2のコンピュータシステム200等の高レベル装置で実装されてもよい。
図7Aに見られるように、電子装置701は、組み込みコントローラ702を含む。従って、電子装置701は「組み込み装置」とも呼ばれる。本例示では、コントローラ702は、内部記憶モジュール709に双方向で結合される処理装置(又はプロセッサ)705を有する。記憶モジュール709は、図7Bに見られるように、不揮発性半導体読み出し専用メモリ(ROM)760及び半導体メモリランダムアクセスメモリ(RAM)770から形成されてもよい。RAM770は、揮発性、不揮発性、又は揮発性及び不揮発性メモリの組み合わせであってもよい。
電子装置701は、LCD(liquid crystal display)パネル等のビデオディスプレイ714に接続されるディスプレイコントローラ707を含む。ディスプレイコントローラ707は、ディスプレイコントローラ707が接続される組み込みコントローラ702から受信する命令に従ってビデオディスプレイ714上にグラフィカル画像を表示するように構成される。
また、電子装置701は、典型的には、キー、キーパッド又は同様のコントロールによって形成されるユーザ入力装置713も含む。一部の実装では、ユーザ入力装置713は、タッチスクリーンを集合的に形成するためにディスプレイ714に物理的に関連付けられるタッチセンサ式パネルを含んでもよい。従って、このようなタッチスクリーンは、キーパッド−ディスプレイの組み合わせで一般的に使用されるプロンプト又はメニュー駆動式GUIとは対照的に、グラフィカルユーザインターフェース(GUI)の一形態として動作してもよい。また、メニューに関するナビゲーションを容易にするために音声コマンド用のマイクロホン又はジョイスティック/サムホイール(thumb wheel)(図示せず)等の他の形態のユーザ入力装置が使用されてもよい。
図7Aに見られるように、電子装置701は、接続719を解してプロセッサ705に結合される携帯型メモリインターフェース706も含む。携帯型メモリインターフェース706によって、データのソース又は宛先として作用するために、又は内部記憶モジュール709を補完するために、補助携帯型記憶媒体725が電子装置701に結合されることを可能にする。このようなインターフェースの例は、USB(Universal Serial Bus)メモリ、SD(Secure Digital)カード、PCMIA(Personal Computer Memory Card International Association)カード、光学ディスク(例えば、DVD)及び磁気ディスク等の携帯型コンピュータ可読記憶媒体との結合を可能にする。
また、電子装置701は、接続721を介してコンピュータ又は通信ネットワーク720への電子装置701の結合を可能にする通信インターフェース708も有する。接続721は、有線又は無線であってもよい。例えば、接続721は無線周波数又は光学であってもよい。有線接続の例はEthernetを含む。更に、無線接続の例は、BluetoothTM型ローカル相互接続、Wi-Fi(IEEE802.11ファミリの標準に基づくプロトコルを含む)、IrDa(Infrared Data Association)等を含む。
方法600は、組み込みコントローラ702内で実行可能な1つ以上のソフトウェアアプリケーションプログラム733として実装されてもよい。特に、図7Bを参照すると、方法600のステップは、組み込みコンピュータシステム702内で実行されるソフトウェア733における命令によって実行される。ソフトウェア命令は、各々が1つ以上の特定のタスクを実行する1つ以上のコードモジュールとして形成されてもよい。また、ソフトウェアは2つの別の部分に分割されてもよい。第1の部分及び対応するコードモジュールは記載されている方法を実行し、第2の部分及び対応するコードモジュールは第1の部分とユーザとの間のユーザインターフェースを管理する。
組み込みコントローラ702のソフトウェア733は、一般的には、内部記憶モジュール709の不揮発性ROM760に記憶される。ROM760に記憶されるソフトウェア733は、コンピュータ可読媒体から要求されると更新され得る。ソフトウェア733は、プロセッサ705にロードされて実行され得る。一部の例では、場合によっては、プロセッサ705はRAM770に設置されるソフトウェア命令を実行してもよい。ソフトウェア命令は、プロセッサ705によってRAM770にロードされて、ROM760からRAM770への1つ以上のコードモジュールのコピーを開始してもよい。代替的に、1つ以上のコードモジュールのソフトウェア命令は、製造業者によってRAM770の不揮発性領域にプレインストールされていてもよい。1つ以上のコードモジュールがRAM770に位置付けられた後で、プロセッサ705は1つ以上のコードモジュールのソフトウェア命令を実行してもよい。
アプリケーションプログラム733は、一般的には、電子装置701の流通前に、製造業者によってROM760にプレインストールされて記憶される。しかしながら、一部の例では、アプリケーションプログラム733は、コンピュータ可読記憶媒体に符号化されてユーザに供給され、内部記憶モジュール709に記憶される前に図1の携帯型メモリインターフェース706を介して読み込まれる。コンピュータ可読記憶媒体は、実行及び/又は処理のために組み込みコントローラ702に命令及び/又はデータを提供することに関与する任意の一時的でない有形の記憶媒体を意味する。このような記憶媒体の例は、以下の装置が電子装置701の内側か外側かにかかわらず、フロッピーディスク、磁気テープ、CD−ROM、DVD、ハードディスクドライブ、ROM又は集積回路、USBメモリ、磁気光学ディスク、フラッシュメモリ、又はPCMCIA等のコンピュータ可読カードを含む。このようなソフトウェア又はコンピュータプログラムが記憶されているコンピュータ可読媒体はコンピュータプログラム製品である。電子装置701におけるこのようなコンピュータプログラム製品の使用は、RE符号化文書をレンダリングする装置をもたらす。
別の代替では、ソフトウェアアプリケーションプログラム733は、ネットワーク720からプロセッサ705によって読み込まれ、又は他のコンピュータ可読媒体から組み込みコントローラ702にロードされてもよい。ソフトウェア、アプリケーションプログラム、命令及び/又はデータを電子装置701に提供することにも関与する一時的又は一時的でないコンピュータ可読伝送媒体の例は、別のコンピュータ又はネットワーク化装置とのネットワーク接続に加えて無線又は赤外線伝送チャネル、並びにEメール送信及びウェブサイト等に記録された情報を含むインターネット又はイントラネットを含む。
上述のアプリケーションプログラム733及び対応するコードモジュールの第2の部分は、図7Aのディスプレイ714上にレンダリングされ又は表される1つ以上のグラフィカルユーザインターフェース(GUI)を実装するように実行されてもよい。電子装置701及びアプリケーションプログラム733のユーザは、ユーザ入力装置713(例えば、キーパッド)の操作を介して、GUIに関連付けられるアプリケーションへの制御コマンド及び/又は入力を提供するように機能的に適合可能にインターフェースを操作してもよい。また、ラウドスピーカ(図示せず)を介して出力される音声プロンプト及びマイクロホン(図示せず)を介して入力されるユーザ音声コマンドを利用するオーディオインターフェース等の、機能的に適合可能なユーザインターフェースの他の形態が実装されてもよい。
図7Bは、アプリケーションプログラム733及び内部記憶装置709を実行するプロセッサ705を有する組み込みコントローラ702を詳細に示す。内部記憶装置709は、ROM(read only memory)760及びRAM(random access memory)770を含む。プロセッサ705は、接続されたメモリ760及び770の一方又は双方に記憶されるアプリケーションプログラム733を実行することができる。電子装置701に最初に電源が入ると、ROM760に存在するシステムプログラムが実行される。ROM760に恒久的に記憶されたアプリケーションプログラム733は、「ファームウェア」と呼ばれる場合がある。プロセッサ705によるファームウェアの実行は、プロセッサ管理、メモリ管理、装置管理、記憶管理及びユーザインターフェースを含む様々な機能を果たしてもよい。
プロセッサ705は、一般に、制御装置(CU)751、演算論理装置(ALU)752、及び内部バッファ若しくはキャッシュメモリ755と共に、アトミックデータ要素756、757を一般に含む一組のレジスタ754を含むローカル又は内部メモリを含む多数の機能モジュールを含む。1つ以上の内部バス759は、こうした機能モジュールを相互接続する。また、プロセッサ705は、接続761を使用して、システムバス781を介して外部装置と通信する1つ以上のインターフェース758も有する。
アプリケーションプログラム733は、条件分岐及びループ命令を含み得る命令762から763のシーケンスを含む。また、プログラム733は、プログラム733の実行に使用されるデータを含んでもよい。このデータは、命令の一部として又はROM760若しくはRAM770内の別の場所764に記憶されてもよい。
一般に、プロセッサ705はその中で実行される一組の命令が与えられる。この命令の組は、特定のタスクを実行する又は電子装置701で起こる特定のイベントを処理するブロックにまとめられてもよい。一般に、アプリケーションプログラム733は、イベントを待って、その後そのイベントに関連付けられるコードのブロックを実行する。イベントは、プロセッサ705によって検出されると、図7Aのユーザ入力装置713を介して、ユーザからの入力に応じてトリガされてもよい。また、イベントは、電子装置701内の他のセンサ及びインターフェースに応答してトリガされてもよい。
一組の命令の実行は、数値変数が読み込まれて修正されることを必要としてもよい。このような数値変数はRAM770に記憶される。本開示の方法は、メモリ770における既知の場所772、773に記憶されている入力変数771を使用する。入力変数771は、メモリ770における既知の場所778、779に記憶されている出力変数777を生成するように処理される。メモリ770の場所775、776における追加のメモリの場所に中間変数774が記憶されてもよい。代替的に、一部の中間変数は、プロセッサ705のレジスタ754にのみ存在してもよい。
命令のシーケンスの実行は、プロセッサ705においてフェッチ−実行サイクルを繰り返し適用することにより達成される。プロセッサ705の制御装置751は、実行される次の命令のROM760又はRAM770におけるアドレスを含むプログラムカウンタと呼ばれるレジスタを保持する。フェッチ実行サイクルの開始時に、プログラムカウンタによってインデックス付けされたメモリアドレスのカウンタが制御装置751にロードされる。従って、ロードされた命令はプロセッサ705の後続の動作を制御して、例えば、データがROMメモリ760からプロセッサレジスタにロードされ、レジスタの内容が別のレジスタの内容と算術的に結合され、レジスタの内容が別のレジスタに記憶された場所に書き込まれる。フェッチ実行サイクルの終了時に、プログラムカウンタは、システムプログラムコードにおける次の命令へのポイントに更新される。実行された命令によって、これはプログラムカウンタに含まれたアドレスをインクリメントし又は分岐演算を達成するためにプログラムカウンタに新しいアドレスをロードすることを含んでもよい。
以下に記載された方法の処理における各ステップ又は下位処理は、アプリケーションプログラム733の1つ以上のセグメントに関連付けられ、プロセッサ705におけるフェッチ−実行サイクルの実行の反復又は電子装置701における他の独立したプロセッサブロックの同様のプログラム動作によって行われる。
方法600は、RE符号化文書内の各単語が連続してレンダリングされるようにレンダリング装置701によって実行される。方法600はステップ610で開始して、現在の単語が未符号化(SE)又は符号化済み(RE)としてタグ付けされているかどうかを決定する。REである場合、方法600はステップ620に進み、現在の単語が「特殊」フォーマットでタグ付けされているかどうかを決定する。(このタグ付けは、RE単語の出力分類が“A”であった場合にRE符号化文書を生成した方法300のステップ360で行われている。)もしそうであれば、ステップ630が続いて、現在のレンダリングフォーマットがデフォルトフォーマットから特殊フォーマットに変更される。次に、ステップ640で特殊フォーマットに従ってレンダリングされる。(ステップ640は以下により詳細に記載される。)次に、ステップ650は、現在のレンダリングフォーマットを元のデフォルトフォーマットに変更する。
現在の単語が特殊フォーマットでタグ付けされていない場合、方法600はステップ660に進み、デフォルトフォーマットに従って現在のRE単語をレンダリングする。(ステップ660は以下により詳細に記載される。)
現在の単語が未符号化(SE)とタグ付けされている場合、ステップ670において未符号化SE単語はデフォルトフォーマットに従って従来の態様でレンダリングされる。方法600は、ステップ650、ステップ660、又はステップ670の後、ステップ680で終了する。
図8は、図6の方法600のステップ640及び660で使用される、RE符号化文書のRE単語をレンダリングする方法800を例示する流れ図である。方法800は、RE単語における各符号化済み音素を連続してレンダリングするために実行される。また、方法800は適切な場所でRE符号化文書内の音節の間に音節境界をレンダリングすることにも留意する。re_misc_displayテーブル460は、「特殊フォーマット」でタグ付けされた単語がどのようにレンダリングされるかに加えて、音節境界がどのようにハイフン、ドット、ショートスペース等としてレンダリングされるかを制御する。特殊フォーマットの例は、小さなフォント、異なる色、括弧による囲み、又はこれらの一部の組み合わせである。
方法800がステップ810で開始して、現在の符号化音素に対応するre_code_displayテーブル450における行を検索する。デフォルトのre_code_displayテーブル及びre_misc_displayテーブル460は、符号化工程140の一部として全てのRE符号化文書に含まれる。しかしながら、レンダリング装置701がカスタマイズされたre_code_displayテーブル450又はre_misc_displayテーブル460を含む場合、カスタマイズされたテーブルは、RE符号化文書に含まれるre_code_displayテーブル又はre_misc_displayテーブルに優先して方法800によって使用される。
以下のステップ820は、レンダリングがウェブ/HTML出力又はプリント出力へのものかどうかを決定する。レンダリングがプリント出力へのものである場合、ステップ830は、ステップ810で検索された対応する行のdisplay_print列のエントリを出力レンダリング文書に出力する。レンダリングがウェブ/HTML出力へのものである場合、ステップ840は、ステップ810で検索された対応する行のdisplay_web列のエントリを出力レンダリング文書に出力する。その後、方法800は終了する。
また、強化RE符号化文書160は、補足情報、即ち、文書160内のRE単語に関連するREデータベース150の一部を含む。補足情報の選択は、RE符号化文書160に対する購入要求の一部としてレンダリング装置701のユーザによって行われてもよい。REデータベース150から抽出されて符号化の方法300のステップ370でRE符号化文書160に追加された強化RE符号化文書160内の各一意のRE単語に対する補足情報は、以下の1つ以上を含んでもよい。
・en_definitionテーブル480から抽出された単語の定義
・re_mediaテーブル470から抽出された単語のオーディオ表現
・re_mediaテーブル470から抽出された単語のビデオ表現
・re_Wordsテーブル420から抽出された単語の強勢指示
各RE符号化単語に関連付けられる強勢指示が補足情報の一部として強化RE符号化文書160に記憶される場合に適切な、レンダリング方法800の様々な実装において、各単語に関連付けられる強勢指示は、re_misc_displayテーブル460によって管理されるその単語における他の音節から異なって、即ち太文字(bold typeface)でレンダリングされた単語に強勢の音節をレンダリングするために使用される。しかしながら、本願の発明者は、正しい音節境界及び音素表記の符号化がこのような強勢指示の使用の大部分を不要にすることを見出した。例えば、2つの単語“contract”(名詞)及び“contract”(動詞)は異なる強勢パターンを有するが、それぞれのRE符号化(c1o1n1-t1r1a1c1t1及びc1o3n1-t1r1a1c1t1)のおかげで、読み手は正しい強調で各単語を発音する傾向がある。
また、ユーザは、REデータベース150によってサポートされた既定の組の言語の1つで、RE符号化文書160の「外国語」バージョンを要求してもよい。このような「外国語」バージョンに関して、補足情報は、上記の情報に加えて以下の1つ以上を含んでもよい。
・translation テーブル495から抽出された各RE単語の外国語への翻訳
・re_syllablesテーブル430から取得されたRE単語における各RE音節の対応する外国語表現を使用して取得されたRE単語の外国語固有の音素表記表現
1つの実装において、ユーザは文書160を選択し、所望の場合は視認性支援フォーマット(例えば、大型活字印刷)を選択し、任意の補足情報を要求し、支払いを行い、ダウンロードすることによってウェブサイトからRE符号化文書160を購入する。選択されたRE符号化文書160の購入価格は、要求された補足情報の量に部分的に依存する。
また、同様の方式がRE符号化文書160の貸し出しにも使用され得る。読み手は図書館サイトにログインして、借りるRE符号化文書160を選択し、フォーマットを選択し、任意の補足情報を要求して、ダウンロードする。読み手が本を読んだ後で、又は所定の間隔の後で、読み手が借りたRE符号化文書160は単純にその読書装置から削除される。その後、RE符号化文書160は、別の読み手が借りることが可能になる。
レンダリング装置701のグラフィカルユーザインターフェースの一部として、RE符号化文書160がレンダリング装置701のディスプレイ714上に表示されるレンダリングRE文書にレンダリングされる場合、レンダリング装置701はユーザ入力装置713を介してユーザからコマンドを受信するように構成される。図9は、一実施形態に従って表示されるRE符号化文書160をレンダリンRE文書180にレンダリングしたレンダリング装置701のディスプレイ714のメインウィンドウ900を例示する。メインウィンドウ900は、ナビゲーション部910、ディスプレイ部920、及び設定部930を含む。ナビゲーション部910は、ユーザが複数のレンダリングされたRE文書を検索することによって、ディスプレイ部920に現在表示されているレンダリングされたRE文書180の一部を変更することを可能にする。設定部は、ユーザがレンダリング装置701の設定を変更することによって、レンダリングされたRE文書180の現在の部分がディスプレイ部920にどのように表示されるかを変更することを可能にする。例えば、設定部930は、ディスプレイ部920において、フォントサイズ、行高さ、文字間隔、単語間隔、テキスト色、背景色、及び「ハイライト色」を変更するためのコントロールを含む。また、1つの実装において、設定部930は、以下に説明されるように、デフォルト表現でレンダリングされたRE音素の一部を形成する発音区別符のサイズを変更するためのコントロール(図示せず)も含む。こうした符号が小さいほど、レンダリングされたREは標準英語によりよく似るようになる。
図10は、一実施形態に従って表示するために強化RE符号化文書160をレンダリングしたレンダリング装置701のディスプレイ714のメインウィンドウ1000を例示する。メインウィンドウ1000は、選択部1010を含む。ユーザは選択部1010においてコントロール1015を起動して、元のSEテキスト又はレンダリングされたREテキストを表示させることができる。また、1つの実装において、選択部1010は、全ての固有名詞等の単語のクラス全体がSE又はレンダリングされたREとして表示されることを可能にするためのコントロール(図示せず)も含む。更なる実装では、選択部1010は、品詞によってレンダリングされる単語のフォーマットを変更するためのコントロール(図示せず)、例えば、名詞、動詞等に対して異なる色も含む。
入力装置713は、例えば、レンダリングされた単語にカーソルをマウスオーバし、又はタッチスクリーンの場合は接触することによって、ユーザがレンダリングされたRE単語を選択することを可能にする。選択部1010は、SEとして選択された単語を表示すること及びレンダリングされたREとしてそれを表示することをトグルするためのコントロール1020を含む。レンダリングされた単語の選択に応じて、レンダリング装置701は、強化RE符号化文書160から選択された単語に関連する補足情報を抽出して、選択部1010において補足情報を表示する。例えば、図10において、現在選択されている単語“today”は、上記「ハイライト色」を使用してウィンドウ1000のディスプレイ部1020にハイライトされている。現在選択されている単語及び現在選択されている単語に関連する補足情報、例えば、単語の定義及び選択された外国語へのその翻訳(この場合フランス語)が、選択部1010に表示される。更に、補足情報のオーディオ部分は、対応するコントロールの選択(「単語を読む」又は「音節で読む」)で、単語全体として、又は音節で分割されて、RE対応音声合成器によって発話される。この機能は、あまり知らない単語の意味又は発音をユーザが明確にすることを可能にすることで、レンダリングされたRE文書180の読み易さを更に強化する。
ウィンドウ1000の底部における再生コントロール1030は、RE対応音声合成器によって補足情報のオーディオ部分の連続的レンダリングを制御する。ユーザは、適切なコントロールを選択することによって単語のオーディオレンダリング間の間隔及びレンダリングの音量を制御することができる。
また、強化RE符号化文書160は、どのようにREを読んで使用すべきかを説明する標準英語の文書及び発音付きの全てのRE音素のリストを含んでもよい。また、強化RE符号化文書160は、読み手の選択した訛りで、音声合成器によって生成される自然に聞こえる英語の発話に完成文書をオーディオレンダリングすることを含んでもよい。
全てのUnicode対応装置がデフォルトでREをレンダリングできることを確実にするために、re_code_displayテーブル450内のdefault_elec及びdefault_print列におけるエントリは、Unicode文字セットから全て取り込まれる。各RE音素に対するdefault_elec及びdefault_print列のエントリは、視覚キュー(通常は発音区別符)をRE音素に対する基本書記素、即ち、RE音素が見つかる表1及び表2の行に対応する書記素に追加することによって得られる。追加された視覚キューは、基本書記素の発音の変種として音素の発音を示すように適合される。例えば、表6に示されるように、書記素“e”に対応する表1の行に見つかるRE音素“e2”(長音“e”)のデフォルト電子表現は、
Figure 0006069211
(Unicode文字0113)であり、上線は基本母音が「伸ばされる」ことを示す。同様に、書記素“e”に対応する表1の行に見つかるRE音素“e3”(schwa “e”)のデフォルト電子表現は
Figure 0006069211
(Unicode文字0115)であり、上に置かれたu字状の単音記号は基本母音が“uh”と「中和される(neutralized)」ことを示す。
「無音」RE音素のデフォルト表現、即ち、表1の第9列及び表2の第9列は、音素が発音されないことを示すために選択される。1つの実装において、表1に示されるように、この指示はこの無音の音素に関連付けられる基本書記素を「グレイアウト」することによって達成される。例えば、書記素“e”に対応する表1の行の第9列に見つかるRE音素“e9”(無音の“e”)のデフォルト電子表現は、基本書記素、即ち、“e”のグレイアウトバージョンである。他の実装では、デフォルト表現は基本書記素の「外形線(outline)」バージョン又は基本書記素の「取り消し線(strikethrough)」バージョンである。無音の音素のデフォルト表現は、好ましくは、「無音」の音素の外見を維持しつつ、レンダリングされたREテキストが「カットアンドペースト」されることができるように選択される。
表7は、re_code_displayテーブル450内のdefault_elec及びdefault_print列からのRE音素のデフォルト表現を含む。
Figure 0006069211
追加された各視覚キューは、視覚キューをより覚えやすくするために選択された名前が与えられている。次に、こうした名前は、各RE音素に対して記憶しやすい名前を作るために基本書記素の名前の末尾につけられる。1つより多くの基本書記素に適用されるキューの名前は以下の通りである。
・「トップライン(top line)」は、第2列にある「長音」母音を示し、“a2”は「aトップライン」と名付けられる。
・「アッパーカップ(upper cup)」は、第3列にある“schwa”母音を示し、“a3”は「aアッパーカップ」と名付けられる。
・「トップドット(top dot)」は、第4列にある“i”のような母音を示し、“a4”は「aトップドット」と呼ばれる。
・「トップドットドット(top dot dot)」は、第5列にある“oo”のような母音を示し、“o4”は「oトップドットドット」と名付けられる。
・「フェイス(face)」は第6列にある「長音e」のような母音を示し、“i6”は「iフェイス」と名付けられる。
・「スクイグル(squiggle)」は第6列にある「短音oo」のような母音を示し、“o6”は「oスクイグル」と名付けられる。
・「トップハット(top hat)」は第3列にある協和音の「帯気音(aspiration)」を示し、“c3”は「cトップハット」と名付けられる。
表7におけるデフォル表現の一部は単一のUnicode文字ではない。その代わり、それらはUnicode「結合文字」を使用して取得され、これは結合文字の直前の「メイン」文字の修正としてレンダリングされる特殊文字である。例えば、RE音素a7のデフォルト表現は、Unicode結合文字036C(小さく上に書かれた“r”)が後に続くUnicode文字0061(“a”)である。
RE音素のデフォルト表現の派生の結果として、デフォルトでレンダリングされたREは、実質的に、音素表記的に等価な元のSEの形状又は綴りを保持する。この理由は、ほとんどのレンダリングRE単語は、音素表記的復号を支援するために音節境界及び視覚キューを使用すると同時に、元のSE単語と同じ基本書記素を使用するからである。
その結果、時間と共に、デフォルトでレンダリングされたREの読み手は、非音素表記的単語の「視覚単語認識」を発達させることで、実質的に同じ形状を有する等価なSE単語を認識することができる。このようにして、デフォルトでレンダリングされたREは、人がSEテキストを読むことを学習するのを支援するように適合された中間フォーマットとして機能する。更に、SEの熟練の読み手は、デフォルトでレンダリングされたREの形状とよく知っている等価なSE単語との類似性により視覚単語認識技術を効果的に働かせることができるので、デフォルトでレンダリングされたREを容易に読むことができる。
しかしながら、“X”と分類されたRE符号化単語の少なくとも1つの音節は対応する基本書記素が対応するSE音節を綴らないRE音素を含むので、“X”と入力分類されたRE符号化単語はソースSE単語の綴りを実質的に保持するようにレンダリングすることができない。これがステップ360を参照して言及したX分類された単語の二重符号化の理由である。方法800の結果、X分類された単語が直後に特殊フォーマットでレンダリングされたRE等価単語と共に元のSEでレンダリングされることになる。上記表1及び表2で定義されたRE音素の組によって、標準英語の単語の1%のみが“X”と分類されると推定されるが、“one”等の多くの一般的な単語がこの入力分類に該当する。
“X”分類された二重符号化単語の数は、RE音素の組のサイズを大きくすることで減少されてもよい。しかしながら、上記のように、このような動作はレンダリングされたREが容易に学習可能であることを確実にするという目的に反する。
付録Bは、Dr Martin Luther King, Jr牧師の演説“I have a dream”の冒頭部分に対してレンダリングされたREのサンプルであり、この最初の文がRE符号化形態で付録Aに見えている。付録Bでは、音節境界が中線ドット(・)としてレンダリングされ、“X”分類単語の特殊フォーマット(例えば第3段落の中央にある“one”等)は角括弧([])による囲みである。第2段落の第1行にある“five”の最後の“e”等の無音音素はグレイテキストで表されている。
記載された配置は出版業界に適用可能である。
上記は本願発明の一部の実施形態のみを記載しており、発明の範囲及び精神から逸脱することなく修正及び/又は変更が可能であり、実施形態は例示的であって限定的ではない。
[付録A]
Figure 0006069211
[付録B]
Figure 0006069211

Claims (12)

  1. 音素表記的に符号化されたテキスト文書をレンダリングするコンピュータ実装方法であって、レンダリングされると前記音素表記的に符号化されたテキスト文書は1つ以上の音素表記的に符号化された単語及び1つ以上の未符号化としてタグ付けされた単語を含み、各音素表記的に符号化された単語は1つ以上の音節を含み、各音節は既定の音素の組からの音素のシーケンスを含み、前記音素の組における各音素は1つ以上の英単語における前記音素として発音される基本書記素に関連付けられ、前記方法は、
    前記音素表記的に符号化されたテキスト文書における各単語に対して、前記単語が未符号化の単語としてタグ付けされているかどうかを決定するステップと、
    前記単語が未符号化の単語としてタグ付けされているかどうかの決定に基づいて前記音素表記的に符号化されたテキスト文書からの前記単語をレンダリングするステップであって、
    コンピュータ装置と通信するデータベースにおいて、既定の音素の組からの前記未符号化の単語又は前記未符号化の単語の音節と関連付けられる符号化された音素のシーケンスを参照することであって、前記シーケンスは前記未符号化の単語又は前記未符号化の単語の音節と音素表記的に等価であること、及び
    符号化された音素の前記シーケンスを使用して前記未符号化の単語又は前記未符号化の単語の音節をレンダリングすることであって、レンダリングされた単語又はレンダリングされた音節のそれぞれは前記未符号化の単語又は前記未符号化の単語の音節の視覚的構造情報を保持すること
    を含むステップと
    を含む、方法。
  2. 前記レンダリングは、前記単語が音素表記的に符号化された単語である場合、
    前記音素表記的に符号化された単語における各符号化された音素に対して、前記音素に対応する表示テーブル内のエントリを取得するステップであって、前記エントリは前記音素に対応する前記基本書記素であり、1つ以上の視覚キューが前記音素の発音を示すように適合されるステップと、
    前記エントリをディスプレイに出力するステップと
    を含む、請求項に記載の方法。
  3. 前記取得するステップは、前記ディスプレイが印刷であるか又はWeb/HTMLであるかどうかに依存する、請求項に記載の方法。
  4. 更なるテーブルに依存して前記音素表記的に符号化された単語における音節境界をレンダリングするステップを更に含む、請求項又はに記載の方法。
  5. 前記レンダリングするステップは、コントロールオプションがアクティブ化されたかどうかを検出して、前記コントロールオプションを検出すると、前記未符号化の単語又は前記符号化された単語をレンダリングすることを更に含む、請求項に記載の方法。
  6. 前記レンダリングするステップは、コントロールオプションがアクティブ化されたかどうかを検出して、前記コントロールオプションを検出すると、単語のクラス全体を未符号化の単語又は符号化された単語としてレンダリングすることを更に含む、請求項に記載の方法。
  7. 前記レンダリングするステップは、コントロールオプションがアクティブ化されたかどうかを検出して、前記コントロールオプションを検出すると、フォーマットを変更することにより前記未符号化の単語又は前記符号化された単語をレンダリングすることを更に含む、請求項に記載の方法。
  8. 前記レンダリングするステップは、前記単語が音素表記的に符号化された単語である場合、
    前記音素表記的に符号化された単語が特殊フォーマットでタグ付けされているかどうかを決定するステップと、
    前記音素表記的に符号化された単語が特殊フォーマットでタグ付けされているかどうかの決定に基づいて前記音素表記的に符号化された単語をレンダリングするステップと
    を更に含む、請求項に記載の方法。
  9. 前記レンダリングするステップは、前記音素表記的に符号化された単語が特殊フォーマットでタグ付けされている場合、前記音素表記的に符号化された単語を前記特殊フォーマットでレンダリングするステップを含む、請求項に記載の方法。
  10. 前記レンダリングするステップは、
    前記音素表記的に符号化されたテキスト文書から前記単語に関連する補足情報を抽出するステップと、
    前記レンダリングされた単語の選択に応じて、前記補足情報を表示するステップと
    を更に含み、前記補足情報は、
    前記単語の定義、
    前記単語の発音のオーディオ表現、
    前記単語の前記発音のビデオ表現、
    前記符号化されたテキスト文書の言語とは異なる言語への前記単語の翻訳、及び
    前記異なる言語における前記単語の音素表記的表現
    から構成されるグループの1つ以上を含む、請求項の何れか1項に記載の方法。
  11. 音素表記的に符号化されたテキスト文書をレンダリングする装置であって、
    メモリと、
    前記メモリに記憶された命令を実行するように適合されるプロセッサであって、前記命令は音素表記的に符号化されたテキスト文書をレンダリングする方法を前記プロセッサに実行させるように構成されるプロセッサと
    を備え、レンダリングされると前記音素表記的に符号化されたテキスト文書は1つ以上の音素表記的に符号化された単語及び1つ以上の未符号化としてタグ付けされた単語を含み、各音素表記的に符号化された単語は音節境界によって分離される1つ以上の音節を含み、各音節は既定の音素の組からの音素のシーケンスを含み、前記音素の組における各音素は1つ以上の英単語における前記音素として発音される基本書記素に関連付けられ、前記方法は、
    前記音素表記的に符号化されたテキスト文書における各単語に対して、前記単語が未符号化の単語としてタグ付けされているかどうかを決定するステップと、
    前記決定に基づいて前記音素表記的に符号化されたテキスト文書からの前記単語をレンダリングするステップであって、
    コンピュータ装置と通信するデータベースにおいて、既定の音素の組からの前記未符号化の単語又は前記未符号化の単語の音節と関連付けられる符号化された音素のシーケンスを参照することであって、前記シーケンスは前記未符号化の単語又は前記未符号化の単語の音節と音素表記的に等価であること、及び
    符号化された音素の前記シーケンスを使用して前記未符号化の単語又は前記未符号化の単語の音節をレンダリングすることであって、レンダリングされた単語又はレンダリングされた音節のそれぞれは前記未符号化の単語又は前記未符号化の単語の音節の視覚的構造情報を保持すること
    を含むステップと
    を含む、装置。
  12. プロセッサで実行可能なコンピュータコードを含むコンピュータプログラムであって、前記コードは請求項10の何れか1項に記載の方法を前記プロセッサに実行させるように構成される命令を含む、コンピュータプログラム。
JP2013541155A 2010-12-02 2011-12-02 テキスト変換及び表現システム Active JP6069211B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2010905304A AU2010905304A0 (en) 2010-12-02 Text conversion system
AU2010905304 2010-12-02
PCT/AU2011/001572 WO2012071630A1 (en) 2010-12-02 2011-12-02 Text conversion and representation system

Publications (2)

Publication Number Publication Date
JP2014504398A JP2014504398A (ja) 2014-02-20
JP6069211B2 true JP6069211B2 (ja) 2017-02-01

Family

ID=46171105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013541155A Active JP6069211B2 (ja) 2010-12-02 2011-12-02 テキスト変換及び表現システム

Country Status (7)

Country Link
US (2) US10521511B2 (ja)
EP (1) EP2646932A4 (ja)
JP (1) JP6069211B2 (ja)
AU (1) AU2011335900B2 (ja)
CA (1) CA2818004C (ja)
WO (1) WO2012071630A1 (ja)
ZA (1) ZA201303527B (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2818004C (en) 2010-12-02 2020-07-14 Accessible Publishing Systems Pty Ltd Text conversion and representation system
DE102012202407B4 (de) * 2012-02-16 2018-10-11 Continental Automotive Gmbh Verfahren zum Phonetisieren einer Datenliste und sprachgesteuerte Benutzerschnittstelle
US9489351B2 (en) * 2013-03-15 2016-11-08 The Dun & Bradstreet Corporation Enhancement of multi-lingual business indicia through curation and synthesis of transliteration, translation and graphemic insight
US8965129B2 (en) 2013-03-15 2015-02-24 Translate Abroad, Inc. Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices
JP6317772B2 (ja) 2013-03-15 2018-04-25 トランスレート アブロード,インコーポレイテッド 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
US9594742B2 (en) * 2013-09-05 2017-03-14 Acxiom Corporation Method and apparatus for matching misspellings caused by phonetic variations
WO2016044879A1 (en) * 2014-09-26 2016-03-31 Accessible Publishing Systems Pty Ltd Teaching systems and methods
USD749115S1 (en) 2015-02-20 2016-02-09 Translate Abroad, Inc. Mobile device with graphical user interface
US10553199B2 (en) * 2015-06-05 2020-02-04 Trustees Of Boston University Low-dimensional real-time concatenative speech synthesizer
IN2015CH05327A (ja) * 2015-10-05 2015-10-16 Wipro Ltd
US10387543B2 (en) * 2015-10-15 2019-08-20 Vkidz, Inc. Phoneme-to-grapheme mapping systems and methods
US10102189B2 (en) * 2015-12-21 2018-10-16 Verisign, Inc. Construction of a phonetic representation of a generated string of characters
US10102203B2 (en) * 2015-12-21 2018-10-16 Verisign, Inc. Method for writing a foreign language in a pseudo language phonetically resembling native language of the speaker
US9910836B2 (en) * 2015-12-21 2018-03-06 Verisign, Inc. Construction of phonetic representation of a string of characters
US9947311B2 (en) * 2015-12-21 2018-04-17 Verisign, Inc. Systems and methods for automatic phonetization of domain names
CN106897272B (zh) * 2017-03-27 2020-07-07 杭州师范大学钱江学院 基于英语音节计算方法在可读性评测中的应用方法与平台
CN107193787A (zh) * 2017-04-14 2017-09-22 木仁 一种蒙古文字母变体形式的自适应方法
US11163959B2 (en) * 2018-11-30 2021-11-02 International Business Machines Corporation Cognitive predictive assistance for word meanings
CN110211562B (zh) * 2019-06-05 2022-03-29 达闼机器人有限公司 一种语音合成的方法、电子设备及可读存储介质
WO2021119246A1 (en) * 2019-12-11 2021-06-17 TinyIvy, Inc. Unambiguous phonics system
CN112786002B (zh) * 2020-12-28 2022-12-06 科大讯飞股份有限公司 一种语音合成方法、装置、设备及存储介质
WO2022256026A1 (en) * 2021-06-04 2022-12-08 Google Llc Systems and methods for generating phonetic spelling variations
AU2022228148B2 (en) * 2021-11-16 2023-07-27 Stephen, Christopher Colin Method and system
WO2023087051A1 (en) * 2021-11-16 2023-05-25 Christopher Colin Stephen Method and system
EP4261822A1 (en) * 2022-04-14 2023-10-18 Vivoka Setting up of speech processing engines
CN116821271B (zh) * 2023-08-30 2023-11-24 安徽商信政通信息技术股份有限公司 一种基于音形码的地址识别和规范化方法及系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4193212A (en) 1978-05-17 1980-03-18 Al Kufaishi Hassan A Unified English pronouncing alphabet
US5057020A (en) 1986-04-15 1991-10-15 Cytanovich Kathryn F Reading enabler
US4713008A (en) 1986-09-09 1987-12-15 Stocker Elizabeth M Method and means for teaching a set of sound symbols through the unique device of phonetic phenomena
KR100240637B1 (ko) * 1997-05-08 2000-01-15 정선종 다중매체와의 연동을 위한 텍스트/음성변환 구현방법 및 그 장치
US6108627A (en) * 1997-10-31 2000-08-22 Nortel Networks Corporation Automatic transcription tool
EP0952531A1 (en) * 1998-04-24 1999-10-27 BRITISH TELECOMMUNICATIONS public limited company Linguistic converter
US6077080A (en) * 1998-10-06 2000-06-20 Rai; Shogen Alphabet image reading method
US6322367B1 (en) * 1999-09-23 2001-11-27 Tawanna Alyce Marshall Method and materials for teaching the phonetic code and repairing self esteem
US6474992B2 (en) * 1999-09-23 2002-11-05 Tawanna Alyce Marshall Reference training tools for development of reading fluency
US7089494B1 (en) * 2000-07-07 2006-08-08 American Megatrends, Inc. Data structure, methods, and computer program products for storing text data strings used to display text information on a display terminal
US20020116420A1 (en) * 2000-09-28 2002-08-22 Allam Scott Gerald Method and apparatus for displaying and viewing electronic information
US7277851B1 (en) 2000-11-22 2007-10-02 Tellme Networks, Inc. Automated creation of phonemic variations
AU2003901428A0 (en) 2003-03-24 2003-04-10 Objective Systems Pty Ltd A system and method for formatting and distributing reading material
US20040191731A1 (en) * 2003-03-31 2004-09-30 Stork David G. Paper document-based assistive technologies for the visually impaired
US8131538B2 (en) 2003-09-30 2012-03-06 American Youth Literacy Foundation Phoneme decoding system and method
US7292971B2 (en) * 2003-10-27 2007-11-06 Kuojui Su Language phonetic system and method thereof
US20060088805A1 (en) 2004-10-27 2006-04-27 Narda Pitkethly Reading instruction system and method
WO2006070373A2 (en) * 2004-12-29 2006-07-06 Avraham Shpigel A system and a method for representing unrecognized words in speech to text conversions as syllables
US7617188B2 (en) * 2005-03-24 2009-11-10 The Mitre Corporation System and method for audio hot spotting
US20080082335A1 (en) 2006-09-28 2008-04-03 Howard Engelsen Conversion of alphabetic words into a plurality of independent spellings
WO2008114453A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム
US8851895B1 (en) * 2008-01-29 2014-10-07 Elizabeth M. Morrison Method and system for teaching and practicing articulation of targeted phonemes
CA2818004C (en) 2010-12-02 2020-07-14 Accessible Publishing Systems Pty Ltd Text conversion and representation system

Also Published As

Publication number Publication date
CA2818004A1 (en) 2012-06-07
US10521511B2 (en) 2019-12-31
US20200285812A1 (en) 2020-09-10
AU2011335900B2 (en) 2015-07-16
ZA201303527B (en) 2014-03-26
US20130253903A1 (en) 2013-09-26
EP2646932A1 (en) 2013-10-09
JP2014504398A (ja) 2014-02-20
WO2012071630A1 (en) 2012-06-07
CA2818004C (en) 2020-07-14
AU2011335900A1 (en) 2013-03-28
US11544444B2 (en) 2023-01-03
EP2646932A4 (en) 2017-04-19

Similar Documents

Publication Publication Date Title
JP6069211B2 (ja) テキスト変換及び表現システム
JPH07325824A (ja) 文法チェックシステム
McBride et al. Reading and writing words: A cross-linguistic perspective
JPH07325828A (ja) 文法チェックシステム
Dickinson et al. Language and computers
US20200364265A1 (en) Aid For Dyslexic Readers
US7801722B2 (en) Techniques for customization of phonetic schemes
US20160019201A1 (en) Tone mark based text suggestions for chinese or japanese characters or words
KR20180064041A (ko) 현대 한국어에서 대표할 수 있는 발음으로 중국 전통 음운학 사호이론에 부합하는 중성자모체계와 한글 합자법을 활용한 중문표기 제공방법 및 시스템
US20150127352A1 (en) Methods, Systems, and Tools for Promoting Literacy
US8438005B1 (en) Generating modified phonetic representations of indic words
TW201104643A (en) Language teaching system
JP2014142762A (ja) 外国語の発音表記方法および情報表示装置
Hall Muak Sa-aak: Challenges of an extensive phoneme inventory for a contained Latin-based orthography
US8408914B2 (en) System and method for learning Chinese character script and Chinese character-based scripts of other languages
WO2006051647A1 (ja) テキストデータ構造、テキストデータ処理方法
JP2924089B2 (ja) 日本語発音練習機
JP4247849B2 (ja) 氏名入力装置
US20240193194A1 (en) Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program
Ornan et al. Phonemic conversion as the ideal romanization scheme for hebrew: implications for hebrew cataloging
Saleh et al. Web development considerations for unicode-based text processing in Uyghur language
Vijayanand et al. Named entity recognition and transliteration for Telugu language
Jamoussi et al. Road sign romanization in Oman: The linguistic landscape close-up
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2020014730A1 (en) Learning aid

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150804

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161012

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20161129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161226

R150 Certificate of patent or registration of utility model

Ref document number: 6069211

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250