JP2009193595A - 中国語方言判断プログラム - Google Patents

中国語方言判断プログラム Download PDF

Info

Publication number
JP2009193595A
JP2009193595A JP2009099708A JP2009099708A JP2009193595A JP 2009193595 A JP2009193595 A JP 2009193595A JP 2009099708 A JP2009099708 A JP 2009099708A JP 2009099708 A JP2009099708 A JP 2009099708A JP 2009193595 A JP2009193595 A JP 2009193595A
Authority
JP
Japan
Prior art keywords
user
dialect
chinese
answer
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009099708A
Other languages
English (en)
Other versions
JP4833313B2 (ja
Inventor
Joseph D Becker
ディー.ベッカー ジョセフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2009193595A publication Critical patent/JP2009193595A/ja
Application granted granted Critical
Publication of JP4833313B2 publication Critical patent/JP4833313B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 中国語方言を判断する。
【解決手段】 ユーザの方言を識別するために第1の質問を表示手段に表示し、ユーザからの第1の回答を入力手段から受信し、第1の回答を分析することによりユーザの方言を判断するために該第1の回答が適当であるか否かを判断する。第1の回答が適当である場合には、ユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する。第1の回答が適当でない場合には、第1の回答にもとづいて第2の質問を選択し、ユーザの方言を識別するために第2の質問を表示手段に表示し、ユーザからの第2の回答を入力手段から受信し、第2の回答を分析することによりユーザの方言を判断するために該第2の回答が適当であるか否かを判断する。第2の回答が適当である場合にはユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する。
【選択図】 図5

Description

本発明は、ユーザ適応型音声データシステムに関する。
おおよその言語は、(日本語や韓国語でさえも)容認されている標準発音と、コンピュータ辞書(DOC:dictionaries on computer)を用いて、該言語で書くためのアルファベットと、を有している。中国語は、発音が広範な点と、音標文字の伝統を有しない点と、で独特な言語である。ピンイン・ローマ字化とボポモフォ音標文字とに関する近年の諸発明によって、標準中国語(Mandarin)が表記する標準の役割をある程度までは果たしている。しかしながら、標準中国語は中国語を話す多くの人々にとって、今なお異質なものと受け取られている。
その結果、インプット・メソッド・エディタ(IME)として知られているコンピュータ・ベースの中国語文字入力方法の多くは、当該文字の視覚形態、若しくは、抽象的な数字コードに基づいている。これによって、市場に「悪くてもないよりはまし」という状況が引き起こされ、並外れて効率が悪く骨の折れるいくつかの方法がきわめて一般的になっている。また、音声ベース・インプット・メソッド・エディタがいくつか存在するが、それらの実用性は、ユーザ個人間の方言とローマ字表記習慣とにおけるおびただしい変形によって、著しく阻害されている。
中国語のいくつかの方言、それらの類似点、相違点について多数の研究が行われてきた(例えば、非特許文献1、2参照)。47シリーズの発音試験を用いて話し手の方言を決定することができる、ということも報告されている。
中国語の方言についての研究の進歩により、音声的手法をより効果的に、容易に使用することができる。そのような音声ベース・システムは、充分に洗練されると、最適な解決方法に一番近いものを提供することができる。
チン・チュアン・チェン(Chin Chuan Cheng)、「いくつかの方言の間における関連の測定:DOCと関連リソース("Measuring Relationship Among Dialects : DOC and Related Resources")」、コンピュータ言語学及び中国語言語処理(Computational Linguistics&Chinese Language Processing)、1997年、2.1、41〜72ページ シウェン・マ(Xiwen Ma)、「比較方言学における定量的手法("Quantative Methods in Comparative Dialectology")」、中国語文(Zhongguo Yuwen)、1989年、212、348〜360ページ
本発明は、ユーザのパーソナル・スタイルに基づいて、該ユーザに中国語文章入力を適応させることができる中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体を提供することを目的とする。
本発明は、ユーザのパーソナル・スタイルに基づいて、該ユーザに中国語文章入力を適応させることができるシステム及び方法を提供する。
本発明は、ユーザの方言に基づいて、ユーザが中国語文章入力をカスタマイズすることができるシステム及び方法を提供する。
本発明は、ユーザ特有な発音あるいは個人言語(idiolect)に基づいて、中国語文章入力をカスタマイズすることができるシステム及び方法を提供する。
本発明は、ユーザ特定のスタイルを反映するポータブル・パーソナル・ローマ字・中国語文字変換辞書、若しくは、パーソナル・スペリング辞書を、ユーザが生成することができるシステム及び方法を提供する。
本発明は、ポータブル・パーソナル・ローマ字・中国語音声ルックアップ・テーブルを、ユーザが生成することができるシステム及び方法を提供する。
本発明は、現存の音声入力システムの補助プリプロセッサである、ポータブル・パーソナル・ローマ字・中国語文字変換辞書、若しくは、パーソナル・スペリング辞書を、ユーザが生成することができるシステム及び方法を提供する。
本発明は、現存の音声入力辞書の補助プリプロセッサであるポータブル・パーソナル・ローマ字・中国語音声ルックアップ・テーブルを、ユーザが生成することができるシステム及び方法を提供する。
本発明は、標準的な方言に対して中国語の表意文字をローマ字化することができるシステム及び方法を提供する。
本発明は、ポータブルなパーソナル・ローマ字・中国語文字変換辞書をユーザが生成することができるシステム及び方法を提供する。
本発明は、予め生成されているパーソナル・ローマ字・中国語文字変換辞書を、ユーザが更新することができるシステム及び方法を提供する。
本発明は、ユーザがパーソナル・ローマ字・中国語文字変換辞書を任意の場所で使用することができるように、該パーソナル・ローマ字・中国語文字変換辞書を、ユーザがダウンロードすることができ、及び/又は、任意の場所で生成したパーソナル・ローマ字・中国語文字変換辞書をロードすることができるシステム及び方法を提供する。
本発明は、ユーザの方言を判断することができるシステム及び方法を提供する。
本発明は、一連の質問及びユーザの回答に基づいて、ユーザの方言を判断することができるシステム及び方法を提供する。
本発明は、判断された方言に基づいて、ユーザが中国語文章入力をカスタマイズすることができるシステムおよび方法を提供する。
本発明のシステム及び方法の様々な例示的実施形態によれば、ユーザの方言を判断し、及び/または、ユーザのパーソナル・スペリング辞書を生成することができる。これらの様々な例示的実施形態は、例えば、パーソナル・コンピュータを含む、広範囲の様々な装置において使用することができる。ユーザは1以上のインタビュー・セッションの間に、1以上の質問に回答する。質問は特定の中国語文字に関する質問であり、回答は当該質問に対する回答である。質問は中国語の表意文字であり、回答は当該表意文字についてユーザが所望する相当ローマ字文字列である。ユーザが所望するこれらの相当ローマ字文字列は、当該ユーザのパーソナル・スペリング辞書を構築するために使用される。質問は方言であり、回答は当該質問に対する回答である。
パーソナル・スペリング辞書は、ユーザが1の場所で当該パーソナル・スペリング辞書を生成することができ、別の場所で当該パーソナル・スペリング辞書を使用することができるように、ポータブルである。
回答は、ユーザの方言を判断するためにも用いることができる。ユーザが所望する相当ローマ字文字列は、ユーザの方言を判断するために用いることができる。
本発明の第1の態様は、複数の方言の中から中国語の方言を選択する機能と、選択された前記中国語の方言において存在しないシラブルに対応する音声コンビネーションを除外する音声コンビネーションのマトリックスを表示手段に表示する機能と、表示された音声コンビネーションの前記マトリックスから音声コンビネーションを選択する機能と、選択された前記音声コンビネーションに相当する第1のローマ字を定義するためにユーザによって使用されるユーザインターフェースを前記表示手段に表示する機能と、選択された前記中国語の方言における選択された前記音声コンビネーションに対応する第1の中国語の文字を前記表示手段に表示する機能と、前記第1の中国語の文字と相当する第1のローマ字とを対応付ける機能と、ユーザの方言を識別するために第1の質問を前記表示手段に表示する機能と、ユーザからの第1の回答を入力手段から受信する機能と、前記第1の回答を分析することによりユーザの方言を判断するために該第1の回答が適当であるか否かを判断する機能と、前記第1の回答が適当である場合には、ユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、前記第1の回答が適当でない場合には、前記第1の回答にもとづいて第2の質問を選択する機能と、ユーザの方言を識別するために前記第2の質問を表示手段に表示する機能と、ユーザからの第2の回答を前記入力手段から受信する機能と、前記第2の回答を分析することによりユーザの方言を判断するために該第2の回答が適当であるか否かを判断する機能と、前記第2の回答が適当である場合にはユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、をコンピュータに実現させるためのプログラムであって、前記第1の質問および第2の質問は、前記表示手段に表示される表意文字についての質問を含み、該第1の質問および第2の質問に対する回答は表示される前記表意文字に相当するローマ字を含む。
本発明の第2の態様は、第1の態様のプログラムであって、パーソナルスペリング辞書を入出力手段を介して入出力する機能、をさらに有し、前記パーソナルスペリング辞書は、選択された前記中国語の方言において少なくとも一つの音声コンビネーションの各々に相当する少なくとも一つのローマ字を含む。
本発明の第3の態様は、第1の態様のプログラムであって、音声コンビネーションの前記マトリックスは、第1の軸に母音フォニームリストを配置し、第2の軸に子音フォニームリストを配置したマトリックスである。
本発明の中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体は、音声コンビネーションを選択し、選択された前記音声コンビネーションの第1のローマ字相当語を定義するようにしているので、ユーザのパーソナル・スタイルに基づいて、該ユーザに中国語文章入力を適応させることができる。
本発明による中国語文章入力システムのインタビュー・インターフェイスの例示的実施形態の1を示す。 本発明のパーソナル・スペリング辞書を構築する方法の第1の例示的実施形態の概要を示すフローチャートである。 本発明のパーソナル・スペリング辞書を構築する方法の第2の例示的実施形態の概要を示すフローチャートである。 本発明のパーソナル・スペリング辞書を構築する方法の第2の例示的実施形態の概要を示すフローチャートである。 本発明によるユーザの方言を判断する方法の例示的実施形態の1の概要を示すフローチャートである。 本発明による中国語文章入力システムの例示的実施形態の1を示すブロック図である。
図1は、本発明によるパーソナル・スペリング辞書を生成することができる、インタビュー・インターフェイス1000の代表的実施形態の1を示している。図1に示されるように、このインタビュー・インターフェイス1000は、音声テーブル1100とステータス・パネル1200とを備えている。インタビュー・セッションの間に、ローマ字化パネル1300は、図1に示されるように、初期化および表示されてもよい。
音声テーブル1100は、複数の可能な音声コンビネーションを含む。音声テーブル1100の上方部分を横切って、母音フォニーム・リスト1110が水平に配置されている。音声テーブル1100の左側部分に沿って子音フォニーム・リスト1120が垂直に配置されている。しかしながら、母音フォニーム・リスト1110および子音フォニーム・リスト1120は、異なった方法によって、及び/または、音声テーブル1100の異なった部分に配置することができる、ということが認められるべきである。音声テーブル1100はいくつかのセルに分割されており、セルの各々は、対応する母音フォニームおよび子音フォニームに関連する音声コンビネーションを表している。例えば、セル1160は、母音フォニーム「a」と子音フォニーム「m」とに関連している。
これらの母音フォニーム・リスト1110および子音フォニーム・リスト1120は、標準的なものとして使用されている中国語方言から得られたものである。この方言は標準中国語である。しかしながら、この標準的な方言は、広東語、福建語あるいは上海語であってもよい。
母音フォニーム・リスト1110は、母音、遷移母音およびこれらのコンビネーションを含む。例えば、このリストには、シンプル・フォニームである「a」、「o」および「e」と、複合フォニームであり二重母音である「uo」、「uang」および「ua」が含まれている。
音声テーブル1100には(図示しない)トーン・パネルが含まれていてもよい。このトーン・パネルは、中国語の単語および中国語の単語の一部を発音するのに使用されるトーンおよびトーン・パターンの差異を反映するために使用することができる。
音声テーブル1100において、音声コンビネーションを表しているセルには、特定の方言あるいは特定の個々の個人言語の認容性を反映するために相異なる色あるいは濃淡が付けられていてもよい。図1に示された例示的実施形態では、これらのセルは、3の濃淡、すなわち、黒色セル1130、白色セル1140、および、灰色セル1150で表されている。この例示的実施形態では、黒色セル1130は、このセルに関連した母音フォニームと子音フォニームとで表された音声コンビネーションが標準的方言のような、適用されている方言あるいは個人言語では認容されないということを示している。すなわち、子音フォニームおよび母音フォニームのこのようなコンビネーションはあり得ず、また、音声テーブル1100を構築するために用いられた適用されている方言あるいは個人言語に生じることはない。白色セル1140は、このセルに関連した母音フォニームと子音フォニームとで表された音声コンビネーションが与えられている方言あるいは個人言語で認容されており、かつ、実際に使われている(つまり実際に生じる)ということを示している。灰色セル1150は、このセルに関連した母音フォニームと子音フォニームとで表された音声コンビネーションが認容されている(つまり生じる)ものの、適用されている方言あるいは個人言語に生じることがないということを示している。すなわち、このようなコンビネーションは音声的には可能であるものの、このような音声コンビネーションは、適用されている方言あるいは個人言語では、実際には、何れの語にもまったく生じないのである。
白色セル1140の各々は、該セルに関連した母音フォニームと子音フォニームとで決定された発音を有する1以上の中国語文字あるいは表意文字に関連していてもよい。すなわち、1の発音は2以上の文字で共用されることもある。また、図1に示された音声テーブル1100では、白色セル1140の各々は、マウス、トラックボールなどのような入力装置あるいは選択装置を用いた選択などにより稼動され、該セルに関連した中国語文字あるいはシラブルの発音についてのローマ字化セッションを初期化することができる。以下に、詳細を記載する。
図1に示された音声テーブル1100についてのある例示的実施形態では、灰色セル1150の各々も、マウス、トラックボールなどのような入力装置あるいは選択装置を用いた選択などにより稼動され、該セルに関連した中国語文字あるいはシラブルの発音についてのローマ字化セッションを初期化することができる。以下に、詳細を記載する。
ステータス・パネル1200は、インタビュー・セッションの状態および状況を表す。ヘッダー1210は、インタビュー・インターフェイスの名前を示す。インタビュー・インターフェイスの開発者が、該名前を決定することができる。名前は、ユーザの各々のためにカスタマイズすることもできる。プログレス・インジケータ1220は、インタビューあるいはインタビュー・セッションが進行中であるか、あるいは、完了したかを示すものである。このプログレス・インジケータ1220は、「進行中」および「完了(Done!)」のような表示語句を示すことによって、進行の状況を示す。
方言インジケータ1232は、適用されている方言あるいは個人言語として使用されている方言を示し、該方言の母音フォニームおよび子音フォニームが音声テーブル1100に表示される。この方言インジケータは、標準的な方言として使用されている方言が標準中国語であるか、広東語、福建語、上海語のような他の方言であるか、個人言語であるか、を表示する。適用されている方言あるいは個人言語は、インタビュー・インターフェイス1000を開始する前に選択することができる。適用されている方言あるいは個人言語は、図示されない方言リストあるいは選択グラフィカル・ユーザ・インターフェイス・ウィジェットを稼動させて、リストに記載された方言のセットからある方言を選択することなどによって、インタビュー・インターフェイス1000が作動している間に選択及び変更することもできる。フォント・インジケータ1234は、音声テーブル1100における母音フォニームおよび子音フォニームのような音声データ、および/または、ローマ字化パネル1300に示された中国語文字あるいは表意文字を示すために用いられるフォントを表示するものである。以下に、詳細を記載する。
インタビュー・ステータス・インジケータ1238は、音声テーブル1100に示されたインタビューの状態を示す。例えば、インタビュー・ステータス・インジケータ1238は、インタビュー・セッションが行われているかいないかを示す。インタビュー・ステータス・インジケータ1238は、インタビューが「記入(Fill−in)」、「例外(Exceptions)」、「あいまい(Ambiguities)」あるいは「照合(Verify)」のためのものであるかどうかについても表示する。インタビュー・セッションのこれらのタイプの各々については、以下に詳細を記載する。
シラブル・ファイル1242は、ユーザのパーソナル・スペリング辞書を記憶するファイルあるいはデータベースの名前を示す。インタビュー・セッションの間にユーザによって定義されたシラブル、すなわち、セル1140あるいはセル1150の1によって表された音声コンビネーションは、該ユーザのパーソナル・スペリング辞書に記録される。このパーソナル・スペリング辞書はポータブルである。したがって、インタビュー・セッションの間にユーザによって定義されたシラブルは、ローマ字化と対応する1以上の中国語文字との間の変換が定義されたインタビュー・インターフェイスの場所とは関係なく、任意の場所で使用することができる。例えば、1のコンピュータでインタビューの間に構築されたパーソナル・スペリング辞書は、該コンピュータからダウンロードして別のコンピュータへ転送することができ、また、該コンピュータで該パーソナル・スペリング辞書を使用したり、更新したりすることもできる。この転送は、例えば、フレキシブル・ディスク、CD−ROM、ネットワークなどを使用して行うことができる。
単一あいまいファイル1244は、相異なる2つの発音を有する中国語文字を記憶するために用いられるファイルあるいはデータベースの名前を示す。二重あいまいファイル1246は、相異なる少なくとも3つの発音がある中国語文字を記憶するファイルあるいはデータベースの名前を表す。単一あいまいファイル1244および二重あいまいファイル1246は、パーソナル・スペリング辞書の一部であり、かつ、ポータブルでもある。しかしながら、他の様々な例示的実施形態では、これらの単一あいまいファイル1244および二重あいまいファイル1246は、該パーソナル・スペリング辞書と別個であってもよい。
オートオープン・インジケータ1248はオートオープン関数の状態を示す。オートオープン関数がオフ(Off)である場合には、図1に示されたインターフェイスは、ユーザが一連のローマ字化セッションを通してパーソナル・スペリング辞書を構築するために使用されている。セッションの各々は1の音声コンビネーションのために供される。反対に、オートオープン関数1248がオン(On)である場合には、図1に示されたインターフェイスは、一連のインタビュー・セッションを通してユーザのパーソナル・スペリング辞書の大部分を判断するために用いることができる。セッションの各々は相異なる音声コンビネーションのためのものである。すなわち、セッションの各々が完了すると、次のセッションが自動的にオープンされる。ローマ字化セッションおよびインタビュー・セッションは双方とも、ローマ字化パネル1300に関連して以下で詳細に記載されるように、同一のインタビュー・インターフェイスを使用することができる。
オートオープン関数1248がオンである場合には、オートオープン関数1248によって、自動的なインタビュー・セッションで、選択シラブルに関するユーザの所望ローマ字化を決定することができる。オートオープン関数1248によれば、ユーザが介入することなく、音声コンビネーションが自動的に選択され、該音声コンビネーションが表示される。これについては以下で詳細に記載する。ユーザは、子音コンポーネントおよび母音コンポーネントに相当する英字を以下に記載される方法で入力することによって、音声コンビネーションの各々に応答する。本システムは、ユーザのこのような応答を解析することによって、ユーザの方言を判断するために使用することができる。
オートオープン関数1248がオンである場合に、オートオープン関数1248は相異なるモードで機能してもよい。オートオープン関数1248は、音声コンビネーションをシーケンシャルに、ランダムに、あるいは、論理的に選択してもよい。オートオープン関数1248がシーケンシャル・モードで機能するときには、オートオープン関数1248の「次(Next)」オプション・インジケータが強調表示される。このモードでは、オートオープン関数1248は、一連の母音フォニームのリスト1110の関連した母音フォニームがある場所、及び、一連の子音フォニームのリスト1120の関連した子音フォニームがある場所、にしたがい、音声コンビネーションについてのインタビュー・セッションを選択する。オートオープン関数1248がランダム・モードである場合には、オートオープン関数1248の「ランダム(Random)」オプション・インジケータが強調表示される。このモードでは、オートオープン関数は、新しいインタビュー・セッションについての音声コンビネーションをランダムに採択する。
オートオープン関数1248が論理モードである場合には、オートオープン関数1248の「論理」オプション・インジケータが強調表示される。このモードでは、オートオープン関数は、前のセルと次のセルとの間における所定の論理関係に基づいて、音声コンビネーションについてのインタビュー・セッションを選択する。例えば、次のセルは、いくつかの中国語方言の間における類似点および相違点を反映する関係に基づいて選択される。このような選択によれば、方言の間における論理関係が適切に利用され、これにより、音声コンビネーションの何れかが、スキップされ、あるいは、除外される。スキップされた音声コンビネーションは、それらのインタビュー・セッションがユーザのパーソナル・スペリング辞書の決定を促進するために必須あるいは必要ではないようなものである。これによって、計算時間が減少し、したがって効率が増大する。
テーブル・ステータス・インジケータ1250は音声テーブル1100の状態を表示する。テーブル・ステータス・インジケータ1250は、音声テーブル1100が灰色セルを明示的に表示するか否かを示すものである。例えば、灰色セルが示されているということをテーブル・ステータス・インジケータ1250が示しているときには、可能な音声コンビネーションだけを表示するそれらのセルの外観によって、それらのセルを白色セル1140および黒色セル1130から識別することができる。これに対して、灰色セルが表示されていないということをテーブル・ステータス・インジケータ1250が示している場合には、音声テーブル1100には白色セル1140および黒色セル1130だけが表示される。灰色セル1150を使用するなどして示される、可能な音声コンビネーションは、黒色セルの範疇の中にひとまとめにされる。ヘッダー1210、プログレス・インジケータ1220、方言インジケータ1232、フォント・インジケータ1234、インタビュー・ステータス・インジケータ1238、シラブル・ファイル1242、単一あいまいファイル1244、二重あいまいファイル1246および/またはオートオープン・インジケータ1248の1以上、および/または、プログレス・インジケータ1220、インタビュー・ステータス・インジケータ1238および/またはオートオープン・インジケータ1248のオプションの1以上は省略してもよいということが認識されるべきである。同様に、他のオプションが供されてもよい。
図1は、ローマ字化パネル1300の例示的実施形態の1を示している。ローマ字化パネル1300は、ローマ字化セッションを開始したときに表示される。ローマ字化セッションは、ユーザがパーソナル・スペリング辞書を構築するか、あるいは、更新することを所望する場合に開始することができる。このパーソナル・スペリング辞書は、音声辞書のプリプロセッサである音声ルックアップ・テーブルとして実装される。ユーザが中国語文字あるいは中国語文章を、例えば、中国語のワード・プロセッサあるいはワード・エディタに入力することができるように、パーソナル・スペリング辞書を使用することができる。
適用されている方言あるいは個人言語に使用されている音声コンビネーションについて、ユーザは、該音声コンビネーションを自分のパーソナル・スペリング辞書におけるシラブルへローマ字化する。このシラブルはその音声コンビネーションに相当するローマ字である。このローマ字は、適用されている方言あるいは個人言語における標準的なローマ字化音声コンビネーションと同じスペルを有していてもよく、有していなくてもよい。このローマ字相当語は、インタビューのローマ字化セッションの間にユーザによって選ばれる。このローマ字相当語は、該ローマ字相当語がそのユーザ自身の方言に適切に合致するか、該ユーザが中国語を話す話し方に適切に合致するように、選ばれる。
ローマ字相当語は、ローマ字化パネルに適用されている方言の何れかによることなく、かつ/または、ユーザの方言を判断することなく、ユーザが話す中国語の方言に適切に合致するように選ばれる。パーソナル・スペリング辞書を生成するために図1のインターフェイスを使用する場合には、ユーザの介入によってローマ字化セッションを開始することができる。ユーザは、特定の音声コンビネーションを示す音声テーブル1100におけるグリッドをクリックすることで、該音声コンビネーションについてのローマ字化セッションを開始することができる。
ローマ字化セッションは、オートオープン関数1248によって自動的に開始される。上記したように、オートオープン関数1248は、いくつかの音声コンビネーションについてのローマ字化セッションを、該音声コンビネーションに関連した母音フォニームおよび子音フォニームのシーケンシャルな位置によるシーケンシャルな順序で開始することができる。オートオープン関数1248は、ローマ字化のために次の音声コンビネーションがランダムに選択されるランダム方式で、音声コンビネーションについてのローマ字化セッションを開始することもできる。さらに、オートオープン関数1248は、ローマ字化のために、次の音声コンビネーションが典型的な中国語文字のローマ字化間、および/または、中国語方言間における類似点および相違点を反映する試験によって選択される論理的手法で、音声コンビネーションについてのローマ字化セッションを開始することができる。この手法はユーザの方言を判断するために使用することができるが、これについては以下で詳細に記載する。
ローマ字化セッションが開始されると、ローマ字化パネル1300が、図1に示されるように表示される。このローマ字化パネル1300は、例えば、パーソナル・スペリング辞書を生成するか、あるいは、更新する場合に、音声コンビネーションに関連したシラブルを記入するために初期化することができる。この場合、「記入」オプションがインタビュー・ステータス・インジケータ1238に表示される。ローマ字化パネル1300は、予めローマ字化されていた音声コンビネーションのローマ字化を照合するために起動することもできる。この場合、「照合」オプションがインタビュー・ステータス・インジケータ1238に表示される。さらに、ローマ字化パネル1300を、ローマ字化されている音声コンビネーションのローマ字化を更新するために開始することもできる。このように、ユーザのパーソナル・スペリング辞書は、ユーザの自由裁量で修正・変更することができる。
ローマ字化パネル1300は、パネル・ヘッダー1310、情報パネル1320、表意文字パネル1330、第1ポイント・ズーム・ウィジェット1340、第2ポイント・ズーム・ウィジェット1350、オリジナル子音表示ボックス1372、ローマ字化子音表示ボックス1374、オリジナル母音表示ボックス1376、ローマ字化母音表示ボックス1378、追加類義語パネル1382、あいまいパネル1384、除去パネル1386、および、アクション・パネル1360を含む。しかしながら、これらの構成要素の1以上をローマ字化パネル1300から省略することができるということが認識されるべきである。パネル・ヘッダー1310は、ローマ字化されるセルによって示される音声コンビネーションを表示するものである。表意文字パネル1330は、ローマ字化される音声コンビネーションに関連した中国語文字、すなわち、表意文字を示すものである。
情報パネル1320は、表意文字パネル1330に表示されている中国語文字をユーザに容易に理解させるための情報があれば、該情報を表示する。この情報パネル1320に示される内容は、絵、画像、図、色あるいは語句などであってよい。例えば、表意文字パネル1330における中国語文字が「hong」(赤)である場合には、情報パネル1320を赤で示すことで、「hong」が赤色に関係あることをユーザに理解しやすくさせる。また、例えば、表意文字パネル1330に示された中国語文字が「nuu(女性)」である場合には、情報パネル1320は、例えば、モナ・リザのような女性の絵を示すことで、「nuu」が「女性」に関係することをユーザに理解しやすくさせる。
情報パネル1320は、漸次更新することのできるデータベースに関連のあるものであってもよい。そのようなデータベースは、インタビュー・セッションの前に更新することができる。このデータベースは、ローマ字化パネル1300の(図示されない)情報更新グラフィカル・ユーザ・インターフェイス・エレメントによって、インタビュー・セッションの間に更新することもできる。このデータベースは、中国語文字の各々およびすべての中国語文字についての情報を有する要はない。また、ある中国語文字についての情報がある場合には、ローマ字化パネル1300の(図示されない)情報表示方式グラフィカル・ユーザ・インターフェイス・エレメントから選択することによって、絵、語句あるいはムービー・クリップのような、中国語文字についての相異なるタイプの情報を選ぶことができる。
第1ポイント・ズーム・ウィジェット1340および第2ポイント・ズーム・ウィジェット1350はコントロールであり、音声コンビネーションに相当するローマ字が、適用されている方言あるいは個人言語における音声コンビネーション自体と同様のスペリングを有しているか否かを示すために用いられる。第1ポイント・ズーム・ウィジェット1340にチェックマークが付されている場合には、表意文字パネル1330に示された中国語文字に関連した音声コンビネーションに相当するローマ字は、適用されている方言あるいは個人言語における音声コンビネーションと同じである。これに対して、第2ポイント・ズーム・ウィジェット1350にチェックマークが付されている場合には、表意文字パネル1330に表示されている中国語文字に関連した音声コンビネーションに相当するローマ字は、適用されている方言あるいは個人言語における音声コンビネーションとは異なっている。
オリジナル子音表示ボックス1372は、表意文字パネル1330に表示されている中国語文字に関連した音声テーブル1100の子音フォニーム・リスト1120の子音フォニームを示すものである。ローマ字化子音表示ボックス1374は、ユーザが所望したこの中国語文字についての子音フォニームのスペリングとしてユーザによって選ばれて入力されたローマ字の文字列を示すものである。ユーザは、この中国語文字をユーザ自身の方言で発音する方法に基づいて、表意文字パネル1330に表示された中国語文字に関する子音フォニームについてこのローマ字の文字列を選ぶ。
オリジナル母音表示ボックス1376は、表意文字パネル1330に示された中国語文字に関連した音声テーブル1100の母音フォニーム・リスト1110の母音フォニームを示すものである。ローマ字化母音表示ボックス1378は、ユーザが所望したこの中国語文字についての母音フォニームのスペリングとしてユーザによって選ばれて入力されたローマ字の文字列を示すものである。ユーザは、この中国語文字をユーザ自身の方言で発音する方法に基づいてその母音フォニームについて、このローマ字の文字列を選ぶ。
追加類義語パネル1382は、表意文字パネル1330に示されている中国語文字の類義語を任意に入力するためものである。例えば、表意文字パネル1330に示された漢字が「ma」(母:mother)である場合には、「mom」、「mommy」、「dear mother」あるいは「dearest mother」のような類義語をその追加類義語パネル1382で追加することができる。
あいまいパネル1384は、表意文字パネル1330に示されている中国語文字の発音に関連するあいまいなものがあるか否かを示すものである。例えば、あいまいパネル1384は、その中国語文字に相異なる2の発音がある場合には、単一あいまいであることを示すことができる。また、あいまいパネル1384は、その中国語文字に相異なる3以上の発音がある場合には、二重あいまいであることを表示することができる。
除去パネル1386は、表意文字パネル1330に示されている中国語文字に相当するローマ字が、互いに同じ音声コンビネーションを有する中国語文字のグループや、適用されている方言あるいは個人言語における表意文字パネル1330に示されている中国語文字のグループの相当するローマ字の例外であるか、あるいは、これと矛盾しているか否かを示すものである。通常は、適用されている方言あるいは個人言語における他の中国語文字のグループと同じ音声コンビネーションを共用する中国語文字は、これらの中国語文字のグループと同じ相当するローマ字も共用する。この中国語文字は、該中国語文字が該グループの同じ相当するローマ字を共用しない場合には、例外である。このような場合、この中国語文字は、除去パネル1386に表示されているグループの相当する一般的なローマ字から除去される。
例えば、「母」、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字は、標準中国語方言において、「ma」という同じ音声コンビネーションを有する。このため、「母」を表す漢字は、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字が含まれるグループに属するとみなすことができる。通常は、「母」を表す中国語文字に相当するローマ字は、このグループにおける他の漢字の各々に相当するローマ字と同じである。一例をあげると、「母」を表す中国語文字に相当するローマ字がユーザの方言における「mu」であれば、「質問」、「繊維」、「馬」および「批判する」を表す漢字に相当するローマ字は、そのユーザの方言において、普通はやはり「mu」である。
しかしながら、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字に相当するローマ字がすべて「mi」であり、「母」を表す中国語文字に相当するローマ字が「mu」であれば、「母」を表す中国語文字は、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字のグループの例外であるとみなされる。したがって、ユーザが、「母」を表す中国語文字に相当するローマ字として、ローマ字化子音表示ボックス1374の領域およびローマ字化母音表示ボックス1378の領域に、各々「m」および「u」を入力することによって「mu」を示すと、除去パネル1386は、中国語文字のグループの相当するローマ字を示すために「mi」を表示する。該中国語文字のグループは、標準中国語方言においては、「母」を表す中国語文字と同じ音声コンビネーション「ma」を共用し、該グループに対し、ユーザの方言において、「母」を表す中国語文字は例外である。
アクション・パネル1360は、「承認(OK!)」、「適用(Apply!)」、「リセット(Reset!)」および「キャンセル(Cancel!)」のようないくつかの機能オプションを提供する。これらのオプションは、ユーザが、例えば、ローマ字化パネル1300を使用して入力した選択肢を確認したり消去したりするために使用することができる。
パーソナル・スペリング辞書を生成するためにインターフェイス1000を操作する例示的な実施形態の1では、ユーザは、母音フォニーム「a」および子音フォニーム「m」に関連した音声テーブル1100の白色セル1160をクリックする。これによって、ローマ字化セッションが開始され、音声コンビネーション「ma」に関連した中国語文字「母」についてのローマ字化パネル1300が表示される。音声コンビネーション「ma」はヘッダー1310に示される。「母」を表す中国語文字は表意文字パネル1330に示される。このとき、情報パネル1320には何も示されない。この文字に関連した絵、画像、図、色あるいは語句が設定されたり読み込まれたりしたことがまったくなかったからである。
この例では、図1に示されるように、表示されたセル文字および選択されたセル文字に関連して、オリジナル子音表示ボックス1372には子音文字「m」が示され、オリジナル母音表示ボックス1376には母音文字列「a」が示される。ユーザは、ユーザ自身の方言に従って、表示されている文字に関連したローマ字子音文字列およびローマ字母音文字列を選択し、これらのローマ字文字列をローマ字化子音表示ボックス1374およびローマ字化母音表示ボックス1378にそれぞれ入力する。
入力されたローマ字子音文字列およびローマ字母音文字列が音声テーブル1100に適用されている方言におけるローマ字子音文字列およびローマ字母音文字列と同じものである場合には、手入力によりあるいは自動的に、第1ポイント・ズーム・ウィジェット1340にチェックマークが付され、該音声コンビネーションに相当するローマ字が、適用されている方言あるいは個人言語における音声コンビネーションと同じであることが示される。第2ポイント・ズーム・ウィジェット1350にはチェックマークが付されないままである。これに対して、入力されたローマ字子音文字列およびローマ字母音文字列の一方あるいは両方が音声テーブル1100に適用されている方言におけるローマ字子音文字列およびローマ字母音文字列と異なっているものである場合には、手入力によりあるいは自動的に、第1ポイント・ズーム・ウィジェット1340からチェックマークが外されて、手入力によりあるいは自動的に、第2ポイント・ズーム・ウィジェット1350にチェックマークが付される。
図1に示された例では、ユーザは「母」を意味する中国語文字について別の名称を有していない。したがって、当該ユーザは追加類義語パネル1382に何も入力しない。また、当該ユーザは、当該中国語文字については1の発音だけを有している。したがって、ユーザはあいまいパネル1384に何も入力しない。さらに、当該ユーザにとっては、当該中国語文字は同じ音声コンビネーションを共有する中国語文字の一般化グループに対する例外ではない。したがって、ユーザは除去パネル1386に何も入力しない。ユーザは、自分が入力したものを確認したり消去したりするために、アクション・パネル1360の中における適切なオプションを選ぶことができる。ユーザが「承認」オプションを選ぶと、その情報が記録されてローマ字化セッションが実行され、当該中国語文字についてのローマ字化パネル1300が消える。その後、ユーザは、別の音声コンビネーションをローマ字化するか否かを決めることができる。ユーザが別の音声コンビネーションをローマ字化することを望む場合には、ユーザは音声テーブル1100の別のセルを選ぶ。
ローマ字化セッションの各々の後に、行われた変更はステータス・パネル1200にリストされているファイルに保存される。当該ファイルはポータブルである。当該ファイルは、フレキシブル・ディスク、CD−ROMなどによってダウンロードすることができる。当該ファイルは、ネットワークなどによって転送することもできる。
あるセルについての音声コンビネーションに相当するローマ字が決定されると、当該セルにはマークが付されて、当該音声コンビネーションがローマ字化されたことが示される。これは、例えば、当該セルの色および/または明るさを落とすなどの方法で、当該セルの外観を変化させることによって行われる。このようにして、ユーザは、音声コンビネーションがローマ字化された音声テーブル1100におけるセルの外観を識別することができる。
他の様々な例示的実施形態では、音声テーブル1100は、特定の適用されている方言の音声コンビネーションではなく、ユーザの方言の音声コンビネーションを示すために用いられる。この例示的実施形態では、ユーザは、音声テーブル1100に示されたユーザの方言から音声コンビネーションを選択することができ、それをリストから選択することのできる中国語文字に関連付けることができる。
音声テーブル1100には、2のテーブル、すなわち、標準的な方言のような所定の適用されている方言に対応している音声テーブルと、ユーザの方言に対応している音声テーブルと、がある。これら2の音声テーブルを横に並べて配置することができる。これらの音声テーブルを、一方が他方の上に表示されるように配置することもできる。
インターフェイス1000がユーザの方言を判断する方言判断システムによって使用される場合、インターフェイス1000の操作に関する様々な他の例示的実施形態では、当該方言判断システムは、特定の音声コンビネーションを自動的に選択するためにオートオープン関数1248を実行する。図1はインターフェイス1000のそのような使用も示している。この例では、方言判断システムは、母音フォニーム「a」および子音フォニーム「m」に関連した音声コンビネーションを選択して、この音声コンビネーションを示すために、図1のインターフェイス1000を使用している。これによって、ローマ字化セッションが起動するとともに、音声コンビネーション「ma」に関連した「母」を意味する中国語文字についてのローマ字化パネル1300が表示される。この音声コンビネーション「ma」はヘッダー1310に示される。「母」を意味する中国語文字は表意文字パネル1330に示される。情報パネル1320はここでは何も示さないが、それは、この中国語文字に関連した絵、画像、図、色あるいは語句が設定されたり読み込まれたりすることがなかったからである。
この例では、オリジナル子音表示ボックス1372には子音文字「m」が示され、オリジナル母音表示ボックス1376には当該中国語文字に関連した母音文字「a」が示される。ユーザは、ユーザ自身の方言に従って、表示された文字に関連したローマ字子音文字列およびローマ字母音文字列を選択し、そして、これらのローマ字文字列をローマ字化子音表示ボックス1374およびローマ字化母音表示ボックス1378に各々入力する。
ユーザは、自分が入力したものを確認したり消去したりするために、アクション・パネル1360の中における適切なオプションを選ぶことができる。ユーザが「承認」オプションを選ぶと、そのローマ字化セッションが完了し、ローマ字化パネル1300が消える。その後、インターフェイス1000を使用する方言判断システムは、別の音声コンビネーションについての別のインタビュー・セッションを起動するか否かを決めることができる。方言判断システムがユーザの方言を判断するに足りる充分な情報を有していない場合には、この方言判断システムは、通常、別のインタビュー・セッションを起動するであろう。これに対して、方言判断システムがユーザの方言を判断するに足りる充分な情報を有している場合には、この方言判断システムは、そのインタビュー・セッションを停止することができる。
図1に示された実施形態では、ユーザが中国語表意文字を取り出す目的で標準的な方言における音声コンビネーションを選ぶことができるように標準的な方言が用いられるが、他の様々な例示的実施形態では標準的な方言は必要とされない。そのようないくつかの例示的実施形態では、中国語表意文字は、中国語表意文字の外観あるいは中国語表意文字の画数のような様々な他の手段によって、選択され表示される。
図2は、本発明のパーソナル・スペリング辞書を構築する方法に関する第1の例示的実施形態の概要を説明するフローチャートである。本発明の操作は、ステップS100で開始され、ステップS110へ続く。ステップS110では、中国語の表意文字が選択され表示される。上記したように、この中国語表意文字は、標準的な方言における音声コンビネーション、その中国語表意文字の外観、その中国語表意文字の画数、あるいは、その中国語表意文字を選択するための他の適切な技術に基づいて、選択することができる。次に、ステップS120では、ユーザは、ユーザのパーソナル・スタイルあるいはユーザの個々の発音あるいは方言に基づいて、表示されたその中国語表意文字に相当するローマ字を入力する。ステップS130で、入力されたローマ字相当語が記憶される。操作は次いで、ステップS140へ続く。
ステップS140では、次の中国語表意文字をローマ字化するか否かについての判断が行われる。ローマ字化するのであれば、操作はステップS110に戻る。ステップS110では、次の中国語表意文字が選択され表示される。ローマ字化しないのであれば、操作はステップS150へ進み、そこで、本方法の操作は終了する。
図3は、図1に示されたインターフェイス1000を用いて、ユーザのパーソナル・スペリング辞書を構築する方法に関する第2の例示的実施形態の概要を説明するフローチャートである。この第2の例示的実施形態では、図2に概要が示された第1の例示的実施形態にはない、概要が上記された様々な特徴が実装されている。図3に示されるように、本発明の操作はステップS200で開始され、ステップS210へ続く。ステップS210では、特定の方言をそのユーザについての適用されている方言および/またはパーソナル辞書として識別したか否かの判定が行われる。識別しなかった場合には、操作はステップS230へ直接ジャンプする。識別した場合、すなわち、標準的な方言が既知である場合には、操作はステップS220へ進む。
ステップS220では、その適用されている方言の中に存在しないシラブルについての音声コンビネーションにマークが付される。図1に示された例では、その適用されている方言の中に存在しないシラブルについての音声コンビネーションを表しているセルは、音声テーブル1100における黒色セル1130としてマークが付される。音声学的には可能であるもののその適用されている方言では用いられないシラブルについての音声コンビネーションは、音声テーブル1100における灰色セル1150としてマークが付される。音声学的には可能であるものの標準的な方言では用いられないシラブルについての音声コンビネーションも、音声テーブル1100における黒色セル1130としてマークを付すことができる。しかしながら、ステップS210およびステップS220は省略することができる、ということを認識すべきである。その後、操作はステップS230へ続く。
ステップS230では、ローマ字相当語の既知でない音声コンビネーションが選択される。この音声コンビネーションは、インタビュー・セッションが開始されたばかりの場合であれば、最初の音声コンビネーションであるであろう。この音声コンビネーションは、インタビュー開始後、当該インタビューの間に選択されたのであれば、次の音声コンビネーションでもあるであろう。この音声コンビネーションは自動的に選択される。すなわち、この場合には、この音声コンビネーションは、例えば、オートオープン関数1248を用いて選択される。ステップS230では、音声コンビネーションについての最初の音声ローマ字化セッションあるいは次の音声ローマ字化セッションを、ある音声コンビネーションに関連した母音および子音のシーケンシャルな位置によるシーケンシャル順序で選択することができる。ステップS230では、最初の音声コンビネーションあるいは次の音声コンビネーションをローマ字化のためにランダムに選択することができる。加えて、ステップS230では、最初の音声コンビネーションあるいは次の音声コンビネーションを、予めローマ字化された音声コンビネーションどうしの間、および/または、中国語方言どうしの間における類似点および相違点を反映する試験に従ってローマ字化のために選択される論理的手法で選択することができる。最初の音声コンビネーションあるいは次の音声コンビネーションが選択された後に、操作はステップS240へ続く。
ステップS240では、選択された音声コンビネーションに相当する中国語表意文字が表示される。例の1が図1に示されており、ここでは、「母」を意味する中国語文字/表意文字が「ma」の音声コンビネーションに従って示される。次に、ステップS250では、表示された中国語表意文字のローマ字相当語がユーザから得られる。ユーザは、自分がその中国語文字をスペリングし、かつ/または、発音するであろう方法に従って、そのローマ字相当語を入力する。その後、ステップS260では、そのローマ字相当語は、表示された音声コンビネーションに対して記憶され、あるいは、記録される。次に、ステップS270では、他の何らかの音声コンビネーションを導き出すことができるか否かを判断するために、音声データの現在の状態が解析される。操作はその後、ステップS280へ続く。
ステップS270での解析には、類似した中国語文字についてのローマ字相当語を、適用されている方言の特性に基づいて、文字のグループ中の可能な一般的な音声パターンから導き出すことが含まれる。例えば、適用されている方言における子音「z」と母音「ei」とが、各々、ユーザの方言において「zh」および「ai」として常にローマ字化されるということを、その適用されている方言の特性、および/または、ユーザがこれまでに得た情報から決定することができる場合には、その適用されている方言において音声コンビネーション「zei」のあるすべての表意文字に、そのユーザの方言において「zhai」のローマ字相当語がある、という一般論を引き出すことができる。また、適用されている方言における音声コンビネーション「zei」がそのユーザの方言における「zhai」のローマ字相当語に関連付けられる場合、適用されている方言における音声コンビネーション「shun」は、あらかじめローマ字化された中国語表意文字どうしの間および/または中国語方言どうしの間における類似点および相違点に基づいて、ユーザの方言における「xong」のローマ字相当語に関連付けしなければならない、ということを導き出すことができる。しかしながら、他の様々な例示的実施形態では、ステップS270は省略することができる。
ステップS280では、ローマ字相当語は、決定された他の音声コンビネーションの何れかについて導き出される。ステップS270に関連して、上記例では、適用されている方言における子音「z」と母音「ei」とが各々、ユーザの方言において[zh]および「ai」として常にローマ字化されるということを決定することができる場合には、その適用されている方言において音声コンビネーション「zei」があるすべての表意文字は、適用されている方言において音声結合「zei」がある表意文字の各々についてインタビューする必要なく、そのユーザの方言における「zhai」として自動的にローマ字化されるであろう。また、ステップS270に関連して上記されたように、適用されている方言における音声コンビネーション「shun」があるすべての表意文字は、適用されている方言における音声コンビネーション「shun」がある表意文字の何れかについてインタビューする必要なく、そのユーザの方言における「xong」として自動的にローマ字化されるであろう、ということを導き出すことができる。操作はその後、ステップS290へ続く。
ステップS290では、決定された他の音声コンビネーションについて各々導き出されたローマ字相当語が、記憶されあるいは記録される。その後、ステップS300では、ローマ字相当語が決定されなかった適用されている方言において許容できる音声コンビネーションがあるか否かについての判断が行われる。そのような音声コンビネーションがあれば、操作はステップS310へ続く。そのような音声コンビネーションがない場合には、操作はステップS320へジャンプする。
ステップS310では、ユーザが現在のインタビュー・セッションを終了させたいか否かについての判断が行われる。終了させたくなければ、操作はステップS230へ戻り、ステップS230で次の音声結合が選択される。終了させたい場合には、操作はステップS320へ続き、ステップS320で本方法の操作は終了する。
図2〜図4に示された第1の例示的実施形態および第2の例示的実施形態のうちのいずれかを用いることで、ユーザは、該ユーザが中国語を話す方法を反映するために、パーソナル・スペリング辞書を構築することができる。該パーソナル・スペリング辞書は、適用されている方言に反映される場合と異なっていてもよいし、若しくは、異なっていなくてもよい。音声コンビネーションはユーザによって選択されてもよい。この選択はローマ字相当語が既知でない場合に、されてもよい。ローマ字相当語がユーザによって、あるいは、方言判断セッションによって(例えば、導出によって)、予め定義されていた場合でも、更新のためにこの選択を行うことができる。
本発明によるユーザ適応型のローマ字による中国語文章入力のシステムおよび方法に関する他の様々な例示的実施形態では、ユーザは、本システムがユーザの方言を判断することができるようにするために、ある方言を直接選ぶことで、あるいは、いくつかの方言に関係のある質問に直接回答することで、あるインタビュー・セッションを開始することを選ぶことができる。
図5は、本発明によって、ユーザにより提供されたローマ字化情報を用いてユーザの方言を判断するための方法に関する例示的実施形態の1の概要を説明するフローチャートである。本方法の操作はステップS400で開始され、ステップS410へ続く。ステップS410ではユーザに最初の質問が表示される。この最初の質問の例には、「あなたの方言は何ですか。」、「あなたの方言は何であると思いますか。」、「あなたはどこに住んでいますか。」、「あなたの故郷で話されている方言は何ですか。」などが含まれる。この最初の質問は、図1に示されたインターフェイス1000のようなインターフェイスに示された表意文字についてのものであってもよい。操作はその後、ステップS420へ続く。
ステップS420では、表示された質問に対する回答の入力がユーザから得られる。その回答は、所定の可能な回答のリストから選択されてもよいし、あるいは、キーボードのような装置を通してユーザが入力してもよい。例えば、ユーザは、ある表意文字についてのローマ字相当語でタイプしてもよい。その後、ステップS430では、ユーザの方言をこれまでに得られた情報から判断することができるか否かについての判断が行われる。判断することができるならば、操作はステップS460へジャンプする。判断することができない場合は、操作はステップS440へ進む。
ステップS440では、ユーザから得られた先の答えに基づいて次の質問が決定される。次に、ステップS450では、ステップS440で決定された次の質問がユーザに表示される。操作はその後、ステップS420へ戻る。
ステップS450で表示される次の質問を決定する場合に、次の質問と先の回答との間における関係は、あまり関連のないものから、たいへん関連のあるものまで、の何れであってもよい。例えば、極端な1の場合には、次の質問を決定する場合に、先の回答を論理的に用いて、ユーザの方言を判断するのに何の関係もない質問を排除することができる。これに対して、別の極端な場合には、先の回答にほとんど関係なく、事実上ランダムなやり方で次の質問を決定することができる。これら2つの極端な場合の間として、次の質問の決定を、先の回答に基づいて行うこともできる。
ステップS460では、ユーザの方言が、表示された質問に対するユーザの回答に基づいて判断される。その後、ステップS470では、判断されたその方言が記憶される。操作はその後、ステップS480へ続き、本方法の操作は終了する。
図6は、本発明によるパーソナル・スペリング辞書生成システム100の例示的実施形態の1のブロック図である。図6に示されるように、パーソナル・スペリング辞書生成システム100は、入力/出力インターフェイス110、コントローラ120、メモリ130、音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション140、音声コンビネーション選択回路、ルーチンあるいはアプリケーション150、ローマ字化情報解析回路、ルーチンあるいはアプリケーション180、方言判断回路、ルーチンあるいはアプリケーション190、質問選択回路、ルーチンあるいはアプリケーション200を含み、これらの構成要素の各々は、1以上の制御および/またはデータバスおよび/または1以上のアプリケーション・プログラム・インターフェイス230によって、相互に接続されている。
図6に示されるように、パーソナル・スペリング辞書生成システム100はプログラム式汎用目的コンピュータに実装される。しかしながら、パーソナル・スペリング辞書生成システム100は、特定目的コンピュータ、プログラム式のマイクロプロセッサあるいはマイクロコントローラおよび周辺機器向け集積回路要素、エーシック(ASIC)あるいは他の集積回路、デジタル・シグナル・プロセッサ(DSP)、離散素子回路のようなハードワイヤード電子回路あるいは論理回路、PLD、PLA、FPGAあるいはPALなどのようなプログラム式論理装置に実装することもできる。一般に、図2〜図5に示されるフローチャートを実行することのできる有限状態機械を導入することのできる何らかの装置は、パーソナル・スペリング辞書生成システム100を実装するために使うことができる。パーソナル・スペリング辞書生成システム100は音声ベース・インプット・メソッド・エディタのプリプロセッサである。
入力/出力(I/O)インターフェイス110は複数のコンポーネントを有していてもよい。このI/Oインターフェイス110はパーソナル・スペリング辞書生成システム100の外部とインターアクトする。例えば、I/Oインターフェイス110は、1以上のユーザ入力装置300からリンク310を経てユーザの入力を受ける。I/Oインターフェイス110は、表示装置400へリンク410を経て情報を出力する。1以上のユーザ入力装置300は、マウス、トラックボール、キーボード、ジョイスティックなどであってよい。1以上のユーザ入力装置300は、インタラクティブ・スクリーンに表示されたグラフィカル・ユーザ・インターフェイス・ウィジェットとインターアクトしてもよい。1以上の表示装置400は、表示スクリーン、インタラクティブ・スクリーンなどであってよい。
図6に示されるように、メモリ130は、変更可能メモリ、揮発性メモリ、不揮発性メモリ、変更不可メモリあるいは固定メモリのうち適切な任意の組み合わせを用いて実施することができる。変更可能メモリは、揮発性であっても不揮発性であってもよく、スタティックRAMあるいはダイナミックRAM、フレキシブル・ディスクとそのディスク・ドライブ、書込可能あるいは再書込可能光ディスクとそのディスクドライブ、ハードディスクドライブ、フラッシュメモリなどのうち、1以上の任意の組み合わせを用いて実施することができる。同様に、変更不可メモリあるいは固定メモリは、ROM、PROM、EPROM、EEPROM、CD−ROMやDVD−ROMのような光ROMディスクとこれらのディスクドライブなどのうち、1以上の任意の組み合わせを用いて実施することができる。図6に示されるように、メモリ130は、相異なる方言の音声データを記憶する音声データ部131、パーソナル・スペリング辞書生成システム100によって生成され、かつ/または、更新されたパーソナル辞書と関連ファイルとを記憶する辞書部132、ユーザからの入力を記憶するユーザ入力部133、インタビュー・セッションの情報を記憶するインタビュー部134、そして、オプションとして、ユーザの方言を判断する場合に尋ねられる質問を含むことのできる質問情報を記憶する質問部135の、1以上が含まれている。
図6に示されている様々な回路、ルーチンあるいはアプリケーションは、コンピュータ・ソフトウェア、実行可能なコンピュータ・コードなどを含むが、これらに限定されるものではなく、プログラム可能なあるいはプログラムされた回路、ルーチンあるいはアプリケーションであってよい。図6に示されているパーソナル・スペリング辞書生成システム100では、音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション140は、ある方言に存在しないシラブルの音声コンビネーションにマークを付けるために機能する。音声コンビネーション選択回路、ルーチンあるいはアプリケーション150は、1以上のローマ字相当語が定義される音声コンビネーションを選択する。図示されない表示回路、ルーチンあるいはアプリケーションは、インタビュー・インターフェイス1000および/またはローマ字化パネル1300のような表示されたユーザ入力スクリーンを変更して、選択された音声コンビネーションに相当する中国語表意文字を表示装置400に表示する。
コントローラ120は、辞書部132にローマ字化情報を記憶する。中国語表意文字に応じて、ユーザによりローマ字化パネル1300に入力される及び/又は定義されるローマ字相当語情報のような該ローマ字化情報は、ユーザにより、1以上のユーザ入力装置300及び/又は表示されているユーザ入力スクリーンを使用して入力される。ローマ字化情報解析回路、ルーチンあるいはアプリケーション180は、実施されるのであれば、何らかの音声コンビネーションを導出することができるか否かを判断するために音声データの状態を解析し、判断された何らかの付加的音声コンビネーションについてのローマ字相当語を導出し、かつ/または、記憶する。方言判断回路、ルーチンあるいはアプリケーション190は、備えられているのであれば、ある方言を辞書部132および/またはインタビュー部134に記憶された利用可能な情報から判断することができるか否かを判断する。質問選択回路、ルーチンあるいはアプリケーション200は、備えられているのであれば、インタビューの間に表示するための質問を決定する。質問部135は、備えられているのであれば、質問選択回路、ルーチンあるいはアプリケーション200が作用する際に、質問選択回路、ルーチンあるいはアプリケーション200が選択する質問を記憶する。
本発明のパーソナル・スペリング辞書生成システム100が作用する場合には、ユーザは、自分のパーソナル・スペリング辞書を構築するために、図6に示されているパーソナル・スペリング辞書生成システム100を使用する。作用中、ユーザは、1以上のユーザ入力装置300およびI/Oインターフェイス110を介して、パーソナル・スペリング辞書生成システム100とインターアクトする。
ユーザが、該ユーザのパーソナル・スペリング辞書を生成するための、あるいは、パーソナル・スペリング辞書にある情報を更新したり、情報の量を増やしたりするための、所望を示すと、質問選択回路、ルーチンあるいはアプリケーション200は、適用されている方言あるいは個人言語を判断するために、質問部135に記憶されている質問情報に基づいて、コントローラ120の制御の下で、質問を選択しあるいは生成する。該質問は、コントローラ120の制御の下で、入力/出力インターフェイス110を介して出力され、表示装置400に表示される。
適用されている方言あるいは個人言語が既知であるか否かを示すために、かつ/または、その適用されている方言あるいは個人言語が何であるかを示すために、ユーザがある回答を入力すると、入力/出力インターフェイス110が、コントローラ120の制御の下で、1以上のユーザ入力装置300からユーザの入力を受け、その回答がユーザ入力部133に記憶される。その回答によって、適用されている方言あるいは個人言語が既知であることと、その適用されている方言あるいは個人言語が何であるかということとが示されると、コントローラ120は、音声データ部131の中に記憶されている、実装されている方言あるいは個人言語を呼び出して、それを音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション140へ転送する。音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション140は、コントローラ120の制御の下で、その適用されている方言あるいは個人言語に存在しないシラブルの音声コンビネーションにマークを付ける。
次に、音声コンビネーション選択回路、ルーチンあるいはアプリケーション150が、1以上のユーザ入力装置300およびI/Oインターフェイス110を介して、ユーザとインターアクトする。例えば、ユーザは、表示装置400に表示された音声コンビネーション・セルを、1以上のユーザ入力装置300を用いて選択することができる。これに応じて、コントローラ120が、ユーザの入力を音声コンビネーション選択回路、ルーチンあるいはアプリケーション150へ転送し、該音声コンビネーション選択回路、ルーチンあるいはアプリケーション150が、表示装置400における選択された音声コンビネーションに関連した表意文字を含んでいるローマ字化パネル1300を、コントローラ120の制御の下で表示する。
さらに、ユーザは、表示装置400のローマ字化パネル1300に表示された表意文字に相当するローマ字を、1以上のユーザ入力装置300を用いて入力することができる。これに応じて、コントローラ120が、ユーザの入力をローマ字化情報解析回路、ルーチンあるいはアプリケーション180へ転送し、該ローマ字化情報解析回路、ルーチンあるいはアプリケーション180が、何らかの音声コンビネーションを導出することができるか否かを決定するために、その入力および/または音声データ部131に記憶されている音声データの状態を、コントローラ120の制御の下で、解析する。音声コンビネーションを導出することがまったくできない場合には、ローマ字化情報解析回路、ルーチンあるいはアプリケーション180は、コントローラ120の制御の下で、ユーザの入力を音声データ部131に記憶する。これに対して、音声コンビネーションを導出することができる場合には、ローマ字化情報解析回路、ルーチンあるいはアプリケーション180は、決定された何らかの付加的音声コンビネーションについてのローマ字相当語をコントローラ120の制御の下で、導出する。その後、ローマ字化情報解析回路、ルーチンあるいはアプリケーション180は、音声データ部131におけるユーザの入力に沿って、決定された付加的音声コンビネーションの何れかについて導出されたローマ字相当語を、コントローラ120の制御の下で、記憶する。
本発明によるパーソナル・スペリング辞書生成システム100の操作についての別の例示的実施形態では、ユーザは、自分のパーソナル・スペリング辞書を読み込みかつ/またはダウンロードするために、図6に示されているパーソナル・スペリング辞書生成システム100を使用する。この例示的実施形態では、ユーザは、1以上のユーザ入力装置300およびI/Oインターフェイス110を用いて、パーソナル・スペリング辞書生成システム100とインターアクトする。コントローラ120は、ユーザのパーソナル・スペリングを辞書部132へアップロードし、あるいは、ユーザのパーソナル・スペリング辞書からダウンロードする。
本発明のパーソナル・スペリング辞書生成システム100の操作についての別の例示的実施形態では、ユーザは、自分の方言を判断するために、図6に示されているパーソナル・スペリング辞書生成システム100を使用する。この例示的実施形態では、ユーザは、1以上のユーザ入力装置300およびI/Oインターフェイス110を用いて、パーソナル・スペリング辞書生成システム100とインターアクトする。
ユーザが、自分の方言を判断する所望を示すと、質問選択回路、ルーチンあるいはアプリケーション200は、コントローラ120の制御の下で、ユーザに尋ねる質問を決定する。質問選択回路、ルーチンあるいはアプリケーション200は、選択された質問を質問部135からリトリーブして、コントローラ120の制御の下で、その質問を表示装置400に表示する。
ユーザが回答を入力すると、入力/出力インターフェイス110がその回答を受信し、コントローラ120の制御の下で、その回答をユーザ入力部133に記憶する。さらに、方言判断回路、ルーチンあるいはアプリケーション190は、コントローラ120の制御の下で、ユーザの方言を判断することができるか否かを判断する。方言判断回路、ルーチンあるいはアプリケーション190がユーザの方言を判断することができないと判断すると、質問選択回路、ルーチンあるいはアプリケーション200は、コントローラ120の制御の下で、ユーザに示すための別の質問を決定する。そして、同様の処理が繰り返される。方言判断回路、ルーチンあるいはアプリケーション190がユーザの方言を判断することができると判断すると、方言判断回路、ルーチンあるいはアプリケーション190は、コントローラ120の制御の下で、ユーザの方言を判断し、判断された方言を記録/記憶するために、インタビュー部134に指示を出す。ユーザの方言が判断された後に、パーソナル・スペリング辞書生成システム100の操作は終了する。ユーザの方言が判断された後、パーソナル・スペリング辞書生成システム100の操作が終了する前に、ユーザの方言の判断を変更するオプションをユーザに提示するようにしてもよい。
本発明のパーソナル・スペリング辞書生成システム100の操作についての別の例示的実施形態では、ユーザは、1以上の対話セッションを介してユーザの方言を判断するために、図6に示されているパーソナル・スペリング辞書生成システム100を使用する。この操作では、ユーザは、ユーザ入力装置300からI/Oインターフェイス110を介してパーソナル・スペリング辞書生成システム100とインターアクトする。ユーザの方言を判断する場合、質問選択回路、ルーチンあるいはアプリケーション200は、ユーザの方言あるいは個人言語を判断することができるように、ユーザへの質問を、コントローラ120の制御の下で、ユーザに表示する。
100 パーソナル・スペリング辞書生成システム
150 音声コンビネーション選択回路、ルーチン、アプリケーション
180 ローマ字化情報解析回路、ルーチン、アプリケーション
1000 インタビュー・インターフェイス

Claims (3)

  1. 複数の方言の中から中国語の方言を選択する機能と、
    選択された前記中国語の方言において存在しないシラブルに対応する音声コンビネーションを除外する音声コンビネーションのマトリックスを表示手段に表示する機能と、
    表示された音声コンビネーションの前記マトリックスから音声コンビネーションを選択する機能と、
    選択された前記音声コンビネーションに相当する第1のローマ字を定義するためにユーザによって使用されるユーザインターフェースを前記表示手段に表示する機能と、
    選択された前記中国語の方言における選択された前記音声コンビネーションに対応する第1の中国語の文字を前記表示手段に表示する機能と、
    前記第1の中国語の文字と相当する第1のローマ字とを対応付ける機能と、
    ユーザの方言を識別するために第1の質問を前記表示手段に表示する機能と、
    ユーザからの第1の回答を入力手段から受信する機能と、
    前記第1の回答を分析することによりユーザの方言を判断するために該第1の回答が適当であるか否かを判断する機能と、
    前記第1の回答が適当である場合には、
    ユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、
    前記第1の回答が適当でない場合には、
    前記第1の回答にもとづいて第2の質問を選択する機能と、
    ユーザの方言を識別するために前記第2の質問を表示手段に表示する機能と、
    ユーザからの第2の回答を前記入力手段から受信する機能と、
    前記第2の回答を分析することによりユーザの方言を判断するために該第2の回答が適当であるか否かを判断する機能と、
    前記第2の回答が適当である場合にはユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、
    をコンピュータに実現させるためのプログラムであって、
    前記第1の質問および第2の質問は、前記表示手段に表示される表意文字についての質問を含み、該第1の質問および第2の質問に対する回答は表示される前記表意文字に相当するローマ字を含む、
    プログラム。
  2. パーソナルスペリング辞書を入出力手段を介して入出力する機能、
    をさらに有し、
    前記パーソナルスペリング辞書は、選択された前記中国語の方言において少なくとも一つの音声コンビネーションの各々に相当する少なくとも一つのローマ字を含む、
    請求項1に記載のプログラム。
  3. 音声コンビネーションの前記マトリックスは、第1の軸に母音フォニームリストを配置し、第2の軸に子音フォニームリストを配置したマトリックスである、請求項1に記載のプログラム。
JP2009099708A 2003-02-26 2009-04-16 中国語方言判断プログラム Expired - Fee Related JP4833313B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/248,880 2003-02-26
US10/248,880 US7315982B2 (en) 2003-02-26 2003-02-26 User-tailorable romanized Chinese text input systems and methods

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004042197A Division JP2004259269A (ja) 2003-02-26 2004-02-19 中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体

Publications (2)

Publication Number Publication Date
JP2009193595A true JP2009193595A (ja) 2009-08-27
JP4833313B2 JP4833313B2 (ja) 2011-12-07

Family

ID=32867818

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2004042197A Pending JP2004259269A (ja) 2003-02-26 2004-02-19 中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体
JP2009099708A Expired - Fee Related JP4833313B2 (ja) 2003-02-26 2009-04-16 中国語方言判断プログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2004042197A Pending JP2004259269A (ja) 2003-02-26 2004-02-19 中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体

Country Status (2)

Country Link
US (2) US7315982B2 (ja)
JP (2) JP2004259269A (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292971B2 (en) * 2003-10-27 2007-11-06 Kuojui Su Language phonetic system and method thereof
US20060048055A1 (en) * 2004-08-25 2006-03-02 Jun Wu Fault-tolerant romanized input method for non-roman characters
US9122655B2 (en) * 2004-11-15 2015-09-01 International Business Machines Corporation Pre-translation testing of bi-directional language display
TWI439877B (zh) * 2007-04-23 2014-06-01 Zi Corp Canada Inc 一般化之語言非相關索引儲存系統及檢索方法
WO2008151465A1 (en) * 2007-06-14 2008-12-18 Google Inc. Dictionary word and phrase determination
WO2008151466A1 (en) 2007-06-14 2008-12-18 Google Inc. Dictionary word and phrase determination
JP2010531492A (ja) * 2007-06-25 2010-09-24 グーグル・インコーポレーテッド ワード確率決定
US7974979B2 (en) 2007-10-05 2011-07-05 Zi Corporation Of Canada, Inc. Inquiry-oriented user input apparatus and method
EP2120130A1 (en) * 2008-05-11 2009-11-18 Research in Motion Limited Mobile electronic device and associated method enabling identification of previously entered data for transliteration of an input
US20090300126A1 (en) * 2008-05-30 2009-12-03 International Business Machines Corporation Message Handling
US8862989B2 (en) * 2008-06-25 2014-10-14 Microsoft Corporation Extensible input method editor dictionary
TWI397001B (zh) * 2009-09-21 2013-05-21 Inst Information Industry 電子裝置之注音輸入系統與方法
US8977535B2 (en) * 2011-04-06 2015-03-10 Pierre-Henry DE BRUYN Transliterating methods between character-based and phonetic symbol-based writing systems
US9459778B2 (en) 2011-07-12 2016-10-04 Mobli Technologies 2010 Ltd. Methods and systems of providing visual content editing functions
WO2014060846A2 (en) * 2012-09-24 2014-04-24 Al-Maadeed Muneera Methods and systems for translation
US9984127B2 (en) * 2014-01-09 2018-05-29 International Business Machines Corporation Using typestyles to prioritize and rank search results
CN104809102B (zh) * 2015-04-01 2018-10-16 北京奇虎科技有限公司 一种基于输入的显示候选词的方法和装置
RU2671043C1 (ru) * 2017-06-15 2018-10-29 Борис Михайлович ПУТЬКО Способ, система и клавиатура для ввода иероглифов

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63314673A (ja) * 1986-12-15 1988-12-22 ユナイテツド・デベロツプメント・インコーポレーテツド 漢字言語文字を選択し記憶するための方法
JP2000003355A (ja) * 1998-06-16 2000-01-07 Toshiba Corp 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4124843A (en) * 1977-05-02 1978-11-07 Atex Corporation Multi-lingual input keyboard and display
US4498143A (en) * 1981-11-12 1985-02-05 Stanislaus Strzelecki Method of and apparatus for forming ideograms
US5164900A (en) * 1983-11-14 1992-11-17 Colman Bernath Method and device for phonetically encoding Chinese textual data for data processing entry
US5175803A (en) * 1985-06-14 1992-12-29 Yeh Victor C Method and apparatus for data processing and word processing in Chinese using a phonetic Chinese language
JPS6231467A (ja) * 1985-08-01 1987-02-10 Toshiba Corp 文章作成装置
US4855842A (en) * 1987-08-06 1989-08-08 Professional Training Systems, Inc. Dedicated programmable controller for interactive video disc system
US5331557A (en) * 1993-01-14 1994-07-19 Liu Zhong Yi Audio-video coding system for Chinese characters
JP2703496B2 (ja) * 1994-01-26 1998-01-26 インターナショナル・ビジネス・マシーンズ・コーポレイション かな漢字変換システムのカスタマイズ方法及びかな漢字変換システム
US5893133A (en) * 1995-08-16 1999-04-06 International Business Machines Corporation Keyboard for a system and method for processing Chinese language text
KR19980035431A (ko) * 1996-11-13 1998-08-05 김광호 다국어 입력 설정 변환 방법
US5933800A (en) * 1996-12-09 1999-08-03 Eten Information System Co., Ltd. Apparatus for recording user behavior in an inputting scheme
US6292768B1 (en) * 1996-12-10 2001-09-18 Kun Chun Chan Method for converting non-phonetic characters into surrogate words for inputting into a computer
US6232956B1 (en) * 1997-02-27 2001-05-15 Spice Technologies, Inc. OHAI technology user interface
US6101461A (en) * 1997-02-28 2000-08-08 Justsystem Corp. Command inputting method
JP3556425B2 (ja) * 1997-03-18 2004-08-18 株式会社東芝 共有辞書更新方法および辞書サーバ
US6240170B1 (en) * 1997-06-20 2001-05-29 Siemens Information And Communication Networks, Inc. Method and apparatus for automatic language mode selection
US6377966B1 (en) * 1997-10-22 2002-04-23 Flashpoint Technology, Inc. Graphical interface to select characters representing phonetic articulation and no articulation groups
GB2333386B (en) * 1998-01-14 2002-06-12 Nokia Mobile Phones Ltd Method and apparatus for inputting information
JP2000066819A (ja) * 1998-08-18 2000-03-03 Matsushita Electric Ind Co Ltd 汎用中国語音声キーボード設定装置
US6356866B1 (en) * 1998-10-07 2002-03-12 Microsoft Corporation Method for converting a phonetic character string into the text of an Asian language
US6349307B1 (en) * 1998-12-28 2002-02-19 U.S. Philips Corporation Cooperative topical servers with automatic prefiltering and routing
US6594638B1 (en) * 1999-04-07 2003-07-15 Netstakes, Inc. On-line method and apparatus for collecting demographic information about a user of a world-wide-web site and dynamically selecting questions to present to the user
TW546943B (en) * 1999-04-29 2003-08-11 Inventec Corp Chinese character input method and system with virtual keyboard
US6562078B1 (en) * 1999-06-29 2003-05-13 Microsoft Corporation Arrangement and method for inputting non-alphabetic language
US6848080B1 (en) * 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US7076423B2 (en) * 1999-12-21 2006-07-11 International Business Machines Corporation Coding and storage of phonetical characteristics of strings
US7043439B2 (en) * 2000-03-29 2006-05-09 Canon Kabushiki Kaisha Machine interface
EP1156430A2 (en) * 2000-05-17 2001-11-21 Matsushita Electric Industrial Co., Ltd. Information retrieval system
US6809725B1 (en) * 2000-05-25 2004-10-26 Jishan Zhang On screen chinese keyboard
US6598021B1 (en) * 2000-07-13 2003-07-22 Craig R. Shambaugh Method of modifying speech to provide a user selectable dialect
US7027975B1 (en) * 2000-08-08 2006-04-11 Object Services And Consulting, Inc. Guided natural language interface system and method
US6686852B1 (en) * 2000-09-15 2004-02-03 Motorola, Inc. Keypad layout for alphabetic character input
US6982658B2 (en) * 2001-03-22 2006-01-03 Motorola, Inc. Keypad layout for alphabetic symbol input
US20020155419A1 (en) * 2001-04-19 2002-10-24 International Business Machines Corporation Customizable online testing for people with disabilities
US7165022B2 (en) * 2001-06-13 2007-01-16 Fujitsu Limited Chinese language input system
US6905340B2 (en) * 2001-07-18 2005-06-14 Mentormate Llc Educational device and method
US6925155B2 (en) * 2002-01-18 2005-08-02 Sbc Properties, L.P. Method and system for routing calls based on a language preference
US8352248B2 (en) * 2003-01-03 2013-01-08 Marvell International Ltd. Speech compression method and apparatus
US7310519B2 (en) * 2003-04-22 2007-12-18 Hitachi Communication Technologies, Ltd. Wireless communication apparatus, wireless communication network and software upgrading method
US7478033B2 (en) * 2004-03-16 2009-01-13 Google Inc. Systems and methods for translating Chinese pinyin to Chinese characters

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63314673A (ja) * 1986-12-15 1988-12-22 ユナイテツド・デベロツプメント・インコーポレーテツド 漢字言語文字を選択し記憶するための方法
JP2000003355A (ja) * 1998-06-16 2000-01-07 Toshiba Corp 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体

Also Published As

Publication number Publication date
US8108772B2 (en) 2012-01-31
US7315982B2 (en) 2008-01-01
JP2004259269A (ja) 2004-09-16
JP4833313B2 (ja) 2011-12-07
US20040167769A1 (en) 2004-08-26
US20080249763A1 (en) 2008-10-09

Similar Documents

Publication Publication Date Title
JP4833313B2 (ja) 中国語方言判断プログラム
JP4237915B2 (ja) ユーザが文字列の発音を設定することを可能にするためにコンピュータ上で実行される方法
JP5172682B2 (ja) 音素のnグラムを使用した単語および名前の生成
US7881928B2 (en) Enhanced linguistic transformation
US8328558B2 (en) Chinese / English vocabulary learning tool
US20020198715A1 (en) Artificial language generation
JP2002014954A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
US20130191115A1 (en) Methods and Systems for Transcribing or Transliterating to an Iconphonological Orthography
JP2001092484A (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
US20020198712A1 (en) Artificial language generation and evaluation
Pitt et al. Design of speech-based devices: a practical guide
JP2008009507A (ja) 外国語の発音のカタカナ表記方法
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP7036483B1 (ja) プログラム、情報処理装置及び情報処理方法
JP5293091B2 (ja) データ処理装置、そのコンピュータプログラムおよびデータ処理方法
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
JP2022132264A (ja) 英語発音練習支援装置、プログラム、およびコンピュータが読み取り可能な記憶媒体
JP2022169012A (ja) 編集装置、音声合成装置及びプログラム
JP4797307B2 (ja) 音声認識装置及び音声認識方法
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0969104A (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH0785026A (ja) 辞書更生方法及び装置
JPH1049523A (ja) 文章作成装置及び方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110921

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees