JP2009193595A

JP2009193595A - 中国語方言判断プログラム

Info

Publication number: JP2009193595A
Application number: JP2009099708A
Authority: JP
Inventors: Joseph D Becker; ディー．ベッカージョセフ
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 2003-02-26
Filing date: 2009-04-16
Publication date: 2009-08-27
Anticipated expiration: 2024-02-19
Also published as: US8108772B2; US7315982B2; JP2004259269A; JP4833313B2; US20040167769A1; US20080249763A1

Abstract

【課題】中国語方言を判断する。
【解決手段】ユーザの方言を識別するために第１の質問を表示手段に表示し、ユーザからの第１の回答を入力手段から受信し、第１の回答を分析することによりユーザの方言を判断するために該第１の回答が適当であるか否かを判断する。第１の回答が適当である場合には、ユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する。第１の回答が適当でない場合には、第１の回答にもとづいて第２の質問を選択し、ユーザの方言を識別するために第２の質問を表示手段に表示し、ユーザからの第２の回答を入力手段から受信し、第２の回答を分析することによりユーザの方言を判断するために該第２の回答が適当であるか否かを判断する。第２の回答が適当である場合にはユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する。
【選択図】図５

Description

本発明は、ユーザ適応型音声データシステムに関する。

おおよその言語は、（日本語や韓国語でさえも）容認されている標準発音と、コンピュータ辞書（ＤＯＣ：ｄｉｃｔｉｏｎａｒｉｅｓｏｎｃｏｍｐｕｔｅｒ）を用いて、該言語で書くためのアルファベットと、を有している。中国語は、発音が広範な点と、音標文字の伝統を有しない点と、で独特な言語である。ピンイン・ローマ字化とボポモフォ音標文字とに関する近年の諸発明によって、標準中国語（Ｍａｎｄａｒｉｎ）が表記する標準の役割をある程度までは果たしている。しかしながら、標準中国語は中国語を話す多くの人々にとって、今なお異質なものと受け取られている。

その結果、インプット・メソッド・エディタ（ＩＭＥ）として知られているコンピュータ・ベースの中国語文字入力方法の多くは、当該文字の視覚形態、若しくは、抽象的な数字コードに基づいている。これによって、市場に「悪くてもないよりはまし」という状況が引き起こされ、並外れて効率が悪く骨の折れるいくつかの方法がきわめて一般的になっている。また、音声ベース・インプット・メソッド・エディタがいくつか存在するが、それらの実用性は、ユーザ個人間の方言とローマ字表記習慣とにおけるおびただしい変形によって、著しく阻害されている。

中国語のいくつかの方言、それらの類似点、相違点について多数の研究が行われてきた（例えば、非特許文献１、２参照）。４７シリーズの発音試験を用いて話し手の方言を決定することができる、ということも報告されている。

中国語の方言についての研究の進歩により、音声的手法をより効果的に、容易に使用することができる。そのような音声ベース・システムは、充分に洗練されると、最適な解決方法に一番近いものを提供することができる。

チン・チュアン・チェン（ＣｈｉｎＣｈｕａｎＣｈｅｎｇ）、「いくつかの方言の間における関連の測定：ＤＯＣと関連リソース（"ＭｅａｓｕｒｉｎｇＲｅｌａｔｉｏｎｓｈｉｐＡｍｏｎｇＤｉａｌｅｃｔｓ：ＤＯＣａｎｄＲｅｌａｔｅｄＲｅｓｏｕｒｃｅｓ"）」、コンピュータ言語学及び中国語言語処理（ＣｏｍｐｕｔａｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓ＆ＣｈｉｎｅｓｅＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ）、１９９７年、２．１、４１〜７２ページシウェン・マ（ＸｉｗｅｎＭａ）、「比較方言学における定量的手法（"ＱｕａｎｔａｔｉｖｅＭｅｔｈｏｄｓｉｎＣｏｍｐａｒａｔｉｖｅＤｉａｌｅｃｔｏｌｏｇｙ"）」、中国語文（ＺｈｏｎｇｇｕｏＹｕｗｅｎ）、１９８９年、２１２、３４８〜３６０ページ

本発明は、ユーザのパーソナル・スタイルに基づいて、該ユーザに中国語文章入力を適応させることができる中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体を提供することを目的とする。

本発明は、ユーザのパーソナル・スタイルに基づいて、該ユーザに中国語文章入力を適応させることができるシステム及び方法を提供する。

本発明は、ユーザの方言に基づいて、ユーザが中国語文章入力をカスタマイズすることができるシステム及び方法を提供する。

本発明は、ユーザ特有な発音あるいは個人言語（ｉｄｉｏｌｅｃｔ）に基づいて、中国語文章入力をカスタマイズすることができるシステム及び方法を提供する。

本発明は、ユーザ特定のスタイルを反映するポータブル・パーソナル・ローマ字・中国語文字変換辞書、若しくは、パーソナル・スペリング辞書を、ユーザが生成することができるシステム及び方法を提供する。

本発明は、ポータブル・パーソナル・ローマ字・中国語音声ルックアップ・テーブルを、ユーザが生成することができるシステム及び方法を提供する。

本発明は、現存の音声入力システムの補助プリプロセッサである、ポータブル・パーソナル・ローマ字・中国語文字変換辞書、若しくは、パーソナル・スペリング辞書を、ユーザが生成することができるシステム及び方法を提供する。

本発明は、現存の音声入力辞書の補助プリプロセッサであるポータブル・パーソナル・ローマ字・中国語音声ルックアップ・テーブルを、ユーザが生成することができるシステム及び方法を提供する。

本発明は、標準的な方言に対して中国語の表意文字をローマ字化することができるシステム及び方法を提供する。

本発明は、ポータブルなパーソナル・ローマ字・中国語文字変換辞書をユーザが生成することができるシステム及び方法を提供する。

本発明は、予め生成されているパーソナル・ローマ字・中国語文字変換辞書を、ユーザが更新することができるシステム及び方法を提供する。

本発明は、ユーザがパーソナル・ローマ字・中国語文字変換辞書を任意の場所で使用することができるように、該パーソナル・ローマ字・中国語文字変換辞書を、ユーザがダウンロードすることができ、及び／又は、任意の場所で生成したパーソナル・ローマ字・中国語文字変換辞書をロードすることができるシステム及び方法を提供する。

本発明は、ユーザの方言を判断することができるシステム及び方法を提供する。

本発明は、一連の質問及びユーザの回答に基づいて、ユーザの方言を判断することができるシステム及び方法を提供する。

本発明は、判断された方言に基づいて、ユーザが中国語文章入力をカスタマイズすることができるシステムおよび方法を提供する。

本発明のシステム及び方法の様々な例示的実施形態によれば、ユーザの方言を判断し、及び／または、ユーザのパーソナル・スペリング辞書を生成することができる。これらの様々な例示的実施形態は、例えば、パーソナル・コンピュータを含む、広範囲の様々な装置において使用することができる。ユーザは１以上のインタビュー・セッションの間に、１以上の質問に回答する。質問は特定の中国語文字に関する質問であり、回答は当該質問に対する回答である。質問は中国語の表意文字であり、回答は当該表意文字についてユーザが所望する相当ローマ字文字列である。ユーザが所望するこれらの相当ローマ字文字列は、当該ユーザのパーソナル・スペリング辞書を構築するために使用される。質問は方言であり、回答は当該質問に対する回答である。

パーソナル・スペリング辞書は、ユーザが１の場所で当該パーソナル・スペリング辞書を生成することができ、別の場所で当該パーソナル・スペリング辞書を使用することができるように、ポータブルである。

回答は、ユーザの方言を判断するためにも用いることができる。ユーザが所望する相当ローマ字文字列は、ユーザの方言を判断するために用いることができる。

本発明の第１の態様は、複数の方言の中から中国語の方言を選択する機能と、選択された前記中国語の方言において存在しないシラブルに対応する音声コンビネーションを除外する音声コンビネーションのマトリックスを表示手段に表示する機能と、表示された音声コンビネーションの前記マトリックスから音声コンビネーションを選択する機能と、選択された前記音声コンビネーションに相当する第１のローマ字を定義するためにユーザによって使用されるユーザインターフェースを前記表示手段に表示する機能と、選択された前記中国語の方言における選択された前記音声コンビネーションに対応する第１の中国語の文字を前記表示手段に表示する機能と、前記第１の中国語の文字と相当する第１のローマ字とを対応付ける機能と、ユーザの方言を識別するために第１の質問を前記表示手段に表示する機能と、ユーザからの第１の回答を入力手段から受信する機能と、前記第１の回答を分析することによりユーザの方言を判断するために該第１の回答が適当であるか否かを判断する機能と、前記第１の回答が適当である場合には、ユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、前記第１の回答が適当でない場合には、前記第１の回答にもとづいて第２の質問を選択する機能と、ユーザの方言を識別するために前記第２の質問を表示手段に表示する機能と、ユーザからの第２の回答を前記入力手段から受信する機能と、前記第２の回答を分析することによりユーザの方言を判断するために該第２の回答が適当であるか否かを判断する機能と、前記第２の回答が適当である場合にはユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、をコンピュータに実現させるためのプログラムであって、前記第１の質問および第２の質問は、前記表示手段に表示される表意文字についての質問を含み、該第１の質問および第２の質問に対する回答は表示される前記表意文字に相当するローマ字を含む。

本発明の第２の態様は、第１の態様のプログラムであって、パーソナルスペリング辞書を入出力手段を介して入出力する機能、をさらに有し、前記パーソナルスペリング辞書は、選択された前記中国語の方言において少なくとも一つの音声コンビネーションの各々に相当する少なくとも一つのローマ字を含む。

本発明の第３の態様は、第１の態様のプログラムであって、音声コンビネーションの前記マトリックスは、第１の軸に母音フォニームリストを配置し、第２の軸に子音フォニームリストを配置したマトリックスである。

本発明の中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体は、音声コンビネーションを選択し、選択された前記音声コンビネーションの第１のローマ字相当語を定義するようにしているので、ユーザのパーソナル・スタイルに基づいて、該ユーザに中国語文章入力を適応させることができる。

本発明による中国語文章入力システムのインタビュー・インターフェイスの例示的実施形態の１を示す。本発明のパーソナル・スペリング辞書を構築する方法の第１の例示的実施形態の概要を示すフローチャートである。本発明のパーソナル・スペリング辞書を構築する方法の第２の例示的実施形態の概要を示すフローチャートである。本発明のパーソナル・スペリング辞書を構築する方法の第２の例示的実施形態の概要を示すフローチャートである。本発明によるユーザの方言を判断する方法の例示的実施形態の１の概要を示すフローチャートである。本発明による中国語文章入力システムの例示的実施形態の１を示すブロック図である。

図１は、本発明によるパーソナル・スペリング辞書を生成することができる、インタビュー・インターフェイス１０００の代表的実施形態の１を示している。図１に示されるように、このインタビュー・インターフェイス１０００は、音声テーブル１１００とステータス・パネル１２００とを備えている。インタビュー・セッションの間に、ローマ字化パネル１３００は、図１に示されるように、初期化および表示されてもよい。

音声テーブル１１００は、複数の可能な音声コンビネーションを含む。音声テーブル１１００の上方部分を横切って、母音フォニーム・リスト１１１０が水平に配置されている。音声テーブル１１００の左側部分に沿って子音フォニーム・リスト１１２０が垂直に配置されている。しかしながら、母音フォニーム・リスト１１１０および子音フォニーム・リスト１１２０は、異なった方法によって、及び／または、音声テーブル１１００の異なった部分に配置することができる、ということが認められるべきである。音声テーブル１１００はいくつかのセルに分割されており、セルの各々は、対応する母音フォニームおよび子音フォニームに関連する音声コンビネーションを表している。例えば、セル１１６０は、母音フォニーム「ａ」と子音フォニーム「ｍ」とに関連している。

これらの母音フォニーム・リスト１１１０および子音フォニーム・リスト１１２０は、標準的なものとして使用されている中国語方言から得られたものである。この方言は標準中国語である。しかしながら、この標準的な方言は、広東語、福建語あるいは上海語であってもよい。

母音フォニーム・リスト１１１０は、母音、遷移母音およびこれらのコンビネーションを含む。例えば、このリストには、シンプル・フォニームである「ａ」、「ｏ」および「ｅ」と、複合フォニームであり二重母音である「ｕｏ」、「ｕａｎｇ」および「ｕａ」が含まれている。

音声テーブル１１００には（図示しない）トーン・パネルが含まれていてもよい。このトーン・パネルは、中国語の単語および中国語の単語の一部を発音するのに使用されるトーンおよびトーン・パターンの差異を反映するために使用することができる。

音声テーブル１１００において、音声コンビネーションを表しているセルには、特定の方言あるいは特定の個々の個人言語の認容性を反映するために相異なる色あるいは濃淡が付けられていてもよい。図１に示された例示的実施形態では、これらのセルは、３の濃淡、すなわち、黒色セル１１３０、白色セル１１４０、および、灰色セル１１５０で表されている。この例示的実施形態では、黒色セル１１３０は、このセルに関連した母音フォニームと子音フォニームとで表された音声コンビネーションが標準的方言のような、適用されている方言あるいは個人言語では認容されないということを示している。すなわち、子音フォニームおよび母音フォニームのこのようなコンビネーションはあり得ず、また、音声テーブル１１００を構築するために用いられた適用されている方言あるいは個人言語に生じることはない。白色セル１１４０は、このセルに関連した母音フォニームと子音フォニームとで表された音声コンビネーションが与えられている方言あるいは個人言語で認容されており、かつ、実際に使われている（つまり実際に生じる）ということを示している。灰色セル１１５０は、このセルに関連した母音フォニームと子音フォニームとで表された音声コンビネーションが認容されている（つまり生じる）ものの、適用されている方言あるいは個人言語に生じることがないということを示している。すなわち、このようなコンビネーションは音声的には可能であるものの、このような音声コンビネーションは、適用されている方言あるいは個人言語では、実際には、何れの語にもまったく生じないのである。

白色セル１１４０の各々は、該セルに関連した母音フォニームと子音フォニームとで決定された発音を有する１以上の中国語文字あるいは表意文字に関連していてもよい。すなわち、１の発音は２以上の文字で共用されることもある。また、図１に示された音声テーブル１１００では、白色セル１１４０の各々は、マウス、トラックボールなどのような入力装置あるいは選択装置を用いた選択などにより稼動され、該セルに関連した中国語文字あるいはシラブルの発音についてのローマ字化セッションを初期化することができる。以下に、詳細を記載する。

図１に示された音声テーブル１１００についてのある例示的実施形態では、灰色セル１１５０の各々も、マウス、トラックボールなどのような入力装置あるいは選択装置を用いた選択などにより稼動され、該セルに関連した中国語文字あるいはシラブルの発音についてのローマ字化セッションを初期化することができる。以下に、詳細を記載する。

ステータス・パネル１２００は、インタビュー・セッションの状態および状況を表す。ヘッダー１２１０は、インタビュー・インターフェイスの名前を示す。インタビュー・インターフェイスの開発者が、該名前を決定することができる。名前は、ユーザの各々のためにカスタマイズすることもできる。プログレス・インジケータ１２２０は、インタビューあるいはインタビュー・セッションが進行中であるか、あるいは、完了したかを示すものである。このプログレス・インジケータ１２２０は、「進行中」および「完了（Ｄｏｎｅ！）」のような表示語句を示すことによって、進行の状況を示す。

方言インジケータ１２３２は、適用されている方言あるいは個人言語として使用されている方言を示し、該方言の母音フォニームおよび子音フォニームが音声テーブル１１００に表示される。この方言インジケータは、標準的な方言として使用されている方言が標準中国語であるか、広東語、福建語、上海語のような他の方言であるか、個人言語であるか、を表示する。適用されている方言あるいは個人言語は、インタビュー・インターフェイス１０００を開始する前に選択することができる。適用されている方言あるいは個人言語は、図示されない方言リストあるいは選択グラフィカル・ユーザ・インターフェイス・ウィジェットを稼動させて、リストに記載された方言のセットからある方言を選択することなどによって、インタビュー・インターフェイス１０００が作動している間に選択及び変更することもできる。フォント・インジケータ１２３４は、音声テーブル１１００における母音フォニームおよび子音フォニームのような音声データ、および／または、ローマ字化パネル１３００に示された中国語文字あるいは表意文字を示すために用いられるフォントを表示するものである。以下に、詳細を記載する。

インタビュー・ステータス・インジケータ１２３８は、音声テーブル１１００に示されたインタビューの状態を示す。例えば、インタビュー・ステータス・インジケータ１２３８は、インタビュー・セッションが行われているかいないかを示す。インタビュー・ステータス・インジケータ１２３８は、インタビューが「記入（Ｆｉｌｌ−ｉｎ）」、「例外（Ｅｘｃｅｐｔｉｏｎｓ）」、「あいまい（Ａｍｂｉｇｕｉｔｉｅｓ）」あるいは「照合（Ｖｅｒｉｆｙ）」のためのものであるかどうかについても表示する。インタビュー・セッションのこれらのタイプの各々については、以下に詳細を記載する。

シラブル・ファイル１２４２は、ユーザのパーソナル・スペリング辞書を記憶するファイルあるいはデータベースの名前を示す。インタビュー・セッションの間にユーザによって定義されたシラブル、すなわち、セル１１４０あるいはセル１１５０の１によって表された音声コンビネーションは、該ユーザのパーソナル・スペリング辞書に記録される。このパーソナル・スペリング辞書はポータブルである。したがって、インタビュー・セッションの間にユーザによって定義されたシラブルは、ローマ字化と対応する１以上の中国語文字との間の変換が定義されたインタビュー・インターフェイスの場所とは関係なく、任意の場所で使用することができる。例えば、１のコンピュータでインタビューの間に構築されたパーソナル・スペリング辞書は、該コンピュータからダウンロードして別のコンピュータへ転送することができ、また、該コンピュータで該パーソナル・スペリング辞書を使用したり、更新したりすることもできる。この転送は、例えば、フレキシブル・ディスク、ＣＤ−ＲＯＭ、ネットワークなどを使用して行うことができる。

単一あいまいファイル１２４４は、相異なる２つの発音を有する中国語文字を記憶するために用いられるファイルあるいはデータベースの名前を示す。二重あいまいファイル１２４６は、相異なる少なくとも３つの発音がある中国語文字を記憶するファイルあるいはデータベースの名前を表す。単一あいまいファイル１２４４および二重あいまいファイル１２４６は、パーソナル・スペリング辞書の一部であり、かつ、ポータブルでもある。しかしながら、他の様々な例示的実施形態では、これらの単一あいまいファイル１２４４および二重あいまいファイル１２４６は、該パーソナル・スペリング辞書と別個であってもよい。

オートオープン・インジケータ１２４８はオートオープン関数の状態を示す。オートオープン関数がオフ（Ｏｆｆ）である場合には、図１に示されたインターフェイスは、ユーザが一連のローマ字化セッションを通してパーソナル・スペリング辞書を構築するために使用されている。セッションの各々は１の音声コンビネーションのために供される。反対に、オートオープン関数１２４８がオン（Ｏｎ）である場合には、図１に示されたインターフェイスは、一連のインタビュー・セッションを通してユーザのパーソナル・スペリング辞書の大部分を判断するために用いることができる。セッションの各々は相異なる音声コンビネーションのためのものである。すなわち、セッションの各々が完了すると、次のセッションが自動的にオープンされる。ローマ字化セッションおよびインタビュー・セッションは双方とも、ローマ字化パネル１３００に関連して以下で詳細に記載されるように、同一のインタビュー・インターフェイスを使用することができる。

オートオープン関数１２４８がオンである場合には、オートオープン関数１２４８によって、自動的なインタビュー・セッションで、選択シラブルに関するユーザの所望ローマ字化を決定することができる。オートオープン関数１２４８によれば、ユーザが介入することなく、音声コンビネーションが自動的に選択され、該音声コンビネーションが表示される。これについては以下で詳細に記載する。ユーザは、子音コンポーネントおよび母音コンポーネントに相当する英字を以下に記載される方法で入力することによって、音声コンビネーションの各々に応答する。本システムは、ユーザのこのような応答を解析することによって、ユーザの方言を判断するために使用することができる。

オートオープン関数１２４８がオンである場合に、オートオープン関数１２４８は相異なるモードで機能してもよい。オートオープン関数１２４８は、音声コンビネーションをシーケンシャルに、ランダムに、あるいは、論理的に選択してもよい。オートオープン関数１２４８がシーケンシャル・モードで機能するときには、オートオープン関数１２４８の「次（Ｎｅｘｔ）」オプション・インジケータが強調表示される。このモードでは、オートオープン関数１２４８は、一連の母音フォニームのリスト１１１０の関連した母音フォニームがある場所、及び、一連の子音フォニームのリスト１１２０の関連した子音フォニームがある場所、にしたがい、音声コンビネーションについてのインタビュー・セッションを選択する。オートオープン関数１２４８がランダム・モードである場合には、オートオープン関数１２４８の「ランダム（Ｒａｎｄｏｍ）」オプション・インジケータが強調表示される。このモードでは、オートオープン関数は、新しいインタビュー・セッションについての音声コンビネーションをランダムに採択する。

オートオープン関数１２４８が論理モードである場合には、オートオープン関数１２４８の「論理」オプション・インジケータが強調表示される。このモードでは、オートオープン関数は、前のセルと次のセルとの間における所定の論理関係に基づいて、音声コンビネーションについてのインタビュー・セッションを選択する。例えば、次のセルは、いくつかの中国語方言の間における類似点および相違点を反映する関係に基づいて選択される。このような選択によれば、方言の間における論理関係が適切に利用され、これにより、音声コンビネーションの何れかが、スキップされ、あるいは、除外される。スキップされた音声コンビネーションは、それらのインタビュー・セッションがユーザのパーソナル・スペリング辞書の決定を促進するために必須あるいは必要ではないようなものである。これによって、計算時間が減少し、したがって効率が増大する。

テーブル・ステータス・インジケータ１２５０は音声テーブル１１００の状態を表示する。テーブル・ステータス・インジケータ１２５０は、音声テーブル１１００が灰色セルを明示的に表示するか否かを示すものである。例えば、灰色セルが示されているということをテーブル・ステータス・インジケータ１２５０が示しているときには、可能な音声コンビネーションだけを表示するそれらのセルの外観によって、それらのセルを白色セル１１４０および黒色セル１１３０から識別することができる。これに対して、灰色セルが表示されていないということをテーブル・ステータス・インジケータ１２５０が示している場合には、音声テーブル１１００には白色セル１１４０および黒色セル１１３０だけが表示される。灰色セル１１５０を使用するなどして示される、可能な音声コンビネーションは、黒色セルの範疇の中にひとまとめにされる。ヘッダー１２１０、プログレス・インジケータ１２２０、方言インジケータ１２３２、フォント・インジケータ１２３４、インタビュー・ステータス・インジケータ１２３８、シラブル・ファイル１２４２、単一あいまいファイル１２４４、二重あいまいファイル１２４６および／またはオートオープン・インジケータ１２４８の１以上、および／または、プログレス・インジケータ１２２０、インタビュー・ステータス・インジケータ１２３８および／またはオートオープン・インジケータ１２４８のオプションの１以上は省略してもよいということが認識されるべきである。同様に、他のオプションが供されてもよい。

図１は、ローマ字化パネル１３００の例示的実施形態の１を示している。ローマ字化パネル１３００は、ローマ字化セッションを開始したときに表示される。ローマ字化セッションは、ユーザがパーソナル・スペリング辞書を構築するか、あるいは、更新することを所望する場合に開始することができる。このパーソナル・スペリング辞書は、音声辞書のプリプロセッサである音声ルックアップ・テーブルとして実装される。ユーザが中国語文字あるいは中国語文章を、例えば、中国語のワード・プロセッサあるいはワード・エディタに入力することができるように、パーソナル・スペリング辞書を使用することができる。

適用されている方言あるいは個人言語に使用されている音声コンビネーションについて、ユーザは、該音声コンビネーションを自分のパーソナル・スペリング辞書におけるシラブルへローマ字化する。このシラブルはその音声コンビネーションに相当するローマ字である。このローマ字は、適用されている方言あるいは個人言語における標準的なローマ字化音声コンビネーションと同じスペルを有していてもよく、有していなくてもよい。このローマ字相当語は、インタビューのローマ字化セッションの間にユーザによって選ばれる。このローマ字相当語は、該ローマ字相当語がそのユーザ自身の方言に適切に合致するか、該ユーザが中国語を話す話し方に適切に合致するように、選ばれる。

ローマ字相当語は、ローマ字化パネルに適用されている方言の何れかによることなく、かつ／または、ユーザの方言を判断することなく、ユーザが話す中国語の方言に適切に合致するように選ばれる。パーソナル・スペリング辞書を生成するために図１のインターフェイスを使用する場合には、ユーザの介入によってローマ字化セッションを開始することができる。ユーザは、特定の音声コンビネーションを示す音声テーブル１１００におけるグリッドをクリックすることで、該音声コンビネーションについてのローマ字化セッションを開始することができる。

ローマ字化セッションは、オートオープン関数１２４８によって自動的に開始される。上記したように、オートオープン関数１２４８は、いくつかの音声コンビネーションについてのローマ字化セッションを、該音声コンビネーションに関連した母音フォニームおよび子音フォニームのシーケンシャルな位置によるシーケンシャルな順序で開始することができる。オートオープン関数１２４８は、ローマ字化のために次の音声コンビネーションがランダムに選択されるランダム方式で、音声コンビネーションについてのローマ字化セッションを開始することもできる。さらに、オートオープン関数１２４８は、ローマ字化のために、次の音声コンビネーションが典型的な中国語文字のローマ字化間、および／または、中国語方言間における類似点および相違点を反映する試験によって選択される論理的手法で、音声コンビネーションについてのローマ字化セッションを開始することができる。この手法はユーザの方言を判断するために使用することができるが、これについては以下で詳細に記載する。

ローマ字化セッションが開始されると、ローマ字化パネル１３００が、図１に示されるように表示される。このローマ字化パネル１３００は、例えば、パーソナル・スペリング辞書を生成するか、あるいは、更新する場合に、音声コンビネーションに関連したシラブルを記入するために初期化することができる。この場合、「記入」オプションがインタビュー・ステータス・インジケータ１２３８に表示される。ローマ字化パネル１３００は、予めローマ字化されていた音声コンビネーションのローマ字化を照合するために起動することもできる。この場合、「照合」オプションがインタビュー・ステータス・インジケータ１２３８に表示される。さらに、ローマ字化パネル１３００を、ローマ字化されている音声コンビネーションのローマ字化を更新するために開始することもできる。このように、ユーザのパーソナル・スペリング辞書は、ユーザの自由裁量で修正・変更することができる。

ローマ字化パネル１３００は、パネル・ヘッダー１３１０、情報パネル１３２０、表意文字パネル１３３０、第１ポイント・ズーム・ウィジェット１３４０、第２ポイント・ズーム・ウィジェット１３５０、オリジナル子音表示ボックス１３７２、ローマ字化子音表示ボックス１３７４、オリジナル母音表示ボックス１３７６、ローマ字化母音表示ボックス１３７８、追加類義語パネル１３８２、あいまいパネル１３８４、除去パネル１３８６、および、アクション・パネル１３６０を含む。しかしながら、これらの構成要素の１以上をローマ字化パネル１３００から省略することができるということが認識されるべきである。パネル・ヘッダー１３１０は、ローマ字化されるセルによって示される音声コンビネーションを表示するものである。表意文字パネル１３３０は、ローマ字化される音声コンビネーションに関連した中国語文字、すなわち、表意文字を示すものである。

情報パネル１３２０は、表意文字パネル１３３０に表示されている中国語文字をユーザに容易に理解させるための情報があれば、該情報を表示する。この情報パネル１３２０に示される内容は、絵、画像、図、色あるいは語句などであってよい。例えば、表意文字パネル１３３０における中国語文字が「ｈｏｎｇ」（赤）である場合には、情報パネル１３２０を赤で示すことで、「ｈｏｎｇ」が赤色に関係あることをユーザに理解しやすくさせる。また、例えば、表意文字パネル１３３０に示された中国語文字が「ｎｕｕ（女性）」である場合には、情報パネル１３２０は、例えば、モナ・リザのような女性の絵を示すことで、「ｎｕｕ」が「女性」に関係することをユーザに理解しやすくさせる。

情報パネル１３２０は、漸次更新することのできるデータベースに関連のあるものであってもよい。そのようなデータベースは、インタビュー・セッションの前に更新することができる。このデータベースは、ローマ字化パネル１３００の（図示されない）情報更新グラフィカル・ユーザ・インターフェイス・エレメントによって、インタビュー・セッションの間に更新することもできる。このデータベースは、中国語文字の各々およびすべての中国語文字についての情報を有する要はない。また、ある中国語文字についての情報がある場合には、ローマ字化パネル１３００の（図示されない）情報表示方式グラフィカル・ユーザ・インターフェイス・エレメントから選択することによって、絵、語句あるいはムービー・クリップのような、中国語文字についての相異なるタイプの情報を選ぶことができる。

第１ポイント・ズーム・ウィジェット１３４０および第２ポイント・ズーム・ウィジェット１３５０はコントロールであり、音声コンビネーションに相当するローマ字が、適用されている方言あるいは個人言語における音声コンビネーション自体と同様のスペリングを有しているか否かを示すために用いられる。第１ポイント・ズーム・ウィジェット１３４０にチェックマークが付されている場合には、表意文字パネル１３３０に示された中国語文字に関連した音声コンビネーションに相当するローマ字は、適用されている方言あるいは個人言語における音声コンビネーションと同じである。これに対して、第２ポイント・ズーム・ウィジェット１３５０にチェックマークが付されている場合には、表意文字パネル１３３０に表示されている中国語文字に関連した音声コンビネーションに相当するローマ字は、適用されている方言あるいは個人言語における音声コンビネーションとは異なっている。

オリジナル子音表示ボックス１３７２は、表意文字パネル１３３０に表示されている中国語文字に関連した音声テーブル１１００の子音フォニーム・リスト１１２０の子音フォニームを示すものである。ローマ字化子音表示ボックス１３７４は、ユーザが所望したこの中国語文字についての子音フォニームのスペリングとしてユーザによって選ばれて入力されたローマ字の文字列を示すものである。ユーザは、この中国語文字をユーザ自身の方言で発音する方法に基づいて、表意文字パネル１３３０に表示された中国語文字に関する子音フォニームについてこのローマ字の文字列を選ぶ。

オリジナル母音表示ボックス１３７６は、表意文字パネル１３３０に示された中国語文字に関連した音声テーブル１１００の母音フォニーム・リスト１１１０の母音フォニームを示すものである。ローマ字化母音表示ボックス１３７８は、ユーザが所望したこの中国語文字についての母音フォニームのスペリングとしてユーザによって選ばれて入力されたローマ字の文字列を示すものである。ユーザは、この中国語文字をユーザ自身の方言で発音する方法に基づいてその母音フォニームについて、このローマ字の文字列を選ぶ。

追加類義語パネル１３８２は、表意文字パネル１３３０に示されている中国語文字の類義語を任意に入力するためものである。例えば、表意文字パネル１３３０に示された漢字が「ｍａ」（母：ｍｏｔｈｅｒ）である場合には、「ｍｏｍ」、「ｍｏｍｍｙ」、「ｄｅａｒｍｏｔｈｅｒ」あるいは「ｄｅａｒｅｓｔｍｏｔｈｅｒ」のような類義語をその追加類義語パネル１３８２で追加することができる。

あいまいパネル１３８４は、表意文字パネル１３３０に示されている中国語文字の発音に関連するあいまいなものがあるか否かを示すものである。例えば、あいまいパネル１３８４は、その中国語文字に相異なる２の発音がある場合には、単一あいまいであることを示すことができる。また、あいまいパネル１３８４は、その中国語文字に相異なる３以上の発音がある場合には、二重あいまいであることを表示することができる。

除去パネル１３８６は、表意文字パネル１３３０に示されている中国語文字に相当するローマ字が、互いに同じ音声コンビネーションを有する中国語文字のグループや、適用されている方言あるいは個人言語における表意文字パネル１３３０に示されている中国語文字のグループの相当するローマ字の例外であるか、あるいは、これと矛盾しているか否かを示すものである。通常は、適用されている方言あるいは個人言語における他の中国語文字のグループと同じ音声コンビネーションを共用する中国語文字は、これらの中国語文字のグループと同じ相当するローマ字も共用する。この中国語文字は、該中国語文字が該グループの同じ相当するローマ字を共用しない場合には、例外である。このような場合、この中国語文字は、除去パネル１３８６に表示されているグループの相当する一般的なローマ字から除去される。

例えば、「母」、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字は、標準中国語方言において、「ｍａ」という同じ音声コンビネーションを有する。このため、「母」を表す漢字は、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字が含まれるグループに属するとみなすことができる。通常は、「母」を表す中国語文字に相当するローマ字は、このグループにおける他の漢字の各々に相当するローマ字と同じである。一例をあげると、「母」を表す中国語文字に相当するローマ字がユーザの方言における「ｍｕ」であれば、「質問」、「繊維」、「馬」および「批判する」を表す漢字に相当するローマ字は、そのユーザの方言において、普通はやはり「ｍｕ」である。

しかしながら、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字に相当するローマ字がすべて「ｍｉ」であり、「母」を表す中国語文字に相当するローマ字が「ｍｕ」であれば、「母」を表す中国語文字は、「質問」、「繊維」、「馬」および「批判する」を表す中国語文字のグループの例外であるとみなされる。したがって、ユーザが、「母」を表す中国語文字に相当するローマ字として、ローマ字化子音表示ボックス１３７４の領域およびローマ字化母音表示ボックス１３７８の領域に、各々「ｍ」および「ｕ」を入力することによって「ｍｕ」を示すと、除去パネル１３８６は、中国語文字のグループの相当するローマ字を示すために「ｍｉ」を表示する。該中国語文字のグループは、標準中国語方言においては、「母」を表す中国語文字と同じ音声コンビネーション「ｍａ」を共用し、該グループに対し、ユーザの方言において、「母」を表す中国語文字は例外である。

アクション・パネル１３６０は、「承認（ＯＫ！）」、「適用（Ａｐｐｌｙ！）」、「リセット（Ｒｅｓｅｔ！）」および「キャンセル（Ｃａｎｃｅｌ！）」のようないくつかの機能オプションを提供する。これらのオプションは、ユーザが、例えば、ローマ字化パネル１３００を使用して入力した選択肢を確認したり消去したりするために使用することができる。

パーソナル・スペリング辞書を生成するためにインターフェイス１０００を操作する例示的な実施形態の１では、ユーザは、母音フォニーム「ａ」および子音フォニーム「ｍ」に関連した音声テーブル１１００の白色セル１１６０をクリックする。これによって、ローマ字化セッションが開始され、音声コンビネーション「ｍａ」に関連した中国語文字「母」についてのローマ字化パネル１３００が表示される。音声コンビネーション「ｍａ」はヘッダー１３１０に示される。「母」を表す中国語文字は表意文字パネル１３３０に示される。このとき、情報パネル１３２０には何も示されない。この文字に関連した絵、画像、図、色あるいは語句が設定されたり読み込まれたりしたことがまったくなかったからである。

この例では、図１に示されるように、表示されたセル文字および選択されたセル文字に関連して、オリジナル子音表示ボックス１３７２には子音文字「ｍ」が示され、オリジナル母音表示ボックス１３７６には母音文字列「ａ」が示される。ユーザは、ユーザ自身の方言に従って、表示されている文字に関連したローマ字子音文字列およびローマ字母音文字列を選択し、これらのローマ字文字列をローマ字化子音表示ボックス１３７４およびローマ字化母音表示ボックス１３７８にそれぞれ入力する。

入力されたローマ字子音文字列およびローマ字母音文字列が音声テーブル１１００に適用されている方言におけるローマ字子音文字列およびローマ字母音文字列と同じものである場合には、手入力によりあるいは自動的に、第１ポイント・ズーム・ウィジェット１３４０にチェックマークが付され、該音声コンビネーションに相当するローマ字が、適用されている方言あるいは個人言語における音声コンビネーションと同じであることが示される。第２ポイント・ズーム・ウィジェット１３５０にはチェックマークが付されないままである。これに対して、入力されたローマ字子音文字列およびローマ字母音文字列の一方あるいは両方が音声テーブル１１００に適用されている方言におけるローマ字子音文字列およびローマ字母音文字列と異なっているものである場合には、手入力によりあるいは自動的に、第１ポイント・ズーム・ウィジェット１３４０からチェックマークが外されて、手入力によりあるいは自動的に、第２ポイント・ズーム・ウィジェット１３５０にチェックマークが付される。

図１に示された例では、ユーザは「母」を意味する中国語文字について別の名称を有していない。したがって、当該ユーザは追加類義語パネル１３８２に何も入力しない。また、当該ユーザは、当該中国語文字については１の発音だけを有している。したがって、ユーザはあいまいパネル１３８４に何も入力しない。さらに、当該ユーザにとっては、当該中国語文字は同じ音声コンビネーションを共有する中国語文字の一般化グループに対する例外ではない。したがって、ユーザは除去パネル１３８６に何も入力しない。ユーザは、自分が入力したものを確認したり消去したりするために、アクション・パネル１３６０の中における適切なオプションを選ぶことができる。ユーザが「承認」オプションを選ぶと、その情報が記録されてローマ字化セッションが実行され、当該中国語文字についてのローマ字化パネル１３００が消える。その後、ユーザは、別の音声コンビネーションをローマ字化するか否かを決めることができる。ユーザが別の音声コンビネーションをローマ字化することを望む場合には、ユーザは音声テーブル１１００の別のセルを選ぶ。

ローマ字化セッションの各々の後に、行われた変更はステータス・パネル１２００にリストされているファイルに保存される。当該ファイルはポータブルである。当該ファイルは、フレキシブル・ディスク、ＣＤ−ＲＯＭなどによってダウンロードすることができる。当該ファイルは、ネットワークなどによって転送することもできる。

あるセルについての音声コンビネーションに相当するローマ字が決定されると、当該セルにはマークが付されて、当該音声コンビネーションがローマ字化されたことが示される。これは、例えば、当該セルの色および／または明るさを落とすなどの方法で、当該セルの外観を変化させることによって行われる。このようにして、ユーザは、音声コンビネーションがローマ字化された音声テーブル１１００におけるセルの外観を識別することができる。

他の様々な例示的実施形態では、音声テーブル１１００は、特定の適用されている方言の音声コンビネーションではなく、ユーザの方言の音声コンビネーションを示すために用いられる。この例示的実施形態では、ユーザは、音声テーブル１１００に示されたユーザの方言から音声コンビネーションを選択することができ、それをリストから選択することのできる中国語文字に関連付けることができる。

音声テーブル１１００には、２のテーブル、すなわち、標準的な方言のような所定の適用されている方言に対応している音声テーブルと、ユーザの方言に対応している音声テーブルと、がある。これら２の音声テーブルを横に並べて配置することができる。これらの音声テーブルを、一方が他方の上に表示されるように配置することもできる。

インターフェイス１０００がユーザの方言を判断する方言判断システムによって使用される場合、インターフェイス１０００の操作に関する様々な他の例示的実施形態では、当該方言判断システムは、特定の音声コンビネーションを自動的に選択するためにオートオープン関数１２４８を実行する。図１はインターフェイス１０００のそのような使用も示している。この例では、方言判断システムは、母音フォニーム「ａ」および子音フォニーム「ｍ」に関連した音声コンビネーションを選択して、この音声コンビネーションを示すために、図１のインターフェイス１０００を使用している。これによって、ローマ字化セッションが起動するとともに、音声コンビネーション「ｍａ」に関連した「母」を意味する中国語文字についてのローマ字化パネル１３００が表示される。この音声コンビネーション「ｍａ」はヘッダー１３１０に示される。「母」を意味する中国語文字は表意文字パネル１３３０に示される。情報パネル１３２０はここでは何も示さないが、それは、この中国語文字に関連した絵、画像、図、色あるいは語句が設定されたり読み込まれたりすることがなかったからである。

この例では、オリジナル子音表示ボックス１３７２には子音文字「ｍ」が示され、オリジナル母音表示ボックス１３７６には当該中国語文字に関連した母音文字「ａ」が示される。ユーザは、ユーザ自身の方言に従って、表示された文字に関連したローマ字子音文字列およびローマ字母音文字列を選択し、そして、これらのローマ字文字列をローマ字化子音表示ボックス１３７４およびローマ字化母音表示ボックス１３７８に各々入力する。

ユーザは、自分が入力したものを確認したり消去したりするために、アクション・パネル１３６０の中における適切なオプションを選ぶことができる。ユーザが「承認」オプションを選ぶと、そのローマ字化セッションが完了し、ローマ字化パネル１３００が消える。その後、インターフェイス１０００を使用する方言判断システムは、別の音声コンビネーションについての別のインタビュー・セッションを起動するか否かを決めることができる。方言判断システムがユーザの方言を判断するに足りる充分な情報を有していない場合には、この方言判断システムは、通常、別のインタビュー・セッションを起動するであろう。これに対して、方言判断システムがユーザの方言を判断するに足りる充分な情報を有している場合には、この方言判断システムは、そのインタビュー・セッションを停止することができる。

図１に示された実施形態では、ユーザが中国語表意文字を取り出す目的で標準的な方言における音声コンビネーションを選ぶことができるように標準的な方言が用いられるが、他の様々な例示的実施形態では標準的な方言は必要とされない。そのようないくつかの例示的実施形態では、中国語表意文字は、中国語表意文字の外観あるいは中国語表意文字の画数のような様々な他の手段によって、選択され表示される。

図２は、本発明のパーソナル・スペリング辞書を構築する方法に関する第１の例示的実施形態の概要を説明するフローチャートである。本発明の操作は、ステップＳ１００で開始され、ステップＳ１１０へ続く。ステップＳ１１０では、中国語の表意文字が選択され表示される。上記したように、この中国語表意文字は、標準的な方言における音声コンビネーション、その中国語表意文字の外観、その中国語表意文字の画数、あるいは、その中国語表意文字を選択するための他の適切な技術に基づいて、選択することができる。次に、ステップＳ１２０では、ユーザは、ユーザのパーソナル・スタイルあるいはユーザの個々の発音あるいは方言に基づいて、表示されたその中国語表意文字に相当するローマ字を入力する。ステップＳ１３０で、入力されたローマ字相当語が記憶される。操作は次いで、ステップＳ１４０へ続く。

ステップＳ１４０では、次の中国語表意文字をローマ字化するか否かについての判断が行われる。ローマ字化するのであれば、操作はステップＳ１１０に戻る。ステップＳ１１０では、次の中国語表意文字が選択され表示される。ローマ字化しないのであれば、操作はステップＳ１５０へ進み、そこで、本方法の操作は終了する。

図３は、図１に示されたインターフェイス１０００を用いて、ユーザのパーソナル・スペリング辞書を構築する方法に関する第２の例示的実施形態の概要を説明するフローチャートである。この第２の例示的実施形態では、図２に概要が示された第１の例示的実施形態にはない、概要が上記された様々な特徴が実装されている。図３に示されるように、本発明の操作はステップＳ２００で開始され、ステップＳ２１０へ続く。ステップＳ２１０では、特定の方言をそのユーザについての適用されている方言および／またはパーソナル辞書として識別したか否かの判定が行われる。識別しなかった場合には、操作はステップＳ２３０へ直接ジャンプする。識別した場合、すなわち、標準的な方言が既知である場合には、操作はステップＳ２２０へ進む。

ステップＳ２２０では、その適用されている方言の中に存在しないシラブルについての音声コンビネーションにマークが付される。図１に示された例では、その適用されている方言の中に存在しないシラブルについての音声コンビネーションを表しているセルは、音声テーブル１１００における黒色セル１１３０としてマークが付される。音声学的には可能であるもののその適用されている方言では用いられないシラブルについての音声コンビネーションは、音声テーブル１１００における灰色セル１１５０としてマークが付される。音声学的には可能であるものの標準的な方言では用いられないシラブルについての音声コンビネーションも、音声テーブル１１００における黒色セル１１３０としてマークを付すことができる。しかしながら、ステップＳ２１０およびステップＳ２２０は省略することができる、ということを認識すべきである。その後、操作はステップＳ２３０へ続く。

ステップＳ２３０では、ローマ字相当語の既知でない音声コンビネーションが選択される。この音声コンビネーションは、インタビュー・セッションが開始されたばかりの場合であれば、最初の音声コンビネーションであるであろう。この音声コンビネーションは、インタビュー開始後、当該インタビューの間に選択されたのであれば、次の音声コンビネーションでもあるであろう。この音声コンビネーションは自動的に選択される。すなわち、この場合には、この音声コンビネーションは、例えば、オートオープン関数１２４８を用いて選択される。ステップＳ２３０では、音声コンビネーションについての最初の音声ローマ字化セッションあるいは次の音声ローマ字化セッションを、ある音声コンビネーションに関連した母音および子音のシーケンシャルな位置によるシーケンシャル順序で選択することができる。ステップＳ２３０では、最初の音声コンビネーションあるいは次の音声コンビネーションをローマ字化のためにランダムに選択することができる。加えて、ステップＳ２３０では、最初の音声コンビネーションあるいは次の音声コンビネーションを、予めローマ字化された音声コンビネーションどうしの間、および／または、中国語方言どうしの間における類似点および相違点を反映する試験に従ってローマ字化のために選択される論理的手法で選択することができる。最初の音声コンビネーションあるいは次の音声コンビネーションが選択された後に、操作はステップＳ２４０へ続く。

ステップＳ２４０では、選択された音声コンビネーションに相当する中国語表意文字が表示される。例の１が図１に示されており、ここでは、「母」を意味する中国語文字／表意文字が「ｍａ」の音声コンビネーションに従って示される。次に、ステップＳ２５０では、表示された中国語表意文字のローマ字相当語がユーザから得られる。ユーザは、自分がその中国語文字をスペリングし、かつ／または、発音するであろう方法に従って、そのローマ字相当語を入力する。その後、ステップＳ２６０では、そのローマ字相当語は、表示された音声コンビネーションに対して記憶され、あるいは、記録される。次に、ステップＳ２７０では、他の何らかの音声コンビネーションを導き出すことができるか否かを判断するために、音声データの現在の状態が解析される。操作はその後、ステップＳ２８０へ続く。

ステップＳ２７０での解析には、類似した中国語文字についてのローマ字相当語を、適用されている方言の特性に基づいて、文字のグループ中の可能な一般的な音声パターンから導き出すことが含まれる。例えば、適用されている方言における子音「ｚ」と母音「ｅｉ」とが、各々、ユーザの方言において「ｚｈ」および「ａｉ」として常にローマ字化されるということを、その適用されている方言の特性、および／または、ユーザがこれまでに得た情報から決定することができる場合には、その適用されている方言において音声コンビネーション「ｚｅｉ」のあるすべての表意文字に、そのユーザの方言において「ｚｈａｉ」のローマ字相当語がある、という一般論を引き出すことができる。また、適用されている方言における音声コンビネーション「ｚｅｉ」がそのユーザの方言における「ｚｈａｉ」のローマ字相当語に関連付けられる場合、適用されている方言における音声コンビネーション「ｓｈｕｎ」は、あらかじめローマ字化された中国語表意文字どうしの間および／または中国語方言どうしの間における類似点および相違点に基づいて、ユーザの方言における「ｘｏｎｇ」のローマ字相当語に関連付けしなければならない、ということを導き出すことができる。しかしながら、他の様々な例示的実施形態では、ステップＳ２７０は省略することができる。

ステップＳ２８０では、ローマ字相当語は、決定された他の音声コンビネーションの何れかについて導き出される。ステップＳ２７０に関連して、上記例では、適用されている方言における子音「ｚ」と母音「ｅｉ」とが各々、ユーザの方言において［ｚｈ］および「ａｉ」として常にローマ字化されるということを決定することができる場合には、その適用されている方言において音声コンビネーション「ｚｅｉ」があるすべての表意文字は、適用されている方言において音声結合「ｚｅｉ」がある表意文字の各々についてインタビューする必要なく、そのユーザの方言における「ｚｈａｉ」として自動的にローマ字化されるであろう。また、ステップＳ２７０に関連して上記されたように、適用されている方言における音声コンビネーション「ｓｈｕｎ」があるすべての表意文字は、適用されている方言における音声コンビネーション「ｓｈｕｎ」がある表意文字の何れかについてインタビューする必要なく、そのユーザの方言における「ｘｏｎｇ」として自動的にローマ字化されるであろう、ということを導き出すことができる。操作はその後、ステップＳ２９０へ続く。

ステップＳ２９０では、決定された他の音声コンビネーションについて各々導き出されたローマ字相当語が、記憶されあるいは記録される。その後、ステップＳ３００では、ローマ字相当語が決定されなかった適用されている方言において許容できる音声コンビネーションがあるか否かについての判断が行われる。そのような音声コンビネーションがあれば、操作はステップＳ３１０へ続く。そのような音声コンビネーションがない場合には、操作はステップＳ３２０へジャンプする。

ステップＳ３１０では、ユーザが現在のインタビュー・セッションを終了させたいか否かについての判断が行われる。終了させたくなければ、操作はステップＳ２３０へ戻り、ステップＳ２３０で次の音声結合が選択される。終了させたい場合には、操作はステップＳ３２０へ続き、ステップＳ３２０で本方法の操作は終了する。

図２〜図４に示された第１の例示的実施形態および第２の例示的実施形態のうちのいずれかを用いることで、ユーザは、該ユーザが中国語を話す方法を反映するために、パーソナル・スペリング辞書を構築することができる。該パーソナル・スペリング辞書は、適用されている方言に反映される場合と異なっていてもよいし、若しくは、異なっていなくてもよい。音声コンビネーションはユーザによって選択されてもよい。この選択はローマ字相当語が既知でない場合に、されてもよい。ローマ字相当語がユーザによって、あるいは、方言判断セッションによって（例えば、導出によって）、予め定義されていた場合でも、更新のためにこの選択を行うことができる。

本発明によるユーザ適応型のローマ字による中国語文章入力のシステムおよび方法に関する他の様々な例示的実施形態では、ユーザは、本システムがユーザの方言を判断することができるようにするために、ある方言を直接選ぶことで、あるいは、いくつかの方言に関係のある質問に直接回答することで、あるインタビュー・セッションを開始することを選ぶことができる。

図５は、本発明によって、ユーザにより提供されたローマ字化情報を用いてユーザの方言を判断するための方法に関する例示的実施形態の１の概要を説明するフローチャートである。本方法の操作はステップＳ４００で開始され、ステップＳ４１０へ続く。ステップＳ４１０ではユーザに最初の質問が表示される。この最初の質問の例には、「あなたの方言は何ですか。」、「あなたの方言は何であると思いますか。」、「あなたはどこに住んでいますか。」、「あなたの故郷で話されている方言は何ですか。」などが含まれる。この最初の質問は、図１に示されたインターフェイス１０００のようなインターフェイスに示された表意文字についてのものであってもよい。操作はその後、ステップＳ４２０へ続く。

ステップＳ４２０では、表示された質問に対する回答の入力がユーザから得られる。その回答は、所定の可能な回答のリストから選択されてもよいし、あるいは、キーボードのような装置を通してユーザが入力してもよい。例えば、ユーザは、ある表意文字についてのローマ字相当語でタイプしてもよい。その後、ステップＳ４３０では、ユーザの方言をこれまでに得られた情報から判断することができるか否かについての判断が行われる。判断することができるならば、操作はステップＳ４６０へジャンプする。判断することができない場合は、操作はステップＳ４４０へ進む。

ステップＳ４４０では、ユーザから得られた先の答えに基づいて次の質問が決定される。次に、ステップＳ４５０では、ステップＳ４４０で決定された次の質問がユーザに表示される。操作はその後、ステップＳ４２０へ戻る。

ステップＳ４５０で表示される次の質問を決定する場合に、次の質問と先の回答との間における関係は、あまり関連のないものから、たいへん関連のあるものまで、の何れであってもよい。例えば、極端な１の場合には、次の質問を決定する場合に、先の回答を論理的に用いて、ユーザの方言を判断するのに何の関係もない質問を排除することができる。これに対して、別の極端な場合には、先の回答にほとんど関係なく、事実上ランダムなやり方で次の質問を決定することができる。これら２つの極端な場合の間として、次の質問の決定を、先の回答に基づいて行うこともできる。

ステップＳ４６０では、ユーザの方言が、表示された質問に対するユーザの回答に基づいて判断される。その後、ステップＳ４７０では、判断されたその方言が記憶される。操作はその後、ステップＳ４８０へ続き、本方法の操作は終了する。

図６は、本発明によるパーソナル・スペリング辞書生成システム１００の例示的実施形態の１のブロック図である。図６に示されるように、パーソナル・スペリング辞書生成システム１００は、入力／出力インターフェイス１１０、コントローラ１２０、メモリ１３０、音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション１４０、音声コンビネーション選択回路、ルーチンあるいはアプリケーション１５０、ローマ字化情報解析回路、ルーチンあるいはアプリケーション１８０、方言判断回路、ルーチンあるいはアプリケーション１９０、質問選択回路、ルーチンあるいはアプリケーション２００を含み、これらの構成要素の各々は、１以上の制御および／またはデータバスおよび／または１以上のアプリケーション・プログラム・インターフェイス２３０によって、相互に接続されている。

図６に示されるように、パーソナル・スペリング辞書生成システム１００はプログラム式汎用目的コンピュータに実装される。しかしながら、パーソナル・スペリング辞書生成システム１００は、特定目的コンピュータ、プログラム式のマイクロプロセッサあるいはマイクロコントローラおよび周辺機器向け集積回路要素、エーシック（ＡＳＩＣ）あるいは他の集積回路、デジタル・シグナル・プロセッサ（ＤＳＰ）、離散素子回路のようなハードワイヤード電子回路あるいは論理回路、ＰＬＤ、ＰＬＡ、ＦＰＧＡあるいはＰＡＬなどのようなプログラム式論理装置に実装することもできる。一般に、図２〜図５に示されるフローチャートを実行することのできる有限状態機械を導入することのできる何らかの装置は、パーソナル・スペリング辞書生成システム１００を実装するために使うことができる。パーソナル・スペリング辞書生成システム１００は音声ベース・インプット・メソッド・エディタのプリプロセッサである。

入力／出力（Ｉ／Ｏ）インターフェイス１１０は複数のコンポーネントを有していてもよい。このＩ／Ｏインターフェイス１１０はパーソナル・スペリング辞書生成システム１００の外部とインターアクトする。例えば、Ｉ／Ｏインターフェイス１１０は、１以上のユーザ入力装置３００からリンク３１０を経てユーザの入力を受ける。Ｉ／Ｏインターフェイス１１０は、表示装置４００へリンク４１０を経て情報を出力する。１以上のユーザ入力装置３００は、マウス、トラックボール、キーボード、ジョイスティックなどであってよい。１以上のユーザ入力装置３００は、インタラクティブ・スクリーンに表示されたグラフィカル・ユーザ・インターフェイス・ウィジェットとインターアクトしてもよい。１以上の表示装置４００は、表示スクリーン、インタラクティブ・スクリーンなどであってよい。

図６に示されるように、メモリ１３０は、変更可能メモリ、揮発性メモリ、不揮発性メモリ、変更不可メモリあるいは固定メモリのうち適切な任意の組み合わせを用いて実施することができる。変更可能メモリは、揮発性であっても不揮発性であってもよく、スタティックＲＡＭあるいはダイナミックＲＡＭ、フレキシブル・ディスクとそのディスク・ドライブ、書込可能あるいは再書込可能光ディスクとそのディスクドライブ、ハードディスクドライブ、フラッシュメモリなどのうち、１以上の任意の組み合わせを用いて実施することができる。同様に、変更不可メモリあるいは固定メモリは、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭのような光ＲＯＭディスクとこれらのディスクドライブなどのうち、１以上の任意の組み合わせを用いて実施することができる。図６に示されるように、メモリ１３０は、相異なる方言の音声データを記憶する音声データ部１３１、パーソナル・スペリング辞書生成システム１００によって生成され、かつ／または、更新されたパーソナル辞書と関連ファイルとを記憶する辞書部１３２、ユーザからの入力を記憶するユーザ入力部１３３、インタビュー・セッションの情報を記憶するインタビュー部１３４、そして、オプションとして、ユーザの方言を判断する場合に尋ねられる質問を含むことのできる質問情報を記憶する質問部１３５の、１以上が含まれている。

図６に示されている様々な回路、ルーチンあるいはアプリケーションは、コンピュータ・ソフトウェア、実行可能なコンピュータ・コードなどを含むが、これらに限定されるものではなく、プログラム可能なあるいはプログラムされた回路、ルーチンあるいはアプリケーションであってよい。図６に示されているパーソナル・スペリング辞書生成システム１００では、音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション１４０は、ある方言に存在しないシラブルの音声コンビネーションにマークを付けるために機能する。音声コンビネーション選択回路、ルーチンあるいはアプリケーション１５０は、１以上のローマ字相当語が定義される音声コンビネーションを選択する。図示されない表示回路、ルーチンあるいはアプリケーションは、インタビュー・インターフェイス１０００および／またはローマ字化パネル１３００のような表示されたユーザ入力スクリーンを変更して、選択された音声コンビネーションに相当する中国語表意文字を表示装置４００に表示する。

コントローラ１２０は、辞書部１３２にローマ字化情報を記憶する。中国語表意文字に応じて、ユーザによりローマ字化パネル１３００に入力される及び／又は定義されるローマ字相当語情報のような該ローマ字化情報は、ユーザにより、１以上のユーザ入力装置３００及び／又は表示されているユーザ入力スクリーンを使用して入力される。ローマ字化情報解析回路、ルーチンあるいはアプリケーション１８０は、実施されるのであれば、何らかの音声コンビネーションを導出することができるか否かを判断するために音声データの状態を解析し、判断された何らかの付加的音声コンビネーションについてのローマ字相当語を導出し、かつ／または、記憶する。方言判断回路、ルーチンあるいはアプリケーション１９０は、備えられているのであれば、ある方言を辞書部１３２および／またはインタビュー部１３４に記憶された利用可能な情報から判断することができるか否かを判断する。質問選択回路、ルーチンあるいはアプリケーション２００は、備えられているのであれば、インタビューの間に表示するための質問を決定する。質問部１３５は、備えられているのであれば、質問選択回路、ルーチンあるいはアプリケーション２００が作用する際に、質問選択回路、ルーチンあるいはアプリケーション２００が選択する質問を記憶する。

本発明のパーソナル・スペリング辞書生成システム１００が作用する場合には、ユーザは、自分のパーソナル・スペリング辞書を構築するために、図６に示されているパーソナル・スペリング辞書生成システム１００を使用する。作用中、ユーザは、１以上のユーザ入力装置３００およびＩ／Ｏインターフェイス１１０を介して、パーソナル・スペリング辞書生成システム１００とインターアクトする。

ユーザが、該ユーザのパーソナル・スペリング辞書を生成するための、あるいは、パーソナル・スペリング辞書にある情報を更新したり、情報の量を増やしたりするための、所望を示すと、質問選択回路、ルーチンあるいはアプリケーション２００は、適用されている方言あるいは個人言語を判断するために、質問部１３５に記憶されている質問情報に基づいて、コントローラ１２０の制御の下で、質問を選択しあるいは生成する。該質問は、コントローラ１２０の制御の下で、入力／出力インターフェイス１１０を介して出力され、表示装置４００に表示される。

適用されている方言あるいは個人言語が既知であるか否かを示すために、かつ／または、その適用されている方言あるいは個人言語が何であるかを示すために、ユーザがある回答を入力すると、入力／出力インターフェイス１１０が、コントローラ１２０の制御の下で、１以上のユーザ入力装置３００からユーザの入力を受け、その回答がユーザ入力部１３３に記憶される。その回答によって、適用されている方言あるいは個人言語が既知であることと、その適用されている方言あるいは個人言語が何であるかということとが示されると、コントローラ１２０は、音声データ部１３１の中に記憶されている、実装されている方言あるいは個人言語を呼び出して、それを音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション１４０へ転送する。音声コンビネーション・マーク付け回路、ルーチンあるいはアプリケーション１４０は、コントローラ１２０の制御の下で、その適用されている方言あるいは個人言語に存在しないシラブルの音声コンビネーションにマークを付ける。

次に、音声コンビネーション選択回路、ルーチンあるいはアプリケーション１５０が、１以上のユーザ入力装置３００およびＩ／Ｏインターフェイス１１０を介して、ユーザとインターアクトする。例えば、ユーザは、表示装置４００に表示された音声コンビネーション・セルを、１以上のユーザ入力装置３００を用いて選択することができる。これに応じて、コントローラ１２０が、ユーザの入力を音声コンビネーション選択回路、ルーチンあるいはアプリケーション１５０へ転送し、該音声コンビネーション選択回路、ルーチンあるいはアプリケーション１５０が、表示装置４００における選択された音声コンビネーションに関連した表意文字を含んでいるローマ字化パネル１３００を、コントローラ１２０の制御の下で表示する。

さらに、ユーザは、表示装置４００のローマ字化パネル１３００に表示された表意文字に相当するローマ字を、１以上のユーザ入力装置３００を用いて入力することができる。これに応じて、コントローラ１２０が、ユーザの入力をローマ字化情報解析回路、ルーチンあるいはアプリケーション１８０へ転送し、該ローマ字化情報解析回路、ルーチンあるいはアプリケーション１８０が、何らかの音声コンビネーションを導出することができるか否かを決定するために、その入力および／または音声データ部１３１に記憶されている音声データの状態を、コントローラ１２０の制御の下で、解析する。音声コンビネーションを導出することがまったくできない場合には、ローマ字化情報解析回路、ルーチンあるいはアプリケーション１８０は、コントローラ１２０の制御の下で、ユーザの入力を音声データ部１３１に記憶する。これに対して、音声コンビネーションを導出することができる場合には、ローマ字化情報解析回路、ルーチンあるいはアプリケーション１８０は、決定された何らかの付加的音声コンビネーションについてのローマ字相当語をコントローラ１２０の制御の下で、導出する。その後、ローマ字化情報解析回路、ルーチンあるいはアプリケーション１８０は、音声データ部１３１におけるユーザの入力に沿って、決定された付加的音声コンビネーションの何れかについて導出されたローマ字相当語を、コントローラ１２０の制御の下で、記憶する。

本発明によるパーソナル・スペリング辞書生成システム１００の操作についての別の例示的実施形態では、ユーザは、自分のパーソナル・スペリング辞書を読み込みかつ／またはダウンロードするために、図６に示されているパーソナル・スペリング辞書生成システム１００を使用する。この例示的実施形態では、ユーザは、１以上のユーザ入力装置３００およびＩ／Ｏインターフェイス１１０を用いて、パーソナル・スペリング辞書生成システム１００とインターアクトする。コントローラ１２０は、ユーザのパーソナル・スペリングを辞書部１３２へアップロードし、あるいは、ユーザのパーソナル・スペリング辞書からダウンロードする。

本発明のパーソナル・スペリング辞書生成システム１００の操作についての別の例示的実施形態では、ユーザは、自分の方言を判断するために、図６に示されているパーソナル・スペリング辞書生成システム１００を使用する。この例示的実施形態では、ユーザは、１以上のユーザ入力装置３００およびＩ／Ｏインターフェイス１１０を用いて、パーソナル・スペリング辞書生成システム１００とインターアクトする。

ユーザが、自分の方言を判断する所望を示すと、質問選択回路、ルーチンあるいはアプリケーション２００は、コントローラ１２０の制御の下で、ユーザに尋ねる質問を決定する。質問選択回路、ルーチンあるいはアプリケーション２００は、選択された質問を質問部１３５からリトリーブして、コントローラ１２０の制御の下で、その質問を表示装置４００に表示する。

ユーザが回答を入力すると、入力／出力インターフェイス１１０がその回答を受信し、コントローラ１２０の制御の下で、その回答をユーザ入力部１３３に記憶する。さらに、方言判断回路、ルーチンあるいはアプリケーション１９０は、コントローラ１２０の制御の下で、ユーザの方言を判断することができるか否かを判断する。方言判断回路、ルーチンあるいはアプリケーション１９０がユーザの方言を判断することができないと判断すると、質問選択回路、ルーチンあるいはアプリケーション２００は、コントローラ１２０の制御の下で、ユーザに示すための別の質問を決定する。そして、同様の処理が繰り返される。方言判断回路、ルーチンあるいはアプリケーション１９０がユーザの方言を判断することができると判断すると、方言判断回路、ルーチンあるいはアプリケーション１９０は、コントローラ１２０の制御の下で、ユーザの方言を判断し、判断された方言を記録／記憶するために、インタビュー部１３４に指示を出す。ユーザの方言が判断された後に、パーソナル・スペリング辞書生成システム１００の操作は終了する。ユーザの方言が判断された後、パーソナル・スペリング辞書生成システム１００の操作が終了する前に、ユーザの方言の判断を変更するオプションをユーザに提示するようにしてもよい。

本発明のパーソナル・スペリング辞書生成システム１００の操作についての別の例示的実施形態では、ユーザは、１以上の対話セッションを介してユーザの方言を判断するために、図６に示されているパーソナル・スペリング辞書生成システム１００を使用する。この操作では、ユーザは、ユーザ入力装置３００からＩ／Ｏインターフェイス１１０を介してパーソナル・スペリング辞書生成システム１００とインターアクトする。ユーザの方言を判断する場合、質問選択回路、ルーチンあるいはアプリケーション２００は、ユーザの方言あるいは個人言語を判断することができるように、ユーザへの質問を、コントローラ１２０の制御の下で、ユーザに表示する。

１００パーソナル・スペリング辞書生成システム
１５０音声コンビネーション選択回路、ルーチン、アプリケーション
１８０ローマ字化情報解析回路、ルーチン、アプリケーション
１０００インタビュー・インターフェイス

Claims

複数の方言の中から中国語の方言を選択する機能と、
選択された前記中国語の方言において存在しないシラブルに対応する音声コンビネーションを除外する音声コンビネーションのマトリックスを表示手段に表示する機能と、
表示された音声コンビネーションの前記マトリックスから音声コンビネーションを選択する機能と、
選択された前記音声コンビネーションに相当する第１のローマ字を定義するためにユーザによって使用されるユーザインターフェースを前記表示手段に表示する機能と、
選択された前記中国語の方言における選択された前記音声コンビネーションに対応する第１の中国語の文字を前記表示手段に表示する機能と、
前記第１の中国語の文字と相当する第１のローマ字とを対応付ける機能と、
ユーザの方言を識別するために第１の質問を前記表示手段に表示する機能と、
ユーザからの第１の回答を入力手段から受信する機能と、
前記第１の回答を分析することによりユーザの方言を判断するために該第１の回答が適当であるか否かを判断する機能と、
前記第１の回答が適当である場合には、
ユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、
前記第１の回答が適当でない場合には、
前記第１の回答にもとづいて第２の質問を選択する機能と、
ユーザの方言を識別するために前記第２の質問を表示手段に表示する機能と、
ユーザからの第２の回答を前記入力手段から受信する機能と、
前記第２の回答を分析することによりユーザの方言を判断するために該第２の回答が適当であるか否かを判断する機能と、
前記第２の回答が適当である場合にはユーザの方言を判断し、判断されたユーザの方言を記憶手段に記憶する機能と、
をコンピュータに実現させるためのプログラムであって、
前記第１の質問および第２の質問は、前記表示手段に表示される表意文字についての質問を含み、該第１の質問および第２の質問に対する回答は表示される前記表意文字に相当するローマ字を含む、
プログラム。
パーソナルスペリング辞書を入出力手段を介して入出力する機能、
をさらに有し、
前記パーソナルスペリング辞書は、選択された前記中国語の方言において少なくとも一つの音声コンビネーションの各々に相当する少なくとも一つのローマ字を含む、
請求項１に記載のプログラム。
音声コンビネーションの前記マトリックスは、第１の軸に母音フォニームリストを配置し、第２の軸に子音フォニームリストを配置したマトリックスである、請求項１に記載のプログラム。