JP5293091B2 - データ処理装置、そのコンピュータプログラムおよびデータ処理方法 - Google Patents

データ処理装置、そのコンピュータプログラムおよびデータ処理方法 Download PDF

Info

Publication number
JP5293091B2
JP5293091B2 JP2008278998A JP2008278998A JP5293091B2 JP 5293091 B2 JP5293091 B2 JP 5293091B2 JP 2008278998 A JP2008278998 A JP 2008278998A JP 2008278998 A JP2008278998 A JP 2008278998A JP 5293091 B2 JP5293091 B2 JP 5293091B2
Authority
JP
Japan
Prior art keywords
language
phonetic
phrase
data processing
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008278998A
Other languages
English (en)
Other versions
JP2010108201A (ja
Inventor
有貴 高畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008278998A priority Critical patent/JP5293091B2/ja
Publication of JP2010108201A publication Critical patent/JP2010108201A/ja
Application granted granted Critical
Publication of JP5293091B2 publication Critical patent/JP5293091B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、日本語などの第一言語語句の発音を英語などの第二会話言語の利用者に伝達するために利用されるデータ処理装置に関する。
現在、日本に入国する外国人の数は年々増えている。グローバル化が進んだことで、英語を読むことのできる日本人は増えているが、日本語を読むことのできる外国人はそれほど多くない。
日本語の地名等は、外国人向けにローマ字で記述されることが多い。ローマ字は、平仮名一文字とアルファベットが一対一で対応しているため、日本語を簡単にアルファベットに置き換えることができる。
しかし、英語では、アルファベットと発音との関係が一対一とは限らない。このため、英語を話す外国人がローマ字を読むと、しばしば間違いが生じる。例えば、「ふうせん」と言う言葉をローマ字で書くと「Fuusen」「Fusen」のようになる。しかし、初めてこの単語を見た外国人は「ふっせん」「ふせん」と読むことが多く、「ふうせん」とは読めない可能性が高い。
観光地などではローマ字表記がよく使われているが、日本語を学んでいる外国人でなければ正しい読み方で読んでいない可能性がある。特に、観光の目的で来日し、日本語の分からない外国人ほど間違えている可能性が高い。
また駅名なども、日本語の他にローマ字で記述されていることが多いが、こちらも正しい読み方で読まれていない可能性があり、駅員や周りの人に目的地を伝えようと思っても、なかなか伝わらないのではないかという心配がある。
日本人にとって英語の発音が難しいように、外国人にとっても日本語の発音はとても難しいといわれている。日本人が英語を学ぶ教材は数多く存在するが、日本語が学べる教材はまだまだ少ない。
従来のローマ字を使わずに、英語を第一会話言語とする人たちが発音を想像できる「フォネティック・スペリング(Phonetic spelling)」を使って記述することで、正しい日本語の読み方を伝えることができるようになる。
例えば、「ふうせん」は「foo-sen」または「who-sen」と書くことで、ほとんどの人が「ふうせん」と読めるようになる。前者は「Food」と言う日常よく使う単語から、「foo」が「ふう」の発音だと容易に想像でき「sen」も「sent」等から「せん」と発音すると容易に想像ができるからである。
このような発音記号は「フォネティック・スペリング」として、欧米では一般的に使われているが、日本ではあまりなじみがない。しかし、観光で日本にくる外国人は、ローマ字よりも「フォネティック・スペリング」の方が読みやすく、なじんでいるので、こちらで書いた方が日本語の読み方を正確に伝えることができる。
この方法を使えば、観光地に来ている日本語を話すことのできない外国人でも、標準的な英語の読み方が分かっていれば、日本語に近い発音で目的地を伝えることができるようになり、ホテルやタクシーで目的地を伝えるとき等に、スムーズにコミュニケーションをとることができる。
なお、当然ながら、日本語などの第一会話言語の利用者が、英語などの第二会話言語の利用者と、会話できるときには、その発音を伝達することができる。しかし、例えば、日本語の単語の発音を英語の利用者に電子メールなどで伝達するような場合、当然ながら「ふうせん」と表記しても読むことができず、前述のように「Fuusen」や「Fusen」と表記しても「ふっせん」や「ふせん」と発音される可能性が高い。
このような場合、前述のように「フォネティック・スペリング(Phonetic spelling)」を使って「foo-sen」や「who-sen」と表記すれば、電子メールなどでも日本語の発音を英語の利用者に略正確に伝達することができる。
現在、上述のように外国語でも発音を容易とするための装置として各種の提案がある(例えば、特許文献1,2参照)。
特開2004−294639号公報 特開平04−010052号公報
しかし、特許文献1の技術は、「カタカナにアクセント記号を付けて」正しい発音を伝えることを可能にするシステムでしかない。また、特許文献2の技術は、「カタカナで記述した英単語から、対応する正しい英単語を探す」と言うシステムでしかない。このため、特許文献1,2の技術を利用しても、日本語などの第一会話言語の発音を、英語などの第二会話言語を読める人に略正確に伝えることは困難である。
本発明は上述のような課題に鑑みてなされたものであり、日本語などの第一会話言語の発音を、英語などの第二会話言語を読める人に略正確に伝えることを可能とするデータ処理装置、そのコンピュータプログラムおよびデータ処理方法、を提供するものである。
本発明のデータ処理装置は、第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶手段と、第二会話言語の言語語句である第二言語語句と発音記号とを対応させて記憶する第二記憶手段と、第一会話言語の言語語句である第一言語語句が表音文字で入力される語句入力手段と、入力された表音文字に対応する発音記号を第一記憶手段から検索する第一検索手段と、検索された発音記号に対応して少なくとも一つの第二言語語句の少なくとも一部を第二記憶手段から検索する第二検索手段と、検索された少なくとも一つの第二言語語句の少なくとも一部を入力された第一言語語句の代替の表音文字として出力する代替出力手段と、を有する。
本発明のコンピュータプログラムは、第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶処理と、第二会話言語の言語語句である第二言語語句と発音記号とを対応させて記憶する第二記憶処理と、第一会話言語の言語語句である第一言語語句が表音文字で入力される語句入力処理と、入力された表音文字に対応する発音記号を検索する第一検索処理と、検索された発音記号に対応して少なくとも一つの第二言語語句の少なくとも一部を検索する第二検索処理と、検索された少なくとも一つの第二言語語句の少なくとも一部を入力された第一言語語句の代替の表音文字として出力する代替出力処理と、をデータ処理装置に実行させる。
本発明のデータ処理方法は、第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶動作と、第二会話言語の言語語句である第二言語語句と発音記号とを対応させて記憶する第二記憶動作と、第一会話言語の言語語句である第一言語語句が表音文字で入力される語句入力動作と、入力された表音文字に対応する発音記号を検索する第一検索動作と、検索された発音記号に対応して少なくとも一つの第二言語語句の少なくとも一部を検索する第二検索動作と、検索された少なくとも一つの第二言語語句の少なくとも一部を入力された第一言語語句の代替の表音文字として出力する代替出力動作と、を有する。
なお、本発明の各種の構成要素は、その機能を実現するように形成されていればよく、例えば、所定の機能を発揮する専用のハードウェア、所定の機能がコンピュータプログラムにより付与されたデータ処理装置、コンピュータプログラムによりデータ処理装置に実現された所定の機能、これらの任意の組み合わせ、等として実現することができる。
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
また、本発明のコンピュータプログラムおよびデータ処理方法は、複数の処理および動作を順番に記載してあるが、その記載の順番は複数の処理および複数の動作を実行する順番を限定するものではない。
このため、本発明のコンピュータプログラムおよびデータ処理方法を実施するときには、その複数の処理および複数の動作の順番は内容的に支障しない範囲で変更することができる。
さらに、本発明のコンピュータプログラムおよびデータ処理方法は、複数の処理および複数の動作が個々に相違するタイミングで実行されることに限定されない。このため、ある処理および動作の実行中に他の処理および動作が発生すること、ある処理および動作の実行タイミングと他の処理および動作の実行タイミングとの一部ないし全部が重複していること、等でもよい。
また、本発明で云うデータ処理装置は、コンピュータプログラムを読み取って対応する処理動作を実行できるように、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、I/F(Interface)ユニット、等の汎用デバイスで構築されたハードウェア、所定の処理動作を実行するように構築された専用の論理回路、これらの組み合わせ、等として実施することができる。
なお、本発明でコンピュータプログラムに対応した各種動作をデータ処理装置に実行させることは、各種デバイスをデータ処理装置に動作制御させることなども意味している。
例えば、データ処理装置に各種データを記憶させることは、データ処理装置に固定されているHDD(Hard Disc Drive)等の情報記憶媒体にCPUが各種データを格納すること、データ処理装置に交換自在に装填されているCD−R(Compact Disc-Recordable)等の情報記憶媒体にCPUがCDドライブで各種データを格納すること、等を許容する。
なお、本発明で云う「データを記憶する」とは、本発明の装置が、少なくともデータを記憶する機能を有することを意味している。このため、本発明の装置がコンシューマにより新規に登録されるデータを記憶することの他、サプライヤにより製造時に登録されたデータを記憶して出荷後にはコンシューマにより新規のデータが登録されないことも許容する。
本発明のデータ処理装置では、第一会話言語の表音文字と第二会話言語の発音記号とを対応させて第一記憶手段が記憶し、第二会話言語の言語語句である第二言語語句と発音記号とを対応させて第二記憶手段が記憶する。このような状態で、第一会話言語の言語語句である第一言語語句が表音文字で語句入力手段に入力される。この入力された表音文字に対応する発音記号を第一記憶手段から第一検索手段が検索する。これで検索された発音記号に対応して少なくとも一つの第二言語語句の少なくとも一部を第二記憶手段から第二検索手段が検索する。この検索された少なくとも一つの第二言語語句の少なくとも一部を入力された第一言語語句の代替の表音文字として代替出力手段が出力する。このため、日本語などの第一言語語句が表音文字で入力されれば、英語などの第二言語語句が代替の表音文字として出力されるので、日本語などの第一会話言語の発音を英語などの第二会話言語を読める人に略正確に伝えることができる。
本発明の実施の一形態を図面を参照して以下に説明する。本実施の形態のデータ処理装置100は、図1に示すように、第一会話言語である日本語の表音文字である平仮名と第二会話言語である英語の発音記号とを対応させて記憶する第一記憶部110と、英語の言語語句であり第二言語語句である英単語と発音記号とを対応させて記憶する第二記憶部120と、日本語の言語語句であり第一言語語句である日本語句が平仮名で入力される語句入力部150と、入力された平仮名に対応する発音記号を第一記憶部110から検索する第一検索部130と、検索された発音記号に対応して少なくとも一つの英単語の少なくとも一部を第二記憶部120から検索する第二検索部140と、検索された少なくとも一つの英単語の少なくとも一部を入力された日本語句の代替の表音文字として出力する代替出力部160と、を有する。
より具体的には、データ処理装置100は、図2に示すように、例えば、所定のデータサービスを提供するデータベースサーバなどからなり、日本ユーザの複数のデータ処理端末210や米国ユーザの複数のデータ処理端末220などが通信ネットワークであるインターネットINで接続されている。
このデータ処理装置100は、いわゆるCPUやHDDや通信I/Fなどのハードウェアで構築されており、上述のようにデータ処理端末210,220に所定のデータサービスを提供するために適正なコンピュータプログラムが実装されている。
このように実装されているコンピュータプログラムに対応して、例えば、CPUがHDD等のデバイスを統合制御することなどにより、上述の各部110〜がデータ処理装置100に論理的に実現されている。
例えば、第一記憶部110と第二記憶部120とは、CPUがコンピュータプログラムに対応して認識するようにHDDに構築された記憶エリアなどに相当する。語句入力部150は、CPUがコンピュータプログラムに対応してインターネットINから通信I/Fへの入力データを認識する機能などに相当する。
第一検索部130と第二検索部140とは、CPUがコンピュータプログラムに対応してHDDの記憶データを取得する機能などに相当する。代替出力部160は、CPUがコンピュータプログラムに対応して通信I/FからインターネットINへのデータ出力を制御する機能などに相当する。
なお、図4ないし図7に示すように、第一記憶部110は、平仮名の一つずつとともに、平仮名の複数の組み合わせも、英語の発音記号に対応して記憶する。より詳細には、第一記憶部110は、図4に示すように、一つずつの平仮名として少なくとも清音と濁音と半濁音と撥音とを記憶し、複数の組み合わせの平仮名として少なくとも拗音を記憶する。
また、第一記憶部110は、図5に示すように、複数の組み合わせの平仮名として一つずつの平仮名に「あ,い,う,え,お,ん」を一つずつ連続させた二文字の平仮名列を記憶する。この結果、第一記憶部110は、複数の組み合わせの平仮名として長音も平仮名で記憶する。
一方、第二検索部140は、検索された発音記号に対応した音節を検索した英単語から抽出する。また、第二記憶部120は、英単語を英語での使用頻度とともに記憶し、第二検索部140は、使用頻度に対応して英単語を検索する。
上述のような構成において、本実施の形態のデータ処理装置100は、例えば、日本ユーザと米国ユーザとがデータ処理端末210,220で音声データを使用することなくテキストデータで会話する、いわゆる電子メールやチャットなどのデータサービスを提供する。
このとき、本実施の形態のデータ処理装置100は、例えば、米国ユーザが日本語句の発音を日本ユーザに質問したようなときに、その日本語句の発音を英単語で表現するデータサービスなども提供する。
本実施の形態のデータ処理装置100では、詳細には後述するが、日本語の平仮名と英語の発音記号とを対応させて第一記憶部110が記憶しており、英語の言語語句である英単語と発音記号とを対応させて第二記憶部120が記憶している。
このような状態で、図3に示すように、例えば、日本ユーザによりデータ処理端末210からインターネットINを経由して、日本語の言語語句である日本語句が平仮名で語句入力部150に入力される(ステップS1−Y)。
例えば、米国ユーザが日本ユーザに「バルーン」の日本語での発音を質問したような場合、日本ユーザはデータ処理装置100の所定サービスのウェブサイトに(図示せず)、データ処理端末210から日本語句の平仮名「ふうせん」を入力することになる。
すると、このデータ処理装置100では、入力された平仮名に対応する発音記号を第一記憶部110から第一検索部130が検索する(ステップS3)。このとき、詳細には後述するアルゴリズムにより、入力された平仮名は発音記号に対応して所定の文字数に分解される(ステップS2)。
ただし、本実施の形態のデータ処理装置100では、前述のように二文字ずつの平仮名と発音記号との対応関係も記憶している。このため、入力された日本語句は優先的に二文字ずつの平仮名に分解される。
例えば、前述の「ふうせん」は一文字ずつならば「ふ・う・せ・ん」と分解されるが、これは二文字ずつの「ふう・せん」に分解される。このときに、「ふう」と「せん」の間には、分かりやすいように「−」が入力される。
上述のように平仮名が分解されて対応する発音記号が検索されると(ステップS3)、この検索された発音記号に対応して少なくとも一つの英単語の少なくとも一部を第二記憶部120から第二検索部140が検索する(ステップS4)。
このとき、第二記憶部120は、英単語を英語での使用頻度とともに記憶しているので、第二検索部140は、使用頻度に対応して英単語を検索する。さらに、第二検索部140は、第一検索部130で検索された発音記号に対応した音節を、検索した英単語から必要により抽出する(ステップS5)。
例えば、前述の「ふう」の発音記号は「fu:」なので、これに対応する英単語として「Food」が検索される。ただし、「fu:」と同じ発音の部分は「Food」の「Foo」の部分のみなので、「d」は排除されて「foo」のみ抽出されることになる。
上述のように発音記号が英単語ないし音節に置換されるデータ処理が(ステップS4,S5)、日本語句の全部の発音記号が完成するまで繰り返される(ステップS6)。例えば、前述の日本語句「ふうせん」は「foo-sen」などの英語表現に変換される。すると、この英語表現を日本語句の代替の表音文字として、代替出力部160が米国ユーザのデータ処理端末220に出力する(ステップS7)。
本実施の形態のデータ処理装置100では、上述のように日本語などの日本語句が平仮名で入力されれば、英語などの英単語が代替の表音文字として出力される。このため、日本語などの発音を英語などを読める人に略正確に伝えることができる。
また、本実施の形態のデータ処理装置100では、平仮名の一つずつとともに平仮名の複数の組み合わせも英語の発音記号に対応して記憶する。このため、日本語句の発音を英語の発音記号に高効率に変換することができる。
特に、一つずつの平仮名として少なくとも清音と濁音と半濁音と撥音とを記憶し、複数の組み合わせの平仮名として少なくとも拗音を記憶するとともに、複数の組み合わせの平仮名として一つずつの平仮名に「あ,い,う,え,お,ん」を一つずつ連続させた二文字の平仮名列を記憶する。
このため、英語の発音記号の全部に必要最小限の平仮名の文字列を高効率に対応させることができる。特に、上述のように一つずつの平仮名に「あ,い,う,え,お,ん」を一つずつ連続させるので、自動的に複数の組み合わせの平仮名として長音も登録することができる。さらに、本実施の形態のデータ処理装置100では、平仮名として促音を利用しないので、登録する平仮名のデータ量を削減して検索の効率を向上させることができる。
さらに、本実施の形態のデータ処理装置100では、上述のように検索された発音記号に対応した音節を検索した英単語から抽出する。このため、日本語句の発音に英単語が一部のみ対応しているような場合でも、その英単語を部分的に抽出して利用することができる。
しかも、英単語を英語での使用頻度とともに記憶し、使用頻度に対応して英単語を検索する。このため、頻繁に使用される英語表現で結果が生成されることになり、確認が容易な結果を出力することができる。
ここで、上述のようなデータ処理装置100の第一記憶部110に日本語の表音文字である平仮名と英語の発音記号とを対応させて効率的に登録するとともに、第二記憶部120に、英単語と発音記号とを対応させて効率的に登録する手法を、図8等を参照して以下に順次説明する。
まず、平仮名一文字に対応する発音記号を「フォネティック・スペリング」の方法を用いて作成する。例えば、「い」は「ee」、「さ」は「saw」等。ただし、日本語の平仮名一文字だけ(図4)では、英語の発音に対応できない。
例えば、「ふうせん」は「ふ」「う」「せ」「ん」の4つの平仮名で構成されているが、「フォネティック・スペリング」を利用して記述すると「foo-sen」もしくは「who-sen」になる。つまり「ふう」と「せん」の二つの音で構成されることになる。
そのため、平仮名二文字の組み合わせを、いわゆる50音とは別に作成する(図5)。日本語に多いのは、母音(あいうえお)と「ん」との組み合わせであるので、108音(図4)にこの6音をかけあわせて、648音の組み合わせを作る。つまり、108音(図4)と648音(図5)を足した756音が、本実施の形態のデータ処理装置100で利用する、平仮名の一覧となる。
つぎに、この756音の平仮名の組み合わせに、発音記号を当てはめる。発音記号は、辞書により使用しているものが異なるので、変換する際に利用する英語辞書(第二記憶部120)の発音記号を用いて、平仮名を発音記号に変換する。
本発明では、日本で最も利用されているといわれている「ジョーンズ式発音記号」を用いて、平仮名に最も発音が近いと思われる発音記号を例として当てはめた(図6)。756音すべてに、似ていると思われる発音記号を当てはめていき、データベースに格納する(第一記憶部110)。
データベースに格納された発音記号(第一記憶部110)と、英語の単語と発音記号が格納されたデータベース(第二記憶部120)を利用して、平仮名と英単語を比較する。比較は発音記号で行う。
英語の発音記号は、単語の発音記号のはじめから、一つずつ比べていく。例えば、「い」の発音を探す場合、「i:」の発音で始まる英単語を探す。この時、より日常的に使われている単語から検索する方が、読みやすい「フォネティック・スペリング」を生成できるので、コーパス辞書を用いて、利用頻度の高い単語から検索する方がよい。
似ている発音の英単語が見つかったら、発音記号が同じ部分を切り出し、「フォネティック・スペリング」の一覧を作成する(図7)。例えば、「ふう」の発音記号「fu:」を利用して、英語辞書のデータベース(第二記憶部120)を検索し、「Food」が見つかったとする。「fu:」と同じ発音の部分は「Food」の「Foo」の部分のみなので、「ふう」に対応するのは「foo」と判断する(dは削除する)。他の平仮名にも同じ作業を繰り返し、「フォネティック・スペリング」のリストを作成する。
上述のように構築されたデータ処理装置100は、入力された平仮名の一覧を受け取ると、データベースに格納されている平仮名とフォネティック・スペリングの一覧と比較し、平仮名をフォネティック・スペリングのアルファベットに置き換えていく。
「フォネティック・スペリング」を用いてふりがなを作成することで、なじみのない地名や建物も、正しい日本語の発音に近い発音で、外国人も読めるようになる。また、日本人の名前も発音が難しい場合があるが、ローマ字で書かず、本実施の形態のデータ処理装置100の方法で記述すれば日本語に近い発音で名前を呼んでもらえるようになる。
なお、本発明は本実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で各種の変形を許容する。例えば、上記形態では日本語句を英語表現に変換することを例示した。しかし、英語に限らず、スペイン語やフランス語など、他の言語にも同じ方法が適用でき、世界中の国の言語に利用できる。
また、上記形態では108音(図4)と6音(あいうえおん)を掛け、648音(図5)の組み合わせを作成したが、108音×108音として、13456音の組み合わせを作れば、より様々な発音に対応することができるようになる。
さらに、上記形態では一つずつの平仮名として清音と濁音と半濁音と撥音とを記憶し、複数の組み合わせの平仮名として少なくとも拗音を記憶するとともに、複数の組み合わせの平仮名として一つずつの平仮名に「あ,い,う,え,お,ん」を一つずつ連続させた二文字の平仮名列を記憶することを例示した。
しかし、このように一つずつの平仮名に「あ,い,う,え,お,ん」を一つずつ連続させた二文字の平仮名列を利用することなく、清音と濁音と半濁音と撥音と拗音と長音のみ利用するようなこともできる。
また、このような場合に長音を利用しないことも可能である。同様に、一つずつの平仮名に「あ,い,う,え,お」を一つずつ連続させた二文字の平仮名列を利用したり、一つずつの平仮名に「ん」を連続させた二文字の平仮名列を利用するようなこともできる。
さらに、上記形態では平仮名の二文字の平仮名列として促音を利用しないことを例示した。しかし、当然ながら、この促音も利用して、より高品質な結果を出力することも可能である。
また、上記形態ではデータ処理装置100を利用して日本ユーザが平仮名で入力する日本語句を英単語により疑似的な発音記号として米国ユーザに提供するデータサービスを利用した。しかし、本実施の形態のデータ処理装置100は、平仮名の日本語句を英単語による疑似的な発音記号に変換することが有用な、各種サービスに利用することができる。
さらに、本実施の形態ではデータ処理装置100の各部がコンピュータプログラムにより各種機能として論理的に実現されることを例示した。しかし、このような各部の各々を固有のハードウェアとして形成することもでき、ソフトウェアとハードウェアとの組み合わせとして実現することもできる。
なお、当然ながら、上述した実施の形態および複数の変形例は、その内容が相反しない範囲で組み合わせることができる。また、上述した実施の形態および変形例では、各部の構造などを具体的に説明したが、その構造などは本願発明を満足する範囲で各種に変更することができる。
以下、参考形態の例を付記する。
1. 第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶手段と、
前記第二会話言語の言語語句である第二言語語句と前記発音記号とを対応させて記憶する第二記憶手段と、
前記第一会話言語の言語語句である第一言語語句が前記表音文字で入力される語句入力手段と、
入力された前記表音文字に対応する前記発音記号を前記第一記憶手段から検索する第一検索手段と、
検索された前記発音記号に対応して少なくとも一つの前記第二言語語句の少なくとも一部を前記第二記憶手段から検索する第二検索手段と、
検索された少なくとも一つの前記第二言語語句の少なくとも一部を入力された前記第一言語語句の代替の表音文字として出力する代替出力手段と、
を有するデータ処理装置。
2. 前記第二検索手段は、検索された前記発音記号に対応した音節を検索した前記第二言語語句から抽出する1.に記載のデータ処理装置。
3. 前記第二記憶手段は、前記第二言語語句を前記第二会話言語での使用頻度とともに記憶し、
前記第二検索手段は、前記使用頻度に対応して前記第二言語語句を検索する1.または2.に記載のデータ処理装置。
4. 前記第一記憶手段は、前記表音文字の一つずつとともに前記表音文字の複数の組み合わせも前記第二会話言語の前記発音記号に対応して記憶する1.ないし3.の何れか一項に記載のデータ処理装置。
5. 前記第一記憶手段は、前記第一会話言語である日本語の前記表音文字である平仮名と前記第二会話言語である英語の発音記号とを対応させて記憶し、一つずつの前記表音文字として少なくとも清音と濁音と半濁音と撥音とを前記平仮名で記憶し、複数の組み合わせの前記表音文字として少なくとも拗音を前記平仮名で記憶する4.に記載のデータ処理装置。
6. 前記第一記憶手段は、複数の組み合わせの前記表音文字として長音と促音との少なくとも一方を前記平仮名で記憶する5.に記載のデータ処理装置。
7. 前記第一記憶手段は、複数の組み合わせの前記表音文字として一つずつの前記表音文字に「あ,い,う,え,お,ん」を一つずつ連続させた二文字の平仮名列を記憶する5.または6.に記載のデータ処理装置。
8. 第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶処理と、
前記第二会話言語の言語語句である第二言語語句と前記発音記号とを対応させて記憶する第二記憶処理と、
前記第一会話言語の言語語句である第一言語語句が前記表音文字で入力される語句入力処理と、
入力された前記表音文字に対応する前記発音記号を検索する第一検索処理と、
検索された前記発音記号に対応して少なくとも一つの前記第二言語語句の少なくとも一部を検索する第二検索処理と、
検索された少なくとも一つの前記第二言語語句の少なくとも一部を入力された前記第一言語語句の代替の表音文字として出力する代替出力処理と、
をデータ処理装置に実行させるコンピュータプログラム。
9. 第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶動作と、
前記第二会話言語の言語語句である第二言語語句と前記発音記号とを対応させて記憶する第二記憶動作と、
前記第一会話言語の言語語句である第一言語語句が前記表音文字で入力される語句入力動作と、
入力された前記表音文字に対応する前記発音記号を検索する第一検索動作と、
検索された前記発音記号に対応して少なくとも一つの前記第二言語語句の少なくとも一部を検索する第二検索動作と、
検索された少なくとも一つの前記第二言語語句の少なくとも一部を入力された前記第一言語語句の代替の表音文字として出力する代替出力動作と、
を有するデータ処理方法。
本発明の実施の形態のデータ処理装置の論理構造を示す模式的なブロック図である。 データ処理装置を一部とするデータ処理システムの全体構造を示す模式的なブロック図である。 データ処理装置のデータサービスの処理動作を示すフローチャートである。 第一記憶手段である第一記憶部に格納される表音文字である平仮名の一部を示す模式図である。 第一記憶部に格納される平仮名の他部を示す模式図である。 第一記憶部に格納される平仮名と発音記号との対応関係の一部を示す模式図である。 平仮名と英単語の部分との対応関係の一部を示す模式図である。 データ処理装置の第一記憶部と第二記憶部とを作成する処理動作を示すフローチャートである。
符号の説明
100 データ処理装置
110 第一記憶部
120 第二記憶部
130 第一検索部
140 第二検索部
150 語句入力部
160 代替出力部
210 データ処理端末
220 データ処理端末
IN インターネット

Claims (9)

  1. 第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶手段と、
    前記第二会話言語の言語語句である第二言語語句と前記発音記号とを対応させて記憶する第二記憶手段と、
    前記第一会話言語の言語語句である第一言語語句が前記表音文字で入力される語句入力手段と、
    入力された前記表音文字に対応する前記発音記号を前記第一記憶手段から検索する第一検索手段と、
    検索された前記発音記号に対応した少なくとも一つの前記第二言語語句を前記第二記憶手段から検索し、検索された前記発音記号に対応した音節を、検索された前記第二言語語句から抽出する第二検索手段と、
    抽出された少なくとも一つの前記音節を、入力された前記第一言語語句の代替の表音文字として出力する代替出力手段と、
    を有するデータ処理装置。
  2. 前記第二検索手段は、前記第一検索手段によって、入力された前記表音文字に対応する前記発音記号が複数検索された場合に、検索された複数の前記発音記号それぞれに対応した前記第二言語語句を前記第二記憶手段から検索し、検索された複数の前記発音記号それぞれに対応した音節を、検索された複数の前記第二言語語句それぞれから抽出し、
    前記代替出力手段は、抽出された複数の前記音節の組み合わせを、入力された前記第一言語語句の代替の表音文字として出力する請求項1に記載のデータ処理装置。
  3. 前記第二記憶手段は、前記第二言語語句を前記第二会話言語での使用頻度とともに記憶し、
    前記第二検索手段は、前記使用頻度に対応して前記第二言語語句を検索する請求項1または2に記載のデータ処理装置。
  4. 前記第一記憶手段は、前記表音文字の一つずつとともに前記表音文字の複数の組み合わせも前記第二会話言語の前記発音記号に対応して記憶する請求項1ないし3の何れか一項に記載のデータ処理装置。
  5. 前記第一記憶手段は、前記第一会話言語である日本語の前記表音文字である平仮名と前記第二会話言語である英語の発音記号とを対応させて記憶し、一つずつの前記表音文字として少なくとも清音と濁音と半濁音と撥音とを前記平仮名で記憶し、複数の組み合わせの前記表音文字として少なくとも拗音を前記平仮名で記憶する請求項4に記載のデータ処理
    装置。
  6. 前記第一記憶手段は、複数の組み合わせの前記表音文字として長音と促音との少なくとも一方を前記平仮名で記憶する請求項5に記載のデータ処理装置。
  7. 前記第一記憶手段は、複数の組み合わせの前記表音文字として一つずつの前記表音文字に「あ,い,う,え,お,ん」を一つずつ連続させた二文字の平仮名列を記憶する請求項5または6に記載のデータ処理装置。
  8. 第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶処理と、
    前記第二会話言語の言語語句である第二言語語句と前記発音記号とを対応させて記憶する第二記憶処理と、
    前記第一会話言語の言語語句である第一言語語句が前記表音文字で入力される語句入力処理と、
    入力された前記表音文字に対応する前記発音記号を検索する第一検索処理と、
    検索された前記発音記号に対応して少なくとも一つの前記第二言語語句を検索し、検索された前記発音記号に対応した音節を、検索された前記第二言語語句から抽出する第二検索処理と、
    抽出された少なくとも一つの前記音節を、入力された前記第一言語語句の代替の表音文字として出力する代替出力処理と、
    をデータ処理装置に実行させるコンピュータプログラム。
  9. コンピュータによって実行されるデータ処理方法であって、
    第一会話言語の表音文字と第二会話言語の発音記号とを対応させて記憶する第一記憶動作と、
    前記第二会話言語の言語語句である第二言語語句と前記発音記号とを対応させて記憶する第二記憶動作と、
    前記第一会話言語の言語語句である第一言語語句が前記表音文字で入力される語句入力動作と、
    入力された前記表音文字に対応する前記発音記号を検索する第一検索動作と、
    検索された前記発音記号に対応して少なくとも一つの前記第二言語語句を検索し、検索された前記発音記号に対応した音節を、検索された前記第二言語語句から抽出する第二検索動作と、
    抽出された少なくとも一つの前記音節を、入力された前記第一言語語句の代替の表音文字として出力する代替出力動作と、
    を有するデータ処理方法。
JP2008278998A 2008-10-30 2008-10-30 データ処理装置、そのコンピュータプログラムおよびデータ処理方法 Expired - Fee Related JP5293091B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008278998A JP5293091B2 (ja) 2008-10-30 2008-10-30 データ処理装置、そのコンピュータプログラムおよびデータ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008278998A JP5293091B2 (ja) 2008-10-30 2008-10-30 データ処理装置、そのコンピュータプログラムおよびデータ処理方法

Publications (2)

Publication Number Publication Date
JP2010108201A JP2010108201A (ja) 2010-05-13
JP5293091B2 true JP5293091B2 (ja) 2013-09-18

Family

ID=42297601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008278998A Expired - Fee Related JP5293091B2 (ja) 2008-10-30 2008-10-30 データ処理装置、そのコンピュータプログラムおよびデータ処理方法

Country Status (1)

Country Link
JP (1) JP5293091B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7404951B2 (ja) 2020-03-17 2023-12-26 オムロンヘルスケア株式会社 生体情報計測装置、生体情報計測装置の制御方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151194A (ja) * 1991-12-02 1993-06-18 Toshiba Corp 文書作成支援装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7404951B2 (ja) 2020-03-17 2023-12-26 オムロンヘルスケア株式会社 生体情報計測装置、生体情報計測装置の制御方法及びプログラム

Also Published As

Publication number Publication date
JP2010108201A (ja) 2010-05-13

Similar Documents

Publication Publication Date Title
JP4064413B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US7873508B2 (en) Apparatus, method, and computer program product for supporting communication through translation between languages
US8346537B2 (en) Input apparatus, input method and input program
JP4833313B2 (ja) 中国語方言判断プログラム
KR102375115B1 (ko) 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화
US20060224378A1 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
US20070255567A1 (en) System and method for generating a pronunciation dictionary
KR20120006489A (ko) 입력 방법 편집기
JP2011254553A (ja) 小型キーパッド用日本語入力メカニズム
JP2006277119A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2009140466A (ja) 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
Thu et al. The application of phrase based statistical machine translation techniques to Myanmar grapheme to phoneme conversion
JP5293091B2 (ja) データ処理装置、そのコンピュータプログラムおよびデータ処理方法
Trinh et al. Applying prediction techniques to phoneme-based AAC systems
Kabra et al. Auto spell suggestion for high quality speech synthesis in hindi
Thatphithakkul et al. LOTUS-BI: A Thai-English code-mixing speech corpus
WO2021130892A1 (ja) 変換テーブル生成装置、音声対話システム、変換テーブル生成方法、音声対話方法および記録媒体
JP2000330996A (ja) 発音電子辞書
Iso-Sipila et al. Multi-lingual speaker-independent voice user interface for mobile devices
WO2023166651A1 (ja) 情報処理装置及び情報処理プログラム
JP2007094269A (ja) 音声出力機能付き情報表示制御装置およびその制御プログラム
Day New Content Functionality for an Automated Oral Reading Fluency Tutor
JP2020118872A (ja) 情報入力システム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees