JP6208056B2 - 発音表示装置、発音表示方法、及びプログラム - Google Patents

発音表示装置、発音表示方法、及びプログラム Download PDF

Info

Publication number
JP6208056B2
JP6208056B2 JP2014053415A JP2014053415A JP6208056B2 JP 6208056 B2 JP6208056 B2 JP 6208056B2 JP 2014053415 A JP2014053415 A JP 2014053415A JP 2014053415 A JP2014053415 A JP 2014053415A JP 6208056 B2 JP6208056 B2 JP 6208056B2
Authority
JP
Japan
Prior art keywords
language
phonetic
phoneme
pronunciation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014053415A
Other languages
English (en)
Other versions
JP2015176037A (ja
Inventor
大威 徐
大威 徐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014053415A priority Critical patent/JP6208056B2/ja
Priority to CN201510096396.9A priority patent/CN104934042A/zh
Publication of JP2015176037A publication Critical patent/JP2015176037A/ja
Application granted granted Critical
Publication of JP6208056B2 publication Critical patent/JP6208056B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Description

本発明の実施の形態は、発音表示装置、発音表示方法、及びプログラムに関する。
中国語などの声調言語は、音の高低が1音節で変化する。このため、母国語が非声調言語のユーザにとっては、声調言語の発音を学習することは難しい。言語の発音を表示する装置として、発音を音楽記号で示した楽譜を表示する装置や、音韻や声調を表すピンインを表示する装置が知られている。
特開2012−13915号公報
しかしながら、声調言語の発音を楽譜やピンインで表す場合、ユーザは、楽譜やピンインを別途学習する必要がある。このため、従来では、声調言語の発音を解り易く提供することが困難であった。
本発明が解決しようとする課題は、声調言語の発音を解り易く提供することができる、発音表示装置、発音表示方法、及びプログラムを提供することである。
実施の形態の発音表示装置は、変換部と、作成部と、を備える。変換部は、声調言語である第2言語の1音節ごとの音韻を、第1言語の発音を示す複数の第1発音記号に変換する。作成部は、発音図式を、第2言語の1音節ごとに作成する。発音図式は、第1直線と、複数の第1発音記号と、を有する。第1直線は、第1発音記号によって表される音の高低の境界を示す、第1方向に長い直線である。複数の第1発音記号は、第1直線によって区切られ、かつ、第1方向に直交する、第2方向に配列された複数の領域の内、音の高低に応じた領域に配置される。
発音表示装置のブロック図。 第1辞書情報のデータ構造を示す図。 第2辞書情報のデータ構造を示す図。 変換情報のデータ構造を示す図。 第3辞書情報のデータ構造を示す図。 発音図式を示す図。 発音図式を示す図。 音の区切りの説明図。 発音図式の作成の説明図。 発音図式の作成の説明図。 発音図式の説明図。 発音図式を示す図。 発音表示処理の手順を示すフローチャート。 発音図式を示す図。 発音表示装置のハードウェア構成を示すブロック図。
以下に添付図面を参照して、発音表示装置、発音表示方法、及びプログラムの実施の形態を詳細に説明する。
発音表示装置10は、第2言語の発音を、第1言語の第1発音記号を含む発音図式(詳細後述)で表示する装置である。
第2言語は、声調言語である。声調言語は、声調を用いる言語である。声調は、言語において意味の区別に用いる音の高低のパターンである。声調言語は、例えば、中国語、ベトナム語、タイ語、ラオ言、ハウサ語等である。第2言語は、例えば、ユーザの学習対象の声調言語である。
第1言語は、第2言語以外の言語である。また、第1言語は、ユーザの学習済みの言語である。例えば、第1言語は、ユーザの母国語の言語である。第1発音記号は、第1言語の発音記号である。第1言語が日本語である場合、第1発音記号は、カタカナである。
本実施の形態では、第2言語が中国語の北京語であり、第1言語が日本語である場合を説明する。なお、第2言語と第1言語の組合せは、この組合せに限定されない。
図1は、発音表示装置10のブロック図である。発音表示装置10は、制御部12と、記憶部14と、入力部16と、表示部18と、通信部19と、を備える。
記憶部14、入力部16、表示部18、及び通信部19は、制御部12と通信可能に接続されている。
表示部18は、各種画像を表示する装置である。表示部18は、液晶や有機EL(Electro Luminescence)等の公知の表示装置である。
入力部16は、ユーザからの入力を受け付ける装置である。入力部16は、例えば、マウス、ボタン、リモコン、キーボード、マイク等の音声認識装置、及び画像認識装置の1または複数を組み合せたものである。入力部16は、ユーザからの入力を受け付けると、受け付けた入力に応じた指示信号を制御部12へ出力する。
入力部16及び表示部18は、一体的に構成されていてもよい。具体的には、入力部16及び表示部18は、入力機能及び表示機能の双方を備えたUI(User Interface)部として構成されていてもよい。UI部には、タッチパネル付LCD(Liquid Crystal Display)等がある。
通信部19は、インターネットを介して、有線通信や無線通信により各種データや信号を外部装置と送受信する。
記憶部14は、各種データを記憶する。記憶部14は、例えば、HDD(ハードディスクドライブ)や、内部メモリ等である。なお、記憶部14を、外部装置や、クラウド上に設けられたサーバ装置に備えた構成としてもよい。
本実施の形態では、記憶部14は、第1辞書情報、第2辞書情報、第3辞書情報、及び変換情報を予め記憶する。
第1辞書情報は、第2言語の1音節ごとの音韻を示す情報である。本実施の形態では、第1辞書情報は、第2言語の単語ごとに、単語における1音節ごとの音韻を示す情報である。記憶部14は、第2言語の種類ごとに、第1辞書情報を記憶する。なお、第2言語が中国語である場合、1音節は1文字の漢字に相当する。
図2は、第1辞書情報のデータ構造の一例を示す図である。なお、図2は、第2言語としての北京語に対応する、第1辞書情報の一例を示す図である。
第1辞書情報は、第2言語の単語ごとに、単語における音節の各々と、第2言語のピンインと、を対応づけた情報である。なお、第2言語が中国語である場合、1音節は1文字の漢字に相当する。このため、図2に示す例では、単語に含まれる音節の各々を、1音節の漢字で示した。第2言語のピンインは、音韻と、声調と、を含む。
第2辞書情報は、第2言語の単語ごとに、属性情報と、第2言語の音韻と、第1言語の音韻と、継続時間と、ピッチパターンと、を対応づけた情報である。記憶部14は、第2言語の種類ごとに、第2辞書情報を記憶する。
図3は、第2辞書情報のデータ構造の一例を示す図である。なお、図3は、第2言語としての北京語に対応する、第2辞書情報の一例を示す図である。
声調言語では、同じ音韻であっても、ピッチパターンによって、異なる単語を意味する場合がある。第2辞書情報に含まれる属性情報は、音韻と、ピッチパターンと、音韻を表す文字の各々の継続時間と、によって特定される、第2言語の単語を特定可能な情報である。すなわち、属性情報は、第2言語の単語の属性を示す情報である。具体的には、属性情報は、第2言語の文章中における単語の位置や、文章の内容等である。なお、属性情報の内容は、この内容に限定されない。文章中における単語の位置は、文章の先頭、文章の末尾、などである。文章の内容や、あいさつ文、話し言葉、紹介文などである。
第2辞書情報に含まれる、第2言語の音韻は、第2言語の単語に含まれる音節の各々の音韻である。図3に示す例では、第2言語の音韻として、第2言語の単語「笑」や「小」の音韻である「xiao」を示した。
第2辞書情報に含まれる、第1言語の音韻は、第2言語の音韻を第1言語の音韻で表したものである。図3に示す例では、北京語の音韻である「xiao」に対応する、日本語の音韻「shiao」を、第1言語の音韻として示した。
なお、第2辞書情報に含まれる第2言語の単語の内、複数の音節からなる単語には、該単語に含まれる音節の各々に対応する音韻が対応づけられている。例えば、単語が「晩上」である場合、第2辞書情報には、該単語に対応する第2言語の音韻として、1音節の漢字「晩」、「上」の各々の音韻「wan」、「shang」のが登録されている。
第2辞書情報に含まれる継続時間は、第1言語の音韻を表す文字の各々に対応する音の継続時間である。例えば、第2辞書情報には、第2言語の音韻「xiao」及び第1言語の音韻「shiao」に対応づけて、「i」、「a」、「o」の各々の音の継続時間が登録されている。
第2辞書情報に含まれるピッチパターンは、対応する属性情報によって特定される第2言語の単語における、1音節ごとの音韻のピッチパターンである。
変換情報は、第2言語の1音節の音韻と、複数の第1発音記号と、を対応づけた情報である。記憶部14は、第2言語の種類と、第1言語の種類と、の組合せごとに、変換情報を記憶する。
図4は、変換情報のデータ構造の一例を示す図である。なお、図4は、第2言語の種類と第1言語の種類の組合せとして、北京語と日本語の組合せに対応する、変換情報の一例を示す図である。
図4に示すように、変換情報は、第2言語の1音節の音韻と、第1言語の複数の第1発音記号と、を対応づけた情報である。
すなわち、変換情報は、第2言語の1音節の音韻を、第1言語の2個以上の第1発音記号に変換するための情報である。図4に示す例では、第2言語の1音節の音韻「ni」に対応する第1発音記号は、1文字の「ニ」ではなく、2文字のカタカナ「ニ」「イ」である。このように、変換情報には、第2言語の1音節の音韻に対応する第1発音記号が2個以上となるように、予め第1発音記号が設定されている。
第3辞書情報は、第2言語の種類と、声調の音階値と、を対応づけた情報である。図5は、第3辞書情報のデータ構造の一例を示す図である。
第2言語の種類は、声調言語の種類を示す。図5に示す例では、第2言語の種類として、声調言語である「北京語」、「広東語」、「タイ語」を示した。声調の音階値は、音の高低の段階を示す数である。例えば、声調による音の高低が2段階である第2言語の場合、声調の音階値は「2」となる。
記憶部14は、第1辞書情報、第2辞書情報、第3辞書情報、及び変換情報を予め記憶する。また、上述したように、記憶部14は、第1辞書情報については、第2言語の種類ごとに予め記憶する。また、記憶部14は、第1言語の種類と第2言語の種類の組合せごとに、第2辞書情報及び変換情報を予め記憶する。なお、これらの第1辞書情報、第2辞書情報、第3辞書情報、及び変換情報の各々は、ユーザによる入力部16の操作指示などにより、適宜、変更、更新可能である。
図1に戻り、説明を続ける。
制御部12は、CPU(Central Processing Unit)などを含んで構成されるコンピュータであり、発音表示装置10全体を制御する。なお、制御部12は、CPUに限定されず、回路などで構成してもよい。
本実施の形態では、制御部12は、第2言語の1音節ごとの音韻を、複数の第1発音記号に変換する。そして、制御部12は、複数の第1発音記号を用いて、第2言語の1音節ごとに、発音図式を作成する。
発音図式は、第2言語の1音節の音韻と、該音韻の音の高低(トーンと称される場合もある)と、を、第1言語の発音記号である複数の第1発音記号と、複数の第1発音記号の配置と、で表した図式である。発音図式は、第2言語の1音節ごとに作成される。
図6は、発音図式70の一例を示す図である。
図6に示す発音図式70は、第2言語としての北京語の1音節の音韻「ma」を、第1言語の第1発音記号として、日本語のカタカナである「マ」「ア」で表したものである。
発音図式70は、複数の第1発音記号と、第1直線72と、を含む。
発音図式70においては、第2言語の1音節の音韻に対応する複数の第1発音記号は、第2言語の発音順に沿って第1方向(図6中、矢印X方向、以下、第1方向Xと称する)に配列されている。第1方向Xは、第1発音記号の横方向と一致する方向である。すなわち、第1発音記号がカタカナである場合、カタカナ1文字の横方向が第1方向Xと一致する。
第1直線72は、第1発音記号によって表される音の高低の境界を示す直線であり、第1方向Xに長い直線である。
第1発音記号は、第1直線72によって区切られ、かつ、第1方向Xに直交する第2方向(図6中、矢印Y方向、以下、第2方向Yと称する)に配列された複数の領域(領域Y1、領域Y2)の内の何れかに配置されている。具体的には、第1発音記号は、該複数の領域(図6では、領域Y1、領域Y2)の内、第1発音記号によって表される音の高低に応じた領域に配置されている。このため、発音図式70は、第1発音記号の第2方向Yにおける位置によって、第1発音記号の表す音の高低を示す。
図6に示す例では、第1発音記号「マ」と第1発音記号「ア」は、第2方向Yにおける第1直線72より上側の領域Y1に配置されている。このため、図6に示す発音図式70は、第1発音記号「マ」と第1発音記号「ア」の音の高さが同じ高音であることを示している。
発音図式70は、第2言語の声調の音階値から「1」を減算した数の第1直線72を含む。発音図式70が複数の第1直線72を含む場合、複数の第1直線72は、第2方向Yに所定間隔を隔てて配列されている。このため、発音図式70は、第2言語の声調の音階値に応じた数の領域を第2方向Yに配列した構成となっている。
例えば、第2言語の声調の音階値が「2」である場合、発音図式70は、1本の第1直線72を備えた構成である(図6参照)。1本の第1直線72によって、第2方向Yに、音の高低を示す2つの領域が形成される。一方、第2言語の声調の音階値が「3」である場合、発音図式70は、2本の第1直線72を、間隔を隔てて第2方向Yに配列した構成である。発音図式70が2本の第1直線72を有する場合、発音図式70には、第1発音記号によって表される音の高低を段階的に示す3つの領域が、第2方向Yに形成された状態となる。
第1直線72の、第1方向Xの長さは、第2言語の1音節の音韻に対応する複数の第1発音記号を第1方向Xに配列したときの、第1方向Xの一端から他端までの長さ以上の長さであることが好ましい。
また、発音図式70は、複数の第2直線74を備える。第2直線74は、第1方向Xに間隔を隔てて配列され、かつ、第2方向Yに沿って設けられている。図6に示す例では、発音図式70には、3本の第2直線74(第2直線74A、第2直線74B、第2直線74C)が第1方向X方向に間隔を隔てて配列されている。
第2直線74は、第2言語の発音順に沿って第1方向Xに配列された複数の第1発音記号の、第1方向Xの両端部と、第1方向Xに隣接する第1発音記号間の少なくとも1箇所と、に配置されている。このため、発音図式70は、少なくとも3本の第2直線74を備える。
発音図式70に含まれる、これらの複数の第2直線74の内、第1発音記号間に配置された第2直線74(図6では、第2直線74B)は、該発音図式70によって示される発音における、音の区切りを示す。
第1方向Xに隣接する第2直線74間には、1つの第1発音記号が配置されていてもよいし、複数の第1発音記号が配置されていてもよい。
図6に示す発音図式70では、第1方向Xに隣接する第2直線74Aと第2直線74Bとの間の領域に、第1発音記号「マ」が配置されている。また、第1方向Xに隣接する第2直線74Bと第2直線74Cとの間の領域に、第1発音記号「ア」が配置されている。
第1方向Xに隣接する第2直線74間の距離は、該第2直線74間に位置する第1発音記号によって表される音の相対的な長さに応じた距離である。
図6に示す例では、第1発音記号「マ」と、第1発音記号「ア」と、の各々が位置する第2直線74間の距離は略同じである(図6中、距離X1、距離X2参照)。このため、図6に示す発音図式70では、第1発音記号「マ」と第1発音記号「ア」の音の長さが略同じであることを示している。
なお、発音図式70は、第1発音記号と、第1直線72と、を少なくとも備えた構成であればよい。また、発音図式70は、第1発音記号と、第1直線72と、複数の第2直線74を備えた構成であることが好ましい。
また、発音図式70は、第1直線72及び第2直線74を含む直線であって、第1発音記号の各々を囲む矩形状の直線を含むことが好ましい。具体的には、図6に示すように、発音図式70は、第1直線72に平行な2本の直線76を更に備えた構成であることが好ましい。そして、これらの2本の直線76を、第1直線72に対して第2方向Yに間隔を隔てて配置する。
詳細には、これらの2本の直線76は、発音図式70における、第2方向Yの両端部に設けられる。
この場合、発音図式70は、第1直線72と、複数の第2直線74と、直線76と、によって形成された矩形状の領域内に、複数の第1発音記号を配置した構成となる。
図1に戻り、発音図式70の作成を行う制御部12について詳細に説明する。
制御部12は、受付部20と、取得部22と、解析部24と、推定部26と、変換部27と、作成部28と、表示制御部30と、を備える。受付部20、取得部22、解析部24、推定部26、変換部27、作成部28、及び表示制御部30の一部またはすべては、例えば、CPUなどの処理装置にプログラムを実行させること、すなわち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェアおよびハードウェアを併用して実現してもよい。
受付部20は、入力部16から指示信号を受け付ける。本実施の形態では、受付部20は、指示信号として、変更指示や、言語情報を入力部16から受け付ける。
変更指示は、第1発音記号の少なくとも一部を、第2言語の第2発音記号に置き換えた発音図式70の作成を指示する指示信号である。言語情報は、発音表示対象の第2言語の種類と、第1言語の種類と、を指示する指示信号である。
取得部22は、発音表示対象の第2言語の文書情報を取得する。文書情報は、第2言語で記載された文書を電子化したものである。本実施の形態では、取得部22は、通信部19を介して外部装置から文書情報を取得する。なお、取得部22は、入力部16から文書情報を取得してもよい。この場合、ユーザによる入力部16の操作指示によって、第2言語が入力される。そして、入力部16が、ユーザによって入力された第2言語の文書情報を、制御部12へ出力する。取得部22は、入力部16から文書情報を取得する。
解析部24は、取得部22で取得した文書情報の第2言語を解析する。詳細には、解析部24は、第1辞書情報(図2参照)から、文書情報に含まれる第2言語の単語ごとに、単語における1音節ごとの音韻を解析する。具体的には、解析部24は、まず、文書情報に含まれる第2言語の各単語を、該第2言語の書字方向に沿って順次読み取る。そして、解析部24は、記憶部14に記憶されている第1辞書情報(図2参照)から、単語ごとに、各単語の1音節分の漢字の各々に対応する第2言語のピンイン(音韻及び声調)を読取る。
また、解析部24は、文書情報の第2言語の単語の各々について、属性情報を作成する。解析部24は、各単語の、文書情報に含まれる文章中の位置、文書情報に含まれる文章の内容(あいさつ文、話し言葉、紹介文など)を解析することで、属性情報を作成する。
例えば、制御部12は、文章中に使われる特徴的な言葉に対応づけて、属性情報を予め記憶部14に記憶する。そして、解析部24は、文書情報に含まれる特徴的な言葉を抽出し、抽出した特徴的な言葉に対応する属性情報を記憶部14から読取る。これにより、解析部24は、属性情報を作成する。
推定部26は、第2言語の単語ごとに、単語における1音節ごとの音韻のピッチパターンと、該音韻を表す文字の各々に対応する音の継続時間と、を推定する。
詳細には、推定部26は、解析部24で解析された、属性情報及び1音節の音韻(第2言語の音韻)に対応する、継続時間と、ピッチパターンと、を第2辞書情報(図3参照)から読取る。
これにより、推定部26は、属性情報と第2言語の音韻によって特定される、第2言語の単語における、1音節ごとの音韻のピッチパターンと、該音韻を表す文字の各々に対応する音の継続時間と、を推定する。
例えば、解析部24が、第2言語の単語「笑」の解析結果として、属性情報「はなし言葉」、該単語の1音節の音韻「xiao」を解析したとする。この場合、推定部26は、第2辞書情報(図3参照)における、属性情報「はなし言葉」及び第2言語の音韻「xiao」に対応する第1言語の音韻「shiao」を読取る。そして、推定部26は、第2辞書情報(図3参照)における、該第1言語の音韻「shiao」を構成する文字である「sh」、「i」、「a」、「o」の各々の音の継続時間と、音韻「shiao」(または「xiao」)のピッチパターンと、を読取る。これにより、推定部26は、第2言語の単語ごとに、該単語における1音節ごとの音韻のピッチパターンと、該音韻を表す文字の各々に対応する音の継続時間と、を推定する。
変換部27は、第2言語の1音節ごとの音韻を、複数の第1発音記号に変換する。
例えば、変換部27は、解析部24から、解析結果として、第2言語の単語ごとに、単語における1音節ごとの音韻(第2言語の音韻)を受け付ける。そして、変換部27は、第2言語の単語ごとに、該単語における1音節ごとの音韻(第2言語の音韻)に対応する複数の第1発音記号を、変換情報(図4参照)から読取る。
例えば、解析部24で解析した1音節の音韻が「ni」である場合、変換部27は、変換情報(図4参照)を用いて、該音韻「ni」を、該音韻「ni」に対応する2つの第1発音記号「ニ」「イ」に変換する。また、例えば、解析部24で解析した1音節の音韻が「huan」である場合、変換部27は、変換情報(図4参照)を用いて、該音韻「huan」を、該音韻「huan」に対応する4つの第1発音記号「ホ」「ウ」「ア」「ン」に変換する。
図1に戻り、作成部28は、取得部22で取得した第2言語の文書情報と、解析部24の解析結果と、推定部26の推定結果と、を用いて、第2言語の1音節ごとに発音図式70を作成する。
まず、作成部28は、受付部20で受け付けた第2言語の種類に対応する声調の音階値を、第3辞書情報(図5参照)から読取る。本実施の形態では、受付部20は、第2言語の種類として、北京語を受け付ける場合を説明する。このため、作成部28は、北京語に対応する声調の音階値として「2」を第3辞書情報から読取る。
次に、作成部28は、読取った声調の音階値から「1」を減算した数を、発音図式70に用いる第1直線72の数として求める。声調の音階値が「2」である場合、作成部28は、発音図式70に用いる第1直線72の数として「1」を算出する。
そして、作成部28は、文書情報の第2言語の各単語の1音節ごとの音韻について、以下の処理を行うことにより、各音韻に対応する発音図式70を、第2言語の1音節ごとに作成する。
まず、作成部28は、第2言語の単語に含まれる1音節の音韻の各々に対応する複数の第1発音記号を変換部27から取得する。
次に、作成部28は、第2言語の1音節の音韻に対応する複数の第1発音記号を、第2言語の発音順に沿って第1方向Xに配列する。作成部28は、第2言語の音韻を構成する文字の配列に応じて第1発音記号を配列することで、第2言語の発音順に沿って第1発音記号を配列する。
そして、作成部28は、複数の第1発音記号の第1方向Xの両端部と、第1方向Xに隣接する第1発音記号間の少なくとも1箇所と、に第2直線74を配置する。
具体的には、作成部28は、第1方向Xに配列した複数の第1発音記号の第1方向Xの両端部に、第2直線74を配置する。次に、作成部28は、該複数の第1発音記号における、第1方向Xに隣接する第1発音記号間の少なくとも1箇所を、音の区切りとして決定する。そして、音の区切りとして決定した位置に、第2直線74を配置する。
例えば、作成部28は、第1方向Xに配列された隣接する第1発音記号間の全ての領域を、音の区切りとして決定し、該領域の各々に第2直線74を配置する。
図6に示すように、第2言語の1音節の音韻が「ma」であり、この音韻が2つの第1発音記号「マ」「ア」に変換されたとする。この場合、作成部28は、第1発音記号「マ」と第1発音記号「ア」を、この発音順に第1方向X方向に配置する。そして、作成部28は、第1方向Xに配列した複数の第1発音記号「マ」「ア」の第1方向Xの両端部に、第2直線74(第2直線74A、第2直線74C)を配置する。次に、作成部28は、第1発音記号「マ」と第1発音記号「ア」との間を、音の区切りとして決定し、第1発音記号「マ」と第1発音記号「ア」との間に第2直線74Bを配置する。
このとき、作成部28は、第1方向Xに隣接する第2直線74間の距離が、第2直線74間に位置する第1発音記号によって表される音の相対的な長さに応じた距離となるように、第1方向Xに隣接する第2直線74の距離を調整して配置する。
詳細には、作成部28は、推定部26による推定結果から、調整対象の音韻のピッチパターンと、該音韻を表す文字の各々に対応する音の継続時間と、を読取る。そして、作成部28は、第1方向Xに隣接する第2直線74間の距離が、該第2直線74間に位置する第1発音記号に対応する音韻を表す文字の各々に対応する音の継続時間の合計に応じた距離となるように、第2直線74間の距離を調整する。
例えば、推定部26によって推定された、図6に示す第1発音記号「マ」「ア」に対応する音韻「ma」を例に挙げる。そして、この音韻「ma」を表す文字「m」「a」の各々に対応する音の継続時間が同じであったとする。この場合、作成部28は、隣接する第2直線74間の距離が同じとなるように、複数の第2直線74を配置する。
図6に示す発音図式70の場合、作成部28は、第2直線74Aと第2直線74Bとの間の距離X1と、第2直線74Bと第2直線74Cとの間の距離X2と、が同じとなるように、配置位置を決定した複数の第2直線74(第2直線74A、第2直線74B、第2直線74C)間の距離を調整する。
なお、作成部28は、第1発音記号の表示時の第1方向Xの大きさより大きい距離で、且つ、上記条件を満たすように、第1方向Xに隣接する第2直線74間の距離を調整する。
次に、作成部28は、第1直線72を配置する。
具体的には、作成部28は、声調数に応じて算出した数の第1直線72を、上記配置した第2直線74に交差するように、第2方向Y方向に所定間隔ごとに配列する。この所定間隔は、第1発音記号の表示時の第2方向Yの大きさより大きければよい。図6に示す例では、第1直線72は、1本である。
次に、作成部28は、第1方向Xに隣接する第2直線74間に配置された第1発音記号の各々の、第2方向Yにおける位置を調整する。
具体的には、作成部28は、第2言語の1音節の音韻に対応する複数の第1発音記号を、第1直線72によって区切られた第2方向Yに配列された複数の領域の内、第1発音記号によって表される音の高低に応じた領域に配置する。
具体的には、作成部28は、推定部26の推定結果を用いて、複数の第1発音記号を、該第2方向Yに配列された複数の領域の内、処理対象の音韻に対応するピッチパターンによって表される音の高低に応じた位置に配置する。
例えば、声調の音階値が「2」である場合、作成部28は、ピッチパターンによって示される高音領域に対応する音の第1発音記号を、第1直線72より第2方向Yの上側に配置し、低音領域に対応する音の第1発音記号を、第1直線72より第2方向Yの下側に配置する。
ピッチパターンから、第1発音記号の第2方向Yにおける位置を定める方法は、声調数に応じて予め定めればよい。
これにより、作成部28は、発音図式70を作成する。なお、作成部28は、第1直線72に平行な直線76を第2方向Yの両端部に配置することで、矩形状の直線を含む発音図式70としてもよい。
図7は、発音図式70の一例を示す図である。
例えば、第2言語が北京語であり、第1言語が日本語であるとする。また、発音表示装置10の処理対象の単語の1音節の音韻が「ma」であったとする。また、変換部27が、音韻「ma」を、複数の第1発音記号「マ」「ア」に変換したとする。また、推定部26によって推定された、音韻「ma」を表す文字「m」「a」の各々に対応する音の継続時間が同じであったとする。なお、図7中、第1発音記号「マ」「ア」で表される音の継続時間は、図7(A)中、距離X1、距離X2で表されている。そして、第1発音記号「マ」「ア」によって表される音の高低は、第2方向Yにおける位置で表されている。
そして、この音韻「ma」の声調が第1声である場合、作成部28は、上記処理を行うことにより、発音図式70Aを作成する。発音図式70Aは、第1発音記号「マ」と「ア」を、同じ継続時間で、且つ同じ高音で発音することを表している。
また、この音韻「ma」の声調が第2声である場合、作成部28は、上記処理を行うことにより、発音図式70Bを作成する。発音図式70Bは、第1発音記号「マ」と「ア」を、同じ継続時間で発音し、「マ」から「ア」に向かって低音から高音となるように発音することを表している。
また、この音韻「ma」の声調が第3声である場合、作成部28は、上記処理を行うことにより、発音図式70Cを作成する。発音図式70Cは、第1発音記号「マ」と「ア」を、同じ継続時間で発音し、「マ」と「ア」を、同じ継続時間で、且つ同じ低音で発音することを表している。
また、この音韻「ma」の声調が第4声である場合、作成部28は、上記処理を行うことにより、発音図式70Dを作成する。発音図式70Dは、第1発音記号「マ」と「ア」を、同じ継続時間で発音し、「マ」から「ア」に向かって高音から低音となるように発音することを表している。
なお、作成部28は、複数の第1発音記号の第1方向Xの両端部と、第1方向Xに隣接する第1発音記号間の少なくとも1箇所と、に第2直線74を配置すればよい。すなわち、作成部28は、第1方向Xに隣接する第1発音記号間の全ての領域ではなく、音の区切りとして決定した一部の領域に、第2直線74を配置してもよい。
例えば、作成部28は、第2言語の1音節の音韻に対応する複数の第1発音記号を、第2言語の発音順に沿って第1方向Xに配列し、第1方向Xに隣接する第1発音記号間の領域の内、音韻の子音と母音との境界に対応する領域を、音の区切りとして決定してもよい。
なお、作成部28は、第2言語の1音節の音韻に対応する複数の第1発音記号を、第2言語の発音順に沿って第1方向Xに配列し、第1方向Xに隣接する第1発音記号間の領域の内、音韻の子音または母音と主母音との境界に対応する領域を、音の区切りとして決定してもよい。
そして、作成部28は、この音の区切りとして決定した位置と、複数の第1発音記号の第1方向Xの両端部と、に第2直線74を配置してもよい。
図8は、音の区切りの説明図である。
第2言語の1音節の漢字が、図8(A)に示す漢字であったとする。この1音節の漢字に対応する音韻は、「huan」である(図8(B)参照)。
変換部27は、図4に示す変換情報を用いて、1音節の音韻「huan」を、この音韻に対応する複数の第1発音記号「ホ」「ウ」「ア」「ン」に変換する。
そして、作成部28は、これらの第1発音記号を発音順に沿って第1方向Xに配列する。すなわち、作成部28は、「ホ」「ウ」「ア」「ン」のこの順に第1発音記号を第1方向Xに配列する。
そして、作成部28は、対応する1音節の音韻「huan」の子音「h」と母音「u」との境界(図8(B)中、境界40A参照)に対応する領域を、音の区切りとして定める。すなわち、作成部28は、第1発音記号「ホ」と第1発音記号「ウ」との間の領域を、音の区切りとして定める。そして、作成部28は、第1発音記号「ホ」と第1発音記号「ウ」との間の領域に、第2直線74を配置する(図8(C)の第2直線74B参照)。
一方、子音または母音と、主母音と、の境界に対応する領域を、音の区切りとして定める場合、作成部28は、1音節の音韻「huan」の母音「u」と主母音「a」との境界(図8(B)中、境界40B参照)に対応する領域を、音の区切りとして定める。すなわち、作成部28は、第1発音記号「ウ」と第1発音記号「ア」との間の領域を、音の区切り位置として定める。そして、作成部28は、第1発音記号「ウ」と第1発音記号「ア」との間の領域に、第2直線74を配置する(図8(D)の第2直線74B参照)。
なお、作成部28は、第2言語の1音節の音韻に対応する複数の第1発音記号を、第2言語の発音順に沿って第1方向Xに配列し、第1方向Xに隣接する第1発音記号間の領域の内、少なくとも該音韻に対応するピッチパターンに応じた音の高低の境界に対応する領域を、音の区切りとして決定してもよい。そして、作成部28は、この音の区切りとして決定した位置と、複数の第1発音記号の第1方向Xの両端部と、に第2直線74を配置してもよい。
図9は、第2言語の単語である「笑」の発音図式70の作成を示す説明図である。
例えば、推定部26が、第2言語の単語「笑」について、1音節の音韻「xiao」に対応する第1言語の音韻「shiao」のピッチパターンとして、図9(A)に示す線図42によって示されるピッチパターンを推定したとする。また、変換部27が、音韻「xiao」を、複数の第1発音記号「シ」「ア」「オ」に変換したとする。
この場合、作成部28は、音韻「shiao」を表す文字間の領域P2〜P4の内、線図42によって示されるピッチパターンが高音から低音に下降し始めた位置44に対応する領域P4を特定する。そして、作成部28は、第1方向Xに隣接する第1発音記号間の複数の領域(「シ」と「ア」の間の領域、「ア」と「オ」の間の領域)の内、該領域P4に対応する領域を、音の区切りとして決定する。そして、作成部28は、この音の区切りとして決定した、「ア」と「オ」の間の位置に、第2直線74Bを配置する(図9(B)参照)。また、作成部28は、複数の第1発音記号「シ」「ア」「オ」の第1方向Xの両端部に第2直線74(第2直線74A、第2直線74C)を配置する。
そして、上述したように、作成部28は、第1方向Xに隣接する第2直線74間の距離が、第2直線74間に位置する第1発音記号によって表される音の相対的な長さに応じた距離となるように、第2直線74の位置を調整する。
図9に示す例では、作成部28は、第1方向Xに隣接する第2直線74Aと第2直線74Bとの距離T1Bが、これらの直線間に位置する第1発音記号「シ」「ア」に対応する音韻を表す文字「shia」の各々に対応する音の継続時間の合計(図9(A)中、T1A参照)に応じた距離となるように、距離T1Bを調整する。
同様に、作成部28は、第1方向Xに隣接する第2直線74Bと第2直線74Cとの距離T2Bが、これらの直線間に位置する第1発音記号「オ」に対応する音韻を表す文字「o」に対応する音の継続時間の合計(図9(A)中、T2A参照)に応じた距離となるように、距離T2Bを調整する。
さらに、作成部28は、第2言語の種類に対応する声調数に応じて算出した数の第1直線72を、第2直線74に直交するように第2方向Y方向に所定間隔ごとに配列する。図9に示す例では、声調数が「2」であり、1本の第1直線72を配置する場合を示した。
そして、作成部28は、第1方向Xに隣接する第2直線74間に配置した第1発音記号「シ」「ア」と、「オ」と、の各々について、第2方向Yにおける位置を調整する。
図9に示す例では、作成部28は、推定部26によって推定された、処理対象の1音節の音韻のピッチパターン(図9(A)の線図42参照)に応じて、ピッチパターンによって示される高音領域(音韻「shia」の領域)に対応する第1発音記号「シ」「ア」を、第1直線72より第2方向Yの上側に配置する。また、作成部28は、低音領域(音韻「o」の領域)に対応する第1発音記号「オ」を、第1直線72より第2方向Yの下側に配置する。
これにより、作成部28は、第2言語「笑」に対応する発音図式70Eを作成する。
なお、作成部28は、変換部27によって変換された、1音節の第1発音記号のモーラ数を、第1発音記号に対応する音韻を示す文字の継続時間に応じて調整してもよい。例えば、作成部28は、第1方向Xに隣接する第2直線74間の同じ領域に複数の第1発音記号を配置する場合、モーラ数が少なくなるように第1発音記号の少なくとも一部の表記を大文字から小文字に補正してもよい。
また、作成部28は、第1方向Xに隣接する第2直線74間の同じ領域に複数の第1発音記号を配置する場合であって、且つ、該領域の音の継続時間が、同じ発音図式70における、1つの第1発音記号の配置された他の領域のN倍未満である場合、モーラ数が少なくなるように補正してもよい。Nは、1より大きい数字である。Nの値は、適宜定めればよい。例えば、Nの値は、「2」である。
例えば、1音節の音韻が3つの第1発音記号「シ」「ア」「オ」に変換されたとする。そして、第1発音記号「ア」と「オ」の間の領域が音の区切りとして決定され、この領域に第2直線74Bが配置されたとする。そして、第1発音記号「シ」「ア」の位置する第2直線74Aと第2直線74Bとの間の領域の距離が、第1発音記号「オ」の位置する第2直線74Bと第2直線74Cとの間の領域の距離の2倍未満であったとする。
この場合、作成部28は、変換部27によって変換された第1発音記号の内、前半の音である第1発音記号「シ」「ア」の少なくとも一部を半角で表記して「シャ」に変換する。これにより、作成部28は、この1音節の音韻に対応する第1発音記号を「シャ」「オ」の2モーラに相当する第1発音記号に補正する。
図10は、第2言語である「小」の発音図式70の作成の説明図である。
例えば、推定部26が、第2言語の1音節の音韻「xiao」に対応する第1言語の音韻「shiao」のピッチパターンとして、図10(A)に示す線図48によって示されるピッチパターンを推定したとする。また、変換部27が、音韻「xiao」を、複数の第1発音記号「シ」「ア」「オ」に変換したとする。
この場合、作成部28は、音韻「shiao」を表す文字間の領域P2〜P4の内、線図48によって示されるピッチパターンが略一定となった位置に対応する領域P4を特定する。そして、作成部28は、第1方向Xに隣接する第1発音記号間の複数の領域(「シ」と「ア」の間の領域、「ア」と「オ」の間の領域)の内、該領域P4に対応する領域を、音の区切りとして決定する。そして、作成部28は、この音の区切りとして決定した、「ア」と「オ」の間の位置に、第2直線74Bを配置する(図10(B)参照)。また、作成部28は、複数の第1発音記号「シ」「ア」「オ」の第1方向Xの両端部に第2直線74(第2直線74A、第2直線74C)を配置する。
このとき、作成部28は、音の区切りである第2直線74Bより前半の音である第1発音記号「シ」「ア」の音の継続時間T1Dが、後半の音である第1発音記号「オ」の音の継続時間T2Dの2倍未満である場合、第1発音記号「シ」「ア」の一部を半角に補正する。図10(B)に示す例では、第1発音記号「シ」「ャ」に補正する。
そして、上述したように、作成部28は、第1方向Xに隣接する第2直線74間の距離が、第2直線74間に位置する第1発音記号によって表される音の相対的な長さに応じた距離となるように、第2直線74の位置を調整する。
図10に示す例では、作成部28は、第1方向Xに隣接する第2直線74Aと第2直線74Bとの距離T1Dが、これらの直線間に位置する第1発音記号「シ」「ャ」に対応する音韻を表す文字「shia」の各々に対応する音の継続時間の合計(図10(A)中、T1C参照)に応じた距離となるように、距離T1Dを調整する。
同様に、作成部28は、第1方向Xに隣接する第2直線74Bと第2直線74Cとの距離T2Dが、これらの直線間に位置する第1発音記号「オ」に対応する音韻を表す文字「o」に対応する音の継続時間の合計(図10(A)中、T2C参照)に応じた距離となるように、距離T2Dを調整する。
そして、作成部28は、第1方向Xに隣接する第2直線74間に配置した第1発音記号「シ」「ャ」と、「オ」と、の各々について、ピッチパターン(図10(A)、線図48参照)を用いて、第2方向Yにおける位置を調整する。これにより、作成部28は、第2言語「小」に対応する発音図式70Fを作成する。
以上のようにして、作成部28は、文書情報に含まれる第2言語の単語ごとに、各音節に対応する発音図式70を作成する。
次に、作成部28は、作成した発音図式70に、文書情報の文構造を反映させる。
図11は、文構造を反映させた発音図式70の説明図である。
図11(A)は、発音図式70(発音図式70G〜70L)の一例である。図11(B)は、各発音図式70に対応する第2言語の1音節分の漢字である。
作成部28は、取得部22で取得した文書情報における第2言語の各単語の位置に応じて、各単語に含まれる音韻に対応する発音図式70を配置した表示画像90を作成する。これにより、作成部28は、発音図式70に文書情報の文構造を反映させる。なお、表示画像90は、発音図式70を少なくとも1つ含む画像であればよい。
作成部28は、1音節の音韻に対応する発音図式70を、該音韻の属する単語ごとに連結する連結線54を作成してもよい。図11には、作成部28が、同じ単語に属する発音図式70を結ぶ連結線54を作成した場合を示した。連結線54は、同じ単語に属する発音図式70を連結する線や記号であればよく、その表示形態は、図11に示す例に限定されない。
また、受付部20が指示信号として変更指示を入力部16から受け付けると、作成部28は、第1発音記号の少なくとも一部を、第2言語の第2発音記号に置き換えた発音図式70を作成する。
変更指示は、第1形態への変更指示と、第2形態への変更指示と、第3形態への変更指示と、の何れかである。第1形態への変更指示は、発音図式70に含まれる発音記号の全てを第1発音記号で表すことを指示する指示信号である。第2形態への変更指示は、発音図式70に含まれる発音記号を、第1発音記号と第2発音記号とを混在させて表すことを指示する指示信号である。第3形態への変更指示は、発音図式70に含まれる発音記号の全てを、第2発音記号で表すことを指示する指示信号である。
図12は、第2言語「好」の音韻「hao」から作成された、発音図式70を示す図である。
作成部28は、初期状態、または、第1形態への変更指示を受け付けた場合、図12(A)に示すように、発音図式70として、第1発音記号「ハ」「オ」を配置した発音図式70Mを作成する。
作成部28は、第2形態への変更指示を受け付けた場合、図12(A)に示す発音図式70Mにおける第2発音記号「オ」を第2発音記号「ao」に置き換えた発音図式70Nを作成する(図12(B)参照)。
また、作成部28は、第3形態への変更指示を受け付けた場合、図12(A)に示す発音図式70Mにおける第2発音記号「ハ」及び「オ」を、第2発音記号「ha」及び「o」の各々に置き換えた発音図式70Pを作成する(図12(C)参照)。
図1に戻り、表示制御部30は、作成部28が作成した発音図式70を含む表示画像90を、表示部18に表示する制御を行う。
次に、制御部12が実行する発音表示処理の手順を説明する。
図13は、制御部12が実行する発音表示処理の手順を示すフローチャートである。
まず、取得部22が、発音表示対象の第2言語の文書情報を取得する(ステップS100)。
次に、受付部20が、入力部16から指示信号として言語情報を受け付ける(ステップS102)。
次に、解析部24は、取得部22で取得した文書情報の第2言語を解析する(ステップS104)。解析部24は、ステップS102で取得した言語情報によって特定される種類の第2言語に対応する第1辞書情報を用いて、文書情報の第2言語を解析する。
次に、推定部26が、ステップS104で解析された第2言語の単語ごとに、単語における1音節ごとの音韻のピッチパターンと、該音韻を表す文字の各々に対応する音の継続時間と、を推定する(ステップS106)。推定部26は、ステップS102で取得した言語情報によって特定される、第1の言語の種類と、第2の言語の種類と、に対応する第2辞書情報を用いて、推定を行う。
次に、制御部12は、ステップS104で解析された第2言語の単語ごとに、単語に含まれる1音節の音韻ごとに、以下の処理を繰り返し実行する。
まず、変換部27が、ステップS104で解析された第2言語の1音節ごとの音韻を、複数の第1発音記号に変換する(ステップS108)。
次に、作成部28が、ステップS102で受け付けた言語情報によって特定される第2言語の種類に対応する声調の音階値を、第3辞書情報(図5参照)から読取る。そして、読取った声調の音階値から「1」を減算した数を、第1直線72の数として決定する(ステップS110)。
次に、作成部28は、第2言語の1音節の音韻に対応する複数の第1発音記号を、第2言語の発音順に沿って第1方向Xに配列する。そして、作成部28は、複数の第1発音記号の第1方向Xの両端部と、第1方向Xに隣接する第1発音記号間の少なくとも1箇所と、に第2直線74を配置する(ステップS112)。
このとき、作成部28は、第1方向Xに隣接する第2直線74間の距離が、第2直線74間に位置する第1発音記号によって表される音の相対的な長さに応じた距離となるように、第1方向Xに隣接する第2直線74の距離を調整して配置する。
次に、作成部28は、上記ステップS110で算出した数の第1直線72を、第2直線74に交差するように、第2方向Y方向に所定間隔ごとに配列する。そして、作成部28は、第1方向Xに隣接する第2直線74間に配置された第1発音記号の各々の、第2方向Yにおける位置を調整する(ステップS114)。
そして、制御部12は、ステップS104で解析された第2言語の単語ごとに、単語に含まれる1音節の音韻ごとに、上記ステップS108〜ステップS114の処理を終了すると、ステップS116へ進む。
次に、作成部28は、作成した発音図式70に、文書情報の文構造を反映させる(ステップS116)。そして、表示制御部30は、文構造を反映させた発音図式70を含む表示画像90を、表示部18に表示する制御を行う(ステップS118)。
次に、受付部20は、変更指示を示す指示信号を受け付けたか否かを判断する(ステップS120)。制御部12は、ステップS120で否定判断すると(ステップS120:No)、ステップS126へ進む。
一方、制御部12は、ステップS120で肯定判断すると(ステップS120:Yes)、ステップS122へ進む。ステップS122では、作成部28が、ステップS120で受け付けた変更指示に応じて表示形態を変更した発音図式70を作成する(ステップS122)。そして、表示制御部30は、ステップS122で作成された発音図式70を含む表示画像90を、表示部18へ表示する制御を行う(ステップS124)。そして、ステップS126へ進む。
ステップS126では、制御部12が、終了指示を受け付けたか否かを判断する(ステップS126)。制御部12は、入力部16から受付部20を介して、処理の終了を示す指示信号を受け付けたか否かを判別することで、ステップS126の判断を行う。
制御部12は、ステップS126で否定判断すると(ステップS126:No)、上記ステップS120へ戻る。一方、制御部12は、ステップS126で肯定判断すると(ステップS126:Yes)、本ルーチンを終了する。
例えば、ステップS120で受け付けた変更指示が、第1形態への変更指示である場合、作成部28は、発音記号の全てを第1発音記号で表した発音図式70を作成する。そして、表示制御部30は、作成された発音図式70を含む表示画像90を、表示部18へ表示する制御を行う。
図14は、表示された発音図式70の一例を示す図である。図14(A)は、発音図式70Qを含む表示画像の一例である。発音図式70Qは、発音記号の全てを第1発音記号で表した発音図式70である。例えば、第1形態への変更指示がなされた場合、または初期状態の場合、表示制御部30は、図14(A)に示す表示画像を表示部18へ表示する制御を行う。図14(A)に示す表示画像は、発音図式70Qと、ボタン画像80(80A、80B、80C)と、対応する第2言語の音韻を示す漢字82と、を含む。ボタン画像80(80A、80B、80C)は、表示形態の変更を指示するための画像である。
ユーザは、例えば、表示部18に表示された表示画像における、ボタン画像80(80A、80B、80C)の表示された領域を入力部16によって指示することで、第1形態、第2形態、または第3形態への変更指示を行う。図14に示す例では、ボタン画像80Aは、発音記号の全てを第1発音記号で表すことを指示するためのボタン画像である。ボタン画像80Bは、発音記号を、第1発音記号と第2発音記号とを混在させて表すことを指示するためのボタン画像である。ボタン画像80Cは、発音記号の全てを、第2発音記号で表すことを指示するためのボタン画像である。
図14(B)は、発音図式70Rを含む表示画像の一例である。発音図式70Rは、発音記号を第1発音記号と第2発音記号とを混在させて表した発音図式70である。例えば、第2形態への変更指示がなされた場合、表示制御部30は、図14(B)に示す表示画像を表示部18へ表示する制御を行う。図14(B)に示す表示画像は、発音図式70Rと、ボタン画像80(80A、80B、80C)と、対応する第2言語の音韻を示す漢字82と、を含む。
図14(C)は、発音図式70Sを含む表示画像の一例である。発音図式70Sは、発音記号の全てを第2発音記号で表した発音図式70である。例えば、第3形態への変更指示がなされた場合、表示制御部30は、図14(C)に示す表示画像を表示部18へ表示する制御を行う。図14(C)に示す表示画像は、発音図式70Sと、ボタン画像80(80A、80B、80C)と、対応する第2言語の音韻を示す漢字82と、を含む。
図14(D)〜図14(F)は、発音表示対象の第2言語の1音節分の漢字が、図14(A)〜図14(C)とは異なる発音図式70の一例を示す図である。
図14(D)は、発音図式70Tを含む表示画像の一例である。発音図式70Tは、発音記号の全てを第1発音記号で表した発音図式70である。図14(D)に示す表示画像は、発音図式70Tと、ボタン画像80(80A、80B、80C)と、対応する第2言語の音韻を示す漢字84と、を含む。図14(D)に示すように、第2言語の音韻を示す漢字が、図14(A)に示す漢字82とは異なる場合であっても、作成された発音図式70が同様となる場合がある。
図14(E)は、発音図式70Uを含む表示画像の一例である。発音図式70Uは、発音記号を第1発音記号と第2発音記号とを混在させて表した発音図式70である。例えば、第2形態への変更指示がなされた場合、表示制御部30は、図14(E)に示す表示画像を表示部18へ表示する制御を行う。図14(E)に示す表示画像は、発音図式70Uと、対応する第2言語の音韻を示す漢字84と、ボタン画像80(80A、80B、80C)と、対応する第2言語の音韻を示す漢字824、を含む。
図14(F)は、発音図式70Vを含む表示画像の一例である。発音図式70Vは、発音記号の全てを第2発音記号で表した発音図式70である。例えば、第3形態への変更指示がなされた場合、表示制御部30は、図14(F)に示す表示画像を表示部18へ表示する制御を行う。図14(F)に示す表示画像は、発音図式70Vと、ボタン画像80(80A、80B、80C)と、対応する第2言語の音韻を示す漢字84と、を含む。
以上説明したように、本実施の形態の発音表示装置10は、変換部27と、作成部28と、を備える。変換部27は、声調言語である第2言語の1音節ごとの音韻を、第1言語の発音を示す複数の第1発音記号に変換する。作成部28は、発音図式70を、第2言語の1音節ごとに作成する。発音図式70は、第1直線72と、複数の第1発音記号と、を含む。第1直線72は、第1発音記号によって表される音の高低の境界を示す、第1方向Xに長い直線である。第1発音記号は、第1直線72によって区切られ、かつ、第1方向Xに直交する、第2方向Yに配列された複数の領域の内、音の高低に応じた領域に配置されている。
このように、発音表示装置10は、第2言語の1音節ごとに、複数の第1発音記号を含む発音図式70を作成する。発音図式70は、第2言語の1音節の音韻と、該音韻の音の高低(トーン)と、を、第1言語の発音記号である複数の第1発音記号と、複数の第1発音記号の配置と、で表した発音図式である。
従って、本実施の形態の発音表示装置10は、声調言語である第2言語の発音を、解り易く提供することができる。
すなわち、本実施の形態の発音表示装置10で生成された発音図式70を表示部18に表示することで、語学学習の初心者であっても、容易に第2言語の発音を確認することができる。
また、発音表示装置10の解析部24は、第2言語の単語ごとに、該単語における1音節ごとの音韻を解析する。そして、変換部27は、第2言語の単語ごとに、該単語における1音節ごとの音韻を複数の第1発音記号に変換する。
このように、発音表示装置10は、第2言語の単語ごとに、単語における1音節ごとの音韻を複数の第1発音記号に変換する。このため、処理対象の音韻が、第2言語の実際の単語とは異なる単語に対応する第1発音記号に変換されることを抑制することができる。このため、発音表示装置10は、精度よく、第2言語の音韻を第1発音記号に変換することができる。
また、発音表示装置10が作成する発音図式70では、第1方向に隣接する第2直線74間の距離が、該第2直線74間に位置する第1発音記号の音の相対的な長さに応じた距離となるように構成されている。
このため、本実施の形態の発音表示装置10では、発音図式70における、第1方向Xに隣接する第2直線74間の距離によって、該第2直線74間に位置する第1発音記号の音の長さを示すことができる。このため、本実施の形態の発音表示装置10は、声調言語である第2言語の発音を、更に解り易く提供することができる。
また、発音表示装置10の作成部28は、複数の第1発音記号を第2言語の発音順に沿って第1方向Xに配列し、第1方向Xに隣接する第1発音記号間の領域の内、少なくとも音韻の子音と母音との境界に対応する領域に、音の区切りを示す第2直線72を配置する。
このため、本実施の形態の発音表示装置10は、声調言語である第2言語の発音を、更に解り易く提供することができる。
また、発音表示装置10の作成部28は、複数の第1発音記号を第2言語の発音順に沿って第1方向Xに配列し、第1方向Xに隣接する第1発音記号間の領域の内、少なくとも音韻の子音または母音と、主母音と、の境界に対応する領域に、音の区切りを示す第2直線72を配置する。
このため、本実施の形態の発音表示装置10は、声調言語である第2言語の発音を、更に解り易く提供することができる。
また、本実施の形態では、推定部26が、第2言語の単語ごとに、該単語における1音節ごとの音韻のピッチパターンを推定する。そして、作成部28が、複数の第1発音記号を第2言語の発音順に沿って第1方向Xに配列し、第1方向Xに隣接する第1発音記号間の領域の内、音韻に対応するピッチパターンに応じた音の高低の境界に対応する領域に、音の区切りを示す第2直線74を配置する。
このため、本実施の形態の発音表示装置10は、声調言語である第2言語の発音を、更に解り易く提供することができる。
また、本実施の形態では、作成部28は、第2言語の1音節の音韻に対応する複数の第1発音記号を、該音韻に対応するピッチパターンによって表される音の高低に応じた位置に配置する。
このため、本実施の形態の発音表示装置10は、声調言語である第2言語の発音を、更に解り易く提供することができる。
また、本実施の形態では、受付部20が指示信号として変更指示を入力部16から受け付けると、作成部28は、第1発音記号の少なくとも一部を、第2言語の第2発音記号に置き換えた発音図式70を作成する。
このため、ユーザによる入力部16の操作に応じて、発音図式70に含まれる発音記号を、第1発音記号のみで表示する形態、第1発音記号と第2発音記号を混在させて表示する形態、または第2発音記号のみで表示する形態、の何れかの形態に変更することができる。
このため、ユーザの学習の進行度合いなどに応じて、適宜、発音図式70の表示形態を変更することができる。
次に、本実施の形態の発音表示装置10のハードウェア構成について説明する。図15は、本実施の形態の発音表示装置10のハードウェア構成例を示すブロック図である。
本実施の形態の発音表示装置10は、通信I/F部820、表示部840、入力部940、CPU860、ROM(Read Only Memory)880、RAM(Random Access Memory)900、及びHDD920等がバス960により相互に接続されており、通常のコンピュータを利用したハードウェア構成となっている。
CPU860は、発音表示装置10の全体の処理を制御する演算装置である。RAM900は、CPU860による各種処理に必要なデータを記憶する。ROM880は、CPU860による各種処理を実現するプログラム等を記憶する。HDD920は、上述した記憶部14に格納されるデータを記憶する。通信I/F部820は、外部装置や外部端末に通信回線等を介して接続し、接続した外部装置や外部端末との間でデータを送受信するためのインタフェースである。通信I/F部820は、上述した通信部19に相当する。表示部840は、上述した表示部18に相当する。入力部940は、上述した入力部16に相当する。
本実施の形態の発音表示装置10で実行される上記各種処理を実行するためのプログラムは、ROM880等に予め組み込んで提供される。
なお、本実施の形態の発音表示装置10で実行されるプログラムは、これらの装置にインストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供するように構成してもよい。
また、本実施の形態の発音表示装置10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施の形態の発音表示装置10で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。
本実施の形態の発音表示装置10で実行されるプログラムは、上述した各部が主記憶装置上に生成されるようになっている。
なお、上記HDD920に格納されている各種情報、すなわち記憶部14に格納されている各種情報は、外部装置(例えばサーバ)に格納してもよい。この場合には、該外部装置とCPU860と、を、ネットワーク等を介して接続した構成とすればよい。
なお、上記には、いくつかの実施の形態を説明したが、これらの実施の形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施の形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10 発音表示装置
20 受付部
22 取得部
24 解析部
26 推定部
27 変換部
28 作成部
30 表示制御部

Claims (14)

  1. 声調言語である第2言語の1音節ごとの音韻を、第1言語の発音を示す複数の第1発音記号に変換する変換部と、
    前記第1発音記号によって表される音の高低の境界を示す、第1方向に長い第1直線と、前記第1直線によって区切られ、かつ、前記第1方向に直交する、第2方向に配列された複数の領域の内、音の高低に応じた領域に配置された複数の前記第1発音記号と、を有する発音図式を、前記第2言語の1音節ごとに作成する作成部と、
    を備えた発音表示装置。
  2. 前記発音図式を表示部に表示する制御を行う表示制御部を備えた、請求項1に記載の発音表示装置。
  3. 前記第2言語の単語ごとに、該単語における1音節ごとの音韻を解析する解析部を備え、
    前記変換部は、
    前記第2言語の単語ごとに、該単語における1音節ごとの音韻を複数の前記第1発音記号に変換する、
    請求項1に記載の発音表示装置。
  4. 前記発音図式は、前記第1方向に間隔を隔てて配列され、かつ、前記第2方向に沿って設けられた、複数の第2直線を含み、
    前記作成部は、
    前記第1方向に隣接する前記第2直線間の距離が、
    前記第2直線間に位置する前記第1発音記号の音の相対的な長さに応じた距離となるように、前記第2直線を配置する、
    請求項1に記載の発音表示装置。
  5. 前記作成部は、
    前記第2言語の1音節の音韻に対応する複数の前記第1発音記号を、前記第2言語の発音順に沿って前記第1方向に配列し、複数の前記第1発音記号の前記第1方向の両端部と、前記第1方向に隣接する前記第1発音記号間の少なくとも1箇所と、に前記第2直線を配置する、請求項4に記載の発音表示装置。
  6. 前記作成部は、
    前記第2言語の1音節の音韻に対応する複数の前記第1発音記号を、前記第2言語の発音順に沿って前記第1方向に配列し、複数の前記第1発音記号の前記第1方向の両端部と、前記第1方向に隣接する前記第1発音記号間の領域の内、少なくとも該音韻の子音と母音との境界に対応する領域と、に前記第2直線を配置する、請求項4に記載の発音表示装置。
  7. 前記作成部は、
    前記第2言語の1音節の音韻に対応する複数の前記第1発音記号を、前記第2言語の発音順に沿って前記第1方向に配列し、複数の前記第1発音記号の前記第1方向の両端部と、前記第1方向に隣接する前記第1発音記号間の領域の内、少なくとも該音韻の子音または母音と主母音との境界に対応する領域と、に前記第2直線を配置する、請求項4に記載の発音表示装置。
  8. 前記第2言語の単語ごとに、該単語における1音節ごとの音韻のピッチパターンを推定する推定部を備え、
    前記作成部は、
    前記第2言語の1音節の音韻に対応する複数の前記第1発音記号を、前記第2言語の発音順に沿って前記第1方向に配列し、複数の前記第1発音記号の前記第1方向の両端部と、前記第1方向に隣接する前記第1発音記号間の領域の内、少なくとも該音韻に対応するピッチパターンに応じた音の高低の境界となる位置と、に前記第2直線を配置する、請求項4に記載の発音表示装置。
  9. 前記推定部は、前記第2言語の単語ごとに、該単語における1音節ごとの音韻のピッチパターンと、該音韻を表す文字の各々に対応する音の継続時間と、を推定し、
    前記作成部は、
    前記第1方向に隣接する前記第2直線間の距離が、該第2直線間に位置する前記第1発音記号に応じた音韻を表す文字の各々に対応する音の継続時間の合計に応じた距離となるように、前記第2直線を配置する、請求項8に記載の発音表示装置。
  10. 前記作成部は、
    前記第2言語の1音節の音韻に対応する複数の前記第1発音記号を、前記第1直線によって区切られた前記第2方向に配列された複数の領域の内、該音韻に対応するピッチパターンによって表される音の高低に応じた領域に配置する請求項8に記載の発音表示装置。
  11. 前記発音図式は、前記第1直線を含み且つ前記第1発音記号の各々を囲む、矩形状の直線を有する、請求項1に記載の発音表示装置。
  12. 前記第1発音記号の少なくとも一部を、前記第2言語の第2発音記号に置き換えた前記発音図式の作成を指示する指示信号を受け付ける受付部を備え、
    前記作成部は、
    前記指示信号を受け付けたときに、前記第1発音記号の少なくとも一部を、前記第2発音記号に置き換えた前記発音図式を作成する、
    請求項1に記載の発音表示装置。
  13. 声調言語である第2言語の1音節ごとの音韻を、第1言語の発音を示す複数の第1発音記号に変換するステップと、
    前記第1発音記号によって表される音の高低の境界を示す、第1方向に長い第1直線と、前記第1直線によって区切られ、かつ、前記第1方向に直交する、第2方向に配列された複数の領域の内、音の高低に応じた領域に配置された複数の前記第1発音記号と、を有する発音図式を、前記第2言語の1音節ごとに作成するステップと、
    を含む発音表示方法。
  14. コンピュータに、
    声調言語である第2言語の1音節ごとの音韻を、第1言語の発音を示す複数の第1発音記号に変換するステップと、
    前記第1発音記号によって表される音の高低の境界を示す、第1方向に長い第1直線と、前記第1直線によって区切られ、かつ、前記第1方向に直交する、第2方向に配列された複数の領域の内、音の高低に応じた領域に配置された複数の前記第1発音記号と、を有する発音図式を、前記第2言語の1音節ごとに作成するステップと、
    を実行させるためのプログラム。
JP2014053415A 2014-03-17 2014-03-17 発音表示装置、発音表示方法、及びプログラム Active JP6208056B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014053415A JP6208056B2 (ja) 2014-03-17 2014-03-17 発音表示装置、発音表示方法、及びプログラム
CN201510096396.9A CN104934042A (zh) 2014-03-17 2015-03-04 发音显示装置及发音显示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014053415A JP6208056B2 (ja) 2014-03-17 2014-03-17 発音表示装置、発音表示方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2015176037A JP2015176037A (ja) 2015-10-05
JP6208056B2 true JP6208056B2 (ja) 2017-10-04

Family

ID=54121183

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014053415A Active JP6208056B2 (ja) 2014-03-17 2014-03-17 発音表示装置、発音表示方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP6208056B2 (ja)
CN (1) CN104934042A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106057213B (zh) * 2016-06-30 2018-08-03 广州酷狗计算机科技有限公司 一种显示人声音高数据的方法和装置
WO2019003350A1 (ja) * 2017-06-28 2019-01-03 ヤマハ株式会社 歌唱音生成装置及び方法、プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0625905B2 (ja) * 1984-10-12 1994-04-06 松下電器産業株式会社 発音練習装置
JPS63113179U (ja) * 1987-01-14 1988-07-21
WO2006085719A1 (en) * 2005-02-14 2006-08-17 Hay Kyung Yoo Foreign language studying device for improving foreign language studying efficiency, and on-line foreign language studying system using the same
JP5282230B2 (ja) * 2010-06-30 2013-09-04 諭 梶原 学習用教材および教材情報出力装置
JP3188412U (ja) * 2013-09-09 2014-01-23 純子 馬場 アクセント学習用補助教具

Also Published As

Publication number Publication date
CN104934042A (zh) 2015-09-23
JP2015176037A (ja) 2015-10-05

Similar Documents

Publication Publication Date Title
JP4769223B2 (ja) テキスト発音記号変換辞書作成装置、認識語彙辞書作成装置、及び音声認識装置
JP5535238B2 (ja) 情報処理装置
JP2020027132A (ja) 情報処理装置およびプログラム
JP6208056B2 (ja) 発音表示装置、発音表示方法、及びプログラム
US20150058011A1 (en) Information processing apparatus, information updating method and computer-readable storage medium
US11694028B2 (en) Data generation apparatus and data generation method that generate recognition text from speech data
RU2320026C2 (ru) Преобразование буквы в звук для синтезированного произношения сегмента текста
JP2008268478A (ja) アクセント調整可能な音声合成装置
JP5079718B2 (ja) 外国語学習支援システム、及びプログラム
CN112002304A (zh) 语音合成方法及装置
JP5696638B2 (ja) 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム
JP2010186339A (ja) 通訳装置、方法、及びプログラム
JP6810363B2 (ja) 情報処理装置、情報処理システム、および情報処理プログラム
JP7307301B2 (ja) 発音表示装置、発音表示方法及びプログラム
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP6411015B2 (ja) 音声合成装置、音声合成方法、およびプログラム
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
JP5169602B2 (ja) 形態素解析装置、形態素解析方法及びコンピュータプログラム
JP2006030384A (ja) テキスト音声合成装置及びテキスト音声合成方法
JP2004171174A (ja) 文章読み上げ装置、読み上げのためのプログラム及び記録媒体
JP6523998B2 (ja) 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JP6762454B1 (ja) ピッチパターン補正装置、プログラム及びピッチパターン補正方法
JP6727477B1 (ja) ピッチパターン補正装置、プログラム及びピッチパターン補正方法
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170906

R151 Written notification of patent or utility model registration

Ref document number: 6208056

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350