JP6020093B2 - Alphabet reading estimation device - Google Patents
Alphabet reading estimation device Download PDFInfo
- Publication number
- JP6020093B2 JP6020093B2 JP2012260940A JP2012260940A JP6020093B2 JP 6020093 B2 JP6020093 B2 JP 6020093B2 JP 2012260940 A JP2012260940 A JP 2012260940A JP 2012260940 A JP2012260940 A JP 2012260940A JP 6020093 B2 JP6020093 B2 JP 6020093B2
- Authority
- JP
- Japan
- Prior art keywords
- partial
- character string
- alphabet
- alphabet character
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 17
- 230000010365 information processing Effects 0.000 description 11
- 238000000034 method Methods 0.000 description 7
- 238000000354 decomposition reaction Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 3
- 238000011056 performance test Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、アルファベット文字列の読みを推定する装置に関するものである。 The present invention relates to an apparatus for estimating reading of an alphabetic character string.
従来のアルファベット読み推定装置は、アルファベット文字列とその日本語読みとを対応付けた大量のデータを用いて、入力されたアルファベット文字列を分解した複数の文字列とその日本語読みとのngram(複数要素の連鎖)頻度(例えば、「tio,ショ」と「n,ン」の連鎖の頻度)を計算し、このngram頻度を用いた音訳モデルに基づいて、入力されたアルファベット単語の日本語読みを推定する装置であった。(例えば、特許文献1) A conventional alphabet reading estimation apparatus uses a large amount of data in which an alphabet character string and its Japanese reading are associated with each other, and an gramm of a plurality of character strings obtained by decomposing an input alphabet character string and its Japanese reading. Multi-element linkage) frequency (for example, “tio, sho” and “n, n” chain frequency) is calculated and based on the transliteration model using this ngram frequency, the input alphabetic word is read in Japanese It was the device which estimates. (For example, Patent Document 1)
特許文献1に開示されているアルファベット読み推定装置は、日本語の読みを推定するアルファベット文字列が入力されると、所定の文字列単位の部分アルファベット文字列に分解し、分解された部分アルファベット文字列のngram頻度を大量データから参照し、参照したデータから音訳モデルに基づいて、日本語読みを推定する。
The alphabet reading estimation device disclosed in
一般に、アルファベット読み推定装置は、単語辞書内に入力されたアルファベット文字列に対応するより長い文字列があれば、より正確に読みを推定できる。しかし、より長い文字列を多数内包するために大量のデータを単語辞書内に記憶させる必要があるため、メモリ等が余分に必要となり、ハードウェアコストが高くなる。一方、少量のデータでngram頻度テーブルを構成すると、データの信頼性を欠くという問題があった。 In general, the alphabet reading estimation device can estimate reading more accurately if there is a longer character string corresponding to the alphabet character string input in the word dictionary. However, since it is necessary to store a large amount of data in the word dictionary in order to include a lot of longer character strings, an extra memory or the like is required, resulting in an increase in hardware cost. On the other hand, when the gram frequency table is configured with a small amount of data, there is a problem that the reliability of the data is lacking.
本発明に係るアルファベット読み推定装置は単語辞書に大量のデータが無くても、少ないデータで信頼性の高いアルファベットの日本語等の特定言語の読みを推定可能とすることを目的とする。 An object of the present invention is to enable estimation of reading of a specific language such as Japanese of an alphabet with high reliability even if there is no large amount of data in a word dictionary.
本発明は、入力されたアルファベット文字列を複数の部分アルファベット文字列に分解して、前記部分アルファベット文字列とその読みの候補である複数の部分読みを対応づけて登録させた辞書を参照して、該部分アルファベット文字列ごとに部分読みを推定するアルファベット読み推定装置において、アルファベット文字列を構成する複数の辞書部分アルファベット文字列のうち、複数の部分読みが推定される辞書部分アルファベット文字列に基づいて作成された辞書特徴アルファベット文字列と、前記複数の部分読みとを対応させ、前記辞書特徴アルファベット文字列の読みを部分読みとして使用する頻度を得点で表した部分得点辞書と、前記入力されたアルファベット文字列を構成する複数の部分アルファベット文字列のうち、複数の部分読みが推定される部分アルファベット文字列に基づいて複数の特徴アルファベット文字列を作成する特徴アルファベット文字列作成部と、前記部分得点辞書を参照して、前記複数の部分読みが推定される辞書特徴アルファベット文字列に一致する前記特徴アルファベット文字列の得点を前記複数の部分読みごとに算出する特徴アルファベット文字列得点算出部と、前記複数の部分読みごとに算出した得点に基づいて部分読みを推定する特徴アルファベット文字列読み判定部と、を備えることを特徴とする。 The present invention refers to a dictionary in which an input alphabet character string is decomposed into a plurality of partial alphabet character strings, and the partial alphabet character string and a plurality of partial readings that are candidates for reading are associated with each other and registered. In the alphabet reading estimation device for estimating partial reading for each partial alphabet character string, based on a dictionary partial alphabet character string from which a plurality of partial readings are estimated among a plurality of dictionary partial alphabet character strings constituting the alphabet character string The dictionary feature alphabet character string created in correspondence with the plurality of partial readings, and a partial score dictionary representing the frequency with which the reading of the dictionary feature alphabet character string is used as the partial reading, and the input Among the multiple partial alphabet strings that make up the alphabet string, multiple A characteristic alphabet character string creating unit that creates a plurality of characteristic alphabet character strings based on a partial alphabet character string on which partial reading is estimated, and a dictionary feature on which the plurality of partial readings are estimated with reference to the partial score dictionary A characteristic alphabet character string score calculation unit that calculates a score of the characteristic alphabet character string that matches the alphabet character string for each of the plurality of partial readings, and estimates a partial reading based on the score calculated for each of the plurality of partial readings And an alphabetic character string reading determination unit.
本発明に係るアルファベット読み推定装置は、入力アルファベット文字列を部分アルファベット文字列に分解し、さらに部分アルファベット文字列から特徴アルファベット文字列を抽出して部分読みとして使用される頻度に応じて得点付けを行い、その得点に基づいて部分読みを推定する構成としたので、少量のデータでも信頼性の高い特定言語の読みを提供することができる。 The alphabet reading estimation device according to the present invention decomposes an input alphabet character string into partial alphabet character strings, further extracts characteristic alphabet character strings from the partial alphabet character strings, and scores them according to the frequency used as partial readings. Since the partial reading is estimated based on the score, the reading of a specific language with high reliability can be provided even with a small amount of data.
実施の形態1
以下、図1から図7を用いて本発明の実施の形態1を説明する。図1は実施の形態1に係るアルファベット読み推定装置の装置構成を示す図である。図2は実施の形態1に係る見出し辞書の例を示す図である。図3は実施の形態1に係る部分得点辞書の例を示す図である。図4は実施の形態1に係るアルファベット読み推定装置の動作フローチャートを示す図である。図5は実施の形態1に係る見出し系列の例を示す図である。図6は実施の形態1に係る特徴アルファベット文字列の例を示す図である。図7は実施の形態1に係る部分アルファベット文字列の合計得点の例を示す図である。
Hereinafter,
以下、図1を用いて実施の形態1に係るアルファベット読み推定装置1の構成を説明する。
Hereinafter, the configuration of the alphabet
実施の形態1に係るアルファベット読み推定装置1は、入力装置10と、情報処理部20と、記憶部30と、出力装置40とで構成される。日本語読みを推定するアルファベット文字列(以下、「入力アルファベット文字列」とする)は、入力装置10から情報処理部20へ入力され、情報処理部20で日本語読みが推定されて出力装置40から出力される。例えば、情報処理部20は、入力装置10から「reversal」という入力アルファベット文字列が入力されると、「リバーサル」という日本語読みを作成して出力装置40から出力する。
The alphabet
入力装置10は、入力アルファベット文字列を情報処理部20に入力する装置である。例えば、キーボードやタッチパネル等がこれにあたる。
The
記憶部30は、入力アルファベット文字列の日本語読みの推定に使用する各種データ(見出し辞書31と部分得点辞書32)を記憶する装置である。例えばハードディスクドライブなどがこれにあたる。
The memory |
見出し辞書31は、アルファベット文字列を複数の文字列に分解したもの(以下、「辞書部分アルファベット文字列」という)とその日本語読み(以下、「部分読み」とする)とを対応付けたデータである。見出し辞書31は、予め、アルファベット文字列に日本語読みを付与して対応付け、さらにアルファベット文字列と日本語読みの音の対応をとることで作成される。例えば、図2は見出し辞書31の例である。この見出し辞書31は、アルファベット文字列「conversation」、「disposal」、「anniversary」、「recognize」から作成されたものである。これらのアルファベット文字列に日本語読みを付与し、音で区切ると、「co/n/ver/sa/tio/n」=「カ/ン/バ/セー/ショ/ン」、「di/s/po/sa/l」=「ディ/ス/ポー/ザ/ル」、「a/nni/ver/sa/ry」=「ア/ニ/バー/サ/リー」、「re/co/g/ni/ze」=「リ/コ/グ/ナイ/ズ」となる。例えば、番号1の行には、辞書部分アルファベット文字列「a」に部分読み「ア」が対応づけられている。これは、「a/nni/ver/sa/ry」=「ア/ニ/バー/サ/リー」の頭文字から作成された見出し辞書31である。なお、辞書部分アルファベット文字列「sa」は、対応する部分読みが「セー」、「ザ」、「サ」のように複数あるので、部分読みが複数対応付けられている。
The
部分得点辞書32は、辞書部分アルファベット文字列から抽出された辞書特徴アルファベット文字列に対応する部分読みが使用される頻度を表す部分得点33で構成される得点情報である。ここで、辞書特徴アルファベット文字列とは、見出し辞書31を作成する際に用いたアルファベット文字列に基づいて辞書部分アルファベット文字列から文字列を抽出したもので、具体的には、「辞書部分アルファベット文字列」と「辞書部分アルファベット文字列を分解して抽出した文字列」と「辞書部分アルファベット文字列を中心に前又は後の文字を含めて抽出した文字列」とをいう。また、使用される頻度とは、1つの部分アルファベット文字列に特定の部分読みを付す頻度のことをいう。ここで、図3は実施の形態1に係る部分得点辞書32の例である。この部分得点辞書32は、アルファベット文字列「conversation」、「disposal」、「anniversary」、「recognize」と、これらのアルファベット文字列から得られた部分アルファベット文字列「sa」とその部分読みから作成されたものである。辞書部分アルファベット文字列「sa」において、「辞書部分アルファベット文字列」は「sa」、「辞書部分アルファベット文字列を分解して抽出した文字列」は「s」と「a」、「辞書部分アルファベット文字列を中心に前又は後の文字を含めて抽出した文字列」は「o−sa」、「r−sa」、「sa+l」、「sa+t」、「po−sa」、「er−sa」となる。図3において、「o−sa」という辞書特徴アルファベット文字列の「sa」の部分に対して「サ」と読む(部分読み)頻度が高い場合、辞書特徴アルファベット文字列「o−sa」の列うち、部分読み「サ」の行の部分得点33は高く設定される。なお、辞書特徴アルファベット文字列の「−」や「+」は、「辞書部分アルファベット文字列を中心に前又は後の文字を含めて抽出した文字列」の「辞書部分アルファベット文字列」と「前又は後の文字」との接続関係を示す記号である。例えば「−」は「辞書部分アルファベット文字列」と「前の文字」とが接続されていることを示し、「+」は「辞書部分アルファベット文字列」と「後の文字」とが接続されていることを示す。また、部分得点辞書32は、アルファベット文字列にその日本語読みを付与し、音の対応を分析して作成される。この部分得点33は、設計者の知見や多数のデータの性能テストの結果から設定される得点である。
The
情報処理部20は、入力アルファベット文字列の日本語読みを推定する装置である。情報処理部20は、入力アルファベット文字列分解部21、見出し系列作成部22、推定対象決定部23、特徴アルファベット文字列作成部24、部分アルファベット文字列得点算出部25、部分アルファベット文字列読み判定部26、から構成される。
The
入力アルファベット文字列分解部21は、入力装置10から入力アルファベット文字列を受けて、複数の部分アルファベット文字列に分解する装置である。
The input alphabet character string decomposition unit 21 is a device that receives an input alphabet character string from the
見出し系列作成部22は、見出し辞書31を参照して、入力アルファベット文字列を分解して得られた部分アルファベット文字列に部分読みを割り当てた見出し系列220を作成する装置である。
The headline
推定対象決定部23は、複数の部分アルファベット文字列のうち、部分読みを推定する部分アルファベット文字列を選択する装置である。
The estimation
特徴アルファベット文字列作成部24は、部分アルファベット文字列から特徴アルファベット文字列を抽出する装置である。特徴アルファベット文字列とは、部分アルファベット文字列の文字列を抽出したもので、具体的には、「部分アルファベット文字列」と「部分アルファベット文字列を分解して抽出した文字列」と「部分アルファベット文字列を中心に前又は後の文字を含めて抽出した文字列」とをいう。例えば、入力アルファベット文字列「reversal」の部分アルファベット文字列「sa」において、「部分アルファベット文字列」は「sa」、「部分アルファベット文字列を分解して抽出した文字列」は、「s」、「a」、「部分アルファベット文字列を中心に前又は後の文字を含めて抽出した文字列」は、「r−sa」、「sa+l」、「er−sa」、「sa+l$」となる。また、「$」マークは何も文字が無いことを意味する。なお、「部分アルファベット文字列を分解して抽出した文字列」は、部分アルファベット文字列が1文字である場合は分解することができないため作成されない。 The characteristic alphabet character string creating unit 24 is a device that extracts a characteristic alphabet character string from a partial alphabet character string. Characteristic alphabet string is a character string extracted from a partial alphabet string. Specifically, "partial alphabet string", "character string extracted by decomposing partial alphabet string" and "partial alphabet" It is a "character string extracted including the preceding or succeeding characters centering on the character string". For example, in the partial alphabet character string “sa” of the input alphabet character string “reversal”, “partial alphabet character string” is “sa”, “character string extracted by decomposing the partial alphabet character string” is “s”, “A” and “a character string extracted including the preceding or following character centered on a partial alphabetic character string” are “r-sa”, “sa + l”, “er-sa”, and “sa + l $”. The “$” mark means that there are no characters. Note that the “character string extracted by decomposing a partial alphabetic character string” is not created because the partial alphabetic character string cannot be decomposed if it is one character.
部分アルファベット文字列得点算出部25は、部分得点辞書32を参照して、部分読みごとに特徴アルファベット文字列の得点を割り当てて合算し、合計得点201を算出する装置である。
The partial alphabet character string
部分アルファベット文字列読み判定部26は、部分アルファベット文字列得点算出部25で合算された得点に基づいて部分アルファベット文字列の部分読みを推定する装置である。
The partial alphabet character string reading
出力装置40は、情報処理部20で推定された入力アルファベット文字列の日本語読みを表示する装置である。例えば、PCモニタやカーナビゲーションシステムのディスプレイがこれにあたる。
The
次に、図4を用いて実施の形態1に係るアルファベット読み推定装置1の動作を説明する。なお、図4の説明では、入力装置10から情報処理部20に入力アルファベット文字列「reversal」が入力され、日本語読み「リバーサル」が出力装置40に出力される例を説明する。なお、この例では、日本語読みないし部分読みを片仮名文字で示したが、平仮名でもよい。
Next, operation | movement of the alphabet reading
ステップ1において、入力装置10は、入力アルファベット文字列「reversal」を情報処理部20に入力する。
In
ステップ2において、入力アルファベット文字列分解部21は、入力アルファベット文字列「reversal」を複数の部分アルファベット文字列に分解する。なお、入力アルファベット文字列分解部21は、見出し辞書31に登録されている辞書部分アルファベット文字列の区分で入力アルファベット文字列を分解する。すなわち、この例においては、見出し辞書31に登録されている辞書部分アルファベット文字列は「re」「ver」「sa」「l」なので、入力アルファベット文字列分解部21は、入力アルファベット文字列を「re、ver、sa、l」と分解する。なお、見出し辞書31には登録されている辞書部分アルファベット文字列として「sa」以外に「s」「a」も存在するが、この例ではより長い文字列の「sa」で分解する方法を採用する。
In
ステップ3において、見出し系列作成部22は、見出し辞書31を参照して見出し系列220を作成する。見出し系列作成部22は、分解した複数の部分アルファベット文字列と一致する辞書部分アルファベット文字列を見出し辞書31から検索する。また、辞書部分アルファベット文字列の部分読みを対応する部分アルファベット文字列に割り当てる。ここで、図5は実施の形態1に係る見出し系列の例を示す図である。この例において、見出し系列作成部22は、入力アルファベット文字列「re、ver、sa、l」の部分アルファベット文字列「re」、「ver」、「sa」、「l」にそれぞれ部分読み「リ」、「バ/バー」、「セー/ザ/サ」、「ル」を割り当てる。
In
ステップ4において、推定対象決定部23は、ステップ3で作成された見出し系列220の部分アルファベット文字列のうち、部分読みを推定する部分アルファベット文字列を選択する。この例では「sa」を選択する。
In
ステップ5において、ステップ4で選択された部分アルファベット文字列に部分読みが複数対応づけられている場合はステップ6に進む。一方、選択された部分アルファベット文字列の部分読みが1つである場合は、ステップ8に進む。
In
ステップ6において、特徴アルファベット文字列作成部24は、推定対象決定部23で選択された部分アルファベット文字列について特徴アルファベット文字列を作成する。ここで、図6は実施の形態1に係る特徴アルファベット文字列の例を示す図である。ステップ1で入力された入力アルファベット文字列が「reversal」で、ステップ4で選択された部分アルファベット文字列が「sa」であるので、「部分アルファベット文字列」(図6では「中心全部」と示す)は、「sa」となる。また、「部分アルファベット文字列を分解して抽出した文字列」(図6では、「中心1」、「中心2」と示す)は、それぞれ「s」、「a」となる。さらに、「部分アルファベット文字列を中心に前又は後の文字を含めて抽出した文字列」(図6では、1つ前の文字を含めた文字列を「前」、2つ前の文字まで含めた文字列を「前前」、後ろの文字を含めた文字列は「後」、2つ後ろの文字まで含めて抽出した文字列を「後後」と示す)は、それぞれ「r−sa」、「er−sa」、「sa+l」、「sa+l$」となる。
In
ステップ7において、部分アルファベット文字列得点算出部25は、部分得点辞書32を参照して部分アルファベット文字列の合計得点34を算出する。図7(a)は実施の形態1に係る部分アルファベット文字列「sa」の合計得点34の例である。部分アルファベット文字列得点算出部25は、部分得点辞書32を参照してステップ4で選択された部分アルファベット文字列の特徴アルファベット文字列と一致する辞書特徴アルファベット文字列の得点を対応する部分読みごとに設定する。この例の場合、見出し系列220において、選択された部分アルファベット文字列は「sa」で、部分読みが「セー/ザ/サ」なので、部分アルファベット文字列得点算出部25は、「sa」の特徴アルファベット文字列の「s、a、sa、r−sa、er−sa、sa+l、sa+l$」の得点を部分読み「セー/ザ/サ」のそれぞれに割り当てる。さらに、部分読みごとに全ての特徴アルファベット文字列の部分得点33を合算して合計得点34を得る。なお、特徴アルファベット文字列「sa+l$」は部分得点辞書501に記述されていないので、部分アルファベット文字列の合計得点34に影響しない。
In
ステップ8において、部分アルファベット文字列読み判定部26は、部分アルファベット文字列の合計得点34を参照して、この部分読みの合計得点34のうち1番高いものを正しい部分読みと推定する。この例の場合、部分アルファベット文字列「sa」の特徴アルファベット文字列「s、a、r−sa、er−sa、sa+l」の部分得点33の合計得点34は、「サ」の行の1.3点が1番高い。したがって、部分アルファベット文字列読み判定部26は、「sa」の部分読みを「サ」であると推定する。なお、ステップ5において、選択された部分アルファベット文字列の部分読みが1つであると判断された場合には、ステップ8はその部分読みを正しい読みであると判断する。
In
ステップ9において、見出し系列220における全ての部分アルファベット文字列に対して日本語読みを推定した場合はステップ10に進む。一方、まだ日本語読みが推定されていない部分アルファベット文字列が存在する場合は、ステップ4に戻り、同じ動作を繰り返す。すなわち、部分アルファベット文字列「sa」以外の部分アルファベット文字列である「re」、「ver」、「l」についても日本語読みを推定する。例えば、図7(b)は、実施の形態1に係る部分アルファベット文字列「ver」の合計得点34の例である。部分アルファベット文字列「sa」の部分読みの推定と同様に合計得点34が高い部分読み「バー」を正しい部分読みであると推定する。
If it is determined in
ステップ10において、ステップ8で全ての部分読みが推定された場合には、出力装置40は、入力アルファベット文字列の読み「re、ver、sal」の日本語読み「リ、バー、サ、ル」を出力装置40へ出力する。
In
以上のように、実施の形態1に係るアルファベット読み推定装置1の動作は終了する。
As described above, the operation of the alphabet reading
なお、実施の形態1に係るアルファベット読み推定装置1の説明において、入力アルファベット文字列は「reversal」としたが、これは1例であり、未知の入力アルファベット文字列であればこれに限られるものではない。
In the description of the alphabet reading
また、実施の形態1に係る推定対象決定部23では、見出し系列220の中から推定する部分アルファベット文字列「sa」を最初に選択した例を示しているが、部分アルファベット文字列を選択する順番はこれに限られず、前から順に「re」、「ver」、「sa」、「l」と選ぶように構成しても良い。
In addition, in the estimation
さらに、入力アルファベット文字列は、英語である例を示したが、フランス語やドイツ語等のアルファベットを用いた言語であればよく、英語に限られるものではない。また、出力される部分読みを日本語読みとしたが、これに限られるものではなく、中国語などの別の言語でも良い。 Furthermore, although the input alphabet character string showed the example which is English, it should just be a language using alphabets, such as French and German, and is not restricted to English. Moreover, although the partial reading to be output is Japanese reading, it is not limited to this, and another language such as Chinese may be used.
なお、特徴アルファベット文字列作成部24で作成される特徴アルファベット文字列の部分アルファベット文字列を分解して抽出した特長」は、部分アルファベット文字列の前後2文字まで抽出したが、これに限られるものではなく、前後1文字以上であればよい。 Note that “feature obtained by decomposing and extracting a partial alphabet character string of the characteristic alphabet character string created by the characteristic alphabet character string creating unit 24” is extracted up to two characters before and after the partial alphabet character string, but is limited to this. Instead, it may be one or more characters before and after.
以上のように実施の形態1に係るアルファベット読み推定装置1は特徴アルファベット文字列作成部24により、読みを推定する部分アルファベット文字列について部分アルファベット文字列を分割した文字列や、部分アルファベット文字列、さらに、部分アルファベット文字列とその部分アルファベット文字列の前後の文字列を含めたものを特徴アルファベット文字列として作成し、この複数の特徴アルファベット文字列に基づいて読みを推定する構成としたので、見出し辞書31に登録されたデータが少ない場合でも、読みをより正確に推定することができる。
As described above, the alphabet reading
実施の形態2
以下、図8、図9、を用いて実施の形態2を説明する。図8は実施の形態2に係る部分得点辞書の例を示す図である。図9は実施の形態2に係る部分アルファベット文字列の合計得点の例を示す図である。なお、実施の形態2に係るアルファベット読み推定装置1の構成は、図1を用いて説明した実施の形態1に係るアルファベット読み推定装置1の構成と同様であるため、説明を省略する。なお、実施の形態1に係る推定対象決定部23は、部分読みを推定する順序は任意であるとした。一方、実施の形態2に係る推定対象決定部23は、部分読みを入力アルファベット文字列の前から順に選択するものとする。
The second embodiment will be described below with reference to FIGS. FIG. 8 is a diagram showing an example of the partial score dictionary according to the second embodiment. FIG. 9 is a diagram showing an example of the total score of the partial alphabetic character strings according to the second embodiment. In addition, since the structure of the alphabet reading
実施の形態1に係る部分得点辞書32は、辞書特徴アルファベット文字列と、部分読みと、部分得点33とで構成される得点情報であった。一方、実施の形態2に係る部分得点辞書32は、部分読みの代わりに先行部分読みを採用したものである。先行部分読みとは、読みを推定する辞書部分アルファベット文字列の部分読みに加えて、1つ前の部分読み(推定した部分読み)を含めたものである。図8は実施の形態2に係る部分得点辞書の例を示す図である。辞書特徴アルファベット文字列「r−sa」に対して先行部分読み「バー・サ」と読む場合の部分得点33は、「0.6」である。一方、辞書特徴アルファベット文字列「r−sa」に対して先行部分読み「バー・セー」と読む場合の部分得点33は、「0.4」である。これは、辞書部分アルファベット文字列「sa」の前の辞書部分アルファベット文字列に対応する読みが「バー」である場合において、辞書特徴アルファベット文字列「r−sa」の「sa」の部分読みは、「セー」と読む場合よりも「サ」と読む場合の方が多いことを表している。なお、実施の形態1に係る部分得点辞書32と同様、実施の形態2に係る部分得点辞書32は設計者の知見や多数のデータの性能テストの結果から設定される。
The
また、実施の形態1に係る部分アルファベット文字列得点算出部25は、見出し系列220のうち推定対象決定部23で選択された部分アルファベット文字列の特徴アルファベット文字列と、これに対応する部分読みを抽出し、部分得点辞書32にならい得点を設定した。一方、実施の形態2に係る部分アルファベット文字列得点算出部25は、部分読みに代えて先行部分読みを抽出する。例えば、図9は実施の形態2に係る部分アルファベット文字列の合計得点の例である。なお、この例では、推定対象決定部23で選択された部分アルファベット文字列は「sa」であるとし、部分アルファベット文字列「re」、「ver」について、既に部分読みが推定されているものとする。部分アルファベット文字列得点算出部25は、既に部分アルファベット文字列読み判定部26によって推定した1つ前の部分アルファベット文字列の部分読み「バー」と、推定対象決定部23で選択した部分アルファベット文字列「sa」の読みである「セー/ザ/サ」を抽出して先行部分読みとする。
Further, the partial alphabet character string
なお、この例では、入力アルファベット文字列「reversal」を分解した先頭の部分アルファベット文字列「re」の部分読みの推定において、部分アルファベット文字列「re」は先行する部分読みがないため、実施の形態1と同様の方法で部分読みが推定されるものとする。 In this example, since the partial alphabet character string “re” has no preceding partial reading in the estimation of partial reading of the first partial alphabet character string “re” obtained by decomposing the input alphabet character string “reversal”, It is assumed that partial reading is estimated by the same method as in the first mode.
以上のように、実施の形態2に係るアルファベット読み推定装置1は、見出し辞書31と部分アルファベット文字列得点算出部25によって先行部分読みを使用するように構成したので、1つの部分アルファベット文字列の部分読みに対して、先行の部分アルファベット文字列の部分読みを考慮した部分アルファベット文字列の合計得点34を算出することが可能となり、より正確な日本語読みを推定することが可能となる。
As described above, the alphabet reading
実施の形態3
以下、実施の形態3について説明する。なお、実施の形態3に係るアルファベット読み推定装置1において、実施の形態1ないし実施の形態2に係るアルファベット読み推定装置1と同じ構成、動作であるものに関しては説明を省略する。
Hereinafter, the third embodiment will be described. In addition, in the alphabet reading
実施の形態1ないし実施の形態2に係るアルファベット読み推定装置1は、見出し辞書31の部分読みを日本語(片仮名文字)からなる文字列とした。一方、実施の形態3に係るアルファベット読み推定装置1は、見出し辞書31の部分読みを音声合成用記号と片仮名文字から構成したことを特徴とするものである。
In the alphabet reading
音声合成用記号とは、片仮名文字と、無声化音節(声帯の振動を伴わない音)を表す文字と、アクセントの有無(音の高低)を表す文字から構成される記号である。例えば、アルファベット文字列「restaurant」の音声合成用記号は、「レHス%LトLラLンL」と示す。ここで、Hは声が高いことを示し、Lは声が低いことを示し、%は無声化音節であることを示す。例えば、「ス%L」は、片仮名文字スで表される音節が無声化音節であり、声が低いことを表している。アルファベット文字列と音声合成用記号との対応は、「re/s/tau/ra/nt」=「レH/ス%L/トL/ラL/ンL」と表現する。 The symbol for speech synthesis is a symbol composed of Katakana characters, characters that indicate unvoiced syllables (sounds that do not involve vocal cord vibration), and characters that indicate the presence or absence of accents (sound pitch). For example, the symbol for speech synthesis of the alphabet character string “restaurant” is indicated as “less H% L L L L L L”. Here, H indicates that the voice is high, L indicates that the voice is low, and% indicates an unvoiced syllable. For example, “su% L” indicates that the syllable represented by the katakana character S is an unvoiced syllable and the voice is low. The correspondence between the alphabetic character string and the speech synthesis symbol is expressed as “re / s / tau / ra / nt” = “les H / s% L / t L / la L / n L”.
以上のように、実施の形態3に係るアルファベット読み推定装置1は、見出し辞書31の部分読みを音声合成用記号と片仮名文字とで構成したので、入力アルファベット文字列の日本語読みとアクセントを同時に推定することができる。
As described above, the alphabet reading
実施の形態4
以下、実施の形態4について説明する。なお、実施の形態4に係るアルファベット読み推定装置1の説明において、実施の形態1ないし実施の形態3に係るアルファベット読み推定装置1と同じ構成、動作であるものに関しては説明を省略する。
Hereinafter, the fourth embodiment will be described. In addition, in description of the alphabet reading
実施の形態1ないし実施の形態3に係るアルファベット読み推定装置1は、部分得点辞書32の部分得点33を設計者の知見や多数データの性能テストの結果から設定した。一方、実施の形態4に係るアルファベット読み推定装置1において、部分得点辞書32の部分得点33は、条件付き確率場モデル(CRF;conditional random field)のモデルパラメータによって部分得点33が設定されることを特徴とする。
In the alphabet reading
条件付き確率場モデルは、下記に示す式(1)から式(3)で示される。式(1)から式(3)において、wはベクトルで表されるモデルパラメータ、x(i)は第i番目の入力アルファベット文字列、y(i)は第i番目の部分読み、P(y(i)|x(i))は、x(i)が与えられたときに、y(i)が起きる確率(条件付き確率)、Cは実験的に決める定数である。|・|はベクトルの大きさを表す。 The conditional random field model is expressed by the following equations (1) to (3). In Expressions (1) to (3), w is a model parameter represented by a vector, x (i) is the i-th input alphabet character string, y (i) is the i-th partial reading, and P (y (I) | x (i) ) is the probability (conditional probability ) that y (i) will occur when x (i) is given, and C is a constant determined experimentally. | · | Represents the magnitude of the vector.
なお、φ(x(i),y(i))は、ベクトル値を返す関数である。φ(x(i),y(i))について、(4)式にベクトルの第k要素の例を式(4)に示す。 Note that φ (x (i) , y (i) ) is a function that returns a vector value. For φ (x (i) , y (i) ), an example of the k-th element of the vector is shown in Equation (4) as in Equation (4).
最急勾配法などを用いて、L(w)が最大となるモデルパラメータwを求める。得られたモデルパラメータwを部分得点33とする。
Using the steepest gradient method or the like, a model parameter w that maximizes L (w) is obtained. The obtained model parameter w is set as a
このように、条件付き確率場モデルのモデルパラメータを部分得点33とするようにしたので、複数の特徴アルファベット文字列の作成において、部分得点33を適切かつ自動的に設定できる効果があり、方式の構築の時間を縮小できる。
Thus, since the model parameter of the conditional random field model is set to the
1 アルファベット読み推定装置、10 入力装置、20 情報処理装部、30 記憶部、40 出力装置、21 入力アルファベット文字列分解部、22 見出し系列作成部、23 推定対象決定部、24 特徴アルファベット文字列作成部、25 部分アルファベット文字列得点算出部、26 部分アルファベット文字列読み判定部、31 見出し辞書、32 部分得点辞書
DESCRIPTION OF
Claims (10)
アルファベット文字列を構成する複数の辞書部分アルファベット文字列のうち、複数の部分読みが推定される辞書部分アルファベット文字列に基づいて作成された辞書特徴アルファベット文字列と、前記複数の部分読みとを対応させ、前記辞書特徴アルファベット文字列の読みを部分読みとして使用する頻度を得点で表した部分得点辞書と、
前記入力されたアルファベット文字列を構成する複数の部分アルファベット文字列のうち、複数の部分読みが推定される部分アルファベット文字列に基づいて複数の特徴アルファベット文字列を作成する特徴アルファベット文字列作成部と、
前記部分得点辞書を参照して、前記複数の部分読みが推定される辞書特徴アルファベット文字列に一致する前記特徴アルファベット文字列の得点を前記複数の部分読みごとに算出する特徴アルファベット文字列得点算出部と、
前記複数の部分読みごとに算出した得点に基づいて部分読みを推定する特徴アルファベット文字列読み判定部と、
を備えるアルファベット読み推定装置。 The input alphabet character string is decomposed into a plurality of partial alphabet character strings, and the partial alphabet is referred to by referring to a dictionary in which the partial alphabet character string and a plurality of partial readings that are candidates for reading are registered in association with each other. In the alphabet reading estimation device that estimates partial reading for each character string,
Corresponds to the dictionary partial alphabet character string created based on the dictionary partial alphabet character string that is estimated to be a plurality of partial readings among the plurality of dictionary partial alphabet character strings constituting the alphabet character string, and the plurality of partial readings A partial score dictionary representing the frequency with which the reading of the dictionary feature alphabetic character string is used as a partial reading,
A characteristic alphabet character string creating unit that creates a plurality of characteristic alphabet character strings based on a partial alphabet character string in which a plurality of partial readings are estimated among a plurality of partial alphabet character strings constituting the input alphabet character string; ,
A characteristic alphabet character string score calculation unit that calculates a score of the characteristic alphabet character string that matches a dictionary characteristic alphabet character string from which the plurality of partial readings is estimated with reference to the partial score dictionary. When,
A characteristic alphabet character string reading determination unit that estimates partial reading based on the score calculated for each of the plurality of partial readings;
An alphabet reading estimation device comprising:
前記複数の部分読みが推定される部分アルファベット文字列に該部分アルファベット文字列の1文字又は2文字後の文字列を追加した文字列と、
前記複数の部分読みが推定される部分アルファベット文字列とからなることを特徴とする請求項3に記載のアルファベット読み推定装置。 The plurality of characteristic alphabet character strings are a character string obtained by adding a character string one or two characters before the partial alphabet character string to the partial alphabet character string from which the plurality of partial readings are estimated;
A character string obtained by adding a character string after one or two characters of the partial alphabet character string to the partial alphabet character string from which the plurality of partial readings are estimated;
4. The alphabet reading estimation apparatus according to claim 3, comprising a partial alphabet character string from which the plurality of partial readings are estimated.
前記特徴アルファベット文字列作成部の前記複数の部分読みは、前記複数の部分読みが推定される部分アルファベット文字列の1つ前の部分アルファベット文字列の部分読みを含むことを特徴とする請求項1から請求項7のいずれかに記載のアルファベット読み推定装置。 The partial scoring dictionary includes a partial reading corresponding to a dictionary partial alphabet character string immediately preceding a dictionary partial alphabet character string from which the plurality of partial readings in the alphabet character string are estimated. It consists of partial reading of the alphabet string,
The plurality of partial readings of the characteristic alphabet character string creating unit include partial readings of a partial alphabet character string immediately preceding a partial alphabet character string from which the plurality of partial readings are estimated. The alphabet reading estimation device according to claim 7.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012260940A JP6020093B2 (en) | 2012-11-29 | 2012-11-29 | Alphabet reading estimation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012260940A JP6020093B2 (en) | 2012-11-29 | 2012-11-29 | Alphabet reading estimation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014106857A JP2014106857A (en) | 2014-06-09 |
JP6020093B2 true JP6020093B2 (en) | 2016-11-02 |
Family
ID=51028258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012260940A Active JP6020093B2 (en) | 2012-11-29 | 2012-11-29 | Alphabet reading estimation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6020093B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4084515B2 (en) * | 1999-11-16 | 2008-04-30 | 日本電信電話株式会社 | Alphabet character / Japanese reading correspondence apparatus and method, alphabetic word transliteration apparatus and method, and recording medium recording the processing program therefor |
JP3961858B2 (en) * | 2002-03-07 | 2007-08-22 | 日本放送協会 | Transliteration device and program thereof |
JP2005092682A (en) * | 2003-09-19 | 2005-04-07 | Nippon Hoso Kyokai <Nhk> | Transliteration device and transliteration program |
JP2009199434A (en) * | 2008-02-22 | 2009-09-03 | Mitsubishi Electric Corp | Alphabetical character string/japanese pronunciation conversion apparatus and alphabetical character string/japanese pronunciation conversion program |
JP5336779B2 (en) * | 2008-06-27 | 2013-11-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Information processing apparatus for performing character string conversion, character string conversion method, program, and information processing system |
-
2012
- 2012-11-29 JP JP2012260940A patent/JP6020093B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014106857A (en) | 2014-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251958B2 (en) | Utterance analysis device, voice dialogue control device, method, and program | |
KR101083540B1 (en) | System and method for transforming vernacular pronunciation with respect to hanja using statistical method | |
Schuster et al. | Japanese and korean voice search | |
JP6493866B2 (en) | Information processing apparatus, information processing method, and program | |
JP4769223B2 (en) | Text phonetic symbol conversion dictionary creation device, recognition vocabulary dictionary creation device, and speech recognition device | |
JP5207642B2 (en) | System, method and computer program for acquiring a character string to be newly recognized as a phrase | |
US10319373B2 (en) | Information processing device, information processing method, computer program product, and recognition system | |
CN108140019B (en) | Language model generation device, language model generation method, and recording medium | |
JP6245846B2 (en) | System, method and program for improving reading accuracy in speech recognition | |
US20160055763A1 (en) | Electronic apparatus, pronunciation learning support method, and program storage medium | |
JP2003514304A5 (en) | ||
JP2006031295A (en) | Apparatus and method for estimating word boundary probability, apparatus and method for constructing probabilistic language model, apparatus and method for kana-kanji conversion, and method for constructing unknown word model | |
JP6941494B2 (en) | End-to-end Japanese speech recognition model learning device and program | |
JP4738847B2 (en) | Data retrieval apparatus and method | |
JP2011008784A (en) | System and method for automatically recommending japanese word by using roman alphabet conversion | |
JP5853595B2 (en) | Morphological analyzer, method, program, speech synthesizer, method, program | |
JP7102710B2 (en) | Information generation program, word extraction program, information processing device, information generation method and word extraction method | |
US11080488B2 (en) | Information processing apparatus, output control method, and computer-readable recording medium | |
JP6020093B2 (en) | Alphabet reading estimation device | |
Kheang et al. | Solving the phoneme conflict in grapheme-to-phoneme conversion using a two-stage neural network-based approach | |
JP6009396B2 (en) | Pronunciation providing method, apparatus and program thereof | |
JP4941495B2 (en) | User dictionary creation system, method, and program | |
JP2000353159A (en) | Notation-reading correspondence device, notation- reading dictionary generating method, text reading arranging device, text reading arranging method, and recording medium | |
JP2013175067A (en) | Automatic reading application device and automatic reading application method | |
JP2004309928A (en) | Speech recognition device, electronic dictionary device, speech recognizing method, retrieving method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20140327 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150929 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160919 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6020093 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |