JP4773813B2 - 読み付与装置、読み付与方法及びプログラム - Google Patents

読み付与装置、読み付与方法及びプログラム Download PDF

Info

Publication number
JP4773813B2
JP4773813B2 JP2005353991A JP2005353991A JP4773813B2 JP 4773813 B2 JP4773813 B2 JP 4773813B2 JP 2005353991 A JP2005353991 A JP 2005353991A JP 2005353991 A JP2005353991 A JP 2005353991A JP 4773813 B2 JP4773813 B2 JP 4773813B2
Authority
JP
Japan
Prior art keywords
segment
information
reading
word
mora
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005353991A
Other languages
English (en)
Other versions
JP2007156273A (ja
Inventor
久子 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005353991A priority Critical patent/JP4773813B2/ja
Publication of JP2007156273A publication Critical patent/JP2007156273A/ja
Application granted granted Critical
Publication of JP4773813B2 publication Critical patent/JP4773813B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、テキストに読みを付与する技術に関する。
日本語テキストに読みを付与する場合、対象となる日本語テキストの形態素解析を行い、その形態素解析結果から得られる読み(単語辞書に登録されている読み)を、当該日本語テキストに付与する方法を採ることが一般的である(例えば、非特許文献1参照)。
浅野久子他、「多段解析法による形態素解析を用いた音声合成用読み韻律設定方法とその単語辞書構成」、自然言語処理、Vol.6, No.2, 1999
しかしながら、従来の読み付与方法では、特に対話調の発声において行われるような、正規の日本語の文法からかけ離れた読みを付与することが困難であるという問題点があった。
すなわち、例えば対話調の発声などでは、自然に、ある読みに対して長音を追加したり(例:「それで」→「それでー」)、促音を追加したり(例:「すごく」→「すっごく」)、削除したり(例:「言っている」→「いって_る」)、置換したり(例:「いいかも」→「いっかも」、「いちにち」→「いちんち」)することがある。非特許文献1のような従来方法によってこのような対話調の読みを付与する場合、このような対話調のテキストを入力テキストとして用意しなければならない。しかし、このような対話調の発話は、通常、意図的に行われているものではない。そのため、このような対話調のテキストを入力として期待するのは難しい。
また、従来の読み付与方法によって付与される読みは単語辞書に登録されている読みである。しかし、通常、単語辞書には対話調の読みは登録されていない。そのため、たとえ対話調のテキストが入力されたとしても対話調の読みを付与することはできない。
さらに、対話調の読みは多様であるため、対話調の読みの全てを単語辞書に登録することは現実的ではない。また、たとえ対話調の読みの全てを単語辞書に登録することができたとしても、その単語辞書のデータ量は膨大となり、単語辞書の検索処理が増大することになる。
以上のような問題は、対話調の読みを付与する場合に限らず、方言の読みを付与する場合等正規の日本語の文法からかけ離れた読みを付与する場合に共通する問題である。
本発明は、このような点に鑑みてなされたものであり、正規の日本語の文法からかけ離れた読みを容易に付与することが可能な技術を提供することを目的とする。
本発明では上記課題を解決するために、まず、形態素解析部が、テキストに対する形態素解析処理を行い、当該テキストを構成する各単語と、それらの属性値とを対応付けた単語情報列を生成し、当該単語情報列を出力する。次に、セグメント情報生成部が、単語情報列の単語又はそれを細分化した単位であるセグメントと、当該単語に対応付けられた属性値から抽出した特徴値とを、それぞれ対応付けたセグメント情報列を生成し、当該セグメント情報列を出力する。そして、分類処理部が、セグメント情報列の特徴値と分類規則情報とを用い、各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報を出力する。その後、変換処理部が、分類結果情報と変換規則情報とを用い、各セグメントの読み替え処理を行う。
ここで、セグメント情報生成部が生成するセグメント情報列は、形態素解析結果から抽出した特徴値によって構成される。よって、このようなセグメント情報列は、規則的な手法(例えば、統計学的な手法)に基づく分類処理に適したものである。これにより、分類処理部は、セグメント情報列の特徴値と分類規則情報とを用い、容易に各セグメントの読み替え処理内容を決定することができる。このように各セグメントの読み替え処理内容が決定した後は、セグメント単位で変換規則を適用し、各セグメントの読み替え処理を行えばよい。
また、本発明において好ましくは、テキストは、その内容の種別を示す付加情報に対応付けられてテキスト記憶部に格納され、分類処理部は、各セグメントに対応する付加情報をも特徴値とし、当該付加情報とセグメント情報列の特徴値と分類規則情報とを用い、各セグメントの読み替え処理内容を決定する。
ここで、テキストの内容種別を示す付加情報をも特徴値とすることにより、分類処理部が行う分類処理の精度が向上する。
また、本発明において好ましくは、変換規則情報によって特定される読み替え位置の例外となる単語を特定するための情報と、当該単語の読み替え処理内容毎の読み替え位置を示す読み替え位置情報とを対応付けたテーブルである例外読み辞書を格納する例外読み辞書記憶部を有する。そして、検索部が、処理対象のセグメントが例外読み辞書の単語と一致する単語を有し、なおかつ、一致した当該例外読み辞書の単語に対応付けられた読み替え位置情報が、当該処理対象のセグメントの分類結果情報が示す当該セグメントの読み替え処理内容に対応するものであるか否かを判断し、その判断結果を出力する。さらに、変換処理部は、処理対象のセグメントが例外読み辞書の単語と一致する単語を有し、なおかつ、一致した当該例外読み辞書の単語に対応付けられた読み替え位置情報が、当該処理対象のセグメントの分類結果情報が示す当該セグメントの読み替え処理内容に対応すると判断された場合、これらの条件を満たす読み替え位置情報を用い、当該セグメントの読み替え処理を行う。これにより、規則的な手法の原則から外れる例外的な読みにも対応することができる。
また、本発明において好ましくは、セグメント情報生成部がセグメント情報列を生成する際に属性値から抽出する特徴値は、当該セグメントの末尾モーラの読みが長音であるか否かを示す特徴値を含む。
ここで、長音を有する単語の多くが末尾モーラに長音を有する。すなわち、末尾モーラに長音を有する単語の特徴が表れている可能性が高い。よって、セグメントの末尾モーラの読みが長音であるか否かを特徴値にすることによって少ない情報量でセグメントの特徴を捉えることができる。これにより、演算処理を効率化できる。
また、本発明において好ましくは、分類規則情報は、特徴値を変数とした分類モデル式であり、分類処理部は、セグメント情報列の特徴値を、分類モデル式である分類規則情報に代入し、その演算結果によって各セグメントの読み替え処理内容を決定する。
このように分類モデル式を用いた統計的な手法を用いることにより、少ない演算量で読み付与を行うことができる。
また、本発明において好ましくは、変換規則情報は、分類結果情報が示す読み替え処理内容がセグメント中に長音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、長音又は促音以外であると判断されたモーラの直後に長音を追加する処理を特定するための情報を含み、変換処理部は、分類処理部から出力された分類結果情報が示す読み替え処理内容がセグメント中に長音を追加する処理であるか否かを判断し、変換規則情報が特定する処理を実行する。
日本語の場合、2つの長音が連続することはなく、促音の直後に長音がつながることもない。長音又は促音以外であると判断されたモーラの直後に長音を追加するのは、このような日本語の特徴を捉えたものである。これにより、効率的な処理を実現できる。
また、本発明において好ましくは、変換規則情報は、分類結果情報が示す読み替え処理内容がセグメント中に促音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、促音以外であると判断されたモーラの直後に促音を追加する処理を特定するための情報を含み、変換処理部は、分類処理部から出力された分類結果情報が示す読み替え処理内容がセグメント中に促音を追加する処理であるか否かを判断し、変換規則情報が特定する処理を実行する。
日本語の場合、2つの促音が連続することはない。促音以外であると判断されたモーラの直後に長音を追加するのは、このような日本語の特徴を捉えたものである。これにより、効率的な処理を実現できる。
また、本発明において好ましくは、変換規則情報に示された、セグメント中のモーラを検索する所定の順序は、セグメントの末尾モーラから先頭モーラに向かう順序である。単語中において促音等が追加される可能性が高いのは末尾モーラ或いは末尾に近いモーラである。このようにセグメントの末尾モーラから先頭モーラに向かう順序で検索することによって効率的な処理が可能となる。
以上のように本発明では、正規の日本語の文法からかけ離れた読みを容易に付与することが可能となる。
以下、本発明を実施するための最良の形態を図面を参照して説明する。
〔第1の実施の形態〕
まず、本発明の第1の実施の形態について説明する。
本形態では、まず、読みを付与するテキストの形態素解析処理を行い、その解析結果から分類規則に従った分類処理に適したセグメント情報列を生成する。次に、このセグメント情報列と分類規則情報とを用い、各セグメントの読み替え処理内容を決定し、さらに分類結果情報と変換規則情報とを用い、各セグメントの読み替え処理を行う。本形態では、読み替え処理として長音を追加する場合を例にとって説明する。
<ハードウェア構成>
図1は、本形態における読み付与装置100のハードウェア構成を例示したブロック図である。
図1に例示するように、この例の読み付与装置100は、CPU(Central Processing Unit)11、入力部12、出力部13、補助記憶装置14、ROM(Read Only Memory)15、RAM(Random Access Memory)16及びバス17を有している。
この例のCPU11は、制御部11a、演算部11b及びレジスタ11cを有し、レジスタ11cに読み込まれた各種プログラムに従って様々な演算処理を実行する。また、この例の入力部12は、データが入力される入力ポート、キーボード、マウス等であり、出力部13は、データを出力する出力ポート、ディスプレイ等である。補助記憶装置14は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、本形態の処理を実行するためのプログラムを格納したプログラム領域14a及びタグ出力情報等の各種データが格納されるデータ領域14bを有している。また、RAM16は、例えば、SRAM (Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等であり、上記のプログラムが書き込まれるプログラム領域16a及び各種データが書き込まれるデータ領域16bを有している。また、この例のバス17は、CPU11、入力部12、出力部13、補助記憶装置14、ROM15及びRAM16を、データのやり取りが可能なように接続する。
<プログラム>
補助記憶装置14のプログラム領域14aには、読み付与装置100としてコンピュータを機能させるための読み付与プログラムが格納される。なお、本形態の読み付与プログラムは、各機能を実現するための複数のプログラムによって構成されるが、これらのプログラムは、単一のプログラム列として記載されていてもよく、また、少なくとも一部のプログラムが別個のモジュールとしてライブラリに格納されていてもよい。また、上記のプログラム単体でその機能を実現できるものでもよいし、上記のプログラムがさらに他のライブラリ(記載していない)を読み出して各機能を実現するものでもよい。
<ハードウェアとソフトウェアとの協働>
この例のCPU11は、読み込まれたOS(Operating System)プログラムに従い、補助記憶装置14のプログラム領域14aに格納されている上述の読み付与プログラムを、RAM16のプログラム領域16aに書き込む。同様にCPU11は、補助記憶装置14のデータ領域14bに格納されている各種データをRAM16のデータ領域16bに書き込む。さらに、CPU11は、当該読み付与プログラムや各種データが書き込まれたRAM16上のアドレスをレジスタ11cに格納する。そして、CPU11の制御部11aは、レジスタ11cに格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM16上の領域から読み付与プログラムやデータを読み出し、読み付与プログラムが示す演算を演算部11bに順次実行させ、その演算結果をレジスタ11cに格納していく。
図2は、このようにCPU11に読み付与プログラムが読み込まれることにより構成される読み付与装置100の機能構成を例示したブロック図である。なお、図2における矢印はデータの流れを示すが、制御部180に入出力されるデータの流れの記載は省略してある。
図2に例示するように、本形態の読み付与装置100は、メモリ110、入力部120、形態素解析部130、セグメント情報生成部140、分類処理部150、変換処理部160、制御部180及び一時メモリ190を有し、入力されたテキスト情報(テキスト含む)に対し、変換後単語情報列108を出力する。また、メモリ110は、テキスト記憶部111、単語情報列記憶部112、セグメント情報列記憶部113、分類規則記憶部114、分類結果記憶部115及び変換規則記憶部116を有している。ここで、テキスト記憶部111には、テキスト情報(テキスト含む)101が格納され、単語情報列記憶部112には、単語情報列102が格納され、セグメント情報列記憶部113には、セグメント情報列103が格納される。また、分類規則記憶部114には、分類規則情報104が格納され、分類結果記憶部115には、分類結果付加セグメント情報列105が格納され、変換規則記憶部116には、変換規則情報106が格納される。なお、各情報の詳細については後述する。
なお、メモリ110及び一時メモリ190は、補助記憶装置14のデータ領域14b、RAM16のデータ領域16b、CPU11のレジスタ11c、その他のバッファメモリやキャッシュメモリ等の何れか、或いはこれらを併用した記憶領域に相当する。また、入力部120は、所定のプログラムが読み込まれたCPU11の制御のもとデータの入力を受け付ける入力部12に相当する。また、形態素解析部130、セグメント情報生成部140、分類処理部150、変換処理部160及び制御部180は、上述の読み付与プログラムがCPU11に読み込まれることにより構成されるものである。また、形態素解析部130の処理には単語辞書が必要となり、その単語辞書を格納するためのメモリが必要となるが、図2ではこれらの記述を省略してある。
<処理>
次に、第1の実施の形態の読み付与方法について説明する。
図3は、第1の実施の形態の読み付与方法を説明するためのフローチャートである。また、図4は、図3のステップS4の詳細を説明するためのフローチャートであり、図5は、図3のステップS5の詳細を説明するためのフローチャートである。以下、図2〜図5を用い、本形態の読み付与方法を説明する。なお、以下では、テキストが1文である場合を例にとって説明するが、テキストが複数の文から構成される場合には、同様な処理を文の数だけ繰り返せばよい。
本形態の読み付与装置100は、制御部180の制御のもと各処理を実行する。また、明示しない限り、各演算過程で算出されたデータは逐一一時メモリ190に格納され、その後の演算処理に利用される。
[前処理]
前処理として、メモリ110の分類規則記憶部114に分類規則情報104を格納し、変換規則記憶部116に変換規則情報106を格納しておく。
分類規則情報104は、例えば、SVM(サポートベクターマシーン)や最大エントロピー法等の公知の統計的な分類手法に用いられる分類モデル式であり、所定の特徴値を変数として持つ識別関数である。この分類モデル式は、学習データを用いた学習によって各パラメータが決定された式である。この具体例については後述する。また、変換規則情報106は、例えば、読み替えのための変換規則を記述した情報である。この具体例についても後述する。
[読み替え処理]
以上のような前処理を前提とし、以下の各処理が実行される。
まず、入力部120から入力されたテキスト情報(テキストを含む)101がメモリ110のテキスト記憶部111に格納される(ステップS1)。具体的には、例えば、キーボード等(「入力部120」に相当)からテキストがキー入力され、これらが所定のテキスト情報に変換されてメモリ110のテキスト記憶部111に格納される。或いは、例えば、外部のハードディスクやメモリ等に格納されていたテキスト情報101がUSB(Universal Serial Bus)端子等(「入力部120」に相当)から入力され、メモリ110のテキスト記憶部111に格納される。なお、テキスト情報101のフォーマットは予め定めておくものとする。図6(a)は、XML(Extensible Markup Language)で記述したテキスト情報101の例である。図6(a)の例では、「東京ですね?」というテキスト101aがXMLによって記述されている。
次に、形態素解析部130が、メモリ110のテキスト記憶部111に格納されたテキスト情報101からテキストを抽出し、抽出したテキストに対する形態素解析処理を行い、当該テキストを構成する各単語と、それらの属性値とを対応付けた単語情報列を生成し、当該単語情報列102を出力する(ステップS2)。そして、形態素解析部130から出力された単語情報列102は、メモリ110の単語情報列記憶部112に格納される。
なお、形態素解析部130が行う形態素解析の方法には特に制限はなく、例えば、前述の非特許文献1記載の方法等を用いることができる。また、α-Tagger(登録商標)や、Rosette形態素解析システムやC、onceptBase/ConceptBase(登録商標)Search等の公知のソフトウェアを用いてもよい。また、本形態の形態素解析部130が生成する形態素解析部130は、形態素解析のNベスト解(NはN≧1の任意の数字)であり、各単語に対して、表記、品詞、読みなどの情報をもつ。
図6(b)は、形態素解析部130が生成した単語情報列102を例示した図である。この図の例の単語情報列102は、形態素解析によって得られた「単語No.」102a、「単語(表記)」102b、「品詞」102ca及び「読み」102cbを対応付けたデータ列である。なお、「品詞」102ca及び「読み」102cbは、各「単語」102bに対応する属性値102cを構成する。例えば、単語No.「1」の単語「東京」の属性値は、品詞「名詞:固有:他」、読み「トーキョー」である。
次に、セグメント情報生成部140が、メモリ110の単語情報列記憶部112から単語情報列102を読み込み、セグメントと、単語に対応付けられた属性値から抽出した特徴値とを、それぞれ対応付けたセグメント情報列103を生成し、当該セグメント情報列を出力する(ステップS3)。そして、セグメント情報生成部140から出力されたセグメント情報列103は、メモリ110のセグメント情報列記憶部113に格納される。ここで、セグメントとは、後述する分類処理部150による処理単位となる語であり、単語、又はそれを細分化した単位(単語、モーラ等)を例示できるが、本形態では、各単語の単位をセグメントとする。
図7は、このように生成されたセグメント情報列103を例示した図である。
図7の例のセグメント情報列103は、各セグメントに対応する「セグメントNo.」103a、「セグメント」103b、「主品詞」103da、「活用形」103db、「体言・記号細分類」103dc、末尾−1番目のモーラの読みが長音であるか否か(「長音」であるか、「その他」の読み又は読み「なし」であるか)を示す「末尾−1モーラの読み」103dd及び末尾のモーラの読みが長音であるか否か(「長音」であるか、「その他」の読み又は読み「なし」であるか)を示す「末尾モーラの読み」103deが対応付けられたデータ列である。なお、「主品詞」103da、「活用形」103db、「体言・記号細分類」103dc、「末尾−1モーラの読み」103dd及び「末尾モーラの読み」103deは、「特徴値」103dを構成する。また、「*」は、対応する情報が存在しないことを示すデータを示している。
図6(b)に例示した単語情報列102から図7の例のセグメント情報列103を生成する場合、セグメント情報生成部140は、単語情報列102の「単語No.」102a及び「単語(表記)」102bの各要素を、それらの対応を維持しつつ、そのままセグメント情報列103の「セグメントNo.」103a及び「セグメント」103bの各要素とする。本形態では、各単語の単位をセグメントとしているからである。
また、セグメント情報生成部140は、単語情報列102の「単語No.」102aの各要素に対応付けられた「品詞」102caの各要素から、主品詞、活用形及び体言・記号細分類を抽出し、これらをセグメント情報列103の「主品詞」103da、「活用形」103db及び「体言・記号細分類」103dcの各要素とする。例えば、図6(b)に例示した単語情報列102の単語No.1の「東京」という単語の品詞は「名詞:固有:地」であり、主品詞は「名詞」、活用形に相当する副品詞は存在せず、体言・記号細分類に該当する副品詞は「固有:地」である。そのため、図7に例示したセグメント情報列103のセグメントNo.1の「主品詞」103daの要素は「名詞」、「活用形」103dbの要素は「*」、「体言・記号細分類」103dcの要素は「固有:地」となる。
さらに、セグメント情報生成部140は、例えば、単語情報列102の「読み」102cbの各要素から末尾−1番目のモーラの読みと、末尾モーラの読みとを抽出し、それらの読みが「長音」であるか、「その他」の読みであるか、或いは読み「なし」であるかを判断する。そして、それらの判断結果(「長音」「その他」「なし」)を、セグメント情報列103の「末尾−1モーラの読み」103dd及び「末尾モーラの読み」103deの各要素とする。例えば、図6(b)に例示した単語情報列102の単語No.1の「東京」という単語の読みは「トーキョー」であり、末尾−1モーラの読みは「キョ」であり、末尾モーラの読みは「ー」である。そのため、図7に例示したセグメント情報列103のセグメントNo.1の「末尾−1モーラの読み」103ddの要素は「その他」となり、「末尾モーラの読み」103deの要素は「長音」となる。なお、「モーラ」とは、時間的なまとまりの単位を表す音韻論的概念である。セグメント情報生成部140は、短母音を含む1音節の長さに相当する区間を1モーラと判断する。具体的には、セグメント情報生成部140は、撥音(ン)及び促音(ッ)を1モーラと判断し、拗音(ァィゥェォャュョ)は直前の文字とつなげて1モーラと判断し(例えば、ヴァ、キャ、キュ、キョ等は1モーラ)、その他については1文字1モーラと判断する。
次に、分類処理部150が、メモリ110のセグメント情報列記憶部113からセグメント情報列103を読み込み、分類規則記憶部114から分類規則情報104を読み込む。そして、分類処理部150は、セグメント情報列103の特徴値103dと分類規則情報104とを用い、各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報105aをセグメント情報列103に付加した分類結果付加セグメント情報列105を出力する(ステップS4)。そして、このように出力された分類結果付加セグメント情報列105は、メモリ110の分類結果記憶部115に格納される。
[分類規則情報104及びステップS4の具体例]
ここで、分類規則情報104及びステップS4の具体例について説明する。
分類規則情報104は、特徴値を用い、セグメントを読み替え処理内容毎に分類するための情報であり、例えば、SVMや最大エントロピー法等の公知の統計的な分類手法に用いられる分類モデル式である。そして、ステップS4では、分類処理部150が、セグメント情報列103の特徴値103dを、分類モデル式である分類規則情報104に代入し、その演算結果によって各セグメントの読み替え処理内容を決定する。なお、特徴値103dを分類モデル式に代入する際、特徴値103dは、一定の規則に基づいて数値に変換されていなければならない。
以下では、統計的な分類手法としてSVMを用い、2つの読み替え処理内容(「長音追加」と「変化なし」)に分類する場合を例に採って説明する。なお、これは一例にすぎず、本発明を限定するものではない。
この場合、分類規則情報104には、例えば、以下の式(1)や(2)に示す分類モデル式を用い、SVMの文脈として、分類対象となるセグメント及びその前後2セグメントの特徴値103dと、前2セグメントの読み分類結果を用いるものとする。
Figure 0004773813
ここで、sign(α)は、αが正であるときにはsign(α)=1となり、αが負であるときにはsign(α)=−1となる関数であり、f(x)の値が読み替え処理内容に対応する。具体的には、例えば、f(x)=1の場合、読み替え処理内容が「長音追加」であると分類し、f(x)=−1の場合、読み替え処理内容が「変化なし」であると分類する。また、αは、ベクトルαの転置ベクトルを示し、αは、ベクトルαの複素共役転置ベクトルを示す。
また、xは、分類対象となるセグメント及びその前後2セグメントの特徴値103dの各要素と、前2セグメントの読み分類結果とをそれぞれ数値化し、それらを要素としたベクトルである。なお、要素の数値化方法及びベクトルを構成する要素の順序は一定である。なお、存在しないデータについては、データが存在しない旨を示す値に数値化する。
また、xは、学習データにおけるj(j=1,...,n)番目のセグメント及びその前後2セグメントの特徴値の各要素と、前2セグメントの読み分類正解値とをそれぞれ数値化し、それらを要素としたベクトルである。なお、本形態の例の学習データは、セグメント情報列103と同じ要素の組と、その組に対応する読み替え処理内容の正解値(「長音追加」又は「変化なし」)とを対応付けたデータ列である。また、要素の数値化方法及びベクトルを構成する要素の順序は、セグメント情報列103からベクトルxを生成する際のものと同じである。
また、yは、学習データにおけるj番目のセグメントの正解値に対応する数値であり、式(1)又は(2)の例ではy∈{1,−1}である。例えば、学習データにおけるj番目のセグメントの正解値が「長音追加」である場合y=1となり、「変化なし」である場合y=−1となる。
また、K(α,β)は、カーネル関数である。すなわち、K(α,β)は、2つのベクトルα,βに対し、以下のように表される関数である。ただし、φ(α)は、スカラー値を出力する任意のd個の非線形関数φ(α)〔p=(1,...,d)〕に対するφ(α)=(φ1(α),φ2(α),...,φd(α))tである。
Figure 0004773813
また、λ及びbは、ベクトルパラメータであり、学習データを用いた学習によって得られる値である。すなわち、λ及びbは、学習データから得られた(x,y)を、式(1)又は(2)の(x,f(x))として代入し、その代入結果の連立方程式を解くことによって得られる。
図4は、図3に示したステップS4の処理の例を説明するためのフローチャートである。以下、この図に従ってステップS4の処理の具体例を説明する。
まず、制御部180が、変数iに1を代入し、この変数iを一時メモリ190に格納する(ステップS11)。次に、分類処理部150が、一時メモリ190から変数iを読み込み、さらにメモリ110のセグメント情報列記憶部113から「セグメントNo.」103aがiであるセグメント及びその前後2セグメントの特徴値103dの各要素と、「セグメントNo.」103aがiであるセグメントの前2セグメントの分類結果情報とをそれぞれ数値化し、それらを要素としたベクトルxを生成する。そして、分類処理部150は、メモリ110の分類規則記憶部114から分類規則情報104(この例では分類モデル式)を読み込み、生成したベクトルxを当該分類モデル式に代入し、その演算を行う(ステップS12)。次に分類処理部150は、当該演算結果
に対応する分類結果情報をセグメントNo.がiであるセグメント情報列103に追加する(ステップS13)。具体的には、例えば、演算結果が1であった場合には「長音追加」を示す分類結果情報をセグメントNo.がiであるセグメント情報列103に追加し、演算結果が−1であった場合には「変化なし」を示す分類結果情報をセグメントNo.がiであるセグメント情報列103に追加する。なお、このように分類結果情報が追加されたセグメント情報列103を分類結果付加セグメント情報列105と呼ぶことにする。図8は、このように分類結果情報105aが追加されたセグメント情報列103からなる分類結果付加セグメント情報列105の構成を例示した図である。この分類結果付加セグメント情報列105は、一時メモリ190に格納される。
次に、制御部180は、一時メモリ190に格納された変数iを読み込み、この変数iはセグメントNo.の最大値であるか否かを判断する(ステップS14)。例えば、図7のセグメント情報列103の場合、制御部180は、変数iがセグメントNo.の最大値である4であるか否かを判断する。ここで、変数iがセグメントNo.の最大値でなかった場合、制御部180は、iに1を加算した値を新たな変数iとし、これを一時メモリ190に格納し、処理をステップS12に戻す。一方、変数iがセグメントNo.の最大値であった場合、制御部180は、分類処理部150に指示を与え、分類処理部150はステップS13の処理で一時メモリ190に格納しておいた分類結果付加セグメント情報列105を出力し(ステップS16)、出力された分類結果付加セグメント情報列105は、メモリ110の分類結果記憶部115に格納される
([分類規則情報104及びステップS4の具体例]の説明終わり)。
ステップS4までの処理により、各セグメントの読みに長音を追加するか、読みを変化させないかが決定された。しかし、本形態のセグメントは単語である。よって、読みに長音を追加すると判断されたセグメントについては、さらに、単語の読みのどの位置に変換を行うかを特定する必要がある。そこで、ステップS5では、セグメント内の読み替え位置を特定するための情報である変換規則情報106を用い、単語の読みのどの位置に変換を行うかを特定し、その読み変換を行なう。すなわち、変換処理部160が、メモリ110の分類結果記憶部115から分類結果付加セグメント情報列105を読み出し、変換規則記憶部116から変換規則情報106を読み出し、分類結果付加セグメント情報列105の分類結果情報と変換規則情報106とを用い、各セグメントに対応する単語の読み替え処理を行った変換後単語情報列108を生成し、当該変換後単語情報列108を出力する(ステップS5)。
[ステップS5の具体例]
ここで、ステップS5の具体例を説明する。この具体例の変換規則情報106は、分類結果情報105aが示す読み替え処理内容がセグメント中に長音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、長音又は促音以外であると判断されたモーラの直後に長音を追加する処理を特定するための情報(プログラムや、処理を特定するためのパラメータ・数式等)を含む。そして、変換処理部160は、分類処理部150から出力された(分類結果付加セグメント情報列105が具備する)分類結果情報105aが示す読み替え処理内容がセグメント中に長音を追加する処理であるか否かを判断し、変換規則情報106によって特定される処理を実行する。なお、以下では、変換処理部160が、セグメント中のモーラを末尾モーラから先頭モーラに向かう順序で検索する方法を例示するが、本発明はこれに限定されるものではない。
図5は、ステップS5の具体例を説明するためのフローチャートである。以下、この図に従ってステップS5の具体例を説明する。
まず、制御部180が、変数iに1を代入し、この変数iを一時メモリ190に格納する(ステップS21)。次に、変換処理部160が、メモリ110の変換規則記憶部116から変換規則情報106を読み込み、変換規則情報106の記述に従った処理を実行する。まず、変換処理部160は、一時メモリ190から変数iを読み込み、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105を参照し、セグメントNo.iに対応する分類結果情報105aが「長音追加」を示すか「変化なし」を示すかを判断する(ステップS22)。
ここで、セグメントNo.iに対応する分類結果情報105aが「変化なし」であった場合、後述のステップS28に進む。
一方、セグメントNo.iに対応する分類結果情報105aが「長音追加」であった場合、制御部180は、変数mに0を代入し、これを一時メモリ190に格納する(ステップS23)。そして、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102を参照し、単語No.iに対応する「読み」102cbの要素(例えば、図6の例でi=1の場合は「トーキョー」)を抽出する。なお、この「読み」は、セグメントNo.iの「セグメント」103bに対応する。本形態の場合、単語情報列102の「単語No.」102aを、そのまま「セグメントNo.」103aとしているからである。変換処理部160は、抽出した単語No.iに対応する「読み」102cbの要素の末尾−m番目のモーラが長音追加可能であるか否かを検証する(ステップS24)。具体的には、変換処理部160は、末尾−m番目のモーラが「長音」或いは「促音」である(長音追加不可)か、そのいずれでもない(長音追加可能)かを検証する。
ここで、末尾−m番目のモーラが長音追加不可であった場合、変換処理部160は、末尾−m番目のモーラが先頭モーラであるか否かを検証する(ステップS25)。ここで、末尾−m番目のモーラが先頭モーラでなかった場合、制御部180は、一時メモリ190に格納された変数mに1を加えた値を新たな変数mの値とし一時メモリ190に格納し(ステップS26)、処理をステップS24に戻す。一方、末尾−m番目のモーラが先頭モーラであった場合、後述するステップS28の処理に進む。
一方、ステップS24の検証において、末尾−m番目のモーラが長音追加可能であった場合、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102の単語No.iに対応する「読み」102cbの末尾−m番目のモーラの直後に長音を追加する(ステップS27)。
ステップS28では、制御部180が一時メモリ190から変数iを読み込み、これがメモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105の「セグメントNo.」103aの要素の最大値であるか否かを判断する(ステップS28)。ここで、変数iが「セグメントNo.」103aの要素の最大値でなかった場合、制御部180は、一時メモリ190の変数iに1を加算した値を新たな変数iの値とし、これを一時メモリ190に格納し(ステップS29)、処理をステップS22に戻す。一方、変数iが「セグメントNo.」103aの要素の最大値であった場合、制御部180は変換処理部160に指示を与え、変換処理部160は、メモリ110の単語情報列記憶部112から読み変換が行なわれた単語情報列102(変換後単語情報列108)を読み込み、これを出力する(ステップS30)。
図9は、図6の単語情報列102及び図8の分類結果付加セグメント情報列105を用い、図5の処理を実行した場合に得られる変換後単語情報列108を示した図である。
図8の分類結果付加セグメント情報列105は、セグメントNo.3に対応する分類結果情報105aのみが「長音追加」を示すものとなっており、セグメントNo.1,4,5に対応する分類結果情報105aは「変化なし」である(ステップS22)。そして、セグメントNo.3に対応する図6の単語情報列102の単語No.3の「読み」102cbの末尾モーラは「ネ」であり、長音・促音以外である(ステップS24)。よって、単語No.3の「読み」102cbの末尾モーラは「ネ」の直後のみに長音「ー」が追加され、単語No.3の「読み」102cbが「ネー」と変換される。その結果、最終的に、図9に示すような「単語No.」108a、「単語」108b、「品詞」108ca及び「読み」108cbからなる変換後単語情報列108が、変換処理部160から出力される(ステップS30/[ステップS5の具体例]の説明終わり)。
〔第2の実施の形態〕
次に、本発明の第2の実施の形態について説明する。
本形態は、第1の実施の形態の変形例であり、読み替え処理として促音追加を行う構成を採る。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する部分については説明を省略する。
<構成>
構成は第1の実施の形態と同様となるため説明を省略する。以下では、図2の機能ブロック図を引用しつつ説明を行う。
<処理>
第2の実施の形態の前処理は第1の実施の形態と同様である。ただし、本形態の変換規則情報106は、分類結果情報105aが示す読み替え処理内容がセグメント中に促音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、促音以外であると判断されたモーラの直後に促音を追加する処理を特定するための情報(プログラムや、処理を特定するためのパラメータ・数式等)を含む。
また、第2の実施の形態における処理全体の流れは第1の実施の形態と同様である(図3)。本形態と第1の実施の形態との相違点は、ステップS4,5の処理の詳細である。以下、本形態におけるステップS4,5の処理の相違点を中心に説明する。
[本形態のステップS4の詳細]
第1の実施の形態で述べたように、分類処理部150は、セグメント情報列の特徴値と分類規則情報104とを用い、各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報をセグメント情報列に付加した分類結果付加セグメント情報列を出力する。本形態のステップS4の処理では、「促音追加」或いは「変化なし」を示す分類結果情報を生成する。その具体的な処理内容は、「長音追加」を「促音追加」と置き換える以外は、第1の実施の形態と同様である。
[本形態のステップS5の詳細]
第1の実施の形態で述べたように、変換処理部160は、メモリ110の分類結果記憶部115から分類結果付加セグメント情報列を読み出し、変換規則記憶部116から変換規則情報106を読み出し、分類結果付加セグメント情報列の分類結果情報と変換規則情報106とを用い、各セグメントに対応する単語の読み替え処理を行って変換後単語情報列108を生成し、当該変換後単語情報列108を出力する。なお、第2の実施の形態では、読み替え処理として、促音追加を行なう。
図10は、本形態におけるステップS5の処理の詳細を説明するためのフローチャートである。以下、この図を用い、本形態におけるステップS5の処理の詳細を説明する。
まず、制御部180が、変数iに1を代入し、この変数iを一時メモリ190に格納する(ステップS41)。次に、変換処理部160は、メモリ110の変換規則記憶部116から変換規則情報106を読み込み、変換規則情報106の記述に従った処理を実行する。まず、変換処理部160は、一時メモリ190から変数iを読み込み、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105を参照し、セグメントNo.iに対応する分類結果情報105aが「促音追加」を示すか「変化なし」を示すかを判断する(ステップS42)。
ここで、セグメントNo.iに対応する分類結果情報105aが「変化なし」であった場合、後述のステップS48に進む。
一方、セグメントNo.iに対応する分類結果情報105aが「促音追加」であった場合、制御部180は、変数mに0を代入し、これを一時メモリ190に格納する(ステップS43)。そして、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102を参照し、単語No.iに対応する「読み」102cbの要素を抽出する。変換処理部160は、抽出した単語No.iに対応する「読み」102cbの要素の末尾−m番目のモーラが促音追加可能であるか否かを検証する(ステップS44)。具体的には、変換処理部160は、末尾−m番目のモーラが「促音」である(促音追加不可)か、「促音」でない(促音追加可能)かを検証する。
ここで、末尾−m番目のモーラが促音追加不可であった場合、変換処理部160は、末尾−m番目のモーラが先頭モーラであるか否かを検証する(ステップS45)。ここで、末尾−m番目のモーラが先頭モーラでなかった場合、制御部180は、一時メモリ190に格納された変数mに1を加えた値を新たな変数mの値とし一時メモリ190に格納し(ステップS46)、処理をステップS44に戻す。一方、末尾−m番目のモーラが先頭モーラであった場合、後述するステップS48の処理に進む。
一方、ステップS44の検証において、末尾−m番目のモーラが促音追加可能であった場合、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102の単語No.iに対応する「読み」102cbの末尾−m番目のモーラの直後に促音を追加する(ステップS47)。
ステップS48では、制御部180が一時メモリ190から変数iを読み込み、これがメモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105の「セグメントNo.」103aの要素の最大値であるか否かを判断する(ステップS48)。ここで、変数iが「セグメントNo.」103aの要素の最大値でなかった場合、制御部180は、一時メモリ190の変数iに1を加算した値を新たな変数iの値とし、これを一時メモリ190に格納し(ステップS49)、処理をステップS42に戻す。一方、変数iが「セグメントNo.」103aの要素の最大値であった場合、制御部180は変換処理部160に指示を与え、変換処理部160は、メモリ110の単語情報列記憶部112から読み変換が行なわれた単語情報列102(変換後単語情報列108)を読み込み、これを出力する(ステップS50)。
〔第3の実施の形態〕
本形態は、第1の実施の形態の変形例であり、単語情報列の単語を細分化したモーラをセグメントとする形態である。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する部分については説明を省略する。
<構成>
構成は第1の実施の形態と同様となるため説明を省略する。以下では、図2の機能ブロック図を引用しつつ説明を行う。
<処理>
第3の実施の形態の前処理は第1の実施の形態と同様である。ただし、本形態の変換規則情報106は、分類結果情報105aが示す読み替え処理内容がセグメントに長音を追加する処理であった場合に、当該セグメント(モーラ)の直後に促音を追加する処理を特定するための情報(プログラムや、処理を特定するためのパラメータ・数式等)を含む。
また、第3の実施の形態もおける処理全体の流れは第1の実施の形態と同様である(図3)。本形態と第1の実施の形態との相違点は、ステップS3からS5の処理の詳細である。以下では、これらの相違点のみを説明する。
[本形態のステップS3の詳細]
第1の実施の形態で述べたように、ステップS3では、セグメント情報生成部140が、メモリ110の単語情報列記憶部112から単語情報列102を読み込み、セグメントと、単語に対応付けられた属性値から抽出した特徴値とを、それぞれ対応付けたセグメント情報列103を生成し、当該セグメント情報列を出力する。ここで、第1の実施の形態では単語をセグメントの単位としたが、第3の実施の形態では、モーラをセグメントとする。この点が第1の実施の形態と第3の実施の形態との相違点である。
図12は、本形態のセグメント情報列203の構成を例示した図である。
図12に例示するように、本形態のセグメント情報列203は、各セグメントに対応する「セグメントNo.」203a、各セグメントに対応する「単語No.」203b、「セグメント」203c、「読み」203da、「主品詞」203db、「活用形」203dc及び「体言・記号細分類」203ddが対応付けられたデータ列である。なお、「読み」203da、「主品詞」203db、「活用形」203dc及び「体言・記号細分類」203ddは、「特徴値」203dを構成する。
図6(b)に例示した単語情報列102から図12の例のセグメント情報列203を生成する場合、まず、セグメント情報生成部140は、「単語(表記)」102bの各要素をモーラ毎に分解し、これらのモーラを「セグメント」203cの各要素とする。そして、セグメント情報生成部140は、それらに、対応する単語の「単語No.」203bと、新たに付与した「セグメントNo.」203aとを関連付ける。また、セグメント情報生成部140は、単語情報列102の「読み」102cbをセグメント毎(モーラ単位)に分解し、それらを、対応する「セグメントNo.」203aと関連付ける。さらに、セグメント情報生成部140は、単語情報列102の「品詞」102caの各要素から、主品詞、活用形及び体言・記号細分類を抽出し、それらを、対応する「単語No.」203bに関連付ける。
以上のように生成されたセグメント情報列203は、セグメント情報生成部140から出力され、メモリ110のセグメント情報列記憶部113に格納される。
[本形態のステップS4の詳細]
第1の実施の形態で述べたように、分類処理部150は、セグメント情報列の特徴値と分類規則情報104とを用い、各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報をセグメント情報列に付加した分類結果付加セグメント情報列を出力する。第3の実施の形態では、この処理を図12で例示したモーラ単位のセグメント情報列203を用いて実行する。その処理手順自体は第1の実施の形態と同様である。
図13は、セグメント情報列203を用いた本形態のステップS4の処理によって生成された分類結果付加セグメント情報列205の例示である。このように、本形態の分類結果付加セグメント情報列205は、セグメント情報列203の各列に対応する分類結果情報205aが対応付けられた構成となる。そして、このように出力された分類結果付加セグメント情報列205は、メモリ110の分類結果記憶部115に格納される。
[本形態のステップS5の詳細]
変換処理部160は、メモリ110の分類結果記憶部115から分類結果付加セグメント情報列を読み出し、変換規則記憶部116から変換規則情報106を読み出し、分類結果付加セグメント情報列の分類結果情報と変換規則情報106とを用い、各セグメントに対応するモーラの読み替え処理を行って変換後単語情報列108を生成し、当該変換後単語情報列108を出力する。第3の実施の形態では、この処理を、セグメントがモーラ単位で構成された分類結果付加セグメント情報列205を用いて実行する。
図11は、本形態におけるステップS5の具体的な処理を説明するためのフローチャートである。以下、この図を用い、本形態におけるステップS5の具体的な処理を説明する。
まず、制御部180が、変数iに1を代入し、この変数iを一時メモリ190に格納する(ステップS61)。次に、変換処理部160が、メモリ110の変換規則記憶部116から変換規則情報106を読み込み、変換規則情報106の記述に従った処理を実行する。まず、変換処理部160は、一時メモリ190から変数iを読み込み、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列205(図13)を参照し、セグメントNo.iに対応する分類結果情報205aが「長音追加」を示すか「変化なし」を示すかを判断する(ステップS62)。
ここで、セグメントNo.iに対応する分類結果情報205aが「変化なし」であった場合、後述のステップS64に進む。一方、セグメントNo.iに対応する分類結果情報205aが「長音追加」であった場合、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102にアクセスし、セグメントNo.iに対応する単語情報列102のモーラの読みの直後に長音追加する(ステップS63)。すなわち、変換処理部160は、まず、iを検索キーとして分類結果付加セグメント情報列205を検索し、「セグメントNo.」203aがiとなる列に属する「単語No.」203bの要素と、その列に属する「読み」203daの要素が単語中どこに位置するかを示す位置情報(単語の先頭から何番目のモーラであるかを示す情報等)とを抽出する。例えば、i=7を検索キーとして、図13の分類結果付加セグメント情報列205を検索した場合、変換処理部160は、「セグメントNo.」203aが「7」となる、「単語No.」203bの要素「3」と、「読み」203daの要素「ネ」と、その「読み」203daの要素「ネ」の位置情報「先頭から1文字目を示す情報」とを抽出する。そして、変換処理部160は、抽出した「単語No.」203bの要素(上記例では「3」)を検索キーとして、メモリ110の単語情報列記憶部112に格納された単語情報列102の「単語No.」102aの要素を検索し、対応する単語(上記例では「ね」)の「読み」102cbの要素(上記例では「ネ」)を特定する。さらに、変換処理部160は、特定された「読み」102cbの要素から、上記の位置情報を用いて一つのモーラの「読み」を特定する(上記例では「ネ」)。そして、変換処理部160は、特定した一つのモーラの「読み」の直後に長音を追加し、単語情報列102の「読み」102cbの要素を更新する(上記例では「ネー」に更新)。単語情報列102の「読み」102cbの要素を更新後、以下のステップS64に移る。
ステップS64では、制御部180が一時メモリ190から変数iを読み込み、これがメモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列205の「セグメントNo.」203aの要素の最大値であるか否かを判断する(ステップS64)。ここで、変数iが「セグメントNo.」203aの要素の最大値でなかった場合、制御部180は、一時メモリ190の変数iに1を加算した値を新たな変数iの値とし、これを一時メモリ190に格納し(ステップS65)、処理をステップS62に戻す。一方、変数iが「セグメントNo.」203aの要素の最大値であった場合、制御部180は変換処理部160に指示を与え、変換処理部160は、メモリ110の単語情報列記憶部112から読み変換が行なわれた単語情報列102(変換後単語情報列108)を読み込み、これを出力する(ステップS66)。
〔第4の実施の形態〕
本形態は、第1,2の実施の形態を融合した形態であり、セグメントの単位を単語とし、読みに長音追加及び促音追加を行うことが可能な形態である。以下では、第1,2の実施の形態との相違点を中心に説明し、これらと共通する部分については説明を省略する。
<構成>
構成は第1の実施の形態と同様となるため説明を省略する。以下では、図2の機能ブロック図を引用しつつ説明を行う。
<処理>
第4の実施の形態の前処理は第1の実施の形態と同様である。ただし、本形態の変換規則情報106は、分類結果情報105aが示す読み替え処理内容がセグメント中に長音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、長音・促音以外であると判断されたモーラの直後に長音を追加する処理を特定するための情報の他、分類結果情報105aが示す読み替え処理内容がセグメント中に促音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、促音以外であると判断されたモーラの直後に促音を追加する処理を特定するための情報を含む。
また、第4の実施の形態における処理全体の流れは第1の実施の形態と同様である(図3)。本形態と第1,2の実施の形態との相違点は、ステップS4,S5の処理の詳細である。以下では、これらの相違点のみを説明する。
[本形態のステップS4の詳細]
第4の実施の形態と第1,2の実施の形態との相違点は、分類処理部150が分類規則情報104を用いて、「長音追加」「促音追加」「変化なし」の3種類の読み替え処理内容を示す処理内容情報を生成する点のみである。
[本形態のステップS5の詳細]
図14,15は、本形態のステップS5の具体例を説明するためのフローチャートである。以下、この図に従って本形態のステップS5の具体例を説明する。
まず、制御部180が、変数iに1を代入し、この変数iを一時メモリ190に格納する(ステップS71)。次に、変換処理部160が、メモリ110の変換規則記憶部116から変換規則情報106を読み込み、変換規則情報106の記述に従った処理を実行する。まず、変換処理部160は、一時メモリ190から変数iを読み込み、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105を参照し、セグメントNo.iに対応する分類結果情報が「長音追加」「促音追加」「変化なし」のいずれを示すかを判断する(ステップS72)。
ここで、セグメントNo.iに対応する分類結果情報が「変化なし」であった場合、後述のステップS78に進む。また、セグメントNo.iに対応する分類結果情報が「促音追加」であった場合、後述のステップS81に進む。
一方、セグメントNo.iに対応する分類結果情報105aが「長音追加」であった場合、制御部180は、変数mに0を代入し、これを一時メモリ190に格納する(ステップS73)。そして、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102を参照し、単語No.iに対応する「読み」102cbの要素を抽出する。変換処理部160は、抽出した単語No.iに対応する「読み」102cbの要素の末尾−m番目のモーラが長音追加可能であるか否かを検証する(ステップS74)。
ここで、末尾−m番目のモーラが長音追加不可であった場合、変換処理部160は、末尾−m番目のモーラが先頭モーラであるか否かを検証する(ステップS75)。ここで、末尾−m番目のモーラが先頭モーラでなかった場合、制御部180は、一時メモリ190に格納された変数mに1を加えた値を新たな変数mの値とし一時メモリ190に格納し(ステップS76)、処理をステップS74に戻す。一方、末尾−m番目のモーラが先頭モーラであった場合、後述するステップS78の処理に進む。一方、ステップS74の検証において、末尾−m番目のモーラが長音追加可能であった場合、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102の単語No.iに対応する「読み」102cbの末尾−m番目のモーラの直後に長音を追加し(ステップS77)、後述するステップS78の処理に進む。
また、ステップS72の判断において、セグメントNo.iに対応する分類結果情報が「促音追加」であった場合、制御部180は、変数mに0を代入し、これを一時メモリ190に格納する(ステップS81)。そして、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102を参照し、単語No.iに対応する「読み」102cbの要素を抽出する。変換処理部160は、抽出した単語No.iに対応する「読み」102cbの要素の末尾−m番目のモーラが促音追加可能であるか否かを検証する(ステップS82)。
ここで、末尾−m番目のモーラが促音追加不可であった場合、変換処理部160は、末尾−m番目のモーラが先頭モーラであるか否かを検証する(ステップS83)。ここで、末尾−m番目のモーラが先頭モーラでなかった場合、制御部180は、一時メモリ190に格納された変数mに1を加えた値を新たな変数mの値とし一時メモリ190に格納し(ステップS84)、処理をステップS82に戻す。一方、末尾−m番目のモーラが先頭モーラであった場合、後述するステップS78の処理に進む。
一方、ステップS82の検証において、末尾−m番目のモーラが促音追加可能であった場合、変換処理部160は、メモリ110の単語情報列記憶部112に格納された単語情報列102の単語No.iに対応する「読み」102cbの末尾−m番目のモーラの直後に促音を追加し(ステップS85)、以下のステップS78の処理に進む。
ステップS78では、制御部180が一時メモリ190から変数iを読み込み、これがメモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105の「セグメントNo.」103aの要素の最大値であるか否かを判断する(ステップS78)。ここで、変数iが「セグメントNo.」103aの要素の最大値でなかった場合、制御部180は、一時メモリ190の変数iに1を加算した値を新たな変数iの値とし、これを一時メモリ190に格納し(ステップS79)、処理をステップS72に戻す。一方、変数iが「セグメントNo.」103aの要素の最大値であった場合、制御部180は変換処理部160に指示を与え、変換処理部160は、メモリ110の単語情報列記憶部112から読み変換が行なわれた単語情報列102(変換後単語情報列108)を読み込み、これを出力する(ステップS80)。
〔第5の実施の形態〕
本形態は、第1の実施の形態の変形例であり、読み替え処理として削除及び置換を行う構成を採る。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する部分については説明を省略する。
<構成>
図16は、本形態の読み付与装置300の機能構成を例示したブロック図である。なお、本形態の読み付与装置300も公知のコンピュータに読み付与プログラムが読み込まれることによって構成されるものである。なお、図16において、第1の実施の形態と共通する部分については図2と同じ符号を付し、説明を省略する。
図16に例示するように、本形態の読み付与装置300は、メモリ110、入力部120、形態素解析部130、セグメント情報生成部140、分類処理部150、変換処理部160、制御部180、一時メモリ190及び削除・置換辞書メモリ310を有し、入力されたテキスト情報(テキスト含む)に対し、変換後単語情報列108を出力する。なお、削除・置換辞書メモリ310には、後述する削除・置換辞書311が格納される。また、メモリ110の変換規則記憶部116には、変換規則情報106の代わりに変換規則情報406が格納される。
<処理>
第5の実施の形態の処理は、前処理及びステップS5の処理の点で第1の実施の形態と相違する。
[本形態の前処理]
前処理として、メモリ110の分類規則記憶部114に分類規則情報104を格納しておくこと、変換規則記憶部116に変換規則情報106を格納しておくことは、第1の実施の形態と同様である。ただし、本形態の変換規則情報106は、分類結果情報105aが示す読み替え処理内容がセグメントの一部を削除又は置換する処理であった場合に、セグメント中の各単語をキーとして削除・置換辞書311を検索し、そこから変換内容を抽出する処理を特定するための情報(プログラムや、処理を特定するためのパラメータ・数式等)を含む。
さらに、本形態の前処理では、削除・置換辞書メモリ310に削除・置換辞書311を格納しておく。図18は、この削除・置換辞書311の例示である。
削除・置換辞書311は、削除又は置換を行う「単語」311aと、その変更後の読みを示す「変更内容」311bとを対応付けたテーブルである。図18の例では、例えば、単語「いいかも」の読みが「イイカモ」から「イッカモ」に置換され、単語「言っている」の読み「イッテイル」の一部が削除され「イッテル」となることを示している。
また、第5の実施の形態における処理全体の流れは第1の実施の形態と同様である(図3)。本形態と第1の実施の形態との相違点は、ステップS4,5の処理の詳細である。以下では、この相違点のみを説明する。
[本形態のステップS4の詳細]
第1の実施の形態で述べたように、分類処理部150は、セグメント情報列の特徴値と分類規則情報104とを用い、各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報をセグメント情報列に付加した分類結果付加セグメント情報列を出力する。第5の実施の形態では、各セグメントの読み替え処理内容として「削除・置換」又は「変化なし」を決定する。その具体的な処理内容については、「長音追加」を「削除・置換」に置き換える以外は第1の実施の形態と同様である。
[本形態のステップS5の詳細]
図17は、本形態におけるステップS5の具体的な処理を説明するためのフローチャートである。以下、この図を用い、本形態におけるステップS5の具体的な処理を説明する。
まず、制御部180が、変数iに1を代入し、この変数iを一時メモリ190に格納する(ステップS91)。次に、変換処理部160が、メモリ110の変換規則記憶部116から変換規則情報106を読み込み、変換規則情報106の記述に従った処理を実行する。まず、変換処理部160は、一時メモリ190から変数iを読み込み、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105を参照し、セグメントNo.iに対応する分類結果情報が「削除・置換」を示すか「変化なし」を示すかを判断する(ステップS92)。
ここで、セグメントNo.iに対応する分類結果情報が「変化なし」であった場合、後述のステップS95に進む。
一方、セグメントNo.iに対応する分類結果情報205aが「削除・置換」であった場合、変換処理部160は、削除・置換辞書メモリ310に格納された削除・置換辞書311から、セグメントNo.がiであるセグメントに対応する変換内容を抽出する(ステップS93)。具体的には、変換処理部160は、セグメントNo.がiであるセグメントに対応する単語(本形態では、セグメント=単語)を検索キーとして、削除・置換辞書311の「単語」311aのフィールドを検索し、一致した単語に対応付けられている「変換内容」311bの要素を抽出する。例えば、図18の例の削除・置換辞書311を用いる場合において、セグメントNo.iのセグメントが単語「いいかも」を具備する場合、変換処理部160は、変換内容として「イッカモ」を抽出する。
そして、変換処理部160は、セグメントNo.がiであるセグメントに対応する単語情報列102の単語の読みを、ステップS93で削除・置換辞書311から抽出した変換内容で置き換える(ステップS94)。具体的には、この例の変換処理部160は、単語情報列102の単語No.iに対応する「読み」102cbの要素を、ステップS93で削除・置換辞書311から抽出した読みに置き換える。その後、以下のステップS95の処理に進む。
ステップS95では、制御部180が一時メモリ190から変数iを読み込み、これがメモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列205の「セグメントNo.」の要素の最大値であるか否かを判断する(ステップS94)。ここで、変数iが「セグメントNo.」の要素の最大値でなかった場合、制御部180は、一時メモリ190の変数iに1を加算した値を新たな変数iの値とし、これを一時メモリ190に格納し(ステップS96)、処理をステップS92に戻す。一方、変数iが「セグメントNo.」の要素の最大値であった場合、制御部180は変換処理部160に指示を与え、変換処理部160は、メモリ110の単語情報列記憶部112から読み変換が行なわれた単語情報列102(変換後単語情報列108)を読み込み、これを出力する(ステップS97)。
〔第6の実施の形態〕
本形態は、第1の実施の形態の変形例であり、テキストに対応付けられた付加情報をも用いて読み替え処理を行う点で第1の実施の形態と相違する。以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する部分については説明を省略する。
<構成>
図19は、本形態の読み付与装置400の機能構成を例示したブロック図である。なお、本形態の読み付与装置400も公知のコンピュータに読み付与プログラムが読み込まれることによって構成されるものである。なお、図19において、第1の実施の形態と共通する部分については図2と同じ符号を付し、説明を省略する。
図19に例示するように、本形態の読み付与装置400は、メモリ410、入力部120、形態素解析部430、付加情報追加部435、セグメント情報生成部440、分類処理部450、変換処理部160、制御部180及び一時メモリ190を有し、入力されたテキスト情報(テキスト及び付加情報含む)に対し、変換後単語情報列108を出力する。なお、メモリ410は、テキスト記憶部111、単語情報列記憶部112、付加単語情報列記憶部412、セグメント情報列記憶部113、分類規則記憶部114、分類結果記憶部115及び変換規則記憶部116を有している。また、付加情報とは、それが関連つけられたテキストの内容の種別を示す情報である。このような付加情報の例としては、例えば、談話情報がある。談話情報とは、会話における発話の種類を示す情報をいう。なお、この発話の種類としては、働きかけ(言明、指示、確認、情報要求等)、応答発話(同意/拒否、回答等)、情報伝達の状態(解釈不能、破棄、独り言等)等を例示できる。
<処理>
図20は、第6の実施の形態の読み付与方法を説明するためのフローチャートである。
なお、以下では、テキストが1文である場合を例にとって説明するが、テキストが複数の文から構成される場合には、同様な処理を文の数だけ繰り返せばよい。
[前処理]
第1の実施の形態と同様、前処理として、メモリ410の分類規則記憶部114に分類規則情報104を格納し、変換規則記憶部116に変換規則情報106を格納しておく。本形態の分類規則情報104も、公知の統計的な分類手法に用いられる分類モデル式であるが、上述の付加情報をも特徴値として取り扱う点で第1の実施の形態と相違する。
[読み替え処理]
以上のような前処理を前提とし、以下の各処理が実行される。
まず、入力部120から入力されたテキスト情報(テキスト及び付加情報を含む)101がメモリ410のテキスト記憶部111に格納される(ステップS101)。なお、テキストは、その付加情報に対応付けられてテキスト記憶部111に格納される。また、テキスト情報401のフォーマットは予め定めておくものとする。図21(a)は、XML(Extensible Markup Language)で記述した場合のテキスト情報401の例である。図21(a)の例のテキスト情報401は、テキスト401a(この例では「東京ですね?」)を1文単位毎にdiscourseタグで囲み、discourseタグのtype属性で談話情報(この例では「確認」)を指定するものとし、この談話情報を付加情報401bとして扱う。また、XMLタグ以外の部分を、解析対象のテキストとして取り扱う。
次に、形態素解析部130が、メモリ410のテキスト記憶部111に格納されたテキスト情報401からテキストを抽出し、抽出したテキストに対する形態素解析処理を行い、当該テキストを構成する各単語と、それらの属性値とを対応付けた単語情報列を生成し、当該単語情報列102を出力する(ステップS102)。そして、形態素解析部130から出力された単語情報列102は、メモリ410の単語情報列記憶部112に格納される。なお、テキスト情報(テキスト及び付加情報を含む)101から、テキストを抽出するには、例えば、XMLパーザを用いる。この場合、形態素解析部130は、XMLパーザに従った処理により、テキスト情報401からテキストと付加情報とを分離する。また、抽出された付加情報はテキスト記憶部111に格納しておく。
次に、付加情報追加部435が、メモリ410の単語情報列記憶部112から単語情報列102を読み込み、テキスト記憶部111から付加情報を読み込む。そして、付加情報追加部435は、当該付加情報を、それらに対応する単語情報列102の列に対応付けた付加単語情報列402を生成して出力する。そして、出力された付加単語情報列402は、メモリ410の付加単語情報列記憶部412に格納される(ステップS103)。
図21(b)は、この付加単語情報列402を例示した図である。この図に例示するように、この例の付加単語情報列402は、「単語No.」102a、「単語」102b、「品詞」102ca、「読み」102cb及び「付加情報」402ccの各要素を対応付けたデータ列である。なお、品詞」102ca、「読み」102cb及び「付加情報」402ccは、「属性値」402cを構成する。
次に、セグメント情報生成部440が、メモリ410の付加単語情報列記憶部412から付加単語情報列402を読み込み、セグメントと、単語に対応付けられた属性値から抽出した特徴値とを、それぞれ対応付けたセグメント情報列403を生成し、当該セグメント情報列を出力する(ステップS104)。そして、セグメント情報生成部440から出力されたセグメント情報列403は、メモリ410のセグメント情報列記憶部113に格納される。
図22は、このように生成されたセグメント情報列403を例示した図である。
図22の例のセグメント情報列403は、各セグメントに対応する「セグメントNo.」103a、「セグメント」103b、「主品詞」103da、「活用形」103db、「体言・記号細分類」103dc、「末尾−1モーラの読み」103dd、「末尾モーラの読み」103de及び「付加情報」403aが対応付けられたデータ列である。なお、「主品詞」103da、「活用形」103db、「体言・記号細分類」103dc、「末尾−1モーラの読み」103dd、「末尾モーラの読み」103de及び「付加情報」403aは、「特徴値」403dを構成する。また、「付加情報」403aは、付加単語情報列402から抽出したものである。また、「セグメントNo.」103a、「セグメント」103b、「主品詞」103da、「活用形」103db、「体言・記号細分類」103dc、「末尾−1モーラの読み」103dd及び「末尾モーラの読み」103deは、第1の実施の形態と同様な手順によって付加単語情報列402から抽出される。
次に、分類処理部150が、メモリ410のセグメント情報列記憶部113からセグメント情報列403を読み込み、分類規則記憶部114から分類規則情報104を読み込む。そして、分類処理部150は、セグメント情報列403の特徴値403dと分類規則情報104とを用い、第1の実施の形態と同様な手順によって各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報405aをセグメント情報列103に付加した分類結果付加セグメント情報列405を出力する(図23/ステップS105)。そして、このように出力された分類結果付加セグメント情報列405は、メモリ410の分類結果記憶部115に格納される。
次に、変換処理部160が、メモリ410の分類結果記憶部115から分類結果付加セグメント情報列405を読み出し、変換規則記憶部116から変換規則情報106を読み出す。そして、第1の実施の形態と同様に、変換処理部160は、分類結果付加セグメント情報列405の分類結果情報と変換規則情報106とを用い、単語情報列102の読みを変換して変換後単語情報列108を生成し、これを出力する(ステップS106)。
〔第7の実施の形態〕
本形態は、第1,4の実施の形態の変形例である。例外的な読み変換を行う単語を同定できる情報(例えば、表記、品詞、読み等の単語情報、或いは、単語ID等ユニークに特定の単語と同定できる情報等)と、対応する例外的な読み替え位置を示す情報(例えば、読みそのもの、読み替えを行うモーラを示す情報等)とを対応つけた例外読み辞書を用い、変換規則の例外となる例外的な読み変換をも可能にする。例えば、末尾モーラが長音追加可能であるにもかかわらず末尾モーラ以外に長音を追加する(例:表記「はい」の読み「ハイ」→「ハーイ」)例外的な読み変換を可能にする。
以下では、第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
<構成>
図24は、本形態の読み付与装置500の機能構成を例示したブロック図である。なお、本形態の読み付与装置500も公知のコンピュータに読み付与プログラムが読み込まれることによって構成されるものである。なお、図24において、第1の実施の形態と共通する部分については図2と同じ符号を付し、説明を省略する。
図24に例示するように、本形態の読み付与装置500は、メモリ110、入力部120、形態素解析部130、セグメント情報生成部140、分類処理部150、変換処理部160、制御部180、一時メモリ190、例外読み辞書メモリ510及び検索部520を有し、入力されたテキスト情報(テキスト含む)に対し、変換後単語情報列108を出力する。
また、例外読み辞書メモリ510には、例外読み辞書511が格納されている。図25は、この例外読み辞書511の構成を例示した図である。
例外読み辞書511は、変換規則情報106によって特定される読み替え位置の例外となる単語を特定するための情報と、当該単語の読み替え処理内容毎の読み替え位置を示す読み替え位置情報とを対応付けたテーブルである。図25の例の例外読み辞書511は、変換規則情報106によって特定される読み替え位置の例外となる「単語(表記)」511aの要素と、当該単語の「長音追加」を行う際の読み替え位置を示す「長音追加に対する読み」511baの要素と、当該単語の「促音追加」を行う際の読み替え位置を示す「促音追加に対する読み」511bbの要素とを対応付けたテーブルである。例えば、例外読み辞書511には、単語「はい」に対し、「長音追加」を行う際の読み「ハーイ」と、「促音追加」を行う際の読み「なし」(登録データなしを示す)とが対応付けられている。
<処理>
第7の実施の形態の前処理は、上述の例外読み辞書511を例外読み辞書メモリ510に格納する処理が加わる以外、第1の実施の形態と同様である。ただし、本形態の変換規則情報106は、そして、分類結果情報が「変化なし」以外の単語に対しては、まず例外読み辞書511を検索し、当該単語及び分類結果に対応する読みが登録されている場合には、その読みに変換し、対応する読みが登録されていない場合には、第1の実施の形態と同様な通常の変換処理を実行させるための情報(プログラムや、処理を特定するためのパラメータ・数式等)を含む。
また、第7の実施の形態における処理全体の流れは第1の実施の形態と同様である(図3)。本形態と第1の実施の形態との相違点は、ステップS4,5の処理の詳細である。以下、本形態におけるステップS4,5の処理の相違点を中心に説明する。
[本形態のステップS4の詳細]
第7の実施の形態と第1の実施の形態との相違点は、分類処理部150が分類規則情報104を用いて、「長音追加」「促音追加」「変化なし」の3種類の読み替え処理内容を示す処理内容情報を生成する点のみである。ただし、これに限定はされない。
[本形態のステップS5の詳細]
図26から図28は、本形態のステップS5の具体例を説明するためのフローチャートである。以下、この図に従って本形態のステップS5の具体例を説明する。
まず、制御部180が、変数iに1を代入し、この変数iを一時メモリ190に格納する(ステップS111)。次に、変換処理部160が、メモリ110の変換規則記憶部116から変換規則情報106を読み込み、変換規則情報106の記述に従った処理を実行する。まず、変換処理部160は、一時メモリ190から変数iを読み込み、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105を参照し、セグメントNo.iに対応する分類結果情報が「変化なし」を示すか「変化なし」以外を示すかを検証する。ここで、分類結果情報が「変化なし」を示す場合、後述するステップS116に進む。一方、分類結果情報が「変化なし」以外の場合、検索部520は、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列と、例外読み辞書メモリ510に格納された例外読み辞書511とを参照し、セグメントNo.がiである処理対象のセグメントが、例外読み辞書511の「単語」511aと一致する単語を含むか否かを検証する(ステップS112)。
ここで、セグメントNo.iのセグメントが、例外読み辞書511の「単語」511aと一致する単語を含まないと判断された場合には、後述するステップS121に進む。一方、セグメントNo.iのセグメントが、例外読み辞書511の「単語」511aと一致する単語を含むと判断された場合、検索部520は、一致した例外読み辞書511の「単語」511aの要素に対応付けられた「読み替え位置情報」511bが、セグメントNo.iの分類結果情報が示す当該セグメントの読み替え処理内容に対応するか否かを検証する(ステップS113)。
例えば、一致した例外読み辞書511の「単語」511aの要素が「はい」であるとする。図25の例の場合、この要素「はい」に対応付けられた「読み替え位置情報」511bは、「長音追加に対する読み」511baの要素「ハーイ」と、「促音追加に対する読み」511bbの要素「なし」である。ここで、セグメントNo.iの分類結果情報が示す当該セグメントの読み替え処理内容が「長音追加」であった場合、これは「長音追加に対する読み」511baの要素「ハーイ」に対応する。よって、検索部520は、「一致した例外読み辞書511の「単語」511aの要素に対応付けられた「読み替え位置情報」511bが、セグメントNo.iの分類結果情報が示す当該セグメントの読み替え処理内容に対応する」と判断する。一方、セグメントNo.iの分類結果情報が示す当該セグメントの読み替え処理内容が「促音追加」であった場合、「促音追加に対する読み」511bbの要素は存在しないのであるから(「なし」)、検索部520は、「一致した例外読み辞書511の「単語」511aの要素に対応付けられた「読み替え位置情報」511bが、セグメントNo.iの分類結果情報が示す当該セグメントの読み替え処理内容に対応しない」と判断する。
ステップS113の判断において、「一致した例外読み辞書511の「単語」511aの要素に対応付けられた「読み替え位置情報」511bが、セグメントNo.iの分類結果情報が示す当該セグメントの読み替え処理内容に対応しない」と判断された場合、後述するステップS121に進む。一方、「対応する」と判断された場合、検索部520は、ステップS111,S112の条件を満たす「読み替え位置情報」511bの要素(例えば、上述の「ハーイ」)を例外読み辞書511から抽出する(ステップS114)。そして、検索部520は、抽出した「読み替え位置情報」511bの要素を、これに対応する「単語」511aの要素に関連付けて一時メモリ190に格納する。
次に、変換処理部160は、一時メモリ190から、上述の「読み替え位置情報」511bの要素及びこれに対応する「単語」511aの要素を読み込み、メモリ110の単語情報列記憶部112から単語情報列102を読み込む。そして、変換処理部160は、読み込んだ「単語」511aの要素に一致する単語情報列102の単語の「読み」のフィールドを、読み込んだ「読み替え位置情報」511bの要素(例えば、上述の「ハーイ」)によって書き換える(ステップS115)。なお、このように「読み」のフィールドが更新された単語情報列102は、メモリ110の単語情報列記憶部112に格納される。その後、後述するステップS116の処理に移る。
[ステップS121以降の処理]
ステップS121以降は、通常の変換規則に従った処理となる。
すなわち、まず、変換処理部160は、メモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105を参照し、セグメントNo.iに対応する分類結果情報が「長音追加」「促音追加」のいずれを示すかを判断する(ステップS121)。
ここで、No.iに対応する分類結果情報が「促音追加」であった場合、第4の実施の形態のステップS81からS85と同じ処理(図15)が実行され(ステップS131からS135)、処理が後述するステップS116に移される。一方、セグメントNo.iに対応する分類結果情報105aが「長音追加」であった場合、第4の実施の形態のステップS73からS77と同じ処理(図14)が実行され(ステップS123からS126)、処理が後述するステップS116に移される。
[ステップS116以降の処理]
ステップS116では、制御部180が一時メモリ190から変数iを読み込み、これがメモリ110の分類結果記憶部115に格納された分類結果付加セグメント情報列105の「セグメントNo.」103aの要素の最大値であるか否かを判断する(ステップS116)。ここで、変数iが「セグメントNo.」103aの要素の最大値でなかった場合、制御部180は、一時メモリ190の変数iに1を加算した値を新たな変数iの値とし、これを一時メモリ190に格納し(ステップS117)、処理をステップS112に戻す。一方、変数iが「セグメントNo.」103aの要素の最大値であった場合、制御部180は変換処理部160に指示を与え、変換処理部160は、メモリ110の単語情報列記憶部112から読み変換が行なわれた単語情報列102(変換後単語情報列108)を読み込み、これを出力する(ステップS118)。
以上の処理により、単語「はい」は次のように読み替えられる(図25の例外読み辞書511を用いた場合)。まず、分類結果情報が「長音追加」である場合には、ステップS115により、その読みが「ハーイ」と読み替えられる。一方、分類結果情報が「促音追加」である場合には、ステップS135により、その読みが「ハイッ」と読み替えられる。
〔変形例等〕
なお、本発明は上述の実施の形態に限定されるものではない。
例えば、第1の実施の形態では、セグメント情報生成部140が、単語情報列102の「読み」102cbの各要素から末尾−1番目のモーラの読みと、末尾モーラの読みとを抽出し、それらの読みが「長音」であるか、「その他」の読みであるか、或いは読み「なし」であるかを判断し、それらの判断結果をセグメント情報列103の「末尾−1モーラの読み」103dd及び「末尾モーラの読み」103deの各要素とすることとした。しかし、これ以外のモーラの読みを用いて単語情報列102を構成してもよく、また、その要素も「長音」「その他」「なし」に限定されず、例えば、「長音」「促音」「その他」「なし」等としてもよい。
また、上記の各実施の形態では、分類結果情報をセグメント情報列に対応付けた分類結果付加セグメント情報列を生成することとしたが、分類結果情報とセグメント情報列との対応関係を別の方法により把握できるのであれば、分類結果付加セグメント情報列を生成する必要はない。
また、上述の各実施の形態では、変換された「読み」によって単語情報列102の「読み」フィールドを更新することとしたが、変換された「読み」を格納する別フィールドを単語情報列102に設ける構成としてもよい。
また、上述の各実施の形態では、セグメントを単語単位にする例と、モーラ単位にする例について説明したが、単語情報列を細分化或いは結合した他の単位をセグメントとしてもよい。
また、上述の第1の実施の形態の処理等においてセグメント中のモーラを探索する場合、その順序は上述したものに限定されない。
また、第3の実施の形態では、セグメントをモーラ単位とし、読みに長音を追加する処理について説明したが、それ以外の読み変換内容(例えば、促音追加、削除、置換)に応用してもよい。この場合、例えば、分類結果情報が「促音追加」である場合には、変換するモーラの読みの末尾に促音を追加することになり、「削除」の場合には、変換するモーラの読みを削除することになる。
また、第7の実施の形態では、読み変換の例外がおこる単語を例外読み辞書511に登録することとしたが、これらの情報を形態素解析で用いる単語辞書に組み込んでもよい(例えば、例外読みというフィールドを単語辞書に設ける等)。
さらに、上述の各実施の形態を適宜結合して実施してもよく、また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力或いは必要に応じて並列的に或いは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明の産業上の利用分野としては、例えば、文字入力されたテキストから合成音声を生成して出力するためのソフトウェアの分野等を例示できる。
図1は、第1の実施の形態における読み付与装置のハードウェア構成を例示したブロック図である。 図2は、読み付与装置の機能構成を例示したブロック図である。 図3は、第1の実施の形態の読み付与方法を説明するためのフローチャートである。 図4は、図3のステップS4の詳細を説明するためのフローチャートである。 図5は、図3のステップS5の詳細を説明するためのフローチャートである。 図6(a)は、XML(Extensible Markup Language)で記述したテキスト情報の例である。図6(b)は、形態素解析部が生成した単語情報列を例示した図である。 図7は、第1の実施の形態のセグメント情報列を例示した図である。 図8は、分類結果付加セグメント情報列の構成を例示した図である。 図9は、図6の単語情報列及び図8の分類結果付加セグメント情報列を用い、図5の処理を実行した場合に得られる変換後単語情報列を示した図である。 図10は、第2の実施の形態におけるステップS5の処理の詳細を説明するためのフローチャートである。 図11は、第3の実施の形態におけるステップS5の具体的な処理を説明するためのフローチャートである。 図12は、第3の実施の形態のセグメント情報列の構成を例示した図である。 図13は、第3の実施の形態の分類結果付加セグメント情報列の例示である。 図14は、第4の実施の形態のステップS5の具体例を説明するためのフローチャートである。 図15は、第4の実施の形態のステップS5の具体例を説明するためのフローチャートである。 図16は、第5の実施の形態の読み付与装置の機能構成を例示したブロック図である。 図17は、第5の実施の形態におけるステップS5の具体的な処理を説明するためのフローチャートである。 図18は、第5の実施の形態における削除・置換辞書の例示である。 図19は、第6実施の形態における読み付与装置の機能構成を例示したブロック図である。 図20は、第6の実施の形態の読み付与方法を説明するためのフローチャートである。 図21(a)は、XMLで記述した第6の実施の形態におけるテキスト情報の例である。 図22は、第6の実施の形態におけるセグメント情報列を例示した図である。 図23は、第6の実施の形態における分類結果付加セグメント情報列を例示した図である。 図24は、第7の実施の形態における読み付与装置の機能構成を例示したブロック図である。 図25は、第7の実施の形態における例外読み辞書の構成を例示した図である。 図26は、第7の実施の形態におけるステップS5の具体例を説明するためのフローチャートである。 図27は、第7の実施の形態におけるステップS5の具体例を説明するためのフローチャートである。 図28は、第7の実施の形態におけるステップS5の具体例を説明するためのフローチャートである。
符号の説明
100,300,500 読み付与装置

Claims (11)

  1. テキストに読みを付与する読み付与装置であって、
    上記テキストを格納するテキスト記憶部と、
    上記テキストに対する形態素解析処理を行い、当該テキストを構成する各単語と、それらの属性値とを対応付けた単語情報列を生成し、当該単語情報列を出力する形態素解析部と、
    上記単語情報列の上記単語又はそれを細分化した単位であるセグメントと、当該単語に対応付けられた上記属性値から抽出した特徴値とを、それぞれ対応付けたセグメント情報列を生成し、当該セグメント情報列を出力するセグメント情報生成部と、
    特徴値を用いて上記セグメントを読み替え処理内容毎に分類する、特徴値を変数とした識別関数を格納する分類規則記憶部と、
    上記セグメント情報列の上記特徴値を上記識別関数に代入し、その演算結果によって各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報を出力する分類処理部と、
    セグメント内の読み替え位置を特定するための変換規則情報を格納する変換規則記憶部と、
    上記変換規則情報によって特定される読み替え位置の例外となる単語を特定するための情報と、当該単語の読み替え処理内容毎の読み替え位置を示す読み替え位置情報とを対応付けたテーブルである例外読み辞書を格納する例外読み辞書記憶部と、
    処理対象のセグメントが上記例外読み辞書の単語と一致、なおかつ、一致した当該例外読み辞書の単語に対応付けられた上記読み替え位置情報が、当該処理対象のセグメントの上記分類結果情報が示す当該セグメントの読み替え処理内容に対応するものであるか否かを判断し、その判断結果を出力する検索部と、
    処理対象のセグメントが上記例外読み辞書の単語と一致、なおかつ、一致した当該例外読み辞書の単語に対応付けられた上記読み替え位置情報が、当該処理対象のセグメントの上記分類結果情報が示す当該セグメントの読み替え処理内容に対応すると判断された場合、これらの条件を満たす読み替え位置情報を用い、当該セグメントの読み替え処理を行い、それ以外の場合には、上記分類結果情報と上記変換規則情報とを用い、当該セグメントの読み替え処理を行う変換処理部と、
    を有する読み付与装置。
  2. 請求項1に記載の読み付与装置であって、
    上記セグメント情報生成部が上記セグメント情報列を生成する際に上記属性値から抽出する特徴値は、当該セグメントの末尾モーラの読みが長音であるか否かを示す特徴値を含む、
    ことを特徴とする読み付与装置。
  3. 請求項1に記載の読み付与装置であって、
    上記変換規則情報は、
    上記分類結果情報が示す読み替え処理内容がセグメント中に長音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、長音又は促音以外であると判断されたモーラの直後に長音を追加する処理を特定するための情報を含み、
    上記変換処理部は、
    上記分類処理部から出力された上記分類結果情報が示す読み替え処理内容がセグメント中に長音を追加する処理であるか否かを判断し、上記変換規則情報が特定する処理を実行する、
    ことを特徴とする読み付与装置。
  4. 請求項1または3に記載の読み付与装置であって、
    上記変換規則情報は、
    分類結果情報が示す読み替え処理内容がセグメント中に促音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、促音以外であると判断されたモーラの直後に促音を追加する処理を特定するための情報を含み、
    上記変換処理部は、
    上記分類処理部から出力された上記分類結果情報が示す読み替え処理内容がセグメント中に促音を追加する処理であるか否かを判断し、上記変換規則情報が特定する処理を実行する、
    ことを特徴とする読み付与装置。
  5. 請求項3或いは4に記載の読み付与装置であって、
    上記変換規則情報に示された、セグメント中のモーラを検索する所定の順序は、セグメントの末尾モーラから先頭モーラに向かう順序である、
    ことを特徴とする読み付与装置。
  6. テキストに読みを付与する読み付与方法であって、
    形態素解析部が、入力された上記テキストに対する形態素解析処理を行い、当該テキストを構成する各単語と、それらの属性値とを対応付けた単語情報列を生成し、当該単語情報列を出力する形態素解析ステップと、
    セグメント情報生成部が、入力された上記単語情報列の上記単語又はそれを細分化した単位であるセグメントと、当該単語に対応付けられた上記属性値から抽出した特徴値とを、それぞれ対応付けたセグメント情報列を生成し、当該セグメント情報列を出力するセグメント情報生成ステップと、
    分類処理部が、入力された上記セグメント情報列の上記特徴値を、特徴値を用いて上記セグメントを読み替え処理内容毎に分類する、特徴値を変数とした識別関数に代入し、その演算結果によって各セグメントの読み替え処理内容を決定し、当該読み替え処理内容を示す分類結果情報を出力する分類処理ステップと、
    検索部が、セグメント内の読み替え位置を特定するための変換規則情報によって特定される読み替え位置の例外となる単語を特定するための情報と当該単語の読み替え処理内容毎の読み替え位置を示す読み替え位置情報とを対応付けたテーブルである例外読み辞書を用い、処理対象のセグメントが上記例外読み辞書の単語と一致、なおかつ、一致した当該例外読み辞書の単語に対応付けられた上記読み替え位置情報が、当該処理対象のセグメントの上記分類結果情報が示す当該セグメントの読み替え処理内容に対応するものであるか否かを判断し、その判断結果を出力する検索ステップと、
    変換処理部が、処理対象のセグメントが上記例外読み辞書の単語と一致、なおかつ、一致した当該例外読み辞書の単語に対応付けられた上記読み替え位置情報が、当該処理対象のセグメントの上記分類結果情報が示す当該セグメントの読み替え処理内容に対応すると判断された場合、これらの条件を満たす読み替え位置情報を用い、当該セグメントの読み替え処理を行い、それ以外の場合には、入力された上記分類結果情報と上記変換規則情報とを用い、当該セグメントの読み替え処理を行う変換処理ステップと、
    を有することを特徴とする読み付与方法。
  7. 請求項6に記載の読み付与方法であって、
    上記セグメント情報生成ステップで上記セグメント情報列を生成する際に上記属性値から抽出される特徴値は、当該セグメントの末尾モーラの読みが長音であるか否かを示す特徴値を含む、
    ことを特徴とする読み付与方法。
  8. 請求項6に記載の読み付与方法であって、
    上記変換規則情報は、
    上記分類結果情報が示す読み替え処理内容がセグメント中に長音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、長音又は促音以外であると判断されたモーラの直後に長音を追加する処理を特定するための情報を含み、
    上記変換処理ステップは、
    上記分類処理ステップで出力された上記分類結果情報が示す読み替え処理内容がセグメント中に長音を追加する処理であるか否かを判断し、上記変換規則情報が特定する処理を実行する、
    ことを特徴とする読み付与方法。
  9. 請求項8に記載の読み付与方法であって、
    上記変換規則情報は、
    分類結果情報が示す読み替え処理内容がセグメント中に促音を追加する処理であった場合に、セグメント中のモーラを所定の順序で検索し、促音以外であると判断されたモーラの直後に促音を追加する処理を特定するための情報を含み、
    上記変換処理ステップは、
    上記分類処理ステップで出力された上記分類結果情報が示す読み替え処理内容がセグメント中に促音を追加する処理であるか否かを判断し、上記変換規則情報が特定する処理を実行する、
    ことを特徴とする読み付与方法。
  10. 請求項8或いは9に記載の読み付与方法であって、
    上記変換規則情報に示された、セグメント中のモーラを検索する所定の順序は、セグメントの末尾モーラから先頭モーラに向かう順序である、
    ことを特徴とする読み付与方法。
  11. 請求項1から5の何れかに記載の読み付与装置としてコンピュータを機能させるためのプログラム。
JP2005353991A 2005-12-07 2005-12-07 読み付与装置、読み付与方法及びプログラム Expired - Fee Related JP4773813B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005353991A JP4773813B2 (ja) 2005-12-07 2005-12-07 読み付与装置、読み付与方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005353991A JP4773813B2 (ja) 2005-12-07 2005-12-07 読み付与装置、読み付与方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007156273A JP2007156273A (ja) 2007-06-21
JP4773813B2 true JP4773813B2 (ja) 2011-09-14

Family

ID=38240700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005353991A Expired - Fee Related JP4773813B2 (ja) 2005-12-07 2005-12-07 読み付与装置、読み付与方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4773813B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001343987A (ja) * 2000-05-31 2001-12-14 Sanyo Electric Co Ltd 音声合成方法、および音声合成装置
JP2002311981A (ja) * 2001-04-17 2002-10-25 Sony Corp 自然言語処理装置および自然言語処理方法、並びにプログラムおよび記録媒体
JP4001872B2 (ja) * 2004-02-23 2007-10-31 日本電信電話株式会社 ローマ字カナ変換装置、その方法及びそのプログラム

Also Published As

Publication number Publication date
JP2007156273A (ja) 2007-06-21

Similar Documents

Publication Publication Date Title
JP6493866B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5599662B2 (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
JP5146979B2 (ja) 自然言語における多義解消装置及びコンピュータプログラム
JP2003076392A (ja) 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム
JP4570509B2 (ja) 読み生成装置、読み生成方法及びコンピュータプログラム
WO2020170912A1 (ja) 生成装置、学習装置、生成方法及びプログラム
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
JP4738847B2 (ja) データ検索装置および方法
JP7103264B2 (ja) 生成装置、学習装置、生成方法及びプログラム
JP4587165B2 (ja) 情報処理装置及びその制御方法
JP7283718B2 (ja) 音響信号検索装置、音響信号検索方法、データ検索装置、データ検索方法、プログラム
JP5342760B2 (ja) 訳語学習のためのデータを作成する装置、方法、およびプログラム
JP6772394B1 (ja) 情報学習装置、情報処理装置、情報学習方法、情報処理方法及びプログラム
JP4839291B2 (ja) 音声認識装置およびコンピュータプログラム
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
KR20000039018A (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JP4773813B2 (ja) 読み付与装置、読み付与方法及びプログラム
JP4671440B2 (ja) 評判関係抽出装置、その方法およびプログラム
JP2022190845A (ja) エンティティとインテントとコーパスの自動生成装置及びプログラム
JP6309852B2 (ja) 強調位置予測装置、強調位置予測方法及びプログラム
JP3758241B2 (ja) 音声情報検索装置
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
WO2022074760A1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
WO2022107328A1 (ja) 機械学習プログラム、機械学習方法および自然言語処理装置
JP6772393B1 (ja) 情報処理装置、情報学習装置、情報処理方法、情報学習方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110624

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4773813

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees