JP2005031259A - 自然言語処理方法 - Google Patents
自然言語処理方法 Download PDFInfo
- Publication number
- JP2005031259A JP2005031259A JP2003194543A JP2003194543A JP2005031259A JP 2005031259 A JP2005031259 A JP 2005031259A JP 2003194543 A JP2003194543 A JP 2003194543A JP 2003194543 A JP2003194543 A JP 2003194543A JP 2005031259 A JP2005031259 A JP 2005031259A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- pose
- words
- pause
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
【課題】例えば読点の数に関係なくポーズの規則を学習すること。
【解決手段】単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力し(S201)、上記文章に対して形態素解析処理を行い(S203)、上記文章を単語毎に分割すると共に、各単語の品詞を決定し、単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、この品詞の並びの出現頻度を求め(S206)、品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に上記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求め(S208)、上記各グループ毎に、上記出現銀度、上記回数を用いて、ポーズの入りやすさを示す値を求める(S210)。
【選択図】 図2
【解決手段】単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力し(S201)、上記文章に対して形態素解析処理を行い(S203)、上記文章を単語毎に分割すると共に、各単語の品詞を決定し、単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、この品詞の並びの出現頻度を求め(S206)、品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に上記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求め(S208)、上記各グループ毎に、上記出現銀度、上記回数を用いて、ポーズの入りやすさを示す値を求める(S210)。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
本発明は、文中にポーズの位置を設定するための技術に関するものである。
【0002】
【従来の技術】
テキストを音声に変換するテキスト音声合成システムにおいて、適切にポーズの位置を決定することは、自然で理解しやすい合成音声を生成するために重要な課題である。
【0003】
従来、ポーズの位置を決定する方法として、統計的な手法を用いてポーズの規則を学習する技術などがあった(例えば特許文献1を参照)。
【0004】
【特許文献1】
特開2001−75584号公報
【0005】
【発明が解決しようとする課題】
しかしながら、従来の統計的な手法では学習結果に読点の位置が大きく反映されてしまう。つまり、例えば「もしこの単語の前に読点があればポーズを入れる」という規則が大きな優先度で生成される。そのため読点が非常に少ない文に対して適切にポーズを設定することができないという問題がある。
【0006】
本発明は以上の問題を鑑みて成されたものであり、例えば読点の数に関係なくポーズの規則を学習する技術を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明の目的を達成するために、例えば本発明の自然言語処理方法は以下の構成を備える。
【0008】
すなわち、単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力する入力工程と、
前記文章に対して形態素解析処理を行い、前記文章を単語毎に分割すると共に、各単語の品詞を決定する形態素解析工程と、
単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、当該品詞の並びの出現頻度を求める出現頻度計算工程と、
品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に前記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求める回数計算工程と、
前記各グループ毎に、前記出現銀度、前記回数を用いて、ポーズの入りやすさを示す値を求める計算工程と
を備えることを特徴とする。
【0009】
本発明の目的を達成するために、例えば本発明の自然言語処理装置は以下の構成を備える。
【0010】
すなわち、単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力する入力手段と、
前記文章に対して形態素解析処理を行い、前記文章を単語毎に分割すると共に、各単語の品詞を決定する形態素解析手段と、
単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、当該品詞の並びの出現頻度を求める出現頻度計算手段と、
品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に前記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求める回数計算手段と、
前記各グループ毎に、前記出現銀度、前記回数を用いて、ポーズの入りやすさを示す値を求める計算手段と
を備えることを特徴とする。
【0011】
【発明の実施の形態】
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
【0012】
[第1の実施形態]
図1は本実施形態に係る自然言語処理装置の基本構成を示すブロック図である。尚本実施形態ではこの自然言語処理装置は一般のパーソナルコンピュータ(PC)やワークステーションとして説明するが、後述する自然言語処理を行う専用のハードウェアであっても良い。
【0013】
101はCPUで、RAM102やROM103に格納されたプログラムやデータを用いて本装置全体の制御を行うと共に、後述する自然言語処理を行う。
【0014】
102はRAMで、外部記憶装置106や記憶媒体ドライブ装置107からロードされたプログラムやデータを一時的に記憶するためのエリアを備えると共に、CPU101が各種の処理を行うために使用するワークエリアも備える。
【0015】
103はROMで、本装置の起動や制御を行うためのプログラムやデータ、表示部105に文字を表示するために必要な文字コードのデータなどを記憶する。
【0016】
104は操作部で、キーボードやマウスなどの、各種の入力を行うための装置により構成されており、各種の指示をCPU101に対して行うことができる。また、入力した文字などのデータはRAM102に一時的に記憶されることになる。
【0017】
105は表示部で、CRTや液晶画面などにより構成されており、各種の表示を行うことができ、後述する文章なども表示することができる。
【0018】
106は外部記憶装置で、ハードディスクドライブ装置などの大容量情報記憶装置に代表されるものであり、ここにOS(オペレーティングシステム)や後述する自然言語処理に係るプログラムやデータを保存することができる。
【0019】
107は記憶媒体ドライブ装置で、CD−ROMやDVD−ROMなどの記憶媒体に格納されたプログラムやデータを読み出し、外部記憶装置106に出力する。108は上述の各部をつなぐバスである。なお、本実施形態に係る自然言語処理装置の構成はこれに限定されるものではなく、他にも例えば紙に印字された文章を電子データとして読みとるためのスキャナをバス108に不図示のインターフェースを介して接続しても良いし、処理した自然言語を音声として外部に出力するための音声処理部、スピーカをバス108にインターフェースを介して接続しても良い。
【0020】
またバス108にネットワークインターフェースを接続し、このネットワークインターフェースを介してインターネットやLANなどのネットワークから上記各種のプログラムやデータを送受信するようにしても良い。
【0021】
以上の構成を備える自然言語処理装置によって行われる自然言語処理について以下説明する。まず、単語の集合による文章において、各単語の品詞列に対するポーズの入りやすさを求める(学習する)処理について説明する。
【0022】
図2は、同処理のフローチャートである。なお、同図に示したフローチャートに従ったプログラムは、外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102にロードされ、CPU101がこれを実行することで、本実施形態に係る自然言語処理装置は、後述する処理を行うことができる。
【0023】
まず操作部104からの指示に従ってCPU101は外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102に、ポーズの設定(挿入)位置に関する情報が付与されたテキストコーパスのデータをロードする(ステップS201)。
【0024】
図4はテキストコーパスの一例を示す図である。三角の記号が指す位置にポーズが存在する。即ちこのテキストコーパスは、単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置を示すものである。このテキストコーパスは、実際に話者が発話した情報を元に作成するので、このテキストコーパスを用ることで話者特有のポーズの入れ方を学習することが可能となる。
【0025】
次にRAM102にロードされたテキストコーパスデータを参照し、未処理の一文のデータを以降の処理対象として、ロードされたエリアとは異なるエリアに取り出す(ステップS202)。取り出せなかった場合、即ちすべての文に対する処理を終了した場合は処理をステップS210に進める。
【0026】
次に、ステップS202で取り出した一文に対して形態素解析を行ない、この一文を単語毎に分割すると共に、各単語の品詞を決定する(ステップS203)。例えば図4のテキストコーパスの例で一文“I have a pen and a pencil.”に対して形態素解析処理を行った結果を図5の「単語」と「品詞」の項目に示す。尚、このような形態素解析処理については周知の技術であるので、ここでの説明は省略する。また形態素解析処理を行った結果はRAM102に一時的に記憶されているものとする。
【0027】
次に、以下で用いる変数iの値を1に初期化する(ステップS204)。そしてこの変数iの値と形態素解析で分割された単語の数とを比較する(ステップS205)。図5の例では単語数は8である。変数iの値が単語数より小さい場合は処理をステップS206へ進め、それ以外の場合は処理をステップS202に進め、次に一文に対してステップS202以降の処理を繰り返す。処理をステップS202へ進めるということは一文に対する処理が終わったことを意味する。
【0028】
次に、i番目の単語境界について、単語境界の前後合わせてN個の単語の夫々の品詞から成る品詞列を得、その品詞列の出現数(出現頻度)を示す値を1つ増やす(ステップS206)。ここでi番目の単語境界とは、i番目の単語と(i+1)番目の単語の間(境界)を意味する。ここでN=2(単語境界の前後各1単語)とした場合について説明する。例えば図5で3番目の単語境界についての処理は、3番目と4番目の単語(a、pen)の夫々の品詞から成る品詞列(冠詞、名詞)の出現数を示すPosSequence(冠詞、名詞)の値を1つ増やす。
【0029】
次に、i番目の単語境界にポーズが存在するか否かを判定する(ステップS207)。即ち、上記品詞列(i番目の単語境界の前後合わせてN個の単語の夫々の品詞から成る品詞列)において、テキストコーパスが示すポーズ設定位置を品詞間に有するか否かを判定する。例えば図5の単語境界におけるポーズの有無は、図4のポーズ位置と比較し「ポーズ有無」の項目の通りになる。
【0030】
ポーズが存在する(テキストコーパスが示すポーズ設定位置を品詞間に有する)場合は、i番目の単語境界の前後合わせてN個の単語の夫々の品詞から成る品詞列に対するポーズ数を示す値を1つ増やす(ステップS208)。図5の例では変数iの値が4の場合、このステップS208が実行され、PauseCount(名詞,接続詞)の値を1つ増やす。
【0031】
そしてステップS208における処理が終了した場合、もしくはi番目の単語境界にポーズが存在しない場合には次の処理として、変数iの値を1つ増やす。つまり次の単語境界に対する上記処理(上記変数iを(i+1)と読み替えた処理)を行う。
【0032】
このようにして、ステップS206からステップS208までの処理を分割した一文中の各単語境界について行うことで、品詞の並びが同じ品詞列のグループ毎に、品詞の並びの出現頻度を求めることができると共に、品詞の並びが同じ品詞列のグループ毎に、ポーズの設定位置を品詞間に有する回数を求めることができる。図6は図5に示した一文に対して上記処理を行うことで得られる各グループの出現数とポーズ数とを示す図である。このような求めた結果はRAM102に一時的に記憶されているものとする。
【0033】
そしてすべての文に対する処理が終了すると、処理はステップS210に移行する。そして、各品詞列(PosA,PosB)について、ポーズの入り易さPause(PosA,PosB)を以下の式に従って求める。
【0034】
Pause(PosA,PosB)=PauseCount(PosA,PosB)/PosSequence(PosA,PosB)
求めたPause(PosA,PosB)のデータは、RAM102に一時的に記憶させても良いし、外部記憶装置106の保存させてもよい。
【0035】
なお、Pause(PosA,PosB)の値は0〜1の実数となるが、例えばPause(PosA,PosB)に127を掛け、0〜127の整数値に量子化した値によって表現しても良いし、その表現方法については特に限定しない。
【0036】
また、ステップS201で入力としたポーズの挿入位置に関する情報が付与されたテキストコーパスに関して、コーパス中の文をそのまま用いてもよいし、文に含まれる読点を削除したものを用いてもよい。
【0037】
また、適度に読点が含まれている原文から読点を除いた文を集め、原文の読点の位置をポーズの位置とみなすことにより、ポーズの挿入位置に関する情報が付与されたテキストコーパスを作成して用いてもよい。図11にその例を示す。同図上部に示した原文から「system」と「a」の間にある読点を削除し、読点のあった位置をポーズ設定位置(三角で示す)とした文(同図下部に示す文)を作成する。これにより、ポーズの情報が付与された文を大量に集めテキストコーパスを作成することもできる。
【0038】
テキストコーパスに含まれるすべての文を処理し、各品詞列に対する出現数、ポーズ数の総数をカウントした後、上記ステップS210の処理で各品詞列に対するポーズの入り易さが最終的に求まることになる。
【0039】
次に、本実施形態に係る自然言語処理として、上記処理によって求まった品詞列のポーズの入り易さを示すデータを用いて、一般の文章に対してポーズを設定する処理について、同処理のフローチャートを示す図3を用いて説明する。尚同図に示したフローチャートに従ったプログラムは、外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102にロードされ、CPU101がこれを実行することで、本実施形態に係る自然言語処理装置は、後述する処理を行うことができる。
【0040】
まず操作部104からの指示に従ってCPU101は外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102に、文章のデータをロードし、この文章に対して上記形態素解析処理を行い、この文章を単語毎に分割すると共に、各単語の品詞を決定する(ステップS301)。図7の「単語」、「品詞」の項目に、ステップS301における形態素解析処理の結果の一例を示す。
【0041】
次に、変数startIdxの値を1に、変数pauseIdxの値を1に初期化する(ステップS302)。また、変数endIdxの値をstartIdx+Wに初期化する(ステップS303)。ここでWはポーズとポーズの間隔の目安となる値で、あらかじめ特定の値を指定しておく。およそ単語W個に1個の割合でポーズが入ることになる。ここでは例としてW=7とする。
【0042】
次に、変数endIdxの値と、ステップS301で形態素解析処理によって分割された単語の数とを比較する(ステップS304)。即ち、すべての単語について後述する処理が行われたか否かを判断する。変数endIdxの値が単語数より小さい場合、すなわちすべての単語について後述する処理が行われていない場合には処理をステップS305に進め、それ以外の場合は処理を終了する。
【0043】
ステップS305では、変数pauseMaxの値を0に初期化すると共に、変数iの値を変数startIdxの値に初期化する。そして次に、変数iの値と変数endIdxの値を比較する(ステップS306)。すなわち、startIdxで示す単語境界の位置からendIdxで示す単語境界の位置までの全ての単語境界で、後述する処理が行われたか否かを判断する。
【0044】
変数iの値が変数endIdxの値より小さい場合、即ちstartIdxで示す単語境界の位置からendIdxで示す単語境界の位置までの全ての単語境界で、後述する処理が行われていない場合には、処理をステップS307に進め、その他の場合は、処理をステップS311に進める。
【0045】
ステップS307では、変数vにi番目の単語境界におけるポーズの入り易さを示す値を代入する。例えば図7で7番目の単語境界は、品詞列が(前置詞、冠詞)となり変数vにポーズの入り易さを示す値”6”を代入する。各品詞列に対するポーズの入り易さを示す値のテーブルは図2に示した上記処理によって予め作成されているものとする。図8は、各品詞列に対するポーズの入りやすさを示す値のテーブルの構成例を示す図である。図8に示すテーブルのデータは上述の通り図2に示した上記処理によって予め作成され、RAM102に一時的に記憶されている、もしくは外部記憶装置106に保存されているものとする。
【0046】
次に、変数pauseMaxの値と変数vの値を比較する(ステップS308)。変数pauseMaxの値が変数vの値以下の場合は処理をステップS309へ進め、その他の場合は処理をステップS310に進める。
【0047】
ステップS309では、変数pauseIdxに変数iの値を代入する。また変数pauseMaxの値に変数vの値を代入する。そして次に、変数iの値に1を加え(ステップS310)、次の単語境界についてステップS306以降の処理を繰り返す。
【0048】
そしてステップS311で、startIdxで示す単語境界の位置からendIdxで示す単語境界の位置までの全ての単語境界で、ステップS308からステップS310までの処理が行われた場合には処理をステップS311に進め、pauseIdx番目の単語境界にポーズを設定する(ステップS311)。なお、変数pauseIdxが示す値は以上の処理により、最もポーズの入りやすさを示す値が大きい単語境界を示す。
【0049】
例えば図7の例で変数startIdxの値を7、変数endIdxの値を14とすると、7番目から13番目までの各単語境界において最も「ポーズの入りやすさを示す値」が大きい単語境界、この例では10番目の単語境界(”communication”と”a”の間)にポーズを設定することになる。ポーズの設定処理とは、例えば、設定位置(図7の例では10番目の単語境界の位置)がポーズの設定位置であることを示すデータを生成する処理である。
【0050】
そして変数startIdxに、(変数pauseIdxが示す値+1)の値を代入し(ステップS312)、ステップS303以降の処理を繰り返す。すなわち、ポーズを設定した位置をstartIdxとして新たに設定し、次の区間(startIdxとendIdxとの間の区間)に対して上記ポーズ設定処理を繰り返す。
【0051】
以上の説明により、本実施形態に係る自然言語処理装置、及び自然言語処理方法は、文を構成する各単語の品詞の並び(品詞列)に基づいてポーズの設定位置を学習するので、文中の読点の数に関係なく、ポーズの設定位置を学習することができる。
【0052】
また、このような学習結果に基づいて一般の文章にポーズを設定するので、例えば実際に話者が発話した情報を元に作成したテキストコーパスを用いて上記学習を行うと、話者特有のポーズの入れ方に従ってポーズを設定することができる。
【0053】
なお本実施形態では、Pause(PosA,PosB)を求めるためにPauseCount(PosA,PosB)とPosSequence(PosA,PosB)との比を求めたが、求める演算方法についてはこれに限定されるものではない。
【0054】
[第2の実施形態]
品詞列の長さを5とした場合の例を図10に示す。この例は長さ5の品詞列で3番目の品詞と4番目の品詞の間に対するポーズの入り易さを考えている。
【0055】
この場合、i番目の単語境界におけるポーズの入り易さを図10を用いて説明する。例えば、10番目の単語境界(「communication」と「a」の間)の品詞列は、10番目の単語境界の前3単語の品詞「a(冠詞)」「radio(名詞)」「comuunication(名詞)」と境界の後2単語の品詞「a(冠詞)」「method(名詞)」の並びの品詞列(冠詞、名詞、名詞、冠詞、名詞)となる。
【0056】
[その他の実施形態]
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0057】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0058】
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0059】
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0060】
【発明の効果】
以上の説明により、本発明によって、例えば読点の数に関係なくポーズの規則を学習することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る自然言語処理装置の基本構成を示すブロック図である。
【図2】単語の集合による文章において、各単語の品詞列に対するポーズの入りやすさを求める(学習する)処理のフローチャートである。
【図3】品詞列のポーズの入り易さを示すデータを用いて、一般の文章に対してポーズを設定する処理のフローチャートである。
【図4】テキストコーパスの一例を示す図である。
【図5】図4のテキストコーパスの例で一文“I have a pen and a pencil.”に対して形態素解析処理を行った結果、及び、各単語境界におけるポーズの有無を示す図である。
【図6】図5に示した一文に対する各グループの出現数とポーズ数とを示す図である。
【図7】ステップS301における形態素解析処理の結果、及び、各単語境界におけるポーズの入りやすさを示す図である。
【図8】各品詞列に対するポーズの入りやすさを示す値のテーブルの構成例を示す図である。
【図9】品詞列の長さを5とした場合に、品詞列で3番目の品詞と4番目の品詞の間に対するポーズの入り易さを説明するための図である。
【図10】図9に示した一文中で、i番目の単語境界におけるポーズの入り易さを説明するための図である。
【図11】適度に読点が含まれている原文から読点を除いた文を集め、原文の読点の位置をポーズの位置とみなすことにより、ポーズの挿入位置に関する情報が付与されたテキストコーパスを作成する例を説明するための図である。
【発明の属する技術分野】
本発明は、文中にポーズの位置を設定するための技術に関するものである。
【0002】
【従来の技術】
テキストを音声に変換するテキスト音声合成システムにおいて、適切にポーズの位置を決定することは、自然で理解しやすい合成音声を生成するために重要な課題である。
【0003】
従来、ポーズの位置を決定する方法として、統計的な手法を用いてポーズの規則を学習する技術などがあった(例えば特許文献1を参照)。
【0004】
【特許文献1】
特開2001−75584号公報
【0005】
【発明が解決しようとする課題】
しかしながら、従来の統計的な手法では学習結果に読点の位置が大きく反映されてしまう。つまり、例えば「もしこの単語の前に読点があればポーズを入れる」という規則が大きな優先度で生成される。そのため読点が非常に少ない文に対して適切にポーズを設定することができないという問題がある。
【0006】
本発明は以上の問題を鑑みて成されたものであり、例えば読点の数に関係なくポーズの規則を学習する技術を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明の目的を達成するために、例えば本発明の自然言語処理方法は以下の構成を備える。
【0008】
すなわち、単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力する入力工程と、
前記文章に対して形態素解析処理を行い、前記文章を単語毎に分割すると共に、各単語の品詞を決定する形態素解析工程と、
単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、当該品詞の並びの出現頻度を求める出現頻度計算工程と、
品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に前記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求める回数計算工程と、
前記各グループ毎に、前記出現銀度、前記回数を用いて、ポーズの入りやすさを示す値を求める計算工程と
を備えることを特徴とする。
【0009】
本発明の目的を達成するために、例えば本発明の自然言語処理装置は以下の構成を備える。
【0010】
すなわち、単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力する入力手段と、
前記文章に対して形態素解析処理を行い、前記文章を単語毎に分割すると共に、各単語の品詞を決定する形態素解析手段と、
単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、当該品詞の並びの出現頻度を求める出現頻度計算手段と、
品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に前記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求める回数計算手段と、
前記各グループ毎に、前記出現銀度、前記回数を用いて、ポーズの入りやすさを示す値を求める計算手段と
を備えることを特徴とする。
【0011】
【発明の実施の形態】
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
【0012】
[第1の実施形態]
図1は本実施形態に係る自然言語処理装置の基本構成を示すブロック図である。尚本実施形態ではこの自然言語処理装置は一般のパーソナルコンピュータ(PC)やワークステーションとして説明するが、後述する自然言語処理を行う専用のハードウェアであっても良い。
【0013】
101はCPUで、RAM102やROM103に格納されたプログラムやデータを用いて本装置全体の制御を行うと共に、後述する自然言語処理を行う。
【0014】
102はRAMで、外部記憶装置106や記憶媒体ドライブ装置107からロードされたプログラムやデータを一時的に記憶するためのエリアを備えると共に、CPU101が各種の処理を行うために使用するワークエリアも備える。
【0015】
103はROMで、本装置の起動や制御を行うためのプログラムやデータ、表示部105に文字を表示するために必要な文字コードのデータなどを記憶する。
【0016】
104は操作部で、キーボードやマウスなどの、各種の入力を行うための装置により構成されており、各種の指示をCPU101に対して行うことができる。また、入力した文字などのデータはRAM102に一時的に記憶されることになる。
【0017】
105は表示部で、CRTや液晶画面などにより構成されており、各種の表示を行うことができ、後述する文章なども表示することができる。
【0018】
106は外部記憶装置で、ハードディスクドライブ装置などの大容量情報記憶装置に代表されるものであり、ここにOS(オペレーティングシステム)や後述する自然言語処理に係るプログラムやデータを保存することができる。
【0019】
107は記憶媒体ドライブ装置で、CD−ROMやDVD−ROMなどの記憶媒体に格納されたプログラムやデータを読み出し、外部記憶装置106に出力する。108は上述の各部をつなぐバスである。なお、本実施形態に係る自然言語処理装置の構成はこれに限定されるものではなく、他にも例えば紙に印字された文章を電子データとして読みとるためのスキャナをバス108に不図示のインターフェースを介して接続しても良いし、処理した自然言語を音声として外部に出力するための音声処理部、スピーカをバス108にインターフェースを介して接続しても良い。
【0020】
またバス108にネットワークインターフェースを接続し、このネットワークインターフェースを介してインターネットやLANなどのネットワークから上記各種のプログラムやデータを送受信するようにしても良い。
【0021】
以上の構成を備える自然言語処理装置によって行われる自然言語処理について以下説明する。まず、単語の集合による文章において、各単語の品詞列に対するポーズの入りやすさを求める(学習する)処理について説明する。
【0022】
図2は、同処理のフローチャートである。なお、同図に示したフローチャートに従ったプログラムは、外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102にロードされ、CPU101がこれを実行することで、本実施形態に係る自然言語処理装置は、後述する処理を行うことができる。
【0023】
まず操作部104からの指示に従ってCPU101は外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102に、ポーズの設定(挿入)位置に関する情報が付与されたテキストコーパスのデータをロードする(ステップS201)。
【0024】
図4はテキストコーパスの一例を示す図である。三角の記号が指す位置にポーズが存在する。即ちこのテキストコーパスは、単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置を示すものである。このテキストコーパスは、実際に話者が発話した情報を元に作成するので、このテキストコーパスを用ることで話者特有のポーズの入れ方を学習することが可能となる。
【0025】
次にRAM102にロードされたテキストコーパスデータを参照し、未処理の一文のデータを以降の処理対象として、ロードされたエリアとは異なるエリアに取り出す(ステップS202)。取り出せなかった場合、即ちすべての文に対する処理を終了した場合は処理をステップS210に進める。
【0026】
次に、ステップS202で取り出した一文に対して形態素解析を行ない、この一文を単語毎に分割すると共に、各単語の品詞を決定する(ステップS203)。例えば図4のテキストコーパスの例で一文“I have a pen and a pencil.”に対して形態素解析処理を行った結果を図5の「単語」と「品詞」の項目に示す。尚、このような形態素解析処理については周知の技術であるので、ここでの説明は省略する。また形態素解析処理を行った結果はRAM102に一時的に記憶されているものとする。
【0027】
次に、以下で用いる変数iの値を1に初期化する(ステップS204)。そしてこの変数iの値と形態素解析で分割された単語の数とを比較する(ステップS205)。図5の例では単語数は8である。変数iの値が単語数より小さい場合は処理をステップS206へ進め、それ以外の場合は処理をステップS202に進め、次に一文に対してステップS202以降の処理を繰り返す。処理をステップS202へ進めるということは一文に対する処理が終わったことを意味する。
【0028】
次に、i番目の単語境界について、単語境界の前後合わせてN個の単語の夫々の品詞から成る品詞列を得、その品詞列の出現数(出現頻度)を示す値を1つ増やす(ステップS206)。ここでi番目の単語境界とは、i番目の単語と(i+1)番目の単語の間(境界)を意味する。ここでN=2(単語境界の前後各1単語)とした場合について説明する。例えば図5で3番目の単語境界についての処理は、3番目と4番目の単語(a、pen)の夫々の品詞から成る品詞列(冠詞、名詞)の出現数を示すPosSequence(冠詞、名詞)の値を1つ増やす。
【0029】
次に、i番目の単語境界にポーズが存在するか否かを判定する(ステップS207)。即ち、上記品詞列(i番目の単語境界の前後合わせてN個の単語の夫々の品詞から成る品詞列)において、テキストコーパスが示すポーズ設定位置を品詞間に有するか否かを判定する。例えば図5の単語境界におけるポーズの有無は、図4のポーズ位置と比較し「ポーズ有無」の項目の通りになる。
【0030】
ポーズが存在する(テキストコーパスが示すポーズ設定位置を品詞間に有する)場合は、i番目の単語境界の前後合わせてN個の単語の夫々の品詞から成る品詞列に対するポーズ数を示す値を1つ増やす(ステップS208)。図5の例では変数iの値が4の場合、このステップS208が実行され、PauseCount(名詞,接続詞)の値を1つ増やす。
【0031】
そしてステップS208における処理が終了した場合、もしくはi番目の単語境界にポーズが存在しない場合には次の処理として、変数iの値を1つ増やす。つまり次の単語境界に対する上記処理(上記変数iを(i+1)と読み替えた処理)を行う。
【0032】
このようにして、ステップS206からステップS208までの処理を分割した一文中の各単語境界について行うことで、品詞の並びが同じ品詞列のグループ毎に、品詞の並びの出現頻度を求めることができると共に、品詞の並びが同じ品詞列のグループ毎に、ポーズの設定位置を品詞間に有する回数を求めることができる。図6は図5に示した一文に対して上記処理を行うことで得られる各グループの出現数とポーズ数とを示す図である。このような求めた結果はRAM102に一時的に記憶されているものとする。
【0033】
そしてすべての文に対する処理が終了すると、処理はステップS210に移行する。そして、各品詞列(PosA,PosB)について、ポーズの入り易さPause(PosA,PosB)を以下の式に従って求める。
【0034】
Pause(PosA,PosB)=PauseCount(PosA,PosB)/PosSequence(PosA,PosB)
求めたPause(PosA,PosB)のデータは、RAM102に一時的に記憶させても良いし、外部記憶装置106の保存させてもよい。
【0035】
なお、Pause(PosA,PosB)の値は0〜1の実数となるが、例えばPause(PosA,PosB)に127を掛け、0〜127の整数値に量子化した値によって表現しても良いし、その表現方法については特に限定しない。
【0036】
また、ステップS201で入力としたポーズの挿入位置に関する情報が付与されたテキストコーパスに関して、コーパス中の文をそのまま用いてもよいし、文に含まれる読点を削除したものを用いてもよい。
【0037】
また、適度に読点が含まれている原文から読点を除いた文を集め、原文の読点の位置をポーズの位置とみなすことにより、ポーズの挿入位置に関する情報が付与されたテキストコーパスを作成して用いてもよい。図11にその例を示す。同図上部に示した原文から「system」と「a」の間にある読点を削除し、読点のあった位置をポーズ設定位置(三角で示す)とした文(同図下部に示す文)を作成する。これにより、ポーズの情報が付与された文を大量に集めテキストコーパスを作成することもできる。
【0038】
テキストコーパスに含まれるすべての文を処理し、各品詞列に対する出現数、ポーズ数の総数をカウントした後、上記ステップS210の処理で各品詞列に対するポーズの入り易さが最終的に求まることになる。
【0039】
次に、本実施形態に係る自然言語処理として、上記処理によって求まった品詞列のポーズの入り易さを示すデータを用いて、一般の文章に対してポーズを設定する処理について、同処理のフローチャートを示す図3を用いて説明する。尚同図に示したフローチャートに従ったプログラムは、外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102にロードされ、CPU101がこれを実行することで、本実施形態に係る自然言語処理装置は、後述する処理を行うことができる。
【0040】
まず操作部104からの指示に従ってCPU101は外部記憶装置106もしくは記憶媒体ドライブ装置107からRAM102に、文章のデータをロードし、この文章に対して上記形態素解析処理を行い、この文章を単語毎に分割すると共に、各単語の品詞を決定する(ステップS301)。図7の「単語」、「品詞」の項目に、ステップS301における形態素解析処理の結果の一例を示す。
【0041】
次に、変数startIdxの値を1に、変数pauseIdxの値を1に初期化する(ステップS302)。また、変数endIdxの値をstartIdx+Wに初期化する(ステップS303)。ここでWはポーズとポーズの間隔の目安となる値で、あらかじめ特定の値を指定しておく。およそ単語W個に1個の割合でポーズが入ることになる。ここでは例としてW=7とする。
【0042】
次に、変数endIdxの値と、ステップS301で形態素解析処理によって分割された単語の数とを比較する(ステップS304)。即ち、すべての単語について後述する処理が行われたか否かを判断する。変数endIdxの値が単語数より小さい場合、すなわちすべての単語について後述する処理が行われていない場合には処理をステップS305に進め、それ以外の場合は処理を終了する。
【0043】
ステップS305では、変数pauseMaxの値を0に初期化すると共に、変数iの値を変数startIdxの値に初期化する。そして次に、変数iの値と変数endIdxの値を比較する(ステップS306)。すなわち、startIdxで示す単語境界の位置からendIdxで示す単語境界の位置までの全ての単語境界で、後述する処理が行われたか否かを判断する。
【0044】
変数iの値が変数endIdxの値より小さい場合、即ちstartIdxで示す単語境界の位置からendIdxで示す単語境界の位置までの全ての単語境界で、後述する処理が行われていない場合には、処理をステップS307に進め、その他の場合は、処理をステップS311に進める。
【0045】
ステップS307では、変数vにi番目の単語境界におけるポーズの入り易さを示す値を代入する。例えば図7で7番目の単語境界は、品詞列が(前置詞、冠詞)となり変数vにポーズの入り易さを示す値”6”を代入する。各品詞列に対するポーズの入り易さを示す値のテーブルは図2に示した上記処理によって予め作成されているものとする。図8は、各品詞列に対するポーズの入りやすさを示す値のテーブルの構成例を示す図である。図8に示すテーブルのデータは上述の通り図2に示した上記処理によって予め作成され、RAM102に一時的に記憶されている、もしくは外部記憶装置106に保存されているものとする。
【0046】
次に、変数pauseMaxの値と変数vの値を比較する(ステップS308)。変数pauseMaxの値が変数vの値以下の場合は処理をステップS309へ進め、その他の場合は処理をステップS310に進める。
【0047】
ステップS309では、変数pauseIdxに変数iの値を代入する。また変数pauseMaxの値に変数vの値を代入する。そして次に、変数iの値に1を加え(ステップS310)、次の単語境界についてステップS306以降の処理を繰り返す。
【0048】
そしてステップS311で、startIdxで示す単語境界の位置からendIdxで示す単語境界の位置までの全ての単語境界で、ステップS308からステップS310までの処理が行われた場合には処理をステップS311に進め、pauseIdx番目の単語境界にポーズを設定する(ステップS311)。なお、変数pauseIdxが示す値は以上の処理により、最もポーズの入りやすさを示す値が大きい単語境界を示す。
【0049】
例えば図7の例で変数startIdxの値を7、変数endIdxの値を14とすると、7番目から13番目までの各単語境界において最も「ポーズの入りやすさを示す値」が大きい単語境界、この例では10番目の単語境界(”communication”と”a”の間)にポーズを設定することになる。ポーズの設定処理とは、例えば、設定位置(図7の例では10番目の単語境界の位置)がポーズの設定位置であることを示すデータを生成する処理である。
【0050】
そして変数startIdxに、(変数pauseIdxが示す値+1)の値を代入し(ステップS312)、ステップS303以降の処理を繰り返す。すなわち、ポーズを設定した位置をstartIdxとして新たに設定し、次の区間(startIdxとendIdxとの間の区間)に対して上記ポーズ設定処理を繰り返す。
【0051】
以上の説明により、本実施形態に係る自然言語処理装置、及び自然言語処理方法は、文を構成する各単語の品詞の並び(品詞列)に基づいてポーズの設定位置を学習するので、文中の読点の数に関係なく、ポーズの設定位置を学習することができる。
【0052】
また、このような学習結果に基づいて一般の文章にポーズを設定するので、例えば実際に話者が発話した情報を元に作成したテキストコーパスを用いて上記学習を行うと、話者特有のポーズの入れ方に従ってポーズを設定することができる。
【0053】
なお本実施形態では、Pause(PosA,PosB)を求めるためにPauseCount(PosA,PosB)とPosSequence(PosA,PosB)との比を求めたが、求める演算方法についてはこれに限定されるものではない。
【0054】
[第2の実施形態]
品詞列の長さを5とした場合の例を図10に示す。この例は長さ5の品詞列で3番目の品詞と4番目の品詞の間に対するポーズの入り易さを考えている。
【0055】
この場合、i番目の単語境界におけるポーズの入り易さを図10を用いて説明する。例えば、10番目の単語境界(「communication」と「a」の間)の品詞列は、10番目の単語境界の前3単語の品詞「a(冠詞)」「radio(名詞)」「comuunication(名詞)」と境界の後2単語の品詞「a(冠詞)」「method(名詞)」の並びの品詞列(冠詞、名詞、名詞、冠詞、名詞)となる。
【0056】
[その他の実施形態]
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0057】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0058】
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0059】
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0060】
【発明の効果】
以上の説明により、本発明によって、例えば読点の数に関係なくポーズの規則を学習することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る自然言語処理装置の基本構成を示すブロック図である。
【図2】単語の集合による文章において、各単語の品詞列に対するポーズの入りやすさを求める(学習する)処理のフローチャートである。
【図3】品詞列のポーズの入り易さを示すデータを用いて、一般の文章に対してポーズを設定する処理のフローチャートである。
【図4】テキストコーパスの一例を示す図である。
【図5】図4のテキストコーパスの例で一文“I have a pen and a pencil.”に対して形態素解析処理を行った結果、及び、各単語境界におけるポーズの有無を示す図である。
【図6】図5に示した一文に対する各グループの出現数とポーズ数とを示す図である。
【図7】ステップS301における形態素解析処理の結果、及び、各単語境界におけるポーズの入りやすさを示す図である。
【図8】各品詞列に対するポーズの入りやすさを示す値のテーブルの構成例を示す図である。
【図9】品詞列の長さを5とした場合に、品詞列で3番目の品詞と4番目の品詞の間に対するポーズの入り易さを説明するための図である。
【図10】図9に示した一文中で、i番目の単語境界におけるポーズの入り易さを説明するための図である。
【図11】適度に読点が含まれている原文から読点を除いた文を集め、原文の読点の位置をポーズの位置とみなすことにより、ポーズの挿入位置に関する情報が付与されたテキストコーパスを作成する例を説明するための図である。
Claims (7)
- 単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力する入力工程と、
前記文章に対して形態素解析処理を行い、前記文章を単語毎に分割すると共に、各単語の品詞を決定する形態素解析工程と、
単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、当該品詞の並びの出現頻度を求める出現頻度計算工程と、
品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に前記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求める回数計算工程と、
前記各グループ毎に、前記出現銀度、前記回数を用いて、ポーズの入りやすさを示す値を求める計算工程と
を備えることを特徴とする自然言語処理方法。 - 前記計算工程では、前記出現頻度と、前記回数との比によって前記ポーズの入りやすさを示す値を求めることを特徴とする請求項1に記載の自然言語処理方法。
- 前記入力工程では、前記文章に含まれる読点を削除し、前記削除した読点の位置に前記ポーズ設定位置データを入力することを特徴とする請求項1に記載の自然言語処理方法。
- 更に、単語毎に分割されると共に、各単語の品詞が決定している文章のデータにおいて、
第1の単語間から所定個数の単語分だけ離間した第2の単語間までの区間に位置する各種の品詞列のうち、前記計算工程で求めたポーズの入りやすさを示す値が最も大きい値の品詞列中にポーズを設定するポーズ設定処理を行うポーズ設定工程を備え、
前記ポーズ設定工程では、ポーズを設定した位置を前記第1の単語間として新たに設定し、次の区間に対して前記ポーズ設定処理を繰り返すことを特徴とする請求項1乃至3の何れか1項に記載の自然言語処理方法。 - 単語の集合による文章に対するポーズの設定位置を示すポーズ設定位置データを入力する入力手段と、
前記文章に対して形態素解析処理を行い、前記文章を単語毎に分割すると共に、各単語の品詞を決定する形態素解析手段と、
単語間の前後合わせてN個(N≧2)の単語の夫々の品詞から成る品詞列を各単語間毎に得、品詞の並びが同じ品詞列のグループ毎に、当該品詞の並びの出現頻度を求める出現頻度計算手段と、
品詞の並びが同じ品詞列のグループ毎に、品詞列中の品詞間に前記ポーズ設定位置データが示すポーズの設定位置が設定された回数を求める回数計算手段と、
前記各グループ毎に、前記出現銀度、前記回数を用いて、ポーズの入りやすさを示す値を求める計算手段と
を備えることを特徴とする自然言語処理装置。 - コンピュータに請求項1乃至4の何れか1項に記載の自然言語処理方法を実行させるためのプログラム。
- 請求項6に記載のプログラムを格納する、コンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003194543A JP2005031259A (ja) | 2003-07-09 | 2003-07-09 | 自然言語処理方法 |
US10/885,747 US20050033566A1 (en) | 2003-07-09 | 2004-07-08 | Natural language processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003194543A JP2005031259A (ja) | 2003-07-09 | 2003-07-09 | 自然言語処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005031259A true JP2005031259A (ja) | 2005-02-03 |
JP2005031259A5 JP2005031259A5 (ja) | 2007-03-01 |
Family
ID=34113581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003194543A Withdrawn JP2005031259A (ja) | 2003-07-09 | 2003-07-09 | 自然言語処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050033566A1 (ja) |
JP (1) | JP2005031259A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079351A (ja) * | 2005-09-16 | 2007-03-29 | Advanced Telecommunication Research Institute International | 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム |
JP2007108749A (ja) * | 2005-10-09 | 2007-04-26 | Toshiba Corp | 韻律統計モデル訓練方法及び装置、韻律解析方法及び装置、テキスト音声合成方法及びシステム |
CN105551481A (zh) * | 2015-12-21 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 语音数据的韵律标注方法及装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4262077B2 (ja) * | 2003-12-12 | 2009-05-13 | キヤノン株式会社 | 情報処理装置及びその制御方法、プログラム |
US20080177548A1 (en) * | 2005-05-31 | 2008-07-24 | Canon Kabushiki Kaisha | Speech Synthesis Method and Apparatus |
US20100153425A1 (en) * | 2008-12-12 | 2010-06-17 | Yury Tulchinsky | Method for Counting Syllables in Readability Software |
US9377373B2 (en) * | 2010-10-05 | 2016-06-28 | Infraware, Inc. | System and method for analyzing verbal records of dictation using extracted verbal features |
GB2559769A (en) * | 2017-02-17 | 2018-08-22 | Pastel Dreams | Method and system of producing natural-sounding recitation of story in person's voice and accent |
US11507743B2 (en) * | 2017-02-28 | 2022-11-22 | Nice Ltd. | System and method for automatic key phrase extraction rule generation |
CN110781651A (zh) * | 2019-10-22 | 2020-02-11 | 合肥名阳信息技术有限公司 | 一种文字转语音插入停顿的方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR950704772A (ko) * | 1993-10-15 | 1995-11-20 | 데이비드 엠. 로젠블랫 | 시스템 트레이닝 방법, 트레이닝된 장치 및 그 사용 방법(A method for training a system, the resulting apparatus, and method of use thereof) |
DE19610019C2 (de) * | 1996-03-14 | 1999-10-28 | Data Software Gmbh G | Digitales Sprachsyntheseverfahren |
US5850629A (en) * | 1996-09-09 | 1998-12-15 | Matsushita Electric Industrial Co., Ltd. | User interface controller for text-to-speech synthesizer |
KR100277694B1 (ko) * | 1998-11-11 | 2001-01-15 | 정선종 | 음성인식시스템에서의 발음사전 자동생성 방법 |
US6801894B2 (en) * | 2000-03-23 | 2004-10-05 | Oki Electric Industry Co., Ltd. | Speech synthesizer that interrupts audio output to provide pause/silence between words |
US6865533B2 (en) * | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
US6847931B2 (en) * | 2002-01-29 | 2005-01-25 | Lessac Technology, Inc. | Expressive parsing in computerized conversion of text to speech |
US7200558B2 (en) * | 2001-03-08 | 2007-04-03 | Matsushita Electric Industrial Co., Ltd. | Prosody generating device, prosody generating method, and program |
IL144818A (en) * | 2001-08-09 | 2006-08-20 | Voicesense Ltd | Method and apparatus for speech analysis |
US7136802B2 (en) * | 2002-01-16 | 2006-11-14 | Intel Corporation | Method and apparatus for detecting prosodic phrase break in a text to speech (TTS) system |
-
2003
- 2003-07-09 JP JP2003194543A patent/JP2005031259A/ja not_active Withdrawn
-
2004
- 2004-07-08 US US10/885,747 patent/US20050033566A1/en not_active Abandoned
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079351A (ja) * | 2005-09-16 | 2007-03-29 | Advanced Telecommunication Research Institute International | 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム |
JP4621936B2 (ja) * | 2005-09-16 | 2011-02-02 | 株式会社国際電気通信基礎技術研究所 | 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム |
JP2007108749A (ja) * | 2005-10-09 | 2007-04-26 | Toshiba Corp | 韻律統計モデル訓練方法及び装置、韻律解析方法及び装置、テキスト音声合成方法及びシステム |
US8024174B2 (en) | 2005-10-09 | 2011-09-20 | Kabushiki Kaisha Toshiba | Method and apparatus for training a prosody statistic model and prosody parsing, method and system for text to speech synthesis |
CN105551481A (zh) * | 2015-12-21 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 语音数据的韵律标注方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20050033566A1 (en) | 2005-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6188977B1 (en) | Natural language processing apparatus and method for converting word notation grammar description data | |
CN109801349B (zh) | 一种声音驱动的三维动画角色实时表情生成方法和系统 | |
CN111653265A (zh) | 语音合成方法、装置、存储介质和电子设备 | |
JPWO2004066271A1 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
TWI470620B (zh) | 文字到語音轉換之方法和系統 | |
JP2005031259A (ja) | 自然言語処理方法 | |
JP2018169434A (ja) | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム | |
Castro et al. | «Máquina de Ouver»-From Sound to Type: Finding the Visual Representation of Speech by Mapping Sound Features to Typographic Variables | |
JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
CN113626635B (zh) | 一种歌曲乐句划分方法、系统、电子设备及介质 | |
JP6523998B2 (ja) | 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム | |
JP3471253B2 (ja) | 文書分類方法、文書分類装置、および文書分類プログラムを記録した記録媒体 | |
JP7363107B2 (ja) | 発想支援装置、発想支援システム及びプログラム | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JPWO2021106051A1 (ja) | サーバおよびデータ割り当て方法 | |
JP2007026347A (ja) | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム | |
JPH10228471A (ja) | 音声合成システム,音声用テキスト生成システム及び記録媒体 | |
JP3961858B2 (ja) | 翻字装置及びそのプログラム | |
KR102500730B1 (ko) | 문장의 스타일 정보를 유지하는 번역 기능을 제공하는 전자 장치 및 그 동작 방법 | |
WO2023189110A1 (ja) | 翻訳システム、翻訳装置及びプログラム | |
JP2007127994A (ja) | 音声合成方法及び音声合成装置並びにプログラム | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
WO2023073886A1 (ja) | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 | |
JP2008158630A (ja) | 画像出力装置及び画像出力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051216 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070111 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20071129 |