JP3706758B2 - 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 - Google Patents

自然言語処理方法,自然言語処理用記録媒体および音声合成装置 Download PDF

Info

Publication number
JP3706758B2
JP3706758B2 JP34299298A JP34299298A JP3706758B2 JP 3706758 B2 JP3706758 B2 JP 3706758B2 JP 34299298 A JP34299298 A JP 34299298A JP 34299298 A JP34299298 A JP 34299298A JP 3706758 B2 JP3706758 B2 JP 3706758B2
Authority
JP
Japan
Prior art keywords
word
pronunciation
text
consonant
stuttering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP34299298A
Other languages
English (en)
Other versions
JP2000172289A (ja
Inventor
勝義 山上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP34299298A priority Critical patent/JP3706758B2/ja
Publication of JP2000172289A publication Critical patent/JP2000172289A/ja
Application granted granted Critical
Publication of JP3706758B2 publication Critical patent/JP3706758B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、自然言語処理方法,自然言語処理用記録媒体および音声合成装置に関する。
【0002】
【従来の技術】
インターネットなどの普及により、さまざまなテキスト情報を容易に得ることができるが、まとまった量のテキスト情報を画面上で閲覧するのは、ユーザにとって負担となることがある。そこで、テキストを音声化するテキスト音声合成技術が開発され、最近では、テキスト読み上げ機能を備えるパソコンやワープロも発売されるようになった。
【0003】
但し、テキスト情報は読まれることを前提として記述されているのが普通なので、忠実に音声として再現するだけでは、ユーザーにわかりやすい読み上げにならない場合が多い。この不都合を軽減する技術は、いろいろと提案されている。
【0004】
例えば、次のようなものがある。特開平3−35296号公報(従来例▲1▼),特開平10−171485号公報(従来例▲2▼),特開平7−121543号公報(従来例▲3▼),特開平7−325595号公報(従来例▲4▼),特開平10−228471号公報(従来例▲5▼)。
【0005】
従来例▲1▼は、入力テキストの難意語や紛らわしい同音異義語を平易な単語に置き換える機能を音声合成装置に付与したものである。従来例▲2▼は、語義テーブルを用いて構文を解析し、単語の置き換えを行う音声合成装置である。従来例▲3▼は、会話文辞書を用いて構文を解析する構文解析装置である。従来例▲4▼は、文節関係規則にしたがってポーズを挿入する音声合成装置である。従来例▲5▼は、単語辞書を用いて単語を同定してポーズを挿入する音声合成システムである。
【0006】
【発明が解決しようとする課題】
上述の従来例は、「単語を単位」とした「構文解析」を行う点で共通する。
【0007】
この場合、「単語を単位」とした処理を行うと、以下のような点で十分な対応ができない。
【0008】
すなわち、書き言葉のテキストには複数の単語で構成される複合語が多用されるが、複合語を構成するそれぞれの単語を聞き取ることは容易であっても、連続して読み上げた場合に、聞き取りにくい発音となる場合がある。したがって、単語単位の処理では、このような連続して単語を読み上げていく場合に生じる聞き取りにくさを改善するには不十分である。複合語を一つの単位として置き換えることも考えられるが、複合語は、任意の単語の組み合わせによって無限に存在するので、事実上、複合語単位での規則を網羅することは不可能である。
【0009】
また、「構文解析」は、単語に分割した後、文節や、かかり結び等の文章構造を解析するものであり、上述の単語単位の処理(単語の置き換え等)は、このような文章の解析処理と不可分の関係となっていて、構文解析の方式やその精度による影響を受ける。
【0010】
本発明は、このような検討に基づいてなされたものであり、上述した従来の自然言語処理の不都合を解消し得る、新規な自然言語処理方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明は、文書の構造ではなく、「文書を音読する際の音の組み合わせ」という新規な観点から分析するようにしたものである。すなわち、発音の組み合わせで聞きづらいものを予め発音パターン規則として登録しておき、テキストが入力されると、まず、その発音パターン規則に該当する音のパターンが存在するかをサーチして、聞きづらいと推定される部分を拾い出す(第1段階の処理)。次に、この拾い出された部分に、読み上げを前提とした文体に変換するためのテキスト変換規則を適用する(第2段階の処理)。
【0012】
変換処理の内容は、状況に応じて柔軟に変化する。すなわち、単語を別の単語で置換するか、単語を複合語に置換するか、単語と単語の間にポーズを挿入するか、単語と単語の間に助詞を挿入するか、といった判断が個別的になされ、最適な変換処理が選択されることになる。
【0013】
本発明では、従来例のように文章の字面に着目するのではなく、音の組み合わせのパターンという新規な観点から問題となりそうな箇所を拾い出すので、一つの単語が特殊な発音で聞きづらい場合やその単語に同音異義語があることによって聞きづらい場合、といった一つの単語に起因する場合のみならず、単語を連続して読み上げる際に生じる、複合語に起因して聞きづらさが生じる場合も含めて、該当箇所を抽出することができる。
【0014】
そして、抽出された部分に対して変換規則を適用して、聞きづらさが生じる態様毎に適切な処理をほどこすので、テキストを読み上げる際の聞きやすさが向上する。
【0015】
また、発音パターンによる問題箇所の絞り込みがなされており、かつ、発音パターンによる問題箇所の絞り込みの規則が既知であるので、テキスト変換規則の構築も、それほど複雑とはならない。
【0016】
また、発音パターン規則による問題箇所の絞り込み処理は、入力された文書を単語列に分割した段階で行うことができ、構文解析処理とは独立に実行できるというメリットがある。
【0017】
【発明の実施の形態】
本発明の自然言語処理方法の第1の態様は、(子音・拗音)(子音・拗音)と(子音・拗音)(子音・母音)(子音・拗音)とのいずれか少なくとも1つの発音パターンが登録されている発音規則テーブルと入力されたテキストとを照合して、前記入力されたテキストから前記発音パターンを含む部分を抽出する第1のステップと、テキスト変換規則テーブルに登録されている変換規則に基づき、抽出された前記部分に含まれる単語または複合語を他の単語または他の複合語に置換する処理、あるいは前記複合語を構成する単語間に助詞またはポーズを挿入する処理を実行する第2のステップと、を含む。
【0018】
この態様では、第1のステップにおいて、音の組み合わせの観点から問題となる箇所を拾い出し、第2のステップにおいて、変換規則テーブルとの照合によって聴きづらさが生じる原因に応じた適切なテキスト変換処理(読み上げを前提とした文章への変換処理)を選択する。これにより、単語単位で聞きづらさが生じる場合のみならず、複合語を単位とする聞きづらい態様についても、テキスト変換を行うことができるようになる。
【0025】
また、本発明の第の態様は、第の態様において、前記複合語を構成する、隣接する2つの単語の隣接部分に前記発音パターンが存在し、かつ、前記2つの単語が共に名詞である場合に、前記2つの単語間に助詞またはポーズを挿入するようにした。
【0026】
複数の単語で構成する複合語の場合、それぞれの単語を単独で聞き取ることは容易であっても、連続して読み上げた場合に聞き取りにくい発音となる場合がある。このような場合にも、聞き取りやすいように助詞やポーズの挿入処理を可能としたものである。従来の構文解析に基づく単語単位の処理では、連続読み上げに起因して生じる発音の聞き取りにくさには対処することができない。この場合、複合語単位の辞書と規則により対応することも考えられるが、複合語は無限に合成可能であるので、複合語単位のテキスト処理は事実上、実現不可能ということになる。本発明の態様では、従来不可能であった、隣接する2つの単語の隣接部分に前記発音パターンが存在する場合も、第1のステップで問題箇所として抽出でき、続いて、第2のステップにおいて、例えば、名詞と名詞との連結の場合には助詞やポーズを挿入するという規則を適用することにより、聞き取り容易な文体に変換することが可能となる。
【0027】
また、本発明の自然言語処理方法の第の態様では、第の態様において、前記発音規則テーブルに登録されている前記発音パターンまたは前記テキスト変換規則テーブルに登録されている前記変換規則を、外部に提示可能とした。
【0028】
これにより、ユーザーが、発音規則または変換規則を確認できるようになる。
【0029】
また、本発明の自然言語処理方法の第の態様は、第の態様において、前記発音規則テーブルに登録されている前記発音パターンまたは前記テキスト変換規則テーブルに登録されている前記変換規則を外部から補正することができるようにした。
【0030】
これにより、ユーザーがテーブルの構築に参画できるようになる。これによって、各々のユーザーに特有な発音規則または変換規則を追加することができ、また、テーブル構築の負担も軽減される。
【0031】
また、本発明の自然言語処理用記録媒体の第1の態様では、自然言語処理装置に、(子音・拗音)(子音・拗音)と(子音・拗音)(子音・母音)(子音・拗音)とのいずれか少なくとも1つの発音パターンが登録されている発音規則テーブルと入力されたテキストとを照合して、前記入力されたテキストから前記発音パターンを含む部分を抽出する第1のステップと、テキスト変換規則テーブルに登録されている変換規則に基づき、抽出された前記部分に含まれる単語または複合語を他の単語または他の複合語に置換する処理、あるいは前記複合語を構成する単語間に助詞またはポーズを挿入する処理を実行し、前記入力されたテキストを読み上げることを前提としたテキストに変換する第2のステップと、を実行させるためのプログラムが記録されている。
【0032】
新規な自然言語処理プログラムを記録した、コンピュータが読み取り可能な記録媒体が得られる。
【0037】
また、本発明の音声合成装置の第1の態様では、日本語の入力テキストを単語列に分割し、単語列の各単語に対して読み、品詞などの言語情報を付与する言語処理手段と、(子音・拗音)(子音・拗音)と(子音・拗音)(子音・母音)(子音・拗音)とのいずれか少なくとも1つの発音パターンが登録されている発音規則テーブルと、前記発音規則テーブルに登録されている前記発音パターンに該当する、前記言語処理手段から出力される単語列を、音声読み上げに適した単語列に変換するためのテキスト変換規則が登録されているテキスト変換規則テーブルと、前記言語処理手段から出力される単語列を前記発音規則テーブルと照合し、前記発音パターンに該当する単語または複数の単語からなる複合語を抽出し、抽出された前記単語または複合語に対して、前記テキスト変換規則テーブルに格納されている前記テキスト変換規則を適用して単語または複合語に置換する処理、あるいは前記複合語を構成する単語間に助詞またはポーズを挿入する処理を実行するテキスト変換手段と、前記テキスト変換手段から出力される単語列に付与された言語情報から音声波形を合成するのに必要な発音系列、ピッチ、パワーなどの韻律情報を生成する韻律情報生成手段と、前記韻律情報生成手段の出力する韻律情報に従って音声波形を合成する音声波形合成手段と、を有する構成とした。
【0038】
これにより、複合語に起因して聞き取りにくさが生じるような場合にも、読み上げやすい文体に変換して読み上げ音声として出力できる、音声合成装置が得られる。
【0041】
(実施の形態1)
以下、本発明の音声合成装置(自然言語処理装置を含む)について図面を参照して、具体的に説明する。
【0042】
図1は、本発明の実施の形態1にかかる音声合成装置の構成を示すブロック図である。
【0043】
図示されるとおり、音声合成装置は、テキスト入力部101と、言語処理部102と、テキスト変換部103(発音パターン抽出部104,テキスト変換処理部105,構文解析部106を有する)と、韻律情報生成部107と、音声波形合成部108と、音声出力部109と、表示部110と、発音規則テーブル111と、テキスト変換規則テーブル112と、テキスト変換規則管理部113と、テキスト変換規則入出力部114と、を具備する。
【0044】
テキスト入力部101は、処理するべきテキストデータを受付ける。言語処理部102は、入力されたテキストデータを形態素解析して、品詞などの言語情報付与した単語列に分割する。
【0045】
テキスト変換部103の発音パターン抽出部104は、言語処理部102から出力される「単語列の読み情報」を走査し、発音規則テーブル111に登録されている発音パターンとの照合(マッチング)を行うことで、その発音パターンが含まれる部分(連続した読み上げの場合に聞き取りにくいと判断される部分)を抽出する。
【0046】
また、テキスト変換部103のテキスト変換処理部105は、発音パターン抽出部104により抽出された部分について、その部分に含まれる単語列をテキスト変換規則にしたがって単語列に置き換える、あるいは単語間に助詞やポーズを挿入する、といったテキスト変換処理を実行し、入力テキストを、音声による読み上げに適したテキストに変換する処理を行う。
【0047】
また、構文解析部106は、言語処理部102から送られてくる単語列を文節列にまとめて文章の係り結びを明らかとする。この構文解析部106は、読み上げに適したテキストへの変換処理には必須とされるものではないが、韻律情報生成部107でイントネーションの付与等のために必要となる情報を提供するべく設けられている。
【0048】
韻律情報生成部107は、テキスト変換処理部105において変換された単語列の読みや品詞などの言語情報から、発音系列,イントネーション,ピッチやパワーなどの韻律情報を生成する。
【0049】
音声波形合成部108は、韻律情報生成部107が生成した、発音系列や韻律情報に基づいて音声波形素片を接続し、音声合成データを得るものである。合成された音声は、音声出力部109から出力される。
【0050】
表示部110は、テキスト変換によって得られた、読み上げに適したテキストを文字情報として表示する表示手段(モニター)であり、変換された文書を、ユーザーが自ら読み上げる場合において使用するものである。
【0051】
また、発音規則テーブル111には、聞き取りにくいと判断される音声パターンが、複数登録されている。テキスト変換規則テーブル112には、発音パターン抽出部104により抽出された単語列に対して、置き換え等の処理をするためのテキスト変換規則が登録されている。
【0052】
また、テキスト変換規則管理部113は、テキスト変換規則テーブル112に対するユーザーインタフェースとして機能するものであり、テキスト変換規則テーブル112に登録されているテキスト変換規則をテキスト変換規則入出力部114を介してユーザーに提示したり、あるいは、ユーザが追加/修正した規則をテキスト変換規則テーブル112に書き込む働きをする。
【0053】
このような音声合成装置は、例えば、図7に示すようなコンピュータシステム上に構築されるものである。このコンピュータシステムは、本体部601と、キーボード602と、ディスプレイ603と、入力装置(マウス)604を含む、音声出力可能なシステムである。図1の発音規則テーブル111およびテキスト変換規則テーブル112は、本体部601にセットされるCD−ROM607内,本体部601が内蔵するディスク(メモリ)606内,あるいは回線608で接続された他のシステムのディスク605内に格納される。
【0054】
なお、図1の音声合成装置における表示部110は、図7のシステムにおけるディスプレイ603に該当し、図1のテキスト変換規則入出力部114は、図7のシステムにおけるディスプレイ603および入力装置604に該当する。
【0055】
このような本実施の形態の音声合成装置では、音声合成前の自然言語処理過程において、図2に示されるように、大別して2段階の処理が行われる。
【0056】
すなわち、第1の段階の処理として、テキスト変換部103の発音パターン抽出部104が、入力されたテキストの単語列(言語処理部102において分割された単語列)を発音規則テーブル111と照合し、所定の発音パターンに該当する部分を抽出する(ステップ120)。
【0057】
次に、第2段階の処理として、テキスト変換処理部105が、テキスト変換規則テーブル112に登録されている変換規則にしたがって、抽出された部分に含まれる単語または複合語を他の単語または複合語に置換する処理,あるいは複合語を構成する単語間に助詞またはポーズを挿入する処理を行って、入力されたテキストを読み上げることを前提としたテキストに変換する(ステップ121)。
【0058】
第1段階のステップでは、文章の係り結び(文章の意味内容や文章の構造)に着目するのではなく、音の組み合わせのパターンという新規な観点から問題となりそうな箇所を拾い出すので、一つの単語が特殊な発音で聞きづらい場合やその単語に同音異義語があることによって聞きづらい場合、といった一つの単語に起因する場合のみならず、単語を連続して読み上げる際に生じる、複合語に起因して聞きづらさが生じる場合も含めて、該当箇所を広く抽出することができる。
【0059】
そして、第2段階のステップにおいて、抽出された部分に対して変換規則を適用して、聞きづらさが生じる態様毎に適切な処理をほどこすので、入力テキストを読み上げる際の聞きやすさが向上する。
【0060】
また、発音パターンによる問題箇所の絞り込みがなされており、かつ、発音パターンによる問題箇所の絞り込みの規則が既知であるので、テキスト変換規則の構築も、それほど複雑とはならない。
【0061】
また、発音パターン規則による問題箇所の絞り込み処理は、入力された文書を単語列に分割した段階で行うことができ、構文解析処理とは独立に実行できる。例えば、構文解析と並列に「テキスト変換処理」を行い、この「テキスト変換処理」の結果を「構文解析処理」を補強する形で活用することにより、聞き取りやすい音声を出力可能な音声合成装置が得られる。
【0062】
以下、発音規則テーブル111およびテキスト変換規則テーブル112の具体的な内容例と、これらの規則を用いたテキスト変換の具体例について説明する。
【0063】
図3は、言語処理部102による、入力テキストから単語列への分割例を示している。
【0064】
すなわち、「橋本首相は競技者表彰会に出席した。」という入力テキスト201は、「橋本」,「首相」,「は」,「競技者」,「表彰」,「会場」,「に」,「出席」,「し」,「た」,「。」という単語列202に分割される。
【0065】
分割された各単語には、図3に示されるように、「単語表記 読み 品詞名」の3つの言語情報が付与される。読点「、」や句点「。」などの読みのないものについては、読みの情報は「*」と記述している。
【0066】
図4(a)は、発音規則テーブル111に登録されている、聞き取りにくい発音の組み合わせのパターン例を示す図であり、図4図(b)は、母音,子音,拗音,撥音の内容を示す図である。
【0067】
図4(a)には2つの発音パターン例が記載されている。発音パターン例301は、(子音・拗音)(子音・拗音)の組み合わせパターンであり、発音パターン例302は、(子音・拗音)(子音・母音)(子音・拗音)の組み合わせパターンである。
【0068】
括弧で囲んだ単位(例えば(子音・拗音))が、一つの読みのパターンを表わす。また、「母音」,「子音」,「拗音」,「撥音」は、日本語の読みを発音記号列として表現した場合の発音記号のグループである。
【0069】
図4(b)は、発音記号をローマ字表記で表わした場合の発音記号のグループ分けを示している。つまり、母音は「a,i,u,e,o」からなるグループであり、子音は「k,s,t,n,h,m,y,r,w,g,z,d,b,p」からなるグループであり、拗音は「ya,yu,yo」からなるグループであり、撥音は、「nn」からなるグループである。
【0070】
例えば、「(子音・拗音)」という読みは、「子音」のグループに含まれる任意の発音記号と「拗音」のグループに含まれる任意の発音記号のすべての組み合わせとして得られる読みを意味する。例えば、「シャ(sya)」、「ギョ(gyo)」などの読みは、この読みとして含まれる。「車種(syasyu)」,「授受(zyuzyu)」といった単語や「民主主義(minsyusyugi)」といった複合語は(子音・拗音)の組み合わせを含んでおり、したがって、これらの単語,複合語は、図1の発音パターン抽出部104による抽出対象となる。
【0071】
また、「客車(kyakusya)」という単語は、発音パターン例302の、(子音・拗音),(子音・拗音),(子音・拗音)の組み合わせに該当して、抽出の対象となる。
【0072】
図5は、テキスト変換規則テーブル112に保持されている変換規則(聞き取りにくいとして抽出された単語列を他の単語に置き換える等の処理を行うための規則)の一例を示す図である。
【0073】
参照符号401,402,403はそれぞれ、一つのテキスト変換規則の単位を示している。図示されるように、各単位の規則は、原則として、上段に示される変換前の単語列のパターンと、下段に示される変換後の単語列パターンとの組み合わせによって規定されている。
【0074】
なお、単語列パターン中の(表記 読み 品詞)という単位が、1つの単語の情報を表わす。
【0075】
テキスト変換規則401は、「首相(シュショー)」という単語を「総理大臣(ソーリダイジン)」という単語に置換する規則である。また、テキスト変換規則402は、「授受(ジュジュ)」という単語を「受け渡し(ウケワタシ)」という単語に置換する規則である。
【0076】
テキスト変換規則403は、名詞と名詞との間に助詞を挿入するという規則である。この変換規則403では、変換前の単語列のパターンにおいて、「表記」および「読み」の部分を「?」としているが、これは任意の表記、読みと照合可能であることを示す。つまり、聞き取りにくい発音パターンを含むとして抽出された単語列の中の、任意の連続する名詞に対して、本規則が適用されることになる。
【0077】
また、テキスト変換規則403における、変換後の単語列パターンの中の、「(1)」,「(2)」の番号は、変換前の単語列パターンに現れた2つの「(?? 名詞)」の左からの順序に対応している。つまり、名詞が連続する複合語が規則403に該当すると、各名詞に分解して、(1)および(2)を、各単語に置き換え、かつ、各名詞間に助詞を挿入することになる。例えば、「競技者表彰」がテキスト変換規則403と照合した場合は、「(1)」は「競技者」」と置き換えられ、「(2)」は「表彰」と置き換えられ、結果的に、「競技者の表彰」という、助詞が挿入された文章に変換されることになる。なお、ここでは、助詞を挿入することにしているが、同様の構造の規則によって、名詞と名詞の間,あるいは特定の単語間にポーズを挿入することも可能である。
【0078】
このような規則を用いてテキスト変換を実施した場合の例を、図6に示す。
図6の上側に示される単語列501は、入力テキストを図1の言語処理部102で解析した結果得られる、変換前の単語列である。
【0079】
この変換前の単語列501の中で、図4(a)の発音パターン301((子音・拗音)(子音・拗音)の組み合わせ)に該当するのは、単語列501aの「首相(シュショー)」と、単語列501bの「競技者(キョーギシャ)および表彰(ヒョウショー)」である。よって、図1の発音パターン抽出部104による発音規則テーブル111を用いた検索の結果として、単語列501a,501bが抽出される。
【0080】
次に、図1のテキスト変換処理部105は、抽出された単語列501aおよび単語列501bに適用すべきテキスト変換規則を、テキスト変換規則テーブル112を検索して見つけ出す。すなわち、単語列501aは、図5に示されるテキスト変換規則401に該当する。また、単語列501bは、テキスト変換規則403に該当する。そこで、テキスト変換処理部105は、単語列501aを別の単語502aに置換し、単語列501bの連続する名詞間に助詞を挿入する処理を行う。
【0081】
このようにして、音声による読み上げに適したテキスト502が得られる。音声波形合成前の自然言語処理によって、入力テキストが読み上げを考慮したテキストに変換されているので、聞き取りやすい明快な音声の出力が可能となる。
【0082】
なお、テキスト変換の結果は、原則として音声による読み上げに反映されるものであるが、必ずしもこれに限定されるものではなく、読み上げは行わずに、図1の表示部110(図7のディスプレイ603)に表示させるだけでもよい。
【0083】
例えば、放送局のなどの放送現場では、書き言葉で書かれた記事原稿をニュース放送で読み上げるのに適した文章表現に修正し、アナウンサーが読み上げるという手順でニュース放送が行われるのが一般的である。しかし、突発的に発生した事件などの場合は、記事原稿をニュース原稿に書き換えるための十分な時間が確保できないことも多い。
【0084】
このような場合には、アナウンサーの負担軽減のために、書き言葉で書かれた記事原稿のテキストの中で、聞き取りにくい個所を自動的に判断し、置き換えるべき話し言葉の表現例を、読み上げ前に提示するようなシステムがあると便利である。本発明は、このような用途にも使用できるものである。
【0085】
また、図1の音声合成装置では、発音規則テーブル111およびテキスト変換規則テーブル112は書き換えが可能なテーブルである。つまり、テキスト変換規則入出力部114およびテキスト変換規則管理部113を用いて、発音規則テーブル111やテキスト変換規則テーブル112をユーザーに提示でき、また、ユーザー自らが、規則を追加,修正等することができる。
【0086】
したがって、各規則テーブルを構築する労力が軽減されると共に、ユーザーのニーズに合致した規則を効率的に蓄積して、ユーザーが使いやすい規則テーブルを構築していくことができる。すなわち、原稿を書きかえる作業者が持っている、書き言葉から話し言葉への変換に関するノウハウを効率的にシステムに蓄積できる。
【0087】
以上説明したように、本実施の形態の音声合成装置(自然言語処理装置)によれば、発音規則テーブル111に登録した聞き取りにくい発音のパターンを用いて、単語単位だけではなく、複合語を構成する連続する単語の読みに関しても聞き取りにくさを判定することができる。そして、テキスト変換規則テーブル112に登録されている変換規則を用いてテキスト変換を実行して、単語単位では置き換えが不可能であった複合語に関しても、より聞き取りやすい表現に置き換えることができる。
【0088】
また、例えば、抽出された単語列に対して変換規則を適用して変換すべき表現の候補をユーザーに提示し、また、その候補をユーザー自身が更新することもできできる。これによって、ユーザの現実のニーズに対応した話し言葉への変換規則を、効率的に蓄積できる。
【0089】
【発明の効果】
以上説明したように本発明によれば、書き言葉で書かれた入力のテキストに含まれる聞き取りにくい表現を、聞き取りやすい表現に置き換えて、分かりやすい読み上げ音声として提供することが可能である。また、ユーザーの現実のニーズに合致した発音規則や変換規則を効率的に蓄積することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1にかかる音声合成装置(自然言語処理装置を含む)のブロック図
【図2】実施の形態1にかかる音声合成装置におけるテキスト変換処理の手順を示すフロー図
【図3】入力テキストの単語列への分割の一例を示す図
【図4】(a) 発音規則の内容の一例を示す図
(b) 発音記号の分類を説明するための図
【図5】テキスト変換規則の内容の一例を示す図
【図6】テキスト変換の一例を示す図
【図7】本発明を実施するためのコンピュータシステムの一例を示す図
【符号の説明】
101 テキスト入力部
102 言語処理部
103 テキスト変換部
104 発音パターン抽出部
105 テキスト変換処理部
106 構文解析部
107 韻律情報生成部
108 音声波形合成部
109 音声出力部
111 発音規則テーブル
112 テキスト変換規則テーブル
113 テキスト変換規則管理部
114 テキスト変換規則入出力部

Claims (6)

  1. (子音・拗音)(子音・拗音)と(子音・拗音)(子音・母音)(子音・拗音)とのいずれか少なくとも1つの発音パターンが登録されている発音規則テーブルと入力されたテキストとを照合して、前記入力されたテキストから前記発音パターンを含む部分を抽出する第1のステップと、
    テキスト変換規則テーブルに登録されている変換規則に基づき、抽出された前記部分に含まれる単語または複合語を他の単語または他の複合語に置換する処理、あるいは前記複合語を構成する単語間に助詞またはポーズを挿入する処理を実行する第2のステップと、を含むことを特徴とする自然言語処理方法。
  2. 前記複合語を構成する、隣接する2つの単語の隣接部分に前記発音パターンが存在し、かつ、前記2つの単語が共に名詞である場合に、前記2つの単語間に助詞またはポーズを挿入することを特徴とする請求項1に記載の自然言語処理方法。
  3. 前記発音規則テーブルに登録されている前記発音パターンまたは前記テキスト変換規則テーブルに登録されている前記変換規則を、外部に提示可能としたことを特徴とする請求項1に記載の自然言語処理方法。
  4. 前記第発音規則テーブルに登録されている前記発音パターンまたは前記テキスト変換規則テーブルに登録されている前記変換規則を、外部から補正することができるようにしたことを特徴とする請求項1に記載の自然言語処理方法。
  5. 自然言語処理装置に、
    (子音・拗音)(子音・拗音)と(子音・拗音)(子音・母音)(子音・拗音)とのいずれか少なくとも1つの発音パターンが登録されている発音規則テーブルと入力されたテキストとを照合して、前記入力されたテキストから前記発音パターンを含む部分を抽出する第1のステップと、
    テキスト変換規則テーブルに登録されている変換規則に基づき、抽出された前記部分に含まれる単語または複合語を他の単語または他の複合語に置換する処理、あるいは前記複合語を構成する単語間に助詞またはポーズを挿入する処理を実行し、前記入力されたテキストを読み上げることを前提としたテキストに変換する第2のステップと、を実行させるためのプログラムを記録したことを特徴とするコンピュータが読み取り可能な自然言語処理用記録媒体。
  6. 日本語の入力テキストを単語列に分割し、単語列の各単語に対して読み、品詞などの言語情報を付与する言語処理手段と、
    (子音・拗音)(子音・拗音)と(子音・拗音)(子音・母音)(子音・拗音)とのいずれか少なくとも1つの発音パターンが登録されている発音規則テーブルと
    前記発音規則テーブルに登録されている前記発音パターンに該当する、前記言語処理手段から出力される単語列を、音声読み上げに適した単語列に変換するためのテキスト変換規則が登録されているテキスト変換規則テーブルと、
    前記言語処理手段から出力される単語列を前記発音規則テーブルと照合し、前記発音パターンに該当する単語または複数の単語からなる複合語を抽出し、抽出された前記単語または複合語に対して、前記テキスト変換規則テーブルに格納されている前記テキスト変換規則を適用して単語または複合語に置換する処理、あるいは前記複合語を構成する単語間に助詞またはポーズを挿入する処理を実行するテキスト変換手段と、
    前記テキスト変換手段から出力される単語列に付与された言語情報から音声波形を合成するのに必要な発音系列、ピッチ、パワーなどの韻律情報を生成する韻律情報生成手段と、
    前記韻律情報生成手段の出力する韻律情報に従って音声波形を合成する音声波形合成手段と、を有することを特徴とする音声合成装置。
JP34299298A 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 Expired - Lifetime JP3706758B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34299298A JP3706758B2 (ja) 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34299298A JP3706758B2 (ja) 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置

Publications (2)

Publication Number Publication Date
JP2000172289A JP2000172289A (ja) 2000-06-23
JP3706758B2 true JP3706758B2 (ja) 2005-10-19

Family

ID=18358109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34299298A Expired - Lifetime JP3706758B2 (ja) 1998-12-02 1998-12-02 自然言語処理方法,自然言語処理用記録媒体および音声合成装置

Country Status (1)

Country Link
JP (1) JP3706758B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4636673B2 (ja) * 2000-11-16 2011-02-23 パナソニック株式会社 音声合成装置および音声合成方法
US6876968B2 (en) * 2001-03-08 2005-04-05 Matsushita Electric Industrial Co., Ltd. Run time synthesizer adaptation to improve intelligibility of synthesized speech
JP4811557B2 (ja) * 2005-02-18 2011-11-09 独立行政法人情報通信研究機構 音声再生装置及び発話支援装置
JP2006284645A (ja) * 2005-03-31 2006-10-19 Nec Corp 音声再生装置およびその再生プログラムならびにその再生方法
JP4114888B2 (ja) 2005-07-20 2008-07-09 松下電器産業株式会社 声質変化箇所特定装置
JP5493537B2 (ja) * 2009-07-24 2014-05-14 富士通株式会社 音声認識装置、音声認識方法及びそのプログラム
CN106233373B (zh) * 2014-04-15 2017-07-07 三菱电机株式会社 信息提供装置及信息提供方法
EP2933070A1 (en) 2014-04-17 2015-10-21 Aldebaran Robotics Methods and systems of handling a dialog with a robot

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60208799A (ja) * 1984-04-02 1985-10-21 松下電器産業株式会社 音声分析合成装置
JPH0335296A (ja) * 1989-06-30 1991-02-15 Sharp Corp テキスト音声合成装置
JP2575252B2 (ja) * 1991-12-26 1997-01-22 沖電気工業株式会社 発音辞書管理方法
JP3446342B2 (ja) * 1994-10-26 2003-09-16 ソニー株式会社 自然言語処理方法および音声合成装置
JPH1078795A (ja) * 1996-09-04 1998-03-24 Secom Co Ltd 音声合成装置
JPH10228471A (ja) * 1996-12-10 1998-08-25 Fujitsu Ltd 音声合成システム,音声用テキスト生成システム及び記録媒体
JPH10171485A (ja) * 1996-12-12 1998-06-26 Matsushita Electric Ind Co Ltd 音声合成装置
JPH10187179A (ja) * 1996-12-26 1998-07-14 Canon Inc 音声合成方法および装置

Also Published As

Publication number Publication date
JP2000172289A (ja) 2000-06-23

Similar Documents

Publication Publication Date Title
US7263488B2 (en) Method and apparatus for identifying prosodic word boundaries
US8027837B2 (en) Using non-speech sounds during text-to-speech synthesis
US7496498B2 (en) Front-end architecture for a multi-lingual text-to-speech system
JP4745036B2 (ja) 音声翻訳装置および音声翻訳方法
JP4038211B2 (ja) 音声合成装置,音声合成方法および音声合成システム
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
JP2000081892A (ja) 効果音付加装置および効果音付加方法
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JP4811557B2 (ja) 音声再生装置及び発話支援装置
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
Gibbon et al. Representation and annotation of dialogue
Ronzhin et al. Survey of russian speech recognition systems
GB2378877A (en) Prosodic boundary markup mechanism
NithyaKalyani et al. Speech summarization for tamil language
El-Imam et al. Rules and algorithms for phonetic transcription of standard Malay
JP6998017B2 (ja) 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム
Anto et al. Text to speech synthesis system for English to Malayalam translation
JP3029403B2 (ja) 文章データ音声変換システム
Gibbon et al. Spoken Language Characterization
JP4575798B2 (ja) 音声合成装置及び音声合成プログラム
JPH03196198A (ja) 音声規則合成装置
JP2004138661A (ja) 音声素片データベース作成方法、音声合成方法、音声素片データベース作成装置、音声合成装置、音声データベース作成プログラム、音声合成プログラム
JP2003030184A (ja) 自然言語処理装置および自然言語処理方法、並びにプログラムおよび記録媒体
Lindström et al. A two-level approach to the handling of foreign items in Swedish speech technology applications.

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050801

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100805

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120805

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130805

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130805

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term