JP2008164785A - 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置 - Google Patents

読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置 Download PDF

Info

Publication number
JP2008164785A
JP2008164785A JP2006352305A JP2006352305A JP2008164785A JP 2008164785 A JP2008164785 A JP 2008164785A JP 2006352305 A JP2006352305 A JP 2006352305A JP 2006352305 A JP2006352305 A JP 2006352305A JP 2008164785 A JP2008164785 A JP 2008164785A
Authority
JP
Japan
Prior art keywords
word
accent
compound
compound word
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006352305A
Other languages
English (en)
Other versions
JP4794429B2 (ja
Inventor
Hideki Kojima
英樹 小島
Kentaro Murase
健太郎 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006352305A priority Critical patent/JP4794429B2/ja
Publication of JP2008164785A publication Critical patent/JP2008164785A/ja
Application granted granted Critical
Publication of JP4794429B2 publication Critical patent/JP4794429B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】複合単語辞書に登録されていない複合単語のアクセントの予測精度を向上させる。
【解決手段】テキスト入力部2と、テキストを単語群に分割する形態素解析部3と、複合単語のアクセント結合様式を表すデータを含むデータを記録する複合単語辞書記録部81、82と、分割された単語群に含まれる含有複合単語を複合単語辞書記録部81、82に対して検索する複合単語検索部4と、検索の結果、含有複合単語が見つからなかった場合、類似する複数の類似複合単語を検索し、複数の類似複合単語のアクセント結合様式に基づいて含有複合単語のアクセント結合様式を決定するアクセント結合決定部5と、所定のアクセント結合規則に基づいてその他の単語群のアクセント結合様式を決定するアクセント結合規則適用部6と、アクセント情報を含む前記テキストの読み情報を生成する読み情報生成部7とを備える。
【選択図】図1

Description

本発明は、音声合成技術において、読み上げ対象のテキスト中に含まれている複合単語のアクセントを判定し、アクセント情報を含むテキストの読み情報を生成する装置、方法およびプログラムに関する。
テキストから音声を合成するテキスト音声合成技術は、例えば、IVR(自動音声応答:Interactive Voice Response)システム、車載情報端末、携帯電話での操作方法ガイダンスやメール読み上げ、視覚障害者・発話障害者の支援などに適用されている。日本語テキスト音声合成技術において、読み上げ対象となるテキストのアクセントの正確な予測は、合成音声の了解性・自然性を確保するために非常に重要な技術である。
まず、日本語標準語(または共通語)のアクセントについての既知の事実を説明する。日本語標準語アクセントの特徴は次の3点である。(1)アクセントは各拍に与えられる「高」「低」の2値で表される。(2)アクセントを構成する単位であるアクセント句において、その第1拍と第2拍は「高低」「低高」のいずれかである。(3)1アクセント句内では「高」から「低」への移行はないか、もしくは一箇所である。
例えば、「日本(ニホン)」は3拍の単語で、そのアクセントは「低高低」である。ここでは、一例として、アクセントが「高」から「低」に移行する位置(アクセント核と称する)を「’」で表し、「ニホ’ン」のように表記する。また「日本絹織物」は「ニホ’ン」「キヌオ’リモノ」の2個のアクセント句からなる。ここでは、一例として、アクセント句の境界を「_」で表し、「ニホ’ン_キヌオ’リモノ」のように表記する。
日本語標準語において、個々の単語のアクセントはおおよそ決まっており、例えば、アクセント辞典に示されている。しかし、複数の単語が連続して構成される複合単語のアクセントについては、明記されたものはない。複合単語は日々新しいものが現われるため、複合単語のアクセントを示す情報を得るには、その複合単語を構成する個々の単語のアクセントから複合単語のアクセントを予測する必要がある。
ここで、複合単語におけるアクセント結合について説明する。例えば、「音声(オ’ンセー)」と「合成(ゴーセー)」から複合単語「音声合成(オンセーゴ’ーセー)」が作られる場合、個々の単語「オ’ンセー」と「ゴーセー」において、それぞれ1アクセント句だったものが結合し、複合単語として1個のアクセント句「オンセーゴ’ーセー」となる。このとき、アクセント核の位置が変化している。このように複数のアクセント句が1個のアクセント句になることをアクセント結合と称する。一方で、「成績(セーセキ)」と「優秀(ユーシュー)」から複合単語「成績優秀(セーセキ_ユーシュー)」が作られる例では、アクセント結合は起こらず、もとの単語それぞれのアクセント句がそのまま維持されている。
3単語以上の複合単語では、アクセント結合のパターンは複雑である。例えば、「日本インターネット協会(ニホ’ン_インターネットキョ’ーカイ)」のように、前の1単語のアクセント句はそのままで、後ろの2単語のアクセント句がアクセント結合する場合や、「日本列島縦断(ニホンレ’ットー_ジューダン)」のように、前に2単語でアクセント結合する場合等、複数のアクセント結合のパターンがある。そのため、複合単語のアクセントの正確な予測は非常に難しくなっている。
従来、複合単語のアクセントを予測するため、単語の拍数やアクセント型によってアクセント結合の様式を分類し、体系的なアクセント結合規則を導出する試みがなされている(例えば、非特許文献1参照)。また、複合語のアクセント判定のために、例えば、下記(1)〜(3)のようなアクセント結合規則が提案されている(例えば、特許文献1参照)。(1)接尾語の直後、接頭語の直前をアクセント句境界とする。(2)時詞(「今日」「明日」など時を表す単語)の直後をアクセント句境界とする。(3)先頭から2単語ずつアクセント結合する。
また、アクセント結合規則が当てはまらないような複合単語について、個々の複合単語について、アクセント結合様式を記録した複合単語辞書を利用して、複合単語のアクセントを判定する方法が開示されている(例えば、特許文献2参照)。
佐藤大和著、杉藤美代子編 「講座 日本語と日本語教育 第2巻 日本語の音声・音韻(上) 複合単語におけるアクセント結合規則と連濁規則」、明治書院、1989年、p233−265 特開平8―314901号公報 特開平9−152883号公報
しかしながら、上記の非特許文献1および特許文献1のようなアクセント結合規則を用いて複合単語のアクセントを予測する場合においては、どのような場合にも当てはまるアクセント結合規則を導出するのが難しい。この場合、アクセント結合規則を大量に記録しておいても、アクセント結合規則にあてはまらない例外が存在する。また、上記特許文献2のように、複合単語のアクセント結合様式を記録した複合単語辞書を利用する場合においても、非常に大量の複合単語を登録する必要がある。そして、非常に大量の複合単語を登録しても、日本語の複合単語を全て網羅することは不可能であった。そのため、複合単語辞書にない複合単語については、アクセントの予測精度が低下するという課題があった。
そこで、本発明は、複合単語辞書に登録されていない複合単語についてもアクセントの予測精度を向上させることができる読み情報生成装置、読み情報生成方法、および読み情報生成プログラムを提供することを目的とする。
本発明にかかる読み情報生成装置は、任意のテキストを入力するテキスト入力部と、単語の表記、読み、品詞およびアクセント情報を、複数の単語について予め登録しておく基本単語辞書記録部と、前記テキスト入力部が入力した前記テキストの形態素解析を行うことによって、前記テキストを単語群に分割し、それぞれの単語について前記基本単語辞書記録部を検索して、各単語の表記、読み、品詞およびアクセント情報を生成する形態素解析部と、連続する複数の単語で構成された複合単語に関するデータであって、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを複数の登録複合単語群それぞれについて予め登録しておく複合単語辞書記録部と、前記形態素解析部によって分割された単語群に含まれる複合単語である含有複合単語と同じ登録複合単語を前記複合単語辞書記録部に対して検索し、検索の結果、前記含有複合単語と同じ登録複合単語が見つかった場合、当該登録複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定する複合単語検索部と、前記複合単語検索部による検索の結果、前記含有複合単語と同じ登録複合単語が見つからなかった場合、前記含有複合単語を構成する各単語と、前記複合単語辞書記録部に記録された登録複合単語を構成する各単語とを比較することにより、前記含有複合単語に類似する複数の類似複合単語を前記複合単語辞書記録部から検索し、前記複数の類似複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定するアクセント結合決定部と、前記形態素解析部によって分割された前記単語群のうち、前記複合単語検索部またはアクセント結合決定部によってアクセント結合様式が決定されていない単語について、所定のアクセント結合規則に基づいてアクセント結合様式を決定するアクセント結合規則適用部と、前記複合単語検索部または前記アクセント結合決定部によって決定されたアクセント結合様式および、前記アクセント結合規則適用部によって決定されたアクセント結合様式に基づいて、前記テキストのアクセント情報を生成し、当該アクセント情報を含む前記テキストの読み情報を生成する読み情報生成部とを備える。
入力されたテキストを形態素解析により分割して得られた単語群に含まれる含有複合単語と同じ登録複合単語が複合単語辞書記録部に記録されていない場合、アクセント結合決定部は、登録複合単語を構成する各単語と、前記含有複合単語を構成する各単語とを比較することにより、含有複合単語に類似する複数の類似複合単語を複合単語辞書記録部から検索する。そして、アクセント結合決定部は、検索した複数の類似複合単語のアクセント結合様式に基づいて、含有複合単語のアクセント結合様式を決定する。そのため、アクセント結合決定部は、含有複合単語と同じ複合単語が複合単語辞書に記録されていないときでも、含有複合単語に類似した類似複合単語のアクセント結合様式を基に、含有複合単語の適切なアクセント結合様式を決定することができる。また、前記複合単語検索部またはアクセント結合決定部によってアクセント結合様式が決定されていない単語については、アクセント結合規則適用部によって、所定のアクセント結合規則に基づいたアクセント結合が適用される。その結果、読み情報生成部は、含有複合単語およびその他の単語群について適切なアクセント情報を生成し、そのようなアクセント情報を含む読み情報を生成することができる。したがって、複合単語辞書に登録されていない複合単語を含むテキストにおいて、アクセント結合の予測精度が向上することになる。また、一定のアクセント予測精度を確保するために複合単語辞書に記録する複合単語の数が少なくてすむようになる。
本発明にかかる読み情報生成装置において、前記複合単語辞書記録部は、登録複合単語を構成する各単語に関する情報を表すデータとして、各単語の表記、読み、品詞および意味属性を含むデータを記録し、前記アクセント結合決定部は、複合単語を構成する各単語の単語数、表記、読み、品詞、拍数、意味属性のうち少なくとも1つについて、前記含有複合単語と、前記複合単語辞書記録部に記録された各登録複合単語との間で比較することにより、前記複数の類似複合単語を検索することが好ましい。
複合単語を構成する各単語の単語数、表記、読み、品詞、拍数、意味属性のうち少なくとも1つが似ている複合単語間では、アクセント結合の有無や様式も似ている可能性が高い。したがって、アクセント結合決定部は、複合単語を構成する各単語の単語数、表記、読み、品詞、意味属性のうち少なくとも1つについて、含有複合単語と登録複合単語とを比較することで、アクセント結合が同じである可能性が高い複合単語を類似複合単語として検索することができる。
ここで「品詞」とは、国文法上の分類である「名詞・形容詞・動詞・副詞・接続詞・感動詞・助詞・助動詞」等の分類に加えて、例えば、「固有名詞・普通名詞・接尾語・接頭語・・時詞・数詞」等のような「名詞」のさらなる分類も含むものとする。また、例えば、「固有名詞」のさらなる分類(例えば、人名、地名等)も品詞に含まれるものとする。品詞にどのような分類が含まれるかは、発明の実施態様に応じて任意に決定される設計事項である。
本発明にかかる読み情報生成装置において、前記アクセント結合決定部は、前記含有複合単語を構成する単語の数と前記各登録複合単語を構成する単語の数との相違、前記含有複合単語を構成する単語群と各登録複合単語を構成する単語群とで一致しない構成単語の数に加えて、下記(a)〜(e)の少なくとも1つを基準として類似度を計算し、類似度を基に複数の類似複合単語を検索することが好ましい。
(a)前記一致しない構成単語における品詞の相違
(b)前記一致しない構成単語における拍数の相違
(c)前記一致しない構成単語における意味属性の相違
(d)前記一致しない構成単語において読みが一致する拍の数
(e)前記一致しない構成単語におけるアクセント型の相違
これにより、アクセント結合決定部は、含有複合単語と、各登録複合単語との類似度を計算することができる。そのため、アクセント結合決定部は、計算した類似度を基に、類似複合単語を、登録複合単語群から検索することができる。
本発明にかかる読み情報生成装置において、前記アクセント結合決定部は、前記複合単語辞書記録部から検索した複数の類似複合単語のアクセント結合様式のうち、最も出現頻度が高いアクセント結合様式を、前記含有複合単語のアクセント結合様式として決定することが好ましい。
アクセント結合決定部は、含有複合単語に類似する類似複合単語において最も出現頻度が高いアクセント結合様式を、含有複合単語のアクセント結合様式とするので、含有複合単語の正しいアクセント結合様式を決定する可能性が高くなる。
本発明にかかる読み情報生成装置は、ユーザが登録した複数の登録複合単語について、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを記録し、前記複合単語辞書記録部と合わせて、前記複合単語検索部および前記アクセント結合決定部が検索に用いることができるユーザ複合単語辞書記録部をさらに備えてもよい。
このようなユーザ複合単語辞書記録部により、ユーザが登録した複合単語およびそれに類似する複合単語のアクセント予測精度が向上する。そのため、例えば、ユーザがよく使う複合単語をユーザ複合単語辞書記録部に登録することで、ユーザの使用態様に対応した複合単語のアクセント予測が可能になる。
本発明にかかる読み情報生成装置は、ユーザが登録した少なくとも1つの単語について、単語の表記、読み、品詞およびアクセント情報を記録し、前記基本単語辞書記録部と合わせて、前記形態素解析部が検索に用いることができるユーザ単語辞書記録部をさらに備えてもよい。これにより、形態素解析部は、ユーザによって登録された単語についても検索対象とするので、ユーザの使用する単語についての形態素解析の精度が向上する。
本発明にかかる音声合成装置は、本発明にかかる読み情報生成装置を含む音声合成装置であって、前記読み情報生成部が生成した読み情報に基づいて、音声波形を合成して出力する音声合成部を備える。上記構成により、音声合成装置は、入力されたテキストに含まれる複合単語を精度よく予測されたアクセントで読み上げる音声を出力することができる。
本発明によれば、複合単語辞書に登録されていない複合単語についてもアクセントの予測精度を向上させることができる読み情報生成装置、読み情報生成方法、および読み情報生成プログラムを提供することができる。
図1は、本実施形態における読み情報生成装置を含む音声合成装置の構成を表す機能ブロック図である。図1に示す読み情報生成装置1は、テキスト入力部2、形態素解析部3、複合単語検索部4、アクセント結合決定部5、アクセント結合規則適用部6、読み情報生成部7、記録部8、ユーザ辞書登録部9を備える。記録部8には、基本単語辞書81、ユーザ単語辞書82、基本複合単語辞書83、ユーザ複合単語辞書84、アクセント結合規則85が記録されている。また、読み情報生成装置1は、音声合成装置10に含まれている。音声合成装置10は、読み情報生成装置1に加えて、音声合成部11およびスピーカ12を備える。
読み情報生成装置1を含む音声合成装置10は、例えば、パーソナルコンピュータやサーバマシン等の汎用コンピュータによって構成される。また、汎用コンピュータに限らず、例えば、車載情報端末、携帯電話、家電製品等の電子機器に組み込まれたコンピュータによって音声合成装置10が構成されてもよい。テキスト入力部2、形態素解析部3、複合単語検索部4、アクセント結合決定部5、アクセント結合規則適用部6、読み情報生成部7、ユーザ辞書登録部9、音声合成部11の各機能は、CPUが所定のプログラムを実行することによって実現される。したがって、上記の各機能をコンピュータで実現するためのプログラムまたはそれを記録した記録媒体も本発明の一実施態様である。また、記録部8は、コンピュータの内蔵記憶装置またはこのコンピュータからアクセス可能な記憶装置によって具現化される。
読み情報生成装置1の記録部8において、基本単語辞書81およびユーザ単語辞書82には、複数の単語の表記、読み、品詞、アクセント情報が記録されている。アクセント情報は、例えば、アクセント型を示すデータである。基本単語辞書81は、予め用意された単語のデータを記録する。ユーザ単語辞書82は、ユーザが、ユーザ辞書登録部9を介して登録した単語のデータを記録する。
また、基本複合単語辞書83およびユーザ複合単語辞書84には、複数の複合単語について、それぞれ複合単語データが記録される。複合単語データには、例えば、複合単語のアクセント結合様式、ならびに複合単語を構成する単語(以下、構成単語と称する)の数、構成単語の表記、読みおよび品詞が含まれている。基本複合単語辞書83は、予め用意された複合単語の複合単語データを記録する。ユーザ複合単語辞書84は、ユーザが、ユーザ辞書登録部9を介して登録した複合単語に関するデータを記録する。以下、基本複合単語辞書83またはユーザ複合単語辞書84に記録されている複合単語を、登録複合単語と称する。
ユーザ辞書登録部9は、ユーザインタフェースを備え、ユーザから入力される、単語または複合単語に関するデータに基づいて、ユーザ単語辞書82、およびユーザ複合単語辞書84を更新する。これにより、ユーザは、ユーザ単語辞書82、およびユーザ複合単語辞書84を適宜編集することができる。
アクセント結合規則85には、例えば、名詞・動詞・形容詞・形容動詞などの自立語と、助詞・助動詞などの付属語とのアクセント結合様式等のように、一定の規則性を持ったアクセント結合様式を表すデータが記録される。本実施形態においては、このように、一定の規則性を持ったアクセント結合様式を表わすデータは、アクセント結合規則85に記録される。そして、このアクセント結合規則85に記録されたデータが表わすアクセント結合様式の有する規則性に当てはまらないような複合単語のアクセント結合様式が、基本複合単語辞書83およびユーザ複合単語辞書84に記録される。
テキスト入力部2は、音声による読み上げ対象のテキストデータを入力する。テキスト入力部2は、例えば、キーボードやマウス等の入力デバイスを介してユーザからテキストデータの入力を受け付けてもよいし、コンピュータが備えるメモリ等に記録されたテキストデータを読み込んでもよい。また、テキスト入力部2は、読み情報生成装置1に対して読み情報の生成を命令する上位アプリケーションからテキストデータを受け取ってもよい。
形態素解析部3は、基本単語辞書81およびユーザ単語辞書82を用いて、テキスト入力部2が入力したテキストデータに対して形態素解析を行う。テキストデータは、形態素解析により、複数の単語に分割される。分割された各単語について、読み、品詞、アクセント情報が生成される。形態素解析の方法として、例えば、ビタビ(Viterbi)アルゴリズムや最長一致法等が挙げられるが、本発明に用いられる形態素解析の方法は、特定のものに限定されない。
複合単語検索部4は、形態素解析部3によりテキストデータが分割されてできた複数の単語群のうち、例えば、名詞が連続する区間を複合単語として抽出する。複合単語検索部4は、この抽出した複合単語(以下、判定対象複合単語と称する)を、基本複合単語辞書83およびユーザ複合単語辞書84から検索する。ここで、判定対象複合単語となる、名詞が連続する区間は、例えば、普通名詞・固有名詞・地名・人名・接頭語・接尾語などの名詞をさらに分類した品詞に属する単語が、それ以外の品詞の単語を挟まずに連続する区間とする。例えば、「ボランティア向上委員会」や「セミナー開始予定時刻」等が判定対象複合単語となる。
なお、上記の名詞の分類方法は一例であり、これに限られない。また、本実施形態では、複合単語検索部4が判定対象複合単語とする複合単語は、名詞が連続する区間である場合の例を説明しているが、判定対象複合単語はこれに限られない。複合単語検索部4は、名詞が連続する区間でなくても、例えば、後述するアクセント結合規則に当てはまらないアクセント結合様式を持つ単語列を判定対象複合単語とすることができる。
上記検索の結果、判定対象複合単語と同じ登録複合単語が基本複合単語辞書83またはユーザ複合単語辞書84に見つかった場合、複合単語検索部4は、その登録複合単語のアクセント結合様式を、判定対象複合単語のアクセント結合様式に決定する。判定対象複合単語と同じ登録複合単語が基本複合単語辞書83およびユーザ複合単語辞書84いずれにも見つからなかった場合、複合単語検索部4は、アクセント結合決定部5に判定対象複合単語に類似する複数の複合単語を検索するように指示する。
アクセント結合決定部5は、基本複合単語辞書83およびユーザ複合単語辞書84に記録されている各登録複合単語の構成単語と、判定対象複合単語の構成単語とを比較することにより、判定対象複合単語に類似する複数の類似複合単語を検索する。検索の結果、類似対象複合単語が見つかった場合、アクセント結合決定部5は、それら複数の類似複合単語のアクセント結合様式に基づいて、判定対象複合単語のアクセント結合様式を決定する。アクセント結合決定部5は、類似複合単語を検索する際の類似性の判断に、例えば、(1)複合単語を構成する単語数、(2)構成単語のうち一致する(または一致しない)構成単語の数、(3)一致しない構成単語の品詞、意味属性、拍数、アクセント型、読みが一致する拍数等を用いることができる。類似性を判断する処理およびアクセント結合様式を決定する処理の詳細は後述する。
アクセント結合規則適用部6は、複合単語以外の単語に関して、アクセント結合規則85に従ってアクセント結合様式を決定する。また、アクセント結合規則適用部6は、複合単語検索部4およびアクセント結合決定部5でアクセント結合様式が決定されなかった複合単語についても、アクセント結合規則85に従ったアクセント結合様式を表すデータを取得する。
読み情報生成部7は、複合単語検索部4が取得したアクセント結合様式を表わすデータまたはアクセント結合決定部5が決定したアクセント結合様式、およびアクセント結合規則適用部6が決定したアクセント結合様式を基にアクセント情報を生成し、そのアクセント情報を含む前記テキストの読み情報、例えば音声合成用の中間表記を生成する。この読み情報におけるアクセント情報には、例えば、アクセント句の境界を表わす情報や、アクセント核の位置を表わす情報等が含まれる。
音声合成部11は、読み情報生成部7が生成した中間表記に基づいて、音声波形信号を合成してスピーカ12に出力する。スピーカ12は、音声合成部11から出力された音声波形信号を音声に変換する。これにより、テキスト入力部2で入力されたテキストデータが音声として読み上げられる。音声合成部11の、中間表記から音声波形信号を生成する機能には、例えば、波形編集方式、LSP方式、PARCOR方式など公知の技術を用いることができる。
次に、読み情報生成装置1の動作の具体例を説明する。そのために、まず、記録部8に記録されるデータの具体例を説明する。図2は、基本単語辞書81に記録されるデータの内容の一例を示す図である。図2に示す例では、各単語の表記、品詞、読み、拍数、アクセント型が格納されている。なお、拍数は単語の読みから求められるので、必ずしも登録しておく必要はない。必要に応じて読みから算出することができる。
ここで、拍は、一定の時間的長さを持った音の分節単位である。拍は、モーラと称されることもある。日本語の場合、仮名書きしたときの1つの仮名が同じ長さで発音されるので、1つの仮名が1拍になる。ただし、小さい仮名「ぁ」「ぃ」「ぅ」「ぇ」「ぉ」「ゃ」「ゅ」「ょ」は、前の仮名とあわせて1拍となる。また、長音「ー」、促音「っ」、撥音「ん」は1拍となる。日本語のテキストデータを形態素解析することによって得られる読み文字列から、例えば、上記の1拍を決める規則に従って、自動的にその拍数を計算することができる。なお、1拍を決める規則は必ずしも上記に限られるものではない。
ここでアクセント型とは、該当する単語のアクセントが「高」から「低」に移行するときの「高」の拍位置を示しており、例えば、「ボランティア」のアクセント型「2」は、アクセントが「ボラ’ンティア」となることを示している。この表記と品詞を用いて、形態素解析部3において入力テキストの形態素解析が行われる。なお、ユーザ単語辞書82のデータ構造も図2に示す構造と同様にすることができる。
図3は、基本複合単語辞書83に記録されるデータの例を示す図である。なお、基本複合単語辞書83とユーザ複合単語辞書84は、装置にあらかじめ用意されたデータか、ユーザが登録したデータかの違いであって、データの構造は同様である。図3に示す例では、「京都ボランティア大会」という複合単語について、構成単語数「3」が記録されており、さらに、構成単語「京都」「ボランティア」「大会」それぞれの表記、読み、品詞、拍数が記録されている。
また、図3に示す例では、「京都ボランティア大会」のアクセントを設定するにあたっての、構成単語のアクセント結合様式を表すデータが記録されている。アクセント結合様式を表すデータは、例えば、複合単語におけるアクセント結合の有無、またはアクセント結合の仕方を表すデータである。アクセント結合の仕方は、例えば、結合後のアクセント核の位置を示すデータ等で表される。図3に示す例では、「京都」はアクセント結合せず、「ボランティア」と「大会」はアクセント結合することを示している。また「結合アクセント型:+1型」とは、2単語がアクセント結合するときに、後にあるほうの単語の1拍目にアクセント核がくることを意味する。
なお、本実施形態では、結合アクセント型に、「平板型」、「+0型」、「+N型」が含まれる場合の例を説明する。平板型のアクセント結合においては、2つのアクセント句が結合して、アクセントのないアクセント句になる。例えば、「類似(ルイジ)」と「性(セ’ー)」が結合して「類似性(ルイジセー)」となる場合が平板型のアクセント結合である。
+0型のアクセント結合においては、2つの単語のアクセント句が結合して、前にある方の単語の末尾にアクセント核がくる。例えば、「評価(ヒョ’ーカ)」と、「式(シ’キ)」が結合して、「評価式(ヒョーカ’シキ)」となる場合が+0型のアクセント結合である。
+N型のアクセント結合においては、2つの単語のアクセント句が結合して、後ろのある方の単語のN拍目にアクセント核がくる。+1型のアクセント結合の例として、「日本(ニホ’ン)」と「列島(レットー)」が結合して、「日本列島(ニホンレ’ットー)」になる場合が挙げられる。また、+2型のアクセント結合の例として、「蒸気(ジョーキ)」と「機関車(キカ’ンシャ)」が結合して「蒸気機関車(ジョーキキカ’ンシャ)」となる場合が挙げられる。
[動作例1]
次に図4を参照して、「私は兵庫ボランティア大会に参加しました。」というテキストデータが入力された場合の読み情報生成装置1の動作例を説明する。図4は、本動作例において、テキストデータが入力されてから読み情報が生成されるまでに扱われるデータの内容を表す図である。図4に示す内容のデータは、例えば、読み情報生成装置1の記録部8に一時的に記録される。テキスト入力部2は、図4に示すテキストデータ20「私は兵庫ボランティア大会に参加しました。」を入力する。次に、形態素解析部3がテキストデータ20に対して形態素解析を行い、表21の内容の形態素解析結果を生成する。表21の上段は、形態素解析によって分割された単語ごとの表記、品詞、読み(アクセント核の位置含む)を示している。表21の下段は、アクセント句の境界を示す。表21に示す例では、1つの単語が1つのアクセント句となっている。各単語の品詞、読み(アクセント核の位置含む)は、基本単語辞書81またはユーザ単語辞書82のデータを用いて決められる。
複合単語検索部4は、表21に示される分割された単語の列のうち、名詞が連続する名詞連続区間Aの「兵庫」「ボランティア」「大会」を判定対象複合単語として抽出する。そして、複合単語検索部4は、基本複合単語辞書83およびユーザ複合単語辞書84に対して、判定対象複合単語と同じ登録複合単語「兵庫ボランティア大会」を検索する。「兵庫ボランティア大会」が基本複合単語辞書83またはユーザ複合単語辞書84に存在する場合、複合単語検索部4は、その登録複合単語「兵庫ボランティア大会」のアクセント結合様式を表すデータを取得し、判定対象複合単語のアクセント結合様式とする。以下では、「兵庫ボランティア大会」が基本複合単語辞書83またはユーザ複合単語辞書84に存在しない場合について説明する。
この場合、アクセント結合決定部5は、「兵庫ボランティア大会」に類似した類似複合単語を複数検索する。類似複合単語の検索の詳細については、後述する。ここでは、一例として、基本複合単語辞書83またはユーザ複合単語辞書84のデータの中から、「京都ボランティア大会」、「兵庫テニス大会」、「大阪ボランティア大会」、「奈良ボランティア大会」が類似複合単語として見つかった場合について説明する。
図4中の表22a、22b、22c、22dは、それぞれ類似複合単語「京都ボランティア大会」、「兵庫テニス大会」、「大阪ボランティア大会」、「奈良ボランティア大会」が示すデータの内容を示す表である。例えば、図3に示すデータでは、類似複合単語「京都ボランティア大会」において、1番目の構成単語「京都」はアクセント結合なしを示している。2番目と3番目の構成単語である「ボランティア」と「大会」とが「アクセント結合あり」であり、そのアクセント型が「+1型」であることを示している。したがって、表22aに示すように、「京都ボランティア大会」においては、「ボランティア」と「大会」が1つのアクセント句になり、アクセント核の位置は、「タイカイ」の1拍目になっている。
また、表22b、22c、22dに示すように、類似複合単語「兵庫テニス大会」、「大阪ボランティア大会」、「奈良ボランティア大会」のアクセント結合様式も、同様に、最初の単語はアクセント結合せず、2番目と3番目の単語が「+1型」でアクセント結合するというものになっている。
アクセント結合決定部5は、複数の類似複合単語「兵庫テニス大会」、「大阪ボランティア大会」、「奈良ボランティア大会」のアクセント結合様式に基づいて、「兵庫ボランティア大会」に適用するアクセント結合様式を決定する。アクセント結合決定部5は、複数の類似複合単語のアクセント結合様式のうち、最も出現頻度が高いアクセント結合様式を、「兵庫ボランティア大会」のアクセント結合様式に決定することができる。図4に示す例では、4つの類似複合単語のアクセント結合様式は、いずれも「2番目と3番目の単語が「+1型」でアクセント結合する」というアクセント結合様式であるので、これが最も出現頻度が高いアクセント結合様式である。
アクセント結合決定部5は、表22a〜22dに示す類似複合単語「京都ボランティア大会」、「兵庫テニス大会」、「大阪ボランティア大会」、「奈良ボランティア大会」のアクセント結合様式を、判定対象複合単語「兵庫ボランティア大会」に適用する。その結果、表23に示すように、アクセント句およびアクセント核の位置が設定される。すなわち、名詞連続区間Aの「兵庫ボランティア大会」においては、「ボランティア」と「大会」が1つのアクセント句に結合され、アクセント核の位置は、「タ’イカイ」の1拍目に設定される。
このように、複数の類似複合単語のアクセント結合様式を基に、判定対象複合単語のアクセント結合様式を決定することにより、1つの類似複合単語のアクセント結合様式を基に決定するよりも、正しいアクセント結合様式が得られる可能性が高くなる。1つの類似複合単語のアクセント結合様式に基づいて決定した場合、そのアクセント結合様式が判定対象複合単語の真のアクセント結合様式と異なっていることにより、誤ったアクセント結合様式が決定される場合があるからである。
その後、アクセント結合規則適用部6は、名詞連続区間A以外の単語列に対して、アクセント結合規則85に従ってアクセント結合する。その結果、表24に示すように、アクセント句のおよびアクセント核の位置が設定される。表24においては、「私」と「は」が1つのアクセント句になり、「ボランティア」「大会」「に」も1つのアクセント句になり、さらに、「参加」「し」「まし」「た」「。」が1つのアクセント句になっている。このようなアクセント句の結合は、アクセント結合規則85に従って設定される。
ここでは、「私」「は」の区間について、例えば、「普通名詞に副助詞の“は”が続いた場合にアクセント結合をする」という規則がアクセント結合規則85に記録されており、アクセント結合規則適用部6はその規則を適用して「私は」を1つのアクセント区間にする。アクセント結合規則85には、公知の規則を用いることができる。
なお、もし、複合単語検索部4およびアクセント結合決定部5が、名詞連続区間Aの複合単語のアクセント結合様式を表すデータを取得できなかったときには、アクセント結合規則適用部6が、アクセント結合規則85に従ってこの複合単語のアクセントを設定してもよい。
読み情報生成部7は、表24に示すアクセント句およびアクセント核の位置を含むデータの内容に基づいて、中間表記25を生成する。中間表記25は、テキストの読み方を表す音声合成用の中間表記データである。中間表記25は、表24に含まれる各単語の読みを連結したのち、アクセント句の境界にアクセント句境界記号「_」を、各アクセント句のアクセン核の位置にアクセント記号「’」を記したものである。アクセント句境界記号「_」は、アクセント句の境界に設けられるポーズを表す。なお、中間表記25のフォーマットは、単なる一例であり、中間表記の表し方は、これに限られない。
音声合成部11は、中間表記25が示す読み情報に対応する音声波形を生成する。その際、アクセント核およびポーズも加味した音声波形が生成される。そのため、音声合成部11によって、中間表記25が示す読み情報が読み上げられると、適切なアクセントおよびポーズを伴う音声が読み上げられることになる。すなわち、了解性・自然性が確保された音声が出力される。
次に、アクセント結合決定部5が、判定対象複合単語に類似する類似複合単語を検索する処理の具体例を説明する。図5は、アクセント結合決定部5が類似複合単語を検索する動作の例を示すフローチャートである。ここでは、図4に示した判定対象複合単語「兵庫ボランティア大会」に類似する複数の複合単語を、図3に示した基本複合単語辞書83のデータから検索する場合の例を説明する。
アクセント結合決定部5は、まず、基本複合単語辞書83およびユーザ複合単語辞書84に記録された登録複合単語のうち1つについて、その登録複合単語(以下、登録単語列と称する)の構成単語の数と、判定対象複合単語(以下、対象単語列と称する)の構成単語の数との差を求め、その差を変数aに記録する(Op1)。例えば、対象単語列が「兵庫ボランティア大会」、登録単語列が「京都ボランティア大会」である場合、構成単語数の差は0なので、a=0となる。
また、アクセント結合決定部5は、登録単語列と対象単語列との構成単語の表記を、前の構成単語から順にそれぞれ比較し、表記が一致するか否かを判定する。表記が一致しない構成単語の数は変数bとして記録される(Op2)。例えば、対象単語列「兵庫ボランティア大会」と登録単語列「京都ボランティア大会」とで、表記が一致しない構成単語数は1となる。
また、アクセント結合決定部5は、登録単語列と対象単語列とで表記が一致しない構成単語の品詞が一致しているか否かを判定する。品詞が一致している場合は “0”、品詞が一致していない場合は“1”が変数cに記録される(Op3)。なお、表記が一致しない構成単語が複数ある場合、アクセント結合決定部5は、表記が一致しない構成単語それぞれについて品詞が一致しているか否か判定され、判定結果(0または1)を変数cに加算する。また、対象単語列の単語数と登録単語列と単語数のいずれか一方が他方より多い場合に、その多い分の構成単語は、表記が一致しない構成単語となる。この場合、アクセント結合決定部5は、その多い分の構成単語の品詞も一致していないと判断してもよい。
また、アクセント結合決定部5は、登録単語列と対象単語列とで表記が一致しない構成単語における拍数の差を計算し、変数dに記録する(Op4)。例えば、対象単語列「兵庫ボランティア大会」と登録単語列「京都ボランティア大会」との間で、表記が一致しない構成単語「京都」および「兵庫」の拍数はいずれも3であるので、拍数の差は0である。
次に、アクセント結合決定部5は、Op1〜Op4で記録された変数a〜dを用いて、登録単語列と対象単語列との類似度Sを計算する(Op5)。類似度Sは例えば、下記式(1)により、計算することができる。
類似度S = - ( a × 1000 + b × 100 + Σ( c × 10 + d )) ―――(1)
ここでは類似度Sは負の値であり、類似度Sが大きいほど、つまり0に近いほど類似性が高いと判断できる。なお、上記式(1)は、一例であり、類似度の計算方法は上記式(1)を用いる場合に限られない。
Op1〜Op5の処理により、1つの登録単語列について、類似度が計算される。アクセント結合決定部5は、基本複合単語辞書83およびユーザ複合単語辞書84に記録される登録複合単語全てについて、類似度の計算が終了するまで(Op6でYesと判断されるまで)、Op1〜Op5の処理を繰り返す。そして、アクセント結合決定部5は、Op5で計算した類似度が所定の閾値より高い登録複合単語を、複数の類似複合単語として選抜する(Op7)。これにより、複数の類似複合単語が検索される。なお、複数の類似複合単語の選抜方法は、上記例に限られない。例えば、アクセント結合決定部5は、類似度が高い順に所定数だけ抽出した登録複合単語を類似複合単語としてもよい。
例えば、基本複合単語辞書83およびユーザ複合単語辞書84に、下記(A)〜(E)に示す登録複合単語が登録されていた場合の類似度の計算例を説明する。
(A)京都ボランティア大会
(B)兵庫県知事
(C)兵庫テニス大会
(D)大阪ボランティア大会
(E)奈良ボランティア大会
上記(A)〜(E)それぞれの登録複合単語におけるa〜dの値は以下のようになる。
(A)については、構成する単語数の差0なので(a=0)、一致しない構成単語は「京都」だけなので(b=1)、一致しない構成単語「京都」と「兵庫」の品詞は一致しているので(c=0)、「京都」と「兵庫」は、拍数がともに3なので、拍数の差0(d=0)となる。
(B)については、構成する単語数の差は0なので(a=0)、一致しない構成単語は「県」と「知事」の2つなので(b=2)、一致しない構成単語「県(接尾語)」と「ボランティア(普通名詞)」の品詞は不一致かつ「知事」と「大会」の品詞一致なので(c=1)、一致しない構成単語「県(2拍)」と「ボランティア(5拍)」の拍数の差3かつ「知事(2拍)」と「大会(4拍)」の拍数の差2なので(d=5)となる。
(C)については、構成する単語数の差は0なので(a=0)、一致しない構成単語は「テニス」だけなので(b=1)、一致しない構成単語「テニス」と「ボランティア」の品詞は一致なので(c=0)、「テニス(3拍)」と「ボランティア(5拍)」の拍数の差は2なので(d=2)となる。
(D)については、構成する単語数の差は0なので(a=0)、一致しない構成単語は「大阪」だけなので(b=1)、一致しない構成単語「大阪」と「兵庫」の品詞は一致なので(c=0)、「大阪(4拍)」と「兵庫(3拍)」の拍数の差は1なので(d=1)となる。
(E)については、構成する単語数の差は0なので(a=0)、一致しない構成単語は「奈良」だけなので(b=1)、一致しない構成単語「奈良」と「兵庫」の品詞は一致なので(c=0)、「奈良(2拍)」と「兵庫(3拍)」の拍数の差は1なので(d=1)となる。
これにより、類似度Sはそれぞれ (A)‐100、(B)‐215、(C)‐102、(D)−101、(E)−101 と算出される。例えば、類似複合単語を選抜するための閾値が−210である場合、類似複合単語として、(A)「京都ボランティア大会」、(C)「兵庫テニス大会」、(D)「大阪ボランティア大会」、(E)「奈良ボランティア大会」が選抜される。
アクセント結合決定部5は、上記のようにして選抜した複数の類似複合単語それぞれのアクセント結合様式を、基本複合単語辞書83またはユーザ複合単語辞書84を参照して取得する(Op8)。そして、アクセント結合決定部5は、取得したアクセント結合様式に基づいて、「兵庫ボランティア大会」に適用するアクセント結合様式を決定する(Op9)。アクセント結合様式決定方法の例は、上述のとおりである。
なお、アクセント結合決定部5は、類似複合単語として選抜するための所定の閾値(例えば本例では、‐210)を超える類似度の登録複合単語がない場合は、適当な類似複合単語が存在しないという結果を出力することもできる。
[動作例2]
次に図6、図7を用いて、読み情報生成装置1の動作の他の例を説明する。ここでは、一例として「詳細は日本スキー連合ホームページを参照のこと。」というテキストデータが入力された場合の例を説明する。図6は、図4と同じ形式で、本例において、テキストデータが入力されてから読み情報が生成されるまでに扱われるデータの内容を表す図である。テキストデータ30は、テキスト入力部2が入力したテキストデータを示す。形態素解析部3は、テキストデータ30に対して形態素解析を行い、表31の内容の形態素解析結果を生成する。
複合単語検索部4は、表31に示される分割された単語の列のうち、名詞連続区間Bの「日本」「スキー」「連合」「ホームページ」を判定対象複合単語として検索する。検索の結果、当該判定対象複合単語が見つからない場合、アクセント結合決定部5は、複数の類似複合単語を検索する。類似複合単語の検索の詳細については、後述する。ここでは、一例として、図3に示す基本複合単語辞書83のデータの中から、「日本自動車連合ホームページ」、「日本登山連合ホームページ」、「日本将棋業界ホームページ」、「日本列島労組ホームページ」が複数の類似複合単語として見つかった場合について説明する。表32a、32b、32c、32dは、類似複合単語「日本自動車連合ホームページ」、「日本登山連合ホームページ」、「日本将棋業界ホームページ」、「日本列島労組ホームページ」が示すデータの内容を示す表である。
アクセント結合決定部5は、複数の類似複合単語のアクセント結合様式のうち、最も出現頻度が高いアクセント結合様式を、「日本スキー連合ホームページ」のアクセント結合様式に決定することができる。表32a〜表32dに示す4つの類似複合単語のうち、表32dの「日本列島労組ホームページ」は、「日本列島/労組/ホームページ」のように、2単語+1単語+1単語の形でアクセント句が分割され、1番目と2番目の単語が+1型でアクセント結合するアクセント結合様式である。他の3つの類似複合単語「日本/自動車連合/ホームページ」、「日本/登山連合/ホームページ」、「日本/将棋業界/ホームページ」は、いずれも、1単語+2単語+1単語の形でアクセント句が分割され、2番目と3番目の単語が+1型でアクセント結合するアクセント結合様式である。したがって、最も出現頻度が高いアクセント結合は、1単語+2単語+1単語で、2番目と3番目の単語が+1型でアクセント結合するアクセント結合様式となる。
したがって、アクセント結合決定部5は、表32a〜32dに示す4つの類似複合単語の中で、最も出現頻度が高いアクセント結合様式を、判定対象複合単語「日本スキー連合ホームページ」に適用する。その結果、表33に示すように、アクセント句およびアクセント核の位置が設定される。すなわち、名詞連続区間Bの「日本スキー連合ホームページ」においては、「スキー」と「連合」が1つのアクセント句に結合され、アクセント核の位置は、「レ’ンゴー」の1拍目に設定される。
その後、アクセント結合規則適用部6は、名詞連続区間B以外の単語列に対して、アクセント結合規則85に従ってアクセント結合する。その結果、表34に示すように、アクセント句のおよびアクセント核の位置が設定される。表34においては、「詳細」と「は」が1つのアクセント句になり、「ホームページ」「を」も1つのアクセント句になり、さらに、「参照」「の」「こと」「。」が1つのアクセント句になっている。読み情報生成部7は、表34に示すアクセント句およびアクセント核の位置を含むデータの内容に基づいて、中間表記35を生成する。
次に、アクセント結合決定部5が、判定対象複合単語に類似する類似複合単語を検索する処理の具体例を説明する。図7は、アクセント結合決定部5が類似複合単語を検索する動作の他の例を示すフローチャートである。ここでは、図6に示した判定対象複合単語「日本スキー連合ホームページ」に類似する単語を、図3に示した基本複合単語辞書83のデータから検索する場合の例を説明する。
アクセント結合決定部5は、まず、基本複合単語辞書83およびユーザ複合単語辞書84に記録された登録複合単語のうち1つについて、その登録単語列の構成単語の数と、対象単語列の構成単語の数とを比較する(Op11)。
これらの構成単語の数が等しくなければ(Op11でNo)、その登録単語列についての類似度の計算処理(後述するOp12〜Op16)は実行されない。これにより、類似する可能性の低い登録複合単語についての類似度計算処理が省略され、計算量を減少させることができる。
これらの構成単語の数が等しければ(Op11でYes)、以下に示すOp12〜Op16の処理により、その登録単語列の類似度が計算される。ここで、Op12〜Op14それぞれの処理は、図5に示したOp2〜Op4と同様である。これにより、変数b、c、dにそれぞれ値が記録される。
Op15において、アクセント結合決定部5は、登録単語列と対象単語列とで表記が一致しない構成単語の意味属性が一致しているか否かを判定する。意味属性が一致している場合は “0”、意味属性が一致していない場合は“1”が変数eに記録される(Op15)。ここで、意味属性とは、単語の持つ意味の属性を表すデータである。例えば、図3に示す例では、構成単語「日本」の意味属性として「国」が記録されている。この意味属性は、例えば、単語ごとに、基本単語辞書81およびユーザ単語辞書82に記録される。登録単語列が「日本自動車連合ホームページ」である場合、登録単語列と表記が一致しない構成単語「スキー」と「自動車」の意味属性はそれぞれ「スポーツ」、「交通手段」であり一致しない。そのため、変数e=1となる。
次に、アクセント結合決定部5は、Op12〜Op15で記録された変数b〜eを用いて、登録単語列と対象単語列との類似度Sを計算する(Op16)。類似度Sは例えば、下記式(2)により、計算することができる。
類似度S = - (b × 100 + Σ( c × 10 + d + e × 0.5 )) ―――(2)
Op11〜Op16の処理により、構成単語数が対象単語列と同じである登録単語列1つについて、類似度が計算される。構成単語数が対象単語列と異なる登録単語列については、類似度は計算されない。登録単語列ひとつひとつに対して類似度計算を行うと処理時間が大きくなる場合、図7に示す例のように、構成単語数の異なる登録に対しては類似度計算を行わない方が望ましい。
アクセント結合決定部5は、Op17でYesと判断されるまで、Op11〜Op16の処理を繰り返す。その後のOp7〜Op9は、図5のOp7〜Op9と同様である。これにより、「日本スキー連合ホームページ」のアクセント結合様式を決定することができる。
[動作例3]
ここで、図8を参照して、アクセント結合決定部5が、類似複合単語を検索して判定対象複合単語のアクセント結合様式を決定する処理の変形例を説明する。ここでは、判定対象複合単語が「兵庫」「ボランティア」「大会」の3つの単語で構成される複合単語である場合を例に挙げて説明する。
まず、アクセント結合決定部5は、「兵庫ボランティア大会」の類似複合単語を、基本複合単語辞書83およびユーザ複合単語辞書84から検索するための初期検索条件を設定する(Op21)。初期検索条件は、例えば、「判定対象複合単語と単語数が一致する複合単語」とすることができる。初期検索条件を示すデータは、例えば、記録部8に予め記録されている。アクセント結合決定部5は、Op21で設定された初期検索条件に従って、基本複合単語辞書83およびユーザ複合単語辞書84から類似複合単語を検索する(Op22)。上記初期検索条件での検索により、「兵庫ボランティア大会」と単語数が一致する複合単語、すなわち、単語数が3の複合単語が検索結果として得られる。この場合、単語数が一致していればよいので、例えば、「未確認飛行物体」「朝鮮半島情勢」等、「兵庫ボランティア大会」とは構成単語が1つも一致していない複合単語も検索結果に含まれることになる。
検索結果が得られると、Op23において、アクセント結合決定部5は、絞込みが必要か否かを検索結果を基に判断する。アクセント結合決定部5は、例えば、検索の結果得られた複合単語数と、その複合単語の中で、最も出現頻度が高いアクセント結合様式を有する複合単語の数が、検索結果の複合単語全体の数に対して占める割合(以下、最大頻度割合と称する。)とに基づいて判断することができる。
ここでは、絞込みの要否の判断基準が、一例として、検索結果の複合単語数<100 且つ、最大頻度割合>80%である場合について説明する。例えば、Op22での検索の結果得られた複合単語数が3000であり、その複合単語において最大頻度割合が60%であった場合は、アクセント結合決定部5は、絞込みが十分でないと判断する(Op23でNo)。
絞込みが十分でないと判断されると(Op23でNo)、Op22で得られた検索結果の複合単語から、さらに絞り込んで検索するための検索条件(以下、絞込み検索条件と称する)を設定する(Op24)。アクセント結合決定部5は、絞込み検索条件に従って、初期検索条件による検索で得られた複合単語に対して絞込み検索を実行する(Op22)。アクセント結合決定部5は、絞込み検索条件として、例えば、「判定対象複合単語と少なくとも1つの構成単語が一致する複合単語」と設定することができる。これにより、例えば、判定対象複合単語が「兵庫ボランティア大会」であった場合は、「兵庫」「ボランティア」「大会」の3つの構成単語のうち、少なくとも1つを含む複合単語が検索結果として得られる。例えば、「兵庫県知事」、「夏季ボランティア活動」、「国際ゴルフ大会」等が検索結果に含まれる。
アクセント結合決定部5は、1回目と同様に、絞込み検索の要否判断を行い(Op23)、絞込み検索がさらに必要と判断した場合(Op23でNo)、さらなる絞込み検索のための絞込み検索条件を設定し(Op24)、検索処理を繰り返す(Op22)。この場合、アクセント結合決定部5は、さらなる絞込み検索条件として、例えば、「判定対象複合単語と、少なくとも2つの構成単語が一致する複合単語」とすることができる。このように、アクセント結合決定部5は、Op24において、実行した検索処理(Op22)の回数が増えるたびに絞込み検索条件を厳しく設定することができる。この機能を実現するために、例えば、記録部8に、検索回数に応じた複数の絞込み検索条件を示すデータが予め記録されてもよい。
アクセント結合決定部5は、絞込み検索が必要ないと判断するまで(Op23でYes)、絞込み検索条件設定(Op24)および検索(Op22)を繰り返す。これにより、適切なアクセント結合様式が得られる程度に絞り込まれた類似複合単語が、検索結果として得られる。例えば、上記例のように、検索結果の複合単語数と、最大頻度割合を絞込み検索要否の判断基準とすることで、適切なアクセント結合様式を得るために必要な複合単語数および最大頻度割合が確保された検索結果が得られる。
アクセント結合決定部5は、検索結果として得られた類似複合単語のアクセント結合様式のうち、最も出現頻度の高いものを、判定対象複合単語のアクセント結合様式に決定する(Op25)。
なお、Op23における絞込み要否判断基準や、Op24における絞込み検索条件は、上記例に限られない。例えば、絞込み検索条件として、一致しない構成単語の品詞、拍数、または意味属性などを限定する条件を設定することもできる。また、所定回数検索を繰り返しても、Op23でYesと判断されない場合に、アクセント結合決定部5は、検索をそれ以上実行せず、その時点で得られている検索結果から、アクセント結合様式を決定してもよい。
以上に示した本実施形態にかかる読み情報生成装置1は、基本複合単語辞書83およびユーザ複合単語辞書84に記録されていない複合単語のアクセントを、類似複合単語のアクセント結合様式に倣って読み上げるため、複合単語のアクセントの予測精度が大幅に向上する。また、アクセント結合規則85によって設定される複合単語のアクセントが適切でない場合に、ユーザがユーザ辞書登録部9を介して、ユーザ複合単語辞書84に、その複合単語のアクセント結合様式を表すデータを記録することができる。これにより、その複合単語と類似した複合単語のアクセントもあわせて修正されることになる。
なお、本発明は、上記実施形態に限られない。例えば、類似度を計算する際に用いる判断基準は、図5、図7に示した処理におけるa〜eの判断基準に限られない。例えば、アクセント結合決定部5は、登録単語列と対象単語列とで表記が一致しない構成単語どうしの各拍を比較し、一致する拍の数を類似度の判断基準に用いてもよい。例えば、対象単語列が「山梨インターネット同好会」であり、登録単語列として「山口インターネット同好会」と「沖縄インターネット同好会」がある場合について説明する。「山梨インターネット同好会」と「山口インターネット同好会」とで一致しない構成単語「山梨(ヤマナシ)」「山口(ヤマグチ)」において、一致する拍は「ヤ」「マ」の2つである。これに対して、構成単語「山梨(ヤマナシ)」「沖縄(オキナワ)」において、一致する拍は0である。このような拍数の比較結果が類似度の判断基準に用いられてもよい。
また、他の例として、例えば、アクセント結合決定部5は、登録単語列と対象単語列とで表記が一致しない構成単語どうしのアクセント型が一致するか否かを類似度の判断基準に用いることもできる。例えば、対象単語列が「落語大会評価」であり、登録単語列が「落語大会参加」である場合、一致しない構成単語「評価(ヒョ’ーカ)」と、「参加(サンカ)」において、アクセント型は、それぞれ1型、0型であるのでアクセント型も一致しない。このようなアクセント型の比較結果が類似度の判断基準に用いられてもよい。
また、アクセント結合決定部5が、複数の類似複合単語のアクセント結合様式を基に判定対象複合単語のアクセント結合様式を決定する方法は、上記実施形態のように、出現頻度を用いる方法に限られない。例えば、アクセント結合決定部5は、複数の類似複合単語それぞれのアクセント結合様式のスコアを、それぞれの類似複合単語の類似度に応じて計算し、複数の類似複合単語においてアクセント結合様式ごとにスコアを集計してもよい。この場合、アクセント結合決定部5は、スコアの高いアクセント結合様式を判定対象複合単語のアクセント結合様式とすることができる。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
任意のテキストを入力するテキスト入力部と、
単語の表記、読み、品詞およびアクセント情報を、複数の単語について予め登録しておく基本単語辞書記録部と、
前記テキスト入力部が入力した前記テキストの形態素解析を行うことによって、前記テキストを単語群に分割し、それぞれの単語について前記基本単語辞書記録部を検索して、各単語の表記、読み、品詞およびアクセント情報を生成する形態素解析部と、
連続する複数の単語で構成された複合単語に関するデータであって、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを複数の登録複合単語群それぞれについて予め登録しておく複合単語辞書記録部と、
前記形態素解析部によって分割された単語群に含まれる複合単語である含有複合単語と同じ登録複合単語を前記複合単語辞書記録部に対して検索し、検索の結果、前記含有複合単語と同じ登録複合単語が見つかった場合、当該登録複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定する複合単語検索部と、
前記複合単語検索部による検索の結果、前記含有複合単語と同じ登録複合単語が見つからなかった場合、前記含有複合単語を構成する各単語と、前記複合単語辞書記録部に記録された登録複合単語を構成する各単語とを比較することにより、前記含有複合単語に類似する複数の類似複合単語を前記複合単語辞書記録部から検索し、前記複数の類似複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定するアクセント結合決定部と、
前記形態素解析部によって分割された前記単語群のうち、前記複合単語検索部またはアクセント結合決定部によってアクセント結合様式が決定されていない単語について、所定のアクセント結合規則に基づいてアクセント結合様式を決定するアクセント結合規則適用部と、
前記複合単語検索部または前記アクセント結合決定部によって決定されたアクセント結合様式および、前記アクセント結合規則適用部によって決定されたアクセント結合様式に基づいて、前記テキストのアクセント情報を生成し、当該アクセント情報を含む前記テキストの読み情報を生成する読み情報生成部とを備える、読み情報生成装置。
(付記2)
前記複合単語辞書記録部は、登録複合単語を構成する各単語に関する情報を表すデータとして、各単語の表記、読み、品詞および意味属性を含むデータを記録し、
前記アクセント結合決定部は、複合単語を構成する各単語の単語数、表記、読み、品詞、拍数、意味属性のうち少なくとも1つについて、前記含有複合単語と、前記複合単語辞書記録部に記録された各登録複合単語との間で比較することにより、前記複数の類似複合単語を検索する、付記1に記載の読み情報生成装置。
(付記3)
前記アクセント結合決定部は、前記含有複合単語を構成する単語の数と前記各登録複合単語を構成する単語の数との相違、前記含有複合単語を構成する単語群と各登録複合単語を構成する単語群とで一致しない構成単語の数に加えて、下記(a)〜(e)の少なくとも1つを基準として類似度を計算し、類似度を基に複数の類似複合単語を検索する、付記2に記載の読み情報生成装置。
(a)前記一致しない構成単語における品詞の相違
(b)前記一致しない構成単語における拍数の相違
(c)前記一致しない構成単語における意味属性の相違
(d)前記一致しない構成単語において読みが一致する拍の数
(e)前記一致しない構成単語におけるアクセント型の相違
(付記4)
前記アクセント結合決定部は、前記複合単語辞書記録部から検索した複数の類似複合単語のアクセント結合様式のうち、最も出現頻度が高いアクセント結合様式を、前記含有複合単語のアクセント結合様式として決定する、付記1〜3のいずれか1項に記載の読み情報生成装置。
(付記5)
ユーザが登録した複数の登録複合単語について、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを記録し、前記複合単語辞書記録部と合わせて、前記複合単語検索部および前記アクセント結合決定部が検索に用いることができるユーザ複合単語辞書記録部をさらに備える、付記1〜4のいずれか1項に記載の読み情報生成装置。
(付記6)
ユーザが登録した少なくとも1つの単語について、単語の表記、読み、品詞およびアクセント情報を記録し、前記基本単語辞書記録部と合わせて、前記形態素解析部が検索に用いることができるユーザ単語辞書記録部をさらに備える、付記1〜5のいずれか1項に記載の読み情報生成装置。
(付記7)
付記1〜6のいずれか1項に記載の情報生成装置を含む音声合成装置であって、
前記読み情報生成部が生成した読み情報に基づいて、音声波形を合成して出力する音声合成部を備える、音声合成装置。
(付記8)
連続する複数の単語で構成された複合単語に関するデータであって、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを複数の登録複合単語群それぞれについて記録する複合単語辞書記録部にアクセス可能なコンピュータが読み情報を生成する読み情報生成方法であって、
任意のテキストを表すデータを入力するテキスト入力ステップと、
前記テキスト入力ステップで入力された前記テキストの形態素解析を行うことによって、前記テキストを単語群に分割し、それぞれの単語について表記、読み、品詞およびアクセント情報を生成する形態素解析ステップと、
前記形態素解析ステップで分割された単語群に含まれる複合単語である含有複合単語と同じ登録複合単語を前記複合単語辞書記録部に対して検索し、検索の結果、前記含有複合単語と同じ登録複合単語が見つかった場合、当該登録複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定する複合単語検索ステップと、
前記複合単語検索ステップにおける検索の結果、前記含有複合単語と同じ登録複合単語が見つからなかった場合、前記含有複合単語を構成する各単語と、前記複合単語辞書記録部に記録された登録複合単語を構成する各単語とを比較することにより、前記含有複合単語に類似する複数の類似複合単語を前記複合単語辞書記録部から検索し、前記複数の類似複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定するアクセント結合決定ステップと、
前記形態素解析ステップで分割された前記単語群のうち、前記複合単語検索ステップまたはアクセント結合決定ステップにおいてアクセント結合様式が決定されていない単語について、所定のアクセント結合規則に基づいてアクセント結合様式を決定するアクセント結合規則適用ステップと、
前記複合単語検索ステップまたは前記アクセント結合決定ステップで決定されたアクセント結合様式と、前記アクセント結合規則適用ステップで決定されたアクセント結合様式とに基づいて、前記テキストのアクセント情報を生成し、当該アクセント情報を含む前記テキストの読み情報を生成する読み情報生成ステップとを含む、読み情報生成方法。
(付記9)
連続する複数の単語で構成された複合単語に関するデータであって、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを複数の登録複合単語群それぞれについて記録する複合単語辞書記録部にアクセス可能なコンピュータに読み情報を生成する処理を実行させる読み情報生成プログラムであって、
任意のテキストを表すデータを入力するテキスト入力処理と、
前記テキスト入力処理で入力された前記テキストの形態素解析を行うことによって、前記テキストを単語群に分割し、それぞれの単語について表記、読み、品詞およびアクセント情報を生成する形態素解析処理と、
前記形態素解析処理で分割された単語群に含まれる複合単語である含有複合単語と同じ登録複合単語を前記複合単語辞書記録部に対して検索し、検索の結果、前記含有複合単語と同じ登録複合単語が見つかった場合、当該登録複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定する複合単語検索処理と、
前記複合単語検索処理における検索の結果、前記含有複合単語と同じ登録複合単語が見つからなかった場合、前記含有複合単語を構成する各単語と、前記複合単語辞書記録部に記録された登録複合単語を構成する各単語とを比較することにより、前記含有複合単語に類似する複数の類似複合単語を前記複合単語辞書記録部から検索し、前記複数の類似複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定するアクセント結合決定処理と、
前記形態素解析処理で分割された前記単語群のうち、前記複合単語検索処理またはアクセント結合決定処理においてアクセント結合様式が決定されていない単語について、所定のアクセント結合規則に基づいてアクセント結合様式を決定するアクセント結合規則適用処理と、
前記複合単語検索処理または前記アクセント結合決定処理で決定されたアクセント結合様式と、前記アクセント結合規則適用処理で決定されたアクセント結合様式とに基づいて、前記テキストのアクセント情報を生成し、当該アクセント情報を含む前記テキストの読み情報を生成する読み情報生成処理とをコンピュータに実行させる、読み情報生成プログラム。
本発明は、読み上げ対象のテキスト中に含まれている複合単語のアクセントを判定し、アクセント情報を含むテキストの読み情報を生成する装置として有用である。
読み情報生成装置を含む音声合成装置の構成を表す機能ブロック図 基本単語辞書に記録されるデータの内容の一例を示す図 基本複合単語辞書に記録されるデータの例を示す図 読み情報が生成されるまでに扱われるデータの内容を表す図 アクセント結合決定部が類似複合単語を検索する動作の例を示すフローチャート 他の動作例において読み情報が生成されるまでに扱われるデータの内容を表す図 類似複合単語を検索する動作の他の例を示すフローチャート アクセント結合決定部が、アクセント結合様式を決定する処理の変形例を示すフローチャート
符号の説明
1 読み情報生成装置
2 テキスト入力部
3 形態素解析部
4 複合単語検索部
5 アクセント結合決定部
6 アクセント結合規則適用部
7 読み情報生成部
8 記録部
9 ユーザ辞書登録部
10 音声合成装置
81 基本単語辞書
82 ユーザ単語辞書
83 基本複合単語辞書
84 ユーザ複合単語辞書
85 アクセント結合規則

Claims (7)

  1. 任意のテキストを入力するテキスト入力部と、
    単語の表記、読み、品詞およびアクセント情報を、複数の単語について予め登録しておく基本単語辞書記録部と、
    前記テキスト入力部が入力した前記テキストの形態素解析を行うことによって、前記テキストを単語群に分割し、それぞれの単語について前記基本単語辞書記録部を検索して、各単語の表記、読み、品詞およびアクセント情報を生成する形態素解析部と、
    連続する複数の単語で構成された複合単語に関するデータであって、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを複数の登録複合単語群それぞれについて予め登録しておく複合単語辞書記録部と、
    前記形態素解析部によって分割された単語群に含まれる複合単語である含有複合単語と同じ登録複合単語を前記複合単語辞書記録部に対して検索し、検索の結果、前記含有複合単語と同じ登録複合単語が見つかった場合、当該登録複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定する複合単語検索部と、
    前記複合単語検索部による検索の結果、前記含有複合単語と同じ登録複合単語が見つからなかった場合、前記含有複合単語を構成する各単語と、前記複合単語辞書記録部に記録された登録複合単語を構成する各単語とを比較することにより、前記含有複合単語に類似する複数の類似複合単語を前記複合単語辞書記録部から検索し、前記複数の類似複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定するアクセント結合決定部と、
    前記形態素解析部によって分割された前記単語群のうち、前記複合単語検索部またはアクセント結合決定部によってアクセント結合様式が決定されていない単語について、所定のアクセント結合規則に基づいてアクセント結合様式を決定するアクセント結合規則適用部と、
    前記複合単語検索部または前記アクセント結合決定部によって決定されたアクセント結合様式および、前記アクセント結合規則適用部によって決定されたアクセント結合様式に基づいて、前記テキストのアクセント情報を生成し、当該アクセント情報を含む前記テキストの読み情報を生成する読み情報生成部とを備える、読み情報生成装置。
  2. 前記複合単語辞書記録部は、登録複合単語を構成する各単語に関する情報を表すデータとして、各単語の表記、読み、品詞および意味属性を含むデータを記録し、
    前記アクセント結合決定部は、複合単語を構成する各単語の単語数、表記、読み、品詞、拍数、意味属性のうち少なくとも1つについて、前記含有複合単語と、前記複合単語辞書記録部に記録された各登録複合単語との間で比較することにより、前記複数の類似複合単語を検索する、請求項1に記載の読み情報生成装置。
  3. 前記アクセント結合決定部は、前記含有複合単語を構成する単語の数と前記各登録複合単語を構成する単語の数との相違、前記含有複合単語を構成する単語群と各登録複合単語を構成する単語群とで一致しない構成単語の数に加えて、下記(a)〜(e)の少なくとも1つを基準として類似度を計算し、類似度を基に複数の類似複合単語を検索する、請求項2に記載の読み情報生成装置。
    (a)前記一致しない構成単語における品詞の相違
    (b)前記一致しない構成単語における拍数の相違
    (c)前記一致しない構成単語における意味属性の相違
    (d)前記一致しない構成単語において読みが一致する拍の数
    (e)前記一致しない構成単語におけるアクセント型の相違
  4. 前記アクセント結合決定部は、前記複合単語辞書記録部から検索した複数の類似複合単語のアクセント結合様式のうち、最も出現頻度が高いアクセント結合様式を、前記含有複合単語のアクセント結合様式として決定する、請求項1〜3のいずれか1項に記載の読み情報生成装置。
  5. 請求項1〜4のいずれか1項に記載の情報生成装置を含む音声合成装置であって、
    前記読み情報生成部が生成した読み情報に基づいて、音声波形を合成して出力する音声合成部を備える、音声合成装置。
  6. 連続する複数の単語で構成された複合単語に関するデータであって、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを複数の登録複合単語群それぞれについて記録する複合単語辞書記録部にアクセス可能なコンピュータが読み情報を生成する読み情報生成方法であって、
    任意のテキストを表すデータを入力するテキスト入力ステップと、
    前記テキスト入力ステップで入力された前記テキストの形態素解析を行うことによって、前記テキストを単語群に分割し、それぞれの単語について表記、読み、品詞およびアクセント情報を生成する形態素解析ステップと、
    前記形態素解析ステップで分割された単語群に含まれる複合単語である含有複合単語と同じ登録複合単語を前記複合単語辞書記録部に対して検索し、検索の結果、前記含有複合単語と同じ登録複合単語が見つかった場合、当該登録複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定する複合単語検索ステップと、
    前記複合単語検索ステップにおける検索の結果、前記含有複合単語と同じ登録複合単語が見つからなかった場合、前記含有複合単語を構成する各単語と、前記複合単語辞書記録部に記録された登録複合単語を構成する各単語とを比較することにより、前記含有複合単語に類似する複数の類似複合単語を前記複合単語辞書記録部から検索し、前記複数の類似複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定するアクセント結合決定ステップと、
    前記形態素解析ステップで分割された前記単語群のうち、前記複合単語検索ステップまたはアクセント結合決定ステップにおいてアクセント結合様式が決定されていない単語について、所定のアクセント結合規則に基づいてアクセント結合様式を決定するアクセント結合規則適用ステップと、
    前記複合単語検索ステップまたは前記アクセント結合決定ステップで決定されたアクセント結合様式と、前記アクセント結合規則適用ステップで決定されたアクセント結合様式とに基づいて、前記テキストのアクセント情報を生成し、当該アクセント情報を含む前記テキストの読み情報を生成する読み情報生成ステップとを含む、読み情報生成方法。
  7. 連続する複数の単語で構成された複合単語に関するデータであって、複合単語のアクセント結合様式と、複合単語を構成する各単語に関する情報とを含むデータを複数の登録複合単語群それぞれについて記録する複合単語辞書記録部にアクセス可能なコンピュータに読み情報を生成する処理を実行させる読み情報生成プログラムであって、
    任意のテキストを表すデータを入力するテキスト入力処理と、
    前記テキスト入力処理で入力された前記テキストの形態素解析を行うことによって、前記テキストを単語群に分割し、それぞれの単語について表記、読み、品詞およびアクセント情報を生成する形態素解析処理と、
    前記形態素解析処理で分割された単語群に含まれる複合単語である含有複合単語と同じ登録複合単語を前記複合単語辞書記録部に対して検索し、検索の結果、前記含有複合単語と同じ登録複合単語が見つかった場合、当該登録複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定する複合単語検索処理と、
    前記複合単語検索処理における検索の結果、前記含有複合単語と同じ登録複合単語が見つからなかった場合、前記含有複合単語を構成する各単語と、前記複合単語辞書記録部に記録された登録複合単語を構成する各単語とを比較することにより、前記含有複合単語に類似する複数の類似複合単語を前記複合単語辞書記録部から検索し、前記複数の類似複合単語のアクセント結合様式に基づいて、前記含有複合単語のアクセント結合様式を決定するアクセント結合決定処理と、
    前記形態素解析処理で分割された前記単語群のうち、前記複合単語検索処理またはアクセント結合決定処理においてアクセント結合様式が決定されていない単語について、所定のアクセント結合規則に基づいてアクセント結合様式を決定するアクセント結合規則適用処理と、
    前記複合単語検索処理または前記アクセント結合決定処理で決定されたアクセント結合様式と、前記アクセント結合規則適用処理で決定されたアクセント結合様式とに基づいて、前記テキストのアクセント情報を生成し、当該アクセント情報を含む前記テキストの読み情報を生成する読み情報生成処理とをコンピュータに実行させる、読み情報生成プログラム。
JP2006352305A 2006-12-27 2006-12-27 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置 Expired - Fee Related JP4794429B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006352305A JP4794429B2 (ja) 2006-12-27 2006-12-27 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006352305A JP4794429B2 (ja) 2006-12-27 2006-12-27 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置

Publications (2)

Publication Number Publication Date
JP2008164785A true JP2008164785A (ja) 2008-07-17
JP4794429B2 JP4794429B2 (ja) 2011-10-19

Family

ID=39694409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006352305A Expired - Fee Related JP4794429B2 (ja) 2006-12-27 2006-12-27 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置

Country Status (1)

Country Link
JP (1) JP4794429B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008239A (ja) * 2010-06-23 2012-01-12 Fujitsu Ltd ユーザ辞書登録装置、ユーザ辞書登録方法、及びユーザ辞書登録プログラム
JP2012108360A (ja) * 2010-11-18 2012-06-07 Mitsubishi Electric Corp 韻律作成装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09152883A (ja) * 1995-11-29 1997-06-10 Ricoh Co Ltd アクセント句分割位置検出方法及びテキスト音声変換装置
JP2004102242A (ja) * 2002-07-15 2004-04-02 Matsushita Electric Ind Co Ltd 音声合成装置
JP2008116650A (ja) * 2006-11-02 2008-05-22 Fujitsu Ltd 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09152883A (ja) * 1995-11-29 1997-06-10 Ricoh Co Ltd アクセント句分割位置検出方法及びテキスト音声変換装置
JP2004102242A (ja) * 2002-07-15 2004-04-02 Matsushita Electric Ind Co Ltd 音声合成装置
JP2008116650A (ja) * 2006-11-02 2008-05-22 Fujitsu Ltd 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008239A (ja) * 2010-06-23 2012-01-12 Fujitsu Ltd ユーザ辞書登録装置、ユーザ辞書登録方法、及びユーザ辞書登録プログラム
JP2012108360A (ja) * 2010-11-18 2012-06-07 Mitsubishi Electric Corp 韻律作成装置

Also Published As

Publication number Publication date
JP4794429B2 (ja) 2011-10-19

Similar Documents

Publication Publication Date Title
JP4114888B2 (ja) 声質変化箇所特定装置
EP3616190A1 (en) Automatic song generation
WO2018200268A1 (en) Automatic song generation
RU2421827C2 (ru) Способ синтеза речи
US9886947B2 (en) Speech recognition device and method, and semiconductor integrated circuit device
JP5198046B2 (ja) 音声処理装置及びそのプログラム
Granroth-Wilding et al. Harmonic analysis of music using combinatory categorial grammar
JP6790959B2 (ja) 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム
Nakatsu et al. Learning to say it well: Reranking realizations by predicted synthesis quality
JP4751299B2 (ja) 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置
JP4794429B2 (ja) 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置
JP5853595B2 (ja) 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム
JP2005257954A (ja) 音声検索装置、音声検索方法および音声検索プログラム
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JPH0962286A (ja) 音声合成装置および音声合成方法
JP3029403B2 (ja) 文章データ音声変換システム
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
JP5184234B2 (ja) データ生成装置及びデータ生成プログラム、並びに、再生装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JP2003005776A (ja) 音声合成装置
JP3573889B2 (ja) 音声出力装置
Sloan Using Linguistic Features to Improve Prosody for Text-to-Speech
JP2022074509A (ja) 差分抽出装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110726

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees