JP2011133658A - Device, method and program for synthesizing audio - Google Patents
Device, method and program for synthesizing audio Download PDFInfo
- Publication number
- JP2011133658A JP2011133658A JP2009293029A JP2009293029A JP2011133658A JP 2011133658 A JP2011133658 A JP 2011133658A JP 2009293029 A JP2009293029 A JP 2009293029A JP 2009293029 A JP2009293029 A JP 2009293029A JP 2011133658 A JP2011133658 A JP 2011133658A
- Authority
- JP
- Japan
- Prior art keywords
- user
- dictionary
- word
- content rate
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、音声合成時に使用するユーザ辞書の利用方法に関する。 The present invention relates to a method for using a user dictionary used during speech synthesis.
テキストを入力し、その読み上げ音声を生成する音声合成技術において、テキストの読み正解率を高めるには、単語の表記に対する読みが登録されている言語辞書に、多くの単語を登録する必要がある。しかし、登録数が増すに従って同表記異読語も増し、読み誤りの原因となる。 In the speech synthesis technology for inputting text and generating the reading speech, it is necessary to register many words in a language dictionary in which the reading for the word notation is registered in order to increase the correct reading rate of the text. However, as the number of registrations increases, the number of misreads with the same notation increases, causing a reading error.
そこで、日本語に頻出する単語を集めた基本辞書をベースに、必要に応じて、ユーザが独自に管理するユーザ辞書を用いる技術が開示されている。分野毎の専門用語を集めた専門辞書を使い分ける方法も開示されている。また、他人のユーザ辞書を利用する方法も開示されている(例えば、特許文献1、特許文献2、特許文献3、特許文献4、特許文献5参照)。 Therefore, a technique is disclosed that uses a user dictionary that is independently managed by a user as needed, based on a basic dictionary that collects words that frequently appear in Japanese. A method for selectively using specialized dictionaries that collect technical terms for each field is also disclosed. In addition, a method using another person's user dictionary is also disclosed (see, for example, Patent Document 1, Patent Document 2, Patent Document 3, Patent Document 4, and Patent Document 5).
しかし、これらの方法には、以下の問題点がある。まず、ユーザ辞書を用いる場合、それなりの数の単語を自分で登録する必要があり、ユーザにとっては、登録作業の負担が大きい。 However, these methods have the following problems. First, when using a user dictionary, it is necessary to register a certain number of words by yourself, and the burden of registration work is large for the user.
また、予め分野別の専門辞書を準備しておく場合は、新語へ対応できないことや、膨大な日本語の語彙を全てカバーする専門辞書を予め準備するのは、実質的には不可能であるといった問題がある。さらに、専門辞書を利用する場合は、ユーザと専門辞書作成者の間で、分野の分類の仕方が共通でないと、適切な分野の専門辞書を選択できないという問題がある。 Also, when preparing specialized dictionaries by field in advance, it is practically impossible to prepare specialized dictionaries that cannot handle new words or that cover all the vast Japanese vocabulary. There is a problem. Furthermore, when a specialized dictionary is used, there is a problem that a specialized dictionary in an appropriate field cannot be selected unless the way of classifying the field is common between the user and the creator of the specialized dictionary.
他人のユーザ辞書を利用する方法では、ある表記の未知語に対して、複数の他人のユーザ辞書を調べ、登録率の高い読みを、当該未知語に対する読みとして、基本辞書に取り込むことを行っているが、この方法では、一つの表記に対して、一つの読みしか登録できないため、同表記異読語に対応できない。 In the method of using another person's user dictionary, a plurality of other person's user dictionaries are examined for a certain notation unknown word, and a reading with a high registration rate is taken into the basic dictionary as a reading for the unknown word. However, in this method, since only one reading can be registered for one notation, it is not possible to cope with the same notation.
また、自分のユーザ辞書と他人のユーザ辞書との間の類似度を比較して、類似度の高い他人の辞書に含まれ、自分の辞書に含まれない単語を、自分の辞書に取り入れる方法では、ユーザ辞書は、それぞれ個人が独立に管理しているもので、それらに、似たよう単語が登録されている確率は少ないという問題がある。例えば、Aさんは、政治、経済、野球に興味があり、それらの文章を良く合成していて、それらに関連した単語がユーザ登録されているとする。また、Bさんは、芸能、天気、野球に興味があり、それらに関連した単語をユーザ登録しているとする。ここで、AさんとBさんのユーザ辞書登録単語の類似度をみると、類似するのは野球の部分だけで、2/3が類似しないため、共有できない。また、仮に、AさんもBさんも野球関連の語しか登録しておらず、類似度が高かったとしても、類似度が高いがためにAさんの辞書に取り込める単語も少なくなり、共有の効果があまり得られない。このように、共有できる確率が少なく、共有できたとしてもその効果が少ない。 Also, by comparing the degree of similarity between your user dictionary and another person's user dictionary, you can incorporate words that are included in another person's dictionary with a high degree of similarity but not in your own dictionary into your own dictionary. The user dictionaries are individually managed by individuals, and there is a problem that the probability that words similar to those are registered is small. For example, suppose that Mr. A is interested in politics, economy, and baseball, synthesizes those sentences well, and the words related to them are registered in the user. In addition, Mr. B is interested in performing arts, weather, and baseball, and registers words related to them as a user. Here, looking at the similarity between the user dictionary registered words of Mr. A and Mr. B, only the baseball part is similar, and 2/3 is not similar and cannot be shared. Also, if both A and B have registered only baseball-related words, even if the degree of similarity is high, the number of words that can be taken into A's dictionary because the degree of similarity is high, and the sharing effect Can not get much. Thus, the probability of sharing is small, and even if it can be shared, the effect is small.
そこで、本発明では、他人のユーザ辞書を有効に利用することによって、自分のユーザ辞書に登録されていない未知語に対しても、読み正解率を向上させることができるようにすることを目的とする。 Therefore, the present invention aims to improve the reading accuracy rate even for unknown words that are not registered in one's user dictionary by effectively using another person's user dictionary. To do.
上記の目的を達成するために、以下に開示する音声合成装置は、合成対象テキストの入力を受付けるテキスト入力部と、テキスト入力部で入力を受付けた合成対象テキストから、ユーザ辞書に含まれるユーザ登録単語を抽出するユーザ登録単語抽出部と、ユーザ登録単語抽出部が抽出したユーザ登録単語について、他人のユーザ辞書に含まれる含有率を算出する含有率算出部と、含有率算出部が算出したユーザ登録単語の含有率に基づいて、他人のユーザ辞書から利用すべきユーザ辞書を選択する参照ユーザ辞書選択部と、参照ユーザ辞書選択部で選択された利用すべきユーザ辞書を用いて、基本辞書にもユーザ辞書にも含まれない未知語の読みを決定する読み決定部とを備える。 In order to achieve the above object, a speech synthesizer disclosed below includes a text input unit that accepts an input of a text to be synthesized, and a user registration included in a user dictionary from a text to be synthesized that is accepted by the text input unit. User registration word extraction unit for extracting words, user registration word extracted by the user registration word extraction unit, content rate calculation unit for calculating the content rate included in the other person's user dictionary, and user calculated by the content rate calculation unit Based on the content rate of the registered word, a reference user dictionary selection unit that selects a user dictionary to be used from another user's dictionary and a user dictionary to be used selected by the reference user dictionary selection unit are used as a basic dictionary. And a reading determining unit that determines reading of unknown words not included in the user dictionary.
上記の構成によれば、他人のユーザ辞書を有効に利用することによって、自分のユーザ辞書に登録されていない未知語に対しても、読み正解率を向上させることができる。 According to the above configuration, it is possible to improve the correct reading rate even for unknown words that are not registered in the user dictionary by effectively using the user dictionary of another person.
[実施形態1]
図1は、本発明の実施形態1に係る音声合成装置100の全体構成を示すブロック図である。図1において、音声合成装置100は、基本辞書110、ユーザ辞書120、ユーザ辞書インターフェース部130、テキスト入力部140、言語処理部150、波形処理部160、及び音声出力部170を備える。
[Embodiment 1]
FIG. 1 is a block diagram showing the overall configuration of a speech synthesis apparatus 100 according to Embodiment 1 of the present invention. In FIG. 1, the speech synthesizer 100 includes a
基本辞書110は、音声合成の際に必要となる基本単語が格納された辞書である。ユーザ辞書120は、ユーザが随時単語を登録していくユーザ固有の辞書である。他人のユーザ辞書121、122、123は、他のユーザが独自に随時単語を登録していく他のユーザ固有の辞書である。基本辞書110には、例えば日本語で頻出する単語の表記(=見出し語)、読み、アクセント等が格納されている。ユーザ辞書120には、ユーザが登録した単語の表記(=見出し語)、読み、アクセント等が格納されている。他人のユーザ辞書121、122、123には、他のユーザが登録した単語の表記(=見出し語)、読み、アクセント等が格納されている。ユーザ辞書インターフェース部130、他人のユーザ辞書のインターフェース部131〜133を介して、異なるユーザ間で、ユーザ辞書情報のやり取りができるようになっている。
The
テキスト入力部140は、合成するテキストの入力を受付ける。例えば、キーボードを介してユーザがテキストを入力する構成、CDやフレキシブルディスクなどのメディアを読取るドライブを介して電子的に入力する構成、スキャナなどによりOCRで読取ったテキストを入力する構成、又は有線または無線のネットワークを介して電子的にテキストを受け取る構成、あるいはこれらの組み合わせであってもよい。
入力されたテキストは言語処理部150へ送られる。言語処理部150では、入力されたテキストの読み、アクセント等を解析し、出力する。言語処理部150は、形態素解析部151、未知語抽出部152、ユーザ登録単語抽出部153、含有率算出部154、参照ユーザ辞書選択部155、及び読み決定部156を備える。
The input text is sent to the language processing unit 150. The language processing unit 150 analyzes and outputs the input text reading, accent, and the like. The language processing unit 150 includes a
形態素解析部151は、基本辞書110とユーザ辞書120とを利用して、形態素解析を行い、読みを決定する。未知語抽出部152は、形態素解析でテキストを単語に分解した結果から、入力テキスト中で、基本辞書110にもユーザ辞書120にも登録されていないと判定された単語を未知語として抽出する。ユーザ登録単語抽出部153は、形態素解析の結果から、入力されたテキストの中で、ユーザ辞書120に登録されていた単語を抽出する。なお、未知語抽出部152およびユーザ登録単語抽出部153での抽出処理は、形態素解析を行わずに、単純なテキストと各種辞書との比較結果として抽出してもよい。
The
含有率算出部154は、未知語およびユーザ登録単語が、他人のユーザ辞書121〜123にどの程度の割合で含まれているかを算出する。この際、他人のユーザ辞書の情報は、回線経由で、ユーザ辞書インターフェース部(UDIC-IF)130が取得し、含有率算出部154に情報を送る。また、ユーザ辞書インターフェース部130は、他人の音声合成装置から、ユーザ辞書情報参照要求があった場合、自分のユーザ辞書120に含まれる情報を提供する。
The content
参照ユーザ辞書選択部155は、未知語抽出部152及びユーザ登録単語抽出部153が抽出した未知語及びユーザ登録単語が、他人のユーザ辞書にどの程度含まれているかを表す含有率に基づいて、複数の他人のユーザ辞書の中から含有率の高いユーザ辞書を、利用すべきユーザ辞書として決定する。例えば、含有率が所定値以上の他人のユーザ辞書を利用すべきユーザ辞書として決定する。なお、含有率が最も高い他人のユーザ辞書を利用すべきユーザ辞書と決定してもよい。又は、含有率が高い順に、所定数の他人のユーザ辞書を選択し、利用すべきユーザ辞書としてもよい。
The reference user
読み決定部156は、基本辞書110、ユーザ辞書120、参照ユーザ辞書選択部155が選択した利用すべき他人のユーザ辞書に含まれる単語の情報を利用して、入力テキストの読み、アクセント等を決定する。決定方法として、例えば、下記の2つの方法が挙げられる。すなわち、(1)未知語抽出部によって未知語として抽出された単語に対して、他人のユーザ辞書単語の表記と比較し、マッチする表記を持つ見出し語の読みを設定したり、あるいは(2)基本辞書110、ユーザ辞書120、利用すべき他人のユーザ辞書中の単語を用いて、形態素解析をやり直すこと等により、読み、アクセントを決定することができる。なお、読み決定部156は、読みに加えて、さらにアクセントその他必要な情報を決定してもよい。
The
波形処理部160は、言語処理部150から出力された、読み、アクセント情報に応じて合成音声データを生成する。図示は省略しているが、波形処理部160は、音声を合成するための波形辞書を有してもよい。例えば波形処理部160は、波形辞書内の音声素片に対して、例えば、線形予測分析法の1つであるPSOLA(Pitch Synchronous Overlap Add)法等を用いたデジタル信号処理で目的のアクセントとなるように声の高さを調整しながら接続し、合成音声を生成することができる。
The
音声出力部170は、波形処理部160で生成された音声データを、各種音声フォーマットに応じた形式に変換し、出力する。
The
なお、上記説明では、音声合成装置100は、基本辞書110、ユーザ辞書120、ユーザ辞書インターフェース部130、テキスト入力部140、言語処理部150、波形処理部160、及び音声出力部170を備える構成としたが、音声合成装置100の構成はこれに限られない。例えば、音声合成装置100が、ネットワークに接続されたサーバ上にあってもよい。この場合、例えば、テキスト入力部140は、ネットワークに接続されたユーザ端末で入力されたテキストを受信する構成とし、音声出力部170は、合成した音声データを、ネットワークを介して前記ユーザ端末へ送信する構成とすることができる。また、当該サーバが上記他人のユーザ辞書も格納し、複数のユーザからテキスト入力を受付けたときに、複数のユーザに対してそれぞれのユーザ辞書を利用して、入力テキストについて音声合成を可能とする構成としてもよい。また、音声合成装置100が備える機能部は、複数のコンピュータに分散されていてもよい。
In the above description, the speech synthesizer 100 includes the
以下、本発明の実施形態1に係る音声合成装置の動作について、図2のフロー図、及び図3の各種データ例を示す図に基づいて説明する。自分、Aさん、Bさん、Cさんのそれぞれのユーザ辞書には、図3(e)、(a)、(b)、(c)に示すように、普段よく読み上げさせているテキストに関連した単語がユーザ登録されているものとする。 Hereinafter, the operation of the speech synthesizer according to the first embodiment of the present invention will be described with reference to the flowchart in FIG. 2 and various data examples in FIG. 3. The user dictionaries of myself, Mr. A, Mr. B, and Mr. C are related to the texts that are usually read aloud as shown in FIGS. 3 (e), (a), (b), and (c). It is assumed that the word is registered as a user.
最初に、図3(d)に示す、ICカードについて述べている合成対象テキストが、テキスト入力部140に入力されたものとする(ステップS201)。 First, it is assumed that the composition target text describing the IC card shown in FIG. 3D is input to the text input unit 140 (step S201).
次に、入力された合成対象テキストに対して、形態素解析部151で形態素解析を行う(ステップS202)。
Next, the
ユーザ登録単語抽出部153は、形態素解析でテキストを単語に分解した結果から、ユーザ辞書に登録されている単語が使われている部分をユーザ登録単語として抽出する(ステップS203)。ここでは、図3(e)に示す、自分のユーザ辞書に登録されている「RAM」と「ROM」とがユーザ登録単語として抽出される。
The user registration
未知語抽出部152は、形態素解析の結果、基本辞書にもユーザ辞書にも登録されていなかった部分を未知語として抽出する(ステップS204)。ここでは、基本辞書にもユーザ辞書にも登録されていない、「IC」、「EEPROM」が未知語として検出されたとする。ちなみに、「EEPROM」は、「Electrically Erasable and Programmable Read Only Memory」の略で、電気的に内容を書き換えることができるROMの一種である。
As a result of the morphological analysis, the unknown
次に、含有率算出部154は、ユーザ登録単語抽出部153及び未知語抽出部152が抽出したユーザ登録単語と未知語とが、他人の辞書の中に含まれる含有率を計算する(ステップS205)。図3(a)に示す、Aさんのユーザ辞書との比較では、ユーザ登録単語(「RAM」、「ROM」)と未知語(「IC」、「EEPROM」)との合計4個の単語のうち、第1の未知語「IC」の1個だけが含まれるため、含有率は25%である。一方、図3(b)に示す、Bさんのユーザ辞書の中には、ユーザ登録単語「RAM」、「ROM」の全てと、未知語「IC」、「EEPROM」の全てが含まれており、ユーザ登録単語と未知語との合計4個の単語が全て含まれるため、含有率が100%であり、Bさんは、現在の合成対象テキストと同分野のテキストを、既に読ませている可能性が高いことが分かる。また、Cさんのユーザ辞書とはユーザ登録単語と未知語との合計4個の単語に一致するものが一つも含まれないため、含有率は0%となる。
Next, the content
参照ユーザ辞書選択部155は、含有率に基づいて利用すべき他人のユーザ辞書を選択する(ステップS206)。ここでは、含有率が100%で最も高い、Bさんのユーザ辞書を利用し、含有率の低い、Aさん、Cさんの辞書は利用しないことを決定する。
The reference user
本説明では、最も含有率が高いBさんの辞書に、全て未知語が含まれていたが、最も含有率が高い第1の他人の辞書に全ての未知語が含まれていない場合は、最も含有率が高い第1の他人の辞書に含まれていない未知語を含んでいる、第2、第3の辞書を、例えば含有率が一定の閾値以上にある他人のユーザ辞書の中から選択し、なるべく多くの未知語が含まれるように、複数の他人のユーザ辞書を選択すればよい。 In this description, all of the unknown words were included in Mr. B's dictionary with the highest content ratio. However, when all the unknown words are not included in the dictionary of the first other person with the highest content ratio, The second and third dictionaries that contain unknown words that are not included in the first other person's dictionary with a high content rate are selected from, for example, other people's user dictionaries whose content rate is equal to or greater than a certain threshold. A plurality of other user's dictionaries may be selected so that as many unknown words as possible are included.
読み決定部156は、ステップ204の未知語抽出結果において、未知語として抽出された部分に対し、ステップS206で選択した他人のユーザ辞書を参照し、利用できる見出し語があれば、未知語部分の読み、アクセント等を決定するために利用する。ここでは、未知語「IC」、「EEPROM」に対して、Bさんのユーザ辞書の「IC」と「EEPROM」の読み、アクセント情報を利用し、入力テキストに対する読み、アクセントを決定する(ステップS207)。
The
以上の方法で、自分のユーザ辞書に登録されていない単語の読みを正しく求めることができる。ユーザ登録単語や、未知語に含まれる単語は、日本語に頻出する単語が登録されている基本単語辞書でカバーできなかった単語であるため、固有名詞や専門用語等が多く含まれ、合成対象テキストの内容の特徴を表す単語となっている。従って、これらの単語を、他人のユーザ辞書に登録されている単語と比較することで、既に、同じような内容のテキストの読み上げを行った他のユーザを推定することができる。しかも、同じような内容のテキストの読み上げ用に用意されたユーザ辞書であるため、必然的に読みも正しいものが登録されている確率が高く、同表記異読語の問題を回避できる。また、従来の分野別辞書を用いる場合とは異なり、合成対象のテキストから特定の分野を推定する必要がないため、分野分けや分野推定誤りの影響を考えなくてもよい利点がある。更に、新語に対しても、絶えずユーザがメンテナンスしている最新のユーザ辞書を利用できるため、新語にも対応できる。なお、本実施形態では、ユーザ登録単語、及び未知語の2つの含有率を算出する構成で説明したが、どちらか1つの含有率を算出する構成としてもよい。 With the above method, it is possible to correctly obtain a reading of a word that is not registered in the user dictionary. User-registered words and words included in unknown words are words that could not be covered by the basic word dictionary in which words that appear frequently in Japanese are registered, so they contain many proper nouns, technical terms, etc. It is a word that represents the characteristics of the text content. Therefore, by comparing these words with words registered in the other person's user dictionary, it is possible to estimate other users who have already read out the text having the same content. In addition, since the user dictionary is prepared for reading out text with similar contents, there is a high probability that the correct reading is inevitably registered, and it is possible to avoid the problem of misread words. Further, unlike the case where a conventional field-specific dictionary is used, it is not necessary to estimate a specific field from the text to be synthesized. Furthermore, since the latest user dictionary maintained by the user can be used for new words, the new words can be handled. In addition, although this embodiment demonstrated the structure which calculates two content rates of a user registration word and an unknown word, it is good also as a structure which calculates any one content rate.
[実施形態2]
本実施形態に係る音声合成装置は、専門分野毎の専門用語が登録されている辞書である専門辞書180を更に備え、言語処理部150が、テキスト入力部140で入力を受付けた合成対象テキストから、専門辞書180に含まれる専門辞書登録単語を抽出する専門辞書登録単語抽出部190を更に備える。更に実施形態2の含有率算出部154は重み付け含有率算出部200を含んでおり、ユーザ登録単語抽出部153が抽出したユーザ登録単語、未知語抽出部152が抽出した未知語、及び専門辞書登録単語抽出部190が抽出した専門辞書登録単語等の単語の種類に応じた重み付けをして、これらの単語が他人のユーザ辞書121、122、123に含まれる含有率を算出する。参照ユーザ辞書選択部155は、重み付け含有率算出部が算出したユーザ登録単語、未知語、及び専門辞書登録単語の重み付け含有率に基づいて、重み付け含有率が所定値以上である他人のユーザ辞書を、利用すべきユーザ辞書として選択する。
[Embodiment 2]
The speech synthesizer according to the present embodiment further includes a
図4は、本発明の実施形態2に係る音声合成装置の全体構成を示すブロック図である。実施形態1の構成に対して、専門辞書180、専門辞書登録単語抽出部190を更に備え、含有率算出部154は、重み付け含有率算出部200を含む。
FIG. 4 is a block diagram showing the overall configuration of the speech synthesizer according to Embodiment 2 of the present invention. The configuration of the first embodiment further includes a
重み付け含有率算出部200は、含有率を計算する際に、ユーザ登録単語、未知語、固有名詞単語の特定の種類の単語や、特定の品詞の含有率の重みを重くする。例えば、合成対象テキストからユーザ登録単語、未知語、専門辞書登録単語がそれぞれ1つずつ抽出され、Aさんのユーザ辞書には、ユーザ登録単語と未知語とが含まれており、Bさんのユーザ辞書には、未知語と専門辞書登録単語とが含まれていたとする。このとき、そのまま含有率を算出すると、Aさん、Bさんそれぞれのユーザ辞書に対して、含有率は2/3≒66%となり、含有率に違いはない。ここで、重み付け含有率算出部200が、専門辞書登録単語について、その含有率の重みを重く設定するものとする。すなわち、実際に含有されている専門辞書登録単語の数は1であるが、重み付けの重みが仮に2倍に設定されているとすると、含有率算出時には、抽出されたユーザ登録単語、未知語、専門辞書登録単語の総数3に対して、重み付けの分専門辞書登録単語の数を割り増しして含有率を計算する。すなわち、重み付けされたBさんの含有率は、未知語の1単語と、重み付けされて割り増しされた専門辞書登録単語の2単語に対して、抽出されたユーザ登録単語、未知語、専門辞書登録単語の総数3で含有率を算出することになり、重み付け後の含有率は(1+2)/3≒100%となる。なお、単語の種類として、ユーザ登録単語、未知語、及び専門辞書登録単語に適用した例を示したが、固有名詞や普通名詞といった品詞の種類によっても単語の種類を分類できる。さらに、ユーザ登録単語の普通名詞、ユーザ登録単語の固有名詞というように、辞書種別と品詞を組み合わせて単語の種類を分類してもよい。
When calculating the content rate, the weighted content
参照ユーザ辞書選択部155は、重み付け含有率算出部200がユーザ登録単語、未知語、専門辞書登録単語の特定の単語の種類に応じて重み付けした後のユーザ登録単語、未知語、及び、固有名詞辞書登録単語の含有率に基づいて、他人のユーザ辞書の中から利用すべきユーザ辞書を選択する。例えば、重み付けをした含有率が所定値以上の他人のユーザ辞書を利用すべきユーザ辞書として選択する。なお、重み付けをした含有率が最も高い他人のユーザ辞書を利用すべきユーザ辞書と決定してもよい。
The reference user
読み決定部156は、基本辞書110、ユーザ辞書120、専門辞書180、参照ユーザ辞書選択部155が選択した利用すべき他人のユーザ辞書に登録されている単語情報を利用して、入力テキストの読み、アクセント等を決定する。
The
これにより、同じような内容のテキストを読み上げさせる場合でも、専門辞書登録単語の重みを重く設定する場合は、より専門性の高い単語の含有率が重視されるため、同表記異読語による読み誤りを高い信頼度で防ぎつつ、利用すべき他人のユーザ辞書を見つけることができる。また、未知語に対する重みを重く設定する場合は、より多くの未知語を含むユーザ辞書を利用することができ、未知語に対する読み付与率を向上させることができ、目的に応じた読み正解率の改善を行うことができる。 As a result, even if the text with the same content is read aloud, if the weight of specialized dictionary registered words is set to be heavy, the content rate of words with higher expertise is emphasized. It is possible to find a user dictionary of another person to be used while preventing an error with high reliability. In addition, when the weights for unknown words are set to be heavy, a user dictionary including more unknown words can be used, the reading grant rate for unknown words can be improved, and the correct reading rate according to the purpose can be improved. Improvements can be made.
[実施形態3]
本発明の実施形態3に係る音声合成装置の全体構成は、実施形態2と同様に図4に示すブロック図となる。
[Embodiment 3]
The overall configuration of the speech synthesizer according to the third embodiment of the present invention is the block diagram shown in FIG.
実施形態3では、重み付け含有率算出部200が、ユーザ登録単語、未知語、専門辞書登録単語のそれぞれの含有率計算の際に、単語の種類や、品詞の種類に応じて、異なる重み付けを行う。例えば、専門辞書登録単語>固有名詞のユーザ登録単語>未知語>普通名詞のユーザ登録単語の順に重みが重くなるように重み付けする。
In the third embodiment, the weighted content
参照ユーザ辞書選択部155は、重み付け含有率算出部200が専門辞書登録単語>固有名詞のユーザ登録単語>未知語>普通名詞のユーザ登録単語の順に重みが重くなるように重み付けした後のユーザ登録単語、未知語、及び、専門辞書登録単語の含有率に基づいて、複数の他人のユーザ辞書の中で利用できる他人のユーザ辞書を選択する。例えば、含有率が所定値以上の他人のユーザ辞書を利用すべき他人のユーザ辞書として選択する。なお、含有率が最も高い他人のユーザ辞書を利用すべき他人のユーザ辞書と決定してもよい。また、上記のように、ユーザ登録単語、未知語、専門辞書登録単語のそれぞれの単語の種類や品詞の種類に応じた重み付けを行うだけでなく、単語そのものの出現頻度(出現数)に対して重み付けを行う構成としてもよい。例えば、野球に関する合成対象テキスト中に、未知語として「適時打」という単語が抽出されており、しかも、「適時打」が合成対象テキスト中に複数回出現するのであれば、「適時打」という単語の出現頻度に応じて重みを重くする重み付けを行ってもよい。
The reference user
読み決定部156は、基本辞書110、ユーザ辞書120、専門辞書180、参照ユーザ辞書選択部155が選択した利用すべき他人のユーザ辞書単語を利用して、入力テキストの読み、アクセント等を決定する。
The
これにより、合成対象の文章の内容を特徴的に表している可能性が高い専門辞書登録単語の含有率や、ユーザ辞書登録単語の含有率を重視でき、同じような内容のテキストを読み上げさせる場合でも、高い確率で同表記異読語の問題を回避しつつ、利用すべき他人のユーザ辞書を見つけることができる。なお、実施形態2、3では、ユーザ辞書登録単語、未知語、及び専門辞書登録単語の3つの含有率を算出していたが、それら3つのうちのどれか1つについて含有率を算出してもよい。 This makes it possible to emphasize the content rate of specialized dictionary registered words and the content rate of user dictionary registered words that are likely to represent the content of the text to be synthesized, and to read out text with similar content However, it is possible to find a user dictionary of another person to be used while avoiding the problem of the same notation word with a high probability. In the second and third embodiments, the three content rates of the user dictionary registered word, unknown word, and specialized dictionary registered word are calculated, but the content rate is calculated for any one of the three. Also good.
[実施形態4]
本実施形態に係る音声合成装置は、参照ユーザ辞書選択部155が利用すべきユーザ辞書を複数選択し、当該複数の利用すべきユーザ辞書間で未知語の読みが異なる場合、読み決定部は、当該複数の利用すべきユーザ辞書のうち、前記含有率が最も高いユーザ辞書を用いて、未知語の読み、アクセントを決定する。
[Embodiment 4]
The speech synthesizer according to the present embodiment selects a plurality of user dictionaries to be used by the reference user
図5は、本発明の実施形態4に係る音声合成装置100のうちの参照ユーザ辞書選択部155、読み決定部156の構成を示す図である。実施形態2、3に対して、参照ユーザ辞書選択部155が、含有率比較部157、同表記異読語検出部158、及び優先度決定部159を更に備える。
FIG. 5 is a diagram illustrating a configuration of the reference user
含有率比較部157は、前記含有率算出部154が算出した、各々の他人の辞書に対する含有率を比較し、ある一定の含有率以上となる他人のユーザ辞書を利用すべきユーザ辞書として選択する。
The content
同表記異読語検出部158は、前記含有率比較部で選択された一定の含有率以上となる他人のユーザ辞書間、または、自分のユーザ辞書と選択された他人のユーザ辞書間で、未知語および自分のユーザ辞書登録語の見出し語に対して、異なる読みが登録されているユーザ辞書がないかを検出する。
The same notation different
優先度決定部159は、未知語の見出し語に対して異なる読みが登録されているユーザ辞書が複数存在する場合、ユーザ登録単語または未知語単独での含有率や、他人のユーザ辞書内の未知語の登録数に応じて、どのユーザ辞書の読みを利用するかの優先度をつける。例えば、ユーザ登録単語の含有率が高い他人のユーザ辞書に高い優先度を設定してもよい。また、未知語に対する見出し語の登録数が多い他人のユーザ辞書に高い優先度を設定してもよい。
When there are a plurality of user dictionaries in which different readings are registered with respect to an unknown word entry word, the
このように優先度を決定すれば、前者の場合は、同表記異読語の読み誤りの軽減を重視でき、後者の場合は、未知語を読める、未知語カバー率を上げることを重視できるようになる。 If priorities are determined in this way, in the former case, it is possible to focus on reducing reading errors of misread words, and in the latter case, it is possible to focus on increasing the coverage of unknown words so that unknown words can be read. become.
また、読み決定部156は、一時辞書作成部161、形態素解析部162、アクセント決定部163で構成され、基本辞書110、ユーザ辞書120、および利用すべき他人のユーザ辞書中の単語を用いて、形態素解析を行い、読み、アクセント等を決定する。
The
一時辞書作成部161は、利用する他人のユーザ辞書が決定したら、決定した他人のユーザ辞書を、自分の基本辞書とユーザ辞書に含めて、合成対象テキストに対する一時的な辞書を作成する。
When the other person's user dictionary to be used is determined, the temporary
形態素解析部162は、合成対象テキストに対して、一時的な辞書を用いて、再度形態素解析を行い、読みを付与する。
The
アクセント決定部163は、アクセント決定ルールなどを参照しながら、アクセント結合処理などを行い、最終的なアクセントを決定する。
The
実施形態1とは異なり、合成対象テキストに対して、未知語が読めるようになる言語辞書を用いて、形態素解析を再度行うことで、未知語が含まれていない最初の言語辞書で形態素解析を行う場合よりも、複合語の読み変化やアクセント結合等の現象に対応でき、形態素解析の精度が高まる。未知語が含まれていない言語辞書で形態素解析を行うと、未知語の部分の特定は可能だが、未知語前後の言葉とのアクセント結合や読みの変化などには対応できないが、本実施形態の構成により、その部分の精度が向上する。 Unlike Embodiment 1, morphological analysis is performed again on the first language dictionary that does not contain unknown words by performing morphological analysis again on the synthesis target text using a language dictionary that enables reading of unknown words. Compared to the case, it is possible to cope with phenomena such as compound word reading change and accent coupling, and the accuracy of morphological analysis is increased. If morphological analysis is performed with a language dictionary that does not contain unknown words, it is possible to identify the unknown word part, but it cannot cope with accent concatenation and reading changes with words before and after the unknown word. The accuracy of the portion is improved by the configuration.
以上説明したように、本実施形態によれば、分野別辞書を予め用意しなくても、他人のユーザ辞書を有効に利用することによって、自分のユーザ辞書に登録されていない未知語に対しても、読み正解率を向上させることができる。また、同表記異読語の問題に対応でき、かつ、自分のユーザ辞書に登録されていない未知語に対して、正しく読みを解析できる。また、ユーザ辞書登録の労力を減らし、かつ、正しく読み上げる確率を高めることができる。加えて、新語にも対応できる。 As described above, according to the present embodiment, an unknown word that is not registered in one's own user dictionary can be obtained by effectively using another user's dictionary without preparing a field-specific dictionary in advance. Also, the correct reading rate can be improved. In addition, it is possible to deal with the problem of differently read words and to correctly analyze readings for unknown words that are not registered in the user dictionary. Further, it is possible to reduce the user dictionary registration effort and increase the probability of reading correctly. In addition, it can handle new words.
上記実施形態で説明した構成は、単に具体例を示すものであり、本発明の技術的範囲を制限するものではない。本発明の効果を奏する範囲において、任意の構成を採用することが可能である。 The configuration described in the above embodiment merely shows a specific example, and does not limit the technical scope of the present invention. Any configuration can be employed within the scope of the effects of the present invention.
なお、本発明の実施形態は、上述した実施形態を実現するソフトウェアのプログラム(実施の形態では図2に示すフロー図に対応したプログラム)が装置に供給され、その装置のコンピュータが、供給されたプログラムを読出して、実行することによっても達成される場合を含む。したがって、本実施形態で説明した機能処理をコンピュータで実現するために、コンピュータにインストールされるプログラム自体も本発明の一実施形態である。つまり、本発明の機能処理を実現させるためのプログラムも、実施形態の一側面に含まれる。 In the embodiment of the present invention, a software program for realizing the above-described embodiment (in the embodiment, a program corresponding to the flowchart shown in FIG. 2) is supplied to the apparatus, and a computer of the apparatus is supplied. This includes the case where it is also achieved by reading and executing the program. Therefore, in order to realize the functional processing described in this embodiment by a computer, the program itself installed in the computer is also an embodiment of the present invention. That is, a program for realizing the functional processing of the present invention is also included in one aspect of the embodiment.
以上の実施形態1〜実施形態4に関し、さらに以下の付記を開示する。 The following additional notes are further disclosed with respect to the above-described first to fourth embodiments.
(付記1)
基本辞書と利用者固有のユーザ辞書を有する音声合成装置であって、
合成対象テキストの入力を受付けるテキスト入力部と、
複数の他人のユーザ辞書を参照可能なインターフェース部と、
前記テキスト入力部で入力を受付けた合成対象テキストから、ユーザ辞書に含まれるユーザ登録単語を抽出するユーザ登録単語抽出部と、
前記ユーザ登録単語抽出部が抽出したユーザ登録単語について、前記インターフェース部経由で前記複数の他人のユーザ辞書毎に含まれる含有率を算出する含有率算出部と、
前記複数の他人のユーザ辞書毎に算出された含有率に基づいて、前記他人のユーザ辞書から利用する他人のユーザ辞書を選択する参照ユーザ辞書選択部と、
前記参照ユーザ辞書選択部で選択された利用すべき他人のユーザ辞書を用いて、基本辞書にもユーザ辞書にも含まれない未知語の読みを決定する読み決定部とを備える、音声合成装置。
(Appendix 1)
A speech synthesizer having a basic dictionary and a user-specific user dictionary,
A text input part that accepts input of text to be synthesized;
An interface unit that can refer to a plurality of other user's dictionaries;
A user-registered word extraction unit that extracts a user-registered word included in the user dictionary from the text to be synthesized that is accepted by the text input unit;
About a user registration word extracted by the user registration word extraction unit, a content rate calculation unit that calculates a content rate included for each of the plurality of other user's dictionaries via the interface unit,
Based on the content rate calculated for each of the plurality of other person's user dictionaries, a reference user dictionary selecting unit that selects the other person's user dictionary to be used from the other person's user dictionary;
A speech synthesizer comprising: a reading determination unit that determines reading of an unknown word that is not included in either the basic dictionary or the user dictionary using the user dictionary of another person to be used selected by the reference user dictionary selection unit.
(付記2)
更に、前記合成対象テキストから、前記基本辞書にも前記利用者のユーザ辞書にも含まれない未知語を抽出する未知語抽出部を備え、
前記含有率算出部は、前記未知語抽出部が抽出した未知語について、前記インターフェース部経由で前記複数の他人のユーザ辞書毎に含まれる含有率を算出する、付記1に記載の音声合成装置。
(Appendix 2)
Furthermore, an unknown word extraction unit that extracts an unknown word that is not included in the basic dictionary or the user dictionary of the user from the synthesis target text,
The speech synthesizer according to appendix 1, wherein the content rate calculation unit calculates the content rate included in each of the plurality of other user's dictionaries via the interface unit for the unknown word extracted by the unknown word extraction unit.
(付記3)
前記含有率算出部は、前記ユーザ登録単語抽出部が抽出したユーザ登録単語、及び前記未知語抽出部が抽出した未知語が他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択部は、前記複数の他人のユーザ辞書毎に算出されたユーザ登録単語、及び未知語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、付記2に記載の音声合成装置。
(Appendix 3)
The content rate calculation unit calculates the content rate that the user registration word extracted by the user registration word extraction unit and the unknown word extracted by the unknown word extraction unit are included in another user's dictionary,
The reference user dictionary selection unit calculates a user dictionary of another person to be used from the plurality of other person's user dictionaries based on a user registration word calculated for each of the plurality of other person's user dictionaries and an unknown word content rate. The speech synthesizer according to appendix 2, which is selected.
(付記4)
更に、専門分野毎の専門単語が登録されている専門辞書と、
前記テキスト入力部で入力を受付けた合成対象テキストから、前記専門辞書に含まれる専門辞書登録単語を抽出する専門辞書登録単語抽出部を備え、
前記含有率算出部は、前記ユーザ登録単語抽出部が抽出したユーザ登録単語、及び専門辞書登録単語抽出部が抽出した専門辞書登録単語が他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択部は、前記含有率算出部が算出したユーザ登録単語、及び専門辞書登録単語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、付記1に記載の音声合成装置。
(Appendix 4)
In addition, a specialized dictionary in which specialized words for each specialized field are registered,
A specialized dictionary registered word extraction unit that extracts a specialized dictionary registered word included in the specialized dictionary from the synthesis target text accepted by the text input unit;
The content rate calculation unit calculates the content rate that the user registration word extracted by the user registration word extraction unit and the professional dictionary registration word extracted by the specialized dictionary registration word extraction unit are included in the other person's user dictionary,
The reference user dictionary selection unit selects a user dictionary of another person to be used from the plurality of other person's user dictionaries based on the user registration word calculated by the content rate calculation unit and the content rate of the specialized dictionary registration word. The speech synthesizer according to appendix 1.
(付記5)
前記合成対象テキストから、前記基本辞書にも前記利用者のユーザ辞書にも含まれない未知語を抽出する未知語抽出部と、
専門分野毎の専門単語が登録されている専門辞書と、
前記テキスト入力部で入力を受付けた合成対象テキストから、前記専門辞書に含まれる専門辞書登録単語を抽出する専門辞書登録単語抽出部とをさらに備え、
前記含有率算出部は、前記ユーザ登録単語抽出部が抽出したユーザ登録単語、前記未知語抽出部が抽出した未知語、及び専門辞書登録単語抽出部が抽出した辞書登録単語のうち少なくとも1つに基づいて、他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択部は、前記含有率算出部が算出した含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、付記1に記載の音声合成装置。
(Appendix 5)
An unknown word extraction unit that extracts unknown words that are not included in the basic dictionary or the user dictionary of the user from the text to be synthesized;
A specialized dictionary in which specialized words for each specialized field are registered,
A specialized dictionary registration word extraction unit that extracts a specialized dictionary registration word included in the specialized dictionary from the synthesis target text accepted by the text input unit;
The content rate calculation unit may include at least one of a user registration word extracted by the user registration word extraction unit, an unknown word extracted by the unknown word extraction unit, and a dictionary registration word extracted by a specialized dictionary registration word extraction unit. Based on the content rate included in the other person's user dictionary,
The speech synthesis device according to attachment 1, wherein the reference user dictionary selection unit selects a user dictionary of another person to be used from the plurality of other person's user dictionaries based on the content rate calculated by the content rate calculation unit.
(付記6)
前記含有率算出部は、単語の種類に応じて重み付けして含有率を算出し、
前記参照ユーザ辞書選択部は、前記含有率算出部が重み付けをした後の含有率に基づいて前記複数の他人のユーザ辞書から、利用すべき他人のユーザ辞書を選択する、付記1〜5のいずれかに記載の音声合成装置。
(Appendix 6)
The content rate calculation unit calculates the content rate by weighting according to the type of word,
The reference user dictionary selection unit selects any other user's user dictionary to be used from the plurality of other person's user dictionaries based on the content rate after the content rate calculation unit is weighted. A speech synthesizer according to claim 1.
(付記7)
前記参照ユーザ辞書選択部が利用すべき他人のユーザ辞書を複数選択し、
前記読み決定部は、当該複数の利用すべき他人のユーザ辞書間で未知語の読みが異なる場合、当該選択された利用すべきユーザ辞書のうち、前記含有率が最も高い他人のユーザ辞書を用いて、未知語の読みを決定する、付記1〜6のいずれかに記載の音声合成装置。
(Appendix 7)
A plurality of other user dictionaries to be used by the reference user dictionary selection unit;
When the reading of unknown words is different among the plurality of other user dictionary to be used, the reading determining unit uses the other user dictionary having the highest content rate among the selected user dictionary to be used. The speech synthesizer according to any one of appendices 1 to 6, which determines reading of an unknown word.
(付記8)
基本辞書と利用者固有のユーザ辞書を用いる音声合成方法であって、
コンピュータが合成対象テキストの入力を受付けるテキスト入力ステップと、
前記テキスト入力ステップで入力を受付けた合成対象テキストから、前記コンピュータがユーザ辞書に含まれるユーザ登録単語を抽出するユーザ登録単語抽出ステップと、
前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語について、前記コンピュータがインターフェース部経由で複数の他人のユーザ辞書毎に含まれる含有率を算出する含有率算出ステップと、
前記複数の他人のユーザ辞書毎に算出された含有率に基づいて、前記コンピュータが前記他人のユーザ辞書から利用する他人のユーザ辞書を選択する参照ユーザ辞書選択ステップと、
前記参照ユーザ辞書選択部で選択された利用すべき他人のユーザ辞書を用いて、前記コンピュータが基本辞書にもユーザ辞書にも含まれない未知語の読みを決定する読み決定ステップとを含む、音声合成方法。
(Appendix 8)
A speech synthesis method that uses a basic dictionary and a user-specific user dictionary,
A text input step in which the computer accepts input of the text to be synthesized;
A user-registered word extracting step in which the computer extracts a user-registered word included in a user dictionary from the synthesis target text received in the text input step;
About the user registration word extracted in the user registration word extraction step, the computer calculates a content ratio included in each of a plurality of other user's dictionaries via the interface unit,
A reference user dictionary selection step in which the computer selects a user dictionary of another person to use from the user dictionary of the other person based on the content rate calculated for each of the plurality of other person user dictionaries;
Using a user dictionary of another person to be used selected by the reference user dictionary selecting unit, and a reading determining step in which the computer determines a reading of an unknown word that is not included in the basic dictionary or the user dictionary. Synthesis method.
(付記9)
更に、前記コンピュータが前記合成対象テキストから、前記基本辞書にも前記利用者のユーザ辞書にも含まれない未知語を抽出する未知語抽出ステップを含み、
前記含有率算出ステップでは、前記未知語抽出ステップで抽出した未知語について、前記インターフェース部経由で前記複数の他人のユーザ辞書毎に含まれる含有率を算出する、付記8に記載の音声合成方法。
(Appendix 9)
Furthermore, the computer includes an unknown word extraction step of extracting an unknown word that is not included in the basic dictionary or the user's user dictionary from the composition target text,
9. The speech synthesis method according to appendix 8, wherein in the content rate calculation step, the content rate included in each of the plurality of other user's dictionaries is calculated via the interface unit for the unknown word extracted in the unknown word extraction step.
(付記10)
基本辞書と利用者固有のユーザ辞書を用いる音声合成プログラムであって、
コンピュータに、
合成対象テキストの入力を受付けるテキスト入力ステップと、
前記テキスト入力ステップで入力を受付けた合成対象テキストから、ユーザ辞書に含まれるユーザ登録単語を抽出するユーザ登録単語抽出ステップと、
前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語について、インターフェース部経由で複数の他人のユーザ辞書毎に含まれる含有率を算出する含有率算出ステップと、
前記複数の他人のユーザ辞書毎に算出された含有率に基づいて、前記他人のユーザ辞書から利用する他人のユーザ辞書を選択する参照ユーザ辞書選択ステップと、
前記参照ユーザ辞書選択部で選択された利用すべき他人のユーザ辞書を用いて、基本辞書にもユーザ辞書にも含まれない未知語の読みを決定する読み決定ステップとを実行させる、音声合成プログラム。
(Appendix 10)
A speech synthesis program that uses a basic dictionary and a user-specific user dictionary,
On the computer,
A text input step that accepts input of text to be synthesized;
A user registration word extraction step for extracting a user registration word included in the user dictionary from the synthesis target text accepted in the text input step;
About the user registration word extracted in the user registration word extraction step, a content rate calculation step for calculating a content rate included for each of a plurality of other user's dictionaries via the interface unit;
A reference user dictionary selection step of selecting a user dictionary of another person to be used from the user dictionary of the other person based on the content rate calculated for each of the plurality of other person user dictionaries;
A speech synthesis program for executing a reading determination step for determining reading of an unknown word that is not included in either the basic dictionary or the user dictionary using the user dictionary of another person to be used selected by the reference user dictionary selection unit .
(付記11)
更に、前記コンピュータに、前記合成対象テキストから、前記基本辞書にも前記利用者のユーザ辞書にも含まれない未知語を抽出する未知語抽出ステップを実行させ、
前記含有率算出ステップでは、前記未知語抽出ステップで抽出した未知語について、前記インターフェース部経由で前記複数の他人のユーザ辞書毎に含まれる含有率を算出する、付記10に記載の音声合成プログラム。
(Appendix 11)
Furthermore, the computer is caused to execute an unknown word extraction step for extracting an unknown word that is not included in the basic dictionary or the user dictionary of the user from the text to be synthesized.
The speech synthesis program according to appendix 10, wherein in the content rate calculation step, the content rate included in each of the plurality of other user's dictionaries is calculated via the interface unit for the unknown word extracted in the unknown word extraction step.
(付記12)
前記含有率算出ステップでは、前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語、及び前記未知語抽出ステップで抽出した未知語が他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択ステップでは、前記複数の他人のユーザ辞書毎に算出されたユーザ登録単語、及び未知語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、付記11に記載の音声合成プログラム。
(Appendix 12)
In the content rate calculation step, the user registration word extracted in the user registration word extraction step, and the content rate that the unknown word extracted in the unknown word extraction step is included in another user's dictionary,
In the reference user dictionary selecting step, based on the user registration word calculated for each of the plurality of other person's user dictionaries and the content rate of unknown words, the other person's user dictionary to be used from the plurality of other person's user dictionaries is obtained. The speech synthesis program according to appendix 11, which is selected.
(付記13)
前記コンピュータに、
更に、前記テキスト入力部で入力を受付けた合成対象テキストから、専門分野毎の専門単語が登録されている専門辞書に含まれる専門辞書登録単語を抽出する専門辞書登録単語抽出ステップを実行させ、
前記含有率算出ステップでは、前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語、及び前記専門辞書登録単語抽出ステップで抽出した専門辞書登録単語が他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択ステップでは、前記含有率算出ステップで算出したユーザ登録単語、及び専門辞書登録単語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、付記11に記載の音声合成プログラム。
(Appendix 13)
In the computer,
Furthermore, from the synthesis target text accepted by the text input unit, to execute a specialized dictionary registration word extraction step for extracting specialized dictionary registration words included in a specialized dictionary in which specialized words for each specialized field are registered,
In the content rate calculation step, the user registration word extracted in the user registration word extraction step, and the content rate in which the specialized dictionary registration word extracted in the specialized dictionary registration word extraction step is included in another user's dictionary,
In the reference user dictionary selection step, a user dictionary of another person to be used is selected from the plurality of other person's user dictionaries based on the user registration word calculated in the content ratio calculation step and the content ratio of the specialized dictionary registration word. The speech synthesis program according to attachment 11.
100 音声合成装置
110 基本辞書
120 ユーザ辞書
130 ユーザ辞書インターフェース部
140 テキスト入力部
150 言語処理部
151 形態素解析部
152 未知語抽出部
153 ユーザ登録単語抽出部
154 含有率算出部
155 参照ユーザ辞書選択部
156 読み決定部
157 含有率比較部
158 同表記異読語検出部
159 優先度決定部
160 波形処理部
161 一時辞書作成部
162 形態素解析部
163 アクセント決定部
170 音声出力部
180 専門辞書
190 専門辞書登録単語抽出部
200 重み付け含有率算出部
100
Claims (9)
合成対象テキストの入力を受付けるテキスト入力部と、
複数の他人のユーザ辞書を参照可能なインターフェース部と、
前記テキスト入力部で入力を受付けた合成対象テキストから、ユーザ辞書に含まれるユーザ登録単語を抽出するユーザ登録単語抽出部と、
前記ユーザ登録単語抽出部が抽出したユーザ登録単語について、前記インターフェース部経由で前記複数の他人のユーザ辞書毎に含まれる含有率を算出する含有率算出部と、
前記複数の他人のユーザ辞書毎に算出された含有率に基づいて、前記他人のユーザ辞書から利用する他人のユーザ辞書を選択する参照ユーザ辞書選択部と、
前記参照ユーザ辞書選択部で選択された利用すべき他人のユーザ辞書を用いて、基本辞書にもユーザ辞書にも含まれない未知語の読みを決定する読み決定部とを備える、音声合成装置。 A speech synthesizer having a basic dictionary and a user-specific user dictionary,
A text input part that accepts input of text to be synthesized;
An interface unit that can refer to a plurality of other user's dictionaries;
A user-registered word extraction unit that extracts a user-registered word included in the user dictionary from the text to be synthesized that is accepted by the text input unit;
About a user registration word extracted by the user registration word extraction unit, a content rate calculation unit that calculates a content rate included for each of the plurality of other user's dictionaries via the interface unit,
Based on the content rate calculated for each of the plurality of other person's user dictionaries, a reference user dictionary selecting unit that selects the other person's user dictionary to be used from the other person's user dictionary;
A speech synthesizer comprising: a reading determination unit that determines reading of an unknown word that is not included in either the basic dictionary or the user dictionary using the user dictionary of another person to be used selected by the reference user dictionary selection unit.
前記含有率算出部は、前記未知語抽出部が抽出した未知語について、前記インターフェース部経由で前記複数の他人のユーザ辞書毎に含まれる含有率を算出する、請求項1に記載の音声合成装置。 Furthermore, an unknown word extraction unit that extracts an unknown word that is not included in the basic dictionary or the user dictionary of the user from the synthesis target text,
The speech synthesizer according to claim 1, wherein the content rate calculation unit calculates a content rate included in each of the plurality of other user's dictionaries via the interface unit for the unknown word extracted by the unknown word extraction unit. .
前記参照ユーザ辞書選択部は、前記複数の他人のユーザ辞書毎に算出されたユーザ登録単語、及び未知語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、請求項2に記載の音声合成装置。 The content rate calculation unit calculates the content rate that the user registration word extracted by the user registration word extraction unit and the unknown word extracted by the unknown word extraction unit are included in another user's dictionary,
The reference user dictionary selection unit calculates a user dictionary of another person to be used from the plurality of other person's user dictionaries based on a user registration word calculated for each of the plurality of other person's user dictionaries and an unknown word content rate. The speech synthesizer according to claim 2, which is selected.
前記テキスト入力部で入力を受付けた合成対象テキストから、前記専門辞書に含まれる専門辞書登録単語を抽出する専門辞書登録単語抽出部を備え、
前記含有率算出部は、前記ユーザ登録単語抽出部が抽出したユーザ登録単語、及び専門辞書登録単語抽出部が抽出した専門辞書登録単語が他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択部は、前記含有率算出部が算出したユーザ登録単語、及び専門辞書登録単語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、請求項1に記載の音声合成装置。 In addition, a specialized dictionary in which specialized words for each specialized field are registered,
A specialized dictionary registered word extraction unit that extracts a specialized dictionary registered word included in the specialized dictionary from the synthesis target text accepted by the text input unit;
The content rate calculation unit calculates the content rate that the user registration word extracted by the user registration word extraction unit and the professional dictionary registration word extracted by the specialized dictionary registration word extraction unit are included in the other person's user dictionary,
The reference user dictionary selection unit selects a user dictionary of another person to be used from the plurality of other person's user dictionaries based on the user registration word calculated by the content rate calculation unit and the content rate of the specialized dictionary registration word. The speech synthesizer according to claim 1.
専門分野毎の専門単語が登録されている専門辞書と、
前記テキスト入力部で入力を受付けた合成対象テキストから、前記専門辞書に含まれる専門辞書登録単語を抽出する専門辞書登録単語抽出部とをさらに備え、
前記含有率算出部は、前記ユーザ登録単語抽出部が抽出したユーザ登録単語、前記未知語抽出部が抽出した未知語、及び専門辞書登録単語抽出部が抽出した辞書登録単語のうち少なくとも1つに基づいて、他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択部は、前記含有率算出部が算出した含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、請求項1に記載の音声合成装置。 An unknown word extraction unit that extracts unknown words that are not included in the basic dictionary or the user dictionary of the user from the text to be synthesized;
A specialized dictionary in which specialized words for each specialized field are registered,
A specialized dictionary registration word extraction unit that extracts a specialized dictionary registration word included in the specialized dictionary from the synthesis target text accepted by the text input unit;
The content rate calculation unit may include at least one of a user registration word extracted by the user registration word extraction unit, an unknown word extracted by the unknown word extraction unit, and a dictionary registration word extracted by a specialized dictionary registration word extraction unit. Based on the content rate included in the other person's user dictionary,
The speech synthesizer according to claim 1, wherein the reference user dictionary selection unit selects a user dictionary of another person to be used from the plurality of other person user dictionaries based on the content rate calculated by the content rate calculation unit. .
コンピュータが合成対象テキストの入力を受付けるテキスト入力ステップと、
前記テキスト入力ステップで入力を受付けた合成対象テキストから、前記コンピュータがユーザ辞書に含まれるユーザ登録単語を抽出するユーザ登録単語抽出ステップと、
前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語について、前記コンピュータがインターフェース部経由で複数の他人のユーザ辞書毎に含まれる含有率を算出する含有率算出ステップと、
前記複数の他人のユーザ辞書毎に算出された含有率に基づいて、前記コンピュータが前記他人のユーザ辞書から利用する他人のユーザ辞書を選択する参照ユーザ辞書選択ステップと、
前記参照ユーザ辞書選択部で選択された利用すべき他人のユーザ辞書を用いて、前記コンピュータが基本辞書にもユーザ辞書にも含まれない未知語の読みを決定する読み決定ステップとを含む、音声合成方法。 A speech synthesis method that uses a basic dictionary and a user-specific user dictionary,
A text input step in which the computer accepts input of the text to be synthesized;
A user-registered word extracting step in which the computer extracts a user-registered word included in a user dictionary from the synthesis target text received in the text input step;
About the user registration word extracted in the user registration word extraction step, the computer calculates a content ratio included in each of a plurality of other user's dictionaries via the interface unit,
A reference user dictionary selection step in which the computer selects a user dictionary of another person to use from the user dictionary of the other person based on the content rate calculated for each of the plurality of other person user dictionaries;
Using a user dictionary of another person to be used selected by the reference user dictionary selecting unit, and a reading determining step in which the computer determines a reading of an unknown word that is not included in the basic dictionary or the user dictionary. Synthesis method.
コンピュータに、
合成対象テキストの入力を受付けるテキスト入力ステップと、
前記テキスト入力ステップで入力を受付けた合成対象テキストから、ユーザ辞書に含まれるユーザ登録単語を抽出するユーザ登録単語抽出ステップと、
前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語について、インターフェース部経由で複数の他人のユーザ辞書毎に含まれる含有率を算出する含有率算出ステップと、
前記複数の他人のユーザ辞書毎に算出された含有率に基づいて、前記他人のユーザ辞書から利用する他人のユーザ辞書を選択する参照ユーザ辞書選択ステップと、
前記参照ユーザ辞書選択部で選択された利用すべき他人のユーザ辞書を用いて、基本辞書にもユーザ辞書にも含まれない未知語の読みを決定する読み決定ステップとを実行させる、音声合成プログラム。 A speech synthesis program that uses a basic dictionary and a user-specific user dictionary,
On the computer,
A text input step that accepts input of text to be synthesized;
A user registration word extraction step for extracting a user registration word included in the user dictionary from the synthesis target text accepted in the text input step;
About the user registration word extracted in the user registration word extraction step, a content rate calculation step for calculating a content rate included for each of a plurality of other user's dictionaries via the interface unit;
A reference user dictionary selection step of selecting a user dictionary of another person to be used from the user dictionary of the other person based on the content rate calculated for each of the plurality of other person user dictionaries;
A speech synthesis program for executing a reading determination step for determining reading of an unknown word that is not included in either the basic dictionary or the user dictionary using the user dictionary of another person to be used selected by the reference user dictionary selection unit .
更に、前記合成対象テキストから、前記基本辞書にも前記利用者のユーザ辞書にも含まれない未知語を抽出する未知語抽出ステップを実行させ、
前記含有率算出ステップでは、前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語、及び前記未知語抽出ステップで抽出した未知語が他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択ステップでは、前記複数の他人のユーザ辞書毎に算出されたユーザ登録単語、及び未知語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、請求項7に記載の音声合成プログラム。 In the computer,
Further, an unknown word extraction step for extracting unknown words that are not included in the basic dictionary or the user dictionary of the user from the text to be synthesized is performed,
In the content rate calculation step, the user registration word extracted in the user registration word extraction step, and the content rate that the unknown word extracted in the unknown word extraction step is included in another user's dictionary,
In the reference user dictionary selecting step, based on the user registration word calculated for each of the plurality of other person's user dictionaries and the content rate of unknown words, the other person's user dictionary to be used from the plurality of other person's user dictionaries is obtained. The speech synthesis program according to claim 7 to be selected.
更に、前記テキスト入力部で入力を受付けた合成対象テキストから、専門分野毎の専門単語が登録されている専門辞書に含まれる専門辞書登録単語を抽出する専門辞書登録単語抽出ステップを実行させ、
前記含有率算出ステップでは、前記ユーザ登録単語抽出ステップで抽出したユーザ登録単語、及び前記専門辞書登録単語抽出ステップで抽出した専門辞書登録単語が他人のユーザ辞書に含まれる含有率を算出し、
前記参照ユーザ辞書選択ステップでは、前記含有率算出ステップで算出したユーザ登録単語、及び専門辞書登録単語の含有率に基づいて、前記複数の他人のユーザ辞書から利用すべき他人のユーザ辞書を選択する、請求項7に記載の音声合成プログラム。 In the computer,
Furthermore, from the synthesis target text accepted by the text input unit, to execute a specialized dictionary registration word extraction step for extracting specialized dictionary registration words included in a specialized dictionary in which specialized words for each specialized field are registered,
In the content rate calculation step, the user registration word extracted in the user registration word extraction step, and the content rate in which the specialized dictionary registration word extracted in the specialized dictionary registration word extraction step is included in another user's dictionary,
In the reference user dictionary selection step, a user dictionary of another person to be used is selected from the plurality of other person's user dictionaries based on the user registration word calculated in the content ratio calculation step and the content ratio of the specialized dictionary registration word. The speech synthesis program according to claim 7.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009293029A JP5325086B2 (en) | 2009-12-24 | 2009-12-24 | Speech synthesis apparatus, speech synthesis method, and speech synthesis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009293029A JP5325086B2 (en) | 2009-12-24 | 2009-12-24 | Speech synthesis apparatus, speech synthesis method, and speech synthesis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011133658A true JP2011133658A (en) | 2011-07-07 |
JP5325086B2 JP5325086B2 (en) | 2013-10-23 |
Family
ID=44346463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009293029A Expired - Fee Related JP5325086B2 (en) | 2009-12-24 | 2009-12-24 | Speech synthesis apparatus, speech synthesis method, and speech synthesis program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5325086B2 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11327871A (en) * | 1998-05-11 | 1999-11-30 | Fujitsu Ltd | Voice synthesizing device |
-
2009
- 2009-12-24 JP JP2009293029A patent/JP5325086B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11327871A (en) * | 1998-05-11 | 1999-11-30 | Fujitsu Ltd | Voice synthesizing device |
Also Published As
Publication number | Publication date |
---|---|
JP5325086B2 (en) | 2013-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11106714B2 (en) | Summary generating apparatus, summary generating method and computer program | |
CA2614840C (en) | System, program, and control method for speech synthesis | |
JP5599662B2 (en) | System and method for converting kanji into native language pronunciation sequence using statistical methods | |
JP2015094848A (en) | Information processor, information processing method and program | |
JP2004355483A (en) | Morpheme analysis device, morpheme analysis method and morpheme analysis program | |
JP4570509B2 (en) | Reading generation device, reading generation method, and computer program | |
JP5625827B2 (en) | Morphological analyzer, speech synthesizer, morphological analysis method, and morphological analysis program | |
JP2010520531A (en) | Integrated pinyin and image input | |
KR20180121831A (en) | Interest determination system, interest determination method, and storage medium | |
CN113380223A (en) | Method, device, system and storage medium for disambiguating polyphone | |
Raj et al. | Text processing for text-to-speech systems in Indian languages. | |
JP2002117027A (en) | Feeling information extracting method and recording medium for feeling information extracting program | |
JP5097802B2 (en) | Japanese automatic recommendation system and method using romaji conversion | |
JP2022121456A (en) | Processing program, processing method, and information processing apparatus | |
CN114863945A (en) | Text-based voice changing method and device, electronic equipment and storage medium | |
JP5152588B2 (en) | Voice quality change determination device, voice quality change determination method, voice quality change determination program | |
Nguyen et al. | A method for Vietnamese Text Normalization to improve the quality of speech synthesis | |
Onyenwe et al. | Toward an effective igbo part-of-speech tagger | |
JP5853595B2 (en) | Morphological analyzer, method, program, speech synthesizer, method, program | |
US20200243092A1 (en) | Information processing device, information processing system, and computer program product | |
JP5325086B2 (en) | Speech synthesis apparatus, speech synthesis method, and speech synthesis program | |
JP2005339347A (en) | Japanese-chinese mechanical translation device, japanese-chinese mechanical translation method and japanese-chinese mechanical translation program | |
JP3471253B2 (en) | Document classification method, document classification device, and recording medium recording document classification program | |
JP7135730B2 (en) | Summary generation method and summary generation program | |
JP2017026808A (en) | Voice recognition device, voice recognition method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130416 |
|
TRDD | Decision of grant or rejection written | ||
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130701 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130702 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130719 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5325086 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |