JP2001014310A - Device and method for compressing conversion dictionary used for voice synthesis application - Google Patents

Device and method for compressing conversion dictionary used for voice synthesis application

Info

Publication number
JP2001014310A
JP2001014310A JP11187598A JP18759899A JP2001014310A JP 2001014310 A JP2001014310 A JP 2001014310A JP 11187598 A JP11187598 A JP 11187598A JP 18759899 A JP18759899 A JP 18759899A JP 2001014310 A JP2001014310 A JP 2001014310A
Authority
JP
Japan
Prior art keywords
dictionary
priority
size
vocabulary
speech synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11187598A
Other languages
Japanese (ja)
Inventor
Atsushi Yamamoto
篤志 山本
Akihiro Kimura
晋太 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11187598A priority Critical patent/JP2001014310A/en
Publication of JP2001014310A publication Critical patent/JP2001014310A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To generate a new dictionary wherein the priority of data is set according to the needs of users. SOLUTION: This method includes a dictionary size input part for inputting the size of a dictionary and a priority decision part 12 which decides the priority of vocabularies stored in the dictionary. The priority decision part extracts vocabularies of high priority from a dictionary main body 13 in order according to corpus 14 information, and stores extracted vocabularies up to the dictionary size inputted at the dictionary input part 11 to generate a new dictionary.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、テキストデータや
波形データ等に基づいて音声合成を行うアプリケーショ
ンにおける、変換に用いる辞書を圧縮する装置及び方法
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and a method for compressing a dictionary used for conversion in an application for performing speech synthesis based on text data, waveform data, and the like.

【0002】[0002]

【従来の技術】昨今のコンピュータ技術の急速な進展に
よって、従来はそのデータ量の膨大さによって、処理時
間が実用的な範囲に収まらないことを理由として敬遠さ
れてきた音声を用いたアプリケーションが多々作成され
るようになってきた。
2. Description of the Related Art Due to the rapid progress of computer technology in recent years, there have been many applications using voice, which have been shunned because the processing time is not within a practical range due to the huge amount of data. It is being created.

【0003】その中でも、テキストデータや波形データ
等に基づいて、音声を人工的に合成して発生させるアプ
リケーションは、利用者にコンピュータを使用している
ことを意識させないユーザインタフェースを実現するた
めに広く用いられるようになってきた。
[0003] Above all, applications that artificially synthesize speech based on text data, waveform data, and the like are widely used to realize a user interface that does not make the user aware of using a computer. It is being used.

【0004】かかるアプリケーションを実現するために
は、変換のための辞書が必須となってくる。すなわち、
音声合成アプリケーションにおいては、単語辞書や波形
辞書が必要となる。
In order to realize such an application, a dictionary for conversion is essential. That is,
In a speech synthesis application, a word dictionary and a waveform dictionary are required.

【0005】しかし、一般にこれらの辞書によって音声
合成の明瞭度を上げるためには、辞書に含まれるべき情
報は膨大なものになるおそれがあり、またその情報量が
多くなればなるほど演算処理時間は長くなることから、
辞書に含まれるべき情報をどの程度にするのかは、実用
上重要な課題となっている。
However, in general, in order to increase the clarity of speech synthesis using these dictionaries, the information to be included in the dictionaries may be enormous, and the more the amount of information, the longer the processing time becomes. Because it becomes long,
Determining how much information should be included in a dictionary is an important practical issue.

【0006】実用的かつコンパクトな辞書を作成する方
法については、多くの方法が開示されている。例えば、
特開平5−189415号公報においては、優先順位の
固定された辞書から、長期学習情報やニューロテーブル
の活性値に基づいた基本語を取り出すことで、新たな精
選辞書を作成する方法が開示されている。
Many methods have been disclosed for creating a practical and compact dictionary. For example,
Japanese Patent Application Laid-Open No. 5-189415 discloses a method of creating a new selected dictionary by extracting basic words based on long-term learning information and the activation value of a neuro table from a dictionary having a fixed priority. I have.

【0007】[0007]

【発明が解決しようとする課題】しかし、上述したよう
な従来の方法では、元になる辞書の優先順位が固定され
ていることから、新たな精選辞書を作成するための基本
語抽出条件によっては、基本語の抽出が効率よく行われ
ない場合が生じるという問題点があった。すなわち、利
用者のニーズは時々刻々変化するものであり、優先順位
が固定されているということは、たとえ長期学習情報等
によって抽出条件を付加したとしても、辞書内の探索順
序は固定された優先順位に従うことから、付加される抽
出条件によっては抽出されるべき基本語の探索効率が悪
く、抽出に時間がかかってしまうおそれがある。
However, in the conventional method as described above, since the priorities of the original dictionaries are fixed, depending on the basic word extraction conditions for creating a new selected dictionary. However, there is a problem that the extraction of the basic word may not be performed efficiently. In other words, the needs of the user change from moment to moment, and the fact that the priorities are fixed means that the search order in the dictionary is fixed even if extraction conditions are added by long-term learning information or the like. Since the order is followed, the search efficiency of the basic word to be extracted is low depending on the added extraction condition, and the extraction may take time.

【0008】また、特殊事情による抽出条件が必要とさ
れる場合、例えば特定の雑誌に関する語彙を優先的に抽
出するとか、今日はこのカテゴリについて、明日はこの
カテゴリについて、というように、優先基準が短期間で
頻繁に変化する場合においては、上述したような従来の
方法では対応しきれない。
[0008] In addition, when extraction conditions due to special circumstances are required, for example, vocabulary relating to a specific magazine is preferentially extracted, or a priority criterion such as this category for today, this category for tomorrow, and the like. In the case of frequently changing in a short period, the conventional method as described above cannot cope with the situation.

【0009】本発明は、上記問題点を解決すべく、利用
者のニーズに合わせて、データの優先順位を設定した新
たな辞書を作成することのできる音声合成アプリケーシ
ョンに用いる変換辞書圧縮装置及び方法を提供すること
を目的とする。
In order to solve the above problems, the present invention provides a conversion dictionary compression apparatus and method for use in a speech synthesis application capable of creating a new dictionary in which data priorities are set according to the needs of the user. The purpose is to provide.

【0010】[0010]

【課題を解決するための手段】上記目的を達成するため
に本発明にかかる音声合成アプリケーションに用いる変
換辞書圧縮装置は、辞書のサイズを入力する辞書サイズ
入力部と、辞書に格納されている語彙の優先順位を判定
する優先順位判定部とを含み、優先順位判定部におい
て、コーパス情報に基づいて辞書本体から優先順位の高
い語彙を順に抽出し、辞書サイズ入力部で入力された辞
書サイズになるまで抽出した語彙を格納して新たな辞書
を作成することを特徴とする。
According to the present invention, there is provided a conversion dictionary compression apparatus used for a speech synthesis application according to the present invention, comprising: a dictionary size input unit for inputting a dictionary size; and a vocabulary stored in the dictionary. A priority determining unit that determines the priority of the dictionary, and in the priority determining unit, extracts words having a high priority from the dictionary body in order based on the corpus information, and obtains the dictionary size input by the dictionary size input unit. A new dictionary is created by storing the extracted vocabulary up to this point.

【0011】かかる構成により、コーパス情報に従っ
て、辞書に含まれる語彙の優先順位を動的に変化させる
ことができるので、特定の雑誌に関する語彙を優先的に
抽出するとか、優先基準が短期間で頻繁に変化する場合
においても、コーパス情報を変えるだけで抽出すべき基
本語の探索を効率良く行うことが可能となる。
With this configuration, the priority of the vocabulary included in the dictionary can be dynamically changed in accordance with the corpus information. Therefore, the vocabulary related to a specific magazine is preferentially extracted, or the priority standard is frequently set in a short period of time. , It is possible to efficiently search for basic words to be extracted simply by changing the corpus information.

【0012】次に、上記目的を達成するために本発明に
かかる音声合成アプリケーションに用いる変換辞書圧縮
方法は、辞書のサイズを入力する工程と、辞書に格納さ
れている語彙の優先順位を判定する工程とを含み、コー
パス情報に基づいて辞書本体から優先順位の高い語彙を
順に抽出し、入力された辞書サイズになるまで抽出した
語彙を格納して新たな辞書を作成することを特徴とす
る。
Next, in order to achieve the above object, a conversion dictionary compression method used for a speech synthesis application according to the present invention comprises the steps of inputting the size of a dictionary and determining the priority of vocabulary stored in the dictionary. And extracting a vocabulary having a high priority from the dictionary body based on the corpus information, and storing the extracted vocabulary until the input dictionary size is reached, to create a new dictionary.

【0013】かかる構成により、コーパス情報に従っ
て、辞書に含まれる語彙の優先順位を動的に変化させる
ことができるので、特定の雑誌に関する語彙を優先的に
抽出するとか、優先基準が短期間で頻繁に変化する場合
においても、コーパス情報を変えるだけで抽出すべき基
本語の探索を効率良く行うことが可能となる。
With this configuration, the priority of the vocabulary included in the dictionary can be dynamically changed according to the corpus information. Therefore, the vocabulary related to a specific magazine can be preferentially extracted, or the priority criterion is frequently set in a short period of time. , It is possible to efficiently search for basic words to be extracted simply by changing the corpus information.

【0014】また、本発明は、上記のような音声合成ア
プリケーションに用いる変換辞書圧縮の機能をコンピュ
ータの処理ステップとして実行するソフトウェアを特徴
とするものであり、具体的には、辞書のサイズを入力す
る工程と、辞書に格納されている語彙の優先順位を判定
する工程とを含み、コーパス情報に基づいて辞書本体か
ら優先順位の高い語彙を順に抽出し、入力された辞書サ
イズになるまで抽出した語彙を格納して新たな辞書を作
成する音声合成アプリケーションに用いる変換辞書圧縮
方法並びにそのような工程をプログラムとして記録した
コンピュータ読み取り可能な記録媒体であることを特徴
とする。
Further, the present invention is characterized by software for executing the function of the conversion dictionary compression used for the above-mentioned speech synthesis application as a processing step of a computer, and more specifically, to input a dictionary size. And deciding the priority order of the vocabulary stored in the dictionary. The vocabulary with the highest priority is sequentially extracted from the dictionary body based on the corpus information, and extracted until the input dictionary size is reached. A conversion dictionary compression method used for a speech synthesis application that stores a vocabulary and creates a new dictionary, and a computer-readable recording medium that records such a process as a program.

【0015】かかる構成により、コンピュータ上へ当該
プログラムをロードさせ実行することで、コーパス情報
に従って、辞書に含まれる語彙の優先順位を動的に変化
させることができるので、特定の雑誌に関する語彙を優
先的に抽出するとか、優先基準が短期間で頻繁に変化す
る場合においても、コーパス情報を変えるだけで抽出す
べき基本語の探索を効率良く行うことが可能となる音声
合成アプリケーションに用いる変換辞書圧縮装置を実現
することができる。
With this configuration, by loading and executing the program on the computer, the priority of the vocabulary included in the dictionary can be dynamically changed in accordance with the corpus information. Conversion dictionary compression for speech synthesis applications that enables efficient search of basic words to be extracted by simply changing corpus information, even when the priority criteria frequently change in a short period of time or when the priority criteria change frequently. The device can be realized.

【0016】[0016]

【発明の実施の形態】以下、本発明の実施の形態にかか
る音声合成アプリケーションに用いる変換辞書圧縮装置
について、図面を参照しながら説明する。図1は本発明
の実施の形態にかかる音声合成アプリケーションに用い
る変換辞書圧縮装置の構成図である。図1において、1
1は辞書サイズ入力部を、12は優先順位判定部を、1
3は辞書本体を、14はコーパスを、15は新規作成辞
書を、それぞれ示す。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, a conversion dictionary compression device used for a speech synthesis application according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram of a conversion dictionary compression device used for a speech synthesis application according to an embodiment of the present invention. In FIG. 1, 1
1 is a dictionary size input unit, 12 is a priority order determination unit, and 1 is a dictionary size input unit.
3 indicates a dictionary body, 14 indicates a corpus, and 15 indicates a newly created dictionary.

【0017】図1において、まず辞書サイズ入力部11
において作成する辞書のサイズを入力する。辞書のサイ
ズを入力するのは、例えばPDA(Personal DigitalAs
sistant )や携帯端末のように計算機資源の限られてい
る媒体においても、音声を用いたアプリケーションを用
いることができるようにするためである。したがって、
ここで入力すべき辞書サイズは、元々の辞書サイズより
も小さい値を指定する。なお、入力は辞書のサイズのみ
に限定する必要はなく、辞書の登録語彙数等であっても
良い。
In FIG. 1, first, a dictionary size input unit 11
Enter the size of the dictionary created in. The dictionary size is entered, for example, by using a PDA (Personal Digital
This is because it is possible to use an application using voice even in a medium having limited computer resources such as a sistant) and a portable terminal. Therefore,
Here, the dictionary size to be input specifies a value smaller than the original dictionary size. The input need not be limited to only the size of the dictionary, but may be the number of words registered in the dictionary.

【0018】そして、優先順位判定部12において、辞
書本体13を参照しながら、辞書サイズ入力部11から
入力された辞書サイズとなるまで、優先順位の高い順に
基本語を抽出する。ここで、優先順位自体はコーパス1
4の内容に基づいて定められる。コーパス14の内容と
しては、例えば「コンピュータ」関連の文献であると
か、特定の新聞に掲載されている内容等が考えられる。
Then, the priority order judging unit 12 extracts the basic words in descending order of priority until the size of the dictionary input from the dictionary size input unit 11 is reached while referring to the dictionary main body 13. Here, the priority itself is corpus 1
4 is determined based on the content. The contents of the corpus 14 may be, for example, documents related to “computers” or contents published in a specific newspaper.

【0019】最後に、基本語抽出条件に合致した基本語
を辞書本体13から順次抽出しながら、新規作成辞書1
5を作成していく。このようにして作成された新規作成
辞書15は、辞書のサイズとしては辞書本体よりも小さ
くなっているのに対して、例えば音声合成アプリケーシ
ョンにおける合成音声の明瞭度は、特定の条件下におい
ては辞書本体を用いているのと遜色無いものとすること
が可能である。例えば、コーパス14によって「コンピ
ュータ」というカテゴリに属する基本語が優先的に抽出
された新規作成辞書15が作成された場合には、「コン
ピュータ」関連の単語の合成音声については通常の辞書
13を用いた場合と同様の明瞭度を保持していることが
期待できる。
Finally, while the basic words that match the basic word extraction conditions are sequentially extracted from the dictionary body 13, the newly created dictionary 1
5 is created. The newly created dictionary 15 created in this way is smaller in dictionary size than the dictionary itself, whereas the clarity of synthesized speech in a speech synthesis application, for example, under specific conditions, It is possible to compare with using the main body. For example, when a newly created dictionary 15 in which the basic words belonging to the category “computer” are preferentially extracted by the corpus 14 is used, the ordinary dictionary 13 is used for the synthesized speech of the words related to “computer”. It can be expected that the same clarity is maintained as in the case where the image is displayed.

【0020】次に、図2は本発明の実施の形態にかかる
音声合成アプリケーションに用いる変換辞書圧縮装置を
音声合成アプリケーションに適用した一実施例を示す。
図2において、21は入力装置を、22は優先順位判定
装置を、23は辞書本体を、24はコーパスを、25は
新規作成辞書を、26は波形辞書を、27は音声合成ア
プリケーションを、それぞれ示す。
FIG. 2 shows an embodiment in which the conversion dictionary compression device used for the speech synthesis application according to the embodiment of the present invention is applied to a speech synthesis application.
In FIG. 2, 21 is an input device, 22 is a priority determination device, 23 is a dictionary body, 24 is a corpus, 25 is a newly created dictionary, 26 is a waveform dictionary, and 27 is a speech synthesis application. Show.

【0021】図2において、まず入力装置21において
利用するべき辞書の圧縮サイズを入力する。なお、入力
は辞書のサイズのみに限定する必要はなく、辞書の登録
語彙数等を入力しても良い。
In FIG. 2, first, a compression size of a dictionary to be used in the input device 21 is inputted. The input need not be limited to only the size of the dictionary, and the number of registered words in the dictionary may be input.

【0022】そして、優先順位判定装置22において、
辞書本体23を参照しながら、入力装置21から入力さ
れた辞書サイズとなるように優先順位の高い順に基本語
を抽出する。ここで、優先順位自体は、コーパス24を
用いることによって利用者が自由に設定することができ
る。例えば、「インターネット」というカテゴリに属す
る基本語の優先順位を高めるようなものでも良いし、特
定の雑誌・業界紙に掲載されている基本語の優先順位を
高めるものであっても良い。
Then, in the priority determining device 22,
While referring to the dictionary main body 23, the basic words are extracted in descending order of priority so as to have the dictionary size input from the input device 21. Here, the priority itself can be freely set by the user by using the corpus 24. For example, the priority of basic words belonging to the category of "Internet" may be increased, or the priority of basic words published in a specific magazine or trade paper may be increased.

【0023】最後に、基本語抽出条件に合致した基本語
を辞書本体23から順次抽出しながら、新規作成辞書2
5を作成していく。かかる新規作成辞書25と、波形辞
書26に基づいて、音声合成アプリケーション27が形
成される。
Finally, while the basic words that match the basic word extraction conditions are sequentially extracted from the dictionary body 23, the newly created dictionary 2
5 is created. A speech synthesis application 27 is formed based on the newly created dictionary 25 and the waveform dictionary 26.

【0024】このようにして作成された新規作成辞書2
5は、辞書のサイズとしては辞書本体よりも小さくなっ
ているのに対して、例えば音声合成アプリケーションに
おける合成音声の明瞭度は、特定の条件下においては辞
書本体を用いているのと遜色無いものとすることが可能
である。例えば、コーパス24によって「インターネッ
ト」というカテゴリに属する基本語が優先的に抽出され
た新規作成辞書25が作成された場合には、「インター
ネット」関連の単語の合成音声については通常の辞書2
3を用いた場合と同様の明瞭度を保持していることが期
待できる。
The newly created dictionary 2 created in this way
5 indicates that the dictionary size is smaller than that of the dictionary itself, whereas the clarity of the synthesized speech in a speech synthesis application, for example, is not inferior to using the dictionary body under specific conditions. It is possible. For example, when a newly created dictionary 25 in which the basic words belonging to the category of “Internet” are preferentially extracted by the corpus 24, the synthesized dictionary of the words related to “Internet” is stored in the normal dictionary 2.
It can be expected that the same clarity as in the case of using No. 3 is maintained.

【0025】また、優先順位自体を直接変更入力できる
構成であっても良い。例えば図3は本発明の実施の形態
にかかる音声合成アプリケーションに用いる変換辞書圧
縮装置に優先順位変更装置31を追加した一実施例を示
す。
Further, the configuration may be such that the priority itself can be directly changed and input. For example, FIG. 3 shows an embodiment in which a priority changing device 31 is added to the conversion dictionary compression device used for the speech synthesis application according to the embodiment of the present invention.

【0026】図3において、優先順位変更装置31は、
出現回数等のパラメータを変更することができ、一方で
は辞書に保管されるべきデータ自体を変更することも可
能である。すなわち、出現回数等のパラメータを変更す
ることで、辞書自体の優先度分布を変更することができ
ると共に、辞書に保管されるべきデータ自体を変更(追
加・削除等)することで出現回数等が変わり、辞書の優
先度が変更される。
In FIG. 3, the priority changing device 31
Parameters such as the number of appearances can be changed, while data itself to be stored in the dictionary can be changed. That is, the priority distribution of the dictionary itself can be changed by changing parameters such as the number of appearances, and the number of appearances can be changed by changing (adding, deleting, etc.) the data itself to be stored in the dictionary. Changes, and the priority of the dictionary is changed.

【0027】また、図4は波形辞書について、同様の辞
書サイズの圧縮処理を行う一実施例を示す。ここで波形
辞書とは、音声自体の出力波形を意味する。したがっ
て、同じ「あ」という言葉の表示であっても、その前後
の文字、あるいは文脈によってその出力波形は変化す
る。
FIG. 4 shows an embodiment in which the same dictionary size compression processing is performed on the waveform dictionary. Here, the waveform dictionary means an output waveform of the voice itself. Therefore, even if the same word "a" is displayed, the output waveform changes depending on the characters before and after the word or the context.

【0028】図4において、まず入力装置21において
利用するべき波形辞書26の圧縮サイズを入力する。な
お、特に波形辞書のサイズのみに限定する必要はなく、
波形辞書の登録波形数の上限値を入力しても良いし、新
規に作成すべき波形辞書のカテゴリを入力するものであ
っても良い。
In FIG. 4, first, the compression size of the waveform dictionary 26 to be used in the input device 21 is input. It is not necessary to limit only to the size of the waveform dictionary.
The upper limit of the number of registered waveforms in the waveform dictionary may be input, or a category of a waveform dictionary to be newly created may be input.

【0029】そして、優先順位判定装置22において、
波形辞書本体26を参照しながら、入力装置21から入
力された辞書サイズとなるように優先順位の高い順に波
形を抽出する。ここで、優先順位自体は、コーパス24
を用いることによって利用者が自由に設定することがで
きる。例えば、「インターネット」というカテゴリに属
する波形の優先順位を高めるようなものでも良いし、特
定のインタビュー等に表出されている音声波形の優先順
位を高めるものであっても良い。
Then, in the priority determining device 22,
While referring to the waveform dictionary main body 26, waveforms are extracted in descending order of priority so as to have the dictionary size input from the input device 21. Here, the priority itself is the corpus 24
Can be set freely by the user. For example, the priority of a waveform belonging to the category "Internet" may be increased, or the priority of a voice waveform expressed in a specific interview or the like may be increased.

【0030】最後に、波形抽出条件に合致した波形を波
形辞書本体26から順次抽出しながら、新規波形辞書4
1を作成していく。かかる新規波形辞書41と辞書23
に基づいて、音声合成アプリケーション27が形成され
る。
Finally, while sequentially extracting the waveforms meeting the waveform extraction conditions from the waveform dictionary main body 26, the new waveform dictionary 4
Create one. The new waveform dictionary 41 and the dictionary 23
, A speech synthesis application 27 is formed.

【0031】このようにして作成された新規波形辞書4
1は、辞書のサイズとしては波形辞書本体26よりも小
さくなっているのに対して、例えば音声合成アプリケー
ションにおける合成音声の明瞭度は、特定の条件下にお
いては波形辞書本体26を用いているのと遜色無いもの
とすることが可能である。
The new waveform dictionary 4 thus created
1 indicates that the size of the dictionary is smaller than that of the waveform dictionary main body 26, whereas the clarity of synthesized speech in a speech synthesis application, for example, is that the waveform dictionary main body 26 is used under specific conditions. It is possible to make it comparable.

【0032】また、図5に示すように、新たな辞書を作
成する際に、カバー率を確認しながら作成することもで
きる。ここでカバー率とは、文章を作成した場合に、新
規作成辞書に登録された語によって当該文章で使用され
る語の何%をカバーできているのかを表す指標である。
図5において、51はカバー率計算装置を、52はカバ
ー率表示装置を、それぞれ示す。
As shown in FIG. 5, when a new dictionary is created, it can be created while checking the coverage. Here, the cover rate is an index indicating what percentage of the words used in the sentence are covered by the words registered in the newly created dictionary when the sentence is created.
In FIG. 5, reference numeral 51 denotes a cover ratio calculating device, and 52 denotes a cover ratio display device.

【0033】新規作成辞書25が作成されたら、元の辞
書本体23とともにカバー率計算装置51が参照して、
新規作成辞書25がどの程度までカバーできているのか
を示す客観的な指標を計算する。そして、かかる計算値
をカバー率表示装置52において常時表示する。
When the newly created dictionary 25 is created, the coverage calculator 51 refers to the dictionary with the original dictionary body 23, and
An objective index indicating how much the newly created dictionary 25 can cover is calculated. Then, the calculated value is always displayed on the coverage ratio display device 52.

【0034】このように、新規作成辞書25におけるカ
バー率を監視しながら入力装置21から入力する条件や
コーパス24の内容等を変更することができるので、利
用者の使用に耐えうる範囲内で、可能な限り辞書サイズ
を小さくすることが可能となる。
As described above, the conditions input from the input device 21 and the contents of the corpus 24 can be changed while monitoring the coverage in the newly created dictionary 25. It is possible to reduce the dictionary size as much as possible.

【0035】また、図6はサイズ圧縮の対象となるのが
辞書ではなく波形辞書が対象である場合に、明瞭度を確
認しながら新たな波形辞書を作成する実施例を示す。す
なわち、波形データを削減して新たな波形辞書を作成し
た場合の、最終的に出力される合成音声の明瞭度を明確
にすることで、利用者が利用できる限度まで波形辞書サ
イズを圧縮しようとするものである。図6において、6
1は明瞭度推定装置を、62は明瞭度表示装置を、それ
ぞれ示す。
FIG. 6 shows an embodiment for creating a new waveform dictionary while confirming the clarity when the size compression target is not a dictionary but a waveform dictionary. In other words, when a new waveform dictionary is created by reducing the waveform data, the clarity of the finally output synthesized speech is clarified, so that the size of the waveform dictionary is reduced to the limit that can be used by the user. Is what you do. In FIG. 6, 6
Reference numeral 1 denotes a clarity estimation device, and 62 denotes a clarity display device.

【0036】図6では、新規波形辞書41が作成された
ら、元の波形辞書本体26とともに明瞭度推定装置61
が参照して、新規波形辞書41によってどの程度まで合
成音声が明瞭であるのかを示す客観的な指標を計算す
る。そして、かかる計算値を明瞭度表示装置62におい
て常時表示する。
In FIG. 6, when a new waveform dictionary 41 is created, the clarity estimating device 61 is created together with the original waveform dictionary main body 26.
Calculates an objective index indicating to what extent the synthesized speech is clear by the new waveform dictionary 41. Then, the calculated value is always displayed on the clarity display device 62.

【0037】このように、新規波形辞書41における明
瞭度を監視しながら入力装置21から入力する条件やコ
ーパス24の内容等を変更することができるので、利用
者の使用に耐えうる範囲内で、可能な限り波形辞書のサ
イズを小さくすることが可能となる。
As described above, the conditions input from the input device 21 and the contents of the corpus 24 can be changed while monitoring the clarity of the new waveform dictionary 41. The size of the waveform dictionary can be reduced as much as possible.

【0038】以上のように本実施の形態によれば、音声
合成アプリケーションにおいて、変換のための辞書サイ
ズを、変換効率を落とすことなく圧縮することが可能と
なる。
As described above, according to the present embodiment, in a speech synthesis application, the dictionary size for conversion can be compressed without lowering the conversion efficiency.

【0039】次に、本発明の実施の形態にかかる音声合
成アプリケーションに用いる変換辞書圧縮装置を実現す
るプログラムの処理の流れについて説明する。図8に本
発明の実施の形態にかかる音声合成アプリケーションに
用いる変換辞書圧縮装置を実現するプログラムの処理の
流れ図を示す。
Next, a description will be given of a processing flow of a program for realizing the conversion dictionary compression apparatus used for the speech synthesis application according to the embodiment of the present invention. FIG. 8 is a flowchart showing the processing of a program for realizing the conversion dictionary compression device used for the speech synthesis application according to the embodiment of the present invention.

【0040】図7において、利用者が辞書を圧縮する条
件の一つとして辞書サイズを入力する(ステップS70
1)。そして、優先順位の高い基本語から順に辞書本体
から抽出する(ステップS702)。
In FIG. 7, the user inputs a dictionary size as one of the conditions for compressing the dictionary (step S70).
1). Then, the basic words are extracted from the dictionary body in descending order of priority (step S702).

【0041】辞書本体から抽出した基本語は、新たな辞
書を構成するデータとして、新規作成辞書に順次格納さ
れていく(ステップS703)。そして、新規作成辞書
が当所利用者が要求していた辞書サイズになったら(ス
テップS704:Yes)、当該新規作成辞書をアプリ
ケーション用の辞書を作成することが可能となる。
The basic words extracted from the dictionary body are sequentially stored in the newly created dictionary as data constituting a new dictionary (step S703). When the newly created dictionary has the dictionary size requested by the user in our office (step S704: Yes), the newly created dictionary can be created as a dictionary for an application.

【0042】本発明の実施の形態にかかる音声合成アプ
リケーションに用いる変換辞書圧縮装置を実現するプロ
グラムを記憶した記録媒体は、図8に示す記録媒体の例
に示すように、CD−ROM82−1やフロッピーディ
スク82−2等の可搬型記録媒体82だけでなく、通信
回線の先に備えられた他の記憶装置81や、コンピュー
タ83のハードディスクやRAM等の記録媒体84のい
ずれでも良く、プログラム実行時には、プログラムはロ
ーディングされ、主メモリ上で実行される。
As shown in the example of the recording medium shown in FIG. 8, the recording medium storing the program for realizing the conversion dictionary compression apparatus used for the speech synthesizing application according to the embodiment of the present invention is a CD-ROM 82-1. Not only a portable recording medium 82 such as a floppy disk 82-2, but also any other storage device 81 provided at the end of a communication line or a recording medium 84 such as a hard disk or a RAM of a computer 83 may be used. , The program is loaded and executed on the main memory.

【0043】また、本発明の実施の形態にかかる音声合
成アプリケーションに用いる変換辞書圧縮装置により生
成された新規作成辞書等を記録した記録媒体も、図8に
示す記録媒体の例に示すように、CD−ROM82−1
やフロッピーディスク82−2等の可搬型記録媒体82
だけでなく、通信回線の先に備えられた他の記憶装置8
1や、コンピュータ83のハードディスクやRAM等の
記録媒体84のいずれでも良く、例えば本発明にかかる
音声合成アプリケーションに用いる変換辞書圧縮装置を
利用する際にコンピュータ83により読み取られる。
Also, as shown in the example of the recording medium shown in FIG. 8, a recording medium that records a newly created dictionary and the like generated by the conversion dictionary compression device used for the speech synthesis application according to the embodiment of the present invention is CD-ROM 82-1
Recording medium 82 such as a disk or a floppy disk 82-2
Not only other storage devices 8 provided at the end of the communication line
1 or a recording medium 84 such as a hard disk or a RAM of the computer 83, which is read by the computer 83 when using the conversion dictionary compression apparatus used for the speech synthesis application according to the present invention.

【0044】[0044]

【発明の効果】以上のように本発明にかかる音声合成ア
プリケーションに用いる変換辞書圧縮装置によれば、コ
ーパス情報に従って、辞書に含まれる語彙の優先順位を
動的に変化させることができるので、特定の雑誌に関す
る語彙を優先的に抽出するとか、優先基準が短期間で頻
繁に変化する場合においても、抽出すべき基本語の探索
を効率良く行うことが可能となる。
As described above, according to the conversion dictionary compression apparatus used in the speech synthesis application according to the present invention, the priority of words included in the dictionary can be dynamically changed according to the corpus information. Even if the vocabulary relating to the magazine is preferentially extracted or the priority standard changes frequently in a short period of time, it is possible to efficiently search for the basic words to be extracted.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の実施の形態にかかる音声合成アプリ
ケーションに用いる変換辞書圧縮装置の構成図
FIG. 1 is a configuration diagram of a conversion dictionary compression device used for a speech synthesis application according to an embodiment of the present invention.

【図2】 本発明の一実施例にかかる音声合成アプリケ
ーションに用いる変換辞書圧縮装置の構成図
FIG. 2 is a configuration diagram of a conversion dictionary compression device used for a speech synthesis application according to an embodiment of the present invention;

【図3】 本発明の他の実施例にかかる音声合成アプリ
ケーションに用いる変換辞書圧縮装置の構成図
FIG. 3 is a configuration diagram of a conversion dictionary compression device used for a speech synthesis application according to another embodiment of the present invention.

【図4】 本発明の他の実施例にかかる音声合成アプリ
ケーションに用いる変換辞書圧縮装置の構成図
FIG. 4 is a configuration diagram of a conversion dictionary compression device used for a speech synthesis application according to another embodiment of the present invention.

【図5】 本発明の他の実施例にかかる音声合成アプリ
ケーションに用いる変換辞書圧縮装置の構成図
FIG. 5 is a configuration diagram of a conversion dictionary compression apparatus used for a speech synthesis application according to another embodiment of the present invention.

【図6】 本発明の他の実施例にかかる音声合成アプリ
ケーションに用いる変換辞書圧縮装置の構成図
FIG. 6 is a configuration diagram of a conversion dictionary compression device used for a speech synthesis application according to another embodiment of the present invention.

【図7】 本発明の実施の形態にかかる音声合成アプリ
ケーションに用いる変換辞書圧縮装置における処理の流
れ図
FIG. 7 is a flowchart of processing in the conversion dictionary compression device used for the speech synthesis application according to the embodiment of the present invention;

【図8】 記録媒体の例示図FIG. 8 is an exemplary diagram of a recording medium.

【符号の説明】[Explanation of symbols]

11 辞書サイズ入力部 12 優先順位判定部 13、23 辞書本体 14、24 コーパス 15、25 新規作成辞書 21 入力装置 22 優先順位判定装置 26 波形辞書 27 音声合成アプリケーション 31 優先度変更装置 41 新規波形辞書 51 カバー率計算装置 52 カバー率表示装置 61 新規波形辞書 61 明瞭度推定装置 62 明瞭度表示装置 81 回線先の記憶装置 82 CD−ROMやフロッピーディスク等の可搬型記
録媒体 82−1 CD−ROM 82−2 フロッピーディスク 83 コンピュータ 84 コンピュータ上のRAM/ハードディスク等の記
録媒体
DESCRIPTION OF SYMBOLS 11 Dictionary size input part 12 Priority judgment part 13, 23 Dictionary main body 14, 24 Corpus 15, 25 Newly created dictionary 21 Input device 22 Priority judgment device 26 Waveform dictionary 27 Voice synthesis application 31 Priority change device 41 New waveform dictionary 51 Coverage ratio calculation device 52 Coverage ratio display device 61 New waveform dictionary 61 Clarity estimation device 62 Clarity display device 81 Storage device of line destination 82 Portable recording medium such as CD-ROM or floppy disk 82-1 CD-ROM 82- 2 Floppy disk 83 Computer 84 Recording media such as RAM / hard disk on computer

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 辞書のサイズを入力する辞書サイズ入力
部と、 辞書に格納されている語彙の優先順位を判定する優先順
位判定部とを含み、 前記優先順位判定部において、コーパス情報に基づいて
辞書本体から優先順位の高い語彙を順に抽出し、前記辞
書サイズ入力部で入力された辞書サイズになるまで抽出
した前記語彙を格納して新たな辞書を作成することを特
徴とした音声合成アプリケーションに用いる変換辞書圧
縮装置。
1. A dictionary size input unit for inputting the size of a dictionary, and a priority determination unit for determining a priority of a vocabulary stored in the dictionary, wherein the priority determination unit determines a priority of a vocabulary based on corpus information. A speech synthesis application characterized by sequentially extracting vocabularies of high priority from the dictionary body, storing the extracted vocabulary until the dictionary size input by the dictionary size input unit and creating a new dictionary. Conversion dictionary compression device to be used.
【請求項2】 辞書のサイズを入力する工程と、 辞書に格納されている語彙の優先順位を判定する工程と
を含み、 コーパス情報に基づいて辞書本体から優先順位の高い語
彙を順に抽出し、入力された辞書サイズになるまで抽出
した前記語彙を格納して新たな辞書を作成することを特
徴とする音声合成アプリケーションに用いる変換辞書圧
縮方法。
2. A step of inputting a size of the dictionary, and a step of determining a priority of a vocabulary stored in the dictionary, extracting words having a higher priority from the dictionary body in order based on the corpus information, A conversion dictionary compression method for use in a speech synthesis application, wherein a new dictionary is created by storing the vocabulary extracted until the input dictionary size is reached.
【請求項3】 辞書のサイズを入力するステップと、 辞書に格納されている語彙の優先順位を判定するステッ
プとを含み、 コーパス情報に基づいて辞書本体から優先順位の高い語
彙を順に抽出し、入力された辞書サイズになるまで抽出
した前記語彙を格納して新たな辞書を作成することを特
徴とするコンピュータに実行させるプログラムを記録し
たコンピュータ読み取り可能な記録媒体。
3. A step of inputting a size of the dictionary, and a step of determining a priority of a vocabulary stored in the dictionary, extracting words having a higher priority from the dictionary body in order based on the corpus information, A computer-readable recording medium storing a program to be executed by a computer, storing the vocabulary extracted until the input dictionary size is reached, and creating a new dictionary.
JP11187598A 1999-07-01 1999-07-01 Device and method for compressing conversion dictionary used for voice synthesis application Withdrawn JP2001014310A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11187598A JP2001014310A (en) 1999-07-01 1999-07-01 Device and method for compressing conversion dictionary used for voice synthesis application

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11187598A JP2001014310A (en) 1999-07-01 1999-07-01 Device and method for compressing conversion dictionary used for voice synthesis application

Publications (1)

Publication Number Publication Date
JP2001014310A true JP2001014310A (en) 2001-01-19

Family

ID=16208922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11187598A Withdrawn JP2001014310A (en) 1999-07-01 1999-07-01 Device and method for compressing conversion dictionary used for voice synthesis application

Country Status (1)

Country Link
JP (1) JP2001014310A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056604A1 (en) * 2006-11-06 2008-05-15 Nec Corporation Sound collection system, sound collection method, and collection processing program
WO2010018796A1 (en) * 2008-08-11 2010-02-18 旭化成株式会社 Exception dictionary creating device, exception dictionary creating method and program therefor, and voice recognition device and voice recognition method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056604A1 (en) * 2006-11-06 2008-05-15 Nec Corporation Sound collection system, sound collection method, and collection processing program
JP5062178B2 (en) * 2006-11-06 2012-10-31 日本電気株式会社 Audio recording system, audio recording method, and recording processing program
WO2010018796A1 (en) * 2008-08-11 2010-02-18 旭化成株式会社 Exception dictionary creating device, exception dictionary creating method and program therefor, and voice recognition device and voice recognition method
JPWO2010018796A1 (en) * 2008-08-11 2012-01-26 旭化成株式会社 Exception word dictionary creation device, exception word dictionary creation method and program, and speech recognition device and speech recognition method

Similar Documents

Publication Publication Date Title
JP5799621B2 (en) Information processing apparatus, information processing method, and program
WO2020062680A1 (en) Waveform splicing method and apparatus based on double syllable mixing, and device, and storage medium
US20090271178A1 (en) Multilingual Asynchronous Communications Of Speech Messages Recorded In Digital Media Files
US20240021202A1 (en) Method and apparatus for recognizing voice, electronic device and medium
WO2014201834A1 (en) Method and device of matching speech input to text
JP2002116796A (en) Voice processor and method for voice processing and storage medium
JP2004070959A (en) Adaptive context sensitive analysis
TWI223165B (en) Japanese virtual dictionary
JPH07222248A (en) System for utilizing speech information for portable information terminal
WO2022126904A1 (en) Voice conversion method and apparatus, computer device, and storage medium
CN109299471A (en) A kind of method, apparatus and terminal of text matches
CN110728983B (en) Information display method, device, equipment and readable storage medium
JP2003255982A (en) Speech recognition system and speech file recording system
JP2005249829A (en) Computer network system performing speech recognition
JP2001014310A (en) Device and method for compressing conversion dictionary used for voice synthesis application
WO2021238337A1 (en) Method and device for entity tagging
CN109346060A (en) Audio recognition method, device, equipment and storage medium
JP7335460B2 (en) clear text echo
CN109065016B (en) Speech synthesis method, speech synthesis device, electronic equipment and non-transient computer storage medium
CN111161737A (en) Data processing method and device, electronic equipment and storage medium
JPH0764583A (en) Text reading-out method and device therefor
JP7102986B2 (en) Speech recognition device, speech recognition program, speech recognition method and dictionary generator
JP7403569B2 (en) Speech recognition result processing method and device, electronic equipment, computer readable storage medium, and computer program
TWI307845B (en) Directory assistant method and apparatus for providing directory entry information, and computer readable medium storing thereon related instructions
JP2000285112A (en) Device and method for predictive input and recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070118

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070316

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070706

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20081205