JPS58154900A - Sentence voice converter - Google Patents
Sentence voice converterInfo
- Publication number
- JPS58154900A JPS58154900A JP57037368A JP3736882A JPS58154900A JP S58154900 A JPS58154900 A JP S58154900A JP 57037368 A JP57037368 A JP 57037368A JP 3736882 A JP3736882 A JP 3736882A JP S58154900 A JPS58154900 A JP S58154900A
- Authority
- JP
- Japan
- Prior art keywords
- words
- text
- word
- pronunciation
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
本発明は、文字情報の形で与えられる文章を音声に変換
して発声する文章音声変換装置に関する。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a text-to-speech conversion device that converts a text given in the form of text information into speech and utters it.
入力文章を音読みで発声する文章音声変換装置が開発さ
れている。ところで、従来の斯る文章音声変換装置は、
一般的な単語も、固有名詞、専門語、新語などの特殊な
単語も区別することなく、同じような発音特性で発声す
るようになっている。A text-to-speech conversion device that reads input text aloud has been developed. By the way, such a conventional text-to-speech conversion device is
Both common words and special words such as proper nouns, technical words, and new words are uttered with similar pronunciation characteristics without distinction.
しかし、一般的な単語や熟語は一般人にも容易に聴取で
きるが、上記のような特殊な単語は、それに慣れていな
い人は聞き落しやすい。これはラジオ放送なとを想像す
れば明らかである。ラジオ放送のアナウンサーは、一般
的でない固有名詞、新語、゛専門語、さらには数詞や年
月日などは、他の一般的な単語や熟語よりも速度を落し
て読んだり、繰り返したり、または読み換える等の方法
で、聴堆者の理解を助ける努力をしている。However, while common words and phrases can be easily heard by the general public, people who are not familiar with the above-mentioned special words are likely to miss them. This becomes clear if you imagine a radio broadcast. Radio broadcast announcers read uncommon proper nouns, new words, technical terms, even numbers, dates, etc. at a slower speed, repeat them, or read them more slowly than other common words and phrases. Efforts are being made to help listeners understand the content by changing the language and other methods.
したがって本発明の目的は、固有名詞、新語、専門語な
どの聴取を容易化した文章音声変換装置を提供すること
にある。Therefore, an object of the present invention is to provide a text-to-speech conversion device that facilitates listening to proper nouns, new words, technical terms, and the like.
この目的を達成するために、本発明による文章音声変換
装置は、入力文章中の特定の種類の単語を識別する手段
を有し、該手段(二よる識別結果にしたがって、該特定
種類の単語の発音特性を他の種類の単語と異ならせるよ
うに構成したことを特徴とするものである。In order to achieve this object, the text-to-speech conversion device according to the present invention has means for identifying a specific type of word in an input text, and according to the identification result by the means (2), the text-to-speech conversion device according to the present invention It is characterized by being constructed so that its pronunciation characteristics are different from those of other types of words.
以下、図面を参照しながら、一実施例について本発明を
説明する。Hereinafter, the present invention will be described with reference to one embodiment with reference to the drawings.
第1図は、本発明にか\る文章音声変換装置のブロック
図である。FIG. 1 is a block diagram of a text-to-speech conversion device according to the present invention.
同図において、1は文章ファイルであり、こ\ではカナ
漢字混りの入力文章が文字コード(例えはJISコード
)の形で蓄積されている。この文章ファイル1から読み
出される入力文章が音声に変換され5発声部12より発
声されるわけである。In the figure, 1 is a text file in which input texts containing kana and kanji are stored in the form of character codes (for example, JIS codes). The input text read from the text file 1 is converted into speech and is uttered by the 5-voice unit 12.
なお、この文章ファイル1は具体的には磁気テープ装置
、磁気ディスク装置などの記憶装置である。Note that this text file 1 is specifically a storage device such as a magnetic tape device or a magnetic disk device.
3は単語辞書ファイルであり、こ\(二は第2図)=示
すような形式で、漢字やカナの各種単語の情報がファイ
ル化されている。こ\で、Wは単語コード、C1はその
単語の品詞を示す品詞コード、C2はその単語の読みを
示す読みコードである。なお、読み方が2通り以上あ°
る単語については、読みコードC2が2つ以上ある。こ
\までは従来の文章音声変換装置に用いられている単語
辞書ファイルと同一形式であるが、本実施例ではさらに
分類コードC3が′追加されている。この分類コードC
3は、該当の単語が他の一般的な単語と発音特性を異な
らせるべき種類の単語(特殊単語と称す)か否かを表示
する。この特殊単語としては、一般的でない人名や地名
などの固有名詞、専門語、新語、また数詞などが必要に
応じて選定される。3 is a word dictionary file, in which information on various words in kanji and kana are stored in the format shown in Figure 2. Here, W is a word code, C1 is a part-of-speech code indicating the part of speech of the word, and C2 is a reading code indicating the reading of the word. In addition, there are more than two ways to read it.
There are two or more reading codes C2 for a word. Up to this point, the format is the same as the word dictionary file used in conventional text-to-speech conversion devices, but in this embodiment, a classification code C3 has been added. This classification code C
3 indicates whether the corresponding word is a type of word (referred to as a special word) whose pronunciation characteristics should be different from other general words. As the special words, proper nouns such as unusual names of people and places, specialized words, new words, numerals, etc. are selected as necessary.
第1図に戻って、2は検索部である。この検索部2は、
公知の2文節最長−散性などの方法により、入力文章中
の格助詞と語句の区切りを検出し、それを参考にして単
語辞書ファイル3より入力文章中の各単語を検索する。Returning to FIG. 1, 2 is a search section. This search section 2 is
A known method such as the longest two-clause-dispersion method is used to detect the break between case particles and words in the input sentence, and with reference to this, each word in the input sentence is searched from the word dictionary file 3.
検索された単語の品詞コード−C1はアクセント決定部
5に送られ、読みコードC2は単音節分解処理部6に送
られ、また分類コードC3は発音制御部9負送られる。The part-of-speech code -C1 of the searched word is sent to the accent determination section 5, the reading code C2 is sent to the monosyllabic decomposition processing section 6, and the classification code C3 is sent to the pronunciation control section 9.
このような検索部2の構成は、従来の文章音声変換装置
の検索部と同様でよい。ただし、本実施例の検索部2は
、特殊単語の識別手段としても働く。つまり、単語の検
索時(″ニー特殊単語か否かを示す分類コードC3も同
時に辞書ファイル3から読み出すからである。換言すれ
ば、単語辞書ファイル3のコード形式を第2図のように
一部変更することにより、検索部2の構成を実質的に変
更することなく特殊単語の識別な可能としているのであ
る。The configuration of the search section 2 may be similar to the search section of a conventional text-to-speech conversion device. However, the search unit 2 of this embodiment also works as a means for identifying special words. In other words, when searching for a word, the classification code C3 indicating whether or not it is a special word is also read out from the dictionary file 3 at the same time. By making this change, it is possible to identify special words without substantially changing the configuration of the search unit 2.
単音節分解処理部6は検索部2から入力される各単語の
読みコードC2から、音韻規則にしたがってその単語の
読みを単音節に分解し、各単音節に対するパラメータを
単音節パラメータファイル7から検索し、それを結合処
理部8へ送る。また単音節分解処理部6は、分解した個
々の単音節間のつながりないし区切りの様子を単音節パ
ラメータと同期して結合処理部8へ通知する。結合処理
部8は、一つながりの音声として発音されるべき単音節
間の結合を自然にするための結合処理(調音処理)を単
音節パラメータに施し、音源パラメータ発生部10へ送
る。The monosyllabic decomposition processing unit 6 decomposes the pronunciation of each word into monosyllables according to the phonological rules from the pronunciation code C2 of each word inputted from the search unit 2, and retrieves parameters for each monosyllable from the monosyllabic parameter file 7. and sends it to the combination processing section 8. Furthermore, the monosyllable decomposition processing unit 6 notifies the combination processing unit 8 of the connection or separation between the decomposed individual monosyllables in synchronization with the monosyllable parameters. The combination processing unit 8 performs combination processing (articulation processing) on the single syllable parameters to make the combination between single syllables that are to be pronounced as one continuous voice natural, and sends them to the sound source parameter generation unit 10 .
なお、上記の単音節分解処理部6、単音節パラメータフ
ィルタ7、および結合処理部8は、いずれも従来装置の
ものと同様でよい。Note that the monosyllable decomposition processing section 6, monosyllable parameter filter 7, and combination processing section 8 described above may all be the same as those of the conventional device.
4はイントネーション決定部である。このイントネーシ
ョン決定部4は、従来と同様(二、例えば入力文章中の
個々の文の末尾の語などから、平叙文か疑問文かなどを
判断し、文の全体的なイントネーション決定部る。イン
トネーション(二よって、文中の語句(特に末尾語)の
発音時のアクセントやピッチを変える必要があるので、
イントネーション決定部4からはイントネーション情報
がアクセント決定部5および発音制御部9に送られる。4 is an intonation determining section. This intonation determining unit 4 determines the overall intonation of the sentence by determining whether it is a declarative sentence or an interrogative sentence based on the final word of each sentence in the input sentence, for example. (2) Therefore, it is necessary to change the accent and pitch when pronouncing the words in the sentence (especially the final word).
The intonation information is sent from the intonation determining section 4 to the accent determining section 5 and the pronunciation control section 9.
アクセント決定部5は、検出部2より与えられ?品詞コ
ードC1、およびイントネーション決定部4からのイン
トネーション情報にしたがって、発声しようとする単語
のアクセントを決定し、アクセント情報を発音制御部9
へ送る。発音制御部9は、アクセント情報およびイント
ネーション情報にしたがって発音特性を決める要素であ
る継続時間、ピッチ、および振幅を決定し、発音特性情
報を出力する。The accent determining section 5 receives the accent from the detecting section 2? The accent of the word to be uttered is determined according to the part of speech code C1 and the intonation information from the intonation determining section 4, and the accent information is transmitted to the pronunciation control section 9.
send to The pronunciation control section 9 determines the duration, pitch, and amplitude, which are the elements that determine the pronunciation characteristics, according to the accent information and intonation information, and outputs the pronunciation characteristics information.
音源パラメータ発生部10は、結合処理装置8から与え
られる単音節パラメータ、およびその修飾情報である発
音特性情報にしたがって音源パラメータを発生する。こ
の音源パラメータにしたがって、音声合成部11は音声
信号を合成し、それを発声部12に送って発声させる。The sound source parameter generation unit 10 generates sound source parameters according to the monosyllabic parameters provided from the combination processing device 8 and pronunciation characteristic information that is modification information thereof. According to the sound source parameters, the voice synthesis section 11 synthesizes a voice signal, and sends it to the voice generation section 12 to generate a voice.
音源パラメータは発音特性情報で修飾されているので、
発声部12で発声される音声の発音特性、つまり継続時
間、ピッチ、振幅(音量)は発音特性情報にしたがって
制御される。Since the sound source parameters are modified with pronunciation characteristic information,
The pronunciation characteristics, that is, the duration, pitch, and amplitude (volume) of the voice uttered by the voice generating section 12 are controlled according to the pronunciation characteristic information.
このように、特殊単語以外については符号9〜12の各
部の動作および構成は従来装置のものと同様である。た
だし、特殊単語の発声時、つまり発音制御部9に入力さ
れる分類コードC3が特殊単語を指定した場合、発声制
御部9はアクセント情報およびイントネーション情報に
よって決まる発音特性を故意に変化させ、その特殊単語
を他の一般語句と明瞭に区別して聴取できるような制御
を行なう。本実施例の発音制御部9は、特殊単語に対し
ては発音特性のうちピッチを一律に高くする。As described above, except for the special words, the operations and configurations of the parts 9 to 12 are the same as those of the conventional device. However, when a special word is uttered, that is, when the classification code C3 input to the pronunciation control unit 9 specifies a special word, the pronunciation control unit 9 intentionally changes the pronunciation characteristics determined by the accent information and intonation information, and Control is performed so that words can be clearly distinguished from other common words and phrases. The pronunciation control unit 9 of this embodiment uniformly increases the pitch of the pronunciation characteristics for special words.
なお、ピッチと同時に振幅なども変化させるようにして
もよく、要は特殊単語であることを聴者(二認識させ、
かつ明瞭に聴取できるように発音特性を変化させるとい
うことである。Note that the amplitude may also be changed at the same time as the pitch.
This means changing the pronunciation characteristics so that the sound can be heard clearly.
特殊単語に対するこのような発音特性の制御を行なうた
めに、発音制御部9は従来装置のものと構成を変更する
必要がある。しかし、このような構成の変更は極めて軽
微でよく、その実現は容易であるので、発音制御部9の
具体例は特(=示さない。In order to control the pronunciation characteristics of special words in this manner, it is necessary to change the configuration of the pronunciation control section 9 from that of the conventional device. However, such a change in the configuration may be extremely minor and its implementation is easy, so a specific example of the sound generation control section 9 will not be specifically shown.
本発明は以上に説明したように、一般的でない固有名詞
、新語、専門用語、さらには聴取しく二くい数詞など(
特殊単語)ζ二ついてはピッチ等の発音特性を故意に変
化させて発声させ、聴者に注意を喚起する構成である。As explained above, the present invention can be applied to unusual proper nouns, new words, technical terms, and even numerals that are difficult to hear (
Special words) ζSecondly, the pronunciation characteristics such as pitch are intentionally changed to make the words uttered in order to call the listener's attention.
したがって本発明によれば、従来の文章音声変換装置の
欠点を大幅に改善した優れた文章音声変換装置を提供す
ることができる効果か得られる。Therefore, according to the present invention, it is possible to provide an excellent text-to-speech conversion device that greatly improves the drawbacks of conventional text-to-speech conversion devices.
第1図は本発明の一実施例を示すブロック図、第2図は
嚇語辞書ファイル内のコード形式を示す図である。
1・・・文章ファイル、2・・・検索部、3・・・単語
辞書ファイル、4・・・イントネーション決定部、5・
・・アクセント決定部、6・・・単音節分解処理部、7
・・・単音節パラメータファイル、8・・・結合処理部
、9・・・発音制御部、IO・・・音源パラメータ発生
部、11・・・音声合成部、12・・・発声部。FIG. 1 is a block diagram showing an embodiment of the present invention, and FIG. 2 is a diagram showing a code format in a threatening word dictionary file. 1... Sentence file, 2... Search section, 3... Word dictionary file, 4... Intonation determining section, 5.
... Accent determination unit, 6... Monosyllabic decomposition processing unit, 7
. . . Monosyllabic parameter file, 8 .
Claims (1)
発声する文章音声変換装置において、入力文章中の特定
の種類の単語を識別する手段を有し、該手段による識別
結果にしたがって、該特定種類の単語の発音特性を他の
種類の単語と異ならせるどとを特徴とする文章音声変換
装置。(1) A text-to-speech conversion device that converts a text input in the form of character information into speech and utters it, which has means for identifying a specific type of word in the input text, and according to the identification result by the means. , a text-to-speech conversion device characterized by making the pronunciation characteristics of the specific type of words different from those of other types of words.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57037368A JPS58154900A (en) | 1982-03-10 | 1982-03-10 | Sentence voice converter |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57037368A JPS58154900A (en) | 1982-03-10 | 1982-03-10 | Sentence voice converter |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58154900A true JPS58154900A (en) | 1983-09-14 |
JPH054676B2 JPH054676B2 (en) | 1993-01-20 |
Family
ID=12495572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57037368A Granted JPS58154900A (en) | 1982-03-10 | 1982-03-10 | Sentence voice converter |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58154900A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6073589A (en) * | 1983-09-30 | 1985-04-25 | 株式会社日立製作所 | Voice synthesization system |
JPS61259295A (en) * | 1985-05-14 | 1986-11-17 | 三菱重工業株式会社 | Voice conversion system for sentence |
JPS63131191A (en) * | 1986-11-20 | 1988-06-03 | 日本電気株式会社 | Regular type voice synthesizer |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5676839A (en) * | 1979-11-28 | 1981-06-24 | Canon Inc | Electronic apparatus |
JPS56103764A (en) * | 1980-01-23 | 1981-08-19 | Hitachi Ltd | Word processor |
JPS56153394A (en) * | 1980-04-30 | 1981-11-27 | Nippon Telegraph & Telephone | Character voice converting system |
JPS5848131A (en) * | 1981-09-16 | 1983-03-22 | Canon Inc | Character processor |
-
1982
- 1982-03-10 JP JP57037368A patent/JPS58154900A/en active Granted
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5676839A (en) * | 1979-11-28 | 1981-06-24 | Canon Inc | Electronic apparatus |
JPS56103764A (en) * | 1980-01-23 | 1981-08-19 | Hitachi Ltd | Word processor |
JPS56153394A (en) * | 1980-04-30 | 1981-11-27 | Nippon Telegraph & Telephone | Character voice converting system |
JPS5848131A (en) * | 1981-09-16 | 1983-03-22 | Canon Inc | Character processor |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6073589A (en) * | 1983-09-30 | 1985-04-25 | 株式会社日立製作所 | Voice synthesization system |
JPH0549998B2 (en) * | 1983-09-30 | 1993-07-27 | Hitachi Ltd | |
JPS61259295A (en) * | 1985-05-14 | 1986-11-17 | 三菱重工業株式会社 | Voice conversion system for sentence |
JPS63131191A (en) * | 1986-11-20 | 1988-06-03 | 日本電気株式会社 | Regular type voice synthesizer |
Also Published As
Publication number | Publication date |
---|---|
JPH054676B2 (en) | 1993-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6148285A (en) | Allophonic text-to-speech generator | |
JP3518898B2 (en) | Speech synthesizer | |
JP2002149180A (en) | Device and method for synthesizing voice | |
US20070219799A1 (en) | Text to speech synthesis system using syllables as concatenative units | |
JPS58154900A (en) | Sentence voice converter | |
JPS63157226A (en) | Conversation type sentence reading device | |
Ngugi et al. | Swahili text-to-speech system | |
JPH07200554A (en) | Sentence read-aloud device | |
JPS6223888B2 (en) | ||
Marasek et al. | Multi-level annotation in SpeeCon Polish speech database | |
JPS6315294A (en) | Voice analysis system | |
JPS60188995A (en) | Sentence enunciation | |
Kaur et al. | BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE | |
JPS62119591A (en) | Sentence reciting apparatus | |
JPH10274998A (en) | Method and device for reading document aloud | |
JPS63237098A (en) | Voice data base configuration system having multi-layer label | |
Venkatagiri | Digital speech technology: An overview | |
Campbell | A step in the direction of synthesising natural-sounding speech | |
JPH01119822A (en) | Sentence reader | |
JPS6027433B2 (en) | Japanese information input device | |
JPS63131191A (en) | Regular type voice synthesizer | |
JPH01266598A (en) | Speech output device | |
Narupiyakul et al. | Speech and prosodic processing for assistive technology | |
JPH02186397A (en) | Device for reading sentence aloud | |
JPH02196300A (en) | Voice synthesis processor |