JPH07210194A - Device for outputting sound - Google Patents
Device for outputting soundInfo
- Publication number
- JPH07210194A JPH07210194A JP6003398A JP339894A JPH07210194A JP H07210194 A JPH07210194 A JP H07210194A JP 6003398 A JP6003398 A JP 6003398A JP 339894 A JP339894 A JP 339894A JP H07210194 A JPH07210194 A JP H07210194A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- access memory
- speed access
- waveform data
- segmented
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、各種の音声ガイダンス
等に用いられる、音声合成による音声出力装置に関す
る。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice output device by voice synthesis, which is used for various voice guidances and the like.
【0002】[0002]
【従来の技術】入力装置から文字列を入力すると、その
文字列が主要な文字列であれば、音声データが格納され
ているメモリより文字列に対応する音声データを読み出
し、その音声データをもとにPCM方式によって音声合
成する。音声データがあらかじめメモリに格納されてい
ない文字列が入力された場合は、言語解析をしてその文
字列の読み等の音韻情報と単語間のポーズ及びアクセン
ト等の韻律情報を得て、それらの韻律情報に基づいて規
則合成を行い、入力された文字列に対応する音声を出力
するという音声出力装置がある。2. Description of the Related Art When a character string is input from an input device, if the character string is a main character string, the voice data corresponding to the character string is read from a memory storing the voice data, and the voice data is also stored. And PCM are used for voice synthesis. When a character string whose voice data is not stored in the memory in advance is input, linguistic analysis is performed to obtain phonological information such as reading of the character string and prosodic information such as pauses and accents between words, and There is a voice output device that performs rule synthesis based on prosody information and outputs a voice corresponding to an input character string.
【0003】[0003]
【発明が解決しようとする課題】しかし、音声出力すべ
き情報に対して、各々音声データの検索が行われるが、
規則合成音の音声出力までにかかる時間と録音再生音の
検索・音声出力までにかかる時間を比較すると差がで
き、音声出力のタイミング制御に不具合が生じるという
問題点があった。However, although the voice data is searched for the information to be voice output,
There is a problem in that there is a difference between the time required to output the voice of the regular synthesized voice and the time required to search and output the voice of the recording / playback sound, which causes a problem in the timing control of the voice output.
【0004】さらに、規則合成によって生成した音声と
録音再生音とでは声の高低に関する情報、いわゆる、ピ
ッチ周波数に差があり、両方式によって生成した音声を
接続し文章音声として出力する場合には、音声の品質が
劣化するという問題点があった。Further, there is a difference in pitch information between the voice generated by rule synthesis and the recorded and reproduced sound, that is, the pitch frequency, and when the voices generated by both formulas are connected and output as a sentence voice, There is a problem that the quality of voice deteriorates.
【0005】[0005]
【課題を解決するための手段】本発明は、音声出力指令
に対し音声出力を速やかに行うことを第一の目的とし、
その具体的手段として大規模音声データの他に高速アク
セスメモリを用意し、音声出力に使用する可能性の高い
重要音声データを高速アクセスメモリ中に転送し保持す
る手段を設け、高速アクセスメモリ中にある音声は録音
再生で出力し、その他の音声は規則合成で出力する。SUMMARY OF THE INVENTION The first object of the present invention is to quickly output a voice in response to a voice output command.
As a concrete means, a high-speed access memory is prepared in addition to large-scale audio data, and a means for transferring and holding important audio data that is highly likely to be used for audio output in the high-speed access memory is provided. Some voices are output by recording and playback, and other voices are output by rule synthesis.
【0006】さらに、高品質な音声を出力することを第
二の目的とし、ピッチ,パワー,音韻継続時間長等の調
整手段を設け、自然な文章音声を出力する。Further, the second purpose is to output a high quality voice, and a means for adjusting pitch, power, phoneme duration etc. is provided to output a natural sentence voice.
【0007】[0007]
【作用】上記の音声出力装置において、地図上の位置等
の情報が入力されると高速アクセスメモリ中で、入力情
報に対応する音声データの有無を検索し、音声データが
ある場合には、録音再生部において音声データの再生を
行い、高速アクセスメモリ中に音声データがない場合に
は、規則合成部において、音素となる素片データを音素
片メモリより読み出し規則合成を行う。さらに、接続出
力部において、以上のようにして生成された各区分音声
を読み出しかつ接続して、出力装置より音声出力する。In the above voice output device, when the information such as the position on the map is input, the high speed access memory is searched for the voice data corresponding to the input information, and if the voice data is present, the recording is performed. The reproduction unit reproduces the voice data, and when there is no voice data in the high-speed access memory, the rule synthesis unit reads out the phoneme unit data from the phoneme unit memory and performs rule composition. Further, the connection output unit reads out and connects each of the divided sounds generated as described above, and outputs the sound from the output device.
【0008】[0008]
【実施例】図1は本発明の一実施例を示す車載ナビゲー
ションシステム用録音再生・規則合成併用型音声出力装
置のシステムのブロック図である。この音声出力装置
は、車載ナビゲーション装置中の位置センサと経路探索
部との出力情報から、必要な出力応答コードを発生する
出力応答部があり、出力応答部より出力した文字コード
からなる音声ナビゲーションに必要な情報を受信する装
置101と、本体と、音声を出力するためのスピーカ等
の出力装置102が接続されている。DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram of a system of an audio output apparatus for recording / playback / rule synthesis combined use for an in-vehicle navigation system showing an embodiment of the present invention. This voice output device has an output response unit that generates a necessary output response code from the output information of the position sensor and the route search unit in the vehicle-mounted navigation device, and the voice navigation is composed of the character code output from the output response unit. A device 101 for receiving necessary information, a main body, and an output device 102 such as a speaker for outputting voice are connected.
【0009】本体は、この装置全体の制御を行う制御部
103と、地名・交差点名を含む音声ナビゲーションに
必要な文章音声を複数区分に分割して記憶しておく大規
模録音ファイル104と、大規模録音ファイル104の
中から重要語の音声データをあらかじめロードする高速
アクセスメモリ105と、大規模録音ファイルから高速
アクセスメモリへ音声データの転送を随時行う高速メモ
リ制御部106と、高速アクセスメモリ中の音声を再生
する録音再生部107と、高速アクセスメモリ中に存在
しない音声を生成出力する規則合成部108と、規則合
成音生成時に必要な音声の素片データを格納する音素片
メモリ109と、各区分音声を読み出し、接続して音声
を出力する接続出力部110からなる。The main body includes a control unit 103 for controlling the entire apparatus, a large-scale recording file 104 for storing sentence voices including a place name and an intersection name necessary for voice navigation in a plurality of divisions, and a large-scale recording file 104. A high-speed access memory 105 that pre-loads voice data of important words from the large-scale recording file 104, a high-speed memory control unit 106 that transfers voice data from the large-scale recording file to the high-speed access memory at any time, and a high-speed access memory A recording / reproducing unit 107 for reproducing a voice, a rule synthesizing unit 108 for generating and outputting a voice that does not exist in the high-speed access memory, a phoneme unit memory 109 for storing voice unit data necessary for generating a ruled synthesized sound, It is composed of a connection output unit 110 that reads out segmented voices, connects them, and outputs voices.
【0010】図2に示すフローチャートによって、図1
に示した本実施例の車載ナビゲーションシステム用録音
再生・規則合成併用型音声出力装置の動作のあらましを
説明する。According to the flow chart shown in FIG.
The outline of the operation of the recording / playback / rule synthesis combined type voice output device for the vehicle-mounted navigation system shown in FIG.
【0011】車載ナビゲーション装置において音声出力
指令が出されると、車載ナビゲーション装置中の位置セ
ンサ等から、音声によるナビゲーションを行うために必
要な位置情報等の文字コードを101の文字コード受信
装置に送信する。文字コード受信装置101から制御部
103に文字コードが出力され、文字コードに対応する
音声が高速アクセスメモリ105に格納されているかど
うかを検索する。When a voice output command is issued in the vehicle-mounted navigation device, a position sensor or the like in the vehicle-mounted navigation device transmits a character code such as position information necessary for performing navigation by voice to the character code receiving device 101. . A character code is output from the character code receiving device 101 to the control unit 103, and it is searched whether a voice corresponding to the character code is stored in the high speed access memory 105.
【0012】文字コードに対応する音声が高速アクセス
メモリ105に格納されていれば、その音声を録音再生
部107で再生する。一方、出力された文字コードに対
応する音声が高速アクセスメモリ105に格納されてい
なければ、まず、制御部103で文字コードが音韻・アク
セント情報に変換され、規則合成部108においてそれ
らの情報に基づき音素となる素片データを音素片メモリ
109より読み出し規則合成を行う。なお、すべての文
字コードに対応する文字情報・アクセント情報は高速ア
クセスメモリ105中に記憶されている。さらに、接続
出力部110において、以上のようにして生成された各
区分音声を読み出しかつ接続して、出力装置より音声出
力する。If the voice corresponding to the character code is stored in the high speed access memory 105, the voice is reproduced by the recording / reproducing unit 107. On the other hand, if the voice corresponding to the output character code is not stored in the high-speed access memory 105, first, the control unit 103 converts the character code into phoneme / accent information, and the rule synthesizing unit 108 based on the information. The phoneme unit data that is a phoneme is read from the phoneme unit memory 109 and rule synthesis is performed. Character information / accent information corresponding to all character codes is stored in the high-speed access memory 105. Further, the connection output unit 110 reads out and connects the respective divided sounds generated as described above, and outputs the sounds from the output device.
【0013】次に、大規模録音ファイル104から高速
アクセスメモリ105へ音声データを転送する制御につ
いて説明する。図3に大規模録音ファイルにおけるデー
タ構造の一実施例を示す。車載ナビゲーションにおける
音声ガイダンスの文章には、交差点名・地名等の地理情
報を多く含むため、このような音声データは、地図上の
位置等を示す文字コードとともに格納する。さらに、こ
の大規模録音ファイル中の音声データについて、地図上
の位置等を示す文字コードをもとに音声データが数個ず
つ含まれるようにエリアを分割し、各ブロックごとに音
声データを格納しておく。大規模録音ファイルから高速
アクセスメモリへの音声データの転送は、このブロック
ごとに行う。Next, control for transferring audio data from the large-scale recording file 104 to the high-speed access memory 105 will be described. FIG. 3 shows an example of the data structure of a large-scale recording file. Since the text of the voice guidance in the vehicle-mounted navigation includes a lot of geographical information such as intersection names and place names, such voice data is stored together with the character code indicating the position on the map. Furthermore, regarding the audio data in this large-scale recording file, the area is divided so that several audio data are included based on the character code indicating the position on the map, etc., and the audio data is stored for each block. Keep it. Transfer of audio data from a large-scale recording file to the high-speed access memory is performed for each block.
【0014】次に、大規模録音ファイル104から高速
アクセスメモリ105へ転送する重要な音声データを選
択する制御について説明する。図4は、車載ナビゲーシ
ョンで用いる地図と大規模録音ファイル中の音声データ
のブロックとの対応を示している。地図上の点線で区切
られた各々のエリアは大規模録音ファイルで音声データ
を分割・格納したブロックに相当する。転送するブロッ
クの選択は、現在地,目的地,走行中の道路の方向等の
条件から決定する。原則として、現在地を含むブロック
を囲む八つのブロックの音声データは高速アクセスメモ
リヘ転送する。図4の場合を例として、転送するブロッ
クの選択例を図5のフローチャートに従って説明する。
現在地のあるブロックはC4である。つまり、C4を囲
む八つのブロックの音声データは高速アクセスメモリ中
に転送が行われている。次に、道路の方向,目的地等の
条件から、現在地点から移動可能なブロックは、C3,
D3と限定でき、例えば、ナビゲーションシステムの推
奨経路にしたがい車が走行すると、転送するブロックは
C2,D2,E2,E3,E4の五つが選択される。Next, control for selecting important voice data to be transferred from the large-scale recording file 104 to the high speed access memory 105 will be described. FIG. 4 shows the correspondence between a map used for in-vehicle navigation and blocks of audio data in a large-scale recording file. Each area separated by a dotted line on the map corresponds to a block in which audio data is divided and stored in a large-scale recording file. The selection of blocks to be transferred is determined based on conditions such as the current location, the destination, and the direction of the road on which the vehicle is running. In principle, the audio data of eight blocks surrounding the block including the current location are transferred to the high speed access memory. Taking the case of FIG. 4 as an example, an example of selecting blocks to be transferred will be described with reference to the flowchart of FIG.
The block where the current position is is C4. That is, the audio data of the eight blocks surrounding C4 are transferred to the high-speed access memory. Next, based on conditions such as the direction of the road and the destination, the block that can be moved from the current position is C3.
It can be limited to D3. For example, when the vehicle travels according to the recommended route of the navigation system, five blocks C2, D2, E2, E3 and E4 are selected as blocks to be transferred.
【0015】また、車が走行中の道路をそのまま直進し
た場合は、B2,C2,D2の三つのブロックを転送す
る。When the vehicle goes straight on the road on which the vehicle is running, three blocks B2, C2 and D2 are transferred.
【0016】この処理と並行して、高速アクセスメモリ
中の不要な音声データの選択もブロックごとに行われ
る。不要な音声データのブロックは現在地,目的地,走
行中の道路の方向等の条件から判断される。In parallel with this processing, unnecessary voice data in the high speed access memory is also selected for each block. Blocks of unnecessary audio data are judged based on conditions such as the current location, the destination, and the direction of the road on which the vehicle is running.
【0017】次に高速アクセスメモリ中のデータ構造の
一実施例を図6に示す。高速アクセスメモリ中には、地
図上の位置を示す文字コードに対応する交差点名,地名
が音韻アクセント情報等とともに格納されている。大規
模録音ファイルから音声データが転送されると、該当す
る位置コードの音声データエリアにそれぞれ格納され
る。また、車載ナビゲーションシステムにおいて、頻度
高く用いられる定型文、例えば、「次の・・・・交差点
を右折して下さい。」などは、録音音声を複数区分に分
割して、あらかじめ高速アクセスメモリ中に格納する。
このような定型文の音声データに関しては、各区分音声
ごとにピッチ,パワー,音韻継続時間長の値が格納され
ている。図7に高速アクセスメモリ中に格納された頻度
の高い音声データに関するデータ構造の一実施例を示
す。Next, an embodiment of the data structure in the high speed access memory is shown in FIG. In the high-speed access memory, intersection names and place names corresponding to character codes indicating positions on the map are stored together with phonological accent information and the like. When the voice data is transferred from the large-scale recording file, it is stored in the voice data area of the corresponding position code. In addition, for fixed phrases that are frequently used in in-vehicle navigation systems, such as "Next ... Turn right at the intersection.", The recorded voice is divided into multiple sections and stored in the high-speed access memory beforehand. Store.
Regarding the voice data of such a fixed sentence, the values of pitch, power, and phoneme duration are stored for each segmented voice. FIG. 7 shows an embodiment of a data structure relating to audio data that is frequently stored in the high speed access memory.
【0018】次に、各区分音声を滑らかに接続する制御
について説明する。出力する文章に定型文を用いる場
合、上記の例で破線で示した区分音声(以下、可変部音
声と呼ぶ)と可変部音声に隣接する定型文の区分音声と
の接続を滑らかにすると、自然な文章音声が出力され
る。そこで、接続出力部では隣接する定型文の区分音声
のピッチ,パワー,音韻継続時間長等の情報をもとに可
変部音声のピッチ,パワー,音韻継続時間長等を調節
し、接続処理を行い音声出力する。図8は、上記接続処
理の処理概念を表す図である。Next, control for smoothly connecting the divided voices will be described. When using a standard sentence as the output sentence, smoothing the connection between the segmented voice (hereinafter referred to as the variable part voice) indicated by the broken line in the above example and the segmental voice of the fixed phrase adjacent to the variable part voice is natural. The sentence sound is output. Therefore, the connection output unit adjusts the pitch, power, phoneme duration, etc. of the variable part voice based on the information such as the pitch, power, phoneme duration, etc. of the segmented speech of the adjacent fixed sentence, and performs connection processing. Output audio. FIG. 8 is a diagram showing a processing concept of the connection processing.
【0019】また、可変部音声を規則合成部で生成する
場合には、音韻アクセント情報と隣接する定型文の区分
音声のピッチ,パワー,音韻継続時間長等の情報をもと
にあらかじめ規則合成してもよい。When the variable part speech is generated by the rule synthesizing part, the rule synthesizing is carried out beforehand based on the information such as the phoneme accent information and the pitch, power, and phoneme duration of the segmented speech of the adjacent fixed sentence. May be.
【0020】[0020]
【発明の効果】本発明によれば、出力すべき録音データ
は高速アクセスメモリ中に格納するため、録音再生音の
音声出力までの処理時間は高速化され、録音再生音と規
則合成音との音声出力のタイミング制御が円滑に行える
ようになる。録音再生用の音声データは大量の記憶容量
を必要とするため、本発明による処理の高速化は著し
い。さらに、音声データに対してピッチ,パワー,音韻
継続時間長の値の調整を行い、音声データを接続するた
め、高品質な文章音声が提供される。According to the present invention, since the recording data to be output is stored in the high speed access memory, the processing time until the voice output of the recording / reproducing sound is accelerated, and the recording / reproducing sound and the regular synthesized sound are combined. The audio output timing control can be smoothly performed. Since the voice data for recording and reproduction requires a large storage capacity, the speed of the processing according to the present invention is remarkable. Furthermore, since the pitch, power, and phoneme duration length values are adjusted for the voice data and the voice data is connected, a high-quality text voice is provided.
【図1】本発明の一実施例を示す車載ナビゲーションシ
ステム用録音再生・規則合成併用型音声出力装置のシス
テムのブロック図。FIG. 1 is a block diagram of a system of an audio output device for recording / playback / rule synthesis combined use for an in-vehicle navigation system showing an embodiment of the present invention.
【図2】本発明の一実施例を示す車載ナビゲーションシ
ステム用録音再生・規則合成併用型音声出力装置の動作
のフローチャート。FIG. 2 is a flow chart of the operation of the recording / playback / rule synthesis combined type voice output device for an in-vehicle navigation system showing an embodiment of the present invention.
【図3】本発明の一実施例を示す車載ナビゲーションシ
ステム用大規模録音ファイルのデータ構造の説明図。FIG. 3 is an explanatory diagram of a data structure of a large-scale recording file for an in-vehicle navigation system showing an embodiment of the present invention.
【図4】本発明の一実施例を示す車載ナビゲーション用
地図と大規模録音ファイルの音声データのブロックとの
対応を示す説明図。FIG. 4 is an explanatory diagram showing the correspondence between a vehicle-mounted navigation map and a block of audio data of a large-scale recording file showing an embodiment of the present invention.
【図5】本発明の大規模録音ファイルから高速アクセス
メモリへ転送する音声データのブロックの選択の一実施
例のフローチャート。FIG. 5 is a flowchart of an embodiment of selecting a block of audio data to be transferred from a large-scale recording file to a high-speed access memory according to the present invention.
【図6】本発明の車載ナビゲーション用高速アクセスメ
モリ中のデータ構造の一実施例を示す説明図。FIG. 6 is an explanatory diagram showing an example of a data structure in a vehicle-mounted navigation high-speed access memory according to the present invention.
【図7】本発明の車載ナビゲーション用高速アクセスメ
モリ中に格納された頻度の高い音声データに関するデー
タ構造の一実施例を示す説明図。FIG. 7 is an explanatory diagram showing an embodiment of a data structure relating to frequently-used voice data stored in a vehicle-mounted navigation high-speed access memory according to the present invention.
【図8】本発明の一実施例を示す車載ナビゲーション装
置用音声出力装置の接続処理の処理概念を表す説明図。FIG. 8 is an explanatory diagram showing a processing concept of a connection processing of an audio output device for a vehicle-mounted navigation device showing an embodiment of the present invention.
101…文字コード受信装置、102…音声出力装置、
103…制御部、104…大規模録音ファイル、105…
高速アクセスメモリ、106…高速アクセスメモリ制御
部、107…録音再生部、108…規則合成部、109
…音素片メモリ、110…接続出力部。101 ... Character code receiving device, 102 ... Voice output device,
103 ... Control unit, 104 ... Large-scale recording file, 105 ...
High-speed access memory, 106 ... High-speed access memory control unit, 107 ... Recording / playback unit, 108 ... Rule synthesis unit, 109
... phoneme unit memory, 110 ... connection output unit.
フロントページの続き (72)発明者 畑岡 信夫 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 角本 繁 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 畠山 朋子 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内Front page continuation (72) Inventor Nobuo Hataoka 1-280 Higashi Koigokubo, Kokubunji, Tokyo Inside Hitachi Central Research Laboratory (72) Inventor Shigeru Kakumoto 1-280 Higashi Koikeku, Kokubunji, Tokyo Hitachi Central Research Co., Ltd. In-house (72) Inventor Tomoko Hatakeyama 1-280 Higashi-Kengikubo, Kokubunji-shi, Tokyo Inside Central Research Laboratory, Hitachi, Ltd.
Claims (8)
に分割し、前記文章音声に対応する波形データを記憶す
る波形データ記憶手段と、前記波形データ記憶手段より
区分音声波形データを選択する手段と、前記波形データ
記憶手段より選択された区分音声の波形データを格納す
る高速アクセスメモリとを含み、前記高速アクセスメモ
リより各区分音声を読み出し録音音声を再生出力する手
段と、文字コード列から音声波形信号を生成する規則音
声合成を行う手段とによって生成した各区分音声を接続
し文章音声を出力する装置において、 出力すべき前記文章音声の区分波形データが前記高速ア
クセスメモリ中に存在するか否かを判定する手段と、前
記区分波形データが前記高速アクセスメモリ中に存在し
ない際には、その区分に対応する文字コード列から規則
合成を行い区分音声波形データを得る手段とを含むこと
を特徴とする音声出力装置。1. A large amount of text voice is divided into a plurality of sections in units of phrases, and waveform data storage means for storing waveform data corresponding to the text voice, and section voice waveform data is selected from the waveform data storage means. And a high-speed access memory for storing the waveform data of the segmented voice selected from the waveform data storage unit, a unit for reading out each segmented voice from the high-speed access memory and reproducing and outputting the recorded voice, and a character code string. In the device which outputs the sentence voice by connecting the respective segmented voices generated by the means for performing the regular voice synthesis for generating the voice waveform signal from the sentence voice, the segmented waveform data of the sentence voice to be output exists in the high-speed access memory. Means for determining whether or not the section waveform data does not exist in the high-speed access memory, and a sentence corresponding to the section A voice output device comprising means for performing rule synthesis from a character code string to obtain segmented voice waveform data.
データを前記高速アクセスメモリへ転送する手段と、前
記波形データ記憶手段より転送された区分音声波形デー
タを前記高速アクセスメモリ中に蓄積する手段と、前記
高速アクセスメモリ中に転送された各区分音声波形デー
タの使用頻度情報として、区分音声波形データの読み出
し回数と前記高速アクセスメモリ中における格納時間を
記憶する手段と、前記高速アクセスメモリ中に転送され
た各区分音声波形データの使用頻度情報等より、前記高
速アクセスメモリ中の区分音声波形データの要・不要を
判断する手段と、不要と判断した音声波形データは前記
高速アクセスメモリ中から削除する手段とを含む音声出
力装置。2. The means for transferring the segmented speech waveform data selected from the waveform data storage means to the high speed access memory, and the segmented speech waveform data transferred from the waveform data storage means at the high speed according to claim 1. Means for accumulating in the access memory, and means for storing the number of times of reading of the divided voice waveform data and the storage time in the high speed access memory as the usage frequency information of each divided voice waveform data transferred to the high speed access memory. The means for determining the necessity / non-necessity of the segmented voice waveform data in the high-speed access memory based on the usage frequency information of the respective segmented voice waveform data transferred to the high-speed access memory, and the voice waveform data determined to be unnecessary are And a means for deleting from the high speed access memory.
に分割し、前記文章音声に対応するLPCパラメータの
音声の特徴パラメータを記憶する特徴パラメータ記憶手
段と、前記特徴パラメータ記憶手段より区分の音声特徴
パラメータを選択する手段と、前記特徴パラメータ記憶
手段より選択された区分音声の特徴パラメータを格納す
る高速アクセスメモリとを含み、前記高速アクセスメモ
リより各区分音声を読み出し録音音声を再生出力する手
段と、文字コード列から音声波形信号を生成する規則音
声合成を行う手段とによって生成した各区分音声を接続
し文章音声を出力する装置において、 出力すべき文章音声の区分音声の特徴パラメータが前記
高速アクセスメモリ中に存在するか否かを判定する手段
と、区分音声の特徴パラメータが前記高速アクセスメモ
リ中に存在しない際には、その区分に対応する文字コー
ド列から規則合成を行い区分音声の特徴パラメータを得
る手段とを含むことを特徴とする音声出力装置。3. A large amount of text speech is divided into a plurality of sections in units such as clauses, and characteristic parameter storage means for storing characteristic parameters of speech of LPC parameters corresponding to the text speech, and classification by the characteristic parameter storage means. And a high-speed access memory for storing the feature parameters of the segmented voice selected from the feature parameter storage unit, each segmented voice is read from the high-speed access memory, and the recorded voice is reproduced and output. In the device which outputs the sentence voice by connecting the respective segmented voices generated by the means and the means for performing the regular voice synthesis for generating the voice waveform signal from the character code string, the characteristic parameter of the segmented voice of the sentence voice to be output is The means for determining whether or not it exists in the high speed access memory, and A voice output device comprising means for obtaining a feature parameter of a segmented voice by performing rule synthesis from a character code string corresponding to the segment when it does not exist in the high speed access memory.
タ記憶手段より選択した区分音声の特徴パラメータを前
記高速アクセスメモリへ転送する手段と、前記波形デー
タ記憶手段より転送された区分音声の特徴パラメータを
前記高速アクセスメモリ中に蓄積する手段と、前記高速
アクセスメモリ中に転送された各区分音声の特徴パラメ
ータの使用頻度情報として、区分音声の特徴パラメータ
の読み出し回数と前記高速アクセスメモリ中における格
納時間を記憶する手段と、前記高速アクセスメモリ中に
転送された各区分音声の特徴パラメータの使用頻度情報
より、前記高速アクセスメモリ中の区分音声の特徴パラ
メータの要・不要を判断する手段と、不要と判断した音
声特徴パラメータは前記高速アクセスメモリ中から削除
する手段とを含むことを特徴とする音声出力装置。4. The means for transferring the feature parameter of the segmented voice selected from the voice feature parameter storage means to the high speed access memory, and the feature parameter of the segmented voice transferred from the waveform data storage means according to claim 3. Means for accumulating in the high-speed access memory, and the frequency of reading the characteristic parameters of the segmental voice and the storage time in the high-speed access memory as usage frequency information of the characteristic parameters of each segmental voice transferred to the high-speed access memory. Means for storing, means for judging the necessity / non-necessity of the characteristic parameter of the divided voice in the high-speed access memory based on the use frequency information of the characteristic parameter of each divided voice transferred to the high-speed access memory And a means for deleting from the high speed access memory. An audio output device, wherein the door.
高く用いる区分音声は、音声データとともにピッチ値,
パワー値,音韻継続時間長などの韻律情報を前記高速ア
クセスメモリ中に格納する手段と、音声データに対し、
ピッチ,パワー,音韻時間長の値を調整して、規則合成
または録音再生によって生成された音声と接続し音声を
出力する手段を具備する音声出力装置。5. The voice segment according to claim 1, 2, 3 or 4, which is frequently used, is a pitch value together with voice data.
Means for storing prosody information such as power value and phoneme duration in the high-speed access memory;
A voice output device comprising means for adjusting the values of pitch, power, and phoneme time length, and connecting the voice generated by rule synthesis or recording / playback to output voice.
段と経路の探索を行う手段と経路の誘導を行う手段を有
し、経路情報等の情報提示手段として音声を用いる車載
ナビゲーション装置。6. The vehicle-mounted navigation device according to claim 5, which has a means for detecting a vehicle position, a means for searching for a route, and a means for guiding a route, and uses voice as information presenting means such as route information.
つかに分割しブロックとして定義し、さらに音声データ
を出力する地図上の位置を位置コードと定義し、同一ブ
ロック内にある位置コードと前記位置コードに対応する
音声データと前記ブロックコードを一つのセットとして
格納する車載用音声ナビゲーション装置。7. An area on a map is divided into several parts and defined as a block, and a position on the map where voice data is output is defined as a position code, and a position code in the same block is defined in claim 6. An in-vehicle voice navigation device that stores voice data corresponding to the position code and the block code as one set.
いて、前記高速アクセスメモリへの格納手段をブロック
単位で行う車載用音声ナビゲーション装置。8. The vehicle-mounted voice navigation device according to claim 7, wherein the means for storing in the high-speed access memory is a block unit based on the information of the current position.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6003398A JPH07210194A (en) | 1994-01-18 | 1994-01-18 | Device for outputting sound |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6003398A JPH07210194A (en) | 1994-01-18 | 1994-01-18 | Device for outputting sound |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07210194A true JPH07210194A (en) | 1995-08-11 |
Family
ID=11556268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6003398A Pending JPH07210194A (en) | 1994-01-18 | 1994-01-18 | Device for outputting sound |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07210194A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001272993A (en) * | 2000-03-24 | 2001-10-05 | Fujitsu General Ltd | Speech synthesis system and emergency information system |
JP2002304285A (en) * | 2001-04-06 | 2002-10-18 | Nippon Hoso Kyokai <Nhk> | Operation support system using voice |
JP2006301059A (en) * | 2005-04-18 | 2006-11-02 | Denso Corp | Voice output system |
JP2009037214A (en) * | 2007-07-11 | 2009-02-19 | Canon Inc | Speech processing device and method |
JP2009282236A (en) * | 2008-05-21 | 2009-12-03 | Mitsubishi Electric Corp | Speech synthesizer |
JP2010230699A (en) * | 2009-03-25 | 2010-10-14 | Toshiba Corp | Speech synthesizing device, program and method |
-
1994
- 1994-01-18 JP JP6003398A patent/JPH07210194A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001272993A (en) * | 2000-03-24 | 2001-10-05 | Fujitsu General Ltd | Speech synthesis system and emergency information system |
JP2002304285A (en) * | 2001-04-06 | 2002-10-18 | Nippon Hoso Kyokai <Nhk> | Operation support system using voice |
JP2006301059A (en) * | 2005-04-18 | 2006-11-02 | Denso Corp | Voice output system |
JP4655268B2 (en) * | 2005-04-18 | 2011-03-23 | 株式会社デンソー | Audio output system |
JP2009037214A (en) * | 2007-07-11 | 2009-02-19 | Canon Inc | Speech processing device and method |
JP2009282236A (en) * | 2008-05-21 | 2009-12-03 | Mitsubishi Electric Corp | Speech synthesizer |
JP2010230699A (en) * | 2009-03-25 | 2010-10-14 | Toshiba Corp | Speech synthesizing device, program and method |
US8626510B2 (en) | 2009-03-25 | 2014-01-07 | Kabushiki Kaisha Toshiba | Speech synthesizing device, computer program product, and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1693829A1 (en) | Voice-controlled data system | |
JP2006047237A (en) | On-vehicle equipment, and voice output method therefor | |
WO1993007447A1 (en) | Navigation apparatus for vehicles | |
JPH10274997A (en) | Document reading-aloud device | |
KR960042718A (en) | Karaoke device, audio playback device, and recording medium used for this | |
US5810600A (en) | Voice recording/reproducing apparatus | |
JPH09325796A (en) | Document reading aloud device | |
JPH07210194A (en) | Device for outputting sound | |
US6393400B1 (en) | Intelligent optical disk with speech synthesizing capabilities | |
JP3518898B2 (en) | Speech synthesizer | |
JP2509523B2 (en) | Vehicle audio output device | |
JP3151731B2 (en) | Navigation device | |
US20070219799A1 (en) | Text to speech synthesis system using syllables as concatenative units | |
JPH0549998B2 (en) | ||
JPH0554960B2 (en) | ||
JP2894483B2 (en) | Navigation device | |
JPH0258639B2 (en) | ||
JP3060276B2 (en) | Speech synthesizer | |
JPH11242496A (en) | Information reproducing device | |
JPS63231493A (en) | Reciting of sentence using voice rule synthesizer | |
JP3409292B2 (en) | Speech synthesis data generator | |
JPS6346518B2 (en) | ||
JPH113096A (en) | Method and system of speech synthesis | |
JP3404776B2 (en) | Signal playback device | |
KR20040062317A (en) | Method for guiding additional information for audio data file |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Effective date: 20031225 Free format text: JAPANESE INTERMEDIATE CODE: A523 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Effective date: 20040127 Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Effective date: 20040205 Free format text: JAPANESE INTERMEDIATE CODE: A61 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090220 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100220 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100220 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110220 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 8 Free format text: PAYMENT UNTIL: 20120220 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 10 Free format text: PAYMENT UNTIL: 20140220 |