JPS61252598A - 音声単語編集方式 - Google Patents
音声単語編集方式Info
- Publication number
- JPS61252598A JPS61252598A JP60094894A JP9489485A JPS61252598A JP S61252598 A JPS61252598 A JP S61252598A JP 60094894 A JP60094894 A JP 60094894A JP 9489485 A JP9489485 A JP 9489485A JP S61252598 A JPS61252598 A JP S61252598A
- Authority
- JP
- Japan
- Prior art keywords
- data
- silent
- word
- adpcm
- quantization width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(発明の分野)
本発明は、銀行や学校などにおける警報その他の放送と
か電話でのサービスなどに利用するものであって、AD
PCM (適応差動パルス符号変調)に基づいた音声単
語編集方式に係り、特には、ADPCMコードで表現さ
れた音声単語データ間に無音データを挿入した状態で、
これらのデータを接続するための技術に関する。
か電話でのサービスなどに利用するものであって、AD
PCM (適応差動パルス符号変調)に基づいた音声単
語編集方式に係り、特には、ADPCMコードで表現さ
れた音声単語データ間に無音データを挿入した状態で、
これらのデータを接続するための技術に関する。
(発明の概要)
本発明は、無音データと単語データとの接続を良好に行
い、自然なかたちでの音声合成ができるとともに、無音
データの記憶に必要な記憶容量を少な(できるようにす
るものである。
い、自然なかたちでの音声合成ができるとともに、無音
データの記憶に必要な記憶容量を少な(できるようにす
るものである。
(従来技術とその問題点)
音声信号は、特に非定常性が強く、平均レベル。
瞬時レベル、m零値間の相関などが絶えず変動する。こ
のような音声信号をADPCM (適応差動パルス符号
変調)方式でコード化すると、音声信号の非定常的な変
動に対して良好に追従した状態でコード化することがで
きる。
のような音声信号をADPCM (適応差動パルス符号
変調)方式でコード化すると、音声信号の非定常的な変
動に対して良好に追従した状態でコード化することがで
きる。
即ち、ADPCM方式は、1つ前のサンプリング時点に
おける量子化幅(ステップ幅)Δ7−1に、その時の量
子化器の出力によって決まる係数M、−9を乗じたもの
を、現サンプリング時点における量子化幅Δ、とするも
のである。つまり、Δ、−Δ@−I XMII−1・・
・・・・・・・(1116進表示のADPCMコードと
コード値と量子化幅係数との関係を次表に示す。
おける量子化幅(ステップ幅)Δ7−1に、その時の量
子化器の出力によって決まる係数M、−9を乗じたもの
を、現サンプリング時点における量子化幅Δ、とするも
のである。つまり、Δ、−Δ@−I XMII−1・・
・・・・・・・(1116進表示のADPCMコードと
コード値と量子化幅係数との関係を次表に示す。
この表におけるコード値°I゛は音声信号のレベル“0
”に対応する。これが一般的には無音データである。
”に対応する。これが一般的には無音データである。
“0”レベルとなるADPCMコード列は、0.8.0
.8.・・・・・・・・・、0.8である。無音データ
が例えば10回連続すると、10個目の無音データにつ
いての量子化幅Δ1゜は、1個目の量子化幅をΔ、とし
て、式(1)から、となる。このような無音データの次
に(る単語データの先頭コードがO”〜13″または′
8゛〜“B”であると、先頭データの量子化幅Δ11は
、Δ@l=o、9XΔ、。ζG、 349Δ、 ・・
・・・・・・・(3)と、著しく小さくなる。
.8.・・・・・・・・・、0.8である。無音データ
が例えば10回連続すると、10個目の無音データにつ
いての量子化幅Δ1゜は、1個目の量子化幅をΔ、とし
て、式(1)から、となる。このような無音データの次
に(る単語データの先頭コードがO”〜13″または′
8゛〜“B”であると、先頭データの量子化幅Δ11は
、Δ@l=o、9XΔ、。ζG、 349Δ、 ・・
・・・・・・・(3)と、著しく小さくなる。
このように量子化幅が時系列的に影響を受けるADPC
M方式で無音データを単語データに接続する場合、その
接続の前後で量子化幅を一致させる必要がある。
M方式で無音データを単語データに接続する場合、その
接続の前後で量子化幅を一致させる必要がある。
しかしながら、従来の単純なADPCM方式には、次の
ような問題点がある。
ような問題点がある。
ADPCMコードで表現されたデータは、伸長時に量子
化幅が系列的に影響を受ける。そのため、単なる′0”
レベルデータを無音データとして扱い、この無音データ
を単語の接続に使用すると、無音データに続く単語デー
タのレベルが著しく小さくなってしまう。
化幅が系列的に影響を受ける。そのため、単なる′0”
レベルデータを無音データとして扱い、この無音データ
を単語の接続に使用すると、無音データに続く単語デー
タのレベルが著しく小さくなってしまう。
即ち、伸長差分データをdn、量子化幅をΔn、コード
値をAとすると、 dn冨ΔnXA ・・・・・・・・・・・
・・・・・・・・・・+4)であるが、無音域をもAD
PCMコードで表現すると、量子化幅Δnが小さいため
、コード値Aが大きくなる。
値をAとすると、 dn冨ΔnXA ・・・・・・・・・・・
・・・・・・・・・・+4)であるが、無音域をもAD
PCMコードで表現すると、量子化幅Δnが小さいため
、コード値Aが大きくなる。
そのため、無音データとして単純に“0”レベルデータ
を与えると、式(4)と矛盾することになる。
を与えると、式(4)と矛盾することになる。
その結果、無音データに後続する単語データの先頭レベ
ルが実際のレベルよりもかなり小さくなってしまう。
ルが実際のレベルよりもかなり小さくなってしまう。
例えば、音声単語「きょうは」と音声単語「よい」と音
声単語「てんきてず」とを、通常の会話と同様に合成す
る場合、無音を“−”で表すとして、 〔きょうは−よい−てんきです〕 のように音声単語と音声単語との間に無音を挿入した状
態でデータを接続することが好ましい。
声単語「てんきてず」とを、通常の会話と同様に合成す
る場合、無音を“−”で表すとして、 〔きょうは−よい−てんきです〕 のように音声単語と音声単語との間に無音を挿入した状
態でデータを接続することが好ましい。
しかし、無音“−”のデータ列において、前記のように
最終の無音コードの量子化幅Δ1゜が非常に小さいと、
後続の音声単語「よい」や[てんきアす1のキ領1−ト
′の!ヱル6巨八−4礒(革? ♂71\太くなり、接
続すべき無音データと単語データの量子化幅が不一致と
なるため、「よ」や「て」が聞こえにくくなる。
最終の無音コードの量子化幅Δ1゜が非常に小さいと、
後続の音声単語「よい」や[てんきアす1のキ領1−ト
′の!ヱル6巨八−4礒(革? ♂71\太くなり、接
続すべき無音データと単語データの量子化幅が不一致と
なるため、「よ」や「て」が聞こえにくくなる。
ことに先頭データに低レベル部をもつ単語(例えば、さ
行の単語などの摩擦音)の場合には、無音データの影響
で単語レベルが著しく小さくなり、聞こえなくなってし
まう。
行の単語などの摩擦音)の場合には、無音データの影響
で単語レベルが著しく小さくなり、聞こえなくなってし
まう。
一例を挙げると、音声単語「わたしは」と無音「−」と
音声単語「せんせいです」とを接続して音声合成すると
、「せんせいてす」の先頭の「せ」の先頭データのレベ
ルが著しく低くなって、「せ」自体が不明確となり、例
えば、 〔わたしは−んせいです〕 のように聞こえるといった具合である。
音声単語「せんせいです」とを接続して音声合成すると
、「せんせいてす」の先頭の「せ」の先頭データのレベ
ルが著しく低くなって、「せ」自体が不明確となり、例
えば、 〔わたしは−んせいです〕 のように聞こえるといった具合である。
(発明の目的)
本発明は、このような事情に鑑みてなされたものであっ
て、無音データと単語データとの接続を良好に行い、自
然なかたちでの音声合成ができるとともに、無音データ
の記憶に必要な記憶容量を少なくできる音声単語編集方
式を提供することを目的とする。
て、無音データと単語データとの接続を良好に行い、自
然なかたちでの音声合成ができるとともに、無音データ
の記憶に必要な記憶容量を少なくできる音声単語編集方
式を提供することを目的とする。
(発明の構成と効果)
本発明は、このような目的を達成するために、次のよう
な構成をとる。
な構成をとる。
即ち、本発明の音声単語編集方式は、ADPCM方式に
よる録音時に単語データと後続の単語データとの間の無
音域について、この無音域の継続時間tを1を超える数
値Xで除算した時間t / xの期間にわたって前記無
音域のデータを無音データとしてセットし、この無音デ
ータと単語データとの接続時に無音データをほぼ前記時
間tの間繰り返し出力するようにしたことを特徴とする
ものである。
よる録音時に単語データと後続の単語データとの間の無
音域について、この無音域の継続時間tを1を超える数
値Xで除算した時間t / xの期間にわたって前記無
音域のデータを無音データとしてセットし、この無音デ
ータと単語データとの接続時に無音データをほぼ前記時
間tの間繰り返し出力するようにしたことを特徴とする
ものである。
即ち、本発明は、単語を録音するときに、無音域の一部
分をADPCMコード化することなく、生のかたちのデ
ータとして採用し、これを音声合成のための無音データ
としたものである。
分をADPCMコード化することなく、生のかたちのデ
ータとして採用し、これを音声合成のための無音データ
としたものである。
この構成による作用は、次の通りである。
無音データとして無音域の一部分(t/X)を採用し、
音声合成時にこの無音データをほぼ時間た無音データの
最終のデータの量子化幅が後続の音声単語の量子化幅と
ほぼ一致することになる。
音声合成時にこの無音データをほぼ時間た無音データの
最終のデータの量子化幅が後続の音声単語の量子化幅と
ほぼ一致することになる。
以上の例から明らかなように、本発明によれば、次のよ
うな効果が発揮される。
うな効果が発揮される。
(i)音声単語について量子化幅が時系列的に影響を受
けるADPCM方式を採用しであるにもかかわらず、さ
行の単語などの摩擦音のように先頭データに低レベル部
をもつ単語の場合でも、無音データと単語データとの接
続を良好なものとし、自然な文章のつながったものとし
て明瞭に聞き取れる音声にすることができる。
けるADPCM方式を採用しであるにもかかわらず、さ
行の単語などの摩擦音のように先頭データに低レベル部
をもつ単語の場合でも、無音データと単語データとの接
続を良好なものとし、自然な文章のつながったものとし
て明瞭に聞き取れる音声にすることができる。
また、単語データが録音データであるため、録音環境が
比較的悪いところで採取した単語であっても、接続その
ものは自然なものになる。
比較的悪いところで採取した単語であっても、接続その
ものは自然なものになる。
(ii )無音データを表現するコードがノイズである
ため、その平均レベルは10″であり、どの区間(t/
X)を採用してもよい、そして、このように採用された
無音データは、一般の単語データに比べて短いものであ
り、かつ、その無音データを繰り返し利用するため、無
音データについての記憶容量を少なくすることができる
。
ため、その平均レベルは10″であり、どの区間(t/
X)を採用してもよい、そして、このように採用された
無音データは、一般の単語データに比べて短いものであ
り、かつ、その無音データを繰り返し利用するため、無
音データについての記憶容量を少なくすることができる
。
(実施例の説明)
以下、本発明を図面に示す実施例に基づいて詳細に説明
する。第1図は本発明の実施例に係る音声単語編集方式
のブロック図である。
する。第1図は本発明の実施例に係る音声単語編集方式
のブロック図である。
図において、■はマイクロホン、2は、マイクロホン1
から入力した音声のアナログ信号をデジタル信号に変換
するA/Dコンバータ、3は、A/Dコンバータ2から
入力した音声デジタル信号をADPCMによって振幅が
大きい程強く圧縮するADPCM圧縮手段、4は、AD
PCM圧縮手段3からのデータについて有音(音声単語
)と無音とに分離する有音/無音分離手段である。AD
PCM圧縮手段3および有音/無音分離手段4が音声分
析用制御手段5を構成している。
から入力した音声のアナログ信号をデジタル信号に変換
するA/Dコンバータ、3は、A/Dコンバータ2から
入力した音声デジタル信号をADPCMによって振幅が
大きい程強く圧縮するADPCM圧縮手段、4は、AD
PCM圧縮手段3からのデータについて有音(音声単語
)と無音とに分離する有音/無音分離手段である。AD
PCM圧縮手段3および有音/無音分離手段4が音声分
析用制御手段5を構成している。
6はメモリであり、有音(音声単語)データのメモリエ
リア6aと、無音データのメモリエリア6bとを有して
いる。
リア6aと、無音データのメモリエリア6bとを有して
いる。
7は、ひと主と生幻のt杏企成すAための−;皇のプロ
グラムデータを、複数の文ごとに格納したテーブルであ
る。例えば、「火災が発生した。v!急に避難せよ、」
というひとまとまりの警報文を合成するためのプログラ
ムデータ、その他の文を合成するためのプログラムデー
タが格納されている。
グラムデータを、複数の文ごとに格納したテーブルであ
る。例えば、「火災が発生した。v!急に避難せよ、」
というひとまとまりの警報文を合成するためのプログラ
ムデータ、その他の文を合成するためのプログラムデー
タが格納されている。
8は、テーブル7から一連のプログラムデータを読み出
し、そのプログラムデータに基づいてメモリエリア6a
およびメモリエリア6bから要求された単語データおよ
び無音データを読み出す放送文選択手段である。この放
送文選択手段8は、警報出力手段9その他の出力手段に
接続され、選択された出力手段からの指令信号によって
前記の読み出し制御を司るように構成されている。
し、そのプログラムデータに基づいてメモリエリア6a
およびメモリエリア6bから要求された単語データおよ
び無音データを読み出す放送文選択手段である。この放
送文選択手段8は、警報出力手段9その他の出力手段に
接続され、選択された出力手段からの指令信号によって
前記の読み出し制御を司るように構成されている。
10は、メモリエリア6aおよびメモリエリア6bから
読み出した単語データおよび無音データを、ADPCM
によって振幅が大きい程強く伸長するADPCM伸長手
段である。放送文選択手段8とADPCM伸長手段10
とが音声合成用制御手段11を構成している。
読み出した単語データおよび無音データを、ADPCM
によって振幅が大きい程強く伸長するADPCM伸長手
段である。放送文選択手段8とADPCM伸長手段10
とが音声合成用制御手段11を構成している。
l2はADPCM伸長手段10から順次的に出力された
単語データおよび無音データをアナログ信号に変換する
D/Aコンバータ、13はD/Aコンバータ12に接続
されたスピーカである。
単語データおよび無音データをアナログ信号に変換する
D/Aコンバータ、13はD/Aコンバータ12に接続
されたスピーカである。
次に、この実施例の動作を第2図のタイムチャートに基
づいて説明する。第2図の(A)は音声データの波形図
、(B)はADPCMコードの波形図、(C)は(A)
の一部分を拡大した波形図である。
づいて説明する。第2図の(A)は音声データの波形図
、(B)はADPCMコードの波形図、(C)は(A)
の一部分を拡大した波形図である。
録音時において、マイクロホン1から入力された音声信
号がA/Dコンバータ2によってデジタル信号に変換さ
れ、ADPCM圧縮手段3によって所定の圧縮を受ける
。圧縮された信号は、有音/無音分離手段4により有音
(単語データ)と無音データとに分離される。
号がA/Dコンバータ2によってデジタル信号に変換さ
れ、ADPCM圧縮手段3によって所定の圧縮を受ける
。圧縮された信号は、有音/無音分離手段4により有音
(単語データ)と無音データとに分離される。
分離された単語データは、メモリエリア6aに記憶され
、無音データはメモリエリア6bに記憶される。
、無音データはメモリエリア6bに記憶される。
このときメモリエリア6bに対する書き込み指令信号は
、無音域が継続する期間tのX分のlの期間だけ入力さ
れる。従って、メモリエリア6bには無音域の期間t
/ xにわたる生のデータ(コード化されていないデー
タ)が記憶される。
、無音域が継続する期間tのX分のlの期間だけ入力さ
れる。従って、メモリエリア6bには無音域の期間t
/ xにわたる生のデータ(コード化されていないデー
タ)が記憶される。
次に、音声を合成する場合の動作を説明する。
例えば、警報出力手段9から放送文選択手段8に指令信
号が与えられると、放送文選択手段8は、テーブル7か
ら一連のプログラムデータを読み出し、そのプログラム
データに基づいてメモリエリア6aおよびメモリエリア
6bから要求された単語データおよび無音データを順次
的に読み出す。
号が与えられると、放送文選択手段8は、テーブル7か
ら一連のプログラムデータを読み出し、そのプログラム
データに基づいてメモリエリア6aおよびメモリエリア
6bから要求された単語データおよび無音データを順次
的に読み出す。
即ち、例えば、「火災が一発生した。−緊急に一避難せ
よ、」というひとまとまりの警報文を合成するための単
語データおよび無音データを読み出し、順次的に合成す
る。このとき無音データは、時間tの間、(t/X)分
のデータがX回にわたって繰り返し読み出される。
よ、」というひとまとまりの警報文を合成するための単
語データおよび無音データを読み出し、順次的に合成す
る。このとき無音データは、時間tの間、(t/X)分
のデータがX回にわたって繰り返し読み出される。
このように合成した単語データおよび無音データのデー
タ列は、ADPCM伸長手段10によって、振幅が大き
い程強く伸長され、接続の良好な状態で復元化される。
タ列は、ADPCM伸長手段10によって、振幅が大き
い程強く伸長され、接続の良好な状態で復元化される。
復元化されたデータ列は、D/Aコンバータ12によっ
てアナログ信号に変換されたのち、スピーカ13から音
声となって出力される。
てアナログ信号に変換されたのち、スピーカ13から音
声となって出力される。
以上のように、量子化幅が時系列的に影響を受けるAD
PCM方式を採用し、ADPCMコードで表現された音
声単語データ間に、生のかたちの無音データを挿入した
状態で、これらのデータを接続するものであるから、さ
行の単語などの摩擦音のように先頭データに低レベル部
をもつ単語の場合でも、無音データと単語データとの接
続を良好なものとし、明瞭に聞き取れる音声にすること
ができる。
PCM方式を採用し、ADPCMコードで表現された音
声単語データ間に、生のかたちの無音データを挿入した
状態で、これらのデータを接続するものであるから、さ
行の単語などの摩擦音のように先頭データに低レベル部
をもつ単語の場合でも、無音データと単語データとの接
続を良好なものとし、明瞭に聞き取れる音声にすること
ができる。
波形図、(B)は図(A)とタイミングを合わせたAD
PCMコードの波形図、(C)は図(A)の一部分を拡
大した波形図である。
PCMコードの波形図、(C)は図(A)の一部分を拡
大した波形図である。
Claims (1)
- (1)ADPCM方式による録音時に単語データと後続
の単語データとの間の無音域について、この無音域の継
続時間tを1を超える数値xで除算した時間t/xの期
間にわたって前記無音域のデータを無音データとしてセ
ットし、この無音データと単語データとの接続時に無音
データをほぼ前記時間tの間繰り返し出力する音声単語
編集方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60094894A JPS61252598A (ja) | 1985-05-01 | 1985-05-01 | 音声単語編集方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60094894A JPS61252598A (ja) | 1985-05-01 | 1985-05-01 | 音声単語編集方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61252598A true JPS61252598A (ja) | 1986-11-10 |
Family
ID=14122744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60094894A Pending JPS61252598A (ja) | 1985-05-01 | 1985-05-01 | 音声単語編集方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61252598A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0279300A (ja) * | 1988-09-16 | 1990-03-19 | Sanyo Electric Co Ltd | 音声録音再生装置 |
JPH0294200A (ja) * | 1988-09-30 | 1990-04-04 | Sanyo Electric Co Ltd | 音声録音再生装置 |
JPH0296200A (ja) * | 1989-03-22 | 1990-04-06 | Ind Technol Res Inst | 適応差動パルス符号変調音声発生器 |
-
1985
- 1985-05-01 JP JP60094894A patent/JPS61252598A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0279300A (ja) * | 1988-09-16 | 1990-03-19 | Sanyo Electric Co Ltd | 音声録音再生装置 |
JPH0294200A (ja) * | 1988-09-30 | 1990-04-04 | Sanyo Electric Co Ltd | 音声録音再生装置 |
JPH0296200A (ja) * | 1989-03-22 | 1990-04-06 | Ind Technol Res Inst | 適応差動パルス符号変調音声発生器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6678650B2 (en) | Apparatus and method for converting reproducing speed | |
KR20030031936A (ko) | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 | |
JPS5982608A (ja) | 音声の再生速度制御方式 | |
JPS61252598A (ja) | 音声単語編集方式 | |
JPS604999B2 (ja) | 音声報知装置 | |
JP2001184100A (ja) | 話速変換装置 | |
JPS61254998A (ja) | 音声単語編集方式 | |
JPS5830695A (ja) | 音声応答時計 | |
JPS6187199A (ja) | 音声分析合成装置 | |
JPS5912479A (ja) | 発音練習装置 | |
JP2605663B2 (ja) | 録音機能付電子機器 | |
JPH01197793A (ja) | 音声合成装置 | |
JPH02153397A (ja) | 音声収録装置 | |
JPS5821798A (ja) | 音声再生装置 | |
KR920002861B1 (ko) | Lpc 음성합성장치 및 그 방법 | |
JPS6295595A (ja) | 音声応答方式 | |
JPH02245800A (ja) | 音声再生方式 | |
JPH1131000A (ja) | ボイスレコーダ | |
JPS58158693A (ja) | 音声符号化方法 | |
JP2861005B2 (ja) | 音声蓄積再生装置 | |
JPS6325700A (ja) | 長音結合方法 | |
JPS6067998A (ja) | 音声合成装置 | |
JP2007288565A (ja) | 車載機 | |
JPH01187596A (ja) | 音声再生方法 | |
JPH03160500A (ja) | 音声合成装置 |