JP2838159B2 - 音声信号処理装置 - Google Patents

音声信号処理装置

Info

Publication number
JP2838159B2
JP2838159B2 JP5349499A JP34949993A JP2838159B2 JP 2838159 B2 JP2838159 B2 JP 2838159B2 JP 5349499 A JP5349499 A JP 5349499A JP 34949993 A JP34949993 A JP 34949993A JP 2838159 B2 JP2838159 B2 JP 2838159B2
Authority
JP
Japan
Prior art keywords
data
audio
silence
control code
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5349499A
Other languages
English (en)
Other versions
JPH07201133A (ja
Inventor
和隆 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ADOBANSU KK
Original Assignee
ADOBANSU KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ADOBANSU KK filed Critical ADOBANSU KK
Priority to JP5349499A priority Critical patent/JP2838159B2/ja
Publication of JPH07201133A publication Critical patent/JPH07201133A/ja
Application granted granted Critical
Publication of JP2838159B2 publication Critical patent/JP2838159B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号処理装置に関
する。
【0002】
【従来の技術】無音声部を符号化し、実質的削除を施し
ながら文庫本、学習書等の書籍を朗読したその朗読音声
をCD−ROM等のディジタル高容量記録媒体に録音す
ることにより、書籍一冊乃至数冊分に相当する朗読音声
が録音可能となる。無音声部の実質的削除するために
は、無音声部を判断する必要があるが、その判断基準に
よって、再生時の音声に違和感を与えたり、削除の時間
が少なくなり、記録媒体全体の録音時間が短くなったり
する。例えば、無音声の音の振幅いき値を高くすると、
音声の余韻の部分を削除してしまう為、再生の際、とつ
とつとした朗読音声になり、違和感が発生したり、音声
の余韻を記録するため無音声のいき値を小さくしすぎ
て、結局削除時間が短くなってしまう場合 あるいは、
連続的な音と音のつながりがある部分であるにも拘ら
ず、一時的に 無音声状態になるため削除対象となり、
再生時、違和感が発生するなどがある。
【0003】
【課題を解決するための手段】上記に鑑み本発明は、無
音声部を判断するために、音声データの音声振幅値に対
しその分布を取り、予め設定された振幅範囲にある音声
振幅の分布が所定値以上の場合仮の無音声開始点を設定
し、前記仮の無音声開始点に対し更に時間遅延した点を
真の無音開始点とする無音開始点設定手段、無音開始点
が設定された後であって、所定数の音声データの音声振
幅がいき値以上である分布が所定値以上の場合仮の無音
声終了点を設定し、前記仮の無音声終了点に対し更に所
定時間を遡らせた点を真の無音終了点とする無音終了点
設定手段を設けることにより適当な無音声部の削除並び
に再生音声の違和感の解消を実現した。音声データの音
声振幅値の分布とは、音声データ列を時間で区切り、そ
の時間内で存在する音声データの発生振幅に対するそれ
ぞれの発生量を示すものである。
【0004】
【実施例】図1は本発明の記録装置の一例を示したブロ
ック図である。(11)は音声入力手段であり、アナログ音
声電信号を生成するマイクロフォン、フィルタ回路、増
幅回路等で構成される。(12)は、A/D変換手段であっ
て、サンプリング回路、A/Dコンバータ回路等で構成
され、更にADPCM等の各種PCM、PWM、ATC
等の圧縮機能を含む回路を必要に応じて備えるものであ
る。(13)は、無音検出手段であって、ディジタル音声デ
ータより予め設定した無音を示すコード、持続時間等を
示すパラメータコード等とまぎらわしい値を示すデータ
を変更、削除、移動等して処理した後、無音声部を検出
し、この部分を無音声を示すコード、時間幅等を示すパ
ラメータコードに対応させ、音声データ中に割り込ませ
るように付加する。(14)は、無音声削除手段であり、無
音声制御コードに続く無音区間バイト数分の音声ディジ
タルデータ上から削除する為の手段である。(15)は、成
分制御コード変換手段であり、アナログ音声をデジタル
音声に変換させる際、及び復元する際、12ビットの変
換手段を使用し、記録媒体には、4ビットデータを記録
する仕様を採っているので、該成分制御コードは、12
ビットから4ビット又は、その逆の変換処理を行う際そ
の変換パラメータとして使用するものである。またディ
ジタル音声信号の変化率の大きい部分や特徴となる部分
を成分制御コードに変換する為の手段でもある。成分制
御コード変換手段(15)は、音声信号の変化率の大きい部
分や特徴となる部分は、通常ディジタル情報を大きくし
ないと充分な復元ができないことから、この部分のデー
タを、量、数を示すデータ、つまり成分制御コードに置
き換えることによってディジタル情報量を少なく抑える
と共に、記録媒体に記録する音声データが4ビット程度
と小さいビット数に抑える場合、再生時、現波形に近い
アナログ音声信号を得るためのものである。(16)は、組
み替え手段であり、所定区間で無音制御コード等の制御
コードと音声データを混在化している場合、無音制御コ
ード部分を無音を示す音声データに置き換え、次の区間
の先頭にその制御コードを格納するものである。所定区
間での音声データと制御コードの混在の状態とは、例え
ば、CPU等の処理手段が8ビットの処理能力があり、
処理しやすいように音声データ列を8ビットで区切る様
な場合であって、この8ビット中に音声データと制御デ
ータが在る状態等である。この様な状態に於いて、下位
4ビットのコードを次の所定区間の先頭に置き、代わり
に無音声を示す音声データを代入する処理を施し、コー
ドと音声データとを区別するものとする。更に組み替え
手段では、ディジタル音声を4ビット符号化する手段も
併せ有する。(17)は記録信号調整手段であって、記録媒
体に書き込む為に必要な形態の信号を入力信号に対し変
更処理させる為の手段である。この場合、EFM変調な
ど、従来利用されている手段も含まれるものとする。(1
7p)は書き込み用ピックアップであり、記録媒体(18)の
種類に応じて適宜選択される。無音声検出手段(13)へ記
録信号調整手段(16)は、1乃至複数のDSP、マイコン
によって構成されるが、その選択は装置の大小、処理能
力の大きさ等々によって適宜選択される。(18)は、記録
媒体で、CD、CD−ROM、MD、MO、磁気テー
プ、IC、ICカード等であるが、これは必ずしも目的
とする記録媒体ではなく、その他の処理作業を行うため
に一時的に記録をする仮の記録媒体である場合もある。
【0005】次に、無音声検出手段の具体的動作の一例
を図2で示すフローチャートを参照して説明する。(2
a)でディジタル化した音声データを所定量分入力す
る。この時、所定量とは、1024個単位等の数であり、一
時的に格納する為の記録素子に依存する。又、これは不
用な場合もある。(2b)で予め無音声を示す符号等とし
て使用する為に設定した制御コードと音声データとを区
別する為、64データを1ブロックとした音声データか
ら、制御コードと同一乃至類似するデータを変更させ
る。この変更は、例えばこのデータに+1(インクリメ
ント)することによって行われる。尚、この+1(インク
リメント)によって音声データの内容は、変更されるが
実際、再生出力音声にはなんら影響が無いのである。次
に(2C)に於いて無音の開始終了を決定するための計算
を行う。計算例としては音声データを所定のブロック単
位(例えば1ブロックを64データとする。)で区切り、
そのブロックでの音声振幅分布等のデータを得る。(2
d)に於いて、(2c)で得られたデータの振幅分布が所
定の範囲(例えば(800h≦X≦80Fh))にどれだけある
かが検出され、もし1ブロック中のデータが該無音範囲
に90%以上あれば、仮の無音声開始とされ(yes)とな
り、それ以外の時は、(no)となる。(2d)で(yes)
の時、次に(2e)で無音開始フラグがオンされているか
どうか調べられ、フラグがオフしていればここで無音開
始が確実に決定され、(no)となり、仮の無音声開始点
に対し無音声フラグがオンする(2f)。(2e)で既に無
音開始フラグがオンしている時は、無音区間中であり、
(yes)となる。(2g)は、次の所定数データブロック
を読み込む部分であり、(2h)にてそのデータブロック
が終了かどうか判定され、終了の時は、(yes)、終了
でない時は、無音範囲計算(2C)に戻る。もし終了の場
合は、(yes)となる(2i)にて全データが終了したか
判定し、もし終了していない場合は、(no)となり、
(2a)にて再び1024個のデータを読み取り、一時的に記
録させ、(2a)以降の処理を続ける。
【0006】(2d)に於いて、もし無音範囲でない場合
(no)となり、これが無音終了なのかどうか(2j)にて
判定される。判定の基準は、例えば所定数のデータ中50
%以上が無音範囲でない場合である。(2j)にて(ye
s)無音終了であれば、(2k)へ進み、(no)であれば
無音部分でないとして(2g)へ進み、次の所定数のデー
タブロックを読み込む。(2k)で、無音開始フラグがオ
ンしているか判定され、もしオフしているのならば(n
o)として(2g)へ進む。もし無音開始フラグがオンし
ていたならば、(yes)として(2l)にて無音区間のバ
イト数が計算される。この時、仮の無音開始点と仮の無
音終了点との間が所定時間以上ある場合、真の無音開始
点と真の無音終了点が設定される。又、場合に応じて設
定された無音声の持続時間が所定の時間より短い時これ
を無音区間と判断せず無効とする処理が施される。この
処理は、朗読が連続してはいるが音と音との間が無音の
状態であって、無音削除の対象となってしまい削除した
結果として再生時違和感が発生するのを防ぐためのもの
として適当である。(2m)にて無音検出による制御コー
ドと無音区間を示すバイト数コードが決定され、音声デ
ータの中に格納される。(2n)にて、無音開始フラグが
オフし、一連の無音検出処理が終わり、(2g)へ移行
し、次のデータブロックが読み出される。
【0007】無音声検出手段(13)にて無音声符号等が音
声データと一緒になった混成データ列は、無音声削除処
理手段(14)に入力され、無音声を示す音声データが削除
される。その具体的動作を図3に示す。(3a)に於いて
無音声検出手段(13)から直接またはバッファ等を介して
間接的に該混成データが読み込まれる。(3b)にて、最
初のデータが無音検出制御コードであるか判定される。
無音検出制御コードであれば(yes)、次の(3d)へ進
む。もしそうでなければ、(no)となり強制的に無音検
出制御コードと無音区間バイト数0をバッファメモリに
格納し、(3d)へ進む。(3d)では、全データが処理を
終了したかどうか判定し、しない場合(no)、改めて混
成データ列を読み込む。次に(3f)にて、無音検出制御
コードであるかないかを判定し、そうである(yes)
時、(3h)にて無音検出制御コードと無音区間を示すバ
イト数のみ格納し、そのままスキップする。更に(3i)
にて無音検出制御コードに対応した無音区間バイト数分
のデータのポインタを進め、無音区間バイト数分データ
を削減する。(3f)にて、無音検出制御コードでない
(no)場合、読み込まれたデータがこの部分は音声デー
タであると決定し、データをバッファに格納する。以上
の繰り返しを行うことによって、全データを音声データ
と無音検出制御コードと無音区間バイト数コードだけの
データ列に整理する。逐次乃至一定量削除処理を行った
後、無音声削除手段(14)の出力は、成分制御コード変換
手段(15)に入力される。
【0008】成分制御コード変換手段(15)の動作の一例
を図4に示し説明する。(4a)に於いて無音声削除手段
(14)が出力したデータを読み込む。尚この実施例での説
明では、読み込むデータの単位は256個とし、1個単位
で処理されることとした。(4b)に於いて、処理データ
が無音検出制御コードであるか、ないかを判定し、制御
コードであるとき(yes)、無音検出制御コードと無音
区間バイト数のみをバッファに格納し、そのままデータ
をスキップさせ(4d)に移行する。無音検出制御コード
でない場合(4d)に移行する。(4d)に於いて、前デー
タと現データとの差を求めて、その差分データから同一
モードでの差データの最大値を求める。(4d')に於
て、モードの変更があるかどうか判定し、モード変更が
あった場合(yes)、(4e)へ移行する。同一モードの
場合(no)は、(4a)へ移行し、次のデータの処理を行
う。(4e)に於て、モード変更が、プラス・マイナス成
分モードへの変更であるか判定を行う。プラス・マイナ
ス成分モードとは、図5(a)で示される様に、データの
変化が少なく、プラスとマイナス成分が有り、隣在った
データの差が規定値以下のデータである。(4e)でプラ
ス・マイナス成分モードに該当する時は(yes)方向へ
行き、該当しない場合は(no)へ行く。(yes)の場合
は、プラス・マイナス成分モードに対応するプラス・マ
イナス制御コード並びに掛け率コードを音声符号データ
上に格納する。掛け率コードとは、音声データの変化量
に於けるビット表現では不充分な部分を補うものであ
り、掛け率によって音声データ変化量を表現するもので
ある。掛け率コードの基準は、任意であって音声データ
のディジタルビット表現、サンプル周波数によって適宜
選択される。尚、サンプル周波数8KHz、記録媒体に
記録される音声並びに制御コードディジタルデータが4
ビットの場合の掛け率は例えば、次の様に設定される。
プラス・マイナスの方向性は、7を基準値とし0〜6ま
でがマイナス成分、8〜14(Eh)までがプラス成分を現
す。この時の最大変化量は7である。最大差(B)(図5
(a))/最大変化量で1変化の掛け率を求める。(4e)
で(no)の時、(4g)へ移行し、プラス成分モード上で
の差分データの一致、不一致を判定し、一致する際、プ
ラス成分モードと対応するプラス制御コード並びに掛け
率を音声データ上に格納する。この時の掛け率は例えば
次の様に設定される。0を基準値とし1〜14(Eh)で現
されることから最大変化量は14に設定される。次に掛け
率(最大差/最大変化量)の演算を行い1変化あたりの掛
け率を求める。(4h)にて、音声データに於いて、プラ
ス成分モードで検知された部分にプラス制御コードと掛
け率を格納する。(4g)にて、(no)の場合、(4i)で
マイナス制御コード、掛け率を音声データ上の該当する
個所へ格納する。マイナス成分の掛け率は、方向性を示
すデータは必要とせず、14を基準値として0〜13
(Dh)で表す。最大変化量は14で(最大差/最大変化
量)で1変化あたりの掛け率を求める。
【0009】以上の様に音声データと成分掛け率制御コ
ード無音声制御が混在化したデータは、組み替え手段(1
6)に入力される。組み替え手段(16)は、この混在化デー
タに対し、音声データを12ビットを4ビットへ符号
化、並びに音声データと制御コードの組み替えを行う。
その具体的動作例を図6に示し説明する。(6a)に於い
て、データを読み込み、そのデータの所定数ずつ区切っ
て処理する。(6b)に於いて、制御コードであるかない
かを判断し、制御コードでない(no)の時、音つまり音
声データである時、4ビットの符号化を(6c)にて行
う。この時、成分と掛け率情報をもとに4ビットの符号
化を行う場合もある。12ビットから4ビットへの1変
換方法例について説明する。初回(n−1)では、0レベ
ル(808h)で計算をし、2回目以降は、下記計算で得
られたデータを前回データとして用いる。データの差を
掛け率(m)で割り、この差に必要な変化値を得る。方向
付けを行う為成分別の基準値を加算し4ビットの音声デ
ータを得る。 4ビット音声データ=(((n)−(n−1))/m)+基準値 成分と掛け率は、前段で示した制御コード変換手段(15)
で決定されたものであって、成分制御コード、掛け率は
書き換えが発生する迄、書き換え前の符号が有効とされ
る。(6c)で4ビット化された音声データが偶数番目か
奇数番目かを判定し、偶数番目の場合(yes)、上位4
ビットレジスタに符号化データを退避させる。奇数番目
の場合(no)、下位4ビットレジスタに符号化データを
退避させる。上位と下位それぞれが収まった所で(6g)
で上位4ビット、下位4ビット合計1バイトの符号化デ
ータをバッファメモリに格納する。(6b)でデータが制
御コードである時、この時点で(6h)にて音声データが
奇数データ終了かどうか判定する。奇数データ終了の時
(yes)、制御コード部に無音声を示す音声を格納し、
あわせて次の上位4ビットに制御コードを格納する。
(6j)にて制御コード(Fh)に付随する成分制御コード
(種類、掛け率等)を追加格納する。(6h)にて音声デー
タが偶数で終了する場合は(no)、上述した(6j)の処
理を行うものである。以上の様に音声データと制御コー
ドが整理されたデータは、記録信号調整手段(17)、書き
込み用ピックアップ(17P)を介して仮のあるいは主体と
なる記録媒体(18)に書き込まれる。尚、記録信号調整手
段は、記録媒体によって適宜構成が変化するものである
以上、図1に示す実施例について構成及びその動作を説
明したがこれはあくまでも1例であり、記録手段が、汎
用性を有する小型携帯用となれば接続構成及び動作も異
なる箇所を有するものとなる。又、アナログ音声をデジ
タル音声に変換する場合のサンプリング周波数、分解能
も上述と同様適宜選択されるものである。
【0010】次に図1で記録した記録媒体を再生するた
めの再生装置について図7を参照して説明する。(71)
は記憶媒体であり、図1で使用した主体となる記録媒体
であり、光磁気ディスク、CD、MD、磁気ディスク、
IC記憶媒体等であって、特に小型で高容量なものが好
ましい。(72)は駆動素子であって、記憶媒体を駆動さ
せる為、及びピックアップを動かす為のスピンドルモー
タ、スレッドモータ等の電動機等である。又、記憶媒体
の種類によって無い場合もある。(73)は、RF増幅器
であって、例えば、読み取った信号を増幅、整形する為
のものである。(74)は、調整手段であり、DSP等で
構成され、誤り訂正処理、PLL等、更に汎用CD再生
装置を利用した場合は、EFM復調手段等を具備する。
(75)は、駆動手段であって、駆動素子(72)の回転
数、読み取り、位置決め等の制御をする為の手段であ
る。(76)は、無音声変換手段であり、マイコン、AS
IC等で構成され、符号化された無音声部をその符号並
びに外部入力に応じて再生する為の手段である。(77)
は、入力制御手段であり、マイコン等で構成され、更に
外部入力(770)の入力信号並びに無音声変換手段(76)
の出力信号に基づいた制御信号を調整手段(74)並びに
無音声変換手段(76)に出力する。(78)は、D/A変
換手段であり、音声ディジタル信号をアナログ信号に変
換し出力する。尚、ADPCM、ATC等の圧縮処理が
データに施されている場合は、これに対応した復元処理
を更に含むものとする。(79)は、増幅手段であり、ア
ナログ音声を増幅し出力する。(80)は、音声出力手段
であり、スピーカ、イヤーホーン等よりなる。
【0011】次に動作を説明する。記憶媒体(71)上か
ら駆動素子(72)を介して得られたディジタル音声並び
に符号化無音声データとの混在信号は、RF増幅手段
(73)で、増幅整形され、調整手段(74)に入力され
る。調整手段(74)は、入力されたデータに対し、誤り
訂正、EFM復調処理を施した出力を行い、更に駆動回
路(75)に対し、例えば記憶媒体の回転速度の調整、ピ
ックアップの移動の調整等々を行う為の信号を出力す
る。無音声変換手段(76)は、調整手段(74)からの出
力に対し、符号化無音声データを検出し、無音声を示す
音声データに変換し、出力する。無音声変換手段(76)
は、入力制御手段(77)からの信号により、無音声の音
声データ範囲を容易に変化させる。入力制御手段(77)
は、入力(770)からのキー入力、ツマミ入力等によって
その入力に応じた信号を調整手段(74)に入力させ、例
えば、キー入力がポーズ、頭だし、リピート等の操作に
基づく信号を調整手段(74)に入力させて駆動回路(7
5)を調整させたりする。又、入力制御手段(77)は、
無音声変換手段(76)に対し、発話速度を遅く又は速く
調整するため無音声部の範囲を示す信号範囲を加算乃至
削除する為の信号を出力する。無音声変換手段(76)が
出力した音声データは、D/A変換手段(78)にてアナ
ログ音声に変換された後、増幅回路(79)で増幅され、
音声出力手段(80)で再生出力される。又、記憶媒体
(71)の読み取りが、一般のCDプレーヤの様に44.1
(KHz)分解能16ビット程度の仕様とした場合、これ
に対し無音声復元処理時、D/A変換等が例えば、8K
Hz分解能4ビット、あるいは12ビット程度と比較的
処理スピードの遅く、しかも発話速度を遅く調整した場
合、無音声変換手段(76)は読み取りを一時的にでも停
止、遅延調整すべく、入力制御手段(77)へ制御信号を
出力する場合もある。この時、入力制御手段(77)は、
調整手段(74)へ、回転速度一定のまま読み取りの停
止、回転速度の低下、停止等の動作を行わせるものとす
る。
【0012】次に無音声変換手段(76)のより具体的な
動作例について図8を参照して説明する。まず(8a)で
調整手段(74)から、ディジタル音声データを所定量だ
け取り込み、一時的にメモリに格納する。尚、このメモ
リは逐次無音声処理を行う場合等は不用となる。所定量
だけ取り込んだ後、場合に応じて記憶媒体(71)からの
読み取りを停止乃至抑制する信号を入力制御手段(77)
に出力する。入力制御手段(77)は、この入力された信
号を調整手段(74)へ出力し、駆動素子(72)等々の駆
動を制御する。(72)で所定量だけ音声データを取り込
んだ後、入力制御手段からパラメータ入力を確認し(8
b)、パラメータ入力が有った時、その入力に応じたパ
ラメータ数をセットする(8c)。(8d)に於いて、無声
出力中であるか確認する。ここでは、無音声出力中を示
すフラグの状態を確認している。無声出力中のフラグが
立っていれば(yes),無声出力処理(8h)へ移項し、
クリアされていれば(no)次のステップ(8e)に移行す
る。(8e)では、音声データを探し、途中制御コードが
有ればパラメータをセットする。次に音声データの処理
が終了したかどうかという判定をし(8f)終了した場合
(例えば、音声データ全体に対応するフラグが0になっ
たとき(yes))、更にデータを読み込む為、等の動作
へ移行する(8EN)。終了しない場合(no)の時は、
(8g)に移行し、無音声制御コードであるかないかを判
定する。無音声制御コードでない場合は、該データが音
声を示すものであるとして(8i)へ移行し、無音声制御
コードである場合は無声出力処理(8h)へ移行する。無
声出力処理(8h)では、無声出力中フラグを立てると共
に0レベルの音声を示すデータ(例えば808h)を出力す
る。更に無音声区間を示すパラメータに対し、(8c)の
セットされたパラメータを加算乃至減算し、この値を毎
回−1(デクリメント)する。加算乃至減算されたパラメ
ータが−1され、値が0になったとき、無音声出力中を
示すフラグはクリアされ、無音声出力は終了する。尚上
記両パラメータの加算乃至減算後、ステップ(8c)でセ
ットされた入力パラメータはクリアされる。無音声出力
処理(8h)が終了した後、時間待ち(8n)をして、次の
データの処理を行う。尚、本実施例での時間待ちは、復
号時のサンプル周波数を8(KHz)と設定している為ス
テップ(8n)での時間待ちは、だいたい125マイクロs
ecとなる。(8g)に於いて無音声制御コードでない
(no)の場合、すなわち、音声データである場合、(8
i)に於いてそのデータが偶数番目であるかを判定す
る。ここでデータが偶数番目であるとき(yes)4ビッ
トのビットシフトを行い(8j)、バイト単位のデータ処
理が行える様奇数番目にシフトさせる。次に(8k)に於
いて4ビットの音声データを12ビットに伸張する。伸張
アルゴリズムとしては、例えば次の通りとする。初回デ
ータ(Y)は0レベル(808h)で計算し、2回目以降は下
記計算で得られたデータを前回データとして用いる、4
ビット音声データ(X)を基準値から引き、掛け率(m)を
かける12ビット前回データ(Y)を加算し12ビット音
声データを求める。 12ビット音声データ=((X−基準値)*m)+Y ただし、無音声後は前回データを0レベルとする。尚、
12ビットに伸張している理由は、音声のデジタル化を
12ビットで行った為であって、上述のアルゴリズムと
共に特に限定するものではない。又掛け率(m)は復元時
に正確さを増す為に記録時にデータ上に付加したもので
あり、特に必要というものでもない。次に(8l)にて音
声データが奇数番目の時を検出し、奇数番目の時だけ
(no)音声データが終了するかどうかチェックが行われ
る(8m)。これは例えば音声データ全体に対応するフラ
グを−1(デクリメント)していく動作を行うものであ
る。発話スピードを制御する為に設定されるパラメータ
乃至パラメータに対する動作は、上述に限るものではな
く、割り込み等その他の手法によって実施されるもので
ある。更にパラメータの発生に於いても、予めその値を
記憶設定しておき外部より入力があった時そのパラメー
タが読みだされ、そのパラメータに従って発話スピード
が設定されるようにしたもの、或は、外部入力時に、そ
の外部入力を読み取ってその入力に基づいて発話スピー
ドを制御する様にしたもの等その構成、動作は適宜選択
されるものである。又その処理様式は、ソフトウエアに
よるものに限らずハードウエアによるものであっても良
い。上述した実施例を使用して構成させる装置の大きさ
は、携帯型ができる程度が好ましく、学習書であれば、
音声をリピート出力する機能や、しおり的な機能を付加
する場合もある。又、装置の大きさは、記録媒体の大き
さにも左右されることから、記録媒体は、小さくてしか
も高容量であるもの、例えばCD−ROM、ミニ光磁気
ディスク、3.5インチフロッピイディスク、デジタル
オーディオテープ等が適当であるが限定されるものでは
無い。尚、ディジタル音声は、自然音声をA/D変換、
圧縮処理して生成した音声等、特に限定するものではな
く、その他既存の方式によって変換された音声を示すも
のである。
【0013】
【発明の効果】以上詳述の如く本発明は、無音声部を充
分に削除すると共に違和感のない再生が行える等の効果
を有する。
【図面の簡単な説明】
【図1】本発明の記録装置の一実施例を示す図
【図2】
【図3】
【図4】
【図6】図1で示した各部動作を具体的に示すフローチ
ャート
【図5】図4の動作を説明するための図
【図7】再生装置の一実施例を示す図
【図8】図7で示した各部動作を具体的に示すフローチ
ャート
【符号の説明】
11 音声入力手段 12 A/D変換手段 13 無音検出手段 14 無音声削除手段 15 成分制御コード変換手段 16 組み替え手段 17 記録信号調整手段 18 記録媒体

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 実質的に無音声部を符号化した様式で音
    声信号をディジタル記録する記録手段、所望の発話速度
    でディジタル音声信号を音声再生する声再生手段より
    なる音声信号処理装置において、音声データの音声振幅
    の分布が予め設定された無音範囲内に所定数以上存在す
    る場合、仮の無音声開始点を設定する手段、無音開始点
    が設定された後であって、音声データの音声振幅の分布
    があらかじめ設定された無音範囲内に所定数以上存在し
    ていない場合仮の無音声終了点を設定する手段、前記仮
    の無音声開始点及び前記仮の無音終了点間の時間幅が所
    定時間以上である場合当該時間幅を無音領域として検出
    する手段よりなる音声信号処理装置。
JP5349499A 1993-12-28 1993-12-28 音声信号処理装置 Expired - Lifetime JP2838159B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5349499A JP2838159B2 (ja) 1993-12-28 1993-12-28 音声信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5349499A JP2838159B2 (ja) 1993-12-28 1993-12-28 音声信号処理装置

Publications (2)

Publication Number Publication Date
JPH07201133A JPH07201133A (ja) 1995-08-04
JP2838159B2 true JP2838159B2 (ja) 1998-12-16

Family

ID=18404165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5349499A Expired - Lifetime JP2838159B2 (ja) 1993-12-28 1993-12-28 音声信号処理装置

Country Status (1)

Country Link
JP (1) JP2838159B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100776432B1 (ko) * 2005-08-16 2007-11-16 주식회사 팬택 오디오 기록 재생 장치 및 그 장치에서 실행 가능한 압축률개선을 위한 오디오 코딩 방법
JP4973492B2 (ja) * 2007-01-30 2012-07-11 株式会社Jvcケンウッド 再生装置、再生方法及び再生プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61233791A (ja) * 1985-04-09 1986-10-18 株式会社リコー 音声認識装置における音声区間検出方式
JPH0821201B2 (ja) * 1987-08-07 1996-03-04 ソニー株式会社 デイジタル式記録再生装置

Also Published As

Publication number Publication date
JPH07201133A (ja) 1995-08-04

Similar Documents

Publication Publication Date Title
JPH0822672A (ja) ディスク記録再生装置
JP3687467B2 (ja) 記録媒体再生装置
JP2838159B2 (ja) 音声信号処理装置
JPH0689544A (ja) ディスク記録装置
JP3968206B2 (ja) 再生装置
JP4542805B2 (ja) 変速再生方法及び装置、並びにプログラム
WO1994024667A1 (en) Apparatus for recording and reproducing voice
EP0652560A1 (en) Apparatus for recording and reproducing voice
JPH11134845A (ja) 光ディスク再生装置
JPH0916200A (ja) 音声記録再生装置
JPH07160282A (ja) 音声再生装置
JP3011635B2 (ja) ディスク記録再生装置
JP3341348B2 (ja) 情報検出再生装置及び情報記録装置
JPS6253093B2 (ja)
JP3064522B2 (ja) 信号処理方法及び圧縮データ記録再生装置
JPH07153188A (ja) 音声再生装置
JPH05234331A (ja) ミニディスクプレーヤ
JPH076512A (ja) 情報再生装置
JP3201865B2 (ja) 音声信号の音程変換方法
JP3134339B2 (ja) 圧縮データ記録再生装置
JPH08287610A (ja) オーディオデータの再生装置
JP3134368B2 (ja) 圧縮データ記録再生装置
JPH0636461A (ja) ディジタルオーディオ信号再生装置
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
JP2001117596A (ja) 音声信号再生方法および音声信号再生装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees