JP3784583B2 - 音声蓄積装置 - Google Patents
音声蓄積装置 Download PDFInfo
- Publication number
- JP3784583B2 JP3784583B2 JP22900599A JP22900599A JP3784583B2 JP 3784583 B2 JP3784583 B2 JP 3784583B2 JP 22900599 A JP22900599 A JP 22900599A JP 22900599 A JP22900599 A JP 22900599A JP 3784583 B2 JP3784583 B2 JP 3784583B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- frame
- importance
- packet
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007906 compression Methods 0.000 claims description 61
- 230000006835 compression Effects 0.000 claims description 59
- 238000000034 method Methods 0.000 claims description 24
- 230000005236 sound signal Effects 0.000 claims description 11
- 206010019133 Hangover Diseases 0.000 claims description 7
- 238000009825 accumulation Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 description 28
- 238000004458 analytical method Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 13
- 239000004065 semiconductor Substances 0.000 description 13
- 238000001514 detection method Methods 0.000 description 12
- 230000005284 excitation Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/64—Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
- H04M1/65—Recording arrangements for recording a message from the calling party
- H04M1/6505—Recording arrangements for recording a message from the calling party storing speech in digital form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Telephone Function (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、ディジタル符号化記録型の留守番電話装置や、その他のディジタル符号化音声記録装置に適用して好適な音声蓄積装置及び音声符号化装置に関するものである。
【0002】
【従来の技術】
従来より、固定加入者電話端末機あるいは携帯電話端末機に搭載される留守番電話装置が利用されている。留守番電話装置は、端末機の利用者が電話に応答できない際に、内蔵する記録媒体(磁気テープや半導体メモリ)に電話発信者の用件を音声で記録するものであり、ボイスメールとも呼ばれる。
【0003】
近年、ディジタル信号処理を低価格で実現することの可能な半導体LSIが利用可能となったことにより、話者の音声をCELP(符号励振線形予測符号化)などの高能率符号化アルゴリズムで圧縮し、記録媒体に格納する方式の留守番電話装置が提案されている。これにより、同一の記録容量の媒体を用いた場合に、通常のPCM(パルス符号変調)方式やADPCM(適応差分PCM)方式などに比べてより多くの音声を記録できるようになり、また、半導体メモリでは録音された複数の用件の中から、特定の用件を選んで再生することを高速に実現可能である。
【0004】
また、留守番電話装置が携帯電話端末機にも搭載されるようになっている。しかし、同端末機に対する利用者の小型化の要求などから、端末機に搭載することのできる半導体メモリの容量には強い制限がある。このため、通常のCELP方式などを用いた方法では要求される音声記録時間を実現することができなかった。
【0005】
このような理由から、留守番電話装置に音声区間検出器を組み合わせたものが実用化されている。この方法では、用件音声を符号化圧縮して媒体に記録する際に、話者の発声状態を監視している。これは、例えば音声ゲインをある閾値と比較することにより実現する。この比較結果を用いて、話者の発声と発声の合間の時間など比較的重要度の低い区間(非発声区間)においては音声の符号化および記録を中断し、非発声区間の継続時間の情報のみを媒体に記録する。結果として、符号化効率を見かけ上増加させることが可能となり、記憶媒体の利用効率が向上する。
【0006】
図2に従来から提案されている半導体メモリを記録媒体に用いたディジタル符号化記録型の留守番電話装置(以下、単に留守番電話と呼ぶ)の概略構成図を示す。A/D(アナログ/ディジタル)変換器3は通話相手からの音声をPCM信号に変換する。ディジタル信号処理装置4はPCM信号を符号化圧縮および復号伸長する。半導体メモリ6は符号化された音声を記録する。D/A(ディジタル/アナログ)変換器5はPCM信号の音声をアナログ信号に変換する。スピーカ7はアナログ音声を出力する。
【0007】
【発明が解決しようとする課題】
しかし、音声区間の識別には音声ゲインや音声のピッチ(周期成分)情報などを用いて実現する方法が提案されているが、音声の背景雑音に対する信号対雑音(S/N)比が劣化した際に、その音声検出能力が低下しやすい。具体的には、非発声区間に隣接する発声区間において語頭および語尾音声を非発声区間と誤認識し、音声が欠落しやすくなる。
【0008】
本発明は、音声区間の検出を実時間で正確に行うことが困難であることに注目し、記録媒体の残容量に余裕がある場合は、用件音声を明瞭に記録することを可能とし、また、残容量が小さくなった場合においても音声の欠落、特に語頭音声の欠落を大幅に改善することを可能とするものである。
【0009】
【課題を解決するための手段】
上記課題を解決するために、音声情報を蓄積する蓄積手段と、蓄積手段に接続され、音声をパケット化して蓄積手段に蓄積する音声記録手段と、蓄積手段に接続され、音声のフレームが発声区間であるか非発声区間であるかによってフレームの重要度を判定し、パケットのヘッダに重要度を搭載して蓄積手段に蓄積するフレーム重要度判定手段と、蓄積手段に接続され、再圧縮が必要な場合は、蓄積手段に蓄積されたフレーム重要度に従って第1の符号化方式で音声を符号化圧縮し、更に圧縮された音声の圧縮が必要な場合は第2の符号化方式を用いて重要度に従い符号化圧縮する音声圧縮手段とを有するようにした。
【0012】
【発明の実施の形態】
(1)第1の実施形態
以下、本発明による蓄積型信号符号化装置に適用した第1の実施形態を図面を参照しながら詳述する。
【0013】
(1−1)第1の実施形態の構成
図1は、ディジタル信号処理装置1及び音声記録空間2の概要を示す。
【0014】
音声記録空間2として、従来符号化圧縮した音声を記録するために利用していた半導体メモリをPCM符号を記録するために併用する。図3は、第1の実施形態を実現するための半導体メモリ内部の音声記録空間2の構成を示すものである。音声記録空間2には、複数のパケット201が蓄積される。各パケットは可変長のヘッダ210と可変長のペイロード220から構成され、ディジタル信号処理装置1内又は別個に設けられるパケット生成手段(図示せず)で生成される。
【0015】
音声は20ミリ秒単位の大きさ(フレームと呼ぶ)に分割され符号化される。各々のフレームは各パケットに格納される。ここで、各パケット(後述する空パケットおよび非発声パケットなど、音声を格納していないものを除く)が対応する音声の時間は常に20ミリ秒であるが、その物理的な符号の大きさ(バイト数)は可変である。各パケットはPCM符号で表された音声信号の符号であったり、またCELP方式で圧縮された符号であったりする。
【0016】
留守番電話装置は呼を着信する毎に、端末の利用者が呼に応答しなければ要件を音声記録空間2に記録する。音声記録空間2には、その容量が許す限り複数の要件を記録できる。以下、個々の要件を音声要件という。
【0017】
パケット201のヘッダ210は図4に示すように、複数の情報フィールドから構成される。この情報フィールドのうち1つは4ビットのIDフィールド211であり、パケットの型(タイプ)を示すものである。本実施形態では、図5に示すパケットの型を有する。
【0018】
空パケット(ID=0)は、音声記録空間2の未使用領域に対応する。後述するように音声信号の圧縮および再圧縮などにより生じるメモリの空き領域も、空パケットにより実現される。空パケットのヘッダには、パケットの大きさ(バイト長)を示す情報フィールドがあり、ペイロードの中身は、例えば、不定値データの集まりである。
【0019】
PCM符号パケット(ID=1)は、PCM符号化で表される音声信号を格納している。8KHz標本化の16ビット量子化PCMの場合、パケットのペイロードの大きさは320バイトとなる。
【0020】
8kbps(キロビット毎秒)CELP符号パケット(ID=2)は、符号化速度8キロビット毎秒のCELP方式で符号化された音声信号を格納している。パケットのペイロードの大きさは20バイトとなる。
【0021】
4kbps(キロビット毎秒)CELP符号パケット(ID=3)は、符号化速度4キロビット毎秒のCELP方式で符号化された音声信号を格納している。パケットのペイロードの大きさは10バイトとなる。
【0022】
非発声パケット(ID=4)は、非発声区間を表している。ペイロードには、非発声区間の時間(フレーム数)が格納されている。パケットのペイロードの大きさは1バイトである。257フレーム以上の非発声区間を表すには、複数の非発声パケットに分割する。
【0023】
終端パケット(ID=5)は、個々の音声要件の末尾を表すための指標である。ペイロードは0バイトである。
【0024】
各パケット(音声を格納していないものを除く。以下、音声パケットと呼ぶ)のヘッダに、さらにフレームの重要度を示す4ビットの重要度フィールド212を設ける。フレーム重要度は0から15で表される数値であり、数値が大きいほど当該パケットに含まれる音声情報がより重要であることを意味する。発声区間の音声は非発声区間の音声に比べて重要であり、また、一度も再生されておらず、端末機の利用者が内容を確認していない用件音声は、一度以上再生された用件音声に比べて重要である。なお、これら重要度の基準は、留守番電話装置が使用される用途など、様々な因子によって別途決定することができる。
【0025】
なお、フレーム重要度0は例外的な意味を持ち、当該パケットの音声フレームの重要度が、未判定であることを示す。
【0026】
ディジタル信号処理装置1は、実時間記録ブロック11、非発声区間検出ブロック12、及び音声圧縮ブロック13から構成される。各ブロックは並列に動作し、動作上の優先順位は、実時間記録ブロック11が最も高く、次に非発声区間検出ブロック12、最後に音声圧縮ブロック13の順となっている。なお、処理ブロックはハードウェア回路又はソフトウェアプログラムのどちらでも実現可能である。
【0027】
実時間記録ブロック11は、用件音声を音声記録空間2に保存する。本実施形態では、音声をPCM符号パケットとして音声記憶空間2に格納していく。このとき、フレーム重要度は0(未判定)としておく。
【0028】
非発声区間検出ブロック12は、ある音声フレームが発声区間であるか非発声区間であるかに応じてフレーム重要度を判定し、記録していく。本実施形態では、重要度は1以上かつ15以下の値の選択肢の中から選ばれる。選択方法としては、例えば、入力パワーを所定の閾値と比較することにより選択する。そして、最も発声区間らしい音声フレームには15の値が設定され、最も非発声区間らしい音声フレームには1の値が設定される。
【0029】
次に、図6を用いて非発声区間検出ブロック12を説明する。ピッチ検出器121は、音声パケット内のフレームの音声信号を用いて、音声に含まれるピッチ成分の周波数(周期)と、ピッチ予測ゲインを求める。パワ演算器122は、音声フレームのパワを求める。フレームS/N比演算器123は、音声フレームパワと背景雑音レベルの推定値を比較しフレーム毎のS/N比を求める。背景雑音レベル推定器124は、求めた音声パワを用いて背景雑音の最低ゲインレベルを追跡する。音声判定器125は、ピッチ周波数およびピッチ予測ゲイン、フレームS/N比を用いて当該フレームの音声らしらを判定する。フレーム重要度設定器126は、音声判定器125の出力を用いて、音声フレームのパケットのフレーム重要度情報を設定する。低速変化S/N比推定器127は、フレームS/N比演算器123の出力をローパスフィルタ処理することで、その低速変化成分を出力する。先読み分析フレーム数演算器128は、低速変化S/N比から後述する先読みフレーム数を求める。前方後方ハングオーバー回路129は、前述の先読み分析フレーム数分だけ遅れて動作し、その過去の音声フレームのフレーム重要度が一定の閾値以上である場合に、その時間前後のフレームのフレーム重要度を増加させる。
【0030】
次に、図8を用いて音声圧縮ブロック13を説明する。音声記録空間残量監視器1301は、音声記録空間2の残量を常時監視する。音声符号化器1302はPCM符号の音声信号をCELP方式で圧縮する。圧縮参照表1303は、所望の圧縮度合いとフレームの重要度に応じて符号化IDを決定する。圧縮度合レジスタ1304は、現在の所望の圧縮度合いを保持する。音声記録空間2を収める半導体メモリと同様に、このレジスタは電池などで記憶が保持される不揮発半導体メモリなどで構成される。
【0031】
図9はフレーム重要度設定のための構成の一例を示す。再生指示回路1210は、留守番電話装置に保持されている用件音声の再生を指示する。用件音声指標テーブル1211は、各用件音声毎に当該用件音声が一度以上再生されたか否かを記録する。音声要件が一度以上再生されていれば、当該音声要件の全体のフレーム重要度を引き上げることとする。
【0032】
(1−2)第1の実施形態の動作
以下、第1の実施形態の蓄積型信号符号化装置の動作を説明する。
【0033】
実時間記録ブロック11は、音声をPCM符号パケットとして音声記憶空間2に格納していく。このとき、フレーム重要度は0(未判定)としておく。
【0034】
非発声区間検出ブロック12は、実時間記録ブロック11が処理しているフレームよりも、ある可変時間だけ遅れて動作する。これは、発声区間と非発生区間を高精度で識別するためには、実時間処理が困難であるためであり、遅延時間については、音声の背景雑音に対するS/N比に応じて決定される。例えば、音声の背景雑音に対するS/N比が十分高い場合は、20フレームだけ遅れて動作する。つまり、実時間記録ブロック11がn番目のフレームをパケット化しているとき、非発声区間検出ブロック12はn−20番目のフレームを処理する。また、音声の背景雑音に対するS/N比が低い場合は、判定が難しくなることから、さらに多くのフレーム分遅れて動作する。例えば、S/N比が5dBのときは50フレーム遅れて動作する。一般に、S/N比が低いほど、発声区間と非発声区間の識別は困難である。特に、非発声区間直後の発声区間(すなわち語頭)では、多くの音声フレームを先読みして分析することにより、その語頭を正しく発声区間と識別できる。このため、非発声区間検出ブロック12は、S/N比が低いほど大きく遅れて非発声区間を検出するようにしている。
【0035】
次に、図6の非発声区間検出ブロック12の構成例を基に動作を説明する。ピッチ検出器121では、音声記録空間2中の音声パケットから取り出した入力音声の離散値信号を線形予測し、その残差信号を処理することで、ピッチ周波数およびピッチ予測ゲインを求め、音声判定器125に出力する。これらのパラメータは、入力音声が人間の音声らしいかどうかを表すものである。パワ演算器122では、音声記録空間2中の音声パケットから取り出した入力音声の離散値信号の標本毎の自乗和を積算することで、音声フレーム単位のパワ値を求め、フレームS/N比演算器123及び背景雑音レベル推定器124に出力する。フレームS/N比演算器123では、パワ演算器122の出力と背景雑音レベル推定器124の出力の差を求めることで、音声フレーム毎のS/N比を求め、音声判定器125及び低速変化S/N比推定器127に出力する。背景雑音レベル推定器124では、パワ演算器122の出力から入力音声の最低パワレベル値を時間軸上で追跡することで、音声に重畳している背景雑音のレベルを推定し、その結果をフレームS/N比演算器123に出力する。音声判定器125では、ピッチ検出器121から出力されるピッチ周波数及びピッチ予測ゲイン、フレームS/N比演算器123から出力されるフレームS/N比の情報を用いて、当該フレームの信号の音声らしさを決定し、フレーム重要度設定器126に出力する。この値は発声区間では高くなり、非発声区間では小さな値となる。一般に、フレームS/N比が高いとき、それは発声区間と考えられる。しかしフレームS/N比が高くとも、ピッチ周波数が一定区間(人間の発声周波数の範囲内)から外れていたり、ピッチ予測ゲインが低いときは、人間の発声らしくない音響信号であると考えられる。これらの情報を総合評価し、音声らしらの情報を出力する。フレーム重要度設定器126では、音声判定器125の出力を1から15の値に正規化することで、フレーム重要度パラメータを決定する。この値は音声記録空間2の音声パケットのヘッダ中にあるフレーム重要度情報フィールドに格納される。低速変化S/N比推定器127では、フレームS/N比演算器123の出力をローパスフィルタによって平滑化することで、低速度に変化するS/N比推定情報を先読み分析フレーム数演算器128に出力する。先読み分析フレーム数演算器128では、低速変化S/N比推定器127から出力される低速変化S/N比推定情報に基づいて、前方後方ハングオーバー回路129が先読み分析するフレーム数を決定する。推定S/N比が高い場合(例えば40dB以上の場合)、分析フレーム数を20フレームとする。逆にS/N比が低い場合(5dB程度)分析フレームを50フレームと長くする。このように、推定S/N比に逆比例して先読み分析フレーム数を決定する。前方後方ハングオーバー回路129では、上述のフレーム重要度設定器126がフレーム重要度情報を設定したフレームに対して、あるフレーム数だけ遅れて動作する。このフレーム数は、先読み分析フレーム数演算器128で求めた数である。前方後方ハングオーバー回路129は、注目している音声フレームのフレーム重要度が一定以上(ここでは12以上とする)であるとき、前後双方向に対して先読みフレーム数分だけ、フレーム重要度を調整する。具体的にはフレーム重要度に4を加算する。ただし、11を超えない値とする。(11とは、上記値12から1を減じた値である。)これにより、音声の背景雑音に対するS/N比が小さいとき、発声区間の前後(語頭および語尾)のフレーム重要度が小さくなることで、発声区間が非発声区間として誤判定されることを防止することができる。言い換えれば、同語頭あるいは語尾部分の欠落を防止する働きを持たせることができる。図7に、本動作をグラフで示す。グラフは、横軸が時間(パケット)であり、縦軸が当該パケットの音声のフレーム重要度である。ハッチ部分は、前方後方ハングオーバー回路によってフレーム重要度が増加されたことを示している。これにより、語頭において適切にフレーム重要度が修正されている様子が分かる。
【0036】
半導体メモリ中の音声記録空間2の残容量が十分に大きい場合(例えば、これを残容量の閾値と比べることで判定する)は、これ以上の処理は行わない。つまり、記録空間に十分に余裕がある場合は、用件音声は全てPCM符号で記録されることになり、用件音声の再生時には、十分な音質が保持されている。
【0037】
記憶空間の残容量が小さくなった場合は、音声圧縮ブロック13が動作を開始する。同ブロックは音声記録空間2中の音声パケットを走査し、フレーム重要度設定器126が設定したフレーム重要度に応じて音声を符号化圧縮する。同ブロックは図11に一例を示す参照表をひくことで、圧縮度合いとフレーム重要度の組み合わせから、符号化IDを決定する。例えば、最初(全パケットがPCM符号パケットである場合)は、フレーム重要度に関わらず全ての音声フレームを8kbps CELP(ID=2)で圧縮していく。これでも記憶空間の残容量が切迫してきた場合、フレーム重要度が小さいものから4kbps CELP(ID=3)で再圧縮する。さらに記憶容量が切迫したときには、フレーム重要度が4以上のものは全て4kbps CELP(ID=3)で符号化圧縮され、それ以外は非発声パケット(ID=4)に変換される。最終的に、記憶空間が完全に一杯になったときは、用件録音の一部が削除されるまで新たな用件音声の録音ができなくなる。
【0038】
以下、図8の音声圧縮ブロック13の動作を図12のフローチャートを用いて説明する。音声記録空間2の残量に余裕がある場合、音声圧縮ブロック13は動作しいない。しかし音声記録空間2残量監視器1301が、音声記録空間2の残量が一定の閾値(例えば20%)よりも小さくなったことを検出したとき、音声圧縮ブロック13は動作を開始する。音声符号化器1302は、圧縮度合レジスタ1304の値を読み出す(ステップS1)。音声符号化器1302は、音声記録空間2中の音声フレームを収めたパケットを先頭より読み出していく(ステップS2)。そして、その音声フレームのフレーム重要度と上述の圧縮度合レジスタ1304を用いて圧縮参照表1303を検索し、当該フレームをいずれの符号化方式のパケット型に変換すべきかを決定する(ステップS3)。圧縮参照表1303の内容については後述する。音声符号化器1302は、圧縮参照表1303で求めたパケット型が、現在のパケット型と異なるとき、当該パケットの音声信号を新たなパケット型の符号化方式で圧縮する。例えば、元のパケット型がPCM符号であり、新たなパケット型が8kbps CELPである場合、パケットのペイロードから取り出したPCM符号を8kbpsの符号化レートのCELPアルゴリズムで符号化圧縮する。そして、圧縮後の符号を再度パケットとして構築し、当該パケットのヘッダについてを再設定すると共に音声記録空間2に保管する(ステップS4)。ここで、符号化圧縮により新パケットは元パケットに比べて小さな記憶空間しか必要としないため、パケットの後半部分が空き空間となる。このままでは小さく分割された空パケットが散在してしまうため、図10に示す音声記録空間2を読み書きするための2つの指標(読み出し指標230および書き込み指標231)を設ける。圧縮前の元のパケットは読み出し指標231を用いて読み出す。圧縮後の新パケットは、書き込み指標230を用いて書き込む。新パケットが元パケットよりも大きくなることはないため、書き込み指標230が読み出し指標231よりも後(図における「右」)にくることはない。各指標としては、例えば、ポインタあるいはカウンタ(計数器)を使用する。なお、空き空間を空パケットとして設定するには、空パケットとしてのID=0をIDフィールドに、さらに同パケットの大きさをパケット長フィールドにそれぞれ書き込む。以上の処理により、原則として空パケットは音声記録空間2の後半にまとめられる。例外としては、音声圧縮ブロック13が動作中に新たな用件音声の記録をする必要が生じた場合などに、止むを得ず音声圧縮ブロック13の動作を中断する場合がある。この場合、音声記憶空間2の途中に空パケットが存在することになる。このような空パケットは、例えば、ディジタル信号処理装置1に空パケット収集ブロックを追加し、そのブロックの働きによって収集する。この動作例としては、計算機工学で用いられる一般的な技法である「ごみ集め」(garbage collection)があげられる。なお、音声記憶空間2を順読み出しする場合は、空パケットを検出したとき、そのヘッダを参照することで空パケットの大きさを調べ、その大きさだけ音声記憶空間2を読み飛ばすことも可能である。ただし、小さな空パケットが分散していると、後で再び音声要件を記録する際に都合が悪いため、可能な限り空パケット収集ブロックを動作させておくことが望ましい。以上の処理を、音声記録空間2中の全音声パケットに対して繰り返す(ステップS5、S6)。しかし、最後まで処理を終了しても、音声記録空間2の残量が残量閾値よりも大きくならなかった場合、以下の処理を実行する。まず、圧縮度合いレジスタ1304から読み出した値を1だけ増加させる(ステップS9)。そして、上述の音声パケット圧縮処理を、音声記録空間2の先頭からやり直す。最後に、音声記録空間2の残量が残量閾値よりも大きくなったとき、そのときの圧縮度合いの値をレジスタ1304に格納し、音声圧縮ブロック13を終了する(ステップS7、S8)。
【0039】
圧縮参照表1303の例を、図11に示す。なお、用件音声の記録動作中(すなわち、実時間記録ブロック11の動作中)に音声記録空間2の残量が閾値よりも小さくなったとき、実時間記録ブロック11の動作に並行して音声圧縮ブロック13を動作させることができる。このとき、実時間記録ブロック11を最優先で動作させるが、音声圧縮ブロック13は、ディジタル信号処理装置1の能力の範囲内で音声を圧縮し、音声記録空間2の残量を拡大する。この結果、音声圧縮ブロック13のパケット指標が実時間記録ブロック11のパケット指標に追いついた場合は、音声圧縮ブロック13は実時間記録ブロック11に信号を伝達し、実時間記録ブロック11のパケット指標を空パケットの先頭位置まで復元させる。これにより、実時間記録ブロック11は音声記録空間2の残り空間を拡大することができる。
【0040】
次に、図9のフレーム重要度の設定動作を説明する。留守番電話装置の利用者が、再生指示回路1210を介して、録音された用件音声の中から任意の用件の再生を指示すると、ディジタル信号処理装置1は半導体メモリ中の音声記録空間2の中から、指示された用件音声の先頭パケットから順にパケットを取り出し、そのヘッダの符号化IDモードに従って音声を復号し、再生する。その際、用件音声を完全に再生し終わると、ディジタル信号処理装置1は、用件音声に属する全パケットのヘッダを走査し、フレーム重要度情報を一定値(ここでは4)だけ減少させる。その後、同一の用件音声を複数回再生しても繰り返しフレーム重要度を減少させることのないよう、用件音声指標テーブル1211の中の用件指標の再生済みを示すフィールドに印をつけておく。一度フィールドに印が付けられた用件音声を繰り返し再生しても、フレーム重要度情報を再度減少させることをしない。ここではフレーム重要度の変更しか行わないが、後に音声記録空間2の残量が減少することで音声圧縮ブロック13が動作を開始すると、そのとき初めて、一度以上再生された用件音声について再圧縮が実施され、音声記録空間2の残量が拡大される。
【0041】
(1−3)第1の実施形態の効果
以上説明した第1の実施形態によれば、利用可能な符号化方式の数以上に細分化したフレーム重要度を設けると共に、非発声区間検出ブロック12と音声圧縮ブロック13を分離させ、必要なときだけ音声圧縮ブロック13を動作させることで、同一のフレーム重要度を持つパケットであっても、半導体メモリ中の音声記録空間2に余裕がある間は、もっとも最近に記録された用件音声についてはPCM符号のまま音声を記録しておくことが可能となり、記録された用件音声の音質を可能な限り高く保持することができる。
【0042】
また、録音された用件音声が増加してきた場合、その用件音声の総計録音時間に応じて最低限必要なだけ、音声を高能率の符号化方式(CELPなど)で圧縮することができる。音声圧縮処理は非通話時に行うため、通話中のディジタル信号処理装置1に大きな負荷をかけることなく、音声を圧縮することができる。圧縮参照表を用いることにより、再圧縮が必要となるパケット数を少なく押さえることが出来、よりディジタル信号処理装置1の負荷を軽減することも可能である。非発声区間の判定に際しては、十分な時間の音声を読み出して分析するため、判定の精度が向上し、非発声区間直後の、音声語頭の記録欠落を防止することができる。
【0043】
さらに、一度再生された用件音声に属するフレーム重要度を減少させることで、既に内容を確認済みの用件音声が消費する音声記録空間2を削減することが可能になる。一方、必要以上にフレーム重要度を減少させると、フレームが非発声パケットとして扱われるため、最終的に音声として復号不可能となることから、用件音声指標テーブル中の再生済みを示すフィールドに印をつけることで、同一の用件音声を繰り返し再生しても、必要以上にフレーム重要度を減少させることを防止できる。また、フレーム重要度情報の変更と実際の音声圧縮ブロック13を分離させることで、フレーム重要度に差のあるパケットが併存しても、半導体メモリ中の音声記録空間2に余裕がある間は、必要以上に音声の符号化圧縮を行わないことにより、記録された用件音声の音質を保持することが可能になる。
【0044】
(2)第2の実施形態
次に、本発明による蓄積型信号符号化装置に適用した第2の実施形態を図面を参照しながら詳述する。第2の実施形態は、第1の実施形態の音声圧縮ブロック13を改良したものであり、音声圧縮ブロック13を中心に説明する。
【0045】
(2−1)第2の実施形態の構成
図13は、第2の実施形態を実現するための音声圧縮ブロック13の構成を示すものである。音声復号器1305は、既に符号化圧縮されている音声パケットを復号伸長する。線形予測分析器1307は、音声のフォルマント特性を分析する。スイッチ1306は音声パケットの内容に応じて、線形予測分析器1307に与える信号を切り替える。 LSP変換器1308は、線形予測パラメータ(LPCパラメータ)を線スペクトル対パラメータ(LSPパラメータ)に変換する。 LSP量子化表生成器1309は、LSPパラメータ群の時間軸上の変化を走査分析し、LSPを離散符号に量子化するための量子化表を生成する。ピッチ分析器1310は、線形予測分析後の残差信号から、ピッチ成分の周波数およびピッチ予測ゲインを分析する。ピッチ分析パラメータ量子化表生成器1311は、ピッチ分析器で求めたパラメータ群の時間軸上の変化を走査分析し、ピッチ分析パラメータ群を離散符号に量子化するための量子化表を生成する。
【0046】
ここで、線形予測分析器1307、 LSP変換器1308、及びピッチ分析器1310は、実施形態1で説明した音声圧縮ブロック13における音声符号化アルゴリズムでも用いられるものであり、兼用することが可能である。
【0047】
また、記録空間2中のパケットのヘッダに収められるIDフィールドのID番号として、新規にID=6を量子化表パケットとして追加する。
【0048】
(2−2)第2の実施形態の動作
第2の実施形態の音声圧縮ブロック13は、用件音声の一件単位に、音声の符号化圧縮アルゴリズムで使用する量子化表の群を、個別に生成する。CELPに代表される音声符号化方式では、音声の分析結果から得られる情報を量子化表を用いて離散符号に置き換えるが、この量子化表は汎用に設計されており、通常、あらゆる話者の音声の性質や言語の性質に対応できるようになっている。しかし、留守番電話の一用件音声に限ってみると、その短時間の特定話者かつ特定言語、特定性別の音声の性質においては、そのLSPパラメータやピッチ分析パラメータの分散量は制限されている。このため、一用件音声だけに特化された量子化表群を生成し使用することにより、汎用の量子化表を用いる場合に比べて、少ない符号情報量でも同等の音質で符号化できる。なお、量子化表の生成には多くの演算処理量を必要とするが、本特許の留守番電話装置の音声圧縮ブロック13は、用件音声の録音時に実時間で動作する必要がないため、問題にはならない。
【0049】
音声圧縮ブロック13では、ディジタル信号処理装置1は音声記録空間2上の音声を符号化圧縮する際に、一用件音声単位で量子化表群を生成する。ディジタル信号処理装置1は音声記録空間2から音声パケットを読み込むが、その内容が既に8kbps CELP方式で符号化されている場合、音声復号器1305により音声パケットを復号し、PCM符号の音声信号に変換する。スイッチ1306は、音声記録空間2から読み出した音声パケットがPCM符号パケットである場合に、そのPCM符号をそのまま線形予測分析器1307に送出する。線形予測分析器1307とLSP変換器1308は、音声記録空間2中に収められた用件音声に属するパケットを順次読み出し、LSPパラメータを出力する。LSP量子化表生成器1309は、LSPパラメータを順次取り込みながら、細かな区間を有するヒストグラム上に、その値の出現頻度を記録していく。同様に、ピッチ分析器1310とピッチ分析パラメータ量子化表生成器1311は、ピッチパラメータ群の出現頻度を記録していく。ディジタル信号処理装置1は一用件音声を走査分析し終わると、LSPパラメータ量子化表およびピッチ分析パラメータ量子化表を生成する。その後、ディジタル信号処理装置1は、生成した量子化表を用いて音声の符号化圧縮を開始する。その際、音声パケットを音声記録空間2に記録する前に、生成した量子化表をパケットに格納して、音声記録空間2に記録する。この際、パケットのヘッダのIDフィールドには、量子化表が収められていることを示すID=6が設定される。
【0050】
次に、用件音声を再生する場合を説明する。ディジタル信号処理装置1は音声記録空間2からパケットを取り出した際、それが量子化表のパケットならば、圧縮された音声符号を復号する際に用いる量子化表を取り出した量子化表で置き換える。その後、順次パケットを取り出しながら音声を復号、再生していく。
【0051】
(2−3)第2の実施形態の効果
以上説明した第2の実施形態によれば、音声の符号化圧縮アルゴリズムで用いる量子化表群を、特定の用件音声専用に作成することができ、用件音声を発声した特定話者、特定言語、特定性別に最適化した量子化表群が得られ、汎用の量子化表群を用いる場合に比べて、同一の情報符号化速度であるならば、より音質の高い符号化が可能になる。
【0052】
また、量子化表の生成には多くの演算処理が必要であるが、本実施形態の音声圧縮ブロック13では、量子化表を用件音声の記録時に実時間で生成する必要がないため、低い能力の信号処理プロセッサを用いても実現することが可能である。
【0053】
(3)第3の実施形態
次に、本発明による蓄積型信号符号化装置に適用した第3の実施形態を図面を参照しながら詳述する。第3の実施形態は、第1の実施形態における8kbps CELP符号化と4kbps CELP符号化を、階層化符号化の構成としたものである。
【0054】
(3−1)第3の実施形態の構成
以下、第3の実施形態の蓄積型信号符号化装置の構成を説明する。
【0055】
図14は、第3の実施形態を実現するための階層化符号化の構成を示すものである。線形予測分析器1001及びLSP変換器1002は、既に説明した線形予測分析器1307及びLSP変換器1308と同等のものである。 LSP量子化器1003は、LSP変換器によって得られるLSPパラメータを量子化する。 LSP多段量子化器1004は、LSP量子化器1003の量子化誤差をさらに精密に量子化する。ピッチ分析符号化器1005は、線形予測残差におけるピッチ成分を求め、ピッチ合成フィルタを構成する。励振源符号化器1006は、ピッチ成分を取り除いた残差信号を用いて励振信号を生成符号化する。ここで、励振源符号化器1006は励振源を多段のコードブック構成で表すことで、復号音質に大きく影響する符号と、復号音声を若干改善するための符号の2種類を出力する。必須符号出力器1007は、LSP量子化器1003の出力、ピッチ分析符号化器1005の出力、又は励振源符号化器1006の出力から復号音質に大きく影響する符号をパックする。必須符号出力器1007の出力は4kbpsである。音質改善符号出力器1008は、LSP多段量子化器1004の出力又は励振源符号化器1006の出力から復号音質を改善する符号をパックする。音質改善符号出力器1008の出力は4kbpsである。
【0056】
(3−2)第3の実施形態の動作
線形予測分析器1001は、音声パケットから取り出した音声(離散値サンプル群)を線形予測分析することで線形予測パラメータを出力する。LSP変換器1002は、線形予測分析器1001から出力された線形予測パラメータを線スペクトル対(LSP)パラメータに変換する。LSP量子化器1003とLSP多段量子化器1004は、共にLSP変換器1002から出力されたLSPパラメータを離散符号に量子化するものであるが、 LSP量子化器1003はLSPパラメータを粗く量子化し、 LSP多段量子化器1004はLSP量子化器1003では表現し切れない微細な誤差成分を精密に量子化する。ピッチ分析量子化器1005は、音声パケットから取り出した音声及びLSP量子化器1003から出力された量子化値より線形予測残差を算出してピッチ成分を求め、ピッチ成分を取り除いた残差成分を出力する。励振源符号化器1006は、ピッチ分析量子化器1005から出力されたピッチ成分が取り除かれた残差成分をコードブック探索により符号化する。このとき、複数の励振パルスに、音質に寄与する度合いに応じて優先順位を設ける。優先度の高い励振パルスに対応するコードブックの指標と、優先度の低い励振パルスに対応するコードブックの指標を別々に出力する。必須符号出力器1007は、LSP量子化器1003の出力、ピッチ分析符号化器1005の出力、又は励振源符号化器1006の出力から復号音質に大きく影響する符号をパックして、4kbpsの符号として出力する。音質改善符号出力器1008は、LSP多段量子化器1004の出力又は励振源符号化器1006の出力から復号音質を改善する符号をパックして、4kbpsの符号として出力する。
【0057】
以上により、音声を復号する上で不可欠の符号(必須符号)と、復号には不可欠ではないものの復号音声の音質を向上させることのできる符号(音質改善符号)の2種類を出力する。前者の符号は符号化速度4kbpsであり、前者と後者の符号を合わせた符号化速度は8kbpsとなる。
【0058】
さらに、本実施形態により、実施形態1の音声圧縮ブロック13を改良することができる。音声圧縮ブロック13は、音声フレームを8kbps CELPで圧縮する必要がある際に、本実施形態の必須符号と音質改善符号を併せてパケットに格納する。パケットのヘッダIDは8kbps CELP(ID=2)である。後に音声圧縮ブロック13が、8kbps CELPで圧縮された音声フレームを4kbps CELPで再圧縮する必要が生じた際は、8kbps CELP方式による音声の復号と4kbpsCELP方式の音声の符号化を行う代わりに、パケットの中から音質改善符号の4kbps符号のみを削除し、パケットのヘッダIDをID=2からID=3に変更するだけで良い。
【0059】
(3−3)第3の実施形態の効果
以上説明した第3の実施形態によれば、8kbps CELPの符号が納められたパケットを4kbps CELPに再圧縮する必要がある場合、復号および再符号化の代わりにパケットの一部を削除するだけで済むため、信号処理プロセッサの処理量を大幅に削減することが可能になる。
【0060】
また、復号および再符号化の処理は、一度量子化された分析結果を用いて復元された音声を再分析し、さらに再量子化をしなくてはならないため、最初から4kbps CELP方式で符号化圧縮する場合に比べて、音質の劣化を伴う。それに対し、必須符号と音質改善符号による階層化符号化を用いた場合は、再分析や再量子化の必要がないため、音質の劣化を最小限に抑えることが可能となる。
【0061】
(4)他の実施形態
上記各実施形態の説明においても、種々の変形実施形態について言及したが、以下に例示するような変形実施形態を挙げることができる。
【0062】
上記各実施形態においては、パケット201は可変長としたが、固定長のパケットを用いることも可能である。ペイロード長が音声フレームのデータ長以下の場合は、複数のパケットにまたがり音声記録空間2に蓄積され、音声フレームのデータ長がペイロード長以下の場合は、1パケットに複数の音声フレームのデータが格納されて音声記録空間2に蓄積される。
【0063】
音声記録空間については、パケットの種別や重要度等に応じて複数設けることも可能である。
【0064】
音声要件の末尾を表すには、終端パケットを用いる他に、終端を示すフラグ等を符号化データが格納されている各パケットに付与しても良い。あるいは、各音声要件の開始パケットと終端パケットを管理する表を別途用意しても良い。
【0065】
上記各実施形態では、直線的な記録空間を利用していたが、電子計算機で用いられる場合はファイルシステムの構成としても良い。これにより、記録空間の空領域の管理が容易となり、「ごみ集め」が不要となる。また、音声圧縮ブロックが生成した空領域を速やかに実時間記録ブロックが再利用できるようになり、空領域の有効利用が容易となる。
【0066】
【発明の効果】
以上のように、本発明によれば、蓄積手段に蓄積された音声信号のうち再度符号化圧縮が必要なものについては圧縮の度合いと音声信号の重要度に応じて圧縮するようにしたので、蓄積手段の容量に応じて再生音質と蓄積容量の最適化を図ることができる。
【図面の簡単な説明】
【図1】第1の実施形態の全体構成を示すブロック図である。
【図2】従来の留守番電話装置の構成を示す図である。
【図3】第1の実施形態の音声記録区間の構成を示す図である。
【図4】第1の実施形態のパケットのヘッダの構成を示す図である。
【図5】第1の実施形態のパケットの型を示す表である。
【図6】第1の実施形態の非発声区間検出ブロックの構成を示す図である。
【図7】第1の実施形態の前方後方ハングオーバー回路の動作を示す図である。
【図8】第1の実施形態の音声圧縮ブロックの構成を示す図である。
【図9】第1の実施形態のフレーム重要度を設定するための構成を示す図である。
【図10】第1の実施形態の音声記録空間に書き込み及び指標読み出し指標を設けた場合の動作を示す図である。
【図11】第1の実施形態の圧縮参照表を示す図である。
【図12】第1の実施形態のフローチャートである。
【図13】第2の実施形態の音声圧縮ブロックの構成を示す図である。
【図14】第3の実施形態の階層符号化の構成を示す図である。
【符号の説明】
1…ディジタル信号処理装置、11…実時間記録ブロック、12…非発声区間検出ブロック、13…音声圧縮ブロック2…音声記録空間、3…A/D変換器、5…D/A変換器、7…スピーカ。
Claims (7)
- 音声情報を蓄積する蓄積手段と、
前記蓄積手段に接続され、音声をパケット化して前記蓄積手段に蓄積する音声記録手段と、
前記蓄積手段に接続され、前記音声のフレームが発声区間であるか非発声区間であるかによって前記フレームの重要度を判定し、前記パケットのヘッダに前記重要度を搭載して前記蓄積手段に蓄積するフレーム重要度判定手段と、
前記蓄積手段に接続され、再圧縮が必要な場合は、前記蓄積手段に蓄積された前記フレーム重要度に従って第1の符号化方式で前記音声を符号化圧縮し、更に前記圧縮された音声の圧縮が必要な場合は第2の符号化方式を用いて前記重要度に従い符号化圧縮する音声圧縮手段とを有することを特徴とする音声蓄積装置。 - 前記フレーム重要度判定手段は更に、過去の音声フレームのフレーム重要度が一定の閾値以上である場合はその時間前後のフレームの重要度を増加させるハングオーバー回路を有することを特徴とする請求項1記載の音声蓄積装置。
- 前記音声圧縮手段は前記第2の符号化方式を用いて前記重要度に従い符号化圧縮した後、更に前記音声の圧縮が必要な場合は、前記蓄積音声の一部または全部を非発音パケットととすることを特徴とする請求項1記載の音声蓄積装置。
- 前記蓄積手段の未使用領域を空きパケットととすることを特徴とする請求項1記載の音声蓄積装置。
- 前記音声が前記蓄積手段より一度以上読み出されたか否かを記録する記録手段を更に有し、
一度読み出された前記音声は前記重要度を減少させることを特徴とする請求項1記載の音声蓄積装置。 - 一度読み出された前記音声信号が再度読み出された場合は、前記重要度を変更しないことを特徴とする請求項6記載の音声蓄積装置。
- 音声信号の前記重要度が変更された場合、前記蓄積手段の蓄積容量に応じて前記重要度を変更するか否かを判断することを特徴とする請求項6記載の音声蓄積装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22900599A JP3784583B2 (ja) | 1999-08-13 | 1999-08-13 | 音声蓄積装置 |
US09/547,866 US7164755B1 (en) | 1999-08-13 | 2000-04-12 | Voice storage device and voice coding device |
US10/618,596 US20040013245A1 (en) | 1999-08-13 | 2003-07-15 | Voice storage device and voice coding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22900599A JP3784583B2 (ja) | 1999-08-13 | 1999-08-13 | 音声蓄積装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005147988A Division JP2005316499A (ja) | 2005-05-20 | 2005-05-20 | 音声符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001053869A JP2001053869A (ja) | 2001-02-23 |
JP3784583B2 true JP3784583B2 (ja) | 2006-06-14 |
Family
ID=16885276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP22900599A Expired - Fee Related JP3784583B2 (ja) | 1999-08-13 | 1999-08-13 | 音声蓄積装置 |
Country Status (2)
Country | Link |
---|---|
US (2) | US7164755B1 (ja) |
JP (1) | JP3784583B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100417125B1 (ko) * | 2002-08-07 | 2004-02-05 | 주식회사 팬택앤큐리텔 | 무선통신 단말의 비화통신모드 자동 진입 방법 |
WO2004095424A1 (ja) * | 2003-04-22 | 2004-11-04 | Nec Corporation | 符号変換方法及び装置とプログラム並びに記録媒体 |
WO2006030865A1 (ja) | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 |
WO2007105586A1 (ja) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | 符号化装置および符号化方法 |
US9112632B2 (en) * | 2008-01-25 | 2015-08-18 | Cisco Technology, Inc. | Supporting efficient and accurate sync/followup timestamps |
US8411829B2 (en) * | 2008-12-16 | 2013-04-02 | James D. Logan | System, method and device for managing messages |
KR101581950B1 (ko) * | 2009-01-12 | 2015-12-31 | 삼성전자주식회사 | 이동 단말에서 수화 음성 신호 처리 장치 및 방법 |
CN102016530B (zh) * | 2009-02-13 | 2012-11-14 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
US8625635B2 (en) * | 2010-04-26 | 2014-01-07 | Cleversafe, Inc. | Dispersed storage network frame protocol header |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
US9826096B1 (en) | 2015-12-01 | 2017-11-21 | 8X8, Inc. | Visual interfaces for telephone calls |
KR20180127695A (ko) * | 2017-05-22 | 2018-11-30 | 삼성전자주식회사 | 저장 공간 확보를 위한 장치 및 그에 관한 방법 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE453449B (sv) * | 1982-07-06 | 1988-02-01 | Ericsson Telefon Ab L M | Anleggning for tradlos overforing av telefonsamtal |
DE3805946A1 (de) * | 1988-02-25 | 1989-09-07 | Fraunhofer Ges Forschung | Vorrichtung zur ermittlung von charakteristischen parametern aus den eingangs- und ausgangssignalen eines systems fuer die audiosignalverarbeitung |
JPH02305053A (ja) | 1989-05-18 | 1990-12-18 | Matsushita Electric Ind Co Ltd | 音声蓄積装置 |
US5191431A (en) * | 1989-08-29 | 1993-03-02 | Canon Kabushiki Kaisha | Recording apparatus having plural operating modes involving diverse signal compression rates and different apportioning of pilot signal recording area |
JPH0491558A (ja) | 1990-08-06 | 1992-03-25 | Sony Corp | 画像記憶装置 |
JPH0614049A (ja) * | 1992-03-19 | 1994-01-21 | Fujitsu Ltd | Atmにおけるセル廃棄制御装置及びその方法 |
JPH0669950A (ja) | 1992-08-17 | 1994-03-11 | Fujitsu Ltd | 音声符号化伝送装置 |
JPH0715519A (ja) | 1993-06-21 | 1995-01-17 | Matsushita Electric Ind Co Ltd | 音声蓄積装置 |
JPH0773080A (ja) | 1993-09-02 | 1995-03-17 | Fuji Xerox Co Ltd | マルチメディア文書記憶管理装置 |
US5506872A (en) * | 1994-04-26 | 1996-04-09 | At&T Corp. | Dynamic compression-rate selection arrangement |
JP3217590B2 (ja) | 1994-06-07 | 2001-10-09 | シャープ株式会社 | メッセージの再生装置 |
MX9700385A (es) | 1994-07-14 | 1998-05-31 | Johnson Grace Company | Metodo y aparato para comprimir imagenes. |
JPH08221100A (ja) | 1995-02-16 | 1996-08-30 | Sanyo Electric Co Ltd | 半導体メモリを使用した録音再生装置の録音方法 |
JPH08279845A (ja) * | 1995-04-06 | 1996-10-22 | Sony Corp | 留守番電話機 |
JP3595073B2 (ja) | 1995-08-28 | 2004-12-02 | 株式会社東芝 | 計算機システムおよびそのシステムで使用されるファイル管理方法 |
US5825853A (en) * | 1995-09-07 | 1998-10-20 | Hitachi, Ltd. | Communication device |
US5781882A (en) * | 1995-09-14 | 1998-07-14 | Motorola, Inc. | Very low bit rate voice messaging system using asymmetric voice compression processing |
TW321810B (ja) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP3701070B2 (ja) | 1996-02-01 | 2005-09-28 | シャープ株式会社 | 音声録音再生装置 |
JP3293457B2 (ja) | 1996-04-11 | 2002-06-17 | 三菱電機株式会社 | 移動無線電話機 |
JPH1091194A (ja) * | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
US6453288B1 (en) * | 1996-11-07 | 2002-09-17 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for producing component of excitation vector |
JP3960646B2 (ja) | 1996-12-24 | 2007-08-15 | 富士ゼロックス株式会社 | 情報蓄積装置および情報蓄積方法 |
JPH10210139A (ja) | 1997-01-20 | 1998-08-07 | Sony Corp | 音声記録機能付き電話装置及び音声記録機能付き電話装置の音声記録方法 |
JP4096132B2 (ja) | 1997-07-24 | 2008-06-04 | 富士ゼロックス株式会社 | 時系列情報の特定区間決定装置、情報蓄積装置および情報蓄積再生装置 |
US6256354B1 (en) * | 1998-02-20 | 2001-07-03 | Vlsi Technology, Inc. | Voice recording and playback mode using the G.726 half-rate within the personal handy phone system |
JP2001160012A (ja) | 1999-12-03 | 2001-06-12 | Nec Corp | 電子メール自動管理方式とクライアントシステム |
-
1999
- 1999-08-13 JP JP22900599A patent/JP3784583B2/ja not_active Expired - Fee Related
-
2000
- 2000-04-12 US US09/547,866 patent/US7164755B1/en not_active Expired - Fee Related
-
2003
- 2003-07-15 US US10/618,596 patent/US20040013245A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US7164755B1 (en) | 2007-01-16 |
US20040013245A1 (en) | 2004-01-22 |
JP2001053869A (ja) | 2001-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3145358B2 (ja) | 無音期間圧縮方法 | |
EP1028411B1 (en) | Coding apparatus | |
JP4146489B2 (ja) | 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体 | |
JP3784583B2 (ja) | 音声蓄積装置 | |
KR20080103113A (ko) | 신호 인코딩 | |
JPH07319496A (ja) | 入力音声信号の速度を変更する方法 | |
JP3478209B2 (ja) | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 | |
US5978757A (en) | Post storage message compaction | |
KR100852613B1 (ko) | 오디오 신호들의 편집 | |
JP3365360B2 (ja) | 音声信号復号方法および音声信号符号化復号方法とその装置 | |
WO2009072777A1 (en) | Apparatus and method of enhancing quality of speech codec | |
KR100796836B1 (ko) | 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체 | |
JP2005316499A (ja) | 音声符号化装置 | |
JP3353852B2 (ja) | 音声の符号化方法 | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
US20070078651A1 (en) | Device and method for encoding, decoding speech and audio signal | |
EP1522063A1 (en) | Sinusoidal audio coding | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JPH05204395A (ja) | 音声用利得制御装置および音声記録再生装置 | |
JP2002287800A (ja) | 音声信号処理装置 | |
JPH10124097A (ja) | 音声記録再生装置 | |
JPH075900A (ja) | 音声記録装置 | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 | |
KR100776432B1 (ko) | 오디오 기록 재생 장치 및 그 장치에서 실행 가능한 압축률개선을 위한 오디오 코딩 방법 | |
JP2000078274A (ja) | 可変レ―ト符号化システムのためのメッセ―ジ記録装置および可変レ―ト符号化システムにおいてサイズ縮小メッセ―ジを記録する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060315 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100324 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100324 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110324 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |