JPH07244929A - 会話音声の圧縮録音方法及びそれを利用した録音装置 - Google Patents

会話音声の圧縮録音方法及びそれを利用した録音装置

Info

Publication number
JPH07244929A
JPH07244929A JP6033386A JP3338694A JPH07244929A JP H07244929 A JPH07244929 A JP H07244929A JP 6033386 A JP6033386 A JP 6033386A JP 3338694 A JP3338694 A JP 3338694A JP H07244929 A JPH07244929 A JP H07244929A
Authority
JP
Japan
Prior art keywords
voice
signal
recording
conversational
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6033386A
Other languages
English (en)
Inventor
Taizo Nozawa
泰三 野沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP6033386A priority Critical patent/JPH07244929A/ja
Publication of JPH07244929A publication Critical patent/JPH07244929A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

(57)【要約】 【目的】 音声信号における会話音声の有無を高精度で
判定し、半導体メモリ等の記録媒体の効率的な使用を図
って会話音声の圧縮録音装置全体を小型化する。 【構成】 飛行機のコクピット等の所定の空間内におけ
る会話音声を記録媒体に圧縮して録音する会話音声の圧
縮録音装置は、コクピット内に配置されて連続的に音声
信号を収録してアナログ電気信号に変換するマイクロフ
ォンMと、増幅器10と、アナログ音声信号をディジタ
ル信号に変換するA/D変換器20と、ディジタル信号
に変換された音声信号を適応予測しながら音声符号化を
行うADPCM符号変換器30と、音声検出器40と、
メモリドライバ50と、メモリ60とを備え、音声検出
器40は、ADPCM符号変換器30の音声符号化器3
2に含まれる適応予測器35からの予測係数a1、a2
を、フレーム化器41、42及び平均値計算器43、4
4によりフレーム平均を行い、有音無音判定器45で閾
値VThと比較して音声信号中の会話音声の有無を高い精
度で検出する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は会話音声の圧縮記録に関
し、特に、所定の空間内で行われた会話音声を効率よく
録音するための会話音声の圧縮録音方法及びそれを利用
した録音装置に関する。
【0002】
【従来技術】所定の空間内における会話音声の録音装置
は、例えば航空機などの事故解析に使用するコクピット
ボイスレコーダとして使用されている。かかるコクピッ
トボイスレコーダは、飛行機の運転室であるコクピット
内でのパイロットの交信及び会話音声を連続的に録音
し、事故の後にこの記録された音声情報に基づいて事故
原因を究明するために使用されるものである。かかるコ
クピットボイスレコーダは、その使用目的から、コクピ
ット内での会話音声を全て連続的に録音する必要がある
ため、大容量の録音容量が必要となる。
【0003】一方、音声などの記録方式としては、従来
のアナログ方式に代わって、音声信号をディジタル信号
に変換して所望の処理を行うディジタル方式の発展が著
しく、このような信号処理方式の変化に伴い、その記録
媒体としても、従来の磁気テープから大容量化の著しい
半導体メモリへ移行する傾向にある。
【0004】また、コクピットボイスレコーダなどのよ
うに、大量の音声情報を効率よく記録媒体に録音するた
めの方式として、コクピット内で会話が行われていない
無音状態を検出し、この検出された無音状態では前記記
録媒体への録音を停止することによって記録媒体の効率
的な使用を可能とし、もって装置の小型軽量化を実現す
る音声の圧縮録音方式も既に知られている。
【0005】添付の図3には、かかる従来技術になる会
話音声の圧縮録音装置が示されており、この図におい
て、マイクロフォンMにより収音されて電気信号に変換
された音声信号は、増幅器1により所望の振幅まで増幅
される。この音声信号は、その後、スイッチSWを介し
てA/D変換器2によりアナログ信号からディジタル信
号に変換され、さらに符号化器であるADPCM符号変
換器3によってパルス変調信号であるADPCM信号に
変調された後、メモリドライブ4を介して半導体メモリ
などにより構成される大容量のメモリ5へ書き込まれて
録音される。なお、この時、増幅器1により増幅された
音声信号の一部がスケルチ回路6へ入力され、このスケ
ルチ回路6により音声信号における音声の有無の状態が
アナログ的手法により検出される。その結果、スケルチ
回路6により音声信号に音声があると判定された場合に
は、上記スイッチSWを閉じ(すなわち、ON状態に
し)て音声信号をメモリ5へ書き込み、一方、無音状態
であると判定された場合には上記スイッチSWを開いて
(OFF状態にして)音声信号の書込を停止する。
【0006】
【発明が解決しようとする課題】しかしながら、上述の
ような従来技術になる会話音声の圧縮録音方式では、電
気信号に変換された音声信号における会話音声の有無の
判定を行うためのスケルチ回路は、音声信号の強弱に基
づいてアナログ的手法によって検出するものであり、そ
のため、このスケルチ回路の音声有無判定基準の設定値
によっては、例えばこの設定値を高めに設定した場合に
は本来は録音すべき小レベルの会話音声は録音されず、
装置の本来の機能を十分に達成することが出来ない。こ
れとは逆に、その設定値を低くし過ぎると、録音すべき
会話音声に加えて多くの雑音までも拾ってしまい、録音
不要な無音状態の音声信号まで録音することから十分な
会話音声の圧縮録音を行うことが不可能となり、これで
は記録媒体も大型化してしまい、装置の小型化が不可能
になってしまうという問題点があった。
【0007】そこで、本発明では、上述の従来技術にお
ける問題点に鑑み、従来のアナログ的手法によるスケル
チ回路に代え、録音すべき音声信号の有無を信号レベル
の大小に拘わらず正確に判定することを可能にすること
により、音声を録音する記録媒体である半導体メモリ等
の記憶容量を効率的に使用することを可能にする会話音
声の圧縮録音方法を提供し、さらに、かかる方法を利用
することにより記憶容量の効率的な使用を図って装置全
体としても小型化の可能な会話音声を圧縮録音装置を提
供することをその目的とする。
【0008】
【課題を解決するための手段】本発明は、会話音声を記
録媒体に録音する録音装置によって、所定の空間内にお
ける音声信号を連続的に入力し、会話が行われていない
無音状態では当該記録媒体への録音を中止して音声信号
を圧縮して録音する会話音声の圧縮録音方法において、
(a)前記入力した音声信号をアナログ信号からディジ
タル信号へ変換するステップと、(b)前記ディジタル
信号に変換された音声信号を適応予測しながら音声符号
化するステップと、(c)前記音声符号化するステップ
における適応予測により得られる予測係数を入力とし、
当該予測係数に基づいて会話音声の有無を判定するステ
ップと、(d)前記判定ステップで前記音声信号中に会
話音声が存在していると判定された場合には、前記記録
媒体への録音を行い、他方、会話が存在していないと判
定される場合には、前記記録媒体への録音を中止するス
テップとを含んでいる会話音声の圧縮録音方法が開示さ
れる。
【0009】更に本発明は、上記の圧縮録音方法を利用
し、所定の空間内における会話音声を記録媒体に圧縮し
て録音する録音装置として、所定の空間内における音声
信号を連続的に収録してアナログ電気信号に変換するた
めの手段と、前記音声変換手段によって電気信号に変換
されたアナログ音声信号をディジタル信号に変換するた
めの手段と、前記アナログ・ディジタル変換手段により
ディジタル信号に変換された音声信号を適応予測しなが
ら音声符号化を行う音声符号化手段と、前記音声符号化
手段での適応予測により得られる予測係数を入力とし、
当該予測係数に基づいて前記音声信号中に会話音声の有
無を検出する検出手段と、前記検出手段により会話音声
の存在を検出した場合には、前記ディジタル信号に変換
された音声信号を前記記録媒体へ録音し、他方、前記検
出手段により会話音声が検出されない場合には、前記デ
ィジタル信号に変換された音声信号の前記記録媒体への
録音を中止する制御手段とを備えた会話音声の圧縮録音
装置を開示する。
【0010】
【作用】上記の本発明になる会話音声の圧縮録音方法に
よれば、所定の空間から連続的に収録されたアナログの
音声信号における会話音声の有無を、ディジタル信号に
変換した後の音声符号化処理において行われる適応予測
により得られる予測係数を利用することにより、雑音に
よる会話音声の誤検出を無くして精度よく会話音声の有
無を検出することによる高精度の会話音声の圧縮録音方
法を可能にし、さらに、かかる圧縮録音方法を録音装置
に利用するための構成により、高い精度で会話音声を圧
縮して記録することによって記録媒体の利用効率を高
め、装置全体としても小型化の可能な会話音声の圧縮録
音装置を提供することを可能にする。
【0011】
【実施例】以下、本発明の実施例について、添付の図面
を参照しながら、詳細に説明する。図2には、本発明の
会話音声の圧縮録音方法を実現するための録音装置の全
体の回路構成が示されており、図において、例えば飛行
機のコクピット内に配置されたマイクロフォンMにより
連続的に収音されて電気信号に変換された音声信号は、
まず、増幅器10により所望の振幅まで増幅され、その
後、後段のA/D変換器20へ入力される。すなわち、
コクピット内でのパイロットの交信や会話を含んだ音声
信号は、連続的に収録されて、所定のサンプリング周期
でサンプリングされ、ディジタル信号に変換されること
となる。
【0012】このように、A/D変換器20によってア
ナログ信号からディジタル信号に変換された音声信号
は、続いて、ADPCM符号変換器30に入力される。
このADPCM符号変換器30は、入力されたディジタ
ル信号に基づいて、これを音声信号を表す一種のディジ
タル方式のパルス変調信号であるADPCM信号に変調
する。このADPCM符号変換器30からの出力は、さ
らに、音声検出器40へ入力され、ここで音声信号にお
けるの会話音声の有無が判定される。すなわち、本発明
によれば、この音声信号におけるの会話音声の有無の判
定を、従来のようにディジタル変換される前のアナログ
の音声信号のレベルにより判定するのではなく、ディジ
タル信号に変換し、さらに、ADPCM信号に変調され
た後の音声信号を利用することによって、音声信号にお
ける会話音声の有無を、雑音等による影響を無くして、
高い精度で判定出来るようにしたものである。なお、こ
こで会話音声の有無とは、マイクロフォンMにより連続
的に収録された音声信号における、ある時間におけるパ
イロットなどによって行われた交信や会話の存在の有無
を言う。
【0013】このような音声検出器40の詳細な内部構
成が、添付の図1に示されている。図からも明らかなよ
うに、ADPCM符号変換器30の一構成要件である音
声符号化器32に含まれ、音声信号の波形を記述するた
めにその予測値からの偏差に基づいた信号を出力する適
応予測器35からの2つの信号、すなわち、予測係数a
1及びa2が、それぞれ、音声検出器40を構成する2
つのフレーム化器41、42へ入力されている。ここで
a1、a2はある時点の標本値を、隣接する過去の2つ
の標本値で予測するために適用予測器35が予測信号を
生成するために算出する係数である。そして、これらの
フレーム化器41、42は、それぞれ、入力した予測係
数a1及びa2を、例えば5msという短い区間のフレ
ームに分割し、さらに、その後段に接続した平均値計算
器43、44により、フレーム毎に予測係数a1及びa
2の平均値を計算する。その後、これらの平均値計算器
43、44により算出された予測係数a1及びa2の平
均値は、有音無音判定器45へ入力され、ここで所定の
閾値VThと比較して音声信号における会話音声の有無の
判定がなされることとなる。なお、この所定の閾値VTh
は、上記の予測係数の発生分布から予め求めた閾値であ
る。また、上記の有音/無音判定器45を構成する、音
声有無の判定回路の構成自体は、例えば特開平4−29
9400号等により既に知られたものであり、特にここ
では詳述しないが、このような既知の回路を採用するこ
とにり容易に構成することが可能である。
【0014】また、上記有音/無音判定器45の所定の
閾値VThは、種々の実験などに基づいて所望の精度を達
成する値を経験的に求めることにより得られるものであ
り、例えば上記の実施例では、5msのフレームにより
平均化した予測係数a1及びa2に対しては、下記のよ
うな5つの閾値を設定している。 (1) 0.70≦a1≦1.00 かつ −0.45≦a2≦−0.35 (2) 0.75≦a1≦1.10 かつ −0.55≦a2≦−0.45 (3) 0.85≦a1≦1.20 かつ −0.65≦a2≦−0.55 (4) 0.95≦a1≦1.20 かつ −0.75≦a2≦−0.65 (5) a1≦0.75 かつ a2≦0 そして、上記フレーム平均化した予測係数a1及びa2
が、上記の(1)〜(5)の5つの閾値の範囲に入って
いれば、上記有音/無音判定器45は無音状態と判定し
て、その出力である音声検出フラグuを「L(Lo
w)」に設定し、それ以外の場合では、音声検出フラグ
uを「H(High)」に設定する。
【0015】さらに、上記の有音/無音判定器45によ
り得られた結果、すなわち、音声検出フラグuにより表
される「L」または「H」の信号に基づいて、ハングオ
ーバー処理装置46によって100msのハングオーバ
ー処理を施し最終的な音声検出出力Vを出す。ハングオ
ーバー処理装置は、語尾切れ防止のため有音から無音に
判定が変わった時それ以降の数フレームを有音に設定す
る機能を有している。すなわち、ハングオーバー処理装
置46からの音声検出出力が「L」であれば、その音声
信号は無音状態であるとし、「H」であれば有音状態で
あるとする。すなわち、有音/無音判定器45からの音
声検出フラグuが「L」であれば、その音声信号は無音
状態であるとして録音する信号から削除し、一方、音声
検出フラグuが「H」であれば、その音声信号には録音
すべき会話音声信号が存在していると判断されることか
らこれを残し、これらをオーバーラップさせて録音すべ
き音声信号を生成する。
【0016】その後、このハングオーバー処理装置46
から得られる最終的な音声検出出力Vは、再び図2へ戻
り、メモリドライブ50に入る。メモリドライブ50で
はこの音声検出出力Vにより音声信号の録音、否録音を
制御し、半導体メモリ等から構成される音声の記録媒体
であるメモリ60へ録音する。すなわち、上記音声検出
器40により会話音声の存在が検出された音声信号だけ
がメモリ60へ録音されることとなる。すなわち、記憶
容量であるメモリ60の効率的な使用を図ることによっ
て、装置の大型化の最も大きな原因となるメモリ60の
記憶容量を最小限に抑制することにより小型化を図り、
装置全体としても小型化の可能な会話音声の圧縮録音装
置を提供することを可能としている。
【0017】
【発明の効果】以上の詳細な説明からも明らかなよう
に、上述の本発明の会話音声の圧縮録音方法によれば、
音声信号をディジタル信号に変換した後にパルス変調を
行う際の符号化器の適応予測器から得られる予測係数を
使用することにより、当該音声信号における会話音声の
有無を、雑音の影響を除いて、高い精度で判定すること
により正確で効率的な音声信号の圧縮処理が可能にな
り、さらに、この圧縮処理方法を録音装置へ利用するこ
とにより、半導体メモリ等から構成される記憶装置の効
率的な使用を図って装置全体としても小型化の可能な会
話音声の圧縮録音装置を提供することが出来るという、
技術的にも極めて優れた効果を発揮することとなる。
【図面の簡単な説明】
【図1】本発明になる会話音声の圧縮録音方法を実施す
るための会話音声の圧縮録音装置の特徴部分である、音
声検出器の詳細構成を示す回路図である。
【図2】上記音声検出器を含んだ本発明になる会話音声
の圧縮録音装置の全体構成を示す回路図である。
【図3】従来技術になる会話音声の圧縮録音装置の構成
の一例を示す回路図である。
【符号の説明】
M マイクロフォン 20 A/D変換器 30 ADPCM符号変換器 40 音声検出器 41、42 フレーム化器 43、44 平均値計算器 45 有音無音判定器 46 ハングオーバー処理装置 60 メモリ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 会話音声を記録媒体に録音する録音装置
    によって、所定の空間内における音声信号を連続的に入
    力し、会話が行われていない無音状態では当該記録媒体
    への録音を中止して音声信号を圧縮して録音する会話音
    声の圧縮録音方法において、 (a)前記入力した音声信号をアナログ信号からディジ
    タル信号へ変換するステップと、 (b)前記ディジタル信号に変換された音声信号を適応
    予測しながら音声符号化するステップと、 (c)前記音声符号化するステップにおける適応予測に
    より得られる予測係数を入力とし、当該予測係数に基づ
    いて会話音声の有無を判定するステップと、 (d)前記判定ステップで前記音声信号中に会話音声が
    存在していると判定された場合には、前記記録媒体への
    録音を行い、他方、会話が存在していないと判定される
    場合には、前記記録媒体への録音を中止するステップと
    を含んでいることを特徴とする会話音声の圧縮録音方
    法。
  2. 【請求項2】 会話音声を記録媒体に圧縮して録音する
    録音装置において、所定の空間内における音声信号を連
    続的に収録してアナログ電気信号に変換するための手段
    と、 前記音声変換手段によって電気信号に変換されたアナロ
    グ音声信号をディジタル信号に変換するための手段と、 前記アナログ・ディジタル変換手段によりディジタル信
    号に変換された音声信号を適応予測しながら音声符号化
    を行う音声符号化手段と、 前記音声符号化手段での適応予測により得られる予測係
    数を入力とし、当該予測係数に基づいて前記音声信号中
    に会話音声の有無を検出する検出手段と、 前記検出手段により会話音声の存在を検出した場合に
    は、前記ディジタル信号に変換された音声信号を前記記
    録媒体へ録音し、他方、前記検出手段により会話音声が
    検出されない場合には、前記ディジタル信号に変換され
    た音声信号の前記記録媒体への録音を中止する制御手段
    とを備えたことを特徴とする会話音声の圧縮録音装置。
  3. 【請求項3】 前記請求項1の会話音声の圧縮録音装置
    において、前記会話音声有無検出手段は、さらに、前記
    音声符号化手段での適応予測により得られる予測係数を
    所定の期間毎にフレーム化して平均化する手段と、前記
    平均化手段により平均化された予測係数を所定の閾値と
    比較する手段とを含んでいることを特徴とする会話音声
    の圧縮録音装置。
JP6033386A 1994-03-03 1994-03-03 会話音声の圧縮録音方法及びそれを利用した録音装置 Pending JPH07244929A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6033386A JPH07244929A (ja) 1994-03-03 1994-03-03 会話音声の圧縮録音方法及びそれを利用した録音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6033386A JPH07244929A (ja) 1994-03-03 1994-03-03 会話音声の圧縮録音方法及びそれを利用した録音装置

Publications (1)

Publication Number Publication Date
JPH07244929A true JPH07244929A (ja) 1995-09-19

Family

ID=12385162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6033386A Pending JPH07244929A (ja) 1994-03-03 1994-03-03 会話音声の圧縮録音方法及びそれを利用した録音装置

Country Status (1)

Country Link
JP (1) JPH07244929A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016158133A (ja) * 2015-02-25 2016-09-01 沖電気工業株式会社 通信装置、遅延回復方法および遅延回復プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016158133A (ja) * 2015-02-25 2016-09-01 沖電気工業株式会社 通信装置、遅延回復方法および遅延回復プログラム

Similar Documents

Publication Publication Date Title
US4720863A (en) Method and apparatus for text-independent speaker recognition
KR101054704B1 (ko) 음성 활성도 검출 시스템 및 방법
US6205420B1 (en) Method and device for instantly changing the speed of a speech
KR20140147587A (ko) Wfst를 이용한 음성 끝점 검출 장치 및 방법
JP2007534020A (ja) 信号符号化
CN110827795A (zh) 语音输入结束判断方法、装置、设备、系统以及存储介质
US9373342B2 (en) System and method for speech enhancement on compressed speech
US6246979B1 (en) Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal
EP0140249A1 (en) Speech analysis/synthesis with energy normalization
JPS6245730B2 (ja)
EP0653091B1 (en) Discriminating between stationary and non-stationary signals
US6868378B1 (en) Process for voice recognition in a noisy acoustic signal and system implementing this process
US6173265B1 (en) Voice recording and/or reproducing method and apparatus for reducing a deterioration of a voice signal due to a change over from one coding device to another coding device
JP2001053869A (ja) 音声蓄積装置及び音声符号化装置
JP3413862B2 (ja) 音声区間検出方法
JPH07244929A (ja) 会話音声の圧縮録音方法及びそれを利用した録音装置
US5696875A (en) Method and system for compressing a speech signal using nonlinear prediction
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPH10116097A (ja) 音声再生装置
JPH11175096A (ja) 音声信号処理装置
JPH11133997A (ja) 有音無音判定装置
JP2947685B2 (ja) 音声コーデック装置
JPH03114100A (ja) 音声区間検出装置
US20220180884A1 (en) Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
JPH0816199A (ja) 録音装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term