JPH0679240B2 - 音声録音装置 - Google Patents

音声録音装置

Info

Publication number
JPH0679240B2
JPH0679240B2 JP60214032A JP21403285A JPH0679240B2 JP H0679240 B2 JPH0679240 B2 JP H0679240B2 JP 60214032 A JP60214032 A JP 60214032A JP 21403285 A JP21403285 A JP 21403285A JP H0679240 B2 JPH0679240 B2 JP H0679240B2
Authority
JP
Japan
Prior art keywords
voice
signal
digital
codec
analog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60214032A
Other languages
English (en)
Other versions
JPS6273297A (ja
Inventor
隆一 宇佐美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60214032A priority Critical patent/JPH0679240B2/ja
Publication of JPS6273297A publication Critical patent/JPS6273297A/ja
Publication of JPH0679240B2 publication Critical patent/JPH0679240B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 本発明は音声録音装置に係り,特に音声を入力し,増幅
した後,アナログ音声をディジタル音声信号に変換して
記憶装置に録音する場合に,音声認識において前処理と
して行われる音声切出し処理部に音声を入力し,音声の
始端と終端を検出することにより,その検出結果を元に
前記ディジタル音声信号を高精度の音声信号として前記
記憶装置に録音することを可能とする音声録音装置を提
供するものである。従来,この種の音声録音装置はアナ
ログ音声信号を増幅した後,ディジタル信号に直し,適
当な方式で符号化して出来るデイジタル音声信号を記憶
装置に格納していた。しかしながら,録音時に音声の前
後のノイズを除去するためには,音の切出を高精度に行
う必要があるが,従来の方式によると,アナログ音声信
号をディジタル信号に符号化する符号キーから得られる
情報のみでは高精度な録音が出来なかったという欠点が
あった。本発明ではアナログ音声信号を増幅し,A/D変換
した後,適当に符号化するCODEC及びCODECの出力に接続
される中央演算装置MPU及び記憶装置からなる一般の音
声録音装置に音声認識装置を接続し,該音声認識装置
は,前記アナログ信号を入力し,前記アナログ信号の周
波数を適当な周波数帯域で分割し,各周波数帯域での少
なくともパワースペクトラムの大きさを計算し,その情
報を元に音声の始端及び終端を検出する音声切出回路部
を有し,前記音声の始端及び終端の検出情報をディジタ
ル情報に変換し,前記録音装置に通知する手段を用いて
高精度な音声登録を可能とする音声録音装置を提供す
る。
〔産業上の利用分野〕
本発明は音声録音装置に係り,特にアナログ信号を入力
し,増幅した後に,パルスコードモジュレーション(PC
M)系の波形に符号化を行う,コーダーデコーダ(CODE
C)からのディジタル音声信号を適当に処理する中央演
算装置(MPU)及び記憶装置とからなる一般の音声録音
装置に,音声認識装置の内部の前処理として利用されて
いる音声切出結果出力を,前記CODECの出力と有機的に
結合することにより,高精度な音声録音が出来ることを
可能とする音声録音装置の構成に関する。
〔従来の技術〕
集積回路技術の発展に伴い,計算処理技術と,通信の通
信技術との融合化が進み,アナログ的な信号もディジタ
ル信号系に変換して色々処理する技術が利用されてき
た。特に電話回線において,電話から入力されたアナロ
グ的な音声信号を交換機内部において増幅した後,A/D変
換し,適当に符号化してパルスコードモジュレーション
(PCU)系のディジタル音声信号に変換することによ
り,時分割多重通信によるディジタル交換機を構成する
ことができ,更に記憶装置に記憶することによって,計
算機と融合して音声メール等のサービスを行うことがで
きる。
このような電話回線上においては,コーダーデコーダー
(コーデックCODEC)が利用されている。これは,電話
から入力されたアナログ音声信号をA/D変換を使って,
ディジタル音声信号を変換するとともに,適当な符号化
を行う符号キーが含まれており,逆にディジタル信号を
アナログ音声信号に変換する場合には,D/A変換する変換
回路が内部に含まれている。このような電話回線上に利
用される音声登録装置は,アナログ音声信号を増幅し,A
/D変換した後,適当な符号にコード化する前記コーデッ
ク,及び前記コーデックの出力に接続される中央演算装
置MPU及び記録装置からなるものであった。このような
装置においては,アナログ信号を容易に実時間での録音
を可能とする特徴があるが,録音時,重要な要素である
音の切出は,上記コーデックから得られる情報のみで
は,充分満足いくものは,得られなかった。そのため,
電話回線等の音声に,外部から乱入する雑音を含んでい
る場合には,切出しの不完全さにより,記憶装置に格納
する場合の音の始端と終端とが最適化されておらず,従
って,信号を除去して録音したり,必要でない部分も録
音してしまうという欠点を有していた。
〔発明の目的〕
本発明はこのような従来の音声録音装置の欠点を除去
し,音声認識装置で利用されている音声切出部の出力
を,前記コーデックの出力等と有機的に結合することに
よって,録音時重要な要素である音の切出を前記切出部
で実行することによりS/N比の高い,音声ディジタル信
号を作成し,記憶装置に格納することによって高精度な
録音を可能とする音声録音装置を提供するものである。
〔問題点を解決するための手段〕
本発明は,アナログ信号を標本化,量子化及び符号化を
行って,ディジタル信号に変換するコーデックと,アナ
ログ音声信号の高域のパワースペクトラムとその音声信
号のパワースペクトラムの総和との比に基づいて音声の
始端、及び終端を検出する音声切出回路部と、音声の始
端、及び始端に関する情報に基づいて、コーデックから
出されるディジタル音声信号を記憶装置に格納する記憶
制御部とを備えることを特徴とする音声録音装置を提供
することにより達成される。
〔作用〕
音声録音装置に必要な音声増幅回路と増幅されたアナロ
グ音声信号をA/D変換し,適当なコードにコード化する
コーデックの出力と,アナログ音声信号の高域のパワー
スペクトラムとその音声信号のパワースペクトラムの総
和との比に基づいて音声の始端、終端を検出し、その始
端、及び終端に関する情報をもとに,アナログ音声信号
をディジタルPCM音声信号に変換して,前記記憶装置に
記憶するようにしている。
〔実施例〕
次に本発明の実施例を図面を参照して説明する。
第1図は本発明の音声登録装置の構成を示すブロック図
である。マイク1から入力される音声信号は,増幅回路
2に入力される。増幅回路2の出力は,コーデック3の
入力となる。コーデック3は前記増幅回路2から出力さ
れるアナログ音声信号をディジタル信号に変えるA/D変
換を内部に含み,且つ量子化し,符号化する符号回路を
含んでいる。量子化には線形量子化と非線形量子化とが
あるが,線形量子化される場合には,A/D変換器でアナロ
グ音声信号をサンプリングし,各サンプル時点のアナロ
グ振幅時を予め決められたビット幅のディジタル信号に
量子化されるので,アナログ音声信号の振幅時に比例し
てディジタルビットパターンが出力されることになる。
符号化する場合には,色々な符号化方式があるが,出力
される信号は,パルスコードモジュレーション即ち,PCM
符号である。コーデック3から出力されるPCM符号はデ
ィジタル信号であるから,コーデック3が接続されたデ
ータバス4を介して記憶装置5に記憶されることが可能
となる。ディジタル信号に変換された音声ディジタル信
号は記憶装置5に格納されることによって,同じデータ
バス4に接続された中央演算装置MPU6の処理によって色
々なディジタル信号処理を施すことが可能となる。この
ように,増幅回路2,コーデック3,記憶装置5,及びMPU6か
ら構成される装置は,音声登録装置として必要不可欠な
要素である。しかし,一般にコーデック3は,アナログ
信号をディジタル信号に変換するとともに,符号化する
機能,或いは逆に記憶装置5に格納された音声信号を入
力し,元のアナログ音声信号を発生するための復号器及
びD/A変換器を含んでいるのが,一般的である。このよ
うなコーデック3は,アナログ音声信号をディジタル音
声信号に変えて,記憶装置5に記憶するための処理回路
であって,録音される音声信号が記憶されるための最適
化処理は一般に行わない。本発明では,音声の切出を行
うために,音声認識装置7に利用されている音声切出回
路部を設置し,マイク1から出力されるアナログ音声信
号を出力し,適当な時間区域毎に音声波形の切出を行
い,切出した音声波形に関する音声切出情報,例えば,
音声の始端と,終端に関する情報をディジタル信号とし
て,前記音声切出回路部から出力する。そして,前記音
声認識装置7の出力と,前記コーデック3の出力を有機
的に結合することによってマイク1から入力されるアナ
ログ音声信号をディジタル信号に変えて記憶装置5に格
納する場合に,始端,及び終端検出情報をもとに,中央
演算装置6が適当な処理を行って記憶するようにしてい
るものである。音声切出回路部は音声認識技術には重要
な処理部であって,この検出には音声波形そのものが持
っている時間領域,或いは周波数領域でのパラメータを
使って抽出される。特に重要なパラメータとしてスペク
トラムの大きさすなわち,音声のパワーがある。このパ
ワーの大きさは音声波形に含まれる色々な周波数成分に
よって異なってくるので,音声切出回路部には各周波数
領域に音声波形の周波数成分を分割するために,低域か
ら高域までのフィルタを複数持つ,フィルタバンクが含
まれている。
音声切出回路部の構成のブロック図は,第2図に示すよ
うに構成される。第2図において,アナログ音声信号
は,低域通過フィルタ20から高域通過フィルタ21までの
フィルタバンクの各フィルタに共通に入力され,処理ブ
ロック22に各フィルタを通過した各周波数成分を含んだ
信号が個々に入力される。
処理部22では各フィルタバンクから入力された信号のパ
ワースペクトラムの計算を行う。例えば,i番目のフィル
タ23から出力されるi番目の周波数領域に含まれる信号
成分のパワーをpiとすれば,処理部22ではi=1からi
=nまでの各スペクトラムの大きさを計算し,その総和
を計算する。その総和をΣpiとすれば,音節の始まり,
すなわち,音声の始端は,Σpiに対する高域のスペクト
ラム,例えば,フィルタ21の出力に対する信号成分のパ
ワースペクトラムの割合,即ち,次式で示される式によ
って決定することができる。
音声の終端の検出は,同様にパワースペクトラムを適当
に処理することによって検出される。音節の始端や終端
はこのようにパワースペクトラムを計算することによっ
て検出されるが,さらに,確実に検出するためには,パ
ワースペクトラム以外に色々なパラメータを使う場合が
ある。例えば,音声波形の時間的な変化率を有効に使う
場合もある。或いは音声のうちの母音が持っているホル
マント周波数のピッチを測定する場合もある。このよう
な色々なパラメータを使って音声を抽出する技術は音声
認識上では重要なことであり,音声切出回路は音声認識
装置においては,必ず含まれている回路であるが,本発
明ではこの回路を有効に音声録音装置に結合することに
よって音声の始端,及び終端検出情報とコーデック3か
ら出力される音声ディジタル信号を中央演算装置MPU6を
用いて適当に処理することによって正確に音声信号だけ
をディジタル音声信号に変換して記憶装置5に格納する
ようにしている。
このように,本発明では録音時重要な要素である音の切
出を音声認識装置7に利用されている音声切出回路部を
用いて切出情報を出力し,コーデック3と切出回路とを
有機的に結合することによって,雑音が混入されている
アナログ信号に対しても,前記アナログ音声信号を,デ
ィジタル音声信号に変える時点で適当に処理することに
よって精度の高い音声信号を録音することが可能とな
る。即ち,本発明では通常音声認識装置7において,音
声の始端,或いは終端を各種パラメータを用いて決定さ
れている技術をそのまま利用して前記コーデックの出力
情報のみでは得られなかった高精度なディジタル音声信
号を得ることを可能とし,記憶装置5に格納することが
できる。
本発明はこのように音声認識装置7に利用されている音
声の切出回路部を用いて音声の始端,終端を通知する手
段を設け,コーデック3からの音声出力部は,音声の録
音時に上記通知があった時点を音声の始端,及び終端と
して中央演算装置6の処理をもとに決定することによ
り,高精度なディジタル音声信号を記憶装置5に格納す
ることができることになる。従って,記憶装置5からデ
ィジタル音声信号を出力し,コーデック3を用いて復号
化し,D/A変換を介してアナログ音声信号を再生する場合
には,雑音を含まない極めて良質な音声信号が得られる
ことになる。
〔発明の効果〕
本発明はこのように,音声認識装置に利用される音声切
出回路部による音声の始端,及び終端の決定は,各種パ
ラメータを用いて決定されるために,精度が高いことを
利用しており,得られた音声の始端,終端を通知する手
段を新たに設けることによって音声の始端,及び終端情
報を元にして形成されるディジタル音声信号を記憶装置
に格納できるので,正確にディジタル音声信号のみを記
憶できるという効果がある。従って,再生時に出力され
る音声信号は,雑音を含まず,良質な音声信号として再
生されるという効果がある。
【図面の簡単な説明】
第1図は本発明の音声録音装置の構成を示すブロック
図, 第2図は本発明の音声切出部の音声始端,終端検出回路
の簡単な回路図である。 1……マイク, 2……増幅回路, 3……コーデック, 4……データバス, 5……記憶装置, 6……中央演算装置MPU, 7……音声認識装置, 20,21,23……フィルタバンク, 22……処理部,

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】アナログ音声信号を標本化、量子化、及び
    符号化を行って、ディジタル信号に変換するコーデック
    と、 前記アナログ音声信号の高域のパワースペクトラムと該
    音声信号のパワースペクトラムの総和との比に基づいて
    音声の始端、及び終端を検出する音声切出回路部と、 前記音声の始端、及び終端に関する情報に基づいて、前
    記コーデックから出力されるディジタル音声信号を記憶
    装置に格納する記憶制御部とを備えることを特徴とする
    音声録音装置。
  2. 【請求項2】前記音声切出回路部は、低域から高域まで
    の特定の周波数帯域の通過特性を有する複数の帯域フィ
    ルタと、該複数の帯域フィルタの出力信号の内の高域の
    出力信号電力と、該複数の帯域フィルタの出力信号電力
    の総和との比を算出する電力比算出回路部とからなるこ
    とを特徴とする特許請求の範囲1記載の音声録音装置。
JP60214032A 1985-09-27 1985-09-27 音声録音装置 Expired - Lifetime JPH0679240B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60214032A JPH0679240B2 (ja) 1985-09-27 1985-09-27 音声録音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60214032A JPH0679240B2 (ja) 1985-09-27 1985-09-27 音声録音装置

Publications (2)

Publication Number Publication Date
JPS6273297A JPS6273297A (ja) 1987-04-03
JPH0679240B2 true JPH0679240B2 (ja) 1994-10-05

Family

ID=16649143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60214032A Expired - Lifetime JPH0679240B2 (ja) 1985-09-27 1985-09-27 音声録音装置

Country Status (1)

Country Link
JP (1) JPH0679240B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030988A (ja) * 2001-07-12 2003-01-31 Mitsubishi Electric Corp 半導体記憶回路

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS58205196A (ja) * 1982-05-25 1983-11-30 東芝エンジニアリング株式会社 音声処理装置における音声情報の自動編集方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS58205196A (ja) * 1982-05-25 1983-11-30 東芝エンジニアリング株式会社 音声処理装置における音声情報の自動編集方法

Also Published As

Publication number Publication date
JPS6273297A (ja) 1987-04-03

Similar Documents

Publication Publication Date Title
US5136652A (en) Amplitude enhanced sampled clipped speech encoder and decoder
US5067158A (en) Linear predictive residual representation via non-iterative spectral reconstruction
US4384169A (en) Method and apparatus for speech synthesizing
JPS6035799A (ja) 人間の音声エンコード装置及び方法
CA1172366A (en) Methods and apparatus for encoding and constructing signals
JP2009532734A (ja) 入力信号の量子化及び逆量子化方法と装置、入力信号の符号化及び復号化方法と装置
Wells Voiced/unvoiced decision based on the bispectrum
US5696875A (en) Method and system for compressing a speech signal using nonlinear prediction
JPH0679240B2 (ja) 音声録音装置
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
JP3354252B2 (ja) 音声認識装置
JPH0237600B2 (ja)
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
CA2053133C (en) Method for coding and decoding a sampled analog signal having a repetitive nature and a device for coding and decoding by said method
JP3875890B2 (ja) 音声信号加工装置、音声信号加工方法及びプログラム
WO2004088634A1 (ja) 音声信号圧縮装置、音声信号圧縮方法及びプログラム
KR100196387B1 (ko) 성분 분리를 통한 시간 영역상의 음성피치 변경방법
JP2519710Y2 (ja) 音声波形符号器
KR100210444B1 (ko) 대역 분할을 통한 음성신호 부호화 방법
KR0138878B1 (ko) 보코더용 피치검색 처리시간 단축법
JP4146949B2 (ja) 音声処理装置
JPH0235994B2 (ja)
JP2880508B2 (ja) 音声の規則合成装置
JP2602641B2 (ja) 音声符号化方式
WO1997016821A1 (en) Method and system for compressing a speech signal using nonlinear prediction

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term