JPS59152498A - 音声信号デ−タ抽出装置 - Google Patents
音声信号デ−タ抽出装置Info
- Publication number
- JPS59152498A JPS59152498A JP58026471A JP2647183A JPS59152498A JP S59152498 A JPS59152498 A JP S59152498A JP 58026471 A JP58026471 A JP 58026471A JP 2647183 A JP2647183 A JP 2647183A JP S59152498 A JPS59152498 A JP S59152498A
- Authority
- JP
- Japan
- Prior art keywords
- address
- audio
- signal
- signal data
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
仔) 産業上の利用分野
本発明は音声信号データが含まれる入力信号データから
その背戸信号データを抽出する為の音声信号データ抽出
装置に関する。
その背戸信号データを抽出する為の音声信号データ抽出
装置に関する。
(へ)従来技術
この種i゛声信号ザータ抽出装置は、音声信号データに
基づいて蛭声の認識を行なう音声認識システム、及び音
声<6号データに基づいて音声の再合成を行なう音声合
成システムに用いられ、正確1、C背戸信号望−夕を得
る事が、これ等システムの性能を決定−づる・(目−な
る。
基づいて蛭声の認識を行なう音声認識システム、及び音
声<6号データに基づいて音声の再合成を行なう音声合
成システムに用いられ、正確1、C背戸信号望−夕を得
る事が、これ等システムの性能を決定−づる・(目−な
る。
従来の肖声色号データの抽出C1於い′〔す、音声1i
<号が含まれる人力信号のl)Q形又はぞのヂ・−夕の
4J 7.づル値を直接目視し、こυ)波形又はそのデ
ータのりン′プル値から瞳声信号が存在する時間領域を
検出する中に依って、この領域に含まれる人力信号のデ
ータのサニノづル値を音声信号データとしC取り出して
いた。
<号が含まれる人力信号のl)Q形又はぞのヂ・−夕の
4J 7.づル値を直接目視し、こυ)波形又はそのデ
ータのりン′プル値から瞳声信号が存在する時間領域を
検出する中に依って、この領域に含まれる人力信号のデ
ータのサニノづル値を音声信号データとしC取り出して
いた。
しかしながら、入力信号の波形又はそのデータの41ン
づル値をtCI接目視して入力音声の時間領域を決定し
ていたので、iE確なこの時間領域の検出は峠かしく、
しかもこの検出の為に11」当なる時間を費やす一欠点
がI)った。さらC二1人力信号データに含まれる々1
1:音成分の中から確実にM声信号データを抽出するの
は内鍵であり、特に音声信号が立ち上がる始端部が欠落
する惧れがあった。
づル値をtCI接目視して入力音声の時間領域を決定し
ていたので、iE確なこの時間領域の検出は峠かしく、
しかもこの検出の為に11」当なる時間を費やす一欠点
がI)った。さらC二1人力信号データに含まれる々1
1:音成分の中から確実にM声信号データを抽出するの
は内鍵であり、特に音声信号が立ち上がる始端部が欠落
する惧れがあった。
Q)発明の目的
本発明は、入力音声信号データから雑音成分の影響を排
除して音声信号データの時間領域を自1ii1ノ的にし
かも確実に抽出できる音声信号イータ抽出持回を提供す
るものである。
除して音声信号データの時間領域を自1ii1ノ的にし
かも確実に抽出できる音声信号イータ抽出持回を提供す
るものである。
・発明の構成
本発明の音声信号イータ抽出装置は音声信号が含ま埃る
入力信号の信号レベルを特定のレベルと比較し、この信
号レベルが特定のレベルより大なる時C:は音声検知信
号を出力する音声検知回路と、一定規時間に亘る入力音
声信号データのサンプル値が格納可能なアドレス容置を
もち、簀き込みアドレスが循環系をなす第1のメ七りと
音声の時間領域に亘る人力音声信号データのサンプル値
が格納用能なアドレス容量をもつ第2のメ七りと、を備
えている。
入力信号の信号レベルを特定のレベルと比較し、この信
号レベルが特定のレベルより大なる時C:は音声検知信
号を出力する音声検知回路と、一定規時間に亘る入力音
声信号データのサンプル値が格納可能なアドレス容置を
もち、簀き込みアドレスが循環系をなす第1のメ七りと
音声の時間領域に亘る人力音声信号データのサンプル値
が格納用能なアドレス容量をもつ第2のメ七りと、を備
えている。
(ホ)実 施 例
第1図に本発明の音声信号データ抽出装置の一実施例の
構成を示す。同図に於いて、(1)は音声を含む入力音
波を市、気的な入力信号(二変換するマイクO)オン、
(2)は該マイク0フォン(1)からの入データを含む
入力信号データとしてのη:/ j I’l/値が得ら
れる。(3)は音声検知回路であり一ヒ記マイク0フオ
′Jfilからの入力信号のエネル千−即ちそのレベル
が特定のしきい値を越えた時、音声信号の在存を示す音
声検知信号が出力される。(4)は上記AD変換器(2
1かもの入力信号イータの寸ンづル(1へを第1のメ七
り(5)又は第2のメtす(6)に切り換え導入する為
の切り換えスイッチであり、−上記音声検知回路(3)
からの音声検知信号が得られるまで、上記入力信号イー
タのサンフル値を川1のメtす(5)に導入し、音声検
知信号が得られた時点以降けC歳入力信号データのサン
プル値を第2のメ℃す(6)に導入する構成となってい
る。
構成を示す。同図に於いて、(1)は音声を含む入力音
波を市、気的な入力信号(二変換するマイクO)オン、
(2)は該マイク0フォン(1)からの入データを含む
入力信号データとしてのη:/ j I’l/値が得ら
れる。(3)は音声検知回路であり一ヒ記マイク0フオ
′Jfilからの入力信号のエネル千−即ちそのレベル
が特定のしきい値を越えた時、音声信号の在存を示す音
声検知信号が出力される。(4)は上記AD変換器(2
1かもの入力信号イータの寸ンづル(1へを第1のメ七
り(5)又は第2のメtす(6)に切り換え導入する為
の切り換えスイッチであり、−上記音声検知回路(3)
からの音声検知信号が得られるまで、上記入力信号イー
タのサンフル値を川1のメtす(5)に導入し、音声検
知信号が得られた時点以降けC歳入力信号データのサン
プル値を第2のメ℃す(6)に導入する構成となってい
る。
一方、第1のメfす(5)は一定規時間(1亘る人力音
声信号イータのサンプも値を格納可能なアドレス客員を
もち、その書き込みアrL/又は先頭アドレスから最終
アトしスに至り、続いて先頭アドレスに帰還して内容の
書き変えを順次行なう循還系をなしている。従って、該
第1のメ℃す(5)には屑に上記A−D変換器(2)か
ら切り換えスイッチ(4)を介して得られる直前の音声
信号データの例えば50m5eCに亘る400υンプル
分のサンプル値が順次格納されている事となる。また第
2のメモリ(6)は一連のメッセー、;晋声の時間領域
例えば5秒程度に亘る人力背戸データの40000 V
ンラル分に及ぶυンプル値を格納可能なアドレス容量を
もち、その畜き込みアドレスは単に先頭アドレスから順
次最終アドレスに至るものである。
声信号イータのサンプも値を格納可能なアドレス客員を
もち、その書き込みアrL/又は先頭アドレスから最終
アトしスに至り、続いて先頭アドレスに帰還して内容の
書き変えを順次行なう循還系をなしている。従って、該
第1のメ℃す(5)には屑に上記A−D変換器(2)か
ら切り換えスイッチ(4)を介して得られる直前の音声
信号データの例えば50m5eCに亘る400υンプル
分のサンプル値が順次格納されている事となる。また第
2のメモリ(6)は一連のメッセー、;晋声の時間領域
例えば5秒程度に亘る人力背戸データの40000 V
ンラル分に及ぶυンプル値を格納可能なアドレス容量を
もち、その畜き込みアドレスは単に先頭アドレスから順
次最終アドレスに至るものである。
次に上述の如き構成の本発明実施例装置の動作を第2因
の信号波形図及び第3図のメ七り模式図を用いて説明す
る。ここでは、第2図に示す如く、背景雑音等に起因す
る雑音成分nと、この雑音成分Vnに依って音声の始端
が不明確と7Z−)’Cいる音声信号■Sとからなる人
力(r4号Nがマイク0フオン(11に人力された場合
を考えてみる。この場合、入力信号■のレベル値が特定
値V T、 klより小・さく音声検知回路(3)から
音声検知43号が得られる゛まで9期間’f 1に於い
ては、A−DK換器(2)からの入力音声データのサン
プル値は第1のメ七1月5)に貯えられる。そして最終
的に音声検知信号が得られた時点tでは第3図υ、)に
示す如く、第1のメtす(5)の先頭アトしスAsから
時点tで書き変えられたアドレスAtまでの領域M++
と、次のアドレスAt+1から最終アトしスAf3まで
の領域M12と、には、行用検知信号が得られた時点℃
の例えば50m5ec直前にある音声の始端時点t8か
らこの時点tまでの入力信号データのサンプル値が時間
領域が前後して格納される事となる。さらにこの時点も
以降の期間し2に於いては、切り換えスイッチ(4)の
動作に依り、入力信号データのサンづル1直は・第2の
メ七り(6)の先頭アトしスAsから1陸終アドレスA
ef、での全領吠M20に格納される=4(どなる。従
−て、これ等i目及び第2のメ七り(5)(6)には、
その各領域M12、Mll、第20の順に、第2図に示
す如く始点t’aから終点tbに至る領域゛rSに含ま
れる入力信号即ち音声信号データの”Jンjル値が格納
されており、時点tのアドレスAしの次のアドレスAt
−)1からこのアドレスAtまで第1のメ七り(5)の
アドレスな一循するアドレス順シー格納された音声信号
データのりシづル値を読み出した後に、第2のメモリの
先頭アドレスから順次音声信号イータのサンづル値を読
み出す事に依って、音声の始端部の欠落のない音声信号
データが完全に抽出できる。
の信号波形図及び第3図のメ七り模式図を用いて説明す
る。ここでは、第2図に示す如く、背景雑音等に起因す
る雑音成分nと、この雑音成分Vnに依って音声の始端
が不明確と7Z−)’Cいる音声信号■Sとからなる人
力(r4号Nがマイク0フオン(11に人力された場合
を考えてみる。この場合、入力信号■のレベル値が特定
値V T、 klより小・さく音声検知回路(3)から
音声検知43号が得られる゛まで9期間’f 1に於い
ては、A−DK換器(2)からの入力音声データのサン
プル値は第1のメ七1月5)に貯えられる。そして最終
的に音声検知信号が得られた時点tでは第3図υ、)に
示す如く、第1のメtす(5)の先頭アトしスAsから
時点tで書き変えられたアドレスAtまでの領域M++
と、次のアドレスAt+1から最終アトしスAf3まで
の領域M12と、には、行用検知信号が得られた時点℃
の例えば50m5ec直前にある音声の始端時点t8か
らこの時点tまでの入力信号データのサンプル値が時間
領域が前後して格納される事となる。さらにこの時点も
以降の期間し2に於いては、切り換えスイッチ(4)の
動作に依り、入力信号データのサンづル1直は・第2の
メ七り(6)の先頭アトしスAsから1陸終アドレスA
ef、での全領吠M20に格納される=4(どなる。従
−て、これ等i目及び第2のメ七り(5)(6)には、
その各領域M12、Mll、第20の順に、第2図に示
す如く始点t’aから終点tbに至る領域゛rSに含ま
れる入力信号即ち音声信号データの”Jンjル値が格納
されており、時点tのアドレスAしの次のアドレスAt
−)1からこのアドレスAtまで第1のメ七り(5)の
アドレスな一循するアドレス順シー格納された音声信号
データのりシづル値を読み出した後に、第2のメモリの
先頭アドレスから順次音声信号イータのサンづル値を読
み出す事に依って、音声の始端部の欠落のない音声信号
データが完全に抽出できる。
上述の実施例に於いては、音声検知回路(3)はマイク
0フオン(1)からの入力信号のレベルを直接比較判定
していたが、A−D変換(2)からの入力信号データの
サンプル値を比較判定する構成としても良い、またA−
D変換器(2)からのディジタル出力を入力信号チーク
として取り扱ったが、このディジタル出力を更にデータ
圧縮した例えばパーコール係数等の特徴パラメータを人
力信号データ及び音声信号チークとして用いる事もでき
る。
0フオン(1)からの入力信号のレベルを直接比較判定
していたが、A−D変換(2)からの入力信号データの
サンプル値を比較判定する構成としても良い、またA−
D変換器(2)からのディジタル出力を入力信号チーク
として取り扱ったが、このディジタル出力を更にデータ
圧縮した例えばパーコール係数等の特徴パラメータを人
力信号データ及び音声信号チークとして用いる事もでき
る。
(へ)発明の効果
本発明の音声信号チーク抽出装置は以上の説明から明ら
かな如く、書き込みアドレスが循環系をなす第1のメ七
りと、これとは別の第2のメ℃りと、の2つのメモリを
用い、音声信号の存在を知らしめる入力信号レベルが特
定のレベルより大きくなる時点までの音声の始端部の音
声信号データを上記第1のメtりに循環せしめて確実に
格納できる構成とし、へカイ8号レベルが特定のレベル
より大きくなった時点以降の音声の後媚の音声信号デー
タを第2のメ七りに格納する構成としたので、入力首座
信号データから雑音成分の影響を受ける事なく、完全な
る音声信号データを抽出する串が可能となる。従って斯
る抽出処理の自動化並びに高速化が図れ、首座認識、前
座合成に係る音声処理システムに寄与する所は太きい。
かな如く、書き込みアドレスが循環系をなす第1のメ七
りと、これとは別の第2のメ℃りと、の2つのメモリを
用い、音声信号の存在を知らしめる入力信号レベルが特
定のレベルより大きくなる時点までの音声の始端部の音
声信号データを上記第1のメtりに循環せしめて確実に
格納できる構成とし、へカイ8号レベルが特定のレベル
より大きくなった時点以降の音声の後媚の音声信号デー
タを第2のメ七りに格納する構成としたので、入力首座
信号データから雑音成分の影響を受ける事なく、完全な
る音声信号データを抽出する串が可能となる。従って斯
る抽出処理の自動化並びに高速化が図れ、首座認識、前
座合成に係る音声処理システムに寄与する所は太きい。
第1図は本発明の苔ハ)5号データ抽出装置の一実施例
の構成を示すづロック図、弔2図は信号波形図、第6図
はメ七り模式図、を示しており、(1]はマイ90フオ
ン、(21はA・1)茨侠器、(,3)は賃声検知回路
、(4)は切り侠えスイ・ソチ、(5)は第1のメ七り
、(6)は−1JJ2のメtりを夫々ボしている。
の構成を示すづロック図、弔2図は信号波形図、第6図
はメ七り模式図、を示しており、(1]はマイ90フオ
ン、(21はA・1)茨侠器、(,3)は賃声検知回路
、(4)は切り侠えスイ・ソチ、(5)は第1のメ七り
、(6)は−1JJ2のメtりを夫々ボしている。
Claims (1)
- 【特許請求の範囲】 1)音声信号が含まれる入力信号の信号レベルを特定の
レベルと比較し、この信号レベルが特定のレベルより大
なる時には音声検知信号を出力する音声検知回路と、一
定短時間に亘る入力音声信号データのサンプル値が格納
可能なアドレス容量をもつ第1のメ七りと、音声の時間
領域に亘る入力音声信号データのサンプル値が格納可能
な第2のメ七りと、を備え、 第1のメモリはその書き込みアドレスが先頭アドレスか
ら最終アドレスに至り続いて先頭アドレスに帰還する貼
環系をなして構成され、上記音声検知回路から音声検知
信号が得られるまで、この第1のメ七りに入力信号デー
タのサンプル値の附き込みを続行し、音声検知信号が得
られた時点にて上記第1のメtりへの書き込みを中止す
ると共に、この時点以降の入力信号データの’jyづル
値は上記第2のメ七りの先頭アドレスから順次書き込み
が行なわれ、 音声検知信号が得られる直前を二1井き込みが行なわれ
た1L1のメ七りのアドレスの次のアドレスにNさ込ま
れている音声信号データを音声の時間領域の先頭イータ
とし、この先頭データのア1°゛レスから第1のメ七り
のアドレスを−イ盾するアト1ノス順に格納された音声
13号チータを続み出した後に、f82のメtりの先頭
アト’ L/スXJ)らny+次格納された首声(jj
号チータを続み出す早を特徴とする背戸信号プータ抽出
装jべ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58026471A JPS59152498A (ja) | 1983-02-18 | 1983-02-18 | 音声信号デ−タ抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58026471A JPS59152498A (ja) | 1983-02-18 | 1983-02-18 | 音声信号デ−タ抽出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59152498A true JPS59152498A (ja) | 1984-08-31 |
Family
ID=12194424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58026471A Pending JPS59152498A (ja) | 1983-02-18 | 1983-02-18 | 音声信号デ−タ抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59152498A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61163400A (ja) * | 1985-01-14 | 1986-07-24 | 横河電機株式会社 | 音声分析装置 |
JPS6228799A (ja) * | 1985-07-31 | 1987-02-06 | 富士通株式会社 | 音声分析装置 |
JPS63243998A (ja) * | 1987-03-31 | 1988-10-11 | カシオ計算機株式会社 | 電子楽器の入力制御装置 |
JPH02184915A (ja) * | 1989-01-12 | 1990-07-19 | Toshiba Corp | 音声認識装置及び方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5584996A (en) * | 1978-12-22 | 1980-06-26 | Fujitsu Ltd | Tone recognition system |
-
1983
- 1983-02-18 JP JP58026471A patent/JPS59152498A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5584996A (en) * | 1978-12-22 | 1980-06-26 | Fujitsu Ltd | Tone recognition system |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61163400A (ja) * | 1985-01-14 | 1986-07-24 | 横河電機株式会社 | 音声分析装置 |
JPS6228799A (ja) * | 1985-07-31 | 1987-02-06 | 富士通株式会社 | 音声分析装置 |
JPS63243998A (ja) * | 1987-03-31 | 1988-10-11 | カシオ計算機株式会社 | 電子楽器の入力制御装置 |
JPH02184915A (ja) * | 1989-01-12 | 1990-07-19 | Toshiba Corp | 音声認識装置及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6857699B2 (ja) | 音声対話設備のウェイクアップ方法、装置、設備、記憶媒体、及びプログラム | |
CN103035247B (zh) | 基于声纹信息对音频/视频文件进行操作的方法及装置 | |
JPS5862699A (ja) | 音声認識装置 | |
CN107507626B (zh) | 一种基于语音频谱融合特征的手机来源识别方法 | |
CN109448746B (zh) | 语音降噪方法及装置 | |
CN105679357A (zh) | 一种移动终端及其基于声纹识别的录音方法 | |
CN111916054A (zh) | 基于唇形的语音生成方法、装置和系统及存储介质 | |
CN106897379B (zh) | 语音文件的lrc时间轴文件自动生成方法及相关设备 | |
CN113409771B (zh) | 一种伪造音频的检测方法及其检测系统和存储介质 | |
JPS59152498A (ja) | 音声信号デ−タ抽出装置 | |
CN111048065B (zh) | 文本纠错数据生成方法及相关装置 | |
CN104869233B (zh) | 一种录音方法 | |
JPS6129518B2 (ja) | ||
CN113256262A (zh) | 会议纪要的自动生成方法、系统、存储介质及电子设备 | |
CN115171651B (zh) | 一种儿化音合成方法、装置、电子设备及存储介质 | |
CN115148208B (zh) | 音频数据处理方法、装置、芯片及电子设备 | |
CN116994597B (zh) | 一种音频处理系统、方法及存储介质 | |
Bae et al. | A Study on Enhancement of Speech using Non-uniform Sampling | |
CN114400007A (zh) | 语音处理方法和装置 | |
CN116364085A (zh) | 数据增强方法、装置、电子设备和存储介质 | |
JPH0756588A (ja) | 音声合成における記号処理装置 | |
US8315858B1 (en) | Method for digitally recording an analog audio signal with automatic indexing | |
CN115440198A (zh) | 混合音频信号的转换方法、装置、计算机设备和存储介质 | |
Garipalli et al. | Analysis of Speech Signals Using Excitation Source Information | |
CN117831500A (zh) | 语音合成的处理方法、装置、电子设备和计算机存储介质 |