KR20190018960A - 음성 신호 부호화 이력 검출 장치 및 음성 신호 부호화 이력 검출 장치의 동작 방법 - Google Patents
음성 신호 부호화 이력 검출 장치 및 음성 신호 부호화 이력 검출 장치의 동작 방법 Download PDFInfo
- Publication number
- KR20190018960A KR20190018960A KR1020170103784A KR20170103784A KR20190018960A KR 20190018960 A KR20190018960 A KR 20190018960A KR 1020170103784 A KR1020170103784 A KR 1020170103784A KR 20170103784 A KR20170103784 A KR 20170103784A KR 20190018960 A KR20190018960 A KR 20190018960A
- Authority
- KR
- South Korea
- Prior art keywords
- speech signal
- history
- encoding
- determining
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/09—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
도 2는 본 발명의 실시 예에 따른 음성 신호 부호화 이력 검출 장치가 음성 신호의 특성 파라미터를 추출하는 방법을 보여준다.
도 3은 본 발명의 실시 예에 따른 음성 신호 부호화 이력 검출 장치가 심층 신경망 네트워크를 사용하여 부호화 이력을 결정하는 방법을 보여준다.
도 4는 본 발명의 실시 예에 따른 음성 신호 부호화 이력 검출 장치의 분류 정확도가 텍스처 프레임의 길이에 따라 변화되는 것을 보여준다.
도 5는 본 발명의 실시 예에 따른 음성 신호 부호화 이력 검출 장치의 음성 신호 부호화 이력 별 분류 정확도를 보여준다.
도 6은 본 발명의 실시 예에 따른 음성 신호 부호화 이력 검출 장치가 사용하는 특성 파라미터에 따른 분류 정확도의 변화를 보여준다.
도 7는 본 발명의 실시 예에 따른 음성 신호 부호화 이력 검출 장치의 동작을 보여주는 순서도이다.
Claims (18)
- 음성 신호를 수신하는 수신부;
상기 음성 신호와 상기 음성 신호의 선형 예측(Linear Prediction, LP) 잔차 신호로부터 특성 파라미터를 추출하고, 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하는 프로세서; 및
상기 판단에 관한 정보를 출력하는 출력부를 포함하는
음성 신호 부호화 이력 검출 장치. - 제1항에서,
상기 프로세서는
상기 음성 신호의 텍스처 프레임 단위로 집합된 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하고,
상기 텍스처 프레임은 상기 음성 신호로부터 상기 특성 파라미터를 추출하는 단위인 프레임이 복수로 집합된 것인
음성 신호 부호화 이력 검출 장치. - 제2항에서,
상기 프로세서는
상기 텍스처 프레임이 포함하는 복수의 프레임 별 상기 특성 파라미터의 평균을 기초로 상기 음성 신호의 부호화 이력을 판단하는
음성 신호 부호화 이력 검출 장치. - 제2항에서,
상기 프로세서는
상기 텍스처 프레임이 포함하는 복수의 프레임 별 상기 특성 파라미터의 편차를 기초로 상기 음성 신호의 부호화 이력을 판단하는
음성 신호 부호화 이력 검출 장치. - 제2항에서,
상기 프로세서는
복수의 텍스처 프레임에 해당하는 상기 특성 파라미터 간의 차이를 기초로 상기 음성 신호의 부호화 이력을 판단하는
음성 신호 부호화 이력 검출 장치. - 제5항에서,
상기 프로세서는
제1 텍스처 프레임의 특성 파라미터의 평균과 제2 텍스처 프레임의 특성 파라미터의 평균의 차이와 제1 텍스처 프레임의 특성 파라미터의 편차와 제2 텍스처 프레임의 특성 파라미터의 편차의 차이 중 적어도 어느 하나를 기초로 상기 음성 신호의 부호화 이력을 판단하는
음성 신호 부호화 이력 검출 장치. - 제1항에서,
상기 특성 파라미터는 LP 계수, 제로 크로싱율(zero crossing rate, ZCR) 및 MFCC(Mel-frequency cepstral coefficients) 중 적어도 어느 하나를 포함하는
음성 신호 부호화 이력 검출 장치. - 제1항에서,
상기 프로세서는
상기 특성 파라미터와 동일한 포맷의 훈련 데이터 셋을 기초로 기계 학습된 알고리즘에 따라 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하는
음성 신호 부호화 이력 검출 장치. - 제1항에서,
상기 프로세서는
상기 음성 신호가 부호화된 이력이 있는지 판단하고,
상기 음성 신호가 부호화된 이력이 있는 경우, 상기 음성 신호의 부호화 시 사용된 비트 레이트에 따라 상기 음성 신호의 부호화 이력을 분류하는
음성 신호 부호화 이력 검출 장치. - 음성 신호 부호화 이력 검출 장치의 동작 방법에서,
음성 신호를 수신하는 단계;
상기 음성 신호와 상기 음성 신호의 선형 예측(Linear Prediction, LP) 잔차 신호로부터 특성 파라미터를 추출하는 단계;
추출한 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계; 및
상기 판단에 관한 정보를 출력하는 단계를 포함하는
동작 방법. - 제10항에서,
상기 음성 신호의 부호화 이력을 판단하는 단계는
상기 음성 신호의 텍스처 프레임 단위로 집합된 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계를 포함하고,
상기 텍스처 프레임은 상기 음성 신호로부터 상기 특성 파라미터를 추출하는 단위인 프레임이 복수로 집합된 것인
동작 방법. - 제11항에서,
상기 음성 신호의 텍스처 프레임 단위로 집합된 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계는
상기 텍스처 프레임이 포함하는 복수의 프레임 별 상기 특성 파라미터의 평균을 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계를 포함하는
동작 방법. - 제11항에서,
상기 음성 신호의 텍스처 프레임 단위로 집합된 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계는
상기 텍스처 프레임이 포함하는 복수의 프레임 별 상기 특성 파라미터의 편차를 기초로 상기 음성 신호의 부호화 이력을 판단하는
동작 방법. - 제11항에서,
상기 음성 신호의 텍스처 프레임 단위로 집합된 상기 특성 파라미터를 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계는
복수의 텍스처 프레임에 해당하는 상기 특성 파라미터 간의 차이를 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계를 포함하는
동작 방법. - 제14항에서,
상기 음성 신호의 텍스처 프레임 단위로 상기 음성 신호의 부호화 이력을 판단하는 단계는
제1 텍스처 프레임의 상기 특성 파라미터의 평균과 제2 텍스처 프레임의 상기 특성 파라미터의 평균의 차이와 제1 텍스처 프레임의 상기 특성 파라미터의 편차와 제2 텍스처 프레임의 상기 특성 파라미터의 편차의 차이 중 적어도 어느 하나를 기초로 상기 음성 신호의 부호화 이력을 판단하는 단계를 포함하는
동작 방법. - 제10항에서,
상기 특성 파라미터는 LP 계수, 제로 크로싱율(zero crossing rate, ZCR) 및 MFCC(Mel-frequency cepstral coefficients) 중 적어도 어느 하나를 포함하는
동작 방법. - 제10항에서,
상기 음성 신호의 부호화 이력을 판단하는 단계는
상기 특성 파라미터와 동일한 포맷의 훈련 데이터 셋을 기초로 기계 학습된 알고리즘에 따라 상기 음성 신호의 부호화 이력을 판단하는 단계를 포함하는
동작 방법. - 제10항에서,
상기 음성 신호의 부호화 이력을 판단하는 단계는
상기 음성 신호가 부호화된 이력이 있는지 판단하는 단계와
상기 음성 신호가 부호화된 이력이 있는 경우, 상기 음성 신호의 부호화 시 사용된 비트 레이트에 따라 상기 음성 신호의 부호화 이력을 분류하는 단계를 포함하는
동작 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170103784A KR20190018960A (ko) | 2017-08-16 | 2017-08-16 | 음성 신호 부호화 이력 검출 장치 및 음성 신호 부호화 이력 검출 장치의 동작 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170103784A KR20190018960A (ko) | 2017-08-16 | 2017-08-16 | 음성 신호 부호화 이력 검출 장치 및 음성 신호 부호화 이력 검출 장치의 동작 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190018960A true KR20190018960A (ko) | 2019-02-26 |
Family
ID=65562672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170103784A Ceased KR20190018960A (ko) | 2017-08-16 | 2017-08-16 | 음성 신호 부호화 이력 검출 장치 및 음성 신호 부호화 이력 검출 장치의 동작 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20190018960A (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210001596A (ko) * | 2019-06-28 | 2021-01-06 | 국방과학연구소 | 보코더 유형 판별 방법 및 장치 |
CN115116452A (zh) * | 2021-12-30 | 2022-09-27 | 昆明理工大学 | 一种基于语音gfcc特征参数的信息隐藏方法 |
CN116597062A (zh) * | 2023-07-10 | 2023-08-15 | 北京麟卓信息科技有限公司 | 一种基于动态自适应解码的压缩纹理渲染优化方法 |
-
2017
- 2017-08-16 KR KR1020170103784A patent/KR20190018960A/ko not_active Ceased
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210001596A (ko) * | 2019-06-28 | 2021-01-06 | 국방과학연구소 | 보코더 유형 판별 방법 및 장치 |
CN115116452A (zh) * | 2021-12-30 | 2022-09-27 | 昆明理工大学 | 一种基于语音gfcc特征参数的信息隐藏方法 |
CN116597062A (zh) * | 2023-07-10 | 2023-08-15 | 北京麟卓信息科技有限公司 | 一种基于动态自适应解码的压缩纹理渲染优化方法 |
CN116597062B (zh) * | 2023-07-10 | 2024-02-09 | 北京麟卓信息科技有限公司 | 一种基于动态自适应解码的压缩纹理渲染优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457688B (zh) | 纠错处理方法及装置、存储介质和处理器 | |
US10878823B2 (en) | Voiceprint recognition method, device, terminal apparatus and storage medium | |
Harb et al. | Voice-based gender identification in multimedia applications | |
KR100795727B1 (ko) | Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법 | |
US7120576B2 (en) | Low-complexity music detection algorithm and system | |
KR20110013390A (ko) | 신호판정방법, 신호판정장치, 프로그램, 신호판정시스템 | |
CN110890087A (zh) | 一种基于余弦相似度的语音识别方法和装置 | |
KR20190018960A (ko) | 음성 신호 부호화 이력 검출 장치 및 음성 신호 부호화 이력 검출 장치의 동작 방법 | |
CN111429943B (zh) | 音频中音乐及音乐相对响度的联合检测方法 | |
US7130795B2 (en) | Music detection with low-complexity pitch correlation algorithm | |
KR100463417B1 (ko) | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 | |
KR101862982B1 (ko) | LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법 | |
KR20070019863A (ko) | 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치 | |
CN101208741B (zh) | 一种适用于数字信号短时相关性模型之间的互用性的方法 | |
US7680654B2 (en) | Apparatus and method for segmentation of audio data into meta patterns | |
Wang et al. | Automatic audio segmentation using the generalized likelihood ratio | |
JP4392805B2 (ja) | オーディオ情報分類装置 | |
KR101551879B1 (ko) | 비교데이터 프루닝과 가우시안 혼합 모델의 유사도 추정을 이용한 유해 동영상 필터링 시스템 및 방법 | |
JP4961565B2 (ja) | 音声検索装置及び音声検索方法 | |
JP4630136B2 (ja) | ストレス状態推定緩和装置及びそのプログラム | |
JP4201204B2 (ja) | オーディオ情報分類装置 | |
KR100744288B1 (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
Hübschen et al. | Bitrate and tandem detection for the amr-wb codec with application to network testing | |
Padmanabhan et al. | Model complexity adaptation using a discriminant measure | |
CN113889096A (zh) | 一种音库训练数据的分析方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170816 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190425 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20191021 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20190425 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |