JP7056340B2 - 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 - Google Patents
符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 Download PDFInfo
- Publication number
- JP7056340B2 JP7056340B2 JP2018076734A JP2018076734A JP7056340B2 JP 7056340 B2 JP7056340 B2 JP 7056340B2 JP 2018076734 A JP2018076734 A JP 2018076734A JP 2018076734 A JP2018076734 A JP 2018076734A JP 7056340 B2 JP7056340 B2 JP 7056340B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound signal
- predetermined
- frequency band
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/316—User authentication by observing the pattern of computer usage, e.g. typical user behaviour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Description
以下、図面を参照して第1実施形態の一例を詳細に説明する。
所定フレーム数Mは、例えば、5フレームである。しかしながら、例えば、レスポンスタイムに応じて、所定フレーム数Mは1フレームであってもよいし、2~4、または6フレーム以上であってもよい。
以下、図面を参照して第2実施形態の一例を詳細に説明する。第1実施形態と同様の構成及び作用については、同様の参照符号を使用して説明を省略する。
以下、図面を参照して第3実施形態の一例を詳細に説明する。第1実施形態または第2実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
以下、図面を参照して、第4実施形態の一例を詳細に説明する。第1~第3実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
以下、図面を参照して、第5実施形態の一例を詳細に説明する。第1~第4実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
以下、図面を参照して、第6実施形態の一例を詳細に説明する。第1~第5実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
録音音声で認証が行われることを防止するために、暗騒音の重畳による、無音区間における音信号の音圧の増加に基づいて、録音音声であることを判定する関連技術が存在する。
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う、
符号化音判定処理をコンピュータに実行させるためのプログラム。
(付記2)
前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
付記1の符号化音判定処理をコンピュータに実行させるためのプログラム。
(付記3)
前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
付記1または付記2のプログラム。
(付記4)
前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
付記3のプログラム。
(付記5)
同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
付記1~付記4の何れかのプログラム。
(付記6)
隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さを表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
付記1~付記5の何れかのプログラム。
(付記7)
前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
付記1~付記5の何れかのプログラム。
(付記8)
コンピュータが、
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う、
符号化音判定方法。
(付記9)
前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
付記8の符号化音判定方法。
(付記10)
前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
付記8または付記9の符号化音判定方法。
(付記11)
前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
付記10の符号化音判定方法。
(付記12)
同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
付記8~付記11の何れかの符号化音判定方法。
(付記13)
隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さを表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
付記8~付記12の何れかの符号化音判定方法。
(付記14)
前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
付記8~付記12の何れかの符号化音判定方法。
(付記15)
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得する取得部と、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う判定部と、
を含む符号化音判定装置。
(付記16)
前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
付記15の符号化音判定装置。
(付記17)
前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
付記16の符号化音判定装置。
(付記18)
同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
付記15~付記17の何れかの符号化音判定装置。
(付記19)
前記判定部は、隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さを表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
付記15~付記18の何れかの符号化音判定装置。
(付記20)
前記判定部は、前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
付記15~付記19の何れかの符号化音判定装置。
14 周波数帯域単位エッジ度算出部
15 符号化音判定部
51 CPU
52 一次記憶部
53 二次記憶部
Claims (8)
- 音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行い、
前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
符号化音判定処理をコンピュータに実行させるためのプログラム。 - 前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
請求項1に記載のプログラム。 - 前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
請求項2に記載のプログラム。 - 同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
請求項1~請求項3の何れか1項に記載のプログラム。 - 隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さの相違を表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
請求項1~請求項4の何れか1項に記載のプログラム。 - 前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
請求項1~請求項4の何れか1項に記載のプログラム。 - コンピュータが、
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行い、
前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
符号化音判定方法。 - 音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得する取得部と、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う判定部と、
を含み、
前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
符号化音判定装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076734A JP7056340B2 (ja) | 2018-04-12 | 2018-04-12 | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 |
US16/361,534 US11081120B2 (en) | 2018-04-12 | 2019-03-22 | Encoded-sound determination method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076734A JP7056340B2 (ja) | 2018-04-12 | 2018-04-12 | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019184867A JP2019184867A (ja) | 2019-10-24 |
JP7056340B2 true JP7056340B2 (ja) | 2022-04-19 |
Family
ID=68161899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018076734A Active JP7056340B2 (ja) | 2018-04-12 | 2018-04-12 | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11081120B2 (ja) |
JP (1) | JP7056340B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001285523A (ja) | 2000-03-28 | 2001-10-12 | Kddi Corp | 呼判別装置 |
JP2010277023A (ja) | 2009-06-01 | 2010-12-09 | Nippon Hoso Kyokai <Nhk> | 電話音声区間検出装置およびそのプログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58180600U (ja) * | 1982-05-26 | 1983-12-02 | オムロン株式会社 | 音声識別装置 |
JP4573792B2 (ja) | 2006-03-29 | 2010-11-04 | 富士通株式会社 | ユーザ認証システム、不正ユーザ判別方法、およびコンピュータプログラム |
CA2871268C (en) | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
US9767806B2 (en) * | 2013-09-24 | 2017-09-19 | Cirrus Logic International Semiconductor Ltd. | Anti-spoofing |
JP5201053B2 (ja) | 2009-03-31 | 2013-06-05 | 沖電気工業株式会社 | 合成音声判別装置、方法及びプログラム |
CN104143341B (zh) * | 2013-05-23 | 2015-10-21 | 腾讯科技(深圳)有限公司 | 爆音检测方法和装置 |
KR20160148009A (ko) * | 2014-07-04 | 2016-12-23 | 인텔 코포레이션 | 자동 화자 검증 시스템에서의 리플레이 공격 검출 |
US10468032B2 (en) * | 2017-04-10 | 2019-11-05 | Intel Corporation | Method and system of speaker recognition using context aware confidence modeling |
US10692490B2 (en) * | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
KR102127126B1 (ko) * | 2018-08-03 | 2020-06-26 | 엘지전자 주식회사 | 음성 판독 장치 |
-
2018
- 2018-04-12 JP JP2018076734A patent/JP7056340B2/ja active Active
-
2019
- 2019-03-22 US US16/361,534 patent/US11081120B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001285523A (ja) | 2000-03-28 | 2001-10-12 | Kddi Corp | 呼判別装置 |
JP2010277023A (ja) | 2009-06-01 | 2010-12-09 | Nippon Hoso Kyokai <Nhk> | 電話音声区間検出装置およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2019184867A (ja) | 2019-10-24 |
US11081120B2 (en) | 2021-08-03 |
US20190318753A1 (en) | 2019-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3762579B2 (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
JP6769299B2 (ja) | オーディオ符号化装置およびオーディオ符号化方法 | |
JP6290429B2 (ja) | 音声処理システム | |
JP5439586B2 (ja) | 低複雑度の聴覚イベント境界検出 | |
US9330682B2 (en) | Apparatus and method for discriminating speech, and computer readable medium | |
US11335355B2 (en) | Estimating noise of an audio signal in the log2-domain | |
JP7201721B2 (ja) | 相関分離フィルタの適応制御のための方法および装置 | |
RU2734288C1 (ru) | Устройство и способ для разложения звукового сигнала с использованием переменного порогового значения | |
KR102517285B1 (ko) | 오디오 신호를 처리하기 위한 장치 및 방법 | |
JP4021124B2 (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
JP2005227782A (ja) | 有声音および無声音の検出装置、並びにその方法 | |
CN110114828B (zh) | 使用比率作为分离特征来分解音频信号的装置和方法 | |
US20150071463A1 (en) | Method and apparatus for filtering an audio signal | |
JP5694745B2 (ja) | 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム | |
JP7056340B2 (ja) | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 | |
JP7316093B2 (ja) | 音声雑音除去装置及びプログラム | |
EP2739067A2 (en) | Audio processing device and method | |
JP4739023B2 (ja) | デジタル音声信号におけるクリッキングノイズ検出 | |
CN115668368A (zh) | 执行动态范围控制的方法和单元 | |
CN110168639B (zh) | 数据编码检测 | |
JP6235725B2 (ja) | マルチ・チャンネル・オーディオ信号分類器 | |
JP6765124B2 (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
JP3753956B2 (ja) | 符号化装置 | |
JP2023545197A (ja) | オーディオ帯域幅検出およびオーディオコーデックにおけるオーディオ帯域幅切り替えのための方法およびデバイス | |
KR101195599B1 (ko) | 잡음 처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220321 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7056340 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |