JP2019184867A - 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 - Google Patents
符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 Download PDFInfo
- Publication number
- JP2019184867A JP2019184867A JP2018076734A JP2018076734A JP2019184867A JP 2019184867 A JP2019184867 A JP 2019184867A JP 2018076734 A JP2018076734 A JP 2018076734A JP 2018076734 A JP2018076734 A JP 2018076734A JP 2019184867 A JP2019184867 A JP 2019184867A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound signal
- predetermined
- frequency
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000005236 sound signal Effects 0.000 claims abstract description 144
- 230000008569 process Effects 0.000 claims abstract description 47
- 238000004364 calculation method Methods 0.000 description 20
- 238000001228 spectrum Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005237 high-frequency sound signal Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/316—User authentication by observing the pattern of computer usage, e.g. typical user behaviour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
Description
以下、図面を参照して第1実施形態の一例を詳細に説明する。
所定フレーム数Mは、例えば、5フレームである。しかしながら、例えば、レスポンスタイムに応じて、所定フレーム数Mは1フレームであってもよいし、2〜4、または6フレーム以上であってもよい。
以下、図面を参照して第2実施形態の一例を詳細に説明する。第1実施形態と同様の構成及び作用については、同様の参照符号を使用して説明を省略する。
以下、図面を参照して第3実施形態の一例を詳細に説明する。第1実施形態または第2実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
以下、図面を参照して、第4実施形態の一例を詳細に説明する。第1〜第3実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
以下、図面を参照して、第5実施形態の一例を詳細に説明する。第1〜第4実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
以下、図面を参照して、第6実施形態の一例を詳細に説明する。第1〜第5実施形態と同様の構成及び作用については同様の参照符号を使用して説明を省略する。
録音音声で認証が行われることを防止するために、暗騒音の重畳による、無音区間における音信号の音圧の増加に基づいて、録音音声であることを判定する関連技術が存在する。
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う、
符号化音判定処理をコンピュータに実行させるためのプログラム。
(付記2)
前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
付記1の符号化音判定処理をコンピュータに実行させるためのプログラム。
(付記3)
前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
付記1または付記2のプログラム。
(付記4)
前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
付記3のプログラム。
(付記5)
同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
付記1〜付記4の何れかのプログラム。
(付記6)
隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さを表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
付記1〜付記5の何れかのプログラム。
(付記7)
前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
付記1〜付記5の何れかのプログラム。
(付記8)
コンピュータが、
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う、
符号化音判定方法。
(付記9)
前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
付記8の符号化音判定方法。
(付記10)
前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
付記8または付記9の符号化音判定方法。
(付記11)
前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
付記10の符号化音判定方法。
(付記12)
同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
付記8〜付記11の何れかの符号化音判定方法。
(付記13)
隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さを表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
付記8〜付記12の何れかの符号化音判定方法。
(付記14)
前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
付記8〜付記12の何れかの符号化音判定方法。
(付記15)
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得する取得部と、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う判定部と、
を含む符号化音判定装置。
(付記16)
前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
付記15の符号化音判定装置。
(付記17)
前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
付記16の符号化音判定装置。
(付記18)
同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
付記15〜付記17の何れかの符号化音判定装置。
(付記19)
前記判定部は、隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さを表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
付記15〜付記18の何れかの符号化音判定装置。
(付記20)
前記判定部は、前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
付記15〜付記19の何れかの符号化音判定装置。
14 周波数帯域単位エッジ度算出部
15 符号化音判定部
51 CPU
52 一次記憶部
53 二次記憶部
Claims (9)
- 音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う、
符号化音判定処理をコンピュータに実行させるためのプログラム。 - 前記音信号の強さの相違を表す値は、前記所定周波数帯域の前記音信号のパワーを所定数のフレーム分加算し、前記所定数で除算した時間方向平均値を算出し、前記所定周波数帯域に含まれる周波数単位の前記時間方向平均値を加算し、前記所定周波数帯域に含まれる前記周波数単位の数で除算することで算出される、
請求項1に記載の符号化音判定処理をコンピュータに実行させるためのプログラム。 - 前記所定周波数帯域が、音信号の符号化の種類によって定められるスケールファクタバンドの各々に対応するように定められる、
請求項1または請求項2に記載のプログラム。 - 前記符号化の種類が複数存在し、
前記所定周波数帯域が、複数の前記符号化の種類の各々のスケールファクタバンドの各々に対応するように定められる、
請求項3に記載のプログラム。 - 同一の周波数帯域境界で隣接する所定周波数帯域の音信号の強さの相違を表す値が、所定時間以上、第1所定値を超える場合、前記音信号は符号化音であると判定する、
請求項1〜請求項4の何れか1項に記載のプログラム。 - 隣接する所定周波数帯域の音信号の強さの相違を表す値が第2所定値を超えた後、前記値が前記第2所定値を超えた周波数帯域境界と同一の周波数帯域境界で隣接する所定周波数帯域の強さを表す値が、所定回数以上、前記第2所定値以下になるまで、前記音信号が符号化音であるか否か判定する処理を繰り返す、
請求項1〜請求項5の何れか1項に記載のプログラム。 - 前記音信号の信号対雑音比が第3所定値を超えた場合、前記音信号が符号化音であるか否か判定する処理を行う、
請求項1〜請求項5の何れか1項に記載のプログラム。 - コンピュータが、
音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得し、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う、
符号化音判定方法。 - 音信号から算出される周波数に対応する前記音信号の強さを示す情報を取得する取得部と、
周波数方向に隣接する所定周波数帯域間における、所定の閾値以上となる前記音信号の強さの相違の有無に基づいて、前記音信号が符号化音であるか否かを判定する処理を行う判定部と、
を含む符号化音判定装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076734A JP7056340B2 (ja) | 2018-04-12 | 2018-04-12 | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 |
US16/361,534 US11081120B2 (en) | 2018-04-12 | 2019-03-22 | Encoded-sound determination method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076734A JP7056340B2 (ja) | 2018-04-12 | 2018-04-12 | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019184867A true JP2019184867A (ja) | 2019-10-24 |
JP7056340B2 JP7056340B2 (ja) | 2022-04-19 |
Family
ID=68161899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018076734A Active JP7056340B2 (ja) | 2018-04-12 | 2018-04-12 | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11081120B2 (ja) |
JP (1) | JP7056340B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58180600U (ja) * | 1982-05-26 | 1983-12-02 | オムロン株式会社 | 音声識別装置 |
JP2001285523A (ja) * | 2000-03-28 | 2001-10-12 | Kddi Corp | 呼判別装置 |
JP2010277023A (ja) * | 2009-06-01 | 2010-12-09 | Nippon Hoso Kyokai <Nhk> | 電話音声区間検出装置およびそのプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4573792B2 (ja) | 2006-03-29 | 2010-11-04 | 富士通株式会社 | ユーザ認証システム、不正ユーザ判別方法、およびコンピュータプログラム |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
US9767806B2 (en) * | 2013-09-24 | 2017-09-19 | Cirrus Logic International Semiconductor Ltd. | Anti-spoofing |
JP5201053B2 (ja) | 2009-03-31 | 2013-06-05 | 沖電気工業株式会社 | 合成音声判別装置、方法及びプログラム |
CN104143341B (zh) * | 2013-05-23 | 2015-10-21 | 腾讯科技(深圳)有限公司 | 爆音检测方法和装置 |
KR20160148009A (ko) * | 2014-07-04 | 2016-12-23 | 인텔 코포레이션 | 자동 화자 검증 시스템에서의 리플레이 공격 검출 |
US10468032B2 (en) * | 2017-04-10 | 2019-11-05 | Intel Corporation | Method and system of speaker recognition using context aware confidence modeling |
US10692490B2 (en) * | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
KR102127126B1 (ko) * | 2018-08-03 | 2020-06-26 | 엘지전자 주식회사 | 음성 판독 장치 |
-
2018
- 2018-04-12 JP JP2018076734A patent/JP7056340B2/ja active Active
-
2019
- 2019-03-22 US US16/361,534 patent/US11081120B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58180600U (ja) * | 1982-05-26 | 1983-12-02 | オムロン株式会社 | 音声識別装置 |
JP2001285523A (ja) * | 2000-03-28 | 2001-10-12 | Kddi Corp | 呼判別装置 |
JP2010277023A (ja) * | 2009-06-01 | 2010-12-09 | Nippon Hoso Kyokai <Nhk> | 電話音声区間検出装置およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7056340B2 (ja) | 2022-04-19 |
US20190318753A1 (en) | 2019-10-17 |
US11081120B2 (en) | 2021-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102237718B1 (ko) | 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법 | |
KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
JP4740609B2 (ja) | 有声音および無声音の検出装置、並びにその方法 | |
JP6769299B2 (ja) | オーディオ符号化装置およびオーディオ符号化方法 | |
RU2719543C1 (ru) | Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке искусственного ограничения частотной полосы аудиосигнала | |
KR101444099B1 (ko) | 음성 구간 검출 방법 및 장치 | |
JP5439586B2 (ja) | 低複雑度の聴覚イベント境界検出 | |
US9330682B2 (en) | Apparatus and method for discriminating speech, and computer readable medium | |
US11335355B2 (en) | Estimating noise of an audio signal in the log2-domain | |
JP4021124B2 (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
KR101291672B1 (ko) | 노이즈 신호 부호화 및 복호화 장치 및 방법 | |
JP2008076636A (ja) | オーディオ信号補間方法及びオーディオ信号補間装置 | |
JP5390690B2 (ja) | 音声コーデックの品質向上装置およびその方法 | |
KR20150032390A (ko) | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 | |
US20150071463A1 (en) | Method and apparatus for filtering an audio signal | |
JP5694745B2 (ja) | 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム | |
JP2019184867A (ja) | 符号化音判定プログラム、符号化音判定方法、及び符号化音判定装置 | |
JP4739023B2 (ja) | デジタル音声信号におけるクリッキングノイズ検出 | |
JP7316093B2 (ja) | 音声雑音除去装置及びプログラム | |
CN110168639B (zh) | 数据编码检测 | |
US11978461B1 (en) | Transient audio watermarks resistant to reverberation effects | |
JP3753956B2 (ja) | 符号化装置 | |
JP6765124B2 (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
JP2009229583A (ja) | 信号検出方法及び装置 | |
KR101195599B1 (ko) | 잡음 처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220321 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7056340 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |