JP4351659B2 - Voiceprint password key system - Google Patents

Voiceprint password key system Download PDF

Info

Publication number
JP4351659B2
JP4351659B2 JP2005218997A JP2005218997A JP4351659B2 JP 4351659 B2 JP4351659 B2 JP 4351659B2 JP 2005218997 A JP2005218997 A JP 2005218997A JP 2005218997 A JP2005218997 A JP 2005218997A JP 4351659 B2 JP4351659 B2 JP 4351659B2
Authority
JP
Japan
Prior art keywords
voiceprint
file
key
feature
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005218997A
Other languages
Japanese (ja)
Other versions
JP2007034031A (en
Inventor
坤郎 余
歐陽彦杰
Original Assignee
積體數位股▲分▼有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 積體數位股▲分▼有限公司 filed Critical 積體數位股▲分▼有限公司
Priority to JP2005218997A priority Critical patent/JP4351659B2/en
Publication of JP2007034031A publication Critical patent/JP2007034031A/en
Application granted granted Critical
Publication of JP4351659B2 publication Critical patent/JP4351659B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、声紋パスワードキーのシステムに関するもので、特に電子資料(ファイルまたはフォルダ)に使用される声紋パスワードキーのシステムに関し、上記声紋パスワードキーは固定式または携帯式に設定されることにより、個人の電子資料の安全保護を強化することができる声紋パスワードキーのシステムに係るものである。   The present invention relates to a voice print password key system, and more particularly to a voice print password key system used for electronic materials (files or folders). The present invention relates to a voiceprint password key system that can enhance the security protection of electronic materials.

現在、個人的な生物特徴を利用して身分を識別するのは段々と個人的な身分識別の主な技術に形成されている。識別の技術において、現在識別できる生物特徴は顔識別、指紋識別、掌紋識別、眼球虹彩識別とデオキシリボ核酸(DNA)排列配対識別などが含まれている。一般として、電子資料の安全保護に対して只個人のパスワードを使用して保護するものであるが、単純な個人のパスワードでは有効な安全保護を提供することができず、例えばパスワードの外部漏れや解読成功などがある。そのため、電子資料の安全を高めるべく、電子資料の安全保護ではその他の保護の措置を求めなければならない。もし、識別技術の構造のコストと実際の操作を考慮した時、声紋による識別は相対的に個人の身分識別の用途に適合するということを発見することができる。   At present, identifying personal identity using personal biological features is gradually becoming a major technology for personal identification. In the identification technology, biological features that can be identified at present include face identification, fingerprint identification, palm print identification, eyeball iris identification, deoxyribonucleic acid (DNA) array pair identification, and the like. In general, a personal password is used to protect the security of electronic materials. However, a simple personal password cannot provide effective security protection. There are successful decoding. Therefore, in order to increase the safety of electronic materials, other measures for protection must be sought in the security protection of electronic materials. If the cost of the identification technology structure and the actual operation are taken into account, it can be found that the identification by voiceprint is relatively suitable for the purpose of personal identification.

従来の声紋認証システムとしては、異なる使用者が特有する音声のスペクトルを利用して使用者の身分を判別することにより、使用者が授権を経たか否かを決定する。上記のシステムでは下記の段階が含まれ、a)使用者が音声を発した後、音声の終点を検知する。b)音声のスペクトルから音声の特徴を取り出す。c)訓練の必要性を決定し、もし「Yes」であれば、音声の特徴を参考のサンプルとすると同時に、境界線を設定し、もし「No」であれば、次の段階に進む。d)音声の特徴と参考のサンプルを図案の比較を行う。e)比較の結果により両者の間隔の距離を計算する。f)計算の結果と設定の境界線を比較する。g)比較の結果により使用者が授権された使用者であるか否かを決定するようにとしたものがある(例えば、特許文献1を参照)。
中華民国公告番号第490655号
As a conventional voiceprint authentication system, it is determined whether or not the user has been authorized by discriminating the identity of the user by using a spectrum of voices that are unique to different users. The above system includes the following steps: a) After the user utters a voice, the end point of the voice is detected. b) Extract voice features from the voice spectrum. c) The necessity of training is determined. If “Yes”, the voice feature is used as a reference sample, and at the same time, a boundary is set. If “No”, the process proceeds to the next stage. d) Compare the design of the audio features and the reference sample. e) The distance between the two is calculated based on the comparison result. f) Compare the result of the calculation with the setting boundary. g) According to the comparison result, it is determined whether or not the user is an authorized user (see, for example, Patent Document 1).
Republic of China notice number 490655

上記のような従来の声紋認証システムにおいては、そのシステムは携帯電話に使用されるもので、音声のスペクトルの分析方法を利用して音声の独特な情報を取り出すことにより、使用者の判別を行う方法である。従来の音声認証システムにおいては、主にそれぞれのタイムフレーム(time frame)の主要数値を利用して使用者が設定した境界線と比較を行い、音声の始点と終点を決定した後、再びPrincen-Bradleyフィルターを利用して検知された音声の信号を転換することにより、対応する音声のスペクトルの図案を取得する。音声のスペクトルの図案と予め保存された参考の音声スペクトルのサンプルとの比較を行うことにより、使用者の声紋を判別する。簡単に言えば、従来の声紋認証システムにおいては、図案の整合と距離の演算を行わなければならず、もし演算の距離が境界線を超えていない場合、使用者は声紋の判別を通過することができる。しかし、上述した図案の整合と距離の演算を行う時、参考のサンプルとテストのサンプルとの間の距離を計算しなければならない。実際には、参考のサンプルが占用するデータベースの空間は相当大きいため、比較的大きいデータベースの空間が必要になると共に、さらに長いファイルの伝送時間が必要になるという問題点があった。また、個人の電子資料の安全保護において一旦参考のサンプルが大き過ぎると、保存空間が限られた保存メディアを承載するのに適用しないという問題点があった。このように、上記のような従来の声紋認証システムにおける参考のサンプルが大きい空間を占用するという問題点をさらに改善することにより、参考のサンプルを保存するデータベースの空間を節約することができるため、保存空間が限られた保存メディアまたは装置を承載する適用することができる。   In the conventional voiceprint authentication system as described above, the system is used for a mobile phone, and a user is discriminated by extracting unique information of voice by using a voice spectrum analysis method. Is the method. In the conventional voice authentication system, the main numerical value of each time frame (time frame) is mainly used for comparison with the boundary line set by the user, the voice start point and end point are determined, and then the Prince- By converting the detected audio signal using the Bradley filter, the corresponding audio spectrum design is obtained. The voiceprint of the user is determined by comparing the design of the speech spectrum with a reference speech spectrum sample stored in advance. In short, in a conventional voiceprint authentication system, the design must be matched and the distance calculated, and if the calculated distance does not exceed the boundary line, the user passes the voiceprint discrimination. Can do. However, the distance between the reference sample and the test sample must be calculated when performing the above-described design matching and distance calculation. Actually, the database space occupied by the reference sample is considerably large, so that a relatively large database space is required and a longer file transmission time is required. In addition, once a reference sample is too large for the safety protection of personal electronic materials, there is a problem in that it is not applicable to loading a storage medium with a limited storage space. Thus, by further improving the problem that the reference sample in the conventional voiceprint authentication system as described above occupies a large space, it is possible to save the space of the database storing the reference sample, The present invention can be applied to a storage medium or device having a limited storage space.

本発明はこのような問題点に鑑みて発明したものであって、その目的とするところは、声紋認証システムを採用し、音声の特徴を抜取る前に、前端処理(front-end processing)を利用して有効音声情報を原始入力音声資料から抜取り、無効音声情報を濾過して除去することにより、資料の処理量を減らすと共に、判別の確率を高めることができる声紋パスワードキーのシステムを提供しようとするものである。   The present invention was invented in view of such problems, and the object of the present invention is to adopt a voiceprint authentication system and perform front-end processing before extracting features of speech. We will provide a voiceprint password key system that reduces the amount of processing material and increases the probability of discrimination by extracting valid voice information from the original input voice data and filtering and removing invalid voice information. It is what.

その他に、本発明においては声紋認証システムを利用して声紋キー(voiceprint)を生成し、例えば一つの声紋特徴値を選出し、上記声紋キーを利用して電子資料の暗号化(encrypt)または復号化(decrypt)の演算を行うことにより、声紋パスワードキーを構成し、上記声紋パスワードキーは上記電子資料を保護するのに用いられることができる声紋パスワードキーのシステムを提供しようとするものである。   In addition, in the present invention, a voiceprint key (voiceprint) is generated using a voiceprint authentication system, for example, one voiceprint feature value is selected, and the electronic material is encrypted or decrypted using the voiceprint key. It is intended to provide a voiceprint password key system that can be used to protect the electronic material by constructing a voiceprint password key by performing a decryption operation.

本発明の第一の目的は、声紋キーを利用して電子資料の暗号化または復号化の演算を行うことにより、声紋パスワードキーを構成するため、電子資料の安全を高めることができる声紋パスワードキーのシステムを提供しようとするものである。   A first object of the present invention is to construct a voiceprint password key by performing an operation of encrypting or decrypting electronic material using a voiceprint key, so that a voiceprint password key that can enhance the safety of the electronic material. It is intended to provide a system.

本発明の第二の目的は、声紋認証システムを採用し、音声特徴の抜取りの訓練とテストの前に、前端処理を利用して有効音声情報を原始入力音声資料から抜取り、無効音声情報を濾過して除去することにより、資料の処理量を減らすと共に、判別の確率を高めることができる声紋パスワードキーのシステムを提供しようとするものである。   The second object of the present invention is to adopt a voiceprint authentication system, extract valid voice information from the original input voice data using front end processing, and filter invalid voice information before training and testing of voice feature extraction. Therefore, it is an object of the present invention to provide a voiceprint password key system that can reduce the processing amount of materials and increase the probability of discrimination by removing them.

本発明の第三の目的は、テストにおいて前端処理を利用して有効音声情報を減らし、そして音声特徴の抜取りを行い、さらにビタビ(Viterbi)演算法を利用して最も相似する径路を獲得することにより、モデルパラメーター(各状態の要望値と変異数)を計算して保存することができ、さらに音声の訓練またはテスト時においてはモデルパラメーターを計算し、音声特徴の間の相似する確率をテストするだけで声紋特徴値を獲得することができるため、訓練とテストの作業を簡単にすることができる声紋パスワードキーのシステムを提供しようとするものである。   The third object of the present invention is to reduce the effective speech information by using the front end processing in the test, extract the speech feature, and obtain the most similar path by using the Viterbi arithmetic method. Allows you to calculate and store model parameters (desired values and number of mutations for each state), and also to calculate model parameters and test similar probabilities between speech features during speech training or testing It is intended to provide a voiceprint password key system that can simplify training and testing operations because voiceprint feature values can be acquired by itself.

上記目的を達成するために、本発明による声紋パスワードキーのシステムは、下記のようになるものである。すなわち、
声紋認証システム(1)および声紋キー(Kc)を用いた構成になっている。上記声紋認証システム(1)には、特徴抜取部が設けられている。上記特徴抜取部は、原始入力音声資料から前端処理部によって得られた有効音声情報に対して線形予測ケプストラム係数とメル周波数ケプストラム係数を採用することによって音声特徴を取得するようになっている。上記声紋認証システム(1)は、上記音声特徴からビタビ演算法を用いて当該音声特徴に最も相似する経路を得ることによって声紋特徴ファイル(31)を獲得するようになっている。上記声紋特徴ファイル(31)は、声紋特徴値を生成するのに用いられ、上記声紋キー(Kc)は、上記声紋特徴値から選出されたものであり、電子資料ファイル(32)の暗号化と復号化の演算を行うのに用いられるようになっている。上記声紋特徴ファイル(31)と入力音声との誤差が予定値より低くなった場合には音声テスト作業を通過したと見なして上記電子資料ファイル(32)が開くのを許可するようになっている。さらに上記誤差が予定値より高くなった場合には音声テスト作業を通過しないと見なして上記電子資料ファイル(32)が開くのを許可しないように構成されている。
In order to achieve the above object, a voiceprint password key system according to the present invention is as follows. That is,
The voice print authentication system (1) and the voice print key (Kc) are used. The voiceprint authentication system (1) is provided with a feature extraction unit. The feature extraction unit acquires a speech feature by adopting a linear prediction cepstrum coefficient and a mel frequency cepstrum coefficient for the effective speech information obtained from the original input speech material by the front end processing unit. The voiceprint authentication system (1) obtains a voiceprint feature file (31) by obtaining a route most similar to the voice feature using the Viterbi calculation method from the voice feature. The voiceprint feature file (31) is used to generate a voiceprint feature value, and the voiceprint key (Kc) is selected from the voiceprint feature value, and the electronic document file (32) is encrypted. It is used to perform decoding operations. When the error between the voiceprint feature file (31) and the input voice is lower than a predetermined value, it is considered that the voice test work has been passed and the electronic material file (32) is permitted to be opened. . Further, when the error becomes higher than a predetermined value, it is regarded that the voice test work is not passed, and the electronic material file (32) is not permitted to be opened.

上記声紋キー(Kc)は、パーソナルコンピュータ、ノート型コンピュータ、パーソナル・デジタル・アシスタンスまたは携帯電話に適用される固定式の声紋パスワードキーとなっていてもよい。また、上記声紋特徴ファイル(31)を暗号化および復号化する一般のキー(K)を備えたものとし、上記声紋特徴ファイル(31)は、上記キー(K)によって暗号化された状態で保存するようにしてもよい。また、上記声紋キー(Kc)は、ネットワークまたは記録メディアの伝送に適用される携帯式の声紋パスワードキーとなっていてもよい。また、上記声紋特徴ファイル(41)を暗号化および復号化する一般のキー(K)を備えており、上記声紋特徴ファイル(41)は上記キー(K)によって暗号化された状態で保存され、上記電子資料ファイル(42)は上記携帯式の声紋パスワードキーによって暗号化された状態で保存されるようになっており、暗号化された上記声紋特徴ファイル(41)と暗号化された上記電子資料ファイル(42)は、直列に接続された直列ファイル(40)となるようにしてもよい。また、情報認証コード生成構造を利用して、暗号化された上記声紋特徴ファイル(41)と暗号化された上記電子資料ファイル(42)との上記直列ファイル(40)に情報認証コードを生成させ、復号化を行う時、上記情報認証コードと声紋特徴ファイル(41)および上記電子資料ファイル(42)に対して認証コードの比較を行うようになっていてもよい。また、キー(K)を利用して上記直列ファイル(40)の情報認証コードを暗号化の演算を行うことにより、上記情報認証コードを暗号化し、さらに上記キー(K)は上記情報認証コードを復号化の演算を行うのに用いられるようにしてもよい。また、上記声紋認証システム(1)は、上記前端処理部および上記特徴抜取部に加えて保存部および運算部を備えた構成になっており、上記前端処理部は、上記声紋認証システム(1)の原始入力音声資料を前端処理するのに用いられることにより、有効音声情報と無効音声情報との区分を完成してから、再び有効音声情報を抜取るようになっており、上記保存部は、上記音声特徴を保存するのに用いられるようになっており、上記運算部は、保存された音声特徴と、入力された音声特徴を運算するのに用いられるようになっているようにしてもよい。また、上記声紋認証システム(1)には、使用者の身分を確認するID番号が未登録であった場合に実行される訓練システム(10)が含まれ、上記訓練システム(10)は、上記前端処理部と上記特徴抜取部を使用することにより、原始入力音声資料から音声特徴を獲得するようになっているものであってもよい。また、上記訓練システム(10)は、他にビタビ演算法を使用することにより、上記音声特徴から当該音声特徴に最も相似する径路を獲得することにより、上記声紋特徴ファイル(31)としてのモデルパラメーターを計算して保存するようになっているものであってもよい。また、上記声紋認証システム(1)には、使用者の身分を確認するID番号が登録済みであった場合に実行されるテストシステム(20)が含まれ、上記テストシステム(20)は、上記前端処理部と上記声紋認証システム(1)を使用することにより、原始入力音声資料から音声特徴を獲得するようになっているものであってもよい。 The voiceprint key (Kc) may be a fixed voiceprint password key applied to a personal computer, notebook computer, personal digital assistance, or mobile phone. The voiceprint feature file (31) is provided with a general key (K) for encrypting and decrypting the voiceprint feature file (31), and the voiceprint feature file (31) is stored in an encrypted state by the key (K). You may make it do. The voiceprint key (Kc) may be a portable voiceprint password key applied to network or recording medium transmission. The voiceprint feature file (41) includes a general key (K) for encrypting and decrypting the voiceprint feature file (41), and the voiceprint feature file (41) is stored in an encrypted state by the key (K). The electronic material file (42) is stored in an encrypted state by the portable voiceprint password key, and the encrypted voiceprint feature file (41) and the encrypted electronic material are stored. The file (42) may be a serial file (40) connected in series. Further, an information authentication code is generated in the serial file (40) of the encrypted voice print feature file (41) and the encrypted electronic material file (42) by using the information authentication code generation structure. When decrypting, the authentication code may be compared with the information authentication code, the voiceprint feature file (41), and the electronic material file (42). Further, the information authentication code is encrypted by performing an operation of encrypting the information authentication code of the serial file (40) using the key (K), and the key (K) further stores the information authentication code. It may be used to perform a decoding operation. The voiceprint authentication system (1) includes a storage unit and a calculation unit in addition to the front end processing unit and the feature extraction unit, and the front end processing unit includes the voiceprint authentication system (1). Is used for front end processing of the original input audio material, and after completing the classification of the effective audio information and the invalid audio information, the effective audio information is extracted again. The voice feature may be used to store the voice feature, and the calculation unit may be used to calculate the stored voice feature and the input voice feature. . The voiceprint authentication system (1) includes a training system (10) that is executed when an ID number for confirming the identity of the user is not registered. The training system (10) By using the front end processing unit and the feature extraction unit, the voice feature may be acquired from the original input voice material. Also, the training system (10), by using the Viterbi calculation method to another, by acquiring the most similar path to the audio features from the speech features, the model parameters as the voiceprint characteristic file (31) May be calculated and stored. The voiceprint authentication system (1) includes a test system (20) that is executed when an ID number for confirming the identity of the user has been registered. The test system (20) By using the front end processing unit and the voiceprint authentication system (1), a voice feature may be obtained from the original input voice material.

本発明の声紋パスワードキーのシステムによれば、声紋キーを利用して電子資料ファイルの暗号化または復号化の演算を行うことにより、声紋パスワードキーを構成するため、電子資料ファイルの安全を高めることができるという利点がある。 According to the voiceprint password key system of the present invention, the voiceprint password key is constructed by performing the operation of encrypting or decrypting the electronic document file by using the voiceprint key, thereby enhancing the safety of the electronic document file. There is an advantage that can be.

本発明の声紋パスワードキーのシステムによれば、声紋認証システムを採用し、音声特徴の抜取りの訓練とテストの前に、前端処理を利用して有効音声情報を原始入力音声資料から抜取り、無効音声情報を濾過して除去することにより、資料の処理量を減らすと共に、判別の確率を高めることができるという利点がある。   According to the voiceprint password key system of the present invention, the voiceprint authentication system is adopted, and before the training and testing of the voice feature extraction, the valid voice information is extracted from the original input voice data using the front end processing, and the invalid voice is recorded. By filtering out information, there is an advantage that the processing amount of the material can be reduced and the probability of discrimination can be increased.

本発明の声紋パスワードキーのシステムによれば、テストにおいて前端処理を利用して有効音声情報を減らし、そして音声特徴の抜取りを行い、さらにビタビ(Viterbi)演算法を利用して最も相似する径路を獲得することにより、モデルパラメーター(各状態の要望値と変異数)を計算して保存することができ、さらに音声の訓練またはテスト時においてはモデルパラメーターを計算し、音声特徴の間の相似する確率をテストするだけで声紋特徴値を獲得することができるため、訓練とテストの作業を簡単にすることができるという利点がある。   According to the voice print password key system of the present invention, the effective voice information is reduced by using the front end processing in the test, the voice feature is extracted, and the most similar path is obtained by using the Viterbi arithmetic method. By acquiring, model parameters (desired values and number of mutations in each state) can be calculated and stored, and also during speech training or testing, model parameters are calculated and the probability of similarity between speech features Since the voiceprint feature value can be obtained only by testing the training, there is an advantage that the work of training and testing can be simplified.

本発明の実施の形態について、以下、図面を参照して説明する。   Embodiments of the present invention will be described below with reference to the drawings.

本発明の実施例の声紋パスワードキーのシステムは声紋認証システムを採用することにより、原始入力音声資料に対して訓練またはテストの作業を行う。図1は声紋パスワードキーのシステムが採用する声紋認証システムによる流れのブロック図である。   The voiceprint password key system according to the embodiment of the present invention employs a voiceprint authentication system to perform training or test work on the original input voice material. FIG. 1 is a block diagram of the flow of the voiceprint authentication system employed by the voiceprint password key system.

図1を参照すると、本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システム1には訓練システム10およびテストシステム20が含まれることにより、原始入力音声資料に対して訓練またはテストの作業を行う。声紋認証システム1には他に前端処理部、特徴抜取部、保存部および運算部が含まれる。前端処理部と特徴抜取部は訓練システム10とテストシステム20が前端処理と特徴抜取りを行うのに用いられ、保存部は音声特徴を保存するのに用いられ、運算部は保存された音声特徴と入力された音声特徴を運算するのに用いられる。   Referring to FIG. 1, a voiceprint authentication system 1 employed by a voiceprint password key system according to an embodiment of the present invention includes a training system 10 and a test system 20, so that training or testing of a source input voice material is performed. Do work. In addition, the voiceprint authentication system 1 includes a front end processing unit, a feature sampling unit, a storage unit, and a calculation unit. The front end processing unit and the feature extraction unit are used by the training system 10 and the test system 20 to perform front end processing and feature extraction, the storage unit is used to store the audio features, and the arithmetic unit is used to store the stored audio features. Used to compute input speech features.

使用者が本発明の声紋認証システム1に進入しようとする時、先ずID番号を入力することにより、身分の確認を行う。それから、声紋認証システム1は入力されたID番号に基づいて、入力されたID番号がすでに登録されたか否かをデータベースで検索する。もし入力されたID番号が未登録であれば、訓練システム10に進入して音声の訓練作業を行うことにより、入力されたID番号の音声資料の登録と保存を行う。もし入力されたID番号がすでに登録された場合、テストシステム20に進入して音声のテスト作業を行うことにより、入力されたID番号の音声の特徴がすでに保存されている入力されたID番号の音声資料と符合するか否かを判別する。   When a user intends to enter the voiceprint authentication system 1 of the present invention, first, an ID number is input to confirm the status. Then, the voiceprint authentication system 1 searches the database for whether or not the input ID number has already been registered based on the input ID number. If the input ID number is unregistered, the voice material of the input ID number is registered and stored by entering the training system 10 and performing voice training work. If the input ID number has already been registered, the voice feature of the input ID number is already stored by entering the test system 20 and performing a voice test operation. It is determined whether or not the audio material matches.

音声の特徴を抜取る前に、前端処理部を利用して有効音声情報を原始入力音声資料から抜取り、無効音声情報を濾過して除去する。本発明においては短間隔エネルギー(Short-Energy)とゼロ交差率(Zero-Crossing Rate)を含んだ検知を行う。本発明においてはガウシアン分布確率を結合した計算方法を採用し、その方程式は下記の如くである。

Figure 0004351659
その中、
Figure 0004351659
は原始信号で複数個のD次元の音フレームに分け、
Figure 0004351659
は所属する確率であり、
Figure 0004351659
は背景背の雑信号の要望値であり、Σi は背景の雑信号の変異数である。ここで、
Figure 0004351659
の中のD=256は一つの定数で、故に省略して計算に入れず、方程式(1)を下記の如く簡単にする。
Figure 0004351659
上記方程式の指数の運算は運算のデータを運算する上では過大になるかもしれず、故にそれを対数に取った後、方程式(2)を下記の如く簡単にする。
Figure 0004351659
原始入力音声資料前端256点を抜取り、短間隔エネルギーとゼロ交差率の要望値と変異数を計算し、それから二個の数値と原始入力音声資料を方程式(3)に代入して運算を行う。短間隔エネルギーとゼロ交差率の分布確率を利用して有効音声情報と無効音声情報を区分し、無効音声情報を濾過して除去することにより、資料の量を減らすだけではなく、有効音声情報を正確に抜取ることができる。 Before extracting the features of the sound, the effective sound information is extracted from the original input sound material by using the front end processing unit, and the invalid sound information is filtered and removed. In the present invention, detection including a short interval energy (Short-Energy) and a zero-crossing rate is performed. In the present invention, a calculation method combining the Gaussian distribution probabilities is adopted, and the equation is as follows.
Figure 0004351659
Among them,
Figure 0004351659
Is a primitive signal divided into multiple D-dimensional sound frames,
Figure 0004351659
Is the probability of belonging,
Figure 0004351659
Is the desired value of the background miscellaneous signal, and Σ i is the number of variations of the background miscellaneous signal. here,
Figure 0004351659
D = 256 in is a constant, so it is omitted and not included in the calculation, and equation (1) is simplified as follows.
Figure 0004351659
The exponential operation of the above equation may be over-running the operation data, so after taking it logarithm, equation (2) is simplified as follows.
Figure 0004351659
Extract 256 points from the front edge of the original input audio material, calculate the desired value and the number of mutations of short interval energy and zero crossing rate, and then substitute the two numerical values and the original input audio material into equation (3) for the calculation. By separating effective speech information and invalid speech information using short interval energy and zero-crossing rate distribution probability, and filtering and removing invalid speech information, not only reducing the amount of data but also valid speech information Can be extracted accurately.

特徴抜取部において特徴の抜取りを行う上で、本発明においては二個の音声判別特徴のモデルパラメーターを採用するもので、線形予測ケプストラム係数(Linear Prediction Cepstrum Coefficient,LPCC)とメル周波数ケプストラム(Mel Frequency Cepstrum Coefficient,MFCC)が含まれる。両者にはそれぞれ12個のケプストラムモデルパラメーター(cepstral coefficients)と12個の一階ケプストラムモデルパラメーター(delta-cepstral coefficients)が含まれる。ケプストラムモデルパラメーターcnを時間に対して偏微分を行う。

Figure 0004351659
Kは音フレームの数を考慮することができる。
一階ケプストラムモデルパラメーターの公式(4)が複雑過ぎて、故にそれを簡単にし、下記の各式は前後各二個のタイムフレームのみを考慮した時、方程式は下記の如く簡単化される。
Figure 0004351659
方程式(5)から(9)の中、Cnはn階の特徴値であり、Lは信号中のタイムフレームの総数であり、iはタイムフレームの番号である。 In the present invention, the feature extraction unit employs model parameters of two speech discrimination features in the present invention. A linear prediction cepstrum coefficient (LPCC) and a mel frequency cepstrum (Mel Frequency) are used. Cepstrum Coefficient (MFCC). Both include 12 cepstrum model parameters (cepstral coefficients) and 12 first-order cepstrum model parameters (delta-cepstral coefficients). Cepstral model parameter c n is partially differentiated with respect to time.
Figure 0004351659
K can take into account the number of sound frames.
When the first-order cepstrum model parameter formula (4) is too complex and therefore simplified, the equations are simplified as follows, considering only two time frames before and after:
Figure 0004351659
In equations (5) to (9), Cn is an nth-order feature value, L is the total number of time frames in the signal, and i is the time frame number.

図2に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる状態と音フレームとの関係の説明図が掲示される。音声を訓練する上で、音声には所謂「状態」の観念が形成され、状態は発音時における口の形と声道の変化である。一般的に言えば、毎回話す時には口の形は必ず変化を有するもので、故に毎回の状態は全て一個の音声変化の特徴の表れである。時に一個の単音で反って多数の状態が含まれる可能性がある。一個の状態は音フレームと同様に固定したサイズを有するものではなく、通常、一個の状態には数個または数十個の音フレームが含まれる。   FIG. 2 shows an explanatory diagram of the relationship between the state and the sound frame by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. In training speech, a so-called “state” concept is formed in speech, and the state is a change in mouth shape and vocal tract during pronunciation. Generally speaking, every time you speak, the shape of your mouth always changes, so every state is a manifestation of a single voice change feature. Sometimes a single note warps and many states are included. One state does not have a fixed size like a sound frame, and usually one state includes several or tens of sound frames.

図2を参照すると、第一状態には三個の音フレームが含まれ、第二状態には六個の音フレームが含まれ、さらに第三状態には四個の音フレームが含まれる。本発明において、先ず均等切り方式を利用して上記状態と音フレームとの間の関係の仮定を行う。それから、本発明において上記開始のモデルパラメーター(要望値と変異数を含み)を計算する。上記開始のモデルパラメーターを利用して音フレームと状態との関係を新たに分配することにより、新切点を獲得する。それから、上記新切点を利用してそれぞれの状態が対応する音フレームを新たに計算する。それから、最大相似する確率が再び上昇しないようになるまで、繰り返し音フレームと状態との間の関係を新たに分配し、さらにそれぞれの状態が対応する音フレームを新たに計算する。 Referring to FIG. 2, the first state includes three sound frames, the second state includes six sound frames, and the third state includes four sound frames. In the present invention, an assumption of the relationship between the state and the sound frame is first made using a uniform cut method. Then, in the present invention, the starting model parameters (including the desired value and the number of mutations) are calculated. A new cut point is obtained by newly distributing the relationship between the sound frame and the state using the model parameter of the start. Then, a new sound frame corresponding to each state is calculated using the new cut point. Then, until the probability of similarity to the maximum is not to rise again, new distributing the relationship between the repetition sound frame and status, further each state newly calculate the corresponding sound frames.

図3に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる音フレームと状態との開始の分配モデルの説明図が掲示される。上記開始の分配モデルは三個の音声のサンプルを例に挙げて均等に分ける動作を行う。   FIG. 3 is an explanatory diagram of a distribution model for starting sound frames and states by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. The starting distribution model performs an operation of equally dividing three audio samples as an example.

開始のモデルにおいて音声を均等に分ける動作を行い、均等に分けた後、整数に割り切ることができないかもしれず、余った音フレームは第一個と最後一個の状態に平等に分ける。再び図3を参照すると、分配のモデルにおいて、音声サンプルを均等に分けるのに三つの要素を考慮しなければならず、a)第一個の音フレームは必ず第一個の状態に属する。b)最後一個の音フレームは必ず最後一個の状態に属する。c)音フレームの状態の変化は不変だけであったり、または次まで変化したりするものである。ガウシアン分布確率を採用してそれぞれの音フレームがそれぞれの状態に属する確率を計算し、さらにビタビ演算法を利用して最も相似する径路を獲得する。   In the starting model, the operation of dividing the sound equally is performed, and after dividing it evenly, it may not be divisible into an integer, and the remaining sound frames are divided equally into the first and last states. Referring again to FIG. 3, in the distribution model, three factors must be considered in order to evenly divide the audio samples: a) The first sound frame always belongs to the first state. b) The last one sound frame always belongs to the last one state. c) The change in the state of the sound frame is only unchanged or changes to the next. Using the Gaussian distribution probability, the probability that each sound frame belongs to each state is calculated, and the most similar path is obtained using the Viterbi arithmetic method.

図4に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる状態転換の説明図が掲示される。図4を参照すると、三個の状態において、L個の音フレームの可能状態変換の方向が示される。×印の付いている音フレームは不可能状態に属すると見なし、矢印の方向は可能状態の変化径路と見なす。   FIG. 4 shows an explanatory diagram of state change by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. Referring to FIG. 4, in three states, directions of possible state conversion of L sound frames are shown. A sound frame with a cross is considered to belong to the impossible state, and the direction of the arrow is considered to be a change path of the possible state.

図5に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる最も相似する径路の説明図が掲示される。図5を参照すると、抜取り特徴の最も相似する径路には第一状態では第一から第三の音フレームが含まれ、第二状態では第四から第六の音フレームが含まれ、さらに第三状態では第七から第十の音フレームが含まれる。   FIG. 5 is an explanatory diagram of the most similar path by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. Referring to FIG. 5, the most similar path of the sampling feature includes the first to third sound frames in the first state, the fourth to sixth sound frames in the second state, and further includes the third sound frame. The state includes the seventh to tenth sound frames.

図6に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる音フレームを均等に分ける説明図が掲示される。図6を参照すると、三個の音声サンプルは三個の状態における開始のモデルは均等に分けた後の分布を採用する。第一音声サンプルのそれぞれの音声サンプルは三個の音フレームを均等に分けた後、残りの二個の音フレームはそれぞれ第一状態と第二状態に分配される。第二音声サンプルのそれぞれの音声サンプルは四個の音フレームを均等に分ける。第三音声サンプルのそれぞれの音声サンプルは三個の音フレームを均等に分けた後、残りの一個の音フレームは第一状態に分配される。計算した後、その最大の相似する確率は2157である。   FIG. 6 is an explanatory diagram for equally dividing sound frames by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. Referring to FIG. 6, the three speech samples adopt a distribution after the start model in three states is equally divided. After each sound sample of the first sound sample equally divides three sound frames, the remaining two sound frames are distributed to a first state and a second state, respectively. Each audio sample of the second audio sample equally divides four sound frames. After each sound sample of the third sound sample equally divides the three sound frames, the remaining sound frame is distributed to the first state. After calculation, its maximum similarity probability is 2157.

図7に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる第一次新たに音フレームを分配する説明図が掲示される。図7を参照すると、第一次新たに音フレームを分配した後、その最大の相似する確率は3171まで上昇する。   FIG. 7 is an explanatory diagram for firstly distributing sound frames by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. Referring to FIG. 7, after first distributing a new sound frame, the maximum similarity probability increases to 3171.

図8に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる第二次新たに音フレームを分配する説明図が掲示される。図8を参照すると、第二次新たに音フレームを分配した後、その最大の相似する確率は3571まで上昇する。   FIG. 8 is an explanatory diagram for distributing a second sound frame by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. Referring to FIG. 8, after the second new sound frame is distributed, the maximum similarity probability increases to 3571.

図9に本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる最良な音フレームを分配する説明図が掲示される。図9を参照すると、数次新たに音フレームを分配した後、その最大の相似する確率である3571は再び上昇しないため、最良な音フレームの分配と見なす。各状態の要望値と変異数を計算してモデルパラメーターとし、モデルパラメーターは声紋特徴ファイルを形成することができ、上記声紋特徴ファイルはデータベースに保存することができる。   FIG. 9 is an explanatory diagram for distributing the best sound frame by the voiceprint authentication system employed by the voiceprint password key system according to the embodiment of the present invention. Referring to FIG. 9, after the sound frame is newly distributed several times, the maximum similarity probability 3571 does not rise again, so it is regarded as the best sound frame distribution. The desired value of each state and the number of mutations are calculated as model parameters. The model parameters can form a voiceprint feature file, and the voiceprint feature file can be stored in a database.

再び図1を参照すると、訓練システム10に進入して音声訓練の作業を行う場合、方程式(1)から(9)を運算することにより、有効訓練音声特徴を獲得することができる。それから、ビタビ演算法を利用して最も相似する径路を獲得する。それから、各状態の要望値と変異数を計算してモデルパラメーターとすることにより、音声訓練の作業を完成することができる。音声訓練において、その最大相似する確率が予定された参考値より小さくなると、音声訓練を通過することができないと共に、訓練の作業を終えるため、新たに声紋認証システム1を操作しなければならない。それに反して、その最大相似する確率が予定された参考値より大きくなると、音声訓練を通過することにより、モデルパラメーターを声紋特徴ファイルと設定し、上記声紋特徴ファイルを一般のキーを利用して暗号化(encryption)を行うと共に、上記声紋認証システム1に保存することができる。 Referring to FIG. 1 again, when entering the training system 10 and performing speech training, effective training speech features can be obtained by computing equations (1) to (9). Then, the most similar path is obtained using the Viterbi arithmetic method. Then, the task of voice training can be completed by calculating the desired value and the number of mutations in each state and using them as model parameters. In speech training, the probability of similarity to the maximum is less than the scheduled reference value, the inability to pass the voice training, to finish the work of training, it must operate a new voiceprint authentication system 1. On the other hand, when the probability of similarity to the maximum becomes larger than the planned reference value, the model parameter is set as a voice print feature file by passing the voice training, and the voice print feature file is set using a general key. Encryption can be performed and stored in the voiceprint authentication system 1.

再び図1を参照すると、同様にテストシステム20に進入して音声テストの作業を行う場合、方程式(1)から(9)を運算することにより、有効テスト音声特徴を獲得することができる。また、上記声紋特徴ファイルの復号化(decryption)を行うことにより、声紋認証システム1は声紋認証の作業を行うことができる。   Referring to FIG. 1 again, when the test system 20 is entered and the voice test operation is performed in the same manner, the effective test voice feature can be obtained by calculating equations (1) to (9). Further, by performing the decryption of the voiceprint feature file, the voiceprint authentication system 1 can perform the voiceprint authentication work.

再び図1を参照すると、それから、有効テスト音声特徴とモデルパラメーターとの間の相似する確率を運算することにより、識別の結果を出力する。音声の識別において、その最小の相似する確率が予定された参考値より大きくなると、音声の識別を通過することにより、声紋認証システム1に進入することができる。それに反して、その最小の相似する確率が予定された参考値より小さくなると、音声の識別を通過することができなくなると共に、テストの作業を終えてしまうため、声紋認証システム1から離れなければならなくなる。 Referring again to FIG. 1, the identification result is then output by computing the similarity probability between the valid test speech feature and the model parameter. In the voice identification, when the minimum similarity probability becomes larger than the scheduled reference value, the voiceprint authentication system 1 can be entered by passing the voice identification. On the other hand, if the minimum similarity probability is smaller than the planned reference value, the voice identification cannot be passed and the test work is completed. Disappear.

図10に本発明の実施例1の声紋パスワードキーのシステムが固定式の声紋パスワードキーを利用して暗号化と復号化を行う流れのブロック図が掲示される。図10を参照すると、本発明の実施例1の声紋パスワードキーのシステム3には声紋キーKcが含まれる。声紋キーKcは電子資料ファイル32の暗号化または復号化の運算を行うのに用いられることにより、固定式の声紋パスワードキーが構成される。上記固定式の声紋パスワードキーはパーソナルコンピューター(PC)、ノート型コンピューター(NB)、パーソナル・デジタル・アシスタンス(PDA)または携帯電話(Mobile Phone)などに適用する。 FIG. 10 is a block diagram showing a flow in which the voiceprint password key system according to the first embodiment of the present invention performs encryption and decryption using a fixed voiceprint password key. Referring to FIG. 10, the voiceprint password key system 3 according to the first embodiment of the present invention includes a voiceprint key Kc . The voiceprint key Kc is used to calculate the encryption or decryption of the electronic material file 32 , thereby forming a fixed voiceprint password key. The fixed voiceprint password key is applied to a personal computer (PC), a notebook computer (NB), a personal digital assistance (PDA), a mobile phone, or the like.

再び図1、10を参照すると、本発明の声紋パスワードキーのシステム3は声紋認証システム1の訓練システム10を採用する。声紋認証システム1は声紋特徴値を生成するのに用いられ、上記声紋特徴値から上記声紋キーKcを選出する。訓練システム10は声紋特徴ファイル31を提供することができ、そして好ましくは声紋特徴ファイル31から32個のバイト(bite)を抜取る。所謂、声紋キーKcは電子資料ファイル32の保存端および抜取端で、全て同じ声紋の特徴を入力しなければならない。電子資料ファイル32を保存する時、予め声紋認証システム1の訓練システム10の訓練作業を利用して声紋キーKcを獲得することができる。この時、声紋キーKcは電子資料ファイル32の暗号化の運算を行うのに用いられ、さらに暗号化された電子資料ファイル32を特定の位置に保存することにより、電子資料ファイル32の暗号化の作業を完成する。本発明においては好ましくは先進的な暗号化標準(Advanced Encryption Standard、AES)および対称式の暗号化方法を採用して暗号化の運算を行う。 1 and 10 again, the voiceprint password key system 3 of the present invention employs the training system 10 of the voiceprint authentication system 1. The voiceprint authentication system 1 is used to generate a voiceprint feature value, and selects the voiceprint key Kc from the voiceprint feature value. The training system 10 can provide a voiceprint feature file 31 and preferably extracts 32 bits from the voiceprint feature file 31. The so-called voiceprint key Kc is the storage end and the extraction end of the electronic material file 32 , and all the same voiceprint features must be input. When the electronic material file 32 is stored, the voiceprint key Kc can be acquired in advance by using the training work of the training system 10 of the voiceprint authentication system 1. At this time, the voiceprint key Kc is used to calculate the encryption of the electronic material file 32. Further, by storing the encrypted electronic material file 32 in a specific position, the encryption of the electronic material file 32 is performed. Complete the work. In the present invention, the encryption operation is preferably performed by employing an advanced encryption standard (AES) and a symmetric encryption method.

再び図1、10を参照すると、電子資料ファイル32を抜取る時、先ず声紋特徴ファイル31を一般のキーKを利用して復号化の運算を行う。それから、声紋認証システム1のテストシステム20を利用して音声テスト作業を行うことにより、声紋特徴ファイル31と入力された音声との比較を行う。もし声紋特徴ファイル31と入力声音との誤差が予定値より低くなった場合、音声テスト作業を通過したと見なし、一旦音声テスト作業を通過すると、電子資料ファイル32が開くのを許可することができる。それに反して、もし声紋特徴ファイル31と入力声音との誤差が予定値より高くなった場合、音声テスト作業を通過していないと見なし、一旦音声テスト作業を通過しないと、電子資料ファイル32が開くのを許可しないように構成される。 Referring to FIGS. 1 and 10 again, when extracting the electronic material file 32 , the voice print feature file 31 is first decrypted using a general key K. Then, voice test work is performed using the test system 20 of the voiceprint authentication system 1 to compare the voiceprint feature file 31 with the input voice. If the error between the voiceprint feature file 31 and the input voice sound is lower than the expected value, it is considered that the voice test work has passed, and once the voice test work is passed, the electronic material file 32 can be permitted to open. . On the other hand, if the error between the voiceprint feature file 31 and the input voice sound is higher than the expected value, it is considered that the voice test work has not been passed, and once the voice test work is not passed , the electronic material file 32 is opened. It is configured not to allow

図11に本発明の実施例2の声紋パスワードキーのシステムが携帯式の声紋パスワードキーを利用して暗号化と復号化を行う流れのブロック図が掲示される。図11を参照すると、本発明の実施例2の声紋パスワードキーのシステム4は声紋キーKcを有する。声紋キーKcは電子資料ファイル42の暗号化または復号化の運算を行うのに用いられることにより、携帯式の声紋パスワードキーが構成される。上記携帯式の声紋パスワードキーはコンパクトディスク(CD)、フレキシブルディスク(Flexible Disk)、フラッシュディスク(Flash Disk)、MOディスク(MO Disk)またはネットワークの伝送などに適用する。 FIG. 11 is a block diagram showing a flow in which the voiceprint password key system according to the second embodiment of the present invention performs encryption and decryption using a portable voiceprint password key. Referring to FIG. 11, the system 4 of the voiceprint of Example 2 of the present invention that have a voiceprint key Kc. The voiceprint key Kc is used to calculate the encryption or decryption of the electronic material file 42 , thereby forming a portable voiceprint password key. The portable voice print password key is applied to a compact disk (CD), a flexible disk (Flexible Disk), a flash disk (Flash Disk), an MO disk (MO Disk), or network transmission.

再び図1、11を参照すると、本発明の声紋パスワードキーのシステム4は声紋認証システム1の訓練システム10を採用し、訓練システム10は声紋特徴ファイル41を提供することができる。声紋認証システム1は声紋特徴値を生成するのに用いられ、上記声紋特徴値から上記声紋キーKcを選出する。電子資料ファイル42を保存する時、予め声紋認証システム1の訓練システム10の訓練作業を利用して声紋キーKcを獲得することができる。この時、声紋特徴ファイル41を電子資料ファイル42に嵌入し、すなわち声紋特徴ファイル41は電子資料ファイル42の2Kから6Kのバイトしか占めていない。声紋キーKcを利用して電子資料ファイル42の暗号化の運算を行うことにより、暗号化された電子資料ファイル42が生成される。また、一般のキーKを利用して声紋特徴ファイル41に対して暗号化の運算を行うことにより、暗号化された声紋特徴ファイル41が生成される。さらに、暗号化された声紋特徴ファイル41と暗号化された電子資料ファイル42を直列に接続することにより、直列ファイル40を獲得する。その他に、暗号化された声紋特徴ファイル41と暗号化された電子資料ファイル42との直列ファイル40を、情報認証コード生成構造を経て情報認証コードを生成させる。本発明においては好ましくは安全な要約アルゴリズム(Secure Hash Algorithm、SHA)の運算法を採用して情報認証コードを生成し、さらに一般のキーKを利用して上記情報認証コードの暗号化の運算を行うことにより、暗号化された情報認証コードを生成する。上記暗号化された電子資料ファイル42、声紋特徴ファイル41と情報認証コードは携帯式のファイルを形成することができ、すなわち電子資料ファイル42の暗号化作業を完成し、ネットワークまたは記録メディアを経て伝送することができる。 1 and 11, the voiceprint password key system 4 of the present invention employs the training system 10 of the voiceprint authentication system 1, and the training system 10 can provide a voiceprint feature file 41. The voiceprint authentication system 1 is used to generate a voiceprint feature value, and selects the voiceprint key Kc from the voiceprint feature value. When the electronic material file 42 is stored, the voiceprint key Kc can be acquired in advance by using the training work of the training system 10 of the voiceprint authentication system 1. At this time, the voiceprint feature file 41 is inserted into the electronic material file 42, that is, the voiceprint feature file 41 occupies only 2K to 6K bytes of the electronic material file 42. The encrypted electronic material file 42 is generated by performing encryption calculation of the electronic material file 42 using the voiceprint key Kc. Further, by performing encryption operation on the voiceprint feature file 41 using a general key K, an encrypted voiceprint feature file 41 is generated. Further, the serial file 40 is obtained by connecting the encrypted voice print feature file 41 and the encrypted electronic material file 42 in series. In addition, an information authentication code is generated from the serial file 40 of the encrypted voice print feature file 41 and the encrypted electronic material file 42 through an information authentication code generation structure. In the present invention, preferably, an information authentication code is generated by employing a secure summarization algorithm (SHA) calculation method, and the calculation of encryption of the information authentication code is performed using a general key K. By doing so, an encrypted information authentication code is generated. The encrypted electronic material file 42, voiceprint feature file 41 and information authentication code can form a portable file, that is, the electronic material file 42 is encrypted and transmitted via a network or a recording medium. can do.

再び図1、11を参照すると、コンピューターのシステムにおいて電子資料ファイル42を抜取る時、先ず暗号化された声紋特徴ファイル41と暗号化された情報認証コードを一般のキーKを利用して復号化の運算を行うことにより、声紋特徴ファイル41と情報認証コードを獲得する。それから、声紋認証システム1のテストシステム20を利用して音声テスト作業を行うことにより、声紋特徴ファイル41と入力された音声との比較を行う。もし声紋特徴ファイル41と入力声音との誤差が予定値より低くなった場合、音声テスト作業を通過したと見なし、一旦音声テスト作業を通過すると、声紋キーKcによって電子資料ファイル42が開くのを許可することができる。それに反して、もし声紋特徴ファイル41と入力声音との誤差が予定値より高くなった場合、音声テスト作業を通過していないと見なし、一旦音声テスト作業を通過しないと、電子資料ファイル42が開くのを許可しないように構成される。 Referring again to FIGS. 1 and 11, when the electronic material file 42 is extracted in the computer system, the encrypted voiceprint feature file 41 and the encrypted information authentication code are first decrypted using a general key K. Is obtained, the voiceprint feature file 41 and the information authentication code are obtained. Then, voice test work is performed using the test system 20 of the voiceprint authentication system 1 to compare the voiceprint feature file 41 with the input voice. If the error between the voice print feature file 41 and the input voice sound is lower than the expected value, it is considered that the voice test work has passed, and once the voice test work is passed, the electronic data file 42 is allowed to be opened by the voice print key Kc. can do. On the other hand, if the error between the voiceprint feature file 41 and the input voice sound is higher than the scheduled value, it is considered that the voice test work has not been passed, and once the voice test work is not passed , the electronic material file 42 is opened. It is configured not to allow

再び図11を参照すると、最後に声紋特徴ファイル41および電子資料ファイル42を上記情報認証コードと認証コードの比較を行う。もし声紋特徴ファイル41と電子資料ファイル42が上記情報認証コードに符合した場合、電子資料ファイル42は上記コンピューターのシステムに表すことができる。それに反して、もし声紋特徴ファイル41と電子資料ファイル42が上記情報認証コードに符合しない場合、電子資料ファイル42は上記コンピューターのシステムに表すことができないと共に、声紋パスワードキーのシステム4から離れなければならない。   Referring to FIG. 11 again, the voice print feature file 41 and the electronic material file 42 are finally compared with the information authentication code. If the voiceprint feature file 41 and the electronic material file 42 match the information authentication code, the electronic material file 42 can be represented in the computer system. On the other hand, if the voice print feature file 41 and the electronic data file 42 do not match the information authentication code, the electronic data file 42 cannot be represented in the computer system and must be separated from the voice print password key system 4. Don't be.

上述の如く、従来の声紋認証システムによれば、参考のサンプルが占用するデータベースの空間は相当大きいため、比較的大きいデータベースの空間が必要になると共に、さらに長いファイルの伝送時間が必要になるという問題点があったが、図1に示す本発明の声紋パスワードキーのシステムによれば、音声の特徴を抜取る前に、前端処理を利用して有効音声情報を原始入力音声資料から抜取り、無効音声情報を濾過して除去することにより、資料の処理量を減らすと共に、判別の確率を高めることができる。また、声紋認証システムを利用して声紋キーを生成し、さらに一つの声紋特徴値を選出し、声紋キーを利用して電子資料ファイルの暗号化または復号化の演算を行うことにより、声紋パスワードキーを構成して電子資料ファイルを保護することができる。 As described above, according to the conventional voiceprint authentication system, the database space occupied by the reference sample is quite large, so a relatively large database space is required and a longer file transmission time is required. Although there was a problem, according to the voiceprint password key system of the present invention shown in FIG. 1, before extracting the features of the voice, the valid voice information is extracted from the original input voice data by using the front end processing and invalidated. By filtering and removing the voice information, it is possible to reduce the processing amount of the material and increase the probability of discrimination. In addition, a voiceprint key is generated by generating a voiceprint key using a voiceprint authentication system, selecting one voiceprint feature value, and performing an operation of encrypting or decrypting an electronic material file using the voiceprint key. Can be used to protect electronic material files .

本発明は、その精神及び必須の特徴事項から逸脱することなく他のやり方で実施することができる。従って、本明細書に記載した好ましい実施例は例示的なものであり、限定的なものではない。   The present invention may be implemented in other ways without departing from the spirit and essential characteristics thereof. Accordingly, the preferred embodiments described herein are illustrative and not limiting.

本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる流れを示すフローチャートである。It is a flowchart which shows the flow by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる状態と音フレームとの関係を示す図である。It is a figure which shows the relationship between the state by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts, and a sound frame. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる音フレームと状態との開始の分配モデルを示す図である。It is a figure which shows the distribution model of the start of a sound frame and a state by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる状態転換を示す図である。It is a figure which shows the state change by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる最も相似する径路を示す図である。It is a figure which shows the path | route most similar by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる音フレームを均等に分ける状態を示す図である。It is a figure which shows the state which divides | segments the sound frame equally by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる第一次新たに音フレームを分配する状態を示す図である。It is a figure which shows the state which distributes a sound frame newly by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる第二次新たに音フレームを分配する状態を示す図である。It is a figure which shows the state which distributes the sound frame newly by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例の声紋パスワードキーのシステムが採用する声紋認証システムによる最良な音フレームを分配する状態を示す図である。It is a figure which shows the state which distributes the best sound frame by the voiceprint authentication system which the system of the voiceprint password key of the Example of this invention employ | adopts. 本発明の実施例1の声紋パスワードキーのシステムが固定式の声紋パスワードキーを利用して暗号化と復号化を行う流れを示すブロック図である。It is a block diagram which shows the flow which the system of the voiceprint password key of Example 1 of this invention performs encryption and decoding using a fixed voiceprint password key. 本発明の実施例2の声紋パスワードキーのシステムが携帯式の声紋パスワードキーを利用して暗号化と復号化を行う流れを示すブロック図である。It is a block diagram which shows the flow which the system of the voiceprint password key of Example 2 of this invention performs encryption and decoding using a portable voiceprint password key.

1 声紋認証システム
10 訓練システム
20 テストシステム
3 声紋パスワードキーのシステム
31 声紋特徴ファイル
32 電子資料ファイル
4 声紋パスワードキーのシステム
40 直列ファイル
41 声紋特徴ファイル
42 電子資料ファイル
K キー
Kc 声紋キー
DESCRIPTION OF SYMBOLS 1 Voiceprint authentication system 10 Training system 20 Test system 3 Voiceprint password key system 31 Voiceprint feature file 32 Electronic material file 4 Voiceprint password key system
40 Serial file 41 Voiceprint feature file 42 Electronic material file
K key
Kc Voiceprint key

Claims (11)

声紋認証システム(1)および声紋キー(Kc)を用いた声紋パスワードキーのシステムであって、
上記声紋認証システム(1)には、特徴抜取部が設けられており、
上記特徴抜取部は、原始入力音声資料から前端処理部によって得られた有効音声情報に対して線形予測ケプストラム係数とメル周波数ケプストラム係数を採用することによって音声特徴を取得するようになっており、
上記声紋認証システム(1)は、上記音声特徴からビタビ演算法を用いて当該音声特徴に最も相似する経路を得ることによって声紋特徴ファイル(31)を獲得するようになっており、
上記声紋特徴ファイル(31)は、声紋特徴値を生成するのに用いられ、
上記声紋キー(Kc)は、上記声紋特徴値から選出されたものであり、電子資料ファイル(32)の暗号化と復号化の演算を行うのに用いられるようになっており、
上記声紋特徴ファイル(31)と入力音声との誤差が予定値より低くなった場合には音声テスト作業を通過したと見なして上記電子資料ファイル(32)が開くのを許可し、上記誤差が予定値より高くなった場合には音声テスト作業を通過しないと見なして上記電子資料ファイル(32)が開くのを許可しないように構成されていることを特徴とする声紋パスワードキーのシステム。
A voiceprint password key system using a voiceprint authentication system (1) and a voiceprint key (Kc),
The voiceprint authentication system (1) is provided with a feature extraction unit,
The feature sampling unit is adapted to acquire a speech feature by adopting a linear prediction cepstrum coefficient and a mel frequency cepstrum coefficient with respect to the effective speech information obtained by the front end processing unit from the original input speech material,
The voiceprint authentication system (1) obtains a voiceprint feature file (31) by obtaining a route most similar to the voice feature using the Viterbi calculation method from the voice feature.
The voiceprint feature file (31) is used to generate voiceprint feature values,
The voiceprint key (Kc) is selected from the voiceprint feature values and is used to perform operations for encryption and decryption of the electronic material file (32).
If the error between the voiceprint feature file (31) and the input voice is lower than the expected value, it is considered that the voice test work has passed and the electronic document file (32) is allowed to open, and the error is scheduled. A voiceprint password key system configured so as not to allow the electronic material file (32) to be opened if it exceeds the value and is regarded as not passing through the voice test operation.
上記声紋キー(Kc)は、パーソナルコンピュータ、ノート型コンピュータ、パーソナル・デジタル・アシスタンスまたは携帯電話に適用される固定式の声紋パスワードキーとなっていることを特徴とする請求項1記載の声紋パスワードキーのシステム。 The voiceprint key (Kc) may be a personal computer, notebook computer, voiceprint of claim 1, wherein that you have a voiceprint stationary to be applied to a personal digital assistant or mobile phone System. 上記声紋特徴ファイル(31)を暗号化および復号化する一般のキー(K)を備えており、
上記声紋特徴ファイル(31)は、上記キー(K)によって暗号化された状態で保存されるようになっていることを特徴とする請求項2記載の声紋パスワードキーのシステム。
Ri Contact comprise common key (K) to encrypt and decrypt the voiceprint characteristic file (31),
The voiceprint characteristic file (31), the system of the voiceprint of claim 2, wherein that you have come to be stored in a state of being encrypted by the key (K).
上記声紋キー(Kc)は、ネットワークまたは記録メディアの伝送に適用される携帯式の声紋パスワードキーとなっていることを特徴とする請求項1記載の声紋パスワードキーのシステム。 The system of the voiceprint key (Kc) is voiceprint of claim 1, wherein that you have a voiceprint portable applied to a transmission network or a recording medium. 上記声紋特徴ファイル(41)を暗号化および復号化する一般のキー(K)を備えており
上記声紋特徴ファイル(41)は上記キー(K)によって暗号化された状態で保存され、上記電子資料ファイル(42)は上記携帯式の声紋パスワードキーによって暗号化された状態で保存されるようになっており、
暗号化された上記声紋特徴ファイル(41)と暗号化された上記電子資料ファイル(42)は、直列に接続された直列ファイル(40)となっていることを特徴とする請求項4記載の声紋パスワードキーのシステム。
Includes a common key (K) to encrypt and decrypt the voiceprint characteristic file (41),
The voiceprint feature file (41) is stored in an encrypted state by the key (K), and the electronic material file (42) is stored in an encrypted state by the portable voiceprint password key. And
Encrypted the voiceprint characteristic file (41) and encrypted the electronic document file (42), voiceprint of claim 4, wherein that you have a connected series files in series (40) Password key system.
情報認証コード生成構造を利用して暗号化された上記声紋特徴ファイル(41)と暗号化された上記電子資料ファイル(42)との上記直列ファイル(40)に情報認証コードを生成させ、復号化を行う時、上記情報認証コードと声紋特徴ファイル(41)および上記電子資料ファイル(42)に対して認証コードの比較を行うようになっていることを特徴とする請求項5記載の声紋パスワードキーのシステム。 Using the information authentication code generating structure, to generate information authentication code in the series file (40) encrypted the voiceprint characteristic file (41) and encrypted the electronic document file (42), decoding when performing reduction, the information authentication code and the voiceprint characteristic file (41) and voiceprint password according to claim 5, characterized in that is adapted to perform comparison of the authentication code to said electronic information file (42) Key system. キー(K)を利用して上記直列ファイル(40)の情報認証コードを暗号化の演算を行うことにより、上記情報認証コードを暗号化し、さらに上記キー(K)は上記情報認証コードを復号化の演算を行うのに用いられることを特徴とする請求項6記載の声紋パスワードキーのシステム。 The information authentication code is encrypted by performing an operation of encrypting the information authentication code of the serial file (40) using the key (K) , and the key (K) decrypts the information authentication code. The voiceprint password key system according to claim 6, wherein the voiceprint password key system is used to perform the following calculation. 上記声紋認証システム(1)は、上記前端処理部および上記特徴抜取部に加えて保存部および運算部を備えた構成になっており
上記前端処理部は、上記声紋認証システム(1)の原始入力音声資料を前端処理するのに用いられることにより、有効音声情報と無効音声情報との区分を完成してから、再び有効音声情報を抜取るようになっており、
上記保存部は、上記音声特徴を保存するのに用いられるようになっており
上記運算部は保存された音声特徴と、入力された音声特徴を運算するのに用いられるようになっていることを特徴とする請求項記載の声紋パスワードキーのシステム。
The voiceprint authentication system (1) is adapted to the configuration with the front section and the storage section and mathematical operation unit in addition to the feature sampling unit,
The front end processing section, by used to front end processing the raw voice article in the voiceprint authentication system (1), after completing the division of the effective audio information and disabling the audio information, the valid voice information again Ri you become so that sampling,
The storage unit is adapted to so that used to store the speech feature,
The mathematical operation unit, the voiceprint of claim 1, wherein the speech feature stored, that is adapted to be used to mathematical operation input speech feature system.
上記声紋認証システム(1)には、使用者の身分を確認するID番号が未登録であった場合に実行される訓練システム(10)が含まれ、
上記訓練システム(10)は、上記前端処理部と上記特徴抜取部を使用することにより、原始入力音声資料から音声特徴を獲得するようになっていることを特徴とする請求項1記載の声紋パスワードキーのシステム。
The voiceprint authentication system (1) includes a training system (10) that is executed when an ID number for confirming the identity of the user is not registered .
The training system (10), said by using the front section and the characteristic sampling unit, voiceprint password according to claim 1, characterized in that is adapted to acquire the speech feature from the raw voice article Key system.
上記訓練システム(10)は、他にビタビ演算法を使用することにより、上記音声特徴から当該音声特徴に最も相似する径路を獲得することにより、上記声紋特徴ファイル(31)としてのモデルパラメーターを計算して保存するようになっていることを特徴とする請求項9記載の声紋パスワードキーのシステム。 The training system (10), by using the Viterbi calculation method to another, by acquiring the most similar path to the audio features from the audio feature, calculates the model parameters as the voiceprint characteristic file (31) 10. The voiceprint password key system according to claim 9, wherein the voiceprint password key system is stored. 上記声紋認証システム(1)には、使用者の身分を確認するID番号が登録済みであった場合に実行されるテストシステム(20)が含まれ、
上記テストシステム(20)は上記前端処理部と上記声紋認証システム(1)を使用することにより、原始入力音声資料から音声特徴を獲得するようになっていることを特徴とする請求項記載の声紋パスワードキーのシステム。
The voiceprint authentication system (1) includes a test system (20) that is executed when an ID number for confirming the identity of the user has been registered.
Said test system (20), by the use of the front section and the voiceprint authentication system (1), according to claim 8, wherein that you have come to acquire speech features from the raw voice article Voiceprint password key system.
JP2005218997A 2005-07-28 2005-07-28 Voiceprint password key system Expired - Fee Related JP4351659B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005218997A JP4351659B2 (en) 2005-07-28 2005-07-28 Voiceprint password key system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005218997A JP4351659B2 (en) 2005-07-28 2005-07-28 Voiceprint password key system

Publications (2)

Publication Number Publication Date
JP2007034031A JP2007034031A (en) 2007-02-08
JP4351659B2 true JP4351659B2 (en) 2009-10-28

Family

ID=37793352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005218997A Expired - Fee Related JP4351659B2 (en) 2005-07-28 2005-07-28 Voiceprint password key system

Country Status (1)

Country Link
JP (1) JP4351659B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109801633A (en) * 2019-01-30 2019-05-24 北京得意音通技术有限责任公司 Method for processing business, device, electronic equipment and storage medium

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5413033B2 (en) * 2009-08-03 2014-02-12 株式会社リコー Information processing apparatus, information leakage prevention method and program
CN109325742A (en) * 2018-09-26 2019-02-12 平安普惠企业管理有限公司 Business approval method, apparatus, computer equipment and storage medium
CN111294642B (en) * 2018-12-10 2021-06-18 杭州海康威视数字技术股份有限公司 Video stream playing method and device
CN111899761A (en) * 2020-07-23 2020-11-06 深圳慕智科技有限公司 Fuzzy test data generation method based on intelligent traffic audio input feature recognition
CN112331215B (en) * 2020-10-26 2022-11-15 桂林电子科技大学 Voiceprint recognition template protection algorithm
CN112818375B (en) * 2021-03-08 2024-03-12 郑州铁路职业技术学院 Encryption system for recording information transmission

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109801633A (en) * 2019-01-30 2019-05-24 北京得意音通技术有限责任公司 Method for processing business, device, electronic equipment and storage medium

Also Published As

Publication number Publication date
JP2007034031A (en) 2007-02-08

Similar Documents

Publication Publication Date Title
JP4351659B2 (en) Voiceprint password key system
EP2120232A1 (en) A random voice print cipher certification system, random voice print cipher lock and generating method thereof
JP6469252B2 (en) Account addition method, terminal, server, and computer storage medium
Pathak et al. Privacy-preserving speech processing: cryptographic and string-matching frameworks show promise
JP5426403B2 (en) Hybrid biometric authentication device, hybrid biometric authentication method, and hybrid biometric authentication computer program.
US20070016419A1 (en) Selective security masking within recorded speech utilizing speech recognition techniques
US20070038868A1 (en) Voiceprint-lock system for electronic data
Monrose et al. Toward {Speech-Generated} Cryptographic Keys on {Resource-Constrained} Devices
Prabakaran et al. A review on performance of voice feature extraction techniques
Camlikaya et al. Multi-biometric templates using fingerprint and voice
US20060229879A1 (en) Voiceprint identification system for e-commerce
CN111091837A (en) Time-varying voiceprint authentication method and system based on online learning
EP3719679A1 (en) A method for protecting biometric templates, and a system and method for verifying a speaker´s identity
Rahulamathavan Privacy-preserving similarity calculation of speaker features using fully homomorphic encryption
Nagakrishnan et al. A robust cryptosystem to enhance the security in speech based person authentication
EP1760566A1 (en) Voiceprint-lock system for electronic data
Luu et al. Investigating the contribution of speaker attributes to speaker separability using disentangled speaker representations
JP2007220068A (en) Portable voiceprint password key remote transmission system and method for it
CN100444188C (en) Vocal-print puzzle lock system
Kelly Cracking passwords using keyboard acoustics and language modeling
CN114172670A (en) Authorization method, device and system
Vielhauer et al. Multimodal speaker authentication–evaluation of recognition performance of watermarked references
TWI270605B (en) Voiceprint key system
You et al. Using paired distances of signal peaks in stereo channels as fingerprints for copy identification
KR100654686B1 (en) Voiceprint-lock system for electronic data

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090701

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees