WO2019078492A1 - 음성 인증 시스템 - Google Patents

음성 인증 시스템 Download PDF

Info

Publication number
WO2019078492A1
WO2019078492A1 PCT/KR2018/010922 KR2018010922W WO2019078492A1 WO 2019078492 A1 WO2019078492 A1 WO 2019078492A1 KR 2018010922 W KR2018010922 W KR 2018010922W WO 2019078492 A1 WO2019078492 A1 WO 2019078492A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice authentication
voice
word
random number
user
Prior art date
Application number
PCT/KR2018/010922
Other languages
English (en)
French (fr)
Inventor
이태훈
Original Assignee
주식회사 공훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 공훈 filed Critical 주식회사 공훈
Publication of WO2019078492A1 publication Critical patent/WO2019078492A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3226Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
    • H04L9/3231Biological data, e.g. fingerprint, voice or retina

Definitions

  • the present invention relates to a voice authentication system, and more particularly, it relates to a voice authentication system and a voice authentication apparatus, in which time synchronization and word dictionary data synchronization are performed to determine whether a user's uttered words are the same and uniqueness of a user voice is identical And a voice authentication system for authenticating a user's voice.
  • Speech recognition technology has developed rapidly in the 2000s and has reached the level where most user languages can be recognized. It is rapidly spreading in real life through voice recognition through smart phones and home speakers.
  • the voice recognition technology is the most familiar and convenient MMI (Man-Machine Interface)
  • MMI Man-Machine Interface
  • the voice recognition technology is rapidly expanding the usage area, but the user authentication (security) of various devices controlled by voice is insufficient.
  • the voice authentication technique compares the voice of the speaker with the voice to be authenticated and processes the voice to be authenticated, but it is not yet technically perfect. Further, in the case of a person, the voice of the voice- Since the feature is changed, voice authentication becomes more difficult.
  • the present invention has been made to solve the above problems, and it is an object of the present invention to provide a voice authentication apparatus and a voice authentication apparatus, And to provide a voice authentication system for authenticating a user's voice.
  • a voice authentication system includes a voice authentication request device and a voice authentication device for synchronizing time synchronization and word dictionary data respectively to authenticate voice of a user and when an event requiring voice authentication occurs
  • the voice authentication apparatus transmits the authentication request code to the voice authentication request apparatus.
  • the voice authentication request apparatus includes a random number generation unit for generating a random number with the input time of the authentication request code as the input value, An output unit for requesting speech, a storage unit for storing synchronized word dictionary data, a communication unit for wireless connection with the voice authentication device, and a random number generating unit for generating a random number from the synchronized word dictionary data, And a control unit for detecting a corresponding word, wherein the voice authentication apparatus comprises: A random number generator for generating a random number as an input value of the transmitted time, a voice input part for recognizing the voice of the uttered word, a word dictionary DB containing the synchronized word dictionary data, and a voice A communication unit for wireless connection with the voice authentication request apparatus, and a control unit for detecting a word corresponding to the random number generated in the random number generation unit of the voice authentication apparatus in the synchronized word dictionary data And the control unit of the voice authentication apparatus recognizes the user's utterance word and compares the recognized utterance word with the word detected
  • the word dictionary data is composed of word data of an MxN matrix structure, and a word corresponding to the generated random number is determined by determining the number of digits of the random number and determining a K digit number corresponding to the predetermined digit And the words of the row and column corresponding to the K digits determined in the word data of the MxN matrix structure can be detected.
  • M and N may be the same or different natural numbers, respectively, and K may be a natural number.
  • synchronization of the word dictionary data can be synchronized by transmitting the word dictionary data stored in the voice authentication device to the voice authentication request device while synchronizing the time with the voice authentication request device and the voice authentication device.
  • a voice authentication method includes synchronizing time synchronization and word dictionary data with a voice authentication request device and a voice authentication device, respectively, and when an event requiring voice authentication occurs, a voice authentication device transmits an authentication request code Generating a random number for each of the voice authentication device and the voice authentication request device by driving each of the random number generation sections with the transmission time of the authentication request code as an input value, Detecting a word corresponding to the random number of the user; requesting the user to utter the word detected in the synchronized word dictionary data of the voice authentication requesting apparatus; when the voice authentication apparatus recognizes the user's utterance word The voice authentication apparatus recognizes the utterance word of the user recognized by the voice authentication apparatus as a synchronized Comparing the voice characteristic value of the uttered word of the user recognized by the voice authentication apparatus with the value stored in the voice authentication characteristic DB to determine the voice of the user, And authenticating.
  • the word dictionary data is composed of word data of an MxN matrix structure, and a word corresponding to the generated random number is determined by dividing the number of digits of the random number and determining a K digit number corresponding to the predetermined digit And the words of the row and column corresponding to the K digits determined in the word data of the MxN matrix structure can be detected.
  • M and N may be the same or different natural numbers, respectively, and K may be a natural number.
  • synchronization of the word dictionary data can be synchronized by transmitting the word dictionary data stored in the voice authentication device to the voice authentication request device while synchronizing the voice authentication request device and the voice authentication device.
  • a computer-readable recording medium on which a program for causing the computer to execute the above-described method may be provided.
  • the voice authentication system even after the user's voice authentication, the user's voice is continuously analyzed and the word dictionary DB and the voice authentication characteristic DB are updated to maintain the accuracy of the user's voice authentication and enhance the security .
  • FIG. 1 is a block diagram of a voice authentication system 1000 according to an embodiment of the present invention.
  • FIG. 2 is a flowchart of a voice authentication method according to an embodiment of the present invention.
  • a voice authentication system includes a voice authentication request device and a voice authentication device for synchronizing time synchronization and word dictionary data respectively to authenticate voice of a user and when an event requiring voice authentication occurs
  • the voice authentication apparatus transmits the authentication request code to the voice authentication request apparatus.
  • the voice authentication request apparatus includes a random number generation unit for generating a random number with the input time of the authentication request code as the input value, An output unit for requesting speech, a storage unit for storing synchronized word dictionary data, a communication unit for wireless connection with the voice authentication device, and a random number generating unit for generating a random number from the synchronized word dictionary data, And a control unit for detecting a corresponding word, wherein the voice authentication apparatus comprises: A random number generator for generating a random number as an input value of the transmitted time, a voice input part for recognizing the voice of the uttered word, a word dictionary DB containing the synchronized word dictionary data, and a voice A communication unit for wireless connection with the voice authentication request apparatus, and a control unit for detecting a word corresponding to the random number generated in the random number generation unit of the voice authentication apparatus in the synchronized word dictionary data And the control unit of the voice authentication apparatus recognizes the user's utterance word and compares the recognized utterance word with the word detected
  • the word dictionary data is composed of word data of an MxN matrix structure, and a word corresponding to the generated random number is determined by determining the number of digits of the random number and determining a K digit number corresponding to the predetermined digit And the words of the row and column corresponding to the K digits determined in the word data of the MxN matrix structure can be detected.
  • M and N may be the same or different natural numbers, respectively, and K may be a natural number.
  • synchronization of the word dictionary data can be synchronized by transmitting the word dictionary data stored in the voice authentication device to the voice authentication request device while synchronizing the time with the voice authentication request device and the voice authentication device.
  • a voice authentication method includes synchronizing time synchronization and word dictionary data with a voice authentication request device and a voice authentication device, respectively, and when an event requiring voice authentication occurs, a voice authentication device transmits an authentication request code Generating a random number for each of the voice authentication device and the voice authentication request device by driving each of the random number generation sections with the transmission time of the authentication request code as an input value, Detecting a word corresponding to the random number of the user; requesting the user to utter the word detected in the synchronized word dictionary data of the voice authentication requesting apparatus; when the voice authentication apparatus recognizes the user's utterance word The voice authentication apparatus recognizes the utterance word of the user recognized by the voice authentication apparatus as a synchronized Comparing the voice characteristic value of the uttered word of the user recognized by the voice authentication apparatus with the value stored in the voice authentication characteristic DB to determine the voice of the user, And authenticating.
  • the word dictionary data is composed of word data of an MxN matrix structure, and a word corresponding to the generated random number is determined by dividing the number of digits of the random number and determining a K digit number corresponding to the predetermined digit And the words of the row and column corresponding to the K digits determined in the word data of the MxN matrix structure can be detected.
  • M and N may be the same or different natural numbers, respectively, and K may be a natural number.
  • synchronization of the word dictionary data can be synchronized by transmitting the word dictionary data stored in the voice authentication device to the voice authentication request device while synchronizing the voice authentication request device and the voice authentication device.
  • a computer-readable recording medium on which a program for causing the computer to execute the above-described method may be provided.
  • FIG. 1 is a block diagram of a voice authentication system 1000 according to an embodiment of the present invention.
  • a voice authentication system 1000 includes a voice authentication request device 100 and a voice authentication device 100 for synchronizing time synchronization and word dictionary data, respectively, 200).
  • the voice authentication request apparatus 100 may include a random number generation unit 110, an output unit 120, a storage unit 130, a communication unit 140, and a control unit 150.
  • the random number generation unit 110 is a device for generating a random number with time input values.
  • the voice authentication requesting device 100 and the voice authentication device 200 are wirelessly connected to perform time synchronization and word dictionary data synchronization at predetermined time intervals before a voice authentication request is generated,
  • the voice authentication apparatus 200 transmits an authentication request code to the voice authentication request apparatus 100.
  • the voice authentication request apparatus 100 receives the authentication request code, and the random number generation unit 110 ) Can be used to generate a random number using the transmitted time of the authentication request code as an input value.
  • the voice authentication request apparatus 100 performs time synchronization with the voice authentication apparatus 200 at predetermined time intervals, the time required for the voice authentication apparatus 200 to transmit the authentication request code, The time for receiving the authentication request code is the same.
  • the transmitted time of the authentication request code input to the random number generation unit 110 becomes equal to the transmission time of the authentication request code input to the random number generation unit 210 of the voice authentication device 200, .
  • the output unit 120 may request the user to utter a word of the word dictionary data stored in the storage unit 130 to request the user to utter a word for voice authentication .
  • the output unit 120 requests a user to utter a word for authentication required for authentication, requests a user to utter a word for authentication using a speaker, or displays the word on a screen using a display or the like, It is possible to induce utterance of the word.
  • the storage unit 130 may store word dictionary data synchronized with the voice authentication apparatus 200.
  • the voice authentication apparatus 200 constructs word dictionary data necessary for user voice authentication in advance before user voice authentication.
  • the voice authentication apparatus 200 performs time synchronization with the voice authentication request apparatus 100 at a predetermined time interval, And transmits the constructed word dictionary data to the voice authentication request apparatus 100.
  • the voice authentication request apparatus 100 can synchronize the word dictionary data by storing the transmitted word dictionary data in the storage unit 130.
  • the communication unit 140 is a device for making a wireless connection with the voice authentication apparatus 200.
  • the voice authentication request apparatus 100 uses the communication unit 140 to communicate with the voice authentication apparatus 200 And can synchronize time synchronization and word dictionary data at predetermined time intervals by wireless connection.
  • the communication unit 140 may include a Bluetooth communication module, a Bluetooth low energy (BLE) communication module, a near field communication module, a Wi-Fi communication module, a Zigbee communication module Module, an IrDA (infrared data association) communication module, a WFD (Wi-Fi Direct) communication module, an UWB (ultra wideband) communication module, an Ant + communication module, and the like.
  • BLE Bluetooth low energy
  • the control unit 150 is an apparatus for controlling the respective devices of the voice authentication requesting apparatus 100.
  • control unit 150 when the control unit 150 receives the authentication request code from the voice authentication device 200, the control unit 150 can control the random number generation unit 110 to generate a random number using the input time of the authentication request code,
  • the output unit 120 may output a phrase, voice command, or the like requesting the user to utter a word necessary for voice authentication.
  • the controller 150 controls the storage unit 130 to store the synchronized word dictionary data and controls the voice authentication apparatus 200 to establish a wireless connection using the communication unit 140, And to synchronize time synchronization and word dictionary data at intervals.
  • the controller 150 may detect a word corresponding to the random number generated by the random number generator 110 from the synchronized word dictionary data stored in the storage unit 130.
  • synchronized word dictionary data can be composed of word data in an MxN matrix structure.
  • M and N may be the same or different natural numbers, for example, M and N may be 10, respectively.
  • word dictionary data can be composed of data of 10-by-10 matrix structure consisting of 10 rows and 10 columns. Since each word and line is contained in each row and column, it can be composed of 100 words.
  • the number of digits of the random number generated by the random number generation unit 110 is divided to determine the K digits corresponding to the predetermined digits, and the K digits corresponding to the K digits determined in the word data of the above- It is possible to detect a word corresponding to a random number generated by a method of detecting words in rows and columns.
  • K may be a natural number, for example, K may be 2.
  • the random number generated by the random number generation unit 110 is 987653
  • the first two digits are 98
  • the middle two digits are 76
  • a two-digit number 98 can be determined, and a word corresponding to nine rows and eight columns is selected from the word data of the 10- It is possible to detect a word corresponding to the random number.
  • the predetermined number of digits can be set to the first 2 digits, the middle 2 digits, and the last 2 digits of the generated random number (for example, a 6-digit random number), and the word dictionary data is composed of word data of a 10 ⁇ 10 matrix structure So you can set the digits to include two digits so you can select the words that correspond to the rows and columns.
  • control the random number generation unit 110 to simply generate a two-digit number with a random number, and to detect the word of the corresponding row and column in the word data of the 10-by-10 matrix structure.
  • the random number generation unit 110 generates a random number of 4 digits, 6 digits, or 8 digits, for example, if the number of digits of a random number can be divided and only two digits of a predetermined digit portion can be determined, It is possible to detect words in rows and columns corresponding to two-digit numbers.
  • the voice authentication apparatus 200 may include a random number generation unit 210, a voice input unit 220, a storage unit 230, a communication unit 240, and a control unit 250.
  • the random number generation unit 210 is a device for generating a random number using an input time value.
  • the voice authentication requesting device 100 and the voice authentication device 200 are wirelessly connected to perform time synchronization and word dictionary data synchronization at predetermined time intervals before a voice authentication request is generated,
  • the voice authentication apparatus 200 transmits an authentication request code to the voice authentication request apparatus 100.
  • the voice authentication apparatus 200 transmits an authentication request code, A random number can be generated from the input time of the authentication request code.
  • the transmission time of the authentication request code input to the random number generation unit 210 is The same time as the transmission time of the authentication request code input to the random number generation unit 110 of the voice authentication request apparatus 100 is generated, so that the same random number is generated.
  • the voice input unit 220 can recognize the voice of a word uttered by the user.
  • the voice input unit 220 may be a voice input device such as a microphone for receiving a voice of a word uttered by the user to authenticate the voice of the user.
  • the storage unit 230 may store a word dictionary DB 232 including synchronized word dictionary data and a voice authentication characteristic DB 234 including voice characteristics of a user.
  • the voice authentication apparatus 200 constructs word dictionary data necessary for user voice authentication in advance before user voice authentication and stores it in the storage unit 230.
  • a word dictionary DB (232) may be stored in advance.
  • a speech or the like is provided to the user for the first time in order to construct word dictionary data necessary for authentication, so that a word including a sentence
  • the dictionary DB 232 may be stored in the storage unit 230.
  • the National Education Charter is stored in the word dictionary DB 232 of the storage unit 230, and a sentence of the National Education Charter stored at the first time by the user is randomly provided to be read by the user.
  • the voice and the sentences read by the user are analyzed to distinguish the nouns and store them in the word dictionary DB 232.
  • the word dictionary DB 232 is updated to a word dictionary divided into nouns, and the controller 250 constructs word dictionary data of a 10 X 10 matrix structure using words stored in the updated word dictionary DB 232 .
  • the voice authentication characteristic DB 234 analyzes voice of a user and a sentence read by a user, and discriminates the voice characteristic of the user and stores the voice characteristic in the storage unit 230.
  • the word dictionary DB 232 is a DB that stores words for constructing word dictionary data
  • the voice authentication characteristic DB 234 stores voice characteristic values of a user who utters a word
  • It is a DB for verification. That is, the information about the uniqueness of the user's voice is stored in the voice authentication characteristic DB 234.
  • a user when a user utteres a word for authentication for a voice authentication in a manner that a word that is authenticated by the user is set as a feature vector model and is stored as a voice characteristic value in the voice authentication characteristic DB 234,
  • the user's voice can be authenticated by comparing the voice characteristic value of the feature vector model stored in the authentication characteristic DB 234 with the voice characteristic value of the user's utterance word.
  • the continuous voices can be derived by analyzing the voice uttered by the user continuously to update the word dictionary DB 232 and the voice authentication characteristic DB 234.
  • the new word dictionary data that is, the word dictionary data of the 10-by-10 matrix structure for voice authentication can be continually updated continuously using the updated word dictionary DB 232, DB 234 enables the user to perform voice authentication even if the voice changes in accordance with the passage of time.
  • the updated word dictionary data is stored in the storage unit 230 and transmitted to the voice authentication request apparatus 100 whenever time synchronization is performed, so that the synchronization of the updated word dictionary data can be performed.
  • the uniqueness of the voice of the user who changes naturally according to the continuous updating of the voice authentication characteristic DB 234 is discriminated, thereby ensuring the reliability of the voice authentication.
  • the communication unit 240 is a device for making a wireless connection with the voice authentication request apparatus 100.
  • the voice authentication apparatus 200 includes a communication unit 240, And synchronize the time synchronization and the updated word dictionary data at predetermined time intervals.
  • the communication unit 240 may include a Bluetooth communication module, a Bluetooth low energy (BLE) communication module, a near field communication module, a Wi-Fi communication module, a Zigbee communication module Module, an IrDA (infrared data association) communication module, a WFD (Wi-Fi Direct) communication module, an UWB (ultra wideband) communication module, an Ant + communication module, and the like.
  • BLE Bluetooth low energy
  • the controller 250 is an apparatus for controlling the respective devices of the voice authentication apparatus 200.
  • control unit 250 transmits an authentication request code to the voice authentication request apparatus 100 using the communication unit 240, and causes the random number generation unit 210 to generate an authentication request code Can be controlled to generate a random number as an input value.
  • the control unit 250 controls the voice input unit 220 to recognize the voice of the uttered word by the user and allows the storage unit 230 to store the updated word dictionary DB 232 and the voice authentication characteristic DB 234), and can control to store word dictionary data newly generated by the updated word dictionary DB 232
  • control unit 250 may control the wireless communication with the voice authentication device 200 using the communication unit 240, and may control the time synchronization and the word dictionary data to be synchronized at predetermined time intervals.
  • the control unit 250 may detect a word corresponding to the random number generated by the random number generation unit 210 from the synchronized word dictionary data stored in the storage unit 230.
  • the synchronized word dictionary data is composed of word data of a 10 X 10 matrix structure, and the number of digits of the random number generated by the random number generation unit 210 is divided into 2 It is possible to detect a word corresponding to a random number generated by a method of determining a digit number and detecting a word of a row and a column corresponding to a two-digit number determined in the word data of the 10 X 10 matrix structure.
  • the random number generation unit 110 generates a random number of 4 digits, 6 digits, 8 digits or more, for example, if the number of digits of the random number can be divided and only the two digits of the predetermined digits can be determined, It is possible to detect the word of the row and the column corresponding to the two-digit number determined by the above-described method.
  • control unit 250 recognizes a user's utterance word, compares the recognized utterance word with the word detected in the synchronized word dictionary data of the voice authentication apparatus 200, .
  • control unit 250 recognizes the user's utterance word through the voice input unit 220 for voice authentication of the user, and stores the recognized user's utterance word in the synchronized word dictionary data of the voice authentication apparatus 200 It is possible to judge whether or not they are the same as the words.
  • the user may utter a word corresponding to the random number generated by the random number generation unit 110 of the voice authentication request apparatus 100.
  • the voice authentication request apparatus 100 and the voice authentication apparatus 200 may perform time synchronization
  • the random number generated by the random number generation unit 210 of the voice authentication apparatus 200 becomes equal to the random number generated by the random number generation unit 110 of the voice authentication request apparatus 100 by the word data synchronization,
  • the words detected by the requesting device 100 and the voice authentication device 200 in correspondence with the random numbers are the same, so that they can be used for voice authentication of the user according to the word identity of each device.
  • control unit 250 can compare the recognized user's utterance word with the value stored in the voice authentication characteristic DB 234 to authenticate the voice of the user.
  • control unit 250 compares the voice characteristic value of the user's utterance word with the value stored in the voice authentication characteristic DB 234 to determine the user's voice, in other words, to determine the uniqueness of the user voice can do.
  • control unit 250 sets a threshold value from a voice characteristic value of a word uttered by the user, compares the voice characteristic value with a value stored in the voice authentication characteristic DB 234, The same user can authenticate the voice of the user by determining that the word is uttered.
  • control unit 250 estimates a feature vector model of a speech signal of a word uttered by the user, and compares the estimated feature vector model and the value stored in the voice authentication feature DB 234 with the overlapped portion in the statistical model The user's voice can be authenticated.
  • FIG. 2 is a flowchart of a voice authentication method according to an embodiment of the present invention
  • step S10 the voice authentication requesting device 100 and the voice authentication device 200 may be wirelessly connected to synchronize time synchronization and word dictionary data, respectively, in order to authenticate a user's voice.
  • the voice authentication request apparatus 100 and the voice authentication apparatus 200 can perform time synchronization and word dictionary data synchronization, respectively, at predetermined time intervals before a voice authentication request occurs.
  • step S20 when an event requiring voice authentication occurs, the voice authentication apparatus 200 can transmit an authentication request code to the voice authentication request apparatus 100.
  • the voice authentication apparatus 200 may generate an authentication request code for requesting the voice authentication of the user, and may transmit the generated authentication request code to the voice authentication request apparatus 100.
  • step S30 the voice authentication apparatus 200 and the voice authentication request apparatus 100 generate the random numbers by driving the respective random number generation units 110 and 210 with the input transmission time of the authentication request code, Words corresponding to the random numbers generated in the generated word dictionary data can be detected.
  • the voice authentication apparatus 200 since the voice authentication apparatus 200 performs time synchronization with the voice authentication request apparatus 100 at a predetermined time interval, the time transmitted by the authentication request code input to the random number generation unit 210 is the voice authentication request apparatus The same random number is generated even if a random number is generated in each of the random number generators 110 and 210 since the same time as the transmission time of the authentication request code input to the random number generator 110 of FIG.
  • the words corresponding to the random numbers generated in the synchronized word dictionary data are also identical, and by using the identities of the words detected by the voice authentication apparatus 200 and the voice authentication request apparatus 100, Authentication can be performed.
  • the synchronized word dictionary data may be composed of word data of a 10-by-10 matrix structure.
  • the number of digits of the random number generated by each of the random number generators 110 and 210 is divided, And a word corresponding to a random number generated by a method of detecting words of a row and a column corresponding to the two-digit number determined in the word data of the 10 X 10 matrix structure can be detected.
  • the voice authentication request apparatus 100 may request the user to utter the detected word in the synchronized word dictionary data of the voice authentication request apparatus 100.
  • the voice authentication request apparatus 100 may request the user to utter a word detected in synchronized word dictionary data using the output unit 120.
  • the voice authentication request apparatus 100 requests a user to utter a word detected from the word dictionary data synchronized to the user using a speaker or displays it on the screen using a display or the like, The utterance of the word detected in the dictionary data can be induced.
  • step S50 the voice authentication apparatus 200 can recognize the user's utterance word.
  • the voice authentication apparatus 200 can recognize a voice uttered by a user and a voice (voice characteristic value) of a uttered word by using the voice input unit 220. [ That is, the voice authentication apparatus 200 recognizes a word uttered by the user for comparison with the word detected in the word dictionary data, and stores the value stored in the voice authentication characteristic DB 234, for example, (Speech characteristic value) of a word uttered by the user for comparison.
  • step S60 the voice authentication apparatus 200 can compare the recognized user's utterance word with the word detected in the synchronized word dictionary data of the voice authentication apparatus 200 to determine whether they are the same.
  • the user may utter a word corresponding to the random number generated by the random number generation unit 110 of the voice authentication request apparatus 100.
  • the voice authentication request apparatus 100 and the voice authentication apparatus 200 may perform time synchronization
  • the random number generated by the random number generation unit 210 of the voice authentication apparatus 200 becomes equal to the random number generated by the random number generation unit 110 of the voice authentication request apparatus 100 by the word data synchronization,
  • the words detected by the requesting device 100 and the voice authentication device 200 in correspondence with the random numbers are the same, so that they can be used for voice authentication of the user according to the word identity of each device.
  • step S70 if the determination result is the same, the voice authentication apparatus 200 can verify the voice of the user by comparing the voice characteristic value of the recognized voice word of the user with the value stored in the voice authentication characteristic DB 234.
  • a word uttered by the user through the voice authentication request apparatus 100 is the same as a word detected by the voice authentication apparatus 200. If the recognized words are the same, The user's voice can be authenticated by comparing with the value stored in the authentication characteristic DB 234.
  • the voice authentication request apparatus 100 judges whether the voice of the user uttered
  • the user's voice can be authenticated by estimating the characteristic vector model of the signal and comparing the estimated characteristic vector model and the value stored in the voice authentication characteristic DB 234 with the overlapped portion in the statistical model.
  • the voice authentication request apparatus 100 sets a threshold value from the voice characteristic value of a word uttered by the user, compares the voice characteristic value with the value stored in the voice authentication characteristic DB 234, , It is possible to authenticate the user's voice by determining that the same user has uttered the word.
  • the user continuously analyzes the voice uttered by the user to derive the continuous noun to update the word dictionary DB 232 and the voice authentication characteristic DB 234.
  • the user's voice is analyzed and the voice characteristic of the user is updated in the course of word dictionaryization of the user's voice, thereby maintaining the accuracy of user voice authentication and enhancing security.
  • the voice authentication request apparatus 100 may be implemented in the form of an earphone, and the voice authentication apparatus 200 may be implemented in the form of a smart phone, a mobile terminal, a PC, a PDA, a pad, and the like, but the scope of the present invention is not limited thereto.
  • the contents of the voice authentication system 1000 described above may be applied to the voice authentication method according to an embodiment of the present invention. Therefore, with respect to the voice authentication method, description of the same contents as those of the voice authentication system 1000 is omitted.
  • One embodiment of the present invention may also be embodied in the form of a recording medium including instructions executable by a computer, such as program modules, being executed by a computer.
  • Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media.
  • the computer readable medium may include both computer storage media.
  • Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

음성 인증 시스템이 개시된다. 본 발명의 일 실시예에 따른 음성 인증 시스템은 음성 인증 요청 장치 및 음성 인증 장치의 시간 동기화 및 단어 사전 데이터 동기화를 통하여 사용자의 발화된 단어의 동일 여부 및 사용자 음성의 고유성 동일 여부를 판단하여 사용자의 음성을 인증할 수 있다.

Description

음성 인증 시스템
본 발명은 음성 인증 시스템에 관한 것으로서, 더욱 상세하게는 음성 인증 요청 장치 및 음성 인증 장치의 시간 동기화 및 단어 사전 데이터 동기화를 통하여 사용자의 발화된 단어의 동일 여부 및 사용자 음성의 고유성 동일 여부를 판단하여 사용자의 음성을 인증하기 위한 음성 인증 시스템에 관한 것이다.
음성 인식 기술은 2000년대 들어 급속히 발전하여 현재는 대부분의 사용자 언어를 인식할 수 있는 수준까지 이르렀으며, 스마트폰과 가정용 스피커를 통한 음성 인식을 통해서 실생활 속에 급격히 퍼지고 있다.
따라서, 음성 인식 기술은 사람에게 가장 친숙하고 편리한 MMI(Man-Machine Interface)로서 사용처를 급속히 확장하고 있으나, 음성으로 통제되는 다양한 기기에 대한 사용자 인증(보안)은 미흡한 실정이다.
즉, 음성 인증 기술은 사전 입력된 화자의 음성과 인증하고자 하는 음성을 비교하여 처리하나 아직은 기술적으로 완벽하지 못한 상태이며, 더욱이 사람의 경우에는 나이가 들어감에 따라서 발성 기관의 근육이 퇴화하여 자연스럽게 음성 특징이 변경되기 때문에 더욱더 음성 인증을 어렵게 하는 문제가 되고 있다.
이에 변화하는 사람의 음성 특성에 따라서 적절히 대응하며, 현재 기술적으로 완벽한 비교가 불가능한 음성 인증 기술에 추가적인 인증 요소를 결합하여 인증이 수행될 수 있도록 함으로써 보안성의 확보와 더불어 편리성 및 간편성을 확보하고자 하는 방안이 강구되고 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로, 음성 인증 요청 장치 및 음성 인증 장치의 시간 동기화 및 단어 사전 데이터 동기화를 통하여 사용자의 발화된 단어의 동일 여부 및 사용자 음성의 고유성 동일 여부를 판단하여 사용자의 음성을 인증하기 위한 음성 인증 시스템을 제공하는데 그 목적이 있다.
본 발명의 일 실시예에 따른 음성 인증 시스템은, 사용자의 음성을 인증하기 위해서 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 음성 인증 요청 장치 및 음성 인증 장치를 포함하고, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치가 인증 요청 코드를 음성 인증 요청 장치로 전송하고, 음성 인증 요청 장치는, 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성하기 위한 난수 생성부, 사용자에게 음성 인증을 위한 단어의 발화를 요청하기 위한 출력부, 동기화된 단어 사전 데이터를 저장하기 위한 저장부, 음성 인증 장치와 무선 연결을 하기 위한 통신부 및 동기화된 단어 사전 데이터에서 음성 인증 요청 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부를 포함하고, 음성 인증 장치는, 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성하기 위한 난수 생성부, 사용자가 발화한 단어의 음성을 인식하기 위한 음성 입력부, 동기화된 단어 사전 데이터를 포함하는 단어 사전 DB 및 사용자의 음성 특성을 포함하는 음성 인증 특성 DB를 저장하기 위한 저장부, 음성 인증 요청 장치와 무선 연결을 하기 위한 통신부 및 동기화된 단어 사전 데이터에서 음성 인증 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부를 포함하고, 음성 인증 장치의 제어부는, 사용자의 발화 단어를 인식하고, 인식된 사용자의 발화 단어를 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하고, 판단결과 동일하면, 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.
또한, 음성 인증 시스템에 있어서, 단어 사전 데이터는 MxN 행렬 구조의 단어 데이터로 구성되며, 생성된 난수에 대응되는 단어의 검출은, 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, MxN 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 또한, K도 자연수 일 수 있다.
또한, 음성 인증 시스템에 있어서, 단어 사전 데이터의 동기화는 음성 인증 요청 장치와 음성 인증 장치가 시간을 동기화하면서 음성 인증 장치에 저장된 단어 사전 데이터를 음성 인증 요청 장치로 전송하여 동기화할 수 있다.
본 발명의 일 실시예에 따른 음성 인증 방법은, 음성 인증 요청 장치와 음성 인증 장치가 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 단계, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치가 인증 요청 코드를 음성 인증 요청 장치로 전송하는 단계, 음성 인증 장치와 음성 인증 요청 장치가 인증 요청 코드의 전송된 시간을 입력값으로 각각의 난수 생성부를 구동하여 각각 난수를 생성시키고, 동기화된 단어 사전 데이터에서 각각 생성된 난수에 대응되는 단어를 검출하는 단계, 음성 인증 요청 장치가 사용자에게 음성 인증 요청 장치의 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청하는 단계, 음성 인증 장치가 사용자의 발화 단어를 인식하는 단계, 음성 인증 장치가 인식된 사용자의 발화 단어를 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하는 단계 및 판단 결과 동일하면, 음성 인증 장치가 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 사용자의 음성을 인증하는 단계를 포함할 수 있다.
또한, 음성 인증 방법에 있어서, 단어 사전 데이터는 MxN 행렬 구조의 단어 데이터로 구성되며, 생성된 난수에 대응되는 단어의 검출은, 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, MxN 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 또한, K도 자연수 일 수 있다.
또한, 음성 인증 방법에 있어서, 단어 사전 데이터의 동기화는, 음성 인증 요청 장치와 음성 인증 장치가 시간을 동기화하면서 음성 인증 장치에 저장된 단어 사전 데이터를 음성 인증 요청 장치로 전송하여 동기화할 수 있다.
한편, 본 발명의 일 실시예로써, 전술한 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체가 제공될 수 있다.
본 발명의 일 실시예에 따른 음성 인증 시스템에 따르면 추가적인 인증 요소를 결합하여 보안성의 확보와 더불어 음성 인증의 편리성 및 간편성을 확보할 수 있다.
본 발명의 일 실시예에 따른 음성 인증 시스템에 따르면 사용자의 음성 인증 후에도 계속적으로 사용자 음성을 분석하여 단어 사전 DB 및 음성 인증 특성 DB를 업데이트 함으로써 사용자의 음성 인증의 정확성을 유지함과 동시에 보안성을 강화할 수 있다.
이하에 첨부되는 도면들은 본 발명에 관한 이해를 돕기 위한 것으로, 상세한 설명과 함께 본 발명에 대한 실시 예들을 제공한다. 다만, 본 발명의 기술적 특징이 특정 도면에 한정되는 것은 아니며, 각 도면에서 개시하는 특징들은 서로 조합되어 새로운 실시 예로 구성될 수 있다.
도 1은 본 발명의 일 실시예에 따른 음성 인증 시스템(1000)의 블록도이다.
도 2는 본 발명의 일 실시예에 따른 음성 인증 방법의 순서도이다.
본 발명의 일 실시예에 따른 음성 인증 시스템은, 사용자의 음성을 인증하기 위해서 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 음성 인증 요청 장치 및 음성 인증 장치를 포함하고, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치가 인증 요청 코드를 음성 인증 요청 장치로 전송하고, 음성 인증 요청 장치는, 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성하기 위한 난수 생성부, 사용자에게 음성 인증을 위한 단어의 발화를 요청하기 위한 출력부, 동기화된 단어 사전 데이터를 저장하기 위한 저장부, 음성 인증 장치와 무선 연결을 하기 위한 통신부 및 동기화된 단어 사전 데이터에서 음성 인증 요청 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부를 포함하고, 음성 인증 장치는, 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성하기 위한 난수 생성부, 사용자가 발화한 단어의 음성을 인식하기 위한 음성 입력부, 동기화된 단어 사전 데이터를 포함하는 단어 사전 DB 및 사용자의 음성 특성을 포함하는 음성 인증 특성 DB를 저장하기 위한 저장부, 음성 인증 요청 장치와 무선 연결을 하기 위한 통신부 및 동기화된 단어 사전 데이터에서 음성 인증 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부를 포함하고, 음성 인증 장치의 제어부는, 사용자의 발화 단어를 인식하고, 인식된 사용자의 발화 단어를 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하고, 판단결과 동일하면, 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.
또한, 음성 인증 시스템에 있어서, 단어 사전 데이터는 MxN 행렬 구조의 단어 데이터로 구성되며, 생성된 난수에 대응되는 단어의 검출은, 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, MxN 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 또한, K도 자연수 일 수 있다.
또한, 음성 인증 시스템에 있어서, 단어 사전 데이터의 동기화는 음성 인증 요청 장치와 음성 인증 장치가 시간을 동기화하면서 음성 인증 장치에 저장된 단어 사전 데이터를 음성 인증 요청 장치로 전송하여 동기화할 수 있다.
본 발명의 일 실시예에 따른 음성 인증 방법은, 음성 인증 요청 장치와 음성 인증 장치가 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 단계, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치가 인증 요청 코드를 음성 인증 요청 장치로 전송하는 단계, 음성 인증 장치와 음성 인증 요청 장치가 인증 요청 코드의 전송된 시간을 입력값으로 각각의 난수 생성부를 구동하여 각각 난수를 생성시키고, 동기화된 단어 사전 데이터에서 각각 생성된 난수에 대응되는 단어를 검출하는 단계, 음성 인증 요청 장치가 사용자에게 음성 인증 요청 장치의 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청하는 단계, 음성 인증 장치가 사용자의 발화 단어를 인식하는 단계, 음성 인증 장치가 인식된 사용자의 발화 단어를 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하는 단계 및 판단 결과 동일하면, 음성 인증 장치가 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 사용자의 음성을 인증하는 단계를 포함할 수 있다.
또한, 음성 인증 방법에 있어서, 단어 사전 데이터는 MxN 행렬 구조의 단어 데이터로 구성되며, 생성된 난수에 대응되는 단어의 검출은, 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, MxN 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 또한, K도 자연수 일 수 있다.
또한, 음성 인증 방법에 있어서, 단어 사전 데이터의 동기화는, 음성 인증 요청 장치와 음성 인증 장치가 시간을 동기화하면서 음성 인증 장치에 저장된 단어 사전 데이터를 음성 인증 요청 장치로 전송하여 동기화할 수 있다.
한편, 본 발명의 일 실시예로써, 전술한 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체가 제공될 수 있다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 명세서 전체에서 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, "그 중간에 다른 소자를 사이에 두고" 연결되어 있는 경우도 포함한다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 음성 인증 시스템(1000)의 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 음성 인증 시스템(1000)은 사용자의 음성을 인증하기 위해서 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 음성 인증 요청 장치(100) 및 음성 인증 장치(200)를 포함할 수 있다.
본 발명의 일 실시예에 따른 음성 인증 요청 장치(100)는 난수 생성부(110), 출력부(120), 저장부(130), 통신부(140) 및 제어부(150)를 포함할 수 있다.
본 발명의 일 실시예에 따른 난수 생성부(110)는 시간을 입력값으로 난수를 생성하기 위한 장치이다. 예를 들어, 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 무선으로 연결되어 음성 인증 요청이 발생하기 전에는 기 설정된 시간 간격으로 각각 시간 동기화와 단어 사전 데이터의 동기화를 수행하고, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치(200)가 인증 요청 코드를 음성 인증 요청 장치(100)로 전송하는데, 이 때 음성 인증 요청 장치(100)는 인증 요청 코드를 전송받고, 난수 생성부(110)를 이용하여 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성할 수 있다.
이 때, 음성 인증 요청 장치(100)는 기 설정된 시간 간격으로 음성 인증 장치(200)와 시간 동기화를 수행하므로 음성 인증 장치(200)가 인증 요청 코드를 전송하는 시간과 음성 인증 요청 장치(100)가 인증 요청 코드를 전송받는 시간은 동일하게 된다.
즉, 난수 생성부(110)에 입력되는 인증 요청 코드의 전송된 시간은 음성 인증 장치(200)의 난수 생성부(210)에 입력되는 인증 요청 코드의 전송한 시간과 동일하게 되므로 동일한 난수가 생성되게 된다.
본 발명의 일 실시예에 따른 출력부(120)는 사용자에게 음성 인증을 위한 단어의 발화를 요청하기 위한 장치로서, 저장부(130)에 저장된 단어 사전 데이터의 단어를 사용자에게 발화하도록 요청할 수 있다.
예를 들어, '민족' 이라는 단어가 저장부(130)의 단어 사전 데이터에 저장되어 있고, 음성 인증을 위하여 사용자의 '민족' 이라는 단어의 발화가 필요한 경우에, 출력부(120)는 사용자에게 "'민족'을 발음하시오" 라고 요청할 수 있다.
즉, 출력부(120)는 사용자에게 인증에 필요한 인증용 단어의 발화를 요청하기 위하여, 스피커를 이용하여 인증용 단어의 발화를 요청하거나 디스플레이 등을 이용하여 화면에 표시하는 방법으로 사용자의 인증용 단어의 발화를 유도할 수 있다.
본 발명의 일 실시예에 따른 저장부(130)는 음성 인증 장치(200)와 동기화된 단어 사전 데이터를 저장할 수 있다.
음성 인증 장치(200)는 사용자 음성 인증 전에 미리 사용자 음성 인증에 필요한 단어 사전 데이터를 구축하는데, 음성 인증 장치(200)는 음성 인증 요청 장치(100)와 기 설정된 시간 간격으로 시간 동기화를 수행하면서, 구축된 단어 사전 데이터를 음성 인증 요청 장치(100)로 전송하고, 음성 인증 요청 장치(100)는 전송받은 단어 사전 데이터를 저장부(130)에 저장함으로써 단어 사전 데이터의 동기화를 수행할 수 있다.
본 발명의 일 실시예에 따른 통신부(140)는 음성 인증 장치(200)와 무선 연결을 하기 위한 장치로서, 음성 인증 요청 장치(100)는 통신부(140)를 이용하여 음성 인증 장치(200)와 무선으로 연결되어 기 설정된 시간 간격으로 시간 동기화 및 단어 사전 데이터의 동기화를 수행할 수 있다.
예를 들어, 통신부(140)는 블루투스(Bluetooth) 통신 모듈, BLE(Bluetooth Low Energy) 통신 모듈, 근거리 무선 통신 모듈(Near Field Communication unit), 와이파이(Wi-Fi) 통신 모듈, 지그비(Zigbee) 통신 모듈, 적외선(IrDA, infrared Data Association) 통신 모듈, WFD(Wi-Fi Direct) 통신 모듈, UWB(ultra wideband) 통신 모듈, Ant+ 통신 모듈 등일 수 있으나, 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 제어부(150)는 음성 인증 요청 장치(100)의 각 장치들을 제어하기 위한 장치이다.
예를 들어, 제어부(150)는 음성 인증 장치(200)로부터 인증 요청 코드를 전송받으면 난수 생성부(110)로 하여금 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성하도록 제어할 수 있고, 출력부(120)로 하여금 사용자에게 음성 인증에 필요한 단어를 발화하도록 요청하는 문구, 음성 명령 등을 출력하도록 할 수 있다.
또한, 제어부(150)는 저장부(130)로 하여금 동기화된 단어 사전 데이터를 저장하도록 제어할 수 있고, 통신부(140)를 이용하여 음성 인증 장치(200)와 무선 연결되도록 제어하고, 기 설정된 시간 간격으로 시간 동기화 및 단어 사전 데이터를 동기화하도록 제어할 수 있다.
또한, 본 발명의 일 실시예에 따른 제어부(150)는 저장부(130)에 저장된 동기화된 단어 사전 데이터로부터 난수 생성부(110)에서 생성된 난수에 대응되는 단어를 검출할 수 있다.
예를 들어, 동기화된 단어 사전 데이터를 MxN 행렬 구조의 단어 데이터로 구성할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 예를 들어, M 과 N은 10일 수 있다. 즉, 단어 사전 데이터를 10행과 10열로 이루어진 10Х10 행렬 구조의 데이터로 구성할 수 있다. 각 행과 열마다 단어가 들어가게 되므로, 100개의 단어로 구성될 수 있다.
이 때 난수 생성부(110)에 의해서 생성된 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, 전술한 예의 10 X 10 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출하는 방식으로 생성된 난수에 대응되는 단어를 검출할 수 있다. 여기서, K는 자연수 일 수 있으며, 예컨대, K는 2일 수 있다.
예를 들어, 난수 생성부(110)에 의하여 생성된 난수가 987653 이라고 가정하면, 2자리 숫자씩 묶었을 때 맨앞의 2자리 숫자는 98이고, 중간 2자리 숫자는 76이며, 맨끝의 2자리 숫자는 53이 된다. 이 때 맨앞의 2자리 숫자를 설정된 자릿수에 대응되는 2자리 숫자로 가정하면 98 이라는 2자리 숫자를 결정할 수 있고, 전술한 예의 10Х10 행렬 구조의 단어 데이터에서 9행 8열에 해당하는 단어를 선택함으로써 생성된 난수에 대응되는 단어를 검출할 수 있다.
즉, 기 설정된 자릿수는 생성된 난수(예: 6자리 난수)에서 맨앞의 2자리, 중간 2자리, 맨끝의 2자리 숫자 중에서 자릿수를 설정할 수 있으며, 단어 사전 데이터를 10Х10 행렬 구조의 단어 데이터로 구성하기 때문에 2자리의 숫자를 포함하도록 자릿수를 설정하여 행과 열에 해당하는 단어를 선택할 수 있다.
물론, 난수 생성부(110)를 제어하여 단순히 2자리의 숫자가 난수로 생성되게 하여 바로 10Х10 행렬 구조의 단어 데이터에서 해당하는 행과 열의 단어를 검출하는 것도 가능하다.
즉, 난수 생성부(110)가 예컨대 4자리, 6자리, 8자리 이상의 난수를 생성하더라도 난수의 자릿수를 구분하여 기 설정된 자릿수 부분의 2자리 숫자만 결정할 수 있으면, 10Х10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자에 대응되는 행과 열의 단어를 검출할 수 있다.
본 발명의 일 실시예에 따른 음성 인증 장치(200)는 난수 생성부(210), 음성 입력부(220), 저장부(230), 통신부(240) 및 제어부(250)를 포함할 수 있다.
본 발명의 일 실시예에 따른 난수 생성부(210)는 시간을 입력값으로 난수를 생성하기 위한 장치이다.
예를 들어, 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 무선으로 연결되어 음성 인증 요청이 발생하기 전에는 기 설정된 시간 간격으로 각각 시간 동기화와 단어 사전 데이터의 동기화를 수행하고, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치(200)가 인증 요청 코드를 음성 인증 요청 장치(100)로 전송하는데, 이 때 음성 인증 장치(200)는 인증 요청 코드를 전송하고, 난수 생성부(210)를 이용하여 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성할 수 있다.
즉, 전술한 바와 같이, 음성 인증 장치(200)는 기 설정된 시간 간격으로 음성 인증 요청 장치(100)와 시간 동기화를 수행하므로, 난수 생성부(210)에 입력되는 인증 요청 코드의 전송한 시간은 음성 인증 요청 장치(100)의 난수 생성부(110)에 입력되는 인증 요청 코드의 전송된 시간과 동일하게 되므로 동일한 난수가 생성되게 된다.
본 발명의 일 실시예에 따른 음성 입력부(220)는 사용자가 발화한 단어의 음성을 인식할 수 있다.
예를 들어, 음성 입력부(220)는 음성 인증 장치(200)가 사용자의 음성을 인증하기 위하여 사용자가 발화한 단어의 음성을 입력받기 위한 장치로서, 마이크 등의 음성 입력 장치가 될 수 있다.
본 발명의 일 실시예에 따른 저장부(230)는 동기화된 단어 사전 데이터를 포함하는 단어 사전 DB(232) 및 사용자의 음성 특성을 포함하는 음성 인증 특성 DB(234)를 저장할 수 있다.
즉, 음성 인증 장치(200)는 사용자 음성 인증 전에 미리 사용자 음성 인증에 필요한 단어 사전 데이터를 구축하여 저장부(230)에 저장하는데, 저장부(230)에는 단어 사전 데이터를 구축하기 위한 단어 사전 DB(232)를 미리 저장해 둘 수 있다.
예를 들어, 사용자가 최초로 음성 인증 시스템(1000)을 사용하는 경우에, 인증에 필요한 단어 사전 데이터를 구축하기 위해서 최초 1회 사용자에게 문장 등을 제공하여 발화하게 하는데, 제공되는 문장을 포함하는 단어 사전 DB(232)를 저장부(230)에 저장해 둘 수 있다.
예를 들어, 처음에는 저장부(230)의 단어 사전 DB(232)에 국민 교육 헌장을 저장하고, 최초 1회 사용자에게 저장된 국민 교육 헌장의 문장을 랜덤하게 제공하여 사용자가 읽도록 함으로써, 사용자의 음성 및 사용자가 읽은 문장을 분석하여 명사를 구분하여 단어 사전 DB(232)에 저장하게 할 수 있다. 이 때 단어 사전 DB(232)는 명사로 구분된 단어 사전으로 업데이트되고, 제어부(250)는 업데이트된 단어 사전 DB(232)에 저장된 단어를 이용하여 10 X 10 행렬 구조의 단어 사전 데이터를 구성할 수 있다.
또한, 음성 인증 특성 DB(234)는 사용자의 음성 및 사용자가 읽은 문장을 분석하여 사용자의 음성 특징을 판별하여 저장부(230)에 저장할 수 있다.
즉, 단어 사전 DB(232)는 단어 사전 데이터를 구성하기 위한 단어를 저장하는 DB가 되고, 음성 인증 특성 DB(234)는 단어를 발화하는 사용자의 음성 특성값을 저장하여 사용자의 음성을 인증, 검증하기 위한 DB가 된다. 즉, 사용자의 음성의 고유성에 관한 정보는 음성 인증 특성 DB(234)에 저장되게 된다.
예를 들어, 사용자가 인증받아 발화한 단어를 특징벡터 모델로 설정하여 음성 인증 특성 DB(234)에 음성 특성값으로 저장하는 방식으로, 이후에 음성 인증을 위하여 사용자가 인증용 단어를 발화하면 음성 인증 특성 DB(234)에 저장된 특징벡터 모델의 음성 특성값과 사용자의 발화 단어의 음성 특성값을 비교하여 사용자의 음성을 인증할 수 있다.
또한, 사용자의 음성 인증이 완료되더라도, 즉 음성 인증 승인 후에도 계속 사용자가 발화한 음성을 분석함으로써 계속 명사를 도출하여 단어 사전 DB(232) 및 음성 인증 특성 DB(234)를 업데이트할 수 있다.
즉, 사용자의 음성 인증 승인 후에도 업데이트된 단어 사전 DB(232)를 이용하여 계속 새로운 단어 사전 데이터, 즉 음성 인증용 10Х10 행렬 구조의 단어 사전 데이터를 계속 신규로 업데이트할 수 있고, 업데이트된 음성 인증 특성 DB(234)를 이용하여 사용자가 시간의 흐름에 따라서 음성이 변화하더라도 사용자의 음성 인증을 가능하게 한다.
여기에서 업데이트된 단어 사전 데이터는 저장부(230)에 저장되고, 시간 동기화가 수행될 때마다 음성 인증 요청 장치(100)로 전송되어 업데이트된 단어 사전 데이터의 동기화가 수행될 수 있다.
즉, 음성 인증 특성 DB(234)의 계속적 업데이트에 따라서 자연스럽게 변화하는 사용자의 음성의 고유성을 판별하게 됨으로써, 음성 인증의 신뢰성을 확보할 수 있다.
본 발명의 일 실시예에 따른 통신부(240)는 음성 인증 요청 장치(100)와 무선 연결을 하기 위한 장치로서, 음성 인증 장치(200)는 통신부(240)를 이용하여 음성 인증 요청 장치(100)와 무선으로 연결되어 기 설정된 시간 간격으로 시간 동기화 및 업데이트된 단어 사전 데이터의 동기화를 수행할 수 있다.
예를 들어, 통신부(240)는 블루투스(Bluetooth) 통신 모듈, BLE(Bluetooth Low Energy) 통신 모듈, 근거리 무선 통신 모듈(Near Field Communication unit), 와이파이(Wi-Fi) 통신 모듈, 지그비(Zigbee) 통신 모듈, 적외선(IrDA, infrared Data Association) 통신 모듈, WFD(Wi-Fi Direct) 통신 모듈, UWB(ultra wideband) 통신 모듈, Ant+ 통신 모듈 등일 수 있으나, 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 제어부(250)는 음성 인증 장치(200)의 각 장치들을 제어하기 위한 장치이다.
예를 들어, 제어부(250)는 음성 인증이 필요한 사건이 발생하면 통신부(240)를 이용하여 음성 인증 요청 장치(100)로 인증 요청 코드를 전송하고, 난수 생성부(210)로 하여금 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성하도록 제어할 수 있다.
또한, 제어부(250)는 음성 입력부(220)로 하여금 사용자가 발화한 단어의 음성을 인식하도록 제어할 수 있고, 저장부(230)로 하여금 업데이트된 단어 사전 DB(232) 및 음성 인증 특성 DB(234)를 저장하도록 제어할 수 있고, 업데이트된 단어 사전 DB(232)에 의해 새로이 생성되는 단어 사전 데이터를 저장하도록 제어할 수 있다.
또한, 제어부(250)는 통신부(240)를 이용하여 음성 인증 장치(200)와 무선 연결되도록 제어하고, 기 설정된 시간 간격으로 시간 동기화 및 단어 사전 데이터를 동기화하도록 제어할 수 있다.
또한, 본 발명의 일 실시예에 따른 제어부(250)는 저장부(230)에 저장된 동기화된 단어 사전 데이터로부터 난수 생성부(210)에서 생성된 난수에 대응되는 단어를 검출할 수 있다.
즉, 전술한 예에서와 같이, 동기화된 단어 사전 데이터는 10 X 10 행렬 구조의 단어 데이터로 구성되고, 난수 생성부(210)에 의해서 생성된 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 2자리 숫자를 결정하고, 10 X 10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자와 대응되는 행과 열의 단어를 검출하는 방식으로 생성된 난수에 대응되는 단어를 검출할 수 있다.
즉, 난수 생성부(110)가 예컨대 4자리, 6자리, 8자리 이상의 난수를 생성하더라도 난수의 자릿수를 구분하여 기 설정된 자릿수 부분의 2자리 숫자만 결정할 수 있으면, 10 X 10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자에 대응되는 행과 열의 단어를 검출할 수 있다.
또한, 본 발명의 일 실시예에 따른 제어부(250)는 사용자의 발화 단어를 인식하고, 인식된 사용자의 발화 단어를 음성 인증 장치(200)의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단할 수 있다.
즉, 제어부(250)는 사용자의 음성 인증을 위해서 음성 입력부(220)를 통해서 사용자의 발화 단어를 인식하고, 인식된 사용자의 발화 단어를 음성 인증 장치(200)의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단할 수 있다.
예를 들어, 사용자는 음성 인증 요청 장치(100)의 난수 생성부(110)에서 생성된 난수와 대응되는 단어를 발화하게 되는데, 음성 인증 요청 장치(100)와 음성 인증 장치(200)의 시간 동기화 및 단어 데이터 동기화에 의해서 음성 인증 장치(200)의 난수 생성부(210)가 생성하는 난수가 음성 인증 요청 장치(100)의 난수 생성부(110)에서 생성된 난수와 동일하게 되고, 결국 음성 인증 요청 장치(100)와 음성 인증 장치(200)가 각각 난수에 대응되게 검출하는 단어도 동일하게 되므로 각 장치의 단어 동일 여부에 따라서 사용자의 음성 인증에 사용될 수 있다.
또한, 본 발명의 일 실시예에 따른 제어부(250)는 인식된 사용자의 발화 단어를 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.
즉, 사용자의 음성 인증, 환언하면 사용자 음성의 고유성을 판별하기 위해서, 제어부(250)는 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.
예를 들어, 제어부(250)는 사용자가 발화한 단어의 음성 특성값에서 임계값을 설정하고, 음성 특성값과 음성 인증 특성 DB(234)에 저장된 값과 비교하여 그 차이가 설정된 임계값 이내인 경우에는 동일한 사용자가 단어를 발화한 것으로 판별하여 사용자의 음성을 인증할 수 있다.
또한, 제어부(250)는 사용자가 발화한 단어의 음성 신호의 특성 벡터 모델을 추정하고, 추정된 특성 벡터 모델과 음성 인증 특성 DB(234)에 저장된 값을 통계적 모델에서 오버랩되는 부분을 비교하는 방법으로 사용자의 음성을 인증할 수 있다.
도 2는 본 발명의 일 실시예에 따른 음성 인증 방법의 순서도이다
도 2를 참조하면, 단계 S10에서, 사용자의 음성을 인증하기 위해서 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 무선으로 연결되어 각각 시간 동기화 및 단어 사전 데이터를 동기화할 수 있다.
즉, 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 음성 인증 요청이 발생하기 전에는 기 설정된 시간 간격으로 각각 시간 동기화와 단어 사전 데이터의 동기화를 수행할 수 있다.
여기에서, 기 설정된 시간 간격뿐만 아니라 연결시마다 동기화가 가능하도록 설정할 수 있으며, 음성 인증 장치(200)를 기준으로 음성 인증 요청 장치(100)의 시간 동기화 및 단어 사전 데이터의 동기화를 수행한다.
단계 S20에서, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치(200)가 인증 요청 코드를 음성 인증 요청 장치(100)로 전송할 수 있다.
즉, 음성 인증이 필요한 사건이 발생하면, 음성 인증 장치(200)가 사용자의 음성 인증을 요청하기 위한 인증 요청 코드를 생성하고 생성된 인증 요청 코드를 음성 인증 요청 장치(100)로 전송할 수 있다.
단계 S30에서, 음성 인증 장치(200)와 음성 인증 요청 장치(100)가 인증 요청 코드의 전송된 시간을 입력값으로 각각의 난수 생성부(110, 210)를 구동하여 각각 난수를 생성시키고, 동기화된 단어 사전 데이터에서 각각 생성된 난수에 대응되는 단어를 검출할 수 있다.
즉, 음성 인증 장치(200)는 기 설정된 시간 간격으로 음성 인증 요청 장치(100)와 시간 동기화를 수행하므로, 난수 생성부(210)에 입력되는 인증 요청 코드의 전송한 시간은 음성 인증 요청 장치(100)의 난수 생성부(110)에 입력되는 인증 요청 코드의 전송된 시간과 동일하게 되므로 각각의 난수 생성부(110, 210)에 각각 난수를 생성하더라도 동일한 난수가 생성되게 된다.
따라서, 동기화된 단어 사전 데이터에서 각각 생성된 난수에 대응되는 단어 또한 동일하게 되며, 각각 다른 장치인 음성 인증 장치(200)와 음성 인증 요청 장치(100)에서 검출된 단어의 동일성을 이용하여 사용자 음성 인증을 수행할 수 있다.
또한, 전술한 예에서와 같이, 동기화된 단어 사전 데이터는 10Х10 행렬 구조의 단어 데이터로 구성될 수 있으며, 각각의 난수 생성부(110, 210)에 의해서 생성된 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 2자리 숫자를 결정하고, 10Х10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자와 대응되는 행과 열의 단어를 검출하는 방식으로 생성된 난수에 대응되는 단어를 검출할 수 있다.
단계 S40에서, 음성 인증 요청 장치(100)가 사용자에게 음성 인증 요청 장치(100)의 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청할 수 있다.
예를 들어, 음성 인증 요청 장치(100)는 출력부(120)를 이용하여 사용자에게 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청할 수 있다.
즉, 음성 인증 요청 장치(100)는 사용자의 음성 인증을 위해서 스피커를 이용하여 사용자에게 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청하거나 디스플레이 등을 이용하여 화면에 표시하는 방법으로 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 유도할 수 있다.
단계 S50에서, 음성 인증 장치(200)가 사용자의 발화 단어를 인식할 수 있다.
예를 들어, 음성 인증 장치(200)는 음성 입력부(220)를 이용하여 사용자가 발화한 단어 및 발화한 단어의 음성(음성 특성값)을 인식할 수 있다. 즉, 음성 인증 장치(200)는 단어 사전 데이터에서 검출된 단어와의 비교를 위해서 사용자가 발화한 단어를 인식하고, 사용자 음성의 고유성 판단을 위해서, 예컨대 음성 인증 특성 DB(234)에 저장된 값과의 비교를 위해서 사용자가 발화한 단어의 음성(음성 특성값)을 인식할 수 있다.
단계 S60에서, 음성 인증 장치(200)가 인식된 사용자의 발화 단어를 음성 인증 장치(200)의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단할 수 있다.
예를 들어, 사용자는 음성 인증 요청 장치(100)의 난수 생성부(110)에서 생성된 난수와 대응되는 단어를 발화하게 되는데, 음성 인증 요청 장치(100)와 음성 인증 장치(200)의 시간 동기화 및 단어 데이터 동기화에 의해서 음성 인증 장치(200)의 난수 생성부(210)가 생성하는 난수가 음성 인증 요청 장치(100)의 난수 생성부(110)에서 생성된 난수와 동일하게 되고, 결국 음성 인증 요청 장치(100)와 음성 인증 장치(200)가 각각 난수에 대응되게 검출하는 단어도 동일하게 되므로 각 장치의 단어 동일 여부에 따라서 사용자의 음성 인증에 사용될 수 있다.
단계 S70에서, 판단 결과 동일하면, 음성 인증 장치(200)가 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.
즉, 사용자가 음성 인증 요청 장치(100)를 통하여 발화한 단어와 음성 인증 장치(200)에서 검출된 단어의 동일 여부를 판단하고, 인식된 단어가 동일하면, 발화된 단어의 음성 특성값을 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.
즉, 사용자 음성 인증을 위해서 각각의 장치(100, 200)에서 검출된 단어의 동일 여부를 판단한 후, 사용자 음성의 고유성을 판단하게 되는데, 음성 인증 요청 장치(100)는 사용자가 발화한 단어의 음성 신호의 특성 벡터 모델을 추정하고, 추정된 특성 벡터 모델과 음성 인증 특성 DB(234)에 저장된 값을 통계적 모델에서 오버랩되는 부분을 비교하는 방법으로 사용자의 음성을 인증할 수 있다.
또한, 음성 인증 요청 장치(100)는 사용자가 발화한 단어의 음성 특성값에서 임계값을 설정하고, 음성 특성값과 음성 인증 특성 DB(234)에 저장된 값과 비교하여 그 차이가 설정된 임계값 이내인 경우에는 동일한 사용자가 단어를 발화한 것으로 판별하여 사용자의 음성을 인증할 수 있다.
또한, 사용자의 음성 인증이 완료되더라도 즉 음성 인증 승인 후에도 계속 사용자가 발화한 음성을 분석함으로써 계속 명사를 도출하여 단어 사전 DB(232) 및 음성 인증 특성 DB(234)를 업데이트할 수 있다.
즉, 사용자의 음성을 지속적으로 단어 사전화 하는 과정에서 사용자의 음성을 분석하고 사용자의 음성 특성을 업데이트함으로써 사용자 음성 인증의 정확성을 유지함과 동시에 보안성을 강화할 수 있다.
음성 인증 요청 장치(100)는 이어폰의 형태로 음성 인증 장치(200)는 스마트폰, 이동 단말, PC, PDA, 패드 등의 형태로 구현 가능하나, 본 발명의 범위가 이에 한정되는 것은 아니다.
또한, 예로써 전술한 수치 값들은 단순히 설명을 위한 예시적인 것으로, 제시된 수치 값에 반드시 제한되는 것은 아니다.
본 발명의 일 실시예에 따른 음성 인증 방법에 관련하여서는 전술한 음성 인증 시스템(1000)에 대한 내용이 적용될 수 있다. 따라서, 음성 인증 방법과 관련하여, 전술한 음성 인증 시스템(1000)에 대한 내용과 동일한 내용에 대하여는 설명을 생략하였다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (7)

  1. 음성 인증 시스템에 있어서,
    상기 음성 인증 시스템은 사용자의 음성을 인증하기 위해서 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 음성 인증 요청 장치 및 음성 인증 장치를 포함하고,
    음성 인증이 필요한 사건이 발생하면 상기 음성 인증 장치가 인증 요청 코드를 상기 음성 인증 요청 장치로 전송하고,
    상기 음성 인증 요청 장치는,
    상기 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성하기 위한 난수 생성부;
    사용자에게 음성 인증을 위한 단어의 발화를 요청하기 위한 출력부;
    상기 동기화된 단어 사전 데이터를 저장하기 위한 저장부;
    상기 음성 인증 장치와 무선 연결을 하기 위한 통신부; 및
    상기 동기화된 단어 사전 데이터에서 상기 음성 인증 요청 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부; 를 포함하고,
    상기 음성 인증 장치는,
    상기 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성하기 위한 난수 생성부;
    상기 사용자가 발화한 단어의 음성을 인식하기 위한 음성 입력부;
    상기 동기화된 단어 사전 데이터를 포함하는 단어 사전 DB 및 상기 사용자의 음성 특성을 포함하는 음성 인증 특성 DB를 저장하기 위한 저장부;
    상기 음성 인증 요청 장치와 무선 연결을 하기 위한 통신부; 및
    상기 동기화된 단어 사전 데이터에서 상기 음성 인증 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부; 를 포함하고,
    상기 음성 인증 장치의 제어부는,
    상기 사용자의 발화 단어를 인식하고, 상기 인식된 사용자의 발화 단어를 상기 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하고, 상기 판단결과 동일하면, 상기 인식된 사용자의 발화 단어의 음성 특성값을 상기 음성 인증 특성 DB에 저장된 값과 비교하여 상기 사용자의 음성을 인증하는 음성 인증 시스템.
  2. 제 1 항에 있어서,
    상기 단어 사전 데이터는 M x N 행렬 구조의 단어 데이터로 구성되며,
    상기 생성된 난수에 대응되는 단어의 검출은,
    상기 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, 상기 M x N 행렬 구조의 단어 데이터에서 상기 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출하는 것이며, M 과 N은 각각 동일하거나 상이한 자연수이고, K도 자연수인 음성 인증 시스템.
  3. 제 1 항에 있어서,
    상기 단어 사전 데이터의 동기화는,
    상기 음성 인증 요청 장치와 상기 음성 인증 장치가 시간을 동기화하면서 상기 음성 인증 장치에 저장된 단어 사전 데이터를 상기 음성 인증 요청 장치로 전송하여 동기화하는 음성 인증 시스템.
  4. 음성 인증 방법에 있어서,
    음성 인증 요청 장치와 음성 인증 장치가 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 단계;
    음성 인증이 필요한 사건이 발생하면 상기 음성 인증 장치가 인증 요청 코드를 상기 음성 인증 요청 장치로 전송하는 단계;
    상기 음성 인증 장치와 상기 음성 인증 요청 장치가 상기 인증 요청 코드의 전송된 시간을 입력값으로 각각의 난수 생성부를 구동하여 각각 난수를 생성시키고, 상기 동기화된 단어 사전 데이터에서 상기 각각 생성된 난수에 대응되는 단어를 검출하는 단계;
    상기 음성 인증 요청 장치가 사용자에게 상기 음성 인증 요청 장치의 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청하는 단계;
    상기 음성 인증 장치가 상기 사용자의 발화 단어를 인식하는 단계;
    상기 음성 인증 장치가 상기 인식된 사용자의 발화 단어를 상기 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하는 단계; 및
    상기 판단 결과 동일하면, 상기 음성 인증 장치가 상기 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 상기 사용자의 음성을 인증하는 단계를 포함하는 음성 인증 방법.
  5. 제 4 항에 있어서,
    상기 단어 사전 데이터는 M x N 행렬 구조의 단어 데이터로 구성되며,
    상기 생성된 난수에 대응되는 단어의 검출은,
    상기 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, 상기 M x N 행렬 구조의 단어 데이터에서 상기 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출하는 것이며, M 과 N은 각각 동일하거나 상이한 자연수이고, K도 자연수인 음성 인증 방법.
  6. 제 4 항에 있어서,
    상기 단어 사전 데이터의 동기화는,
    상기 음성 인증 요청 장치와 상기 음성 인증 장치가 시간을 동기화하면서 상기 음성 인증 장치에 저장된 단어 사전 데이터를 상기 음성 인증 요청 장치로 전송하여 동기화하는 음성 인증 방법.
  7. 제 4 항 내지 제 6 항 중 어느 한 항의 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체.
PCT/KR2018/010922 2017-10-20 2018-09-17 음성 인증 시스템 WO2019078492A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2017-0136546 2017-10-20
KR1020170136546A KR101812022B1 (ko) 2017-10-20 2017-10-20 음성 인증 시스템

Publications (1)

Publication Number Publication Date
WO2019078492A1 true WO2019078492A1 (ko) 2019-04-25

Family

ID=60936989

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/010922 WO2019078492A1 (ko) 2017-10-20 2018-09-17 음성 인증 시스템

Country Status (2)

Country Link
KR (1) KR101812022B1 (ko)
WO (1) WO2019078492A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101925253B1 (ko) * 2018-06-01 2018-12-04 주식회사 공훈 문맥 독립형 화자확인 장치 및 이를 이용한 화자확인 방법
KR102098956B1 (ko) * 2018-09-19 2020-04-09 주식회사 공훈 음성인식장치 및 음성인식방법
KR102623727B1 (ko) 2018-10-29 2024-01-11 삼성전자주식회사 전자 장치 및 이의 제어 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096390A (ja) * 1995-06-22 1997-01-10 Seiko Epson Corp 音声認識対話処理方法および音声認識対話装置
KR20030013855A (ko) * 2001-08-09 2003-02-15 삼성전자주식회사 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템
KR101181060B1 (ko) * 2011-08-09 2012-09-07 서울시립대학교 산학협력단 음성 인식 시스템 및 이를 이용한 화자 인증 방법
KR20160149132A (ko) * 2015-06-17 2016-12-27 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 성문 인증 방법 및 장치
KR20170049317A (ko) * 2015-10-28 2017-05-10 브이피 주식회사 음성인식을 활용한 인증 장치 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096390A (ja) * 1995-06-22 1997-01-10 Seiko Epson Corp 音声認識対話処理方法および音声認識対話装置
KR20030013855A (ko) * 2001-08-09 2003-02-15 삼성전자주식회사 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템
KR101181060B1 (ko) * 2011-08-09 2012-09-07 서울시립대학교 산학협력단 음성 인식 시스템 및 이를 이용한 화자 인증 방법
KR20160149132A (ko) * 2015-06-17 2016-12-27 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 성문 인증 방법 및 장치
KR20170049317A (ko) * 2015-10-28 2017-05-10 브이피 주식회사 음성인식을 활용한 인증 장치 및 방법

Also Published As

Publication number Publication date
KR101812022B1 (ko) 2017-12-26

Similar Documents

Publication Publication Date Title
WO2019078492A1 (ko) 음성 인증 시스템
WO2014107076A1 (en) Display apparatus and method of controlling a display apparatus in a voice recognition system
WO2018151464A1 (ko) 음성 인식을 이용한 코딩시스템 및 코딩방법
WO2019125084A1 (en) Systems and methods for biometric user authentication
WO2018128238A1 (ko) 디스플레이 장치를 이용한 가상 상담 시스템 및 방법
WO2014010982A1 (en) Method for correcting voice recognition error and broadcast receiving apparatus applying the same
WO2020166896A1 (en) Electronic apparatus and controlling method thereof
WO2021118179A1 (ko) 사용자 단말, 화상 통화 장치, 화상 통화 시스템 및 그 제어방법
WO2020054980A1 (ko) 음소기반 화자모델 적응 방법 및 장치
WO2019054681A1 (ko) 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비
US11776543B2 (en) Authentication system, authentication method, and, non-transitory computer-readable information recording medium for recording program
WO2023128342A1 (ko) 동형 암호화된 음성을 이용한 개인 식별 방법 및 시스템
WO2018117660A1 (en) Security enhanced speech recognition method and device
WO2020149621A1 (ko) 영어 말하기 평가 시스템 및 방법
CN112654983A (zh) 信息处理装置、用户认证网络系统以及用户认证方法
WO2020204357A1 (ko) 전자 장치 및 이의 제어 방법
WO2020251116A1 (ko) 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법
WO2020138943A1 (ko) 음성을 인식하는 장치 및 방법
KR101876262B1 (ko) 복합 사용자 인증 시스템
CN104965650A (zh) 公共场所显示设备的控制方法及装置
WO2014178491A1 (ko) 발화 인식 방법 및 장치
WO2023022316A1 (ko) 외국어 동영상의 자막 필터링 방법 및 이를 수행하는 시스템
WO2017119596A1 (ko) 통합 회원 관리 방법
WO2023121231A1 (en) Computer implemented method for determining false positives in a wakeup-enabled device, corresponding device and system
KR20200039210A (ko) 컴퓨터 프로그램

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18867909

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18867909

Country of ref document: EP

Kind code of ref document: A1