KR20170003366A - 성문 기반 통신 방법, 장치, 및 시스템 - Google Patents

성문 기반 통신 방법, 장치, 및 시스템 Download PDF

Info

Publication number
KR20170003366A
KR20170003366A KR1020150187473A KR20150187473A KR20170003366A KR 20170003366 A KR20170003366 A KR 20170003366A KR 1020150187473 A KR1020150187473 A KR 1020150187473A KR 20150187473 A KR20150187473 A KR 20150187473A KR 20170003366 A KR20170003366 A KR 20170003366A
Authority
KR
South Korea
Prior art keywords
information
voice
user account
identification information
server
Prior art date
Application number
KR1020150187473A
Other languages
English (en)
Other versions
KR101769689B1 (ko
Inventor
니안동 두
차오 리
얀 씨에
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20170003366A publication Critical patent/KR20170003366A/ko
Application granted granted Critical
Publication of KR101769689B1 publication Critical patent/KR101769689B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/0643Hash functions, e.g. MD5, SHA, HMAC or f9 MAC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/083Network architectures or network communication protocols for network security for authentication of entities using passwords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/065Encryption by serially and continuously modifying data stream elements, e.g. stream cipher systems, RC4, SEAL or A5/3
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3226Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
    • H04L9/3231Biological data, e.g. fingerprint, voice or retina
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3236Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions
    • H04L9/3239Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions involving non-keyed hash functions, e.g. modification detection codes [MDCs], MD5, SHA or RIPEMD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints

Abstract

본 발명은 성문 기반 통신 방법, 장치 및 시스템에 관련된다. 성문 기반 통신 방법은, 제1 정보를 서버에 전송하고 상기 서버로부터 전송된 식별 정보를 수신하는 단계를 포함하되, 상기 식별 정보는 상기 서버가 상기 제1 정보를 수신한 후에 생성되고 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및 제2 정보 및 상기 식별 정보를 상기 서버에 전송하는 단계를 포함하되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나이다.

Description

성문 기반 통신 방법, 장치, 및 시스템{COMMUNICATION METHOD, APPARATUS AND SYSTEM BASED ON VOICEPRINT}
본 출원은 2015. 6. 30.자로 중국특허청에 출원된 중국특허출원 제201510372778.X호의 이익들 및 우선권을 주장하고, 해당 출원의 모든 내용은 여기에 참조로 포함된다.
본 발명의 실시예들은 일반적으로 통신 기술 분야에 관련되고, 보다 구체적으로, 성문 기반 통신 방법, 장치 및 시스템에 관련된다.
종래의 확인 모드(verification mode)는 일반적으로 비밀번호를 기반으로 하지만, 비밀번호 기반 확인 모드는 도용하기 쉽다. 보안을 향상시키기 위하여, 성문(voiceprint) 기반 확인 코드가 나타나고, 이것은 사용자의 성문 정보를 사용하고 위조하기 쉽지 않으며, 따라서 어느 정도는 보안을 향상시킨다.
종래 기술에서, 성문 기반 확인 과정에서, 서버에 의하여 확인되기 위해, 클라이언트는 일반적으로 사용자 계정 정보(user account information) 및 성문 정보(voiceprint information)를 서버에 동시에 전송한다. 그러나, 악성 공격자(malicious attacker)가 클라이언트와 서버 사이의 통신 연결에서 데이터 패킷을 캡쳐(capture)하거나 분석하면, 사용자 계정 정보 및 성문 정보 또한 유출될 수 있다. 따라서 종래 기술에서는 통신 방식의 숨은 보안 위험이 있다.
본 발명의 실시예들은 종래 기술에 존재하는 문제점들의 적어도 하나를 최소한 어느 정도 해결하고자 한다.
그에 맞춰, 본 발명의 목적은 성문 기반 통신의 보안을 향상시키는 성문 기반 통신 방법을 제공하는 것이다.
본 발명의 다른 목적은 성문 기반 통신 장치를 제공하는 것이다.
본 발명의 다른 목적은 성문 기반 통신 시스템을 제공하는 것이다.
상기 목적들을 달성하기 위하여, 본 발명의 제1 측면의 실시예들은 성문 기반 통신 방법을 제공하고, 성문 기반 통신 방법은, 제1 정보를 서버에 전송하고 상기 서버로부터 전송된 식별 정보를 수신하는 단계를 포함하되, 상기 식별 정보는 상기 서버가 상기 제1 정보를 수신한 후에 생성되고 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및 제2 정보 및 상기 식별 정보를 상기 서버에 전송하는 단계를 포함하되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나이다.
본 발명의 제1 측면의 실시예들에 따른 성문 기반 통신 방법과 함께, 제1 정보 및 제2 정보를 서버로 두번에 걸쳐서 전송하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송에서 야기되는 문제는 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
상기 목적들을 달성하기 위하여, 본 발명의 제2 측면의 실시예들은 성문 기반 통신 방법을 제공하고, 성문 기반 통신 방법은, 클라이언트로부터 전송된 제1 정보를 수신하고, 식별 정보를 생성하고, 상기 식별 정보를 상기 클라이언트로 전송하는 단계를 포함하되, 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및 상기 클라이언트로부터 전송된 상기 식별 정보 및 제2 정보를 수신하는 단계를 포함하되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나이다.
본 발명의 제2 측면의 실시예들에 따른 성문 기반 통신 방법과 함께, 두번에 걸쳐서 클라이언트로부터 전송된 제1 정보 및 제2 정보를 수신하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송에서 야기되는 문제는 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
상기 목적들을 달성하기 위하여, 본 발명의 제3 측면의 실시예들은 성문 기반 통신 장치를 제공하고, 성문 기반 통신 장치는, 제1 정보를 서버에 전송하고 서버로부터 전송된 식별정보를 수신하기 위한 제1 상호작용 모듈을 포함하되, 식별 정보는 서버가 제1 정보를 수신한 후에 생성되고 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고, 제2 정보 및 상기 식별 정보를 상기 서버에 전송하기 위한 제2 상호작용 모듈을 포함하되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나이다.
본 발명의 제3 측면의 실시예들에 따른 성문 기반 통신 장치와 함께, 제1 정보 및 제2 정보를 서버로 두번에 걸쳐서 전송하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송에서 야기된 문제는 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
상기 목적들을 달성하기 위하여, 본 발명의 제4 측면의 실시예들은 성문 기반 통신 장치를 제공하고, 성문 기반 통신 장치는, 클라이언트로부터 전송된 제1 정보를 수신하고, 식별 정보를 생성하고, 상기 식별 정보를 상기 클라이언트로 전송하기 위한 제1 상호작용 모듈을 포함하되, 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및 상기 클라이언트로부터 전송된 상기 식별 정보 및 제2 정보를 수신하기 위한 제2 상호작용 모듈을 포함하되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나이다.
본 발명의 제4 측면의 실시예들에 따른 성문 기반 통신 장치와 함께, 두번에 걸쳐서 클라이언트로부터 전송된 제1 정보 및 제2 정보를 수신하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송에서 야기되는 문제는 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
상기 목적들을 달성하기 위하여, 본 발명의 제5 측면의 실시예들은 성문 기반 통신 시스템을 제공하고, 성문 기반 통신 시스템은, 본 발명의 제3 측면의 실시예들에 따른 장치 및 본 발명의 제4 측면의 실시예들에 따른 장치를 포함한다.
본 발명의 제5 측면의 실시예들에 따른 성문 기반 통신 시스템과 함께, 확인 보안을 향상시키기 위하여, 모바일 단말 및 서버는 사용자 계정 정보 및 음성 정보를 두번에 걸쳐서 전송하고, 예를 들어, 확인을 위한 음성 정보 및 사용자 계정 정보는 따로따로 전송되고, 따라서 그것의 동기 전송에서 야기되는 불안 문제는 방지될 수 있다.
상기 목적들을 달성하기 위하여, 본 발명의 제6 측면의 실시예들은 성문 기반 통신 장치를 제공하고, 성문 기반 통신 장치는, 프로세서; 및 상기 프로세서에 의하여 실행될 수 있는 명령어들을 저장하기 위한 메모리를 포함한다. 상기 프로세서는, 제1 정보를 서버에 전송하고 상기 서버로부터 전송된 식별 정보를 수신하도록 구성되되, 상기 식별 정보는 상기 서버가 상기 제1 정보를 수신한 후에 생성되고 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 제2 정보 및 상기 식별 정보를 상기 서버에 전송하도록 구성되되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나이다.
상기 목적들을 달성하기 위하여, 본 발명의 제7 측면의 실시예들은 성문 기반 통신 장치를 제공하고, 성문 기반 통신 장치는 프로세서; 및 상기 프로세서에 의하여 실행될 수 있는 명령어들을 저장하기 위한 메모리를 포함한다. 상기 프로세서는, 클라이언트로부터 전송된 제1 정보를 수신하고, 식별 정보를 생성하고, 상기 식별 정보를 상기 클라이언트로 전송하도록 구성되되, 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및 상기 클라이언트로부터 전송된 상기 식별 정보 및 제2 정보를 수신하도록 구성되되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나이다.
본 발명의 실시예들의 추가적인 측면들 및 이점들은 다음의 설명들에 있는 부분에서 주어질 것이고, 다음의 설명들로부터의 부분에서 명백해지거나, 또는 본 발명의 실시예들의 실행으로부터 학습될 것이다.
본 발명의 실시예들의 상기 및/또는 추가적인 측면들과 이점들은 첨부된 도면들을 참조로 하는 다음의 설명들로부터 명백해지고 더 순조롭게 이해될 것이다.
도 1은 본 발명의 일 실시예에 따른 성문 기반 통신 방법의 흐름도이다;
도 2는 본 발명의 다른 실시예에 따른 성문 기반 통신 방법의 흐름도이다;
도 3은 본 발명의 다른 실시예에 따른 성문 기반 통신 방법의 흐름도이다;
도 4는 본 발명의 다른 실시예에 따른 성문 기반 통신 방법의 흐름도이다;
도 5는 본 발명의 일 실시예에 따른 성문 기반 통신 장치의 구성도이다;
도 6은 본 발명의 다른 실시예에 따른 성문 기반 통신 장치의 구성도이다;
도 7은 본 발명의 다른 실시예에 따른 성문 기반 통신 장치의 구성도이다;
도 8은 본 발명의 다른 실시예에 따른 성문 기반 통신 장치의 구성도이다; 및
도 9는 본 발명의 일 실시예에 따른 성문 기반 통신 시스템의 구성도이다.
본 발명의 실시예들에 대하여 참조가 상세하게 이루어질 것이다. 본 발명의 실시예들은 도면들에서 개시될 것이고, 동일하거나 또는 유사한 구성요소들 및 동일하거나 또는 유사한 기능들을 하는 구성요소들은 설명들 전반에 걸쳐 동일한 참조번호에 의하여 표시된다. 대조적으로, 본 발명의 실시예들은 첨부된 특허청구범위들의 의도 및 원리들의 범위에 들어가는 모든 변경들(changes), 대안들(alternatives), 및 수정들(modifications)을 포함한다.
도 1은 본 발명의 일 실시예에 따른 성문 기반 통신 방법의 흐름도이다. 예를 들어, 본 실시예는 클라이언트(client)에 의하여 수행되고 클라이언트는 모바일 디바이스(mobile device)에 있다. 본 방법은 다음의 단계들을 포함한다.
단계 S11에서, 제1 정보는 서버로 전송되고 서버로부터 전송된 식별 정보(identification information)는 수신되며, 식별 정보는 서버가 제1 정보를 수신한 후에 생성되고 제1 정보는 사용자 계정 정보(user account information) 및 음성 정보(speech information) 중 하나이다.
일 실시예에서, 사용자 계정 정보 및 음성 정보의 동기 전송(synchronous transmission)에서 야기되는 문제를 방지하기 위하여, 사용자 계정 정보 및 음성 정보는, 사용자 계정 정보 및 음성 정보가 동시에 캡쳐되는 것을 방지하기 위해 두번에 걸쳐서 전송될 수 있다.
사용자 계정 정보는, 예를 들어, 사용자 이름, 전화 번호, 우편함 이름(mailbox name) 등 일 수 있다.
상기 실시예의 방법은 등록 과정(registration process), 또는 확인 과정(verification process)에서 사용될 수 있고, 확인 과정은 로그인 확인(login verification) 또는 결제 확인(payment verification)을 포함할 수 있다.
음성 정보(speech information)는 다른 적용 시나리오들 (application scenarios)에 따라 다를 수 있다. 예를 들어, 등록하는 경우에, 음성 정보는 연습 샘플(training sample)로 구성된 음성 데이터(speech data)이고, 연습 샘플은 성문 특성 정보(voiceprint characteristic information)를 획득하기 위하여 성문 연습(voiceprint training)으로 구성된다. 또한, 확인하는 경우에, 음성 정보는 확인될 음성 데이터이다.
구체적으로, 등록 과정에서, 클라이언트가 등록될 음성 정보를 획득할 수 있도록, 클라이언트는 등록 인터페이스(interface)를 사용자에게 디스플레이 할 수 있고, 사용자는 등록 인터페이스에 있는 사용자 계정 정보에 기입할 수 있고 클라이언트의 프롬프트 메시지(prompt message)에 따라 해당 프롬프트 내용(prompt content)을 말할 수 있다.
확인 과정에서, 클라이언트가 확인될 음성 정보를 획득할 수 있도록, 클라이언트는 확인 인터페이스를 사용자에게 디스플레이 할 수 있고, 사용자는 확인 인터페이스에 있는 사용자 계정 정보에 기입할 수 있고 프롬프트에 따라 또는 자발적으로 음성의 부분(section of speech)을 생성할 수 있다.
단계 S12에서, 제2 정보 및 식별 정보는 서버에 전송되고, 제2 정보는 사용자 계정 정보 및 음성 정보 중 다른 하나이다.
식별 정보는 서버에 의하여 랜덤하게 생성될 수 있고, 구체적으로 메시지 다이제스트 5(message digest 5, MD5) 코드일 수 있다.
식별 정보를 수신한 후에 클라이언트는 식별 정보 및 제2 정보를 서버에 동시에 전송한다. 서로 연관된 제1 정보 및 제2 정보에 따라 등록 또는 확인을 수행하기 위하여, 서버는 식별 정보에 따라 제1 정보를 제2 정보와 연관 짓는다.
일 실시예에서, 제1 정보 및 제2 정보를 서버에 두번에 걸쳐서 전송하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송(synchronous transmission)에서 야기되는 문제는 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
도 2는 본 발명의 다른 실시예에 따른 성문 기반 통신 방법의 흐름도이다. 본 실시예의 실행하는 주요부(executive main body)는 서버이다. 본 실시예의 본 방법은 다음의 단계들을 포함한다.
단계 S21에서, 클라이언트(client)로부터 전송된 제1 정보는 수신되고, 식별 정보(identification information)는 생성되고, 식별 정보는 클라이언트에 전송되며, 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이다.
식별 정보는 랜덤하게 생성되고, 구체적으로 MD5 코드일 수 있다.
음성 정보는 다른 어플리케이션 시나리오들에 따라 다를 수 있다. 예를 들어, 등록하는 경우에, 음성 정보는 연습 샘플로 구성된 음성 데이터이고, 연습 샘플은 성문 특성 정보를 획득하기 위하여 성문 연습으로 구성된다. 또한, 확인하는 경우에, 음성 정보는 확인될 음성 데이터이다.
단계 S22에서, 클라이언트로부터 전송된 제2 정보 및 식별 정보는 수신되고, 제2 정보는 사용자 계정 정보 및 음성 정보 중 다른 하나이다.
서로 연관된 제1 정보 및 제2 정보에 따라 등록 또는 확인을 수행하기 위하여, 제1 정보 및 제2 정보는 식별 정보를 통하여 서로 연관될 수 있다.
일 실시예에서, 두번에 걸쳐서 클라이언트로부터 전송된 제2 정보 및 제1 정보를 수신하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송에서 야기되는 문제는 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
도 3은 본 발명의 다른 실시예에 따른 성문 기반 통신 방법의 흐름도이다. 예를 들어, 본 방법은 등록 과정에서 사용될 수 있다. 일 실시예에서, 예를 들어, 클라이언트는 모바일 단말(mobile terminal)을 포함하고, 서버는 성문 연습 서버(voiceprint training server), 캐시(cache) 및 확인 서버(verifying server)를 포함한다. 도 3에 나타난 바와 같이, 본 방법은 다음의 단계들을 포함한다.
단계 S31에서, 모바일 단말은 음성 데이터를 성문 연습 서버에 전송한다.
모바일 단말은 프롬프트 텍스트(prompt text)를 사용자에게 디스플레이 할 수 있고, 이것은, 예를 들어 복수의 숫자들을 포함하고, 사용자가 이 숫자들을 말하도록 촉구한다. 사용자가 이 숫자들을 말한 후에, 모바일 단말은 사용자에 의하여 말하여진 음성 데이터를 획득할 수 있고, 그리고 나서 숫자들에 대응하는 음성 데이터를 성문 연습 서버에 전송한다.
단계 S32에서, 성문 연습 서버는 성문 특성 정보를 획득하기 위하여 음성 데이터를 연습하고 MD5 코드를 랜덤하게 생성한다.
음성 데이터를 수신한 후에, 성문 연습 서버는 수신된 음성 데이터가 프롬프트 텍스트와 일치하는지 여부를 판단한다. 수신된 음성 데이터가 프롬프트 텍스트와 일치하면, 성문 연습 서버는 성문 특성 정보를 획득하기 위하여 음성 데이터를 더 연습하고, 이는 종래 기술이 참조될 수 있다.
성문 특성 정보를 획득한 후에, 성문 연습 서버는 MD5 코드를 랜덤하게 생성할 수 있다.
단계 S33에서, 성문 연습 서버는 MD5 코드 및 성문 특성 정보를 서로 대응시켜 캐시에 저장한다.
단계 S34에서, 성문 연습 서버는 MD5 코드를 모바일 단말에 전송한다.
단계 S33 및 단계 S34의 시간 순서들은 제한되지 않는다.
단계 S35에서, 모바일 단말은 MD5 코드 및 사용자 계정 정보를 확인 서버에 전송한다.
등록하는 경우에, 모바일 단말이 사용자 계정 정보를 획득할 수 있도록, 모바일 단말은 등록 인터페이스를 사용자에게 디스플레이 하고, 사용자는 등록 인터페이스에 있는 사용자 계정 정보에 기입한다.
단계 S36에서, 확인 서버는 MD5 코드의 유효성을 확인하고, 만약 MD5 코드가 유효하다면, 확인 서버는 MD5 코드에 따라 캐시에서 대응하는 성문 특성 정보를 찾는다.
MD5 코드를 수신한 후에, 확인 서버는 먼저 MD5 코드의 유효성(validity)을 확인할 수 있다. 예를 들어, 확인 서버는 캐시를 검색하고 수신된 MD5 코드가 캐시에 있는지 여부를 판단한다. 수신된 MD5 코드가 캐시에 있으면, 확인 서버는 MD5 코드가 유효하다고 결정한다.
MD5 코드가 유효하다고 결정된 후에, 대응하는 성문 특성 정보는 찾아진다.
단계 S37에서, 등록 결과를 획득하기 위하여, 확인 서버는 수신된 사용자 계정 정보 및 찾아낸 성문 특성 정보를 서로 대응시켜 저장한다.
등록 결과는, 확인 서버가 수신된 사용자 계정 정보 및 찾아낸 성문 특성 정보를 서로 대응시켜 저장한 후에 획득될 수 있다. 예를 들어, 수신된 사용자 계정 정보 및 찾아낸 성문 특성 정보가 서로 대응시켜져 성공적으로 저장된 후에, 등록은 성공적이고; 그렇지 않으면, 등록은 실패된다.
단계 S38에서, 확인 서버는 등록 결과를 모바일 단말에 전송하고, 예를 들어, 등록은 성공적이거나, 등록은 실패된다.
본 실시예에 있는 성문 연습 서버, 캐시, 및 확인 서버는 동일한 물리적 장치 또는 다른 물리적 장치들에 배치될 수 있음은 이해될 수 있다.
일 실시예에서, 등록 보안을 향상시키기 위하여, 모바일 단말이 서버에 등록되는 경우에, 등록에 대한 사용자 계정 정보 및 음성 정보는 따로따로 전송되고, 따라서 그것의 동기 전송에서 야기되는 불안(insecurity) 문제는 방지될 수 있다. 이에 더하여, 식별 정보는 램덤하게 생성될 수 있고, 따라서 보안을 더 향상시킬 수 있다.
도 4는 본 발명의 다른 실시예에 따른 성문 기반 통신 방법의 흐름도이다. 예를 들어, 본 방법은 확인 과정(verification process)에서 사용될 수 있다. 일 실시예에서, 예를 들어, 클라이언트는 모바일 단말을 포함하고, 서버는 성문 확인 서버, 캐시, 및 확인 서버(verifying server)를 포함한다. 도 4에 나타난 바와 같이, 본 방법은 다음의 단계들을 포함한다.
단계 S41에서, 모바일 단말은 음성 데이터를 성문 확인 서버에 전송한다.
모바일 단말은 확인 인터페이스를 사용자에게 디스플레이 할 수 있고, 사용자는 확인 인터페이스에 있는 녹음 버튼을 클릭한 후에 확인될 음성 데이터를 녹음할 수 있고, 모바일 단말은 사용자에 의하여 말하여진 음성 데이터를 획득한 후에 확인될 음성 데이터를 성문 확인 서버에 전송한다. 사용자에 의하여 녹음된 확인될 음성 데이터는 프롬프트 텍스트에 따라 또는 프롬프트 없이 말하여질 수 있다.
단계 S42에서, 성문 확인 서버는 확인될 음성 데이터를 수신하고 MD5 코드를 랜덤하게 생성한다.
음성 데이터가 프롬프트 텍스트에 따라 획득되면, 음성 데이터를 수신한 후에, 성문 확인 서버는 먼저 수신된 음성 데이터가 프롬프트 텍스트와 일치하는지 여부를 판단할 수 있다. 수신된 음성 데이터가 프롬프트 텍스트와 일치하면, 성문 확인 서버는 그때 MD5 코드를 생성한다.
단계 S43에서, 성문 확인 서버는 MD5 코드 및 확인될 음성 데이터를 서로 대응시켜 캐시에 저장한다.
단계 S44에서, 성문 확인 서버는 MD5 코드를 모바일 단말에 전송한다.
단계 S43 및 단계 S44의 시간 순서들은 제한되지 않는다.
단계 S45에서, 모바일 단말은 MD5 코드 및 사용자 계정 정보를 확인 서버에 전송한다.
확인하는 경우에, 모바일 단말이 사용자 계정 정보를 획득하도록, 모바일 단말은 확인 인터페이스를 사용자에게 디스플레이 하고, 사용자는 확인 인터페이스에 있는 사용자 계정 정보에 기입한다.
단계 S46에서, 확인 서버는 MD5 코드의 유효성을 확인하고, MD5 코드가 유효하면, 확인 서버는 MD5 코드에 따라 캐시에서 대응하는 확인될 음성 데이터를 찾는다.
MD5 코드를 수신한 후에, 확인 서버는 MD5 코드의 유효성을 먼저 확인할 수 있다. 예를 들어, 확인 서버는 캐시를 검색하고 수신된 MD5 코드가 캐시에 있는지 여부를 판단한다. 수신된 MD5 코드가 캐시에 있으면, 확인 서버는 MD5 코드가 유효하다고 결정하고; 수신된 MD5 코드가 캐시에 없으면, 확인 서버는 MD5 코드가 유효하지 않다고 결정한다.
MD5 코드가 유효하다고 결정된 후, 확인될 대응하는 음성 데이터는 찾아질 수 있다.
단계 S47에서, 확인 서버는 수신된 사용자 계정 정보, 사용자 계정 정보 뿐만 아니라 확인될 찾아낸 음성 데이터 및, 등록할 때 획득된 성문 특성 정보에 따라 확인 결과를 획득한다.
MD5가 유효하다고 결정되는 경우에, 확인될 음성 데이터 및 사용자 계정 정보는 MD5 코드를 통하여 서로 연관될 수 있다. 그 때, 수신된 사용자 계정 정보에 대응하는 성문 특성 정보는 등록할 때 획득된 성문 특성 정보 및 사용자 계정 정보 사이의 관련성 및 수신된 사용자 계정 정보에 따라 찾아질 수 있다. 연속하여, 확인 결과를 획득하기 위하여, 수신된 사용자 계정 정보와 연관된 확인될 음성 데이터와 찾아낸 음성 특정 정보는 서로 비교된다. 예를 들어, 확인될 음성 데이터와 성문 특성 정보 간의 유사값(similarity value)은 산출되고, 만약 유사값이 기준점보다 크면, 확인은 성공적이고; 그렇지 않으면, 확인은 실패된다. 분명히, 확인 결과가, 알려진 기술들을 사용하는 것에 의하여 성문 특성 정보 및 확인될 음성 데이터에 따라 획득될 수 있음은 이해될 수 있다.
단계 S47에서, 확인 서버는 확인 결과를 모바일 단말에 전송하고, 예를 들어, 확인은 성공적이거나 또는 확인은 실패된다.
일 실시예에 있는 성문 확인 서버, 캐시 및 확인 서버는 동일한 물리적 장치 또는 다른 물리적 장치들에 배치될 수 있음은 이해될 수 있다.
일 실시예에서, 확인 보안을 향상시키기 위하여, 모바일 단말이 서버에 등록되는 경우에, 확인을 위한 음성정보 및 사용자 계정 정보는 각기 전송되고, 따라서 그것의 동기 전송에서 야기되는 불안 문제는 방지될 수 있다. 이에 더하여, 식별 정보는 랜덤하게 생성되고, 따라서 보안을 더 향상시킬 수 있다.
도 5는 본 발명의 일 실시예에 따른 성문 기반 통신 장치의 구성도이다. 본 장치는 클라이언트, 예를 들어, 모바일 디바이스에 있다. 본 장치(50)는 제1 상호작용 모듈(51) 및 제2 상호작용 모듈(52)을 포함한다.
제1 상호작용 모듈(51)은 제1 정보를 서버에 전송하고 서버로부터 전송된 식별 정보를 수신하도록 구성되되, 식별 정보는 서버가 제1 정보를 수신한 후에 생성되고 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이다.
일 실시예에서, 사용자 계정 정보 및 음성 정보의 동기 전송에서 야기되는 문제를 방지하기 위하여, 사용자 계정 정보 및 음성 정보가 동시에 캡쳐되는 것을 방지하기 위하여 사용자 계정 정보 및 음성 정보는 두번에 걸쳐서 전송될 수 있다.
사용자 계정 정보는, 예를 들어, 사용자 이름, 전화 번호, 메일박스 이름 등일 수 있다.
일 실시예의 장치는 등록 과정 또는 확인 과정에서 사용될 수 있고, 확인 과정은 로그인 확인 또는 결제 확인을 포함할 수 있다.
음성 정보는 다른 적용 시나리오들에 따라 다를 수 있다. 예를 들어, 등록하는 경우에, 음성 정보는 연습 샘플로 구성된 음성 데이터이고, 연습 샘플은 성문 특성 정보를 획득하기 위하여 성문 연습으로 구성된다. 또한, 확인하는 경우에, 음성 정보는 확인될 음성 데이터이다.
구체적으로, 등록 과정에서, 클라이언트가 등록될 음성 정보를 획득할 수 있도록, 클라이언트는 등록 인터페이스를 사용자에게 디스플레이 할 수 있고, 사용자는 등록 인터페이스에 있는 사용자 계정 정보에 기입하고 클라이언트의 프롬프트 메시지에 따라 대응하는 프롬프트 내용을 말할 수 있다.
확인 과정에서, 클라이언트가 확인될 음성 정보를 획득할 수 있도록, 클라이언트는 등록 인터페이스를 사용자에게 디스플레이할 수 있고, 사용자는 등록 인터페이스에 있는 사용자 계정 정보에 기입하고 프롬프트에 따라 또는 자발적으로 음성의 부분을 생성할 수 있다.
제2 상호작용 모듈(52)은 제2 정보 및 식별 정보를 서버에 전송하도록 구성되되, 제2 정보는 사용자 계정 정보 및 음성 정보 중 다른 하나이다.
식별 정보는 서버에 의하여 랜덤하게 생성될 수 있고, 구체적으로 메시지 다이제스트 5(MD5) 코드일 수 있다.
식별 정보를 수신한 후에, 클라이언트는 식별 정보 및 제2 정보를 서버에 동시에 전송한다. 서로 연관된 제1 정보 및 제2 정보에 따라 확인 또는 등록을 수행하기 위하여, 서버는 식별 정보에 따라 제1 정보와 제2 정보를 연관 짓는다.
일 실시예에서, 제1 정보 및 제2 정보를 두번에 걸쳐서 서버에 전송하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송에서 야기되는 문제가 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
도 6은 본 발명의 다른 실시예에 따른 성문 기반 통신 장치의 구성도이다. 본 장치는 서버에 있다. 본 장치(60)는, 제1 상호작용 모듈(61) 및 제2 상호작용 모듈(62)을 포함한다.
제1 상호작용 모듈(61)은 클라이언트로부터 전송된 제1 정보를 수신하고 식별 정보를 생성하고 식별 정보를 클라이언트에 전송하도록 구성되되, 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이다.
선택적으로, 제1 상호작용 모듈(61)은 식별 정보를 랜덤하게 생성하도록 더 구성된다.
식별 정보는 램덤하게 생성되고, 구체적으로 MD5 코드일 수 있다.
음성 정보는 다른 적용 시나리오들에 따라 다를 수 있다. 예를 들어, 등록할 때, 음성 정보는 연습 샘플로 구성된 음성 데이터이고 연습 샘플은 성문 특성 정보를 획득하기 위하여 성문 연습으로 구성된다. 또한, 확인할 때, 음성 정보는 확인될 음성 데이터이다.
제2 상호작용 모듈(62)은 클라이언트로부터 전송된 식별 정보 및 제2 정보를 수신하도록 구성되되, 제2 정보는 사용자 계정 정보 및 음성 정보 중 다른 하나이다.
서로 연관된 제2 정보 및 제1 정보에 따라 확인 또는 등록을 수행하기 위하여, 제1 정보 및 제2 정보는 식별 정보를 통하여 서로 연관될 수 있다.
일 실시예에서, 두번에 걸쳐서 클라이언트로부터 전송된 제2 정보 및 제1 정보를 수신하는 것에 의하여, 제1 정보 및 제2 정보의 동기 전송에서 야기되는 문제는 방지될 수 있고, 따라서 성문 기반 통신의 보안을 향상시킬 수 있다.
다른 실시예에서, 도 7에 나타난 바와 같이, 제1 정보는 음성정보이고 제2 정보는 사용자 계정 정보 이며, 등록할 때, 음성 정보는 연습 샘플로 구성된 음성 데이터이고, 연습 샘플은 성문 특성 정보를 획득하기 위하여 성문 연습으로 구성되고, 본 장치(60)는, 연습 모듈(training module)(71), 제1 저장 모듈(72) 및 등록 모듈(73)을 더 포함한다.
연습 모듈(71)은 연습 샘플로 구성된 음성 데이터를 수신한 후에 성문 특성 정보를 획득하기 위하여 연습 샘플로 구성된 음성 데이터를 연습하도록 구성된다.
음성 데이터가 수신된 후에, 수신된 음성 데이터가 프롬프트 텍스트와 일치하는지 여부가 판단된다. 만약 수신된 음성 데이터가 프롬프트 텍스트와 일치하면, 음성 정보는 성문 특성 정보를 획득하기 위하여 더 연습되고, 이는 종래 기술이 참조될 수 있다.
식별 정보는 랜덤하게 생성된 MD5 코드일 수 있다.
제1 저장 모듈(72)은 식별 정보 및 성문 특성 정보를 서로 대응시켜 저장하도록 구성될 수 있다.
예를 들어, 제1 저장 모듈은 캐시일 수 있다.
등록 모듈(73)은 사용자 계정 정보 및 식별 정보를 수신한 후에 기저장된 데이터로부터 수신된 식별 정보와 대응하는 성문 특성 정보를 찾고, 등록 결과를 획득하기 위하여 수신된 사용자 계정 정보와 찾아낸 성문 특성 정보를 서로 대응시켜 저장하도록 구성된다.
MD5 코드를 수신한 후에, MD5 코드의 유효성이 먼저 확인된다. 예를 들어, 등록 모듈은 캐시를 검색하고, 수신된 MD5 코드가 캐시에 있는지 여부를 판단한다. 만약 수신된 MD5 코드가 캐시에 있으면, MD5 코드는 유효하다고 결정되고; 만약 수신된 MD5 코드가 캐시에 있지 않으면, MD5 코드는 유효하지 않다고 결정된다.
등록 결과를 획득하기 위하여, MD5 코드가 유효하다고 결정된 후에, 사용자 계정 정보 및 성문 특성 정보는 서로 대응시켜 저장될 수 있다. 예를 들어, 사용자 계정 정보 및 성문 특성 정보가 서로 대응시켜 성공적으로 저장된 후에, 등록은 성공적이고; 그렇지 않으면, 등록은 실패된다.
일 실시예에서, 등록 보안을 향상시키기 위하여, 모바일 단말이 서버에 등록되는 경우에, 등록에 대한 음성정보 및 사용자 계정 정보는 각기 전송되고, 따라서 그것의 동기 전송에서 야기되는 불안 문제는 방지될 수 있다. 이에 더하여, 식별 정보는 랜덤하게 생성되고, 따라서 보안을 더 향상시킬 수 있다.
다른 실시예에서, 도 8에 나타난 바와 같이, 제1 정보는 음성 정보이고 제2 정보는 사용자 계정 정보 이며, 확인할 때, 음성 정보는 확인될 음성 데이터 이고, 본 장치(60)는, 제2 저장 모듈(81) 및 확인 모듈(verifying module)(82)을 더 포함한다.
제2 저장 모듈(81)은 확인될 음성 데이터를 수신하고 식별 정보를 생성한 후에 식별 정보 및 확인될 음성 데이터를 서로 대응시켜 저장하도록 구성된다.
예를 들어, 제2 저장 모듈은 캐시(cache)일 수 있다.
확인 모듈(82)은 사용자 계정 정보 및 식별 정보를 수신한 후에 기저장된 데이터로부터 수신된 식별 정보에 대응하는 확인될 음성 데이터를 찾고, 수신된 사용자 계정 정보, 사용자 계정 정보 뿐만 아니라 확인될 찾아낸 음성 데이터 및, 등록할 때 획득된 성문 특성 정보에 따라 확인 결과를 획득하도록 구성된다.
MD5 코드가 수신된 후에, MD5 코드의 유효성은 먼저 확인된다. 예를 들어, 확인 모듈은 캐시를 검색하고 수신된 MD5 모드가 캐시에 있는지 여부를 판단한다. 만약 수신된 MD5 코드가 캐시에 있으면, 확인 모듈은 MD5 코드가 유효한 것으로 결정하고; 만약 수신된 MD5 코드가 캐시에 있지 않으면, 확인 모듈은 MD5 코드가 유효하지 않은 것으로 결정한다.
MD5가 유효한 것으로 결정된 후에, 사용자 계정 정보 및 확인될 음성 데이터는 MD5 코드를 통하여 서로 연관될 수 있다. 그 다음, 수신된 사용자 계정 정보에 대응하는 성문 특성 정보는 등록할 때 획득된 성문 특성 정보 및 사용자 계정 정보 사이의 연관성 및 수신된 사용자 계정 정보에 따라 찾아질 수 있다. 연속하여, 확인 결과를 획득하기 위하여, 수신된 사용자 계정 정보와 연관된 확인될 음성 데이터 및 찾아낸 성문 특성 정보는 서로 비교된다. 예를 들어, 확인될 음성 데이터와 성문 특성 정보 간의 유사값(similarity value)은 산출되고, 만약 유사값이 기준점 보다 크면, 확인은 성공적이고; 그렇지 않으면, 확인은 실패된다. 분명히, 확인 결과가, 알려진 기술들을 사용하는 것에 의하여 성문 특성 정보 및 확인될 음성 데이터에 따라 획득될 수 있음은 이해될 수 있다.
일 실시예에서, 확인 보안을 향상시키기 위하여, 모바일 단말이 서버에 등록되는 경우에, 등록에 대한 음성 정보 및 사용자 계정 정보는 따로따로 전송되고, 따라서 그것의 동기 전송에서 야기되는 불안 문제는 방지될 수 있다. 이에 더하여, 식별 정보는 랜덤하게 생성되고, 따라서 보안을 더 향상시킬 수 있다.
도 9는 본 발명의 일 실시예에 따른 성문 기반 통신 시스템의 구성도이다. 본 시스템(70)은, 클라이언트 장치(91) 및 서버 장치(92)를 포함하고, 클라이언트 장치(91)은 도 5에 나타난 것이고 서버 장치(92)는 도 6 내지 8에 나타난 것이다.
일 실시예에서, 확인 보안을 향상시키기 위하여, 모바일 단말 및 서버는 사용자 계정 정보 및 음성 정보를 두번에 걸쳐서 제공하고, 예를 들어, 확인에 대한 사용자 계정 정보 및 음성 정보는 따로따로 전송되고, 따라서 그것의 동기 전송에서 야기되는 보안 문제는 방지될 수 있다. 이에 더하여, 식별 정보는 랜덤하게 생성되고, 따라서 보안을 더 향상시킬 수 있다.
본 발명의 일 실시예에 따라, 성문 기반 통신 장치는 제공된다. 본 장치는, 프로세서, 프로세서에 의하여 실행될 수 있는 명령어들을 제공하기 위한 메모리를 포함한다. 본 프로세서는, 제1 정보를 서버에 전송하고 서버로부터 전송된 식별 정보를 수신하도록 구성되되, 식별 정보는 서버가 제1 정보를 수신한 후에 생성되고 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및 제2 정보 및 식별 정보를 서버에 전송하도록 구성되되, 제2 정보는 사용자 계정 정보 및 음성 정보 중 다른 하나이다.
일부 실시예들에서, 제1 정보는 음성 정보 이고 제2 정보는 사용자 계정 정보이다.
일부 실시예들에서, 식별 정보는 램덤하게 생성된다.
본 발명의 일 실시예에 따라 성문 기반 통신 장치는 제공된다. 본 장치는, 프로세서, 및 프로세서에 의하여 실행될 수 있는 명령어들을 저장하기 위한 메모리를 포함한다. 본 프로세서는, 클라이언트로부터 전송된 제1 정보를 수신하고, 식별 정보를 생성하고, 식별 정보를 클라이언트에 전송하도록 구성되되, 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및 클라이언트로부터 전송된 식별 정보 및 제2 정보를 수신하도록 구성되되, 제2 정보는 사용자 계정 정보 및 음성 정보 중 다른 하나이다.
일부 실시예들에서, 제1 정보는 음성 정보 이고 제2 정보는 사용자 계정 정보이다.
일부 실시예들에서, 등록할 때, 음성 정보는 연습 샘플로 구성된 음성 데이터 이고 연습 샘플은 성문 특성 정보를 획득하기 위하여 성문 연습으로 구성되고, 프로세서는, 연습 샘플로 구성된 연습 데이터를 수신한 후에 성문 특성 정보를 획득하기 위하여 연습 샘플로 구성된 음성 데이터를 연습하고; 식별 정보 및 성문 특성 정보를 서로 대응시켜 저장하고; 사용자 계정 정보 및 식별 정보를 수신한 후에 기저장된 데이터로부터 식별 정보에 대응하는 성문 특성 정보를 찾고, 등록 결과를 획득하기 위하여 수신된 사용자 계정 정보 및 찾아낸 성문 특성 정보를 서로 대응시켜 저장하도록 더 구성된다.
일부 실시예들에서, 확인할 때, 음성 정보는 확인될 음성 데이터이고, 프로세서는, 확인될 음성 데이터를 수신하고 식별 정보를 생성한 후에 식별 정보 및 확인될 음성 데이터를 서로 대응시켜 저장하고, 사요자 계정 정보 및 식별 정보를 수신한 후에 기저장된 데이터로부터 식별정보에 대응하는 확인될 음성 데이터를 찾고, 수신된 사용자 계정 정보, 사용자 계정 정보 뿐만 아니라 확인될 찾아낸 음성 데이터 및, 등록할 때 획득된 성문 특성 정보에 따라 확인 결과를 획득하도록 더 구성된다.
일부 실시예들에서, 프로세서는 식별 정보를 랜덤하게 생성하는 것에 의하여 식별 정보를 생성한다.
본 발명의 명세서(description)에서, “제1” 및 “제2”의 용어는 단지 설명을 위하여 사용되고 상대적인 중요도(relative importance)를 나타내거나 암시하는 것으로 볼 수 없음은 이해될 것이다. 게다가, 본 발명의 명세서에서, 별도의 설명이 없으면, “복수의”의 용어는 둘 또는 둘 이상을 나타내는 것으로 이해될 수 있다.
흐름도들에서 설명되거나 어떠한 다른 방식으로 설명된 모든 절차 및 방법은 하나 또는 하나 이상의 모듈들, 특정 로직(logic) 기능들 또는 절차들을 실현하는 수행 가능한 코드들을 저장하기 위한 부분(portion)들 또는 일부(part)를 포함하는 것으로 이해될 수 있다. 게다가 본 발명의 유리한 실시예들은 다른 실행들을 포함하고, 다른 실행에서 수행의 순서는 서술되거나 또는 언급된 것과 다르며, 실질적으로 동시에 또는 관련된 기능들에 따른 반대 순서로 기능들을 수행하는 것을 포함한다. 이것은 본 발명의 실시예들이 속하는 기술 분야의 통상의 지식을 가진 자에 의하여 이해될 수 있다.
본 발명의 각 부분은 하드웨어(hardware), 소프트웨어(software), 펌웨어(firmware) 또는 그들의 조합에 의하여 실현될 수 있음은 이해된다. 상기의 실시예들에서, 복수의 단계들 또는 방법들은 메모리에 저장되고 적절한 명령어 수행 시스템에 의하여 수행되는 펌웨어 또는 소프트웨어에 의하여 실현될 수 있다. 예를 들어, 다른 실시예에서와 마찬가지로, 그것이 하드웨어에 의하여 실현되면, 단계들 또는 방법들은 본 기술분야에서 알려진 다음의 기술들의 하나 또는 조합에 의하여 실현될 수 있다: 데이터 신호의 로직 기능을 실현하기 위한 논리 게이트 회로(logic gate circuit)를 구비하는 독립된 논리 회로(discrete logic circuit), 적절한 조합 논리 게이트 회로(combination logic gate circuit)를 구비하는 특수-용도의 집적 회로(application-specific integrated circuit), 프로그램 가능 게이트 어레이(programmable gate array, PGA), 필드 프로그램 가능 게이트 어레이(field programmable gate array, FPGA), 등.
본 기술분야의 통상의 기술자는 본 발명의 상기 전형전인 방법에 있는 단계들의 부분들 또는 전체가 프로그램들과 함께 관련된 하드웨어를 명령하는 것에 의하여 달성될 수 있음을 이해할 수 있다. 프로그램들은 컴퓨터 판독 가능한 저장 매체에 저장될 수 있고, 프로그램들은, 컴퓨터를 실행시키는 경우에, 본 발명의 상기 방법 실시예들에 있는 단계들의 하나 또는 조합을 포함한다.
이에 더하여, 본 발명의 실시예들의 각 기능 셀(function cell)은 처리 모듈(processing module)에 통합될 수 있거나, 또는 이 셀들은 물리적으로 분리되어 존재할 수 있고, 또는 두개 또는 두개 이상의 셀들은 처리 모듈에 통합될 수 있다. 통합된 모듈은 하드웨어의 형태 또는 소프트웨어 기능 모듈들의 형태로 실현될 수 있다. 통합된 모듈이 소프트웨어 기능 모듈의 형태로 실현되고 독립된 제품으로 팔리고 사용되는 경우에, 통합된 모듈은 컴퓨터 판독 가능한 저장 매체에 저장될 수 있다.
상기에서 언급된 저장 매체는 판독 전용 기억장치들(read-only memories), 자기 디스크들(magnetic disks) 또는 CD, 등일 수 있다.
본 명세서를 통하여 참조되는 “일 실시예,”, “일부 실시예들,”, “하나의 예,”, “구체적 예,” 또는 “일부 예들,”은, 실시예 또는 예와의 관계에서 설명된 특정 특징(feature), 구조(structure), 물질(material), 또는 특성(characteristic)이 본 발명의 적어도 하나의 실시예 또는 예시에 포함됨을 의미한다. 본 명세서를 통하여 다양한 부분에 있는 문구들(phrases)의 등장은 본 발명의 일부 실시예들 또는 예를 반드시 참조하는 것은 아니다. 게다가, 특정 특징들, 구조들, 물질들, 또는 특성들은 하나 또는 하나 이상의 실시예들 또는 예들에서 모든 적합한 방식으로 조합될 수 있다.
전형적인 실시예들이 도시되고 설명되었지만, 상기 실시예들이 본 발명을 제한하는 것으로 해석될 수 없고, 변경들(changes), 대안들(alternatives), 및 수정들(modifications)이 본 발명의 의도(sprit), 원리들(principles) 및 범위(scope)로부터 벗어나지 않고 상기 실시예들에서 수행될 수 있음은 본 기술분야의 통상의 기술자에 의하여 이해될 수 있다.

Claims (16)

  1. 성문 기반 통신 방법으로서,
    제1 정보를 서버에 전송하고 상기 서버로부터 전송된 식별 정보를 수신하는 단계를 포함하되, 상기 식별 정보는 상기 서버가 상기 제1 정보를 수신한 후에 생성되고 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및
    제2 정보 및 상기 식별 정보를 상기 서버에 전송하는 단계를 포함하되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나인 것을 특징으로 하는 성문 기반 통신 방법.
  2. 제1항에 있어서, 상기 제1 정보는 상기 음성 정보이고 상기 제2 정보는 상기 사용자 계정 정보인 것을 특징으로 하는 성문 기반 통신 방법.
  3. 제1항에 있어서, 상기 식별 정보는 램덤으로 생성되는 것을 특징으로 하는 성문 기반 통신 방법.
  4. 성문 기반 통신 방법으로서,
    클라이언트로부터 전송된 제1 정보를 수신하고, 식별 정보를 생성하고, 상기 식별 정보를 상기 클라이언트로 전송하는 단계를 포함하되, 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고; 및
    상기 클라이언트로부터 전송된 상기 식별 정보 및 제2 정보를 수신하는 단계를 포함하되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나인 것으로 특징으로 하는 성문 기반 통신 방법.
  5. 제4항에 있어서, 상기 제1 정보는 상기 음성 정보 이고 상기 제2 정보는 상기 사용자 계정 정보인 것을 특징으로 하는 성문 기반 통신 방법.
  6. 제5항에 있어서, 등록하는 경우에, 상기 음성 정보는 연습 샘플로 구성된 음성 데이터이고 성문 특성 정보를 획득하기 위하여 상기 연습 샘플은 성문 연습으로 구성되고, 상기 방법은
    상기 연습 샘플로 구성된 상기 음성 데이터를 수신한 후에 상기 성문 특성정보를 획득하기 위하여 상기 연습 샘플로 구성된 상기 음성 데이터를 연습하는 단계;
    상기 식별 정보 및 상기 성문 특성 정보를 서로 대응시켜 저장하는 단계; 및
    상기 사용자 계정 정보 및 상기 식별 정보를 수신한 후에 기저장된 데이터로부터 상기 식별 정보에 대응하는 상기 성문 특성 정보를 찾고, 등록 결과를 획득하기 위하여 상기 수신된 사용자 계정 정보 및 상기 찾아낸 성문 특성 정보를 서로 대응시켜 저장하는 단계를 더 포함하는 것을 특징으로 하는 성문 기반 통신 방법.
  7. 제5항에 있어서, 확인하는 경우에, 상기 음성 정보는 확인될 음성 데이터이고, 상기 방법은,
    상기 확인될 음성 데이터를 수신하고 상기 식별 정보를 생성한 후에 상기 식별 정보 및 상기 확인될 음성 데이터를 대응시켜 저장하는 단계; 및
    상기 사용자 계정 정보 및 상기 식별 정보를 수신한 후에 기저장된 데이터로부터 상기 식별 정보에 대응하는 상기 확인될 데이터를 찾고, 상기 수신된 사용자 계정 정보, 상기 사용자 계정 정보 뿐만 아니라 확인될 상기 찾아낸 음성 데이터 및, 등록할 때 획득된 상기 성문 특성 정보에 따라 확인 결과를 획득하는 단계를 더 포함하는 것을 특징으로 하는 성문 기반 통신 방법.
  8. 제4항에 있어서, 상기 식별 정보를 생성하는 단계는
    상기 식별 정보를 랜덤하게 생성하는 단계를 포함하는 것을 특징으로 하는 성문 기반 통신 방법.
  9. 성문 기반 통신 장치로서,
    프로세서; 및
    상기 프로세서에 의하여 실행될 수 있는 명령어들을 저장하기 위한 메모리;를 포함하되,
    상기 프로세서는,
    제1 정보를 서버에 전송하고 상기 서버로부터 전송된 식별 정보를 수신하도록 구성되되, 상기 식별 정보는 상기 서버가 상기 제1 정보를 수신한 후에 생성되고 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고;
    제2 정보 및 상기 식별 정보를 상기 서버에 전송하도록 구성되되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나인 것을 특징으로 하는 성문 기반 통신 장치.
  10. 제9항에 있어서, 상기 제1 정보는 상기 음성 정보 이고 상기 제2 정보는 상기 사용자 계정 정보인 것을 특징으로 하는 성문 기반 통신 장치.
  11. 제9항에 있어서, 상기 식별 정보는 랜덤하게 생성되는 것을 특징으로 하는 성문 기반 통신 장치.
  12. 성문 기반 통신 장치로서,
    프로세서; 및
    상기 프로세서에 의하여 실행될 수 있는 명령어들을 저장하기 위한 메모리;를 포함하되,
    상기 프로세서는,
    클라이언트로부터 전송된 제1 정보를 수신하고 식별 정보를 생성하고 상기 식별 정보를 상기 클라이언트로 전송하도록 구성되되, 상기 제1 정보는 사용자 계정 정보 및 음성 정보 중 하나이고;
    상기 클라이언트로부터 전송된 상기 식별 정보 및 제2 정보를 수신하도록 구성되되, 상기 제2 정보는 상기 사용자 계정 정보 및 상기 음성 정보 중 다른 하나인 것을 특징으로 하는 성문 기반 통신 장치.
  13. 제12항에 있어서, 상기 제1 정보는 음성 정보 이고 상기 제2 정보는 상기 사용자 계정 정보인 것을 특징으로 하는 성문 기반 통신 장치.
  14. 제13항에 있어서, 등록하는 경우에, 상기 음성 정보는 연습 샘플로 구성된 음성 데이터이고 성문 특성 정보를 획득하기 위하여 상기 연습 샘플은 성문 연습으로 구성되고, 상기 프로세서는
    상기 연습 샘플로 구성된 상기 연습 데이터를 수신한 후에 상기 성문 특성정보를 획득하기 위하여 상기 연습 샘플로 구성된 상기 음성 데이터를 연습하고;
    상기 식별 정보 및 상기 성문 특성 정보를 서로 대응시켜 저장하고;
    상기 사용자 계정 정보 및 상기 식별 정보를 수신한 후에 기저장된 데이터로부터 상기 식별 정보에 대응하는 상기 성문 특성 정보를 찾고, 등록 결과를 획득하기 위하여 상기 수신된 사용자 계정 정보 및 상기 찾아낸 성문 특성 정보를 서로 연관시켜 저장하도록 더 구성된 것을 특징으로 하는 성문 기반 통신 장치.
  15. 제13항에 있어서, 확인하는 경우에, 상기 음성 정보는 확인될 음성 데이터이고, 상기 프로세서는,
    상기 확인될 음성 데이터를 수신하고 상기 식별 정보를 생성한 후에 상기 식별 정보 및 상기 확인될 음성 데이터를 서로 연관시켜 저장하고;
    상기 사용자 계정 정보 및 상기 식별 정보를 수신한 후에 기저장된 데이터로부터 상기 식별 정보와 대응되는 상기 확인될 음성 데이터를 찾고, 상기 수신된 사용자 계정 정보, 상기 사용자 계정 정보 뿐만 아니라 확인될 상기 찾아낸 음성 데이터 및, 등록할 때 획득된 상기 성문 특성 정보에 따라 확인 결과를 획득하도록 더 구성된 것을 특징으로 하는 성문 기반 통신 장치.
  16. 제12항에 있어서, 상기 프로세서가 식별 정보를 생성하는 것은,
    상기 식별정보를 랜덤하게 생성하는 것에 의하는 것을 특징으로 하는 성문 기반 통신 장치.
KR1020150187473A 2015-06-30 2015-12-28 성문 기반 통신 방법, 장치, 및 시스템 KR101769689B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510372778.XA CN104967622B (zh) 2015-06-30 2015-06-30 基于声纹的通讯方法、装置和系统
CN201510372778.X 2015-06-30

Publications (2)

Publication Number Publication Date
KR20170003366A true KR20170003366A (ko) 2017-01-09
KR101769689B1 KR101769689B1 (ko) 2017-08-18

Family

ID=54221564

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150187473A KR101769689B1 (ko) 2015-06-30 2015-12-28 성문 기반 통신 방법, 장치, 및 시스템

Country Status (4)

Country Link
US (1) US9865267B2 (ko)
JP (1) JP2017017669A (ko)
KR (1) KR101769689B1 (ko)
CN (1) CN104967622B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200021545A (ko) * 2017-12-12 2020-02-28 알리바바 그룹 홀딩 리미티드 정보 송신 방법 및 디바이스

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10356091B2 (en) * 2015-07-14 2019-07-16 Ujet, Inc. Communication enhancement methods
CN106710593B (zh) * 2015-11-17 2020-07-14 腾讯科技(深圳)有限公司 一种添加账号的方法、终端、服务器
US10382475B2 (en) * 2016-07-01 2019-08-13 Genesys Telecommunications Laboratories, Inc. System and method for preventing attacks in communications
US10701206B2 (en) 2016-07-01 2020-06-30 Genesys Telecommunications Laboratories, Inc. System and method for contact center communications
CN107492379B (zh) * 2017-06-30 2021-09-21 百度在线网络技术(北京)有限公司 一种声纹创建与注册方法及装置
WO2019104698A1 (zh) * 2017-11-30 2019-06-06 腾讯科技(深圳)有限公司 信息处理方法及装置、多媒体设备及存储介质
CN109510844B (zh) * 2019-01-16 2022-02-25 中民乡邻投资控股有限公司 一种基于声纹的对话交流式的账号注册方法及装置

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953700A (en) * 1997-06-11 1999-09-14 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
US20010039619A1 (en) * 2000-02-03 2001-11-08 Martine Lapere Speaker verification interface for secure transactions
US7054819B1 (en) * 2000-02-11 2006-05-30 Microsoft Corporation Voice print access to computer resources
JP4689788B2 (ja) * 2000-03-02 2011-05-25 株式会社アニモ 電子認証システム、電子認証方法及び記録媒体
JP3603756B2 (ja) * 2000-06-30 2004-12-22 日本電気株式会社 音声署名商取引システム及び方法
KR100374029B1 (ko) * 2000-11-20 2003-02-26 삼성전자주식회사 이동무선 단말기의 음성인식기능을 이용한 사용자 인증 방법
US6973426B1 (en) * 2000-12-29 2005-12-06 Cisco Technology, Inc. Method and apparatus for performing speaker verification based on speaker independent recognition of commands
US20020091937A1 (en) * 2001-01-10 2002-07-11 Ortiz Luis M. Random biometric authentication methods and systems
US20020194003A1 (en) * 2001-06-05 2002-12-19 Mozer Todd F. Client-server security system and method
US7174323B1 (en) * 2001-06-22 2007-02-06 Mci, Llc System and method for multi-modal authentication using speaker verification
US6898568B2 (en) * 2001-07-13 2005-05-24 Innomedia Pte Ltd Speaker verification utilizing compressed audio formants
JP2003044445A (ja) * 2001-08-02 2003-02-14 Matsushita Graphic Communication Systems Inc 認証システム、サービス提供サーバ装置および音声認証装置並びに認証方法
US20030037004A1 (en) * 2001-08-14 2003-02-20 Chuck Buffum Dialog-based voiceprint security for business transactions
JP2004013274A (ja) * 2002-06-04 2004-01-15 Ntt Comware Corp ユーザ認証システム、ユーザ認証方法、ユーザ認証プログラムおよび記録媒体
FR2842643B1 (fr) * 2002-07-22 2004-09-03 France Telecom Normalisation de score de verification dans un dispositif de reconnaissance vocale de locuteur
US8666747B2 (en) * 2002-10-31 2014-03-04 Verizon Business Global Llc Providing information regarding interactive voice response sessions
JP4725512B2 (ja) * 2004-03-18 2011-07-13 日本電気株式会社 音声処理システム、音声処理方法、音声処理サーバ装置、およびプログラム
US8725514B2 (en) * 2005-02-22 2014-05-13 Nuance Communications, Inc. Verifying a user using speaker verification and a multimodal web-based interface
US20080312926A1 (en) * 2005-05-24 2008-12-18 Claudio Vair Automatic Text-Independent, Language-Independent Speaker Voice-Print Creation and Speaker Recognition
US7536304B2 (en) * 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication
US8396711B2 (en) * 2006-05-01 2013-03-12 Microsoft Corporation Voice authentication system and method
US7992196B2 (en) * 2006-11-06 2011-08-02 Voice Identity, Inc. Apparatus and method for performing hosted and secure identity authentication using biometric voice verification over a digital network medium
JP4867760B2 (ja) * 2007-03-30 2012-02-01 ソニー株式会社 情報処理装置および方法、並びに情報処理システム
JP2009123020A (ja) 2007-11-15 2009-06-04 Canon Inc 情報処理装置、情報処理方法、プログラム及び記憶媒体
US8863262B2 (en) * 2008-08-20 2014-10-14 Yellowpages.Com Llc Systems and methods to provide information and services to authorized users
CN101685635A (zh) * 2008-09-23 2010-03-31 吕共欣 身份验证系统及方法
US8332223B2 (en) * 2008-10-24 2012-12-11 Nuance Communications, Inc. Speaker verification methods and apparatus
US20100306283A1 (en) 2009-01-28 2010-12-02 Digitiliti, Inc. Information object creation for a distributed computing system
KR101566196B1 (ko) 2009-03-02 2015-11-05 삼성전자주식회사 히스토그램 분석을 이용한 영상 분류 방법 및 장치, 이를 이용한 문자 인식 방법 및 장치
US8620666B1 (en) * 2009-08-07 2013-12-31 West Corporation System, method, and computer-readable medium that facilitate voice biometrics user authentication
JP5697330B2 (ja) * 2009-12-25 2015-04-08 ヤフー株式会社 複数要素認証を実施する認証サーバ及びその方法
US9553727B2 (en) * 2010-01-21 2017-01-24 Omid Ebrahimi Kia Secure and mobile biometric authentication for electronic health record management
FR2964812B1 (fr) * 2010-09-09 2013-04-12 Mobilegov France Procede d'authentification pour l'acces a un site web
JP2012079231A (ja) * 2010-10-05 2012-04-19 Hitachi Ltd 認証情報管理装置および認証情報管理方法
US9318114B2 (en) * 2010-11-24 2016-04-19 At&T Intellectual Property I, L.P. System and method for generating challenge utterances for speaker verification
GB2489527B (en) * 2011-04-01 2014-01-01 Voicevault Ltd Voice verification system
US8897500B2 (en) * 2011-05-05 2014-11-25 At&T Intellectual Property I, L.P. System and method for dynamic facial features for speaker recognition
US20130006626A1 (en) * 2011-06-29 2013-01-03 International Business Machines Corporation Voice-based telecommunication login
CN102869008A (zh) * 2011-07-07 2013-01-09 上海先先信息科技有限公司 一种应用声纹验证作为移动应用安全密码的技术
US9323912B2 (en) * 2012-02-28 2016-04-26 Verizon Patent And Licensing Inc. Method and system for multi-factor biometric authentication
JP2014016726A (ja) * 2012-07-06 2014-01-30 Keyware Solutions Inc 認証装置、認証方法、扉開閉管理装置及びコンピュータプログラム
CN102760434A (zh) * 2012-07-09 2012-10-31 华为终端有限公司 一种声纹特征模型更新方法及终端
US9172699B1 (en) * 2012-11-30 2015-10-27 Microstrategy Incorporated Associating a device with a user account
US8694315B1 (en) * 2013-02-05 2014-04-08 Visa International Service Association System and method for authentication using speaker verification techniques and fraud model
US20140359736A1 (en) * 2013-05-31 2014-12-04 Deviceauthority, Inc. Dynamic voiceprint authentication
CN103679452A (zh) * 2013-06-20 2014-03-26 腾讯科技(深圳)有限公司 支付验证方法、装置及系统
JP2015099470A (ja) * 2013-11-19 2015-05-28 日本電信電話株式会社 認証システム、方法、サーバ及びプログラム
CN103986725A (zh) * 2014-05-29 2014-08-13 中国农业银行股份有限公司 一种客户端、服务器端以及身份认证系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200021545A (ko) * 2017-12-12 2020-02-28 알리바바 그룹 홀딩 리미티드 정보 송신 방법 및 디바이스
US11711434B2 (en) 2017-12-12 2023-07-25 Advanced New Technologies Co., Ltd. Information transmission method and device

Also Published As

Publication number Publication date
US20170004832A1 (en) 2017-01-05
JP2017017669A (ja) 2017-01-19
CN104967622B (zh) 2017-04-05
KR101769689B1 (ko) 2017-08-18
US9865267B2 (en) 2018-01-09
CN104967622A (zh) 2015-10-07

Similar Documents

Publication Publication Date Title
KR101769689B1 (ko) 성문 기반 통신 방법, 장치, 및 시스템
US10873576B2 (en) Authenticating a user device via a monitoring device
US9979721B2 (en) Method, server, client and system for verifying verification codes
KR101908711B1 (ko) 인공 지능을 기반으로 하는 성문 로그인 방법 및 장치
EP3543998B1 (en) Method and apparatus for playing multimedia content
US10152585B2 (en) System and method of providing and validating enhanced CAPTCHAs
US10135818B2 (en) User biological feature authentication method and system
WO2016015687A1 (zh) 声纹验证方法及装置
US20120253810A1 (en) Computer program, method, and system for voice authentication of a user to access a secure resource
CN106961418A (zh) 身份认证方法和身份认证系统
US20170318013A1 (en) Method and system for voice-based user authentication and content evaluation
CN109684799A (zh) 账户登录方法、登录装置、账户登录设备及存储介质
CN102543084A (zh) 在线声纹认证系统及其实现方法
CN109165336B (zh) 一种信息输出控制方法及家教设备
CN109410664A (zh) 一种发音纠正方法及电子设备
US11757870B1 (en) Bi-directional voice authentication
US20140101739A1 (en) Semantic challenge for audio human interactive proof
CN110704822A (zh) 提高用户身份验证安全性的方法、装置、服务器及系统
CN109087647B (zh) 声纹识别处理方法、装置、电子设备及存储介质
US20140163986A1 (en) Voice-based captcha method and apparatus
CN104601532B (zh) 一种登录账户的方法及装置
CN105225664B (zh) 信息验证方法和装置及声音样本的生成方法和装置
CN110245485A (zh) 一种结合广告视频的验证系统及其验证方法
CN112397072B (zh) 语音检测方法、装置、电子设备及存储介质
US20230142081A1 (en) Voice captcha

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant