KR20170012873A - 음성 검증 방법, 장치 및 시스템 - Google Patents

음성 검증 방법, 장치 및 시스템 Download PDF

Info

Publication number
KR20170012873A
KR20170012873A KR1020167027069A KR20167027069A KR20170012873A KR 20170012873 A KR20170012873 A KR 20170012873A KR 1020167027069 A KR1020167027069 A KR 1020167027069A KR 20167027069 A KR20167027069 A KR 20167027069A KR 20170012873 A KR20170012873 A KR 20170012873A
Authority
KR
South Korea
Prior art keywords
voice verification
voice
user
information
network side
Prior art date
Application number
KR1020167027069A
Other languages
English (en)
Other versions
KR101881058B1 (ko
Inventor
시아오항 왕
양 동
용 관
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20170012873A publication Critical patent/KR20170012873A/ko
Application granted granted Critical
Publication of KR101881058B1 publication Critical patent/KR101881058B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/32Payment architectures, schemes or protocols characterised by the use of specific devices or networks using wireless devices
    • G06Q20/325Payment architectures, schemes or protocols characterised by the use of specific devices or networks using wireless devices using wireless networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • G06Q20/40145Biometric identity checks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0815Network architectures or network communication protocols for network security for authentication of entities providing single-sign-on or federations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • H04M3/382Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
    • H04M3/385Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords using speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/10Aspects of automatic or semi-automatic exchanges related to the purpose or context of the telephonic communication
    • H04M2203/105Financial transactions and auctions, e.g. bidding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/306Prerecordings to be used during a voice call
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6054Biometric subscriber identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6081Service authorization mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42085Called party identification service
    • H04M3/42102Making use of the called party identifier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5158Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with automated outdialling systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 음성 검증 방법, 장치, 및 시스템을 제공하며, 방법은 네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계; 네트워크 측에서, 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이하는 단계; 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하는 단계; 네트워크 측에서, 음성 검증 정보 및 기록 정보에 따라 검증 결과를 판단하는 단계를 포함한다. 본 발명에 의해 제공되는 기술적 해결책은 검증의 편의성을 증대시키고, 검증의 불확실성을 감소시키고, 검증의 구현 방식을 풍부하게 한다.

Description

음성 검증 방법, 장치 및 시스템{METHOD, APPARATUS AND SYSTEM FOR VOICE VERIFICATION}
본 발명은 검증 기술에 관한 것으로서, 특히 음성 검증 방법, 음성 검증 장치, 및 음성 검증 시스템에 관한 것이다.
사용자 재산 손실 및 사용자 정보 누설을 회피하도록 사용자 계정 보안 또는 사용자 정보 보안을 보호하기 위해서, 검증은 네트워크 지불 및 사용자 로그온과 같은 프로세스에 광범위하게 적용되어 왔다.
기존 검증 프로세스는 통상 단문 메시징 서비스((Short Messaging Service)(SMS)) 메시지(멀티미디어 메시징 서비스((Multimedia Messaging Service)(MMS)) 메시지를 포함함)에 기초하여 구현된다. 특정 구현 프로세스는 일반적으로 이하를 포함한다: 사용자 장비로부터 검증 요청을 수신한 후에 서버(예를 들어, 지불 서버 또는 로그온 서버)에 의해, 사용자에 의해 예약되는 이동 전화 번호를 검색하는 것, 및 검증 요청을 위한 검증 코드를 발생시키며, 그 검증 코드는 수 또는 알파벳 또는 수 및 알파벳의 조합일 수 있는 것; 서버에 의해, 검증 코드를 포함하는 SMS 메시지를 사용자에 의해 예약되는 이동 전화 번호에 따라 SMS 서버를 통해 사용자에게 송신하는 것; SMS를 수신한 후에 사용자에 의해, SMS 내의 검증 코드를 대응하는 페이지 상의 입력 박스에 입력하는 것; 사용자 장비로부터 검증 코드를 수신한 후에 서버에 의해, 이전에 발생된 검증 코드 및 수신된 검증 코드에 따라 검증하는 것. 검증 결과는 주로 서버가 후속 절차(예를 들어, 후속 로그온 절차 또는 지불 절차 등)를 결정하기 위한 것이다.
본 발명을 생성하는 프로세스 동안, 발명자는 기존 검증 방식이 네트워크 공격 및 검증 요청의 위조를 포함하는 불법 행위에 기인하는 사용자 계정 및 사용자 정보에 대한 보안 문제를 어느 정도 회피할 수 있지만, 그것이 불편, 불확실성, 및 단일 검증 수단과 같은 문제를 처리하기 위해 개선을 여전히 요구한다는 것을 발견하였다. 구체적으로, SMS 메시지가 저장 및 전송 메커니즘을 통해 송신되기 때문에, SMS 서버는 SMS 메시지를 송신할 때 수신자의 상태(예를 들어, 수신자가 파워 온되거나 신호 커버리지 영역 내에 있는지)를 인식하지 못하며, 그 결과 수신자가 SMS 메시지를 수신하는 시간은 예측할 수 없고, 이는 불확실성을 검증 프로세스에 추가하고; 정상 상황에서, 그것은 SMS를 사용자에게 송신하는데 대략 5~10초가 걸리고, 사용자는 검증 코드가 수신될 때까지 대기할 필요가 있고; 더욱이, 기존 검증 방법은 사용자가 수신된 검증 코드를 수동으로 입력하는 것을 요구하므로 불편하고, 검증 코드의 수동 입력은 또한 검증 프로세스 동안 인공 결함을 도입하여, 검증 프로세스의 편의성을 더 저하시킬 수 있다.
본 발명의 목적은 음성 검증을 위한 방법, 장치 및 시스템을 제공하는 것이다.
본 발명의 일 양태에 따르면, 음성 검증 방법이 제공되고, 방법은 단계를 포함한다:
본 발명의 다른 양태에 따르면, 또한 음성 검증 장치가 제공되며, 장치는 포함한다:
본 발명의 더 추가 양태에 따르면, 음성 검증 시스템이 더 제공되면, 시스템은 포함한다:
종래 기술과 비교하여, 본 발명은 이하의 장점을 갖는다: 사용자 측으로부터 음성 검증 요청에 응답하여 사용자에게 호출을 개시하고 음성 검증 정보를 사용자에게 플레이함으로써, 네트워크 측은 사용자 측의 상태 및 음성 검증 정보가 사용자 측에 성공적으로 플레이되었는지를 분명히 인식하며, 본 발명은 네트워크 측에 의해 야기되는 검증 프로세스가 사용자 상태를 인식할 수 없는 것에 대한 불확실성을 일정 정도 회피한다. 본 발명의 실시예에 따르면, 사용자 측이 감시, 자동 리스닝, 자동 음성 기록, 및 네트워크 워크에 기록 정보의 자동 송신과 같은 동작을 수행하게 함으로써, 검증을 요구하는 정보(즉, 기록 정보)는 수동 동작을 도입하지 않으면서 네트워크 측에 다시 자동으로 송신될 수 있으며, 그 결과 네트워크 측은 후속 음성 검증 동작을 신속하게 및 순조롭게 수행할 수 있고, 이는 검증 코드의 수동 입력에 의해 야기되는 검증 프로세스의 불편, 사용자가 검증을 요구하는 정보의 수신을 대기해야 하는 것, 및 검증 프로세스에 인공 고장을 도입하는 것 등과 같은 문제를 회피한다. 따라서, 본 발명에 의해 제공되는 기술적 해결책은 검증의 편의성을 증대시키고, 불확실성을 감소시키며, 검증의 구현 방식을 풍부하게 한다는 것을 알 수 있다.
첨부 도면을 참조하여 비제한적 실시예의 상세한 설명을 판독함으로써, 본 발명의 다른 특징, 목적 및 장점이 더 명백해질 것이다.
도 1은 본 발명의 제 1 실시예에 따른 음성 검증의 방법의 흐름도를 예시한다.
도 2는 본 발명의 제 2 실시예에 따른 음성 검증의 방법의 흐름도를 예시한다.
도 3은 본 발명의 제 3 실시예에 따른 음성 검증 시스템의 개략도를 예시한다.
도 4는 본 발명의 제 4 실시예에 따른 음성 검증 장치의 개략도를 예시한다.
도 5는 본 발명의 제 5 실시예에 따른 음성 검증 장치의 개략도를 예시한다.
도면에서, 동일 또는 유사한 참조 번호는 동일 또는 유사한 구성요소를 나타낸다.
일부 예시적 실시예가 처리 또는 방법으로서 흐름도의 형태로서 설명된다는 점이 예시적 실시예를 더 상세히 논의하기 전에 언급되어야 한다. 흐름도는 순차적으로 처리되는 것으로 각각의 동작을 도시하지만, 그 안에서의 많은 동작은 병렬적으로, 함께 또는 동시에 구현될 수 있다. 게다가, 다양한 동작은 재배열될 수 있다. 동작이 완료될 때, 처리가 종결될 수 있다. 그러나, 첨부 도면에 포함되지 않는 부가 단계가 포함될 수 있다. 처리는 방법, 기능, 사양, 서브루틴, 서브프로그램 등에 대응할 수 있다.
문맥에서 지칭되는 "서버"는 논리 서버 또는 엔티티 서버를 포함할 수 있으며; 엔티티 서버는 또한 "네트워크 장치", 즉 미리 결정된 프로그램 또는 명령어를 실행함으로써 수치 값 계산 및/또는 논리 계산과 같은 미리 결정된 처리 절차를 수행할 수 있는 네트워크 측에 제공되는 지능형 전자 장치로 지칭될 수 있다. 네트워크 장치는 프로세서 및 메모리를 포함할 수 있으며, 프로세서는 미리 결정된 처리 절차를 수행하기 위해 사전 저장된 프로그램 명령어를 실행하고; 미리 결정된 처리 절차는 또한 ASIC, FPGA, 및 DSP와 같은 하드웨어에 의해 수행되거나, 명령어 및 하드웨어의 조합에 수행될 수 있다.
엔티티 서버는 소형 태블릿 장치 또는 대형 태블릿 장치일 수 있다. 서버는 단지 일 예이고, 다른 기존 또는 장래에 가능하게 생겨날 네트워크 장치는 본 발명에 적용 가능하다면, 또한 본 발명의 보호 범위 내에 포함되어야 하고 이로써 참조로 포함된다는 점을 주목할 필요가 있다.
아래에 개시되는 방법(그것의 일부는 흐름도를 통해 예시됨)은 일반적으로 하드웨어, 소프트웨어, 펌웨어, 미들웨어, 마이크로코드, 하드웨어 기술 언어 또는 그것의 임의의 조합을 통해 구현될 수 있다. 방법이 소프트웨어, 펌웨어, 미들웨어 또는 마이크로코드로 구현될 때, 필요한 작업을 실행하는 프로그램 코드 또는 코드 세그먼트는 머신 또는 컴퓨터 판독 가능 매체(예를 들어, 저장 매체)에 저장될 수 있다. (하나 이상의) 프로세서는 필요한 작업을 구현할 수 있다.
여기에 개시되는 특정 구조 및 기능 상세는 본 발명의 예시적 실시예를 설명하기 위해 단지 대표적인 것이다. 그 대신, 본 발명은 많은 대안 실시예를 통해 구체적으로 구현될 수 있다. 따라서, 본 발명은 여기에 예시되는 실시예로만 제한된다고 이해되지 않아야 한다.
그러나, "제 1" 및 "제 2"와 같은 용어는 각각의 유닛을 설명하기 위해 여기에 사용될 수 있지만, 이러한 유닛은 이러한 용어에 의해 제한되지 않아야 한다는 점이 이해되어야 한다. 이러한 용어의 사용은 하나의 유닛을 다른 유닛과 단지 구별하는 것이다. 예를 들어, 예시적 실시예의 범위로부터 벗어나지 않으면서, 제 1 유닛은 제 2 유닛으로 지칭될 수 있으며, 유사하게 제 2 유닛은 제 1 유닛으로 지칭될 수 있다. 여기에 사용되는 용어 "및/또는"은 열거되는 바와 같이 하나 이상의 연관된 아이템 중 어느 것 및 모든 조합을 포함한다.
하나 유닛이 추가 유닛에 "연결" 또는 "결합"될 때, 그것은 추가 유닛에 직접 연결 또는 결합될 수 있거나, 중간 유닛이 존재할 수 있다는 점이 이해되어야 한다. 대조적으로, 유닛이 추가 유닛에 "직접 연결" 또는 "직접 결합"될 때, 중간 유닛은 존재하지 않는다. 유닛 사이의 관계를 설명하는 다른 용어(예를 들어, "사이에 배치"에 대한 "사이에 직접 배치", "에 인접"에 대한 "에 바로 인접" 등)는 유사한 방식으로 해석되어야 한다.
여기에 사용되는 용어는 예시적 실시예를 제한하도록 의도되지 않는 바람직한 실시예만을 설명하기 위한 것이다. 달리 지시되지 않는 한, 여기에 사용되는 단수( "하나의" 또는 "일")는 복수 형태를 포함하도록 의도된다. 또한 여기에 사용되는 용어 "포함한다" 및/또는 "구비한다"는 명시된 바와 같이 특징, 정수, 단계, 동작, 유닛 및/또는 구성요소의 존재를 규정하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 유닛, 구성요소, 및/또는 그것의 조합의 존재 또는 추가를 배제하지 않는다는 점이 이해되어야 한다.
또한 일부 대안 실시예에서, 언급되는 바와 같은 기능/동작은 도면에 표시되는 것과 상이한 순서로 발생할 수 있다는 점을 주목해야 한다. 예를 들어, 수반되는 기능/동작에 따라, 2개의 연속적으로 예시된 도면은 실질적으로 동시에 또는 때때로 역 순서로 실행될 수 있다.
이하, 본 발명은 도면과 함께 더 상세히 설명될 것이다.
실시예 1: 음성 검증 방법.
도 1은 본 실시예의 음성 검증 방법의 흐름도를 예시하며; 도 1에 예시된 바와 같은 방법은 단계(S100), 단계(S110), 단계(S120), 및 단계(S130)를 주로 포함한다. 이하, 도 1에서의 각각의 단계가 예시될 것이다.
S100: 네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정한다.
구체적으로, 네트워크 측은 사용자에 의해 예약되는 복수의 사용자 음성 통신 번호를 사전 저장한다. 이러한 사용자 음성 통신 번호는 한 세트의 통신 번호를 형성한다. 네트워크 측은 사전 저장된 세트의 통신 번호로부터 음성 검증 요청에 대응하는 사용자 음성 통신 번호를 획득할 수 있다. 특정 예에서, 네트워크 측에서의 세트의 통신 번호는 사용자 음성 통신 번호와 사용자 식별자(예를 들어, 사용자 로그온 계정 또는 사용자 지불 계정 정보 등; 이하, 설명은 일 예로서 사용자 지불 계정 정보를 사용하여 이루어질 것임) 사이의 복수의 대응 관계를 포함한다. 네트워크 측은 사용자 측으로부터 음성 검증 요청을 수신할 때, 음성 검증 요청에 포함된 정보로부터 사용자 지불 계정 정보를 우선 획득할 수 있고; 그 다음, 네트워크 측은 사용자 지불 계정 정보에 대응하는 사용자 음성 통신 번호를 획득하기 위해 사용자 계정 지불 정보를 사용하여 세트로부터 매칭 및 검색을 수행한다. 본 실시예는 네트워크 측에서 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하는 특정 구현으로 제한되지 않는다.
본 실시예에서 획득되는 사용자 음성 통신 번호는 네트워크 측과 사용자 측 사이에 음성 호출 연결을 주로 설정하는 것이다. 본 실시예에서의 사용자 음성 통신 번호는 사용자의 이동 전화 번호일 수 있다.
하나의 응용 시나리오에서, 본 실시예에서, 사용자 음성 통신 번호에 대응하는 사용자 장치 및 음성 검증 요청을 송신하는 사용자 장비는 동일한 사용자 장비이며, 사용자는 지불 동작 또는 로그온 동작 등을 수행하기 위해 그/그녀의 스마트 이동 전화(또는 전화 기능을 갖는 태블릿 컴퓨터)를 사용하고, 스마트 이동 전화(또는 전화 기능을 갖는 태블릿 컴퓨터)의 번호(즉, 사용자의 이동 전화 번호)는 단지 사용자 식별자(예를 들어, 사용자 로그온 계정 또는 사용자 지불 계정 정보 등)에 대응하는 사용자 음성 통신 번호이다.
다른 응용 시나리오에 있어서, 본 실시예에서, 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청을 송신하는 사용자 장비가 아니며, 예를 들어 사용자는 지불 동작 또는 로그온 동작 등을 수행하기 위해 그/그녀의 스마트폰(또는 전화 기능을 갖는 태블릿 컴퓨터)을 사용하는 반면에, 네트워크 측에 저장되는 사용자 식별자 정보에 대응하는 사용자 음성 통신 번호는 사용자의 스마트폰의 번호이고; 다른 예에서, 사용자는 스마트폰을 사용하여 지불 동작을 수행하는 반면에, 스마트폰의 번호(즉, 사용자의 이동 전화 번호)는 사용자 식별자 정보(예를 들어, 사용자의 로그온 계정 또는 사용자 지불 계정 정보)에 대응하는 사용자 음성 통신 번호가 아니며, 즉 사용자 식별자 정보에 대응하는 사용자 음성 통신 번호는 지불 동작 또는 로그온 동작을 수행하도록 사용자에 의해 사용되는 스마트 이동 전화 번호의 번호와 동일하지 않다.
본 실시예에서, 특정 시간 기간(예를 들어, 몇 시간 또는 수십 시간 또는 몇 일) 내에 상이한 음성 검증 요청을 위해 네트워크 측에서 결정되는 음성 검증 정보는 통상 반복되지 않는다. 다시 말하면, 본 발명의 네트워크 측은 상이한 음성 검증 요청이 특정 시간 기간 내에 상이한 음성 검증 정보에 대응해야 하는 것을 보장해야 한다.
본 실시예의 네트워크 측에 의해, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 예는 아래에 제공된다: 네트워크 측은 복수의 오디오 파일(또한 음성 파일로 지칭될 수 있음)을 사전 저장하고, 복수의 오디오 파일의 특성은 크게 다르고; 모든 오디오 파일은 오디오 파일 세트를 형성할 수 있고; 음성 검증 요청을 수신할 때, 네트워크 측은 오디오 파일 세트로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다.
본 실시예의 네트워크 측에 의해, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 다른 특정 예는 아래에 제공된다: 네트워크 측은 음성 검증 요청을 수신한 후에, 오디오 파일을 랜덤하게 발생시키고 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다. 네트워크 측에서 오디오 파일을 랜덤하게 발생시키는 방식은 사전 저장된 오디오 파일로부터 오디오 정보의 작은 세그먼트를 랜덤하게 캡처하는 것에 의해 새로운 오디오 파일을 발생시킬 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다. 네트워크에서 오디오 파일을 랜덤하게 발생시키는 방식은 측 또한 2개 이상의 사전 저장된 오디오 파일을 새로운 오디오 파일로 랜덤하게 조합할 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다.
본 실시예는 네트워크 측이 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 구현 방식, 오디오 파일의 특정 포맷, 또는 네트워크 측이 오디오 파일을 랜덤하게 발생시키는 특정 구현 방식 등에 제한을 갖지 않는다.
본 실시예의 음성 검증 정보는 음악 음성 검증 정보를 플레이하거나 음성 검증 정보를 수 및/또는 알파벳 및/또는 단어 및/또는 한자의 형태로 플레이하기 위해 사용될 수 있으며; 게다가, 음성 검증 정보를 플레이하는 지속 기간은 통상 매우 짧으며, 예를 들어 일반적으로 1 내지 5초이다. 본 실시예는 음성 검증 정보에 의해 플레이되는 특정 콘텐츠 또는 음성 검증 정보를 플레이하는 시간 길이를 제한하지 않는다.
본 실시예에서, 모든 음성 검증 정보는 대응하는 고유 식별자를 가지며, 즉 하나의 음성 검증 정보는 하나의 식별자를 사용하여 고유하게 결정될 수 있다. 식별자는 음성 검증 정보의 식별자로 지칭될 수 있다. 음성 검증 정보에 대응하는 식별자는 구체적으로 오디오 파일의 파일명 또는 오디오 파일 및 파일명의 저장 경로의 조합, 또는 오디오 파일의 인덱스 값, 또는 랜덤 발생 알고리즘을 사용하여 랜덤하게 발생되는 식별자일 수 있다. 본 실시예는 음성 검증 정보의 식별자의 특정 표현 형태로 제한되지 않는다.
본 실시예에서의 음성 검증 정보에 대응하는 식별자는 검증 프로세스(예를 들어, 지불 검증 프로세스)를 위해 사용될 수 있고; 음성 매칭 알고리즘에 식별자를 추가함으로써, 음성 검증 결과의 정확도가 더 보장될 수 있다.
일 실시예에서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 동안 네트워크 측은 또한 음성 검증 정보에 대응하는 식별자를 획득하며, 예를 들어 오디오 파일의 파일명 또는 인덱스 값을 음성 검증 정보로 획득하고, 다른 예에 대해, 오디오 파일의 파일명 및 저장 경로를 음성 검증 정보로 획득하는 것 등일 수 있고; 그 다음, 네트워크 측은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있다. 통상적인 상황에서, 네트워크 측은 결정된 음성 검증 정보에 대응하는 식별자를 사용자 측에서 음성 검증 요청을 송신하는 사용자 장비에 제공할 수 있다. 음성 검증 요청을 요청하는 사용자 장비가 사용자 음성 통신 번호에 대응하는 사용자 장비가 아닌 경우에, 음성 검증 요청을 송신하는 사용자 장비는 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비를 제공할 수 있으며, 예를 들어 음성 검증 요청을 송신하는 사용자 장비는 WiFi 또는 블루투스와 같은 무선 송신 방식을 통해, 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비에 제공하고; 다른 예에 대해, 음성 검증 요청을 송신하는 사용자 장비는 2차원 코드를 디스플레이하며, 그 결과 사용자 음성 통신 번호에 대응하는 사용자 장비는 2차원 코드를 스캐닝함으로써 음성 검증 정보에 대응하는 식별자를 획득할 수 있고; 물론, 음성 검증 요청을 송신하는 사용자 장비는 또한 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비에 제공하기 위해 다른 편리한 송신 방식을 채택할 수 있고; 게다가, 음성 검증 요청을 송신하는 사용자 장비는 식별자를 송신할 때, 또한 음성 검증 요청을 위한 수신자 정보를 사용자 음성 통신 번호에 대응하는 사용자 장비에 제공할 수 있으며, 그 결과 사용자 음성 통신 번호에 대응하는 사용자 장비는 후속 기록으로부터 획득되는 기록 정보의 수신자를 인식할 수 있다. 본 실시예는 음성 검증 요청을 송신하는 사용자 장비가 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비에 어떻게 제공하는지에 관한 특정 구현 방식을 제한하지 않는다.
실제 응용 시나리오에서, 본 실시예의 네트워크 측은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있지만, 그것은 본 실시예의 네트워크 측이 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공해야 하는 것을 의미하는 것이 아니며, 즉 네트워크 측은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공하지 않을 때 본 실시예의 검증 절차가 또한 구현될 수 있다는 점을 특히 주목해야 한다.
S110: 네트워크 측에서, 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이한다.
구체적으로, 본 실시예의 네트워크 측은 사용자 측과 음성 호출 연결(즉, 음성 링크)을 설정하기 위해 사용자 음성 통신 번호에 따라 대응하는 호출 동작을 수행할 수 있다. 본 실시예의 네트워크 측은 기존 호출 방식을 이용하는 사용자 측과 음성 호출 연결을 설정할 수 있으며, 예를 들어 네트워크 측은 인터넷 프로토콜((Internet Protocol)(IP)) 네트워크를 공중 교환 전화 네트워크((Public Switched Telephone Network)(PSTN))와 연결하거나; 네트워크 측은 상호작용 음성 응답((Interactive Voice Response)(IVR)) 기술을 사용하여 음성 호출 연결을 사용자 측과 설정한다. 사용자 측과 음성 호출 연결을 성공적으로 설정할 때(예를 들어, 사용자가 착신 호출에 대답할 때), 네트워크 측은 음성 호출 연결에 기초하여 사용자에게 상기 결정된 음성 검증 정보를 플레이한다. 본 실시예는 네트워크 측에 의해 대응하는 사용자에게 호출을 개시하고 네트워크 측에게 음성 호출 연결을 통해 사용자에게 음성 검증 정보를 플레이하는 특정 구현 방식을 제한하지 않는다.
본 실시예의 네트워크 측은 사용자에게 음성 검증 정보를 성공적으로 플레이할 수 있도록 호출 반복 기능을 제공하며, 예를 들어 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되지 않는 경우에 또는 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되었지만 음성 검증 정보는 성공적으로 플레이되지 않고, 네트워크 측은 사용자를 위해 다시 호출 기능을 수행해야 한다.
네트워크 측에서 호출을 반복하는 특정 예는 네트워크 측이 사용자 음성 통신 번호의 가입 위치를 결정할 수 없으면, 네트워크 측이 사용자 음성 통신 번호에 조정을 수행(예를 들어, 현재 호출에 대응하는 특정 실패 이유에 기초하여 사용자 음성 통신 번호를 조정하는 법을 결정)하고, 조정 후에 사용자를 호출하는 동작을 재수행할 수 있고; 예를 들어, 네트워크 측이 사용자 음성 통신 번호 전에 0을 다이얼링하고, 사용자를 다시 호출하고; 다른 예에 대해, 네트워크 측이 사용자 음성 통신 번호 전에 추가된 0을 삭제하고, 사용자를 다시 호출하는 것이다.
네트워크 측에서 호출을 반복하는 다른 특정 예는 비정상이 현재 호출에 의해 사용되는 호출자 번호에 발생하면(예를 들어, 호출자 번호가 PSTN 등에 의해 스크리닝되면), 네트워크 측이 다른 호출자 번호를 사용하여 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다. 다시 말하면, 복수의 호출자 번호는 네트워크 측에 제공되고; 네트워크 측이 호출자 번호로부터의 원인으로 인해 사용자와 음성 호출 연결을 성공적으로 설정하지 않는 경우에, 네트워크 측은 호출자 번호를 변경하고, 새로운 호출자 번호를 사용하여 사용자 측과 음성 호출 연결을 다시 설정하려고 시도해야 한다.
네트워크 측에서 호출을 반복하는 추가 특정 예는 네트워크 측이 현재 호출을 위한 사용자 측과 음성 호출 연결을 성공적으로 설정했지만, 연결 중단과 같은 이유로 음성 검증 정보를 성공적으로 플레이하지 않을 때, 네트워크 측이 음성 검증 정보를 성공적으로 플레이할 수 있도록 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다.
S120. 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신한다.
구체적으로, 사용자 측은 음성 검증 요청을 송신한 후에 호출 감시 상태로 진입할 수 있으며, 예를 들어 사용자 측은 검증 서비스를 개시한 후에 호출 감시 상태로 진입하고; 착신 호출이 있는 것을 감시할 때, 사용자 측은 리스닝 동작을 자동으로 수행하고, 기록 서비스 등을 호출함으로써 음성 호출 연결로 플레이되는 오디오 신호를 기록하고; 호출의 종결 시(예를 들어, 호출이 끊김) 사용자 측은 기록 정보를 포함하는 음성 검증 메시지를 네트워크 측에 자동으로 송신하며, 예를 들어 네트워크 측은 기록 정보를 하이퍼텍스트 전송 프로토콜((HyperText Transfer Protocol)(HTTP))을 통해 네트워크 측에 송신하며, 그 결과 네트워크 측은 음성 검증 메시지를 위한 음성 검증 동작을 수행할 수 있다.
다른 호출(검증에 부적절한 호출)에 자동 리스닝 및 기록 동작을 수행하는 것을 회피하기 위해, 본 실시예에서의 사용자 측은 호출 감시된 화이트 리스트를 사전 저장하고, 사용자 측은 감시된 호출의 호출 가입자가 사전 저장된 호출 화이트 리스트 내의 호출 가입자에 속할 때 자동 리스닝 및 자동 기록 동작만을 수행할 것이고; 그렇지 않으면 사용자 측은 자동 리스닝 및 자동 기록 동작을 수행하지 않는다.
사용자 측이 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 수신하면, 사용자 측은 기록 정보를 수신된 식별자와 함께 네트워크 측에 송신할 수 있으며, 예를 들어 사용자 측은 기록 정보 및 식별자를 포함하는 HTTP 기반 음성 검증 메시지를 네트워크 측에 송신한다.
상기 예를 계속하면, 음성 검증 요청을 송신하는 사용자 장비가 사용자 음성 통신 번호에 대응하는 사용자 장비가 아닐 때, 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청을 송신하는 사용자 장비로부터 송신되는 음성 검증 정보에 대응하는 식별자 및 음성 검증 요청을 위한 수신자 정보를 수신한 후에, 음성 검증 요청에서 식별자 및 수신자 정보를 버퍼링하고, 기록 정보를 네트워크 측에 송신할 때 수신자 정보에 기초하여 식별자 및 기록 정보를 함께 네트워크 측에 송신한다.
S130. 네트워크 측에서, 음성 검증 정보 및 기록 정보에 따라 검증 결과를 결정한다.
구체적으로, 네트워크 측은 음성 매칭 동작의 정확도를 증대시키도록 그것에 의해 수신되는 기록된 정보를 사전 처리한 후에 음성 매칭의 동작을 수행할 수 있다. 여기서의 사전 처리는 잡음 감소 처리 및 정규화 처리를 지칭한다.
본 실시예에서 검증 결과를 판단하는 특정 예는 네트워크 측이 수신된 기록 정보와 네트워크 측에 저장되는 각각의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭하는 음성 검증 정보가 네트워크 측에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.
본 실시예에서 검증 결과를 판단하는 다른 특정 예는 네트워크 측이 수신된 기록 정보와 네트워크 측에 의해 이전에 결정된 음성 검증 정보 사이의 음성 매칭을 각각 수행하고, 음성 매칭 결과가 그들이 매칭하는 것일 때 음성 검증이 이때에 성공하는 것으로 판단하는 반면에, 음성 매칭 결과가 그들이 매칭하지 않는 것일 때 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.
네트워크 측이 기록 정보를 수신할 뿐만 아니라, 사용자 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 수신하는 경우에, 본 실시예에서 검증 결과를 판단하는 특정 예는 네트워크가 수신된 식별자에 따라 네트워크 측에 저장되는 모든 음성 검증 정보로부터 음성 검증 정보의 일부를 선정하고, 수신된 기록 정보와 음성 검증 정보의 일부 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭하는 음성 검증 정보가 네트워크 측에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.
네트워크 측은 또한 식별자 및 기록 정보를 사용하여 음성 검증을 수행하고, 예를 들어 사용자로부터 송신되는 식별자가 이전에 결정된 바와 같이 식별자와 매칭하고 기록 정보가 또한 이전에 결정된 바와 같이 음성 검증 정보와 일치하는 것으로 판단하는 경우에 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하기 위해 다른 방식을 채택할 수 있다.
실시예에서 음성 검증 정보에 대응하는 식별자는 음성 검증을 결정하는 프로세스 동안 보조 정보의 역할을 할 수 있고, 예를 들어 그것은 음성 매칭의 시간을 감소시키거나 음성 검증을 결정하는 조건의 역할을 할 수 있다는 점을 설명으로부터 알 수 있다.
본 실시예의 음성 매칭 프로세스는 기록 정보에서 특징을 추출하는 단계, 및 추출된 특징을 음성 검증에서의 특징과 비교하는 단계를 포함할 수 있고; 본 실시예에서의 각각의 음성 검증 정보의 특징은 사전 추출되고 네트워크 측에 저장될 수 있다. 본 실시예의 음성 매칭 프로세스는 또한 기록 정보에 음성 인식을 수행하는 단계, 및 기록 정보에 대한 음성 인식의 결과를 음성 검증 정보에 대한 음성 인식의 결과와 비교하는 단계를 포함할 수 있고; 본 실시예에서의 각각의 음성 검증 정보의 음성 인식 결과는 미리 수행되고 네트워크 측에 저장되는 음성 인식일 수 있다. 물론, 본 실시예는 또한 음성 매칭을 수행하기 위해 다른 음성 매칭 알고리즘을 이용할 수 있다. 본 실시예는 음성 매칭의 특정 구현 방식을 제한하지 않는다.
음성 검증이 성공할 때, 네트워크 측은 후속 처리 절차(예를 들어, 후속 지불 절차 또는 후속 사용자 로그온 절차 등)에 진입할 수 있다. 게다가, 현재 지불 절차가 (성공 또는 실패에 관계없이) 완료되거나 로그온 절차가 (로그온 실패 또는 로그온 성공에 관계없이) 완료될 때, 사용자 측은 사용자 호출을 더 이상 감시하지 않을 수 있으며, 예를 들어 사용자 측은 현재 시작된 감시 서비스 등을 폐쇄한다.
실시예 2: 음성 검증의 방법.
본 실시예는 스마트 이동 전화를 갖는 사용자에 의해 네트워크 지불을 수행하는 일 예를 채택하고, 도 2를 참조하여 본 실시예의 음성 검증 방법을 예시한다. 본 실시예에서, 사용자에 의해 사용되는 스마트 이동 전화의 번호는 네트워크 측에서 사용자에 의해 예약되는 사용자 지불 계정 정보에 대응하는 사용자 음성 통신 번호이다.
도 2에서, 스마트 이동 전화는 사용자 측에 속한다. 무선 지불 클라이언트는 스마트 이동 전화 내에 제공된다. 지불 서버, 호출 센터, 및 음성 매칭 서버는 네트워크 측에 속한다.
본 실시예에서의 무선 지불 클라이언트는 구체적으로 스마트 이동 전화 내의 이동 지불 소프트웨어 개발 키트((Software Development Kit)(SDK)) 또는 APP 제품의 형태일 수 있고; 본 실시예에서의 지불 서버, 호출 센터, 및 음성 매칭 서버는 동일한 세트의 네트워크 장치(예를 들어, 서버)의 중앙에 제공될 수 있거나, 2개 또는 3개의 세트의 상이한 네트워크 장치에 개별적으로 배치될 수 있다. 본 실시예는 무선 지불 클라이언트, 지불 서버, 호출 센터 및 음성 매칭 서버의 특정 표현 형태로 제한되지 않는다.
단계 1: 네트워크 지불 프로세스 동안, 무선 지불 클라이언트는 음성 검증 요청을 개시하고 그것이 위치되는 스마트 이동 전화의 착신 호출을 감시하기 시작하며, 무선 지불 클라이언트는 호출 상태 감시 서비스를 시작함으로써 착신 호출을 감시한다.
단계 2. 무선 지불 클라이언트로부터 음성 검증 요청을 수신할 때, 지불 서버는 음성 검증 요청에 포함된 정보(예를 들어, 사용자 지불 계정 정보)에 따라 그것의 장소에 저장되는 정보(예를 들어, 사용자 지불 계정 정보와 스마트 이동 전화 번호 사이의 한 세트의 대응 관계)로부터 음성 검증 요청에 대응하는 스마트 이동 전화 번호를 검색하고; 지불 서버는 그것이 사전 저장하는 오디오 파일의 한 세트의 식별자로부터 식별자를 랜덤하게 선택하고, 식별자를 무선 지불 클라이언트에 제공한다.
본 실시예에서의 모든 오디오 파일은 지불 서버에 저장되거나 호출 센터에 저장될 수 있다. 물론, 모든 오디오 파일은 또한 지불 서버 및 호출 센터와 독립적으로 다른 위치에 저장될 수 있다.
단계 3. 지불 서버는 대응하는 사용자를 호출 센터를 통해 호출하기 위해 그것이 발견하는 스마트 이동 전화 번호 및 랜덤하게 선택된 식별자를 호출 센터에 제공하고, 식별자에 대응하는 음성 검증 정보를 사용자에게 플레이한다. 지불 서버는 식별자 및 스마트 이동 전화 번호를 호출 센터에 의해 제공되는 웹 서비스 인터페이스를 통해 호출 센터에 제공하는 것에 의해, HTTP 계층 기반 발신 호출 인터페이스 호출을 구현할 수 있다.
단계 4: 호출 센터는 사용자 측의 스마트 이동 전화와 음성 호출 연결을 설정(즉, 호출 링크를 설정)하도록 지불 서버에 의해 제공되는 스마트 이동 전화 번호에 기초하여 호출 동작을 수행한다. 음성 호출 연결이 성공적으로 설정된 후에, 호출 센터는 지불 서버에 의해 제공되는 식별자에 따라 대응하는 음성 검증 정보(예를 들어, 오디오 파일)를 플레이하며, 예를 들어 호출 센터는 식별자에 따라 국부적으로 저장된 오디오 파일로부터 식별자에 대응하는 오디오 파일을 선택하고; 그 다음, 음성 호출 연결이 성공적으로 설정된 후에 오디오 파일을 플레이한다.
단계 5. 스마트 이동 전화 내의 무선 지불 클라이언트는 사용자가 호출되고 호출자가 무선 지불 클라이언트에 저장되는 화이트 리스트에 속하는 것을 감시할 때, 자동 리스닝을 수행하고, 호출 센터에 의해 플레이되는 음성 검증 정보를 기록하도록 자동 기록 동작을 수행한다.
단계 6. 무선 지불 클라이언트는 이러한 호출의 종결 시에, 그것이 기록하는 기록 정보 및 지불 서버에 의해 제공되는 식별자를 HTTP 기반 음성 검증 메시지를 통해 자동으로 업로드한다.
단계 7. 지불 서버는 음성 매칭 서버가 음성 매칭 동작을 수행하는 것을 요청하기 위해 수신된 기록 정보 및 식별자를 함께 음성 매칭 서버에 제공한다. 음성 매칭 서버는 또한 모든 음성 검증 정보를 저장한다. 호출 센터에서의 음성 검증 정보의 모두는 음성 매칭 서버에 저장되는 모든 음성 검증 정보와 동일해야 하며, 예를 들어 그것의 음성 검증 정보를 갱신할 때, 음성 매칭 서버는 호출 센터에서 모든 음성 검증 정보를 동기적으로 갱신해야 한다. 음성 매칭 서버는 수신된 식별자에 따라 모든 음성 검증 정보에서 음성 검증 정보의 일부를 결정하고, 기록 정보와 음성 검증 정보의 일부 사이의 음성 매칭을 하나씩 수행하고, 매칭된 음성 검증 정보 또는 음성 검증 정보의 식별자(예를 들어, 오디오 파일명)를 지불 서버에 제공할 수 있다. 지불 서버는 음성 검증 정보가 이전에 결정된 음성 검증 정보와 일치하는 것으로 판단하거나 또는 음성 매칭 서버로부터 송신되는 식별자가 이전에 결정된 음성 검증 정보의 식별자와 동일한 것으로 판단할 때 이러한 음성 검증이 성공하는 것으로 판단하고; 그렇지 않으면 그것은 이러한 음성 검증이 실패하는 것을 판단한다. 지불 서버는 음성 검증의 결과에 기초하여 후속 지불 흐름을 결정할 수 있다.
이러한 지불 프로세스가 종료된 후에, 무선 지불 클라이언트는 사용자의 착신 호출을 더 이상 감시하지 않지 않아야 하며, 예를 들어 무선 지불 클라이언트는 전화 호출 상태 감시 서비스 등을 폐쇄한다.
실시예 3: 음성 검증 시스템
본 실시예의 음성 검증 시스템의 메인 구조는 도 3에 예시된다.
도 3에서의 음성 검증 시스템은 제어 모듈(311), 호출 모듈(312), 음성 검증 모듈(313), 음성 검증 요청 모듈(321), 및 감시 기록 모듈(322)을 주로 포함하고; 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)은 네트워크 측에 제공되는 반면에, 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 사용자 측에 제공된다.
본 실시예에서의 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)은 네트워크 측에서 동일한 장치로 통합되거나, 네트워크 측에서 2개 또는 3개의 상호 독립 장치에 개별적으로 배치될 수 있다.
본 실시예에서의 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 사용자 측에서 동일한 사용자 장비에 제공될 수 있으며, 예를 들어 둘 다는 사용자의 동일한 스마트 이동 전화에 배치되고; 음성 검증 요청 모듈(321) 및 감시 및 기록 모듈(322)은 또한 2개의 상호 독립 장비에 제공될 수 있으며, 예를 들어 음성 검증 요청 모듈(321)은 PC 머신 또는 태블릿 컴퓨터에 제공되는 반면에, 감시 및 기록 모듈(322)은 스마트 이동 전화 내에 제공된다.
이하, 음성 검증 시스템에 포함되는 각각의 모듈은 이하에 상세히 설명될 것이다.
음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 주로 적응된다.
구체적으로, 검증을 요구하는 응용 시나리오에서, 음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 촉발되며, 예를 들어 사용자 측에서 웹사이트에 로그온하는 절차 중에 음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 작동되고; 다른 예에 대해, 사용자 측에서 네트워크 지불을 수행하는 절차 중에 음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 작동된다.
음성 검증 요청 모듈(321)에 의해 네트워크 측에 송신되는 음성 검증 요청은 통상 HTTP 기반 음성 검증 요청이고, 음성 검증 요청은 통상 사용자를 고유하게 특징화할 수 있는 사용자 식별자, 예를 들어 사용자 로그온 계정 또는 사용자 지불 계정 정보 등을 포함한다.
제어 모듈(311)은 사용자 측으로부터 음성 검증 요청에 기초하여 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 주로 적응된다.
구체적으로, 제어 모듈(311)은 사용자에 의해 예약되는 복수의 사용자 음성 통신 번호를 사전 저장한다. 이러한 사용자 음성 통신 번호는 한 세트의 통신 번호를 형성한다. 제어 모듈(311)은 한 세트의 사전 저장된 통신 번호로부터 음성 검증 요청에 대응하는 사용자 음성 통신 번호를 획득할 수 있다. 특정 예로서, 제어 모듈(311)은 사용자 음성 통신 번호와 사용자 식별자(예를 들어, 사용자 로그온 계정 또는 사용자 지불 계정 정보 등; 이하, 설명은 일 예로서 사용자 지불 계정 정보로 이루어질 것임) 사이의 대응 관계를 사전 저장하고, 복수의 대응 관계는 한 세트의 통신 번호를 형성한다. 사용자 측으로부터 음성 검증 요청을 수신할 때, 제어 모듈(311)은 음성 검증 요청으로 운반되는 정보로부터 사용자 지불 계정 정보를 우선 획득할 수 있고; 그 다음, 제어 모듈(311)은 사용자 지불 계정 정보에 대응하는 사용자 음성 통신 번호를 획득하기 위해 사용자 계정 지불 정보를 사용하여 세트에서 대응 관계에 따라 매칭 및 검색을 수행한다. 본 실시예는 제어 모듈(311)에 의해, 음성 검증 요청에 따라 사용자 음성 통신 번호를 획득하는 특정 구현 방식으로 제한되지 않는다.
제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호는 네트워크 측과 사용자 측 사이에 음성 호출 연결을 주로 설정하는 것이다. 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호는 사용자의 이동 전화 번호일 수 있다.
하나의 응용 시나리오에서, 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청 모듈(321)이 위치되는 사용자 장비이다. 다른 응용 시나리오에서, 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청 모듈(321)이 위치되는 사용자 장비가 아니다. 2개의 응용 시나리오의 특정 예는 상기 실시예 1에 설명되었으며, 이는 여기서 반복되지 않을 것이다.
본 실시예에서, 특정 시간 기간(예를 들어, 몇 시간 또는 수십 시간 또는 몇 일) 내에 상이한 음성 검증 요청을 위해 제어 모듈(311)에 의해 결정되는 음성 검증 정보는 통상 반복되지 않는다. 다시 말하면, 제어 모듈(311)은 상이한 음성 검증 요청이 특정 시간 기간 내에 상이한 음성 검증 정보에 대응해야 하는 것을 보장해야 한다.
제어 모듈(311), 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 예는 아래에 제공된다: 네트워크 측은 복수의 오디오 파일을 사전 저장하고, 복수의 오디오 파일의 특징은 서로 크게 다르다. 모든 오디오 파일은 오디오 파일 세트를 형성할 수 있다. 음성 검증 요청을 수신할 때, 제어 모듈(311)은 오디오 파일 세트로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다.
제어 모듈(311)에 의해, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 다른 특정 예는 아래에 제공된다: 제어 모듈(311)은 음성 검증 요청을 수신한 후에, 오디오 파일을 랜덤하게 발생시키고 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다. 제어 모듈(311)에 의해 오디오 파일을 랜덤하게 발생시키는 방식은 사전 저장된 오디오 파일로부터 오디오 정보의 작은 세그먼트를 랜덤하게 캡처하는 것에 의해, 새로운 오디오 파일을 발생시킬 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다. 제어 모듈(311)에 의해 오디오 파일을 랜덤하게 발생시키는 방식은 또한 2개 이상의 사전 저장된 오디오 파일을 새로운 오디오 파일로 랜덤하게 조합할 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다.
본 실시예는 제어 모듈(311)이 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 구현 방식, 오디오 파일의 특정 포맷, 또는 제어 모듈(311)이 오디오 파일을 랜덤하게 발생시키는 특정 구현 방식에 제한을 갖지 않는다.
본 실시예의 음성 검증 정보는 음악 음성 검증 정보를 플레이하거나 음성 검증 정보를 수 및/또는 알파벳 및/또는 단어 및/또는 한자의 형태로 플레이하기 위해 사용될 수 있다. 게다가, 음성 검증 정보를 플레이하는 시간 길이는 통상 매우 짧으며, 예를 들어 일반적으로 1 내지 5초이다. 본 실시예는 음성 검증 정보에 의해 플레이되는 특정 콘텐츠 또는 음성 검증 정보를 플레이하는 시간 길이를 제한하지 않는다.
본 실시예에서, 모든 음성 검증 정보는 대응하는 고유 식별자를 가지며, 즉 하나의 음성 검증 정보는 하나의 식별자를 사용하여 고유하게 결정될 수 있다. 식별자는 음성 검증 정보의 식별자로 지칭될 수 있다. 음성 검증 정보에 대응하는 식별자는 구체적으로 오디오 파일의 파일명 또는 오디오 파일의 파일명 및 저장 경로의 조합, 또는 오디오 파일의 인덱스 값, 또는 랜덤 발생 알고리즘을 사용하여 랜덤하게 발생되는 식별자일 수 있다. 본 실시예는 음성 검증 정보의 식별자의 특정 표현 형태로 제한되지 않는다.
본 실시예에서의 음성 검증 정보의 식별자는 검증 프로세스(예를 들어, 지불 검증 프로세스)를 위해 사용될 수 있으며; 음성 매칭 알고리즘에 식별자를 추가함으로써 음성 검증 결과의 정확도가 더 보장될 수 있다.
일 실시예에서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 동안, 제어 모듈(311)은 또한 음성 검증 정보에 대응하는 식별자를 획득하며, 예를 들어, 오디오 파일의 파일명 또는 인덱스 값을 음성 검증 정보로 획득하고, 다른 예에 대해, 오디오 파일의 파일명 및 저장 경로를 음성 검증 정보로 획득하는 것 등일 수 있고; 그 다음, 제어 모듈(311)은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있다. 통상의 상황에서, 제어 모듈(311)은 결정된 음성 검증 정보에 대응하는 식별자를 음성 검증 요청 모듈(321)에 제공할 수 있다. 음성 검증 요청 모듈(321)은 제어 모듈(311)로부터 송신되는 음성 검증 정보에 대응하는 식별자를 감시 기록 모듈(322)에 제공해야 하고; 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)이 동일한 사용자 장비에서 제공되지 않는 경우에, 음성 검증 요청 모듈(321)은 음성 검증 정보에 대응하는 식별자를 Wi-Fi 또는 블루투스와 같은 무선 송신 방식을 통해 감시 기록 모듈(322)에 제공할 수 있으며; 음성 검증 요청 모듈(321)은 또한 2차원 코드를 디스플레이할 수 있으며, 그 결과 감시 기록 모듈(322)은 2차원 코드를 스캐닝함으로써 음성 검증 정보에 대응하는 식별자를 획득할 수 있고; 물론, 음성 검증 요청 모듈(321)은 또한 제어 모듈(311)로부터 송신되는 음성 검증 정보에 대응하는 식별자를 감시 기록 모듈(322)에 제공하기 위해 다른 편리한 송신 방식을 채택할 수 있고; 게다가, 음성 검증 요청 모듈(321)은 식별자를 송신할 때, 또한 음성 검증 요청을 위한 수신자 정보를 감시 기록 모듈(322)에 제공할 수 있으며, 그 결과 감시 기록 모듈(322)은 후속 기록으로부터 획득되는 기록 정보를 위한 수신자를 인식할 수 있다. 본 실시예는 음성 검증 요청 모듈(321)이 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 감시 기록 모듈(322)에 어떻게 제공하는지에 관한 특정 구현 방식을 제한하지 않는다.
실제 응용 시나리오에서, 본 실시예의 제어 모듈(311)은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있지만, 그것은 본 실시예의 제어 모듈(311)이 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공해야 하는 것을 의미하지 않으며, 즉 제어 모듈(311)이 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공하지 않을 때, 본 실시예의 검증 절차가 또한 절대적으로 구현될 수 있다는 점을 특히 주목해야 한다.
호출 모듈(312)은 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이하도록 주로 적응된다.
구체적으로, 호출 모듈(312)은 사용자 음성 통신 번호에 따라 호출 동작을 수행함으로써 네트워크 측과 사용자 측 사이에 음성 호출 연결(즉, 음성 링크)을 설정한다. 호출 모듈(312)은 기존 호출 방식을 이용하는 사용자 측과 음성 호출 연결을 설정할 수 있으며, 예를 들어 호출 모듈(312)은 IP 네트워크가 PSTN에 연결될 때 IVR 기술을 사용하여 사용자 측과 음성 호출 연결을 설정한다.
사용자 측에서 음성 호출 연결을 성공적으로 설정하는 경우(예를 들어, 사용자가 착신 호출에 대답하는 경우), 호출 모듈(312)은 음성 호출 연결에 기초하여 사용자에게 상기 결정되는 음성 검증 정보를 플레이한다. 본 실시예는 호출 모듈(312)에 의해, 대응하는 사용자에게 호출을 개시하고, 및 호출 모듈(312)에 의해, 음성 호출 연결을 통해 사용자에게 음성 검증 정보를 플레이하는 특정 구현 방식을 제한하지 않는다.
호출 모듈(312)은 사용자에게 음성 검증 정보를 성공적으로 플레이하도록 호출 반복 기능을 제공하며, 예를 들어 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되지 않는 경우나 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되었지만 음성 검증 정보는 성공적으로 플레이되지 않는 경우에, 호출 모듈(312)은 사용자를 위해 호출 기능을 재수행해야 한다.
호출 모듈(312)에 의해 호출을 반복하는 특정 예는 호출 모듈(312)이 사용자 음성 통신 번호의 가입 위치를 결정할 수 없으면, 호출 모듈(312)이 사용자 음성 통신 번호를 조정(예를 들어, 현재 호출에 대응하는 특정 실패 이유에 기초하여 사용자 음성 통신 번호를 조정하는 법을 결정)할 수 있고, 조정 후에, 호출 모듈(312)이 사용자를 호출하는 동작을 다시 수행하고; 예를 들어, 호출 모듈(312)이 사용자 음성 통신 번호 전에 0을 다이얼링하고 그 다음에 사용자를 다시 호출하고; 다른 예에 대해, 호출 모듈(312)이 사용자 음성 통신 번호 전에 0을 삭제하고 그 다음에 사용자를 다시 호출하는 것이다.
호출 모듈(312)에 의해 호출을 반복하는 다른 특정 예는 비정상이 현재 호출을 위한 호출 모듈(312)에 의해 사용되는 호출자 번호에 발생하면(예를 들어, 호출자 번호가 PSTN에 의해 스크리닝되면), 호출 모듈(312)이 다른 호출자 번호를 사용하여 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다. 다시 말하면, 복수의 호출자 번호는 호출 모듈(312)에 제공되고; 호출 모듈(312)이 호출자 번호로부터의 원인으로 인해 사용자 측과 음성 호출 연결을 성공적으로 설정하지 않는 경우에, 호출 모듈(312)은 호출자 번호를 변경하고, 새로운 호출자 번호를 사용하여 사용자 측과 음성 호출 연결을 다시 설정하려고 시도해야 한다.
호출 모듈(312)에 의해 호출을 반복하는 추가 특정 예는 사용자 측과의 음성 호출 연결이 현재 호출에 대해 성공적으로 설정되었지만 음성 검증 정보가 연결 중단과 같은 원인으로 인해 성공적으로 플레이되지 않는 경우에 호출 모듈(312)이 음성 검증 정보를 성공적으로 플레이할 수 있도록 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다.
감시 기록 모듈(322)은 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시할 때 음성 검증 요청을 위한 네트워크 측에 의해 플레이되는 음성 인증 정보를 획득하기 위해 자동 리스닝 및 기록 동작을 수행하도록 주로 적응되고; 호출의 종결 시에, 감시 기록 모듈(322)은 음성 검증 모듈(313)이 기록 정보에 따라 음성 검증을 수행할 수 있도록 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신한다.
구체적으로, 감시 기록 모듈(322)은 음성 검증 요청 모듈(321)이 음성 검증 요청을 송신한 후에 호출 감시 상태로 진입할 수 있으며, 예를 들어 감시 기록 모듈(322)은 검증 서비스를 개시한 후에 호출 감시 상태로 진입하고; 착신 호출이 감시될 때, 감시 기록 모듈(322)은 리스닝 동작을 자동으로 수행하고, 기록 서비스 등을 호출함으로써 음성 호출 연결로 플레이되는 오디오 신호를 기록하고; 현재 호출의 종결 시에(예를 들어, 호출이 끊김), 감시 기록 모듈(322)은 기록 정보를 포함하는 음성 검증 메시지를 네트워크 측(예를 들어, 제어 모듈(311))에 자동으로 송신하며, 예를 들어 감시 기록 모듈(322)은 기록 정보를 HTTP를 통해 제어 모듈(311)에 송신하고, 제어 모듈(311)은 기록 정보를 음성 검증 모듈(313)에 제공하며, 그 결과 음성 검증 모듈(313)은 음성 검증 메시지를 위한 음성 검증 동작을 수행할 수 있다.
다른 호출(검증에 부적절한 호출)에 자동 리스닝 및 기록 동작을 수행하는 것을 회피하기 위해, 감시 기록 모듈(322)은 호출 감시된 화이트 리스트를 사전 저장하고, 감시 기록 모듈(322)은 감시된 호출의 호출 가입자가 사전 저장된 화이트 리스트 내의 호출 가입자일 때 자동 리스닝 및 자동 기록 동작만을 수행할 수 있고; 그렇지 않으면 감시 기록 모듈(322)은 자동 리스닝 및 자동 기록 동작을 수행하지 않는다.
감시 기록 모듈(322)이 음성 검증 정보에 대응하는 식별자를 수신할 때, 감시 기록 모듈(322)은 기록 정보를 수신된 식별자와 함께 제어 모듈(311)에 송신할 수 있으며, 예를 들어 감시 기록 모듈(322)은 기록 정보 및 식별자를 포함하는 HTTP 기반 음성 검증 메시지를 제어 모듈(311)에 송신한다.
상기 예를 계속 설명하면, 음성 검증 요청 모듈(321)이 위치되는 사용자 장비는 감시 기록 모듈이 위치되는 사용자 장비가 아닐 때, 감시 기록 모듈(322)은 음성 검증 요청 모듈(321)로부터 송신되는 음성 검증 정보에 대응하는 식별자 및 음성 검증 요청을 위한 수신자 정보를 수신한 후에, 식별자 및 음성 검증 요청을 위한 수신자 정보를 버퍼링하고, 제어 모듈(311)에 기록 정보의 송신 시에, 식별자 및 기록 정보를 함께 수신자 정보에 기초하여 제어 모듈(311)에 송신한다.
음성 검증 모듈(313)은 음성 검증 정보 및 사용자 측으로부터의 기록 정보에 따라 음성 검증 결과를 결정하도록 주로 적응된다.
구체적으로, 음성 검증 모듈(313)은 음성 매칭 동작의 정확도를 증대시키도록, 그것이 수신하는 기록 정보(예를 들어, 제어 모듈(311)로부터 송신되는 기록 정보)를 사전 처리한 후에 음성 매칭 동작을 수행할 수 있다. 사전 처리는 여기서 잡음 감소 처리 및 정규화 처리를 지칭한다.
음성 검증 모듈(313)에 의해, 검증 결과를 판단하는 특정 예는 음성 검증 모듈(313)이 수신된 기록 정보와 국부적으로 저장되는 각각의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭하는 음성 검증 정보가 제어 모듈(311)에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.
음성 검증 모듈(313)에 의해, 검증 결과를 판단하는 다른 특정 예는 음성 검증 모듈(313)이 수신된 기록 정보와 제어 모듈(311)에 의해 이전에 결정된 음성 검증 정보 사이의 음성 매칭을 수행하고, 음성 매칭 결과가 그들이 매칭하는 것일 때 음성 검증이 이때에 성공하는 것으로 음성 검증 모듈(313)이 판단하는 반면에, 음성 매칭 결과가 그들이 매칭하지 않는 것일 때 음성 검증이 이때에 실패하는 것으로 음성 검증 모듈(313)이 판단하는 것이다.
음성 검증 모듈(313)이 기록 정보를 수신할 뿐만 아니라, 사용자 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 수신하는 경우에, 음성 검증 모듈(313)에 의해, 검증 결과를 판단하는 특정 예는 음성 검증 모듈(313)이 국부적으로 저장되는 모든 음성 검증 정보로부터 음성 검증 정보의 일부를 선정하고, 수신된 기록 정보와 음성 검증 정보의 일부 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭되는 음성 검증 정보가 제어 모듈(311)에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 음성 검증 모듈(313)이 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 음성 검증 모듈(313)이 판단하는 것이다.
음성 검증 모듈(313)은 또한 식별자 및 기록 정보를 사용하여 음성 검증을 수행하고, 예를 들어 사용자로부터 송신되는 식별자가 이전에 결정된 식별자와 매칭하고 기록 정보가 또한 이전에 결정된 바와 같이 음성 검증 정보와 매칭하는 경우에 음성 검증이 이때에 성공하는 것으로 음성 검증 모듈(313)이 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 음성 검증 모듈(313)이 판단하기 위해 다른 방식을 채택할 수 있다.
실시예에서 음성 검증 정보에 대응하는 식별자는 음성 검증을 결정하는 프로세스 동안 보조 정보의 역할을 할 수 있으며, 예를 들어 그것은 음성 매칭의 시간을 감소시키거나 음성 검증을 결정하는 조건의 역할을 할 수 있는 점을 상기 설명으로부터 알 수 있다.
음성 검증 모듈(313)의 음성 매칭 프로세스는 기록 정보에서 특징을 추출하는 단계, 및 추출된 특징을 음성 검증 내의 특징과 비교하는 단계를 포함할 수 있고; 본 실시예에서의 각각의 음성 검증 정보의 특징은 사전 추출되고 음성 검증 모듈(313)에 국부적으로 저장될 수 있다. 음성 검증 모듈(313)의 음성 매칭 프로세스는 또한 기록 정보에 음성 인식을 수행하는 단계, 및 기록 정보의 음성 인식 결과를 음성 검증 정보의 음성 인식 결과와 비교하는 단계를 포함할 수 있고; 실시예에서의 각각의 음성 검증 정보의 음성 인식 결과는 미리 수행되고 네트워크 측에 저장되는 음성 인식일 수 있다. 물론, 음성 검증 모듈(313)은 또한 음성 매칭을 수행하기 위해 다른 음성 매칭 알고리즘을 이용할 수 있다. 본 실시예는 음성 검증 모듈(313)에 의해 수행되는 음성 매칭의 특정 구현 방식을 제한하지 않는다.
음성 검증이 성공할 때, 네트워크 측(예를 들어, 제어 모듈(311))은 후속 처리 절차(예를 들어, 후속 지불 절차 또는 후속 사용자 로그온 절차 등)에 진입할 수 있다. 게다가, 현재 지불 절차가 (성공 또는 실패에 관계없이)가 완료되거나 로그온 절차가 (로그온 실패 또는 로그온 성공에 관계없이) 완료될 때, 감시 기록 모듈(322)은 사용자 호출을 더 이상 감시하지 않을 수 있으며, 예를 들어 감시 기록 모듈(322)은 현재 시작된 감시 서비스를 폐쇄한다.
실시예 4: 음성 검증 장치.
음성 검증 장치의 메인 구조가 도 4에 도시된다.
도 4에서의 음성 검증 장치는 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)을 포함하며, 그들은 네트워크 측에 제공된다. 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)은 네트워크 측에서 동일한 장치에 통합되거나, 네트워크 측에서 2개 또는 3개의 상호 독립 장치에 개별적으로 배치될 수 있다.
제어 모듈(311)은 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 주로 적응된다.
호출 모듈(312)은 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우에 사용자에게 음성 검증 정보를 플레이하도록 주로 적응된다.
음성 검증 모듈(313)은 제어 모듈(311)에 의해 결정되는 음성 검증 정보 및 사용자 측으로부터의 기록 정보에 따라 음성 검증 결과를 판단하도록 주로 적응된다.
제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)에 의해 수행되는 특정 동작은 상기 실시예 2 및 실시예 3에 설명되었고; 실시예 2에 대해, 제어 모듈(311)은 지불 서버에 제공될 수 있고; 호출 모듈(312)은 호출 센터에 제공될 수 있는 반면에, 음성 검증 모듈(313)은 음성 매칭 서버 및 지불 서버에 제공될 수 있으며(즉, 음성 검증 모듈(313)의 음성 매칭 부분은 음성 매칭 서버에 의해 실행되는 반면에, 지불 서버는 음성 매칭 결과에 따라 음성 검증 결과 부분의 판단을 실행함), 이는 반복해서 설명되지 않을 것이다.
실시예 5 음성 검증 장치
본 실시예에서의 음성 검증 모듈의 메인 구조는 도 5에 예시된다.
도 5에서의 음성 검증 모듈은 음성 검증 요청 모듈 및 감시 기록 모듈(322)을 포함하며, 그들은 사용자 측에 제공된다.
본 실시예에서의 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 사용자 측에서 동일한 사용자 장비에 제공될 수 있으며, 예를 들어 그들은 하나의 스마트 이동 전화에 제공되고; 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 또한 2개의 상호 독립 장치 각각에 제공될 수 있으며, 예를 들어 음성 검증 요청 모듈(321)은 PC 또는 태블릿 컴퓨터에 제공되는 반면에, 감시 기록 모듈(322)은 스마트 이동 전화 내에 제공된다.
음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 주로 적응된다.
감시 기록 모듈(322)은 네트워크 측으로부터 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시할 때, 음성 검증 요청에 응답하여 네트워크 측에 의해 플레이되는 음성 검증 정보를 획득하기 위해 자동 픽업 및 기록 동작을 수행하도록 주로 적응되고; 호출의 종결 시에, 감시 기록 모듈(322)은 네트워크 측이 기록 정보에 따라 음성 검증을 수행할 수 있도록 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신한다.
음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)에 의해 수행되는 특정 동작은 실시예 2 및 실시예 3에 설명되었고; 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)의 특정 예는 실시예 2에서의 무선 지불 클라이언트이며, 이는 여기서 반복해서 설명되지 않을 것이다.
본 개시는 소프트웨어 또는 소프트웨어 및 하드웨어의 조합으로 구현될 수 있고; 예를 들어, 그것은 전용 집적 회로(ASIC), 범용 컴퓨터, 또는 임의의 다른 유사한 하드웨어 장치에 구현될 수 있다는 점을 주목해야 한다. 일 실시예에서, 본 개시의 소프트웨어 프로그램은 상기 단계 또는 기능을 구현하도록 프로세서에 의해 실행될 수 있다. 마찬가지로, 본 개시의 소프트웨어 프로그램(관련 데이터 구조를 포함함)은 컴퓨터 판독 가능 기록 매체, 예를 들어 RAM 메모리, 자기 또는 광 드라이버, 또는 플로피 디스크, 및 유사한 장치에 저장될 수 있다. 게다가, 본 개시의 기능의 일부 단계는 다양한 기능 또는 단계를 실행하도록 하드웨어, 예를 들어 프로세서와 협력하는 회로에 의해 구현될 수 있다.
본 개시는 상기 예시적 실시예의 상세로 제한되지 않고, 본 개시는 본 개시의 사상 또는 기본 특징으로부터 벗어나지 않으면서 다른 형태로 구현될 수 있다는 점이 당업자에게 명백하다. 따라서, 어떠한 방식으로도, 실시예는 예시적인 것으로 간주되고 제한적인 것으로 간주되지 않아야 하고; 본 개시의 범위는 상기 설명 대신 첨부된 청구항에 의해 제한된다. 따라서, 청구항의 균등 요소의 의미 및 범위에 들어가도록 의도되는 모든 변형은 본 개시 내에서 포괄되어야 한다. 청구항 내의 참조 부호는 관련된 청구항을 제한하는 것으로 간주되지 않아야 한다. 아울러, 용어 "포함한다/포함하는/구비한다/구비하는"은 다른 유닛 또는 단계를 배제하지 않고 단수는 복수를 배제하지 않는다는 점이 명백하다. 장치 청구항에 명시되는 복수의 유닛 또는 수단은 또한 소프트웨어 또는 하드웨어를 통해 단일 유닛 또는 수단에 의해 구현될 수 있다. 제 1 및 제 2와 같은 용어는 명칭을 표시하기 위해 사용되지만 임의의 특정 시퀀스를 표시하지는 않는다.
예시적 실시예가 구체적으로 예시되고 설명되었지만, 당업자는 청구범위의 사상 및 범위로부터 벗어나는 것 없이 그것의 형태 및 상세가 다소 변경될 수 있는 점을 이해할 것이다. 여기서, 추구되는 바와 같은 보호는 첨부된 청구범위에 정의된다. 각각의 실시예의 이러한 그리고 다른 양태는 이하의 번호가 부여된 절에 규정된다:
1. 네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;
네트워크 측에서, 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이하는 단계;
사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하는 단계;
네트워크 측에서, 음성 검증 정보 및 기록 정보에 따라 검증 결과를 판단하는 단계를 포함하는 음성 검증 방법.
2. 절 1에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계; 또는
음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계를 더 포함하는 음성 검증 방법.
3. 절 1에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
음성 검증 정보의 식별을 획득하고, 식별자를 사용자 측에 제공하는 단계를 더 포함하고;
기록으로부터 획득되는 기록 정보를 네트워트 측에 송신하는 단계는,
기록으로부터 획득되는 기록 정보 및 식별자를 함께 네트워크 측에 송신하는 단계를 포함하는 음성 검증 방법.
4. 절 3에 있어서, 음성 검증 정보 및 기록 정보에 따라 음성 검증 결과를 결정하는 단계는,
수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 기록 정보와 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하는 단계;
기록 정보와 매칭하는 음성 검증 정보가 음성 검증 요청에 대응하는 음성 검증 정보인 하는 경우 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 음성 검증이 실패하는 것으로 판단하는 단계를 포함하는 음성 검증 방법.
5. 절 1 내지 절 4 중 어느 한 절에 있어서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계는,
사용자가 호출되고 호출 가입자가 화이트 리스트 내의 호출 가입자에 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계를 포함하는 음성 검증 방법.
6. 음성 검증 요청을 네트워크 측에 송신하는 단계;
네트워크 측으로부터 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시하는 경우에, 음성 검증 요청에 응답하여 네트워크에 의해 수행되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하는 단계;
호출의 종결 시에, 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하며, 그 결과 네트워크 측은 기록 정보에 따라 음성 검증을 수행하는 단계를 포함하는 음성 검증 방법.
7. 절 6에 있어서,
네트워크 측으로부터 송신되는 음성 검증 정보의 식별자를 수신하는 단계를 더 포함하고;
기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하는 단계는,
기록으로부터 획득되는 기록 정보 및 식별자를 함께 네트워크 측에 송신하는 단계를 포함하고;
식별자는 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 방법.
8. 절 6 또는 절 7에 있어서, 사용자가 호출되는 것을 감시하는 경우에 자동 리스닝 및 기록 동작을 수행하는 단계는,
사용자가 호출되고 호출 가입자가 화이트 리스트 내의 호출 가입자에 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계를 포함하는 음성 검증 방법.
9. 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;
사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 사용자에게 음성 검증 정보를 플레이하는 단계;
음성 검증 정보 및 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하는 단계를 포함하고, 기록 정보는 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 방법.
10. 절 9에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계; 또는
음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계를 포함하는 음성 검증 방법.
11. 절 9 또는 절 10에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
음성 검증 정보의 식별자를 획득하고, 식별자를 사용자 측에 제공하는 단계를 더 포함하고;
기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하는 단계는,
기록으로부터 획득되는 기록 정보 및 식별자를 함께 네트워크 측에 송신하는 단계를 포함하는 음성 검증 방법.
12. 절 11에 있어서, 음성 검증 정보 및 기록 정보에 따라 음성 검증 결과를 결정하는 단계는,
수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 기록 정보와 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하는 단계;
기록 정보와 매칭하는 음성 검증 정보가 음성 검증 요청에 대응하는 음성 검증 정보인 하는 경우 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 음성 검증이 실패하는 것으로 판단하는 단계를 포함하는 음성 검증 방법.
13. 사용자 측에서 제공되는 음성 검증 장치로서,
음성 검증 요청을 네트워크 측에 송신하도록 적응되는 음성 검증 요청 모듈;
네트워크 측으로부터 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시하는 경우 음성 검증 요청에 응답하여 네트워크 측에 의해 플레이되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시에 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하며, 그 결과 네트워크 측은 기록 정보에 따라 음성 검증을 수행하도록 적응되는 감시 기록 모듈을 포함하는 음성 검증 장치.
14. 절 13에 있어서, 음성 검증 요청 모듈은 또한,
네트워크 측으로부터 송신되는 음성 검증 정보의 식별자를 수신하도록 적응되고;
감시 기록 모듈은,
기록으로부터 획득되는 기록 정보 및 식별자를 함께 네트워크 측에 송신하도록 특히 적응되고;
식별자는 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 장치.
15. 절 13 또는 절 14에 있어서, 감시 기록 모듈은,
사용자가 호출되고 호출 가입자가 화이트 리스트 내의 호출 가입자에 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하도록 특히 적응되는 음성 검증 장치.
16. 네트워크 측에서 제공되는 음성 검증 장치로서,
사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 적응되는 제어 모듈;
사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우에, 사용자에게 음성 검증 정보를 플레이하도록 적응되는 호출 모듈;
음성 검증 정보 및 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하도록 적응되는 음성 검증 모듈을 포함하고, 기록 정보는 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 장치.
17. 절 16에 있어서, 제어 모듈은,
복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하거나;
음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하도록 특히 적응되는 음성 검증 장치.
18. 절 16 또는 절 17에 있어서, 제어 모듈은,
음성 검증 정보의 식별자를 획득하고, 식별자를 사용자 측에 제공하도록 더 적응되고;
제어 모듈은 사용자 측으로부터 기록 정보 및 식별자를 수신하도록 특히 적응되는 음성 검증 장치.
19. 절 18에 있어서, 음성 검증 모듈은,
수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 기록 정보와 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고;
기록 정보와 매칭하는 음성 검증 정보가 음성 검증 요청에 대응하는 음성 검증 정보인 것으로 판단하는 경우 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 음성 검증이 실패하는 것으로 판단하도록 특히 적응되는 음성 검증 장치.
20. 절 13 내지 절 15 중 어느 하나에 따른 장치 및 절 16 내지 절 19 중 어느 하나에 따른 장치를 포함하는 음성 검증 시스템.

Claims (23)

  1. 네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;
    상기 네트워크 측에서, 상기 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 상기 결정된 음성 검증 정보를 상기 사용자에게 플레이하는 단계;
    상기 사용자 측에서, 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 상기 호출의 종결 시 상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하는 단계;
    상기 네트워크 측에서, 상기 음성 검증 정보 및 상기 기록 정보에 따라 검증 결과를 판단하는 단계를 포함하는 음성 검증 방법.
  2. 제1항에 있어서,
    상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
    복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 상기 랜덤하게 선택된 오디오 파일을 상기 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계; 또는
    상기 음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 상기 랜덤하게 발생된 오디오 파일을 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보로 사용하는 단계를 더 포함하는 음성 검증 방법.
  3. 제1항에 있어서,
    상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
    상기 음성 검증 정보의 식별을 획득하고, 상기 식별자를 상기 사용자 측에 제공하는 단계를 더 포함하고;
    상기 기록으로부터 획득되는 기록 정보를 상기 네트워트 측에 송신하는 단계는,
    상기 기록으로부터 획득되는 상기 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하는 단계를 포함하는 음성 검증 방법.
  4. 제3항에 있어서,
    상기 음성 검증 정보 및 상기 기록 정보에 따라 음성 검증 결과를 판단하는 단계는,
    상기 수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 상기 기록 정보와 상기 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하는 단계;
    상기 기록 정보와 매칭하는 상기 음성 검증 정보가 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보인 것으로 판단하는 경우에 상기 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 상기 음성 검증이 실패하는 것으로 판단하는 단계를 포함하는 음성 검증 방법.
  5. 제1항 내지 제4중 어느 한 항에 있어서, 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계는,
    상기 사용자가 호출되고 화이트 리스트 내의 호출 가입자에 상기 호출 가입자가 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계를 포함하는 음성 검증 방법.
  6. 음성 검증 요청을 네트워크 측에 송신하는 단계;
    상기 네트워크 측으로부터 사용자로의 호출을 감시하고, 상기 사용자가 호출되는 것을 감시하는 경우 상기 음성 검증 요청에 응답하여 상기 네트워크에 의해 수행되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하는 단계;
    상기 호출의 종결 시에, 상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하며, 그 결과 상기 네트워크 측은 상기 기록 정보에 따라 음성 검증을 수행하는 단계를 포함하는 음성 검증 방법.
  7. 제6항에 있어서,
    상기 네트워크 측으로부터 송신되는 상기 음성 검증 정보의 식별자를 수신하는 단계를 더 포함하고;
    상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하는 단계는,
    상기 기록으로부터 획득되는 상기 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하는 단계를 포함하고;
    상기 식별자는 상기 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 방법.
  8. 제6항 또는 제7항에 있어서,
    상기 사용자가 호출되는 것을 감시하는 경우 자동 리스닝 및 기록 동작을 수행하는 단계는,
    상기 사용자가 호출되고 화이트 리스트 내의 호출 가입자에 상기 호출 가입자가 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계를 포함하는 음성 검증 방법.
  9. 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;
    상기 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 상기 사용자에게 상기 음성 검증 정보를 플레이하는 단계;
    상기 음성 검증 정보 및 상기 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하는 단계를 포함하고, 상기 기록 정보는 상기 사용자 측에서 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 방법.
  10. 제9항에 있어서,
    상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
    복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 상기 랜덤하게 선택된 오디오 파일을 상기 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계; 또는
    상기 음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 상기 랜덤하게 발생된 오디오 파일을 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보로 사용하는 단계를 포함하는 음성 검증 방법.
  11. 제9항 또는 제10항에 있어서,
    상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
    상기 음성 검증 정보의 식별자를 획득하고, 상기 식별자를 상기 사용자 측에 제공하는 단계를 더 포함하고;
    상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하는 단계는,
    상기 기록으로부터 획득되는 상기 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하는 단계를 포함하는 음성 검증 방법.
  12. 제11항에 있어서,
    상기 음성 검증 정보 및 상기 기록 정보에 따라 음성 검증 결과를 판단하는 단계는,
    상기 수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 상기 기록 정보와 상기 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하는 단계;
    상기 기록 정보와 매칭하는 상기 음성 검증 정보가 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보인 것으로 판단하는 경우에 상기 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 상기 음성 검증이 실패하는 것으로 판단하는 단계를 포함하는 음성 검증 방법.
  13. 사용자 측에서 제공되는 음성 검증 장치로서,
    음성 검증 요청을 네트워크 측에 송신하도록 적응되는 음성 검증 요청 모듈;
    상기 네트워크 측으로부터 사용자로의 호출을 감시하고, 상기 사용자가 호출되는 것을 감시하는 경우 상기 음성 검증 요청에 응답하여 상기 네트워크 측에 의해 플레이되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하고, 상기 호출의 종결 시에 상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하며, 그 결과 상기 네트워크 측은 상기 기록 정보에 따라 음성 검증을 수행하도록 적응되는 감시 기록 모듈을 포함하는 음성 검증 장치.
  14. 제13항에 있어서,
    상기 음성 검증 요청 모듈은 또한,
    상기 네트워크 측으로부터 송신되는 상기 음성 검증 정보의 식별자를 수신하도록 적응되고;
    상기 감시 기록 모듈은,
    상기 기록으로부터 획득되는 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하도록 특히 적응되고;
    상기 식별자는 상기 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 장치.
  15. 제13항 또는 제14항에 있어서,
    상기 감시 기록 모듈은,
    상기 사용자가 호출되고 화이트 리스트 내의 호출 가입자에 상기 호출 가입자가 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하도록 특히 적응되는 음성 검증 장치.
  16. 네트워크 측에서 제공되는 음성 검증 장치로서,
    사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 적응되는 제어 모듈;
    상기 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 상기 사용자에게 상기 음성 검증 정보를 플레이하도록 적응되는 호출 모듈;
    상기 음성 검증 정보 및 상기 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하도록 적응되는 음성 검증 모듈을 포함하고, 상기 기록 정보는 상기 사용자 측에서 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 장치.
  17. 제16항에 있어서,
    상기 제어 모듈은,
    복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 상기 랜덤하게 선택된 오디오 파일을 상기 음성 검증 요청에 대응하는 음성 검증 정보로 사용하거나;
    상기 음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 상기 랜덤하게 발생된 오디오 파일을 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보로 사용하도록 특히 적응되는 음성 검증 장치.
  18. 제16항 또는 제17항에 있어서,
    상기 제어 모듈은,
    상기 음성 검증 정보의 식별자를 획득하고, 상기 식별자를 상기 사용자 측에 제공하도록 더 적응되고;
    상기 제어 모듈은 상기 사용자 측으로부터 상기 기록 정보 및 상기 식별자를 수신하도록 특히 적응되는 음성 검증 장치.
  19. 제18항에 있어서,
    상기 음성 검증 모듈은,
    상기 수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 상기 기록 정보와 상기 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고;
    상기 기록 정보와 매칭하는 상기 음성 검증 정보가 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보인 것으로 판단하는 경우 상기 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 상기 음성 검증이 실패하는 것으로 판단하도록 특히 적응되는 음성 검증 장치.
  20. 제13항 내지 제15항 중 어느 한 항에 따른 장치 및 제16항 내지 제19항 중 어느 한 항에 따른 장치를 포함하는 음성 검증 시스템.
  21. 실행될 때, 제1항 내지 제12항 중 어느 한 항에 따른 방법이 실행되게 하는 컴퓨터 코드를 저장한 컴퓨터 판독 가능 매체.
  22. 컴퓨터 장치에 의해 실행될 때, 제1항 내지 제12항 중 어느 한 항에 따른 방법이 실행되게 하는 컴퓨터 프로그램 제품.
  23. 메모리 및 프로세서를 포함하는 컴퓨터 장치로서, 상기 메모리는 컴퓨터 코드를 저장하고, 상기 프로세서는 상기 컴퓨터 코드를 실행함으로써 제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하도록 구성되는 컴퓨터 장치.

KR1020167027069A 2015-06-30 2015-11-16 음성 검증 방법, 장치 및 시스템 KR101881058B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510378018.X 2015-06-30
CN201510378018.XA CN105119877B (zh) 2015-06-30 2015-06-30 语音验证方法、装置以及系统
PCT/CN2015/094648 WO2017000476A1 (zh) 2015-06-30 2015-11-16 语音验证方法、装置以及系统

Publications (2)

Publication Number Publication Date
KR20170012873A true KR20170012873A (ko) 2017-02-03
KR101881058B1 KR101881058B1 (ko) 2018-08-17

Family

ID=54667770

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167027069A KR101881058B1 (ko) 2015-06-30 2015-11-16 음성 검증 방법, 장치 및 시스템

Country Status (6)

Country Link
US (1) US10423958B2 (ko)
EP (1) EP3136677A4 (ko)
JP (1) JP6470306B2 (ko)
KR (1) KR101881058B1 (ko)
CN (1) CN105119877B (ko)
WO (1) WO2017000476A1 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469788A (zh) * 2015-12-09 2016-04-06 百度在线网络技术(北京)有限公司 语音信息验证方法及装置
CN107330696A (zh) * 2016-04-29 2017-11-07 宇龙计算机通信科技(深圳)有限公司 一种运用语音识别技术的支付方法、装置、终端及系统
CN106330882B (zh) * 2016-08-18 2019-12-27 广州凰腾通信科技有限公司 安全验证方法及安全验证装置
CN107104979B (zh) * 2017-05-25 2020-01-14 杭州东信北邮信息技术有限公司 一种语音回拨验证业务的实现方法和系统
CN107342087A (zh) * 2017-06-19 2017-11-10 广州市讯飞樽鸿信息技术有限公司 一种语音验证方法及系统
KR20190046063A (ko) * 2017-10-25 2019-05-07 현대자동차주식회사 사용자 인증 시스템, 사용자 인증 방법 및 서버
EP3477927B1 (en) * 2017-10-31 2021-03-17 Telia Company AB Management of call connection attempt
US11216801B2 (en) * 2017-11-01 2022-01-04 Mastercard International Incorporated Voice controlled systems and methods for onboarding users and exchanging data
US11012555B2 (en) * 2017-11-20 2021-05-18 International Business Machines Corporation Non-verbal sensitive data authentication
CN109862033A (zh) * 2019-03-14 2019-06-07 浙江糖链科技有限公司 一种利用异构网络实现实时信息确认的方法
JP7334780B2 (ja) * 2019-06-10 2023-08-29 日本電気株式会社 通信端末、情報処理装置、情報処理システム、情報処理方法およびプログラム
WO2021137113A1 (en) * 2019-12-30 2021-07-08 Telecom Italia Spa Method for authenticating a user, and artificial intelligence system operating according to said method
TWI803788B (zh) * 2020-11-12 2023-06-01 中華電信股份有限公司 防止機器盜撥國際電話之方法及系統
CN112802475A (zh) * 2020-12-30 2021-05-14 厦门市美亚柏科信息股份有限公司 基于语音识别的应用自动登录方法及计算机可读存储介质
CN112888082A (zh) * 2021-01-27 2021-06-01 上海华客信息科技有限公司 基于二维码的语音通话方法、系统、设备及存储介质
CN113055536B (zh) * 2021-03-22 2022-07-19 中国工商银行股份有限公司 验证电话客服身份及电话客服的方法、装置、设备及介质
CN114822592B (zh) * 2022-06-27 2022-09-09 山东登远信息科技有限公司 一种基于语音识别的变电站信号验收方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040035647A (ko) * 2004-04-06 2004-04-29 (주)예스테크놀로지 화자인증 기술을 이용한 네트워크 기반의 전자금융거래 사용자 인증서비스 제공 방법 및 이를 수행하는 장치
WO2015043338A1 (en) * 2013-09-27 2015-04-02 Tencent Technology (Shenzhen) Company Limited Identify verifying method, account acquiring method, mobile terminal, and storage medium

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7280970B2 (en) * 1999-10-04 2007-10-09 Beepcard Ltd. Sonic/ultrasonic authentication device
US7130800B1 (en) * 2001-09-20 2006-10-31 West Corporation Third party verification system
US6601762B2 (en) * 2001-06-15 2003-08-05 Koninklijke Philips Electronics N.V. Point-of-sale (POS) voice authentication transaction system
US20030037004A1 (en) * 2001-08-14 2003-02-20 Chuck Buffum Dialog-based voiceprint security for business transactions
JP2005149232A (ja) 2003-11-17 2005-06-09 Matsushita Electric Ind Co Ltd 認証用データ提供方法、ユーザ認証方法、認証用データ提供装置、ユーザ認証装置並びに携帯通信端末
JP2006017936A (ja) * 2004-06-30 2006-01-19 Sharp Corp 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体
JP2008234398A (ja) 2007-03-22 2008-10-02 Oki Electric Ind Co Ltd 音声認証システム及び認証局サーバ
US20090327310A1 (en) * 2008-06-27 2009-12-31 Sony Ericsson Mobile Communications Ab Methods for providing access to files on an electronic device using a phone number for authentication and related electronic devices and computer program products
US8311190B2 (en) * 2008-12-23 2012-11-13 International Business Machines Corporation Performing human client verification over a voice interface
CN101997849A (zh) * 2009-08-18 2011-03-30 阿里巴巴集团控股有限公司 一种互联网用户身份验证的方法、装置及系统
CN101662365A (zh) * 2009-09-18 2010-03-03 浙江大学 一种中文语音验证码的生成方法
CN103020820A (zh) * 2011-09-20 2013-04-03 深圳市财付通科技有限公司 一种交易支付方法和系统
CN103903622A (zh) 2012-12-28 2014-07-02 腾讯科技(深圳)有限公司 一种语音验证方法、装置及系统
CN103944861A (zh) 2013-01-20 2014-07-23 上海博路信息技术有限公司 一种语音验证系统
US10366391B2 (en) * 2013-08-06 2019-07-30 Visa International Services Association Variable authentication process and system
US10192219B2 (en) * 2014-01-09 2019-01-29 Capital One Services, Llc Voice recognition to authenticate a mobile payment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040035647A (ko) * 2004-04-06 2004-04-29 (주)예스테크놀로지 화자인증 기술을 이용한 네트워크 기반의 전자금융거래 사용자 인증서비스 제공 방법 및 이를 수행하는 장치
WO2015043338A1 (en) * 2013-09-27 2015-04-02 Tencent Technology (Shenzhen) Company Limited Identify verifying method, account acquiring method, mobile terminal, and storage medium

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
음성인증을 이용한 PDA 인증시스템 개발, 중소기업 기술혁신개발사업 최종보고서, ㈜한국파워보이스, 2004년 5월 31일. *

Also Published As

Publication number Publication date
JP6470306B2 (ja) 2019-02-13
CN105119877A (zh) 2015-12-02
JP2017529711A (ja) 2017-10-05
US20180114225A1 (en) 2018-04-26
KR101881058B1 (ko) 2018-08-17
US10423958B2 (en) 2019-09-24
CN105119877B (zh) 2018-11-13
EP3136677A4 (en) 2017-07-19
EP3136677A1 (en) 2017-03-01
WO2017000476A1 (zh) 2017-01-05

Similar Documents

Publication Publication Date Title
KR101881058B1 (ko) 음성 검증 방법, 장치 및 시스템
JP2017529711A5 (ko)
US10674009B1 (en) Validating automatic number identification data
US8861692B1 (en) Web call access and egress to private network
US10055742B2 (en) Call transfers for web-delivered calls
US20170149772A1 (en) Identity authentication method, system, business server and authentication server
US8189754B2 (en) Image sharing system
US20140341366A1 (en) Call control for web calls
CN103152705A (zh) 短信的处理方法、装置及系统
WO2014086222A1 (zh) 设置视频通话参数、和发送能力参数的方法及装置
CA3064797A1 (en) Identity verification method and apparatus, and electronic device
WO2016134587A1 (zh) Wifi连接验证方法、wifi热点设备及终端
WO2011150885A2 (zh) 语音留言的管理方法和装置
US10938865B2 (en) Management of subscriber identity in service provision
US10003618B2 (en) Device and method for providing mobile Internet call service
KR101820119B1 (ko) 실시간 보이스 피싱 분석 서비스 방법, 통신망 중계 장치 및 단말
CN104869611A (zh) 一种wlan接入方法及装置
US20170171510A1 (en) Method and device for leaving video message
CN110913055B (zh) 终端设备的查找方法及装置、电子设备
US11122409B2 (en) Detecting safety concerns via subscriber safety control (SSC) system
CN112004228B (zh) 实人认证方法及系统
CN107148008A (zh) 通话切换方法、系统、终端及服务器
CN108834116B (zh) 蓝牙配对方法、电子设备及存储介质
KR102574576B1 (ko) 단말의 호 연결 방법 및 이를 수행하는 단말
US9843677B2 (en) Data entry confirmation system for a device or system with dialing capability

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant