KR20170012873A

KR20170012873A - 음성 검증 방법, 장치 및 시스템

Info

Publication number: KR20170012873A
Application number: KR1020167027069A
Authority: KR
Inventors: 시아오항 왕; 양 동; 용 관
Original assignee: 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date: 2015-06-30
Filing date: 2015-11-16
Publication date: 2017-02-03
Also published as: JP6470306B2; CN105119877A; JP2017529711A; US20180114225A1; KR101881058B1; US10423958B2; CN105119877B; EP3136677A4; EP3136677A1; WO2017000476A1

Abstract

본 발명은 음성 검증 방법, 장치, 및 시스템을 제공하며, 방법은 네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계; 네트워크 측에서, 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이하는 단계; 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하는 단계; 네트워크 측에서, 음성 검증 정보 및 기록 정보에 따라 검증 결과를 판단하는 단계를 포함한다. 본 발명에 의해 제공되는 기술적 해결책은 검증의 편의성을 증대시키고, 검증의 불확실성을 감소시키고, 검증의 구현 방식을 풍부하게 한다.

Description

음성 검증 방법, 장치 및 시스템{METHOD, APPARATUS AND SYSTEM FOR VOICE VERIFICATION}

본 발명은 검증 기술에 관한 것으로서, 특히 음성 검증 방법, 음성 검증 장치, 및 음성 검증 시스템에 관한 것이다.

사용자 재산 손실 및 사용자 정보 누설을 회피하도록 사용자 계정 보안 또는 사용자 정보 보안을 보호하기 위해서, 검증은 네트워크 지불 및 사용자 로그온과 같은 프로세스에 광범위하게 적용되어 왔다.

기존 검증 프로세스는 통상 단문 메시징 서비스((Short Messaging Service)(SMS)) 메시지(멀티미디어 메시징 서비스((Multimedia Messaging Service)(MMS)) 메시지를 포함함)에 기초하여 구현된다. 특정 구현 프로세스는 일반적으로 이하를 포함한다: 사용자 장비로부터 검증 요청을 수신한 후에 서버(예를 들어, 지불 서버 또는 로그온 서버)에 의해, 사용자에 의해 예약되는 이동 전화 번호를 검색하는 것, 및 검증 요청을 위한 검증 코드를 발생시키며, 그 검증 코드는 수 또는 알파벳 또는 수 및 알파벳의 조합일 수 있는 것; 서버에 의해, 검증 코드를 포함하는 SMS 메시지를 사용자에 의해 예약되는 이동 전화 번호에 따라 SMS 서버를 통해 사용자에게 송신하는 것; SMS를 수신한 후에 사용자에 의해, SMS 내의 검증 코드를 대응하는 페이지 상의 입력 박스에 입력하는 것; 사용자 장비로부터 검증 코드를 수신한 후에 서버에 의해, 이전에 발생된 검증 코드 및 수신된 검증 코드에 따라 검증하는 것. 검증 결과는 주로 서버가 후속 절차(예를 들어, 후속 로그온 절차 또는 지불 절차 등)를 결정하기 위한 것이다.

본 발명을 생성하는 프로세스 동안, 발명자는 기존 검증 방식이 네트워크 공격 및 검증 요청의 위조를 포함하는 불법 행위에 기인하는 사용자 계정 및 사용자 정보에 대한 보안 문제를 어느 정도 회피할 수 있지만, 그것이 불편, 불확실성, 및 단일 검증 수단과 같은 문제를 처리하기 위해 개선을 여전히 요구한다는 것을 발견하였다. 구체적으로, SMS 메시지가 저장 및 전송 메커니즘을 통해 송신되기 때문에, SMS 서버는 SMS 메시지를 송신할 때 수신자의 상태(예를 들어, 수신자가 파워 온되거나 신호 커버리지 영역 내에 있는지)를 인식하지 못하며, 그 결과 수신자가 SMS 메시지를 수신하는 시간은 예측할 수 없고, 이는 불확실성을 검증 프로세스에 추가하고; 정상 상황에서, 그것은 SMS를 사용자에게 송신하는데 대략 5~10초가 걸리고, 사용자는 검증 코드가 수신될 때까지 대기할 필요가 있고; 더욱이, 기존 검증 방법은 사용자가 수신된 검증 코드를 수동으로 입력하는 것을 요구하므로 불편하고, 검증 코드의 수동 입력은 또한 검증 프로세스 동안 인공 결함을 도입하여, 검증 프로세스의 편의성을 더 저하시킬 수 있다.

본 발명의 목적은 음성 검증을 위한 방법, 장치 및 시스템을 제공하는 것이다.

본 발명의 일 양태에 따르면, 음성 검증 방법이 제공되고, 방법은 단계를 포함한다:

본 발명의 다른 양태에 따르면, 또한 음성 검증 장치가 제공되며, 장치는 포함한다:

본 발명의 더 추가 양태에 따르면, 음성 검증 시스템이 더 제공되면, 시스템은 포함한다:

종래 기술과 비교하여, 본 발명은 이하의 장점을 갖는다: 사용자 측으로부터 음성 검증 요청에 응답하여 사용자에게 호출을 개시하고 음성 검증 정보를 사용자에게 플레이함으로써, 네트워크 측은 사용자 측의 상태 및 음성 검증 정보가 사용자 측에 성공적으로 플레이되었는지를 분명히 인식하며, 본 발명은 네트워크 측에 의해 야기되는 검증 프로세스가 사용자 상태를 인식할 수 없는 것에 대한 불확실성을 일정 정도 회피한다. 본 발명의 실시예에 따르면, 사용자 측이 감시, 자동 리스닝, 자동 음성 기록, 및 네트워크 워크에 기록 정보의 자동 송신과 같은 동작을 수행하게 함으로써, 검증을 요구하는 정보(즉, 기록 정보)는 수동 동작을 도입하지 않으면서 네트워크 측에 다시 자동으로 송신될 수 있으며, 그 결과 네트워크 측은 후속 음성 검증 동작을 신속하게 및 순조롭게 수행할 수 있고, 이는 검증 코드의 수동 입력에 의해 야기되는 검증 프로세스의 불편, 사용자가 검증을 요구하는 정보의 수신을 대기해야 하는 것, 및 검증 프로세스에 인공 고장을 도입하는 것 등과 같은 문제를 회피한다. 따라서, 본 발명에 의해 제공되는 기술적 해결책은 검증의 편의성을 증대시키고, 불확실성을 감소시키며, 검증의 구현 방식을 풍부하게 한다는 것을 알 수 있다.

첨부 도면을 참조하여 비제한적 실시예의 상세한 설명을 판독함으로써, 본 발명의 다른 특징, 목적 및 장점이 더 명백해질 것이다.
도 1은 본 발명의 제 1 실시예에 따른 음성 검증의 방법의 흐름도를 예시한다.
도 2는 본 발명의 제 2 실시예에 따른 음성 검증의 방법의 흐름도를 예시한다.
도 3은 본 발명의 제 3 실시예에 따른 음성 검증 시스템의 개략도를 예시한다.
도 4는 본 발명의 제 4 실시예에 따른 음성 검증 장치의 개략도를 예시한다.
도 5는 본 발명의 제 5 실시예에 따른 음성 검증 장치의 개략도를 예시한다.
도면에서, 동일 또는 유사한 참조 번호는 동일 또는 유사한 구성요소를 나타낸다.

일부 예시적 실시예가 처리 또는 방법으로서 흐름도의 형태로서 설명된다는 점이 예시적 실시예를 더 상세히 논의하기 전에 언급되어야 한다. 흐름도는 순차적으로 처리되는 것으로 각각의 동작을 도시하지만, 그 안에서의 많은 동작은 병렬적으로, 함께 또는 동시에 구현될 수 있다. 게다가, 다양한 동작은 재배열될 수 있다. 동작이 완료될 때, 처리가 종결될 수 있다. 그러나, 첨부 도면에 포함되지 않는 부가 단계가 포함될 수 있다. 처리는 방법, 기능, 사양, 서브루틴, 서브프로그램 등에 대응할 수 있다.

문맥에서 지칭되는 "서버"는 논리 서버 또는 엔티티 서버를 포함할 수 있으며; 엔티티 서버는 또한 "네트워크 장치", 즉 미리 결정된 프로그램 또는 명령어를 실행함으로써 수치 값 계산 및/또는 논리 계산과 같은 미리 결정된 처리 절차를 수행할 수 있는 네트워크 측에 제공되는 지능형 전자 장치로 지칭될 수 있다. 네트워크 장치는 프로세서 및 메모리를 포함할 수 있으며, 프로세서는 미리 결정된 처리 절차를 수행하기 위해 사전 저장된 프로그램 명령어를 실행하고; 미리 결정된 처리 절차는 또한 ASIC, FPGA, 및 DSP와 같은 하드웨어에 의해 수행되거나, 명령어 및 하드웨어의 조합에 수행될 수 있다.

엔티티 서버는 소형 태블릿 장치 또는 대형 태블릿 장치일 수 있다. 서버는 단지 일 예이고, 다른 기존 또는 장래에 가능하게 생겨날 네트워크 장치는 본 발명에 적용 가능하다면, 또한 본 발명의 보호 범위 내에 포함되어야 하고 이로써 참조로 포함된다는 점을 주목할 필요가 있다.

아래에 개시되는 방법(그것의 일부는 흐름도를 통해 예시됨)은 일반적으로 하드웨어, 소프트웨어, 펌웨어, 미들웨어, 마이크로코드, 하드웨어 기술 언어 또는 그것의 임의의 조합을 통해 구현될 수 있다. 방법이 소프트웨어, 펌웨어, 미들웨어 또는 마이크로코드로 구현될 때, 필요한 작업을 실행하는 프로그램 코드 또는 코드 세그먼트는 머신 또는 컴퓨터 판독 가능 매체(예를 들어, 저장 매체)에 저장될 수 있다. (하나 이상의) 프로세서는 필요한 작업을 구현할 수 있다.

여기에 개시되는 특정 구조 및 기능 상세는 본 발명의 예시적 실시예를 설명하기 위해 단지 대표적인 것이다. 그 대신, 본 발명은 많은 대안 실시예를 통해 구체적으로 구현될 수 있다. 따라서, 본 발명은 여기에 예시되는 실시예로만 제한된다고 이해되지 않아야 한다.

그러나, "제 1" 및 "제 2"와 같은 용어는 각각의 유닛을 설명하기 위해 여기에 사용될 수 있지만, 이러한 유닛은 이러한 용어에 의해 제한되지 않아야 한다는 점이 이해되어야 한다. 이러한 용어의 사용은 하나의 유닛을 다른 유닛과 단지 구별하는 것이다. 예를 들어, 예시적 실시예의 범위로부터 벗어나지 않으면서, 제 1 유닛은 제 2 유닛으로 지칭될 수 있으며, 유사하게 제 2 유닛은 제 1 유닛으로 지칭될 수 있다. 여기에 사용되는 용어 "및/또는"은 열거되는 바와 같이 하나 이상의 연관된 아이템 중 어느 것 및 모든 조합을 포함한다.

하나 유닛이 추가 유닛에 "연결" 또는 "결합"될 때, 그것은 추가 유닛에 직접 연결 또는 결합될 수 있거나, 중간 유닛이 존재할 수 있다는 점이 이해되어야 한다. 대조적으로, 유닛이 추가 유닛에 "직접 연결" 또는 "직접 결합"될 때, 중간 유닛은 존재하지 않는다. 유닛 사이의 관계를 설명하는 다른 용어(예를 들어, "사이에 배치"에 대한 "사이에 직접 배치", "에 인접"에 대한 "에 바로 인접" 등)는 유사한 방식으로 해석되어야 한다.

여기에 사용되는 용어는 예시적 실시예를 제한하도록 의도되지 않는 바람직한 실시예만을 설명하기 위한 것이다. 달리 지시되지 않는 한, 여기에 사용되는 단수( "하나의" 또는 "일")는 복수 형태를 포함하도록 의도된다. 또한 여기에 사용되는 용어 "포함한다" 및/또는 "구비한다"는 명시된 바와 같이 특징, 정수, 단계, 동작, 유닛 및/또는 구성요소의 존재를 규정하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 유닛, 구성요소, 및/또는 그것의 조합의 존재 또는 추가를 배제하지 않는다는 점이 이해되어야 한다.

또한 일부 대안 실시예에서, 언급되는 바와 같은 기능/동작은 도면에 표시되는 것과 상이한 순서로 발생할 수 있다는 점을 주목해야 한다. 예를 들어, 수반되는 기능/동작에 따라, 2개의 연속적으로 예시된 도면은 실질적으로 동시에 또는 때때로 역 순서로 실행될 수 있다.

이하, 본 발명은 도면과 함께 더 상세히 설명될 것이다.

실시예 1: 음성 검증 방법.

도 1은 본 실시예의 음성 검증 방법의 흐름도를 예시하며; 도 1에 예시된 바와 같은 방법은 단계(S100), 단계(S110), 단계(S120), 및 단계(S130)를 주로 포함한다. 이하, 도 1에서의 각각의 단계가 예시될 것이다.

S100: 네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정한다.

구체적으로, 네트워크 측은 사용자에 의해 예약되는 복수의 사용자 음성 통신 번호를 사전 저장한다. 이러한 사용자 음성 통신 번호는 한 세트의 통신 번호를 형성한다. 네트워크 측은 사전 저장된 세트의 통신 번호로부터 음성 검증 요청에 대응하는 사용자 음성 통신 번호를 획득할 수 있다. 특정 예에서, 네트워크 측에서의 세트의 통신 번호는 사용자 음성 통신 번호와 사용자 식별자(예를 들어, 사용자 로그온 계정 또는 사용자 지불 계정 정보 등; 이하, 설명은 일 예로서 사용자 지불 계정 정보를 사용하여 이루어질 것임) 사이의 복수의 대응 관계를 포함한다. 네트워크 측은 사용자 측으로부터 음성 검증 요청을 수신할 때, 음성 검증 요청에 포함된 정보로부터 사용자 지불 계정 정보를 우선 획득할 수 있고; 그 다음, 네트워크 측은 사용자 지불 계정 정보에 대응하는 사용자 음성 통신 번호를 획득하기 위해 사용자 계정 지불 정보를 사용하여 세트로부터 매칭 및 검색을 수행한다. 본 실시예는 네트워크 측에서 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하는 특정 구현으로 제한되지 않는다.

본 실시예에서 획득되는 사용자 음성 통신 번호는 네트워크 측과 사용자 측 사이에 음성 호출 연결을 주로 설정하는 것이다. 본 실시예에서의 사용자 음성 통신 번호는 사용자의 이동 전화 번호일 수 있다.

하나의 응용 시나리오에서, 본 실시예에서, 사용자 음성 통신 번호에 대응하는 사용자 장치 및 음성 검증 요청을 송신하는 사용자 장비는 동일한 사용자 장비이며, 사용자는 지불 동작 또는 로그온 동작 등을 수행하기 위해 그/그녀의 스마트 이동 전화(또는 전화 기능을 갖는 태블릿 컴퓨터)를 사용하고, 스마트 이동 전화(또는 전화 기능을 갖는 태블릿 컴퓨터)의 번호(즉, 사용자의 이동 전화 번호)는 단지 사용자 식별자(예를 들어, 사용자 로그온 계정 또는 사용자 지불 계정 정보 등)에 대응하는 사용자 음성 통신 번호이다.

다른 응용 시나리오에 있어서, 본 실시예에서, 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청을 송신하는 사용자 장비가 아니며, 예를 들어 사용자는 지불 동작 또는 로그온 동작 등을 수행하기 위해 그/그녀의 스마트폰(또는 전화 기능을 갖는 태블릿 컴퓨터)을 사용하는 반면에, 네트워크 측에 저장되는 사용자 식별자 정보에 대응하는 사용자 음성 통신 번호는 사용자의 스마트폰의 번호이고; 다른 예에서, 사용자는 스마트폰을 사용하여 지불 동작을 수행하는 반면에, 스마트폰의 번호(즉, 사용자의 이동 전화 번호)는 사용자 식별자 정보(예를 들어, 사용자의 로그온 계정 또는 사용자 지불 계정 정보)에 대응하는 사용자 음성 통신 번호가 아니며, 즉 사용자 식별자 정보에 대응하는 사용자 음성 통신 번호는 지불 동작 또는 로그온 동작을 수행하도록 사용자에 의해 사용되는 스마트 이동 전화 번호의 번호와 동일하지 않다.

본 실시예에서, 특정 시간 기간(예를 들어, 몇 시간 또는 수십 시간 또는 몇 일) 내에 상이한 음성 검증 요청을 위해 네트워크 측에서 결정되는 음성 검증 정보는 통상 반복되지 않는다. 다시 말하면, 본 발명의 네트워크 측은 상이한 음성 검증 요청이 특정 시간 기간 내에 상이한 음성 검증 정보에 대응해야 하는 것을 보장해야 한다.

본 실시예의 네트워크 측에 의해, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 예는 아래에 제공된다: 네트워크 측은 복수의 오디오 파일(또한 음성 파일로 지칭될 수 있음)을 사전 저장하고, 복수의 오디오 파일의 특성은 크게 다르고; 모든 오디오 파일은 오디오 파일 세트를 형성할 수 있고; 음성 검증 요청을 수신할 때, 네트워크 측은 오디오 파일 세트로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다.

본 실시예의 네트워크 측에 의해, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 다른 특정 예는 아래에 제공된다: 네트워크 측은 음성 검증 요청을 수신한 후에, 오디오 파일을 랜덤하게 발생시키고 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다. 네트워크 측에서 오디오 파일을 랜덤하게 발생시키는 방식은 사전 저장된 오디오 파일로부터 오디오 정보의 작은 세그먼트를 랜덤하게 캡처하는 것에 의해 새로운 오디오 파일을 발생시킬 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다. 네트워크에서 오디오 파일을 랜덤하게 발생시키는 방식은 측 또한 2개 이상의 사전 저장된 오디오 파일을 새로운 오디오 파일로 랜덤하게 조합할 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다.

본 실시예는 네트워크 측이 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 구현 방식, 오디오 파일의 특정 포맷, 또는 네트워크 측이 오디오 파일을 랜덤하게 발생시키는 특정 구현 방식 등에 제한을 갖지 않는다.

본 실시예의 음성 검증 정보는 음악 음성 검증 정보를 플레이하거나 음성 검증 정보를 수 및/또는 알파벳 및/또는 단어 및/또는 한자의 형태로 플레이하기 위해 사용될 수 있으며; 게다가, 음성 검증 정보를 플레이하는 지속 기간은 통상 매우 짧으며, 예를 들어 일반적으로 1 내지 5초이다. 본 실시예는 음성 검증 정보에 의해 플레이되는 특정 콘텐츠 또는 음성 검증 정보를 플레이하는 시간 길이를 제한하지 않는다.

본 실시예에서, 모든 음성 검증 정보는 대응하는 고유 식별자를 가지며, 즉 하나의 음성 검증 정보는 하나의 식별자를 사용하여 고유하게 결정될 수 있다. 식별자는 음성 검증 정보의 식별자로 지칭될 수 있다. 음성 검증 정보에 대응하는 식별자는 구체적으로 오디오 파일의 파일명 또는 오디오 파일 및 파일명의 저장 경로의 조합, 또는 오디오 파일의 인덱스 값, 또는 랜덤 발생 알고리즘을 사용하여 랜덤하게 발생되는 식별자일 수 있다. 본 실시예는 음성 검증 정보의 식별자의 특정 표현 형태로 제한되지 않는다.

본 실시예에서의 음성 검증 정보에 대응하는 식별자는 검증 프로세스(예를 들어, 지불 검증 프로세스)를 위해 사용될 수 있고; 음성 매칭 알고리즘에 식별자를 추가함으로써, 음성 검증 결과의 정확도가 더 보장될 수 있다.

일 실시예에서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 동안 네트워크 측은 또한 음성 검증 정보에 대응하는 식별자를 획득하며, 예를 들어 오디오 파일의 파일명 또는 인덱스 값을 음성 검증 정보로 획득하고, 다른 예에 대해, 오디오 파일의 파일명 및 저장 경로를 음성 검증 정보로 획득하는 것 등일 수 있고; 그 다음, 네트워크 측은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있다. 통상적인 상황에서, 네트워크 측은 결정된 음성 검증 정보에 대응하는 식별자를 사용자 측에서 음성 검증 요청을 송신하는 사용자 장비에 제공할 수 있다. 음성 검증 요청을 요청하는 사용자 장비가 사용자 음성 통신 번호에 대응하는 사용자 장비가 아닌 경우에, 음성 검증 요청을 송신하는 사용자 장비는 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비를 제공할 수 있으며, 예를 들어 음성 검증 요청을 송신하는 사용자 장비는 WiFi 또는 블루투스와 같은 무선 송신 방식을 통해, 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비에 제공하고; 다른 예에 대해, 음성 검증 요청을 송신하는 사용자 장비는 2차원 코드를 디스플레이하며, 그 결과 사용자 음성 통신 번호에 대응하는 사용자 장비는 2차원 코드를 스캐닝함으로써 음성 검증 정보에 대응하는 식별자를 획득할 수 있고; 물론, 음성 검증 요청을 송신하는 사용자 장비는 또한 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비에 제공하기 위해 다른 편리한 송신 방식을 채택할 수 있고; 게다가, 음성 검증 요청을 송신하는 사용자 장비는 식별자를 송신할 때, 또한 음성 검증 요청을 위한 수신자 정보를 사용자 음성 통신 번호에 대응하는 사용자 장비에 제공할 수 있으며, 그 결과 사용자 음성 통신 번호에 대응하는 사용자 장비는 후속 기록으로부터 획득되는 기록 정보의 수신자를 인식할 수 있다. 본 실시예는 음성 검증 요청을 송신하는 사용자 장비가 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 사용자 음성 통신 번호에 대응하는 사용자 장비에 어떻게 제공하는지에 관한 특정 구현 방식을 제한하지 않는다.

실제 응용 시나리오에서, 본 실시예의 네트워크 측은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있지만, 그것은 본 실시예의 네트워크 측이 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공해야 하는 것을 의미하는 것이 아니며, 즉 네트워크 측은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공하지 않을 때 본 실시예의 검증 절차가 또한 구현될 수 있다는 점을 특히 주목해야 한다.

S110: 네트워크 측에서, 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이한다.

구체적으로, 본 실시예의 네트워크 측은 사용자 측과 음성 호출 연결(즉, 음성 링크)을 설정하기 위해 사용자 음성 통신 번호에 따라 대응하는 호출 동작을 수행할 수 있다. 본 실시예의 네트워크 측은 기존 호출 방식을 이용하는 사용자 측과 음성 호출 연결을 설정할 수 있으며, 예를 들어 네트워크 측은 인터넷 프로토콜((Internet Protocol)(IP)) 네트워크를 공중 교환 전화 네트워크((Public Switched Telephone Network)(PSTN))와 연결하거나; 네트워크 측은 상호작용 음성 응답((Interactive Voice Response)(IVR)) 기술을 사용하여 음성 호출 연결을 사용자 측과 설정한다. 사용자 측과 음성 호출 연결을 성공적으로 설정할 때(예를 들어, 사용자가 착신 호출에 대답할 때), 네트워크 측은 음성 호출 연결에 기초하여 사용자에게 상기 결정된 음성 검증 정보를 플레이한다. 본 실시예는 네트워크 측에 의해 대응하는 사용자에게 호출을 개시하고 네트워크 측에게 음성 호출 연결을 통해 사용자에게 음성 검증 정보를 플레이하는 특정 구현 방식을 제한하지 않는다.

본 실시예의 네트워크 측은 사용자에게 음성 검증 정보를 성공적으로 플레이할 수 있도록 호출 반복 기능을 제공하며, 예를 들어 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되지 않는 경우에 또는 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되었지만 음성 검증 정보는 성공적으로 플레이되지 않고, 네트워크 측은 사용자를 위해 다시 호출 기능을 수행해야 한다.

네트워크 측에서 호출을 반복하는 특정 예는 네트워크 측이 사용자 음성 통신 번호의 가입 위치를 결정할 수 없으면, 네트워크 측이 사용자 음성 통신 번호에 조정을 수행(예를 들어, 현재 호출에 대응하는 특정 실패 이유에 기초하여 사용자 음성 통신 번호를 조정하는 법을 결정)하고, 조정 후에 사용자를 호출하는 동작을 재수행할 수 있고; 예를 들어, 네트워크 측이 사용자 음성 통신 번호 전에 0을 다이얼링하고, 사용자를 다시 호출하고; 다른 예에 대해, 네트워크 측이 사용자 음성 통신 번호 전에 추가된 0을 삭제하고, 사용자를 다시 호출하는 것이다.

네트워크 측에서 호출을 반복하는 다른 특정 예는 비정상이 현재 호출에 의해 사용되는 호출자 번호에 발생하면(예를 들어, 호출자 번호가 PSTN 등에 의해 스크리닝되면), 네트워크 측이 다른 호출자 번호를 사용하여 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다. 다시 말하면, 복수의 호출자 번호는 네트워크 측에 제공되고; 네트워크 측이 호출자 번호로부터의 원인으로 인해 사용자와 음성 호출 연결을 성공적으로 설정하지 않는 경우에, 네트워크 측은 호출자 번호를 변경하고, 새로운 호출자 번호를 사용하여 사용자 측과 음성 호출 연결을 다시 설정하려고 시도해야 한다.

네트워크 측에서 호출을 반복하는 추가 특정 예는 네트워크 측이 현재 호출을 위한 사용자 측과 음성 호출 연결을 성공적으로 설정했지만, 연결 중단과 같은 이유로 음성 검증 정보를 성공적으로 플레이하지 않을 때, 네트워크 측이 음성 검증 정보를 성공적으로 플레이할 수 있도록 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다.

S120. 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신한다.

구체적으로, 사용자 측은 음성 검증 요청을 송신한 후에 호출 감시 상태로 진입할 수 있으며, 예를 들어 사용자 측은 검증 서비스를 개시한 후에 호출 감시 상태로 진입하고; 착신 호출이 있는 것을 감시할 때, 사용자 측은 리스닝 동작을 자동으로 수행하고, 기록 서비스 등을 호출함으로써 음성 호출 연결로 플레이되는 오디오 신호를 기록하고; 호출의 종결 시(예를 들어, 호출이 끊김) 사용자 측은 기록 정보를 포함하는 음성 검증 메시지를 네트워크 측에 자동으로 송신하며, 예를 들어 네트워크 측은 기록 정보를 하이퍼텍스트 전송 프로토콜((HyperText Transfer Protocol)(HTTP))을 통해 네트워크 측에 송신하며, 그 결과 네트워크 측은 음성 검증 메시지를 위한 음성 검증 동작을 수행할 수 있다.

다른 호출(검증에 부적절한 호출)에 자동 리스닝 및 기록 동작을 수행하는 것을 회피하기 위해, 본 실시예에서의 사용자 측은 호출 감시된 화이트 리스트를 사전 저장하고, 사용자 측은 감시된 호출의 호출 가입자가 사전 저장된 호출 화이트 리스트 내의 호출 가입자에 속할 때 자동 리스닝 및 자동 기록 동작만을 수행할 것이고; 그렇지 않으면 사용자 측은 자동 리스닝 및 자동 기록 동작을 수행하지 않는다.

사용자 측이 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 수신하면, 사용자 측은 기록 정보를 수신된 식별자와 함께 네트워크 측에 송신할 수 있으며, 예를 들어 사용자 측은 기록 정보 및 식별자를 포함하는 HTTP 기반 음성 검증 메시지를 네트워크 측에 송신한다.

상기 예를 계속하면, 음성 검증 요청을 송신하는 사용자 장비가 사용자 음성 통신 번호에 대응하는 사용자 장비가 아닐 때, 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청을 송신하는 사용자 장비로부터 송신되는 음성 검증 정보에 대응하는 식별자 및 음성 검증 요청을 위한 수신자 정보를 수신한 후에, 음성 검증 요청에서 식별자 및 수신자 정보를 버퍼링하고, 기록 정보를 네트워크 측에 송신할 때 수신자 정보에 기초하여 식별자 및 기록 정보를 함께 네트워크 측에 송신한다.

S130. 네트워크 측에서, 음성 검증 정보 및 기록 정보에 따라 검증 결과를 결정한다.

구체적으로, 네트워크 측은 음성 매칭 동작의 정확도를 증대시키도록 그것에 의해 수신되는 기록된 정보를 사전 처리한 후에 음성 매칭의 동작을 수행할 수 있다. 여기서의 사전 처리는 잡음 감소 처리 및 정규화 처리를 지칭한다.

본 실시예에서 검증 결과를 판단하는 특정 예는 네트워크 측이 수신된 기록 정보와 네트워크 측에 저장되는 각각의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭하는 음성 검증 정보가 네트워크 측에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.

본 실시예에서 검증 결과를 판단하는 다른 특정 예는 네트워크 측이 수신된 기록 정보와 네트워크 측에 의해 이전에 결정된 음성 검증 정보 사이의 음성 매칭을 각각 수행하고, 음성 매칭 결과가 그들이 매칭하는 것일 때 음성 검증이 이때에 성공하는 것으로 판단하는 반면에, 음성 매칭 결과가 그들이 매칭하지 않는 것일 때 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.

네트워크 측이 기록 정보를 수신할 뿐만 아니라, 사용자 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 수신하는 경우에, 본 실시예에서 검증 결과를 판단하는 특정 예는 네트워크가 수신된 식별자에 따라 네트워크 측에 저장되는 모든 음성 검증 정보로부터 음성 검증 정보의 일부를 선정하고, 수신된 기록 정보와 음성 검증 정보의 일부 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭하는 음성 검증 정보가 네트워크 측에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.

네트워크 측은 또한 식별자 및 기록 정보를 사용하여 음성 검증을 수행하고, 예를 들어 사용자로부터 송신되는 식별자가 이전에 결정된 바와 같이 식별자와 매칭하고 기록 정보가 또한 이전에 결정된 바와 같이 음성 검증 정보와 일치하는 것으로 판단하는 경우에 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하기 위해 다른 방식을 채택할 수 있다.

실시예에서 음성 검증 정보에 대응하는 식별자는 음성 검증을 결정하는 프로세스 동안 보조 정보의 역할을 할 수 있고, 예를 들어 그것은 음성 매칭의 시간을 감소시키거나 음성 검증을 결정하는 조건의 역할을 할 수 있다는 점을 설명으로부터 알 수 있다.

본 실시예의 음성 매칭 프로세스는 기록 정보에서 특징을 추출하는 단계, 및 추출된 특징을 음성 검증에서의 특징과 비교하는 단계를 포함할 수 있고; 본 실시예에서의 각각의 음성 검증 정보의 특징은 사전 추출되고 네트워크 측에 저장될 수 있다. 본 실시예의 음성 매칭 프로세스는 또한 기록 정보에 음성 인식을 수행하는 단계, 및 기록 정보에 대한 음성 인식의 결과를 음성 검증 정보에 대한 음성 인식의 결과와 비교하는 단계를 포함할 수 있고; 본 실시예에서의 각각의 음성 검증 정보의 음성 인식 결과는 미리 수행되고 네트워크 측에 저장되는 음성 인식일 수 있다. 물론, 본 실시예는 또한 음성 매칭을 수행하기 위해 다른 음성 매칭 알고리즘을 이용할 수 있다. 본 실시예는 음성 매칭의 특정 구현 방식을 제한하지 않는다.

음성 검증이 성공할 때, 네트워크 측은 후속 처리 절차(예를 들어, 후속 지불 절차 또는 후속 사용자 로그온 절차 등)에 진입할 수 있다. 게다가, 현재 지불 절차가 (성공 또는 실패에 관계없이) 완료되거나 로그온 절차가 (로그온 실패 또는 로그온 성공에 관계없이) 완료될 때, 사용자 측은 사용자 호출을 더 이상 감시하지 않을 수 있으며, 예를 들어 사용자 측은 현재 시작된 감시 서비스 등을 폐쇄한다.

실시예 2: 음성 검증의 방법.

본 실시예는 스마트 이동 전화를 갖는 사용자에 의해 네트워크 지불을 수행하는 일 예를 채택하고, 도 2를 참조하여 본 실시예의 음성 검증 방법을 예시한다. 본 실시예에서, 사용자에 의해 사용되는 스마트 이동 전화의 번호는 네트워크 측에서 사용자에 의해 예약되는 사용자 지불 계정 정보에 대응하는 사용자 음성 통신 번호이다.

도 2에서, 스마트 이동 전화는 사용자 측에 속한다. 무선 지불 클라이언트는 스마트 이동 전화 내에 제공된다. 지불 서버, 호출 센터, 및 음성 매칭 서버는 네트워크 측에 속한다.

본 실시예에서의 무선 지불 클라이언트는 구체적으로 스마트 이동 전화 내의 이동 지불 소프트웨어 개발 키트((Software Development Kit)(SDK)) 또는 APP 제품의 형태일 수 있고; 본 실시예에서의 지불 서버, 호출 센터, 및 음성 매칭 서버는 동일한 세트의 네트워크 장치(예를 들어, 서버)의 중앙에 제공될 수 있거나, 2개 또는 3개의 세트의 상이한 네트워크 장치에 개별적으로 배치될 수 있다. 본 실시예는 무선 지불 클라이언트, 지불 서버, 호출 센터 및 음성 매칭 서버의 특정 표현 형태로 제한되지 않는다.

단계 1: 네트워크 지불 프로세스 동안, 무선 지불 클라이언트는 음성 검증 요청을 개시하고 그것이 위치되는 스마트 이동 전화의 착신 호출을 감시하기 시작하며, 무선 지불 클라이언트는 호출 상태 감시 서비스를 시작함으로써 착신 호출을 감시한다.

단계 2. 무선 지불 클라이언트로부터 음성 검증 요청을 수신할 때, 지불 서버는 음성 검증 요청에 포함된 정보(예를 들어, 사용자 지불 계정 정보)에 따라 그것의 장소에 저장되는 정보(예를 들어, 사용자 지불 계정 정보와 스마트 이동 전화 번호 사이의 한 세트의 대응 관계)로부터 음성 검증 요청에 대응하는 스마트 이동 전화 번호를 검색하고; 지불 서버는 그것이 사전 저장하는 오디오 파일의 한 세트의 식별자로부터 식별자를 랜덤하게 선택하고, 식별자를 무선 지불 클라이언트에 제공한다.

본 실시예에서의 모든 오디오 파일은 지불 서버에 저장되거나 호출 센터에 저장될 수 있다. 물론, 모든 오디오 파일은 또한 지불 서버 및 호출 센터와 독립적으로 다른 위치에 저장될 수 있다.

단계 3. 지불 서버는 대응하는 사용자를 호출 센터를 통해 호출하기 위해 그것이 발견하는 스마트 이동 전화 번호 및 랜덤하게 선택된 식별자를 호출 센터에 제공하고, 식별자에 대응하는 음성 검증 정보를 사용자에게 플레이한다. 지불 서버는 식별자 및 스마트 이동 전화 번호를 호출 센터에 의해 제공되는 웹 서비스 인터페이스를 통해 호출 센터에 제공하는 것에 의해, HTTP 계층 기반 발신 호출 인터페이스 호출을 구현할 수 있다.

단계 4: 호출 센터는 사용자 측의 스마트 이동 전화와 음성 호출 연결을 설정(즉, 호출 링크를 설정)하도록 지불 서버에 의해 제공되는 스마트 이동 전화 번호에 기초하여 호출 동작을 수행한다. 음성 호출 연결이 성공적으로 설정된 후에, 호출 센터는 지불 서버에 의해 제공되는 식별자에 따라 대응하는 음성 검증 정보(예를 들어, 오디오 파일)를 플레이하며, 예를 들어 호출 센터는 식별자에 따라 국부적으로 저장된 오디오 파일로부터 식별자에 대응하는 오디오 파일을 선택하고; 그 다음, 음성 호출 연결이 성공적으로 설정된 후에 오디오 파일을 플레이한다.

단계 5. 스마트 이동 전화 내의 무선 지불 클라이언트는 사용자가 호출되고 호출자가 무선 지불 클라이언트에 저장되는 화이트 리스트에 속하는 것을 감시할 때, 자동 리스닝을 수행하고, 호출 센터에 의해 플레이되는 음성 검증 정보를 기록하도록 자동 기록 동작을 수행한다.

단계 6. 무선 지불 클라이언트는 이러한 호출의 종결 시에, 그것이 기록하는 기록 정보 및 지불 서버에 의해 제공되는 식별자를 HTTP 기반 음성 검증 메시지를 통해 자동으로 업로드한다.

단계 7. 지불 서버는 음성 매칭 서버가 음성 매칭 동작을 수행하는 것을 요청하기 위해 수신된 기록 정보 및 식별자를 함께 음성 매칭 서버에 제공한다. 음성 매칭 서버는 또한 모든 음성 검증 정보를 저장한다. 호출 센터에서의 음성 검증 정보의 모두는 음성 매칭 서버에 저장되는 모든 음성 검증 정보와 동일해야 하며, 예를 들어 그것의 음성 검증 정보를 갱신할 때, 음성 매칭 서버는 호출 센터에서 모든 음성 검증 정보를 동기적으로 갱신해야 한다. 음성 매칭 서버는 수신된 식별자에 따라 모든 음성 검증 정보에서 음성 검증 정보의 일부를 결정하고, 기록 정보와 음성 검증 정보의 일부 사이의 음성 매칭을 하나씩 수행하고, 매칭된 음성 검증 정보 또는 음성 검증 정보의 식별자(예를 들어, 오디오 파일명)를 지불 서버에 제공할 수 있다. 지불 서버는 음성 검증 정보가 이전에 결정된 음성 검증 정보와 일치하는 것으로 판단하거나 또는 음성 매칭 서버로부터 송신되는 식별자가 이전에 결정된 음성 검증 정보의 식별자와 동일한 것으로 판단할 때 이러한 음성 검증이 성공하는 것으로 판단하고; 그렇지 않으면 그것은 이러한 음성 검증이 실패하는 것을 판단한다. 지불 서버는 음성 검증의 결과에 기초하여 후속 지불 흐름을 결정할 수 있다.

이러한 지불 프로세스가 종료된 후에, 무선 지불 클라이언트는 사용자의 착신 호출을 더 이상 감시하지 않지 않아야 하며, 예를 들어 무선 지불 클라이언트는 전화 호출 상태 감시 서비스 등을 폐쇄한다.

실시예 3: 음성 검증 시스템

본 실시예의 음성 검증 시스템의 메인 구조는 도 3에 예시된다.

도 3에서의 음성 검증 시스템은 제어 모듈(311), 호출 모듈(312), 음성 검증 모듈(313), 음성 검증 요청 모듈(321), 및 감시 기록 모듈(322)을 주로 포함하고; 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)은 네트워크 측에 제공되는 반면에, 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 사용자 측에 제공된다.

본 실시예에서의 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)은 네트워크 측에서 동일한 장치로 통합되거나, 네트워크 측에서 2개 또는 3개의 상호 독립 장치에 개별적으로 배치될 수 있다.

본 실시예에서의 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 사용자 측에서 동일한 사용자 장비에 제공될 수 있으며, 예를 들어 둘 다는 사용자의 동일한 스마트 이동 전화에 배치되고; 음성 검증 요청 모듈(321) 및 감시 및 기록 모듈(322)은 또한 2개의 상호 독립 장비에 제공될 수 있으며, 예를 들어 음성 검증 요청 모듈(321)은 PC 머신 또는 태블릿 컴퓨터에 제공되는 반면에, 감시 및 기록 모듈(322)은 스마트 이동 전화 내에 제공된다.

이하, 음성 검증 시스템에 포함되는 각각의 모듈은 이하에 상세히 설명될 것이다.

음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 주로 적응된다.

구체적으로, 검증을 요구하는 응용 시나리오에서, 음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 촉발되며, 예를 들어 사용자 측에서 웹사이트에 로그온하는 절차 중에 음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 작동되고; 다른 예에 대해, 사용자 측에서 네트워크 지불을 수행하는 절차 중에 음성 검증 요청 모듈(321)은 음성 검증 요청을 네트워크 측에 송신하도록 작동된다.

음성 검증 요청 모듈(321)에 의해 네트워크 측에 송신되는 음성 검증 요청은 통상 HTTP 기반 음성 검증 요청이고, 음성 검증 요청은 통상 사용자를 고유하게 특징화할 수 있는 사용자 식별자, 예를 들어 사용자 로그온 계정 또는 사용자 지불 계정 정보 등을 포함한다.

제어 모듈(311)은 사용자 측으로부터 음성 검증 요청에 기초하여 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 주로 적응된다.

구체적으로, 제어 모듈(311)은 사용자에 의해 예약되는 복수의 사용자 음성 통신 번호를 사전 저장한다. 이러한 사용자 음성 통신 번호는 한 세트의 통신 번호를 형성한다. 제어 모듈(311)은 한 세트의 사전 저장된 통신 번호로부터 음성 검증 요청에 대응하는 사용자 음성 통신 번호를 획득할 수 있다. 특정 예로서, 제어 모듈(311)은 사용자 음성 통신 번호와 사용자 식별자(예를 들어, 사용자 로그온 계정 또는 사용자 지불 계정 정보 등; 이하, 설명은 일 예로서 사용자 지불 계정 정보로 이루어질 것임) 사이의 대응 관계를 사전 저장하고, 복수의 대응 관계는 한 세트의 통신 번호를 형성한다. 사용자 측으로부터 음성 검증 요청을 수신할 때, 제어 모듈(311)은 음성 검증 요청으로 운반되는 정보로부터 사용자 지불 계정 정보를 우선 획득할 수 있고; 그 다음, 제어 모듈(311)은 사용자 지불 계정 정보에 대응하는 사용자 음성 통신 번호를 획득하기 위해 사용자 계정 지불 정보를 사용하여 세트에서 대응 관계에 따라 매칭 및 검색을 수행한다. 본 실시예는 제어 모듈(311)에 의해, 음성 검증 요청에 따라 사용자 음성 통신 번호를 획득하는 특정 구현 방식으로 제한되지 않는다.

제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호는 네트워크 측과 사용자 측 사이에 음성 호출 연결을 주로 설정하는 것이다. 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호는 사용자의 이동 전화 번호일 수 있다.

하나의 응용 시나리오에서, 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청 모듈(321)이 위치되는 사용자 장비이다. 다른 응용 시나리오에서, 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 대응하는 사용자 장비는 음성 검증 요청 모듈(321)이 위치되는 사용자 장비가 아니다. 2개의 응용 시나리오의 특정 예는 상기 실시예 1에 설명되었으며, 이는 여기서 반복되지 않을 것이다.

본 실시예에서, 특정 시간 기간(예를 들어, 몇 시간 또는 수십 시간 또는 몇 일) 내에 상이한 음성 검증 요청을 위해 제어 모듈(311)에 의해 결정되는 음성 검증 정보는 통상 반복되지 않는다. 다시 말하면, 제어 모듈(311)은 상이한 음성 검증 요청이 특정 시간 기간 내에 상이한 음성 검증 정보에 대응해야 하는 것을 보장해야 한다.

제어 모듈(311), 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 예는 아래에 제공된다: 네트워크 측은 복수의 오디오 파일을 사전 저장하고, 복수의 오디오 파일의 특징은 서로 크게 다르다. 모든 오디오 파일은 오디오 파일 세트를 형성할 수 있다. 음성 검증 요청을 수신할 때, 제어 모듈(311)은 오디오 파일 세트로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다.

제어 모듈(311)에 의해, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 다른 특정 예는 아래에 제공된다: 제어 모듈(311)은 음성 검증 요청을 수신한 후에, 오디오 파일을 랜덤하게 발생시키고 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용한다. 제어 모듈(311)에 의해 오디오 파일을 랜덤하게 발생시키는 방식은 사전 저장된 오디오 파일로부터 오디오 정보의 작은 세그먼트를 랜덤하게 캡처하는 것에 의해, 새로운 오디오 파일을 발생시킬 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다. 제어 모듈(311)에 의해 오디오 파일을 랜덤하게 발생시키는 방식은 또한 2개 이상의 사전 저장된 오디오 파일을 새로운 오디오 파일로 랜덤하게 조합할 수 있으며, 그 새로운 오디오 파일은 단지 랜덤하게 발생된 오디오 파일이다.

본 실시예는 제어 모듈(311)이 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 특정 구현 방식, 오디오 파일의 특정 포맷, 또는 제어 모듈(311)이 오디오 파일을 랜덤하게 발생시키는 특정 구현 방식에 제한을 갖지 않는다.

본 실시예의 음성 검증 정보는 음악 음성 검증 정보를 플레이하거나 음성 검증 정보를 수 및/또는 알파벳 및/또는 단어 및/또는 한자의 형태로 플레이하기 위해 사용될 수 있다. 게다가, 음성 검증 정보를 플레이하는 시간 길이는 통상 매우 짧으며, 예를 들어 일반적으로 1 내지 5초이다. 본 실시예는 음성 검증 정보에 의해 플레이되는 특정 콘텐츠 또는 음성 검증 정보를 플레이하는 시간 길이를 제한하지 않는다.

본 실시예에서, 모든 음성 검증 정보는 대응하는 고유 식별자를 가지며, 즉 하나의 음성 검증 정보는 하나의 식별자를 사용하여 고유하게 결정될 수 있다. 식별자는 음성 검증 정보의 식별자로 지칭될 수 있다. 음성 검증 정보에 대응하는 식별자는 구체적으로 오디오 파일의 파일명 또는 오디오 파일의 파일명 및 저장 경로의 조합, 또는 오디오 파일의 인덱스 값, 또는 랜덤 발생 알고리즘을 사용하여 랜덤하게 발생되는 식별자일 수 있다. 본 실시예는 음성 검증 정보의 식별자의 특정 표현 형태로 제한되지 않는다.

본 실시예에서의 음성 검증 정보의 식별자는 검증 프로세스(예를 들어, 지불 검증 프로세스)를 위해 사용될 수 있으며; 음성 매칭 알고리즘에 식별자를 추가함으로써 음성 검증 결과의 정확도가 더 보장될 수 있다.

일 실시예에서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 동안, 제어 모듈(311)은 또한 음성 검증 정보에 대응하는 식별자를 획득하며, 예를 들어, 오디오 파일의 파일명 또는 인덱스 값을 음성 검증 정보로 획득하고, 다른 예에 대해, 오디오 파일의 파일명 및 저장 경로를 음성 검증 정보로 획득하는 것 등일 수 있고; 그 다음, 제어 모듈(311)은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있다. 통상의 상황에서, 제어 모듈(311)은 결정된 음성 검증 정보에 대응하는 식별자를 음성 검증 요청 모듈(321)에 제공할 수 있다. 음성 검증 요청 모듈(321)은 제어 모듈(311)로부터 송신되는 음성 검증 정보에 대응하는 식별자를 감시 기록 모듈(322)에 제공해야 하고; 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)이 동일한 사용자 장비에서 제공되지 않는 경우에, 음성 검증 요청 모듈(321)은 음성 검증 정보에 대응하는 식별자를 Wi-Fi 또는 블루투스와 같은 무선 송신 방식을 통해 감시 기록 모듈(322)에 제공할 수 있으며; 음성 검증 요청 모듈(321)은 또한 2차원 코드를 디스플레이할 수 있으며, 그 결과 감시 기록 모듈(322)은 2차원 코드를 스캐닝함으로써 음성 검증 정보에 대응하는 식별자를 획득할 수 있고; 물론, 음성 검증 요청 모듈(321)은 또한 제어 모듈(311)로부터 송신되는 음성 검증 정보에 대응하는 식별자를 감시 기록 모듈(322)에 제공하기 위해 다른 편리한 송신 방식을 채택할 수 있고; 게다가, 음성 검증 요청 모듈(321)은 식별자를 송신할 때, 또한 음성 검증 요청을 위한 수신자 정보를 감시 기록 모듈(322)에 제공할 수 있으며, 그 결과 감시 기록 모듈(322)은 후속 기록으로부터 획득되는 기록 정보를 위한 수신자를 인식할 수 있다. 본 실시예는 음성 검증 요청 모듈(321)이 네트워크 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 감시 기록 모듈(322)에 어떻게 제공하는지에 관한 특정 구현 방식을 제한하지 않는다.

실제 응용 시나리오에서, 본 실시예의 제어 모듈(311)은 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공할 수 있지만, 그것은 본 실시예의 제어 모듈(311)이 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공해야 하는 것을 의미하지 않으며, 즉 제어 모듈(311)이 음성 검증 정보에 대응하는 식별자를 사용자 측에 제공하지 않을 때, 본 실시예의 검증 절차가 또한 절대적으로 구현될 수 있다는 점을 특히 주목해야 한다.

호출 모듈(312)은 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이하도록 주로 적응된다.

구체적으로, 호출 모듈(312)은 사용자 음성 통신 번호에 따라 호출 동작을 수행함으로써 네트워크 측과 사용자 측 사이에 음성 호출 연결(즉, 음성 링크)을 설정한다. 호출 모듈(312)은 기존 호출 방식을 이용하는 사용자 측과 음성 호출 연결을 설정할 수 있으며, 예를 들어 호출 모듈(312)은 IP 네트워크가 PSTN에 연결될 때 IVR 기술을 사용하여 사용자 측과 음성 호출 연결을 설정한다.

사용자 측에서 음성 호출 연결을 성공적으로 설정하는 경우(예를 들어, 사용자가 착신 호출에 대답하는 경우), 호출 모듈(312)은 음성 호출 연결에 기초하여 사용자에게 상기 결정되는 음성 검증 정보를 플레이한다. 본 실시예는 호출 모듈(312)에 의해, 대응하는 사용자에게 호출을 개시하고, 및 호출 모듈(312)에 의해, 음성 호출 연결을 통해 사용자에게 음성 검증 정보를 플레이하는 특정 구현 방식을 제한하지 않는다.

호출 모듈(312)은 사용자에게 음성 검증 정보를 성공적으로 플레이하도록 호출 반복 기능을 제공하며, 예를 들어 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되지 않는 경우나 음성 호출 연결이 사용자의 현재 호출에 대해 성공적으로 설정되었지만 음성 검증 정보는 성공적으로 플레이되지 않는 경우에, 호출 모듈(312)은 사용자를 위해 호출 기능을 재수행해야 한다.

호출 모듈(312)에 의해 호출을 반복하는 특정 예는 호출 모듈(312)이 사용자 음성 통신 번호의 가입 위치를 결정할 수 없으면, 호출 모듈(312)이 사용자 음성 통신 번호를 조정(예를 들어, 현재 호출에 대응하는 특정 실패 이유에 기초하여 사용자 음성 통신 번호를 조정하는 법을 결정)할 수 있고, 조정 후에, 호출 모듈(312)이 사용자를 호출하는 동작을 다시 수행하고; 예를 들어, 호출 모듈(312)이 사용자 음성 통신 번호 전에 0을 다이얼링하고 그 다음에 사용자를 다시 호출하고; 다른 예에 대해, 호출 모듈(312)이 사용자 음성 통신 번호 전에 0을 삭제하고 그 다음에 사용자를 다시 호출하는 것이다.

호출 모듈(312)에 의해 호출을 반복하는 다른 특정 예는 비정상이 현재 호출을 위한 호출 모듈(312)에 의해 사용되는 호출자 번호에 발생하면(예를 들어, 호출자 번호가 PSTN에 의해 스크리닝되면), 호출 모듈(312)이 다른 호출자 번호를 사용하여 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다. 다시 말하면, 복수의 호출자 번호는 호출 모듈(312)에 제공되고; 호출 모듈(312)이 호출자 번호로부터의 원인으로 인해 사용자 측과 음성 호출 연결을 성공적으로 설정하지 않는 경우에, 호출 모듈(312)은 호출자 번호를 변경하고, 새로운 호출자 번호를 사용하여 사용자 측과 음성 호출 연결을 다시 설정하려고 시도해야 한다.

호출 모듈(312)에 의해 호출을 반복하는 추가 특정 예는 사용자 측과의 음성 호출 연결이 현재 호출에 대해 성공적으로 설정되었지만 음성 검증 정보가 연결 중단과 같은 원인으로 인해 성공적으로 플레이되지 않는 경우에 호출 모듈(312)이 음성 검증 정보를 성공적으로 플레이할 수 있도록 사용자를 호출하는 동작을 다시 수행할 수 있는 것이다.

감시 기록 모듈(322)은 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시할 때 음성 검증 요청을 위한 네트워크 측에 의해 플레이되는 음성 인증 정보를 획득하기 위해 자동 리스닝 및 기록 동작을 수행하도록 주로 적응되고; 호출의 종결 시에, 감시 기록 모듈(322)은 음성 검증 모듈(313)이 기록 정보에 따라 음성 검증을 수행할 수 있도록 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신한다.

구체적으로, 감시 기록 모듈(322)은 음성 검증 요청 모듈(321)이 음성 검증 요청을 송신한 후에 호출 감시 상태로 진입할 수 있으며, 예를 들어 감시 기록 모듈(322)은 검증 서비스를 개시한 후에 호출 감시 상태로 진입하고; 착신 호출이 감시될 때, 감시 기록 모듈(322)은 리스닝 동작을 자동으로 수행하고, 기록 서비스 등을 호출함으로써 음성 호출 연결로 플레이되는 오디오 신호를 기록하고; 현재 호출의 종결 시에(예를 들어, 호출이 끊김), 감시 기록 모듈(322)은 기록 정보를 포함하는 음성 검증 메시지를 네트워크 측(예를 들어, 제어 모듈(311))에 자동으로 송신하며, 예를 들어 감시 기록 모듈(322)은 기록 정보를 HTTP를 통해 제어 모듈(311)에 송신하고, 제어 모듈(311)은 기록 정보를 음성 검증 모듈(313)에 제공하며, 그 결과 음성 검증 모듈(313)은 음성 검증 메시지를 위한 음성 검증 동작을 수행할 수 있다.

다른 호출(검증에 부적절한 호출)에 자동 리스닝 및 기록 동작을 수행하는 것을 회피하기 위해, 감시 기록 모듈(322)은 호출 감시된 화이트 리스트를 사전 저장하고, 감시 기록 모듈(322)은 감시된 호출의 호출 가입자가 사전 저장된 화이트 리스트 내의 호출 가입자일 때 자동 리스닝 및 자동 기록 동작만을 수행할 수 있고; 그렇지 않으면 감시 기록 모듈(322)은 자동 리스닝 및 자동 기록 동작을 수행하지 않는다.

감시 기록 모듈(322)이 음성 검증 정보에 대응하는 식별자를 수신할 때, 감시 기록 모듈(322)은 기록 정보를 수신된 식별자와 함께 제어 모듈(311)에 송신할 수 있으며, 예를 들어 감시 기록 모듈(322)은 기록 정보 및 식별자를 포함하는 HTTP 기반 음성 검증 메시지를 제어 모듈(311)에 송신한다.

상기 예를 계속 설명하면, 음성 검증 요청 모듈(321)이 위치되는 사용자 장비는 감시 기록 모듈이 위치되는 사용자 장비가 아닐 때, 감시 기록 모듈(322)은 음성 검증 요청 모듈(321)로부터 송신되는 음성 검증 정보에 대응하는 식별자 및 음성 검증 요청을 위한 수신자 정보를 수신한 후에, 식별자 및 음성 검증 요청을 위한 수신자 정보를 버퍼링하고, 제어 모듈(311)에 기록 정보의 송신 시에, 식별자 및 기록 정보를 함께 수신자 정보에 기초하여 제어 모듈(311)에 송신한다.

음성 검증 모듈(313)은 음성 검증 정보 및 사용자 측으로부터의 기록 정보에 따라 음성 검증 결과를 결정하도록 주로 적응된다.

구체적으로, 음성 검증 모듈(313)은 음성 매칭 동작의 정확도를 증대시키도록, 그것이 수신하는 기록 정보(예를 들어, 제어 모듈(311)로부터 송신되는 기록 정보)를 사전 처리한 후에 음성 매칭 동작을 수행할 수 있다. 사전 처리는 여기서 잡음 감소 처리 및 정규화 처리를 지칭한다.

음성 검증 모듈(313)에 의해, 검증 결과를 판단하는 특정 예는 음성 검증 모듈(313)이 수신된 기록 정보와 국부적으로 저장되는 각각의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭하는 음성 검증 정보가 제어 모듈(311)에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 판단하는 것이다.

음성 검증 모듈(313)에 의해, 검증 결과를 판단하는 다른 특정 예는 음성 검증 모듈(313)이 수신된 기록 정보와 제어 모듈(311)에 의해 이전에 결정된 음성 검증 정보 사이의 음성 매칭을 수행하고, 음성 매칭 결과가 그들이 매칭하는 것일 때 음성 검증이 이때에 성공하는 것으로 음성 검증 모듈(313)이 판단하는 반면에, 음성 매칭 결과가 그들이 매칭하지 않는 것일 때 음성 검증이 이때에 실패하는 것으로 음성 검증 모듈(313)이 판단하는 것이다.

음성 검증 모듈(313)이 기록 정보를 수신할 뿐만 아니라, 사용자 측으로부터 송신되는 음성 검증 정보에 대응하는 식별자를 수신하는 경우에, 음성 검증 모듈(313)에 의해, 검증 결과를 판단하는 특정 예는 음성 검증 모듈(313)이 국부적으로 저장되는 모든 음성 검증 정보로부터 음성 검증 정보의 일부를 선정하고, 수신된 기록 정보와 음성 검증 정보의 일부 사이의 음성 매칭을 각각 수행하고, 기록 정보와 매칭되는 음성 검증 정보가 제어 모듈(311)에 의해 이전에 결정된 음성 검증 정보일 때 음성 검증이 이때에 성공하는 것으로 음성 검증 모듈(313)이 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 음성 검증 모듈(313)이 판단하는 것이다.

음성 검증 모듈(313)은 또한 식별자 및 기록 정보를 사용하여 음성 검증을 수행하고, 예를 들어 사용자로부터 송신되는 식별자가 이전에 결정된 식별자와 매칭하고 기록 정보가 또한 이전에 결정된 바와 같이 음성 검증 정보와 매칭하는 경우에 음성 검증이 이때에 성공하는 것으로 음성 검증 모듈(313)이 판단하고; 그렇지 않으면 음성 검증이 이때에 실패하는 것으로 음성 검증 모듈(313)이 판단하기 위해 다른 방식을 채택할 수 있다.

실시예에서 음성 검증 정보에 대응하는 식별자는 음성 검증을 결정하는 프로세스 동안 보조 정보의 역할을 할 수 있으며, 예를 들어 그것은 음성 매칭의 시간을 감소시키거나 음성 검증을 결정하는 조건의 역할을 할 수 있는 점을 상기 설명으로부터 알 수 있다.

음성 검증 모듈(313)의 음성 매칭 프로세스는 기록 정보에서 특징을 추출하는 단계, 및 추출된 특징을 음성 검증 내의 특징과 비교하는 단계를 포함할 수 있고; 본 실시예에서의 각각의 음성 검증 정보의 특징은 사전 추출되고 음성 검증 모듈(313)에 국부적으로 저장될 수 있다. 음성 검증 모듈(313)의 음성 매칭 프로세스는 또한 기록 정보에 음성 인식을 수행하는 단계, 및 기록 정보의 음성 인식 결과를 음성 검증 정보의 음성 인식 결과와 비교하는 단계를 포함할 수 있고; 실시예에서의 각각의 음성 검증 정보의 음성 인식 결과는 미리 수행되고 네트워크 측에 저장되는 음성 인식일 수 있다. 물론, 음성 검증 모듈(313)은 또한 음성 매칭을 수행하기 위해 다른 음성 매칭 알고리즘을 이용할 수 있다. 본 실시예는 음성 검증 모듈(313)에 의해 수행되는 음성 매칭의 특정 구현 방식을 제한하지 않는다.

음성 검증이 성공할 때, 네트워크 측(예를 들어, 제어 모듈(311))은 후속 처리 절차(예를 들어, 후속 지불 절차 또는 후속 사용자 로그온 절차 등)에 진입할 수 있다. 게다가, 현재 지불 절차가 (성공 또는 실패에 관계없이)가 완료되거나 로그온 절차가 (로그온 실패 또는 로그온 성공에 관계없이) 완료될 때, 감시 기록 모듈(322)은 사용자 호출을 더 이상 감시하지 않을 수 있으며, 예를 들어 감시 기록 모듈(322)은 현재 시작된 감시 서비스를 폐쇄한다.

실시예 4: 음성 검증 장치.

음성 검증 장치의 메인 구조가 도 4에 도시된다.

도 4에서의 음성 검증 장치는 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)을 포함하며, 그들은 네트워크 측에 제공된다. 제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)은 네트워크 측에서 동일한 장치에 통합되거나, 네트워크 측에서 2개 또는 3개의 상호 독립 장치에 개별적으로 배치될 수 있다.

제어 모듈(311)은 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 주로 적응된다.

호출 모듈(312)은 제어 모듈(311)에 의해 획득되는 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우에 사용자에게 음성 검증 정보를 플레이하도록 주로 적응된다.

음성 검증 모듈(313)은 제어 모듈(311)에 의해 결정되는 음성 검증 정보 및 사용자 측으로부터의 기록 정보에 따라 음성 검증 결과를 판단하도록 주로 적응된다.

제어 모듈(311), 호출 모듈(312), 및 음성 검증 모듈(313)에 의해 수행되는 특정 동작은 상기 실시예 2 및 실시예 3에 설명되었고; 실시예 2에 대해, 제어 모듈(311)은 지불 서버에 제공될 수 있고; 호출 모듈(312)은 호출 센터에 제공될 수 있는 반면에, 음성 검증 모듈(313)은 음성 매칭 서버 및 지불 서버에 제공될 수 있으며(즉, 음성 검증 모듈(313)의 음성 매칭 부분은 음성 매칭 서버에 의해 실행되는 반면에, 지불 서버는 음성 매칭 결과에 따라 음성 검증 결과 부분의 판단을 실행함), 이는 반복해서 설명되지 않을 것이다.

실시예 5 음성 검증 장치

본 실시예에서의 음성 검증 모듈의 메인 구조는 도 5에 예시된다.

도 5에서의 음성 검증 모듈은 음성 검증 요청 모듈 및 감시 기록 모듈(322)을 포함하며, 그들은 사용자 측에 제공된다.

본 실시예에서의 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 사용자 측에서 동일한 사용자 장비에 제공될 수 있으며, 예를 들어 그들은 하나의 스마트 이동 전화에 제공되고; 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)은 또한 2개의 상호 독립 장치 각각에 제공될 수 있으며, 예를 들어 음성 검증 요청 모듈(321)은 PC 또는 태블릿 컴퓨터에 제공되는 반면에, 감시 기록 모듈(322)은 스마트 이동 전화 내에 제공된다.

감시 기록 모듈(322)은 네트워크 측으로부터 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시할 때, 음성 검증 요청에 응답하여 네트워크 측에 의해 플레이되는 음성 검증 정보를 획득하기 위해 자동 픽업 및 기록 동작을 수행하도록 주로 적응되고; 호출의 종결 시에, 감시 기록 모듈(322)은 네트워크 측이 기록 정보에 따라 음성 검증을 수행할 수 있도록 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신한다.

음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)에 의해 수행되는 특정 동작은 실시예 2 및 실시예 3에 설명되었고; 음성 검증 요청 모듈(321) 및 감시 기록 모듈(322)의 특정 예는 실시예 2에서의 무선 지불 클라이언트이며, 이는 여기서 반복해서 설명되지 않을 것이다.

본 개시는 소프트웨어 또는 소프트웨어 및 하드웨어의 조합으로 구현될 수 있고; 예를 들어, 그것은 전용 집적 회로(ASIC), 범용 컴퓨터, 또는 임의의 다른 유사한 하드웨어 장치에 구현될 수 있다는 점을 주목해야 한다. 일 실시예에서, 본 개시의 소프트웨어 프로그램은 상기 단계 또는 기능을 구현하도록 프로세서에 의해 실행될 수 있다. 마찬가지로, 본 개시의 소프트웨어 프로그램(관련 데이터 구조를 포함함)은 컴퓨터 판독 가능 기록 매체, 예를 들어 RAM 메모리, 자기 또는 광 드라이버, 또는 플로피 디스크, 및 유사한 장치에 저장될 수 있다. 게다가, 본 개시의 기능의 일부 단계는 다양한 기능 또는 단계를 실행하도록 하드웨어, 예를 들어 프로세서와 협력하는 회로에 의해 구현될 수 있다.

본 개시는 상기 예시적 실시예의 상세로 제한되지 않고, 본 개시는 본 개시의 사상 또는 기본 특징으로부터 벗어나지 않으면서 다른 형태로 구현될 수 있다는 점이 당업자에게 명백하다. 따라서, 어떠한 방식으로도, 실시예는 예시적인 것으로 간주되고 제한적인 것으로 간주되지 않아야 하고; 본 개시의 범위는 상기 설명 대신 첨부된 청구항에 의해 제한된다. 따라서, 청구항의 균등 요소의 의미 및 범위에 들어가도록 의도되는 모든 변형은 본 개시 내에서 포괄되어야 한다. 청구항 내의 참조 부호는 관련된 청구항을 제한하는 것으로 간주되지 않아야 한다. 아울러, 용어 "포함한다/포함하는/구비한다/구비하는"은 다른 유닛 또는 단계를 배제하지 않고 단수는 복수를 배제하지 않는다는 점이 명백하다. 장치 청구항에 명시되는 복수의 유닛 또는 수단은 또한 소프트웨어 또는 하드웨어를 통해 단일 유닛 또는 수단에 의해 구현될 수 있다. 제 1 및 제 2와 같은 용어는 명칭을 표시하기 위해 사용되지만 임의의 특정 시퀀스를 표시하지는 않는다.

예시적 실시예가 구체적으로 예시되고 설명되었지만, 당업자는 청구범위의 사상 및 범위로부터 벗어나는 것 없이 그것의 형태 및 상세가 다소 변경될 수 있는 점을 이해할 것이다. 여기서, 추구되는 바와 같은 보호는 첨부된 청구범위에 정의된다. 각각의 실시예의 이러한 그리고 다른 양태는 이하의 번호가 부여된 절에 규정된다:

1. 네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;

네트워크 측에서, 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 결정된 음성 검증 정보를 사용자에게 플레이하는 단계;

사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하는 단계;

네트워크 측에서, 음성 검증 정보 및 기록 정보에 따라 검증 결과를 판단하는 단계를 포함하는 음성 검증 방법.

2. 절 1에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,

복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계; 또는

음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계를 더 포함하는 음성 검증 방법.

3. 절 1에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,

음성 검증 정보의 식별을 획득하고, 식별자를 사용자 측에 제공하는 단계를 더 포함하고;

기록으로부터 획득되는 기록 정보를 네트워트 측에 송신하는 단계는,

기록으로부터 획득되는 기록 정보 및 식별자를 함께 네트워크 측에 송신하는 단계를 포함하는 음성 검증 방법.

4. 절 3에 있어서, 음성 검증 정보 및 기록 정보에 따라 음성 검증 결과를 결정하는 단계는,

수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 기록 정보와 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하는 단계;

기록 정보와 매칭하는 음성 검증 정보가 음성 검증 요청에 대응하는 음성 검증 정보인 하는 경우 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 음성 검증이 실패하는 것으로 판단하는 단계를 포함하는 음성 검증 방법.

5. 절 1 내지 절 4 중 어느 한 절에 있어서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계는,

사용자가 호출되고 호출 가입자가 화이트 리스트 내의 호출 가입자에 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계를 포함하는 음성 검증 방법.

6. 음성 검증 요청을 네트워크 측에 송신하는 단계;

네트워크 측으로부터 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시하는 경우에, 음성 검증 요청에 응답하여 네트워크에 의해 수행되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하는 단계;

호출의 종결 시에, 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하며, 그 결과 네트워크 측은 기록 정보에 따라 음성 검증을 수행하는 단계를 포함하는 음성 검증 방법.

7. 절 6에 있어서,

네트워크 측으로부터 송신되는 음성 검증 정보의 식별자를 수신하는 단계를 더 포함하고;

기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하는 단계는,

기록으로부터 획득되는 기록 정보 및 식별자를 함께 네트워크 측에 송신하는 단계를 포함하고;

식별자는 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 방법.

8. 절 6 또는 절 7에 있어서, 사용자가 호출되는 것을 감시하는 경우에 자동 리스닝 및 기록 동작을 수행하는 단계는,

9. 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;

사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 사용자에게 음성 검증 정보를 플레이하는 단계;

음성 검증 정보 및 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하는 단계를 포함하고, 기록 정보는 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 방법.

10. 절 9에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,

음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계를 포함하는 음성 검증 방법.

11. 절 9 또는 절 10에 있어서, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,

음성 검증 정보의 식별자를 획득하고, 식별자를 사용자 측에 제공하는 단계를 더 포함하고;

12. 절 11에 있어서, 음성 검증 정보 및 기록 정보에 따라 음성 검증 결과를 결정하는 단계는,

13. 사용자 측에서 제공되는 음성 검증 장치로서,

음성 검증 요청을 네트워크 측에 송신하도록 적응되는 음성 검증 요청 모듈;

네트워크 측으로부터 사용자로의 호출을 감시하고, 사용자가 호출되는 것을 감시하는 경우 음성 검증 요청에 응답하여 네트워크 측에 의해 플레이되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하고, 호출의 종결 시에 기록으로부터 획득되는 기록 정보를 네트워크 측에 송신하며, 그 결과 네트워크 측은 기록 정보에 따라 음성 검증을 수행하도록 적응되는 감시 기록 모듈을 포함하는 음성 검증 장치.

14. 절 13에 있어서, 음성 검증 요청 모듈은 또한,

네트워크 측으로부터 송신되는 음성 검증 정보의 식별자를 수신하도록 적응되고;

감시 기록 모듈은,

기록으로부터 획득되는 기록 정보 및 식별자를 함께 네트워크 측에 송신하도록 특히 적응되고;

식별자는 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 장치.

15. 절 13 또는 절 14에 있어서, 감시 기록 모듈은,

사용자가 호출되고 호출 가입자가 화이트 리스트 내의 호출 가입자에 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하도록 특히 적응되는 음성 검증 장치.

16. 네트워크 측에서 제공되는 음성 검증 장치로서,

사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 적응되는 제어 모듈;

사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우에, 사용자에게 음성 검증 정보를 플레이하도록 적응되는 호출 모듈;

음성 검증 정보 및 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하도록 적응되는 음성 검증 모듈을 포함하고, 기록 정보는 사용자 측에서, 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 장치.

17. 절 16에 있어서, 제어 모듈은,

복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 랜덤하게 선택된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하거나;

음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 랜덤하게 발생된 오디오 파일을 음성 검증 요청에 대응하는 음성 검증 정보로 사용하도록 특히 적응되는 음성 검증 장치.

18. 절 16 또는 절 17에 있어서, 제어 모듈은,

음성 검증 정보의 식별자를 획득하고, 식별자를 사용자 측에 제공하도록 더 적응되고;

제어 모듈은 사용자 측으로부터 기록 정보 및 식별자를 수신하도록 특히 적응되는 음성 검증 장치.

19. 절 18에 있어서, 음성 검증 모듈은,

수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 기록 정보와 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고;

기록 정보와 매칭하는 음성 검증 정보가 음성 검증 요청에 대응하는 음성 검증 정보인 것으로 판단하는 경우 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 음성 검증이 실패하는 것으로 판단하도록 특히 적응되는 음성 검증 장치.

20. 절 13 내지 절 15 중 어느 하나에 따른 장치 및 절 16 내지 절 19 중 어느 하나에 따른 장치를 포함하는 음성 검증 시스템.

Claims

네트워크 측에서, 사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;
상기 네트워크 측에서, 상기 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 상기 결정된 음성 검증 정보를 상기 사용자에게 플레이하는 단계;
상기 사용자 측에서, 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하고, 상기 호출의 종결 시 상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하는 단계;
상기 네트워크 측에서, 상기 음성 검증 정보 및 상기 기록 정보에 따라 검증 결과를 판단하는 단계를 포함하는 음성 검증 방법.
제1항에 있어서,
상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 상기 랜덤하게 선택된 오디오 파일을 상기 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계; 또는
상기 음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 상기 랜덤하게 발생된 오디오 파일을 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보로 사용하는 단계를 더 포함하는 음성 검증 방법.
제1항에 있어서,
상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
상기 음성 검증 정보의 식별을 획득하고, 상기 식별자를 상기 사용자 측에 제공하는 단계를 더 포함하고;
상기 기록으로부터 획득되는 기록 정보를 상기 네트워트 측에 송신하는 단계는,
상기 기록으로부터 획득되는 상기 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하는 단계를 포함하는 음성 검증 방법.
제3항에 있어서,
상기 음성 검증 정보 및 상기 기록 정보에 따라 음성 검증 결과를 판단하는 단계는,
상기 수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 상기 기록 정보와 상기 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하는 단계;
상기 기록 정보와 매칭하는 상기 음성 검증 정보가 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보인 것으로 판단하는 경우에 상기 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 상기 음성 검증이 실패하는 것으로 판단하는 단계를 포함하는 음성 검증 방법.
제1항 내지 제4중 어느 한 항에 있어서, 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계는,
상기 사용자가 호출되고 화이트 리스트 내의 호출 가입자에 상기 호출 가입자가 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계를 포함하는 음성 검증 방법.
음성 검증 요청을 네트워크 측에 송신하는 단계;
상기 네트워크 측으로부터 사용자로의 호출을 감시하고, 상기 사용자가 호출되는 것을 감시하는 경우 상기 음성 검증 요청에 응답하여 상기 네트워크에 의해 수행되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하는 단계;
상기 호출의 종결 시에, 상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하며, 그 결과 상기 네트워크 측은 상기 기록 정보에 따라 음성 검증을 수행하는 단계를 포함하는 음성 검증 방법.
제6항에 있어서,
상기 네트워크 측으로부터 송신되는 상기 음성 검증 정보의 식별자를 수신하는 단계를 더 포함하고;
상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하는 단계는,
상기 기록으로부터 획득되는 상기 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하는 단계를 포함하고;
상기 식별자는 상기 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 방법.
제6항 또는 제7항에 있어서,
상기 사용자가 호출되는 것을 감시하는 경우 자동 리스닝 및 기록 동작을 수행하는 단계는,
상기 사용자가 호출되고 화이트 리스트 내의 호출 가입자에 상기 호출 가입자가 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 단계를 포함하는 음성 검증 방법.
사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계;
상기 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 상기 사용자에게 상기 음성 검증 정보를 플레이하는 단계;
상기 음성 검증 정보 및 상기 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하는 단계를 포함하고, 상기 기록 정보는 상기 사용자 측에서 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 방법.
제9항에 있어서,
상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 상기 랜덤하게 선택된 오디오 파일을 상기 음성 검증 요청에 대응하는 음성 검증 정보로 사용하는 단계; 또는
상기 음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 상기 랜덤하게 발생된 오디오 파일을 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보로 사용하는 단계를 포함하는 음성 검증 방법.
제9항 또는 제10항에 있어서,
상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하는 단계는,
상기 음성 검증 정보의 식별자를 획득하고, 상기 식별자를 상기 사용자 측에 제공하는 단계를 더 포함하고;
상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하는 단계는,
상기 기록으로부터 획득되는 상기 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하는 단계를 포함하는 음성 검증 방법.
제11항에 있어서,
상기 음성 검증 정보 및 상기 기록 정보에 따라 음성 검증 결과를 판단하는 단계는,
상기 수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 상기 기록 정보와 상기 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하는 단계;
상기 기록 정보와 매칭하는 상기 음성 검증 정보가 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보인 것으로 판단하는 경우에 상기 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 상기 음성 검증이 실패하는 것으로 판단하는 단계를 포함하는 음성 검증 방법.
사용자 측에서 제공되는 음성 검증 장치로서,
음성 검증 요청을 네트워크 측에 송신하도록 적응되는 음성 검증 요청 모듈;
상기 네트워크 측으로부터 사용자로의 호출을 감시하고, 상기 사용자가 호출되는 것을 감시하는 경우 상기 음성 검증 요청에 응답하여 상기 네트워크 측에 의해 플레이되는 음성 검증 정보를 획득하도록 자동 리스닝 및 기록 동작을 수행하고, 상기 호출의 종결 시에 상기 기록으로부터 획득되는 기록 정보를 상기 네트워크 측에 송신하며, 그 결과 상기 네트워크 측은 상기 기록 정보에 따라 음성 검증을 수행하도록 적응되는 감시 기록 모듈을 포함하는 음성 검증 장치.
제13항에 있어서,
상기 음성 검증 요청 모듈은 또한,
상기 네트워크 측으로부터 송신되는 상기 음성 검증 정보의 식별자를 수신하도록 적응되고;
상기 감시 기록 모듈은,
상기 기록으로부터 획득되는 기록 정보 및 상기 식별자를 함께 상기 네트워크 측에 송신하도록 특히 적응되고;
상기 식별자는 상기 기록 정보와 함께 음성 검증을 수행하기 위한 것인 음성 검증 장치.
제13항 또는 제14항에 있어서,
상기 감시 기록 모듈은,
상기 사용자가 호출되고 화이트 리스트 내의 호출 가입자에 상기 호출 가입자가 속하는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하도록 특히 적응되는 음성 검증 장치.
네트워크 측에서 제공되는 음성 검증 장치로서,
사용자 측으로부터 음성 검증 요청에 따른 사용자 음성 통신 번호를 획득하고, 상기 음성 검증 요청에 대응하는 음성 검증 정보를 결정하도록 적응되는 제어 모듈;
상기 사용자 음성 통신 번호에 따라 대응하는 사용자에게 호출을 개시하고, 호출 연결의 경우 상기 사용자에게 상기 음성 검증 정보를 플레이하도록 적응되는 호출 모듈;
상기 음성 검증 정보 및 상기 사용자 측으로부터 수신되는 기록 정보에 따라 음성 검증 결과를 판단하도록 적응되는 음성 검증 모듈을 포함하고, 상기 기록 정보는 상기 사용자 측에서 상기 사용자가 호출되는 것을 감시할 때 자동 리스닝 및 기록 동작을 수행하는 것으로부터 획득되는 정보를 지칭하는 음성 검증 장치.
제16항에 있어서,
상기 제어 모듈은,
복수의 사전 설정 오디오 파일로부터 오디오 파일을 랜덤하게 선택하고, 상기 랜덤하게 선택된 오디오 파일을 상기 음성 검증 요청에 대응하는 음성 검증 정보로 사용하거나;
상기 음성 검증 요청을 위한 오디오 파일을 랜덤하게 발생시키고, 상기 랜덤하게 발생된 오디오 파일을 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보로 사용하도록 특히 적응되는 음성 검증 장치.
제16항 또는 제17항에 있어서,
상기 제어 모듈은,
상기 음성 검증 정보의 식별자를 획득하고, 상기 식별자를 상기 사용자 측에 제공하도록 더 적응되고;
상기 제어 모듈은 상기 사용자 측으로부터 상기 기록 정보 및 상기 식별자를 수신하도록 특히 적응되는 음성 검증 장치.
제18항에 있어서,
상기 음성 검증 모듈은,
상기 수신된 식별자에 따라 복수의 음성 검증 정보를 선택하고, 상기 기록 정보와 상기 선택된 복수의 음성 검증 정보 사이의 음성 매칭을 각각 수행하고;
상기 기록 정보와 매칭하는 상기 음성 검증 정보가 상기 음성 검증 요청에 대응하는 상기 음성 검증 정보인 것으로 판단하는 경우 상기 음성 검증이 성공하는 것으로 판단하고, 그렇지 않으면 상기 음성 검증이 실패하는 것으로 판단하도록 특히 적응되는 음성 검증 장치.
제13항 내지 제15항 중 어느 한 항에 따른 장치 및 제16항 내지 제19항 중 어느 한 항에 따른 장치를 포함하는 음성 검증 시스템.
실행될 때, 제1항 내지 제12항 중 어느 한 항에 따른 방법이 실행되게 하는 컴퓨터 코드를 저장한 컴퓨터 판독 가능 매체.
컴퓨터 장치에 의해 실행될 때, 제1항 내지 제12항 중 어느 한 항에 따른 방법이 실행되게 하는 컴퓨터 프로그램 제품.
메모리 및 프로세서를 포함하는 컴퓨터 장치로서, 상기 메모리는 컴퓨터 코드를 저장하고, 상기 프로세서는 상기 컴퓨터 코드를 실행함으로써 제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하도록 구성되는 컴퓨터 장치.