KR20080019210A - 보안 정보를 위한 음성 인식 시스템 - Google Patents

보안 정보를 위한 음성 인식 시스템 Download PDF

Info

Publication number
KR20080019210A
KR20080019210A KR1020077028302A KR20077028302A KR20080019210A KR 20080019210 A KR20080019210 A KR 20080019210A KR 1020077028302 A KR1020077028302 A KR 1020077028302A KR 20077028302 A KR20077028302 A KR 20077028302A KR 20080019210 A KR20080019210 A KR 20080019210A
Authority
KR
South Korea
Prior art keywords
subword
security
speech
speech unit
input
Prior art date
Application number
KR1020077028302A
Other languages
English (en)
Inventor
데이비드 지. 올라손
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20080019210A publication Critical patent/KR20080019210A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Storage Device Security (AREA)

Abstract

보안 정보를 위한 음성 인식 시스템을 개시한다. 음성 인식 시스템의 실시예는 보안 시스템과 인터페이스하는 서브워드 음성 인식 컴포넌트를 포함한다. 서브워드 음성 인식 컴포넌트는 암호 또는 보안 코드와 같은 입력 발성에 대한 서브워드 음성 단위를 제공한다. 입력 발성에 대한 서브워드 음성 단위는 인증을 위해 보안 시스템에 제공된다.
보안 정보, 음성 인식, 입력 발성, 인증, 보안 시스템

Description

보안 정보를 위한 음성 인식 시스템{SPEECH RECOGNITION SYSTEM FOR SECURE INFORMATION}
다수의 자동화된 시스템은 정보에 액세스하거나 다양한 동작을 수행하기 위해, 전화 키(telephone key)를 이용하여 보안 암호 또는 코드를 입력하는 것을 필요로 한다. 예를 들어, 자동화된 은행 업무 시스템은 계좌 정보를 검색하기 위해 보안 암호 또는 보안 코드를 필요로 할 수 있다. 이러한 시스템은 사용자에게 생년월일이나 사회 보장 번호와 같은 비밀 정보, 또는 사용자와 연관된 기타 암호를 입력할 것을 프롬프트할 수 있다. 그러고나서, 그 시스템은 비밀 정보나 암호의 저장된 기록과 사용자의 입력 또는 응답을 대조하여, 사용자의 진정성을 검증한다. 이러한 단순한 숫자 암호는 종종 몰래 알아내는 것이 비교적 쉽다.
다양한 애플리케이션은 작업을 수행하기 위해, 전화 또는 다이얼로그 시스템을 이용하여, 사용자에게 프롬프트에 대한 응답으로서 음성 정보를 입력할 것을 프롬프트한다. 이들 애플리케이션은 음성 인식 시스템을 이용하여 입력 음성을 인식한다. 이러한 음성 인식 시스템은 문법을 이용하여 발성 내의 단어를 인식한다. 보안 정보를 위한 전화나 다이얼로그 시스템의 환경에서는, 보안 데이터를 위한 문법을 구성하는 것이 어렵다. 이는, 문법이 단어를 인식하기 위해서는, 그 단어를 위해 작성된 규칙을 가져야 하기 때문이다. 따라서, 비밀 암호 정보로서 종종 이 용되는 적절한 이름과 기타 단어는 문법으로 잘 처리되지 않는다. 또한, 문법이 비밀 암호를 포함하는 경우에도, 자동화된 음성 인식이 보안 애플리케이션이나 시스템의 외부의 전화 다이얼로그 시스템에서 일어나면, 그 비밀 암호 정보는 일반적으로 보안 상태에 있지 않기 때문에 보안이 훼손된다.
본 발명의 실시예는 이들 및/또는 기타 문제들 중 하나 이상의 문제를 다룬다. 본 배경기술은 결코 본 발명을 제한하기 위한 것이 아니라, 단지 일 예로서 제공될 뿐이다.
<발명의 요약>
본 발명의 실시예는 보안 정보를 위한 음성 인식 시스템에 관한 것이다. 음성 인식 시스템은 보안 시스템과 인터페이스하는 서브워드(sub-word) 음성 단위 인식 컴포넌트를 포함한다. 서브워드 음성 단위 인식 컴포넌트는 사용자로부터 암호나 비밀 정보를 표현한 음성 입력 발성을 수신하고, 발성 내의 서브워드 음성 단위를 인식하며, 그 서브워드 음성 단위를 보안 시스템에 제공하여 저장된 정보나 데이터와 서브워드 음성 단위를 대조한다.
상기 발명의 요약은 아래의 실시예에서 더 설명되는 개념의 선택을 단순화된 형태로 소개하기 위한 것이다. 본 발명의 상세한 설명은 본 발명의 청구 대상의 주요 특징이나 필수 특징들을 확인하기 위한 것도 아니고, 본 발명의 청구 대상의 범위를 정하는데 있어서 어떤 도움을 주기 위해 이용되는 것도 아니다.
도 1은 본 발명의 실시예가 이용되거나 구현될 수 있는 컴퓨팅 환경의 예시 적인 일 실시예의 블록도이다.
도 2는 보안 정보를 위한 음성 인식 시스템의 일 실시예를 도시한 블록도이다.
도 3은 보안 정보와 관련하여 사용자 입력 발성의 인증의 일 실시예를 도시한 흐름도이다.
도 4는 보안 시스템에서 보안 정보의 입력을 위한 일 실시예를 도시한 블록도이다.
도 5는 보안 시스템에서 보안 정보의 입력을 위한 단계들의 일 실시예를 도시한 흐름도이다.
본 발명의 실시예는 보안 정보를 위한 서브워드 음성 인식에 관한 것이다. 본 발명을 더 상세히 설명하기 전에, 도 1을 참조하여, 본 발명이 구현될 수 있는 예시적인 컴퓨팅 환경(100)의 일 실시예를 설명할 것이다.
도 1은 본 발명이 구현되기에 적합한 컴퓨팅 시스템 환경(100)의 일례를 도시하고 있다. 컴퓨팅 시스템 환경(100)은 적합한 컴퓨팅 환경의 일례에 불과하며, 본 발명의 용도 또는 기능성의 범위에 관해 어떤 제한을 암시하고자 하는 것이 아니다. 컴퓨팅 환경(100)이 예시적인 운영 환경(100)에 도시된 컴포넌트들 중 임의의 하나 또는 그 컴포넌트들의 임의의 조합과 관련하여 어떤 의존성 또는 요구사항을 갖는 것으로 해석되어서는 안된다.
본 발명은 많은 기타 범용 또는 특수 목적의 컴퓨팅 시스템 환경 또는 구성 에서 동작할 수 있다. 본 발명에서 사용하는 데 적합할 수 있는 잘 알려진 컴퓨팅 시스템, 환경 및/또는 구성의 예로는 퍼스널 컴퓨터, 서버 컴퓨터, 핸드-헬드 또는 랩톱 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 시스템, 셋톱 박스, 프로그램가능한 가전제품, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 전화 시스템, 상기 시스템들이나 장치들 중 임의의 것을 포함하는 분산 컴퓨팅 환경, 기타 등등이 있지만 이에 제한되는 것은 아니다.
본 발명은 일반적으로 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터 실행가능 명령어와 관련하여 기술될 것이다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하거나 특정 추상 데이터 유형을 구현하는 루틴, 프로그램, 개체, 컴포넌트, 데이터 구조 등을 포함한다. 본 기술 분야의 숙련된 자들은 여기에 제공된 설명 및 도면에 기반하여 본 발명의 양상을 컴퓨터 판독가능 매체에 저장된 명령으로서 구현할 수 있다.
본 발명은 또한 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 작업이 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 메모리 저장 장치를 비롯한 로컬 및 원격 컴퓨터 저장 매체 둘 다에 위치할 수 있다.
도 1과 관련하여, 본 발명을 구현하는 예시적인 시스템은 컴퓨터(110) 형태의 범용 컴퓨팅 장치를 포함한다. 컴퓨터(110)의 컴포넌트들은 처리 장치(120), 시스템 메모리(130), 및 시스템 메모리를 비롯한 각종 시스템 컴포넌트들을 처리 장치(120)에 연결시키는 시스템 버스(121)를 포함하지만 이에 제한되는 것은 아니 다. 시스템 버스(121)는 메모리 버스 또는 메모리 컨트롤러, 주변 장치 버스 및 각종 버스 아키텍처 중 임의의 것을 이용하는 로컬 버스를 비롯한 몇몇 유형의 버스 구조 중 어느 것이라도 될 수 있다. 예로서, 이러한 아키텍처는 ISA(industry standard architecture) 버스, MCA(micro channel architecture) 버스, EISA(Enhanced ISA) 버스, VESA(video electronics standard association) 로컬 버스, 그리고 메자닌 버스(mezzanine bus)로도 알려진 PCI(peripheral component interconnect) 버스 등을 포함하지만 이에 제한되는 것은 아니다.
컴퓨터(110)는 통상적으로 각종 컴퓨터 판독가능 매체를 포함한다. 컴퓨터(110)에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 이러한 컴퓨터 판독가능 매체는 휘발성 및 비휘발성 매체, 이동식 및 비이동식 매체를 포함한다. 예로서, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 포함하지만 이에 제한되는 것은 아니다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성, 이동식 및 비이동식 매체를 포함한다.
컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital versatile disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터(110)에 의해 액세스되고 원하는 정보를 저장할 수 있는 임의의 기타 매체를 포함하지만 이에 제한되는 것은 아니다. 통신 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터 등을 구현하고 모든 정보 전달 매체를 포함한다. "피변조 데이터 신호"라는 용어는, 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 예로서, 통신 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 및 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들의 모든 조합이 또한 컴퓨터 판독가능 매체의 영역 안에 포함되는 것으로 한다.
시스템 메모리(130)는 판독 전용 메모리(ROM)(131) 및 랜덤 액세스 메모리(RAM)(132)와 같은 휘발성 및/또는 비휘발성 메모리 형태의 컴퓨터 저장 매체를 포함한다. 시동 중과 같은 때에, 컴퓨터(110) 내의 구성요소들 사이의 정보 전송을 돕는 기본 루틴을 포함하는 기본 입/출력 시스템(BIOS)(133)은 통상적으로 ROM(131)에 저장되어 있다. RAM(132)은 통상적으로 처리 장치(120)가 즉시 액세스 할 수 있고 및/또는 현재 동작시키고 있는 데이터 및/또는 프로그램 모듈을 포함한다. 예로서, 도 1은 운영 체제(134), 애플리케이션 프로그램(135), 기타 프로그램 모듈(136) 및 프로그램 데이터(137)를 도시하고 있지만 이에 제한되는 것은 아니다.
컴퓨터(110)는 또한 기타 이동식/비이동식, 휘발성/비휘발성 컴퓨터 저장매체를 포함한다. 단지 예로서, 도 1은 비이동식·비휘발성 자기 매체에 기록을 하거나 그로부터 판독을 하는 하드 디스크 드라이브(141), 이동식·비휘발성 자기 디 스크(152)에 기록을 하거나 그로부터 판독을 하는 자기 디스크 드라이브(151), CD-ROM 또는 기타 광 매체 등의 이동식·비휘발성 광 디스크(156)에 기록을 하거나 그로부터 판독을 하는 광 디스크 드라이브(155)를 포함한다. 예시적인 운영 환경에서 사용될 수 있는 기타 이동식/비이동식, 휘발성/비휘발성 컴퓨터 기억 매체로는 자기 테이프 카세트, 플래시 메모리 카드, DVD, 디지털 비디오 테이프, 고상(solid state) RAM, 고상 ROM 등이 있지만 이에 제한되는 것은 아니다. 하드 디스크 드라이브(141)는 통상적으로 인터페이스(140)와 같은 비이동식 메모리 인터페이스를 통해 시스템 버스(121)에 접속되고, 자기 디스크 드라이브(151) 및 광 디스크 드라이브(155)는 통상적으로 인터페이스(150)와 같은 이동식 메모리 인터페이스에 의해 시스템 버스(121)에 접속된다.
위에서 설명되고 도 1에 도시된 드라이브들 및 이들과 관련된 컴퓨터 저장 매체는, 컴퓨터(110)를 위해, 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 및 기타 데이터를 저장한다. 도 1에서, 예를 들어, 하드 디스크 드라이브(141)는 운영 체제(144), 애플리케이션 프로그램(145), 기타 프로그램 모듈(146), 및 프로그램 데이터(147)를 저장하는 것으로 도시되어 있다. 여기서 주의할 점은 이들 컴포넌트가 운영 체제(134), 애플리케이션 프로그램(135), 기타 프로그램 모듈(136), 및 프로그램 데이터(137)와 동일하거나 그와 다를 수 있다는 것이다. 이에 관해, 운영 체제(144), 애플리케이션 프로그램(145), 기타 프로그램 모듈(146) 및 프로그램 데이터(147)에 다른 번호가 부여되어 있다는 것은 적어도 이들이 다른 사본(copy)이라는 것을 나타내기 위한 것이다.
사용자는 키보드(162), 마이크(163) 및 마우스, 트랙볼(trackball) 또는 터치 패드와 같은 포인팅 장치(161) 등의 입력 장치를 통해 명령 및 정보를 컴퓨터(110)에 입력할 수 있다. 다른 입력 장치(도시 생략)로는 조이스틱, 게임 패드, 위성 안테나, 스캐너 등을 포함할 수 있다. 이들 및 기타 입력 장치는 종종 시스템 버스에 결합된 사용자 입력 인터페이스(160)를 통해 처리 장치(120)에 접속되지만, 병렬 포트, 게임 포트 또는 USB(universal serial bus) 등의 다른 인터페이스 및 버스 구조에 의해 접속될 수도 있다. 모니터(191) 또는 다른 유형의 디스플레이 장치도 비디오 인터페이스(190) 등의 인터페이스를 통해 시스템 버스(121)에 접속될 수 있다. 모니터 외에, 컴퓨터는 스피커(197) 및 프린터(196) 등의 기타 주변 출력 장치를 포함할 수 있고, 이들은 출력 주변장치 인터페이스(195)를 통해 접속될 수 있다.
컴퓨터(110)는 원격 컴퓨터(180)와 같은 하나 이상의 원격 컴퓨터로의 논리적 접속을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(180)는 또 하나의 퍼스널 컴퓨터, 핸드-헬드 장치, 서버, 라우터, 네트워크 PC, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있고, 통상적으로 컴퓨터(110)와 관련하여 상술된 구성요소들의 대부분 또는 그 전부를 포함한다. 도 1에 도시된 논리적 접속으로는 LAN(171) 및 WAN(173)이 있지만, 기타 네트워크를 포함할 수도 있다. 이러한 네트워킹 환경은 사무실, 전사적 컴퓨터 네트워크(enterprise-wide computer network), 인트라넷, 및 인터넷에서 일반적인 것이다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(110)는 네트워크 인터페이스 또는 어댑터(170)를 통해 LAN(171)에 접속된다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(110)는 통상적으로 인터넷과 같은 WAN(173)을 통해 통신을 설정하기 위한 모뎀(172) 또는 기타 수단을 포함한다. 내장형 또는 외장형일 수 있는 모뎀(172)은 사용자 입력 인터페이스(160) 또는 기타 적절한 메커니즘을 통해 시스템 버스(121)에 접속된다. 네트워크화된 환경에서, 컴퓨터(110) 또는 그의 일부와 관련하여 기술된 프로그램 모듈은 원격 메모리 저장 장치에 저장될 수 있다. 예로서, 도 1은 원격 애플리케이션 프로그램(185)이 원격 컴퓨터(180)에 있는 것으로 도시하고 있지만 이에 제한되는 것은 아니다. 도시된 네트워크 접속은 예시적인 것이며 이 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 이해할 것이다.
본 발명의 실시예는 보안 정보에 대한 음성 인식 시스템(200)에 관한 것으로, 이것은 다양하게 응용될 수 있으며 도시된 특정 실시예에 한정되지 않는다. 도 2에 도시된 실시예에서, 음성 인식 시스템(200)은 애플리케이션(202) 및 보안 시스템(204)을 포함한다. 도 2에서, 애플리케이션(202)은 일반적으로, 오디오 프롬프트(208)로 사용자(207)에게 프롬프트하고, 음성 응답(210)을 수신하며, 사용자가 프롬프트에 대한 음성 응답과 음성 명령(voice command)을 이용하여 일정 작업을 수행할 수 있도록 하는 음성 인식 시스템(206)을 갖는 전화 또는 다이얼로그 시스템을 도시하고 있다.
일 실시예에서, 음성 인식 시스템(206)은 서브워드 음성 단위 인식 컴포넌트(212)를 포함한다. 서브워드 음성 단위 인식 컴포넌트(212)는 사용자(207)로부 터 응답 또는 발성(210)을 수신한다. 컴포넌트(212)는 입력 음성 발성 또는 응답(210)에서 음소(phoneme)와 같은 서브워드 음성 단위(214)를 인식한다.
도시된 실시예에서, 보안 시스템(204)은 보안 데이터베이스 또는 보안 정보(220)를 포함한다. 설명된 실시예에서, 데이터베이스(220)는 암호나 보안 코드와 같은 보안 데이터에 대응하는 서브워드 음성 단위를 포함한다. 도시된 바와 같이, 인식 컴포넌트(212)는 입력 음성 또는 발성의 인증을 위해 보안 인터페이스(222)를 통해 보안 시스템(204)과 인터페이스한다. 일 예로서, 보안 인터페이스(222)는 방화벽 또는 보안 프로토콜을 채용한 기타 인터페이스이다. 특정 인터페이스 또는 프로토콜은 보안 시스템(204) 내의 데이터가 애플리케이션(202) 내의 데이터보다 안전하다라고 말하는 것을 제외하면 본 발명의 목적을 달성하는데 있어서 중요하지 않다.
특히, 도시된 실시예에서, 본 발명의 시스템(200)은 암호 또는 보안 코드를 검증하거나 확인하는데 이용된다. 암호 또는 코드는 프롬프트(208)에 응답하여 사용자(207)에 의해 입력된다. 발성은 서브워드 음성 단위 인식 컴포넌트(212)에 의해 서브워드 음성 단위(214)로 처리된다. 애플리케이션(202)은 사용자 이름, 계좌 번호 또는 기타 ID 코드와 같은 사용자 ID 정보(224)에 더하여 서브워드 음성 단위(214)를 보안 시스템(204)에 제공한다.
보안 시스템(204)은 서브워드 음성 단위(214)와 사용자 ID(224)를 이용하여 수신된 사용자 ID(224)에 대응하는 암호 또는 보안 코드를 나타내는 저장된 정보에 액세스한다. 저장된 정보는 예를 들어 저장된 서브워드 음성 단위일 수 있다. 입 력 음성에 대응하는 서브워드 음성 단위는 음성 단위 비교 컴포넌트(225)에 의해 저장된 데이터 또는 저장된 서브워드 음성 단위와 비교된다.
입력 서브워드 음성 단위(214)가 저장된 암호 또는 보안 코드와 일치하면, 암호가 맞는다는 인증 메시지(226)가 보안 인터페이스(222)를 통해 애플리케이션(202)에 제공된다. 일치하지 않으면, 메시지(226)는 암호가 맞지 않는다는 것을 지시한다. 상술한 바와 같이, 보안 정보의 경우에, 서브워드 음성 단위만이 애플리케이션(202)에서 인식되고, 보안 인터페이스(222)를 통해 보안 시스템(204)에 전달된다. 따라서, 보안 정보의 단위 레벨 인식을 보안 시스템(204) 외부에서 이용할 수 없으므로, 정보 보안을 보호하게 된다.
도 3은 보안 코드나 암호와 같은 보안 데이터에 대한 보안 음성 인식 실시예를 구현하기 위한 단계들을 더 상세히 도시한다. 도시된 실시예에서, 블록(230)에 도시된 바와 같이, 사용자(207)는 작업을 수행하기 위해 애플리케이션(202)에 액세스하며, 블록(232)으로 도시된 바와 같이, 사용자(207)는 암호나 보안 코드와 같은 보안 정보를 입력하도록 프롬프트된다.
프롬프트(208)에 응답하여, 블록(234)에 도시된 바와 같이, 사용자(207)는 응답(210)을 발성한다. 블록(236)에 의해 도시된 바와 같이, 발성된 응답(210) 내의 서브워드 음성 단위는 서브워드 음성 단위 인식 컴포넌트(212)에 의해 인식된다. 단계(238)에 의해 도시된 바와 같이, 서브워드 음성 단위(214)는 기타 식별 정보(224)와 함께 보안 인터페이스(222)를 통해 보안 시스템(204)에 제공된다. 보안 시스템(204)은 식별된 사용자(207)와 관련하여 저장소(220)에 저장된 보안 데이 터 또는 정보와 서브워드 음성 단위(214)를 비교한다.
특히, 도시된 실시예에서, 블록(240)으로 도시된 바와 같이, 음성 단위 비교 컴포넌트(225)는 보안 데이터 또는 정보를 위해 저장된 서브워드 음성 단위를 검색하고, 저장된 서브워드 음성 단위를 입력 발성에 대한 입력 서브워드 음성 단위(214)와 비교한다. 블록(242)으로 도시된 바와 같이, 저장된 서브워드 음성 단위와 입력 음성이나 발성에 대한 서브워드 음성 단위를 비교하여, 입력 발성이 사용자(207)에 대해 저장된 데이터 또는 암호와 일치하는지를 결정한다.
일치하면, 블록(248)으로 도시된 바와 같이, 보안 시스템 또는 애플리케이션(204)은 일치를 검증하는 메시지(226)를 애플리케이션(202)에 전송하고, 블록(250)으로 도시된 바와 같이, 애플리케이션(202)은 사용자(207)가 요구한 작업 또는 정보를 잠금 해제한다. 예를 들어, 입력 발성에 대한 서브워드 음성 단위가 저장된 정보에 대한 서브워드 음성 단위 또는 음소와 일치하는 경우, 보안 시스템은 애플리케이션(202)을 잠금 해제하여, 사용자가 그렇지 않은 경우 잠겨 있을 정보에 액세스하거나 원하는 작업이나 작업들을 수행할 수 있도록 한다.
일치하지 않으면, 블록(252)으로 도시된 바와 같이, 보안 시스템(204)은 일치하지 않는다는 메시지를 애플리케이션(202)에 전송하고, 블록(254)으로 도시된 바와 같이, 애플리케이션(202)은 잠금 상태를 유지하고/하거나 사용자(207)에게 에러 메시지를 표시한다.
상술한 실시예에서, 보안 정보는 보안 시스템(204) 외부에서 완전히 인식되지는 않는다. 그 대신에, 보안 정보에 대응하는 서브워드 음성 단위만이 인식되어 보안 시스템(204)에 전달된다. 따라서, 보안 정보에 대한 단어 레벨 문법은 보안 시스템(204) 외부에서 이용 가능하지 않아도 된다. 예를 들어, 사용자가 텔레뱅킹 시스템의 은행 계좌를 잠금 해제하기 위해 사용자 어머니의 결혼 전의 성을 입력하라는 명령을 받으면, 보안 시스템(204) 외부에서 단어 레벨 인식을 이용할 수 없다. 그 대신에, 사용자 어머니의 결혼 전의 성의 입력 발성은 서브워드 음성 단위로서 인식되고, 서브워드 음성 단위가 보안 시스템(204)에 전달되어 사용자의 입력 발성이 보안 데이터베이스(220)에 저장된 사용자 어머니의 결혼 전 성에 대한 데이터와 일치하는지를 검증한다.
도 4는 시스템(200)에 등록하기 위한 일 실시예를 도시한다. 이 프로세스는 보안 데이터베이스(220)에 저장하기 위해, 사용자의 보안 정보를 식별하는 서브워드 음성 단위를 입력하거나 생성하는 것을 포함한다. 도 4는 사용자가 보안 시스템(204)에 직접 정보를 입력하는 일 실시예를 도시한다. 그러나, 보안 정보는 도 2의 시스템(200) 내의 애플리케이션(202)을 통해서도 입력될 수 있다는 것을 알 것이다. 도 4에 도시된 실시예에서, 보안 정보는 (전화나 기타 음성 다이얼로그 시스템과 같은) 음성 또는 오디오 입력 장치(260)를 이용하거나 다른 방법으로는 영숫자 키보드 또는 키패드와 같은 비가청(non-audible) 입력 장치(262)를 이용하여 보안 시스템(204)에 입력될 수 있다. 도 4에 도시된 실시예에서, 보안 시스템(204)은 보안 프롬프트(264)를 사용자(207)에게 제공하여, 예를 들어, 사용자 어머니의 결혼 전 성과 같은 보안 정보 또는 데이터를 입력하도록 한다. 보안 프롬프트(264)에 응답하여, 사용자는 오디오 응답 또는 발성 또는 (텍스트 응답과 같 은) 비-오디오(non-audio) 응답을 제공할 수 있다.
도 4에 도시된 바와 같이, 사용자의 입력이 오디오 입력 장치(260)에 의한 것이면, 오디오 응답 내의 서브워드 음성 단위는 서브워드 음성 단위 인식기(268)에 의해 인식된다. 사용자의 응답이 비가청 오디오 입력 장치(262)를 통해 (예를 들어, 텍스트로) 입력되면, 서브워드 음성 단위 발생기(270)는 텍스트 입력에 대한 서브워드 음성 단위를 발생시킨다. 예를 들어, 도시된 실시예에서, 서브워드 음성 단위는 음소이고, 입력 단어를 식별하는 사전이나 어휘 목록(272) 및 인식된 단어에 대한 음소를 생성하는 글자와 사운드 간 규칙(274; letter to sound rules)을 이용하여 서브워드 음성 단위 발생기(270)에 의해 텍스트로부터 발생된다. 어느 경우이든, 서브워드 음성 단위 발생기(270) 또는 서브워드 음성 인식기(268)로부터의 서브워드 음성 단위(271)는 보안 데이터베이스(220)에 저장된다.
도 5는 보안 데이터베이스(220)에 보안 정보를 입력하기 위한 단계들을 더 상세히 도시한다. 도시된 바와 같이, 블록(280)으로 도시된 바와 같이 사용자는 보안 시스템(204)에 액세스하고, 블록(282)으로 도시된 바와 같이, 사용자는 사용자 ID 정보(예를 들어, 이름이나 전화 번호 등)를 입력하여 등록하라는 프롬프트(264)를 제공받는다. 블록(284)으로 도시된 바와 같이, 사용자는 또한 보안 정보(예를 들어, 암호나 보안 코드)를 입력하라는 명령을 받는다. 블록(286)으로 도시된 바와 같이, 보안 정보는 오디오 입력 장치(260) 또는 비가청 입력 장치(262)를 통해 사용자에 의해 입력된다.
블록(288)으로 도시된 바와 같이, 시스템은 사용자의 응답이 비가청(예를 들 어, 텍스트)인지 음성인지를 결정한다. 사용자의 보안 정보가 오디오 입력 장치(260)를 통해 입력되면, 블록(290)으로 도시된 바와 같이, 서브워드 음성 단위는 서브워드 음성 단위 인식기(268)를 이용하여 사용자에 의해 입력된 보안 정보에 대해 인식된다. 사용자의 응답이 텍스트 입력으로서 입력되면, 단계(292)로 도시된 바와 같이, 서브워드 음성 단위는 서브워드 음성 단위 발생기(270)에 의해 텍스트 입력이나 응답에 대해 발생된다. 일단 서브워드 음성 단위(271)가 발생되거나 인식되면, 블록(294)에 의해 도시된 바와 같이, 서브워드 음성 단위(271)는 보안 데이터베이스(220)내에서 사용자의 ID 또는 계좌 아래에 저장된다.
특정 실시예를 참조하여 본 발명을 설명하였지만, 당업자라면 본 발명의 사상 및 범위로부터 일탈함이 없이 형태 및 상세에 있어서 변경을 할 수 있다는 것을 알 것이다.

Claims (18)

  1. 음성 인식 시스템으로서,
    보안 데이터를 표현한 입력 발성에 대한 서브워드 음성 단위를 제공하도록 구성된 서브워드 음성 단위 인식 컴포넌트; 및
    상기 서브워드 음성 인식 컴포넌트와 별개로, 상기 서브워드 음성 단위를 수신하고 상기 보안 데이터를 나타내는 저장된 정보와 상기 서브워드 음성 단위를 비교하도록 구성된 보안 시스템
    을 포함하는 음성 인식 시스템.
  2. 제1항에 있어서, 상기 서브워드 음성 인식 컴포넌트와 상기 보안 시스템은 보안 인터페이스를 통해 접속되는 음성 인식 시스템.
  3. 제1항에 있어서, 상기 보안 시스템은 상기 보안 데이터를 위해 저장된 서브워드 음성 단위를 검색하고 상기 입력 발성에 대한 상기 서브워드 음성 단위와 상기 저장된 서브워드 음성 단위를 비교하도록 구성되는 음성 인식 시스템.
  4. 제1항에 있어서, 상기 보안 데이터는 보안 데이터베이스에 저장되는 암호 또는 보안 코드를 포함하는 음성 인식 시스템.
  5. 제3항에 있어서,
    상기 서브워드 음성 단위 인식 컴포넌트와 동작 가능하며, 상기 보안 시스템에 사용자 ID를 제공하도록 구성된 애플리케이션을 더 포함하고, 상기 보안 시스템은 상기 사용자 ID에 대응하는 상기 저장된 서브워드 음성 단위를 검색하는 음성 인식 시스템.
  6. 제5항에 있어서, 상기 보안 시스템은 상기 저장된 서브워드 음성 단위와 상기 입력 발성에 대한 상기 서브워드 음성 단위의 비교에 기초하여, 상기 보안 데이터가 정확하다는 메시지를 상기 애플리케이션에 제공하는 음성 인식 시스템.
  7. 제6항에 있어서, 상기 애플리케이션은 상기 비교에서의 일치에 응답하여 잠금 해제되는 음성 인식 시스템.
  8. 애플리케이션으로서,
    입력 발성에 대응하는 서브워드 음성 단위를 인식하도록 구성된 서브워드 음성 단위 인식 컴포넌트를 포함하고,
    상기 애플리케이션은 상기 서브워드 음성 단위를 보안 시스템에 제공하고 상기 서브워드 음성 단위에 기초하여 상기 보안 시스템으로부터 보안 인증을 수신하도록 구성되는 애플리케이션.
  9. 제8항에 있어서, 상기 애플리케이션은 보안 데이터를 입력하라는 프롬프트에 대한 응답으로 상기 입력 발성을 수신하고, 상기 서브워드 음성 단위를 인식하기 위해 상기 입력 발성을 상기 서브워드 음성 단위 인식 컴포넌트에 제공하는 애플리케이션.
  10. 제8항에 있어서, 상기 애플리케이션은 프롬프트에 응답하여 사용자 ID를 수신하고, 상기 사용자 ID를 상기 보안 시스템에 제공하는 애플리케이션.
  11. 제8항에 있어서, 상기 애플리케이션은 보안 인터페이스를 통해 상기 보안 시스템에 접속되도록 구성되는 애플리케이션.
  12. 입력 발성을 수신하는 단계;
    상기 입력 발성에 대응하는 서브워드 음성 단위를 인식하는 단계; 및
    상기 서브워드 음성 단위를 보안 인터페이스를 통해 보안 시스템에 제공하여, 상기 입력 발성에 대응하는 상기 서브워드 음성 단위와 저장된 서브워드 음성 단위에 기초하여 보안 정보를 인증하는 단계
    를 포함하는 방법.
  13. 제12항에 있어서, 상기 보안 시스템에 사용자 ID를 제공하는 단계; 및
    상기 서브워드 음성 단위 및 상기 사용자 ID에 기초하여 상기 보안 정보를 인증하는 단계를 더 포함하는 방법.
  14. 제13항에 있어서, 상기 입력 발성은 사용자에 의해 입력된 보안 정보이고,
    사용자 ID에 기초하여 보안 데이터베이스로부터 상기 저장된 서브워드 음성 단위를 검색하는 단계; 및
    상기 입력 발성에 대한 상기 서브워드 음성 단위가 상기 사용자 ID에 대한 상기 검색된 서브워드 음성 단위와 일치하는지를 판정하는 단계를 더 포함하는 방법.
  15. 제14항에 있어서, 상기 입력 발성에 대한 상기 서브워드 음성 단위가 상기 사용자 ID에 대한 상기 저장된 서브워드 음성 단위와 일치하는 경우에, 사용자 애플리케이션을 잠금 해제하는 단계를 더 포함하는 방법.
  16. 제12항에 있어서, 상기 보안 정보를 사용자 ID와 함께 보안 데이터베이스 내에 입력하는 단계;
    상기 입력된 보안 정보에 대한 서브워드 음성 단위를 제공하는 단계; 및
    상기 보안 데이터베이스에 상기 서브워드 음성 단위를 저장하는 단계를 포함하는 방법.
  17. 제16항에 있어서, 상기 보안 정보는 입력 발성으로서 오디오 입력 장치를 통 해 입력되고, 상기 입력된 보안 정보에 대한 서브워드 음성 단위를 제공하는 단계는 상기 입력 발성에서 서브워드 음성 단위를 인식하는 단계를 포함하는 방법.
  18. 제16항에 있어서, 상기 보안 정보는 텍스트 입력으로서 텍스트 입력 장치를 통해 입력되고, 상기 입력된 보안 정보에 대한 서브워드 음성 단위를 제공하는 단계는 상기 텍스트 입력 장치로부터의 상기 텍스트 입력에 대한 서브워드 음성 단위를 발생시키는 단계를 포함하는 방법.
KR1020077028302A 2005-06-22 2006-04-21 보안 정보를 위한 음성 인식 시스템 KR20080019210A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/158,830 US20060293898A1 (en) 2005-06-22 2005-06-22 Speech recognition system for secure information
US11/158,830 2005-06-22

Publications (1)

Publication Number Publication Date
KR20080019210A true KR20080019210A (ko) 2008-03-03

Family

ID=37568670

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077028302A KR20080019210A (ko) 2005-06-22 2006-04-21 보안 정보를 위한 음성 인식 시스템

Country Status (6)

Country Link
US (1) US20060293898A1 (ko)
EP (1) EP1894186A4 (ko)
JP (1) JP2008544327A (ko)
KR (1) KR20080019210A (ko)
CN (1) CN101208739A (ko)
WO (1) WO2007001602A2 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150035312A (ko) * 2013-09-27 2015-04-06 에스케이플래닛 주식회사 음성에 기반한 잠금 해제를 수행하는 사용자 장치, 음성에 기반한 사용자 장치의 잠금 해제 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR20210110414A (ko) * 2014-04-01 2021-09-07 구글 엘엘씨 동적으로 발생된 어구들을 사용하는 세그먼트 기반 화자 검증
US11152008B2 (en) 2017-12-19 2021-10-19 Samsung Electronics Co., Ltd. Electronic apparatus, method for controlling thereof and computer readable recording medium

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010367B2 (en) * 2006-12-22 2011-08-30 Nuance Communications, Inc. Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines
CN102254559A (zh) * 2010-05-20 2011-11-23 盛乐信息技术(上海)有限公司 基于声纹的身份认证系统及方法
US11792185B2 (en) 2019-01-08 2023-10-17 Universal Electronics Inc. Systems and methods for associating services and/or devices with a voice assistant
US11700412B2 (en) 2019-01-08 2023-07-11 Universal Electronics Inc. Universal voice assistant
US11451618B2 (en) 2014-05-15 2022-09-20 Universal Electronics Inc. Universal voice assistant
US8898064B1 (en) * 2012-03-19 2014-11-25 Rawles Llc Identifying candidate passwords from captured audio
CN103379488A (zh) * 2012-04-26 2013-10-30 国民技术股份有限公司 密钥钥匙装置及使用方法
CN103077341B (zh) * 2013-01-30 2016-01-20 广东欧珀移动通信有限公司 一种应用程序解锁方法及装置
US11445011B2 (en) 2014-05-15 2022-09-13 Universal Electronics Inc. Universal voice assistant
CN111787012B (zh) 2014-11-07 2022-10-14 三星电子株式会社 语音信号处理方法及实现此的终端和服务器
EP4350558A2 (en) 2014-11-07 2024-04-10 Samsung Electronics Co., Ltd. Speech signal processing method and speech signal processing apparatus
CN105245729B (zh) * 2015-11-02 2019-02-26 北京奇虎科技有限公司 移动终端消息阅读方法和装置
US10909978B2 (en) * 2017-06-28 2021-02-02 Amazon Technologies, Inc. Secure utterance storage
JP2020004192A (ja) * 2018-06-29 2020-01-09 株式会社フュートレック 通信装置および通信装置を備える音声認識端末装置
KR102623727B1 (ko) 2018-10-29 2024-01-11 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11665757B2 (en) 2019-01-08 2023-05-30 Universal Electronics Inc. Universal audio device pairing assistant
US11776539B2 (en) * 2019-01-08 2023-10-03 Universal Electronics Inc. Voice assistant with sound metering capabilities

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1160148B (it) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom Dispositivo per la verifica del parlatore
US5548647A (en) * 1987-04-03 1996-08-20 Texas Instruments Incorporated Fixed text speaker verification method and apparatus
US5127043A (en) * 1990-05-15 1992-06-30 Vcs Industries, Inc. Simultaneous speaker-independent voice recognition and verification over a telephone network
US5430827A (en) * 1993-04-23 1995-07-04 At&T Corp. Password verification system
US5677989A (en) * 1993-04-30 1997-10-14 Lucent Technologies Inc. Speaker verification system and process
US5907597A (en) * 1994-08-05 1999-05-25 Smart Tone Authentication, Inc. Method and system for the secure communication of data
US5774858A (en) * 1995-10-23 1998-06-30 Taubkin; Vladimir L. Speech analysis method of protecting a vehicle from unauthorized accessing and controlling
US5752231A (en) * 1996-02-12 1998-05-12 Texas Instruments Incorporated Method and system for performing speaker verification on a spoken utterance
US6529881B2 (en) * 1996-06-28 2003-03-04 Distributed Software Development, Inc. System and method for identifying an unidentified customer at the point of sale
WO1998023062A1 (en) * 1996-11-22 1998-05-28 T-Netix, Inc. Voice recognition for information system access and transaction processing
US5995927A (en) * 1997-03-14 1999-11-30 Lucent Technologies Inc. Method for performing stochastic matching for use in speaker verification
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
JPH1127750A (ja) * 1997-07-08 1999-01-29 Koorasu Computer Kk アクセス認証方法、接続制御装置、及び通信システム
US6246988B1 (en) * 1998-02-10 2001-06-12 Dsc Telecom L.P. Method and apparatus for accessing a data base via speaker/voice verification
US6243678B1 (en) * 1998-04-07 2001-06-05 Lucent Technologies Inc. Method and system for dynamic speech recognition using free-phone scoring
US6185530B1 (en) * 1998-08-14 2001-02-06 International Business Machines Corporation Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system
US6519565B1 (en) * 1998-11-10 2003-02-11 Voice Security Systems, Inc. Method of comparing utterances for security control
US6671672B1 (en) * 1999-03-30 2003-12-30 Nuance Communications Voice authentication system having cognitive recall mechanism for password verification
US6393305B1 (en) * 1999-06-07 2002-05-21 Nokia Mobile Phones Limited Secure wireless communication user identification by voice recognition
US6691089B1 (en) * 1999-09-30 2004-02-10 Mindspeed Technologies Inc. User configurable levels of security for a speaker verification system
JP2001111652A (ja) * 1999-10-12 2001-04-20 Fujitsu Ltd 音声・pb信号変換電話による音声応答システム
US6356868B1 (en) * 1999-10-25 2002-03-12 Comverse Network Systems, Inc. Voiceprint identification system
US6401063B1 (en) * 1999-11-09 2002-06-04 Nortel Networks Limited Method and apparatus for use in speaker verification
US7130800B1 (en) * 2001-09-20 2006-10-31 West Corporation Third party verification system
JP4689788B2 (ja) * 2000-03-02 2011-05-25 株式会社アニモ 電子認証システム、電子認証方法及び記録媒体
EP1209663A1 (de) * 2000-11-27 2002-05-29 Siemens Aktiengesellschaft Zugangssteueranordnung und Verfahren zur Zugangssteuerung
US20020128844A1 (en) * 2001-01-24 2002-09-12 Wilson Raymond E. Telephonic certification of electronic death registration
US6985861B2 (en) * 2001-12-12 2006-01-10 Hewlett-Packard Development Company, L.P. Systems and methods for combining subword recognition and whole word recognition of a spoken input
US7194069B1 (en) * 2002-01-04 2007-03-20 Siebel Systems, Inc. System for accessing data via voice
JP2004096204A (ja) * 2002-08-29 2004-03-25 Nippon Telegraph & Telephone East Corp 遠隔音声制御装置、および遠隔音声制御装置による本人認証方法ならびにデータ登録方法、自動音声通知方法、遠隔音声制御プログラム
US7224786B2 (en) * 2003-09-11 2007-05-29 Capital One Financial Corporation System and method for detecting unauthorized access using a voice signature
US20050071168A1 (en) * 2003-09-29 2005-03-31 Biing-Hwang Juang Method and apparatus for authenticating a user using verbal information verification
US20060229879A1 (en) * 2005-04-06 2006-10-12 Top Digital Co., Ltd. Voiceprint identification system for e-commerce

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150035312A (ko) * 2013-09-27 2015-04-06 에스케이플래닛 주식회사 음성에 기반한 잠금 해제를 수행하는 사용자 장치, 음성에 기반한 사용자 장치의 잠금 해제 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR20210110414A (ko) * 2014-04-01 2021-09-07 구글 엘엘씨 동적으로 발생된 어구들을 사용하는 세그먼트 기반 화자 검증
US11152008B2 (en) 2017-12-19 2021-10-19 Samsung Electronics Co., Ltd. Electronic apparatus, method for controlling thereof and computer readable recording medium

Also Published As

Publication number Publication date
EP1894186A4 (en) 2009-05-20
WO2007001602A2 (en) 2007-01-04
JP2008544327A (ja) 2008-12-04
CN101208739A (zh) 2008-06-25
US20060293898A1 (en) 2006-12-28
EP1894186A2 (en) 2008-03-05
WO2007001602A3 (en) 2007-12-13

Similar Documents

Publication Publication Date Title
KR20080019210A (ko) 보안 정보를 위한 음성 인식 시스템
JP3542026B2 (ja) 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
US7689420B2 (en) Personalizing a context-free grammar using a dictation language model
US20180047397A1 (en) Voice print identification portal
US8694322B2 (en) Selective confirmation for execution of a voice activated user interface
US20070239453A1 (en) Augmenting context-free grammars with back-off grammars for processing out-of-grammar utterances
US20150112684A1 (en) Content-Aware Speaker Recognition
JP4173207B2 (ja) 発声音に関する話者の検証を行うためのシステム及び方法
CN104217149A (zh) 基于语音的生物认证方法及设备
US6496800B1 (en) Speaker verification system and method using spoken continuous, random length digit string
JP2010079235A (ja) 個人(オーディ)情報を含まないメディア・ストリームを保存する方法
US6246987B1 (en) System for permitting access to a common resource in response to speaker identification and verification
JP2006235623A (ja) 短い発話登録を使用する話者認証のためのシステムおよび方法
US10866948B2 (en) Address book management apparatus using speech recognition, vehicle, system and method thereof
JP4318475B2 (ja) 話者認証装置及び話者認証プログラム
US7302381B2 (en) Specifying arbitrary words in rule-based grammars
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
KR20140076056A (ko) 음성 기반 캡차 방법 및 장치
KR102604319B1 (ko) 화자 인증 시스템 및 그 방법
US6499012B1 (en) Method and apparatus for hierarchical training of speech models for use in speaker verification
KR20040068548A (ko) 행동 모델을 사용한 비-개입적 화자 인증 방법 및 시스템
US11929077B2 (en) Multi-stage speaker enrollment in voice authentication and identification
US8254530B2 (en) Authenticating personal identification number (PIN) users
JP6546070B2 (ja) 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application