KR20140137343A

KR20140137343A - 건강 모니터링 시스템에서의 화자 확인

Info

Publication number: KR20140137343A
Application number: KR20147021283A
Authority: KR
Inventors: 푸량 웽; 타우픽 하산; 쯔어 펭
Original assignee: 로베르트 보쉬 게엠베하; 푸량 웽; 타우픽 하산; 쯔어 펭
Priority date: 2011-12-29
Filing date: 2012-12-26
Publication date: 2014-12-02
Also published as: US20140365219A1; JP6234937B2; KR101986867B1; US9424845B2; CN104160441B; EP2810277A1; US8818810B2; JP2015510606A; CN104160441A; US20130173268A1; WO2013101818A1; EP2810277B1

Abstract

사람이 원격 진료 장치를 사용하도록 등록되었다는 것을 확인하기 위한 방법이 사람이 발성한 그리고 원격 진료 장치에 의해서 수신된 단어 내에서 대사 전달되지 않은 트리거 문구를 식별하는 단계를 포함한다. 원격 진료 장치는 등록된 사용자의 명칭을 말하도록 사람에게 대사 전달하고, 선택적으로, 사람에 대한 건강 팁을 말하도록 사람에게 대사 전달한다. 원격 진료 장치는, 대사 전달되지 않은 트리거 문구, 등록된 사용자의 명칭, 및 건강 팁으로부터 생성된 발언 데이터를 이용하여, 해당 사람이 등록된 사용자라는 것을 확인한다.

Description

건강 모니터링 시스템에서의 화자 확인{SPEAKER VERIFICATION IN A HEALTH MONITORING SYSTEM}

본원은 일반적으로 자동화된 음성(speech) 인식 분야에 관한 것이고, 보다 특히 화자를 확인하는 음성 인식 시스템 및 방법에 관한 것이다.

원격 진료 및 가정 건강 관리 분야가 최근에 급격하게 성장하였다. 원격 진료 시스템에서, 환자는 의사 또는 다른 건강 관리 제공자의 장소로부터 지리적으로 떨어져 있다. 예를 들어, 환자가 건강 관리 시설 내의 장소 대신에 집에 있을 수 있을 것이다. 원격 진료 장치는, 환자가 건강 관리 시설로 이동할 필요가 없이, 건강 관리 제공자로 하여금 환자의 건강 상태를 모니터링할 수 있게 하고 일부 의료 문제를 진단 및 처치(treat)할 수 있게 한다. 원격 진료 시스템의 이용은 건강 관리의 비용을 줄일 수 있는, 그리고 증가된 환자 모니터링을 통한 건강 관리의 품질을 향상시킬 수 있는 가능성을 가진다.

여러 가지 공지된 원격 진료 시스템은, 환자가 의료 데이터를 의사 또는 건강 관리 제공자에게 전송할 수 있게 하는 장치를 제공한다. 일부 장치는 심박수, 혈압, 호흡수와 같은 생체 신호를 기록하도록 그리고 기록된 생체 신호의 데이터를 추후의 검토를 위한 데이터베이스로 전송하도록 구성된다. 다른 원격 진료 시스템은, 처방된 시간에 약물을 복용하도록 환자를 환기(remind)시킬 수 있거나 물리적 치료(therapy) 체제(regime)의 일부로서 운동을 실시하도록 환자를 환기시킬 수 있다.

원격 진료 시스템이 많은 잠재적인 장점을 가지지만, 그러한 시스템은 또한, 건강 관리 전문가의 보조 없이 원격 진료 장치들을 이용하는 환자에게 어려울 수 있다. 직관적인 사용자 인터페이스를 제공하는 것은 원격 진료 장치의 효과를 높이고, 또한, 환자가 원격 진료 장치를 성실하게 이용할 가능성을 증가시킨다. 일부 환경에서, 원격 진료 장치는 또한, 각각의 환자에 대한 적절한 처치를 제공하기 위해서 상이한 환자들 사이에서 구분할 필요가 있다. 예를 들어, 은퇴 사회에서, 환자의 큰 그룹이 원격 진료 장치를 이용할 수 있을 것이고, 또는 동일한 가족의 일부 구성원이 상이한 처치를 위해서 원격 진료 장치를 이용할 수 있을 것이다. 원격 진료의 일부 형태는, 휴대가 가능한 그리고 환자들 사이에서 우발적으로 바뀔 수 있는 손에 들고 다니는 유닛(handheld unit)이다. 그에 따라, 환자와 장치 사이의 상호작용을 용이하게 하기 위해서 그리고 원격 진료 장치가 각각의 환자에 대한 적절한 처치를 제공하도록 하기 위해서 원격 진료 장치를 개선하는 것이 유리할 것이다.

일 실시예에 따라서, 사람의 신원을 확인하기 위한 방법이 개발되었다. 그러한 방법은, 오디오(audio) 입력 장치를 이용하여, 사람이 발성한 발언(utterance)에 상응하는 오디오 데이터를 생성하는 단계, 오디오 데이터 프로세서를 이용하여 오디오 데이터 내의 제1발언 데이터를 식별하는 단계, 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 등록 명칭(registration name)을 발성하도록 사람에게 대사를 전달(prompt)하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계, 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 메모리 내에 상기 식별된 제1발언 데이터를 저장하는 단계, 오디오 입력 장치를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하는 단계, 오디오 데이터 프로세서를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하는 단계, 상기 식별된 제2발언 데이터를 메모리 내에 저장하는 단계, 화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리(voice)의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내의 등록된 사용자라는 것을 확인하는 단계, 및 상기 사람이 상기 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 포함한다.

다른 실시예에 따라서, 화자 확인되는 원격 진료 장치가 개발되었다. 원격 진료 장치는 사람이 발성한 발언으로부터 오디오 데이터를 생성하는 오디오 입력 장치, 상기 오디오 입력 장치에 동작적으로 연결되고 상기 오디오 입력 장치에 의해서 생성된 오디오 데이터로부터 발언 데이터를 생성하도록 구성된 오디오 데이터 프로세서, 상기 오디오 데이터 프로세서에 의해서 생성된 복수의 발언 데이터를 저장하도록 구성된 메모리, 적어도 하나의 사용자를 적어도 하나의 사용자에 상응하는 등록 명칭 및 목소리 모델과 연관시키도록 구성된 등록 데이터베이스, 상기 메모리 및 상기 등록 데이터베이스에 동작적으로 연결된 화자 확인 모듈, 사용자 인터페이스 장치, 및 상기 오디오 입력 장치, 오디오 데이터 프로세서, 메모리, 등록 데이터베이스, 화자 확인 모듈, 및 사용자 인터페이스 장치에 동작적으로 연결된 제어기를 포함한다. 상기 제어기는 사람에 의해서 발성된 발언을 포함하는 소리를 수신하기 위해서 그리고 상기 사람으로 하여금 발성하도록 대사를 전달하지 않고 상기 발언에 상응하는 오디오 데이터를 생성하기 위해서 상기 오디오 입력 장치를 활성화시키도록, 상기 오디오 데이터 프로세서를 이용하여 상기 사람이 발성한 발언에 상응하는 오디오 데이터 내의 제1발언 데이터를 식별하도록, 상기 식별된 제1발언 데이터를 상기 메모리 내에 저장하도록, 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 등록 명칭을 발성하도록 사람에게 대사를 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록, 상기 오디오 입력 장치를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하도록, 상기 오디오 데이터 프로세서를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하도록, 상기 식별된 제2발언을 메모리 내에 저장하도록, 화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성한 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내의 등록된 사용자라는 것을 확인하도록, 및 상기 등록 명칭을 발성한 사람이 사용자라는 것을 확인하는 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록 구성된다.

도 1은 환자에 의해서 이용되는 손에 들고 다니는 원격 진료 장치의 개략도이다.
도 2는 사람이 원격 진료 장치의 등록된 사용자라는 것을 확인하기 위한 프로세스의 블록도이다.
도 3은 원격 진료 장치와 함께 이용되는 등록 데이터베이스의 예이다.
도 4는 원격 진료 장치와 함께 이용되는 건강 팁(health tip) 데이터베이스의 예이다.

여기에서 개시된 시스템 및 프로세스에 대한 상세 내용의 전반적인 이해를 위해서, 본원 명세서 전체를 통해서 도면을 참조한다. 도면에서, 유사한 참조 번호는 유사한 요소를 나타낸다. 여기에서 사용된 바와 같이, "발언"이라는 용어는, 단어 및 문구를 포함한, 사람에 의해서 발성된 모든 것을 지칭한다. "발언 데이터"라는 용어는 하나 이상의 발언에 상응하는 데이터를 지칭한다. 발언 데이터는 발언의 직접적인 소리 기록에 상응할 수 있고, 또는, 전형적으로, 디지털 신호 프로세서, 음향 모델러(modeler), 및 언어 모델과 같은, 프론트 엔드 프로세서(front-end processor)를 포함하는, 음성 인식기로부터 생성된 프로세스된 데이터일 수 있다.

여기에서 사용된 바와 같이, "확인하다(verify)" 또는 "확인"이라는 용어는 프로세스를 지칭하는 것으로서, 그러한 프로세스에 의해서, 원격 진료 장치의 등록된 사용자임을 표명(purport)하는 사람이 사실상의 사용자라는 것을 원격 진료 장치가 인증하게 된다. 화자 확인 프로세스에서, 원격 진료 장치는, 어떠한 사람으로부터의 하나 이상의 발언을 프로세싱하는 것에 의해서 그 사람이 표명된 사용자인지 또는 아닌지를 확인한다. 예를 들어, 만약 원격 진료 장치가 등록된 사용자 "존 스미스(John Smith)"를 인식하도록 구성된다면, 사람은 먼저 그 사람이 등록된 사용자 존 스미스라는 것을 나타내는 입력을 원격 진료 장치로 입력하고, 하나 이상의 발언을 제공하며, 상기 하나 이상의 발언은, 등록된 사용자 존 스미스로부터의 미리 결정된 목소리 모델을 이용하여 그 사람이 등록된 사용자 존 스미스인지 또는 아닌지를 확인하기 위해서 원격 진료 장치에 의해서 이용된다.

여기에서 사용된 바와 같이, "건강 팁"이라는 용어는, 환자의 건강 또는 웰-빙에 관한 조언 또는 정보와 관련된 단어 또는 문구를 지칭한다. 예를 들어, "오늘 1 마일을 걸어야 한다"라는 문구는, 환자가 실시하여야 할 운동에 관한 건강 팁이다. 일부 건강 팁은, "신선한 야채를 먹어야 한다"라는 영양에 관한 건강 팁과 같이, 거의 모든 환자에게 일반적인 것이다. 다른 건강 팁은 특정 환자에게 지시될 수 있다. 예를 들어, 약물 처방을 받는 환자에게 지시되는 건강 팁은 "적절한 시간에 약물 처방을 하여야 한다"이다. 제공된 예에서, 건강 팁의 언어가 환자의 관점(perspective)으로부터 1인칭으로 구성되어 있다. 이하에서 설명되는 바와 같이, 환자는, 원격 진료 장치를 이용하기 위한 확인 프로세스의 일부로서 하나 이상의 건강 팁을 크게 발성한다. 비록 다른 건강 팁이 다양한 형태의 문구 및 단어를 포함하지만, 환자에 대한 건강 팁의 적용성(applicability)을 강화하기 위해서, 일부 건강 팁이 1 인칭 관점으로 제공된다.

도 1은 원격 진료 장치(100)를 도시한다. 원격 진료 장치(100)는 오디오 입력 장치(104), 하나 이상의 사용자 인터페이스 장치(108), 오디오 데이터 프로세서(112), 화자 확인 모듈(116), 네트워크 입/출력(I/O) 장치(120), 제어기(124) 및 메모리(128)를 포함한다. 메모리(128)는 기록된 발언 데이터(132)의 버퍼를 위한 데이터, 저장된 프로그램 지시어(136), 등록 데이터베이스(140), 및 건강 팁 데이터베이스(144)를 저장한다. 하나의 동작 모드에서, 메모리(128)는 또한 미리 결정된 트리거 발언 데이터(134)를 저장한다. 메모리(128)는 랜덤 액세스 메모리(RAM)와 같은 하나 이상의 장치, 그리고 디지털 데이터를 저장하기 위한 자기 매체 및 솔리드-스테이트(solid-state) 데이터 저장 장치들과 같은 비-휘발성 데이터 저장 장치를 포함한다. 도 1의 예에서, 원격 진료 장치(100)가, 사람(102)이 손에 들고 다니는 이용을 위한 크기 및 형상으로 형성된 하우징(150) 내에 수용된다. 원격 진료 장치(100)는 사람(102)이 원격 진료 장치(100)의 등록된 사용자인지 확인하기 위해서 사람(102)으로부터의 발언을 수용하도록 그리고 원격 진료 장치를 동작시키기 위해서 사람(102)으로부터의 발언을 수용하도록 구성된다.

원격 진료 장치(100)는, 하우징(150) 내에 배치되는 하나 이상의 사용자 인터페이스 장치(108)를 포함한다. 사용자 인터페이스 장치는 출력 정보를 사용자에게 제공하고 사용자로부터의 입력 정보, 명령, 및 발언을 수신한다. 출력 장치의 일반적인 예에는, 액정 디스플레이(LCD)와 같은 가시적인 디스플레이 스크린 또는 다른 가시적인 디스플레이 스크린, 소리 및 합성된 음성(speech)을 방출하는 스피커, 촉각적인(haptic) 피드백 장치, 등이 포함된다. 입력 장치의 일반적인 예에는, 오디오 입력부(104)로서 또한 이용되는 마이크로폰, 키패드, 디스플레이 스크린과 통합된 터치 스크린 인터페이스, 그리고 버튼 및 스위치를 포함하는 촉지적인(tactile) 제어부가 포함된다. 특히, 사용자 인터페이스 장치(108)는, 오디오 입력부(104)에 의해서 검출되는 발언을 제공하기 위해서, 원격 진료 장치로 하여금 사람(102)에게 대사를 전달하게 할 수 있다.

원격 진료 장치(100)는 네트워크 I/O 장치(120)를 포함한다. 네트워크 I/O 장치의 일반적인 예에는, 무선 근거리 네트워크(WLAN), 무선 광역 네트워크(WWAN) 네트워크 장치와 같은 무선 데이터 통신 모듈이 포함된다. 다른 I/O 장치에는, 데이터 네트워크에 대한 접속을 제공하는 분리된 컴퓨터로 원격 진료 장치(100)를 연결하기 위한, 이더넷 장치와 같은 유선 네트워크 장치, 또는 USB 장치와 같은 직렬 장치가 포함된다. 네트워크 I/O 장치는, 원격 진료 장치(100)로 하여금, 인터넷과 같은 데이터 네트워크를 통해서, 온라인 데이터베이스 및 건강 관리 제공자와 통신할 수 있게 한다.

전형적으로, 오디오 입력부(104)는, 원격 진료 장치(100) 주위의 분위기 내의 소리를 검출할 수 있는 위치에서 하우징(150) 내에 배치되는 하나 이상의 마이크로폰을 포함한다. 상기 오디오 입력 장치(104)는 사람(102)이 발성한 발언을 검출하고 그러한 발언으로부터 오디오 데이터를 생성하는 기능을 한다. 일부 실시예에서, 오디오 데이터가 하나 이상의 마이크로폰에 의해서 생성된 아날로그 전기 신호를 포함한다. 다른 실시예에서, 오디오 입력부(104)는, 수신된 발언에 상응하는 아날로그 신호를, 기록된 소리를 나타내는, 펄스-코드 변조된(PCM) 신호 또는 다른 디지털 신호와 같은 디지털 신호로 변환하는 아날로그 대 디지털 변환기를 포함한다. 오디오 입력 장치(104)의 일부 실시예는, 신호 필터, 에코 삭제 회로, 및 오디오 데이터의 품질을 개선하는 다른 신호 처리 장치를 포함한다.

오디오 데이터 프로세서(112)는 오디오 입력 장치(104)로부터 오디오 데이터를 수신하고 오디오 데이터로부터 발언 데이터를 생성한다. 오디오 데이터 프로세서(112)는 오디오 데이터로부터 발성된 단어 및 문구를 추출하기 위해서 오디오 데이터를 프로세싱하는 음향 모델러 및 언어 모델을 포함한다. 오디오 데이터 프로세서(112) 메모리(128)에 동작적으로 연결된다. 하나의 동작 모드에서, 오디오 데이터 프로세서(112)는 생성된 발언 데이터를, 하나 이상의 트리거 문구에 상응하는 메모리(128) 내의 미리 결정된 발언 데이터(134)에 대해서 비교한다. 만약 발생된 발언 데이터가 미리 결정된 트리거 문구의 발언 데이터에 상응한다면, 제어기(124)는, 화자 확인 모듈을 포함하는, 원격 의료 장치(100) 내의 다른 구성요소를 활성화시킨다. 다른 동작 모드에서, 오디오 데이터 프로세서(112)는 생성된 발언 데이터를 건강 팁 데이터베이스(144) 내의 하나 이상의 건강 팁에 상응하는 발언 데이터에 대해서 비교한다. 오디오 데이터 프로세서(112)가 여러 가지 타입의 미리 결정된 발언 데이터에 상응하는 발언 데이터를 생성할 때, 오디오 데이터 프로세서(112)는 메모리(128) 내의 발언 데이터 버퍼(132) 내에 발언 데이터를 저장한다. 발언 데이터 버퍼(132)는, 사람(102)이 원격 의료 장치(100)에 대한 등록된 사용자인지를 확인하기 위해서 이용되는 복수의 발언 데이터의 세트를 축적한다.

화자 확인 모듈(116)이 메모리(128) 및 제어기(124)에 동작적으로 연결된다. 화자 확인 모듈(116)은 발언 데이터 버퍼(132)로부터 발언 데이터를 판독하고, 상기 발언 데이터가 원격 의료 장치(100)를 이용하는 사람의 표명된 등록 명칭과 연관된 등록 데이터베이스(140) 내에 저장된 음성 모델에 상응한다는 것을 확인한다. 발언 데이터 버퍼(132)는, 트리거 문구, 등록된 사용자 명칭, 및 하나 이상의 발성된 건강 팁에 상응하는 발언 데이터를 포함하는, 오디오 데이터 프로세서(112)에 의해서 생성된 축적된 발언 데이터를 저장한다. 하나의 실시예에서, 화자 확인 모듈(116)은, 발언 데이터 버퍼(132) 내의 발언 데이터가 등록된 사용자의 목소리 모델에 상응할 가능성에 상응하는 신뢰(confidence) 점수를 생성한다. 화자 확인 모듈(116)은 또한, 등록된 사용자 이외의 사람에 속하는 하나 이상의 목소리의 여러 가지 목소리 특성에 상응하는, 사칭자 목소리 모델에 상응하는 신뢰 점수를 생성한다. 사칭자 목소리 모델은, 모듈(116)에서 이용되는 화자 확인 방법에 따라서, 가우스 혼합 모델(GMM) 또는 다른 기술을 이용하여 여러 사람으로부터의 많은 양의 데이터에 대해서 미리 훈련된다. 원격 의료 장치(100)는 화자 확인 프로세스 중의 사용을 위해서 등록 데이터베이스(140) 내에 사칭자 목소리 모델을 저장한다.

만약 사용자의 목소리 모델에 대한 신뢰 점수가 사칭자에 대한 신뢰 점수 보다 적어도 미리 결정된 문턱값 만큼 더 높은 경우에, 화자 확인 모듈(116)은, 발언 데이터가 등록된 사용자의 목소리 모델에 상응한다는 것을 확인한다. 만약 사칭자의 목소리 모델에 대한 신뢰 점수가 등록된 사용자에 대한 신뢰 점수 보다 적어도 미리 결정된 문턱값 만큼 더 높다면, 화자 확인 모듈(116)은, 발언 데이터가 등록된 사용자의 목소리 모델에 상응하지 않는다는 것을 확인한다. 일부 경우에, 발언 데이터가 사용자의 목소리 모델에 상응하는지 또는 그렇지 않은지의 여부를 명확하게 나타내는 신뢰 점수를 생성하기 위해서 이용가능한 발언 데이터가 불충분하다. 발언 데이터 버퍼(132)에 부가되는 부가적인 발언 데이터를 생성하기 위해서 하나 이상의 건강 팁을 발성하도록 원격 의료 장치(100)가 사람(102)에게 대사를 전달하고, 상기 데이터 버퍼(132) 내의 부가적인 발언 데이터는, 화자 확인 모듈(116)이 등록된 사용자의 목소리 모델을 이용하여 사람(102)을 확인하기 위한 충분한 발언 데이터를 가질 수 있는 가능성을 증가시킨다.

등록 데이터베이스(140)는, 원격 의료 장치(100)를 사용하도록 인증된 하나 이상의 사용자에 상응하는 등록 데이터를 포함한다. 도 3은 등록 데이터베이스(300) 내에 저장된 데이터의 예를 도시한다. 등록 데이터베이스(300)는 등록된 명칭 식별자(304), 등록된 명칭(308)에 상응하는 발언 데이터, 및 등록된 사용자(312)에 상응하는 목소리 모델에 대한 발언 데이터에 상응하는 열(column)을 포함한다. 등록된 명칭 식별자(304)는, 원격 의료 장치(100)의 각각의 사용자를 식별하는 스트링(string) 또는 수치적 식별자이다. 도 3의 예에서, "IMPOSTOR(사칭자)" 명칭은, 등록된 사용자 중 한 명이 아닌 하나 이상의 목소리 모델에 상응하는 발언 데이터를 저장하는 등록 데이터베이스 내의 특별한 엔트리(entry)이다.

표(300)에서, 각각의 사용자(308)의 등록된 명칭에 대한 발언 데이터 및 각각의 사용자(312)의 목소리 모델에 대한 발언 데이터 모두는 등재(enrollment) 프로세스 중에 사용자에 의해서 발성되는 발언으로부터 획득된 발언 데이터를 포함한다. 등재 프로세스에서, 사용자는, 등록 명칭 및 일련의 훈련(training) 문구를 포함하는 하나 이상의 일련의 단어 및 문구로 이루어진 발언을 발성한다. 등록된 사용자의 목소리 모델은, 등록 명칭 및 훈련 문구로 이루어진 발언으로부터 생성된 발언 데이터를 이용하여 생성된다. 등재 프로세스는, 전형적으로, 환자가 원격 의료 장치를 받기(receive) 전에 한차례 실시된다. 원격 의료 장치(100)는 등재 프로세스를 직접적으로 실시할 수 있고, 또는 분리된 등재 시스템이 등록을 실시하고 원격 의료 장치(100)가 사용자 정보 및 생성된 목소리 모델을 수신할 수 있다. 예를 들어, 원격 의료 장치(100)는, 네트워크 I/O 장치(120)를 경유하여 인터넷(160)을 통해서 접속되는 온라인 등록 데이터베이스(170)로부터 하나 이상의 등재된 사용자에 대한 등록 데이터를 다운로드할 수 있을 것이다.

등록된 명칭(308)에 대한 발언 데이터는, 원격 의료 장치(100)를 사용하도록 등록된 사람의 등록된 명칭에 상응하는 발언 데이터를 저장한다. 등록된 명칭은 단순한 사용자의 명칭, 예를 들어 "존 스미스" 일 수 있고, 또는 특별한 로그인 명칭 및 수치적 환자 번호일 수 있을 것이다. 등록된 명칭이 설명을 위한 문장으로서 도 3에 나열되어 있으나, 등록 데이터베이스(300) 내의 이진수 발언 데이터로서 전형적으로 저장된다. 목소리 모델(312)에 대한 발언 데이터는 등록된 사용자에 의해서 제공된 복수의 발언에 상응하는 발언 데이터를 포함한다. 일부 실시예에서, 목소리 모델을 생성하기 위해서 이용된 발언 데이터가 등재 프로세스 중에 한 차례 제공된다. 다른 실시예에서, 원격 의료 장치(100)가 특별한 등록된 사용자가 발성한다는 것을 확인한 후에, 발언 데이터(312)가 새롭게 생성된 발언 데이터로 업데이트된다. 업데이트된 발언 데이터는, 원격 의료 장치(100)를 이용한 처치 중에 발생하는 사용자의 목소리의 점진적인 변화를 설명한다. 목소리 모델에 대한 발언 데이터는 전형적으로 등록 데이터베이스(140) 내에서 이진수 데이터 포맷으로 저장된다.

건강 팁 데이터베이스(144)가 복수의 건강 팁과 연관된 데이터를 포함한다. 도 4는 건강 팁 데이터베이스에 저장된 데이터의 예를 도시한다. 표(400)는 건강 팁 식별자(404), 건강 팁(408)을 발성하도록 사람에게 대사를 전달하기 위해서 이용되는 데이터, 및 발성된 건강 팁(412)에 상응하는 발언 데이터에 상응하는 열을 포함한다. 표(400) 내의 각각의 행은 단일 건강 팁에 상응하는 데이터를 나타내고, 표(400)는 전형적으로 복수의 건강 팁을 포함한다. 건강 팁 식별자는 특별한 건강 팁을 식별하는 스트링 또는 수치적 값이다. 일부 실시예에서, 원격 의료 장치(100)는, 도 3의 표(300)로부터의 등록된 명칭 식별자(304) 및 건강 팁 식별자(404)를 이용하여, 선택된 건강 팁을 특별한 환자와 연관시킨다.

건강 팁(408)을 위한 대사 전달 데이터는, 원격 의료 장치(100)로 하여금 상응하는 건강 팁을 발성하도록 사용자에게 대사 전달하는 사용자에 대한 메시지를 생성할 수 있게 하는 포맷화된 데이터를 포함한다. 도 4에 도시된 대사 전달 데이터가 문장의 형태이지만, 대사 전달 데이터는, 원격 의료 장치가 스피커를 통해서 출력하는 오디오 데이터 및 사용자 인터페이스 장치(108) 내의 스크린 상에서 디스플레이되는 가시적인 대사 전달의 형태를 포함하는 다양한 형태로 저장될 수 있다. 일부 대사 전달은, 사용자로 하여금 원격 의료 장치(100)에 대해서 역으로 반복하도록 하기 위한 문구를 제공한다. 다른 건강 팁 대사 전달은 사용자에게 단순한 질의를 제공하고 사용자는 질의에 대한 답변을 발성한다. 질의 및 답변 구성에서, 화자가 질의에 대한 답변을 기억하는 것을 돕도록, 원격 의료 장치(100)가 디스플레이 화면 상에서 답변을 디스플레이할 수 있을 것이다.

발언 데이터(412)는 특별한 건강 팁에 상응한다. 발언 데이터가 설명을 위해서 도 4에서 문장으로서 도시되어 있으나, 발언 데이터는 전형적으로 건강 팁 데이터베이스(144) 내에서 이진수 데이터 포맷으로 저장된다. 일부 실시예에서, 각각의 건강 팁에 대한 발언 데이터(412)가, 원격 의료 장치를 이용하기에 앞서서 등재 프로세스 중에 각각의 건강 팁을 발성하는 등록된 사람의 기록된 발언에 직접적으로 상응한다. 다른 실시예에서, 발언 데이터는 등록된 사용자의 목소리에 직접적으로 상응하지 않고, 그 대신에 하나 이상의 목소리에 대해서 일반적이 된다(generic). 오디오 데이터 프로세서(112)는, 발언의 오디오 데이터로부터 생성된 발언 데이터를 미리 결정된 발언 데이터(412)에 대해서 비교하여, 그 사람(102)이 대사 전달된 건강 팁을 발성한 것인지 또는 다른 문구를 발성한 것인지를 식별한다.

일부 실시예에서, 건강 팁 데이터베이스(144) 내에 저장된 원격 의료 장치(100) 검색물(retrieve)은, 네트워크 I/O 장치(120)를 경유하여 인터넷(160)을 통해서 별도의 건강 팁 데이터베이스(174)로부터 검색된다. 건강 관리 제공자는, 많은 환자에 대해서 적용될 수 있는 일반적인 건강 팁 및 특별한 등록된 사용자와 연관된 특정 건강 팁을 포함하는 여러 가지 건강 팁을 건강 팁 데이터베이스(174) 내에 배치시킨다(populate). 원격 의료 장치(100)는 건강 팁 데이터베이스(144) 내의 건강 팁을 주기적으로 업데이트하고, 그에 따라 사용자는 다양한 건강 팁을 수신한다.

도 1을 다시 참조하면, 제어기(124)가 원격 의료 장치(100)의 동작을 조정하고, 보다 특히, 원격 의료 장치와 상호작용하는 사람이 등록된 사용자라는 것을 확인하기 위해서 원격 의료 장치를 제어한다. 원격 의료 장치의 일부 실시예는, 제어기(124), 오디오 데이터 프로세서(112), 화자 확인 모듈(116), 및 네트워크 I/O 장치(120)의 일부 또는 전부의 기능을 구현하기 위해서, 프로세서, 마이크로프로세서, 필드 프로그래머블 게이트 어레이(FPGA), 주문형 집적 회로(ASIC), 또는 다른 디지털 연산 장치와 같은 단일 마이크로전자 장치를 포함한다. 제어기(124)는 메모리(128)의 저장된 프로그램 지시어 지역(136) 내에서 유지되는 소프트웨어 지시어를 실행한다. 일부 실시예에서, 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116)을 포함하는 원격 의료 장치(100) 내의 여러 구성요소가, 제어기(124)에 의해서 실행되는 소프트웨어 프로그램으로서 구현된다. 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116)의 기능을 구현하기 위한 저장된 지시어가 메모리(128)의 저장된 프로그램 지역(136) 내에 저장된다. 다른 실시예에서, 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116) 중 하나 또는 양자 모두가 디지털 신호 프로세서(DSP)와 같은 특별한 프로세싱 장치를 포함한다. 또 다른 실시예는, 하드웨어 구성요소와 소프트웨어 구성요소의 조합을 이용하여, 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116)의 기능을 실시한다. 원격 의료 장치 내의 여러 가지 마이크로전자 구성요소가 "시스템 온 칩(SoC)" 구성에서 단일 물리적 장치 내로 조합될 수 있다.

도 2는, 화자 확인 프로세스를 통해서, 원격 의료 장치의 등록된 사용자라는 것을 표명하는 사람의 신원이 등록된 사용자와 매칭되는지를 확인하기 위한 프로세스(200)를 도시한다. 프로세스(200)는 설명 목적을 위한 원격 의료 장치(100)와 함께 설명되어 있다. 이하에서 설명되는 바와 같이, 기능을 구현하거나 일부 작용을 실시하는 것으로서 설명되는 프로세스는, 기능을 구현 또는 작용을 실시하기 위해서 하나 이상의 전자적 구성요소를 동작시키기 위해서 메모리 내에 저장된 프로그램된 지시어를 실행하는 제어기를 지칭한다. 프로세스(200)는 오디오 입력 장치를 통해서 수신된 소리로부터 오디오 데이터를 생성하는 오디오 입력 장치로 시작된다(블록(204)). 원격 의료 장치(100)에서, 오디오 입력 장치(104)는 주변으로부터 소리를 수신하는 하나 이상의 마이크로폰을 포함하고, 상기 오디오 입력 장치는 수신된 소리로부터 오디오 데이터를 생성한다. 프로세스(200)는, 오디오 신호가 발언을 포함하는 경우에, 오디오로부터 발언 데이터를 생성하고(블록(212)), 상기 발언 데이터를 미리 결정된 트리거 문구에 대해서 비교한다(블록(216)). 전형적으로, 트리거 문구는, 원격 의료 장치(100)의 우발적인 활성화를 방지하기 위해서, 일상적인 대화에서 사용되지 않는 단어 또는 복수의 단어이다. 원격 의료 장치는, 사람으로 하여금 트리거 문구를 발성하도록 하기 위한 대사 전달이나 요청을 생성하지 않는다.

원격 의료 장치(100)는, 블록(204-216)에서, 사람(102)이 트리거 문구를 발성하는지에 대해서 모니터링 동작 모드 유닛에서 지속적으로 프로세스를 실시한다. 모니터링 모드에서, 원격 의료 장치 내의 여러 가지 구성요소가 비활성화되거나 원격 의료 장치(100)의 전력 소모를 감소시키는 저전력 동작 모드로 위치된다. 배터리를 통해서 동작하는 원격 의료 장치의 실시예에서, 저전력 모드는 원격 의료 장치의 배터리 수명을 연장시킨다. 원격 의료 장치(100)는, 오디오 데이터 프로세서(112)가 트리거 발언 데이터(134)에 상응하는 오디오 신호로부터 발언 데이터를 생성할 때, 프로세스(200)를 계속 진행한다.

프로세스(200)에서, 트리거 문구에 상응하는 발언 데이터가, 화자의 신원을 확인하기 위한 추후의 이용을 위해서, 메모리 내에 저장된다(블록(220)). 원격 의료 장치(100)에서, 발언 데이터가 발언 데이터 버퍼(132) 내에 저장된다. 트리거 문구를 수신한 후에, 프로세스(200)는 화자로 하여금 등록된 사용자의 등록 명칭을 말하도록(state) 하는 대사 전달을 생성한다((블록 (224)). 원격 의료 장치(100)는 스피커를 이용하여 가청적인 대사 전달을 생성할 수 있고 또는 사람(102)으로 하여금 사용자 명칭을 발성하도록 하는 요청을 가시적으로 디스플레이할 수 있다.

원격 의료 장치는 발성된 등록된 명칭에 상응하는 오디오 데이터를 생성하고(블록(232)), 등록된 명칭의 오디오 데이터에 상응하는 발언 데이터를 생성한다(블록(236)). 원격 의료 장치(100)에서, 만약 사람(102)이 등록 데이터베이스(140) 내의 하나의 사용자에 상응하는 등록된 명칭을 제공하지 않는다면(블록(238)), 원격 의료 장치(100)는 등록된 사용자의 명칭을 반복하도록 화자에게 대사 전달하거나 트리거 문구를 모니터링하기 위해서 블록(204)에서 설명된 프로세싱으로 복귀한다. 등록된 사용자의 명칭에 상응하는 발언 데이터를 수신한 후에(블록(238)), 프로세스(200)는 등록된 사용자의 명칭에 상응하는 발언 데이터를 메모리 내에 저장한다(블록(240)). 원격 의료 장치(100)에서, 등록된 명칭에 상응하는 발언 데이터가, 트리거 문구로부터의 발언 데이터에 더하여, 발언 데이터 버퍼(132) 내에 저장된다.

프로세스(200)는, 등록된 명칭에 상응하는 사용자의 미리 결정된 목소리 모델을 이용하여 메모리 내에 저장된 발언 데이터의 확인을 위한 하나 이상의 신뢰 점수를 생성한다(블록(244)). 원격 의료 장치(100) 내의 화자 확인 모듈(116)은 발언 데이터 버퍼(132)로부터의 기록된 발언 데이터 및 등록된 데이터베이스(140)로부터의 등록된 사용자의 목소리 모델에 상응하는 발언 데이터를 추출한다. 일부 실시예에서, 등록 데이터베이스(140)는 하나 초과의 사용자에 대한 음성 모델을 저장하고, 프로세스(200)는 원격 의료 장치(100)를 사용하도록 등록된 상이한 사용자들을 구분하기 위해서 발성된 등록 명칭에 상응하는 사용자를 선택한다. 화자 확인 모듈(116)은 또한 등록 데이터베이스(140) 내의 사칭자로부터의 발언 데이터를 추출한다.

일부 경우에, 트리거 문구 및 등록 명칭에 대한 발언 데이터를 이용하여, 사람(102)이 등록된 명칭을 가지는 사용자인지를 명확하게 식별하는 신뢰 점수를 화자 확인 모듈(116)이 충분히 생성할 수 있다(블록(248)). 프로세스(200)는, 축적된 데이터량을 이용하여, 블록(244)의 프로세싱에서 식별되는 신뢰 점수의 신뢰성을 측정한다. 등록된 사용자 목소리 모델에 대한 신뢰 점수가 사칭자 모델에 대한 신뢰 점수 보다 미리 결정된 문턱값 만큼 더 높다는 것을 화자 확인 모듈(116)이 확인한 경우(블록(256)), 원격 의료 장치(100)는 그 사람(102)이 등록된 명칭을 가지는 사용자라는 것을 확인하고(블록(260)), 원격 의료 장치(100)는 그 사용자에게 서비스를 제공한다(블록(264)).

발언 데이터가 사칭자에 상응한다는 것을 나타내는 신뢰 점수를 화자 확인 모듈(116)이 확인한 경우에(블록(256)), 화자 확인 모듈(116)은, 사람(102)이 등록된 사용자가 아니라는 것을 식별하고(블록(292)), 원격 의료 장치(100)는 사칭자에 대한 원격 의료 서비스를 거부한다(블록(296)). 일부 구성에서, 원격 의료 장치(100)는 실패한 확인 시도를 계속적으로 계수하고, 그 계수가 미리 결정된 문턱값을 초과하는 경우에, 원격 의료 장치는 사용자 확인을 위한 어떠한 부가적인 시도도 차단한다. 예를 들어, 사람이 사칭자라는 결과를 각각 초래한, 원격 의료 장치를 이용한 사람 확인을 위한 3번의 연속적인 시도가 있는 경우에, 원격 의료 장치는 건강 관리 전문가가 그 장치를 리셋할 때까지 어떠한 사용자도 차단하게 된다.

일부 경우에, 화자 확인 모듈(116)은, 사람(102)이 등록된 사용자인지 또는 아닌지를 확인하기에 충분하지 않은 신뢰 점수를 생성한다(블록(248)). 예를 들어, 등록된 사용자의 목소리 모델 및 사칭자 목소리 모델 모두로부터 생성된 신뢰 점수가 미리 결정된 문턱값 이하인 경우에 또는 양 신뢰 점수가 서로의 미리 결정된 범위 내에 있는 경우에, 화자 확인 모듈(116)은 확인 실시를 위한 부가적인 발언 데이터를 요청할 수 있을 것이다. 다른 예에서, 불충분한 양의 발언 데이터로부터 생성된 높은 또는 낮은 신뢰 점수가 낮은 신뢰성을 가진다. 프로세스(200)는, 화자를 확인하기 위한 충분한 신뢰성 정도로 신뢰 점수를 생성하기 위해서 부가적인 발언 데이터를 수집한다.

부가적인 발언 데이터를 생성하기 위해서, 프로세스(200)는 사람(102)으로 하여금 건강 팁을 발성하도록 대사 전달한다(블록(272)). 원격 의료 장치는 건강 팁 데이터베이스(144)로부터 건강 팁을 선택하고 사람(102)을 위한 오디오 또는 가시적 대사 전달을 생성한다. 오디오 입력부(104)는 발성된 건강 팁에 상응하는 오디오 데이터를 생성하고(블록(276)), 오디오 데이터 프로세서(112)는 오디오 데이터로부터 발언 데이터를 생성한다(블록(280)). 오디오 데이터 프로세서(112)는 생성된 발언 데이터를, 건강 팁 데이터베이스(144) 내에 저장된 선택된 건강 팁에 대한 미리 결정된 발언 데이터에 대해서 비교한다.

만약 생성된 발언 데이터가 건강 팁에 상응하지 않는다면(블록(282)), 원격 의료 장치(100)는 사람으로 하여금 건강 팁을 발성하도록 대사 전달을 반복한다(블록(272)). 원격 의료 장치(100)는, 프로세싱(200) 동안에 생성된 발언 데이터가 대사 전달된 건강 팁에 상응하지 않는 횟수를 지속적으로 계수한다. 만약 계수가 미리 결정된 최대 숫자를 초과한다면(블록(283)), 장치(100)는 사용자 인터페이스를 이용하여 대안적인 확인을 위한 대사를 전달한다(블록(298)). 예를 들어, 만약 사용자가 3번의 연속적인 횟수 동안 건강 팁에 대한 정확한 응답을 제공할 수 없다면, 장치(100)는 대안적인 확인을 요청한다. 만약 생성된 발언 데이터가 건강 팁에 상응한다면(블록(282)), 생성된 발언 데이터가 발언 데이터 버퍼(132) 내에 저장된다(블록(284)). 이어서, 프로세스(200)가 블록(244)으로 복귀되어, 건강 팁으로부터의 발언 데이터를 포함하는 축적된 발언 데이터의 모두를 이용하여 화자 확인을 실시한다.

일부 경우에, 프로세스(200)는, 사람(102)이 등록된 사용자인지를 확인하기 위한 충분한 발언 데이터가 수집될 때까지, 복수의 건강 팁을 대사 전달한다. 원격 의료 장치(100)는, 다양한 발언 데이터를 화자 확인 모듈(116)로 제공하기 위해서 각각의 반복 중에 상이한 건강 팁에 대한 대사를 전달한다. 프로세스(200)는, 사용자 확인 프로세스 중에 수용되는 건강 팁의 수에 대한 제한을 실시한다(블록(268)). 예를 들어, 만약 프로세스(200)가 5개의 건강 팁에 상응하는 발언 데이터를 수신하였으나 사람(102)이 등록된 사용자인지를 확인하기 위한 충분한 발언 데이터가 여전히 부족한 경우에, 화자 확인 프로세스(200)가 종료되고, 원격 의료 장치(100)는 대안적인 확인 프로세스를 이용한다(블록(298)). 하나의 대안적인 확인 프로세스에서, 원격 의료 장치는 사용자 인터페이스(108) 내의 디스플레이 스크린 상에서 로그인 대사 전달을 생성하고, 사람(102)이 키패드를 통해서 사용자 명칭 및 암호를 입력한다.

원격 의료 장치(100) 및 확인 프로세스(200)는 단순하고 효과적인 확인 과정을 환자에게 제공한다. 원격 의료 장치(100)가, 사람이 등록된 사용자인지를 확인하기 위해서, 초기 트리거 문구를 포함하여, 사람으로부터 수신된 유효 발언 데이터의 전부를 이용하기 때문에, 원격 의료 장치(100)는 최소 수의 음성 샘플을 이용하여 사용자를 효과적으로 확인할 수 있다. 부가적으로, 건강 팁 음성 샘플은 확인 프로세스 중에 건강에 관한 조언을 환자에게 제공하고, 그에 따라 초기 확인 프로세스 중에도 각각의 환자에게 제공되는 의료적인 이득을 증가시킨다.

도면 및 전술한 설명에서 본원 발명을 구체적으로 도시하고 설명하였지만, 이는 예시적인 것으로 간주되어야 하고 특징을 제한하지 않는 것으로 간주되어야 한다. 예를 들어, 여기에서 설명된 음성의 예가 한국어로 기술되어 있지만, 원격 의료 장치(100)가 다양한 범위의 언어로부터 음성을 인식하고 발언 데이터를 생성하도록 구성될 수 있을 것이다. 바람직한 실시예만이 제시되었다는 것, 그리고 본원 발명의 사상으로부터의 모든 변경, 수정 및 추가적인 적용의 보호를 원한다는 것을 이해할 수 있을 것이다.

Claims

사람의 신원을 확인하기 위한 방법이며,
오디오 입력 장치를 이용하여, 사람이 발성한 발언에 상응하는 오디오 데이터를 생성하는 단계;
오디오 데이터 프로세서를 이용하여 상기 오디오 데이터 내의 제1발언 데이터를 식별하는 단계;
미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 등록 명칭을 발성하도록 사람에게 대사 전달하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계;
상기 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 메모리 내에 상기 식별된 제1발언 데이터를 저장하는 단계;
상기 오디오 입력 장치를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하는 단계;
오디오 데이터 프로세서를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하는 단계;
상기 식별된 제2발언 데이터를 메모리 내에 저장하는 단계;
화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 단계; 및
상기 사람이 상기 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 포함하는
사람의 신원을 확인하기 위한 방법.
제1항에 있어서,
상기 메모리 내의 제1 및 제2발언 데이터가 사용자의 목소리의 미리 결정된 모델을 이용하여 사람을 확인하는데 있어서 불충분하다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 미리 결정된 문구를 발성하도록 사람에게 대사를 전달하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계;
상기 음성 입력 장치를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터를 생성하는 단계;
상기 오디오 데이터 프로세서를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터 내의 제3발언 데이터를 식별하는 단계;
상기 제3발언 데이터를 상기 메모리 내에 저장하는 단계; 및
화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 단계를 더 포함하는
사람의 신원을 확인하기 위한 방법.
제2항에 있어서,
상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하는 제3발언 데이터에 응답하여 제3발언 데이터를 상기 메모리 내에 저장하는 단계를 더 포함하는
사람의 신원을 확인하기 위한 방법.
제2항에 있어서,
상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하지 않는 제3발언 데이터에 응답하여 제 2 시간에 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 더 포함하는
사람의 신원을 확인하기 위한 방법.
제2항에 있어서,
상기 사용자 인터페이스 장치는 미리 결정된 문구로서 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하는
사람의 신원을 확인하기 위한 방법.
제5항에 있어서,
상기 사용자 인터페이스 장치는, 상기 등록 데이터베이스 내의 등록 명칭과 연관된 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하는
사람의 신원을 확인하기 위한 방법.
제2항에 있어서,
화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성하는 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하지 않는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 확인하는 단계; 및
상기 등록 명칭을 발성하는 사람이 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 상기 화자 확인 모듈이 확인하는 것에 응답하여 상기 사람에 대한 서비스를 거부하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 더 포함하는
사람의 신원을 확인하기 위한 방법.
제2항에 있어서,
상기 사용자의 목소리의 미리 결정된 모델을 이용하여 사람을 확인하는데 있어서 상기 메모리 내의 제1, 제2 및 제3발언 데이터가 충분하지 않다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 적어도 하나의 부가적인 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 것을 계속하는 단계;
오디오 입력 장치를 이용하여, 사람이 발성한 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터를 생성하는 단계;
오디오 데이터 프로세서를 이용하여 상기 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터에서 적어도 하나의 부가적인 발언 데이터를 식별하는 단계;
적어도 하나의 부가적인 발언 데이터를 메모리 내에 저장하는 단계;
상기 화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2, 제3, 및 적어도 하나의 부가적인 발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 단계를 더 포함하는
사람의 신원을 확인하기 위한 방법.
제8항에 있어서,
미리 결정된 문턱값을 초과하는 다수의 부가적인 발언 데이터가 메모리 내에 저장된 후에 상기 사람이 사용자라는 것을 화자 확인 모듈이 확인하는데 있어서 불충분한 발언 데이터를 가지는 메모리에 응답하여 상기 사람이 상기 등록 데이터베이스 내의 등록 명칭과 연관된 사용자라는 것을 상기 화자 확인 모듈이 확인할 수 없다는 것을 식별하는 단계를 더 포함하는
사람의 신원을 확인하기 위한 방법.
제9항에 있어서,
상기 사람이 등록 데이터베이스 내의 등록 명칭과 연관된 사용자라는 것을 상기 화자 확인 모듈이 확인할 수 없다는 것에 응답하여 상기 오디오 입력 장치와 상이한 사용자 입력 장치를 이용하여 사람의 확인을 위한 정보를 입력하도록, 사용자 인터페이스 장치를 이용하여 사람에게 대사를 전달하는 단계를 더 포함하는
사람의 신원을 확인하기 위한 방법.
화자 확인되는 원격 진료 장치이며,
사람이 발성한 발언으로부터 오디오 데이터를 생성하는 오디오 입력 장치;
상기 오디오 입력 장치에 동작적으로 연결되고 상기 오디오 입력 장치에 의해서 생성된 오디오 데이터로부터 발언 데이터를 생성하도록 구성된 오디오 데이터 프로세서;
상기 오디오 데이터 프로세서에 의해서 생성된 복수의 발언 데이터를 저장하도록 구성된 메모리;
적어도 하나의 사용자를 적어도 하나의 사용자에 상응하는 등록 명칭 및 목소리 모델과 연관시키도록 구성된 등록 데이터베이스;
상기 메모리 및 상기 등록 데이터베이스에 동작적으로 연결된 화자 확인 모듈;
사용자 인터페이스 장치; 및
상기 오디오 입력 장치, 오디오 데이터 프로세서, 메모리, 등록 데이터베이스, 화자 확인 모듈, 및 사용자 인터페이스 장치에 동작적으로 연결된 제어기를 포함하고,
상기 제어기는:
사람에 의해서 발성된 발언을 포함하는 소리를 수신하기 위해서 그리고 상기 사람으로 하여금 발성하도록 대사를 전달하지 않고 상기 발언에 상응하는 오디오 데이터를 생성하기 위해서 상기 오디오 입력 장치를 활성화시키도록;
상기 오디오 데이터 프로세서를 이용하여 상기 사람이 발성한 발언에 상응하는 오디오 데이터 내의 제1발언 데이터를 식별하도록;
상기 식별된 제1발언 데이터를 상기 메모리 내에 저장하도록;
미리 결정된 트리거 발언에 상응하는 제1발언 데이터에 응답하여 등록 명칭을 발성하도록 사람에게 대사를 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록;
상기 오디오 입력 장치를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하도록;
상기 오디오 데이터 프로세서를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하도록;
상기 식별된 제2발언을 메모리 내에 저장하도록;
화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성한 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내의 등록된 사용자라는 것을 확인하도록; 그리고
상기 등록 명칭을 발성한 사람이 사용자라는 것을 확인한 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록 구성되는, 원격 진료 장치.
제11항에 있어서,
상기 제어기는,
상기 메모리 내의 제1 및 제2발언 데이터가 사용자의 목소리의 미리 결정된 모델을 이용하여 사람을 확인하는데 있어서 불충분하다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 미리 결정된 문구를 발성하도록 사람에게 대사를 전달하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하도록;
상기 음성 입력 장치를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터를 생성하도록;
상기 오디오 데이터 프로세서를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터 내의 제3발언 데이터를 식별하도록;
상기 제3발언 데이터를 상기 메모리 내에 저장하도록; 그리고
화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성한 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하도록; 추가적으로 구성되는, 원격 진료 장치.
제12항에 있어서,
상기 오디오 데이터 프로세서는,
상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하는 제3발언 데이터에 응답하여 제3발언 데이터를 상기 메모리 내에 저장하도록 추가적으로 구성되는, 원격 진료 장치.
제12항에 있어서,
상기 제어기는,
상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하지 않는 제3발언 데이터에 응답하여 제 2 시간에 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록 추가적으로 구성되는, 원격 진료 장치.
제12항에 있어서,
상기 사용자 인터페이스 장치는,
상기 미리 결정된 문구로서 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하도록 추가적으로 구성되는, 원격 진료 장치.
제15항에 있어서,
상기 사용자 인터페이스 장치는,
상기 등록 데이터베이스 내의 등록 명칭과 연관된 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하도록 추가적으로 구성되는, 원격 진료 장치.
제12항에 있어서,
상기 제어기는,
상기 화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성하는 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하지 않는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 확인하도록; 그리고
상기 등록 명칭을 발성하는 사람이 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 상기 화자 확인 모듈이 확인하는 것에 응답하여 상기 사람에 대한 서비스를 거부하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하도록, 추가적으로 구성되는, 원격 진료 장치.
제12항에 있어서,
상기 제어기는,
상기 등록 데이터베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 상기 메모리 내의 제1, 제2 및 제3발언 데이터를 확인하는데 있어서 상기 메모리 내에 저장된 제1, 제2 및 제3발언 데이터가 불충분하다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 적어도 하나의 부가적인 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록;
상기 오디오 입력 장치를 이용하여, 사람이 발성한 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터를 생성하도록;
상기 오디오 데이터 프로세서를 이용하여 상기 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터에서 적어도 하나의 부가적인 발언 데이터를 식별하도록;
적어도 하나의 부가적인 발언 데이터를 메모리 내에 저장하도록; 그리고
상기 화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2, 제3, 및 적어도 하나의 부가적인 발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하도록 추가적으로 구성되는, 원격 진료 장치.
제18항에 있어서,
상기 제어기는,
미리 결정된 문턱값을 초과하는 다수의 부가적인 발언 데이터가 메모리 내에 저장된 후에 상기 사람이 사용자라는 것을 화자 확인 모듈이 확인하는데 있어서 불충분한 발언 데이터를 가지는 메모리에 응답하여 상기 사람이 상기 등록 데이터베이스 내의 등록 명칭과 연관된 사용자라는 것을 상기 화자 확인 모듈이 확인할 수 없다는 것을 식별하도록 추가적으로 구성되는, 원격 진료 장치.
제19항에 있어서,
상기 제어기는,
상기 사람이 등록 데이터베이스 내의 등록 명칭과 연관된 사용자가 아니라는 것을 상기 화자 확인 모듈이 확인하는 것에 응답하여 상기 오디오 입력 장치와 상이한 사용자 입력 장치를 이용하여 사람의 확인을 위한 정보를 입력하도록, 사용자 인터페이스 장치를 이용하여, 사람에게 대사를 전달하도록 추가적으로 구성되는, 원격 진료 장치.
제11항에 있어서,
상기 오디오 입력 장치, 오디오 데이터 프로세서, 메모리, 등록 데이터베이스, 화자 확인 모듈, 사용자 인터페이스 장치, 및 제어기가 내부에 배치되는 손에 들고 다니는 하우징을 더 포함하는, 원격 진료 장치.