KR20140137343A - 건강 모니터링 시스템에서의 화자 확인 - Google Patents

건강 모니터링 시스템에서의 화자 확인 Download PDF

Info

Publication number
KR20140137343A
KR20140137343A KR20147021283A KR20147021283A KR20140137343A KR 20140137343 A KR20140137343 A KR 20140137343A KR 20147021283 A KR20147021283 A KR 20147021283A KR 20147021283 A KR20147021283 A KR 20147021283A KR 20140137343 A KR20140137343 A KR 20140137343A
Authority
KR
South Korea
Prior art keywords
person
user
utterance
memory
data
Prior art date
Application number
KR20147021283A
Other languages
English (en)
Other versions
KR101986867B1 (ko
Inventor
푸량 웽
타우픽 하산
쯔어 펭
Original Assignee
로베르트 보쉬 게엠베하
푸량 웽
타우픽 하산
쯔어 펭
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 로베르트 보쉬 게엠베하, 푸량 웽, 타우픽 하산, 쯔어 펭 filed Critical 로베르트 보쉬 게엠베하
Publication of KR20140137343A publication Critical patent/KR20140137343A/ko
Application granted granted Critical
Publication of KR101986867B1 publication Critical patent/KR101986867B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/10Multimodal systems, i.e. based on the integration of multiple recognition engines or fusion of expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

사람이 원격 진료 장치를 사용하도록 등록되었다는 것을 확인하기 위한 방법이 사람이 발성한 그리고 원격 진료 장치에 의해서 수신된 단어 내에서 대사 전달되지 않은 트리거 문구를 식별하는 단계를 포함한다. 원격 진료 장치는 등록된 사용자의 명칭을 말하도록 사람에게 대사 전달하고, 선택적으로, 사람에 대한 건강 팁을 말하도록 사람에게 대사 전달한다. 원격 진료 장치는, 대사 전달되지 않은 트리거 문구, 등록된 사용자의 명칭, 및 건강 팁으로부터 생성된 발언 데이터를 이용하여, 해당 사람이 등록된 사용자라는 것을 확인한다.

Description

건강 모니터링 시스템에서의 화자 확인{SPEAKER VERIFICATION IN A HEALTH MONITORING SYSTEM}
본원은 일반적으로 자동화된 음성(speech) 인식 분야에 관한 것이고, 보다 특히 화자를 확인하는 음성 인식 시스템 및 방법에 관한 것이다.
원격 진료 및 가정 건강 관리 분야가 최근에 급격하게 성장하였다. 원격 진료 시스템에서, 환자는 의사 또는 다른 건강 관리 제공자의 장소로부터 지리적으로 떨어져 있다. 예를 들어, 환자가 건강 관리 시설 내의 장소 대신에 집에 있을 수 있을 것이다. 원격 진료 장치는, 환자가 건강 관리 시설로 이동할 필요가 없이, 건강 관리 제공자로 하여금 환자의 건강 상태를 모니터링할 수 있게 하고 일부 의료 문제를 진단 및 처치(treat)할 수 있게 한다. 원격 진료 시스템의 이용은 건강 관리의 비용을 줄일 수 있는, 그리고 증가된 환자 모니터링을 통한 건강 관리의 품질을 향상시킬 수 있는 가능성을 가진다.
여러 가지 공지된 원격 진료 시스템은, 환자가 의료 데이터를 의사 또는 건강 관리 제공자에게 전송할 수 있게 하는 장치를 제공한다. 일부 장치는 심박수, 혈압, 호흡수와 같은 생체 신호를 기록하도록 그리고 기록된 생체 신호의 데이터를 추후의 검토를 위한 데이터베이스로 전송하도록 구성된다. 다른 원격 진료 시스템은, 처방된 시간에 약물을 복용하도록 환자를 환기(remind)시킬 수 있거나 물리적 치료(therapy) 체제(regime)의 일부로서 운동을 실시하도록 환자를 환기시킬 수 있다.
원격 진료 시스템이 많은 잠재적인 장점을 가지지만, 그러한 시스템은 또한, 건강 관리 전문가의 보조 없이 원격 진료 장치들을 이용하는 환자에게 어려울 수 있다. 직관적인 사용자 인터페이스를 제공하는 것은 원격 진료 장치의 효과를 높이고, 또한, 환자가 원격 진료 장치를 성실하게 이용할 가능성을 증가시킨다. 일부 환경에서, 원격 진료 장치는 또한, 각각의 환자에 대한 적절한 처치를 제공하기 위해서 상이한 환자들 사이에서 구분할 필요가 있다. 예를 들어, 은퇴 사회에서, 환자의 큰 그룹이 원격 진료 장치를 이용할 수 있을 것이고, 또는 동일한 가족의 일부 구성원이 상이한 처치를 위해서 원격 진료 장치를 이용할 수 있을 것이다. 원격 진료의 일부 형태는, 휴대가 가능한 그리고 환자들 사이에서 우발적으로 바뀔 수 있는 손에 들고 다니는 유닛(handheld unit)이다. 그에 따라, 환자와 장치 사이의 상호작용을 용이하게 하기 위해서 그리고 원격 진료 장치가 각각의 환자에 대한 적절한 처치를 제공하도록 하기 위해서 원격 진료 장치를 개선하는 것이 유리할 것이다.
일 실시예에 따라서, 사람의 신원을 확인하기 위한 방법이 개발되었다. 그러한 방법은, 오디오(audio) 입력 장치를 이용하여, 사람이 발성한 발언(utterance)에 상응하는 오디오 데이터를 생성하는 단계, 오디오 데이터 프로세서를 이용하여 오디오 데이터 내의 제1발언 데이터를 식별하는 단계, 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 등록 명칭(registration name)을 발성하도록 사람에게 대사를 전달(prompt)하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계, 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 메모리 내에 상기 식별된 제1발언 데이터를 저장하는 단계, 오디오 입력 장치를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하는 단계, 오디오 데이터 프로세서를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하는 단계, 상기 식별된 제2발언 데이터를 메모리 내에 저장하는 단계, 화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리(voice)의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내의 등록된 사용자라는 것을 확인하는 단계, 및 상기 사람이 상기 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 포함한다.
다른 실시예에 따라서, 화자 확인되는 원격 진료 장치가 개발되었다. 원격 진료 장치는 사람이 발성한 발언으로부터 오디오 데이터를 생성하는 오디오 입력 장치, 상기 오디오 입력 장치에 동작적으로 연결되고 상기 오디오 입력 장치에 의해서 생성된 오디오 데이터로부터 발언 데이터를 생성하도록 구성된 오디오 데이터 프로세서, 상기 오디오 데이터 프로세서에 의해서 생성된 복수의 발언 데이터를 저장하도록 구성된 메모리, 적어도 하나의 사용자를 적어도 하나의 사용자에 상응하는 등록 명칭 및 목소리 모델과 연관시키도록 구성된 등록 데이터베이스, 상기 메모리 및 상기 등록 데이터베이스에 동작적으로 연결된 화자 확인 모듈, 사용자 인터페이스 장치, 및 상기 오디오 입력 장치, 오디오 데이터 프로세서, 메모리, 등록 데이터베이스, 화자 확인 모듈, 및 사용자 인터페이스 장치에 동작적으로 연결된 제어기를 포함한다. 상기 제어기는 사람에 의해서 발성된 발언을 포함하는 소리를 수신하기 위해서 그리고 상기 사람으로 하여금 발성하도록 대사를 전달하지 않고 상기 발언에 상응하는 오디오 데이터를 생성하기 위해서 상기 오디오 입력 장치를 활성화시키도록, 상기 오디오 데이터 프로세서를 이용하여 상기 사람이 발성한 발언에 상응하는 오디오 데이터 내의 제1발언 데이터를 식별하도록, 상기 식별된 제1발언 데이터를 상기 메모리 내에 저장하도록, 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 등록 명칭을 발성하도록 사람에게 대사를 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록, 상기 오디오 입력 장치를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하도록, 상기 오디오 데이터 프로세서를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하도록, 상기 식별된 제2발언을 메모리 내에 저장하도록, 화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성한 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내의 등록된 사용자라는 것을 확인하도록, 및 상기 등록 명칭을 발성한 사람이 사용자라는 것을 확인하는 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록 구성된다.
도 1은 환자에 의해서 이용되는 손에 들고 다니는 원격 진료 장치의 개략도이다.
도 2는 사람이 원격 진료 장치의 등록된 사용자라는 것을 확인하기 위한 프로세스의 블록도이다.
도 3은 원격 진료 장치와 함께 이용되는 등록 데이터베이스의 예이다.
도 4는 원격 진료 장치와 함께 이용되는 건강 팁(health tip) 데이터베이스의 예이다.
여기에서 개시된 시스템 및 프로세스에 대한 상세 내용의 전반적인 이해를 위해서, 본원 명세서 전체를 통해서 도면을 참조한다. 도면에서, 유사한 참조 번호는 유사한 요소를 나타낸다. 여기에서 사용된 바와 같이, "발언"이라는 용어는, 단어 및 문구를 포함한, 사람에 의해서 발성된 모든 것을 지칭한다. "발언 데이터"라는 용어는 하나 이상의 발언에 상응하는 데이터를 지칭한다. 발언 데이터는 발언의 직접적인 소리 기록에 상응할 수 있고, 또는, 전형적으로, 디지털 신호 프로세서, 음향 모델러(modeler), 및 언어 모델과 같은, 프론트 엔드 프로세서(front-end processor)를 포함하는, 음성 인식기로부터 생성된 프로세스된 데이터일 수 있다.
여기에서 사용된 바와 같이, "확인하다(verify)" 또는 "확인"이라는 용어는 프로세스를 지칭하는 것으로서, 그러한 프로세스에 의해서, 원격 진료 장치의 등록된 사용자임을 표명(purport)하는 사람이 사실상의 사용자라는 것을 원격 진료 장치가 인증하게 된다. 화자 확인 프로세스에서, 원격 진료 장치는, 어떠한 사람으로부터의 하나 이상의 발언을 프로세싱하는 것에 의해서 그 사람이 표명된 사용자인지 또는 아닌지를 확인한다. 예를 들어, 만약 원격 진료 장치가 등록된 사용자 "존 스미스(John Smith)"를 인식하도록 구성된다면, 사람은 먼저 그 사람이 등록된 사용자 존 스미스라는 것을 나타내는 입력을 원격 진료 장치로 입력하고, 하나 이상의 발언을 제공하며, 상기 하나 이상의 발언은, 등록된 사용자 존 스미스로부터의 미리 결정된 목소리 모델을 이용하여 그 사람이 등록된 사용자 존 스미스인지 또는 아닌지를 확인하기 위해서 원격 진료 장치에 의해서 이용된다.
여기에서 사용된 바와 같이, "건강 팁"이라는 용어는, 환자의 건강 또는 웰-빙에 관한 조언 또는 정보와 관련된 단어 또는 문구를 지칭한다. 예를 들어, "오늘 1 마일을 걸어야 한다"라는 문구는, 환자가 실시하여야 할 운동에 관한 건강 팁이다. 일부 건강 팁은, "신선한 야채를 먹어야 한다"라는 영양에 관한 건강 팁과 같이, 거의 모든 환자에게 일반적인 것이다. 다른 건강 팁은 특정 환자에게 지시될 수 있다. 예를 들어, 약물 처방을 받는 환자에게 지시되는 건강 팁은 "적절한 시간에 약물 처방을 하여야 한다"이다. 제공된 예에서, 건강 팁의 언어가 환자의 관점(perspective)으로부터 1인칭으로 구성되어 있다. 이하에서 설명되는 바와 같이, 환자는, 원격 진료 장치를 이용하기 위한 확인 프로세스의 일부로서 하나 이상의 건강 팁을 크게 발성한다. 비록 다른 건강 팁이 다양한 형태의 문구 및 단어를 포함하지만, 환자에 대한 건강 팁의 적용성(applicability)을 강화하기 위해서, 일부 건강 팁이 1 인칭 관점으로 제공된다.
도 1은 원격 진료 장치(100)를 도시한다. 원격 진료 장치(100)는 오디오 입력 장치(104), 하나 이상의 사용자 인터페이스 장치(108), 오디오 데이터 프로세서(112), 화자 확인 모듈(116), 네트워크 입/출력(I/O) 장치(120), 제어기(124) 및 메모리(128)를 포함한다. 메모리(128)는 기록된 발언 데이터(132)의 버퍼를 위한 데이터, 저장된 프로그램 지시어(136), 등록 데이터베이스(140), 및 건강 팁 데이터베이스(144)를 저장한다. 하나의 동작 모드에서, 메모리(128)는 또한 미리 결정된 트리거 발언 데이터(134)를 저장한다. 메모리(128)는 랜덤 액세스 메모리(RAM)와 같은 하나 이상의 장치, 그리고 디지털 데이터를 저장하기 위한 자기 매체 및 솔리드-스테이트(solid-state) 데이터 저장 장치들과 같은 비-휘발성 데이터 저장 장치를 포함한다. 도 1의 예에서, 원격 진료 장치(100)가, 사람(102)이 손에 들고 다니는 이용을 위한 크기 및 형상으로 형성된 하우징(150) 내에 수용된다. 원격 진료 장치(100)는 사람(102)이 원격 진료 장치(100)의 등록된 사용자인지 확인하기 위해서 사람(102)으로부터의 발언을 수용하도록 그리고 원격 진료 장치를 동작시키기 위해서 사람(102)으로부터의 발언을 수용하도록 구성된다.
원격 진료 장치(100)는, 하우징(150) 내에 배치되는 하나 이상의 사용자 인터페이스 장치(108)를 포함한다. 사용자 인터페이스 장치는 출력 정보를 사용자에게 제공하고 사용자로부터의 입력 정보, 명령, 및 발언을 수신한다. 출력 장치의 일반적인 예에는, 액정 디스플레이(LCD)와 같은 가시적인 디스플레이 스크린 또는 다른 가시적인 디스플레이 스크린, 소리 및 합성된 음성(speech)을 방출하는 스피커, 촉각적인(haptic) 피드백 장치, 등이 포함된다. 입력 장치의 일반적인 예에는, 오디오 입력부(104)로서 또한 이용되는 마이크로폰, 키패드, 디스플레이 스크린과 통합된 터치 스크린 인터페이스, 그리고 버튼 및 스위치를 포함하는 촉지적인(tactile) 제어부가 포함된다. 특히, 사용자 인터페이스 장치(108)는, 오디오 입력부(104)에 의해서 검출되는 발언을 제공하기 위해서, 원격 진료 장치로 하여금 사람(102)에게 대사를 전달하게 할 수 있다.
원격 진료 장치(100)는 네트워크 I/O 장치(120)를 포함한다. 네트워크 I/O 장치의 일반적인 예에는, 무선 근거리 네트워크(WLAN), 무선 광역 네트워크(WWAN) 네트워크 장치와 같은 무선 데이터 통신 모듈이 포함된다. 다른 I/O 장치에는, 데이터 네트워크에 대한 접속을 제공하는 분리된 컴퓨터로 원격 진료 장치(100)를 연결하기 위한, 이더넷 장치와 같은 유선 네트워크 장치, 또는 USB 장치와 같은 직렬 장치가 포함된다. 네트워크 I/O 장치는, 원격 진료 장치(100)로 하여금, 인터넷과 같은 데이터 네트워크를 통해서, 온라인 데이터베이스 및 건강 관리 제공자와 통신할 수 있게 한다.
전형적으로, 오디오 입력부(104)는, 원격 진료 장치(100) 주위의 분위기 내의 소리를 검출할 수 있는 위치에서 하우징(150) 내에 배치되는 하나 이상의 마이크로폰을 포함한다. 상기 오디오 입력 장치(104)는 사람(102)이 발성한 발언을 검출하고 그러한 발언으로부터 오디오 데이터를 생성하는 기능을 한다. 일부 실시예에서, 오디오 데이터가 하나 이상의 마이크로폰에 의해서 생성된 아날로그 전기 신호를 포함한다. 다른 실시예에서, 오디오 입력부(104)는, 수신된 발언에 상응하는 아날로그 신호를, 기록된 소리를 나타내는, 펄스-코드 변조된(PCM) 신호 또는 다른 디지털 신호와 같은 디지털 신호로 변환하는 아날로그 대 디지털 변환기를 포함한다. 오디오 입력 장치(104)의 일부 실시예는, 신호 필터, 에코 삭제 회로, 및 오디오 데이터의 품질을 개선하는 다른 신호 처리 장치를 포함한다.
오디오 데이터 프로세서(112)는 오디오 입력 장치(104)로부터 오디오 데이터를 수신하고 오디오 데이터로부터 발언 데이터를 생성한다. 오디오 데이터 프로세서(112)는 오디오 데이터로부터 발성된 단어 및 문구를 추출하기 위해서 오디오 데이터를 프로세싱하는 음향 모델러 및 언어 모델을 포함한다. 오디오 데이터 프로세서(112) 메모리(128)에 동작적으로 연결된다. 하나의 동작 모드에서, 오디오 데이터 프로세서(112)는 생성된 발언 데이터를, 하나 이상의 트리거 문구에 상응하는 메모리(128) 내의 미리 결정된 발언 데이터(134)에 대해서 비교한다. 만약 발생된 발언 데이터가 미리 결정된 트리거 문구의 발언 데이터에 상응한다면, 제어기(124)는, 화자 확인 모듈을 포함하는, 원격 의료 장치(100) 내의 다른 구성요소를 활성화시킨다. 다른 동작 모드에서, 오디오 데이터 프로세서(112)는 생성된 발언 데이터를 건강 팁 데이터베이스(144) 내의 하나 이상의 건강 팁에 상응하는 발언 데이터에 대해서 비교한다. 오디오 데이터 프로세서(112)가 여러 가지 타입의 미리 결정된 발언 데이터에 상응하는 발언 데이터를 생성할 때, 오디오 데이터 프로세서(112)는 메모리(128) 내의 발언 데이터 버퍼(132) 내에 발언 데이터를 저장한다. 발언 데이터 버퍼(132)는, 사람(102)이 원격 의료 장치(100)에 대한 등록된 사용자인지를 확인하기 위해서 이용되는 복수의 발언 데이터의 세트를 축적한다.
화자 확인 모듈(116)이 메모리(128) 및 제어기(124)에 동작적으로 연결된다. 화자 확인 모듈(116)은 발언 데이터 버퍼(132)로부터 발언 데이터를 판독하고, 상기 발언 데이터가 원격 의료 장치(100)를 이용하는 사람의 표명된 등록 명칭과 연관된 등록 데이터베이스(140) 내에 저장된 음성 모델에 상응한다는 것을 확인한다. 발언 데이터 버퍼(132)는, 트리거 문구, 등록된 사용자 명칭, 및 하나 이상의 발성된 건강 팁에 상응하는 발언 데이터를 포함하는, 오디오 데이터 프로세서(112)에 의해서 생성된 축적된 발언 데이터를 저장한다. 하나의 실시예에서, 화자 확인 모듈(116)은, 발언 데이터 버퍼(132) 내의 발언 데이터가 등록된 사용자의 목소리 모델에 상응할 가능성에 상응하는 신뢰(confidence) 점수를 생성한다. 화자 확인 모듈(116)은 또한, 등록된 사용자 이외의 사람에 속하는 하나 이상의 목소리의 여러 가지 목소리 특성에 상응하는, 사칭자 목소리 모델에 상응하는 신뢰 점수를 생성한다. 사칭자 목소리 모델은, 모듈(116)에서 이용되는 화자 확인 방법에 따라서, 가우스 혼합 모델(GMM) 또는 다른 기술을 이용하여 여러 사람으로부터의 많은 양의 데이터에 대해서 미리 훈련된다. 원격 의료 장치(100)는 화자 확인 프로세스 중의 사용을 위해서 등록 데이터베이스(140) 내에 사칭자 목소리 모델을 저장한다.
만약 사용자의 목소리 모델에 대한 신뢰 점수가 사칭자에 대한 신뢰 점수 보다 적어도 미리 결정된 문턱값 만큼 더 높은 경우에, 화자 확인 모듈(116)은, 발언 데이터가 등록된 사용자의 목소리 모델에 상응한다는 것을 확인한다. 만약 사칭자의 목소리 모델에 대한 신뢰 점수가 등록된 사용자에 대한 신뢰 점수 보다 적어도 미리 결정된 문턱값 만큼 더 높다면, 화자 확인 모듈(116)은, 발언 데이터가 등록된 사용자의 목소리 모델에 상응하지 않는다는 것을 확인한다. 일부 경우에, 발언 데이터가 사용자의 목소리 모델에 상응하는지 또는 그렇지 않은지의 여부를 명확하게 나타내는 신뢰 점수를 생성하기 위해서 이용가능한 발언 데이터가 불충분하다. 발언 데이터 버퍼(132)에 부가되는 부가적인 발언 데이터를 생성하기 위해서 하나 이상의 건강 팁을 발성하도록 원격 의료 장치(100)가 사람(102)에게 대사를 전달하고, 상기 데이터 버퍼(132) 내의 부가적인 발언 데이터는, 화자 확인 모듈(116)이 등록된 사용자의 목소리 모델을 이용하여 사람(102)을 확인하기 위한 충분한 발언 데이터를 가질 수 있는 가능성을 증가시킨다.
등록 데이터베이스(140)는, 원격 의료 장치(100)를 사용하도록 인증된 하나 이상의 사용자에 상응하는 등록 데이터를 포함한다. 도 3은 등록 데이터베이스(300) 내에 저장된 데이터의 예를 도시한다. 등록 데이터베이스(300)는 등록된 명칭 식별자(304), 등록된 명칭(308)에 상응하는 발언 데이터, 및 등록된 사용자(312)에 상응하는 목소리 모델에 대한 발언 데이터에 상응하는 열(column)을 포함한다. 등록된 명칭 식별자(304)는, 원격 의료 장치(100)의 각각의 사용자를 식별하는 스트링(string) 또는 수치적 식별자이다. 도 3의 예에서, "IMPOSTOR(사칭자)" 명칭은, 등록된 사용자 중 한 명이 아닌 하나 이상의 목소리 모델에 상응하는 발언 데이터를 저장하는 등록 데이터베이스 내의 특별한 엔트리(entry)이다.
표(300)에서, 각각의 사용자(308)의 등록된 명칭에 대한 발언 데이터 및 각각의 사용자(312)의 목소리 모델에 대한 발언 데이터 모두는 등재(enrollment) 프로세스 중에 사용자에 의해서 발성되는 발언으로부터 획득된 발언 데이터를 포함한다. 등재 프로세스에서, 사용자는, 등록 명칭 및 일련의 훈련(training) 문구를 포함하는 하나 이상의 일련의 단어 및 문구로 이루어진 발언을 발성한다. 등록된 사용자의 목소리 모델은, 등록 명칭 및 훈련 문구로 이루어진 발언으로부터 생성된 발언 데이터를 이용하여 생성된다. 등재 프로세스는, 전형적으로, 환자가 원격 의료 장치를 받기(receive) 전에 한차례 실시된다. 원격 의료 장치(100)는 등재 프로세스를 직접적으로 실시할 수 있고, 또는 분리된 등재 시스템이 등록을 실시하고 원격 의료 장치(100)가 사용자 정보 및 생성된 목소리 모델을 수신할 수 있다. 예를 들어, 원격 의료 장치(100)는, 네트워크 I/O 장치(120)를 경유하여 인터넷(160)을 통해서 접속되는 온라인 등록 데이터베이스(170)로부터 하나 이상의 등재된 사용자에 대한 등록 데이터를 다운로드할 수 있을 것이다.
등록된 명칭(308)에 대한 발언 데이터는, 원격 의료 장치(100)를 사용하도록 등록된 사람의 등록된 명칭에 상응하는 발언 데이터를 저장한다. 등록된 명칭은 단순한 사용자의 명칭, 예를 들어 "존 스미스" 일 수 있고, 또는 특별한 로그인 명칭 및 수치적 환자 번호일 수 있을 것이다. 등록된 명칭이 설명을 위한 문장으로서 도 3에 나열되어 있으나, 등록 데이터베이스(300) 내의 이진수 발언 데이터로서 전형적으로 저장된다. 목소리 모델(312)에 대한 발언 데이터는 등록된 사용자에 의해서 제공된 복수의 발언에 상응하는 발언 데이터를 포함한다. 일부 실시예에서, 목소리 모델을 생성하기 위해서 이용된 발언 데이터가 등재 프로세스 중에 한 차례 제공된다. 다른 실시예에서, 원격 의료 장치(100)가 특별한 등록된 사용자가 발성한다는 것을 확인한 후에, 발언 데이터(312)가 새롭게 생성된 발언 데이터로 업데이트된다. 업데이트된 발언 데이터는, 원격 의료 장치(100)를 이용한 처치 중에 발생하는 사용자의 목소리의 점진적인 변화를 설명한다. 목소리 모델에 대한 발언 데이터는 전형적으로 등록 데이터베이스(140) 내에서 이진수 데이터 포맷으로 저장된다.
건강 팁 데이터베이스(144)가 복수의 건강 팁과 연관된 데이터를 포함한다. 도 4는 건강 팁 데이터베이스에 저장된 데이터의 예를 도시한다. 표(400)는 건강 팁 식별자(404), 건강 팁(408)을 발성하도록 사람에게 대사를 전달하기 위해서 이용되는 데이터, 및 발성된 건강 팁(412)에 상응하는 발언 데이터에 상응하는 열을 포함한다. 표(400) 내의 각각의 행은 단일 건강 팁에 상응하는 데이터를 나타내고, 표(400)는 전형적으로 복수의 건강 팁을 포함한다. 건강 팁 식별자는 특별한 건강 팁을 식별하는 스트링 또는 수치적 값이다. 일부 실시예에서, 원격 의료 장치(100)는, 도 3의 표(300)로부터의 등록된 명칭 식별자(304) 및 건강 팁 식별자(404)를 이용하여, 선택된 건강 팁을 특별한 환자와 연관시킨다.
건강 팁(408)을 위한 대사 전달 데이터는, 원격 의료 장치(100)로 하여금 상응하는 건강 팁을 발성하도록 사용자에게 대사 전달하는 사용자에 대한 메시지를 생성할 수 있게 하는 포맷화된 데이터를 포함한다. 도 4에 도시된 대사 전달 데이터가 문장의 형태이지만, 대사 전달 데이터는, 원격 의료 장치가 스피커를 통해서 출력하는 오디오 데이터 및 사용자 인터페이스 장치(108) 내의 스크린 상에서 디스플레이되는 가시적인 대사 전달의 형태를 포함하는 다양한 형태로 저장될 수 있다. 일부 대사 전달은, 사용자로 하여금 원격 의료 장치(100)에 대해서 역으로 반복하도록 하기 위한 문구를 제공한다. 다른 건강 팁 대사 전달은 사용자에게 단순한 질의를 제공하고 사용자는 질의에 대한 답변을 발성한다. 질의 및 답변 구성에서, 화자가 질의에 대한 답변을 기억하는 것을 돕도록, 원격 의료 장치(100)가 디스플레이 화면 상에서 답변을 디스플레이할 수 있을 것이다.
발언 데이터(412)는 특별한 건강 팁에 상응한다. 발언 데이터가 설명을 위해서 도 4에서 문장으로서 도시되어 있으나, 발언 데이터는 전형적으로 건강 팁 데이터베이스(144) 내에서 이진수 데이터 포맷으로 저장된다. 일부 실시예에서, 각각의 건강 팁에 대한 발언 데이터(412)가, 원격 의료 장치를 이용하기에 앞서서 등재 프로세스 중에 각각의 건강 팁을 발성하는 등록된 사람의 기록된 발언에 직접적으로 상응한다. 다른 실시예에서, 발언 데이터는 등록된 사용자의 목소리에 직접적으로 상응하지 않고, 그 대신에 하나 이상의 목소리에 대해서 일반적이 된다(generic). 오디오 데이터 프로세서(112)는, 발언의 오디오 데이터로부터 생성된 발언 데이터를 미리 결정된 발언 데이터(412)에 대해서 비교하여, 그 사람(102)이 대사 전달된 건강 팁을 발성한 것인지 또는 다른 문구를 발성한 것인지를 식별한다.
일부 실시예에서, 건강 팁 데이터베이스(144) 내에 저장된 원격 의료 장치(100) 검색물(retrieve)은, 네트워크 I/O 장치(120)를 경유하여 인터넷(160)을 통해서 별도의 건강 팁 데이터베이스(174)로부터 검색된다. 건강 관리 제공자는, 많은 환자에 대해서 적용될 수 있는 일반적인 건강 팁 및 특별한 등록된 사용자와 연관된 특정 건강 팁을 포함하는 여러 가지 건강 팁을 건강 팁 데이터베이스(174) 내에 배치시킨다(populate). 원격 의료 장치(100)는 건강 팁 데이터베이스(144) 내의 건강 팁을 주기적으로 업데이트하고, 그에 따라 사용자는 다양한 건강 팁을 수신한다.
도 1을 다시 참조하면, 제어기(124)가 원격 의료 장치(100)의 동작을 조정하고, 보다 특히, 원격 의료 장치와 상호작용하는 사람이 등록된 사용자라는 것을 확인하기 위해서 원격 의료 장치를 제어한다. 원격 의료 장치의 일부 실시예는, 제어기(124), 오디오 데이터 프로세서(112), 화자 확인 모듈(116), 및 네트워크 I/O 장치(120)의 일부 또는 전부의 기능을 구현하기 위해서, 프로세서, 마이크로프로세서, 필드 프로그래머블 게이트 어레이(FPGA), 주문형 집적 회로(ASIC), 또는 다른 디지털 연산 장치와 같은 단일 마이크로전자 장치를 포함한다. 제어기(124)는 메모리(128)의 저장된 프로그램 지시어 지역(136) 내에서 유지되는 소프트웨어 지시어를 실행한다. 일부 실시예에서, 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116)을 포함하는 원격 의료 장치(100) 내의 여러 구성요소가, 제어기(124)에 의해서 실행되는 소프트웨어 프로그램으로서 구현된다. 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116)의 기능을 구현하기 위한 저장된 지시어가 메모리(128)의 저장된 프로그램 지역(136) 내에 저장된다. 다른 실시예에서, 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116) 중 하나 또는 양자 모두가 디지털 신호 프로세서(DSP)와 같은 특별한 프로세싱 장치를 포함한다. 또 다른 실시예는, 하드웨어 구성요소와 소프트웨어 구성요소의 조합을 이용하여, 오디오 데이터 프로세서(112) 및 화자 확인 모듈(116)의 기능을 실시한다. 원격 의료 장치 내의 여러 가지 마이크로전자 구성요소가 "시스템 온 칩(SoC)" 구성에서 단일 물리적 장치 내로 조합될 수 있다.
도 2는, 화자 확인 프로세스를 통해서, 원격 의료 장치의 등록된 사용자라는 것을 표명하는 사람의 신원이 등록된 사용자와 매칭되는지를 확인하기 위한 프로세스(200)를 도시한다. 프로세스(200)는 설명 목적을 위한 원격 의료 장치(100)와 함께 설명되어 있다. 이하에서 설명되는 바와 같이, 기능을 구현하거나 일부 작용을 실시하는 것으로서 설명되는 프로세스는, 기능을 구현 또는 작용을 실시하기 위해서 하나 이상의 전자적 구성요소를 동작시키기 위해서 메모리 내에 저장된 프로그램된 지시어를 실행하는 제어기를 지칭한다. 프로세스(200)는 오디오 입력 장치를 통해서 수신된 소리로부터 오디오 데이터를 생성하는 오디오 입력 장치로 시작된다(블록(204)). 원격 의료 장치(100)에서, 오디오 입력 장치(104)는 주변으로부터 소리를 수신하는 하나 이상의 마이크로폰을 포함하고, 상기 오디오 입력 장치는 수신된 소리로부터 오디오 데이터를 생성한다. 프로세스(200)는, 오디오 신호가 발언을 포함하는 경우에, 오디오로부터 발언 데이터를 생성하고(블록(212)), 상기 발언 데이터를 미리 결정된 트리거 문구에 대해서 비교한다(블록(216)). 전형적으로, 트리거 문구는, 원격 의료 장치(100)의 우발적인 활성화를 방지하기 위해서, 일상적인 대화에서 사용되지 않는 단어 또는 복수의 단어이다. 원격 의료 장치는, 사람으로 하여금 트리거 문구를 발성하도록 하기 위한 대사 전달이나 요청을 생성하지 않는다.
원격 의료 장치(100)는, 블록(204-216)에서, 사람(102)이 트리거 문구를 발성하는지에 대해서 모니터링 동작 모드 유닛에서 지속적으로 프로세스를 실시한다. 모니터링 모드에서, 원격 의료 장치 내의 여러 가지 구성요소가 비활성화되거나 원격 의료 장치(100)의 전력 소모를 감소시키는 저전력 동작 모드로 위치된다. 배터리를 통해서 동작하는 원격 의료 장치의 실시예에서, 저전력 모드는 원격 의료 장치의 배터리 수명을 연장시킨다. 원격 의료 장치(100)는, 오디오 데이터 프로세서(112)가 트리거 발언 데이터(134)에 상응하는 오디오 신호로부터 발언 데이터를 생성할 때, 프로세스(200)를 계속 진행한다.
프로세스(200)에서, 트리거 문구에 상응하는 발언 데이터가, 화자의 신원을 확인하기 위한 추후의 이용을 위해서, 메모리 내에 저장된다(블록(220)). 원격 의료 장치(100)에서, 발언 데이터가 발언 데이터 버퍼(132) 내에 저장된다. 트리거 문구를 수신한 후에, 프로세스(200)는 화자로 하여금 등록된 사용자의 등록 명칭을 말하도록(state) 하는 대사 전달을 생성한다((블록 (224)). 원격 의료 장치(100)는 스피커를 이용하여 가청적인 대사 전달을 생성할 수 있고 또는 사람(102)으로 하여금 사용자 명칭을 발성하도록 하는 요청을 가시적으로 디스플레이할 수 있다.
원격 의료 장치는 발성된 등록된 명칭에 상응하는 오디오 데이터를 생성하고(블록(232)), 등록된 명칭의 오디오 데이터에 상응하는 발언 데이터를 생성한다(블록(236)). 원격 의료 장치(100)에서, 만약 사람(102)이 등록 데이터베이스(140) 내의 하나의 사용자에 상응하는 등록된 명칭을 제공하지 않는다면(블록(238)), 원격 의료 장치(100)는 등록된 사용자의 명칭을 반복하도록 화자에게 대사 전달하거나 트리거 문구를 모니터링하기 위해서 블록(204)에서 설명된 프로세싱으로 복귀한다. 등록된 사용자의 명칭에 상응하는 발언 데이터를 수신한 후에(블록(238)), 프로세스(200)는 등록된 사용자의 명칭에 상응하는 발언 데이터를 메모리 내에 저장한다(블록(240)). 원격 의료 장치(100)에서, 등록된 명칭에 상응하는 발언 데이터가, 트리거 문구로부터의 발언 데이터에 더하여, 발언 데이터 버퍼(132) 내에 저장된다.
프로세스(200)는, 등록된 명칭에 상응하는 사용자의 미리 결정된 목소리 모델을 이용하여 메모리 내에 저장된 발언 데이터의 확인을 위한 하나 이상의 신뢰 점수를 생성한다(블록(244)). 원격 의료 장치(100) 내의 화자 확인 모듈(116)은 발언 데이터 버퍼(132)로부터의 기록된 발언 데이터 및 등록된 데이터베이스(140)로부터의 등록된 사용자의 목소리 모델에 상응하는 발언 데이터를 추출한다. 일부 실시예에서, 등록 데이터베이스(140)는 하나 초과의 사용자에 대한 음성 모델을 저장하고, 프로세스(200)는 원격 의료 장치(100)를 사용하도록 등록된 상이한 사용자들을 구분하기 위해서 발성된 등록 명칭에 상응하는 사용자를 선택한다. 화자 확인 모듈(116)은 또한 등록 데이터베이스(140) 내의 사칭자로부터의 발언 데이터를 추출한다.
일부 경우에, 트리거 문구 및 등록 명칭에 대한 발언 데이터를 이용하여, 사람(102)이 등록된 명칭을 가지는 사용자인지를 명확하게 식별하는 신뢰 점수를 화자 확인 모듈(116)이 충분히 생성할 수 있다(블록(248)). 프로세스(200)는, 축적된 데이터량을 이용하여, 블록(244)의 프로세싱에서 식별되는 신뢰 점수의 신뢰성을 측정한다. 등록된 사용자 목소리 모델에 대한 신뢰 점수가 사칭자 모델에 대한 신뢰 점수 보다 미리 결정된 문턱값 만큼 더 높다는 것을 화자 확인 모듈(116)이 확인한 경우(블록(256)), 원격 의료 장치(100)는 그 사람(102)이 등록된 명칭을 가지는 사용자라는 것을 확인하고(블록(260)), 원격 의료 장치(100)는 그 사용자에게 서비스를 제공한다(블록(264)).
발언 데이터가 사칭자에 상응한다는 것을 나타내는 신뢰 점수를 화자 확인 모듈(116)이 확인한 경우에(블록(256)), 화자 확인 모듈(116)은, 사람(102)이 등록된 사용자가 아니라는 것을 식별하고(블록(292)), 원격 의료 장치(100)는 사칭자에 대한 원격 의료 서비스를 거부한다(블록(296)). 일부 구성에서, 원격 의료 장치(100)는 실패한 확인 시도를 계속적으로 계수하고, 그 계수가 미리 결정된 문턱값을 초과하는 경우에, 원격 의료 장치는 사용자 확인을 위한 어떠한 부가적인 시도도 차단한다. 예를 들어, 사람이 사칭자라는 결과를 각각 초래한, 원격 의료 장치를 이용한 사람 확인을 위한 3번의 연속적인 시도가 있는 경우에, 원격 의료 장치는 건강 관리 전문가가 그 장치를 리셋할 때까지 어떠한 사용자도 차단하게 된다.
일부 경우에, 화자 확인 모듈(116)은, 사람(102)이 등록된 사용자인지 또는 아닌지를 확인하기에 충분하지 않은 신뢰 점수를 생성한다(블록(248)). 예를 들어, 등록된 사용자의 목소리 모델 및 사칭자 목소리 모델 모두로부터 생성된 신뢰 점수가 미리 결정된 문턱값 이하인 경우에 또는 양 신뢰 점수가 서로의 미리 결정된 범위 내에 있는 경우에, 화자 확인 모듈(116)은 확인 실시를 위한 부가적인 발언 데이터를 요청할 수 있을 것이다. 다른 예에서, 불충분한 양의 발언 데이터로부터 생성된 높은 또는 낮은 신뢰 점수가 낮은 신뢰성을 가진다. 프로세스(200)는, 화자를 확인하기 위한 충분한 신뢰성 정도로 신뢰 점수를 생성하기 위해서 부가적인 발언 데이터를 수집한다.
부가적인 발언 데이터를 생성하기 위해서, 프로세스(200)는 사람(102)으로 하여금 건강 팁을 발성하도록 대사 전달한다(블록(272)). 원격 의료 장치는 건강 팁 데이터베이스(144)로부터 건강 팁을 선택하고 사람(102)을 위한 오디오 또는 가시적 대사 전달을 생성한다. 오디오 입력부(104)는 발성된 건강 팁에 상응하는 오디오 데이터를 생성하고(블록(276)), 오디오 데이터 프로세서(112)는 오디오 데이터로부터 발언 데이터를 생성한다(블록(280)). 오디오 데이터 프로세서(112)는 생성된 발언 데이터를, 건강 팁 데이터베이스(144) 내에 저장된 선택된 건강 팁에 대한 미리 결정된 발언 데이터에 대해서 비교한다.
만약 생성된 발언 데이터가 건강 팁에 상응하지 않는다면(블록(282)), 원격 의료 장치(100)는 사람으로 하여금 건강 팁을 발성하도록 대사 전달을 반복한다(블록(272)). 원격 의료 장치(100)는, 프로세싱(200) 동안에 생성된 발언 데이터가 대사 전달된 건강 팁에 상응하지 않는 횟수를 지속적으로 계수한다. 만약 계수가 미리 결정된 최대 숫자를 초과한다면(블록(283)), 장치(100)는 사용자 인터페이스를 이용하여 대안적인 확인을 위한 대사를 전달한다(블록(298)). 예를 들어, 만약 사용자가 3번의 연속적인 횟수 동안 건강 팁에 대한 정확한 응답을 제공할 수 없다면, 장치(100)는 대안적인 확인을 요청한다. 만약 생성된 발언 데이터가 건강 팁에 상응한다면(블록(282)), 생성된 발언 데이터가 발언 데이터 버퍼(132) 내에 저장된다(블록(284)). 이어서, 프로세스(200)가 블록(244)으로 복귀되어, 건강 팁으로부터의 발언 데이터를 포함하는 축적된 발언 데이터의 모두를 이용하여 화자 확인을 실시한다.
일부 경우에, 프로세스(200)는, 사람(102)이 등록된 사용자인지를 확인하기 위한 충분한 발언 데이터가 수집될 때까지, 복수의 건강 팁을 대사 전달한다. 원격 의료 장치(100)는, 다양한 발언 데이터를 화자 확인 모듈(116)로 제공하기 위해서 각각의 반복 중에 상이한 건강 팁에 대한 대사를 전달한다. 프로세스(200)는, 사용자 확인 프로세스 중에 수용되는 건강 팁의 수에 대한 제한을 실시한다(블록(268)). 예를 들어, 만약 프로세스(200)가 5개의 건강 팁에 상응하는 발언 데이터를 수신하였으나 사람(102)이 등록된 사용자인지를 확인하기 위한 충분한 발언 데이터가 여전히 부족한 경우에, 화자 확인 프로세스(200)가 종료되고, 원격 의료 장치(100)는 대안적인 확인 프로세스를 이용한다(블록(298)). 하나의 대안적인 확인 프로세스에서, 원격 의료 장치는 사용자 인터페이스(108) 내의 디스플레이 스크린 상에서 로그인 대사 전달을 생성하고, 사람(102)이 키패드를 통해서 사용자 명칭 및 암호를 입력한다.
원격 의료 장치(100) 및 확인 프로세스(200)는 단순하고 효과적인 확인 과정을 환자에게 제공한다. 원격 의료 장치(100)가, 사람이 등록된 사용자인지를 확인하기 위해서, 초기 트리거 문구를 포함하여, 사람으로부터 수신된 유효 발언 데이터의 전부를 이용하기 때문에, 원격 의료 장치(100)는 최소 수의 음성 샘플을 이용하여 사용자를 효과적으로 확인할 수 있다. 부가적으로, 건강 팁 음성 샘플은 확인 프로세스 중에 건강에 관한 조언을 환자에게 제공하고, 그에 따라 초기 확인 프로세스 중에도 각각의 환자에게 제공되는 의료적인 이득을 증가시킨다.
도면 및 전술한 설명에서 본원 발명을 구체적으로 도시하고 설명하였지만, 이는 예시적인 것으로 간주되어야 하고 특징을 제한하지 않는 것으로 간주되어야 한다. 예를 들어, 여기에서 설명된 음성의 예가 한국어로 기술되어 있지만, 원격 의료 장치(100)가 다양한 범위의 언어로부터 음성을 인식하고 발언 데이터를 생성하도록 구성될 수 있을 것이다. 바람직한 실시예만이 제시되었다는 것, 그리고 본원 발명의 사상으로부터의 모든 변경, 수정 및 추가적인 적용의 보호를 원한다는 것을 이해할 수 있을 것이다.

Claims (21)

  1. 사람의 신원을 확인하기 위한 방법이며,
    오디오 입력 장치를 이용하여, 사람이 발성한 발언에 상응하는 오디오 데이터를 생성하는 단계;
    오디오 데이터 프로세서를 이용하여 상기 오디오 데이터 내의 제1발언 데이터를 식별하는 단계;
    미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 등록 명칭을 발성하도록 사람에게 대사 전달하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계;
    상기 미리 결정된 트리거 발언에 상응하는 식별된 제1발언 데이터에 응답하여 메모리 내에 상기 식별된 제1발언 데이터를 저장하는 단계;
    상기 오디오 입력 장치를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하는 단계;
    오디오 데이터 프로세서를 이용하여 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하는 단계;
    상기 식별된 제2발언 데이터를 메모리 내에 저장하는 단계;
    화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 단계; 및
    상기 사람이 상기 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 포함하는
    사람의 신원을 확인하기 위한 방법.
  2. 제1항에 있어서,
    상기 메모리 내의 제1 및 제2발언 데이터가 사용자의 목소리의 미리 결정된 모델을 이용하여 사람을 확인하는데 있어서 불충분하다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 미리 결정된 문구를 발성하도록 사람에게 대사를 전달하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계;
    상기 음성 입력 장치를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터를 생성하는 단계;
    상기 오디오 데이터 프로세서를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터 내의 제3발언 데이터를 식별하는 단계;
    상기 제3발언 데이터를 상기 메모리 내에 저장하는 단계; 및
    화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 단계를 더 포함하는
    사람의 신원을 확인하기 위한 방법.
  3. 제2항에 있어서,
    상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하는 제3발언 데이터에 응답하여 제3발언 데이터를 상기 메모리 내에 저장하는 단계를 더 포함하는
    사람의 신원을 확인하기 위한 방법.
  4. 제2항에 있어서,
    상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하지 않는 제3발언 데이터에 응답하여 제 2 시간에 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 더 포함하는
    사람의 신원을 확인하기 위한 방법.
  5. 제2항에 있어서,
    상기 사용자 인터페이스 장치는 미리 결정된 문구로서 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하는
    사람의 신원을 확인하기 위한 방법.
  6. 제5항에 있어서,
    상기 사용자 인터페이스 장치는, 상기 등록 데이터베이스 내의 등록 명칭과 연관된 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하는
    사람의 신원을 확인하기 위한 방법.
  7. 제2항에 있어서,
    화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성하는 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하지 않는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 확인하는 단계; 및
    상기 등록 명칭을 발성하는 사람이 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 상기 화자 확인 모듈이 확인하는 것에 응답하여 상기 사람에 대한 서비스를 거부하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하는 단계를 더 포함하는
    사람의 신원을 확인하기 위한 방법.
  8. 제2항에 있어서,
    상기 사용자의 목소리의 미리 결정된 모델을 이용하여 사람을 확인하는데 있어서 상기 메모리 내의 제1, 제2 및 제3발언 데이터가 충분하지 않다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 적어도 하나의 부가적인 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하는 것을 계속하는 단계;
    오디오 입력 장치를 이용하여, 사람이 발성한 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터를 생성하는 단계;
    오디오 데이터 프로세서를 이용하여 상기 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터에서 적어도 하나의 부가적인 발언 데이터를 식별하는 단계;
    적어도 하나의 부가적인 발언 데이터를 메모리 내에 저장하는 단계;
    상기 화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2, 제3, 및 적어도 하나의 부가적인 발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하는 단계를 더 포함하는
    사람의 신원을 확인하기 위한 방법.
  9. 제8항에 있어서,
    미리 결정된 문턱값을 초과하는 다수의 부가적인 발언 데이터가 메모리 내에 저장된 후에 상기 사람이 사용자라는 것을 화자 확인 모듈이 확인하는데 있어서 불충분한 발언 데이터를 가지는 메모리에 응답하여 상기 사람이 상기 등록 데이터베이스 내의 등록 명칭과 연관된 사용자라는 것을 상기 화자 확인 모듈이 확인할 수 없다는 것을 식별하는 단계를 더 포함하는
    사람의 신원을 확인하기 위한 방법.
  10. 제9항에 있어서,
    상기 사람이 등록 데이터베이스 내의 등록 명칭과 연관된 사용자라는 것을 상기 화자 확인 모듈이 확인할 수 없다는 것에 응답하여 상기 오디오 입력 장치와 상이한 사용자 입력 장치를 이용하여 사람의 확인을 위한 정보를 입력하도록, 사용자 인터페이스 장치를 이용하여 사람에게 대사를 전달하는 단계를 더 포함하는
    사람의 신원을 확인하기 위한 방법.
  11. 화자 확인되는 원격 진료 장치이며,
    사람이 발성한 발언으로부터 오디오 데이터를 생성하는 오디오 입력 장치;
    상기 오디오 입력 장치에 동작적으로 연결되고 상기 오디오 입력 장치에 의해서 생성된 오디오 데이터로부터 발언 데이터를 생성하도록 구성된 오디오 데이터 프로세서;
    상기 오디오 데이터 프로세서에 의해서 생성된 복수의 발언 데이터를 저장하도록 구성된 메모리;
    적어도 하나의 사용자를 적어도 하나의 사용자에 상응하는 등록 명칭 및 목소리 모델과 연관시키도록 구성된 등록 데이터베이스;
    상기 메모리 및 상기 등록 데이터베이스에 동작적으로 연결된 화자 확인 모듈;
    사용자 인터페이스 장치; 및
    상기 오디오 입력 장치, 오디오 데이터 프로세서, 메모리, 등록 데이터베이스, 화자 확인 모듈, 및 사용자 인터페이스 장치에 동작적으로 연결된 제어기를 포함하고,
    상기 제어기는:
    사람에 의해서 발성된 발언을 포함하는 소리를 수신하기 위해서 그리고 상기 사람으로 하여금 발성하도록 대사를 전달하지 않고 상기 발언에 상응하는 오디오 데이터를 생성하기 위해서 상기 오디오 입력 장치를 활성화시키도록;
    상기 오디오 데이터 프로세서를 이용하여 상기 사람이 발성한 발언에 상응하는 오디오 데이터 내의 제1발언 데이터를 식별하도록;
    상기 식별된 제1발언 데이터를 상기 메모리 내에 저장하도록;
    미리 결정된 트리거 발언에 상응하는 제1발언 데이터에 응답하여 등록 명칭을 발성하도록 사람에게 대사를 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록;
    상기 오디오 입력 장치를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터를 생성하도록;
    상기 오디오 데이터 프로세서를 이용하여 상기 발성된 등록 명칭에 상응하는 오디오 데이터 내의 제2발언 데이터를 식별하도록;
    상기 식별된 제2발언을 메모리 내에 저장하도록;
    화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성한 사람이, 상기 등록 명칭과 연관된 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1 및 제2발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내의 등록된 사용자라는 것을 확인하도록; 그리고
    상기 등록 명칭을 발성한 사람이 사용자라는 것을 확인한 화자 확인 모듈에 응답하여 상기 사람에게 서비스를 제공하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록 구성되는, 원격 진료 장치.
  12. 제11항에 있어서,
    상기 제어기는,
    상기 메모리 내의 제1 및 제2발언 데이터가 사용자의 목소리의 미리 결정된 모델을 이용하여 사람을 확인하는데 있어서 불충분하다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 미리 결정된 문구를 발성하도록 사람에게 대사를 전달하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하도록;
    상기 음성 입력 장치를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터를 생성하도록;
    상기 오디오 데이터 프로세서를 이용하여 상기 발성된 미리 결정된 문구에 상응하는 오디오 데이터 내의 제3발언 데이터를 식별하도록;
    상기 제3발언 데이터를 상기 메모리 내에 저장하도록; 그리고
    화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성한 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하도록; 추가적으로 구성되는, 원격 진료 장치.
  13. 제12항에 있어서,
    상기 오디오 데이터 프로세서는,
    상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하는 제3발언 데이터에 응답하여 제3발언 데이터를 상기 메모리 내에 저장하도록 추가적으로 구성되는, 원격 진료 장치.
  14. 제12항에 있어서,
    상기 제어기는,
    상기 미리 결정된 문구의 미리 결정된 발언 데이터에 상응하지 않는 제3발언 데이터에 응답하여 제 2 시간에 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록 추가적으로 구성되는, 원격 진료 장치.
  15. 제12항에 있어서,
    상기 사용자 인터페이스 장치는,
    상기 미리 결정된 문구로서 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하도록 추가적으로 구성되는, 원격 진료 장치.
  16. 제15항에 있어서,
    상기 사용자 인터페이스 장치는,
    상기 등록 데이터베이스 내의 등록 명칭과 연관된 건강 팁을 발성하도록 사람을 위한 대사 전달을 생성하도록 추가적으로 구성되는, 원격 진료 장치.
  17. 제12항에 있어서,
    상기 제어기는,
    상기 화자 확인 모듈을 이용하여, 상기 등록 명칭을 발성하는 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하지 않는 메모리 내에 저장된 제1, 제2 및 제3발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 확인하도록; 그리고
    상기 등록 명칭을 발성하는 사람이 등록 데이터베이스 내에 등록된 사용자가 아니라는 것을 상기 화자 확인 모듈이 확인하는 것에 응답하여 상기 사람에 대한 서비스를 거부하기 위해서 사용자 인터페이스 장치를 이용하여 출력을 생성하도록, 추가적으로 구성되는, 원격 진료 장치.
  18. 제12항에 있어서,
    상기 제어기는,
    상기 등록 데이터베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 상기 메모리 내의 제1, 제2 및 제3발언 데이터를 확인하는데 있어서 상기 메모리 내에 저장된 제1, 제2 및 제3발언 데이터가 불충분하다는 것을 상기 화자 확인 모듈이 식별하는 것에 응답하여 적어도 하나의 부가적인 미리 결정된 문구를 발성하도록 사람에게 대사 전달하기 위해서 상기 사용자 인터페이스 장치를 이용하여 출력을 생성하도록;
    상기 오디오 입력 장치를 이용하여, 사람이 발성한 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터를 생성하도록;
    상기 오디오 데이터 프로세서를 이용하여 상기 적어도 하나의 부가적인 미리 결정된 문구에 상응하는 오디오 데이터에서 적어도 하나의 부가적인 발언 데이터를 식별하도록;
    적어도 하나의 부가적인 발언 데이터를 메모리 내에 저장하도록; 그리고
    상기 화자 확인 모듈을 이용하여, 상기 사람이, 상기 등록 데이터 베이스 내에 등록된 사용자의 목소리의 미리 결정된 모델에 상응하는 메모리 내에 저장된 제1, 제2, 제3, 및 적어도 하나의 부가적인 발언 데이터에 응답하여 등록 명칭과 연관된 등록 데이터베이스 내에 등록된 사용자라는 것을 확인하도록 추가적으로 구성되는, 원격 진료 장치.
  19. 제18항에 있어서,
    상기 제어기는,
    미리 결정된 문턱값을 초과하는 다수의 부가적인 발언 데이터가 메모리 내에 저장된 후에 상기 사람이 사용자라는 것을 화자 확인 모듈이 확인하는데 있어서 불충분한 발언 데이터를 가지는 메모리에 응답하여 상기 사람이 상기 등록 데이터베이스 내의 등록 명칭과 연관된 사용자라는 것을 상기 화자 확인 모듈이 확인할 수 없다는 것을 식별하도록 추가적으로 구성되는, 원격 진료 장치.
  20. 제19항에 있어서,
    상기 제어기는,
    상기 사람이 등록 데이터베이스 내의 등록 명칭과 연관된 사용자가 아니라는 것을 상기 화자 확인 모듈이 확인하는 것에 응답하여 상기 오디오 입력 장치와 상이한 사용자 입력 장치를 이용하여 사람의 확인을 위한 정보를 입력하도록, 사용자 인터페이스 장치를 이용하여, 사람에게 대사를 전달하도록 추가적으로 구성되는, 원격 진료 장치.
  21. 제11항에 있어서,
    상기 오디오 입력 장치, 오디오 데이터 프로세서, 메모리, 등록 데이터베이스, 화자 확인 모듈, 사용자 인터페이스 장치, 및 제어기가 내부에 배치되는 손에 들고 다니는 하우징을 더 포함하는, 원격 진료 장치.
KR1020147021283A 2011-12-29 2012-12-26 건강 모니터링 시스템에서의 화자 확인 KR101986867B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/340,213 2011-12-29
US13/340,213 US8818810B2 (en) 2011-12-29 2011-12-29 Speaker verification in a health monitoring system
PCT/US2012/071633 WO2013101818A1 (en) 2011-12-29 2012-12-26 Speaker verification in a health monitoring system

Publications (2)

Publication Number Publication Date
KR20140137343A true KR20140137343A (ko) 2014-12-02
KR101986867B1 KR101986867B1 (ko) 2019-06-07

Family

ID=47553473

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147021283A KR101986867B1 (ko) 2011-12-29 2012-12-26 건강 모니터링 시스템에서의 화자 확인

Country Status (6)

Country Link
US (2) US8818810B2 (ko)
EP (1) EP2810277B1 (ko)
JP (1) JP6234937B2 (ko)
KR (1) KR101986867B1 (ko)
CN (1) CN104160441B (ko)
WO (1) WO2013101818A1 (ko)

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
KR20120121070A (ko) * 2011-04-26 2012-11-05 삼성전자주식회사 원격 건강관리 시스템 및 이를 이용한 건강관리 방법
US10008206B2 (en) * 2011-12-23 2018-06-26 National Ict Australia Limited Verifying a user
US9390445B2 (en) 2012-03-05 2016-07-12 Visa International Service Association Authentication using biometric technology through a consumer device
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US8850534B2 (en) * 2012-07-06 2014-09-30 Daon Holdings Limited Methods and systems for enhancing the accuracy performance of authentication systems
US10438591B1 (en) 2012-10-30 2019-10-08 Google Llc Hotword-based speaker recognition
US9704486B2 (en) * 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US8694315B1 (en) 2013-02-05 2014-04-08 Visa International Service Association System and method for authentication using speaker verification techniques and fraud model
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
GB2515527B (en) * 2013-06-26 2016-08-31 Cirrus Logic Int Semiconductor Ltd Speech Recognition
GB2516075B (en) * 2013-07-10 2018-08-22 Cirrus Logic Int Semiconductor Ltd Sensor input recognition
CN105283836B (zh) * 2013-07-11 2019-06-04 英特尔公司 用于设备唤醒的设备、方法、装置及计算机可读存储介质
US9711148B1 (en) * 2013-07-18 2017-07-18 Google Inc. Dual model speaker identification
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9189742B2 (en) * 2013-11-20 2015-11-17 Justin London Adaptive virtual intelligent agent
GB2524222B (en) * 2013-12-18 2018-07-18 Cirrus Logic Int Semiconductor Ltd Activating speech processing
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
KR102246900B1 (ko) * 2014-07-29 2021-04-30 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US10704944B2 (en) 2014-09-14 2020-07-07 Becton, Dickinson And Company System and method for capturing dose information
US10971260B2 (en) 2014-09-14 2021-04-06 Becton, Dickinson And Company System and method for capturing dose information
CN105740056B (zh) * 2014-12-08 2019-03-29 联想(北京)有限公司 信息处理方法及电子设备
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10438593B2 (en) 2015-07-22 2019-10-08 Google Llc Individualized hotword detection models
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
WO2017162675A1 (en) 2016-03-22 2017-09-28 Koninklijke Philips N.V. Analyzing validity of measured health-related data
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
EP3690878A4 (en) 2017-09-28 2021-06-09 Kyocera Corporation VOICE COMMAND SYSTEM AND VOICE COMMAND PROCESS
US10901687B2 (en) 2018-02-27 2021-01-26 Dish Network L.L.C. Apparatus, systems and methods for presenting content reviews in a virtual world
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11538045B2 (en) 2018-09-28 2022-12-27 Dish Network L.L.C. Apparatus, systems and methods for determining a commentary rating
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11501879B2 (en) * 2018-10-01 2022-11-15 Preventice Technologies, Inc. Voice control for remote monitoring
US10918910B2 (en) * 2018-11-27 2021-02-16 Sap Se Digital assistant for therapeutic treatment
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
CN111193811A (zh) * 2020-03-04 2020-05-22 杭州憶盛医疗科技有限公司 一种基于5g网络的医疗手术在线远程控制系统
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US20220014518A1 (en) * 2020-07-07 2022-01-13 Ncs Pearson, Inc. System to confirm identity of candidates
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US20220272131A1 (en) * 2020-09-04 2022-08-25 Puzzle Ai Co., Ltd. Method, electronic device and system for generating record of telemedicine service
CN114861594B (zh) * 2022-07-08 2022-09-20 英诺达(成都)电子科技有限公司 芯片的低功耗验证方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS648670A (en) * 1987-07-01 1989-01-12 Fujitsu Ltd Mos field-effect transistor
KR20020097269A (ko) * 2001-03-15 2002-12-31 코닌클리케 필립스 일렉트로닉스 엔.브이. 수시 도움을 요구하는 독거인을 모니터링하기 위한 자동시스템
US20100069725A1 (en) * 2008-09-15 2010-03-18 Masimo Corporation Patient monitor including multi-parameter graphical display

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58129682A (ja) 1982-01-29 1983-08-02 Toshiba Corp 個人照合装置
US5365574A (en) 1990-05-15 1994-11-15 Vcs Industries, Inc. Telephone network voice recognition and verification using selectively-adjustable signal thresholds
US5517558A (en) * 1990-05-15 1996-05-14 Voice Control Systems, Inc. Voice-controlled account access over a telephone network
US5127043A (en) * 1990-05-15 1992-06-30 Vcs Industries, Inc. Simultaneous speaker-independent voice recognition and verification over a telephone network
US5265191A (en) 1991-09-17 1993-11-23 At&T Bell Laboratories Technique for voice-based security systems
US5660176A (en) 1993-12-29 1997-08-26 First Opinion Corporation Computerized medical diagnostic and treatment advice system
US5608784A (en) * 1994-01-24 1997-03-04 Miller; Joel F. Method of personnel verification using voice recognition
US5414755A (en) 1994-08-10 1995-05-09 Itt Corporation System and method for passive voice verification in a telephone network
US5774841A (en) 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US6073101A (en) 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
US5752231A (en) 1996-02-12 1998-05-12 Texas Instruments Incorporated Method and system for performing speaker verification on a spoken utterance
US5940476A (en) 1996-06-28 1999-08-17 Distributed Software Development, Inc. System and method for identifying an unidentified caller
US6292782B1 (en) 1996-09-09 2001-09-18 Philips Electronics North America Corp. Speech recognition and verification system enabling authorized data transmission over networked computer systems
DE69624848T2 (de) 1996-10-15 2003-10-09 Swisscom Ag, Bern Verfahren zum überprüfen eines sprechers
US6539352B1 (en) 1996-11-22 2003-03-25 Manish Sharma Subword-based speaker verification with multiple-classifier score fusion weight and threshold adaptation
NZ337954A (en) 1997-03-13 2001-09-28 First Opinion Corp Computerized disease management method adjusts a disease therapy for a patient based on obtained health data
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6697783B1 (en) 1997-09-30 2004-02-24 Medco Health Solutions, Inc. Computer implemented medical integrated decision support system
US6064963A (en) 1997-12-17 2000-05-16 Opus Telecom, L.L.C. Automatic key word or phrase speech recognition for the corrections industry
US6246987B1 (en) 1998-02-04 2001-06-12 Alcatel Usa Sourcing, L.P. System for permitting access to a common resource in response to speaker identification and verification
JP3835032B2 (ja) * 1998-12-18 2006-10-18 富士通株式会社 利用者照合装置
US6505155B1 (en) 1999-05-06 2003-01-07 International Business Machines Corporation Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy
US6978238B2 (en) * 1999-07-12 2005-12-20 Charles Schwab & Co., Inc. Method and system for identifying a user by voice
US7590538B2 (en) * 1999-08-31 2009-09-15 Accenture Llp Voice recognition system for navigating on the internet
US6523009B1 (en) 1999-11-06 2003-02-18 Bobbi L. Wilkins Individualized patient electronic medical records system
JP4636768B2 (ja) * 1999-12-23 2011-02-23 フィリップス コーポレイト インテレクチュアル プロパティ ゲーエムベーハー 患者識別された測定
US7194395B2 (en) 2000-02-23 2007-03-20 The United States Of America As Represented By The Secretary Of The Army System and method for hazardous incident decision support and training
JP2002123294A (ja) * 2000-10-18 2002-04-26 Olympus Optical Co Ltd 医療システム
JP4622106B2 (ja) * 2001-01-29 2011-02-02 日本電気株式会社 人物特定システム
JP2002258883A (ja) * 2001-02-27 2002-09-11 Sanyo Electric Co Ltd 音声再生装置、音声再生方法及び音声再生システム
JP3687553B2 (ja) * 2001-03-23 2005-08-24 日本電気株式会社 個人認証方式
US6853716B1 (en) 2001-04-16 2005-02-08 Cisco Technology, Inc. System and method for identifying a participant during a conference call
US7493264B1 (en) 2001-06-11 2009-02-17 Medco Health Solutions, Inc, Method of care assessment and health management
ATE483190T1 (de) 2001-07-18 2010-10-15 Daon Holdings Ltd Verteiltes netzwerksystem mit biometrischer zugangsprüfung
US20050154588A1 (en) 2001-12-12 2005-07-14 Janas John J.Iii Speech recognition and control in a process support system
US7240007B2 (en) 2001-12-13 2007-07-03 Matsushita Electric Industrial Co., Ltd. Speaker authentication by fusion of voiceprint match attempt results with additional information
DE10313310A1 (de) 2003-03-25 2004-10-21 Siemens Ag Verfahren zur sprecherabhängigen Spracherkennung und Spracherkennungssystem dafür
JP2007530327A (ja) 2003-07-18 2007-11-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 対話プロセス制御方法
US7418392B1 (en) 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
US20070033041A1 (en) 2004-07-12 2007-02-08 Norton Jeffrey W Method of identifying a person based upon voice analysis
US7254383B2 (en) 2004-07-30 2007-08-07 At&T Knowledge Ventures, L.P. Voice over IP based biometric authentication
US7668733B2 (en) 2004-11-09 2010-02-23 Medcor, Inc. Providing adaptive medical triage
US7529677B1 (en) 2005-01-21 2009-05-05 Itt Manufacturing Enterprises, Inc. Methods and apparatus for remotely processing locally generated commands to control a local device
WO2007008248A2 (en) 2005-07-11 2007-01-18 Voicedemand, Inc. Voice control of a media player
US20070038460A1 (en) 2005-08-09 2007-02-15 Jari Navratil Method and system to improve speaker verification accuracy by detecting repeat imposters
US7962340B2 (en) 2005-08-22 2011-06-14 Nuance Communications, Inc. Methods and apparatus for buffering data for use in accordance with a speech recognition system
US20070112571A1 (en) 2005-11-11 2007-05-17 Murugappan Thirugnana Speech recognition at a mobile terminal
US20070143307A1 (en) 2005-12-15 2007-06-21 Bowers Matthew N Communication system employing a context engine
US20080104410A1 (en) 2006-10-25 2008-05-01 Brown Daniel R Electronic clinical system having two-factor user authentication prior to controlled action and method of use
US7992196B2 (en) 2006-11-06 2011-08-02 Voice Identity, Inc. Apparatus and method for performing hosted and secure identity authentication using biometric voice verification over a digital network medium
US9762576B2 (en) 2006-11-16 2017-09-12 Phonefactor, Inc. Enhanced multi factor authentication
US8787555B2 (en) 2006-12-19 2014-07-22 Telethrive, Inc. Process for obtaining expert advice on-demand
DE102007021772B4 (de) 2007-05-09 2013-01-24 Voicecash Ip Gmbh Digitales Verfahren und Anordnung zur Authentifizierung eines Nutzers einer Datenbasis
US8831941B2 (en) 2007-05-29 2014-09-09 At&T Intellectual Property Ii, L.P. System and method for tracking fraudulent electronic transactions using voiceprints of uncommon words
US8050917B2 (en) * 2007-09-27 2011-11-01 Siemens Enterprise Communications, Inc. Method and apparatus for identification of conference call participants
US7766223B1 (en) 2007-11-08 2010-08-03 Mello Steven M Method and system for mobile services
US8050920B2 (en) * 2008-01-18 2011-11-01 Universidad De Chile Biometric control method on the telephone network with speaker verification technology by using an intra speaker variability and additive noise unsupervised compensation
US8498870B2 (en) 2008-01-24 2013-07-30 Siemens Medical Solutions Usa, Inc. Medical ontology based data and voice command processing system
US8536976B2 (en) 2008-06-11 2013-09-17 Veritrix, Inc. Single-channel multi-factor authentication
CA2665009C (en) 2008-05-23 2018-11-27 Accenture Global Services Gmbh System for handling a plurality of streaming voice signals for determination of responsive action thereto
US8332223B2 (en) * 2008-10-24 2012-12-11 Nuance Communications, Inc. Speaker verification methods and apparatus
US20100114573A1 (en) * 2008-10-30 2010-05-06 Motorola, Inc. Method and Device for Verifying a User
US8095368B2 (en) 2008-12-04 2012-01-10 At&T Intellectual Property I, L.P. System and method for voice authentication over a computer network
WO2011002735A1 (en) 2009-07-01 2011-01-06 Carnegie Mellon University Methods and apparatuses for monitoring energy consumption and related operations
KR20110010939A (ko) 2009-07-27 2011-02-08 삼성전자주식회사 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법
US8340831B2 (en) 2009-12-16 2012-12-25 Robert Bosch Gmbh Non-intrusive load monitoring system and method
US9672335B2 (en) 2009-12-17 2017-06-06 Laird H Shuart Cognitive-based logon process for computing device
CN102238190B (zh) * 2011-08-01 2013-12-11 安徽科大讯飞信息科技股份有限公司 身份认证方法及系统
US9898723B2 (en) * 2012-12-19 2018-02-20 Visa International Service Association System and method for voice authentication
US8694315B1 (en) * 2013-02-05 2014-04-08 Visa International Service Association System and method for authentication using speaker verification techniques and fraud model

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS648670A (en) * 1987-07-01 1989-01-12 Fujitsu Ltd Mos field-effect transistor
KR20020097269A (ko) * 2001-03-15 2002-12-31 코닌클리케 필립스 일렉트로닉스 엔.브이. 수시 도움을 요구하는 독거인을 모니터링하기 위한 자동시스템
US20100069725A1 (en) * 2008-09-15 2010-03-18 Masimo Corporation Patient monitor including multi-parameter graphical display

Also Published As

Publication number Publication date
CN104160441B (zh) 2017-12-15
WO2013101818A1 (en) 2013-07-04
US9424845B2 (en) 2016-08-23
JP6234937B2 (ja) 2017-11-22
KR101986867B1 (ko) 2019-06-07
EP2810277A1 (en) 2014-12-10
US20140365219A1 (en) 2014-12-11
JP2015510606A (ja) 2015-04-09
EP2810277B1 (en) 2016-04-27
CN104160441A (zh) 2014-11-19
US8818810B2 (en) 2014-08-26
US20130173268A1 (en) 2013-07-04

Similar Documents

Publication Publication Date Title
KR101986867B1 (ko) 건강 모니터링 시스템에서의 화자 확인
Rudzicz et al. Speech interaction with personal assistive robots supporting aging at home for individuals with Alzheimer’s disease
CN106782536A (zh) 一种语音唤醒方法及装置
US20130158434A1 (en) Apparatus for voice assisted medical diagnosis
Giorgino et al. Automated spoken dialogue system for hypertensive patient home management
CN102149319A (zh) 阿尔茨海默氏症认知使能器
JP2019527864A (ja) 安心で独立した生活を促進するためのバーチャル健康アシスタント
US11749298B2 (en) Health-related information generation and storage
CN113380234B (zh) 基于语音识别生成表单的方法、装置、设备及介质
JP7390268B2 (ja) 認知機能予測装置、認知機能予測方法、プログラム及びシステム
WO2021159755A1 (zh) 智能诊疗数据处理方法、设备、装置及存储介质
WO2019080502A1 (zh) 利用语音进行疾病预测的方法、应用服务器和计算机可读存储介质
CN111798850A (zh) 用语音操作设备的方法和系统及服务器
Rudzicz et al. Speech recognition in Alzheimer’s disease with personal assistive robots
JP2021110895A (ja) 難聴判定装置、難聴判定システム、コンピュータプログラム及び認知機能レベル補正方法
US20080147439A1 (en) User recognition/identification via speech for a personal health system
JP2010054549A (ja) 回答音声認識システム
Grasso The long-term adoption of speech recognition in medical applications
CN110767282B (zh) 一种健康档案生成方法、装置以及计算机可读存储介质
KR20230066821A (ko) 인공지능 기반의 개인용 챗봇 시스템
Griol et al. Towards emotionally sensitive conversational interfaces for e-therapy
JP2020144676A (ja) 情報連携システム、情報連携サーバー、音声入出力装置、情報連携方法およびプログラム
JP2020144681A (ja) 情報連携システム、情報連携サーバー、音声入出力装置、情報連携方法およびプログラム
Cavalcante et al. Mobile and Personal Speech Assistant for the Recognition of Disordered Speech
CN115565662A (zh) 一种病床语音交互桌面终端系统

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right