CN104160441B - 健康监控系统中的讲话者核实 - Google Patents

健康监控系统中的讲话者核实 Download PDF

Info

Publication number
CN104160441B
CN104160441B CN201280068413.2A CN201280068413A CN104160441B CN 104160441 B CN104160441 B CN 104160441B CN 201280068413 A CN201280068413 A CN 201280068413A CN 104160441 B CN104160441 B CN 104160441B
Authority
CN
China
Prior art keywords
people
speech data
data
user
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280068413.2A
Other languages
English (en)
Other versions
CN104160441A (zh
Inventor
翁富良
T·哈桑
冯哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of CN104160441A publication Critical patent/CN104160441A/zh
Application granted granted Critical
Publication of CN104160441B publication Critical patent/CN104160441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/10Multimodal systems, i.e. based on the integration of multiple recognition engines or fusion of expert systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Security & Cryptography (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种用于核实人被注册以使用远程医疗设备的方法,包含识别由人说出并由远程医疗设备接收的字中的未提示的触发词。远程医疗设备提示人陈述注册用户的名字,并可选地提示人陈述对于该人的健康意见。远程医疗设备使用从未提示的触发词、注册用户的名字、以及健康意见产生的话语数据,核实该人是注册用户。

Description

健康监控系统中的讲话者核实
技术领域
概括地讲,本申请涉及自动化的语音识别领域,更具体地,涉及核实讲话者的语音识别系统和方法。
背景技术
远程医疗和家庭医疗保健的领域近年来经历了强劲的增长。在远程医疗系统中,病人被在地理上从医生或者其他医疗保健提供商的面前移除。例如,病人可以在家,而不是在医疗保健设施的现场。远程医疗设备能使医疗保健提供商监控病人的健康状态,并潜在地诊断并处理一些医疗问题,而不需要病人前往医疗保健设施。使用远程医疗系统具有如下的潜力:通过增加对病人的监控来降低医疗保健的成本,并改善医疗保健的质量。
各种已知的远程医疗系统向病人提供一种能使病人向医生或者医疗保健提供商传输医疗数据的设备。一些设备被配置为记录生物信号,诸如心率、血压、以及呼吸率,并将记录的生物信号的数据传输至数据库,用于之后的复查。其他远程医疗系统作为物理治疗方案的部分,向病人提供提醒以处方规定的次数服药或者进行锻炼。
虽然远程医疗系统具有大量潜在的优点,但这样的系统还可能给常使用远程医疗设备而没有医疗保健专业人员的辅助的病人呈现难题。提供直观的用户界面增加了远程医疗设备的有效性,也增加了病人将会勤于使用远程医疗设备的可能性。在一些环境中,远程医疗设备还需要在不同病人之间进行区分,以向每个病人提供适当的治疗。例如,在退休社区中,可能有一大群病人使用远程医疗设备,或者相同家庭的每个成员可能使用远程医疗设备用于不同的治疗。一些形式的远程医疗设备是手持单元,其便携并可能在病人之间不慎交换。因此,改善远程医疗设备,以缓解病人与设备之间的交互,并保证远程医疗设备向每个病人提供适当的治疗将是有利的。
发明内容
根据一个实施例,已开发了用于核实人的身份的方法。该方法包含:用音频输入设备产生与人说出的话语对应的音频数据;用音频数据处理器识别所述音频数据中的第一话语数据;响应于识别的与预定的触发话语对应的第一话语数据,用用户界面设备来产生输出,以提示人说出注册名;响应于识别的与预定的触发话语对应的第一话语数据,将识别的第一话语数据存储在存储器中;用所述音频输入设备产生与说出的注册名对应的音频数据;用所述音频数据处理器识别与说出的注册名对应的所述音频数据中的第二话语数据;将识别的第二话语数据存储在所述存储器中;响应于在存储器中存储的所述第一和第二话语数据对应于在所述注册数据库中注册的与所述注册名关联的用户的声音的预定模型,用讲话者核实模块核实该人是在注册数据库中注册的与所述注册名关联的用户;响应于所述讲话者核实模块核实该人是在所述注册数据库中注册的所述用户,用所述用户界面设备产生输出,来向该人提供服务。
根据另一个实施例,已开发了具有讲话者核实的远程医疗设备。该远程医疗设备包含:音频输入设备,被配置为从人说出的话语产生音频数据;音频数据处理器,可操作地连接至所述音频输入设备,并被配置为从由所述音频输入设备产生的音频数据产生话语数据;存储器,被配置为存储由所述音频数据处理器产生的多个话语数据;注册数据库,被配置为将至少一个用户与所述至少一个用户所对应的注册名和声音模型关联;讲话者核实模块,可操作地连接至所述存储器和所述注册数据库;用户界面设备;以及控制器,可操作地连接至所述音频输入设备、音频数据处理器、存储器、注册数据库、讲话者核实模块和用户界面设备。所述控制器被配置为:激活所述音频输入设备来接收包含由人说出的话语的声音,并产生与所述话语对应的音频数据而不提示该人说话;用所述音频数据处理器识别与由该人说出的所述话语对应的音频数据中的第一话语数据;将识别的第一话语数据存储在所述存储器中;响应于与预定的触发话语对应的第一话语数据,用用户界面设备来产生输出,以提示该人说出注册名;用所述音频输入设备产生与说出的注册名对应的音频数据;用所述音频数据处理器识别与说出的注册名对应的所述音频数据中的第二话语数据;将识别的第二话语存储在所述存储器中;响应于在所述存储器中存储的第一和第二话语数据对应于在所述注册数据库中注册的与所述注册名关联的所述用户的声音的预定模型,用讲话者核实模块核实说出所述注册名的该人是在注册数据库中注册的与所述注册名关联的用户;以及响应于所述讲话者核实模块核实说出所述注册名的该人是所述用户,用所述用户界面设备产生输出,来向该人提供服务。
附图说明
图1是由病人使用的手持远程医疗设备的概要图。
图2是用于核实人是远程医疗设备的注册用户的过程的框图。
图3是与远程医疗设备使用的注册数据库的示例。
图4是与远程医疗设备使用的健康意见数据库的示例。
具体实施方式
为了大体理解本文公开的系统和过程的细节,遍及本说明书参考了附图。在附图中,类似的参考标记指代类似的元件。如本文使用的,术语“话语”是指由人说出的任何内容,包含字和词。术语“话语数据”是指对应于一个或多个话语的数据。话语数据可以对应于记录话语的直接声音,或者是从语音识别器产生的经处理的数据,语音识别器典型地包含前端处理器,诸如数字信号处理器、声学建模器、以及语言模型。
如本文使用的,术语“核实”是指如下过程:远程医疗设备经该过程对声称是远程医疗设备的注册用户的人实际上是该用户进行认证。在讲话者核实过程中,远程医疗设备通过处理来自人的一个或多个话语,核实该人是或者不是声称的用户。例如,如果远程医疗设备被配置为识别注册用户“约翰史密斯”,那么人首先向该远程医疗设备键入输入,表明他是注册用户约翰史密斯,并提供一个或多个话语,远程医疗设备使用来自注册用户约翰史密斯的预定的声音模型,使用该话语来核实该人是或者不是注册用户约翰史密斯。
如本文使用的,术语“健康意见”是指与以下内容有关的字或者词:有关病人的健康和安康的建议或者信息。例如,词“今天我应该走一英里”是与病人应该进行的锻炼有关的健康意见。一些健康意见对几乎任何病人都是通用的,诸如营养健康意见“我应该吃新鲜的蔬菜”。其他健康意见可以针对特定病人。例如,针对带有药处方的病人的健康意见是“我应该在适当的时间服用我的药处方”。在提供的示例中,健康意见中的语言从病人的角度以第一人称构成。如下所述,病人大声说出一个或多个健康意见,作为用于使用远程医疗设备的核实过程的一部分。一些健康意见以第一人称角度提供,以增强健康意见对病人的适用性,尽管其他健康意见包含各种形式的词和字。
图1描绘了远程医疗设备100。远程医疗设备100包含:音频输入设备104、一个或多个用户界面设备108、音频数据处理器112、讲话者核实模块116、网络输入/输出(I/O)设备120、控制器124和存储器128。存储器128为以下内容存储数据:记录的话语数据的缓冲132、存储的程序指令136、注册数据库140、以及健康意见数据库144。在一个操作模式中,存储器128还存储预定的触发话语数据134。存储器128包含一个或多个设备来存储数字数据,诸如随机存取存储器(RAM)和非易失性数据存储设备,诸如磁介质和固态数据存储设备。在图1的示例中,远程医疗设备100包含在形成具有由人102手持使用的尺寸和形状的外壳150内。远程医疗设备100被配置为从人102接受话语,以核实人102是远程医疗设备100的注册用户、以及从人102接受话语来操作该远程医疗设备。
远程医疗设备100包含位于外壳150内的一个或多个用户界面设备108。用户界面设备提供输出信息给用户,并从用户接收输入信息、命令、以及话语。输出设备的常见示例包含视觉显示屏,诸如液晶显示器(LCD)和其他视觉显示屏;发出声音和合成语音的扬声器;触觉反馈设备等。输入设备的常见示例包含还被用作音频输入104的麦克风、小键盘、集成在显示屏的触摸屏界面、以及包含按钮和开关的触觉控制。尤其是,用户界面设备108能使远程医疗设备提示人102来提供由音频输入104检测的话语。
远程医疗设备100包含网络I/O设备120。网络I/O设备的常见示例包含无线数据通信模块,诸如无线局域网(WLAN)、无线广域网(WWAN)网络设备。其他I/O设备包含有线网络设备,诸如以太网设备,或者串行设备,诸如USB设备,以将远程医疗设备100连接至向数据网络提供接入的分离的计算机。网络I/O设备能使远程医疗设备100经由数据网络,诸如互联网,与在线数据库和医疗保健提供商通信。
音频输入104典型地包含一个或多个麦克风,麦克风位于外壳150,处于能够检测远程医疗设备100周围的环境中的声音的位置。音频输入设备104发挥功能,以检测由人102说出的话语,并从该话语产生音频数据。在一些实施例中,音频数据包含由一个或多个麦克风产生的模拟电信号。在其他实施例中,音频输入104包含模数转换器,将与接收的话语对应的模拟信号转换为数字信号,诸如代表记录的声音的脉冲编码调制(PCM)信号或其他数字信号。音频输入设备104的一些实施例包含信号滤波器、回声消除电路、以及改善音频数据的质量的其他信号处理设备。
音频数据处理器112从音频输入设备104接收音频数据,并从音频数据产生话语数据。音频数据处理器112包含处理音频数据的声学建模器和语言模型,以从音频数据提取说出的字和词。音频数据处理器112可操作地连接至存储器128。在一个操作模式中,音频数据处理器112对产生的话语数据与存储器128中与一个或多个触发词对应的预定的话语数据134进行比较。如果产生的话语数据与预定的触发词的话语数据对应,那么控制器124激活远程医疗设备100中的其他组件,包含讲话者核实模块。在另一个操作模式中,音频数据处理器112对产生的话语数据与健康意见数据库144中的一个或多个健康意见所对应的话语数据进行比较。当音频数据处理器112产生与各种类型的预定的话语数据对应的话语数据时,音频数据处理器112将话语数据存储在存储器128中的话语数据缓冲132中。话语数据缓冲132积累被用于核实人102是远程医疗设备100的注册用户的多组话语数据。
讲话者核实模块116可操作地连接至存储器128和控制器124。讲话者核实模块116从话语数据缓冲132读出话语数据,并核实该话语数据与存储在注册数据库140中的语音模型对应,其中所述语音模型与使用远程医疗设备100的人的声称的注册名关联。话语数据缓冲132存储有由音频数据处理器112产生的积累的话语数据,包含与触发词、注册用户名、以及一个或多个说出的健康意见对应的话语数据。在一个实施例中,讲话者核实模块116产生与如下内容对应的置信度:话语数据缓冲132中的话语数据与注册用户的声音模型对应的可能性。讲话者核实模块116还产生与冒充者声音模型对应的置信度,其对应于属于不是注册用户的人的一个或多个声音的各种声音特征。根据用于模块116的讲话者核实方法,使用高斯混合模型(GMM)或者其他技术,事先用来自不同的人的大量的数据来训练冒充者声音模型。远程医疗设备100将产生的冒充者声音模型存储在注册数据库140中,用于在讲话者核实过程期间使用。
如果对于用户的声音模型的置信度高出冒充者至少预定的阈值,那么讲话者核实模块116核实:话语数据与注册用户的声音模型对应。如果对于冒充者的声音模型的置信度高出注册用户至少预定的阈值,那么讲话者核实模块116核实:话语数据不与注册用户的声音模型对应。在一些情况下,没有足够可用的话语数据来产生清楚表明话语数据是否与用户的声音模型对应的置信度。远程医疗设备100提示人102说出一个或多个健康意见,来产生增加至话语数据缓冲132的额外的话语数据,并且数据缓冲132中额外的话语数据增加了以下内容的可能性:讲话者核实模块116具有足够的话语数据来用注册用户的声音模型去核实人102。
注册数据库140包含与被授权使用远程医疗设备100的一个或多个用户对应的注册数据。图3描绘了存储在注册数据库300中的数据的示例。注册数据库300包含对应于以下内容的列:注册名标识符304、对应于注册名的话语数据308、以及对应于注册用户的声音模型的话语数据312。注册名标识符304是识别远程医疗设备100的每个用户的字符串或者数字标识符。在图3的示例中,“冒充者”名字是注册数据库中的特殊的条目,其存储与不是注册用户之一的一个或多个声音模型对应的话语数据。
在表格300中,对于每个用户308的注册名的话语数据和对于每个用户312的声音模型的话语数据都包含从用户在登记过程期间说出的话语获得的话语数据。在登记过程中,用户说出包括一个或多个一系列字和词的话语,包含注册名和一系列训练词。注册用户的声音模型是使用从包括注册名和训练词的话语产生的话语数据产生的。登记过程典型地在病人接收远程医疗设备之前进行一次。远程医疗设备100可以直接进行登记过程,或者分离的登记系统进行注册,并且远程医疗设备100接收用户信息和产生的声音模型。例如,远程医疗设备100可以从经由网络I/O设备120通过互联网160接入的在线注册数据库170,下载对于一个或多个登记用户的注册数据。
对于注册名308的话语数据存储有与被注册以使用远程医疗设备100的用户的注册名对应的话语数据。注册名可以简单地为用户的名字,例如“约翰史密斯”,或者可以是特殊的登录名或者数字病人编号。出于说明的目的,注册名在图3中列出为文本,但是典型地在注册数据库300中存储为二进制话语数据。对于声音模型312的话语数据包含对应于由注册用户提供的多个话语的话语数据。在一些实施例中,在登记过程期间被用于产生声音模型的话语数据被提供一次。在其他实施例中,在远程医疗设备100核实特定的注册用户正在说话之后,话语数据312被更新为新产生的话语数据。更新的话语数据会导致在用远程医疗设备100治疗期间发生的用户的声音的逐步改变。对于声音模型的话语数据典型地以二进制数据格式存储在注册数据库140中。
健康意见数据库144包含与多个健康意见关联的数据。图4描绘了存储在健康意见数据库的数据的示例。表格400包含对应于以下内容的列:健康意见标识符404、被用于提示人说出健康意见的数据408、以及对应于说出的健康意见的话语数据412。表格400中的每行代表对应于单个的健康意见的数据,并且表格400典型地包含多个健康意见。健康意见标识符是识别特定健康意见的字符串或者数字值。在一些实施例中,远程医疗设备100使用来自图3中表格300的健康意见标识符404和注册名标识符304,将选择的健康意见与特定病人关联。
对于健康意见的提示数据408包含能使远程医疗设备100向用户产生消息提示用户说出对应的健康意见的格式化数据。虽然在图4中描绘的提示数据是文本的形式,但提示数据可以以各种格式存储,包含远程医疗设备经由扬声器输出的音频数据、以及以用户界面设备108的屏幕上显示的视觉提示的形式。一些提示对用户提供词,以重复回到远程医疗设备100。其他健康意见提示对用户提供简单的问题,而用户说出问题的答案。在问题和答案配置中,远程医疗设备100可以在显示屏显示答案,以辅助讲话者记住问题的答案。
话语数据412与特定的健康意见对应。出于示例性目的,话语数据在图4中描绘为文本,但是话语数据典型地以二进制数据格式存储在健康意见数据库144中。在一些实施例中,对于每个健康意见的话语数据412直接与注册用户的记录的话语对应,该注册用户在使用远程医疗设备之前在登记过程期间说出每个健康意见。在其他实施例中,话语数据不直接与注册用户的声音对应,而是对一个或多个声音通用。音频数据处理器112被配置为对从话语的音频数据产生的话语数据与预定的话语数据412进行比较,以识别人102是否说出了提示的健康意见或者说出了不同的词。
在一些实施例中,存储在健康意见数据库144中的远程医疗设备100检索是从分离的健康意见数据库174通过互联网160经由网络I/O设备120检索的。医疗保健提供商用各种健康意见(包含适用于很多病人的通用健康意见)以及与特定注册用户关联的特定健康意见,来填充健康意见数据库174。远程医疗设备100周期地更新健康意见数据库144中的健康意见,以便用户接收多种多样的健康意见。
再次参考图1,控制器124协调远程医疗设备100的操作,更具体而言,控制远程医疗设备以核实与远程医疗设备交互的人是注册用户。远程医疗设备的一些实施例包含单个的微电子设备,诸如处理器、微控制器、现场可编程门阵列(FPGA)、特定用途集成电路(ASIC)、或者其他数字计算设备,以实现一些或者所有以下项目的功能:控制器124、音频数据处理器112、讲话者核实模块116、以及网络I/O 120。控制器124执行保持在存储器128的存储的程序指令区136的软件指令。在一些实施例中,远程医疗设备100中的各种组件(包含音频数据处理器112和讲话者核实模块116)实现为由控制器116执行的软件程序。实现音频数据处理器112和讲话者核实模块116的功能的存储的指令,存储在存储器100的存储的程序区136。在其他实施例中,音频数据处理器112和讲话者核实模块116中的一个或两者包含专门的处理设备,诸如数字信号处理器(DSP)。又一个实施例使用硬件和软件组件的组合,执行音频数据处理器112和讲话者核实模块116的功能。远程医疗设备中的各种微电子组件可以组合为“片上系统”(SoC)配置中的单个的物理设备。
图2描绘用于通过讲话者核实过程,来核实声称是远程医疗设备的注册用户的人的身份与注册用户匹配的过程200。出于说明的目的,结合远程医疗设备100来说明过程200。如下所述,被说明为实现功能或者执行一些动作的过程是指控制器执行存储在存储器中的编程的指令,来操作一个或多个电子组件以实现该功能或者执行该动作。过程200以音频输入设备从通过音频输入设备接收的声音产生音频数据开始(框204)。在远程医疗设备100中,音频输入设备104包含从环境接收声音的一个或多个麦克风,以及从接收的声音产生音频数据的音频输入设备。过程200从音频信号产生话语数据(框212),如果音频信号包含话语,那么对话语数据与预定的触发词进行比较(框216)。触发词典型地是并非用于通常会话的一个字或者多个字,以防止远程医疗设备100的不慎激活。远程医疗设备不对人产生提示或者请求来说出触发词。
远程医疗设备100以监控操作模式连续执行框204–216中的过程,直到人102说出触发词。在监控模式中,远程医疗设备的各种组件未激活或者被置于低功率操作模式,其降低了远程医疗设备100的功耗。在经由电池操作的远程医疗设备的实施例中,低功率模式延长远程医疗设备的电池寿命。当音频数据处理器112从与触发话语数据134对应的音频信号产生话语数据时,远程医疗设备100继续过程200。
在过程200中,对应于触发词的话语数据存储在存储器中,供以后核实讲话者的身份使用(框220)。在远程医疗设备100中,话语数据存储在话语数据缓冲132。在接收了触发词之后,过程200产生对讲话者的提示,来陈述注册用户的注册名(框224)。远程医疗设备100可以使用扬声器来产生音频提示,或者视觉显示请求使人102说出用户名。
远程医疗设备产生与说出的注册名对应的音频数据(框232),并且产生与注册名的音频数据对应的话语数据(框236)。在远程医疗设备100中,如果人102不提供与注册数据库140中的一个用户对应的注册名(框238),那么远程医疗设备100要么提示讲话者重复注册用户的名字、要么返回框204描述的处理来监控寻找触发词。在接收了与注册用户的名字对应的话语数据之后(框238),过程200将与注册用户的名字对应的话语数据存储在存储器中(框240)。在远程医疗设备100中,除了来自触发词的话语数据外,与注册名对应的话语数据也被存储在话语数据缓冲132。
过程200继续产生一个或多个置信度,用于用与注册名对应的用户的预定的声音模型来核实存储在存储器中的话语数据(框244)。远程医疗设备100中的讲话者核实模块116从话语数据缓冲132提取记录的话语数据,并且从注册数据库140提取对应于注册用户的声音模型的话语数据。在一些实施例中,注册数据库140存储对于多于一个用户的语音模型,并且过程200选择对应于说出的注册名的用户,在被注册以使用远程医疗设备100的不同用户之间进行区分。讲话者核实模块116还从注册数据库140中的冒充者提取话语数据。
在一些实例中,用于触发词的话语数据和注册名足够讲话者核实模块116以产生清楚表明人102是否是具有该注册名的用户的置信度(框248)。过程200利用积累的数据量,测量在框244的处理中识别的置信度的可靠性。如果讲话者核实模块116核实:对于注册用户声音模型的置信度高出对于冒充者模型的置信度多于预定的阈值(框256),那么远程医疗设备100核实:人102是具有该注册名的用户(框260),并且远程医疗设备100向用户提供服务(框264)。
如果讲话者核实模块116识别:表明与冒充者对应的话语数据的置信度(框256),那么讲话者核实模块116识别:人102不是注册用户(框292),并且远程医疗设备100拒绝向冒充者提供远程健康服务(框296)。在一些配置中,远程医疗设备100维持对失败的核实尝试的计数,并且如果计数超过预定的阈值,那么远程医疗设备阻止任何额外的尝试来使用该远程医疗设备核实用户。例如,如果使用该远程医疗设备核实人的3次连续尝试每次结果都是该人被识别为冒充者,那么远程医疗设备锁住任何用户,直至医疗保健专业人员重置该设备。
在一些情况下,讲话者核实模块116产生不足以核实人102是否是注册用户的置信度(框248)。例如,如果对于注册用户的声音模型和冒充者声音模型这两者产生的置信度都低于预定的阈值,或者如果两个置信度位于彼此的预定范围内,那么讲话者核实模块116可以请求额外的话语数据以进行核实。在另一个示例中,从不足量的话语数据产生的高或低置信度具有低可靠性。过程200收集额外的话语数据,以产生具有足够程度的可靠性的置信度来核实讲话者。
为了产生额外的话语数据,过程200提示人102说出健康意见(框272)。远程医疗设备从健康意见数据库144选择健康意见,并产生对于人102的音频或者视觉提示。音频输入104产生与说出的健康意见对应的音频数据(框276),并且音频数据处理器112从音频数据产生话语数据(框280)。音频数据处理器112对产生的话语数据与存储在健康意见数据库144的选择的健康意见的预定的话语数据进行比较。
如果产生的话语数据不与健康意见对应(框282),那么远程医疗设备100重复提示人说出健康意见(框272)。在过程200期间,远程医疗设备100维持产生的话语数据不与提示的健康意见对应的次数的计数器。如果该计数超过预定的最大数(框283),那么设备100用用户界面提示替代核实(框298)。例如,如果用户对于健康意见连续3次不能提供正确的响应,那么设备100请求替代核实。如果产生的话语数据与健康意见对应(框282),那么产生的话语数据存储在话语数据缓冲132中(框284)。过程200然后返回框244来使用所有的积累的话语数据(包含来自健康意见的话语数据)进行讲话者核实。
在一些情况下,在收集足够的话语数据来核实人102是否是注册用户之前,过程200提示多个健康意见。在每个重复期间远程医疗设备100提示不同的健康意见,以提供更广泛种类的话语数据给讲话者核实模块116。过程200在用户核实处理期间对接受的健康意见的数量加以限制(框268)。例如,如果过程200接收与5个健康意见对应的话语数据,但是仍然缺少足够的话语数据来核实人102是否是注册用户,那么讲话者核实过程200终止,并且远程医疗设备100使用替代的核实过程(框298)。在一个替代的核实处理中,远程医疗设备在用户界面108的显示屏上产生登入提示,并且人102经由小键盘键入用户名和密码。
远程医疗设备100和核实过程200向病人提供简单且有效的核实过程。由于远程医疗设备100使用从人接收的所有有效的话语数据(包含初始触发词)来核实人是注册用户,因此远程医疗设备100能以最小数量的语音样本来有效核实用户。另外,在核实过程期间健康意见语音样本向病人提供健康建议,以增加提供给每个病人的医疗福利,即便是在初始核实过程期间。
在附图和上述描述中已示出并详细描述了本发明,但其性质上应该被视为说明性而非限制性的。例如,本文说明的语音的示例是英语,但远程医疗设备100可以被配置为从范围广泛的语言识别语音并产生话语数据。要理解的是呈现的仅是优选的实施例,并且期望要保护的是在本发明的精神内的所有改变、修改和进一步的应用。

Claims (21)

1.一种用于核实人的身份的方法:
用音频输入设备产生与人说出的话语对应的音频数据;
用音频数据处理器识别所述音频数据中的第一话语数据;
响应于识别出的第一话语数据与预定的触发话语对应,用用户界面设备来产生输出,以提示人说出注册名;
响应于识别出的第一话语数据与所述预定的触发话语对应,将所述识别出的第一话语数据存储在存储器中;
用所述音频输入设备产生与所说出的注册名对应的音频数据;
用所述音频数据处理器识别所述音频数据中与所述说出的注册名对应的第二话语数据;
将所识别出的第二话语数据存储在所述存储器中;
响应于在所述存储器中存储的所述第一话语数据和所述第二话语数据对应于在注册数据库中注册的与所述注册名关联的用户的声音的预定模型,用讲话者核实模块核实该人是在所述注册数据库中注册的与所述注册名关联的用户;以及
响应于所述讲话者核实模块核实该人是在所述注册数据库中注册的用户,用所述用户界面设备产生输出以向该人提供服务。
2.如权利要求1所述的方法,还包括:
响应于所述讲话者核实模块识别:所述存储器中的所述第一话语数据和第二话语数据用所述用户的声音的预定模型不足以核实该人,用所述用户界面设备产生输出,来提示该人说出预定短语;
用所述音频输入设备产生与所说出的预定短语对应的音频数据;
用所述音频数据处理器识别所述音频数据中与所说出的预定短语对应的第三话语数据;
将所述第三话语数据存储在所述存储器中;以及
响应于在所述存储器中存储的所述第一话语数据、所述第二话语数据、以及所述第三话语数据对应于在所述注册数据库中注册的用户的声音的预定模型,用所述讲话者核实模块核实该人是在所述注册数据库中注册的用户。
3.如权利要求2所述的方法,还包括:
响应于所述第三话语数据对应于所述预定短语的预定的话语数据,将所述第三话语数据存储在所述存储器中。
4.如权利要求2所述的方法,还包括:
响应于所述第三话语数据不对应于所述预定短语的预定的话语数据,用所述用户界面设备产生输出,以提示该人第二次说出所述预定短语。
5.如权利要求2所述的方法,所述用户界面设备产生提示,以使该人说出健康建议作为所述预定短语。
6.如权利要求5所述的方法,所述用户界面设备产生提示,以使该人说出与在所述注册数据库中的所述注册名关联的健康建议。
7.如权利要求2所述的方法,还包括:
响应于存储在所述存储器中的所述第一话语数据、所述第二话语数据、以及所述第三话语数据不对应于在所述注册数据库中注册的所述用户的声音的预定模型,用所述讲话者核实模块来核实说出所述注册名的人不是在所述注册数据库中注册的与所述注册名关联的用户;以及
响应于所述讲话者核实模块核实说出所述注册名的人不是在所述注册数据库中注册的用户,用所述用户界面设备产生输出以拒绝为该人服务。
8.如权利要求2所述的方法,还包括:
响应于所述讲话者核实模块识别所述存储器中的所述第一话语数据、所述第二话语数据、以及所述第三话语数据用所述用户的声音的预定模型不足以核实该人,继续用所述用户界面设备产生输出,以提示该人说出至少一个额外的预定短语;
用所述音频输入设备产生与该人说出的所述至少一个额外的预定短语对应的音频数据;
用所述音频数据处理器识别所述音频数据中与所述至少一个额外的预定短语对应的至少一个额外的话语数据;
将所述至少一个额外的话语数据存储在所述存储器中;以及
响应于在所述存储器中存储的所述第一话语数据、所述第二话语数据、所述第三话语数据、以及至少一个额外的话语数据对应于在所述注册数据库中注册的所述用户的声音的预定模型,用所述讲话者核实模块核实该人是在所述注册数据库中注册的与所述注册名关联的用户。
9.如权利要求8所述的方法,还包括:
响应于在超过预定阈值的若干额外的话语数据存储在所述存储器之后,所述存储器没有足够的话语数据使所述讲话者核实模块核实该人是用户,识别所述讲话者核实模块不能核实该人是在所述注册数据库中与所述注册名关联的用户。
10.如权利要求9所述的方法,还包括:
响应于所述讲话者核实模块不能核实该人是所述注册数据库中与所述注册名关联的用户,用所述用户界面设备提示该人用不同于所述音频输入设备的用户输入设备来输入用于核实该人的信息。
11.一种具有讲话者核实的远程医疗设备,包括:
音频输入设备,被配置为从人说出的话语产生音频数据;
音频数据处理器,可操作地连接至所述音频输入设备,并被配置为从由所述音频输入设备产生的音频数据产生话语数据;
存储器,被配置为存储由所述音频数据处理器产生的多个话语数据;
注册数据库,被配置为将至少一个用户与对应于所述至少一个用户的注册名和声音模型关联;
讲话者核实模块,可操作地连接至所述存储器和所述注册数据库;
用户界面设备;以及
控制器,可操作地连接至所述音频输入设备、音频数据处理器、存储器、注册数据库、讲话者核实模块、以及用户界面设备,所述控制器被配置为:
激活所述音频输入设备来接收包含由人说出的话语的声音,并产生与所述话语对应的音频数据而不提示该人说话;
用所述音频数据处理器识别与由该人说出的所述话语对应的音频数据中的第一话语数据;
将所识别出的第一话语数据存储在所述存储器中;
响应于所述第一话语数据与预定的触发话语对应,用用户界面设备来产生输出,以提示该人说出注册名;
用所述音频输入设备产生与所说出的注册名对应的音频数据;
用所述音频数据处理器识别所述音频数据中与所述说出的注册名对应的第二话语数据;
将所识别出的第二话语存储在所述存储器中;
响应于在所述存储器中存储的所述第一话语数据和所述第二话语数据对应于在所述注册数据库中注册的与所述注册名关联的用户的声音的预定模型,用讲话者核实模块核实说出所述注册名的该人是在注册数据库中注册的与所述注册名关联的用户;以及
响应于所述讲话者核实模块核实说出所述注册名的人是用户,用所述用户界面设备产生输出以向该人提供服务。
12.如权利要求11所述的远程医疗设备,所述控制器还被配置为:
响应于所述讲话者核实模块识别:所述存储器中的所述第一话语数据和所述第二话语数据用所述用户的声音的预定模型不足以核实该人,用所述用户界面设备产生输出,以提示该人说出预定短语;
用所述音频输入设备产生与所说出的预定短语对应的音频数据;
用所述音频数据处理器,识别所述音频数据中与所说出的预定短语对应的第三话语数据;
将所述第三话语数据存储在所述存储器中;以及
响应于在所述存储器中存储的所述第一话语数据、所述第二话语数据、以及所述第三话语数据对应于在所述注册数据库中注册的所述用户的声音的预定模型,用所述讲话者核实模块核实说出所述注册名的该人是在所述注册数据库中注册的用户。
13.如权利要求12所述的远程医疗设备,所述音频数据处理器还被配置为:
响应于所述第三话语数据对应于所述预定短语的预定的话语数据,将所述第三话语数据存储在所述存储器中。
14.如权利要求12所述的远程医疗设备,所述控制器还被配置为:
响应于所述第三话语数据不对应于所述预定短语的预定的话语数据,用所述用户界面设备产生输出,以提示该人第二次说出所述预定短语。
15.如权利要求12所述的远程医疗设备,所述用户界面设备还被配置为:
产生提示,以使该人说出健康建议作为所述预定短语。
16.如权利要求15所述的远程医疗设备,所述用户界面设备还被配置为:
产生提示,以使该人说出与在所述注册数据库中的所述注册名关联的健康建议。
17.如权利要求12所述的远程医疗设备,所述控制器还被配置为:
响应于存储在所述存储器中的所述第一话语数据、所述第二话语数据、以及所述第三话语数据不对应于在所述注册数据库中注册的所述用户的声音的预定模型,用所述讲话者核实模块来核实说出所述注册名的人不是在所述注册数据库中注册的与所述注册名关联的用户;以及
响应于所述讲话者核实模块核实说出所述注册名的人不是在所述注册数据库中注册的用户,用所述用户界面设备产生输出以拒绝为该人服务。
18.如权利要求12所述的远程医疗设备,所述控制器还被配置为:
响应于所述讲话者核实模块识别在所述存储器中存储的所述第一话语数据、所述第二话语数据、以及所述第三话语数据不足以核实:在所述存储器中存储的所述第一话语数据、所述第二话语数据、以及所述第三话语数据对应于在所述注册数据库中注册的所述用户的声音的预定模型,继续用所述用户界面设备产生输出,以提示该人说出至少一个额外的预定短语;
用所述音频输入设备产生与由该人说出的所述至少一个额外的预定短语对应的音频数据;
用所述音频数据处理器识别所述音频数据中与所述至少一个额外的预定短语对应的至少一个额外的话语数据;
将所述至少一个额外的话语数据存储在所述存储器中;以及
响应于在存储器中存储的所述第一话语数据、所述第二话语数据、所述第三话语数据、以及至少一个额外的话语数据对应于在所述注册数据库中注册的所述用户的声音的预定模型,用所述讲话者核实模块核实该人是在所述注册数据库中注册的与所述注册名关联的用户。
19.如权利要求18所述的远程医疗设备,所述控制器还被配置为:
响应于在超过预定阈值的若干额外的话语数据存储在所述存储器之后,所述存储器没有足够的话语数据使所述讲话者核实模块核实该人是用户,识别所述讲话者核实模块不能核实该人是在所述注册数据库中与所述注册名关联的用户。
20.如权利要求19所述的远程医疗设备,所述控制器还被配置为:
响应于所述讲话者核实模块核实该人不是所述注册数据库中与所述注册名关联的用户,用所述用户界面设备提示该人用不同于所述音频输入设备的用户输入设备来输入核实该人的信息。
21.如权利要求11所述的远程医疗设备,还包括:
手持外壳,所述音频输入设备、音频数据处理器、存储器、注册数据库、讲话者核实模块、用户界面设备、以及控制器位于其中。
CN201280068413.2A 2011-12-29 2012-12-26 健康监控系统中的讲话者核实 Active CN104160441B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/340,213 2011-12-29
US13/340,213 US8818810B2 (en) 2011-12-29 2011-12-29 Speaker verification in a health monitoring system
PCT/US2012/071633 WO2013101818A1 (en) 2011-12-29 2012-12-26 Speaker verification in a health monitoring system

Publications (2)

Publication Number Publication Date
CN104160441A CN104160441A (zh) 2014-11-19
CN104160441B true CN104160441B (zh) 2017-12-15

Family

ID=47553473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280068413.2A Active CN104160441B (zh) 2011-12-29 2012-12-26 健康监控系统中的讲话者核实

Country Status (6)

Country Link
US (2) US8818810B2 (zh)
EP (1) EP2810277B1 (zh)
JP (1) JP6234937B2 (zh)
KR (1) KR101986867B1 (zh)
CN (1) CN104160441B (zh)
WO (1) WO2013101818A1 (zh)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
KR20120121070A (ko) * 2011-04-26 2012-11-05 삼성전자주식회사 원격 건강관리 시스템 및 이를 이용한 건강관리 방법
US10008206B2 (en) * 2011-12-23 2018-06-26 National Ict Australia Limited Verifying a user
US9390445B2 (en) 2012-03-05 2016-07-12 Visa International Service Association Authentication using biometric technology through a consumer device
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US8850534B2 (en) * 2012-07-06 2014-09-30 Daon Holdings Limited Methods and systems for enhancing the accuracy performance of authentication systems
US10438591B1 (en) * 2012-10-30 2019-10-08 Google Llc Hotword-based speaker recognition
US9704486B2 (en) * 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US8694315B1 (en) 2013-02-05 2014-04-08 Visa International Service Association System and method for authentication using speaker verification techniques and fraud model
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
GB2515527B (en) * 2013-06-26 2016-08-31 Cirrus Logic Int Semiconductor Ltd Speech Recognition
GB2526980B (en) * 2013-07-10 2017-04-12 Cirrus Logic Int Semiconductor Ltd Sensor input recognition
CN110096253B (zh) * 2013-07-11 2022-08-30 英特尔公司 利用相同的音频输入的设备唤醒和说话者验证
US9711148B1 (en) * 2013-07-18 2017-07-18 Google Inc. Dual model speaker identification
US9189742B2 (en) * 2013-11-20 2015-11-17 Justin London Adaptive virtual intelligent agent
GB2524222B (en) * 2013-12-18 2018-07-18 Cirrus Logic Int Semiconductor Ltd Activating speech processing
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
KR102246900B1 (ko) * 2014-07-29 2021-04-30 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US10971260B2 (en) 2014-09-14 2021-04-06 Becton, Dickinson And Company System and method for capturing dose information
US10704944B2 (en) 2014-09-14 2020-07-07 Becton, Dickinson And Company System and method for capturing dose information
CN105740056B (zh) * 2014-12-08 2019-03-29 联想(北京)有限公司 信息处理方法及电子设备
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10438593B2 (en) 2015-07-22 2019-10-08 Google Llc Individualized hotword detection models
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
WO2017162675A1 (en) 2016-03-22 2017-09-28 Koninklijke Philips N.V. Analyzing validity of measured health-related data
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
JP6972149B2 (ja) * 2017-09-28 2021-11-24 京セラ株式会社 音声命令システム及び音声命令方法
US10901687B2 (en) 2018-02-27 2021-01-26 Dish Network L.L.C. Apparatus, systems and methods for presenting content reviews in a virtual world
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11538045B2 (en) 2018-09-28 2022-12-27 Dish Network L.L.C. Apparatus, systems and methods for determining a commentary rating
US11501879B2 (en) * 2018-10-01 2022-11-15 Preventice Technologies, Inc. Voice control for remote monitoring
US10918910B2 (en) * 2018-11-27 2021-02-16 Sap Se Digital assistant for therapeutic treatment
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
CN111193811A (zh) * 2020-03-04 2020-05-22 杭州憶盛医疗科技有限公司 一种基于5g网络的医疗手术在线远程控制系统
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US20220272131A1 (en) * 2020-09-04 2022-08-25 Puzzle Ai Co., Ltd. Method, electronic device and system for generating record of telemedicine service
CN114861594B (zh) * 2022-07-08 2022-09-20 英诺达(成都)电子科技有限公司 芯片的低功耗验证方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4653097A (en) * 1982-01-29 1987-03-24 Tokyo Shibaura Denki Kabushiki Kaisha Individual verification apparatus
US5940476A (en) * 1996-06-28 1999-08-17 Distributed Software Development, Inc. System and method for identifying an unidentified caller
US6246987B1 (en) * 1998-02-04 2001-06-12 Alcatel Usa Sourcing, L.P. System for permitting access to a common resource in response to speaker identification and verification
US6556127B1 (en) * 1996-10-15 2003-04-29 Swisscom Ag Speaker verification method
CN102238190A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 身份认证方法及系统

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS648670A (en) * 1987-07-01 1989-01-12 Fujitsu Ltd Mos field-effect transistor
US5365574A (en) 1990-05-15 1994-11-15 Vcs Industries, Inc. Telephone network voice recognition and verification using selectively-adjustable signal thresholds
US5127043A (en) * 1990-05-15 1992-06-30 Vcs Industries, Inc. Simultaneous speaker-independent voice recognition and verification over a telephone network
US5517558A (en) * 1990-05-15 1996-05-14 Voice Control Systems, Inc. Voice-controlled account access over a telephone network
US5265191A (en) 1991-09-17 1993-11-23 At&T Bell Laboratories Technique for voice-based security systems
US5660176A (en) 1993-12-29 1997-08-26 First Opinion Corporation Computerized medical diagnostic and treatment advice system
US5608784A (en) * 1994-01-24 1997-03-04 Miller; Joel F. Method of personnel verification using voice recognition
US5414755A (en) 1994-08-10 1995-05-09 Itt Corporation System and method for passive voice verification in a telephone network
US5774841A (en) 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
US6073101A (en) 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
US5752231A (en) 1996-02-12 1998-05-12 Texas Instruments Incorporated Method and system for performing speaker verification on a spoken utterance
US6292782B1 (en) 1996-09-09 2001-09-18 Philips Electronics North America Corp. Speech recognition and verification system enabling authorized data transmission over networked computer systems
AU5359498A (en) 1996-11-22 1998-06-10 T-Netix, Inc. Subword-based speaker verification using multiple classifier fusion, with channel, fusion, model, and threshold adaptation
CA2284168A1 (en) 1997-03-13 1998-09-17 First Opinion Corporation Disease management system
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6697783B1 (en) 1997-09-30 2004-02-24 Medco Health Solutions, Inc. Computer implemented medical integrated decision support system
US6064963A (en) 1997-12-17 2000-05-16 Opus Telecom, L.L.C. Automatic key word or phrase speech recognition for the corrections industry
JP3835032B2 (ja) * 1998-12-18 2006-10-18 富士通株式会社 利用者照合装置
US6505155B1 (en) 1999-05-06 2003-01-07 International Business Machines Corporation Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy
US6978238B2 (en) * 1999-07-12 2005-12-20 Charles Schwab & Co., Inc. Method and system for identifying a user by voice
US7590538B2 (en) * 1999-08-31 2009-09-15 Accenture Llp Voice recognition system for navigating on the internet
US6523009B1 (en) 1999-11-06 2003-02-18 Bobbi L. Wilkins Individualized patient electronic medical records system
ATE397413T1 (de) * 1999-12-23 2008-06-15 Philips Intellectual Property System zur messung von parameter identifizierten patienten
US7194395B2 (en) 2000-02-23 2007-03-20 The United States Of America As Represented By The Secretary Of The Army System and method for hazardous incident decision support and training
JP2002123294A (ja) * 2000-10-18 2002-04-26 Olympus Optical Co Ltd 医療システム
JP4622106B2 (ja) * 2001-01-29 2011-02-02 日本電気株式会社 人物特定システム
JP2002258883A (ja) * 2001-02-27 2002-09-11 Sanyo Electric Co Ltd 音声再生装置、音声再生方法及び音声再生システム
US6611206B2 (en) * 2001-03-15 2003-08-26 Koninklijke Philips Electronics N.V. Automatic system for monitoring independent person requiring occasional assistance
JP3687553B2 (ja) * 2001-03-23 2005-08-24 日本電気株式会社 個人認証方式
US6853716B1 (en) 2001-04-16 2005-02-08 Cisco Technology, Inc. System and method for identifying a participant during a conference call
US7493264B1 (en) 2001-06-11 2009-02-17 Medco Health Solutions, Inc, Method of care assessment and health management
US7702918B2 (en) 2001-07-18 2010-04-20 Daon Holdings Limited Distributed network system using biometric authentication access
US20050154588A1 (en) 2001-12-12 2005-07-14 Janas John J.Iii Speech recognition and control in a process support system
US7240007B2 (en) 2001-12-13 2007-07-03 Matsushita Electric Industrial Co., Ltd. Speaker authentication by fusion of voiceprint match attempt results with additional information
DE10313310A1 (de) 2003-03-25 2004-10-21 Siemens Ag Verfahren zur sprecherabhängigen Spracherkennung und Spracherkennungssystem dafür
US20070043570A1 (en) 2003-07-18 2007-02-22 Koninklijke Philips Electronics N.V. Method of controlling a dialoging process
US7418392B1 (en) 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
US20070033041A1 (en) 2004-07-12 2007-02-08 Norton Jeffrey W Method of identifying a person based upon voice analysis
US7254383B2 (en) 2004-07-30 2007-08-07 At&T Knowledge Ventures, L.P. Voice over IP based biometric authentication
US7668733B2 (en) 2004-11-09 2010-02-23 Medcor, Inc. Providing adaptive medical triage
US7529677B1 (en) 2005-01-21 2009-05-05 Itt Manufacturing Enterprises, Inc. Methods and apparatus for remotely processing locally generated commands to control a local device
US7424431B2 (en) 2005-07-11 2008-09-09 Stragent, Llc System, method and computer program product for adding voice activation and voice control to a media player
US20070038460A1 (en) 2005-08-09 2007-02-15 Jari Navratil Method and system to improve speaker verification accuracy by detecting repeat imposters
US7962340B2 (en) 2005-08-22 2011-06-14 Nuance Communications, Inc. Methods and apparatus for buffering data for use in accordance with a speech recognition system
US20070112571A1 (en) 2005-11-11 2007-05-17 Murugappan Thirugnana Speech recognition at a mobile terminal
US20070143307A1 (en) 2005-12-15 2007-06-21 Bowers Matthew N Communication system employing a context engine
US20080104410A1 (en) 2006-10-25 2008-05-01 Brown Daniel R Electronic clinical system having two-factor user authentication prior to controlled action and method of use
US7992196B2 (en) 2006-11-06 2011-08-02 Voice Identity, Inc. Apparatus and method for performing hosted and secure identity authentication using biometric voice verification over a digital network medium
US9762576B2 (en) 2006-11-16 2017-09-12 Phonefactor, Inc. Enhanced multi factor authentication
US8787555B2 (en) 2006-12-19 2014-07-22 Telethrive, Inc. Process for obtaining expert advice on-demand
DE102007021772B4 (de) 2007-05-09 2013-01-24 Voicecash Ip Gmbh Digitales Verfahren und Anordnung zur Authentifizierung eines Nutzers einer Datenbasis
US8831941B2 (en) 2007-05-29 2014-09-09 At&T Intellectual Property Ii, L.P. System and method for tracking fraudulent electronic transactions using voiceprints of uncommon words
US8050917B2 (en) * 2007-09-27 2011-11-01 Siemens Enterprise Communications, Inc. Method and apparatus for identification of conference call participants
US7766223B1 (en) 2007-11-08 2010-08-03 Mello Steven M Method and system for mobile services
US8050920B2 (en) * 2008-01-18 2011-11-01 Universidad De Chile Biometric control method on the telephone network with speaker verification technology by using an intra speaker variability and additive noise unsupervised compensation
US8498870B2 (en) 2008-01-24 2013-07-30 Siemens Medical Solutions Usa, Inc. Medical ontology based data and voice command processing system
US8536976B2 (en) 2008-06-11 2013-09-17 Veritrix, Inc. Single-channel multi-factor authentication
CA2665009C (en) 2008-05-23 2018-11-27 Accenture Global Services Gmbh System for handling a plurality of streaming voice signals for determination of responsive action thereto
WO2010031070A2 (en) * 2008-09-15 2010-03-18 Masimo Corporation Patient monitor including multi-parameter graphical display
US8332223B2 (en) * 2008-10-24 2012-12-11 Nuance Communications, Inc. Speaker verification methods and apparatus
US20100114573A1 (en) * 2008-10-30 2010-05-06 Motorola, Inc. Method and Device for Verifying a User
US8095368B2 (en) 2008-12-04 2012-01-10 At&T Intellectual Property I, L.P. System and method for voice authentication over a computer network
WO2011002735A1 (en) 2009-07-01 2011-01-06 Carnegie Mellon University Methods and apparatuses for monitoring energy consumption and related operations
KR20110010939A (ko) 2009-07-27 2011-02-08 삼성전자주식회사 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법
US8340831B2 (en) 2009-12-16 2012-12-25 Robert Bosch Gmbh Non-intrusive load monitoring system and method
US9672335B2 (en) 2009-12-17 2017-06-06 Laird H Shuart Cognitive-based logon process for computing device
SG11201504186UA (en) * 2012-12-19 2015-07-30 Visa Int Service Ass System and method for voice authentication
US8694315B1 (en) * 2013-02-05 2014-04-08 Visa International Service Association System and method for authentication using speaker verification techniques and fraud model

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4653097A (en) * 1982-01-29 1987-03-24 Tokyo Shibaura Denki Kabushiki Kaisha Individual verification apparatus
US5940476A (en) * 1996-06-28 1999-08-17 Distributed Software Development, Inc. System and method for identifying an unidentified caller
US6556127B1 (en) * 1996-10-15 2003-04-29 Swisscom Ag Speaker verification method
US6246987B1 (en) * 1998-02-04 2001-06-12 Alcatel Usa Sourcing, L.P. System for permitting access to a common resource in response to speaker identification and verification
CN102238190A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 身份认证方法及系统

Also Published As

Publication number Publication date
EP2810277B1 (en) 2016-04-27
WO2013101818A1 (en) 2013-07-04
JP6234937B2 (ja) 2017-11-22
US20140365219A1 (en) 2014-12-11
EP2810277A1 (en) 2014-12-10
JP2015510606A (ja) 2015-04-09
US20130173268A1 (en) 2013-07-04
US8818810B2 (en) 2014-08-26
KR101986867B1 (ko) 2019-06-07
CN104160441A (zh) 2014-11-19
US9424845B2 (en) 2016-08-23
KR20140137343A (ko) 2014-12-02

Similar Documents

Publication Publication Date Title
CN104160441B (zh) 健康监控系统中的讲话者核实
US10931643B1 (en) Methods and systems of telemedicine diagnostics through remote sensing
AU2010276325B2 (en) Systems and methods for collection, organization and display of EMS information
CN104335211B (zh) 用于数据收集和传输的具有多个健康监测设备、交互式语音识别和移动接口的健康监测系统
US7395117B2 (en) Implantable medical device having long-term wireless capabilities
US20040128161A1 (en) System and method for ad hoc communications with an implantable medical device
CN107405081A (zh) 获得用于诊断的音频数据库的可穿戴设备
CN105517493A (zh) 咳嗽检测、分析以及通信平台
JP2009519549A (ja) 遠隔で収集された外部センサ計測結果の認証提供
WO2011127459A1 (en) Systems and methods for ems device communications interface
WO2009130630A2 (en) Identifying possible medical conditions of a patient
CN105164688B (zh) 将生物测定用于认证和触摸区分
US20170053086A1 (en) Systems and methods for ems device communications interface
CN109087689A (zh) 名中医诊断信息收集系统、方法和终端
Jean-Baptiste et al. Intelligent assistive system using real-time action recognition for stroke survivors
Aggarwal et al. Voice based secured smart lock design for internet of medical things: An artificial intelligence approach
CN107657196A (zh) 医嘱执行的监控方法及装置、存储介质、终端、监控系统
CN108231177A (zh) 一种辅助更新方法、系统及装置
CN113409926A (zh) 一种智能随访系统
Sethia et al. Automated NFC enabled rural healthcare for reliable patient record maintainance
CN117150562B (zh) 基于区块链的血糖监测方法、装置、设备及存储介质
CN108831554A (zh) 医疗信息处理方法及装置
CN112117015B (zh) 一种脓毒症的预警设备、方法、装置及存储介质
Kumar A Novel Affirmation Structure In light of Biometric and Radio Fingerprinting for the IoT in e-Health with Matrices
Al Hamadi Verification Framework for Functionality of ECG BioSensors

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant