CN117242518A - 用于智能广播管理的系统和方法 - Google Patents

用于智能广播管理的系统和方法 Download PDF

Info

Publication number
CN117242518A
CN117242518A CN202280032496.3A CN202280032496A CN117242518A CN 117242518 A CN117242518 A CN 117242518A CN 202280032496 A CN202280032496 A CN 202280032496A CN 117242518 A CN117242518 A CN 117242518A
Authority
CN
China
Prior art keywords
segment
speech
information
segments
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280032496.3A
Other languages
English (en)
Inventor
J·温德耶
H·H·陈
J·P·弗里丁
S·丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cochlear Ltd
Original Assignee
Cochlear Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cochlear Ltd filed Critical Cochlear Ltd
Publication of CN117242518A publication Critical patent/CN117242518A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/60Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles
    • H04R25/604Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of acoustic or vibrational transducers
    • H04R25/606Mounting or interconnection of hearing aid parts, e.g. inside tips, housings or to ossicles of acoustic or vibrational transducers acting directly on the eardrum, the ossicles or the skull, e.g. mastoid, tooth, maxillary or mandibular bone, or mechanically stimulating the cochlea, e.g. at the oval window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/55Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
    • H04R25/554Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired using a wireless connection, e.g. between microphone and amplifier or using Tcoils
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/55Communication between hearing aids and external devices via a network for data exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Neurosurgery (AREA)
  • Prostheses (AREA)

Abstract

一种设备包括语音活动检测(VAD)电路系统,所述VAD电路系统被配置成分析一个或多个音频广播流并且识别所述一个或多个广播流的其中音频数据包括语音数据的第一片段。所述设备还包括导出电路系统,所述导出电路系统被配置成接收所述第一片段,并且对于每个第一片段,从所述第一片段的语音数据导出一个或多个字。所述设备还包括关键字检测电路系统,所述关键字检测电路系统被配置成对于每个第一片段接收所述一个或多个字并且生成指示所述一个或多个字中的至少一个字是否在一组所存储的关键字之中的关键字信息。所述设备还包括决策电路系统,所述决策电路系统被配置成接收所述第一片段、所述第一片段中的每一个的一个或多个字以及所述第一片段中的每一个的关键字信息,并且对于每个第一片段,至少部分地基于所述关键字信息在关于将指示所述第一片段的信息传送到接受者的多个选项中进行选择。

Description

用于智能广播管理的系统和方法
背景
技术领域
本申请大体上涉及用于在信息呈现给用户之前由用户佩戴或保持的装置接收广播信息以及管理(例如,过滤;注释;存储)信息的系统和方法。
背景技术
近几十年来,医疗装置已为接受者提供了广泛的治疗益处。医疗装置可以包括内部或可植入部件/装置、外部或可佩戴部件/装置或其组合(例如,具有与可植入部件通信的外部部件的装置)。医疗装置,例如传统助听器、部分或完全可植入听力假体(例如,骨传导装置、机械刺激器、耳蜗植入物等)、起搏器、除颤器、功能性电刺激装置和其他医疗装置,多年来在执行救生和/或生活方式改善功能和/或接受者监测方面一直是成功的。
多年来,医疗装置的类型以及由其执行的功能范围有所增加。例如,有时称为“可植入医疗装置”的许多医疗装置现在通常包括永久或临时植入接受者体内的一个或多个器械、设备、传感器、处理器、控制器或其他功能性机械或电部件。这些功能性装置通常用于诊断、预防、监测、治疗或管理疾病/损伤或其症状,或研究、替换或修改解剖结构或生理过程。这些功能性装置中的许多功能性装置利用从外部装置接收到的电力和/或数据,所述外部装置是可植入部件的一部分或与可植入部件协同操作。
发明内容
在本文公开的一个方面,一种设备包括语音活动检测(VAD)电路系统,所述VAD电路系统被配置成分析包括音频数据的一个或多个广播流,以识别所述一个或多个广播流的其中所述音频数据包括语音数据的第一片段,并且识别所述一个或多个广播流的其中所述音频数据不包括语音数据的第二片段。所述设备还包括导出电路系统,所述导出电路系统被配置成接收所述第一片段,并且对于每个第一片段,从所述第一片段的语音数据导出一个或多个字。所述设备还包括关键字检测电路系统,所述关键字检测电路系统被配置成对于每个第一片段接收所述一个或多个字并且生成指示所述一个或多个字中的至少一个字是否在一组所存储的关键字之中的关键字信息。所述设备还包括决策电路系统,所述决策电路系统被配置成接收所述第一片段、所述第一片段中的每一个的一个或多个字以及所述第一片段中的每一个的关键字信息,并且对于每个第一片段,至少部分地基于所述关键字信息在关于将指示所述第一片段的信息传送到接受者的多个选项中进行选择。
在本文公开的另一方面,一种方法包括接收包括音频数据的一个或多个电磁无线广播流。所述方法还包括将所述一个或多个电磁无线广播流划分成包括语音包括片段和语音排除片段的多个片段。所述方法还包括评估每个语音包括片段的音频数据是否包括至少一个关键字。所述方法还包括基于所述评估,将关于所述语音包括片段的信息传送到用户。
在本文公开的另一方面,一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质上存储有计算机程序,所述计算机程序指示计算机系统通过至少如下所述将实时音频信息分割成不同信息区段:接收包括音频信息的一个或多个电磁无线广播流;将所述一个或多个电磁无线广播流分割成包括语音包括区段和语音排除区段的多个区段;评估每个语音包括区段的音频信息是否包括至少一个关键字;以及基于所述评估,将关于所述语音包括区段的信息传送到用户。
附图说明
本文中结合附图描述了具体实施方式,在附图中:
图1是根据本文中所描述的某些实施方式的植入接受者体内的示例耳蜗植入听觉假体的透视图;
图2是根据本文中所描述的某些实施方式的植入接受者体内的示例完全可植入中耳植入物听觉假体的透视图;
图3A示意性地示出根据本文中所描述的某些实施方式的包括由接受者佩戴或植入接受者身上和/或体内的装置的示例系统;
图3B示意性地示出根据本文中所描述的某些实施方式的包括由接受者佩戴、保持和/或携带的外部装置的示例系统;
图3C示意性地示出根据本文中所描述的某些实施方式的包括由接受者佩戴或植入接受者身上和/或体内的装置以及由接受者佩戴、保持和/或携带的外部装置的示例系统;
图4A示意性地示出根据本文中所描述的某些实施方式的示例设备;
图4B示意性地示出根据本文中所描述的某些实施方式的作为装置的部件、外部装置的部件、或在装置和外部装置之间划分的示例设备;以及
图5A-5C是根据本文中所描述的某些实施方式的示例方法的流程图。
具体实施方式
本文中所描述的某些实施方式提供一种装置(例如,听力装置),其被配置成接收无线广播(例如,蓝牙5.2广播;基于位置的蓝牙广播),所述无线广播流式传输许多音频公告,其中至少一些对装置的用户感兴趣。所接收的无线广播可以包括用户不感兴趣的大量音频公告,这可能导致各种问题(例如,干扰用户收听环境声音、对话或其他音频流;用户错过许多音频公告中的少量感兴趣的公告,从而产生不确定性、混乱和/或压力,并且可能影响用户的安全)。例如,在交通枢纽(例如,机场;火车站;公交站)处的用户可能仅对与用户旅行有关的一小部分相关公告(例如,机场处的航班号和登机号)感兴趣。
本文中所描述的某些实施方式利用基于关键字检测的机制来分析广播流,将广播流分割成不同信息区段(例如,公告),并且在用户不主动收听流的情况下智能地管理背景中的广播流,并以适当的方式通知用户相关公告。例如,可以存储和重放相关公告,以确保用户没有错过任何公告(例如,用户在更方便的时间收听);前面是警告音(例如,哔哔声),并且响应于用户发起的信号而回放。对于另一实例,相关公告可以转换为中继给用户的文本或其它视觉显示的信息(例如,经由智能电话或智能手表显示器)。基于关键字检测的机制可以由用户直接定制(例如,仅呈现由用户选择的某些类别的公告;对于所有广播基于一般基础;基于每个广播)和/或可以从其他集成服务接收信息(例如,日历;个性化分析模块,其提供用于关键字检测/通知的用户特定参数),从而确保相关信息被传达给所述用户,同时简化所述用户的收听体验。
本文详述的教导在至少一些实施方式中适用于任何类型的可植入或不可植入刺激系统或装置(例如,可植入或不可植入听觉假体装置或系统)。实施方式可以包括可以利用本文详述的教示和/或其变型的任何类型的医疗装置。此外,尽管本文在听觉假体装置的上下文中描述了某些实施方式,但是某些其他实施方式在其它类型的装置或系统(例如,智能电话;智能扬声器)的上下文中是兼容的。
仅为了易于描述,主要参考示意性医疗装置描述本文公开的设备和方法,所述医疗装置即可植入换能器组件,包括但不限于:电声电气/声学系统、耳蜗植入物装置、可植入助听器装置、中耳植入物装置、骨传导装置(例如,有源骨传导装置、无源骨传导装置、透皮骨传导装置、经皮骨传导装置)、直接声学耳蜗植入物(DACI)、中耳换能器(MET)、电声植入物装置、其他类型的听觉假体装置和/或其组合或变型,或者任何其它适当的具有或不具有一个或多个外部部件的听觉假体系统。实施方式可以包括任何类型的能够利用本文详述的教导和/或其变型的听觉假体。某些此类实施方式可以被称为“部分植入”、“半可植入”、“大部分可植入”、“完全可植入”或“全部可植入”听觉假体。在一些实施方式中,可以在除听觉假体之外的其他类型假体中利用本文详述的教导和/或其变型。
图1是根据本文中所描述的某些实施方式的植入接受者体内的示例耳蜗植入物听觉假体100的透视图。示例听觉假体100在图1中被示出为包括植入式刺激器单元120和在接受者外部的麦克风组件124(例如部分可植入耳蜗植入物)。根据本文中所描述的某些实施方式的示例听觉假体100(例如完全可植入耳蜗植入物;大部分可植入耳蜗植入物)可使用如本文中更全面地描述的可皮下植入麦克风组件替代图1中所示的外部麦克风组件124。在某些实施方式中,图1的示例耳蜗植入物听觉假体100可以与如本文所描述的液体药剂储存器结合。
如图1中所示,接受者具有外耳101、中耳105和内耳107。在功能齐全的耳朵中,外耳101包括耳廓110和耳道102。声压或声波103由耳廓110收集并经通道进入并穿过耳道102。跨过耳道102的远端设置有响应于声波103而振动的鼓膜104。该振动通过中耳105的三块骨骼联接到椭圆窗或卵圆窗112,所述三块骨骼统称为听小骨106,并且包括锤骨108、砧骨109和镫骨111。中耳105的骨骼108、109和111用来过滤并放大声波103,从而使得椭圆窗112铰接或响应于鼓膜104的振动而振动。此振动在耳蜗140内建立外淋巴的流体运动波。这种流体运动继而激活耳蜗140内部的微小毛细胞(未示出)。毛细胞的激活使得合适的神经脉冲被生成并且通过螺旋神经节细胞(未示出)和听觉神经114被传输到大脑(也未示出),在大脑中,它们被感知为声音。
如图1中所示出,示例听觉假体100包括暂时或永久植入接受者体内的一个或多个部件。示例听觉假体100在图1中被示为具有:直接或间接地附接到接受者身体的外部部件142;以及暂时或永久地植入接受者体内(例如,定位在邻近接受者的耳廓110的颞骨的凹部中)的内部部件144。外部部件142通常包括用于检测声音的一个或多个声音输入元件(例如,外部麦克风124)、声音处理单元126(例如,设置在耳后单元中)、电源(未示出)和外部发射器单元128。在图1的示意性实施方式中,外部发射器单元128包括外部线圈130(例如,包括多匝电绝缘单股或多股铂丝或金丝的线状天线线圈),并且优选地包括直接或间接地固定到外部线圈130的磁体(未示出)。外部发射器单元128的外部线圈130是与内部部件144的感应射频(RF)通信链路的部分。声音处理单元126处理麦克风124的输出,所述麦克风在所描绘的实施方式中由接受者的耳廓110定位在接受者的身体外部。声音处理单元126处理麦克风124的输出,生成编码信号,本文中有时被称为编码数据信号,该编码数据信号(例如经由电缆)被提供给外部发射器单元128。将认识到,声音处理单元126可以利用数字处理技术来提供频率成形、放大、压缩和其他信号调节,包括基于接受者特定的拟合参数的调节。
外部部件142的电源被配置成向听觉假体100供电,其中听觉假体100包括电池(例如,位于内部部件144中或设置在单独的植入位置),所述电池(例如,经由经皮能量传递链路)由从外部部件142提供的电力再充电。经皮能量传递链路用于将电力和/或数据传递到听觉假体100的内部部件144。各种类型的能量传递(例如,红外(IR)、电磁、电容性和电感性传递)可用以将功率和/或数据从外部部件142传递到内部部件144。在听觉假体100的操作期间,由可再充电电池存储的电力根据需要分配到各种其他植入的部件。
内部部件144包括内部接收器单元132、刺激器单元120和细长电极组件118。在一些实施方式中,内部接收器单元132和刺激器单元120在生物相容性外壳内被气密密封。内部接收器单元132包括内部线圈136(例如,包括电绝缘单股或多股铂丝或金丝的多匝的线天线线圈),且优选地包括相对于内部线圈136固定的磁体(也未示出)。内部接收器单元132和刺激器单元120在生物相容性外壳内被气密密封,其有时统称为刺激器/接收器单元。内部线圈136通过经皮能量传递链路(例如,电感RF链路)从外部线圈130接收电力和/或数据信号。刺激器单元120基于数据信号生成电刺激信号,并且刺激信号通过细长电极组件118被递送至接受者。
细长电极组件118具有连接到刺激器单元120的近端和植入耳蜗140中的远端。电极组件118从刺激器单元120延伸穿过乳突骨119到达耳蜗140。在一些实施方式中,电极组件118可以至少植入基底区域116中,并且有时植入得更深。例如,电极组件118可以朝向耳蜗140的顶端(被称为耳蜗尖134)延伸。在某些情况下,电极组件118可以通过耳蜗开窗122插入到耳蜗140中。在其他情况下,耳蜗开窗可以通过圆形窗121、卵圆窗112、岬123或通过耳蜗140的顶回147形成。
细长电极组件118包括沿着其长度设置的电极或触头148的纵向对准且向远侧延伸的阵列146,本文有时称为电极或触头阵列146。尽管电极阵列146可以设置在电极组件118上,但在大多数实际应用中,电极阵列146被集成到电极组件118中(例如,电极阵列146设置在电极组件118中)。如所指出的,刺激器单元120生成刺激信号,刺激信号由电极148施加到耳蜗140,从而刺激听神经114。
虽然图1示意性地示出了利用包括外部麦克风124、外部声音处理单元126和外部电源的外部部件142的听觉假体100,但在某些其他实施方式中,麦克风124、声音处理单元126和电源中的一者或多者可植入接受者身上或接受者体内(例如内部部件144内)。例如,听觉假体100可以具有可植入接受者身上或接受者体内(例如,包封在位于皮下的生物相容性组件内)的麦克风124、声音处理单元126和电源中的每一者,并且可以被称为完全可植入耳蜗植入物(“TICI”)。对于另一实例,听觉假体100可以具有可植入接受者身上或接受者体内的耳蜗植入物的大部分部件(例如,不包括麦克风,该麦克风可以是耳道内麦克风),并且可以被称为大部分可植入耳蜗植入物(“MICI”)。
图2示意性地示出根据本文中所描述的某些实施方式的利用声学致动器的植入接受者体内的示例完全可植入听觉假体200(例如,完全可植入中耳植入物或完全可植入声学系统)的透视图。图2的示例听觉假体200包括位于皮下(例如,在接受者的皮肤下方和接受者的颅骨上)的生物相容性可植入组件202(例如,包括可植入胶囊)。虽然图2示意性地示出包括麦克风的示例可植入组件202,但在其它示例听觉假体200中,可以使用吊坠式麦克风(例如,通过电缆连接到可植入组件202)。可植入组件202包括信号接收器204(例如,包括线圈元件)和声换能器206(例如,包括隔膜和驻极体或压电换能器的麦克风),所述声换能器定位成通过接受者的覆盖组织接收声信号。可植入组件202还可用于容纳完全可植入听觉假体200的多个部件。例如,可植入组件202可包括能量存储装置和信号处理器(例如,声音处理单元)。各种附加处理逻辑和/或电路系统部件也可以作为设计选择包括在可植入组件202中。
对于图2中所示的示例听觉假体200,可植入组件202的信号处理器与致动器210(例如,包括换能器,所述换能器被配置成响应于来自信号处理器的电信号而产生机械振动)可操作地通信(例如,经由导线208电互连)。在某些实施方式中,图1和图2中所示的示例听觉假体100、200可以包括可植入麦克风组件,诸如图2中所示的麦克风组件206。对于此类示例听觉假体100,可植入组件202的信号处理器可以与麦克风组件206和主可植入部件120的刺激器单元可操作地通信(例如,经由导线电互连)。在某些实施方式中,麦克风组件206和信号处理器(例如,声音处理单元)中的至少一个植入接受者身上或体内。
图2中所示的示例听觉假体200的致动器210可支撑地连接到定位系统212,所述定位系统继而连接到安装在接受者的乳突内的骨锚固件214(例如,经由钻穿颅骨的孔)。致动器210包括用于将致动器210连接到接受者的听小骨106的连接设备216。在连接状态下,连接设备216提供用于听小骨106的声学刺激的通信路径(例如,通过将振动从致动器210传输到砧骨109)。
在正常操作期间,环境声学信号(例如,环境声音)撞击接受者的组织并且在麦克风组件206处经皮接收。在接收到经皮信号时,可植入组件202内的信号处理器处理信号以经由导线208向致动器210提供经处理的音频驱动信号。将认识到,信号处理器可以利用数字处理技术来提供频率成形、放大、压缩和其他信号调节,包括基于接受者特定的拟合参数的调节。音频驱动信号使致动器210将声频振动传输到连接设备216,以通过对接受者的砧骨109的机械刺激来影响期望的声音感觉。
皮下可植入麦克风组件202被配置成通过生成输出信号(例如,电信号;光信号;电磁信号)响应于听觉信号(例如,声音;可听频率范围中的压力振动),所述输出信号指示由麦克风组件202接收的听觉信号,并且这些输出信号由听觉假体100、200使用,以生成刺激信号,所述刺激信号被提供给接受者的听觉系统。为了补偿由于植入而到达麦克风组件202的降低的声学信号强度,可植入麦克风组件202的隔膜可以被配置成提供比外部不可植入麦克风组件更高的灵敏度。例如,可植入麦克风组件202的隔膜可以被配置成比用于外部不可植入麦克风组件的隔膜更坚固和/或更大。
图1中所示的示例听觉假体100利用外部麦克风124,并且图2中所示的听觉假体200利用包括皮下可植入声换能器的可植入麦克风组件206。在本文中所描述的某些实施方式中,听觉假体100利用接受者身上或体内的一个或多个植入式麦克风组件。在本文中所描述的某些实施方式中,听觉假体200利用定位在接受者外部和/或植入接受者身上或体内的一个或多个麦克风组件,并且利用植入接受者身上或体内的一个或多个声换能器(例如,致动器210)。在某些实施方式中,外部麦克风组件可用于补充听觉假体100、200的可植入麦克风组件。因此,本文详述的教导和/或其变型可以与任何类型的外部或可植入麦克风布置一起使用,并且图1和图2中所示的声换能器仅仅是说明性的。
图3A示意性地示出根据本文中所描述的某些实施方式的示例系统300,其包括由接受者佩戴或植入接受者身上和/或体内的装置310。图3B示意性地示出根据本文中所描述的某些实施方式的示例系统300,其包括由接受者佩戴、保持和/或携带的外部装置320。图3C示意性地示出根据本文中所描述的某些实施方式的示例系统300,其包括由接受者佩戴或植入接受者身上和/或体内的装置310,以及由接受者佩戴、保持和/或携带的外部装置320。图3A-3C的示例系统300各自与至少一个远程广播系统330无线通信,所述远程广播系统被配置成发射对应于包括音频数据的一个或多个广播流的无线电磁信号332。例如,音频数据可以包括与至少一个远程广播系统330的范围(例如,空间范围)内的一个或多个用户相关的公告(例如,在机场、火车站、船坞或其他运输设施处的公告;在会议、体育赛事或其他公共或私人活动处的公告)。
如图3A示意性示出的,装置310被配置成经由无线通信链路334(例如,WiFi;蓝牙;手机连接、电话或其它互联网连接)直接从至少一个远程广播系统330接收电磁信号332。例如,装置310可以被配置成直接从至少一个远程广播系统330接收一个或多个广播流(例如,音频广播流),并且将来自音频数据的信息(例如,通过刺激信号;通过声音)提供给接受者。如图3B示意性示出的,外部装置320被配置成经由无线通信链路334(例如,WiFi;蓝牙;手机连接、电话或其它互联网连接)直接从至少一个广播系统330接收电磁信号332,并且向接受者提供(例如,通过刺激信号;通过声音)来自音频数据的信息。例如,外部装置320可以被配置成从至少一个远程广播系统330接收一个或多个广播流,并且向接受者传输(例如,通过声音;通过文本)来自音频数据的信息。如图3C示意性示出的,外部装置320被配置成经由第一无线通信链路334(例如,WiFi;蓝牙;手机连接、电话或其它互联网连接)直接从至少一个广播系统330接收电磁信号332,并且被配置成经由第二无线通信链路336(例如,WiFi;蓝牙;射频(RF);磁感应)将一个或多个广播流的至少一部分传输到装置310。例如,外部装置320可以被配置成从至少一个远程广播系统330接收一个或多个广播流,并且(例如,经由第二无线通信链路336)将来自音频数据的信息传输到装置310,所述装置被配置成(例如,通过刺激信号;通过声音)向接受者提供信息。在某些实施方式中,图3A和3C的装置310包括植入或佩戴在接受者身上的多个装置310。例如,装置310可以包括两个听力假体,每个接受者的耳朵各一个(例如,双侧耳蜗植入物对;声音处理器和助听器)。多个装置310可以彼此同步地操作(例如,一对耳蜗植入装置,其均从来自外部装置320的音频数据或直接从至少一个广播系统330接收信息)。在某些实施方式中,多个装置310彼此独立地操作,而在某些其他实施方式中,多个装置310作为控制“子”装置的操作的“父”装置操作。
在某些实施方式中,装置310和/或外部装置320与一个或多个地理远程计算装置(例如,远程服务器和/或处理器;“云”)可操作地通信,所述一个或多个地理远程计算装置被配置成执行如本文中所描述的一个或多个功能。例如,装置310和/或外部装置320可以被配置成经由至少一个广播系统330(例如,经由无线通信链路334、336中的一者或两者)将信号传输到一个或多个地理远程计算装置,如图3A-3C示意性地示出的。例如,装置310和/或外部装置320可以被配置成经由未耦合到至少一个广播系统330的其它无线通信链路(例如,WiFi;蓝牙;手机连接、电话或其它互联网连接)将信号传输到一个或多个地理远程计算装置。
在某些实施方式中,装置310包括换能器组件,其实例包括但不限于:可植入和/或可佩戴感觉假体(例如,耳蜗植入物听觉假体100;完全可植入听觉假体200;可植入助听器;可佩戴助听器,其实例是部分或完全在耳道内的助听器);至少一个可佩戴扬声器(例如,耳内;耳上;耳塞;耳机)。在某些实施方式中,装置310被配置成从周围环境接收听觉信息(例如,由装置310的一个或多个麦克风检测到的声音)和/或从至少一个远程系统(例如,移动电话、电视、计算机)接收音频输入,并且从接受者接收用户输入(例如,用于控制装置310)。
在某些实施方式中,外部装置320包括由接受者佩戴、保持和/或携带的至少一个便携式装置。例如,外部装置320可包括外部佩戴的声音处理器(例如,声音处理单元126),所述声音处理器被配置成与装置310有线通信或无线通信(例如,经由RF通信链路;经由磁感应链路),并且专用于与装置310结合操作。对于另一实例,外部装置320可以包括远离装置310的装置(例如,智能电话、智能平板电脑、智能手表、膝上型计算机、被配置成在正常使用期间离开静止位置运输的其它移动计算装置)。在某些实施方式中,外部装置320可包括多个装置(例如,与外部佩戴的声音处理器通信的手持式计算装置,所述外部佩戴的声音处理器与装置310通信)。
在某些实施方式中,外部装置320包括被配置成从接受者接收用户输入的输入装置(例如,键盘;触摸屏;按钮;开关;语音识别系统)和被配置成向接受者提供信息的输出装置(例如,显示器;扬声器)。例如,如图3B和3C示意性示出的,外部装置320可包括触摸屏322,所述触摸屏被配置成作为输入装置和输出装置两者操作。在某些实施方式中,外部装置320被配置成将控制信号传输到装置310和/或从装置310接收指示装置310的操作或性能的数据信号。外部装置320还可以被配置成从接受者接收用户输入(例如,用于控制装置310)和/或向接受者提供关于装置310的操作或性能的信息(例如,经由触摸屏322上显示的图形用户界面)。在某些实施方式中,如图3C示意性示出的,外部装置320被配置成将信息(例如,音频信息)传输到装置310,并且装置310被配置成将信息(例如,通过刺激信号;通过声音)提供到接受者。
图4A示意性地示出根据本文中所描述的某些实施方式的示例设备400。设备400包括语音活动检测(VAD)电路系统410,所述VAD电路系统被配置成分析包括音频数据的一个或多个广播流412,以识别一个或多个广播流412的其中音频数据包括语音数据的第一片段414,并且识别一个或多个广播流412的其中音频数据不包括语音数据的第二片段。设备400还包括导出电路系统420,所述导出电路系统被配置成接收第一片段414,并且对于每个第一片段414,从第一片段414的语音数据导出一个或多个字422。设备400还包括关键字检测电路系统430,所述关键字检测电路系统被配置成对于每个第一片段414接收一个或多个字422,并且生成指示一个或多个字422中的至少一个字是否在一组存储的关键字434中的关键字信息。设备400还包括决策电路系统440,所述决策电路系统被配置成接收第一片段414、第一片段414中的每一个的一个或多个字422以及第一片段414中的每一个的关键字信息432,并且对于每个第一片段414,至少部分地基于关键字信息432在关于将指示第一片段414的信息442传送到接受者的多个选项中进行选择。
图4B示意性地示出根据本文中所描述的某些实施方式的作为装置310的部件、外部装置320的部件、或在装置310和外部装置320之间划分的示例设备400。在某些其它实施方式中,设备400的至少一部分位于远离装置310和外部装置320两者的一个或多个地理远程计算装置中。在某些实施方式中,设备400包括一个或多个微处理器(例如,专用集成电路;由具有计算机可执行指令的软件编程的通用集成电路;微电子电路系统;微控制器),VAD电路系统410、导出电路系统420、关键字检测电路系统430和/或决策电路系统440是所述微处理器的部件。在某些实施方式中,一个或多个微处理器包括控制电路系统,所述控制电路系统被配置成控制VAD电路系统410、导出电路系统420、关键字检测电路系统430和/或决策电路系统440,以及设备400的其它部件。例如,外部装置320可包括一个或多个微处理器中的至少一个微处理器。对于另一实例,装置310(例如,被配置成由接受者佩戴或植入接受者身上和/或体内的感觉假体)可包括一个或多个微处理器中的至少一个微处理器。
在某些实施方式中,一个或多个微处理器包括至少一个存储装置和/或与至少一个存储装置可操作地通信,所述至少一个存储装置被配置成存储由一个或多个微处理器在操作期间(例如,同时提供本文中所描述的某些实施方式的功能)访问的信息(例如,数据;命令)。至少一个存储装置可以包括至少一个有形(例如,非暂时性)计算机可读存储介质,其实例包括但不限于:只读存储器(ROM);随机存取存储器(RAM);磁盘存储介质;光学存储介质;闪存存储器。至少一个存储装置可以用软件(例如,作为应用程序下载的计算机程序)编码,所述软件包括用于指示一个或多个微处理器的计算机可执行指令(例如,可执行数据访问逻辑、评估逻辑和/或信息输出逻辑)。在某些实施方式中,一个或多个微处理器执行软件的指令以提供如本文中所描述的功能。
如图4B中所示,设备400可以与被配置成接收一个或多个广播流412的至少一个数据输入接口450(例如,装置310和/或外部装置320的部件)进行操作性通信。至少一个数据输入接口450的实例包括但不限于被配置成用于接收如下中的至少一者的端口和/或天线:WiFi信号;蓝牙信号;手机连接信号、电话信号或其它互联网信号。在某些实施方式中,至少一个数据输入接口450被配置成检测来自至少一个远程广播系统330的电磁信号332,并且响应于用户输入(例如,用户响应于指示已检测到广播远程广播系统330的提示)和/或自动地(例如,基于所习得的行为,例如在远程广播系统330的范围内检测到来自先前访问期间连接到的远程广播系统330的电磁信号332)接收包括电磁信号332的广播流412。
在某些实施方式中,设备400可以被配置成在至少两个模式中操作:其中禁用本文中所描述的功能的第一(例如,“正常”)操作模式和其中启用本文中所描述的功能的第二(例如,“智能”)操作模式。例如,设备400可以响应于用户输入(例如,用户响应于指示已检测到广播远程广播系统330的提示)和/或自动地(例如,基于与远程广播系统330的连接和/或断开)在第一模式与第二模式之间切换。在编码(例如,加密)一个或多个广播流412的某些实施方式中,至少一个数据输入接口450和/或设备400的其它部分被配置成解码(例如,解密)广播流412。
如图4B中所示,设备400可以与至少一个数据输出接口460(例如,装置310和/或外部装置320的部件)可操作地通信,所述至少一个数据输出接口被配置成可操作地耦合到通信部件(例如,装置310和/或外部装置320的另一部件;与装置310和外部装置320分开的部件),所述通信部件被配置成将指示第一片段414的信息442传送到接受者。至少一个数据输出接口460可以包括有线和/或无线端口的任何组合,包括但不限于:通用串行总线(USB)端口;电气和电子工程师协会(IEEE)1394端口;PS/2端口;网络端口;以太网端口;蓝牙端口;无线网络接口。
在某些实施方式中,一个或多个广播流412的第一片段414(例如,包括语音数据的片段)包含消息(例如,句子),所述消息具有接受者可能感兴趣的特定信息(例如,关于机场或火车站的调度或登机口的更新的公告;关于会议、文化活动或体育活动的活动时间表或位置的公告)。广播流412的第一片段414可以通过广播流412的不包含音频数据或仅包含非语音音频数据(例如,音乐;背景噪声)的一个或多个第二片段(例如,不包括语音数据的片段)彼此分开。
在某些实施方式中,VAD电路系统410被配置成通过分析一个或多个广播流412的音频数据的一个或多个特性来识别第一片段414并识别第二片段。例如,基于一个或多个特性(例如,调制深度;信噪比;过零率;互相关性;子带/全带能量测量值;对应于语音的频率范围(例如,80Hz至400Hz)内的频谱结构;长期时域行为特征),VAD电路系统410可以识别一个或多个广播流412的包含语音活动的音频数据的时间间隔和一个或多个广播流412的不包含语音活动的音频数据的时间间隔。如下文献描述了可以由根据本文中所描述的某些实施方式的VAD电路系统410执行的语音活动检测过程的实例:S.Graf等人的“Features forvoice activity detection:a comparison analysis”EURASIP J.Adv.in SignalProcessing,2015:91(2015);国际电信联盟,“ITU-T TelecommunicationsStandardization Sector of ITU:Series G:Transmission Systems and Media”,G.729附录B(1996);“Digital cellular telecommunications system(Phase 2+);VoiceActivity Detector(VAD)for Adaptive Multi-Rate(AMR)speech traffic channels,General description,GSM 06.94version 7.1.0Release 1998,”ETSI EN 301 708V7.1.0(1999-07)。在某些实施方式中,VAD电路系统410是本地的(例如,装置410和/或外部装置420的部件),而在某些其他实施方式中,VAD电路系统410是远程服务器的部分(例如,“在云中”)。在其中广播流仅包含由广播流412不被广播的时间间隔分开的第一片段414(例如,语音包括片段)的某些实施方式中(例如,仅包括由其中不传输音频数据的“无声”时间间隔分开的音频公告的机场广播流),VAD电路系统410可以将第一片段414标识为在没有广播片段的时间间隔之间广播的片段。
在某些实施方式中,VAD电路系统410被配置成将信息附加到至少一些片段,附加信息指示片段是第一片段414(例如,语音包括片段)还是第二片段(例如,语音排除片段)。例如,附加信息可以基于片段的音频数据的一个或多个特性(例如,调制深度;信噪比;过零率;互相关性;子带/全带能量测量值;对应于语音的频率范围(例如,80Hz至400Hz)内的频谱结构;长期时域行为特性)是否指示片段是第一片段414还是第二片段呈附加到片段(或覆盖在片段上)的值(例如,零或一)的形式。在某些实施方式中,VAD电路系统410被配置成将第一片段414与第二片段解析(例如,划分)开。例如,VAD电路系统410可以将第一片段414传输到电路系统以用于进一步处理(例如,传输到存储器电路系统以用于存储和由其它电路系统进一步处理),并且可以丢弃第二片段。对于另一实例,VAD电路系统410可以将第二片段排除在进一步处理之外(例如,通过将第一片段414传输到导出电路系统420和决策电路系统440,而不将第二片段传输到导出电路系统420或决策电路系统440)。
在某些实施方式中,导出电路系统420被配置成针对包含在语音数据内的一个或多个字422分析来自第一片段414(例如,从VAD电路系统410接收)的语音数据。例如,导出电路系统420可以被配置成执行语音-文本转换(例如,使用语音-文本引擎或应用程序编程接口,其实例可从Google和Amazon获得)和/或其它语音识别过程(例如,从一种语言翻译成另一种语言)。导出电路系统420可以被配置成从语音数据中提取呈与如本文中所描述的进一步处理和/或与传送到接受者兼容的形式(例如,文本)的一个或多个字422。在某些实施方式中,如图4A和4B示意性示出的,导出电路系统420被配置成将一个或多个字422传输到关键字检测电路系统430和决策电路系统440。在某些其它实施方式中,导出电路系统420被配置成将一个或多个字422传输到关键字检测电路系统430,并且关键字检测电路系统430被配置成将一个或多个字422传输到决策电路系统440。在某些实施方式中,导出电路系统420是VAD电路系统410的部分,反之亦然。在某些实施方式中,导出电路系统420是本地的(例如,装置410和/或外部装置420的部件),而在某些其他实施方式中,导出电路系统420是远程服务器的部分(例如,“在云中”)。
在某些实施方式中,关键字检测电路系统430被配置成(例如,从导出电路系统420)接收一个或多个字422,从存储器电路系统检索一组所存储的关键字434,并将一个或多个字422与一组所存储的关键字434的关键字进行比较(例如,以确定第一片段414与用户或接受者的相关性)。例如,一组所存储的关键字434(例如,关键字列表)可以存储在存储器电路系统中,所述存储器电路系统被配置成由关键字检测电路系统430(例如,如图4A和4B示意性地示出的关键字检测电路系统430的存储器电路系统,或在设备400的其它存储器电路系统中)访问。在某些实施方式中,设备400可以访问多组所存储的关键字434(例如,不同广播流412、不同广播系统330和/或不同当日时间的不同组的所存储的关键字434),并且各组所存储的关键字434中的一个或多个可以随时间推移变化(例如,自动编辑或由接受者编辑)。可以至少部分地基于当前接收的广播流412的身份和/或广播当前接收的广播流412的广播系统330的身份来选择要访问的用于与一个或多个字422进行比较的一组所存储的关键字434。例如,在从机场广播系统330接收到广播流412时,关键字检测电路系统430可以访问兼容的一组所存储的关键字434以与预期在广播流412内的关键字进行比较(例如,登机口变化;时间表变化)。
在某些实施方式中,如图4B示意性示出的,关键字检测电路系统430与关键字生成电路系统470进行操作性通信,所述关键字生成电路系统被配置成生成要由关键字检测电路系统430访问的一组所存储关键字434中的至少一些关键字。在某些其它实施方式中,关键字生成电路系统470是关键字检测电路系统430的部件,或者是设备400的另一部件。
如图4B示意性示出的,某些实施方式的关键字生成电路系统470与被配置成接收输入信息482的至少一个输入接口480进行操作性通信,并且关键字生成电路系统470被配置成至少部分地基于输入信息482生成一组所存储的关键字434。例如,输入信息482可以包括由接受者提供的指示接受者感兴趣的关键字的信息(例如,用户输入;经由键盘或触摸屏手动输入;经由麦克风口头输入);来自时钟、日历或装置310和/或外部装置320的其它软件应用程序(例如,提供关于所安排的事件和/或当日时间的信息的时钟/日历应用程序;提供关于与所存储的票据有关的信息的信息的票据应用程序;提供关于接受者的位置的信息的地理定位应用程序,诸如工作站或交通站)的、关键字生成电路系统470可从其提取关键字的信息;和/或关键字生成电路系统470可以从其提取(例如,摘取;抓取)关键字或关键字相关信息的其它信息。在某些实施方式中,关键字生成电路系统470被配置成自动地(例如,基于所习得的行为,例如,使用先前在设备400先前从与提供当前接收的广播流412相同的广播系统330接收广播流412时使用的一组所存储的关键字434)和/或基于预定规则(例如,诸如“疏散”和“紧急”等的字自动地包括在一组所存储的关键字434中)生成一组所存储的关键字434。
在某些实施方式中,对于每个所存储的关键字434,一组所存储的关键字434包括指示所存储的关键字434的重要性的信息。如图4B示意性示出的,某些实施方式的关键字生成电路系统470与被配置成接收输入信息492的至少一个输入接口490进行操作性通信,并且关键字生成电路系统470被配置成至少部分地基于输入信息492生成一组所存储的关键字434。至少一个输入接口490和至少一个输入接口480可以彼此相同或可以彼此分离。在某些实施方式中,关键字的重要性指示其与其他关键字相比的相对重要性。例如,诸如“疏散”或“紧急”等的关键字可能比其他关键字具有更高的重要性。在某些实施方式中,输入信息492可以包括由接受者提供(例如,用户输入;经由键盘或触摸屏手动输入;经由麦克风口头输入)的指示接受者感兴趣的一个或多个关键字的重要性的信息;来自时钟、日历或装置310和/或外部装置320的其它软件应用程序(例如,提供关于所安排的事件和/或当日时间的信息的时钟/日历应用程序;提供关于所存储的票据的信息的票据应用程序;提供关于接受者的位置的信息的地理定位应用程序)的、关键字生成电路系统470可从其提取一个或多个关键字的重要性的信息;和/或关键字生成电路系统470可以从其提取(例如,摘取;抓取)一个或多个关键字的重要性的其它信息。在某些实施方式中,关键字生成电路系统470被配置成自动地(例如,基于所习得或过去的行为,诸如之前在设备400先前从与提供当前接收的广播流412相同的广播系统330接收广播流412时使用的关键字434的重要性)和/或基于预定规则(例如,诸如“疏散”和“紧急”等的关键字自动地具有最高重要性水平)将重要性分配到一组所存储的关键字434中的一个或多个关键字。
在某些实施方式中,对于每个第一片段414,决策电路系统440被配置成至少部分地响应于对应于第一片段414的关键字信息432(例如,从关键字检测电路系统430接收),选择是否将指示第一片段414的任何信息442传送到接受者。在某些实施方式中,决策电路系统440被配置成将第一片段414的关键字信息432与预定一组规则进行比较,以确定第一片段414是否对接受者具有足够的兴趣(例如,重要性)以保证与接受者的通信。如果关键字信息432指示第一片段414没有足够的兴趣,则决策电路系统440不生成关于第一片段414的任何信息442。如果关键字信息432指示第一片段414具有足够的兴趣,则决策电路系统440生成关于第一片段414的信息442。
至少部分地响应于对应于第一片段414的关键字信息432,决策电路系统440可以在数据输出接口460中进行选择,并且可以选择指示要传送到接受者的第一片段414的信息442的形式和/或内容。在某些实施方式中,第一片段414和/或一个或多个字422包括将经由数据输出接口460传送到接受者的信息422的内容的至少一部分。例如,决策电路系统440可以将呈指示第一片段414的一个或多个字422的至少一个文本消息形式的信息442传输到数据输出接口460a,所述数据输出接口被配置成接收信息442并将信息442传送到被配置成向接受者显示至少一个文本消息的屏幕。对于另一实例,决策电路系统440可以将呈指示关于信息442(例如,指示第一片段414的一个或多个字422是否包括所存储的关键字434,指示所存储的关键字434的标识,和/或指示所存储的关键字434的重要性)的通知(例如,警告;警报)的至少一个信号形式的信息442传输到数据输出接口460b,所述数据输出接口被配置成接收至少一个信号并且将通知作为至少一个可视信号(例如,由指示灯或显示屏输出)、至少一个音频信号(例如,作为音调或其它声音从扬声器输出)和/或至少一个触觉或感触信号(例如,作为振动从电动机输出)传送到接受者。对于另一实例,决策电路系统440可以将呈指示第一片段414的音频数据的至少一个信号形式的信息442传输到数据输出接口460c,所述数据输出接口被配置成接收至少一个信号并将音频数据传送到接受者(例如,作为声音从扬声器、例如助听器或耳机输出;作为刺激信号从听力假体输出)。对于另一实例,决策电路系统440可以将呈存储兼容的至少一个信号形式的信息442传输至数据输出接口460d,所述数据输出接口被配置成接收至少一个信号并将信息442传送到存储器电路系统(例如,至少一个存储装置,例如闪存存储器),以(例如,经由其它数据输出接口460a-c中的一个或多个)存储并随后检索和传送给接受者。例如,决策电路系统440还可以被配置成随时间推移跟踪第一片段414的意图,并且可以相应地管理存储器电路系统中的信息队列442(例如,在接收到关于相同主题的较新信息442时删除较旧信息442;随时间推移学习用户的意图和/或兴趣,并且针对某些类型的不感兴趣的信息442停止向用户发送通知)。数据输出接口460中的一个或多个可以被配置成以多种形式接收信息442和/或可以被配置成与多个通信部件进行操作性通信。其它类型的数据输出接口460(例如,到其它通信部件的接口)也与本文中所描述的某些实施方式兼容。
图5A是根据本文中所描述的某些实施方式的示例方法500的流程图。虽然通过参考图4A-4B的示例设备400的一些结构描述了方法500,具有部件的其它配置的其它设备和系统也可以用于执行根据本文中所描述的某些实施方式的方法500。在某些实施方式中,非暂时性计算机可读存储介质上存储有指示计算机系统执行方法500的计算机程序。
在操作块510中,方法500包括接收包括音频数据的一个或多个电磁无线广播流412(例如,来自至少一个远程广播系统330的至少一个蓝牙广播流)。例如,一个或多个电磁无线广播流412可以由用户佩戴、保持和/或携带或者植入在用户身上(例如,装置310)或体内的个人电子装置(例如,外部装置320)接收。
在操作块520中,方法500还包括将一个或多个广播流412划分成包括语音包括片段(例如,第一片段414)和语音排除片段的多个片段。图5B是根据本文中所描述的某些实施方式的操作块520的实例的流程图。在操作块522中,划分一个或多个广播流412可以包括检测多个片段中的每个片段的至少一个特性(例如,调制深度;信噪比;过零率;互相关;子带/全带能量测量值;对应于语音的频率范围(例如,80Hz至400Hz)内的频谱结构;长期时域行为特性)。在操作块524中,划分一个或多个广播流412还可以包括对于多个片段中的每个片段确定至少一个特性是否指示片段是语音包括片段还是语音排除片段。在操作块526中,划分一个或多个广播流412还可以包括将信息附加到至少一些片段,该信息指示该片段是语音包括片段还是语音排除片段。在某些实施方式中,划分一个或多个广播流412还可以包括将语音排除片段排除在操作块528中的进一步处理之外。
在操作块530中,方法500还包括评估每个语音包括片段的音频数据是否包括至少一个关键字434。图5C是根据本文中所描述的某些实施方式的操作块530的实例的流程图。在操作块532中,评估音频数据可以包括从语音包括片段的音频数据提取一个或多个字422。在操作块534中,评估音频数据还可以包括将一个或多个字422与一组关键字434进行比较,以检测一个或多个字422内的至少一个关键字434。该组关键字434可以从如下中的至少一者编译:用户输入、当日时间、接收到语音包括片段时用户的地理位置、先前用户输入的历史和/或来自计算机存储器或一个或多个计算应用程序的信息。在操作块536中,评估音频数据还可以包括将信息附加到语音包括片段中的至少一些,所述信息指示语音包括片段的一个或多个字422内检测到的至少一个关键字434的存在和/或身份。在某些实施方式中,评估音频数据还可以包括在操作块538中将重要性水平分配给语音包括片段。重要性水平可以至少部分地基于至少一个关键字的存在和/或身份、用户输入、当日时间、接收到语音包括片段时用户的地理位置、先前用户输入的历史和/或来自计算机存储器或一个或多个计算应用程序的信息。
在操作块540中,方法500还包括基于所述评估,将关于语音包括片段的信息传送给用户。例如,基于一个或多个字422是否包括至少一个关键字434、包括的至少一个关键字434的身份和/或语音包括片段的重要性水平,关于语音包括片段的信息可以选择为传送到用户或不传送到用户。如果选择传送信息,所述将信息传送可以选自由如下组成的组:向用户显示至少一个文本消息,所述至少一个文本消息指示语音包括片段的一个或多个字;向用户提供至少一个可视、音频和/或触觉信号,所述至少一个可视、音频和/或触觉信号指示语音包括片段是否包括关键字、关键字的标识和/或关键字的重要性;向用户提供指示语音包括片段的音频数据的至少一个信号;并将指示语音包括片段的音频数据的至少一个信号存储在存储器电路系统中,随后从存储器电路系统检索所存储的至少一个信号,并向用户提供所存储的至少一个信号。
示例实施方式
在一个实例中,根据本文中所描述的某些实施方式的具有听力假体(例如,装置310)的接受者可以进入机场,在机场中,基于位置的蓝牙无线广播(例如,广播流412)用于反映通过扬声器系统播放的正常公告,所述听力假体具有外部声音处理器(例如,外部装置320)和与声音处理器通信的移动装置(例如,智能手机;智能手表;另一外部装置320)。移动装置可以连接到无线广播(例如,经由数据输入接口450接收),并且可以切换到操作模式(例如,“智能模式”),从而实现本文中所描述的某些实施方式的功能。接受者可以经由输入接口480将对应于航班信息(例如,航空公司、航班号、登机号)和/或其它相关信息的关键字输入到关键术语的对话框。当接受者签到时,移动装置可以从无线广播接收公告,将公告拆分成片段,并检查一个或多个关键字。就在接受者通过安全检查之后,可以公告接受者航班号的登机口变化,并且移动装置可以以音频形式存储此公告,并且可以经由听力假体经由音调(例如,三声上升哔哔声)通知接受者。当接受者选择时(例如,一旦接受者完成点咖啡;通过按下移动装置上的按钮),接受者可以选择收听公告,并且移动装置可以将所存储的公告的音频流式传输到接受者的听力假体的声音处理器。接受者还可以选择在接受者选择时重放公告(例如,通过在先前时间完成所存储的音频的流式传输五秒内再次按下按钮)。接受者还可以选择接收公告的文本版本(例如,如果文本对于接受者更方便;如果所存储的音频的流对接受者来说是不明确的)。
在另一实例中,根据本文中所描述的某些实施方式的具有听力假体(例如,装置310)的接受者可以进入大运量公共交通火车站,在大运量公共交通火车站中,基于位置的蓝牙无线广播(例如,广播流412)用于反映通过扬声器系统播放的正常公告,所述听力假体具有外部声音处理器(例如,外部装置320)和与声音处理器通信的移动装置(例如,智能手机;智能手表;另一外部装置320)。该站可以是接受者在每个工作日早上乘坐同一通勤车的站,并且移动装置可以呈现通知弹出文本消息提议以连接到该站的无线广播(例如,经由数据输入接口450接收无线广播)并且启用本文中所描述的某些实施方式的功能。在接受者选择这样做时,移动装置可以访问与接受者的正常通勤相关的关键字(例如,姓名;时间;轨道;平台)。可以从接受者的输入、自动从移动装置上的日历应用程序获得的信息和/或自动从与接受者的先前通勤相对应的先前存储的关键字接收这些关键字。如果存在针对接受者的通勤车的平台改变的公告,则可以经由移动装置的警告蜂鸣声向接受者呈现公告,随后是通知接受者平台改变的文本消息。然后,接受者可以不中断接受者一直在收听的音乐而进入新平台。
在另一实例中,根据本文中所描述的某些实施方式的具有听力假体(例如,装置310)的接受者可以参加家庭活动,在家庭活动中,基于位置的蓝牙无线广播(例如,广播流412)用于反映通过扬声器系统播放的正常公告,所述听力假体具有外部声音处理器(例如,外部装置320)和与声音处理器通信的移动装置(例如,智能手机;智能手表;另一外部装置320)。公告可以关于某些主题演讲的位置,并且接受者可以滚动浏览这些公告的列表,最近的公告实时出现在列表的顶部。接受者可以将移动装置配置成不播放此类别的公告的可听通知,而是播放对接受者具有更高重要性的一个或多个第二类别的公告(例如,包括比其它公告具有更高优先级或重要性的一个或多个关键字的公告)的可听通知。如果参考接受者的汽车通过其车牌号(例如,该车牌号的汽车即将被拖曳)广播公告,因为接受者先前已在高优先级关键字列表中输入了车牌号,则公告可以触发接受者的可听通知,使得接受者可以立即检查并作出响应。
尽管为了易于理解,使用常用术语来描述特定实施方式的系统和方法,但这些术语在本文中用于具有其最广泛的合理解释。尽管关于例示性实例和实施方式描述了本公开的各个方面,但所公开的实例和实施方式不应被解释为限制性的。除非另外特别陈述,或者在如所使用的上下文中另有理解,否则诸如“可以(can)”、“可能(could)”、“可能(might)”或“可以(may)”的条件语言一般旨在传达特定实施方式包括特定特征、元件和/或步骤,而其他实施方式不包括特定特征、元件和/或步骤。因此,这种条件语言一般不旨在暗示特征、元件和/或步骤对于一个或多个实施方式以任何方式被需要,或者不旨在暗示一个或多个实施方式必须包括用于在具有或没有用户输入或提示的情况下决定这些特征、元件和/或步骤是否被包括在任何特定实施方式中或者将在任何特定实施方式中被执行的逻辑。具体地说,术语“包括(comprises)”和“包括(comprising)”应被解释为以非排他性方式指代元件、部件或步骤,这指示所引用的元件、部件或步骤可以存在、利用没有明确引用的其他元件、部件或步骤,或者与该其他元件、部件或步骤组合。
应了解,本文中所公开的实施方式并不相互排斥,并且可在各种布置中彼此组合。另外,尽管所公开的方法和设备在很大程度上是在各种装置的上下文中描述的,但本文中所描述的各种实施方式可被并入多种其他合适的装置、方法和上下文中。更一般地,如可以理解的,本文描述的某些实施方式可用于可以受益于本文描述的某些属性的多种可植入医疗装置上下文中。
如本文中所使用,诸如术语“大约”、“约”、“大致”和“基本上”的程度语言表示仍然执行所需功能或实现所需结果的接近所陈述的值、量或特性的值、量或特性。例如,术语“大约”、“约”、“大致”和“基本上”可以指在所陈述的量的±10%内、在所陈述的量的±5%内、在所陈述的量的±2%内、在所陈述的量的±1%内,或者在所陈述的量的±0.1%内的量。作为另一示例,术语“大体上平行”和“基本上平行”是指偏离精确平行±10度、±5度、±2度、±1度或±0.1度的值、量或特征,并且术语“大体上垂直”和“基本上垂直”是指偏离精确垂直±10度、±5度、±2度、±1度或±0.1度的值、量或特征。本文中公开的范围还涵盖任何和所有重叠、子范围及其组合。诸如“高达”、“至少”、“大于”、“小于”、“在……之间”等的语言包括所列举的数字。如本文中所使用,除非上下文另外明确规定,否则“一(a/an)”和“所述”的含义包括复数。另外,如在本文中的描述中所使用,除非上下文另外明确规定,否则“在……中”的含义包括“到……中”和“在……上”。
虽然本文中根据序数形容词(例如第一、第二等)标记的元件来论述方法和系统,但序数形容词仅用作将一个元件与另一元件(例如,一个信号与另一信号,或者一个电路与另一电路)区分开的标记,并且序数形容词并不用于表示这些元件的次序或它们的使用次序。
本文中所描述和要求保护的发明在范围上不受本文中所公开的特定示例实施方式的限制,原因是这些实施方式旨在作为举例说明,并且不是对本发明的若干方面的限制。任何等效实施方式都旨在处于本发明的范围内。实际上,除了本文中示出和描述的那些之外,根据前述描述,本发明在形式和细节上的各种修改对于本领域技术人员将变得显而易见。这类修改也旨在落入权利要求的范围内。本发明的广度和范围不应受本文中所公开的示例实施方式中的任一个的限制,而应仅根据权利要求和其等效物来限定。

Claims (29)

1.一种设备,包括:
语音活动检测(VAD)电路系统,所述VAD电路系统被配置成分析包括音频数据的一个或多个广播流,以识别所述一个或多个广播流的其中所述音频数据包括语音数据的第一片段,并且识别所述一个或多个广播流的其中所述音频数据不包括语音数据的第二片段;
导出电路系统,所述导出电路系统被配置成接收所述第一片段,并且对于每个第一片段,从所述第一片段的语音数据导出一个或多个字;
关键字检测电路系统,所述关键字检测电路系统被配置成对于每个第一片段接收所述一个或多个字并且生成指示所述一个或多个字中的至少一个字是否在一组所存储的关键字之中的关键字信息;以及
决策电路系统,所述决策电路系统被配置成接收所述第一片段、所述第一片段中的每一个的一个或多个字以及所述第一片段中的每一个的关键字信息,并且对于每个第一片段,至少部分地基于所述关键字信息在关于将指示所述第一片段的信息传送到接受者的多个选项中进行选择。
2.根据权利要求1所述的设备,其中所述VAD电路系统、所述导出电路系统、所述关键字检测电路系统和所述决策电路系统是一个或多个微处理器的部件。
3.根据权利要求2所述的设备,还包括外部装置,所述外部装置被配置成由所述接受者佩戴、保持和/或携带,所述外部装置包括所述一个或多个微处理器中的至少一个微处理器。
4.根据权利要求2或权利要求3所述的设备,还包括感觉假体,所述感觉假体被配置成由所述接受者佩戴或植入所述接受者身上和/或体内,所述感觉假体包括所述一个或多个微处理器中的至少一个微处理器。
5.根据权利要求4所述的设备,其中所述感觉假体和所述外部装置彼此无线通信。
6.根据任一前述权利要求所述的设备,其中所述VAD电路系统还被配置成将所述第一片段与所述第二片段解析开,以将所述第二片段排除在进一步处理之外,并且将所述第一片段传输到所述导出电路系统和所述决策电路系统。
7.根据任一前述权利要求所述的设备,其中所述导出电路系统还被配置成将所述一个或多个字传输到所述关键字检测电路系统。
8.根据任一前述权利要求所述的设备,其中所述关键字检测电路系统还被配置成从存储器电路系统检索所述一组所存储的关键字。
9.根据任一前述权利要求所述的设备,其中所述一组所存储的关键字包括对于每个所存储的关键字指示所存储的关键字的重要性的信息。
10.根据任一前述权利要求所述的设备,还包括关键字生成电路系统,所述关键字生成电路系统被配置成生成所述一组所存储的关键字中的至少一些关键字。
11.根据权利要求10所述的设备,其中所述关键字生成电路系统被配置成从至少一个关键字源和/或至少一个重要性源接收输入信息。
12.根据权利要求11所述的设备,其中来自至少一个关键字源和/或所述至少一个重要性源的输入信息包括由所述接受者提供的信息。
13.根据任一前述权利要求所述的设备,其中关于将指示所述第一片段的信息传送到所述接受者的多个选项包括如下中的至少一者:
指示所述第一片段的一个或多个字的至少一个文本消息;
至少一个可视、音频和/或触觉信号,所述至少一个可视、音频和/或触觉信号指示所述第一片段的一个或多个字是否包括所存储的关键字,指示所存储的关键字的标识和/或指示所存储的关键字的重要性;
至少一个信号,所述至少一个信号指示所述第一片段的音频数据并且传送到所述接受者;以及
至少一个信号,所述至少一个信号指示所述第一片段的音频数据并且传输到存储器电路系统以被存储并随后被检索,并且被传送到所述接受者。
14.一种方法,包括:
接收包括音频数据的一个或多个电磁无线广播流;
将所述一个或多个电磁无线广播流划分成包括语音包括片段和语音排除片段的多个片段;
评估每个语音包括片段的音频数据是否包括至少一个关键字;以及
基于所述评估,将关于所述语音包括片段的信息传送到用户。
15.根据权利要求14所述的方法,其中所述接收由被所述用户佩戴、保持和/或携带或植入所述用户身上或体内的个人电子装置执行。
16.根据权利要求14或15所述的方法,其中所述一个或多个电磁无线广播流包括至少一个蓝牙广播流。
17.根据权利要求14至16中任一项所述的方法,其中所述划分包括:
检测所述多个片段中的每个片段的至少一个特性;
对于所述多个片段中的每个片段,确定所述至少一个特性是否指示所述片段是语音包括片段还是语音排除片段;以及
将信息附加到所述片段中的至少一些片段,所述信息指示所述片段是语音包括片段还是语音排除片段。
18.根据权利要求17所述的方法,其中所述划分还包括将所述语音排除片段排除在进一步处理之外。
19.根据权利要求14至18中任一项所述的方法,其中所述评估包括:
从所述语音包括片段的音频数据提取一个或多个字;
将所述一个或多个字与一组关键字进行比较以检测所述一个或多个字内的至少一个关键字;以及
将信息附加到所述语音包括片段中的至少一些,所述信息指示在所述语音包括片段的一个或多个字内检测到的至少一个关键字的存在和/或身份。
20.根据权利要求19所述的方法,其中所述一组关键字是根据如下中的至少一者编译的:用户输入、当日时间、接收到所述语音包括片段时用户的地理位置、先前用户输入的历史和/或来自计算机存储器或一个或多个计算应用程序的信息。
21.根据权利要求14至20中任一项所述的方法,其中所述评估还包括向所述语音包括片段分配重要性水平。
22.根据权利要求21所述的方法,其中所述重要性水平至少部分地基于所述至少一个关键字的存在和/或身份、用户输入、当日时间、接收到所述语音包括片段时用户的地理位置、先前用户输入的历史和/或来自计算机存储器或一个或多个计算应用程序的信息。
23.根据权利要求14至22中任一项所述的方法,其中所述将信息传送选自由如下组成的组:
向所述用户显示至少一个文本消息,所述至少一个文本消息指示所述语音包括片段的一个或多个字;
向所述用户提供至少一个可视、音频和/或触觉信号,所述至少一个可视、音频和/或触觉信号指示所述语音包括片段是否包括关键字、所述关键字的标识和/或所述关键字的重要性;
向所述用户提供指示所述语音包括片段的音频数据的至少一个信号;以及
将指示所述语音包括片段的音频数据的至少一个信号存储在存储器电路系统中,并且随后从所述存储器电路系统检索所存储的至少一个信号,并向所述用户提供所存储的至少一个信号。
24.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质上存储有计算机程序,所述计算机程序指示计算机系统通过至少如下所述将实时音频信息分割成不同信息区段:
接收包括音频信息的一个或多个电磁无线广播流;
将所述一个或多个电磁无线广播流分割成包括语音包括区段和语音排除区段的多个区段;
评估每个语音包括区段的音频信息是否包括至少一个关键字;以及
基于所述评估,将关于所述语音包括区段的信息传送到用户。
25.根据权利要求24所述的非暂时性计算机可读存储介质,其中分割所述一个或多个电磁无线广播流包括:
检测所述多个区段中的每个区段的至少一个特性;
对于所述多个区段中的每个区段确定所述至少一个特性是否指示所述区段是语音包括区段还是语音排除区段;
将信息附加到所述区段中的至少一些区段,所述信息指示所述区段是语音包括区段还是语音排除区段;以及
将所述语音排除区段排除在进一步处理之外。
26.根据权利要求24或权利要求25所述的非暂时性计算机可读存储介质,其中评估所述音频信息包括:
从每个语音包括区段的音频信息提取一个或多个字;
将所述一个或多个字与一组关键字进行比较以检测所述一个或多个字内的至少一个关键字;
将信息附加到所述语音包括区段中的至少一些,所述信息指示在所述语音包括区段的一个或多个字内检测到的至少一个关键字的存在和/或身份;
向所述语音包括区段分配重要性水平,所述重要性水平至少部分地基于所述至少一个关键字的存在和/或身份、用户输入、当日时间、接收到所述语音包括区段时用户的地理位置、先前用户输入的历史和/或来自计算机存储器或一个或多个计算应用程序的信息。
27.根据权利要求24至26中任一项所述的非暂时性计算机可读存储介质,还包括根据如下中的至少一者编译所述一组关键字:用户输入、当日时间、接收到所述语音包括区段时用户的地理位置、先前用户输入的历史和/或来自计算机存储器或一个或多个计算应用程序的信息。
28.根据权利要求24至27中任一项所述的非暂时性计算机可读存储介质,还包括基于所述一个或多个字是否包括至少一个关键字、所包括的至少一个关键字的身份和/或所述语音包括区段的重要性水平,选择是将关于所述语音包括区段的信息传送到所述用户还是不将关于所述语音包括区段的信息传送到所述用户。
29.根据权利要求28所述的非暂时性计算机可读存储介质,其中传送所述信息包括如下中的至少一者:
向所述用户显示至少一个文本消息,所述至少一个文本消息指示所述语音包括区段的一个或多个字;
向所述用户提供至少一个可视、音频和/或触觉信号,所述至少一个可视、音频和/或触觉信号指示所述语音包括区段是否包括关键字、所述关键字的标识和/或所述关键字的重要性;
向所述用户提供指示所述语音包括区段的音频信息的至少一个信号;以及
将指示所述语音包括区段的音频信息的至少一个信号存储在存储器电路系统中,并且随后从所述存储器电路系统检索所存储的至少一个信号,并向所述用户提供所存储的至少一个信号。
CN202280032496.3A 2021-05-18 2022-05-04 用于智能广播管理的系统和方法 Pending CN117242518A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163190112P 2021-05-18 2021-05-18
US63/190,112 2021-05-18
PCT/IB2022/054124 WO2022243778A1 (en) 2021-05-18 2022-05-04 System and method for smart broadcast management

Publications (1)

Publication Number Publication Date
CN117242518A true CN117242518A (zh) 2023-12-15

Family

ID=84141144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280032496.3A Pending CN117242518A (zh) 2021-05-18 2022-05-04 用于智能广播管理的系统和方法

Country Status (3)

Country Link
US (1) US20240185881A1 (zh)
CN (1) CN117242518A (zh)
WO (1) WO2022243778A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8788050B2 (en) * 2003-12-22 2014-07-22 Cochlear Limited Hearing prosthesis system having interchangeable housings
US10195432B2 (en) * 2014-11-21 2019-02-05 Cochlear Limited Systems and methods for non-obtrusive adjustment of auditory prostheses
US10091591B2 (en) * 2016-06-08 2018-10-02 Cochlear Limited Electro-acoustic adaption in a hearing prosthesis
WO2019142072A1 (en) * 2018-01-16 2019-07-25 Cochlear Limited Individualized own voice detection in a hearing prosthesis
US20190325862A1 (en) * 2018-04-23 2019-10-24 Eta Compute, Inc. Neural network for continuous speech segmentation and recognition

Also Published As

Publication number Publication date
US20240185881A1 (en) 2024-06-06
WO2022243778A1 (en) 2022-11-24

Similar Documents

Publication Publication Date Title
US9114259B2 (en) Recording and retrieval of sound data in a hearing prosthesis
CN110072434B (zh) 用于辅助听力设备使用的声音声学生物标记的使用
US8641596B2 (en) Wireless communication in a multimodal auditory prosthesis
CN110650772B (zh) 可植入听觉假体的使用约束
US20110093039A1 (en) Scheduling information delivery to a recipient in a hearing prosthesis
US20230352165A1 (en) Dynamic virtual hearing modelling
US20230066760A1 (en) Functionality migration
EP2876899A1 (en) Adjustable hearing aid device
US10003895B2 (en) Selective environmental classification synchronization
US20240179479A1 (en) Audio training
CN111615833B (zh) 听力假体中的个性化自身语音检测
AU2012237711B2 (en) Wireless audio signal monitor output for hearing implant system
EP2876902A1 (en) Adjustable hearing aid device
CN111133774B (zh) 声学点识别
US20210321201A1 (en) Systems and methods for customizing auditory devices
US20240185881A1 (en) System and method for smart broadcast management
US20230329912A1 (en) New tinnitus management techniques
US9901736B2 (en) Cochlea hearing aid fixed on eardrum
CN113195043A (zh) 评估对感觉事件的响应并基于其执行处理动作
US20230269013A1 (en) Broadcast selection
Kaplan Technology for Aural
Friesen et al. Cochlear Implant Research: Overview, Current and Future Trends

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination