CN117959592A - 高级听力假体接受者康复和/或恢复 - Google Patents

高级听力假体接受者康复和/或恢复 Download PDF

Info

Publication number
CN117959592A
CN117959592A CN202410031402.1A CN202410031402A CN117959592A CN 117959592 A CN117959592 A CN 117959592A CN 202410031402 A CN202410031402 A CN 202410031402A CN 117959592 A CN117959592 A CN 117959592A
Authority
CN
China
Prior art keywords
content
recipient
input
hearing
hearing prosthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410031402.1A
Other languages
English (en)
Inventor
J·梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cochlear Ltd
Original Assignee
Cochlear Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cochlear Ltd filed Critical Cochlear Ltd
Publication of CN117959592A publication Critical patent/CN117959592A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/70Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/55Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
    • H04R25/558Remote control, e.g. of amplification, frequency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/39Aspects relating to automatic logging of sound environment parameters and the performance of the hearing aid during use, e.g. histogram logging, or of user selected programs or settings in the hearing aid, e.g. usage logging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/41Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/55Communication between hearing aids and external devices via a network for data exchange
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Prostheses (AREA)

Abstract

一种提高听力假体的接受者利用听力假体聆听的能力的方法,包括获取指示内容的第一特性的数据,其中该内容是音频或音频视觉内容,获取指示内容的第二特性的数据,基于第一特性和第二特性,标识具体内容,以及使用具体内容的至少一个项目以及听力假体,以使接受者中的听力感知基于具体内容的至少一个项目而被诱发。

Description

高级听力假体接受者康复和/或恢复
分案申请说明
本申请是国际申请号为PCT/IB2019/052782、国际申请日为2019年04月04日、于2020年10月09日进入中国国家阶段、国家申请号为201980024856.3、发明名称为“高级听力假体接受者康复和/或恢复”的中国发明专利申请的分案申请。
相关申请的交叉引用
本申请要求以澳大利亚麦格理大学的Jim MAY命名为发明人的、于2018年04月05日提交的、题为“ADVANCED HEARING PROSTHESIS RECIPIENT HABILITATION AND/ORREHABILITATION”的美国临时申请号62/652,971的优先权,其内容在法律允许的最大程度上通过整体引用并入于此。
背景技术
可能由于多种不同原因引起的听力损失通常为两种类型:传导性的和感官神经性的。感官神经性听力损失是由于将声音信号转换为神经冲动的耳蜗中的毛细胞不存在或被破坏所致。各种听力假体在市场上可买到,以向患有感官神经性听力损失的个体提供感知声音的能力。一个听力假体的示例是耳蜗植入物。
当向耳蜗中的毛细胞提供声音的正常机械通路例如由于听小骨链或耳道的损伤而受到阻碍时,发生传导性听力损失。患有传导性听力损失的个体可能会保持某种形式的残余听力,因为耳蜗中的毛细胞可能没有受到损害。
患有听力损失的个体通常接收声学助听器。常规助听器依靠空气传导原理将声学信号传输到耳蜗。特别地,助听器通常使用被放置于接受者的耳道内或外耳上的设备来放大接受者的外耳所接收的声音。这种放大的声音到达耳蜗,引起外周淋巴的运动以及对听觉神经的刺激。传导性听力损失的病例通常通过骨传导助听器进行治疗。与常规助听器对比而言,这些设备使用机械致动器,该机械致动器联接到颅骨以施加放大的声音。
与主要依赖于空气传导原理的助听器对比而言,通常被称为耳蜗植入物的某些类型的听力假体将接收到的声音转换成电刺激。电刺激被施加到耳蜗,其结果是对接收到的声音的感知。
诸如与接受者对接的医疗设备这样的许多设备具有结构和/或功能特征,其中在针对个体接受者调整这样的特征方面具有实用价值。针对接受者的特定需要或特定要求或特定特征,定制或订制或以其他方式调整与接受者对接或以其他方式由接受者使用的设备的过程,通常被称为适配。在这样的个体接受者中具有实用价值的一种医疗设备是上述的耳蜗植入物。也就是说,存在具备适配接受者的实用价值的其他类型的医疗设备,例如其他类型的听力假体。
存在以增强或以其他方式提供感觉刺激的其他类型的医疗设备,仅作为示例而非限制,例如视觉假体,例如视网膜植入物。总体上,这些设备(听力、视觉等)在本文中将被描述为感觉假体或感觉医疗设备。一些这种感觉假体的一些实施例包括一个或多个感觉刺激诱发现象捕捉装置,仅作为示例而非限定于此,例如麦克风或照相机等。应注意,感觉刺激诱发现象并不要求该现象诱发所有人的刺激(该现象存在与否与例如盲人是否能看到还是聋人是否能听到无关)。
发明内容
根据另一示例性实施例,一种提高听力假体的接受者利用所述听力假体聆听的能力的方法,包括:获取指示内容的第一特性的数据,其中所述内容是音频内容或音频视觉内容;获取指示所述内容的第二特性的数据;基于所述第一特性和所述第二特性,标识具体内容;以及使用所述具体内容的至少一个项目以及所述听力假体,以使接受者中的听力感知基于所述具体内容的至少一个项目而被诱发。
根据另一示例性实施例,存在一种方法,包括:电子地接收第一输入,所述第一输入指示听力假体的接受者需要的媒体内容;向接受者提供基于接收的所述第一输入的一个或多个话题项目选择;及使用与被提供的所述一个或多个话题项目选择相对应的、消费者容易可用的媒体内容,训练或再训练耳蜗植入物的接受者来利用所述假体识别和/或区别声音,其中相对于缺失所述第一输入的情况,所述训练或再训练提高训练依从性。
根据另一个示例性实施例,存在一种听力假体训练系统,包括:第一子系统,被配置为:接收第一输入,所述第一输入指示听力假体的接受者需要的音频内容和/或音频视觉内容;和接收第二输入,所述第二输入指示所述接受者的特征,所述特征与所述接受者的感官状态和/或精神状态有关;以及第二个子系统,被配置为:基于所述第一输入和所述第二输入标识媒体内容。
根据另一个示例性实施例,存在一种标识听力假体接受者利用音频内容的方法,包括:搜索音频和/或音频视觉内容,并且标识音频和/或音频视觉内容;以及评估所述被标识的内容,其中所述评估所述内容的动作针对语言属性和/或音频属性评估所述内容。
根据另一个示例性实施例,存在一种听力康复和/或恢复方法,包括:提供第一输入,所述第一输入指示要由听力假体的接受者使用的音频和/或音频视觉内容;提供第二输入,所述第二输入指示接受者理解能力和/或受接受者理解影响特征需求;基于所述第一输入和所述第二输入的分析、以及从较大内容项目组中剔除的内容项目的子组,接收一个或多个具体内容项目和/或所述一个或多个具体内容项目的一个或多个指示符;选择用于收听和/或观看的所述一个或多个具体内容项目之一;以及通过收听所述一个或多个具体内容项目之一来康复和/或恢复所述接受者的听力。
附图说明
下面参考附图描述实施例,其中:
图1是示例性听力假体的透视图,其中能够应用本文详述的至少一些教导;
图2A和图2B呈现了示例性系统,其包括听力假体和便携式手持设备形式的远程设备;
图3呈现了示例性系统,其包括听力假体和智能手表形式的远程设备;
图4呈现了根据示例性实施例的示例性概念功能示意图;
图5呈现了示例性实施例的示例性示意图;
图6呈现了根据示例性实施例的用于示例性算法的示例性流程图;
图7呈现了根据示例性实施例的用于示例性算法的示例性流程图;
图8-13呈现了根据示例性实施例的用于示例性算法的示例性流程图;
图14和图15呈现了根据示例性实施例的一些示例性黑匣子图;
图16-18呈现了根据示例性实施例的用于示例性算法的示例性流程图;以及
图19和图20呈现了根据示例性实施例的一些系统的示例性功能图。
具体实施方式
图1是植入在接受者中的被称为耳蜗植入物系统100的耳蜗植入物的透视图,本文详述的一些实施例和/或其变型可应用于该耳蜗植入物。耳蜗植入物100是系统10的一部分,系统10在一些实施例中可以包括外部组件,如将在下面详细描述的。另外,应指出,本文详述的教导也可应用于其他类型的听力假体,诸如仅作为示例而非限制,骨传导设备(经皮、主动经皮和/或被动经皮)、直接声学耳蜗刺激器、中耳植入物和常规助听器等。实际上,应指出,本文详述的教导也可应用于所谓的多模式设备。在示例性实施例中,这些多模式设备将电刺激和声刺激都施加给接受者(有时称为电声刺激器)。在示例性实施例中,这些多模式设备经由电听觉和骨传导听觉诱发听力感知。因此,除非另外指明,或者除非其公开内容基于当前技术状态而与给定的设备不兼容,否则本文关于这些类型的听力假体之一的任何公开内容对应于这些类型的听力假体中的另一种的公开内容或针对此事的任何医疗设备。因此,在至少一些实施例中,本文详述的教导可应用于部分可植入和/或完全可植入的医疗设备,该医疗设备向接受者、患者或其他用户提供广泛的治疗益处,包括具有植入式麦克风的听力植入物、听觉脑刺激器、视觉假体(例如,仿生眼)、传感器、功能性电刺激设备等。
鉴于以上内容,应理解,本文详述的至少一些实施例和/或其变型针对身体穿戴的感官补充医疗设备(例如,图1的听力假体,即使在丢失全部自然听力实力的情况下,该听力假体也会补充听力感官)。应指出,一些感官补充医疗设备的至少一些示例性实施例针对在保持了某些自然听力实力的情况下补充了听力感官的诸如常规助听器之类的设备以及视觉假体(既适用于具有一些自然视觉功能的接受者,又适用于不具有自然视觉功能的接受者)。因此,本文详述的教导可应用于任何类型的感官补充医疗设备,本文详述的教导使得能够以实用的方式在其中使用。就此而言,短语“感官补充医疗设备”是指用以向接受者提供感官的任何设备,而不管适用的自然感官是仅部分受损还是完全受损。
接受者有外耳101、中耳105和内耳107。下面描述外耳101、中耳105和内耳107的部件,然后描述耳蜗植入物100。
在功能齐全的耳朵中,外耳101包括耳廓110和耳道102。耳廓110收集声压或声波103,并且被引导入并通过耳道102。跨耳道102的远端布置的是鼓膜104,其响应于声波103而振动。该振动通过中耳105的三个骨骼耦合到椭圆形窗口或椭圆形窗外,三个骨骼统称为小骨106,包括槌骨108、砧骨109和骨111。中耳105的骨骼108、109和111用于过滤和放大声波103,从而使椭圆形窗口112响应鼓膜104的振动而发声或振动。该振动在耳蜗140内建立了外周淋巴的流体运动波。这样的流体运动继而激活了耳蜗140内部的微小毛细胞(未示出)。毛细胞的激活导致产生适当的神经冲动,并通过螺旋神经节细胞(未示出)和听觉神经114将其传递到大脑(也未示出),在该处它们被感知为声音。
如图所示,耳蜗植入物100包括被临时或永久地植入接受者中的一个或多个部件。耳蜗植入物100如图1所示,具有外部设备142,该外部设备是系统10(以及耳蜗植入物100)的一部分,如下所述,该外部设备配置为向耳蜗植入物提供电力,其中,植入的耳蜗植入物包括电池,该电池由外部设备142提供的电力充电。
在图1的说明性布置中,外部设备142可以包括耳后(BTE)单元126中的电源(未标示)。外部设备142还包括经皮能量传输链路部件,其称为外部能量传输组件。经皮能量传输链路用于将能量和/或数据传输到耳蜗植入物100。各种类型的能量传输,例如红外(IR)、电磁、电容和电感传输,都可以用于将能量和/或数据从外部设备142传输到耳蜗植入物100。在图1的说明性实施例中,外部能量传输组件包括外部线圈130,该外部线圈130形成感应射频(RF)通信链路的一部分。外部线圈130通常是由多匝电绝缘的单股或多股铂线或金线组成的。外部设备142还包括位于外部线圈130的线匝内的磁体(未标示)。应当注意到图1中所示的外部设备仅用于说明,其他外部设备也可与本发明的实施例一起使用。
耳蜗植入物100包括内部能量传输组件132,该内部能量传输组件132可以置于接受者的耳廓110的颞骨的凹部临近范围内。如下所述,内部能量传输组件132是经皮能量传输链路的组件,并从外部设备142接收能量和/或数据。在说明性实施例中,能量传输链路包括感应RF链路,内部能量传输组件132包括初级内部线圈136。内部线圈136通常是由多匝电绝缘的单股或多股铂线或金线组成的线天线线圈。
耳蜗植入物100还包括主要可植入部件120和细长电极组件118。在一些实施例中,内部能量传输组件132和主要可植入部件120被气密密封在生物相容性壳体内。在一些实施例中,主要可植入部件120包括可植入麦克风组件(未标示)和声音处理单元(未标示),以将由内部能量传输组件132中的可植入麦克风接收的声音信号转换为数据信号。也就是说,在一些备选实施例中,可植入麦克风组件可以置于单独的可植入部件(例如,具有其自身的外壳组件等),该单独的可植入部件与主要可植入部件120信号通信(例如,通过位于单独的可植入部件和主要可植入部件120之间的引线等)。在至少一些实施例中,本文中详述的教导和/或其变型可以与任何类型的可植入麦克风布置一起使用。
主要可植入部件120还包括刺激器单元(也未标示),该刺激器单元基于数据信号产生电刺激信号。电刺激信号通过细长电极组件118传递到接受者。
细长电极组件118的近端连接到主要可植入组件120,远端植入在耳蜗140内。电极组件118穿过乳突骨119从主要可植入组件120延伸到耳蜗140。在一些实施例中,电极组件118可以至少可被植入在基底区116中,有时可被植入更深处。例如,电极组件118可以朝耳蜗140的顶部延伸,这一顶部被称为耳蜗顶点134。在某些情况下,电极组件118可以通过耳蜗切开术122插入到耳蜗140中。在其他情况下,耳蜗造口术可以通过圆形窗口121、椭圆形窗口112、耳蜗岬部123或通过耳蜗140的耳蜗顶转147形成。
电极组件118包括延其长度布置的电极148的纵向对齐并向远侧延伸的阵列146。如所指出的,刺激器单元产生的刺激信号由电极148施加到耳蜗140,从而刺激听神经114。
图2A和2B示出了根据示例性实施例的示例性系统210,其包括听力假体100和便携式手持设备240,该听力假体100在示例性实施例中对应于上述耳蜗植入物100。图2B所示的实施例具有通过听力假体100的无线连接230,而图2A所示的替代实施例则不具有这样的连接。在示例性实施例中,听力假体100是植入接受者99中的植入物(如图2A/2B中虚线框出部分所示)。在示例性实施例中,如图2B所示,系统210被配置为耳蜗植入物100和便携式手持设备240(例如,便携式蜂窝电话,仅作为示例而非限定于此,常被提起的智能手机)具有关联性,虽然在图2A中,并没有这样直接关联。仅作为示例而非限定于此,在示例性实施例中,该关联性是指智能手机可通过无线连接230充当听力假体100的控制设备。或者,或除此之外,该关联性是指仅将由智能手机的麦克风所捕获的音频信号流传输到听力假体,以便听力假体基于该音频流来诱发听力感知(如下文将详述,还存在其他关系)。在一些实施例中,便携式手持设备240仅扩展了听力假体系统,但并不是听力假体系统的控制设备。也就是说,在某些实施例中,两个设备之间存在不同的关联性。反而,例如说,两个设备可以同时运用,以达到更好的实用价值,这将在下文进行描述。这两个设备相对于彼此完全自主地工作,但在一些这样的示例性实施例中,两个设备中的一个或两个设备可以“意识到”一个或两个设备正在与另一个设备同时使用。以下将对此进行更近一步的详细说明。需要说明的是,在一些实施例中,远程设备不能主动去调整假体100,但是这不排除远程设备可向接受者提供提示,表明在接受者在调整假体100时还是具有实用价值的。在一些实施例中,在一个或多个或所有设备的操作期间存在设备之间的配对,并且该配对被一个或多个或所有设备标识。
要注意的是,尽管本文中详细描述的实施例经常描述为耳蜗植入物的使用,但是备选的实施例也可以用于其他类型的听力假体中,例如,仅作为示例而非限定于此,骨传导设备(经皮,主动经皮和/或被动经皮)、直接声学耳蜗植入物(DACI)和传统助听器。因此,除非另外指明,或者除非其公开内容与给定的基于当前技术状态的听力假体不相容,否则本文关于这些类型听力假体中的一种的任何公开内容都对应于这些类型假体医疗设备中的另一种的公开内容,或与该事项有关的任何医疗设备。
图3示出了示例性实施例的示例性系统211,包括听力假体100,其在示例性实施例中对应于以上详述的耳蜗植入物100;以及便携式设备241,该设备具有可选的无线连接230,可与听力假体100连接,其中,在此图中便携式设备241是智能手表。在示例性实施例中,听力假体100是植入接受者99中的植入物(如图2A/2B中虚线框出部分所示)。在示例性实施例中,在智能手表的实施例中,系统211配置为耳蜗植入物100和便携式设备241可具备关联性。仅作为示例而非限定于此,在示例性实施例中,该关联性是智能手表241经由无线连接230用作假体100的远程麦克风和/或用作假体控制器的能力。然而,如以上详述的关于智能手机的实施例,在一些实施例中,其间没有关联性。为了清楚起见,只要该技术可以实现除非另外说明,否则本文关于智能手机的特征的任何公开内容可以对应于对智能手表的特征的公开内容,和/或反之亦然。还应注意的是,尽管图2A、图2B和图3中呈现的是多功能智能便携式设备作为远程设备,在一些实施例中,远程设备是专用于实现本文中详述的教导。还应注意以下所详细描述的,在一些实施例中,一个或多个或所有前述设备可以在提供的系统中同时使用和/或替代系统的另一组件。
为了清楚起见,在示例性实施例中,本文中详述的教导可以被配置为用于执行本文中详述的教导的多功能智能便携式设备全部或部分执行。并且,本文中详述的教导可以全部或部分地由计算机(手提电脑,台式机等),或由交互式电视,或由配置为可访问互联网或与本文中详述的教导关联的数据的任何设备执行。任何配置为可执行本文详细描述的一个或多个方法算法的电子设备,可以利用于至少一些示例性实施例,在这些示例性实施例中,执行本文详细描述的一个或多个方法的配置可以通过使用软件和/或固件和/或硬件程序实现。这些电子设备可以是基于处理器和/或微处理器的设备。此类设备的其他详细信息如下所述。但现在将先描述其一些实用用途。
利用诸如耳蜗植入物的听力假体并不总是直接的命题。在某些情况下,接受者需要“重新学习”如何听。使用耳蜗植入物的电听力与自然听力不同。此外,对于从没有听力的人而言,他们必须重头开始学习声音。在示例性实施例中,通过练习听力来提高康复和/或恢复率可能具有实用价值。其中一种方法是经常进行对话。另一种方法是听如有声读物等,或听电视节目或广播等。
在示例性实施例中,存在康复和/或恢复的方法,包括通过听障人士作为在家中练习/治疗的形式来收听某些类型的音频内容,例如播客和有声读物。就是说,在这种疗法场景下,当接受者努力寻找对接受者来说既有趣又非常匹配他或她的听力能力时,就存在挑战。这是康复过程的早期阶段会出现的情况。在一些示例性实施例中,医疗保健专业人员等,或者临床医生可以提供或以其他方式推荐匹配他们听力能力的内容列表。可能会遇到的内容示例,或者可能与接受者的听觉相关的一部分可能是例如儿童故事。就是说,在某些此类场景下,接受者很难保持动力并进行练习,因为他们发现受限制的内容集(例如推荐的内容集)并不是特别有趣。在示例场景中,情况可能是这样的,其中接受者是成人,受限制的内容对应为儿童故事或儿童电视节目等。
示例性实施例包括音频内容搜索引擎,该音频内容搜索引擎被配置为,使得诸如听力假体接受者和/或与此类接受者合作的医疗保健专业人员等用户能够在音频内容、或具有音频内容的内容的广泛选择中搜索与话题相关的内容,在该话题中给定的接受者或一组接受者对匹配其收听能力的属性感兴趣。下文将对此进一步详细说明,但首先对示例系统以及初始编译内容的系统进行简要概述,其中搜索用户界面/搜索用户服务是该示例系统的一部分。
图4呈现了根据示例性实施例的示例性概念概述。在此,存在与示例性实施例中的搜索用户界面相对应的搜索界面和服务410,其与用户99交互,其中用户是听力假体的接受者和/或用户499,其中用户是医疗保健专业人员或护理人员或与听力假体的接受者合作的人(有偿或无偿,例如父母或朋友)。
图4还呈现了音频内容索引引擎420。简而言之,在示例性实施例中,其可以是被配置为自动搜寻具有音频内容的内容(歌曲,有声读物,电视/视频等),分析内容的各种标准,以及标记或标识此类基于标准的内容,这些标记稍后将由接受者直接或间接地使用,以审核或缩小接受者感兴趣的内容,并使其与接受者的听力能力相匹配。在该系统的一些示例性实施例中,该系统可以是基于计算机的系统,其搜索万维网430以查找内容并根据算法分析该内容。在示例性实施例中,各种标准——音频内容标准——可以包括字率、性别、口音、语言复杂度级别和/或背景声音特性/级别。这些都将在下方更详细描述,但是从现在开始,这些是将为给定内容标记的一些标准。进一步说明,标准可以是内容的主题/话题。如果内容是电影,则主题可以是动作片、纪录片、戏剧、喜剧、爱情片等。如果内容是电视节目,则主题可以是上述的任何主题,还可以包括新闻、天气预报、教育节目等。需要注意的是在寻找内容的过程中不必分析或评估该主题内容。就这一点而言,标识内容的标题和利用基于标题等来缩小内容的算法可能很简单。
在示例性实施例中,开发或以其他方式购买针对音频数据的上述每个特征/属性的分类器(口音分类器,语言分类器,字率分类器等)。分类器可以是基于处理器的设备,其接收音频输入或接收指示音频输入的至少一些特征的输入,并根据算法对输入进行分析以对输入进行分类。例如,存在用于分类书面语言的分类器,例如谷歌所使用的分类器。因此,实施例可以在至少一些示例性实施例中利用这样的分类器,并且否则利用基于这种市售分类器的修改的分类器。
分析的结果/搜索引擎努力的结果可以存储在音频内容索引440中。在示例性实施例中,可以是基于云的索引。在示例性实施例中,可以是可下载到接受者的智能手机等或接受者的计算机等的数据库。也就是说,在示例性实施例中,音频内容索引440可以被下载到设备,搜索界面和服务410是该设备的一部分。
已经建立了由系统编译的数据库等,或者具有搜索内容的能力,实施例包括搜索用户界面,其可以是搜索界面和服务410的一部分,这可以是计算机或本文详述的任何智能设备的图形用户界面。图5呈现了智能手机510上的示例搜索用户界面的示意图示例。下面将更详细地描述搜索用户界面的一些其他功能。简而言之,用户可以在搜索用户界面输入他们感兴趣的话题和/或音频内容的属性,以试图使内容,相较于未使用本文中详述的教导的情况,与他们的收听能力更匹配。图5呈现了示例性界面,其中接受者已输入神秘故事有声读物的话题内容到界面510的搜索框中。过滤器被提供以基于上述各种音频内容进行过滤。还应注意,存在快速过滤器或简单过滤器,使接受者能够在示例性实施例中基于容易程度和困难程度之间的比例来标识内容,这可以是系统经由其分析而编译的,或是由搜索用户界面等通过使用算法来生成的,该算法评估标记的音频内容标准并确定收听的容易程度。就这一点而言,在一些实施例中,可以通过提供聚合一些和/或所有过滤器属性的单个输入选项来简化用户体验。
要注意的是,尽管以上详述的实施例集中于可以与听力假体进行通信的智能设备,但是在其他实施例中,具有搜索用户界面的智能设备不需要进行通信,或假体的控制设备。这些可以是完全独立于假体的设备,与假体无关。也就是说,在备选的实施例中,搜索用户界面可以是假体的一部分,其中假体可以通过蜂窝电话技术,或通过电传线圈等,或通过蓝牙技术等与万维网等进行通信。——接受者可以大声说出,以便听力假体的麦克风拾取言语并分析言语,然后根据其进行搜索。实际上,在示例性实施例中,音频内容索引440可以存储在听力假体中。假体本身可以从可用内容中标识各种具体内容,而无需与外界交互(保存以获取音频内容索引),并基于搜索/基于过滤将返回的各种具体内容通知接受者。假体可以与接受者“交谈”,并告诉他或她想观看最新版的“东方特快列车谋杀案”(代替旧版本,因为例如新版本的音频质量比旧版本更好,并且搜索用户界面设置为“简单”——如果搜索用户界面设置为“困难”,则很可能反馈为“东方特快列车谋杀案”的旧版本)。接受者会“听到”假体告诉接受“东方特快列车谋杀案”的2017年发行版可能是更适合他或她的内容,然后接受者可以访问因特网等,或使用随意一种有线电视/卫星电视等的点播系统,并观看(收听)该电影。
现在将描述图4配置的各种组件的一些附加细节。
如上所述,一些实施例包括音频内容搜索引擎。在一些示例性实施例中,音频内容搜索引擎可以有效地使用一次,然后在内容的数据库以及各种标签被开发(develope)之后被忽略。也就是说,基于数据库被创建或更新后更新的内容来定期更新数据库,或者标识上次所创建的但无法从如万维网上获得的新内容,具有实用价值。鉴于上述内容,在示例性实施例中,存在一种方法,该方法包括使用音频内容搜索引擎执行搜索1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30次或更多次,其中每次使用的时间间隔为,例如,变化地,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、或36天、或周、或月中的任意时间间隔。此外,在至少一些示例性实施例中,搜索引擎可以是基于先前的搜索来缩小搜索范围的智能搜索引擎。因此,初始搜索可能需要花费几天和/或几周和/或几个月来编译初始数据库,而随后的搜索则可花费更少的时间。
无论如何,在至少一些实施例中,音频内容索引引擎是负责从与言语聆听难度有关的言语音频内容(言语文件——可以是基于包含声音/言语的电影/视频数据的文件)中提取属性的部件。言语聆听难度属性包括与语言理解难度有关的语言属性,以及与言语聆听难度有关的音频属性。同样,这些属性(或更准确地说,这些属性的标记)可以存储在音频内容索引中,以便搜索服务能够通过这些属性过滤内容。
一些语言属性和/或音频属性的附加示例如下所述。简而言之,语言属性这一表述是指可以全部以文本形式而非音频形式表示的语言的属性。在示例性实施例中,这等效于市售言语转换文本的计算机转换系统的输出,和/或通过对着麦克风大声朗读并从文本转换言语时所使用的文本。语言属性在本文中详述的教导的至少一些示例性实施例中是实用的,因为在至少一些场景示例中,更复杂的语言更难于理解。例如,特别是单词标识率已经很低时,拥有更复杂词汇的语言更难理解。因此,本文中详述的教导可以包括标识接受者在开始听力进程时所使用的词汇不太复杂的内容,以及标识接受者随后的听力进程时所使用的词汇较为复杂的内容。就这一点而言,词汇的复杂度可以用作评估接受者在理解或收听内容的音频数据时是否轻松或艰难的指标。本文的实施例包括的方法包括使用了包括不太复杂词汇的内容加强训练方案的依从性,这一加强是相对于使用了更复杂词汇的内容的训练方案而言。本文的实施例还包括的方法是使用包括更复杂词汇的内容,加重负担或锻炼接受者的认知能力,以达到比其他情况时更大的程度。这类似于跑步者或运动员加大锻炼量以增强肌肉或耐力等。
此处使用的音频属性这一表述对应为只能以音频形式呈现的言语文件的属性。这些包括如言语的速度(字率)、说话者的性别、口音和背景声音特性(例如噪音、音乐或声效等)。
本文中详述的教导包括标识具有音频属性的内容,这些内容在接受者的听力进程开启之初对接受者的负担较小,还包括标识具有负担更重的音频属性的内容,这些内容在接受者随后的听力进程使用。在这方面,复杂性音频属性(通用术语,其中在其他所有条件都相同的情况下,更多的复杂性意味着该属性使理解言语变得更加困难,而复杂性越小意味着该属性使理解言语变得更不困难)用作评估接受者在理解或收听内容的音频数据时是否轻松或艰难的指标。本文的实施例包括的方法包括使用了不太复杂的音频属性的内容加强训练方案的依从性,这一加强是相对于使用了更复杂的音频属性的内容的情况而言。本文的实施例还包括的方法是使用包括更复杂的音频属性的内容,加重负担或锻炼接受者的认知能力,以达到比其他情况时更大的程度。
图6更详细地呈现了搜索引擎的操作的算法示例。图6呈现了一种方法,方法600包括方法动作610,该方法动作610包括数据的收集。在示例性实施例中,诸如RSS(丰富网站摘要)的协议或另一协议被用于订阅和下载音频内容。在示例性实施例中,方法动作610可以包括自动和/或手动/策动的内容发现机制的使用。
举例来说,方法动作610可以包括访问标准化计算机可读格式的在线内容和/或更新到该在线内容的动作。在示例性实施例中,用户(无论是人工的还是自动的或两者)在单个或多个新闻聚合器中随时关注1个或2个或3个或更多或很多的不同网站。这些新闻聚合器会自动检查RSS订阅源中是否有新内容,使内容可以自动从网站传递到网站和/或从网站传递给用户。实际上,在示例性实施例中,方法动作610是通过订阅市售网站RSS的动作来执行的,而在其他实施例中,利用专门开发的RSS来实现方法动作610。因此,示例性实施例包括开发RSS来执行方法动作610。在一些示例性实施例中,但不一定是所有示例性实施例,标准包括利用标准XML文件格式来确保或增强与各种机器/程序的兼容性。在示例性实施例中,无论是市售的RSS或专为执行方法动作610这一特定目的而开发的RSS,都会监控各种站点(在某些情况下持续不断监控,而在其他情况下则是定期或半定期,或基于某种时间形式和/或基于某种数据驱动形式进行监控),并自动标识内容和/或任何更新。在至少一些示例性实施例中,无论是基于计算机还是其他方式,浏览器或其他自动化设备如果找到新数据会自动下载,或者以不违反版权法等的方式访问该数据,这一访问使本文中详述的教导成为可能。
如上所述,在一些实施例中,RSS订阅可用于标识或发现新的订阅音频内容。应注意的是在一些实施例中不一定是这种情况。再次,如上所述,在某些情况下,数据库已设置并且不会进一步更新。当然,在其他实施例中,更新会连续或半连续或定期或半定期或其他任何具有实用价值的方式进行。
尽管上述实施例主要关于自动化技术,但是在一些其他实施例中,方法动作610以非自动化方式执行,或具体而言以人工启动方式执行。仅作为示例而非限定于此,人们可自行将数据提供给公共资源,例如通过电子邮件,或通过将数据输入配置为编译或收集数据的网站。仅作为示例而非限定于此,在示例性实施例中,一流的听力假体制造商会提供网站,让人们能够以类似于利用RSS的方式将数据输入该网站。还应注意的是,自动方式和手动方式都可以相互结合去执行。能执行方法动作610的任何设备、系统和/或方法都可以应用在至少一些示例性实施例中。
依旧是关于方法600的内容,在示例性实施例中存在被配置为执行方法600所有方法动作的集成系统。对此的推论是,在示例性实施例中,存在一种基于图6的算法的系统。
因此,通过执行本文中详述的方法600和/或其他方法,可以实现创建各种内容项目的音频属性的索引。
图7呈现了将方法600的方法动作与可以执行方法600的结构和/或功能设备/方法动作相集成的示例图。
再次参考图6,方法600还包括方法动作620,该方法动作620包括摄取在方法动作610中收集的收集数据的动作。在示例性实施例中,通过将音频内容从一种或多种格式和/或从一系列格式转换成用于实现本文中详述的教导的格式,例如标准格式,来执行方法动作610。参考图7可以看到在方法动作610中所收集的数据的各种格式,可以是蕴含了各类音频编码格式,例如MP3格式、ACC格式等。因此,方法动作620可以包括将这些格式调整为单一格式,例如ACC格式,如果这是被用于标准化格式的格式。标准化格式由对称球体720进行了概念化呈现,这一对称球体概念化呈现了位于球体表面的任何东西可以轻松移动到其他任何位置的能力,从而呈现了方法动作620的结果兼容性。
方法600还包括方法动作630,该方法动作630包括转换经摄取的数据的动作。就这一点而言,在示例性实施例中,将方法动作620的格式化动作引起的音频内容转换为文本格式或相对于使本文详述的教导具有实用价值的一些其他格式,该文本格式可被一些下游分类器使用。任何音频到文本识别算法或系统可以被使用。在示例性实施例中,可利用DragonTM或NexmoTM的基础编程或其变型或其他达到相同和/或类似结果的算法,以上列举仅作为示例而非限定于此。启用方法动作630的任何设备、系统和/或方法可以用于至少一些示例性实施例中。
还应注意到的是,尽管此处呈现的转换指示了言语至文本的转换,但是在其他示例性实施例中,也可以执行其他类型的转换。实际上在示例性实施例中,将先进技术应用于视觉数据,用于分析视觉数据的清晰度和/或开发可以用于对视频等中的视觉场景与文本之间的相关性进行分类(在方法动作640中)的数据。仅作为示例而非作为限制,在示例性实施例中,如果动作与某个内容中的文本比与另一个内容中的文本的相关性更大,则在所有其他条件相同的情况下,其内容应该更容易被理解,至少对于可以看见人而言如此。实际上,在一些示例性实施例中,如新闻广播等,视频中的人们相对静止,可以根据人们是否能看清嘴唇运动的程度对高清视频进行分类,在此可以使用唇读,以便更容易理解演讲。实际上,高清视频的这一概念可以是确定音频内容是否更容易听的一个因素。关注嘴唇是另一个因素。
在至少一些示例性实施例中,可以利用关于启用方法动作640并且因此使搜索用户界面能够实施本文中详述的教导的任何类型的转换。
也就是说,要注意到在一些示例性实施例中,不会执行方法动作630。实际上,要注意到在至少一些示例性实施例中,本文详述的一个或多个方法动作在某些方法中会特别执行和/或从本文详述的一个或多个其他方法动作结合中排除。在任何情况下,如图7所示,在格式标准化之后(还是在一些实施例中不必执行的方法动作的另一示例),某些摄取的数据并没有从言语转换为文本,或者更准确地说,方法动作640利用尚未从言语转换为文本数据而被部分地执行(尽管方法动作640的一些部分可以基于这种经转换的数据而被执行)。更具体而言,再次参考方法动作640,存在对经转换的数据和/或经摄取的数据进行分类和/或测量的动作,以从内容项目中提取过滤器属性(并且在备选的实施例中,方法动作640包括对基于非经摄取的格式(动作620被跳过,并使用原始被收集的数据)和/或基于未经转换的非经摄取的格式(还是,跳过动作620)的经转换的数据进行分类和/或测量。
参考图7可以看出,在一些示例性实施例中,语言复杂性分类器被用于测量/分类经转换的言语至文本。并且在示例性实施例中,语言分类器被用于测量/分类经转换的言语至文本。需要注意的是这些只是言语至文本可以被测量和/或被分类的多种方式中的两种。在示例性实施例中,只要一种方式在创建标签或分类或创建搜索用户界面的层次结构方面有实用价值的,至少在一些示例性实施例中,将言语至文本进行分类的任何方式都可以使用。
同样参考图7可以看出,在一些示例性实施例中,在方法动作640中利用了字率测量、性别分类、口音分类和/或背景声音分类/测量。在示例性实施例中,这是对一个或多个非经转换格式执行的,而在其他实施例中,也可以应用于经转换的格式。
还要注意虽然上述关于视频的示例性实施例是参照将视频转换为可以进行分析及分类的格式来进行的,但是在一些其他实施例中,视频格式没有被转换,方法动作640是基于原始视频执行的。在任何情况下,无论是在经转换的数据上还是在未转换的数据上,只要可以使用本文中详述的教导,任何执行方法动作640的方式可以在至少一些示例性实施例中使用。需要清楚说明的是,一些实施例明显地测量/分类或以其他方式分析经转换的数据,和一些实施例明显地测量/分类或以其他方式分析未转换的数据,和/或其组合,以及方法动作640。
方法600还包括方法动作650,该方法动作650包括存储经分类和/或经测量的数据。在示例性实施例中,其可以存储在诸如计算机存储器之类的存储器中,该存储器可以是如硬盘驱动器或集成电路存储器等。该存储器可以置于主机和/或在我的服务器上,该服务器可以通过因特网或以太网访问,也可以通过RF技术等访问。
方法动作650包括以可搜索的方式或以可被有效评估的方式存储数据,同时将数据存储在数据库中。
简要地说方法600或其至少一部分,可以视为确定音频内容的可访问性的方法。改善可用性涵盖改善产品设计、服务或环境,比起没有改善可用性的情况,能够更适合残障人士使用。则可用性这个通用词可以对应给定的产品服务或环境适合残障人士使用的级别。由此可推,对轮椅使用者而言,坡道比起楼梯更为可用。鉴于此概念,方法600的示例性实施例或至少其一部分,是旨在实现言语音频收听体验的伪设计,从而使内容适合听障人士。也就是说,在示例性实施例中,方法600的结果是基于适合听障人士的程度进行的数据的分类。例如,听障人士会觉得快速或复杂的语言,或不熟悉的口音或性别的言语更难懂。这些会被认为是不太适合或不适合的内容。
方法600的至少一些示例性实施例可以使用机器学习等来执行。可应用专家系统来优化搜索过程等,以便标识对实施本文中详述的教导有用的内容。以下将进行更详细的描述,在一些示例性实施例中,存在一些包括从接受者处接收反馈有关可理解内容的音频数据的难易程度的方法。在示例性实施例中,该反馈可用于训练机器学习进一步完善分类或标识对实施本文中详述的教导有用的内容。
在一些示例性实施例中,用于至少一部分执行方法600的系统类似于谷歌搜索引擎等。在这方面,至少一些本文中详述的教导可以用来执行谷歌搜索引擎的修改的算法。
鉴于上述,应注意的是在至少一些示例性实施例中,存储经分类/经测量的数据的动作包括:基于统计,仅存储听障人士可用的数据,以及消除或不存储听障人士不可用的数据。例如,方法600的算法可以消除快速或复杂的语言或带口音的语言。在这方面,在示例性实施例中,在方法动作640和方法动作650之间有这样一种方法动作,该方法动作包括评估经分类/经测量的数据并对该数据进行分类,或审核该数据以移除不可用内容,或相对于可用性较高的内容移除可用性较低的内容。对于各种测量和/或分类可能会有一个整体阈值级别,其会阻止该内容到达存储器/数据库级别。替代地,和/或除此之外,针对各种测量和/或分类可以存在滑动阈值,其会阻止内容到达存储器/数据库。在示例性实施例中,如果一个标准不满足阈值,则阻止内容到达数据库。在示例性实施例中,即使一个标准不满足阈值,如果其他标准超过阈值一定值,或者部分标准满足阈值而部分标准不满足阈值,则满足和/或超过阈值的标准数量满足给定值,那么即便内容在一个或多个区域中不足,该内容仍可到达数据库。
在至少一些示例性实施例中,可以在方法动作650之前使用任何分类或审查数据的制度或方式。
也就是说,在一些实施例中,提供较为不可用的内容可能具有实用价值。在这方面,有些人认为从长期效果而言,提供难以理解的(或至少相对难以理解的)音频内容可以提高接受者的听力能力,因为它能“锻炼”接受者。一个简单的例子是在抬高10°角的跑步机上跑步比0°角的跑步机更能锻炼人(减轻疲劳等)。因此,将更难理解的内容存储在数据库中是可行的。实际上,这在具备难易程度等级的搜索用户界面的实施例中很实用,其中在使用场景中,接受者可将等级一直加强至困难。此外,如以下示例性场景:一个只会说英语的人疯狂爱上了一个非英语口音很重的人,其在盎格鲁文化圈更为陌生(一种非浪漫语言,例如汉语或阿拉伯语)。而这个人恰好是一个听障人士,可能想听带汉语或阿拉伯语口音的内容,以便他或她可以通过练习来学习如何更好地去听懂他或她的一生挚爱。因此,对于提供被认为不需要存储在数据库中或听障人士不可用的内容具有实用价值。
由上可推在示例性实施例中,可以修改方法600以便主动寻找并且以其他方式找到这些可用性较低的音频内容。
此外,在一些备选的实施例中,存在改善可用性的设备、系统和/或方法。仅作为示例而非限定于此,在示例性实施例中,修改音频和/或音频-视频内容的音频数据,使得该内容相对于没有修改的情况,对于听力假体接受者而言可用性更高。例如,在一些示例性实施例中,数据被修改为使得音频文件的回放相对于在此示例性场景下未修改的情况下的音频文件的回放被减慢,从而降低字率。由此可推,这相当于面向非英语母语者讲话时,说英语的速度变慢。还应注意,在至少一些示例性实施例中,数据本身没有被修改,但是将数据呈现给接受者的设备修改了呈现。
在一些示例性场景中,去除了背景声音和/或背景噪声。在示例性实施例中,改善了信噪比。这些动作可以视为对数据的修改,或对数据呈现的修改,与以上详述减慢字率的实施例相伴。
另一个示例性实施例修改了性别和/或口音。在示例性实施例中,通过以下步骤执行:先将言语数据转换为文本后将文本转换为合成言语和/或让另一个人以对接受者更好的方式阅读该文本。也就是说,在一些实施例中,不一定存在言语至文本的转换。取决于技术和/或可用资源,也可能是言语到言语的转换。
在某些方面,本文中结合听力学和/或神经学与互联网搜索引擎结合的方法,其目的是使给定话题/话题对接受者而言是可用的,或者至少相对于在未使用本文中详述的教导的情况,使给定话题/话题更为可用。尽管两者并非互斥,但请注意这是与提高可用性略有不同的范例。可用性与增加给定事物的数量相对应,例如与给定话题相关的内容。可用性与让人们能更好访达该话题内某单独项相对应。举例来说,在示例性实施例中,通过添加字幕和/或调整内容的背景噪声增加可用性。进一步说明,在示例性实施例中,对比一般情况,通过降低音频内容传递的速度增加可用性。以下将更详细描述增加可用性的一些其他方法。
与此相反的是,在至少一些示例性实施例中,对可用性有不利影响的事物可用于增强训练。举例来说,在其他条件相同的情况下,可以在接受者已经熟悉的材料中移除字幕(例如曾听过的内容,或更准确地说曾看过的内容),从而加压或让内容更难以理解。本文的想法是在某些情况下,较难理解的言语可用于训练目的,以提高接受者理解此类言语的能力,前提是该言语并没有难以理解到导致接受者放弃或对此类训练失去希望。
应当注意的是,当对比未使用本文中详述的教导,对内容的理解,确切地说是内容的音频数据的理解更佳时,本文中详述的教导可用于标识内容。关于至少一些示例性实施例的想法是如果内容更有趣或者内容是接受者感兴趣的,则接受者将更愿意参与或继续接受训练。因此,标识内容具有实用价值,让这些内容即是接受者感兴趣的,又包括能满足理解能力的最小阈值的声音数据。准确而言,如果接受者无法充分理解内容的声音数据,则接受者不太愿意继续训练或训练足够时长。
表征至少一些示例性实施例的另一种方式是标识包括满足某些可听性要求的音频数据的内容。可听性“级别”的指标可从上述语言属性和/或音频属性中得出。总体而言,在至少一些示例性实施例中,所有上述语言特性和/或音频特性相结合以确立给定内容的给定音频数据的可听性水平。就这一点而言,在示例性实施例中,存在一种方法动作,该方法动作包括确立可听性标准,和/或确立各个可听性级别的各标准,以及一种方法动作,该方法动作包括标识具有对应于一个或多个可听性级别的音频数据的内容。根据接受者在听力过程中所处的位置和/或接受者进行更艰苦训练的意愿,将具有给定可听性级别的音频数据的内容提供给接受者,其构思是根据具有接受者的精神状态和/或接受者的康复和/或恢复水平匹配可听性水平,相对于未使用本文中详述的教导的情况,接受者会继续从事训练/再训练。
在至少一些示例性实施例中使用的本文中详述的教导中有实用价值的内容,可以使用任意设备、系统和/或方法来评估其可听性。可以使用其任何度量,或其他任何在标识内容方面具有实用价值的度量,而用于标识的内容是可帮助耳蜗植入物接受者(或任何其他听力假体接受者)康复和/或恢复的内容。仅作为示例而非限定于此,评估言语速度、和/或单词和/或句子之间的停顿数、和/或发声等,具有实用价值。如果言语速度较慢,和/或停顿次数相对较多,则内容更容易被理解,并且该内容会被标识为对康复和/或恢复实用的内容。(相反,在对接受者施加压力或提出挑战的实施例中,使用言语速度较快及停顿频率较少的话题内容具有实用价值)。由此可推,在至少一些示例性实施例中,修改内容以降低语速和/或插入有意义的停顿以增强可听性具有实用价值。还应注意的是在至少一些示例性实施例中,内容会被评估该内容是否为符合对话的,与演讲或新闻广播相反的内容。就这一点而言,在示例性实施例中,对话有时比以字母要素呈现的内容容易听。因此,实施例可以包括标识更多对话且更少演讲的内容并提供这些内容给接受者。当然,要注意的是,可用于总体评估中的特征中的任何一个用以评估内容整体的可听性,从而确定该内容对接受者的康复和/或恢复是否具有实用效果。
此外,在至少一些示例性实施例中可评估其他特征,例如口语特有的,会影响语言处理的特征。举例来说,诸如重音、语调等韵律特征可用作评估过程的一部分,以确定或标识对康复和/或恢复具有实用价值的内容。还应注意在至少一些其内容被修改的示例性实施例中,可以修改某些单词和/或短语来产生这些韵律特征。还请注意,在至少一些示例性实施例中,诸如停顿、重复等非流利性特征可用于评估可用内容的可听性。与一些实施例一致,还可以修改内容以添加这些停顿和/或包括重复。就这一点而言,在至少一些示例性实施例中,可以通过操控内容来提供具有该重复和/或停顿的内容。
在一个示例性实施例中,至少可以在一些示例性实施例中使用预测句子可听性的自动方法。仅作为示例而非限制,在Kotani(Katsunori Kotani,Shota Ueda,TakehikoYoshimi,Hiroaki Nanjo,2014年,“自适应计算机辅助语言学习和教学系统的可听性测量方法”,第28届亚太语言、信息与计算会议论文集,第387-394页)中的详述配置和/或其变化可以用于至少一些示例性实施例中。在至少一些示例性实施例中,使用自然语言处理(NLP)测量口语文本难度的系统方法至少可以用于一些示例性实施例中。注意,在至少一些示例性实施例中,可听性基于逐句分析和/或可以基于多句分析产生。这些是自动执行的。也就是说,在一些备选的实施例中,“即时”分析通过手动操作或基于耳蜗植入物使用者的输入/反馈安排进行,这些用户先前使用了属于康复和/或恢复机制一部分内容。
在至少一些示例性实施例中,与口语文本的感知难度相关联的语言特征,例如基于研究的经验结果,被用于至少一些示例性实施例中评估内容的可听性。至少有些算法使用一个或两个或三个或四个或五个维度进行测量。仅作为示例而非限定于此,在至少一些示例性实施例中,对预测内容可收性有实用价值的算法会使用声学维度、词汇维度、语法维度和/或语篇维度。该算法可在这些维度的一个或多个分析内容,并针对内容的可听性制定评分或其他度量标准。基于此,可向接受者提供与其所需相应的可听性的内容。
仅作为示例而非限定于此,在声学维度,在一些实施例中可以评估每秒单词速度的语速。此外,还可以评估每个单词的沉默数,评估语块的平均偏差,评估重音音节之间的平均间隔(秒),和/或内部持续时间的变化。在示例性实施例中,这些与相对于可听性的人类平均难度等级等相关。在词汇方面,在一个示例性实施例中,评估每个子句的名词搭配数,评估标型比率,评估低频词的归一化频率和/或平均词类频率,相对可听性,可再次建立一个与相对于可听性的人类平均难度等级的相关性。在语法方面,评估每个句子的平均单词数,评估长句数量,评估标准化句子的数量,其一个或多个都可与相对于可听性的人类平均难度等级相关。
再次,在一些实施例中评估音频内容的流畅性。在这方面,特征可以衡量言语流的流畅程度。例如评估没有非流利性语块的语速和平均长度。可计算停顿的次数或停顿的类型。例如,捕捉静默停顿和言语的特征,例如每个单词的静默停顿的持续时间、静默停顿持续时间的平均值以及长静默停顿的数量。此外,还可以评估韵律特征。例如,一些特征可测量言语的节奏和/或持续时间的变化。仅作为示例而非限定于此,可评估重音音节之间的平均间隔和/或重读音节的相对频率。以上所有或其中任何一个都是上述和一些实施例中的一些可与关联可听性的经验和/或统计数据进行比较,以评估给定音频内容的可听性程度。为了实现本文中详述的教导,可以对其进行比较。
应注意到在至少一些示例性实施例中,一种自动系统和/或方法,和/或Su-YoonYoon,Yeonsuk Cho,Diane Napolitano在“使用语言特征的口语文本难度预测”(第11届针对建立教育应用的LP的创新用途工作坊会议论文集,第267-276页,加州圣地亚哥,2016年6月16日)中详述或使用的系统和/或方法,可应用于至少一些示例性实施例中,以确定或以其他方式评估给定内容的可听性,并确定其在康复和/或恢复方面的实用价值。
明确地说,在至少一些示例性实施例的设备、系统和/或方法,用以实现一个或多个本文中详述的教导,并是与评估内容可听性,及用于确定内容是否应提供给接受者相关的。还应注意到,在至少一些示例性实施例中的设备、系统和/或方法用于修改或以其他方式改变内容以增加可听性,或通过修改关于一个或多个本文详述的上述可听性特征的内容来降低可收听性的,如技术能实现。
接着将描述更多的实施例。
图8呈现了示例性方法即方法800的示例性算法,该方法是一种提高听力假体的接受者利用听力假体聆听的能力的方法。简而言之,相对于其他内容,诸如耳蜗植入物的听力假体的接受者在收听特定内容方面可能有困难。举一个类似的例子,如果我们能在任何指定时间设置一台有100个频道的有线电视,那可能只有5个或10个或20个甚至少于5个频道正在显示具有音频数据的内容,是耳蜗植入物的新接受者(例如在过去一年内安装耳蜗植入物的人)能够合理理解或以其他方式通过听力范式使用,其中听力范式是对接受者完全没有负担和/或跟随且理解其意思的方式。方法权利要求800的类比是从100个频道中标识10个或20个内容项目,但是在方法800中不只限于这100个频道,反而在一些实施例中可以是对接受者公开可用的所有可能的内容(无论是免费的还是通过购买或订阅等获得的)。(同样,我们通过类比来建立一个框架,在这个框架中100个频道类比世界上所有可用的内容)。
如此一来方法800包括方法动作810,其包括获取指示内容的第一特性的数据,其中内容是音频内容或音频视觉内容;内容的第一特性可以是内容的一个或多个语言属性和/或一个或多个音频属性。下文描述一些更具体的例子。仍参照图8,方法800还包括方法动作820,其包括获取指示内容的第二特性的数据。在这个示例性实施例中,内容的第二特性可以是接受者(或看护者或帮助接受者更好地收听或以其他方式发挥该作用的人——可以是接受者的父母或接受者的重要人士或医疗保健专业人员——需要说明清楚的是实施例包括了例如父母等标识第一特性和第二特性并利用或执行方法800将此提供给医疗保健专业人员或服务提供商)期望的内容话题或内容类型或内容主旨(这些可以非互斥)。
方法800还包括方法动作830,其包括基于第一特性和第二特性标识具体内容。如下文将更详述以及如上所述内容,在一些实施例中有基于收听属性开发的分类音频和/或音频视觉内容的数据库。在方法动作830的示例性实施例中,第一特性和第二特性用于标识分类音频和/或音频视觉内容的子集。也就是说,如下文描述,在一些实施例中,方法动作830通过实时或半实时分析内容来执行,用以标识内容的特征并将内容与第一数据和第二数据进行比较以获取具体内容。
在一些实施例中,具体内容可以是一个或多个内容项目。在多于一个的内容项目的情况下,会向接受者提供列表,其中,在一些实施例中,该列表可以基于一些数据特征而分层。例如,首要性可以被赋予给对接受者来说比其他特征更重要的(一个或多个)特征。在示例性实施例中,我们可以说具体内容项目1到10被标识为满足预定标准。如果项目8、项目7和项目3具有最低字率,则在列表中可首先列出。如果项目3和项目4被标识为具有与对接受者重要的性别相关联的言语,则可以列出这些项目(如果这是第二重要的特征——在一些实施例中,如果这两者交叠,则可以首先列出该具体内容项目)。然后可列出性别不确定的项目,最后列出与可能提供的所需不同的性别的项目。
在至少一些示例性实施例中,可以利用对经标识的具体内容进行分类的任何设备、系统和/或方法。
方法800包括方法动作840,其包括使用具体内容的至少一个项目以及听力假体,以使接受者中的听力感知基于具体内容的至少一个项目而被诱发。仅作为示例而非限定于此,在示例性实施例中,接受者可以查找具体内容项目。例如,接受者可以去内容服务提供商并下载或以其他方式访问与方法动作830引起的具体内容项目相对应的电影。可替代地,可针对有线电视系统和/或卫星电视系统和/或卫星音乐系统等上已上架节目或将上架节目执行该方法,或所标识的具体内容可以对应于在特定频道上呈现的相对应的素材,而不是其他特定频道的素材。
在方法800的一些实施例中,与必须经由单独的动作肯定地访问内容相反,具体内容经由网络访问系统或经由电子邮件等被直接提供给接受者,包括被自动地直接提供给接受者。实际上,在一些实施例中,接受者的音频设备和/或音频视觉设备可以自动获取内容或以其他方式切换频道以访问该内容。
然而应注意在最广泛意义上,方法800中不需要内容服务提供商与接受者或执行该方法者交互。实际上在示例性实施例中,内容可以由接受者或用户预先获取(例如接受者可以具有包含1000张DVD的库,或内容的电子文件等)。该方法可专门定制为从用户当前拥有或可以其他方式访问的内容中标识内容。实际上在示例性实施例中,本文中详述的教导可以执行并随着时间创建一个库,接受者可以重看或重听库中的内容,其中具体内容可以根据方法800进行标识。
在示例性实施例中第一特性是与声音相关的特性。伴随上述详细的教导,声音相关特性可以是字率、性别、口音、语言复杂性和/或背景声音特性。在实现本文详述的教导方面具有实用价值的任何其他声音相关特性可以用于至少一些示例性实施例中。此外应注意方法800不限于单一声音特性。在示例性实施例中,某些情况下,可以在方法800的实施方式中获取上述所有五个特性。
在示例性实施例中第二特性是内容话题特性。仅作为示例而非限定于此,如上所述,该话题可以是神秘故事、爱情故事、动作、戏剧、喜剧等。内容话题也可以是声乐、纪录片、幻想等。内容话题可以是新闻、体育、天气预报等。第二特性可以是有关实质性内容(与例如声音内容相反)的任何特性,该内容是接受者和/或用户感兴趣的。
在示例性实施例中,第一特性是以下中的一项:语言复杂性、语言特性、字率、说话者的性别、说话者的口音或背景噪音特性。然而,需要注意的是,第一特性并不局限于这些特性。
同样,如上所述,在一些示例性实施例中可获取多于一个的第一特性。在这方面,图9包括示例性方法,方法900,其包括方法动作910,方法动作910包括执行方法800。方法900还包括方法动作920,其包括获取指示具体内容的另外的一个或多个第一特性的数据。值得注意的是方法动作920可以在完全执行方法动作800前执行。在这方面值得注意的是,除非另外指明,至少一些示例性实施例包括这样的实施例:如技术允许则可实施,本文公开的任一方法动作可以相对于本文公开的其他任一方法动作以任意顺序被执行。
仍然关于方法900,在示例性实施例中,多个第一特性包括上述特性中的任何一个或多个。
值得注意的是在一些示例性实施例中,前述第一特性不一定是开放式限制。例如,在使用字率等的场景中,可以有上限和下限。例如,字率的上限中的下限可以与之同时应用。
如上所述,在一些示例性实施例中,可以通过提供聚合上述各种声音特性中的一些的单个输入选项来精简或以其他方式简化用户体验。在此,在示例性实施例中,第一特性可以是易听度特性。如下更详细描述所示,通过滑动虚拟按钮从容易到困难,该特性可以被输入到用于实施方法800的设备中,例如在图5的GUI屏幕所示。在示例性实施例中,该特性可以是绝对的特性,其本身是基于标准并是有意义的,而在其他实施例中,该特性可以是两个或多个声音特性以加权方式的某种形式的合并。举例来说,低字率、无口音(相较于接受者的母语)、低语言复杂性、低背景声音特性的内容可以被归为容易的特性,而与这些相反的内容被归为困难的特性。更准确地说,实际上在某些情况下,关于获取指示第一特性的数据的动作,第一特性可以是容易的,而所提供的内容可以是具有低语言复杂性、低背景声音特性、低字率和无口音的内容。虽然这不一定会标识为容易,但当接收到易听度的第一特性且第一特性是收听容易时,进行标识的算法会应用这些定性符。与之相反的场景是当接收到易听度的第一特性且第一特性是收听困难。此外还应注意到在一些实施例中,可存在针对多个交错中间地带的中间地带。
依旧是当第一特性可以是易听度特性,虽然以下不限于此实施例,但是在示例性实施例中,方法800还包括将第一特性与基于统计的定性符相关联的动作,其中定性符基于统计数据,统计数据指示具有听力假体和/或接受者的人口统计特性的人将能够理解具体内容中的言语。仅作为示例而非限定于此,随着时间的推移,可以基于来自接受者或来自与接受者相关联的人的反馈,或者另外基于可以与可量化和/或(一个或多个)可量化特性相关的简档数据(例如,一个内容项目相对于同一话题中的其他内容项目的使用次数等)来开发数据集。因此,当接受者输入他或她想要有一个中间地带易听度内容项目时,可以基于统计汇编的质量和/或数量来标识具体内容。仅作为示例而非限定于此,如果数据指示电影“星球大战”收听困难(例如带有很多背景噪音——其典型是激光枪射击和太空船的噪音,以及被称为伍基人的高大生物所发出的嚎叫可能会被混淆标识为说话),那么电影“星球大战”将被归类为收听困难的内容项目。“绿野仙踪”可能是一个中间地带易听度项目(一开始芒奇金人的高音可能会造成收听困难,但至少数字重制版中,其他时候对话相对简单——确实实施例中,比起原始版本,会优先推送接受者数字重制版)。电影“荒岛余生”则可能是一个收听容易内容,考虑到其中对话是有限的(相对地)且精确而缓慢的,并且说话者的声音都极好。另一部可能符合收听容易标准的电影是“火星救援”,或许与电影“荒岛余生”的原因相似。观看这些电影的听力假体使用者们可提供反馈,使得与这些电影相关的统计数据得以应用。另一方面,这些电影可通过专业人士和/或自动化系统进行分析。
还要注意在示例性实施例中可以使用附加的定性符。例如,定性符可以剔除脏话或暴力等和/或定性符可以指示内容所适合的年龄段。在这方面,虽然电影“火星救援”可能是一部收听容易的电影,但一些特定语言可能会从结果中将电影剔除。
图10呈现了用于示例性方法的另一个示例性算法,方法1000,其包括方法动作1010,方法动作1010包括电子地接收第一输入,第一输入指示听力假体的接受者需要的媒体内容。在示例性实施例中,第一输入可通过例如上述智能手机510或经由如个人计算机等另一个设备来接收。也就是说,第一输入可通过电话以音频信号等来接收。方法1000还包括方法动作1020,其包括向接受者提供基于接收的第一输入的一个或多个话题项目选择,这可以在至少一些示例性实施例中电子地执行。方法1000还包括方法动作1030,使用与被提供的一个或多个话题选择相对应的、消费者容易可用的媒体内容,训练或再训练耳蜗植入物的接受者来利用假体识别和/或区别声音,其中相对于缺失第一输入的情况,训练或再训练提高训练依从性。就这一点而言,在方法1000的示例性实施例中,通过向接受者倾斜或有目的地向接受者提供由一方所识别的话题项目选择,来执行向接收者提供一个或多个话题项目选择的动作,该一方是执行提供有助于提高训练依从性的动作的一方,和/或相对于可能提供的其他可能项目以相对容易听到的方式执行动作的一方。实际上,在示例性实施例中,上述统计数据库可用于标识响应于接受者的关于所需媒体内容的输入而提供给接受者的项目。在示例性实施例中,如果接受者需要戏剧内容,则执行提供动作的一方可以提供还包括字幕的戏剧话题电影。在示例性实施例中,如果接受者需要获取教育媒体内容,则执行提供动作的执行者可以从Ted演讲中选取提供项目,这些项目可以是带字幕的。在这方面,基于经验/统计数据,执行方法动作1020的执行者将会认为,这些项目相对于没有字幕的项目更为有助于提高训练机制的依从性。因此,执行方法动作1020的执行者提供了与其他项目相反的这些项目。
鉴于上述可以理解,在至少一些示例性实施例中,存在提供康复和/或恢复依从性的方法,在示例性实施例中,这些方法是为接受者提供可使他们更愿意继续训练的内容,以激励依从性。更愿意继续训练是相对于其他情况而言。如下更详细描述的,在一些实施例中,实施例可以包括操控整个声音场景以激励依从性。
图11呈现了示例性方法(方法1100)的示例性流程图。方法1100包括方法动作1110,其包括执行方法1000。方法1100还包括方法动作1120,其包括电子地接收第二输入,第二输入指示接受者理解言语的能力、和/或指示接受者基于由听力假体诱发的听力感知利用听力假体来聆听的能力。如上所述,本文中的方法动作可与其他方法动作交错,且流程图不一定需要时间顺序,否则将基于自上而下读取来指示。就此而言,在示例性实施例中,当结合方法动作1020执行方法1000时(即,当执行方法1100时),可以在方法动作1020之前执行方法动作1120。
需要注意的是,方法动作1120可以通过接收上述数据中的任何一个或多个来执行,例如字率、性别、重音、语言复杂性和/或背景音特性。这些均指示了接受者理解言语的能力和/或接受者通过听力假体收听的能力,尽管这些可能被视为与之相关的潜在变量。在一些替代实施例中,第二输入还可以仅仅简单是描述接受者的收听和/或理解的能力,即理解例如1到10的范围,或例如可怕的、差的、公平的、好的、优秀的和近乎完美等的能力。可用于实施方法动作1100的任何定性指标和/或定量指标都可以应用在至少一些示例性实施例中。
图12呈现了示例性方法的另一个示例性算法,方法1200。方法1200包括方法动作1210,其中包括执行方法1100。方法动作1200还包括方法动作1220,其包括将第二输入与指示与一个或多个话题项目选择相关联的媒体内容中的言语的易理解度的数据进行比较;这一指示言语理解难易度的数据还可以是字率、性别和/或口音等。本文详述的任何特征都是可用的。相反,数据可以基于上述统计分析和/或两者的组合。在示例性实施例中,可以通过计算机来进行比较,该计算机可在数据库等中搜索满足或以其他方式对应于第二输入数据的内容。
方法1200还包括方法动作1230,其包括基于比较选择一个或多个话题项目选择。在方法1200的示例性实施例中,所提供的一个或多个话题项目选择对应于经选择的一个或多个话题项目选择。
需要注意的是,方法1000和/或1100和/或1200或本文详述的任何其他方法中至少是由接受者之外的一方执行,可以针对多个不同的听力假体接受者执行。在示例性实施例中,方法1100可为如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个接受者执行。在示例性实施例中,方法1000、1100和/或1200或本文中详述的任何其他方法可为N个接受者执行,其中N是1到1000000之间的任何整数值或以整数位增量值的任何值或值范围(如:77、745、987、111、4444到340991、10000到100000等)。在一些实施例中,N也可以是更大的值。在示例性实施例中,其中可为N个不同的接受者和/或N次(包括对给定的接受者执行多次)执行所述方法,对比统计上没有(方法1100和/或1200的)相应的第二输入的情况,训练依从性至少能提高平均X%(平均值、中间值和/或众数),其中X是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、80、90、100、120、140、160、180,200、225、250、275、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1100、1200、1300、1400、1500、1750、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000、10000、12500、15000、17500或20000,或以1为增量的任何值或值范围(在一些实施例中,X可以是更大的值)。值得注意的是训练依从性是同类比较的评估。换句话说,主观和/或客观标准是可被创建的或已经存在的,并且可以相应地对依从性进行评分。依从性可基于时间测量(例如接受者参加训练的时长)、定量测量(接受者参加训练的次数)、定性测量(接受者是否真的参加了训练,或只是进行动作)等等,在至少一些示例性实施例中使用可用于测量依从性的任何标记。
与上面详述的教导相一致,本文中详述的一些实施例旨在从媒体内容库中审核或以其他方式剔除媒体内容,以获得剩余的更有助于训练或耳蜗植入物使用者的听力理解的媒体内容。就此而言,在示例性实施例中,与所需媒体内容相对应的可获得的媒体内容相对,使得至少Y%的内容不适合用于训练,其中Y可以是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40,45、50、55、60、65、70、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99(或更大)。此外,在示例性实施例中,本文详述的适用于这些值的任何方法使得该方法还包括:从所提供的一个或多个话题选择中审核至少Y%的大部分,其中被审查的部分可以是Y的全部或一部分(Y被审查的百分比可以是Z%,其中Z可以是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99)。
在方法1000的变化中,有一种方法,其包括电子地接收第二输入,第二输入指示接受者付出努力以收听需要的媒体内容的意愿,其中向接受者提供一个或多个选择的动作还基于第二输入。在这方面,在示例性实施例中,接收指示接受者付出努力来收听的意愿的输入的动作,可以对应于接受者滑动智能手机510上难易程度条的结果,且所产生的输入通过电子传送到执行者执行方法1000时所在的远程位置。由此可推,在示例性实施例中,接收指示接受者付出努力来收听的意愿的输入的动作,可以对应于接受者和输入关于上述变量(例如字率、性别、重音等)中的任何一个或多个的数据的结果。这里的想法是,在某些情况下接受者可能愿意执行更密集的训练机制,因此愿意尝试收听精神压力更大或更难理解的音频内容,以努力提高他或她通过耳蜗植入物的听力能力。在其他情况下,接受者可能不愿意执行高强度的训练机制,而在其他情况下,可能只是出于与训练无关的原因而想轻松地收听音频内容。这样的特征可以使接受者能够简化输入,并且能够实现接受者能简单使用的相对简单的实施例。
更进一步,刚才提到的方法1000的一些示例性实施例可以选择性地包括或取代关于意愿的特征,该特征具有指示接受者通过听力假体收听的能力。因此,在示例性实施例中,方法1000的变化包括电子地接收第二输入,第二输入指示接受者付出努力以收听需要的媒体内容的意愿,和/或电子地接收第三输入,第三输入指示接受者利用听力假体聆听的能力,对于后者,这不一定与接受者努力收听的意愿有关,而是一个指示接受者目前使用耳蜗植入物听力能力的因素。这可能是一个指示接受者听力进程的进度点的因素。这可以与定性和/或定量的和/或与统计数据集相关。在任何情况下,在该方法的示例性实施例中,向接受者提供一个或多个选择的动作还分别基于第二输入和/或第三输入,以及伴随图4中元件440的存储特征,话题项目选择被预存储在数据库中,并且利用指示符被分类,指示符与接受者付出努力以收听的意愿相关、和/或与接受者利用听力假体聆听的能力相关。在一个示例性实施例中,自动化系统,例如比较输入数据的指标与数据库或其他市售数据库中的单个项目相关标记数据的指标的算法,可被用于实施或以其他方式实现本文中详述的教导,可用于比较第二输入和/或第三输入,即基于第二输入和/或第三输入(以及在一些实施例中的第一输入)的数据与数据库中的标签进行比较,以标识最终将提供给接受者的项。
与上文详述的教导一致,方法1000或本文详述的任何方法中的训练或再训练可以包括针对训练的具体目的收听媒体内容,而不是为了例如享乐、教育、娱乐等其他目的收听媒体内容。实际上,本文的实施例旨在为单一目的提供内容,单一目的是训练接受者长期更好地聆听,其中本文的教导被利用以标识内容,该内容将提高相对于其他情况的训练依从性,例如,因为接受者对内容更感兴趣或者内容对接受者的侮辱或激怒更少。实际上,关于后者,在一些示例性实施例中,可以收集关于实质性内容的数据,并且可用作审核媒体内容范围的附加因素。例如,有观众认为包含“粗俗”内容的喜剧可随之被标识出来,接受者可以提供指示此类喜剧应被剔除的数据。暴力、成人话题、愚蠢情节等因素都可以编辑,这些附加信息可以在审核过程中使用,以为提供给接受者的项目剔除(或添加)内容。
如上所述,在一些示例性实施例中,在训练期间为接受者提供挑战具有实用价值。也就是说,为实现增强或扩展接受者听力能力的目的,为接受者提供比其他媒体内容更困难收听的音频媒体内容具有实用价值。这类似于长跑训练等,即完成更长距离的跑步或负重跑,或跑山或在跑步机上增加坡度等。在这方面,在一个示例性实施例中,可以存在诸如图13的算法所呈现的示例性方法,其代表了方法1300的算法,其包括方法动作1310,方法动作1310包括执行方法1000。方法1300还包括方法动作1320,方法动作1320包括电子地接收第二输入的动作,第二输入指示接受者利用听力假体聆听的能力。方法1300还包括方法动作1330,其包括将第二输入与指示与一个或多个话题选择相关联的媒体内容中的言语的易理解度的数据进行比较。在这方面,同样,本文详述的任何编目和/或数据库管理技术,或其他任何可实现此方法动作的方式可使用于至少一些示例性实施例中。图13还呈现了方法动作1340,其包括标识高于接受者的聆听的能力的媒体内容。在示例性实施例中,该基准基于从具统计意义人口中获得的统计数据,并且包括接受者的特定人口统计细节。这里的想法是执行者会标识那些对接受者增大负担或以其他方式给接受者压力的内容,超出了提供的内容是在接受者舒适范围内的情况。也就是说,在至少一些该方法的示例性变化中,还会标识出所使用的在接受者当前听力能力之上的等级或数量或其他定量和/或定性因素,并且对可用内容设定限制,从而不会提供不太困难的内容。在这方面,提供太难的内容可能会阻碍接受者参加训练机制,或者使接受者过快地疲倦,从而导致训练无法达到其该有的效果。
方法1300还包括方法动作1350,其包括基于标识选择一个或多个话题选择。在方法1300的示例性实施例中,所提供的一个或多个话题选择对应所选话题选择,训练或再训练可提高训练依从性,相对于如超出接受者的听力能力范围的媒体内容无需标识就可以被接受者获取时的情况。在示例性实施例中,相对于没有标识时统计的情况,依从性平均(平均值、中间值和/或众数)至少提高X%。
应注意至少一些示例性实施例可关注接受者的听力损失的具体特征。仅作为示例而非限定于此,某些听力损失的特征是频率范围和/或一段时间长度的听力损失和/或接受者是否曾经有过听力等。在这方面,在方法1000的示例性变化中存在附加动作,该动作是电子地接收第二输入,第二输入指示接受者的听力损失的特征,其中向接受者提供一个或多个选择的动作还基于第二输入,且话题项目选择被预存储在数据库中,并且利用指示符被分类,指示符与接受者的听力损失的特征相关。
需要注意的是本文中详述的任何方法也可以结合以下动作来执行。在示例性实施例中的动作是当完成标识动作时,自动以电子地传送和/或显示,作为本文详述的方法的结果而标识的任何一个或多个或所有所标识的具体内容/内容项目。在这方面在至少一些实施例中,本公开的任何标识动作,与执行算法的公开相对应,其中该算法比较第一数据集和其他数据集(例如,前者可以是基于输入的数据,而后者可以是与数据库相关联的数据),在确定数据匹配或满足预先确定的要求时,执行标识动作(而如果数据不匹配或不满足预先确定的要求,则不执行标识动作)。同样在一些实施例中,在标识的动作中,设备和/或系统配置为自动显示或传送(例如以电子地)所标识的内容,例如将数据传送给用户或接受者等。在一些示例性实施例中,本文详述的设备和/或系统配置为自动显示内容和/或向接受者提供一个执行某操作的指示,例如滑动按钮或提供命令等,内容将被显示或至少被下载。
在这方面,关于本文详述的方法动作设计以电子地接收指示助听器的所需媒体内容的第一输入,并基于接收到的第一输入向接受者提供一个或多个话题项目选择,中间动作包括刚刚详述的标识动作,其包括执行各种数据项的比较,其中,向接收器提供一个或多个话题项目选择的动作可以在相互关联的数据项上执行,并且如果数据项相互不关联,则不执行向接受者提供一个或多个话题项的操作。
此外如本文将指出的,一些实施例包括搜索音频内容和/或音频视觉内容并标识这些内容,以及评估所标识的内容的动作。在示例性实施例中,评估动作可基于比较两个数据集触发。在示例性实施例中,系统配置为在标识内容时自动评估内容。在示例性实施例中,用于控制的算法可以使用逻辑树等,其中如果所标识的内容满足特定标准,则自动执行分析,并且如果所标识的标准不满足准则,则不自动执行分析。
在这方面,应注意到与可在设备和/或系统上执行的方法动作相关的本文中的任何方法动作,都对应由计算机或配置为执行该方法动作的机器所执行的自动方法动作。在示例性实施例中,这些计算机和/或机器包括逻辑电路,用以评估是否存在特定的预先确定的因素,如存在则自动执行该方法,如不存在则不执行该方法。例如,从内容到文本的音频数据自动转换会在例如确定音频内容是某种语言时执行,并且如确定音频内容是另一种语言和/或以不是某种预先确定的语言中的一种或多种时,则不执行。
任何所提供的本文详述指示符是使用算法等时自动提供的,其中该算法等使用了逻辑树,其中如数据与其他数据关联,则自动提供指示符,如数据与其他数据不关联,则不自动提供指示符。任何本文详述的评估过程亦然,其中当执行逻辑算法,如果逻辑算法指示评估应该自动执行时,则在一些实施例中可自动执行。
与上述关于训练和/或再训练的话题一致,在示例性实施例中,存在一个训练系统(包括再训练系统),例如图14概念性呈现的系统1410,在一个实施例中该系统可以是听力假体训练系统,其包括第一子系统1420,被配置为接收第一输入,第一输入指示听力假体的接受者需要的音频内容和/或音频视觉内容,以及接收第二输入,第二输入指示接受者的特征,特征与接受者的感官状态和/或精神状态有关。感官状态则可对应一个有听力障碍的接受者。也就是说,在一些不限于听力假体的训练系统实施例中,例如视网膜植入物的训练系统等,感官状态可指是视觉障碍。精神状态则可指疲劳状态等,或指示接受者参加训练等意愿的状态。在这方面,最终提供的内容会被审核,以便提供被精简的内容,其中精简内容是为使内容比起没有这种输入的情况,更适合接受者相对于这些状态其一或两者。
在示例性实施例中,第一子系统对应于上文详述的智能手机510。在示例性实施例中,第一子系统可以对应于个人计算机等。在示例性实施例中,第一子系统可以是通过因特网或经由陆地线路或经由无线系统等接收输入的远程服务器等。在这方面,第一子系统不明确限于设备由接受者或与接受者有关联的人持有或以其他方式直接占有的物品。然而,与第一子系统是智能手机或计算机等的实施例一致,在示例性实施例中,第一子系统是具有GUI的便携式电子设备,并且GUI包括用于第一输入的至少一个数据录入点和用于第二输入的至少一个数据录入点。这可以对应于或以其他方式类似于智能手机等上的任何数据录入点。此外,在示例性实施例中,其中第一子系统是具备GUI的便携式电子设备,GUI包括至少一个用于第一输入的数据录入点和至少一个用于第二输入的数据录入点。还有在至少一些示例性实施例中,第一子系统被配置为向接受者提供输出,该输出指示被标识的媒体内容。例如,GUI可显示通过对输入的数据执行本文详述方法后标识的电影标题等。
在示例性实施例中,训练系统包括黑盒1430呈现的第二子系统,其配置为基于第一输入和第二输入标识媒体内容。在示例性实施例中,第二子系统可以是通过连接999(因特网、电话等)和第一子系统相互通信的远程设备,而在另一示例性实施例中,第一子系统和第二子系统是同一设备的部分,如图15所描绘(参考1510指示系统,参考1520指示第一子系统,参考1530指示第三子系统)。在示例性实施例中,第一子系统和/或第二子系统可以是计算设备,其包括存储器或其他被配置成访问源数据以实现本文中详述的教导。第一子系统和/或第二子系统与处理器和/或微处理器或任何其他可实施本文中详述的教导的电子自动设备相关。在一些实施例中,子系统还可以是通用计算机和/或选用了为实现本文中详述的教导的软件和/或固件和/或硬件的专用计算机。
在示例性实施例中,第二子系统配置为访问表示媒体内容项目的数据库(例如,上述音频内容索引,或者在实现本文中详述的教导中具有实用价值的其他任何数据库)。另外,第二子系统配置为基于第一输入和第二输入从数据库中标识一个或多个媒体内容项目,其中标识的动作对应于标识媒体内容的动作。
以下将描述该系统的一些附加细节。
在示例性实施例中,感官状态是接受者理解言语和/或基于听力假体诱发听力感知后通过听力假体收听的能力的状态(或例如,接受者理解光线和/或基于视力假体诱发视觉感知后通过视力假体看光线的能力的状态,其中第一子系统配置为接收指示视力假体接受者所需视觉内容的第一输入和接收指示与接受者的感官状态和/或精神状态有关的接受者特征的第二输入,且第二子系统配置为上述)。
精神状态是接受者进行收听和/或理解所听内容的渴望/愿望的状态(或努力看和/或理解所看内容)。再次,这与本文中详述的教导的至少一些实施例中的目标之一相伴而生,即提高对训练机制的依从性。在这方面尝试调整训练的难度/调整训练对接受者所施加压力,以适应他或她参加的意愿是具有实用价值的。
如上方图6和图7,需要再次注意的是,一些实施例包括方法、设备和算法,其用于为实现听力假体训练目去挑选适用内容,或者从内容的范围中挑选适用于听力假体接受者收听容易程度的内容。在这方面,图16呈现了示例性方法(方法1600)的示例性流程图,该方法是标识听力假体接受者利用音频内容的方法。该方法包括方法动作1610,其包括搜索音频和/或音频视觉内容,并且标识音频和/或音频视觉内容。这可以根据上述搜索设备的系统和/或方法或任何可用于实现的方式来执行。在示例性实施例中,搜索可以是基于万维网的搜索和/或基于内容服务提供商的数据库的搜索和/或基于电视网络等提供的节目的搜索。
方法1600还包括方法动作1620,其包括评估被标识的内容,其中评估内容的动作针对语言属性和/或音频属性评估内容。评估与本文所述任何评估和/或其变化相对应。在示例性实施例中,可评估内容的语言复杂性。语言分类可用于标识与音频内容相关联的语言类型。可评估内容的字率。可根据说话人的性别和/或说话人的口音评估内容。此外,还可以评估背景声音。基于所有这些评估中的一个或多个或所有,按照本文中详述的教导可直接或间接地向接受者提供标识内容的子集。
在任何情况下,在示例性实施例中,方法动作1610可以包括对万维网上的内容执行基于计算机的搜索例程的操作。
图17展示了用于示例性方法的另一个示例性算法,方法1700包括上述方法动作1610和1620,以及方法动作1730。方法动作1730包括将内容的音频数据自动转换为文本。在本实施例的一个示例性实施例中,评估被标识的内容的动作包括评估内容的语言复杂性和/或语言类型,且在一个示例性实施例中,该评估基于文本执行。由此可推在与方法1700相关联的另一示例性实施例中,评估被标识的内容的动作包括评估字率、音频数据中言语的声音性别、口音质量和/或背景声音水平。
与上述关于创建音频内容索引的教导一致,在示例性实施例中,上述一些方法还包括将评估的结果存储于基于语言属性和/或音频属性的内容而被分类的数据库中的动作。此外,在示例性实施例中,使数据库对外部用户是可访问的,例如,上文所述系统1400的第一子系统的用户。在一个示例性实施例中,用户可以是听力假体接受者,而在其他示例性实施例中,用户可以是与听力假体接受者一起工作或为听力假体接受者提供护理的人。
在一些示例性方法中,还存在如下动作,即从用户接收第一输入,第一输入指示听力假体的接受者需要的内容(戏剧、喜剧等),以及从用户接收第二输入,第二输入指示听力假体的接受者理解言语的能力、和/或指示接受者基于由听力假体诱发的听力感知利用听力假体来聆听的能力。这些特性如上述,此处不再赘述。在一些示例性实施例中,所述方法还包括将接收到的第一输入和第二输入与数据库的分类进行比较,并基于比较提供公开可用的内容的指示。因此,在示例性实施例中有订阅服务,其中数据库由订阅服务提供商控制。需要注意的是,数据库不一定是包含内容的数据库。数据库可以是包含内容标题和/或内容链接的数据库,或指向可以获取内容的链接的数据库。仅作为示例而非限定于此,数据库可以指示给定标题可从HuluTM、NetflixTM、AmazonTM或本地资源库TM获取。也就是说,在一些实施例中,数据库还可以包括潜在内容。
方法1600的实施例还包括执行从用户接收第一输入的动作,第一输入指示听力假体的接受者需要的内容。同样,这可以对应话题或类型等。该变型还包括从所述用户接收第二输入的动作,第二输入指示听力假体的接受者理解言语的能力、和/或指示接受者基于由听力假体诱发的听力感知利用听力假体来聆听的能力。该变型还包括基于第一输入和第二输入,评估被标识的内容;以及向用户提供基于评估的公开可用的内容的子集的指示符的动作。应该注意到该方法还可以使用接受者的个人设备(PC、智能手机等)执行,其中个人设备实际上是搜索引擎。因此,在示例性实施例中,例如个人计算机或智能手机等的个人计算设备配置为用以执行本文详述的一个或多个方法动作,必定至少执行本文详述的一个或多个方法动作。同样在一个示例性实施例中上述方法可以被接受者/用户的远程系统执行。
方法1600的另一个变型使用来自接受者或其他用户的反馈来增强该方法。想法是如接受者决定内容是好或坏,系统或方法的控制者等会修改评估过程以增加或减少找到类似内容的可能性,或修改评估过程从而将内容完全从数据库中删除,尽管通常的标准将来会将其提供给用户。就此而言,在示例性实施例中,方法1600的变化包括以下附加动作:
A.接收第一输入,第一输入指示听力假体的接受者需要的内容;
B.接收第二输入,第二输入指示听力假体的接受者理解言语的能力、和/或指示接受者基于由听力假体诱发的听力感知利用听力假体来聆听的能力;
C.执行评估过程,评估过程包括基于第一输入和第二输入评估被标识的内容;
D.向用户提供基于评估的公开可用的内容的子集的指示符。
至此,上述四种方法动作都已在上文进行了描述,以下将不再赘述。但在示例性实施例中,该方法还包括以下动作:
E.接收反馈,反馈指示接受者对关于内容的子集的内容的至少一个项目的聆听经历的满意度;
F.基于接收到的反馈修改评估过程;
G.接收第三输入,第三输入指示听力假体的接受者需要的内容;
H.接收第四输入,第四输入指示听力假体的接受者理解言语的能力、和/或指示接受者基于由听力假体诱发的听力感知利用听力假体来聆听的能力;
I.执行被修改的评估过程,被修改的评估过程包括基于第三输入和第四输入对被标识的内容进行第二评估;
J.向用户提供基于第二评估的公开可用的内容的第二子集的第二指示符。
关于动作“E”,这组成来自接受者或其他用户的反馈,其中该反馈指示接受者对于内容子集的至少一个内容项目的听力体验的满意度。例如,如接受者感觉听力体验困难,但来自接受者的输入表明听力体验应该是更容易的,或反之亦然,则接受者可以提供此类指示。
基于这一反馈,在动作“F”中,可修改评估过程。值得注意的是,在某些情况下执行方法动作“F”使用了一个以上的反馈。可能有一个阈值或标准用来确定反馈量或反馈类型(例如,非常差会触发一个反馈的变化,但是反常可能需要多次出现该情况),其结果是方法被修改。
方法动作“G”和“H”前述方法动作的重复,与执行这些动作相关联。G可以是新请求,而H可以是重用请求。也就是说,在一个备选的实施例中,G和H可以在一个全新的中执行。方法动作“I”包括执行修改后的评估过程,其包括第二次评估基于第三输入和第四输入标识的内容,方法动作“J”包括向用户提供基于第二次评估的公开可用的第二内容的子集的第二指示符。此用户可以是同一用户,也可以是与以前不同的用户。重点在于从统计学上讲,方法动作I和J的结果应该比先前的包括未修改评估过程的方法动作的结果更好。
方法1600的另一种变化使训练机制具有动态性,在这种情况下,随着接受者更适应听力假体,训练变得更加困难。就此而言,在一个示例性实施例中,方法1600的变型包括以下附加动作:
A.接收第一输入,第一输入指示听力假体的接受者需要的内容;
B.接收第二输入,第二输入指示听力假体的接受者理解言语的能力、和/或指示接受者基于由听力假体诱发的听力感知利用听力假体来聆听的能力;
C.接收第三输入,第三输入指示与接受者相关联的训练的特性;
D.基于第一输入、第二输入和第三输入,来评估被标识的内容以标识公开可用的内容的子集;和
E.向用户提供基于评估的被标识的公开可用的内容的子集的指示符。
动作A和动作B已在上述讨论过,以下将不再赘述。动作C是指示与接受者相关联的训练特性的特征。在此可以是接受者已经训练的时间长度、需要的训练练习(更困难、更容易等)、接受者在训练中锻炼听力时愿意接受的难度等。动作D包括基于三个输入评估内容,以标识公开可用的内容子集,动作E需要向所标识子集的用户提供指示符。关键在于,利用该示例性方法,可以调整或以其他方式改变用于标识内容的算法,以说明与单个接受者相关的训练的特殊方面。
在上述方法的示例性实施例中,训练的特性是接受者以前的经历的历史,该历史至少与接受者先前使用的用于康复或恢复接受者的听力的一些音频和/或音频视觉内容有关。例如,接受者以前是否使用过该内容。更进一步举例即,接受者之前使用内容(相同或相似或不同)时表现如何。评估标识内容的动作还包括以下至少一项:(i)标识内容子集,使得该子集包括原本不在该内容中、但用于第三输入的内容;或者(ii)标识内容子集,使得该子集不包括原本在该内容中、但用于第三输入的内容。后者的标识过程可以包括删除或添加内容到内容库中,这些内容分别将提供给用户或以其他方式推荐给用户。
在一个示例性实施例中,训练的特性是训练强度特性(例如,接受者努力程度的期望目标是什么和/或对接受者所需的压力源是什么,等等)。再一次,评估标识内容的动作还包括以下至少一项:(i)标识内容子集,使得该子集包括原本不在该内容中、但用于第三输入的内容;或者(ii)标识内容子集,使得该子集不包括原本在该内容中、但用于第三输入的内容。
实施例还针对单独由接受者和/或看护接受者的用户执行的方法。虽然不明确限定于此,图18提供了示例性方法(方法1800)的流程图,该方法包括方法动作1810,其包括提供第一输入,第一输入指示要由听力假体的接受者使用的音频和/或音频视觉内容。方法1800还包括方法动作1820,其包括提供第二输入,第二输入指示接受者理解能力和/或受接受者理解影响特征需求。这些方法动作均可使用如智能手机的便携式手持电子设备执行,和/或可使用个人计算机等来执行。还需要注意到的是,在一些示例性实施例中,方法动作1810和1820可以通过电话线路等使用言语来执行。在任何情况下,关于提供指示接受者理解能力的第二输入的动作,这可以对应于基于统计的定量符和/或定性符。与以上详述的教导一致,该指示符可以在以上详述的方法中使用,以根据本文中详述的教导,帮助标识内容对接受者适合或对接受者具有实用性。关于接受者的理解影响因素,这可以与本文详述的任何输入相对应,该输入是关于接受者愿意努力去听或理解内容、语言复杂性、字率测量、说话者性别、说话者口音和/或背景噪音程度时,接受者容易或困难的程度。明确地说,方法动作1820可以使用任何指示接受者通常理解言语或声音的数据,和/或任何指示接受者愿意努力理解言语的意愿程度的数据来执行。
方法1800还包括方法动作1830,其包括基于第一输入和第二输入的分析、以及从较大内容项目组中剔除的内容项目的子组,接收一个或多个具体内容项目和/或所述一个或多个具体内容项目的一个或多个指示符。关于一个或多个具体内容项目的一个或多个指示符这些可以是它们的标题或指向潜在内容的链接,而对于前者而言,具体内容项目,这些可以是实际的媒体项目,其可通过互联网或电子邮件等递送。方法1800还包括方法动作1840,其包括选择用于收听和/或观看的所述一个或多个具体内容项目之一,以及方法动作1850,其包括通过收听一个或多个具体内容项目之一,来康复和/或恢复所述接受者的听力。关于后一种方法动作,这与简单地收听内容不同。在这里,方法动作1850要求收听具体内容项目的结果为听力康复和/或恢复,这与本文中至少一些实施例的目标相一致,该目标是基于本文中详述的教导和/或变化的实施达到康复和/或恢复。
在方法1800的一个示例性实施例中,提供第一输入的动作和提供第二输入的动作,由接受者和/或使用诸如智能手机或PC的个人计算设备照顾接受者的人执行。
此外,在1800的方法的一个示例性实施例中,提供和接收的动作导致与比没有提供第二输入的动作时接受者更容易获得的内容相关联的话题。在1800的方法的一个示例性实施例中,接受者理解力的影响因素需求至少是音频视觉内容中音频数据的字率、说话者的口音、说话者的性别、语言复杂性或背景声音中的其中一项。在一个示例性实施例中,接受者理解力的影响因素需求是指示关于如何影响理解言语的特征中接受者需要什么的特征(由此可得“需求”定性符)。任何可以使用的特征是指示接受者关于他或她愿意努力收听的意愿程度的特征,可以使用在至少一些示例性实施例中。
如上所述,在康复和/或恢复的一些示例性实施例中,当接受者正在收听内容的音频数据时,他或她正在收听的内容的音频数据的整体声音场景被改变后提供给接受者,以便调整理解内容的难易程度。在这方面,在方法1800的示例性实施例中,有一种附加动作能够改变所选的一个或多个具体内容的特性,以增加或减少对内容的易理解程度。仅作为示例而非限定于此,可以通过调整内容的属性来提高或降低字率。仅作为示例而非限定于此,可以去除并替换口音为不同的口音或根本无口音。更进一步说,女性声音可以被男性声音替代,反之亦然。
由上可推,在方法1800的示例性实施例中还存在一个动作,该动作在收听一个或多个具体内容项目之一时,允许应用一个或多个压力源,以增加对内容中言语的理解难度。仅作为示例,在一个示例性实施例中,添加噪声以模拟背景噪声,因此相对于没有压力源的情况,更难理解言语和音频内容。此外,仅作为示例,还可以添加回声特征。可以添加一个额外的说话人的声音,该说话人可以对其中一个人说话。在一些其它示例性实施例中,可以提供新口音,亦或是正常语言和言语可以替代为带口音语言。同样,可以添加背景噪音来制造压力源或增加压力源。
在一些示例性实施例中,可以调整整体声音场景,使得正被收听的内容的言语听起来像电话中的言语,这与正常言语不同。可以调整声音场景,使言语听起来像穿过隧道或像在洞穴中等。可以调整声音的质量以提高或降低可理解程度。
注意,虽然上述部分内容已就制造压力源进行了描述,但是在一些实施例中,另一种观念是提供现实生活场景的训练材料(例如,听某人在电话中讲话)。在这方面,这可能不一定被认为是一个压力源,因为它是一个环境条件,在该环境中行使其功能具有实用价值。
另请注意,虽然本身不一定构成应力源,但一些其他实施例可包括提供不同质量的内容。例如,与其他播客相比,质量相对较差的播客可能被用来增加接受者的认知负担,从而使收听更加困难,但也不会太过困难而导致接受者不想进一步训练。此外,还可以有目的地调整质量,使接受者承受更多的压力从而使接受者更加努力地训练。
任何操控整体声音场景的设备、系统和/或方法可以在至少一些示例性实施例中使用,相对于没有操控的情况,相对而言,该方法可以改变收听的总体难度以增强康复和/或恢复。
明确地说,在示例性实施例中,本文中详述的教导可以被配置为用于执行本文中详述的教导的多功能智能便携式设备和/或个人计算机和/或交互式电子设备全部或部分执行。在一些示例性实施例中,存在多功能智能便携式设备,例如上述图2A、2B和图3所示,包括一个交互式显示器,其可以是触摸屏,如截至2017年7月4日为止,市售的苹果TM智能手机(例如iPhone 6TM)或三星(如Galaxy S7TM)。在一个示例性实施例中,多功能智能便携式设备是一种穿戴式设备,仅作为示例而非限定于此,如图3的实施例中是一个包括底盘的智能手表。在一些实施例中,该底盘可以是塑料和/或金属底盘,其支持诸如可呈现图像(例如文本、图片、图形等)的LCD屏幕等示例性组件,其中,在一些实施例中,LCD屏幕是触控屏,一个或多个麦克风(例如1、2、3、4、5、6、7、8、9、10个或更多个麦克风)、一个或多个扬声器(例如1、2、3、4、5个扬声器)、和/或一个或多个振动器,其包括其马达和配重(如使用),其中中央处理单元(CPU)可以是一个计算机芯片或计算机处理器等、一个或多个印刷线板、连接表带的凸缘、一个RF发送器、一个RF接收器(例如,Wi-Fi和/或蓝牙发射器/接收器系统)等。应注意,在至少一些示例性实施例中,穿戴式设备241对应于苹果手表TM系列1或系列2,截至2017年7月4日为止在美国可购买到。在一个示例性实施例中,穿戴式设备241对应于三星Galaxy GearTM Gear 2,截至2017年7月4日为止在美国可购买到。在一个示例性实施例中,上述底盘装载一个或多个或所有部件在刚详述的三星和/或苹果设备中可用的一个或多个所有组件。注意,在至少一些示例性实施例中,底盘是单个单片部件,而在其他实施例中,底盘是相互集成组件的部件。值得注意的是,穿戴式设备可以包括两个或多个底盘。需要注意的是,当多功能智能便携式设备是穿戴式设备时,交互式显示器对应于上述智能手表的显示器。
在本实施例的至少一些示例性实施例中,多功能智能便携式设备还包括无线通信套件。在示例性实施例中,无线通信套件包括FM/RF接收器和/或发射器,或IR接收器和/或发射器等。在示例性实施例中,无线通信套件基于蓝牙技术,并且包括蓝牙兼容设备,例如蓝牙收发器。因此,在一些示例性实施例中,多功能智能便携式设备配置为与听力假体进行信号通信(RF通信,但在一些其他实施例中还可以是IR通信和/或有线通信),并且至少有一个从中接收信号或向其发送信号。
在至少一些示例性实施例中,多功能智能便携式设备还包括操作系统(本文公开的任何计算设备/系统亦然),该操作系统可以包括处理器和存储器,与软件和/或固件和/或硬件一起执行本文中详述的教导的一个或多个。
一个示例性系统包括一个示例性设备/多个示例性设备,该设备可实现本文中详述的教导,其至少在一些实施例中可实现自动化使用,如即将在文中描述的自动化和/或半自动化系统那样。即,示例性实施例包括以自动或半自动方式执行本文详述的一个或多个或所有方法及其变化,至少部分地使用以下任何修改过的设备/系统,例如通过编程/提供编程来执行所述方法。
图19的示意图说明了一个示例性配置,其中接受者1202和/或看护者和/或用户操作系统1206,该系统可与医疗设备(例如耳蜗植入物系统100)和/或与接受者控制的或接受者的看护者控制的设备一起使用,例如智能手机240或智能手表241或个人电脑1919。下文中,设备100通常被称为听力假体/耳蜗植入物,但请注意,该设备可以是可用于实现本文中详述的教导的任何设备的代理。
系统1206将至少部分地描述为与接受者和/或看护者的交互,并且在某些情况下,与接受者/看护者独立的系统用户的交互。在示例性实施例中,系统1206是接受者/看护者控制的系统,并且在一些实施例中,它是一个远程控制系统和/或由服务提供商控制的系统。
在19所示的实施例中。用于执行所述方法动作的耳蜗植入物系统和/或计算机设备可以直接连接系统1206,该系统可执行一个或多个本文详述的方法动作(在一些实施例中自动执行,如技术可实现)和/或具有一个或多个本文详述的功能的系统),在言语处理器116或其他耳蜗植入物系统的处理器和/或计算设备和系统1206之间建立数据通信连接1208。系统1206可以由数据通信连接1208与接受者/看护者的设备的任何处理器双向耦合。图19中所描绘的实施例描绘了通过线路连接的系统1206和听力假体,在至少一些实施例中,至少在一些实施例中,使用可实现本文中详述的教导的任何通信连接,可通过通信将假体可以和/或接受者/看护者设备与系统1206进行耦合。
系统1206可以包括系统控制器1212以及用户界面1214。控制器1212是能够执行指令的任何类型的设备,例如通用计算机或专用计算机、手持计算机(例如,掌上电脑(PDA))、数字电子电路、集成电路、特别设计的ASICs(专用集成电路)、固件、软件,和/或其组合。如下述,在一个示例性实施例中,控制器1212是一个处理器。控制器1212还可以包括用于与设备100(例如,耳蜗植入物100)和/或设备240、241和/或1919建立数据通信连接1208的接口。在控制器1212包括一台计算机的实施例中,该接口可以是如计算机的内部接口或外部接口。例如,在一个实施例中,控制器1206和任何接受者/看护者设备包括多种方式:USB、火线、蓝牙、WiFi或其他通信接口,通过该接口可以建立数据通信连接1208。控制器1212还可以包括用于存储信息的存储器。该存储可以是例如易失性存储或非易失性存储,例如,随机存取存储器、固态存储器、磁性存储器、全息存储器等。存储可以是远程的,且可以是基于云的存储等等。
用户界面1214可以包括显示器1222和输入界面1224。显示器1222可以是任何类型的显示设备,例如通常与计算机系统一起使用的设备。在一个示例性实施例中,元件1222对应于配置成向接受者直观显示多个单词(包括句子)的设备,如上文所述。
输入界面1224是能够从患者处接收信息的任何类型的界面,例如计算机键盘、鼠标、言语响应软件、触摸屏(例如与显示器1222集成)、麦克风(例如可选地与言语标识软件等耦合)、视网膜控制、操纵杆,以及任何其他现在或以后开发的数据输入或数据呈现格式。注意,在示例性实施例中,显示器1222和输入界面1224可以是相同的部件,例如触摸屏的情况)。应注意在至少一些示例性实施例中,系统1206被配置为执行一个或多个或所有本文详述的方法动作,其中系统1206的各个子部件以传统方式使用,相对于本文详述方法动作。
在一些示例性实施例中,系统1206可以部分地或全部地位于远程位置(例如位于诊所),在一些实施例中,系统1206可以与接受者和/或看护者位于同一位置。
在示例性实施例中,系统1206被配置为获取指示内容的第一特性的数据,其中所述内容是一种音频内容或一种音频视觉内容;获取指示内容的第二特性的数据并基于第一特性和第二特性标识具体内容。在一个示例性实施例中,这些操作通过设备240等的输入、通过连接1208和/或通过用户界面1214等来执行。在一个示例性实施例中,系统1206配置为电子地接收指示听力假体接受者需要的媒体内容的第一输入,向接受者基于接收的第一输入的一个或多个话题项目选择。再次,可以经由连接1208和/或经由用户界面1214来执行接收第一输入和/或向接受者提供一个或多个话题项的动作。
在一个示例性实施例中,系统1206配置为电子地接收指示接受者利用听力假体聆听的能力的第二输入,将所述第二输入与指示与所述一个或多个话题选择相关联的所述媒体内容中的言语的易理解度的数据进行比较,标识高于所述接受者的聆听的能力的媒体内容。根据另一个示例性实施例,系统1206包括/表示第一子系统,该第一子系统配置为接收第一输入,所述第一输入指示听力假体的接受者需要的音频内容和/或音频视觉内容,和接收第二输入,所述第二输入指示所述接受者的特征,所述特征与所述接受者的感官状态和/或精神状态有关。系统2106还包括第二子系统,该第二子系统配置为基于所述第一输入和所述第二输入标识媒体内容。
在一个示例性实施例中,系统1206配置为搜索音频和/或音频视觉内容,并且标识所述音频和/或音频视觉内容,评估被标识的所述内容,其中评估所述内容的动作针对语言属性和/或音频属性评估所述内容。
此外,在至少一些示例性实施例中,系统1206可用于提供第一输入,所述第一输入指示要由听力假体的接受者使用的音频和/或音频视觉内容,用于提供第二输入,所述第二输入指示接受者理解能力和/或受接受者理解影响特征需求。在一个示例性实施例中,可以通过一个设备240经由连接1208和/或通过用户界面1214等执行。另外,在一个示例性实施例中,基于所述第一输入和所述第二输入的分析、以及从较大内容项目组中剔除的内容项目的子组、接收一个或多个具体内容项目和/或所述一个或多个具体内容项目的一个或多个指示符的动作,可以经由来自系统1206的输出被执行。
同样,再次注意到图19的示意图是功能性的示意图。在一些实施例中,系统1206是独立设备(例如手提电脑、智能手机等),配置为执行一个或多个或所有本文中详述的方法动作和/或其变化。在备选的实施例中,系统1206是具有位于不同地理位置的组件的系统仅作为示例而非限定于此,用户界面1214可以位于一个位置,并且系统控制器(例如处理器)1212可以位于另一远程位置(地理意义上的远程位置)。仅作为示例而非限定于此,系统控制器1212可经由互联网和/或经由蜂窝通信技术等与用户界面1214进行通信,连接1208与系统1206、假体100和/或智能手机240、智能手表241和/或计算机1919等之间亦然。在至少一些实施例中,系统控制器1212还可以经由互联网和/或经由蜂窝网络等与用户界面1214通信。同样,在示例性实施例中,用户界面1214可以是便携式通信设备,仅作为示例而非限定于此,例如,移动电话和/或智能手机。实际上,用户界面1214可用作手提电脑等的一部分。任何能够使系统1206被实践的配置,和/或任何能够使本文中详述的教导和/或其变化能够被实践的配置,都可以在至少一些实施例中使用。
鉴于以上内容,图20描绘了示例性功能示意图,其中设备2240,在此示例性实施例中为接受者/看护者控制的便携式手持设备2240或计算机,但可理解其代表任何可实现本文中详述的教导的设备(例如,远程专用听力假体控制单元、个人计算机、智能手机、座机电话等),是通过连接2230与地理位置上的远程设备/设施10000进行通信的,可以是因特网连接或手机连接,也可以是任何具有实用价值的可实现通信的连接。地理位置上的远程设备/设施1000可以包含控制器1212,并且远程设备240可以包含用户界面1214(或者远程设备可以包含界面1214)。地理远程设备/设施10000是诊所或服务提供商。还应注意在图20的实施例中,连接2230可以表示设备2240与听力假体100之间的通信和/或可以表示便携式手持设备2240与接受者/看护者之间的通信(绕过听力假体)。即,在一些实施例中,2240是假体,而在其他实施例中,2240是与假体的接口。
示例性实施例需要执行本文详述的一些或全部方法动作,其中听力假体接受者或其看护者,听力假体100和/或便携式手持设备2240距离执行本文详述的一些方法动作的地点远程(例如地理意义上远距离)的位置。
在一个设备配置为控制听力假体的示例性实施例中,在至少一些示例性实施例中,设备配置为在显示器上显示控制设置,用来控制听力假体。
应注意本文所述的一个或多个方法动作可以在本公开的任何设备和/或系统,方法动作的任何公开对应本公开中的设备和/或系统,其被编程为并具备相应结构以执行这些方法动作。而且,本公开中具有功能的任何设备和/或系统可以对应于本公开中具有用于执行该功能的结构和/或程序的设备和/或系统。
还应注意,本文详述的设备和/或系统的任何公开也对应于以其他方式提供的设备和/或系统的公开。
本文中关于方法动作的任何公开还对应于一个实施例的一个公开,在该实施例中,如技术可实现,设备和/或系统配置为执行该方法动作。具有功能的设备和/或系统的任何公开对应于执行与该功能对应的方法动作的方法的实施例的公开。
还应指出,除非另有说明,否则可以将本文详述的任何实施例的任何元件与本文详述的任何实施例的任何其他元件组合。还应指出,在至少一些示例性实施例中,在示例性实施例中可以明确地排除本文详述的实施例的任何一个或多个元件。也就是说,在至少一些示例性实施例中,存在明显不具有本文详述的一个或多个元件的实施例。
尽管上面已经描述了本发明的各种实施例,但是应该理解,它们仅以示例而非限制的方式而被呈现。对于相关领域的技术人员将显而易见的是,在不脱离本发明的精神和范围的情况下,可以在形式和细节上进行各种改变。

Claims (44)

1.一种提高听力假体的接受者利用所述听力假体聆听的能力的方法,包括:
获取指示内容的第一特性的数据,其中所述内容是音频内容或音频视觉内容,并且所述第一特性指示所述内容的一个或多个语言属性和/或一个或多个音频属性;
获取指示所述内容的第二特性的数据,其中所述第二特性指示所述听力假体的用户期望的媒体内容;以及
基于所述第一特性和所述第二特性,标识用于诱发所述接受者中的听力感知的具体内容。
2.根据权利要求1所述的方法,其中:
所述第一特性是声音相关的特性。
3.根据权利要求1所述的方法,其中:
所述第二特性是内容话题特性。
4.根据权利要求1所述的方法,其中:
所述第二特性是实质性内容特性。
5.根据权利要求1所述的方法,其中:
所述第一特性是以下中的一项:语言复杂性、语言特性、字率、说话者的性别、说话者的口音或背景声音特性。
6.根据权利要求1所述的方法,还包括:
获取指示所述具体内容的另外的一个或多个第一特性的数据,其中
所述多个第一特性包括以下中的一项或多项:语言复杂性、语言特性、字率、说话者的性别、说话者的口音或背景声音特性。
7.根据权利要求1所述的方法,其中:
所述第一特性是易听度特性。
8.根据权利要求1所述的方法,还包括:
将所述第一特性与基于统计的定性符相关联,其中所述定性符基于统计数据,所述统计数据指示具有听力假体的人将能够理解所述具体内容中的言语。
9.根据权利要求1所述的方法,还包括:
将所述第一特性与基于统计的定性符相关联,其中所述定性符基于统计数据,所述统计数据指示具有听力假体和所述接受者的人口统计学特性的人将能够理解所述具体内容中的言语。
10.一种听力假体训练方法,包括:
电子地接收第一输入,所述第一输入指示听力假体的接受者需要的媒体内容;
电子地接收第二输入,所述第二输入指示所述接受者理解言语的能力、和/或指示所述接受者基于由所述听力假体诱发的听力感知利用所述听力假体来聆听的能力;
基于所述第一输入和所述第二输入,向所述接受者提供一个或多个话题项目选择;以及
使用与被提供的所述一个或多个话题项目选择相对应的、消费者容易可用的媒体内容,训练或再训练耳蜗植入物的接受者来利用所述假体识别和/或区别声音,其中
相对于缺失所述第一输入的情况,所述训练或再训练提高训练依从性。
11.根据权利要求10所述的方法,还包括:
将所述第二输入与指示与所述一个或多个话题项目选择相关联的所述媒体内容中的言语的易理解度的数据进行比较;以及
基于所述比较,选择一个或多个所述话题项目选择,其中
被提供的所述一个或多个话题项目选择对应于被选择的所述一个或多个话题项目选择。
12.根据权利要求10所述的方法,其中:
与所述需要的媒体内容相对应的所述容易可用的媒体内容使得所述内容中的至少50%的内容不适合所述训练;以及
所述方法还包括:审核来自被提供的所述一个或多个话题选择的所述至少50%的内容中的至少大部分。
13.根据权利要求10所述的方法,其中:
与所述需要的媒体内容相对应的所述容易可用的媒体内容使得所述内容中的至少90%的内容不适合所述训练;以及
所述方法还包括:审核来自被提供的所述一个或多个话题选择的所述至少90%的内容中的至少大部分。
14.根据权利要求10所述的方法,还包括:
电子地接收第二输入,所述第二输入指示所述接受者付出努力以收听所述需要的媒体内容的意愿,其中
向所述接受者提供一个或多个选择的动作还基于所述第二输入。
15.根据权利要求10所述的方法,还包括:
电子地接收第二输入,所述第二输入指示所述接受者付出努力以收听所述需要的媒体内容的意愿,和/或电子地接收第三输入,所述第三输入指示所述接受者利用所述听力假体聆听的能力,其中
向所述接受者提供一个或多个选择的动作还分别基于所述第二输入和/或所述第三输入,以及
所述话题项目选择被预存储在数据库中,并且利用指示符被分类,所述指示符与所述接受者付出努力以收听的意愿相关、和/或与所述接受者利用所述听力假体聆听的能力相关。
16.根据权利要求10所述的方法,其中:
所述训练或再训练包括:针对训练的具体目的收听所述媒体内容。
17.根据权利要求10所述的方法,还包括:
电子地接收第二输入,所述第二输入指示所述接受者利用所述听力假体聆听的能力;
将所述第二输入与指示与所述一个或多个话题选择相关联的所述媒体内容中的言语的易理解度的数据进行比较;
标识高于所述接受者的聆听的能力的媒体内容;以及
基于所述标识,选择所述一个或多个话题选择,其中
被提供的所述一个或多个话题选择对应于被选择的所述一个或多个话题选择,以及
相对于仅高于所述接受者的聆听的能力的媒体内容被使得没有所述标识就被所述接受者可用的情况,所述训练或再训练提高训练依从性。
18.根据权利要求10所述的方法,还包括:
电子地接收第二输入,所述第二输入指示所述接受者的听力损失的特征,其中
向所述接受者提供一个或多个选择的动作还基于所述第二输入,
所述话题项目选择被预存储在数据库中,并且利用指示符被分类,所述指示符与所述接受者的听力损失的所述特征相关。
19.一种听力假体训练方法,包括:
针对至少十位不同接受者重复根据权利要求10所述的方法,其中
统计上,相对于缺失相应的所述第二输入的情况,所述训练依从性平均至少提高10%。
20.一种听力假体训练方法,包括:
针对至少十位不同接受者重复根据权利要求10所述的方法,其中
统计上,相对于缺失相应的所述第二输入的情况,所述训练依从性平均至少提高30%。
21.一种听力假体训练系统,包括:
第一子系统,被配置为:
接收第一输入,所述第一输入指示听力假体的接受者需要的音频内容和/或音频视觉内容;以及
接收第二输入,所述第二输入指示所述接受者的特征,所述特征与所述接受者的感官状态和/或精神状态有关;以及
第二个子系统,被配置为:
基于所述第一输入和所述第二输入,标识媒体内容。
22.根据权利要求21所述的系统,其中:
所述感官状态是所述接受者理解言语的能力、和/或基于由所述听力假体诱发的听力感知来利用听力假体聆听的能力的状态;并且
所述精神状态是所述接受者需要工作以聆听和/或理解所听到的内容的状态。
23.根据权利要求21所述的系统,其中:
所述第一子系统是具有GUI的便携式电子设备;并且
所述GUI包括用于所述第一输入的至少一个数据录入点和用于所述第二输入的至少一个数据录入点。
24.根据权利要求21所述的系统,其中:
所述第一子系统和所述第二子系统是同一设备的部分。
25.根据权利要求21所述的系统,其中:
所述第一子系统是具有GUI的便携式电子设备;
所述GUI包括用于所述第一输入的至少一个数据录入点和用于所述第二输入的至少一个数据录入点;并且
所述第一子系统被配置为向所述接受者提供输出,所述输出指示被标识的所述媒体内容。
26.根据权利要求21所述的系统,其中:
所述第一子系统和所述第二子系统分别是彼此进行信号通信的不同设备的部分。
27.根据权利要求21所述的系统,其中所述第二子系统被配置为:
访问表示媒体内容项目的数据库;以及
基于所述第一输入和所述第二输入,从所述数据库中标识一个或多个媒体内容项目,其中标识的动作对应于标识媒体内容的动作。
28.一种标识听力假体接受者利用音频内容的方法,包括:
搜索音频和/或音频视觉内容,并且标识所述音频和/或音频视觉内容;以及
从用户接收第一输入,所述第一输入指示听力假体的接受者需要的内容;
从所述用户接收第二输入,所述第二输入指示听力假体的接受者理解言语的能力、和/或指示所述接受者基于由所述听力假体诱发的听力感知利用所述听力假体来聆听的能力;
基于所述第一输入和所述第二输入,评估被标识的所述内容,其中
评估所述内容的动作针对语言属性和/或音频属性评估所述内容。
29.根据权利要求28所述的方法,其中:
搜索的动作包括针对万维网上的内容执行基于计算机的搜索例程。
30.根据权利要求29所述的方法,还包括:
将所述内容的音频数据自动转换为文本,其中
评估被标识的所述内容的动作包括评估所述内容的语言复杂性和语言类型。
31.根据权利要求29所述的方法,还包括:
将所述内容的音频数据自动转换为文本,其中
评估所述被标识的所述内容的动作包括评估字率、所述音频数据中言语的声音性别、口音质量和/或背景声音水平。
32.根据权利要求29所述的方法,还包括:
将评估的结果存储于基于语言属性和/或音频属性的所述内容而被分类的数据库中;
使所述数据库对外部用户是可访问的;
将接收到的所述第一输入和所述第二输入与所述数据库的所述分类进行比较;以及
基于所述比较,提供公开可用的内容的指示。
33.根据权利要求29所述的方法,还包括:
向所述用户提供基于所述评估的公开可用的内容的子集的指示符。
34.根据权利要求29所述的方法,还包括:
执行评估过程,所述评估过程包括基于所述第一输入和所述第二输入评估被标识的所述内容;
向用户提供基于所述评估的公开可用的内容的子集的指示符;
接收反馈,所述反馈指示所述接受者对关于所述内容的子集的内容的至少一个项目的聆听经历的满意度;
基于接收到的所述反馈修改所述评估过程;
接收第三输入,所述第三输入指示听力假体的接受者需要的内容;
接收第四输入,所述第四输入指示听力假体的接受者理解言语的能力、和/或指示所述接受者基于由所述听力假体诱发的听力感知利用所述听力假体来聆听的能力;
执行被修改的所述评估过程,被修改的所述评估过程包括基于所述第三输入和所述第四输入对被标识的所述内容进行第二次评估;
向用户提供基于所述第二次评估的公开可用的内容的第二子集的第二指示符。
35.根据权利要求29所述的方法,还包括:
接收第三输入,所述第三输入指示与所述接受者相关联的训练的特性;
基于所述第一输入、所述第二输入和所述第三输入,评估被标识的所述内容以标识公开可用的内容的子集;以及
向用户提供基于所述评估的被标识的所述公开可用的内容的子集的指示符。
36.根据权利要求35所述的方法,其中:
所述训练的特性是所述接受者以前的经历的历史,所述历史至少与所述接受者先前使用的用于康复或恢复所述接受者的听力的一些音频和/或音频视觉内容有关;并且
评估被标识的所述内容的动作包括以下至少一项:
标识所述内容的子集,以使所述子集包括原本不在所述内容中、但用于所述第三输入的内容;或者
标识所述内容的子集,以使所述子集不包括原本在所述内容中、但用于所述第三输入的内容。
37.根据权利要求35所述的方法,其中:
所述训练的特性是训练强度特性;并且
评估被标识的所述内容的动作包括以下至少一项:
标识所述内容的子集,以使所述子集包括原本不在所述内容中、但用于所述第三输入的内容;或者
标识所述内容的子集,以使所述子集不包括原本在所述内容中、但用于所述第三输入的内容。
38.一种听力康复和/或恢复方法,包括:
提供第一输入,所述第一输入指示要由听力假体的接受者使用的音频和/或音频视觉内容;
提供第二输入,所述第二输入指示接受者理解能力和/或受接受者理解影响特征需求;
基于所述第一输入和所述第二输入的分析、以及从较大内容项目组中剔除的内容项目的子组,接收一个或多个具体内容项目和/或所述一个或多个具体内容项目的一个或多个指示符;
选择用于收听和/或观看的所述一个或多个具体内容项目之一;以及
通过收听所述一个或多个具体内容项目之一来康复和/或恢复所述接受者的听力。
39.根据权利要求38所述的方法,其中:
提供所述第一输入的动作和提供所述第二输入的动作由所述接受者、和/或使用个人计算设备照顾所述接受者的人执行。
40.根据权利要求38所述的方法,其中:
提供和接收的动作引起与所述内容相关联的话题,与提供所述第二输入的动作缺失的情况相比,所述话题对所述接受者是更可用的。
41.根据权利要求38所述的方法,其中:
所述接受者理解影响特征需求是以下中的至少一项:所述音频视觉内容中的所述音频数据的字率、一个或多个说话者的口音、一个或多个说话者的性别、言语的语言复杂性或背景声音。
42.根据权利要求38所述的方法,还包括:
使得能够改变被选择的所述一个或多个具体内容的特征,以增加或降低所述内容的易理解度。
43.根据权利要求38所述的方法,还包括:
在收听所述一个或多个具体内容项目中的所述一个具体内容项目时,启用一个或多个应激源的应用,以增加所述内容中的言语的理解的难度。
44.根据权利要求38所述的方法,其中:
所述接受者理解能力是基于统计的定量符和/或定性符。
CN202410031402.1A 2018-04-05 2019-04-04 高级听力假体接受者康复和/或恢复 Pending CN117959592A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862652971P 2018-04-05 2018-04-05
US62/652,971 2018-04-05
PCT/IB2019/052782 WO2019193547A1 (en) 2018-04-05 2019-04-04 Advanced hearing prosthesis recipient habilitation and/or rehabilitation
CN201980024856.3A CN111971979A (zh) 2018-04-05 2019-04-04 高级听力假体接受者康复和/或恢复

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980024856.3A Division CN111971979A (zh) 2018-04-05 2019-04-04 高级听力假体接受者康复和/或恢复

Publications (1)

Publication Number Publication Date
CN117959592A true CN117959592A (zh) 2024-05-03

Family

ID=68101331

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202410031402.1A Pending CN117959592A (zh) 2018-04-05 2019-04-04 高级听力假体接受者康复和/或恢复
CN201980024856.3A Pending CN111971979A (zh) 2018-04-05 2019-04-04 高级听力假体接受者康复和/或恢复

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201980024856.3A Pending CN111971979A (zh) 2018-04-05 2019-04-04 高级听力假体接受者康复和/或恢复

Country Status (4)

Country Link
US (2) US11750989B2 (zh)
EP (1) EP3777239A4 (zh)
CN (2) CN117959592A (zh)
WO (1) WO2019193547A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230264020A1 (en) * 2020-06-22 2023-08-24 Cochlear Limited User interface for prosthesis
US11350166B2 (en) 2020-08-27 2022-05-31 Comcast Cable Communications, Llc Systems and methods for improved content accessibility scoring
WO2023144641A1 (en) * 2022-01-28 2023-08-03 Cochlear Limited Transmission of signal information to an implantable medical device
WO2023233248A1 (en) * 2022-06-01 2023-12-07 Cochlear Limited Environmental signal recognition training

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5927988A (en) 1997-12-17 1999-07-27 Jenkins; William M. Method and apparatus for training of sensory and perceptual systems in LLI subjects
US8326584B1 (en) 1999-09-14 2012-12-04 Gracenote, Inc. Music searching methods based on human perception
US7889879B2 (en) * 2002-05-21 2011-02-15 Cochlear Limited Programmable auditory prosthesis with trainable automatic adaptation to acoustic conditions
CN1466111A (zh) 2002-07-05 2004-01-07 池美芬 “多元感受模仿”听觉口语障碍康复训练方法
US20070276285A1 (en) 2003-06-24 2007-11-29 Mark Burrows System and Method for Customized Training to Understand Human Speech Correctly with a Hearing Aid Device
US7849070B2 (en) * 2005-08-03 2010-12-07 Yahoo! Inc. System and method for dynamically ranking items of audio content
US20100260363A1 (en) * 2005-10-12 2010-10-14 Phonak Ag Midi-compatible hearing device and reproduction of speech sound in a hearing device
US7908273B2 (en) 2006-03-09 2011-03-15 Gracenote, Inc. Method and system for media navigation
WO2007137232A2 (en) 2006-05-20 2007-11-29 Personics Holdings Inc. Method of modifying audio content
US7983915B2 (en) 2007-04-30 2011-07-19 Sonic Foundry, Inc. Audio content search engine
US8423363B2 (en) 2009-01-13 2013-04-16 CRIM (Centre de Recherche Informatique de Montréal) Identifying keyword occurrences in audio data
US8463719B2 (en) 2009-03-11 2013-06-11 Google Inc. Audio classification for information retrieval using sparse features
KR20100112687A (ko) 2009-04-10 2010-10-20 지원바이오매틱스(주) 온라인 기반 청각 개선 관리 서비스 제공을 위한 정보처리방법 및 장치
US20110060384A1 (en) 2009-09-10 2011-03-10 Cochlear Limited Determining stimulation level parameters in implant fitting
US9275139B2 (en) 2012-03-30 2016-03-01 Aurix Limited “At least” operator for combining audio search hits
WO2014006220A1 (en) 2012-07-06 2014-01-09 Jacoti Bvba Consumer electronics device adapted for hearing loss compensation
US9031663B2 (en) 2013-02-22 2015-05-12 Cochlear Limited Genetic algorithm based auditory training
US20140250355A1 (en) 2013-03-04 2014-09-04 The Cutting Corporation Time-synchronized, talking ebooks and readers
WO2015007321A1 (en) 2013-07-18 2015-01-22 Longsand Limited Identifying stories in media content
DK201370793A1 (en) 2013-12-19 2015-06-29 Gn Resound As A hearing aid system with selectable perceived spatial positioning of sound sources
US9326086B2 (en) 2014-02-21 2016-04-26 City University Of Hong Kong Neural induced enhancement of audio signals
CN106797521B (zh) * 2014-09-19 2020-03-17 科利耳有限公司 基于音频的控制信号表征来配置听力假体声音处理器
US9501568B2 (en) 2015-01-02 2016-11-22 Gracenote, Inc. Audio matching based on harmonogram
US10477325B2 (en) 2015-04-10 2019-11-12 Cochlear Limited Systems and method for adjusting auditory prostheses settings

Also Published As

Publication number Publication date
US20210168544A1 (en) 2021-06-03
EP3777239A1 (en) 2021-02-17
EP3777239A4 (en) 2021-12-22
CN111971979A (zh) 2020-11-20
WO2019193547A1 (en) 2019-10-10
US11750989B2 (en) 2023-09-05
US20230412995A1 (en) 2023-12-21

Similar Documents

Publication Publication Date Title
CN110072434B (zh) 用于辅助听力设备使用的声音声学生物标记的使用
US20230412995A1 (en) Advanced hearing prosthesis recipient habilitation and/or rehabilitation
US20240054117A1 (en) Artificial intelligence platform with improved conversational ability and personality development
Edwards The future of hearing aid technology
CN102149319B (zh) 阿尔茨海默氏症认知使能器
Borrie et al. Perceptual learning of dysarthric speech: A review of experimental studies
KR102520761B1 (ko) 난청환자를 위한 청능 훈련시스템
US20200152304A1 (en) Systems And Methods For Intelligent Voice-Based Journaling And Therapies
Shafiro et al. The influence of environmental sound training on the perception of spectrally degraded speech and environmental sounds
Tognola et al. eHealth for hearing–new views and apps practicalities
US20220036878A1 (en) Speech assessment using data from ear-wearable devices
Waterschoot et al. BLISS. An Agent for Collecting Spoken Dialogue data about Health and Well-being
US20240087361A1 (en) Using projected spots to determine facial micromovements
US12009008B2 (en) Habilitation and/or rehabilitation methods and systems
WO2020261148A1 (en) Prediction and identification techniques used with a hearing prosthesis
AU2009279764A1 (en) Automatic performance optimization for perceptual devices
Mamun et al. Quantifying cochlear implant users’ ability for speaker identification using ci auditory stimuli
US11100814B2 (en) Haptic and visual communication system for the hearing impaired
Vithana et al. Mimi: Sinhala language speech assistive learning bot to support children with stuttering
US20240127824A1 (en) Identifying silent speech using recorded speech
CN117708285A (zh) 一种面向养老服务机器人的情感调节系统
CN115910111A (zh) 语音交互方法、装置、智能设备及计算机可读存储介质
Katz Basic Research in Speech Science—Speech-Language Pathology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination