CN117242784A

CN117242784A - 用于个人防护设备中的声音处理的系统和方法

Info

Publication number: CN117242784A
Application number: CN202280032579.2A
Authority: CN
Inventors: 弗兰克·T·埃尔福特; 简·D·福斯特; 托尔斯滕·哥本哈根; 维贾伊·K·季德拉; 埃布尔·格拉德斯通·曼加姆
Original assignee: 3M Innovative Properties Co
Current assignee: 3M Innovative Properties Co
Priority date: 2021-05-04
Filing date: 2022-04-25
Publication date: 2023-12-15
Also published as: EP4335113A1; WO2022234384A1

Abstract

本发明呈现了一种个人防护设备装置，该个人防护设备装置包括被配置为将经修改的声音提供给用户的扬声器。该装置还包括被配置为捕获环境声流的麦克风。该装置还包括声音分析器，该声音分析器从该麦克风接收该环境声流并且识别环境声音中的第一声音。该装置还包括声音处理器，该声音处理器基于声音识别来将模型应用于该第一声音，以获得该经修改的声音，其中该模型改变经识别的声音的特性。该经修改的声音被提供给该扬声器。该模型包括本地存储在该个人防护设备装置的存储器内的模型数据库中的算法。

Description

用于个人防护设备中的声音处理的系统和方法

背景技术

维护工人的安全和健康是许多行业主要问题。已制定了各种规章制度来帮助解决这一问题。此类规则提供了要求集以确保人员健康和安全过程的适当管理。为了帮助维护工人安全和健康，如果个体进入或留在具有危险或潜在危险条件的工作环境中，一些个体可被要求戴上、佩戴、携带或以其它方式使用个人防护设备(PPE)制品。

与关于安全的不断演进的规则和规章制度一致，在需要使用PPE的任何工作场所中，安全是重要的问题。雇佣佩戴PPE制品的工人的公司或企业也希望确保工人遵守与PPE的正确使用和维护有关的相关法律、规章制度和公司政策。

发明内容

呈现了一种个人防护设备装置，该个人防护设备装置包括被配置为将经修改的声音提供给用户的扬声器。PPE装置还包括被配置为捕获环境声音的麦克风。PPE装置还包括声音分析器，该声音分析器从麦克风接收环境声音，将该环境声音解析成多个声音部分，将声音部分与声音对象的数据库进行比较，并且基于该比较来识别环境声音中的第一声音。PPE装置还包括声音处理器，该声音处理器基于声音识别来将模型应用于第一声音，以获得经修改的声音，其中模型改变经识别的第一声音的特征。经修改的声音被提供给扬声器。模型包括本地存储在个人防护设备装置的存储器内的模型数据库中的算法。模型数据库包括多个模型，并且其中该多个模型包括经下载的模型。

本文的系统和方法为用户提供了经改善的音频体验，从而允许放大对于用户而言期望的或有用的声音(诸如包括紧急通知的声学警告信号)，减小可能不期望或损坏的声音，和/或完全去除不希望的声音。本文的系统和方法为用户提供了经改善的、可定制的音频体验。

附图和以下描述中示出了本公开的一个或多个示例的细节。根据说明书和附图以及权利要求书，本公开的其他特征、目标和优点将显而易见。

附图说明

图1示出了听力保护装置的用户。

图2示出了本发明的实施方案可用于其中的工作位点。

图3示出了在本发明的实施方案中修改经捕获的声音的方法。

图4A示出了本发明的实施方案中的PPE声音修改系统。

图4B示出了在本发明的实施方案中将模型应用于声流的方法。

图5A至图5B示出了本发明的实施方案中的声音模型管理系统的示意图。

图6示出了在本发明的实施方案中获得用于PPE装置的新的声音模型的方法。

图7示出了根据本发明的实施方案的模型数据存储库。

图8至图10示出了可以在本文的实施方案中使用的示例性装置。

图11A至图11D示出了经识别的声音对象的示例性提取和验证。

图12示出了可以在本文的实施方案中使用的示例性用户界面结构。

具体实施方式

许多类型的个人防护设备(PPE)包括扬声器、麦克风或两者。扬声器可向用户提供接收到的音频传输，而麦克风可捕获来自佩戴者的音频。不同形式的PPE具有不同质量的麦克风和扬声器。另外，佩戴不同的PPE会干扰麦克风拾取音频的能力以及扬声器传输音频的能力。

一些听力保护装置包括主动听力保护，该主动听力保护包括：一个或多个麦克风，其从用户的周围环境接收环境声音；处理器，其用于将声音处理到安全级别；以及一个或多个扬声器，其以安全级别向用户回放该声音。主动听力保护装置使用电子电路通过麦克风拾取环境声音，并将该环境声音转换至安全级别，然后通过扬声器将其播放给用户。另外，主动听力保护可以包括滤除高于给定声压级的声音，例如主动减小枪声，同时以基本不变的级别提供人类语音。本文的至少一些实施方案适用于主动听力装置。

在主动听力保护系统中，首先由麦克风来接收声音信号。所接收到的声音信号被转换为电子信号以进行处理。在对声音信号进行处理使得所有频率对于用户而言均处于安全级别之后，声音信号被再现并且通过听力保护装置的扬声器将其回放给用户。

一些主动听力保护单元是电平相关的，使得电子电路适应声压级。电平相关的听力保护单元有助于从周围噪声中滤除诸如枪声的脉冲噪声，和/或在将接收到的所有环境声音再现给用户之前将其连续地调整到适当的级别。主动听力保护单元，特别是电平相关的主动听力保护单元，可能是必要的，以便于在嘈杂的环境中，或者在噪声级别可能显著变化的环境中，或者在高脉冲声音可能导致听力损伤的环境中进行通信。用户可需要听到附近的环境声音，诸如机器声音或语音，同时还被保护免受有害噪声级别的影响。

如图1所示，主动听力保护单元可以使用耳塞或耳罩设计来进行提供，或者以双重保护模式来进行提供，如提交于2019年10月3日的美国临时专利申请序列号62/909989中所述，该文献以引入方式并入本文。

然而，虽然主动听力保护能够将基本上所有频率的声音减小到安全级别，但是该主动听力保护没有选择性地减小或滤除各个声音组分，以获得高于或低于安全级别的环境声音的经改善的听觉体验以及回放给佩戴者的安全的整体声音级别。在许多环境中，选择性地减小声音可能是有帮助的。例如，在战场场景中时，可能期望PPE选择性地减小枪声并且选择性地放大人类语音的声音。在建筑工地场景中，选择性地减小链锯或其他动力工具的声音并且放大指示经过的救护车或朝向佩戴者移动的重型机械的声音可能是有帮助的。

期望一种系统，该系统可以辨认传入声流内的各个声音并且将一个或多个模型应用于经辨认的声音，以改变那些声音对用户的感知。如本文所用，应用模型是指将算法应用于所检测到的声音频率，从而改变用户的听觉体验。算法可以放大、减小、消除、向其添加叠层或以其他方式改变传入声音，以提供经修改的声音，然后该经修改的声音向用户广播。例如，传入声流可以包括链锯锯切、监管说话，以及指示重型机械在用户附近倒车的哔哔声。应用模型可以包括以下项中的任一者或全部：减小链锯的声音、放大监管的语音、消除哔哔声同时提供附近重型机械的听觉警示。

在现有技术中已知，可以辨认声音并且在其周围提供警示，例如如公布于2015年8月6日的美国PAP 2015/0222977中所述。另外，在现有技术中已知，装置可以将所接收的声音与经登记的声音模式匹配以生成警示，如公布于2016年9月15日的美国PAP 2016/0269841中所述。然而，先前还不了解基本上实时地辨认所接收的声流内的声音，改变声音，改变各个声音组分，以及将其重组到针对PPE装置的佩戴者的广播声音中。

图1示出了根据本发明的实施方案的双重听力保护系统。然而，虽然示出了双重听力系统10，但是明确设想了本文的实施方案可以包括单独操作的耳罩20或内耳塞30。人10可处于具有多个声音50的环境中。如图1所示，不同的声音50可以具有与它们相关联的不同的声压级。声音50中的一些声音可能为用户10希望听到的声音，并且可能希望放大。一些其他声音50可能为可能分散用户10注意力的声音，用户可能希望减小或完全消除该声音。

双重听力保护系统还可包括一个或多个麦克风40。在图1中麦克风40被示为定位成拾取用户10的语音。然而，其它麦克风(未示出)可被定位成拾取环境声音50。另外，第一听力保护系统20和第二听力保护系统30中的每一者可以具有一个或多个麦克风40。

图2示出了本发明的实施方案可用于其中的工作位点。图2为示出工作位点8A或8B的示例性联网环境2的框图。工作位点环境8A和8B可以具有一个或多个工人10A至10N，该一个或多个工人中的每个工人可以佩戴不同的PPE，包括听力保护件，诸如相对于图1所述的入耳式或包耳式听力保护件。工人10A至10N可以全部在相同的环境2中，但是它们可以各自执行多种任务。对于每个工人10A至10N，要求不同的声音处理需要。例如，操作链锯的工人可能希望减小链锯的声音。但是路人可能希望声音被放大，或者希望提供警示(前提条件是附近正在操作危险的机器)。

环境2包括模型数据库6，该模型数据库包括可以由用户10A至10N所佩戴的PPE访问或者可以被下载到PPE装置中的模型。例如，如本文所述，各个模型可以与声音相关联，并且当检测到给定声音时可以由PPE装置的处理器访问，使得可以应用该模型。模型可在PPE装置内从本地存储访问，或者可从远程存储源(诸如在线数据库)下载/访问。

物理环境8A和8B中的每个物理环境表示物理环境诸如工作环境，在该环境中，一个或多个个体诸如工人10当在相应环境内从事任务或活动时利用个人防护设备。

在该示例中，环境8A被大体示出为具有工人10，而环境8B以扩展形式示出以提供更详细的示例。在图2的示例中，多个工人10A至10N可以佩戴多种不同的PPE，诸如耳罩听力保护器、入耳式听力保护器、安全帽、手套、眼镜、护目镜、面罩、呼吸器、发网、洗手衣或任何其他合适的个人防护设备。

虽然环境2被示出为工厂或工业环境，但也明确设想了在一些实施方案中，模型数据库可由单个用户用单个PPE装置访问，诸如在家庭改建计划期间单独操作动力工具的杂务工。

一般来讲，如本文更详细描述的，模型数据库6被配置为容纳可供PPE在环境8A和8B内下载的模型。模型可以由PPE的制造商、装置的制造商(例如，动力工具的制造商)、其他第三方、或者创建他们自己的模型并且将其上传到数据库6的个体来进行生成。数据库6可以通过网络4来访问环境内的一个或多个装置或显示器16，或远离环境的装置或显示器18。例如，装置16、18可以具有允许用户10A至10N从数据库6选择用于下载到PPE装置的模型的应用界面。另外，界面还可以允许用户10A至10N将声音上传到数据库6，并且创建或选择应用于所述声音的模型。然后，用户10A至10N能够将所创建的/经选择的模型下载到PPE装置，使得当将来检测到声音时，模型可以被应用。在一些实施方案中，PPE装置不具有从数据库6直接下载模型的能力。在其他实施方案中，PPE装置可以访问数据库6，以下载模型或直接上传声音。例如，如果接收到未由给定PPE装置所辨认的声音，则它可以将声音提供给模型数据库6，以用于进行辨认。模型数据库6可以具有可辨认声音的更大数据库，并且能够提供可以由PPE应用于声音的模型。在一个实施方案中，所述模型可以通过网络4来自动提供给PPE。在另一个实施方案中，PPE可以通过装置16、18来接收新的模型。

在本文的一些实施方案中，PPE的制品可以包括嵌入式传感器、通信部件、监测装置和处理电子器件中的一者或多者。此外，每个PPE制品可包括用于输出指示PPE的操作的数据和/或生成通信并将通信输出到相应工人10的一个或多个输出装置。例如，PPE可以包括一个或多个装置以生成听觉反馈(例如，一个或多个扬声器)、视觉反馈(例如，一个或多个显示器、发光二极管(LED)等)或触觉反馈(例如，振动或提供其他触觉反馈的装置)。另外，许多类型的PPE可以包括能够接收声音、将模型应用于所接收的声音并且输出处理声音的听力保护装置。

在一些示例中，环境8中的每个环境包括计算设施，诸如显示器16，或通过相关联的PPE，工人10可以通过该计算设施与模型数据库6通信。例如，环境8可以被配置有无线技术，诸如802.11无线网络、网络、802.15ZigBee网络等。在图2的示例中，环境8B包括本地网络7，该本地网络提供了基于分组的传输介质，以用于经由网络4与PPE计算系统6通信。此外，环境8B包括多个无线接入点19A、19B，该多个无线接入点可以在地理上遍布于整个环境中，以在整个工作环境中提供对无线通信的支持。

如图2的示例中所示，环境诸如环境8B也可包括在工作环境内提供准确的位置信息的一个或多个支持无线的信标诸如信标17A-17C。例如，信标17A-17C可以是支持GPS的，使得相应信标内的控制器可能够精确地确定相应信标的位置。基于与信标17中的一个或多个信标的无线通信，或由工人10佩戴的数据集线器14被配置为确定工作环境8B内的工人的位置。以这种方式，事件数据可以用位置信息来进行标记。

在示例性具体实施中，环境诸如环境8B还可包括一个或多个安全站15，这些安全站遍布于整个环境中。安全站15可允许工人10中的一个工人检查PPE制品和/或其他安全设备，验证安全设备适合于环境8和/或交换数据中的特定一者。例如，安全站15可将警示规则、软件更新或固件更新传输到PPE制品或其他设备。

此外，环境8中的每个环境包括计算设施，该计算设施为最终用户计算装置16提供操作环境，以用于经由网络4与模型数据库6进行交互。例如，环境8中的每个环境通常包括负责监督环境内的安全合规性的一个或多个安全管理人员或监管(由用户20或远程用户24代表)。例如，最终用户计算装置16、18可以为膝上型电脑、台式计算机、移动装置诸如平板电脑或所谓的智能蜂窝电话。

如图2所示，工作位点8B可以具有一个或多个相机60，该一个或多个相机固定在工作位点内、移动(例如，无人机、机器人或经安装的设备)或与工人10A至10N相关联(例如，与PPE相连佩戴的增强现实头戴式耳机或其他相机等)。

本文的系统和方法允许每个PPE装置定制并且改善每个工人10A至10N的体验。通过从模型数据库6下载必要的模型，每个工人均可以具有经定制的听觉体验，该经定制的听觉体验放大期望的声音、减小或消除不希望的声音、添加警示叠层，所有这些均基于辨认进入由工人所佩戴的PPE装置的麦克风的声流内的传入声音。

图3示出了在本发明的实施方案中修改经捕获的声音的方法。方法100可以在听力保护装置或具有主动听力保护的其他PPE中实施，以选择性地调节传入声流内的声音。首先接收声音，如框110所指示。可以通过与执行方法100的相同PPE装置相关联的麦克风(例如，在头戴式耳机外部的麦克风)来接收声音。或者，在另一个实施方案中，可以通过另一个机制来接收声音，如框109所指示。例如，人类语音可以由天线来接收，从另一个源进行广播。

可以作为声流的一部分来接收在框110中所接收的声音，如框104所指示。与PPE装置相关联的处理器可以负责从传入声流解析声音，或者可以从另一个源(该另一个源从声流解析该声音)接收该声音，如框102所指示。也设想了其他配置，如框106所指示。

在框120中，例如通过将经解析的声音与本地存储在PPE装置中(如框122所指示)或远离PPE装置存储(如框124所指示)的声音的数据库进行比较，来识别声音模式。在一些实施方案中，声音模式使用机器学习或人工智能来进行识别，诸如受过训练以检测某些声音(例如，链锯)的存在的模型。可以提取许多特征，然后将它们与可以用于分类或识别声音的已知数据库进行比较。

在另一个实施方案中，所接收的声音被缓冲(例如10ms)，并且随后应用转换，诸如例如FFT、MFCC等。该表示被馈送通过受过预训练的模型，该受过预训练的模型将其分类为特定声音(例如，链锯)。在另一个实施方案中，步骤120和130两者均被包括在受过预训练的模型(存储在PPE装置本地的数据库中)中，其中该表示被馈送到模型中并且经增强的声音为模型的输出。

在另一个实施方案中，模型经过训练以在逻辑基础上而不是在频率基础上分离不同的组分(例如，将声音分离成链锯、手提钻、…和剩余组分)。

在框130中，将模型应用于经解析的声音。模型可以包括放大声音(如框112所指示)、减小声音(如框114所指示)、消除声音(如框116所指示)或将叠层添加至声音(诸如警示、信息广播或另一声音)(如框118所指示)。还可结合或代替放大、减小或消除声音而采取其他行动，如框126所指示。

在框140中，经修改的声音通过扬声器来向PPE装置的佩戴者进行广播。在一个实施方案中，可以仅传输经修改的声音，如框142所指示。经修改的声音可以与经解析的声流的其他部分重组，如框144所指示。在一些实施方案中，声流被解析成多个声音部分，该多个声音部分中的每个声音部分经历修改。在此类实施方案中，如图3所指示，可以针对声流的每个经检测的声音部分来重复框110、120及130的方法步骤。其他声音广播配置也是可能的，如框146所指示。

例如，建筑工地区中的PPE装置的用户可能正在操作圆锯，同时附近的水泥卡车正在倒车。监管可以口头上或通过通信单元来发出命令。可以显著减小圆锯声音部分，并且可以放大监管声音部分。警告声音可以叠层在水泥卡车的声音上，作为警告用户附近存在潜在危险的警告。然后，在通过PPE的扬声器向用户广播之前，重组声音部分–减小的圆锯噪声、放大的监管语音和警告叠层。在一个实施方案中，按顺序分析并且修改声音部分，如框130所指示。然而，在其他实施方案中，并行地分析并且修改多个声音部分。这可以允许以较小的延迟将声音广播到用户，但确实需要较大的处理能力。

图4A示出了本发明的实施方案中的PPE声音修改系统。系统200可与图1的听力保护装置以及其他PPE装置一起使用。例如，图4中示出的焊接头盔218可以为声音修改系统200的一部分。在本公开中的实施方案中描述了声音修改系统，该声音修改系统可以适用于多种PPE系统，特别是包括拾取环境噪声的麦克风和将声音提供给用户的扬声器的任何PPE系统。例如，焊接头盔218在图4A中示出并且头盔218可以包括内置扬声器，或可以将来自麦克风的声音提供给入耳式扬声器听力保护单元，或由用户佩戴在头盔218下的包头式听力保护单元。

图4A示出了系统200中的焊接头盔218，该焊接头盔包括头戴式装置210、护目镜附接组件214和装置210内部的一个或多个扬声器(未示出)，以及在装置210的外部或内部表面上，或在听力保护装置的衰减部分的外部以捕获外部声音的一个或多个麦克风(未示出)。

如图所示，PPE装置200与单独的装置220进行通信联系，该单独的装置在图4中示出为手机，其可以具有应用程序，通过该应用程序，PPE装置200的用户或佩戴者可以与声音修改模型数据库250进行交互。然而，明确设想了在一些实施方案中，用户可以直接与数据库250通信。例如，焊接头盔200包括可以具有增强现实叠层能力的屏幕212。佩戴者可以能够使用音频、运动或远程控制器，使用屏幕212、使用集成到PPE 200中的处理器与数据库250进行交互。然而，许多PPE装置缺乏屏幕，并且旨在降低处理能力以保持蓄电池寿命。因此，在许多实施方案中，并且如本文所述，PPE装置被设想为使用中间装置220与数据库250进行交互。

另外，虽然在图4中示出了移动电话220，但是明确设想了其他计算装置220也是可能的，包括膝上型电脑、平板电脑、台式计算机或能够以有线或无线容量与PPE装置200和数据库250两者进行交互的其他计算终端。

计算装置220包括一个或多个计算机处理器和存储器，该存储器包括可以由该一个或多个计算机处理器执行的指令。计算装置220通信地耦接到PPE装置200并且耦接到声音修改模型数据库250。计算装置220可以包括与在本公开的其他附图中所示和所述的功能和部件相同的功能和部件、这些功能或部件的子集或超集。然而，如上所述，在一些实施方案中，计算装置220集成到PPE装置200或数据库250中，使得装置200直接与数据库250通信。

计算装置220可以包括在个人防护设备制品中或者附接到个人防护设备制品(例如，系统200)，可以在头罩210外部的单独装置中定位在工人上或附接到该工人，或者可以在与工人完全分开的远程计算装置(例如，远程服务器或针对用户的安全终端)中。计算装置220可以根据本公开的技术与声音修改模型数据库250通信。

根据本文的实施方案，与PPE 200相关联的麦克风(未示出)可以接收声流202，解析出特定的声音部分，将模型应用于经解析的声音部分，并且通过扬声器(未示出)来将经修改的声音部分单独地或重组为经修改的声流202广播给PPE 200的佩戴者。

在一些实施方案中，负责辨认声音并且应用适当声音模型的处理器可以检测声流202内不熟悉的声音部分。PPE处理器可以生成针对数据库250的关于未知声音的查询。例如，在一个实施方案中，可以即时地、当装置200处于充电状态时或当装置220连接到WIFI时，经由装置220发送该查询。在其他实施方案中，可以在其他适当的时间发送查询。

声音修改模型数据库250可以自动提供新的声音模型，以用于下载到PPE 200的本地存储中，或者可以仅在请求或选择时使用装置220的应用界面或与PPE 200相关联的屏幕、安全站(例如，图2中示出的站点15)、计算机或膝上型电脑来提供声音模型。

如本文更详细描述的，在一些实施方案中，声音修改模型数据库250包括以下功能：对PPE处理器当前“未知”的声音进行分类或识别，并且提供可以被下载到PPE装置200的本地存储器中的声音模型。另选地，在一些实施方案中，使用装置220的处理器来完成声音辨认过程。其它合适的构造也是可能的。

在一些实施方案中，方法100的至少一些步骤使用装置220的处理器来实现。在其他实施方案中，方法100仅仅使用集成到装置200中的处理器和存储器来实现。

本文描述了能够响应于某些经辨认的声音而提供警示的系统和方法。所述警示可以使用PPE 200内的音频、视觉或触觉反馈机制和/或使用计算装置220的音频、视觉或触觉反馈机制来进行提供。另外，在一些实施方案中，PPE装置200或计算装置220可以存储经生成的警示的指示，或将该指示发送至另一个远程装置或存储介质。

计算装置220可以生成任何类型的输出的指示。在一些示例中，输出的指示可为包括各种通知数据的消息。通知数据可包括但不限于：警示、警告或信息消息；个人防护设备的类型；工人标识符；生成消息时的时间戳；个人防护设备的位置；一个或多个光强度或任何其他描述性信息。在一些示例中，该消息可被发送到如本公开中描述的一个或多个计算装置，并且输出用于在通信地耦接到相应计算装置的输出装置的一个或多个用户界面处显示。在一些示例中，计算装置220可以接收声源源自何处的指示(例如，基于来自生成经辨认的声音的装置的通信)，并且进一步基于声源和发生的声音类型来生成所指示的输出。

图4B示出了在本发明的实施方案中将模型应用于新辨认的声音的方法。在一个实施方案中，方法500可以仅仅由PPE装置来执行。在其他实施方案中，至少一些功能由单独的计算装置(诸如与PPE装置200通信的移动装置220)来执行。

在框510中，由PPE装置来接收传入声流。麦克风502可以捕获声音，或可以由天线504来接收该声音，或另一个机制506可以提供声音。

在框520中，声流被解析成多个声音部分。例如，站在外面佩戴PPE装置的个体可以接收包括风声部分、雨声部分、语音部分和鸟叫部分的声流。

如框550所指示，针对多个声音部分中的每个声音部分而重复框530和540。继而，在框530中辨认每个声音部分，并且应用模型，如框540所指示。模型可以包括对声音部分什么也不做、放大声音部分、减小声音部分、消除声音部分或将叠层添加至声音部分。

在框530中，辨认声音部分。这可以基于手动触发514来自动完成512，或者半自动完成。例如，为了节省处理空间，PPE装置可以仅自动解析在某些频率范围内或高于某些分贝级别的声音。用户可以享受听到风、雨、鸟以及它们的同伴的环境声音，并且因此这些声音中没有一个可能需要调节。

声音可以被辨认为已知装置声音522(诸如在远处的枪声)、已知环境声音524(诸如风或雨或鸟的声音)或已知其他声音526(诸如人类语音声音部分)。

在框540中，基于辨认将模型应用于声音部分。例如，由装置制造商生成的经存储的模型542可以将风声减小50％。模型可以为经用户编程的模型544，例如可听见地命名与鸟叫相关联的鸟的警示叠层。模型544还可以为响应于用户请求的经生成的模型，例如用户上传鸟声并且响应于该声音而接收经定制编程的模型544。模型可以由另一个源(诸如另一个个体)来进行生成。模型可以被自动应用532，例如每次在框530中辨认出声音时，或者被手动应用534–例如仅当用户请求时提供可听见的鸟名称。在其他实施方案中，模型可以被半自动应用536。

图5A和图5B示出了本发明的实施方案中的声音模型管理系统的示意图。系统300表示单个PPE装置310与模型数据库340的交互。然而，如图2所设想，明确设想了本文所述的系统和方法可以在联网环境中操作，其中其他PPE装置310均访问单个模型数据库340。

在图5中示出的实施方案中，PPE装置310经由装置管理器350来访问模型数据库340。然而，在其他实施方案中，明确设想了PPE装置310可以直接与模型数据库340进行交互，使得装置管理器350的功能中的至少一些功能结合到PPE装置310中。

PPE装置310包括被配置为拾取环境声音的一个或多个麦克风302。PPE装置310还可以包括一个或多个天线306，该一个或多个天线被配置为从其他装置(包括其他PPE装置310)接收信号，该信号包括可以与由麦克风302所接收的声流类似地进行处理或者被结合到该声流中的音频信号。PPE装置还包括被配置为向PPE装置310的佩戴者广播声音的一个或多个扬声器304。PPE装置还可以包括被配置为与装置管理器350通信或直接与模型数据库340通信的通信部件308。

PPE装置310还包括存储器320，除了PPE装置310的功能操作所必需的数据326之外，该存储器还存储经存储的声音324和经存储的模型322的数据库。

PPE装置还包括模型应用程序引擎330，该模型应用程序引擎分析环境声音并且按需应用模型，以改善PPE装置310的佩戴者的体验。

声音接收器332从麦克风302接收声流，并且将声流解析成各个声音部分。例如，在建筑工地区中所接收的声流可以包括在PPE装置310的佩戴者附近使用的圆锯的声音、在远离PPE装置310的佩戴者的位置使用的钉枪的声音、在远处经过的救护车的声音以及在附近的两个同事之间的语音。声音接收器332可以将声流解析成圆锯部分、钉枪部分、救护车部分和语音部分。

声音分析器334从声音接收器332接收每个声音部分，并且检查经存储的声音324以将声音部分与已知声音匹配。经存储的声音324可以先前从模型数据库340下载，或者可以已经由制造商安装在PPE装置310上。声音分析器334辨认出圆锯声音部分、救护车声音部分、语音部分和钉枪部分。

在一些实施方案中，声音分析器将所接收的声音分离成声音部分，类似于多轨音频流。在另一个实施方案中，单个模型涵盖声音接收器332和声音分析器334，使得一个模型在一个步骤中无所不包，这对于在嵌入式装置上进行计算可能更快，因为该模型直接得到输入流并且将其转换为输出流。因此，在一个步骤中，传入声流通过应用ML模型来几乎实时地划分成声音部分。在分割过程期间，声音部分已经用与声音分析器334可访问的模型最为相关的事项进行了识别。

模型应用器336基于所接收的声音部分的识别来检索经存储的模型322，并且将其应用于经辨认的声音。例如，可以消除救护车声音，可以将钉枪声音减小50％，可以将圆锯声音减小90％，并且可以将语音声音放大300％。模型应用器336可以基于声音识别的置信度来应用模型。例如，置信度可以在最小85％至95％置信度之间变化。

声音处理器338将声音部分重组到可以通过扬声器304来进行广播的格式中。将由减小50％的钉枪声音部分、减小90％的圆锯声音部分和放大300％的语音声音部分组成的经修改的声流通过扬声器304来提供给用户。

模型应用程序引擎330还可以具有其他功能。例如，在一些实施方案中，当声音部分未被辨认为经存储的声音类别324中的一个声音类别时，模型应用程序引擎将查询发送至模型数据库。

PPE装置310可以为接收声音并且将该声音提供给用户的任何合适的PPE装置中的一个PPE装置。PPE装置可以为听力保护装置，诸如包耳式或入耳式听力保护单元。PPE装置还可以为PAPR呼吸器、焊接头盔或任何其他合适的PPE实施方案。PPE装置310包括所述个人防护功能所必需的任何功能部件328。

模型数据库340存储可以使用合适的接口来进行访问的模型和声音记录。在一些实施方案中，使用模型应用程序引擎330的PPE装置310可以直接与模型数据库340进行交互，以按需检索新的模型和/或以提供未经辨认的声音以用于分析。模型数据库340可以包括来自多个地方的模型。例如，PPE装置310的制造商可以基于期望的交互来提供受过预训练的模型344。例如，军用听力保护装置的制造商可以基于枪声、炮声、爆炸等来生成多种模型，而焊接头盔的制造商可以基于不同的焊炬来生成多种模型。另外，第三方可以上传第三方模型342。例如，PPE装置的个体所有者可以上传锯穿PVC管的声音，并且可以生成将锯穿PVC管的声音减小70％的模型。另外，动力工具的制造商可以上传作用于不同材料的不同动力工具的多种模型。

模型数据库340还包括可以用于识别由PPE装置310所提供的未知声音的声音样本346。声音样本346可以由PPE装置310直接上传，或由该PPE装置通过装置管理器350上传。声音样本346可以被自动上传，例如一旦它们被记录，或一旦触发事件发生，诸如PPE装置310或装置管理器350连接到无线网络。声音还可以基于用户行动来进行上传，该用户行动为例如用户记录(例如，使用移动装置的记录功能，使用所述移动装置的麦克风或者远程使用PPE装置310的麦克风302)他们希望为之生成模型的声音。

根据本文所述的方法和系统，模型数据库340还可以包括其他数据或功能348。

装置管理器350在图5中被示出为与PPE装置310和模型数据库340分开。在一些实施方案中，装置管理器350使用无线网络(诸如WIFI、蜂窝网络、NFC或其他合适的通信协议)来与PPE装置310进行通信。然而，在其他实施方案中，装置管理器350需要有线连接。装置管理器350可以例如使用无线、蜂窝或基于云的通信网络来与模型数据库350通信。装置管理器使用一个或多个通信模块354来与PPE装置310和模型数据库340通信。装置管理器350还可以包括其他合适的功能356。

装置管理器350可以为任何合适的计算装置，诸如蜂窝电话、平板电脑、膝上型计算机、台式计算机或其他装置。装置管理器350具有被配置为显示用户界面360的屏幕，该用户界面由用户界面生成器352基于用户致动模型管理应用程序而生成。用户界面360可以向用户提供检视可用于通过模型数据存储模块362下载到PPE装置310的模型的方式，该模型数据存储模块还可以指示已经存储在装置310上的模型322。用户可以使用模型数据存储模块来向经存储的模型数据库322添加或去除模型。另外，用户界面360可以呈现模型生成器模块364，该模型生成器模块可以允许用户例如基于所记录的声音来生成新的模型342。所记录的声音可以直接从PPE装置310、装置管理器350上传，或者从PPE装置310经由装置管理器350来进行上传。附加的声音记录也可以为可上载的，例如在除了PPE装置310之外的装置上捕获的已知声音或未知声音的记录。用户界面360还可以包括其他特征或图标。

图5B示出了声音模型管理系统的另一个实施方案。系统370可以从多种源接收声音样本，该多种源包括但不限于PPE装置制造商374、第三方372或最终用户376(使用PPE装置的个体或企业)。源372、374、376可以例如通过有线或无线网络连接来将声音样本378提供给模型数据库380。

模型数据库380可以存储经辨认的声音和未经辨认的声音两者。经辨认的声音可能已经与模型相关联，并且被提供给基于云的装置管理器390，以用于直接392或间接394部署到PPE装置。对于未经辨认的声音，受过训练的模型382可以由用户372、374、376中的任何一个用户来进行生成，并且然后可以被提供给基于云的装置管理器390。如图5B所示，PPE装置可以将数据396(例如遥测数据、位置数据、环境声音样本或用户数据)提供回基于云的装置管理器390。在一些实施方案中，可以在将新的受过训练的模型提供给装置管理器390之前，执行用于确保模型的质量、安全性和可靠性的审查过程。

基于云的装置管理器390还可以具有其他功能，例如在实施方案(诸如图2)中向多个PPE装置传递信息，其中PPE装置为网络内的多个PPE装置中的一个PPE装置。在其他实施方案中，其中PPE装置的单独用户与模型数据库380进行交互，基于云的装置管理器390可以使用计算装置上的应用程序来间接地访问394。

图6示出了在本发明的实施方案中获得用于PPE装置的新的声音模型的方法。方法400可以用于将新获得的模型应用于声流的声音部分。方法400可以由用户来进行实践，该用户例如在移动电话上或直接在PPE装置的屏幕上与模型下载应用程序进行交互。

在框410中，用户使用用户界面来选择模型。该模型可以从PPE装置制造商404、第3方402或另一个合适的源提供。模型可以特定于PPE装置，例如用于减小PAPR呼吸器的声音的模型；或者可以为设备专用的，诸如用于当重型机械在附近移动时对警示进行叠层的模型。

模型可以例如响应于用户的先前提交的声音样本而被自动选择414。装置管理系统可以将模型推送到PPE装置以用于下载。另选地，可以手动地选择模型416。例如，包耳式听力保护装置的所有者可能已经购买了新的圆锯，并且可以搜索并下载与当切割穿过材料时圆锯制造的声音相对应的模型。模型可以单独下载，例如圆锯切割穿过PVC所制造的噪声减小50％；或者作为组合包下载，例如当切割穿过材料时圆锯可以制造的所有已知声音减小50％。另外，第3方提示318可以指示用户应下载模型。例如，设备制造商可以提供QR码，当由用户的电话来进行扫描时，该QR码选择与设备相关的模型。也明确设想了选择模型的其他方法。

在框420中，将模型下载到PPE装置。在一个实施方案中，将模型从模型数据库直接下载到PPE装置。在另一个实施方案中，模型通过集线器(诸如移动电话)来下载到PPE装置。模型可以基于来自第3方422的提示来进行下载，基于可用性来自动下载(例如，如框424所指示)，手动下载(如框426所指示)，或基于另一个合适的触发428来进行下载。

如箭头450所指示，在一些实施方案中，准备好由PPE装置来将模型应用于所接收的声音部分，如框440所指示，当下载时应用于传入声音。然而，如框430所指示，在一些实施方案中，模型在其使用之前被修订。例如，计算装置(诸如移动电话、膝上型电脑、平板电脑或台式计算机)可以允许PPE装置用户在其应用之前修订模型。例如，下载模型420可以是指将模型从基于云的模型数据库下载到中间集线器装置(诸如移动装置220)的步骤，该中间集线器装置然后可以在第二步骤中将模型提供给PPE装置200。

在框430中，在存储在基于云的模型数据库中时、在存储在中间集线器装置上时、或者在下载到PPE装置的存储器之后，修订经选择的模型。例如，对使用圆锯感到适应的最终用户可能比对使用圆锯感到陌生的人更希望使声音衰减。例如，最终用户可以将默认阻尼从50％改变为90％。

图7示出了根据本发明的实施方案的数据生成系统。模型生成系统700示出了数据和功能中的一些数据和功能，该数据和功能可以归因于相对于图1至图6所述的模型数据存储库。然而，虽然模型生成系统700被示出为单独的独立式系统，但明确设想了在一些实施方案中，模型生成系统700为基于云的模型数据库的一部分。例如，数据存储库700可以由装置制造商来进行管理，或者可以由企业用户来本地管理。因此，虽然模型数据存储库700示出了在一些实施方案中可能可用的一些数据和功能的表示，但是其他实施方案可以具有与所示出的不同的数据或功能。

声音接收器720从外部源接收声流，诸如直接从PPE装置、从作为集线器进行操作的计算装置、或从另一个源(诸如PPE用户的记录装置)接收声流。

所接收的声流被提供给声音解析模块730。在所接收的声流含有多个声音的情况下，音频流接收器732将其提供给声音解析器734，该声音解析器将声音解析成若干声音部分或声音对象，该若干声音部分或声音对象中的每个声音部分或声音对象由声音对象标识符736识别。模型生成器738基于一个或多个模型函数740来生成模型。

声音数据库710存储多个已知声音对象，该多个已知声音对象包括装置声音702(诸如切割穿过木材的链锯)、环境噪声704(诸如风)、机器噪声(诸如推土机的声音)、语音声音708或其他噪声718。声音数据库710内的声音对象可以由PPE装置制造商712、由第3方714或由最终用户716来进行生成。

最终用户、第3方或装置制造商可以通过将模型函数740和值指定给声音对象来生成模型。例如，可以将声音对象(声音函数)放大50％(值)。可能的声音函数740包括均衡器742、放大器744、减小器746、消除器748、警示叠层752(例如，响亮的哔哔声或附近存在危险的其他指示)、标记器754(例如，声音的听觉标记，例如诸如生成鸟叫的鸟的名称)或另一合适的函数756。

一旦生成模型，通信部件750就将其提供给接收装置。接收装置可以为由声音接收器720来接收的声音的源，或者经生成的模型可以被提供给模型数据存储，以用于其他用户可用。模型生成系统700可以包括其他功能760以及相对于图7所述的功能。

本文描述了针对用户定制音频体验的系统和方法。在图1至图7中相对于给定装置描述了许多不同的功能。然而，虽然在若干附图中相对于给定装置示出了功能，但明确设想了在一些实施方案中，所示出的功能由不同的装置来执行。

然而，为了使延迟最小化，在至少一些实施方案中，可以优选地将本文所述的方法和系统中的至少一些方法和系统完全包含在PPE装置内，使得在PPE装置与计算装置或模型数据库之间往返传输经解析的声音对象而不会损失时间。

类似地，虽然本文所讨论的模型经过生成或修订，但是可以优选地，生成或修订发生在除了PPE装置之外的装置上，因为软件大小要求对于PPE装置可能难以承受。

图8至图10示出了能够在先前的附图中所示的实施方案中使用的示例性装置。图8示出了能够在先前的附图中所示的实施方案中使用的示例性移动装置。图8是可用作例如工人装置或监管/安全官员装置的手持或移动计算装置的一个例示性示例的简化框图，其中可部署本系统(或其一部分)。例如，移动装置可以部署在计算装置的操作员隔间中，用于生成、处理或显示数据。

图8提供了可以运行本文示出和描述的一些部件的移动蜂窝装置616的部件的总框图。移动蜂窝装置616与这些部件进行交互，或运行一些部件并与一些部件进行交互。在装置616中，提供了通信链路613，该通信链路允许手持装置与其他计算装置通信，并且在一些实施方案中提供用于自动接收信息(诸如通过扫描)的信道。通信链路613的示例包括允许通过一个或多个通信协议进行通信，该通信协议为诸如用于提供对网络的蜂窝接入的无线服务，以及提供对网络的本地无线连接的协议。

在其他示例中，可以在连接到接口615的可移动安全数字(SD)卡上接收应用程序。接口615和通信链路613沿着总线619与处理器617(其也可体现为处理器)通信，该总线还连接到存储器621和输入/输出(I/O)部件623，以及时钟625和定位系统627。

在一个实施方案中，提供了I/O部件623来促进输入和输出操作，并且装置616可以包括输入部件，诸如按钮、触摸传感器、光学传感器、麦克风、触摸屏、接近传感器、加速度计、取向传感器，以及输出部件，诸如显示装置、扬声器和/或打印机端口。也可使用其他I/O部件623。

时钟625例示性地包括输出时间和日期的实时时钟部件。其还可以为处理器617提供定时功能。

例示性地，定位系统627包括输出装置616的当前地理位置的部件。该定位系统可以包括例如全球定位系统(GPS)接收器、LORAN系统、航位推算系统、蜂窝三角测量系统，或其他定位系统。其还可以包括例如生成期望地图、导航路线和其他地理功能的地图绘制软件或导航软件。

存储器621存储操作系统629、网络设置631、应用程序633、应用程序配置设置635、数据存储库637、通信驱动程序639和通信配置设置641。存储器621可以包括所有类型的有形易失性和非易失性计算机可读存储器装置。其还可以包括计算机存储介质(下文描述)。存储器621存储计算机可读指令，这些指令当由处理器617执行时，使得处理器根据这些指令执行计算机实现的步骤或功能。处理器617也可以由其他部件激活以促进其功能。明确设想了虽然物理存储器存储621被示出为装置的一部分，但是云计算选项(其中使用远程服务来完成一些数据和/或处理)为可用的。

图9示出了装置也可以为智能电话771。智能电话771具有显示图标或图块或其他用户输入机制775的触敏显示器773。机制775可以由用户用来运行应用程序、打电话、执行数据传输操作等。一般来讲，智能电话771被构建在移动操作系统上，并且提供比非智能电话更先进的计算能力和连通性。需注意，装置的其他形式是可能的。

图10是其中可部署本文描述的系统和方法的元素或(例如)其部分的计算环境的一个示例。参考图10，用于实施一些实施方案的示例性系统包括呈计算机810形式的通用计算装置。计算机810的部件可以包括但不限于处理单元820(其可以包括处理器)、系统存储器830和将包括系统存储器的各种系统部件耦接到处理单元820的系统总线821。系统总线821可以是若干类型的总线结构中的任何一种总线结构，该总线结构包括存储器总线或存储器控制器、外围总线以及使用多种总线架构中的任何一种总线架构的本地总线。相对于本文所述的系统和方法描述的存储器和程序可被部署在图10的对应部分中。

计算机810通常包括多种计算机可读介质。计算机可读介质可以是可由计算机810访问的任何可用介质，并且包括易失性/非易失性介质和可移动/不可移动介质两者。作为示例并且非限制性地，计算机可读介质可以包括计算机储存介质和通信介质。计算机存储介质不同于，并且不包括调制的数据信号或载波。计算机存储介质包括硬件存储介质，该硬件存储介质包括在任何方法或技术中实施的易失性/非易失性和可移动/不可移动介质，以用于存储如计算机可读指令、数据结构、程序模块或其他数据等信息。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存存储器或其他存储器技术、CD-ROM、数字通用光盘(DVD)或其他光盘存储装置、磁带盒、磁带、磁盘存储装置或其他磁性存储装置，或可用于存储期望信息并且可由计算机810访问的任何其他介质。通信介质可以在运输机制中体现计算机可读指令、数据结构、程序模块或其他数据，并且包括任何信息递送介质。术语“已调制数据信号”是指以对信号中的信息进行编码的方式来设定或改变其一个或多个特征的信号。

系统存储器830包括呈易失性和/或非易失性存储器形式的计算机存储介质，诸如只读存储器(ROM)831和随机存取存储器(RAM)832。含有有助于在计算机810内的元件之间传输信息的基本例程(诸如在启动期间)的基本输入/输出系统833(BIOS)通常存储在ROM831中。RAM 832通常含有处理单元820立即可访问和/或当前正在操作的数据和/或程序模块。作为示例并且非限制性地，图10示出了操作系统834、应用程序835、其他程序模块836和程序数据837。

计算机810还可以包括其他可移除/不可移除和易失性/非易失性计算机存储介质。仅作为示例，图10示出了硬盘驱动器841，该硬盘驱动器对不可移除、非易失性磁介质、非易失性磁盘852、光盘驱动器855和非易失性光盘856进行读取或写入。硬盘驱动器841通常通过不可移除的存储器接口(诸如接口840)连接到系统总线821，并且光盘驱动器855通常通过可移除的存储器接口(诸如接口850)连接到系统总线821。

可替代地或另外地，本文所述的功能能够至少部分地由一个或多个硬件逻辑组件执行。例如，但不限于，能够使用的说明性类型的硬件逻辑组件包括现场可编程门阵列(FPGA)、专用集成电路(例如，ASIC)、专用的标准产品(例如，ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等。

上文讨论并在图10中所示出的驱动器及其相关联的计算机存储介质为计算机810提供了计算机可读指令、数据结构、程序模块和其他数据的存储。在图13中，例如，硬盘驱动器841被示出为存储操作系统844、应用程序845、其他程序模块846和程序数据847。需注意，这些部件可与操作系统834、应用程序835、其他程序模块836和程序数据837相同或不同。

用户可通过诸如键盘862、麦克风863和指向装置861(诸如鼠标、轨迹球或触摸板)等输入装置将命令和信息输入到计算机810中。其他输入装置(未示出)可以包括操纵杆、游戏板、卫星接收器、扫描仪、手势识别装置等。这些和其他输入装置通常通过耦接到系统总线的用户输入接口860连接到处理单元820，但可通过其他接口和总线结构连接。视觉显示器891或其他类型的显示装置也经由接口(诸如视频接口890)连接到系统总线821。除了监视器之外，计算机还可以包括其他外围输出装置，诸如扬声器897和打印机896，其可以通过输出外围接口895连接。

计算机810使用逻辑连接(诸如局域网(LAN)或广域网(WAN))在与一个或多个远程计算机(诸如远程计算机880)的联网环境中操作。计算机还可以通过另一个有线连接来连接到网络。也可以使用无线网络，诸如WiFi。

当在LAN联网环境中使用时，计算机810通过网络接口或适配器870连接到LAN871。当在WAN联网环境中使用时，计算机810通常包括调制解调器872或用于通过WAN 873(诸如互联网)建立通信的其他装置。在联网环境中，程序模块可以存储在远程存储器存储设备中。例如，图10示出了远程应用程序885可驻留在远程计算机880上。

在优选实施方案的具体描述中参考了附图，这些附图示出了可实践本发明的具体实施方案。例示的实施方案并非旨在详尽列举根据本发明的所有实施方案。应当理解，在不脱离本发明范围的情况下，可利用其他实施方案，并且可进行结构性或逻辑性的改变。因此，不能认为以下的详细描述具有限制意义，并且本发明的范围由所附权利要求书限定。

除非另外指明，否则本说明书和权利要求书中所使用的表达特征尺寸、量和物理特性的所有数在所有情况下均应理解成由术语“约”修饰。因此，除非有相反的说明，否则在上述说明书和所附权利要求书中列出的数值参数均为近似值，这些近似值可根据本领域的技术人员利用本文所公开的教导内容来寻求获得的期望特性而变化。

除非内容另外明确指明，否则如本说明书和所附权利要求书中所使用的，单数形式“一个/种”和“所述”涵盖了具有多个指代物的实施方案。除非内容另外明确指明，否则如本说明书和所附权利要求书中使用的，术语“或”一般以其包括“和/或”的意义采用。

如果在软件中实施，那么该技术可至少部分地通过包括指令的计算机可读介质来实现，这些指令当在处理器中执行时执行上文所述方法中的一种或多种。计算机可读介质可包括有形计算机可读存储介质，并且可形成计算机程序产品的一部分，计算机程序产品可包括包装材料。计算机可读存储介质可包括随机访问存储器(RAM)诸如同步动态随机访问存储器(SDRAM)、只读存储器(ROM)、非易失性随机访问存储器(NVRAM)、电可擦可编程的只读存储器(EEPROM)、闪存(FLASH)存储器、磁性或光学的数据存储介质等。计算机可读存储介质还可包括非易失性存储设备，诸如硬盘、磁带、光盘(CD)、数字多用光盘(DVD)、蓝光光盘、全息数据存储介质或其他非易失性存储设备。

如本文所用的术语“处理器”可指适用于实施本文所述的技术的前述结构中的任一者或任何其他结构。此外，在一些方面，本文所述的功能可提供在被配置成用于执行本公开的技术的专用软件模块或硬件模块内。即使在软件中实施，该技术也可使用用于执行软件的硬件例如处理器、以及用于存储软件的存储器。在任何此类情况下，本文所述的计算机可定义能够执行本文所述的特定功能的特定机器。另外，该技术可在也可被视为处理器的一个或多个电路或逻辑元件中全面实施。

呈现了一种个人防护设备装置，该个人防护设备装置包括被配置为将经修改的声音提供给用户的扬声器。PPE装置还包括被配置为捕获环境声流的麦克风。PPE装置还包括声音分析器，该声音分析器从麦克风接收环境声流并且识别环境声音中的第一声音。PPE装置还包括声音处理器，该声音处理器基于声音识别来将模型应用于第一声音，以获得经修改的第一声音。模型改变经识别的声音的特性，并且经修改的声音被提供给扬声器。模型包括本地存储在个人防护设备装置的存储器内的模型数据库中的算法。

装置可以被实现为使得模型数据库通信地耦接到包括多个可下载的模型的远程数据库。

装置可以被实现为使得该多个模型中的一个模型包括源自第三方的经下载的模型。

装置可以被实现为使得模型包括放大器，并且声音由声音处理器来放大。

装置可以被实现为使得模型包括消除器，并且声音由声音处理器来进行去除。

装置可以被实现为使得模型包括减小器，并且声音由声音处理器来减小。

装置可以被实现为使得模型包括警示叠层，并且将警示叠层添加到经识别的声音或经重组的声音部分。

装置可以被实现为使得模型为第一模型并且声音分析器识别第二声音，并且将第二模型应用于第二声音以获得经修改的第二声音。

装置可以被实现为使得第二模型与第一模型不同。

装置可以被实现为使得经修改的声音为经修改的第一声音，并且声音处理器将经修改的第一声音与经修改的第二声音重组以获得经修改的声音。

装置还可以包括被配置为从第二装置接收模型的通信部件。

装置可以被实现为使得通信部件在2.4GHz协议或5GHz协议下操作。

装置可以被实现为使得装置为听力保护装置，并且听力保护装置提供电平相关的听力保护。

装置可以被实现为使得听力保护装置为入耳式听力保护装置。

装置可以被实现为使得听力保护装置为包耳式头戴式耳机。

装置可以被实现为使得听力保护装置为入耳式听力保护单元。

装置可以被实现为使得装置为动力驱动的空气净化呼吸器。

装置可以被实现为使得装置为具有听力保护单元的焊接头盔。

装置可以被实现为使得如果声音部分由声音分析器检测到并且未经辨认，则使用通信部件来将该声音部分提供给第二装置。

装置可以被实现为使得经修改的声音包括经重组的第一经修改的声音与第二经修改的声音。

装置可以被实现为使得经修改的声音包括环境声音，其中经修改的声音小于第一声音。

装置可以被实现为使得模型数据库包括经下载的模型。

呈现了一种声学模型管理系统，其包括声音数据库，该声音数据库包括多个声音对象。系统还包括模型数据库，该模型数据库包括多个模型，该多个模型中的每个模型适用于声音对象中的一个或多个声音对象。系统还包括声音解析系统。声音解析系统包括：声音接收器，其被配置为接收声流；声音分析器，其被配置为从声流解析多个声音部分；声音选择器，其被配置为选择该多个声音部分中的一个声音部分，以用于进行操纵；以及模型生成器，其被配置为生成用于应用于经选择的声音部分的模型。经生成的模型以及与经选择的声音部分相对应的声音对象被存储在模型数据库中。系统还包括用户界面生成器，该用户界面生成器被配置为生成用户界面以供用户与声音解析系统进行交互，使用声音选择器来选择声音部分，以及使用模型生成器来生成模型。系统还包括下载管理器，该下载管理器被配置为将经识别的声音部分和经生成的模型提供给个人防护设备装置存储器；使得个人防护设备装置的处理器可以自动识别传入音频流中的声音部分；并且自动应用经生成的模型，使得当被识别时，在向用户广播之前根据模型来操纵声音类型。

声学模型管理系统可以被实现为使得用户通过选择用于应用于声音部分的模型函数来生成模型。模型函数为放大、减小、均衡或消除函数。

声学模型管理系统可以被实现为使得模型函数还包括将叠层应用于声音部分。叠层为警示叠层或与声音部分相对应的标记。

声学模型管理系统可以被实现为使得声音接收器从个人防护设备装置接收声流。

声学模型管理系统可以被实现为使得声音接收器从计算装置接收声流。

呈现了一种在个人防护设备装置中处理声音的方法。方法包括接收环境声流。方法还包括使用模型应用程序引擎来将环境声音解析成多个声音对象。方法还包括使用声音分析器来识别声音对象中的一个声音对象。方法还包括基于经识别的声音对象来从模型数据库检索模型。方法还包括：通过将经检索的模型应用于经识别的声音对象以获得经修改的声音对象以及将该多个声音对象重组到经修改的声音中来处理环境声音。经修改的声音包括经修改的声音对象而不是经识别的声音对象。方法还包括通过个人防护装置的扬声器来向个人防护装置的佩戴者广播经修改的声音。

方法可以被实现为使得通过定位在个人防护装置的外部上的麦克风来接收环境声音。

方法可以被实现为使得个人防护设备装置为入耳式听力保护装置、包耳式听力保护装置、焊接头盔或动力驱动的空气净化呼吸器。

方法还可以包括：使用声音分析器来识别第二声音对象，基于经识别的第二声音对象来从模型数据库检索模型，将经识别的第二声音对象处理成第二经修改的声音对象，以及将第一经修改的声音对象和第二经修改的声音对象重组到经修改的声音中。

方法还可以包括：将该多个声音对象中的一个声音对象识别为未知声音对象，以及将未知声音对象发送到第二装置以用于进行识别。

方法还可以包括：将电平相关的函数应用于未知声音对象，以及将该未知声音对象重组到经修改的声音对象中。

方法还可以包括：接收与未知声音对象相对应的新的模型，

将新的模型应用于未知声音对象，以及将该未知声音对象重组到经修改的声音对象中。

方法可以被实现为使得当接收到声流时，自动完成解析、识别、检索和处理的步骤。

实施例

实施例1：辨认声音部分

在数据集上训练机器学习(ML)模型，以将音频分类到不同的类别中。如图11A所示，音频输入经受了特征提取、audioset嵌入、所应用的机器学习建模和类别决定。

为了实现这一点，首先使用在Hershey等人，CNN Architectures for Large- Scale Audio Classification,International Conference on Acoustics,Speech andSignal Procesing(ICASSP),IEEE(2017)中描述的VGG启发的声学模型来提取用于模型的音频特征。在YouTube-8M片段数据集的初步版本上训练该模型。特征被PCA化和量化，以与提供有YouTube-8M的音频特征兼容。

在Audioset数据集上训练机器学习(ML)模型，以将音频分类到不同的类别中。AudioSet数据集为从YouTube视频中抽取的人类标记的10秒声音剪辑的大规模集合。特征嵌入和提取使用由google提供的受过预训练的模型来完成。ML模型正在使用嵌入步骤的输出并且运行分类(这可以为标准分类模型，但是也可以包括深度学习模型，诸如多层感知器(MLP)或长短期记忆(LSTM)网络。

如图11B中所示，针对可能与所捕获的声音匹配的多个可能声音中的每个可能声音而生成概率。图11C示出了如何基于声音对象的数据库来将经解析的声音部分识别为链锯。

图11D示出了用作用于测量模型性能的度量的准确度和损失。准确度描述了机器学习模型用于预测正确类别的准确度。损失是为其进行优化的机器学习模型的内部度量(损失->0)。在训练期间的神经网络内，将数据呈现给模型若干次。每个循环为一个学习周期。

实施例2：声音模型管理用户界面

图12示出了用于声音模型管理系统的示例性用户界面。可以示出多个经下载的模型。每个模型均可以被更新或可由模型发起人来进行更新，并且因此可具有版本号和创建日期。可以列出下载或可用日期，以及给定模型是否已经下载的状态。

Claims

1.一种个人防护设备装置，所述个人防护设备装置包括：

扬声器，所述扬声器被配置为将经修改的声音提供给用户；

麦克风，所述麦克风被配置为捕获环境声流；

声音分析器，所述声音分析器从所述麦克风接收所述环境声流并且识别环境声音中的第一声音；

声音处理器，所述声音处理器基于声音识别来将模型应用于所述第一声音，以获得经修改的第一声音，其中所述模型改变经识别的声音的特性，并且其中所述经修改的声音被提供给所述扬声器；以及

其中所述模型包括本地存储在所述个人防护设备装置的存储器内的模型数据库中的算法。

2.根据权利要求1所述的装置，其中所述模型数据库通信地耦接到包括多个可下载的模型的远程数据库。

3.根据权利要求1或2所述的装置，其中多个模型中的一个模型包括源自第三方的经下载的模型。

4.根据权利要求1至3中的任一项所述的装置，其中所述模型包括放大器，并且其中所述声音由所述声音处理器来放大。

5.根据权利要求1至4中的任一项所述的装置，其中所述模型包括消除器，并且其中所述声音被所述声音处理器去除。

6.根据权利要求1至5中的任一项所述的装置，其中所述模型包括减小器，并且其中所述声音由所述声音处理器来减小。

7.根据权利要求1至6中的任一项所述的装置，其中所述模型包括警示叠层，并且其中将警示叠层添加到所述经识别的声音或经重组的声音部分。

8.根据权利要求1至7中的任一项所述的装置，其中所述模型为第一模型并且其中所述声音分析器识别第二声音，并且将第二模型应用于所述第二声音以获得经修改的第二声音。

9.根据权利要求8所述的装置，其中所述第二模型与所述第一模型不同。

10.根据权利要求8所述的装置，其中所述经修改的声音为经修改的第一声音，并且其中所述声音处理器将所述经修改的第一声音与所述经修改的第二声音重组以获得所述经修改的声音。

11.根据权利要求8所述的装置，并且所述装置还包括通信部件，所述通信部件被配置为从第二装置接收模型。

12.根据权利要求11所述的装置，其中所述通信部件在2.4GHz协议或5GHz协议下操作。

13.根据权利要求1至12中的任一项所述的装置，其中所述装置为听力保护装置，并且其中所述听力保护装置提供电平相关的听力保护。

14.根据权利要求13所述的装置，其中所述听力保护装置为入耳式听力保护装置。

15.根据权利要求13所述的装置，其中所述听力保护装置为包耳式头戴式耳机。

16.根据权利要求13所述的装置，其中所述听力保护装置为入耳式听力保护单元。

17.根据权利要求1至16中的任一项所述的装置，其中所述装置为动力驱动的空气净化呼吸器。

18.根据权利要求1至17中的任一项所述的装置，其中所述装置为具有听力保护单元的焊接头盔。

19.根据权利要求11所述的装置，并且其中，如果声音部分由所述声音分析器检测到并且未经辨认，则使用所述通信部件来将所述声音部分提供给所述第二装置。

20.根据权利要求1至19中的任一项所述的装置，其中所述经修改的声音包括经重组的第一经修改的声音与第二经修改的声音。

21.根据权利要求1至20中的任一项所述的装置，其中所述经修改的声音包括所述环境声音，其中所述经修改的声音小于所述第一声音。

22.根据权利要求1至21中的任一项所述的装置，其中所述模型数据库包括经下载的模型。

23.一种声学模型管理系统，所述声学模型管理系统包括：

声音数据库，所述声音数据库包括多个声音对象；

模型数据库，所述模型数据库包括多个模型，所述多个模型中的每个模型适用于所述声音对象中的一个或多个声音对象；

声音解析系统，所述声音解析系统包括：

声音接收器，所述声音接收器被配置为接收声流；

声音分析器，所述声音分析器被配置为从所述声流解析多个声音部分；

声音选择器，所述声音选择器被配置为选择所述多个声音部分中的一个声音部分，以用于进行操纵；以及

模型生成器，所述模型生成器被配置为生成应用于经选择的声音部分的模型，其中经生成的模型以及与所述经选择的声音部分相对应的声音对象被存储在所述模型数据库中；

用户界面生成器，所述用户界面生成器被配置为生成用户界面以供用户与所述声音解析系统进行交互，使用所述声音选择器来选择所述声音部分，以及使用所述模型生成器来生成模型；以及

下载管理器，所述下载管理器被配置为将所述经识别的声音部分和所述经生成的模型提供给个人防护设备装置存储器，使得所述个人防护设备装置的处理器能够自动识别传入音频流中的所述声音部分，并且自动应用所述经生成的模型，使得当被识别时，在向用户广播之前根据所述模型来操纵声音类型。

24.根据权利要求23所述的声学模型管理系统，其中所述用户通过选择用于应用于所述声音部分的模型函数来生成所述模型，其中所述模型函数为放大、减小、均衡或消除函数。

25.根据权利要求24所述的声学模型管理系统，其中所述模型函数还包括将叠层应用于所述声音部分，其中所述叠层为警示叠层或与所述声音部分相对应的标记。

26.根据权利要求23至25中的任一项所述的声学模型管理系统，其中所述声音接收器从个人防护设备装置接收所述声流。

27.根据权利要求23至26中的任一项所述的声学模型管理系统，其中所述声音接收器从计算装置接收所述声流。

28.一种在个人防护设备装置中处理声音的方法，所述方法包括：

接收环境声流；

使用模型应用程序引擎来将环境声音解析成多个声音对象；

使用声音分析器来识别所述声音对象中的一个声音对象；

基于经识别的声音对象来从模型数据库检索模型；

通过将经检索的模型应用于所述经识别的声音对象以获得经修改的声音对象以及将所述多个声音对象重组到经修改的声音中来处理所述环境声音，其中所述经修改的声音包括所述经修改的声音对象而不是所述经识别的声音对象；以及

通过个人防护装置的扬声器来向所述个人防护装置的佩戴者广播所述经修改的声音。

29.根据权利要求28所述的方法，其中通过定位在所述个人防护装置的外部上的麦克风来接收所述环境声音。

30.根据权利要求28或29所述的方法，其中所述个人防护设备装置为入耳式听力保护装置、包耳式听力保护装置、焊接头盔或动力驱动的空气净化呼吸器。

31.根据权利要求28至30中的任一项所述的方法，其中所述方法还包括：

使用所述声音分析器来识别第二声音对象；

基于经识别的第二声音对象来从模型数据库检索模型；

将所述经识别的第二声音对象处理成第二经修改的声音对象；以及

将第一经修改的声音对象和所述第二经修改的声音对象重组到所述经修改的声音中。

32.根据权利要求28至31中的任一项所述的方法，并且所述方法还包括：

将所述多个声音对象中的一个声音对象识别为未知声音对象；以及

将所述未知声音对象发送到第二装置以用于进行识别。

33.根据权利要求32所述的方法，并且所述方法还包括：将电平相关的函数应用于所述未知声音对象，以及将所述未知声音对象重组到所述经修改的声音对象中。

34.根据权利要求32所述的方法，并且所述方法还包括：

接收与所述未知声音对象相对应的新的模型；

将所述新的模型应用于所述未知声音对象；以及

将所述未知声音对象重组到所述经修改的声音对象中。

35.根据权利要求28至34中的任一项所述的方法，其中当接收到所述声流时，自动完成解析、识别、检索和处理的步骤。