CN108028047A

CN108028047A - 用于生成数据库的方法和设备

Info

Publication number: CN108028047A
Application number: CN201680048686.9A
Authority: CN
Inventors: 托马斯·施波雷尔; 托比亚斯·克劳斯; 尤迪特·利伯特劳; 萨拉·克普林格; 迪特马·克普林格
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2015-06-30
Filing date: 2016-06-30
Publication date: 2018-05-11
Anticipated expiration: 2036-06-30
Also published as: US11003709B2; EP3317878A1; EP3317878B1; CN108028047B; CA2990891A1; KR20180025921A; CN108028048B; KR20180022967A; US20180121540A1; JP2018525664A; CA2990888A1; JP6602406B2; US20180122398A1; US11880407B2; EP3317879A1; KR102137537B1; CN108028048A; EP3317879B1; JP6654209B2; WO2017001611A1

Abstract

本发明的实施例提供了一种用于生成数据库的方法。该方法包括“接收环境噪声”的步骤，其可典型地包括干扰噪声和“迁移时间窗口的缓冲环境噪声”，诸如30秒或60秒或优选地多于5秒。另选地，该方法还可包括“导出关于环境噪声的参数集”和“对迁移时间窗口的参数集进行缓冲”的步骤。缓冲的环境噪声或缓冲的参数集通常指代为记录。此外，该方法包括“获得信号”的步骤，其识别环境噪声中多个信号类别(干扰噪声和非干扰噪声)中的一个信号类别(例如，干扰噪声)。第三个基本步骤是“响应于该信号，存储缓冲的记录”在诸如内部或外部存储器的存储器中。重复这些获得和存储的步骤，以便构建包括相同信号类别的多个缓冲记录的数据库。

Description

用于生成数据库的方法和设备

技术领域

本发明的实施例涉及一种方法和设备，并且生成具有几个信号类别的缓冲记录的数据库。

背景技术

例如，噪声可细分为信号类别，如干扰噪声和非干扰噪声。例如，也可想到细分为更多干扰的噪声和更少干扰的噪声。

并不总是容易对干扰噪声进行分类。知道存在影响噪声是否被感知为干扰噪声的不同因素是很重要的。鸟在主观上不会被感知为干扰噪声，甚至当其唧唧声很大(客观可测量参数：声压级)并且与其他环境噪声(客观可测量参数：动力学因素)明显不同时。然而，比起刚刚提到的鸟，显著较安静的飞机经过将被更多的测试人员感知为干扰噪声。

这里的后果是，例如使用当前的方法，为了允许预测噪声评估，当关于干扰噪声考察环境(如旅馆，旅馆或工作场所的健康区域)时，必须将评估留给测试人员。

例如，关于绝对响度或音量或相对于水平的纯粹自动化评估用作第一提示，但是不足以用于最终评估。因此，需要改进的方法。

发明内容

主要方面

本发明的目的是提供一种用于分类噪声的构思，如主观干扰噪声。

该目的通过独立权利要求的主题来实现。

本发明的实施例提供了一种用于生成数据库的方法。该方法包括“接收环境噪声”的步骤，该环境噪声示例性地包括干扰噪声，以及“迁移时间窗口的缓冲的环境噪声”，如30或60秒，或者优选地多于5秒。另选地，也可想到该方法包括“导出关于环境噪声的参数集”和“缓冲迁移时间窗口的参数集”的步骤。缓冲的环境噪声或缓冲的参数集通常被称为记录。此外，该方法包括“获得信号”的步骤，该信号识别环境噪声中的多个信号类别(干扰噪声和非干扰噪声)的一个信号类别(如干扰噪声)。第三个基本步骤是“响应于信号，将缓冲记录存储”于存储器中，如内部或外部的存储器。重复获得和存储这些步骤，以便建立包括相同信号类别的多个缓冲记录的数据库。

本发明的实施例基于以下发现：使用连续记录的设备并且存储环境中的相关位置，可建立在其中存储记录或特性(如记录的音频指纹或心理声学参数)，使得能够在稍后时间识别这样的声音序列的数据库。这里的构思假设了“识别主观干扰噪声或者类别的噪声”的步骤由人使用按钮或者按键或不同的输入接口示例性地识别或者标记干扰噪声或者信号类别来执行。该信号用作为用于切断序列或从当前连续运行中提取特性并将其存储在存储器中以建立数据库的指示符。因此，可容易地建立用于明确地关联声音描述参数的干扰噪声或分类器的库，这允许之后预测主观噪声感知。

对应于实施例，通过包括如音量、动态、范围、动态增加、频谱、单调或重复字符的各个参数的参数(如音频指纹)，或者通过如清晰度、粗糙度、音调、变化的强度或音量的心理声学参数，可描述主观干扰噪声。因此，根据另一实施例，该方法包括确定用于缓冲记录的音频指纹或确定心理声学参数的步骤。通常，将记录或音频指纹存储在数据库中是足够的，而心理声学参数表示附加信息。音频指纹的优点在于以匿名方式存储记录。

在从用户接口(如按钮)获得信号的单独步骤中，可获得主观评估当前识别的控制噪声的另一替代或附加信号。这种主观评估是将音频信号分配到信号类别(如很少干扰或高度干扰)。然后结合相应的部分或参数存储该主观评估。

根据另一实施例，除了部分或参数之外，还可存储时间戳。根据另一实施例，还可想到还存储例如来自GPS接收器的当前位置信息。为了不使数据库变得太大，以数据归纳的方式存储待缓冲的数据也是可行的。

这里要指出的是，根据实施例，存储器或数据库被直接包含在执行方法的相应设备中，或者根据另一个实施例，也可提供在外部。

另一实施例涉及对应的设备。所述设备包括用于连续记录的麦克风、用于缓冲的缓冲器、用于接收信号的接口以及用于存储与属于所识别的干扰噪声的信号类别相关的记录(音频文件、音频指纹或心理声学参数)的另一存储器。根据另一实施例，该设备可包括输入接口(如按钮)，使用该输入接口可确认主观干扰噪声的存在，或者通常可将噪声分配到信号类别。输入装置也可通过分类成几个信号类别中的一个(即通过评估)进行扩展。根据另一实施例，设备还可包括通信接口，通过该通信接口连接外部存储器(外部数据库)。

从属权利要求中限定了其它的改进。

其它方面

本发明的实施例提供一种用于识别多个信号类别(如干扰噪声和非干扰噪声)的一个信号类别(如干扰噪声)的噪声的方法。该方法包括“接收环境噪声”和“确立环境噪声或从环境噪声导出的参数集是否满足描述多个信号类别的一个信号类别的预定义的规则”的步骤。从这里开始，执行以下步骤：“存入已经满足预定义规则”、“记录接收到的迁移时间窗口的环境噪声”、“从迁移时间窗口的环境噪声中导出参数集并且存储该参数集”或者“发出用于识别噪声的另一个设备的激活信号”。

该方面的实施例基于以下发现：根据上面描述的方法借助于上述设备可确定的数据库，如通过将当前噪声环境与来自数据库的噪声或从数据库获得的或存储在数据库中的参数(如音频指纹)进行比较，有可能识别主观上感知到的干扰噪声的存在。该方法可以自动方式执行，并且可单独使用存储的数据库来允许对噪声状况(鸟的鸣叫对空气调节)的评估进行预测，而不需要人类进行的任何主观评估。

通过将环境噪声与先前缓冲的环境噪声进行比较，或者通过将当前导出的参数数据集(音频指纹)与先前确定的参数数据集进行比较，或者通过导出心理声学参数并将其与其预定的阈值进行比较，可示例性地完成识别规则匹配。

另一个实施例涉及一种用于识别多个信号类别的一个信号类别的噪声的设备。该设备包括用于连续监听当前环境噪声的麦克风、用于将当前环境噪声与存储在数据库中的数据进行比较的处理器(记录干扰噪声或描述干扰噪声的参数)以及用于一旦在当前的环境中已经识别出干扰噪声就输出信息的接口。在这里，数据(如之前确定的记录)和之前确定的音频指纹或之前确立的心理声学参数的阈值可存储在内部或者根据另一实施例，使用例如已经根据另一方面可确定的数据库在外部读取。

根据这些被识别的客观干扰噪声或一个信号类别，信息可进一步单独地处理，或者结合时间的指示、位置的指示或将干扰噪声分类成类别中的一个类别(对应的干扰组：轻微干扰、干扰、高度干扰)。根据优选的实施例，这些信息被输出到外部数据库。

由于在该实施例中仅提供对位置或该一个位置的评估，或者根据其它的实施例，也可想到将该评估扩展到若干个位置，如空间或室外环境中的若干个位置，即若干相邻位置(如分布在一个城市)。因此，另一实施例提供了一种方法，其中针对两个相邻位置接收“记录”、“比较”和“输出”的步骤。当存在两个相邻位置的信息时，例如，可确定第一位置和第二位置的记录之间的关系，以便确定主观感知的干扰噪声的移动、空间扩展或方向。

根据另一实施例，类似于识别干扰噪声，也可想到识别不同的序列(如控制指令)，使用该序列输出对应的控制信号。在这里，与控制信号相关联的记录可以是语音命令，或者如前所述，被分类为干扰噪声的声音信号。例如，控制信号由自身执行该方法的设备输出，使得例如开始记录，或外部设备，如通过控制信号切换到记录模式的、布置在不同位置处的另一个设备。

根据其它的实施例，上面概述的设备还可包括通信接口，用于与数据库通信以读取之前确定的干扰噪声或参数，或者用于输出关于干扰噪声的信息。根据其它的实施例，设备也有可能使用该通信接口与另一个设备进行通信，使得可针对两个相邻位置获得和/或分析干扰噪声。

子方面的实施例提供了一种用于分析信号类别的噪声的方法。该方法包括在第一位置和第二位置处连续记录当前环境噪声的步骤。在这里，记录进而意味着直接记录环境噪声，或者从与环境噪声有关的参数集(如音频指纹或心理声学参数)导出环境噪声。另外，对于每个记录，执行与先前获得的主观感知的干扰噪声的记录或描述干扰噪声的参数的比较，以便识别每个位置(第一位置和第二位置)的干扰噪声。记录之间的关系可根据在不同位置处包括一个干扰噪声的两个记录(第一记录和第二记录)来确定，以便能够更精确地分析所产生的干扰噪声，例如相对于其位置、扩展或运动。

该方面的实施例基于以下发现：使用两个不同位置处的同一个干扰噪声的两个记录的关系有可能获得关于干扰噪声本身的扩展信息。在这里，首先识别相应环境中(即，在第一位置和第二位置处)的干扰噪声，并且其在被识别时与彼此相关。有利地，在这里有可能获得关于干扰噪声的移动或干扰噪声的扩展或干扰噪声的传播方向的信息。另外，也有可能区分局部干扰噪声(即仅在一个位置处)和全局事件(即在几个位置处发生的事件)。使用该方法有可能识别特性噪声事件及其移动的传播。

根据实施例，确定第一记录和第二记录之间的关系的步骤通过分析第一记录和第二记录之间的水平差来完成。另选地或除此之外，在确定关系的步骤中也可能确立时间偏移，即在两个不同位置处确立的两个记录中的事件之间的延迟时间或运行时间偏移。另外，还可关于频率和霍尔效应的差异来评估两个记录。使用所有这些分析参数，有可能确定噪声源和记录位置之间的距离，因为声音通常随着距离的增加而减小，并且/或者存在频移，使得上频率被抵消了。

根据另一实施例，该方法包括分析相对于第一位置和第二位置之间的距离的音频事件或各个源，相对于主观干扰噪声源的移动进行分析，以及/或者相对于主观干扰噪声源的数量进行分析。例如，这三种分析基于评估第一记录和第二记录之间的关系，即根据比较上述因素。

在该方面要提到的是，优选地使用迁移时间窗口来进行连续记录。此外，与上述方面一样，也可想到从外部读取要进行比较的噪声。

在这里要指出的是，该方法当然可扩展到第三位置。

在根据该方面的实施例中，当已经在第一位置处确定了干扰信号时，可在第二位置处开始记录，以便允许对传播的干扰信号进行时间分析。

另一实施例涉及一种用于分析一个信号类别的信号的系统。该系统包括具有一个麦克风的两个单元，每个单元用于连续记录当前环境噪声。两个单元可定位在不同的位置处，如相邻的位置。在这里，“记录”再次意指直接记录环境噪声并且从参数(如音频指纹)导出环境噪声。此外，该系统包括至少一个处理器，该处理器可集成在第一单元或第二单元中，并且被配置为通过将第一和第二单元的第一记录和第二记录与之前获得的至少一个记录/信号类别的信号的音频指纹或描述信号类别的信号的参数进行比较来识别噪声。另外，处理器被配置为确立第一记录和第二记录之间的关系。

根据实施例，两个单元可经由通信接口(如无线电接口)连接到彼此。

根据另一实施例，提供了用于执行上述方法中的一个方法的计算机程序。

附图说明

下面将参考附图讨论本发明的实施例，其中：

图1a是用于说明根据基本变型中方面1“建立数据库”的方法的流程图；

图1b是用于说明根据方面1的扩展方法的流程图；

图1c至1f示出了方面1的设备的变型；

图2a是用于说明方面2“识别信号类别的噪声”的对应的基本变型的方法的流程图；

图2b是方面2的扩展实施例的流程图；

图2c是方面2的设备的示意性框图；

图3a是用于说明方面3“分析各个信号类别的噪声”的基本变型的方法的流程图；

图3b是方面3的设备的示意性框图。

在下面更详细地讨论本方面的实施例之前，需要指出的是，相同效果的元件和结构具有相同的附图标记，使得其描述可相互适用或可互换。

具体实施方式

图1a示出了用于建立数据库的方法100，该方法包括“使用麦克风11接收和记录110和信号接收”120的步骤。当已经接收到信号120时(参见判定125的地方)，将步骤110的记录存储在数据库中，其使用步骤130示出。该步骤130基本上表示基本方法100的结束(参见端点135)。

关于“记录110”的步骤要指出的是，在记录时，通常可存在编码的子步骤。编码也可被实现为使得获得所谓的音频指纹，即用于记录的特性参数的导出。与记录相比较时，该音频指纹被强烈地压缩并因此被匿名化，其中，音频指纹仍然允许使用音频指纹来识别可比较的噪声，即相同类别的噪声。通常，可描述音频指纹，使得其作为音频信号的表示，该表示代表了音频信号的所有基本特征，使得能够进行随后的分类。音频指纹通常不足以允许解码以形成真实的音频信号，并且因此保护了隐私。类似地，或并行于编码，可存在导出描述记录的参数(如心理声学参数)的子步骤。

记录过程110也可被描述为环形缓冲器，因为记录通常会被重复覆盖，并且因此仅缓冲预定的周期，如例如120秒、60秒或30秒，或者通常多于5秒。该环形缓冲器还提供了满足隐私要求的优点。当获得信号120时，使用步骤130，将上一周期的环境噪声的该时间窗口存储或最终存储在另一存储器(如数据库)中，使得其稍后可用。为了有效地建立数据库，针对一个或不同信号类别的若干信号重复执行方法100。

该方法100用于建立数据库，其中识别了麦克风11接收(即记录)的主观干扰噪声。当用户已经识别到环境中的干扰噪声时，使用由用户执行的步骤完成识别，该步骤使用按钮12(或者通常为用户输入接口12)来示例性地执行“信号120输出”步骤。因为麦克风110监听环境噪声并且在步骤110中对这些环境噪声进行缓冲，所以这些干扰噪声也被记录，使得可将缓冲记录或其一部分存储在用于建立数据库的永久存储器中(参见步骤130)。在用户没有识别到干扰噪声的情况下，将重复该方法，使用了从主观评估(判定元素125)到开始点101的箭头来说明该过程。

该方法的优点在于，以这种方式可建立足够宽的数据库，该数据库包括与主观感知干扰噪声相关联的多个记录或参数(如音频指纹)。

在这里要指出的是，该过程会造成信号的时间点对时间窗口的相关性。示例性地，在信号的时间处的时间窗口的开始在信号的时间之前相距固定距离，如30秒或60秒，这会造成相关性。另外，时间窗口的结束还可取决于信号的时间，使得信号的时间与时间窗口的结束一致，或者例如存在5秒的时间距离(在信号的时间之前结束)。通常，对相关性进行选择，使得记录时间窗口将总是在信号的时间之前，其中信号也可在时间窗口内。

图1b示出了扩展方法100'，该方法也允许建立数据库，但是具有扩展信息。方法100'通常基于方法100，并且其过程受到开始101和结束135的限制。因此，方法100'还包括以下基本步骤：记录110'、接收120'相关于主观噪声评估或者通常相关于将接收的信号分配成来自多个信号类别(如非干扰噪声、轻微干扰噪声和高度干扰噪声)中的一个信号类别(如干扰噪声)的信号，以及像使用数据库一样存储缓冲记录130。另外，步骤130和120'通过判定点125连接。

在该实施例中，记录步骤110'被细分成两个子步骤，即110a'和110b'。例如，步骤110a涉及计算心理声学参数，如粗糙度、清晰度、音量、音调和/或变化强度。步骤110b被归纳为确定描述该记录的音频指纹，使得之后可再次使用音频指纹识别特性特征。

可存在不同的输入装置来执行主观噪声评估的步骤120'。这些是“使用执行方法100'的设备上的按键或按钮的评估(参考附图标记12a')，使用问卷使主观噪声评估关联(参考附图标记12b')，或者使用智能设备评估(参考附图标记12c')。为了执行主观噪声评估120'的步骤，可单独或组合使用这三个评估变型12a'、12b'和12c'。一旦存在评估(参考判定点125)，心理声学参数(附图标记110a')和/或音频指纹(参考附图标记110b')就会被存储在存储器中，其在步骤130中示出。

根据其它的实施例，除了纯粹的参数或指纹或者音频记录的部分之外，还可添加时间和/或位置信息。这些也在步骤130中被存储并且源于另一个步骤132，该步骤对应地包括：确定当前位置和/或确定当前时间。

当数据库已经建立并且具有对应的大小(参考步骤130)时，其可如在步骤132中所示的那样通过相关或统计评估来进行评估。

上述方法100和100'的典型应用情况是例如设备位于旅馆房间中并且监视当前的环境噪声。当旅馆的客人想要在其旅馆的房间里安静和宁静，但是干扰噪声阻止其这样做时，他或她可标记这些干扰噪声。这可能会造成这样的结果，即房间的声音可能不会太大，但是可能存在一定的噪声，如阻止客人入睡的空气调节。使用该设备，他或她可执行主观评估，即分类为信号类别，如“干扰”、“非常干扰”或“高度干扰”。评估表征了使用不同参数评估的噪声情况。最后，音频指纹、心理声学参数，或者一般来说，与信号类别中的一个类型相关联的记录被存储在数据库中。

下面参考图1c、图1d和图1e讨论设备的三种变型。

图1c示出了第一设备变型，即设备20，其经由接口或无线电接口连接到实际的信号处理单元(未示出)，并且基本上被配置为发出用于识别干扰信号或特定信号类别的信号。在这里，本实施例中的设备22包括可执行主观评估的两个按钮24a和24b。这些按钮24a和24b与不同的信号类别相关联。

设备20可示例性地为智能设备(如平板电脑、智能手表、智能电话)，其包括集成在应用中的虚拟按钮24a和24b。该应用还可示例性地包含问卷，通过该问卷可从用户(如旅馆客人)收集一般质量的其它信息。

当操作按钮24a或24b时，在实际的数据收集设备中执行缓冲环境噪声或导出参数并且然后真正存储的方法。例如，该外部设备可以是在各个监视位置处具有麦克风的服务器。

图1d示出了另一种变型，其中，用于接收环境噪声的内部麦克风26集成在包括按钮24a和24b的设备20'中。除此之外或另选地，外部麦克风26e可经由接口连接到设备20'。

图1e示出了不再包括作为输入装置的按钮的设备20”的另一个变型，但是其仅包括内部麦克风26或任选的或另选的外部麦克风26e，并且使用可与信号类别的环境噪声相关联的该语音命令。

参考设备20'和20”，在这一点上应该注意，即也可连接几个外部麦克风。在这里也可想到，除了正常的空气传播声音之外，还记录结构传播声音(意味着各个设备包括结构传播声音接收器)。

参考图1c和图1d的实施例，需注意，不同的按钮24a和24b也可通过其它的按钮来扩展。为了区分按钮，可提供颜色编码：红色＝干扰、黄色＝无差别、绿色＝非常令人愉快的环境噪声(后者示例性地适用于当鸟鸣叫清晰可见但被感知为理想的噪声时)。

参考图1c至1d，需要提到的是，设备20、20'和20”可另外被集成为软件应用程序，并且另外集成在如智能电话、平板电脑或智能手表的设备中。这些软件应用程序能够允许以下功能：

-通过问卷调查技术或不同的主观获得技术扩展上述噪声质量的检测；

-使用存在于其它设备中的传感器系统(麦克风、GPS、倾斜传感器、生物反馈功能)；

-无线或(如果适用的话)与在这里开发的用于数据通信的设备的机械连接；

-使用这里开发的软件完全控制这里开发的设备。

图1f示出了设备20”'的部件。设备20”'包括麦克风26、用于校准麦克风的任选的校准装置26k以及处理单元42和存储器44。

处理装置42包括用于对音频文件进行编码或者用于导出音频指纹的预处理46，以及用于确定心理声学参数的单元48。预处理46的元数据和单元48的心理声学参数都被写入存储器44。另外，音频信号可通过例如由按钮控制的单元49更准确地存储或存储在存储器44中。

校准装置26k用于为所有传感器提供定义的灵敏度值。在这里，预先执行例如开关的测量或记录、频率响应或压缩。

根据所存储的音频样本、元数据(心理声学参数的音频指纹)以及借助于来自图1c至图1d的输入装置中的一个装置获得的标记，然后可执行借助于数据分析器50的实际数据分析，以及与各个信号类别的关联。

这里要指出的是，该设备通常是移动设备，因此通常可使用电池或蓄电池向其供应电力。另选地，常规的电源也是可行的。为了存储记录，该设备还可包括存储介质，如便携式存储介质(如SD卡)或与服务器的连接。通过有线或玻璃纤维接口或甚至无线电接口完成与服务器的连接。在协议层面上，存在不同的方式来做这个，其在这里将不再详细讨论。

为了提高可评估性，该设备还可包括用于与其他设备精确同步的装置，例如，如时间码或世界时钟。另外，也可想到将该设备耦接到位置确定单元(如GPS接收器)，或者将其集成在一起，以便确定哪个干扰噪声已经被确定在哪个位置或者被感知为是干扰的。

在这里要指出的是，对应于其它的实施例，方法100或100'还可包括预校准(参考校准装置26k)。这意味着，对应于实施例，上面讨论的方法100或100'包括校准的步骤。

关于方面1，要指出的是，对应于实施例，还可想到的是，所有这些设备都执行测量数据的数据归纳记录，以便归纳数据。数据归纳对于长期测量也可以是有利的。根据压缩或错误的程度，可确保隐私被保留，因为监视的数据可总是被压缩，使得基本上只有参数，如心理声学参数(粗糙度、清晰度、音调等)或音频指纹被记录。这里要再次指出的是，对于数据和消费者保护而言，是否记录或音频指纹或是仅仅心理声学参数的精确判定本质上受法律框架条件的影响。

如上面所讨论的，使用所谓的“音频指纹”，其中，存在将在下面更详细地讨论的其不同的变型。已经知道许多方法，使用这些方法可从音频信号中提取特征或指纹。美国专利号5,918,223公开了一种用于基于内容的分析、存储、恢复和分割音频信息的方法。音频数据的分析生成被称为特征向量的一组数值，其可用于对各个音频片段之间的相似度进行分类和排列等级。音频片段的音量、音高、音调的亮度、带宽和所谓的Mel频率倒谱系数(MFCC)被用作表征或分类音频片段的特征。每个块或帧的值被存储，然后相对于时间进行一阶求导。为了描述随时间的变化，根据其计算包括其一阶求导的这些特征中的每一个的统计量，如平均值或标准偏差。这组统计量形成特征向量。特征向量因此是音频片段的指纹并且可存储在数据库中。

Yao Wang等人在专家刊物“多媒体内容分析”(IEEE信号处理杂志，2000年11月，第12页至第36页)公开了用于对多媒体片段进行索引和表征的类似概念。为了确保音频信号与特定类别的有效关联，已经开发了许多特征和分类器。建议将时间范围特征或频率范围特征作为用于分类多媒体片段的内容的特征。这些包括音量、作为音频信号形状的基本频率的音高、频谱特征(如频带相对于总能量内容的能量内容)、频谱过程中的截止频率等。除了涉及所谓音频信号样本的每块尺寸的短时特征之外，建议与音频片段的较长周期有关的长期量。通过形成各个特征的时间差来形成其它的典型特征。块中获得的特征也很少像这样直接传递用于分类，因为他们表现出太高的数据速率。一种进一步处理的传统形式是计算短期统计。在这些统计中，例如，进行计算平均值、方差和时间相关系数。这降低了数据速率，并且另一方面导致改进了对音频信号的识别。

WO 02/065782描述了一种形成指纹以形成多媒体信号的方法。该方法涉及从音频信号中提取一个或几个特征。这里的音频信号被分成段，并且在每个段中进行块和频带的处理。以示例的方式提及了功率密度谱的能量、音调和标准偏差的逐频带计算。

从DE 101 34 471和DE 101 09 648已知一种用于分类音频信号的设备和方法，其中，通过音频信号的音调的量度来获得指纹。这里的指纹允许对音频信号进行稳健的、基于内容的分类。在这里提到的文件揭示了在音频信号上生成音调的量度的几种可能性。在这种情况下，将音频信号的段转换到频谱范围是计算音调的基础。然后可并行计算对于一个频带或所有频带的音调。然而，这种系统的缺点是，随着音频信号失真的增加，指纹不再具有足够的表现力，并且在满足可靠性的情况下不再可能识别音频信号。然而，在许多情况下都会发生失真，特别是当使用低传输质量的系统传输音频信号时。目前，在移动系统或强数据压缩的情况下尤其如此。这样的系统(如移动电话)主要被实现用于语音信号的双向传输，并且经常只以非常低的质量传输音乐信号。还存在其它的因素，这些因素可具有对传输信号的质量的负面影响，如低质量的麦克风、信道干扰和转码效应。对于用于识别和分类信号的设备，信号质量恶化会造成识别性能严重劣化。检查已经揭示了，特别是当使用根据DE101 34 471和DE 101 09 648的设备或方法时，保持音调的识别标准(频谱平坦度测量)时系统中的变化不会导致识别性能中其它的显著改进。

当假设已经建立了包括噪声(如不同信号类别的干扰噪声)的足够的数据库时，由此，可在任何环境中搜索特定的干扰噪声，然后可存入是否已经识别这样的干扰噪声。该方法如图2a所示。

图2a示出了包括将经由麦克风11接收的环境噪声(参考接收205的步骤)匹配到来自数据库15的记录的步骤210的方法200。只要已经发现了在判定215的地方示出的匹配，就输出一个信号，如用于存入或用于排除进一步的动作。只要尚未发现匹配，就会重复该方法，这使用了到起始点201的白天来说明。

对应于实施例，当前环境噪声的相应音频指纹而不是记录可与之前存储在数据库15中的音频指纹进行比较。在这里的方法包括确定当前环境噪声的音频指纹，并且将其与存储在数据库15中的音频指纹进行比较。

即使当在方法200中假设将环境噪声或音频指纹事先与存储在数据库15中的环境噪声/音频指纹相匹配来进行识别时，一般而言，可相关于一规则来监视环境噪声。在比较环境噪声/音频指纹的情况下，该规则将意味着“部分匹配”。

例如，另一个这样的规则可以是简单地待超过的音量值或待超过的与心理声学参数有关的阈值。根据实施例，导出当前环境噪声的心理声学参数，其通过预定义的规则与预定义的相应阈值进行比较，以便识别这种事件的发生。

根据扩展的实施例，该方法不仅可纯粹识别这种干扰噪声，而且可将噪声分类为例如语音、马达噪声、音乐、教堂钟声或射击声。

示例性地在智能电话或专门为此设计的设备上执行这种方法的一个潜在应用场景是设备位于旅馆房间中并且监视环境噪声。在这里，使用来自数据库15的数据来评估环境噪声，并且存入了随着时间推移已经发生了多少可能被感知为干扰的噪声事件以及可能被感知为干扰的噪声事件中的哪一个。例如，这可以是在一天的过程中计算干扰的空气调节噪声。作为存入的替代形式，可执行对该噪声的音频记录或预先缓冲的环境噪声的存储(参见上文)。基本思想是旅馆运营商能够使用这种方法预测和评估噪声感知。

图2b示出了在判定215的步骤或点与结束216之间包括其它步骤的扩展方法200'。

这些是通过步骤220计数事件或使用单元变量221，因此获得事件222的数量。任选地，音频记录可通过已被识别的事件来开始，如使用步骤230所示。

图2c示出了设备40的另一实施方式。其包括作为中央单元的处理器41，该处理器执行分析/匹配的实际步骤。首先，其使用内部麦克风26，其中，也可想到访问外部麦克风26e1和26e2。例如，用于匹配的数据存储在内部存储器44中。

任选地，处理器被配置为确定并匹配音频指纹和/或心理声学参数，以便获得对应的规则匹配。

为了允许这种功能，任选地提供另一外围单元，如内部时钟55、电池56b或通常也可使用电缆56k实现的电源56。任选地，处理器还访问其它的传感器元件57、控制单元58(如记录激活按钮)或定时器59。在这里，根据其它的，处理器41还可被配置为执行客观噪声评估，以便与主观评估(识别主观音调事件)相结合地确立关联。

对应于实施例，根据之前获得的愉悦性主观评估，CPU可取决于相应的噪声类别对不同评估矩阵中的信号类别的各个识别的噪声进行分类/归类。

根据其它实施例，也可提供外部数据存储器60(如外部硬盘或服务器)，用于存储或加载数据库。该连接可以是有线连接或无线连接。在无线通信中，对应于其它实施例，将提供通信接口62，如实现外部访问的无线接口62w或有线接口62k。

根据另一个方面，提供了一种系统，其基本上由彼此结合的、之前描述的设备40中的两个组成，使得一旦在其中一个设备中接收到对应的噪声(即，信号类别)，这两个设备就相互激活。该系统用于更详细地分析或评估各个噪声类别的噪声。在这里执行下面在图3中讨论的方法。

图3a示出了包括与在第一位置和第二位置处执行的、与方法200或200'相对应的噪声分析的步骤的方法300。这意味着步骤210存在两次(参考210a和210b)。

然后在另一个步骤220中比较确定的记录或参数，如在两个位置处的音频指纹(由步骤210a和210b产生)。

根据实施例，两个相邻位置处的两个步骤210可相互相关，如使用任选的步骤“在相邻设备211上的音频记录”所示出的。另选地，可在相邻的装置处执行另一个动作。其原因在于，例如，当执行方法210a的第一设备识别出噪声并且激活执行方法210b的第二设备时，可在不同的位置处识别相同的噪声。这里最后要提到的是，从判定215的地方开始，有指向起始点301的另一个箭头，这基本上暗示了以下事实：将执行噪声分析210a的方法，直到已经发现对应的匹配。

由于位置通常在空间上相邻，所以有可能以这种方式估计噪声的传播、速度或更大的噪声源。

示例性地，当将其自己的分析与同时在不同设备上的分析进行比较时，当在几个设备处已经识别出相同事件时，可确定这是诸如雷电的全局事件(参考判定321的领域之后的附图标记232)或是本地事件(参考判定321的领域之后的附图标记324)。对于全局事件323，通常“近”和“远”设备之间的水平差异可忽略不计(相对于r的r变化小)。对于本地事件324，水平差异很大(相对于r的r变化大)。例如，本地事件可以是呼救、爆炸、露天音乐会。对于本地事件，之后可进行其它的分析，即关于其它参数的分析325。根据时间的偏移或频率的偏移，可确定本地事件、传播或时间线的量。确定全局事件323或本地事件324(如其分析325)基本上是该方法的结束329。

例如，一种可能的应用场景是将几个设备分布在市中心。所有设备通过数据连接(如有线、无线、以太网或LAN连接)相互连接。使用服务器的连接也是可能的。所有的设备分析噪声情况(心理声学参数、音频指纹)。这些设备中的一个设备识别特征事件，如预先在数据库中分类的信号类别。当场触发音频记录。同时，设备触发行为，如在一个相邻节点上的动作。通过比较两个节点，可区分全局事件和本地事件，如上面已经讨论的。

方法300基本上由包括设备40中的两个设备的系统来执行(图2c)。

然而，由于提供了用于连接两个设备的额外的接口，所以也有可能几乎没有变化，如图3b所示。

图3b示出了在输入侧上包括麦克风26和任选的校准单元26k的设备70。例如，通过预处理46对由麦克风接收到的音频流进行预处理，以便导出音频指纹(参考附图标记46a)或心理声学参数(参考附图标记48)。同时，可识别事件或类别(参考附图标记50)。通过识别事件/类别，一方面可触发自动音频记录(参考附图标记50a1)，或者可发出控制指令，如用于激活另一节点(参考附图标记50a2或另一设备70')。用于输出控制指令50a2的装置可示例性地激活随后从用于生成音频指纹46a的装置或者用于导出心理声学参数48的装置接收和记录数据的存储器。音频信号也可存储在存储器44中，其中，在这里也可通过按钮49a来允许或阻止记录。在该实施例中，CPU 41也可连接到定时器59。

除了设备70之外，基本上履行相同功能的设备70'设置在另一个相邻的位置处。该设备70'还包括存储器44，当设备70'借助于激活装置50a2时或者根据被识别并属于一个类别的噪声，该存储器已经存储了该时间段的音频结果。数据分析器72在下一个步骤(例如相对于扩展)中分析来自设备70和70'的存储器44的记录或音频指纹或心理声学参数。然而，在这里，数据分析器72与另一设备的两个存储器连接是有利的，其中，在这里提到，数据分析器72可布置在设备70和70'中的一个中，或者在相对于他们两者的外部。

对应于另一实施例，按钮(如按钮24a')可集成在设备70中，使得设备70还执行设备20、20'或20”'的功能。

任选的元件50a'允许在识别分类之后自动触发记录。另选地，在这里也可想到，当在已经获得的任何信号类别中没有发现噪声时，自动记录成形。

换句话说，方法303可描述方法200的功能基本上被涵盖，即识别和分类诸如语音、马达噪声、音乐、厨房砖、射击声等的噪声，并且根据不同位置处的多个麦克风，已经通过分析扩展该功能。

在这里还要指出的是，某些类别的自动录音，如爆炸和射击声，例如也可能暗示了恐怖主义。在这里，所有相邻的节点70/70'直接切换到记录会很有用。

另外，当在一段时间内超过特定的噪声阈值时，也可能自动(例如，时间上有限的)记录。记录也可扩展到相邻的节点，以便因此在合并多个节点(引起对干扰源的研究，分离噪声源)时，通过这些较长的记录来执行信号源的精确定位。

上述三种情况的潜在应用领域如下：

-旅游、旅馆、健康部门、自行车道、远足路径；

-工作保护(办公室工作、机器工厂、客舱工作场所)；

-城市规划(音景、噪声映射)；

-公共安全(监控生产设施)。

也可想到方法100/100'、200/200'和300的组合或者设备20/20'/20”/20”'、40和70/70'的功能。这样的示例是用于主观评估和记录以及用于设备的机器评估的设备和方法的组合。

在这里要指出的是，已经结合不同方面讨论的元素当然也可应用于第二方面。示例性地，涉及音频指纹或心理声学参数的教导适用于所有三个方面，其中，仅结合第一方面更详细地讨论教导。

虽然已经在设备的上下文中描述了一些方面，但是清楚的是，这些方面也表示对应方法的描述，使得设备的块或元件也对应于相应的方法步骤或方法步骤的特征。类似地，在方法步骤的上下文中描述的方面也表示对应设备的对应块或项目或特征的描述。例如，方法步骤中的一些或全部可通过(或使用)如微处理器、可编程计算机或电子电路的硬件设备来执行。在一些实施例中，最重要的方法步骤中的一些或几个可由这样的设备来执行。

创新性的编码的信号(如音频信号或视频信号或传输流信号)可存储在数字存储介质上，或者可在诸如无线传输介质或有线传输介质(如因特网)的传输介质上传输。

例如，该创新性的编码的音频信号可存储在数字存储介质上，或者可在诸如无线传输介质或有线传输介质(如因特网)的传输介质上传输。

取决于某些实施方式要求，本发明的实施例可以硬件或软件来实现。使用数字存储介质，例如软盘、DVD、蓝光盘、CD、ROM、PROM、EPROM、EEPROM或FLASH存储器、硬盘驱动器或具有存储在其上的以电子方式可读取的控制信号的另一种磁性或光学存储器，可执行该实施方式，所述的数字存储介质与可编程计算机系统协作或能够与可编程计算机系统协作，使得执行相应的方法。因此，数字存储介质可以是计算机可读的。

根据本发明的一些实施例包含包括电子可读控制信号的数据载体，所述的电子可读控制信号能够与可编程计算机系统协作，使得执行本文描述的方法中的一个方法。

通常，本发明的实施例可实现为具有程序代码的计算机程序产品，当计算机程序产品在计算机上运行时，程序代码可操作用于执行其中一个方法。

程序代码可例如存储在机器可读的载体上。

其他实施例包括用于执行本文描述的其中一个方法的计算机程序，其中，计算机程序存储在机器可读的载体上。

换句话说，本发明方法的实施例因此是计算机程序，该计算机程序包括程序代码，该程序代码用于当计算机程序在计算机上运行时执行本文描述的其中一个方法。

因此，创新性方法的另一实施例是数据载体(或数字存储介质或计算机可读介质)，包括记录在其上的用于执行本文描述的其中一个方法的计算机程序。

因此，创新性方法的另一实施例是表示用于执行本文描述的其中一个方法的计算机程序的数据流或信号序列。例如，数据流或信号序列可被配置为通过数据通信连接(例如通过互联网)传送。

另一实施例包括处理装置，如计算机或可编程逻辑设备，其被配置为或适于执行本文描述的其中一个方法。

另一实施例包括其上安装有用于执行本文描述的其中一个方法的计算机程序的计算机。

根据本发明的另一实施例包括被配置为将用于执行本文描述的至少一个方法的计算机程序传送到接收器的设备或系统。可以电子或光学方式执行传送。例如，接收器可以是计算机、移动设备、存储设备等。例如，设备或系统可包括用于将计算机程序传送到接收器的文件服务器。

在一些实施例中，可编程逻辑设备(例如现场可编程门阵列，FPGA)可用来执行本文描述的方法的功能中的一些或全部。在一些实施例中，现场可编程门阵列可与微处理器协作，以便执行本文所描述的其中一个方法。通常，在一些实施例中，通过任何硬件设备执行方法。这可以是普遍适用的硬件(诸如计算机处理器(CPU))或专用于该方法的硬件(诸如ASIC)。

上述实施例仅仅是为了说明本发明的原理。应当理解，本文所描述的配置和细节的修改和变化对于本领域的其他技术人员来说将是显而易见的。因此，本发明意图仅由所附专利权利要求的范围限制，而不是由通过对本文的实施例的描述和解释给出的具体细节限制。

Claims

1.一种用于生成数据库(15)的方法(100、100')，包括以下步骤：

接收(110、110')环境噪声，并且缓冲迁移时间窗口的所述环境噪声，或者从所述环境噪声导出参数集并且缓冲所述迁移时间窗口的所述参数集，以便获得缓冲记录；

获得(120)识别所述环境噪声中的多个信号类别中的一个信号类别的信号；

响应于该信号，将所述缓冲记录存储(130)在存储器中；以及

重复获得(120)和存储(130)的步骤，以便获得包括相同信号类别的多个缓冲记录的所述数据库(15)。

2.根据权利要求1所述的方法(100、100')，其中，在所述信号与所述缓冲记录的所述迁移时间窗口之间存在时间相关性。

3.根据权利要求2所述的方法(100、100')，其中，所述时间相关性是所述迁移时间窗口的开始在所述信号的时间之前；或者迁移窗口的结束在所述信号的时间处或者在所述信号的时间之前。

4.根据前述权利要求中任一项所述的方法(100、100')，其中，通过用户输入装置(24a、24b)、按钮(24a、24b)或智能设备接收所述信号。

5.根据前述权利要求中任一项所述的方法(100、100')，其中，通过用于确定音量的检测器、用于识别所述环境噪声中的控制信号的处理器或者用于在相邻的位置处生成数据库(15)的设备接收所述信号。

6.根据前述权利要求中任一项所述的方法(100、100')，其中，导出所述参数集包括确定用于缓冲的环境噪声的音频指纹。

7.根据前述权利要求中任一项所述的方法(100、100')，其中，导出所述参数集包括确定所述缓冲记录的心理声学参数。

8.根据权利要求7所述的方法(100、100')，其中，所述心理声学参数包括音量、清晰度、音调、粗糙度和/或变化强度。

9.根据前述权利要求中任一项所述的方法(100、100')，包括：获得识别所述环境噪声中的多个信号类别中的另一信号类别的另一信号，其中，响应于所述另一信号执行存储，使得保持所述缓冲记录与类别或所述另一信号类别的关联。

10.根据前述权利要求中任一项所述的方法(100、100')，其中，当存储(130)时，将在获得所述信号时的时间戳也与所述缓冲记录一起存储。

11.根据前述权利要求中任一项所述的方法(100、100')，其中，所述方法(100、100')包括在获得所述信号时确定当前位置的步骤，并且将确定的位置与所述缓冲记录一起存储存储。

12.根据前述权利要求中任一项所述的方法(100、100')，其中，以数据归纳的方式存储所述缓冲记录。

13.根据前述权利要求中任一项所述的方法(100、100')，其中，所述存储器(44)被布置在外部。

14.一种具有程序代码的计算机程序，用于当所述程序在计算机上运行时执行根据权利要求1至13中任一项所述的方法(100、100')。

15.一种用于生成数据库(15)的设备(20、20'、20”、20”')，包括：

麦克风(11)，用于接收环境噪声；

缓冲器，用于缓冲迁移时间窗口的所述环境噪声，或者从所述环境噪声导出参数集并且用于缓冲所述迁移时间窗口的所述参数集，以便获得缓冲记录；

接口，用于获得识别所述环境噪声中的多个信号类别中的一个信号类别的信号；以及

存储器(44)，用于响应于该信号存储所述缓冲记录；

其中，所述设备(20、20'、20”、20”')被配置为重复获得和存储，以便获得包括相同信号类别的多个缓冲记录的所述数据库(15)。

16.根据权利要求15所述的设备(20、20'、20”、20”')，其中，所述设备(20、20'、20”、20”')包括输入装置、按钮或连接到输入接口的智能设备；或者

其中，所述输入接口连接到用于确定音量的检测器、用于识别所述环境噪声中的控制信号的处理器、或者用于在相邻的位置处生成数据库(15)的另一设备(20、20'、20”、20”')。

17.根据权利要求15或16所述的设备(20、20'、20”、20”')，其中，所述设备(20、20'、20”、20”')包括位置确定装置，使用所述位置确定装置能够确定当前位置，使得能够结合待存储的所述缓冲记录的一部分或参数存储所述当前位置。

18.根据权利要求15至17中任一项所述的设备(20、20'、20”、20”')，其中，所述缓冲器是环形存储器。

19.根据权利要求15至18中任一项所述的设备(20、20'、20”、20”')，其中，所述设备(20、20'、20”、20”')包括通信接口，使用所述通信接口能够连接外部的所述存储器(44)。

20.通过根据权利要求1至13中任一项所述的方法生成的数据库(15)的用途。