CN113691685A

CN113691685A - 错误的音频设置的自动校正

Info

Publication number: CN113691685A
Application number: CN202110537726.9A
Authority: CN
Inventors: P·Y·德奥勒; S·乔普德卡; N·达加
Original assignee: Avaya Management LP
Current assignee: Avaya Management LP
Priority date: 2020-05-18
Filing date: 2021-05-18
Publication date: 2021-11-23
Also published as: US20210359872A1; DE102021204829A1; US11502863B2

Abstract

本公开涉及错误的音频设置的自动校正。电子会议常常会是造成挫败感和资源浪费的源头，因为参与者可能被迫与无关的声音(诸如由应当被静音的端点提供的不预期用于会议的对话)竞争。类似地，参与者可能以向会议提供他们的讲话的预期进行讲话，但是在其相关联的端点被静音时讲话。因此，在寻址到被错误地静音或未静音的端点时，会议可能会尴尬并缺乏生产效率。通过检测错误的音频设置，能够提示端点或自动校正端点以具有适当的音频状态。

Description

错误的音频设置的自动校正

技术领域

本发明一般而言涉及用于基于音频的通信的系统和方法，并且尤其涉及检测和校正错误的静音设置。

背景技术

在电话会议中，通常预期某人讲话并听到沉默，然后“你在静音吗？”。有时甚至需要通过不同的渠道与将要讲话者进行交流并让他们知道自己没有被听到，最可能是因为他们仍然处于静音。其他参与者或者继续前进、忽略来自将要讲话者的贡献，或者等待直到他们取消静音。一旦讲话者意识到自己在静音的情况下说话并取消静音，讲话者必须重复在处于静音时所说的一切。

反过来，主持人常常需要宣布：“请那些不讲话的人可以继续静音”以避免从不讲话的参与者的通信设备中拾取的无关的对话和背景噪声。在整个会议期间，会议管理员可能需要一次又一次提醒参与者这一点。无关的噪声会分散注意力或使得不能理解预期的内容。

无关的噪声和沉默的讲话者导致会议参与者的糟糕经历。会议的连续性或流程中断，和/或所需内容可能被忽略。

发明内容

具有经由网络上的通信端点进行通信的至少两个参与者或两组参与者的电子会议或会晤(在本文中，“会议”)在商务和其它场合中是普遍的。遗憾地，也普遍的是讲话者在没有意识到自己处于静音的情况下说话，这导致混乱、浪费的时间和会议的连续性。也普遍的是从与非讲话的参与者相关联的未静音端点拾取并插入会议中无关的噪声。

这些和其它需求通过本文呈现的各种实施例和方面来解决。实施例取决于特定配置而提供多个优点。

在一个实施例中，并且作为本文实施例的一般介绍，提供了一种识别正在讲话的讲话者处于静音的事实并智能地采取行动的系统，和/或一种识别与会议无关的声音(例如，“无关的对话”)被拾取并包括在会议中的事实并且类似地在要求进行任何手动干预之前自动采取行动以减少会议中的无关声音。

某些现有技术系统将会议参与者以及该参与者正使用以提供他们的语音的端点终端一起注册以包括在会议中。这允许服务器识别到达服务器的媒体是来自特定参与者。此类现有技术系统允许参与者看到所有会议参与者的列表以及当前正在讲话的参与者的标记(诸如突出显示)。类似地，当参与者处于静音时，能以与参与者的标记(诸如参与者的姓名、头像、缩略图等)相关联的方式来提供标记(诸如静音符号)，以将参与者识别为静音。本文提供的实施例超越了现有技术的系统并且总体上提高了现有技术的水平。

在一个实施例中，提供了一种实现参与者的智能静音/取消静音的系统，其可以由执行功能或模块的(一个或多个)微处理器(在本文中，“处理器”)执行，所述功能或模块可以包括以下一个或多个：

1.语音特点识别模块：在一个实施例中，处理器执行负责当用户在会议期间积极讲话时捕获会议的每个参与者的语音特点的模块。当只有单个用户在会议中讲话而其他人在听时，可以检测到用户在会议中的参与。附加地或可替代地，当多个参与者同时说话时，可以分析来自讲话用户的端点的各个输入，以得出那些讲话的参与者的相关联语音特点。

可以被捕获和量化的语音特点包括但不限于以下一个或多个：响度(音量)、音高、范围、音调和速度。除了语音的声音特点外，还可以对语言进行表征，诸如以识别讲话的参与者可能正在以一种语言(例如，德语)讲话，但是会议正在以一种不同的语言(例如，英语)进行。因此，检测到德语的讲话可以被识别为非会议内容并且被静音，诸如当参与者正在与房间中的另一方说德语而不是针对会议说英语时。语音识别可以利用来自如Nuance和Microsoft等来源的语音识别库。在另一个实施例中，捕获的语音特点可以被用于训练机器学习(ML)模型。

由于如上所述的数据搜集在每个用户积极参与会议(在会议中讲话)时识别其语音特点，因此这个数据随后可以被(处理流程中的)后续模块用于训练ML模型。为了减少误报，可以执行过滤，诸如以排除人的可听水平之外的声音。这个数据被用于训练有关会议中每个用户的语音特点的模型，这有助于模型准确地识别用户实际上正在参与会议(在会议中讲话)而不是与会议之外的某个人进行私下对话(例如，在同一房间中的人，使用蜂窝电话进行单独的对话等)。

2.自然语言处理模块：在一个实施例中，处理器执行用于支持以上#1中描述的语音特点模块的模块。在此，自然语言处理模块将实时地处理和分析会议中的对话。从会议期间捕获的参与者的说出的姓名中，识别寻址到会议中特定参与者的捕获的讲话。

一旦识别出特定参与者的姓名，诸如从在会议的一部分期间的使用中，自然语言编程(NLP)就可以被用于确定使用该姓名的句子的上下文以及那个句子是寻址到参与者的问题还是引用会议的非参与者。除了捕获的语音特点之外，这个确定还被用于加强参与者现在正在会议中积极讲话的事实。

3.语音特点分析和处理模块：在一个实施例中，服务器的处理器执行从参与者的端点接收音频流(例如，讲话)的模块。该流优选地利用先前捕获的数据(诸如来自语音特点和/或自然语言处理)进行实时分析。

当参与者使用软件客户端(或web客户端)连接到会议并使用软件/web客户端使自己静音时，数据流仍传递到服务器，但是服务器不将流广播到其他参与者。因此，参与者可以静音讲话，但是服务器仍可以访问来自参与者端点/终端的流。

在将数据传递到服务器上之前，软件客户端将在其端部处进行筛选。初始筛选可以包括进行检查以确定讲话的强度是否超过某个阈值(诸如人的可听极限)，并且滤出低于这个极限的音频信号。高于极限的信号被传递到会议服务器上。

-当参与者在静音讲话时，服务器使用从软件客户端接收到的数据以将其与基线数据(诸如训练数据和/或来自NLP模块的信号)进行比较，以确定参与者正在会议中积极讲话但正处于静音。

在另一个实施例中，利用训练数据和来自参与者的端点的传入的实时流，ML模块指派反映参与者正在积极讲话以向会议提供讲话但是处于静音的置信度的置信度评分。响应于置信度高于先前确定的阈值，创建警报事件并将其发送到会议服务器，诸如警报模块(参见下文)。

4.参与者警报模块：在一个实施例中，处理器一旦接收到与警报事件相关联的置信度评分就执行用于执行动作的模块。该模块可以基于置信度在采取任何手动干预之前或为了避免任何手动干预(包括一旦确定积极的参与者正在静音讲话)而主动采取动作：

非常低的置信度评分：不采取任何动作。

低的置信度评分：触发参与者的端点进行可视指示器的呈现，指示他们正在静音讲话。

中等：触发参与者的端点进行语音通告，告知他们正在静音讲话。

高：自动取消参与者的音频的静音。

当确定在端点未处于静音时所提供的音频不要包括在会议中时，特定的置信度水平可以导致特定的动作，包括：

非常低的置信度评分：不采取任何动作。

低的置信度评分：触发参与者的端点进行可视和/或可听提示的呈现，指示他们正在向会议提供音频并且可能需要被静音。

中等：触发可视和/或可听通知的呈现，告知他们正在生成向会议提供的噪声并且如果不参与会议就应当保持静音。

高：自动使参与者的端点静音。

除了自动确定阈值置信度之外，参与者、会议主持人或其他管理员还可以配置阈值和/或禁用自动静音/取消静音，无论是否具有通告或指示参与者应当手动发起使其端点静音/取消静音的通告功能。警告参与者当静音时将对其音频进行监视可能是必要的或有益的，但是这种监视仅用于确定在静音时提供的音频是否指示应当将音频取消静音，反之亦然，诸如根据由将使用本发明的所在国家/地区所施加的法律/法律规则。

会议参与者注册和识别：在一个实施例中，当用户加入会议时，会议服务器或系统的处理器将参与者连同参与者正在使用的端点终端一起注册。这允许服务器关联到达服务器的媒体流(音频或音频-视频)来自特定参与者。如本文所述，会议服务器的至少一个处理器可以执行组件/模块，以便响应于以下情况而确定是否应当将参与者的端点自动取消静音或者应当采取其它动作：确定参与者可能正在讲话，目的是将讲话包括在会议中，但目前被静音。

本文的实施例提供了使用NLP/AI来分析参与者的语音特点，其还可以包括机器学习、深度学习或其它机器智能和语音识别技术，以确定用户未在会议中讲话，但向会议贡献音频(例如，噪声、无关的讲话等)，并在要求任何手动干预之前自动采取适当的动作，从而保留会议参与者的丰富用户体验。

本文的其它实施例提供了使用NLP/AI和语音识别技术来分析参与者的语音特点，以确定用户在会议中实际上是在静音讲话，并由系统自动采取适当的动作，而无需任何手动干预，从而保留会议参与者的丰富用户体验。可以利用NLP或其它机器智能来解析由一个参与者说出的寻址到或引用另一个参与者的句子。例如，问针对另一个参与者的问题(例如，“让我们看一下文档。Alice，您准备好了吗？”)就是针对Alice的问题，因此，Alice使用的端点应当做出响应。如果不是，那么端点可以被自动取消静音。如果NLP确定引用没有针对另一个参与者(例如，“让我们看看Alice共享的文档。”)，那么可能不期望由Alice使用的端点做出响应，并且当前的静音/取消静音状态保持不变。

公开了各种实施例和实施例的各个方面，包括：

在一个实施例中，公开了一种会议服务器，包括：会议服务器包括：到网络的网络接口；存储组件，包括非暂态存储设备；处理器，包括至少一个微处理器；并且其中处理器一旦访问机器可执行指令就使处理器进行以下操作：经由网络向多个端点中的每个端点广播会议内容，并且其中会议内容包括从多个端点中的贡献端点接收的音频部分；确定音频部分是否与会议内容无关；并且一旦确定音频部分与会议内容无关就执行静音动作以将音频部分从会议内容中排除。

在另一个实施例中，公开了一种会议服务器，包括：到网络的网络接口；存储组件，包括非暂态存储设备；处理器，包括至少一个微处理器；并且其中处理器一旦访问机器可执行指令就使处理器进行以下操作：经由网络向多个端点中的每个端点广播会议内容，并且其中会议内容选择性地包括从多个端点中的贡献端点接收的音频部分；确定音频部分是否被静音，其中处理器从贡献端点接收音频部分并从会议内容中忽略该音频部分；一旦确定音频部分被静音，确定贡献端点是否被错误地静音；当被错误地静音时，执行取消静音动作以将音频部分包括在会议内容中。

在另一个实施例中，公开了一种用于校正错误的音频设置的方法，该方法包括：经由网络向多个端点中的每个端点广播会议内容，其中会议内容包括由多个端点中的一个或多个端点提供的音频内容；确定从多个端点中的第一端点接收的音频内容中的第一音频部分是否与会议内容无关；并且一旦确定第一音频部分与会议内容无关就执行静音动作以将第一音频部分从会议内容中排除。

前述实施例中的任何一个或多个的方面包括处理器，该处理器进行执行静音动作，还包括发信号通知贡献端点以使贡献端点激励静音提示电路。

前述实施例中的任何一个或多个的方面包括处理器，该处理器还进行：访问参与者的音频简档，其中在音频简档中表征参与者在向会议内容贡献讲话时提供的讲话。

前述实施例中的任何一个或多个的方面包括处理器，该处理器还进行：访问参与者的音频简档，其包括讲话音量、音高、范围、音调或讲话速度中的至少一个；并且确定音频部分是否与会议内容无关还包括：确定音频部分的讲话音量、音高、范围、音调或讲话速度中的至少一个与音频简档的讲话音量、音高、范围、音调或讲话速度中的该至少一个不同。

前述实施例中的任何一个或多个的方面包括处理器，该处理器一旦确定音频部分的讲话音量、音高、范围、音调或讲话速度中的至少一个与音频简档的讲话音量、音高、范围、音调或讲话速度中的该至少一个不同并且差异大于先前确定的阈值，就确定音频部分与会议内容无关。

前述实施例中的任何一个或多个实施例的方面包括：其中音频简档包括从参与者被与多个端点中的不同端点相关联的另一个参与者按姓名寻址到之后的会议内容中采样的讲话音量、音高、范围、音调或讲话速度中的至少一个。

前述实施例中的任何一个或多个的方面包括：其中处理器一旦检测到会议内容包括姓名并且在姓名之后听到来自参与者的讲话，就确定参与者的音频简档。

前述实施例中的任何一个或多个的方面包括：其中处理器还进行：访问参与者的音频简档，其中在音频简档中表征由参与者提供的关于包括第一口头语言的声音属性的讲话；并且确定音频部分是否与会议内容无关还包括：确定音频部分是否包括第二口头语言。

前述实施例中的任何一个或多个的方面包括：其中处理器还进行：使多个端点中的每个端点呈现与贡献端点相关联的静音动作的标记。

前述实施例中的任何一个或多个的方面包括：其中处理器进行执行取消静音动作，还包括：发信号通知贡献端点以使贡献端点激励取消静音提示电路。

前述实施例中的任何一个或多个的方面包括：其中音频部分包括编码的声音，并且其中处理器确定贡献端点被错误地静音还包括确定编码的声音包括讲话。

前述实施例中的任何一个或多个的方面包括：其中处理器进行确定贡献端点被错误地静音，还包括：一旦确定编码的声音包括讲话，就访问参与者的音频简档，其中在音频简档中表征由参与者在向会议内容贡献讲话时提供的讲话；确定音频部分是否与会议内容无关，还包括：确定音频部分的讲话音量、音高、范围、音调或讲话速度中的至少一个与音频简档的讲话音量、音高、范围、音调或讲话速度中的至少一个不同；并且当确定音频部分不是无关的时，执行取消静音动作。

前述实施例中的任何一个或多个的方面包括，其中处理器进行确定贡献端点被错误地静音，还包括：一旦确定编码的声音包括参与者被与多个端点中的不同端点相关联的另一个参与者按姓名寻址到之后的讲话。

前述实施例中的任何一个或多个的方面包括，其中静音动作还包括发信号通知贡献端点以使贡献端点激励静音提示电路。

前述实施例中的任何一个或多个的方面还包括访问参与者的音频简档，其中在音频简档中表征参与者在向会议内容贡献讲话时提供的讲话；访问参与者的音频简档，其包括讲话音量、音高、范围、音调或讲话速度中的至少一个；并且确定音频部分是否与会议内容无关，还包括：确定音频部分的讲话音量、音高、范围、音调或讲话速度中的至少一个与音频简档的讲话音量、音高、范围、音调或讲话速度中的该至少一个不同，并且其中差异大于先前确定的阈值。

前述实施例中的任何一个或多个的方面包括：从多个端点中的第二端点接收第二音频部分，该第二音频部分被静音，并且当被静音时，被从会议内容中忽略；确定第二端点是否被错误地静音；并且一旦确定第二端点被错误地静音，执行取消静音动作以将第二音频部分包括在会议内容中。

前述实施例中的任何一个或多个的方面包括，其中执行取消静音动作，还包括发信号通知贡献端点以使贡献端点激励取消静音提示电路。

前述实施例中的任何一个或多个的方面包括，其中确定音频部分是否被错误地静音还包括：一旦确定编码的声音包括在参与者被与多个端点中的不同端点相关联的另一个参与者按姓名寻址到之后的讲话。

短语“至少一个”、“一个或多个”、“或”和“和/或”是在操作中既是连词(conjunctive)又是反意连接词(disjunctive)的开放式表达。例如，表达“A、B和C中的至少一个”、“A、B或C中的至少一个”、“A、B和C中的一个或多个”、“A、B或C中的一个或多个”、“A、B和/或C”以及“A、B或C”中的每一个意味着仅A、仅B、仅C、A和B一起、A和C一起、B和C一起或者A、B和C一起。

术语“一个”实体是指该实体的一个或多个。由此，术语“一个”、“一个或多个”和“至少一个”在本文中可以互换使用。还应当注意的是，术语“包括”、“包含”和“具有”可以互换使用。

如本文中所使用的，术语“自动”及其变型是指通常连续或半连续的、当被执行时无需实质性(material)人工输入就可以完成的任何处理或操作。但是，即使处理或操作的执行使用了实质性或非实质性人工输入，如果该输入是在执行处理或操作之前接收到的，那么该处理或操作也可以是自动的。如果人工输入影响将如何执行处理或操作，那么这种输入被认为是实质性的。同意处理或操作的执行的人工输入不被认为是“实质性的”。

本公开的各方面可以采取完全硬件的实施例、完全软件(包括固件、驻留软件、微代码等)的实施例或者组合软件和硬件方面的实施例的形式，这些在本文中全都可以一般地称为“电路”、“模块”或“系统”。可以利用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质，当由微处理器读取时，该计算机可读信号介质或计算机可读存储介质使微处理器执行在其中编码的指令。

计算机可读存储介质可以是例如但不限于电子的、磁的、光学的、电磁的、红外的或半导体系统、装置或设备，或前述的任意合适组合。计算机可读存储介质的更具体的示例(非穷举列表)将包括以下：具有一根或多根导线的电连接件、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备，或前述的任意合适组合。在本文档的上下文中，计算机可读存储介质可以是可以包含或存储由指令执行系统、装置或设备使用或与其结合使用的程序的任何有形的非暂态介质。

计算机可读信号介质可以例如在基带中或者作为载波一部分包括其中实施有计算机可读程序代码的传播的数据信号。这种传播的信号可以采用多种形式中的任意一种，包括但不限于，电磁信号、光信号或其任意合适组合。计算机可读信号介质可以是不是计算机可读存储介质并且可以传送、传播或传输由指令执行系统、装置或设备使用或者与其结合使用的程序的任何计算机可读介质。实施在计算机可读介质上的程序代码可以使用任何适当的介质(包括但不限于无线、有线、光缆、RF等，或前述的任意合适组合)来发送。

如本文所使用的，术语“确定”、“计算”及其变型被互换地使用，并且包括任何类型的方法、处理、数学运算或技术。

如本文所使用的，术语“部件”将根据35U.S.C.第112(f)节和/或第112节第6段给予其最宽泛可能的解释。因而，包含术语“部件”的权利要求应覆盖本文阐述的所有结构、材料或动作及其所有等同物。另外，结构、材料或动作及其等同物应包括发明内容、附图说明、具体实施方式、说明书摘要和权利要求本身中描述的所有内容。

前面是提供对本发明的一些方面的理解的本发明的简化总结。这个总结既不是对本发明及其各种实施例的广泛的概述也不是穷举的概述。其既不旨在识别本发明的关键或决定性元素，也不旨在描绘本发明的范围，而是以简化的形式呈现本发明的所选择的概念作为对以下呈现的更详细描述的介绍。如将认识到的，本发明的其它实施例有可能单独或组合地使用上面阐述或下面详细描述的一个或多个特征。而且，虽然本公开是以示例性实施例的形式呈现的，但应当认识到的是，本公开的各个方面可以被分别要求保护。

附图说明

结合附图描述本公开：

图1描绘了根据本公开的实施例的第一系统；

图2描绘了根据本公开的实施例的第一交互；

图3描绘了根据本公开的实施例的第二交互；

图4描绘了根据本公开的实施例的第一过程；

图5描绘了根据本公开的实施例的第二过程；

图6描绘了根据本公开的实施例的数据结构；以及

图7描绘了根据本公开的实施例的第二系统。

具体实施方式

随后的描述仅提供实施例，并不旨在限制权利要求的范围、适用性或配置。更确切地说，随后的描述将为本领域技术人员提供用于实现实施例的可行描述。应该理解的是，在不脱离所附权利要求的精神和范围的情况下，可以对元件的功能和布置进行各种改变。

当以复数形式使用时，对包括元件编号而没有子元件标识符(当图中存在子元件标识符时)的描述的任何引用意图指具有相似元件编号的任何两个或更多个元件。当以单数形式进行这种引用时，旨在引用具有相似元件编号的元件之一而不限于具体的一个元件。本文中相反的任何明确使用或提供进一步的资格或标识应优先。

还将关于分析软件、模块和相关联的分析硬件来描述本公开的示例性系统和方法。但是，为了避免不必要地模糊本公开，以下描述省略了众所周知的结构、部件和设备，其可以在附图中以简化的形式示出或从其省略或以其它方式概括。

出于解释的目的，阐述了许多细节以便提供对本公开的透彻理解。但是，应该理解的是，本公开能够以超出本文阐述的具体细节的各种方式实施。

图1描绘了根据本公开的实施例的系统100。在一个实施例中，在参与者102(例如，参与者102A-F)之间建立并维持会议，其中音频和可选地视频、文档、共同浏览和/或其它媒体被广播到每个参与者102。会议的音频部分可以包括由一个或多个参与者102提供的语音形式的音频。应当认识到的是，由参与者102例示的参与者的数量是非限制性的，并且可以包括任何数量的两个或更多个参与者，其中参与者102中的至少一个提供或尝试提供会议的音频内容的一部分。如将关于随后的实施例更完整地讨论的，由任何参与者102在任何时间提供的音频内容可以对于会议是无关的并被移除。

参与者102或参与者102的至少非零子集经由网络106接收由服务器110广播的会议。服务器110可以具有或利用数据存储装置112作为服务器110的至少一个微处理器(或更简单地，“处理器”)可访问的数据的非暂态储存库。服务器110可以是独立组件或与其它组件共同实施，诸如以管理通信、参与者名单、时间安排、接收/贡献权限、发言权控制和/或其它管理和/或连接特征。例如，由参与者102A经由端点104A接收的音频被广播回参与会议的每个端点104。可选地，由一个端点(例如，端点104A)提供的音频可以从提供给提供端点(例如，端点104A)的广播中排除，以避免回声、反馈或以其它方式干扰参与者102A听到可能会有所延迟的他们自己的声音。

服务器110可以包括或访问电话或其它通信装备(例如，交换机、集线器、路由器等)，以便促进广播会议并从提供会议内容的任何参与者102接收会议内容的部分。在另一个实施例中，服务器110和/或数据存储装置112可以被实施为端点104之一。

参与者102可以经由相应的端点104提供会议内容，该端点104转换经由网络106从服务器110广播的编码的音频信号，反之亦然。可选地，一个或多个端点104可以类似地向服务器110和/或从服务器110呈现编码的视频、文本消息、文档、共同浏览信号等。被配置为向会议贡献音频的每个端点104包括和/或利用麦克风来捕获诸如来自相关联参与者102的机械波能量(例如，声音)，并将机械波能量转换成电信号，该电信号可以被进一步转换成数据分组，以经由网络106进行传输。端点104和相关联的麦克风108的示例包括但不限于：端点104A和104E，各自分别被实施为具有(有线或无线地)附接的麦克风108A和108E的个人计算机；端点104B、104D和104E，各自分别利用集成的麦克风108B、108D和108E；以及端点104C，利用并入、(有线或无线地)附接到端点104C的麦克风108C。本领域普通技术人员应当认识到的是，其它麦克风可以被用作麦克风108，诸如电话的听筒，其可以是到网络106的有线的(模拟的或数字的)或无线的(例如，蜂窝式、WiFi、双向无线电等)端点。类似地，端点104可以被实施为可操作为经由网络106从服务器110接收会议广播并将会议呈现给相关联的参与者102并且可选地提供音频部分以供服务器110结合到会议内容中的任何电信设备。

常常，特定技术的困难是由使用该技术的人引入的。例如，在没有机械故障的情况下，如果人总是表现出色以感知汽车和环境并做出适当的响应，汽车将永远不会撞车。类似地，会议常常是挫败感、浪费资源、误解以及其它由于人为失误而引起的错误的源头。在一个实施例中，特定参与者102可以在他们的讲话正被包括在会议内容中并且被呈现给其它参与者102的假设下讲话。但是，由于错误地处于静音，因此会议没有意识到尝试进行的贡献。相反，特定参与者102可能正在贡献与会议无关但被包括在内的声音。声音可以是指向未参与会议的另一方的讲话或其它不想要的噪声(例如，背景噪声、敲击声、嗡嗡声等)。特定参与者102可能错误地认为他们处于静音，或者相关联的麦克风108不会拾取不想要的噪声以将其包括在会议内容中。因此，其他参与者102可能发现分心或难以感知预期的会议内容。在前面的示例中，资源常常被浪费，并且由于参与者102试图了解错误的音频设置、应用校正并在必要时重新插入想要包括在会议内容中的音频内容而中断会议的流程。

图2描绘了根据本公开的实施例的交互200。应当认识到的是，本文的性质需要将可以被实施为声波或编码的电信号或数据分组的口头内容和其它声音表示为文本。这种使用文本的表示不应当与实际文本(例如，文本聊天、短消息服务(SMS)、电子邮件等)混淆。虽然可以可选地利用文本的发送和接收并将其结合到会议内容中，但是基于文本的通信不在本文提供的实施例的范围之内。而且，交互200和300(参见图3)中的每一个例示了系统100的某些特征和动作以及系统100的组件(参见图1)，并且省略了其它特征和动作以避免不必要地使附图和相关联的描述复杂化。

在一个实施例中，服务器110经由参与者102各自的端点104向参与者102呈现包括音频内容的会议内容210。会议的音频部分包括由一个或多个端点104和相关联的或集成的麦克风108连续或间断贡献的音频。

在一个实施例中，端点104A向服务器110提供讲话202，服务器110进而广播现在包括所贡献的讲话的会议内容210。类似地，端点104C向服务器110提供讲话206，服务器110进而广播现在包括所贡献的讲话的会议内容210。端点104B向服务器110提供讲话204。一旦服务器110确定讲话204与会议无关，服务器110就执行静音动作以将讲话204从会议内容210中排除(示为删除线文本)。关于下面的实施例，更完整地讨论确定声音(诸如讲话204)与会议无关。在一个实施例中，服务器110将静音通知/动作信号208发送到端点104B，并且作为响应，端点104B激活通知电路或逻辑以提示参与者102A手动地激活端点104B的静音特征和/或自动激活端点104B的静音特征。在一个实施例中，静音特征允许继续捕获声音并将其从端点104B发送到服务器110，但是服务器110将该声音从会议内容210中排除。

在其它实施例中，静音通知/动作208还可以包括向端点104B发信号告知它们已经被置成静音和/或向所有端点104发信号告知端点104B处于静音。作为好处，如果期望参与者102B向会议内容提供讲话，诸如响应于提示。

图3描绘了根据本公开的实施例的交互300。在一个实施例中，参与者102D向服务器110提供了包括讲话302的音频部分312，服务器110进而将会议内容308广播到每个端点104，诸如端点104A。参与者102A经由麦克风108A和端点104A将音频部分314(诸如包括讲话304)贡献给服务器110。但是，端点104A被服务器110或端点104A静音，并且讲话304否则将导致包括将是静默的会议部分306的会议内容308。为了避免讲话304在端点104A处于静音时被从会议内容308中排除，服务器110确定端点104A被错误地静音，并且作为响应，执行取消静音通知/动作310，以使讲话304被包括在会议内容308中。

在一个实施例中，由于讲话302具体地寻址到参与者102A(例如，向“Alice”提出问题)，因此服务器110确定端点104A被错误地静音。服务器110诸如通过在数据存储装置112(参见图1)内维护参与者102和端点104的记录来注册每个参与者102及其相关联的端点104。因而，服务器110可以执行语音到文本分析或其它语音识别操作，并确定与端点104A相关联的特定参与者102具有在讲话302中提供的姓名(“Alice”)并因此寻址到参与者102A。因此，来自端点104A的讲话被期望，以响应于讲话302中提供的提示，并且响应于期望的讲话，服务器110在取消静音/通知动作310中将被静音的端点104A取消静音。在另一个实施例中，当由端点104A执行静音时，服务器110可以用取消静音/通知动作310发信号通知端点104A，以使端点104A执行取消静音步骤，并且类似地使讲话304被包括在会议内容中。如将关于随后的实施例更详细讨论的，当确定特定端点104是否被错误地静音时，可以使用其它准则。可以利用NLP指示正在被寻址并期望响应的参与者(例如，“让我们看一下文档，然后交给Alice。”“Alice，请翻阅文档。”“Alice，可以解释文档吗？”等等)，而不是仅仅提及参与者(例如，“让我们看看Alice提供的文档。”等等)。当期望或请求响应时，可以自动执行被寻址的参与者的取消静音。

在一个实施例中，取消静音通知/动作310可以包括激励端点104A的电路或逻辑以通知参与者102A他们处于静音和/或提示参与者102A手动将端点104A取消静音。例如，端点104A可以在与端点104A相关联的显示器上播放生成的或记录的消息或音调和/或提供视觉提示(例如，“Alice，问了您一个问题，并且您处于静音”)。作为进一步的选项，端点104A可以重放讲话302的全部或一部分。重放讲话302的全部或一部分再次提示用户102A提供响应。如果用户102A确实提供了响应(诸如在静音时)，那么可以记录在静音时接收的响应讲话304并将其重放到会议中。例如，在端点104A处于静音时，用户102A可以通过说一两个词(例如，“对于……”)来开始提供讲话304。在端点104A取消静音之后，服务器110可以缓冲在端点104A取消静音之后提供的词以及记录的讲话，然后将缓冲的讲话回放到会议中作为会议内容，直到讲话304是实况为止。如果在静音期间提供的讲话304的部分多于几个词(例如，超过十秒)，那么可以提示用户102A或者发起回放在静音时提供的讲话304的部分或者再次重复讲话304。

在另一个实施例中，取消静音通知/动作310可以自动将端点104A取消静音以提供语音304作为会议内容的一部分。在此类实施例中，取消静音通知/动作310还可以包括发信号通知端点104A，其中该信号使得仅端点104A将呈现它们被关闭静音的通知(例如，音调、消息、弹出消息等)。作为进一步的选项，可以向所有端点104通知端点104的打开静音/关闭静音状态，并且当改变时，每个端点104被相应地更新，诸如用消息(例如，“Alice”打开静音”或“Alice关闭静音”)或者用具有与静音状态相关联的含义的图形图标。可选地，讲话304可以被缓冲并重放为会议内容308，从而在取消静音通知/动作310导致端点104A取消静音之前提供的任何讲话都被提供为未中断的讲话，但是具有由讲话304的开始和取消静音动作的发生所确定的延迟。在这种实施例中，实时讲话304可以被缓冲并且仅缓冲的内容被提供为会议内容308。讲话304中的后续暂停可以终止缓冲和/或将实时讲话304提供为会议内容308，诸如以便为会议参与者提供最佳体验。

图4描绘了根据本公开的实施例的过程400。过程400可以被实施为编码为机器可读指令的算法，该指令在由诸如服务器110的处理器之类的处理器读取时使该处理器执行算法的步骤。在一个实施例中，过程400确定从参与会议的特定端点104接收的音频与会议无关并且应当从会议内容中排除。

在一个实施例中，过程400在步骤402中向参与者广播会议内容，诸如由服务器110将会议内容广播到每个端点104以呈现给相关联的参与者102。步骤402发起或继续广播会议内容并且可以在执行过程400的其它步骤的同时连续地执行，直到会议结束为止。会议内容包括在步骤404中从一个或多个单独端点104接收的音频。测试406确定由特定端点104接收的音频是否与会议无关，并且如果确定是否定的，那么过程继续到测试410。如果测试406被确定是肯定的，那么处理继续到步骤408，其中由特定端点104接收的音频被静音，以排除从该端点接收的当前和/或将来的音频在步骤402中被广播。可以由诸如提供会议内容的服务器110之类的服务器的处理器来执行静音，或者通过到特定端点104的信号来执行静音，该信号在被相关联的参与者102接收到时执行静音动作。测试410确定会议是否已经结束，并且如果确定是肯定的，那么过程400可以结束，并且在步骤402中发起/继续的会议内容的广播如果尚未终止则可以断开，否则处理可以继续并循环回到步骤404。

测试406被不同地实施以确定从特定端点104接收的音频与会议无关。例如，从特定端点104接收的音频可以包括高于某个阈值水平(音量)或持续时间的非讲话声音。这可以包括环境噪声(例如，街道、笔的敲击、办公装备、餐馆背景噪声、动物、婴儿哭声、孩子玩耍等)，并且由于不包括讲话或不包括足够可理解的讲话而被排除。从特定端点104接收的音频可以包括讲话，但是因为讲话被进一步确定为该讲话与会议无关而被排除在会议内容之外。例如，讲话可以是办公室环境的喧闹声，其中其他人的讲话形成了噪声的喧闹声，并且讲话是部分或完全无法理解的。可理解的讲话仍然可以被确定为与会议无关并且被排除在会议内容之外，这将相对于图6进行更完整的讨论。

图5描绘了根据本公开的实施例的过程500。过程500可以实施为编码为机器可读指令的算法，该指令在由诸如服务器110的处理器之类的处理器读取时使处理器执行算法的步骤。在一个实施例中，过程500确定从参与会议的特定端点104接收的音频被错误地在静音时接收并且应当被包括在会议内容中。

在一个实施例中，过程500在步骤502中将会议内容广播给参与者，诸如由服务器110将会议内容广播给每个端点104以呈现给相关联的参与者102。步骤502发起或继续广播会议内容，并且可以在执行过程500的其它步骤的同时连续地执行，直到会议结束为止。会议内容包括在步骤504中从一个或多个单独端点104接收到的音频。

测试506确定从特定端点104接收到的音频是否是用处于静音的特定端点104接收的。如果测试506被确定是否定的，那么过程500继续到测试512，其确定会议是否已经结束。如果测试512被确定是肯定的，那么过程500可以结束，并且在步骤502中发起/继续的会议内容的广播如果尚未终止则可以被断开，否则处理可以继续并循环回到步骤504。测试506可以响应于特定端点104已接收到静音信号以及由服务器110提供的静音而确定音频是特定端点104在静音时接收到的。在另一个实施例中，静音可以由特定端点自身提供，其中服务器110接收指示音频被特定端点接收但由于处于静音而没有被转发到服务器110的信号。

如果测试506被确定是肯定的，那么测试508确定静音是否是错误的，并且如果确定是肯定的，那么执行步骤510以执行取消静音动作。如果测试508被确定为是否定的，那么处理可以继续到测试512。步骤510可以将从特定端点104接收的音频取消静音，诸如当由服务器110执行静音时，或通过向特定端点104发送取消静音的信号并且作为响应，特定端点取消静音。

由测试508执行的对静音错误的确定被不同地实施。在一个实施例中，会议内容的先前部分(诸如由不同端点104提供的)对与特定端点104相关联的参与者102进行寻址，诸如通过姓名、角色、位置等。在另一个实施例中，当已知要提供预期包括在会议内容中的讲话时，来自特定端点104的音频中提供的讲话的属性与来自参与者102的先前讲话的讲话的属性在先前确定的阈值内匹配，这将相对于图6进行更完整的讨论。

图6描绘了根据本公开的实施例的数据结构600。由人(诸如提供要包括在会议内容中的讲话的特定参与者102)提供的讲话，与提供给其它非会议内容的讲话相比，在讲话属性方面可以有所不同。例如，与一组远程会议参与者讲话的人可以具有特定的讲话方式，该方式与在与同事或其它方面对面讲话时有所不同。这些方式可以被量化为各种讲话属性并被用于确定由参与者提供的讲话是否意图包括在会议内容中。在一个实施例中，数据结构600例示了多条记录的字段，该多条记录可以被用于维护参与者102的讲话属性，诸如可以被维护在数据存储装置112中以供服务器110访问。

在一个实施例中，服务器110可以接收非讲话声音(例如，街道噪声、吠叫的狗等)，并且确定该声音要从会议内容中排除并且执行静音动作。

在另一个实施例中，数据结构600包括记录标识符字段602，诸如索引、序列号、参与者102的标记、端点104的标记等。在另一个实施例中，参与者标识符块604包括一个或多个参与者标识符字段608A-608n。参与者标识符字段608A-608n可以被用于维护如何寻址特定参与者102。例如，参与者标识符字段608A-608n可以包括全名(例如，“Robert Smith”)、名字(例如，“Robert”)、简称(例如，“Rob”)、其它寻址形式(例如，“Bobby”、“Bob”、“Robby”等)、角色(例如，“营销”、“营销部门”、“营销组”等)、位置(例如，“东海岸办公室”、“第6层”等)。因此，提供会议内容的另一个参与者102可以被确定以寻址特定的作为目标的参与者102。例如，“我们现在将听到来自Robert Smith的声音”、“东海岸办公室的情况如何”、“让我们听取营销组的声音”、“Bobbie，您能回答吗”、“来自第6层的人能回答那个问题吗”等等。并且，作为响应，关联与参与者标识符字段608A-608n中的一个或多个匹配的内容，并且如果它们的关联端点104被静音，那么发起取消静音动作。

在另一个实施例中，声音包括讲话(例如，可理解的讲话)，并且一旦确定讲话属性与先前语音属性不同或不同到超出先前确定的阈值，就被确定为与会议无关，该先前语音属性与在提供预期用于会议的讲话时的参与者相关联。由各个参与者102提供的讲话可以在先前事件(例如，先前会议)期间或在当前事件(例如，当前会议)的先前部分期间被接收。例如，参与者102B可以已经提供了会议内容的先前部分，诸如以解决会议的议程项目、自我介绍、提问问题等。提供给服务器110的声音的来源易于被从特定端点104接收数据分组的服务器110识别，该数据分组还可以被注册到相关联的参与者102。所提供的先前讲话的声音波形可以被量化。

在一个实施例中，声音量化字段606可以包括多个讲话模式数据结构610A-610n。例如，在会议开始之前，讲话可以被相关联的端点104的特定麦克风108捕获并且被提供给服务器110。在会议尚未开始(例如，等待主持人或主人开始会议)时，诸如与附近的同事讲话，并且这种讲话可以被量化并添加到与非会议内容相关联的特定讲话模式数据结构610。在会议期间，特定参与者102可以提供会议内容，诸如可以被确定为讲话大于阈值时间长度(例如，五秒)，这将与呈现会议内容的一部分是一致的。因而，该讲话可以被量化并添加到与会议内容相关联的特定讲话模式数据结构610。当从特定参与者102接收到讲话时，可以针对各个语音属性612A-612n和/或614A-614n进行评估，并且当匹配时，封装的讲话模式数据结构610A-610n确定参与者102的特定讲话模式。例如，匹配一个或多个语音属性612A-612n可以然后确定当前讲话模式是与讲话模式数据结构610A相关联的讲话模式。如果相关联的讲话模式数据结构610与会议内容相关联，并且提供端点104被静音，那么可以执行取消静音动作。如果相关联的讲话模式数据结构610与非会议内容相关联(例如，与同事面对面讲话)，并且提供端点104未被静音，那么可以执行静音动作。

语音属性612A-612n…614A-614n维护语音(例如，波形)表征或其它标记，诸如讲话音量、音高、范围、音调或讲话速度。作为另一个选项，可以由服务器110识别所讲的特定语言(例如，英语、德语等)，并将其维护为针对相关联的讲话模式数据结构610的特定语音属性612A-612n…614A-614n内的条目。

图7描绘了根据本公开的实施例的系统700。在一个实施例中，端点104和/或服务器110可以全部或部分地实施为包括各种组件以及与其它组件和/或系统的连接的设备702。组件被不同地实施，并且可以包括处理器704。处理器704可以被实施为单个电子微处理器或多处理器设备(例如，多核)，其中具有诸如(一个或多个)控制单元、(一个或多个)输入/输出单元、(一个或多个)算术逻辑单元、(一个或多个)寄存器、主存储器和/或访问信息(例如，数据、指令等)(诸如经由总线714接收的)的其它组件之类的组件，执行指令，并输出数据(再次诸如经由总线714)。在其它实施例中，处理器704可以包括可以由其它进程和/或进程所有者使用的共享处理设备，诸如在处理阵列或分布式处理系统(例如，“云”、场等)中。应当认识到的是，处理器704是非暂态计算设备(例如，包括与其它组件和设备通信的电路系统和连接的电子机器)。处理器704可以操作虚拟处理器，诸如以处理非处理器本机的机器指令(例如，翻译

9xx芯片组代码以仿真不同处理器的芯片组或非本机操作系统，诸如Mac上的VAX操作系统)，但是，此类虚拟处理器是由底层处理器(例如，处理器704)及其硬件和其它电路系统执行的应用。

除了处理器704的组件之外，设备702还可以利用存储器706和/或数据存储装置708来存储可访问的数据，诸如指令、值等。在一个实施例中，数据存储装置112全部或部分地实施为存储器706和/或数据存储装置708。通信接口710促进经由总线714与诸如处理器704之类的组件的通信，与不能经由总线714访问的组件通信。通信接口710可以被实施为网络端口、卡、线缆或其它配置的硬件设备。附加地或可替代地，人工输入/输出接口712连接到一个或多个接口组件，以从人和/或电子设备接收和/或向人和/或电子设备呈现信息(例如，指令、数据、值等)。可以连接到输入/输出接口的输入/输出设备730的示例包括但不限于键盘、鼠标、轨迹球、打印机、显示器、传感器、开关、继电器等。在另一个实施例中，通信接口710可以包括人工输入/输出接口712或由人工输入/输出接口712组成。通信接口710可以被配置为直接与联网的组件通信或利用一个或多个网络(诸如网络720和/或网络724)。

网络106可以全部或部分地被实施为网络720。网络720可以是有线网络(例如，以太网)、无线网络(例如，WiFi、蓝牙、蜂窝等)或其组合，并且使设备702能够与(一个或多个)网络组件722通信。在其它实施例中，网络720可以全部或部分地被实施为电话网络(例如，公共交换电话网络(PSTN)、专用小交换机(PBX)、蜂窝电话网络等)。

附加地或可替代地，可以利用一个或多个其它网络。例如，网络724可以表示第二网络，其可以促进与由设备702利用的组件的通信。例如，网络724可以是商业实体或其它组织的内部网络，由此组件被联网的组件722所信任(或至少如此)，联网的组件722可以连接到包括可能不那么被信任的公共网络(例如，互联网)的网络720。

附接到网络724的组件可以包括存储器726、数据存储装置728、(一个或多个)输入/输出设备730和/或处理器704可以访问的其它组件。例如，存储器726和/或数据存储装置728可以完全地或针对特定任务或目的补充或取代存储器706和/或数据存储装置708。例如，存储器726和/或数据存储装置728可以是外部数据储存库(例如，服务器场、阵列、“云”等)，并允许设备702和/或其它设备访问其上的数据。类似地，处理器704可以经由人工输入/输出接口712和/或经由通信接口710直接地、经由网络724、仅经由网络720(未示出)或经由网络724和720来访问(一个或多个)输入/输出设备730。存储器706、数据存储装置708、存储器726、数据存储装置728中的每一个包括非暂态数据存储装置，该非暂态数据存储装置包括数据存储设备。

应当认识到的是，可以由各种组件发送、接收、存储、处理和呈现计算机可读数据。还应当认识到的是，所例示的组件可以控制其它组件，无论是在本文中例示的还是以其它方式。例如，一个输入/输出设备730可以是路由器、交换机、端口或其它通信组件，使得处理器704的特定输出启用(或禁用)可以与网络720和/或网络724相关联的输入/输出设备730，以允许(或禁止)网络720和/或网络724上的两个或更多个节点之间的通信。本领域普通技术人员将认识到的是，除了本文描述的那些通信装备之外或者作为替代，可以利用其它通信装备，而不背离实施例的范围。

在前面的描述中，出于例示的目的，以特定次序描述了方法。应当认识到的是，在替代实施例中，能够以与所描述的次序不同的次序来执行方法，而不脱离实施例的范围。还应当认识到的是，上述方法可以作为由专用执行本文所述的一种或多种算法或其一部分的硬件部件(例如，电路系统)执行的算法来执行。在另一个实施例中，硬件组件可以包括通用微处理器(例如，CPU、GPU)，其首先被转换成专用微处理器。然后，已经在其中加载了编码信号的专用微处理器使得现在专用的微处理器去维护机器可读指令，以使微处理器能够读取并执行从本文所述的算法和/或其它指令得出的机器可读指令集。用于执行(一个或多个)算法或其一部分的机器可读指令不是无限的，而是利用微处理器已知的有限指令集。机器可读指令可以在微处理器中被编码为信号产生组件中的信号或值并且在一个或多个实施例中被包括、存储器电路中的电压、开关电路的配置和/或通过特定逻辑门电路的选择性使用。附加地或可替代地，机器可读指令可以是微处理器可访问的，并且在介质或设备中被编码为磁场、电压值、电荷值、反射/非反射部分和/或物理标记。

在另一个实施例中，微处理器还包括单个微处理器、多核处理器、多个微处理器、分布式处理系统(例如，(一个或多个)阵列、(一个或多个)刀片、(一个或多个)服务器场、“云”、(一个或多个)多用途处理器阵列、(一个或多个)集群等)中的一个或多个，和/或可以与执行其它处理操作的微处理器共置一处。任何一个或多个微处理器都可以集成到单个处理设备(例如，计算机、服务器、刀片等)中，或者全部或部分位于经由通信链路(例如，总线、网络、背板等，或其多个)连接的离散组件中。

通用微处理器的示例可以包括中央处理单元(CPU)，其具有在指令寄存器(或其它保持指令的电路系统)中编码的数据值或包括存储器位置的数据值，存储器位置进而包括用作指令的值。存储器位置还可以包括在CPU外部的存储器位置。此类CPU外部组件可以实施为现场可编程门阵列(FPGA)、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、随机存取存储器(RAM)、总线可访问存储装置、网络可访问存储装置等中的一种或多种。

这些机器可执行指令可以存储在一个或多个机器可读介质上，诸如CD-ROM或其它类型的光盘、软盘、ROM、RAM、EPROM、EEPROM、磁卡或光卡、闪存或适于存储电子指令的其它类型的机器可读介质。可替代地，可以通过硬件和软件的组合来执行这些方法。

在另一个实施例中，微处理器可以是诸如客户端设备上的微处理器和服务器上的微处理器之类的处理硬件组件的系统或集合、具有其相应微处理器的设备集合，或者共享或远程的处理服务(例如，“基于云”的微处理器)。微处理器的系统可以包括处理任务的任务特定分配和/或共享或分布式处理任务。在又一个实施例中，微处理器可以执行软件以提供服务，以模拟一个或多个不同的微处理器。因此，由硬件组件的第一集合所组成的第一微处理器可以虚拟地提供第二微处理器的服务，由此与第一微处理器相关联的硬件可以使用与第二微处理器相关联的指令集来操作。

虽然机器可执行指令可以在本地存储和执行到特定机器(例如，个人计算机、移动计算设备、膝上型计算机等)，但是应当认识到的是，数据和/或指令的存储和/或指令的至少一部分的执行可以经由到远程数据存储装置和/或处理设备或设备集合(通常称为“云”)的连接来提供，但可以包括公共、私有、专用、共享和/或其它服务局，计算服务和/或“服务器场”。

本文描述的微处理器的示例可以包括但不限于以下当中的至少一个：

800和801、具有4G LTE集成和64位计算的

610和615、具有64位体系架构的

A7微处理器、

M7运动协微处理器、

系列、

Core^TM系列微处理器、

系列微处理器、

Atom^TM系列微处理器、Intel

系列微处理器、

i5-4670K和i7-4770K 22nm Haswell、

i5-3570K 22nm Ivy Bridge、

FX^TM系列微处理器、

FX-4300、FX-6300和FX-8350 32nm Vishera、

Kaveri微处理器、Texas

Jacinto C6000^TM汽车信息娱乐微处理器、Texas

OMAP^TM汽车级移动微处理器、

Cortex^TM-M微处理器、

Cortex-A和ARM926EJ-S^TM微处理器、其它行业等同的微处理器，并且可以使用任何已知的或将来开发的标准、指令集、库和/或体系架构来执行计算功能。

本文讨论的任何步骤、功能和操作可以连续且自动地执行。

已经关于通信系统和组件以及用于监视、增强和修饰通信和消息的方法描述了本发明的示例性系统和方法。但是，为了避免不必要地模糊本发明，前面的描述省略了许多已知的结构和设备。这种省略不应当被解释为对要求保护的本发明的范围的限制。阐述具体细节以提供对本发明的理解。但是，应当认识到的是，本发明能够以超出本文阐述的具体细节的各种方式来实践。

此外，虽然本文例示的示例性实施例示出了共同定位的系统的各种部件，但是系统的某些部件可以远程地定位在分布式网络(诸如LAN和/或互联网)的远处部分，或者位于专用系统内。因此，应当认识到的是，系统的组件或其部分(例如，微处理器、存储器/存储装置、接口等)可以组合成一个或多个设备(诸如一个或多个服务器、计算机、计算设备、终端、“云”或其它分布式处理)，或共同定位在分布式网络(诸如模拟和/或数字电信网络、分组交换网络或电路交换网络)的特定节点上。在另一个实施例中，组件可以物理地或逻辑地分布在多个组件上(例如，微处理器可以包括一个组件上的第一微处理器和另一组件上的第二微处理器，每个微处理器执行分配的任务和/或共享任务的一部分)。从前面的描述中将认识到，并且出于计算效率的原因，可以将系统的组件布置在组件的分布式网络内的任何位置处而不影响系统的操作。例如，各种组件可以定位在诸如PBX和媒体服务器、网关之类的交换机中、在一个或多个通信设备中、在一个或多个用户的室内，或其某种组合。类似地，系统的一个或多个功能部分可以分布在(一个或多个)电信设备和相关联的计算设备之间。

此外，应当认识到的是，连接元件的各种链路可以是有线或无线链路或其任意组合，或者任何其它已知的或以后开发的能够向连接的元件或从连接的元件供给和/或传送数据的(一个或多个)元件。这些有线或无线链路也可以是安全链路，并且可以能够传送加密信息。例如，用作链路的传输介质可以是用于电信号的任何合适的载体，包括同轴线缆、铜线和光纤，并且可以采取声波或光波的形式，诸如在无线电波和红外数据通信中生成的那些。

而且，虽然已经关于事件的特定序列讨论和例示了流程图，但应当认识到的是，可以在不实质性地影响本公开的操作的情况下对这个序列进行改变、添加和省略。

可以使用本发明的许多变化和修改。可以提供本发明的一些特征而不提供其它特征。

在又一个实施例中，本发明的系统和方法可以结合专用计算机、编程的微处理器或微控制器和(一个或多个)外围集成电路元件、ASIC或其它集成电路、数字信号微处理器、诸如分立元件电路之类的硬连线电子或逻辑电路、诸如PLD、PLA、FPGA、PAL之类的可编程逻辑设备或门阵列、专用计算机、任何相当的装置等来实现。一般而言，能够实现本文例示的方法的任何(一个或多个)设备或装置都可以用于实现本发明的各个方面。可以用于本发明的示例性硬件包括计算机、手持设备、电话(例如，蜂窝式、启用互联网的、数字、模拟、混合及其它)以及本领域中已知的其它硬件。这些设备中的一些包括微处理器(例如，单个或多个微处理器)、存储器、非易失性存储装置、输入设备和输出设备。此外，还可以构建包括但不限于分布式处理或组件/对象分布式处理、并行处理或虚拟机处理的替代软件实现来实现本文描述的如由一个或多个处理组件提供的方法。

在又一个实施例中，所公开的方法可以结合使用对象或面向对象的软件开发环境的软件来容易地实现，该对象或面向对象的软件开发环境提供可以在各种计算机或工作站平台上使用的便携式源代码。可替代地，所公开的系统可以使用标准逻辑电路或VLSI设计来部分地或完全地用硬件来实现。使用软件还是硬件来实现根据本发明的系统取决于系统的速度和/或效率要求、特定功能以及所使用的特定软件或硬件系统或者微处理器或微计算机系统。

在又一个实施例中，所公开的方法可以部分地用可以在存储介质上存储、在具有控制器和存储器的协作的编程的通用计算机、专用计算机、微处理器等上执行的软件来实现。在这些情况下，本发明的系统和方法可以被实现为嵌入在个人计算机上的程序(诸如applet、

或CGI脚本)，驻留在服务器或计算机工作站上的资源，嵌入在专用测量系统、系统组件等中的例程。该系统还可以通过将系统和/或方法物理地结合到软件和/或硬件系统中来实现。

本文中包括软件的实施例由一个或多个微处理器执行或存储以供后续执行，并作为可执行代码被执行。选择可执行代码以执行包括特定实施例的指令。执行的指令是从微处理器理解的离散原生指令集中选择的受约束的指令集，并且在执行之前被提交给微处理器可访问的存储器。在另一个实施例中，人类可读的“源代码”软件在由一个或多个微处理器执行之前首先被转换成系统软件，以包括从平台的原生指令集中选择的特定于平台(例如，计算机、微处理器、数据库等)的指令集。

虽然本发明参考特定标准和协议描述了在实施例中实现的组件和功能，但是本发明不限于这些标准和协议。本文未提及的其它类似的标准和协议是存在的并且被认为包括在本发明中。而且，本文提及的标准和协议以及本文未提及的其它类似的标准和协议定期地被实质具有相同功能的更快或更有效的等同物所取代。具有相同功能的这种替换标准和协议被认为是包括在本发明中的等同物。

本发明在各种实施例、配置和方面(包括各种实施例、子组合及其子集)中包括基本上如本文所描绘和描述的组件、方法、处理、系统和/或装置。在理解本公开之后，本领域技术人员将理解如何实现和使用本发明。本发明在各种实施例、配置和方面中包括在没有本文未描绘和/或描述的项目的情况下提供设备和处理，或者在其各种实施例、配置或方面中包括没有如已经在先前的设备或处理中使用的这些项目，例如用于改进性能、实现易用性和/或降低实现的成本。

已经出于例示和描述的目的呈现了本发明的前述讨论。前述内容并非旨在将本发明限制到本文公开的一种或多种形式。在例如前述的具体实施方式中，为了使本公开简化的目的，本发明的各种特征在一个或多个实施例、配置或方面中被组合在一起。本发明的实施例、配置或方面的特征可以在除以上讨论的那些之外的替代实施例、配置或方面中组合。本公开的这种方法不应当被解释为反映所要求保护的发明需要比每个权利要求中明确阐述的更多特征的意图。相反，如以下权利要求所反映的，发明性方面在于少于单个前述公开的实施例、配置或方面的所有特征。因此，所附的权利要求在此结合到具体实施方式中，每项权利要求本身作为本发明的单独的优选实施例。

而且，虽然本发明的描述已经包括对一个或多个实施例、配置或方面以及某些变化和修改的描述，但是其它变化、组合和修改也在本发明的范围内，例如可以是在理解本公开之后的本领域技术人员的技能和知识范围内。旨在获得在允许的程度上包括替代实施例、配置或方面的权利，包括相对要求保护的结构、功能、范围或步骤的替代、可互换和/或等同的结构、功能、范围或步骤，无论这些替代、可互换和/或等同的结构、功能、范围或步骤是否在本文中被公开，并且不意在公然贡献任何可专利的主题。

Claims

1.一种会议服务器，包括：

到网络的网络接口；

存储组件，包括非暂态存储设备；

处理器，包括至少一个微处理器；以及

其中处理器一旦访问机器可执行指令，使处理器进行以下操作：

经由网络向多个端点中的每个端点广播会议内容，并且其中会议内容包括从所述多个端点中的贡献端点接收的音频部分；

确定音频部分是否与会议内容无关；以及

一旦确定音频部分与会议内容无关，执行静音动作以将音频部分从会议内容中排除。

2.如权利要求1所述的会议服务器，其中处理器进行执行静音动作还包括：发信号通知贡献端点以使贡献端点激励静音提示电路。

3.如权利要求1所述的会议服务器，其中处理器还进行：

访问参与者的音频简档，其中在音频简档中表征参与者在向会议内容贡献讲话时提供的讲话。

4.如权利要求3所述的会议服务器，其中处理器还进行：

访问参与者的音频简档，其包括：讲话音量、音高、范围、音调或讲话速度中的至少一个；以及

确定音频部分是否与会议内容无关，还包括：确定音频部分的讲话音量、音高、范围、音调或讲话速度中的至少一个与音频简档的讲话音量、音高、范围、音调或讲话速度中的所述至少一个不同。

5.如权利要求3所述的会议服务器，其中处理器一旦确定音频部分的讲话音量、音高、范围、音调或讲话速度中的至少一个与音频简档的讲话音量、音高、范围、音调或讲话速度中的所述至少一个不同并且差异大于先前确定的阈值，就确定音频部分与会议内容无关。

6.如权利要求4所述的会议服务器，其中音频简档包括从参与者被与所述多个端点中的不同端点相关联的另一个参与者按姓名寻址到之后的会议内容中采样的讲话音量、音高、范围、音调或讲话速度中的至少一个。

7.如权利要求3所述的会议服务器，其中处理器一旦检测到会议内容包括姓名并且在姓名之后听到来自参与者的讲话，就确定参与者的音频简档。

8.如权利要求1所述的会议服务器，其中处理器还进行：

访问参与者的音频简档，其中在音频简档中表征由参与者提供的关于包括第一口头语言的声音属性的讲话；以及

确定音频部分是否与会议内容无关，还包括：确定音频部分是否包括第二口头语言。

9.如权利要求1所述的会议服务器，其中处理器还进行：使所述多个端点中的每个端点呈现与贡献端点相关联的静音动作的标记。

10.一种会议服务器，包括：

到网络的网络接口；

存储组件，包括非暂态存储设备；

处理器，包括至少一个微处理器；以及

经由网络向多个端点中的每个端点广播会议内容，并且其中会议内容选择性地包括从所述多个端点中的贡献端点接收的音频部分；

确定音频部分是否被静音，其中处理器从贡献端点接收音频部分并从会议内容中忽略该音频部分；

一旦确定音频部分被静音，确定贡献端点是否被错误地静音；

当被错误地静音时，执行取消静音动作以将音频部分包括在会议内容中。