CN117714221A - 会议纪要构建方法、装置、存储介质及智能眼镜 - Google Patents
会议纪要构建方法、装置、存储介质及智能眼镜 Download PDFInfo
- Publication number
- CN117714221A CN117714221A CN202311460517.4A CN202311460517A CN117714221A CN 117714221 A CN117714221 A CN 117714221A CN 202311460517 A CN202311460517 A CN 202311460517A CN 117714221 A CN117714221 A CN 117714221A
- Authority
- CN
- China
- Prior art keywords
- user
- conference
- target
- meeting
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 42
- 239000011521 glass Substances 0.000 title claims abstract description 36
- 238000004891 communication Methods 0.000 claims abstract description 43
- 230000004044 response Effects 0.000 claims abstract description 15
- 239000004984 smart glass Substances 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 21
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 description 39
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种基于智能眼镜的会议纪要构建方法、装置、电子设备以及存储介质,包括:响应于针对目标设备的连接操作,与所述目标设备建立通信连接;通过所述通信连接,从所述目标设备中获取目标会议的会议音频数据;从所述会议音频数据中识别所述目标会议中参会用户的用户声纹;基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要,该方案可以减少人力消耗,并且,还可以提高会议纪要的有效性。
Description
技术领域
本申请涉及智能设备技术领域,尤其涉及一种基于智能眼镜的会议纪要构建方法、装置、存储介质及智能眼镜。
背景技术
随着计算机技术的发展,会议的形式越来越多样,不局限于参会人员聚集到统一的会议室中进行开会,可以通过远程音视频的网络会议,实现跨地域的会议召开,便利了人们的工作和生活。在会议过程中,往往需要参会人员对会议的内容进行文字记录,通常是以手动记笔记或录制音视频后回顾的方式记录会议。
然而,在目前的方案中,依赖记录人员手动记录或回顾音视频资料从而构建相应的会议纪要,十分费时,并且,并且在多方会场参与提出意见时,可能会出现遗漏或错误的情况,即,会议纪要的有效性不高。
发明内容
基于此,本申请提供一种基于智能眼镜的会议纪要构建方法、装置、存储介质及智能眼镜,可以减少人力消耗,并且,还可以提高会议纪要的有效性。
第一方面,本申请实施例提供一种基于智能眼镜的会议纪要构建方法,包括:
响应于针对目标设备的连接操作,与所述目标设备建立通信连接;
通过所述通信连接,从所述目标设备中获取目标会议的会议音频数据;
从所述会议音频数据中识别所述目标会议中参会用户的用户声纹;
基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要。
第二方面,本申请实施例还提供一种基于智能眼镜的会议纪要构建装置,包括:
建立模块,用于响应于针对目标设备的连接操作,与所述目标设备建立通信连接;
获取模块,用于通过所述通信连接,从所述目标设备中获取目标会议的会议音频数据;
识别模块,用于从所述会议音频数据中识别所述目标会议中参会用户的用户声纹;
构建模块,用于基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要。
可选地,在本申请的一些实施例中,所述构建模块包括:
分割单元,用于对所述会议音频数据进行分割,得到多个用户语音数据;
获取单元,用于获取所述参会用户的用户标识;
构建单元,用于根据所述用户语音数据、用户声纹以及用户标识,构建所述目标会议的会议纪要。
可选地,在本申请的一些实施例中,所述构建单元包括:
转换子单元,用于将所述用户语音数据转换为用户语音文本;
确定子单元,用于根据所述用户声纹以及用户标识,确定所述用户语音文本对应的参会用户;
构建子单元,用于基于所述用户语音文本的语义以及所述用户语音文本对应的参会用户,构建所述目标会议的会议纪要。
可选地,在本申请的一些实施例中,所述构建子单元具体用于:
基于所述用户语音文本的语义,从所述用户语音文本中截取目标文本;
以所述目标文本为基准,根据所述用户语音文本对应的参会用户,构建所述目标会议的会议纪要。
可选地,在本申请的一些实施例中,所述确定子单元具体用于:
将所述用户声纹与用户标识进行绑定;
将所述用户声纹与预先录入的候选声纹进行匹配,并将匹配的候选声纹确定为目标声纹;
根据绑定信息以及所述目标声纹对应的用户信息,确定所述用户语音文本对应的参会用户。
可选地,在本申请的一些实施例中,还包括创建模块,所述创建模块具体用于:
提取所述会议纪要的会议内容;
基于所述会议内容生成当前用户的待办事项;
响应于针对所述待办事项的任务创建操作,创建所述待办事项对应的任务提醒。
可选地,在本申请的一些实施例中,还包括上传模块,所述上传模块具体用于:
利用当前的账号信息对所述会议纪要进行加密;
将加密数据上传至云端。
第三方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器上述基于智能眼镜的会议纪要构建方法的步骤。
第四方面,本申请实施例提供了一种智能眼镜,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述基于智能眼镜的会议纪要构建方法的步骤。
本申请实施例提供一种基于智能眼镜的会议纪要构建方法、装置、存储介质及智能眼镜,在响应于针对目标设备的连接操作,与所述目标设备建立通信连接后,通过所述通信连接,从所述目标设备中获取目标会议的会议音频数据,接着,从所述会议音频数据中识别所述目标会议中参会用户的用户声纹,最后,基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要。在本申请提供的基于智能眼镜的会议纪要构建方案中,识别目标设备通过通信连接传输的会议音频数据的用户声纹,然后,基于用户声纹以及会议音频数据,构建目标会议的会议纪要,避免出现记录人员手动记录会议内容导致会议纪要的可靠性不佳的问题,同时,还可以减少人力消耗。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1是本申请实施例提供的基于智能眼镜的会议纪要构建方法的场景示意图;
图2是本申请实施例提供的基于智能眼镜的会议纪要构建方法的流程图;
图3是本申请实施例提供的基于智能眼镜的会议纪要构建方法中会议纪要的界面示意图;
图4是本申请实施例提供的基于智能眼镜的会议纪要构建装置的结构示意图;
图5是本申请实施例提供的基于智能眼镜的会议纪要构建装置的另一结构示意图;
图6是本申请实施例提供的基于智能眼镜的会议纪要构建装置的又一结构示意图;
图7是本申请提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供一种基于智能眼镜的会议纪要构建方法、装置、存储介质及智能眼镜。
其中,本申请提供的基于智能眼镜的会议纪要构建装置可以集成在智能眼镜中,该智能眼镜可以通过有线或无线通信方式进行直接或间接地与电子设备进行连接,电子设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱或智能手表等,但并不局限于此。此外,智能眼镜也可以与服务器进行连接,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,本申请在此不做限制。
例如,请参阅图1,本申请提供一种基于智能眼镜的会议纪要构建装置,该基于智能眼镜的会议纪要构建装置集成在智能眼镜10中,用户在使用智能眼镜10时,建立智能眼镜10与手机20之间的蓝牙连接,然后,通过该蓝牙连接,从手机20中获取目标会议的会议音频数据。接着,智能眼镜20从会议音频数据中识别目标会议中参会用户的用户声纹。最后,智能眼镜20基于用户声纹以及会议音频数据,构建目标会议的会议纪要,用户30则可以通过智能眼镜20获取该目标会议的会议纪要。
本申请提供的基于智能眼镜的会议纪要构建方法,识别目标设备通过通信连接传输的会议音频数据的用户声纹,然后,基于用户声纹以及会议音频数据,构建目标会议的会议纪要,避免出现记录人员手动记录会议内容导致会议纪要的可靠性不佳的问题,同时,还可以减少人力消耗。
本申请一种基于智能眼镜的会议纪要构建方法,包括:响应于针对目标设备的连接操作,与目标设备建立通信连接;通过通信连接,从目标设备中获取目标会议的会议音频数据;从会议音频数据中识别目标会议中参会用户的用户声纹;基于用户声纹以及会议音频数据,构建目标会议的会议纪要。
请参阅图2,图2为本申请提供的基于智能眼镜的会议纪要构建方法的流程示意图。该基于智能眼镜的会议纪要构建方法的具体流程可以如下:
101、响应于针对目标设备的连接操作,与目标设备建立通信连接。
其中,目标设备可以是智能手机、平板电脑或笔记本电脑,以智能手机为例,响应于针对智能手机的连接操作,与智能手机建立蓝牙通信,该蓝牙通信的通信信道可以是标准蓝牙协议通道,也可以是低功耗蓝牙协议通道。可选地,可以与智能手机建立标准蓝牙协议通道,以便后续智能手机可以通过该标准蓝牙协议通道传输数据。可以理解的是,该连接操作可以是由用户触发的,也可以是由智能眼镜触发的。需要说明的是,当智能眼镜和智能手机均打开蓝牙功能时,则由智能眼镜触发连接操作。
102、通过通信连接,从目标设备中获取目标会议的会议音频数据。
具体的,目标设备可以通过标准蓝牙协议通道传输目标会议的会议音频数据,智能眼镜通过标准蓝牙协议通道获取目标会议的会议音频数据。需要说明的是,在从目标设备中获取目标会议的会议音频数据之前,目标设备可以对会议音频数据进行降噪处理,即,在一些实施例中,可以通过通信连接,从目标设备中获取降噪后的会议音频数据。
103、从会议音频数据中识别目标会议中参会用户的用户声纹。
所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不变。基于声纹的这两个特征,便于后续将会议音频数据分割出每个参会用户的用户语音数据,进而提高后续会议纪要的有效性。
在本申请实施例中,可以通过预先训练声纹提取模型从会议音频数据提取声纹特征,然后,基于声纹特征提取参会用户的用户声纹。
可选地,在一些实施例中,本申请实施例的用户声纹并不是为了进行用户验证,而是为了区分不同用户,便于后续进行构建会议纪要,故,在提取到声纹特征后,可以利用高斯混合模型对提取的声纹特征进行处理,从而得到参会用户的用户声纹,如对声纹特征t1进行处理,得到参会用户u1对应的用户声纹s1、对声纹特征t2进行处理,得到参会用户u2对应的用户声纹s2,依次类推。
104、基于用户声纹以及会议音频数据,构建目标会议的会议纪要。
例如,具体的,可以根据上述用户声纹对会议音频数据进行分割,从而得到多个用户语音数据,该用户语音数据对应一个用户声纹,随后,再根据用户标识、用户语音数据以及用户声纹,构建目标会议的会议纪要,即,可选地,在一些实施例中,步骤“基于用户声纹以及会议音频数据,构建目标会议的会议纪要”,具体可以包括:
(11)对会议音频数据进行分割,得到多个用户语音数据;
(12)获取参会用户的用户标识;
(13)根据用户语音数据、用户声纹以及用户标识,构建目标会议的会议纪要。
具体的,由于在会议中可能会出现两个人或者三个人同时说话的情况,如同事之间的交谈或多端之间的对话,同一段语音当中包含多个人的说话语音,如果直接进行语音识别,可能导致识别的结果不准确。因此,本申请采用RNN对会议音频数据进行分割,从而分割出多个用户语音数据。
在得到每个参会用户的用户语音数据后,可以将参会用户的用户标识与用户语音数据进行关联,便于后续构建目标会议的会议纪要。例如,具体的,对会议音频数据进行分割,得到用户语音数据y1、用户语音数据y2和用户语音数据y3后,可以获取参会用户的用户标识,如获取到用户标识u1、用户标识u2以及用户标识u3,然后,将用户声纹、用户标识以及用户语音数据进行关联,比如,将用户声纹s1-用户标识u1-用户语音数据y1进行关联,以便后续构建目标会议的会议纪要。
需要说明的是,在目前的线上会议中,通常都一个用户使用一个用户账号进行参会,当然,也会存在一个用户账号对应多个用户的情况。针对于用户账号对应一个参会用户的情况,则采用上述方法将数据进行关联,以便后续构建会议纪要;针对于一个用户账号对应多个参会用户的情况,首先,可将用户声纹与用户语音数据进行关联,随后,确认其对应的标识,还是以前面的数据为例,可以将用户声纹s1与其对应的用户语音数据y1进行关联、将用户声纹s2与其对应的用户语音数据y2进行关联、以及将用户声纹s3与其对应的用户语音数据y3进行关联,然后,确定每个用户标识的说话时间以及每个用户语音数据对应的时间戳,基于每个用户标识的说话时间以及每个用户语音数据对应的时间戳,确定用户语音数据所对应的用户标识,如,确定用户语音数据y1和用户语音数据y2均通过用户标识u1的用户账号进行发言的,则关联结果为:用户声纹s1-用户标识u1-用户语音数据y1以及用户声纹s2-用户标识u1-用户语音数据y2,后续进行构建会议纪要时则以此关联数据为准,即,可选地,在一些实施例中,步骤“根据用户语音数据、用户声纹以及用户标识,构建目标会议的会议纪要”,具体可以包括:
(21)将用户语音数据转换为用户语音文本;
(22)根据用户声纹以及用户标识,确定用户语音文本对应的参会用户;
(23)基于用户语音文本的语义以及用户语音文本对应的参会用户,构建目标会议的会议纪要。
可以理解的是,语音数据是连续不断的信号,无法直接用于构建会议纪要,因此,在本申请中,将用户语音数据转换为用户语音文本,然后,根据用户声纹以及用户标识,确定对应的参会用户,最后,基于用户语音文本的语义以及用户语音文本对应的参会用户,构建目标会议的会议纪要。
需要说明的是,会议纪要是在会议记录基础上经过加工、整理出来的一种记叙性和介绍性的文件。包括会议的基本情况、主要精神及中心内容,便于向上级汇报或向有关人员传达及分发。整理加工时或按会议程序记叙,或按会议内容概括出来的几个问题逐一叙述。
由于在会议过程中,往往会出现某些与会议无关的内容,如请xx进行发言、会议开始或会议结束等,若将这些与会议无关的内容记录在会议纪要中,不仅浪费计算资源,还降低会议纪要的有效性,故,在一些实施例中,根据用户语音文本的语义,从用户语音文本中截取与会议内容相关的文本,然后,以截取的文本为进行构建会议纪要,也即,步骤“基于用户语音文本的语义以及用户语音文本对应的参会用户,构建目标会议的会议纪要”,具体可以包括:
(31)基于用户语音文本的语义,从用户语音文本中截取目标文本;
(32)以目标文本为基准,根据用户语音文本对应的参会用户,构建目标会议的会议纪要。
例如,可以通过大语言模型对用户语音文本进行语义识别,然后,基于语义识别结果,从用户语音文本中截取与会议内容相关的目标文本,随后,以目标文本为基准,根据用户语音文本对应的参会用户,构建目标会议的会议纪要。
具体的,请参阅图3,用户语音文本为:现阶段,销售团队今年的年销售额为xx元,各销售组长应同一明确这一目标,并围绕这一目标开展工作,做到指标到人,严格考核,按节点完成,心中有数,那么通过大语言模型对用户语音文本进行语义识别后,从用户语音文本中截取与会议内容相关的目标文本为:销售团队今年的年销售额为xx元,做到指标到人,严格考核,按节点完成,心中有数,随后,将该目标文本填写至预设的会议纪要模板中,得到目标会议的会议纪要。
需要说明的是,大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型的基本原理是通过深度学习技术,通过多层神经网络去建模语言的统计规律和潜在语义信息。这样的模型在训练过程中会对大量的文本数据进行学习和抽象,从而可以生成具有逻辑和连贯性的语言输出。同时,这类模型也需要收集和整理大规模的数据集来进行训练,以保证模型能够有较好的泛化能力。
此外,还需要说明的是,上述的情况是针对未录入声纹的情况。在一些场景中,如部门会议中,可以预先录入用户的声纹,并将该声纹与用户进行关联,后续则可以根据实际采集的用户声纹与录入的声纹之间的匹配度,确定实际采集的用户声纹对应的用户;当然,也可以将每次会议的用户声纹保存至云端,当某个用户声纹上传至云端的次数大于预设值时,也可以将该上传次数大于预设值的用户声纹用于后续声纹匹配,即,可选地,在一些实施例中,步骤“根据用户声纹以及用户标识,确定用户语音文本对应的参会用户”,具体可以包括:
(41)将用户声纹与用户标识进行绑定;
(42)将用户声纹与预先录入的候选声纹进行匹配,并将匹配的候选声纹确定为目标声纹;
(43)根据绑定信息以及目标声纹对应的用户信息,确定用户语音文本对应的参会用户。
在得到会议纪要后,还可以根据会议纪要的纪要内容,生成相应的待办事项,然后,当前用户可以根据实际需求创建与该待办事项相关的任务提示,即,可选地,在一些实施例中,本申请的基于智能眼镜的会议纪要构建方法具体还可以包括:
(51)提取会议纪要的会议内容;
(52)基于会议内容生成当前用户的待办事项;
(53)响应于针对待办事项的任务创建操作,创建待办事项对应的任务提醒。
需要说明的是,上述创建待办事项对应的任务提醒包括两种情况:
情况1:针对于已预先录入声纹的场景,当前用户所在的智能眼镜可以将该会议内容通过通信连接发送至目标设备中,由目标设备确定会议内容与当前用户相关的相关内容,然后,接收目标设备返回的相关内容,基于该相关内容生成当前用户的待办事项,随后,可以显示任务创建界面,当接收到当前用户针对该任务创建界面的确认操作时,即,响应于针对待办事项的任务创建操作,创建待办事项对应的任务提醒。
情况2:针对于未预先录入声纹的场景,目标设备无法从会议内容中获知哪些内容指定由当前用户执行,因此,目标设备则可以基于会议内容输出每个子内容的相关描述,然后,接收目标设备返回的相关描述,并基于相关描述生成当前用户的待办事项,具体任务提醒创建过程则与情况1相同,具体参阅前面实施例,在此不再赘述。
另外,为了便于用户可以调用相应的会议纪要,在构建会议纪要后,可以将该会议纪要上传至云端,即,可选地,在一些实施例中,本申请的基于智能眼镜的会议纪要构建方法具体还可以包括:
(61)利用当前的账号信息对会议纪要进行加密;
(62)将加密数据上传至云端。
利用当前的账号信息对会议纪要进行加密,不仅可以保证会议纪要内容的安全性,还可以保证加密秘钥的唯一性,由此,可以避免不法分子通过云端获取到企业内部的会议信息。
以上完成本申请的基于智能眼镜的会议纪要构建流程。
如上所述,本申请提供一种基于智能眼镜的会议纪要构建方法,在响应于针对目标设备的连接操作,与目标设备建立通信连接后,通过通信连接,从目标设备中获取目标会议的会议音频数据,接着,从会议音频数据中识别目标会议中参会用户的用户声纹,最后,基于用户声纹以及会议音频数据,构建目标会议的会议纪要。在本申请提供的基于智能眼镜的会议纪要构建方法中识别目标设备通过通信连接传输的会议音频数据的用户声纹,然后,基于用户声纹以及会议音频数据,构建目标会议的会议纪要,避免出现记录人员手动记录会议内容导致会议纪要的可靠性不佳的问题,同时,还可以减少人力消耗。
相应的,请参阅图4,本申请实施例提供一种基于智能眼镜的会议纪要构建装置(以下简称构建装置),该交互装置包括建立模块201、获取模块202、识别模块203以及构建模块204,具体如下:
建立模块201,用于响应于针对目标设备的连接操作,与目标设备建立通信连接。
建立模块201可以建立智能眼镜与智能手机之间的标准蓝牙协议通道。
获取模块202,用于通过通信连接,从目标设备中获取目标会议的会议音频数据。
具体的,目标设备可以通过标准蓝牙协议通道传输目标会议的会议音频数据,获取模块202通过标准蓝牙协议通道获取目标会议的会议音频数据。可选地,在一些实施例中,获取模块202在从目标设备中获取目标会议的会议音频数据之前,目标设备可以对会议音频数据进行降噪处理,即,在一些实施例中,获取模块202可以通过通信连接,从目标设备中获取降噪后的会议音频数据。
识别模块203,用于从会议音频数据中识别所述目标会议中参会用户的用户声纹。
在本申请实施例中,识别模块203可以通过预先训练声纹提取模型从会议音频数据提取声纹特征,然后,基于声纹特征提取参会用户的用户声纹。
可选地,在一些实施例中,本申请实施例的用户声纹并不是为了进行用户验证,而是为了区分不同用户,便于后续进行构建会议纪要,故,在提取到声纹特征后,可以利用高斯混合模型对提取的声纹特征进行处理,从而得到参会用户的用户声纹。
构建模块204,用于基于用户声纹以及会议音频数据,构建目标会议的会议纪要。
例如,具体的,构建模块204可以根据上述用户声纹对会议音频数据进行分割,从而得到多个用户语音数据,该用户语音数据对应一个用户声纹,随后,再根据用户标识、用户语音数据以及用户声纹,构建目标会议的会议纪要。
可选地,在本申请的一些实施例中,构建模块204具体可以包括:
分割单元,用于对会议音频数据进行分割,得到多个用户语音数据;
获取单元,用于获取参会用户的用户标识;
构建单元,用于根据用户语音数据、用户声纹以及用户标识,构建目标会议的会议纪要。
可选地,在本申请的一些实施例中,构建单元具体可以包括:
转换子单元,用于将用户语音数据转换为用户语音文本;
确定子单元,用于根据用户声纹以及用户标识,确定用户语音文本对应的参会用户;
构建子单元,用于基于用户语音文本的语义以及用户语音文本对应的参会用户,构建目标会议的会议纪要。
可选地,在本申请的一些实施例中,构建子单元具体可以用于:基于用户语音文本的语义,从用户语音文本中截取目标文本;以目标文本为基准,根据用户语音文本对应的参会用户,构建目标会议的会议纪要。
可选地,在本申请的一些实施例中,确定子单元具体可以用于:将用户声纹与用户标识进行绑定;将用户声纹与预先录入的候选声纹进行匹配,并将匹配的候选声纹确定为目标声纹;根据绑定信息以及目标声纹对应的用户信息,确定用户语音文本对应的参会用户。
可选地,在本申请的一些实施例中,请参阅图5,本申请的构建装置具体还可以包括创建模块205,该创建模块205具体可以用于:提取会议纪要的会议内容;基于会议内容生成当前用户的待办事项;响应于针对待办事项的任务创建操作,创建待办事项对应的任务提醒。
可选地,在本申请的一些实施例中,请参阅图6,本申请的构建装置具体还可以包括上传模块206,该上传模块206具体可以用于:利用当前的账号信息对会议纪要进行加密;将加密数据上传至云端。
如上所述,本申请提供一种基于智能眼镜的会议纪要构建装置,建立模块201在响应于针对目标设备的连接操作,与目标设备建立通信连接后,获取模块202通过通信连接,从目标设备中获取目标会议的会议音频数据,接着,识别模块203从会议音频数据中识别目标会议中参会用户的用户声纹,最后,构建模块204基于用户声纹以及会议音频数据,构建目标会议的会议纪要。在本申请提供的基于智能眼镜的会议纪要构建方法中识别目标设备通过通信连接传输的会议音频数据的用户声纹,然后,基于用户声纹以及会议音频数据,构建目标会议的会议纪要,避免出现记录人员手动记录会议内容导致会议纪要的可靠性不佳的问题,同时,还可以减少人力消耗。
此外,本申请还提供一种电子设备,如图7所示,其示出了本申请所涉及的智能眼镜的结构示意图,具体来讲:该智能眼镜可以包括一个或者一个以上处理核心的处理器301、一个或一个以上计算机可读存储介质的存储器302、电源303和输入单元304等部件。本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器301是该智能眼镜的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器302内的软件程序和/或模块,以及调用存储在存储器302内的数据,执行智能眼镜的各种功能和处理数据,从而对智能眼镜进行整体监控。可选的,处理器301可包括一个或多个处理核心;优选的,处理器301可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器301中。
存储器302可用于存储软件程序以及模块,处理器301通过运行存储在存储器302的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据智能眼镜的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器302还可以包括存储器控制器,以提供处理器301对存储器302的访问。
智能眼镜还包括给各个部件供电的电源303,优选的,电源303可以通过电源管理系统与处理器301逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源303还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该智能眼镜还可包括输入单元304,该输入单元304可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,智能眼镜还可以包括显示单元等,在此不再赘述。具体在本实施例中,智能眼镜中的处理器301会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器302中,并由处理器301来运行存储在存储器302中的应用程序,从而实现各种功能,如下:
响应于针对目标设备的连接操作,与目标设备建立通信连接;通过通信连接,从目标设备中获取目标会议的会议音频数据;从会议音频数据中识别目标会议中参会用户的用户声纹;基于用户声纹以及会议音频数据,构建目标会议的会议纪要。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本申请实施例在响应于针对目标设备的连接操作,与目标设备建立通信连接后,通过通信连接,从目标设备中获取目标会议的会议音频数据,接着,从会议音频数据中识别目标会议中参会用户的用户声纹,最后,基于用户声纹以及会议音频数据,构建目标会议的会议纪要。在本申请提供的基于智能眼镜的会议纪要构建方法中识别目标设备通过通信连接传输的会议音频数据的用户声纹,然后,基于用户声纹以及会议音频数据,构建目标会议的会议纪要,避免出现记录人员手动记录会议内容导致会议纪要的可靠性不佳的问题,同时,还可以减少人力消耗。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请所提供的任一种基于智能眼镜的会议纪要构建方法中的步骤。例如,该指令可以执行如下步骤:
响应于针对目标设备的连接操作,与目标设备建立通信连接;通过通信连接,从目标设备中获取目标会议的会议音频数据;从会议音频数据中识别目标会议中参会用户的用户声纹;基于用户声纹以及会议音频数据,构建目标会议的会议纪要。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请所提供的任一种基于智能眼镜的会议纪要构建方法中的步骤,因此,可以实现本申请所提供的任一种基于智能眼镜的会议纪要构建方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述各种可选实现方式中提供的方法。
以上对本申请所提供的一种基于智能眼镜的会议纪要构建方法、装置、存储介质及智能眼镜进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于智能眼镜的会议纪要构建方法,其特征在于,包括:
响应于针对目标设备的连接操作,与所述目标设备建立通信连接;
通过所述通信连接,从所述目标设备中获取目标会议的会议音频数据;
从所述会议音频数据中识别所述目标会议中参会用户的用户声纹;
基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要。
2.根据权利要求1所述的方法,其特征在于,所述基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要,包括:
对所述会议音频数据进行分割,得到多个用户语音数据;
获取所述参会用户的用户标识;
根据所述用户语音数据、用户声纹以及用户标识,构建所述目标会议的会议纪要。
3.根据权利要求2所述的方法,其特征在于,所述根据所述用户语音数据、用户声纹以及用户标识,构建所述目标会议的会议纪要,包括:
将所述用户语音数据转换为用户语音文本;
根据所述用户声纹以及用户标识,确定所述用户语音文本对应的参会用户;
基于所述用户语音文本的语义以及所述用户语音文本对应的参会用户,构建所述目标会议的会议纪要。
4.根据权利要求3所述的方法,其特征在于,所述基于所述用户语音文本的语义以及所述用户语音文本对应的参会用户,构建所述目标会议的会议纪要,包括:
基于所述用户语音文本的语义,从所述用户语音文本中截取目标文本;
以所述目标文本为基准,根据所述用户语音文本对应的参会用户,构建所述目标会议的会议纪要。
5.根据权利要求3所述的方法,其特征在于,所述根据所述用户声纹以及用户标识,确定所述用户语音文本对应的参会用户,包括:
将所述用户声纹与用户标识进行绑定;
将所述用户声纹与预先录入的候选声纹进行匹配,并将匹配的候选声纹确定为目标声纹;
根据绑定信息以及所述目标声纹对应的用户信息,确定所述用户语音文本对应的参会用户。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要之后,还包括:
提取所述会议纪要的会议内容;
基于所述会议内容生成当前用户的待办事项;
响应于针对所述待办事项的任务创建操作,创建所述待办事项对应的任务提醒。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要之后,还包括:
利用当前的账号信息对所述会议纪要进行加密;
将加密数据上传至云端。
8.一种基于智能眼镜的会议纪要构建装置,其特征在于,包括:
建立模块,用于响应于针对目标设备的连接操作,与所述目标设备建立通信连接;
获取模块,用于通过所述通信连接,从所述目标设备中获取目标会议的会议音频数据;
识别模块,用于从所述会议音频数据中识别所述目标会议中参会用户的用户声纹;
构建模块,用于基于所述用户声纹以及会议音频数据,构建所述目标会议的会议纪要。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述基于智能眼镜的会议纪要构建方法的步骤。
10.一种智能眼镜,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述基于智能眼镜的会议纪要构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311460517.4A CN117714221A (zh) | 2023-11-03 | 2023-11-03 | 会议纪要构建方法、装置、存储介质及智能眼镜 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311460517.4A CN117714221A (zh) | 2023-11-03 | 2023-11-03 | 会议纪要构建方法、装置、存储介质及智能眼镜 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117714221A true CN117714221A (zh) | 2024-03-15 |
Family
ID=90150449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311460517.4A Pending CN117714221A (zh) | 2023-11-03 | 2023-11-03 | 会议纪要构建方法、装置、存储介质及智能眼镜 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117714221A (zh) |
-
2023
- 2023-11-03 CN CN202311460517.4A patent/CN117714221A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488433B (zh) | 一种适用于银行的提升现场体验感的人工智能交互系统 | |
CN106686339A (zh) | 电子会议智能 | |
CN106685916A (zh) | 电子会议智能 | |
CN109474763A (zh) | 一种基于语音、语义的ai智能会议系统及其实现方法 | |
US20050209848A1 (en) | Conference support system, record generation method and a computer program product | |
CN106471802A (zh) | 视频会议中的实时视频变换 | |
CN107645523A (zh) | 一种情绪交互的方法和系统 | |
CN109428859A (zh) | 一种同步通信方法、终端及服务器 | |
CN115735357A (zh) | 用于电话会议讨论的投票问题 | |
CN110427099A (zh) | 信息记录方法、装置、系统、电子设备以及信息获取方法 | |
CN104540035B (zh) | 一种无障碍视频手语呼叫系统及方法 | |
WO2017172655A1 (en) | Analysis of a facial image to extract physical and emotional characteristics of a user | |
CN111405236A (zh) | 一种视频会议大数据化分析方法和系统 | |
KR20170126667A (ko) | 회의 기록 자동 생성 방법 및 그 장치 | |
CN113111658B (zh) | 校验信息的方法、装置、设备和存储介质 | |
US20210406292A1 (en) | Recognizing polling questions from a conference call discussion | |
CN114757155B (zh) | 一种会议文档的生成方法及装置 | |
CN117714221A (zh) | 会议纪要构建方法、装置、存储介质及智能眼镜 | |
CN114363103B (zh) | 一种处理会议信息的方法、装置及计算机可读介质 | |
CN112634879B (zh) | 语音会议管理方法、装置、设备及介质 | |
CN112969000A (zh) | 网络会议的控制方法、装置、电子设备和存储介质 | |
WO2024032111A9 (zh) | 在线会议的数据处理方法、装置、设备、介质及产品 | |
CN109976700A (zh) | 一种录音权限转移的方法、电子设备及存储介质 | |
TWI739067B (zh) | 跨通路人工智慧對話式平台及其運作方法 | |
CN113782022B (zh) | 基于意图识别模型的通信方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |