会议记录优化方法、装置、设备及存储介质
技术领域
本发明涉及语音识别技术领域,特别涉及一种会议记录优化方法、装置、设备及存储介质。
背景技术
目前,越来越多的参会人员对自动记录会议内容提出了需求,在某些高端会议室中,已配备自动会议记录功能,即在会议室中放置一个远场麦克风阵列,麦克风录制并提取会议人员声音,通过语音转文字的方法,将音频流转化为相应文字,例如专利201810328377.8提出了一种自动会议记录方法。但是,现有技术中,转化正确率低,尤其是生活中不常见的专有名词和专业关键词的识别率不尽人意。
发明内容
本公开实施例提供了一种会议记录优化方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
在一些可选地实施例中,一种会议记录优化方法,包括:
获取会议语音识别后的第一文字信息;
获取会议中展示的图像信息,并提取图像信息中的第二文字信息;
提取所述第二文字信息中的关键词,结合日常语料库对所述关键词进行过滤处理,建立专用关键词语料库;
根据专用关键词语料库对第一文字信息进行优化。
进一步地,获取会议语音识别后的第一文字信息之前,还包括:
获取会议的语音信息;
通过语音识别服务器将语音信息转换成第一文字信息。
进一步地,提取图像信息中的第二文字信息,包括:
通过光学字符识别技术提取图像信息中的第二文字信息。
进一步地,结合日常语料库对第二文字信息进行过滤处理之前,还包括:
建立日常语料库。
进一步地,根据专用关键词语料库对第一文字信息进行优化,包括:
实时计算所述第一文字信息中的关键词与专用关键词的相似度;
当所述相似度达到预设阈值时,修正所述第一文字信息中的关键词。
进一步地,还包括:
当会议结束时,对第一文字信息再进行整体优化,得到整体优化修正后的第一文字信息;
对整体优化修正后的第一文字信息进行分段以及排版优化。
进一步地,根据专用关键词语料库对第一文字信息进行优化之后,还包括:
将第一文字信息中的专用关键词进行标注;
根据标注后的专用关键词预测第一文字信息的主题。
在一些可选地实施例中,一种会议记录优化装置,包括:
第一获取模块,用于获取会议语音识别后的第一文字信息;
第二获取模块,用于获取会议中展示的图像信息,并提取图像信息中的第二文字信息;
提取模块,用于提取所述第二文字信息中的关键词,结合日常语料库对所述关键词进行过滤处理,建立专用关键词语料库;
优化模块,用于根据专用关键词语料库对第一文字信息进行优化。
在一些可选地实施例中,一种会议记录优化设备,包括:
一个或多个处理器、存储一个或多个程序的存储装置;
当一个或多个程序被一个或多个处理器执行时,一个或多个处理器实现上述实施例提供的一种会议记录优化方法。
在一些可选地实施例中,一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述实施例提供的一种会议记录优化方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本发明提出了一种会议记录优化方法,获取会议语音识别后的第一文字信息;获取会议中展示的图像信息,并提取图像信息中的第二文字信息;结合日常语料库对第二文字信息进行过滤处理,并提取会议关键词,建立专用关键词语料库;根据专用关键词语料库对第一文字信息进行优化。通过上述方法,可以提升现有自动会议记录技术的识别成功率,突出会议主题,节约二次整理时间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种会议记录优化方法的流程示意图;
图2是根据一示例性实施例示出的一种会议记录优化方法的流程示意图;
图3是根据一示例性实施例示出的一种会议记录优化装置的结构示意图;
图4是根据一示例性实施例示出的一种会议记录优化机器人的结构示意图;
图5是根据一示例性实施例示出的一种会议记录优化设备的结构示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或一个以上实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
实施例1:
本公开实施例提供了一种会议记录优化方法,图1是根据一示例性实施例示出的一种会议记录优化方法的流程示意图。如图1所示,在本公开实施例中,一种会议记录优化方法,包括:
S101获取会议语音识别后的第一文字信息;
通常,在获取第一文字信息之前,还包括,获取会议的语音信息,通过语音识别服务器将语音信息转换成第一文字信息。
具体地,首先采集会议的语音信息,通过远场麦克风阵列或其他声音采集设备,采集参会人员的声音信号,并对声音信号做降噪处理,输出优化后的声音音频流数据。然后,将音频流数据发送至语音识别服务器,在一些示例性实施例中,语音识别服务器包括第三方服务器,如讯飞语音识别服务器、腾讯语音识别服务器,或自研语音识别服务器。返回识别后的文字信息,将返回识别后的文字信息作为第一文字信息。
通过上述方法,可以获取到会议语音识别后的第一文字信息。
S102获取会议中展示的图像信息,并提取图像信息中的第二文字信息;
在一些示例性场景中,会在会议中展示一些相关资料的图像信息,这些相关资料与会议主题密切相关,因此,获取会议中展示的相关资料的图像信息,具体地,可通过截屏和摄像头采集等方法实时获取会议资料图像信息。例如,截取当前会议资料播放设备的屏幕内容,发送至处理程序,或通过高清摄像头正对会议资料播放设备的屏幕,实时采集会议图像信息,将图像信息发送至处理程序。
获得上述会议中展示的图像信息后,提取图像信息中的文字信息,具体地,可通过OCR(Optical Character Recognition,光学字符识别)技术提取图像信息中的文字信息,上述OCR技术可针对印刷体字符,采用光学的方式将纸质文档中的文字转换成黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,提取会议中展示的图像信息中的文字信息,将提取出的图像信息中的文字信息作为第二文字信息。
通过上述方法,可以获得会议中展示的图像信息中的文字信息。
S103提取所述第二文字信息中的关键词,结合日常语料库对所述关键词进行过滤处理,建立专用关键词语料库;
通常,在会议场景中,常常会出现很多不常见的专有名词,例如产品名称、学术名、人名等。通过日常语料库对这些不常见的专有名词进行识别的准确率较低,因此,整个会议语音识别的准确率就比较低。
在本公开实施例中,通过建立专用关键词语料库提高对不常见的专有名词的识别准确率。
具体地,获取会议中展示的图像信息中的第二文字信息,提取第二文字信息中的关键词,可通过NLP关键词抽取算法提取第二文字信息中的关键词,将提取出来的关键词与日常语料库中的关键词进行对比,将日常语料库中没有的关键词过滤出来,即过滤出不常用的关键词,将过滤出来的不常用的关键词加入专用关键词语料库,完成专用关键词语料库的建立。其中,日常语料库是预先设立的。
在一些示例性场景中,获取的第二文字信息是“王笑宇是科学家个”。通过NLP关键词抽取算法提取出来的关键词是“王笑宇”和“科学家”,将提取出来的关键词与日常语料库对比,过滤出“王笑宇”不在日常语料库中,将“王笑宇”加入专用关键词语料库。
通过上述方法,可以建立专用的关键词语料库。
S104根据专用关键词语料库对第一文字信息进行优化。
其中,第一文字信息指的是会议语音识别后的文字信息,通过专用关键词语料库对第一文字信息中不常见的关键词进行优化,可以提高语音识别的准确率。
具体地,实时计算所述第一文字信息中的关键词与专用关键词的相似度,当所述相似度达到预设阈值时,修正所述第一文字信息中的关键词。可通过NLP关键词抽取算法提取第一文字信息中的关键词,然后实时计算所述第一文字信息中的关键词与专用关键词的相似度,当所述相似度达到预设阈值时,修正所述第一文字信息中的关键词。其中,预设阈值用户可自行设定。通过上述方法,可修正第一文字信息中的不常用关键词,提高会议记录的准确率。
可选地,根据专用关键词语料库对第一文字信息进行优化之后,还包括:
将第一文字信息中的专用关键词进行标注;
根据标注后的专用关键词预测第一文字信息的主题。
可选地,还包括:当会议结束时,对第一文字信息再进行整体优化,得到整体优化后的第一文字信息;对整体优化后的第一文字信息进行分段以及排版优化。
具体地,在会议结束后,可获得会议完整语音识别的第一文字信息,通过专用语料库对上述第一文字信息再进行整体优化,计算所述第一文字信息中的关键词与专用关键词的相似度,当所述相似度达到预设阈值时,修正所述第一文字信息中的关键词。得到整体优化后的第一文字信息,提高第一文字信息的识别准确率。
获得整体优化后的第一文字信息后,对整体优化后的第一文字信息进行分段以及排版,提升读者的阅读体验以及降低会议整理的工作量。
进一步地,获取会议语音识别后的第一文字信息之前,还包括:
获取会议的语音信息;
通过语音识别服务器将语音信息转换成第一文字信息。
具体地,首先采集会议的语音信息,通过远场麦克风阵列或其他声音采集设备,采集参会人员的声音信号,并对声音信号做降噪处理,输出优化后的声音音频流数据。然后,将音频流数据发送至语音识别服务器,在一些示例性实施例中,语音识别服务器包括第三方服务器,如讯飞语音识别服务器、腾讯语音识别服务器,或自研语音识别服务器。返回识别后的文字信息,将返回识别后的文字信息作为第一文字信息。
进一步地,提取图像信息中的第二文字信息,包括:
通过光学字符识别技术提取图像信息中的第二文字信息。
获得上述会议中展示的图像信息后,提取图像信息中的文字信息,具体地,可通过OCR(Optical Character Recognition,光学字符识别)技术提取图像信息中的文字信息,上述OCR技术可针对印刷体字符,采用光学的方式将纸质文档中的文字转换成黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,提取会议中展示的图像信息中的文字信息,将提取出的图像信息中的文字信息作为第二文字信息。
进一步地,结合日常语料库对第二文字信息进行过滤处理之前,还包括:
建立日常语料库。
进一步地,根据专用关键词语料库对第一文字信息进行优化,包括:
实时计算所述第一文字信息中的关键词与专用关键词的相似度;
当所述相似度达到预设阈值时,修正所述第一文字信息中的关键词。
进一步地,还包括:
当会议结束时,对第一文字信息再进行整体优化,得到整体优化后的第一文字信息;
对整体优化后的第一文字信息进行分段以及排版优化。
具体地,在会议结束后,可获得会议完整语音识别的第一文字信息,通过专用语料库对上述第一文字信息再进行整体优化,计算所述第一文字信息中的关键词与专用关键词的相似度,当所述相似度达到预设阈值时,修正所述第一文字信息中的关键词。得到整体优化后的第一文字信息,提高第一文字信息的识别准确率。
获得整体优化后的第一文字信息后,对整体优化后的第一文字信息进行分段以及排版,提升读者的阅读体验以及降低会议整理的工作量。
进一步地,根据专用关键词语料库对第一文字信息进行优化之后,还包括:
将第一文字信息中的专用关键词进行标注;
根据标注后的专用关键词预测第一文字信息的主题。
基于上述实施例,可以提取会议中展示的图像信息中的第二文字信息,结合日常语料库和第二文字信息建立专用关键词语料库,通过专用关键词语料库对语音转换后的第一文字信息中的不常用关键词进行优化,提高自动会议记录技术的识别成功率,突出会议主题,并且对最终生成的会议记录文字信息进行排版优化,可以提升阅读体验,降低会议整理的工作量。
图2是根据一示例性实施例示出的一种会议记录优化方法的流程示意图。
如图2所示,一种会议记录优化方法,包括:会议语音采集,将采集的语音信息转换成第一文字信息,获取会议资料画面,通过OCR技术提取会议资料画面中的第二文字信息,提取第二文字信息中的关键词,将提取出来的关键词与日常语料库中的关键词进行对比,将日常语料库中没有的关键词过滤出来,即过滤出不常用的关键词,将过滤出来的不常用的关键词加入专用关键词语料库,完成专用关键词语料库的建立。然后通过专用关键词语料库对第一文字信息进行优化,得到优化后的第一文字信息,对优化后的第一文字信息进行分段、排版、关键词标注以及主题预测。通过上述方法,不仅可以提高会议记录的准确率,还可以提升读者的阅读体验,降低会议整理的工作量。
实施例2:
本公开实施例提供了一种会议记录优化装置,图3是根据一示例性实施例示出的一种会议记录优化装置的结构示意图。如图3所示,在本公开实施例中,一种会议记录优化装置,包括:
S301第一获取模块,用于获取会议语音识别后的第一文字信息;
S302第二获取模块,用于获取会议中展示的图像信息,并提取图像信息中的第二文字信息;
S303提取模块,用于提取所述第二文字信息中的关键词,结合日常语料库对所述关键词进行过滤处理,建立专用关键词语料库;
S304优化模块,用于根据专用关键词语料库对第一文字信息进行优化。
基于上述实施例,可以提取会议中展示的图像信息中的第二文字信息,结合日常语料库和第二文字信息建立专用关键词语料库,通过专用关键词语料库对语音转换后的第一文字信息中的不常用关键词进行优化,提高自动会议记录技术的识别成功率。
实施例3:
本公开实施例提供了一种会议记录优化机器人,图4是根据一示例性实施例示出的一种会议记录优化机器人的结构示意图。如图4所示,一种会议记录优化机器人,包括:
麦克风阵列、摄像头、主控板、显示屏以及语音识别模块,其中,语音识别模块可由本地语音识别模块或云端语音识别模块构成,用于将会议语音信息转换成第一文字信息;麦克风阵列用于声音数据的采集;摄像头用于会议画面的拍摄采集;主控板的功能有:会议系统主体逻辑的实现,会议画面的截屏采集,OCR图像转文字,各类文字优化算法的实现;显示屏用于用户交互的上位机实现和会议记录的实时展示。
通过本公开实施例提供的一种会议记录优化机器人,可以提取会议中展示的图像信息中的第二文字信息,结合日常语料库和第二文字信息建立专用关键词语料库,通过专用关键词语料库对语音转换后的第一文字信息中的不常用关键词进行优化,提高自动会议记录技术的识别成功率。
实施例4:
本公开实施例提供了一种会议记录优化设备,图5是根据一示例性实施例示出的一种会议记录优化设备的结构示意图。
在一些实施例中,一种会议记录优化设备,包括处理器51和存储有程序指令的存储器52,还可以包括通信接口53和总线54。其中,处理器51、通信接口53、存储器52可以通过总线54完成相互间的通信。通信接口53可以用于信息传输。处理器51可以调用存储器52中的逻辑指令,以执行上述实施例提供的会议记录优化方法。
此外,上述的存储器52中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器52作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器51通过运行存储在存储器52中的软件程序、指令以及模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器52可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非易失性存储器。
实施例5:
本公开实施例提供了一种计算机可读介质,其上存储有计算机可读指令,计算机可读指令可被处理器执行以实现上述实施例提供的会议记录优化方法。
以上,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。