CN114546939A - 会议纪要生成方法、装置、电子设备和可读存储介质 - Google Patents

会议纪要生成方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN114546939A
CN114546939A CN202210178673.0A CN202210178673A CN114546939A CN 114546939 A CN114546939 A CN 114546939A CN 202210178673 A CN202210178673 A CN 202210178673A CN 114546939 A CN114546939 A CN 114546939A
Authority
CN
China
Prior art keywords
conference
time
recording
speaking
display data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210178673.0A
Other languages
English (en)
Inventor
赵丽菲
王金鹏
张超
宿绍勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd filed Critical BOE Technology Group Co Ltd
Priority to CN202210178673.0A priority Critical patent/CN114546939A/zh
Publication of CN114546939A publication Critical patent/CN114546939A/zh
Priority to PCT/CN2023/071473 priority patent/WO2023160288A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/155Conference systems involving storage of or access to video conference sessions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开提供一种会议纪要生成方法、装置、电子设备和可读存储介质。会议纪要生成方法包括以下步骤:接收生成目标会议的会议纪要的生成请求;根据所述生成请求提取所述目标会议的会议记录文件,所述会议记录文件包括会议录音和显示数据,所述会议录音和所述显示数据是通过智能会议交互设备采集的;解析所述会议记录文件生成所述目标会议的会议纪要,其中,所述会议纪要包括根据所述会议录音生成的发言文本和显示数据,其中,所述显示数据的时间与所述会议录音相对应。

Description

会议纪要生成方法、装置、电子设备和可读存储介质
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种会议纪要生成方法、装置、电子设备和可读存储介质。
背景技术
为了保存和记录会议中的相关内容,通常需要建立会议的会议纪要,相关技术中,通常通过文字等会议内容进行记录,以建立会议的会议纪要。
发明内容
第一方面,本公开实施例提供了一种会议纪要生成方法,所述方法包括以下步骤:
接收生成目标会议的会议纪要的生成请求;
根据所述生成请求提取所述目标会议的会议记录文件,所述会议记录文件包括会议录音和显示数据,所述会议录音和所述显示数据是通过智能会议交互设备采集的;
解析所述会议记录文件生成所述目标会议的会议纪要,其中,所述会议纪要包括根据所述会议录音生成的发言文本和显示数据,其中,所述显示数据的时间与所述会议录音相对应。
在一些实施例中,所述会议纪要包括多条子内容,所述子内容均包括所述发言文本和所述显示数据。
在一些实施例中,每一所述子内容包括的显示数据的时间均与所述子内容包括的发言文本的时间相对应。
在一些实施例中,所述解析所述会议记录文件生成所述目标会议的会议纪要,包括:
根据声纹信息识别所述会议录音对应的多个发言对象;
根据所述发言对象的发言顺序形成所述多条子内容。
在一些实施例中,所述会议纪要包括会议录音,所述根据所述发言对象的发言顺序形成所述多条子内容之后,所述方法还包括:
显示与所述子内容对应的音频播放控制标识和发言文本,其中,所述音频播放控制标识用于控制播放所述子内容对应的会议录音,所述发言文本是识别与所述子内容对应的会议录音获得的;
在所述会议纪要中显示数据显示区域,其中,所述数据显示区域用于在播放所述会议录音时,显示与所述会议录音的时间对应的显示数据。
在一些实施例中,所述显示数据包括所述智能会议交互设备在所述目标会议中的录屏视频和截图图片中的一项或多项。
在一些实施例中,所述数据显示区域的数量为多个,每一所述数据显示区域与一条所述子内容相对应,所述数据显示区域用于播放与所述子内容所对应的录屏视频或展示与所述子内容对应的截图图片。
在一些实施例中,所述解析所述会议记录文件生成所述目标会议的会议纪要之后,所述方法还包括:
接收针对所述音频播放控制标识中的目标控制标识的控制请求;
根据所述控制请求播放所述目标控制标识对应的目标会议录音;
按照与所述目标会议录音的时间的对应关系,在所述数据显示区域同步显示所述显示数据。
在一些实施例中,所述显示数据包括会议录音中发言对象的发言时间的结束时刻或所述发言时间结束之后的预设时刻的截图图片。
在一些实施例中,所述显示数据包括录屏视频,所述根据所述生成请求提取所述目标会议的会议记录文件,包括:
根据对所述会议录音中发言对象的识别结果确定所述发言对象的发言时间;
根据所述发言时间确定与所述发言时间对应的录屏视频。
在一些实施例中,所述显示数据包括根据所述发言时间确定的操作区域的显示数据。
在一些实施例中,所述方法还包括:获取根据所述发言时间确定的操作区域的显示数据;
所述获取根据所述发言时间确定的操作区域的显示数据,包括:
确定与所述发言时间对应的目标操作记录;
识别与所述目标操作记录所在位置对应的操作区域;
根据所述目标操作记录所在的位置对应的操作区域确定所述发言时间对应的显示数据。
在一些实施例中,所述目标操作记录包括书写操作的操作记录。
在一些实施例中,所述根据所述发言时间确定与所述发言时间对应的录屏视频,包括:
确定所述发言时间对应的操作时间,其中,所述操作时间覆盖所述发言时间;
根据所述操作时间确定与所述发言时间对应的录屏视频。
在一些实施例中,所述操作时间包括所述发言时间,所述操作时间还包括第一时间段和第二时间段中的至少一项,所述第一时间段为所述发言时间之前的第一预设时长的时间段,所述第二时间段为所述发言时间之后的第二预设时长的时间段。
在一些实施例中,所述会议记录文件还包括所述目标会议的现场视频文件,所述会议纪要还包括时间与所述会议录音对应的现场视频片段。
在一些实施例中,所述会议记录文件以超文本标记语言html格式保存。
第二方面,本公开实施例还提供一种会议纪要生成装置,应用于智能会议交互设备,所述装置包括:
生成请求接收模块,用于接收生成目标会议的会议纪要的生成请求;
提取模块,用于根据所述生成请求提取所述目标会议的会议记录文件,所述会议记录文件包括会议录音和所述智能会议交互设备的显示数据;
生成模块,用于解析所述会议记录文件生成所述目标会议的会议纪要,其中,所述会议纪要包括根据所述会议录音生成的发言文本以及时间与所述会议录音对应的显示数据。
第三方面,本公开实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;所述处理器,用于读取存储器中的程序实现如前述第一方面所述方法中的步骤。
在一些实施例中,所述电子设备为智能会议交互设备,所述智能会议交互设备包括麦克风,所述麦克风用于采集所述会议录音。
第四方面,本公开实施例还提供一种可读存储介质,用于存储程序,所述程序被处理器执行时实现如前述第一方面所述方法中的步骤。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的会议纪要生成方法的流程示意图;
图2是本公开实施例中一显示界面示意图;
图3是本公开实施例中又一显示界面示意图;
图4是本公开实施例中会议纪要的格式示意图;
图5是本公开实施例中确定操作区域的流程示意图;
图6是本公开实施例提供的会议纪要生成装置的结构示意图;
图7是本公开实施提供的电子设备的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开实施例中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,本申请中使用“和/或”表示所连接对象的至少其中之一,例如A和/或B和/或C,表示包含单独A,单独B,单独C,以及A和B都存在,B和C都存在,A和C都存在,以及A、B和C都存在的7种情况。
本公开实施例提供了一种会议纪要生成方法。
如图1所示,在其中一些实施例中,该会议纪要生成方法包括以下步骤:
步骤101:接收生成目标会议的会议纪要的生成请求。
用户可以通过不同的方式发出会议纪要的生成请求,例如,用户可以通过主动点击相应的生成控制按钮发出生成请求,也可以预先设置为会议结束后,自动生成会议纪要,这样,在会议结束后,会自动生成该生成请求。
步骤102:根据所述生成请求提取所述目标会议的会议记录文件。
本实施例中,会议记录文件通过智能会议交互设备采集,智能会议交互设备通常指的是智能交互平板,用户可以在会议过程中基于该会议交互设备进行演示文稿的展示、将该会议交互设备作为手写白板书写内容等。
在接收到生成请求后,提取生成会议纪要所需的会议记录文件,本实施例中,会议记录文件包括会议录音和所述智能会议交互设备的显示数据。
在会议开始时,用户可以打开智能会议交互设备中的录屏工具,对会议过程中,智能会议交互设备上显示的内容进行录制。
如图2所示,本实施例中,在智能会议交互设备的显示界面201上显示一个录屏控制控件202,该录屏控制控件202上包括启动和停止录屏操作的录屏控制按钮203、记录录屏时间的时间框204。
会议录音具体包括会议现场人员发言的现场录音,还可以包括智能会议交互设备播放的文件的声音,本实施例中,将其称作屏幕声音,实施时,可以通过麦克风采集现场录音,还可以通过读取喇叭的播放数据获取屏幕声音,从而降低外部声音对于屏幕声音的干扰。
实施时,可以在录屏控制控件202上设置与现场录音对应的现场录音开关205和与屏幕声音对应的屏幕声音开关206,这样,可以由工作人员根据需要控制所需录制的声音。
如图3所示,录制完成的文件可以在录制列表208中显示,实施时,可以按照录制的时间命名,也可以按照文件1、文件2……进行顺序编号命名。针对每一文件,进一步可以进行保存、访问、删除、格式转换等操作。
在一些实施例中,现场录音和屏幕声音可以保存在不同的文件中。在一些实施例中,考虑到参会人员发言时,智能会议交互设备很可能不会用于播放内容,在智能会议交互设备播放内容时,参会人员很可能在观看所播放的内容,而不会进行发言,因此,也可以将现场录音和屏幕声音录制并保存在同一音频文件中。
显示数据可以是视频数据,也可以是图片数据,具体的,显示数据可以是在目标会议过程中对智能会议交互设备的显示界面进行录屏获得的录屏视频,也可以是在目标会议过程中对智能会议交互设备的显示界面进行截图获得的截图图片。
所获得的会议录音和显示数据可以在进行格式转换后保存在指定的路径,示例性的,可以以录制的时间对录制的文件进行命名保存,也可以按照先后顺序通过序号或编号的方式对录制的文件进行命名保存。
实施时,可以根据需要选择不同的格式保存所获得的会议录音和显示数据,示例性的,可以以mp3格式保存会议录音,以mov、mp4、wmv等不同的格式保存显示数据,显示数据的分辨率以及会议录音的质量也是可以根据需要选择的,此处不做进一步限定。
所保存的文件可以结合起来,以不同的格式保存,例如,可以以html(Hyper TextMarkup Language,超文本标记语言)格式的文件保存等。
在接收到生成请求之后,可以在指定的文件目录中提取会议录音和显示数据。
步骤103:解析所述会议记录文件生成所述目标会议的会议纪要。
在获得了会议录音和显示数据之后,进一步生成目标会议的会议纪要。
需要理解的是,本实施例的技术方案中,会议纪要可以在终端上进行,例如,可以在智能会议交互设备上或其他控制设备上进行,如果是在智能会议交互设备上进行的,可以直接提取保存于智能会议交互设备本地的会议记录文件。
如果是在其他终端设备上进行的,则可以将智能会议交互设备上的会议记录文件传输至终端设备。
此外,该方法还可以在云端服务器上进行,示例性的,可以由终端设备向云端服务器发送上述生成请求,然后由智能会议交互设备将会议记录文件上传至云端服务器,在云端服务器解析会议记录文件生成会议纪要。
本实施例中,会议纪要包括根据会议录音生成的发言文本以及显示数据,这里,显示数据的时间与会议录音的时间是相对应的。
可以理解为,本实施例的技术方案中,对上述获得的会议录音进行识别,从而获得会议录音对应的发言文本。
本实施例中还截取每一会议录音的时间对应的显示数据,也就是说,所获得的与每一会议录音对应的显示数据是该发言对象发言时,智能会议交互设备上的显示数据。这样,本实施例生成了包括发言文本以及显示数据的会议纪要。
这样,本实施例的技术方案所获得的会议纪要能够更加全面的还原会议内容,提高了所生成的会议纪要对会议内容记录的准确性和完整性。
所生成的会议纪要也可以以html格式保存,有助于提高兼容性,更便于在不同的平台进行访问和查看。
在另外一些实施例中,还可以对会议纪要进行不同的管理操作,例如,可以识别会议录音对应的发言对象,还可以根据需要提取某一特定对象的会议录音或发言文本等。
在一些实施例中,步骤103包括:
根据声纹信息识别所述会议录音对应的多个发言对象;
根据所述发言对象的发言顺序形成所述多条子内容。
本实施例中,在获取了会议录音后,基于声纹识别获取会议录音中的发言对象。声纹识别技术本身可以参考相关技术,此处不做进一步限定和描述。
实施时,可以首先录制每一参会对象的声音,以提取其声纹信息,然后根据提取的声纹信息对会议录音中的发言对象进行识别。也可以根据声纹差异对发言对象进行区分之后,由人工对不同的发言对象进行标记区分。
在根据声纹信息识别发言对象之后,根据发言对象的发言对象形成多条子内容。
本实施例中,会议纪要包括多子字内容,每一子内容均包括发言文本和显示数据。可以理解为,每一子内容对应一次发言,实施时,可以将多条子内容按照发言顺序依次显示。
为了区分各子内容对应的发言对象,可以在每一子内容处显示发言对象对应的对象标识,对象标识可以是个发言对象的头像、照片、名字或代号或编号等,对象标识按照发言顺序依次显示。
如图4所示,示例性的,对象A首先发言,则显示一个与对象A对应的对象标识401,这样,就形成了一条子内容,接下来,对象B发言,则显示一个与对象B对应的对象标识401,然后又形成一条子内容,对象A再次发言,则再次显示一个与对象A对应的对象标识401以形成下一条子内容,依次类推。
也就是说,每存在一次发言,则形成一条子内容,与每一发言对象对应的子内容的数量可以是多条,与每一发言对象对应的子内容的数量与该发言对象的发言次数相等,这里,对于一次发言的定义是,发言过程中,没有其他发言对象的发言,且发言过程中的停顿间隔小于一定的时间长度,例如,可以设定为小于1分钟、小于40秒等不同的数值。
在一些实施例中,该方法还包括:
显示与所述子内容对应的音频播放控制标识和发言文本,其中,所述音频播放控制标识用于控制播放所述子内容对应的会议录音,所述发言文本是识别所述会议录音获得的;
在所述会议纪要中显示数据显示区域,其中,所述数据显示区域用于在播放所述会议录音时,显示与所述会议录音的时间对应的显示数据。
请继续参阅图4,在与每一子内容的对象标识401对应的位置,还显示了音频播放控制标识402,该音频播放控制标识402用于控制播放相应的会议录音,也就是说,当用户控制会议纪要中某一音频播放控制标识402时,播放相应的会议录音,能够直接了解发言对象的发言状态。
请继续参阅图4,在与每一对象标识401对应的位置,还显示了相应的发言文本403,基于该发言文本403,能够便于在不方便播放会议录音时,直接通过文本了解发言内容,丰富了会议纪要内容的全面性。
如图3所示,本实施例的会议纪要中还显示有数据显示区域404。该数据显示区域404用于在播放所述会议录音时,播放与子内容所对应的录屏视频或展示与子内容对应的截图图片。
这里,所播放的录屏视频可以理解为完整的显示数据的一个显示数据片段,该显示数据片段为上述会议录音对应的时间段内的显示数据。这样,能够建立智能会议交互设备上显示的内容与会议录音之间的对应关系,用户在浏览会议纪要并听取会议录音时,也能够了解这一时间段在智能会议交互设备上显然的内容,从而有助于更加准确和清除的了解会议内容。
而截图图片可以根据需要设置,例如,如果一个发言对象发言过程中,显示界面上显示的内容没有发生变化,则可以截取一张截图图片,以节约会议记录文件和会议纪要所占用的存储空间。在一些实施例中,显示数据截图图片具体包括会议录音中发言对象的发言时间的结束时刻或发言时间结束之后的预设时刻。
在其中一些实施例中,数据显示区域404的数量为一个,各对象标识401对应的显示数据片段均在该数据显示区域404中播放。
在一些实施例中,所述数据显示区域404的数量为多个,每一所述数据显示区域404与一条子内容相对应,数据显示区域404用于显示与相对应的子内容所对应的显示数据。
在一些实施例中,步骤103之后,还包括:
接收针对所述音频播放控制标识中的目标控制标识的控制请求;
根据所述控制请求播放所述目标控制标识对应的目标会议录音;
按照与所述目标会议录音的时间的对应关系,在所述数据显示区域同步显示所述显示数据。
本实施例的技术方案中,当用户在会议纪要中控制播放某一会议录音时,在数据显示区域中同步播放相应的显示数据片段或显示截取的截图图片,以全面的还原会议场景,便于其他对象能够根据会议纪要全面完整的还原和了解会议内容。
在一些实施例中,显示数据可以是对于智能会议交互设备全部显示界面进行录制,在另外一些实施例中,则是录制智能会议交互设备显示界面的一部分。
具体的,显示数据包括根据发言时间确定的操作区域的显示数据。
示例性的,在显示数据包括截图图片的情况下,可以根据发言时间内的操作操作输入对应的区域确定截图范围,以截取相应区域的图片。
在显示数据包括录屏视频的情况下,可以根据发言时间内的操作输入对应的区域确定录屏范围,并获取该范围内的录屏视频。
在一些实施例中,所述根据所述生成请求提取所述目标会议的会议记录文件,包括:
根据对所述会议录音中发言对象的识别结果确定所述发言对象的发言时间;
根据所述发言时间确定与所述发言时间对应的录屏视频。
如图5所示,本实施例的技术方案中,首先确定一个发言对象的发言时间,这里,发言时间可以通过会议录音的识别结果确定。基于所确定的发言时间,进一步确定该发言时间对应的显示数据。
在一些实施例中,根据所述发言时间确定与所述发言时间对应的录屏视频的步骤具体包括:
确定所述发言时间对应的操作时间,其中,所述操作时间覆盖所述发言时间;
根据所述操作时间确定与所述发言时间对应的录屏视频。
在一些实施例中,操作输入包括书写操作的操作输入。需要理解的是,智能会议交互设备可以作为手写板使用,在发言对象发言时,可能会在智能会议交互设备上书写一些内容,然而发言对象也可能首先书写一些内容,然后才结合书写的内容进行发言。因此,发言时间对应的录屏视频的时间长度可能大于发言时间的长度。本实施例中,将发言时间对应的操作输入覆盖的时间定义为操作时间,实施时,根据发言时间确定操作时间,能够降低遗漏与发言时间对应的显示数据遗漏的可能性。
在其中一些实施例中,操作时间包括发言时间,操作时间还包括第一时间段和第二时间段中的至少一项,第一时间段为发言时间之前的第一预设时长的时间段,第二时间段为发言时间之后的第二预设时长的时间段。
相应的,本实施例中根据发言时间确定操作时间,操作时间包括发言时间,可以理解为,操作时间包括了全部发言时间,且操作时间还包括可能包括一些不属于发言时间的时间段。
示例性的,可以令第一预设时长为30秒,则操作时间包括发言时间以及第一时间段,其中,第一时间段为发言时间之前的30秒。又如,可以令第二预设时长为10秒,则操作时间包括发言时间以及第二时间段,其中,第二时间段为发言时间之后的10秒。
显然,操作时间还可以包括发言时间,且同时包括第一时间段和第二时间段,以确保发言对象书写的相关内容能够被操作时间所覆盖。显然,第一预设时长和第二预设时长的长度并不局限于此,且可以根据需要设定。
在一些实施例中,该方法还包括获取根据所述发言时间确定的操作区域的显示数据的步骤,该步骤具体包括:
确定与所述发言时间对应的目标操作记录;
识别与所述目标操作记录所在位置对应的操作区域;
根据所述目标操作记录所在的位置对应的操作区域确定所述发言时间对应的显示数据。
本实施例中,识别与发言时间相关联的目标操作记录,在识别了目标操作记录之后,进一步根据目标操作记录确定操作区域,示例性的,可以确定全部目标操作记录对应的操作位置的坐标在横向和纵向上的最大值和最小值,上述最大值和最小值可以依据现有的计算方式进行,例如通过冒泡排序法进行计算等,此处不做进一步限定。
在确定了坐标在横向和纵向上的最大值和最小值,能够确定一个矩形的区域,该矩形区域的两边的横坐标分别为上述横向上的最大值和最小值,该矩形区域的两边的纵坐标分别为上述纵向上的最大值和最小值。这样,用户在会议录音对应的时间段内执行的操作均是在该操作区域内的。通过在视频播放区域仅显示操作区域的图像,能够更加清楚的展示发言对象书写的内容,有助于更加清楚的了解和还原会议状态。
在确定了操作区域之后,进一步提取该操作区域的录屏视频或截图图片作为该操作区域的显示数据。
在一些实施例中,所获取的显示数据对应的范围可以略大于所确定的操作区域的范围,示例性的,可以设置为显示区域的每一侧的尺寸大于操作区域的尺寸5毫米,这样,相当于为操作区域增加了一个边框区域,能够使得获得的录屏视频或截图图片更加美观,提高了用户体验。
需要理解的是,所确定的操作区域并不一定局限为矩形,例如可以是椭圆形、圆形等不同的形状,只要能够涵盖目标操作区域对应的全部区域即可。
在其中一些实施例中,所述根据所述操作时间确定与所述发言时间对应的目标操作记录,包括:
根据第一操作记录和第二操作记录的关联性识别与所述会议录音对应的目标操作记录,其中,所述第一操作记录为所述操作时间内的操作记录,所述第二操作记录为所述发言时间内的操作记录,所述操作时间覆盖所述发言时间。
本实施例中通过第一操作记录和第二操作记录的关联性确定目标操作记录。
具体的,在确定了操作时间之后,识别操作时间内对应的操作记录,示例性的,可以从工作台中读取操作时间内对应的笔迹,然后对所读取的笔迹进行识别,以区分操作时间内的笔迹是否包含完整的文字或图像。
如果包含完成的文字或图像,则将构成完整的文字或图像的笔迹分为一组,然后读取每一组笔迹的时间信息,确定每一组中的笔迹是仅存在于发言时间内,还是同时存在于发言时间和操作时间内。
如果位于操作时间内但位于发言时间外的一部分笔迹与位于发言时间内的一部分笔迹能够构成一个完整的文字或图像,则认为用户在发言前就进行了内容的书写,因此,认为这一部分操作记录对应的内容与用户的发言是相关的,将这一部分操作记录作为目标操作记录。
此外,对于发言时间内的全部操作记录均作为目标操作记录。如果笔迹不包含完整的文字或图像,则仅将发言时间内的操作记录作为目标操作记录。
在一些实施例中,会议记录文件还包括目标会议的现场视频文件,会议纪要还包括时间与音频文件对应的现场视频片段。
本实施例中,智能会议交互设备可以内置摄像头,也可以外接摄像头,并通过摄像头采集会议现场的现场视频,然后保存为现场视频文件,在生成会议纪要时,还可以在会议纪要中增加时间与音频文件对应的现场视频片段,这样,能够通过会议纪要清楚和完整的还原会议现场状态。
如图2所示,在录屏控制控件202上,可以显示一个控制摄像头录制现场视频的录制控制开关207,以根据需要采集会议现场的现场视频。在会议现场以及视频回放过程中,还可以在显示界面201上显示一个视频窗口,以通过视频窗口显示现场视频。
本公开实施例提供了一种会议纪要生成装置,应用于智能会议交互设备。
如图6所示,在一个实施例中,该会议纪要生成装置600包括:
生成请求接收模块601,用于接收生成目标会议的会议纪要的生成请求;
提取模块602,用于根据所述生成请求提取所述目标会议的会议记录文件,所述会议记录文件包括会议录音和显示数据,所述会议录音和所述显示数据是通过智能会议交互设备采集的;
生成模块603,用于解析所述会议记录文件生成所述目标会议的会议纪要,其中,所述会议纪要包括根据所述会议录音生成的发言文本和显示数据,其中,所述显示数据的时间与所述会议录音相对应。
在一些实施例中,所述会议纪要包括多条子内容,所述子内容均包括所述发言文本和所述显示数据。
在一些实施例中,每一所述子内容包括的显示数据的时间均与所述子内容包括的发言文本的时间相对应。
在一些实施例中,所述生成模块603包括:
发言对象识别子模块,用于根据声纹信息识别所述会议录音对应的多个发言对象;
子内容生成子模块,用于根据所述发言对象的发言顺序形成所述多条子内容。
在一些实施例中,所述会议纪要包括会议录音,所述装置还包括:
标识显示模块,用于显示与所述子内容对应的音频播放控制标识和发言文本,其中,所述音频播放控制标识用于控制播放所述子内容对应的会议录音,所述发言文本是识别与所述子内容对应的会议录音获得的;
区域显示模块,用于在所述会议纪要中显示数据显示区域,其中,所述数据显示区域用于在播放所述会议录音时,显示与所述会议录音的时间对应的显示数据。
在一些实施例中,所述显示数据包括所述智能会议交互设备在所述目标会议中的录屏视频和截图图片中的一项或多项。
在一些实施例中,所述数据显示区域的数量为多个,每一所述数据显示区域与一条所述子内容相对应,所述数据显示区域用于播放与所述子内容所对应的录屏视频或展示与所述子内容对应的截图图片。
在一些实施例中,所述装置还包括:
控制请求接收模块,用于接收针对所述音频播放控制标识中的目标控制标识的控制请求;
录音播放模块,用于根据所述控制请求播放所述目标控制标识对应的目标会议录音;
显示数据展示模块,用于按照与所述目标会议录音的时间的对应关系,在所述数据显示区域同步显示所述显示数据。
在一些实施例中,所述显示数据包括会议录音中发言对象的发言时间的结束时刻或所述发言时间结束之后的预设时刻的截图图片。
在一些实施例中,所述显示数据包括录屏视频,所述提取模块602包括:
发言时间确定子模块,用于根据对所述会议录音中发言对象的识别结果确定所述发言对象的发言时间;
显示数据确定子模块,用于根据所述发言时间确定与所述发言时间对应的录屏视频。
在一些实施例中,所述显示数据包括根据所述发言时间确定的操作区域的显示数据。
在一些实施例中,还包括:显示数据获取模块,用于获取根据所述发言时间确定的操作区域的显示数据;
所述显示数据获取模块,包括:
目标操作记录确定子模块,用于确定与所述发言时间对应的目标操作记录;
操作区域识别子模块,用于识别与所述目标操作记录所在位置对应的操作区域;
显示数据确定子模块,用于根据所述目标操作记录所在的位置对应的操作区域确定所述发言时间对应的显示数据。
在一些实施例中,所述目标操作记录包括书写操作的操作记录。
在一些实施例中,所述显示数据确定子模块包括:
操作时间确定单元,用于确定所述发言时间对应的操作时间,其中,所述操作时间覆盖所述发言时间;
显示数据确定单元,用于根据所述操作时间确定与所述发言时间对应的录屏视频。
在一些实施例中,所述操作时间包括所述发言时间,所述操作时间还包括第一时间段和第二时间段中的至少一项,所述第一时间段为所述发言时间之前的第一预设时长的时间段,所述第二时间段为所述发言时间之后的第二预设时长的时间段。
在一些实施例中,所述会议记录文件还包括所述目标会议的现场视频文件,所述会议纪要还包括时间与所述会议录音对应的现场视频片段。
在一些实施例中,所述会议记录文件以超文本标记语言html格式保存。本实施例的会议纪要生成装置600能够实现上述会议纪要生成方法实施例的各个步骤,并能实现基本相同的技术效果,此处不再赘述。
本公开实施例还提供一种电子设备。请参见图7,电子设备可以包括处理器701、存储器702及存储在存储器702上并可在处理器701上运行的程序7021。程序7021被处理器701执行时可实现上述方法实施例中的任意步骤及达到相同的有益效果,此处不再赘述。
在其中一些实施例中,电子设备具体为智能会议交互设备,该智能会议交互设备上设置有麦克风,能够实现采集会议录音,所采集的会议录音和通过智能会议交互设备采集的显示数据形成会议记录文件,进一步解析该会议记录文件能够生产会议纪要。
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过程序指令相关的硬件来完成,所述的程序可以存储于一可读取介质中。
本公开实施例还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时可实现上述方法实施例中的任意步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
所述的存储介质,如只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
需要说明的是,应理解以上各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,各个模块、单元、子单元或子模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific IntegratedCircuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
以上所述是本公开实施例的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本公开所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本公开的保护范围。

Claims (21)

1.一种会议纪要生成方法,所述方法包括以下步骤:
接收生成目标会议的会议纪要的生成请求;
根据所述生成请求提取所述目标会议的会议记录文件,所述会议记录文件包括会议录音和显示数据,所述会议录音和所述显示数据是通过智能会议交互设备采集的;
解析所述会议记录文件生成所述目标会议的会议纪要,其中,所述会议纪要包括根据所述会议录音生成的发言文本和显示数据,其中,所述显示数据的时间与所述会议录音相对应。
2.如权利要求1所述的方法,其中,所述会议纪要包括多条子内容,所述子内容均包括所述发言文本和所述显示数据。
3.如权利要求2所述的方法,其中,每一所述子内容包括的显示数据的时间均与所述子内容包括的发言文本的时间相对应。
4.如权利要求2所述的方法,其中,所述解析所述会议记录文件生成所述目标会议的会议纪要,包括:
根据声纹信息识别所述会议录音对应的多个发言对象;
根据所述发言对象的发言顺序形成所述多条子内容。
5.如权利要求4所述的方法,其中,所述会议纪要包括会议录音,所述根据所述发言对象的发言顺序形成所述多条子内容之后,所述方法还包括:
显示与所述子内容对应的音频播放控制标识和发言文本,其中,所述音频播放控制标识用于控制播放所述子内容对应的会议录音,所述发言文本是识别与所述子内容对应的会议录音获得的;
在所述会议纪要中显示数据显示区域,其中,所述数据显示区域用于在播放所述会议录音时,显示与所述会议录音的时间对应的显示数据。
6.如权利要求1至5中任一项所述的方法,其中,所述显示数据包括所述智能会议交互设备在所述目标会议中的录屏视频和截图图片中的一项或多项。
7.如权利要求5所述的方法,其中,所述数据显示区域的数量为多个,每一所述数据显示区域与一条所述子内容相对应,所述数据显示区域用于播放与所述子内容所对应的录屏视频或展示与所述子内容对应的截图图片。
8.如权利要求5或7所述的方法,其中,所述解析所述会议记录文件生成所述目标会议的会议纪要之后,所述方法还包括:
接收针对所述音频播放控制标识中的目标控制标识的控制请求;
根据所述控制请求播放所述目标控制标识对应的目标会议录音;
按照与所述目标会议录音的时间的对应关系,在所述数据显示区域同步显示所述显示数据。
9.如权利要求6所述的方法,其中,所述显示数据包括会议录音中发言对象的发言时间的结束时刻或所述发言时间结束之后的预设时刻的截图图片。
10.如权利要求6所述的方法,其中,所述显示数据包括录屏视频,所述根据所述生成请求提取所述目标会议的会议记录文件,包括:
根据对所述会议录音中发言对象的识别结果确定所述发言对象的发言时间;
根据所述发言时间确定与所述发言时间对应的录屏视频。
11.如权利要求9或10所述的方法,其中,所述显示数据包括根据所述发言时间确定的操作区域的显示数据。
12.如权利要求11所述的方法,其中,所述方法还包括:获取根据所述发言时间确定的操作区域的显示数据;
所述获取根据所述发言时间确定的操作区域的显示数据,包括:
确定与所述发言时间对应的目标操作记录;
识别与所述目标操作记录所在位置对应的操作区域;
根据所述目标操作记录所在的位置对应的操作区域确定所述发言时间对应的显示数据。
13.如权利要求12所述的方法,其中,所述目标操作记录包括书写操作的操作记录。
14.如权利要求10所述的方法,其中,所述根据所述发言时间确定与所述发言时间对应的录屏视频,包括:
确定所述发言时间对应的操作时间,其中,所述操作时间覆盖所述发言时间;
根据所述操作时间确定与所述发言时间对应的录屏视频。
15.如权利要求14所述的方法,其中,所述操作时间包括所述发言时间,所述操作时间还包括第一时间段和第二时间段中的至少一项,所述第一时间段为所述发言时间之前的第一预设时长的时间段,所述第二时间段为所述发言时间之后的第二预设时长的时间段。
16.如权利要求1至5中任一项所述的方法,其中,所述会议记录文件还包括所述目标会议的现场视频文件,所述会议纪要还包括时间与所述会议录音对应的现场视频片段。
17.如权利要求1至5中任一项所述的方法,其中,所述会议记录文件和或所述会议纪要的格式为超文本标记语言html格式。
18.一种会议纪要生成装置,应用于智能会议交互设备,所述装置包括:
生成请求接收模块,用于接收生成目标会议的会议纪要的生成请求;
提取模块,用于根据所述生成请求提取所述目标会议的会议记录文件,所述会议记录文件包括会议录音和所述智能会议交互设备的显示数据;
生成模块,用于解析所述会议记录文件生成所述目标会议的会议纪要,其中,所述会议纪要包括根据所述会议录音生成的发言文本以及时间与所述会议录音对应的显示数据。
19.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序所述处理器,用于读取存储器中的程序实现如权利要求1至17中任一项所述的会议纪要生成方法中的步骤。
20.如权利要求19所述的电子设备,其中,所述电子设备为智能会议交互设备,所述智能会议交互设备包括麦克风,所述麦克风用于采集所述会议录音。
21.一种可读存储介质,用于存储程序,所述程序被处理器执行时实现如权利要求1至17中任一项所述的会议纪要生成方法中的步骤。
CN202210178673.0A 2022-02-25 2022-02-25 会议纪要生成方法、装置、电子设备和可读存储介质 Pending CN114546939A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210178673.0A CN114546939A (zh) 2022-02-25 2022-02-25 会议纪要生成方法、装置、电子设备和可读存储介质
PCT/CN2023/071473 WO2023160288A1 (zh) 2022-02-25 2023-01-10 会议纪要生成方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210178673.0A CN114546939A (zh) 2022-02-25 2022-02-25 会议纪要生成方法、装置、电子设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN114546939A true CN114546939A (zh) 2022-05-27

Family

ID=81679077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210178673.0A Pending CN114546939A (zh) 2022-02-25 2022-02-25 会议纪要生成方法、装置、电子设备和可读存储介质

Country Status (2)

Country Link
CN (1) CN114546939A (zh)
WO (1) WO2023160288A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023160288A1 (zh) * 2022-02-25 2023-08-31 京东方科技集团股份有限公司 会议纪要生成方法、装置、电子设备和可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986826A (zh) * 2018-08-14 2018-12-11 中国平安人寿保险股份有限公司 自动生成会议记录的方法、电子装置及可读存储介质
CN111986677A (zh) * 2020-09-02 2020-11-24 深圳壹账通智能科技有限公司 会议纪要生成方法、装置、计算机设备及存储介质
CN112925945A (zh) * 2021-04-12 2021-06-08 平安科技(深圳)有限公司 会议纪要生成方法、装置、设备及存储介质
CN114065720A (zh) * 2021-11-23 2022-02-18 Oppo广东移动通信有限公司 会议纪要生成方法、装置、存储介质及电子设备
CN114546939A (zh) * 2022-02-25 2022-05-27 京东方科技集团股份有限公司 会议纪要生成方法、装置、电子设备和可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023160288A1 (zh) * 2022-02-25 2023-08-31 京东方科技集团股份有限公司 会议纪要生成方法、装置、电子设备和可读存储介质

Also Published As

Publication number Publication date
WO2023160288A1 (zh) 2023-08-31

Similar Documents

Publication Publication Date Title
CN108012173B (zh) 一种内容识别方法、装置、设备和计算机存储介质
CN110557678B (zh) 视频处理方法、装置及设备
CN112653902B (zh) 说话人识别方法、装置及电子设备
CN111050201B (zh) 数据处理方法、装置、电子设备及存储介质
CN110032355B (zh) 语音播放方法、装置、终端设备及计算机存储介质
WO2023160288A1 (zh) 会议纪要生成方法、装置、电子设备和可读存储介质
CN113014854A (zh) 互动记录的生成方法、装置、设备及介质
CN108108143B (zh) 录音回放的方法、移动终端及具有存储功能的装置
CN111860122B (zh) 一种现实场景下的阅读综合行为的识别方法及系统
CN113391745A (zh) 网络课程的重点内容处理方法、装置、设备及存储介质
CN113365109A (zh) 一种生成视频字幕的方法、装置、电子设备和存储介质
CN111522992A (zh) 题目入库方法、装置、设备及存储介质
CN116437139B (zh) 课堂视频录制方法、装置、存储介质和设备
CN111475423A (zh) 数据录入方法、装置、电子设备及可读存储介质
CN111161710A (zh) 同声传译方法、装置、电子设备及存储介质
CN113630620A (zh) 多媒体文件播放系统、相关方法、装置及设备
JP2012053855A (ja) コンテンツ閲覧装置、コンテンツ表示方法及びコンテンツ表示プログラム
KR101783872B1 (ko) 동영상 검색 시스템 및 방법
CN113411532B (zh) 记录内容的方法、装置、终端及存储介质
CN113938723B (zh) 弹幕的播放方法、装置及设备
JP2009283020A (ja) 記録装置、再生装置、及びプログラム
WO2014053474A1 (en) Method and system for organising image recordings and sound recordings
CN113296660A (zh) 图像处理方法、装置及电子设备
CN112584225A (zh) 视频录制处理方法、视频播放控制方法及电子设备
CN114341866A (zh) 同声传译方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination