CN112084756A - 会议文件生成方法、装置及电子设备 - Google Patents

会议文件生成方法、装置及电子设备 Download PDF

Info

Publication number
CN112084756A
CN112084756A CN202010943828.6A CN202010943828A CN112084756A CN 112084756 A CN112084756 A CN 112084756A CN 202010943828 A CN202010943828 A CN 202010943828A CN 112084756 A CN112084756 A CN 112084756A
Authority
CN
China
Prior art keywords
information
conference
content
area
subtitle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010943828.6A
Other languages
English (en)
Other versions
CN112084756B (zh
Inventor
杨慧玲
撒创伟
邓凌聪
王曙光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuanguang Software Co Ltd
Original Assignee
Yuanguang Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuanguang Software Co Ltd filed Critical Yuanguang Software Co Ltd
Priority to CN202010943828.6A priority Critical patent/CN112084756B/zh
Publication of CN112084756A publication Critical patent/CN112084756A/zh
Application granted granted Critical
Publication of CN112084756B publication Critical patent/CN112084756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/278Subtitling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及一种会议文件生成方法、装置及电子设备。会议文件生成方法包括:在终端界面的第一区域展示会议发言人的字幕信息,第二区域展示会议共享屏幕对应的内容信息;响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配;根据所述字幕信息生成所述批注信息,并在所述目标位置对应的预设区域内添加所述批注信息;基于添加所述批注信息后的所述内容信息,生成会议文件。通过本发明,在会议过程中即可形成相关的会议纪要,提高了线上会议的效率,减轻了会议记录者的负担。

Description

会议文件生成方法、装置及电子设备
技术领域
本发明涉及互联网技术领域,具体涉及会议文件生成方法、装置及电子设备。
背景技术
伴随社会的发展,为了节省时间和成本,在线会议的工作讨论方式越来越普遍。发明人在实现本发明的过程中发现,当前的线上会议软件,参会人可以通过共享屏幕的内容进行沟通讨论,但无法在会议过程中形成相关的会议纪要,从而导致线上会议的效率较低。
发明内容
本发明的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本发明的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本发明的一些实施例提出了会议文件生成方法、装置及电子设备,来解决以上背景技术部分提到的技术问题。
第一方面,本发明的一些实施例提供了一种会议文件生成方法,包括:
在终端界面的第一区域展示会议发言人的字幕信息,第二区域展示会议共享屏幕对应的内容信息;响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配;根据所述字幕信息生成所述批注信息,并在所述目标位置对应的预设区域内添加所述批注信息;基于添加所述批注信息后的所述内容信息,生成会议文件。
第二方面,本发明的一些实施例提供了一种会议文件生成装置,包括:
展示模块,用于在终端界面的第一区域展示会议发言人的字幕信息,在第二区域展示会议共享屏幕对应的内容信息;确定模块,用于响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配;添加模块,用于根据所述字幕信息生成所述批注信息,并在所述目标位置对应的预设区域内添加所述批注信息;第一生成模块,用于基于添加所述批注信息后的所述内容信息,生成会议文件。
第三方面,本发明的一些实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中的步骤。
本发明的上述各个实施例中的一个实施例具有如下有益效果:本发明提出的会议文件生成方法、装置及电子设备,可以在在线会议的过程中,实时识别会议发言人的发言内容,生成针对会议内容的批注信息,建立会议文件,即在会议过程中形成相关的会议纪要,提高了线上会议的效率,减轻了会议记录者的负担。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1是根据本公开的会议文件生成方法的一些实施例的流程图;
图2是根据本公开的会议文件生成方法的另一些实施例的流程图;
图3是根据本公开的会议文件生成方法的再一些实施例的流程图;
图4是根据本公开的会议文件生成方法的一些实施例的展示图;
图5是根据本公开的会议文件生成装置的一些实施例的示意图;
图6是根据本公开的电子设备的一些实施例所提供的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关公开相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种会议文件生成方法进行详细介绍,本公开实施例所提供的会议文件生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该会议文件生成方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面将参考附图并结合实施例来详细说明本公开。
当前市面上的在线会议软件,可以支持多人远程进行在线会议,但是会议过程中,会议记录人员需要单独新建一个文件进行会议记录,如果发言人表达速度过快,可能会导致来不及做会议记录的情况;此外,针对会议中共享屏幕上的基础内容,也只支持内容所有者对其进行编辑,可能会造成遗漏需要编辑的内容。
图1示出了本公开一实施例的会议文件生成方法。该方法包括:
步骤S110,在终端界面的第一区域展示会议发言人的字幕信息,第二区域展示会议共享屏幕对应的内容信息。
本实施例方案的应用场景可以是多人在线会议中,任何一个参会用户终端上的会议界面。本步骤中,会议共享屏幕展示在终端界面的第二区域,共享屏幕中展示的是会议共享文件中的内容信息,该内容信息可以是文本、图文等形式。在终端界面的第一区域,基于语音识别技术,将会议发言人的语音转化成字幕信息,实时展示在终端界面的第一区域。其中,展示的字幕信息可以是根据发言人发言的频率和内容来实时更新替换,也可以以句子的形式在第一区域滚动展示,具体展示的字幕句子数量主要由区域大小决定。
需要说明的是,第一区域和第二区域可以是预先设定的,也可以是根据终端对应的参会用户的触发操作确定的,触发操作包括但不仅限于单机、双击、长按、重按、拖拽等,本公开实施例在此不做限定。此外,字幕信息同步功能也可以是根据参会用户的触发功能开启的,参会用户可以设置全体参会人开启字幕信息同步功能,也可以选择仅自己开启字幕信息同步功能。
可选地,上述字幕信息的确定方法包括:获取会议发言人的第一发言内容;基于语音识别技术和第一发言内容,生成第一发言内容对应的字幕信息。
具体地,响应于会议发言人的语音,获取该会议发言人的音频信息(即第一发言内容)。基于语音识别技术(Automatic Speech Recognition,ASR)ASR,确定音频信息中的多个文本单元,将这些文本单元组合在一起,生成音频信息对应的字幕信息。在这过程中,每个文本单元可能对应有多个候选文本单元,因此首先需要确定每个文本单元中各候选文本单元的置信度,然后基于各个候选文本单元的置信度进行筛选,确定每个文本单元中的目标文本单元,将目标文本单元组合在一起,得到字幕信息。
其中,文本单元可以是一个字、一个词。在对音频信息中的文本单元进行划分的时候,可以根据音频信息的停顿或重音来进行检测。候选文本单元的置信度用于表示该候选文本单元为音频信息对应的目标文本单元的可能性。可选地,可以将音频信息输入值预先训练好的语音识别模型中,输出得到音频信息对应的文本单元,以及每个文本单元中各个候选文本单元的置信度。其中,语音识别模型在训练时,可以是基于大量的语音样本、以及语音样本对应的文本信息进行训练的,具体语音识别模型的训练方法,将不再展开介绍。
作为本公开另一些实施例的可选实施方式,如图4所示,若字幕信息以句子的形式呈现,在第一区域展示的字幕信息包括多句字幕信息,如图2所示,则字幕信息的生成方法还包括:
S1001,基于语音识别技术和所述第一发言内容,生成所述发言内容对应的初始字幕信息。
本步骤中初始字幕信息的生成过程如上所示,此处不再展开介绍。
S1002,在所述第一区域展示的所述字幕信息中确定目标字幕信息;其中,所述目标字幕信息对应的第二发言内容的发言时间与所述第一发言内容的发言时间差在预设范围内;
一般来说,发言内容的上下文之间是围绕同一话题展开的,是存在一定关联性的,因此,可以结合之前预设时间内发言内容对应的字幕信息,来对待生成的字幕信息进行校正。具体地,第一区域中展示了之前发言内容的字幕信息,预先记录由字幕信息对应的发言内容的发言时间,在确定每句字幕信息对应的发言时间戳后,选择与当前发言时间的时间差在预设范围内第二发言内容的字幕信息,作为目标字幕信息。进一步地,若目标字幕信息较多,还可以根据初始字幕信息和目标字幕信息间的相似度,对目标字幕信息做筛选。具体地,可以先提取各目标字幕信息的特征向量,然后计算各目标字幕信息的特征向量之间的距离,将距离小于预设阈值的目标字幕信息作为最终的目标字幕信息。
S1003,基于所述第二发言内容对所述初始字幕信息进行校正,得到所述发言内容对应的字幕信息。
具体地,可以利用分词技术对初始字幕信息和目标字幕信息进行分词,得到初始字幕信息对应的多个第一关键词,以及目标字幕信息对应的多个第二关键词,分词的过程一般会把助词、叹词等进行过滤。针对每个第一关键词,遍历第二关键词确定是否存在目标第二关键词,该目标第二关键词对应的拼音字符串与第一关键词对应的拼音字母串相同,若存在目标第二关键词,则将第一关键词替换成该目标第二关键词。针对每个关键词,完成上述遍历及替换后,得到发言内容对应的字幕信息。
参会用户想结合会议发言人的发言内容在共享屏幕对应的内容信息上批注时,即可将发言内容对应的字幕信息从第一区域拖拽到第二区域。具体地,参会用户针对自己所做的标注,可以选择公开给所有参会用户,也可以选择仅自己可见,设置仅自己可见即形成私人标注,设置为公开则全体参会用户可进行批注的协作,提高会议记录效率。
步骤S120,响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配。
具体地,字幕信息是与第二区域的内容信息强相关的,参会用户的意图也是将字幕信息批注在其相关的目标内容信息上。在本公开的实施例中,不需要用户具体去找应该把字幕信息拖拽到目标内容信息在第二区域中所在的位置,而是终端直接根据字幕信息的识别,确定于其对应的目标内容信息,将字幕信息自动添加到该目标内容信息在第二区域对应的目标位置的预设区域中。
可选地,对所述字幕信息进行分词,确定至少一个关键词;其次,将所述关键词与所述内容信息的结构化信息进行匹配,确定目标结构化信息;最后,基于所述结构化信息与所述第二区域内各位置标识的映射关系,确定所述字幕信息对应的目标位置。
其中,结构化信息指的是文本中的一些具有规律性或标识性的内容,比如,文本中的图片、文本、视频等;还可以对文本中内容信息的进一步划分,比如识别出文本的标题、类别、摘要、关键词等。这里,预先提取内容信息中的若干结构化信息,并基于该结构化信息所属的某部分内容信息在第二区域的位置,建立结构化信息与第二区域内各位置标识的映射关系。这样,当确定了目标结构化信息后,不需要再定位该目标结构化信息所属的目标内容信息在第二区域的位置,直接通过上述映射关系,查找到字幕信息对应的目标位置。
作为本公开再一些实施例的可选实施方式,如图3所示,映射关系的建立包括如下步骤:
步骤S1201,响应所述终端界面第二区域更新所述会议共享屏幕对应的内容信息,对所述内容信息进行文字识别,得到所述内容信息对应的文本信息。
因为终端屏幕的第二区域显示面积是有限的,因此在会议进行过程中,会随着会议进程跟新共享屏幕上的内容信息。响应于每次共享屏幕上内容信息的更新,即开始对内容信息进行文字识别。
具体地,在识别内容信息对应的文本信息时,可以先基于光学字符识别技术(Optical Character Recognition,OCR)OCR,确定组成文本信息的多个文本单元,以及各文本单元下各候选文本单元的置信度,然后基于各个候选文本单元的置信度,确定目标文本单元,基于目标文本单元得到文本信息。
步骤S1202,将所述文本信息分成若干个子文本信息,提取各所述子文本信息的结构化信息。
在很多文本信息页面中,可以将文本信息上的内容划分成不同的部分,这些不同的部分可以称为区块。一般来讲,同一主题的内容会放置在同一个区块中进行叙述,因此,相应的,可以基于区块去划分子文本信息。此外,可选地,还可以基于预先训练好的文本划分模型,将文本信息输入该模型中,即可输出划分好的子文本信息。训练该文本划分模型的样本是已经标注好子文本信息的若干文本信息样本。
进一步地,结构化信息的提取可以是识别子文本信息中的标题、关键词等等得到的,现有技术中此类方案很多,本公开在此不做赘述。
步骤S1203,确定所述各子文本信息在所述第二区域所在的位置,生成各子文本信息对应的位置标识。
需要说明的是,该位置可以是以终端屏幕作为坐标系建立的,各子文本信息可能包括多行文本,可以统一以多行文本的中心点作为该子文本信息在第二区域的位置,生成该子文本信息的坐标,将该坐标作为子文本信息对应的位置标识。
步骤S1204,基于各所述子文本信息的结构化信息和位置标识,生成内容信息中结构化信息与所述第二区域内各位置标识的映射关系。
在确定各子文本信息的结构化信息和位置标识后,即可建立结构化信息和位置标识的映射关系。这样,当确定了目标结构化信息后,直接通过上述映射关系,查找到字幕信息对应的目标位置。
步骤S130,根据所述字幕信息生成所述批注信息,并在所述目标位置对应的预设区域内添加所述批注信息。
为了使批注信息具有较好的可视性,如图4所示,在第二区域中包括展示批注信息的预设区域,批注信息具体展示在预设区域的哪一行或那几行,取决于目标位置在第二区域的所在行。
具体地,一方面,可以直接将字幕信息作为批注信息;另一方面,参会用户也可以对字幕信息进行修改补充,得到批注信息。
步骤S140,基于添加所述批注信息后的所述内容信息,生成会议文件。
进一步地,除了批注信息外,还包括参会用户通过标注工具对会议共享屏幕的内容信息进行编辑而得到的标注信息。因此,在第二区域共享屏幕展示内容信息的过程中,会接收通过标注工具对所述内容信息的标注信息。
例如,标注工具中的“文字内容标注”,可以通过键盘输入文字内容在会议共享屏幕上进行批注;“画图标注”具备画笔涂鸦、形状(方形、椭圆形)涂鸦等标注功能,可以选择画笔或形状对会议共享屏幕上的内容信息进行标注;“橡皮擦”可以取消屏幕标记,当选择仅自己可见时,仅可以取消自己在屏幕做的标记;当选择公开,可取消当前共享屏幕上现有标记的任一标记;“激光笔效果”可以替代鼠标进行屏幕页面上定位显示,比鼠标更加显眼,且可以选择定位标识的显示颜色。
当确定当前展示的内容信息中已完成相关的批注和标注后,可以触发生成会议文件标识,响应于触发该标识生成的会议文件生成指令,结合所述批注信息和所述标注信息生成所述会议文件。或者,监测到共享屏幕上即将更新下一页内容信息时,说明当前共享屏幕上的内容信息处于被更新的状态,结合所述批注信息和所述标注信息生成所述会议文件。可选地,可以直接将包括内容信息、批注信息、标注信息的第二区域进行截图保存,将该截图图片作为会议文件。
进一步地,对于每张会议文件,根据该会议文件中内容信息的属性特征生成所述会议文件的标识信息。随着会议的进行,会议文件会越来越多,根据每张会议文件的标识信息,对各所述会议文件进行排序整合,得到会议文件包。
其中,属性特征可以是从内容信息中提取的关键词,也可以是代表该内容信息在整个会议内容信息的顺序,例如该内容信息是首屏显示在第二区域的会议内容信息,则属性特征为1;该内容信息是第六屏显示在第二区域的会议内容信息,则属性特征为6。在对每屏内容信息生成会议文件后,基于该标识信息对会议文件排序,得到的会议文件包刚好和会议内容信息是对应的。
进一步地,若属性特征是关键词,需要预先根据会议内容信息建立关键词顺序线索表,关键词顺序即代表内容信息的顺序,在排序时,将属性特征和关键词顺序检索表进行匹配,生成会议文件包。
作为本公开实施例的一些可选实施方式,会议文件可以实时进行分享和下载,即在会议过程中,参会用户或其他相关用户即可收到已经生成的会议文件,方便大家在会议中根据实时生成的会议文件进行更多的互动和讨论。
更进一步地,本公开实施例的会议文件生成方法也支持会议录音录屏功能,点击录音录屏功能即可对当前会议进行录音录屏,点击保存到系统,也可进行下载分享。此外,参会用户可向共享屏幕人发起远程控制请求,当共享屏幕者同意请求后,可远程控制共享屏幕者的电脑进行操作。
通过本公开上述实施例提供的会议文件生成方法,会议文件生成方法、装置及电子设备,可以在在线会议的过程中,实时识别会议发言人的发言内容,生成针对会议内容的批注信息,建立会议文件,即在会议过程中形成相关的会议纪要,提高了线上会议的效率,减轻了会议记录者的负担。此外,会议纪要可以在会议过程中实时分享下载,提高了会议的互动性和实时性。
图5示出了本公开一实施例的会议文件生成装置。所示装置包括:展示模块510、确定模块520、添加模块530以及第一生成模块540。其中,
展示模块510用于,在终端界面的第一区域展示会议发言人的字幕信息,在第二区域展示会议共享屏幕对应的内容信息;确定模块520用于,响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配;添加模块530用于,根据所述字幕信息生成所述批注信息,并在所述目标位置对应的预设区域内添加所述批注信息;生成模块540用于,基于添加所述批注信息后的所述内容信息,生成会议文件。
可选地,所述装置还包括获取模块和第二生成模块,其中,获取模块用于,获取所述会议发言人的第一发言内容;第二生成模块用于,基于语音识别技术和所述第一发言内容,生成所述第一发言内容对应的字幕信息。
可选地,所述字幕信息以句子的形式呈现,在所述第一区域展示的所述字幕信息包括多句所述字幕信息;所述第二生成模块还用于,基于语音识别技术和所述第一发言内容,生成所述发言内容对应的初始字幕信息;在所述第一区域展示的所述字幕信息中确定目标字幕信息;其中,所述目标字幕信息对应的第二发言内容的发言时间与所述第一发言内容的发言时间差在预设范围内;基于所述第二发言内容对所述初始字幕信息进行校正,得到所述发言内容对应的字幕信息。
可选地,确定模块520还用于,对所述字幕信息进行分词,确定至少一个关键词;将所述关键词与所述内容信息的结构化信息进行匹配,确定目标结构化信息;基于所述结构化信息与所述第二区域内各位置标识的映射关系,确定所述字幕信息对应的目标位置。
可选地,所述装置还包括映射关系模块,所述映射关系模块用于,响应所述终端界面第二区域更新所述会议共享屏幕对应的内容信息,对所述内容信息进行文字识别,得到所述内容信息对应的文本信息;将所述文本信息分成若干个子文本信息,提取各所述子文本信息的结构化信息;确定所述各子文本信息在所述第二区域所在的位置,生成各子文本信息对应的位置标识;基于各所述子文本信息的结构化信息和位置标识,生成内容信息中结构化信息与所述第二区域内各位置标识的映射关系。
可选地,第一生成模块540还用于,接收通过标注工具对所述内容信息的标注信息;响应于生成会议文件的指令,或响应于所述内容信息处于更新状态,结合所述批注信息和所述标注信息生成所述会议文件;根据所述内容信息的属性特征生成所述会议文件的标识信息。
可选地,所述装置还包括排序模块,所述排序模块用于,基于所述会议文件的标识信息,对各所述会议文件进行排序整合,得到会议文件包。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
基于同一技术构思,本申请实施例还提供了一种计算机设备。参照图6所示,为本申请实施例提供的计算机设备600的结构示意图,包括处理器601、存储器602、和总线603。其中,存储器602用于存储执行指令,包括内存6021和外部存储器6022;这里的内存6021也称内存储器,用于暂时存放处理器601中的运算数据,以及与硬盘等外部存储器6022交换的数据,处理器601通过内存6021与外部存储器6022进行数据交换,当计算机设备600运行时,处理器601与存储器602之间通过总线603通信,使得处理器601执行以下指令:
在终端界面的第一区域展示会议发言人的字幕信息,第二区域展示会议共享屏幕对应的内容信息;响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配;根据所述字幕信息生成所述批注信息,并在所述目标位置对应的预设区域内添加所述批注信息;基于添加所述批注信息后的所述内容信息,生成会议文件。
其中,处理器601的具体处理流程可以参照上述方法实施例的记载,这里不再赘述。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的会议文件生成方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例所提供的会议文件生成方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的会议文件生成方法的步骤,具体可参见上述方法实施例,在此不再赘述。
本公开实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software DevelopmentKit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种会议文件生成方法,其特征在于,包括:
在终端界面的第一区域展示会议发言人的字幕信息,第二区域展示会议共享屏幕对应的内容信息;
响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配;
根据所述字幕信息生成批注信息,并在所述目标位置对应的预设区域内添加所述批注信息;
基于添加所述批注信息后的所述内容信息,生成会议文件。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述会议发言人的第一发言内容;
基于语音识别技术和所述第一发言内容,生成所述第一发言内容对应的字幕信息。
3.根据权利要求2所述的方法,其特征在于,所述字幕信息以句子的形式呈现,在所述第一区域展示的所述字幕信息包括多句所述字幕信息;
所述基于语音识别技术和所述第一发言内容,生成所述发言内容对应的字幕信息,包括:
基于语音识别技术和所述第一发言内容,生成所述发言内容对应的初始字幕信息;
在所述第一区域展示的所述字幕信息中确定目标字幕信息;其中,所述目标字幕信息对应的第二发言内容的发言时间与所述第一发言内容的发言时间差在预设范围内;
基于所述第二发言内容对所述初始字幕信息进行校正,得到所述发言内容对应的字幕信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置,包括:
对所述字幕信息进行分词,确定至少一个关键词;
将所述关键词与所述内容信息的结构化信息进行匹配,确定目标结构化信息;
基于所述目标结构化信息与所述第二区域内各位置标识的映射关系,确定所述字幕信息对应的目标位置。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
响应所述终端界面第二区域更新所述会议共享屏幕对应的内容信息,对所述内容信息进行文字识别,得到所述内容信息对应的文本信息;
将所述文本信息分成若干个子文本信息,提取各所述子文本信息的结构化信息;
确定所述各子文本信息在所述第二区域所在的位置,生成各子文本信息对应的位置标识;
基于各所述子文本信息的结构化信息和位置标识,生成内容信息中结构化信息与所述第二区域内各位置标识的映射关系。
6.根据权利要求1所述的方法,其特征在于,所述基于添加所述批注信息后的所述内容信息,生成会议文件,包括:
接收通过标注工具对所述内容信息的标注信息;
响应于生成会议文件的指令,或响应于所述内容信息处于更新状态,结合所述批注信息和所述标注信息生成所述会议文件;
根据所述内容信息的属性特征生成所述会议文件的标识信息。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述会议文件的标识信息,对各所述会议文件进行排序整合,得到会议文件包。
8.一种会议文件生成装置,其特征在于,包括:
展示模块,用于在终端界面的第一区域展示会议发言人的字幕信息,在第二区域展示会议共享屏幕对应的内容信息;
确定模块,用于响应针对所述字幕信息的触发操作,在所述内容信息中,确定所述字幕信息在所述第二区域对应的目标位置;其中,所述目标位置处的目标内容信息与所述字幕信息相匹配;
添加模块,用于根据所述字幕信息生成所述批注信息,并在所述目标位置对应的预设区域内添加所述批注信息;
第一生成模块,用于基于添加所述批注信息后的所述内容信息,生成会议文件。
9.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的会议文件生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的会议文件生成方法。
CN202010943828.6A 2020-09-08 2020-09-08 会议文件生成方法、装置及电子设备 Active CN112084756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010943828.6A CN112084756B (zh) 2020-09-08 2020-09-08 会议文件生成方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010943828.6A CN112084756B (zh) 2020-09-08 2020-09-08 会议文件生成方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112084756A true CN112084756A (zh) 2020-12-15
CN112084756B CN112084756B (zh) 2023-10-10

Family

ID=73731661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010943828.6A Active CN112084756B (zh) 2020-09-08 2020-09-08 会议文件生成方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112084756B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541495A (zh) * 2020-12-22 2021-03-23 厦门亿联网络技术股份有限公司 会议消息的检测方法、装置、服务器及存储介质
CN112966480A (zh) * 2021-03-18 2021-06-15 深圳云之家网络有限公司 一种远程会议注解方法及其相关设备
WO2023050995A1 (zh) * 2021-09-29 2023-04-06 中兴通讯股份有限公司 数据处理方法、装置、计算机可读存储介质和程序产品
WO2023246328A1 (zh) * 2022-06-24 2023-12-28 京东方科技集团股份有限公司 视频会议的标记方法、系统、终端、服务器及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070143103A1 (en) * 2005-12-21 2007-06-21 Cisco Technology, Inc. Conference captioning
CN105653511A (zh) * 2015-12-31 2016-06-08 田雪松 文件批注信息生成方法
CN205408020U (zh) * 2015-12-11 2016-07-27 中国农业银行股份有限公司 一种远程会议系统
CN108255403A (zh) * 2018-01-16 2018-07-06 广州视源电子科技股份有限公司 信息批注系统、方法、装置和存储介质
CN108595645A (zh) * 2018-04-26 2018-09-28 深圳市鹰硕技术有限公司 会议发言管理方法以及装置
CN109726367A (zh) * 2017-10-27 2019-05-07 腾讯科技(北京)有限公司 一种批注展示的方法及相关装置
CN109862308A (zh) * 2019-01-28 2019-06-07 视联动力信息技术股份有限公司 一种批注处理方法和系统
WO2019148583A1 (zh) * 2018-02-02 2019-08-08 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN110381382A (zh) * 2019-07-23 2019-10-25 腾讯科技(深圳)有限公司 视频笔记生成方法、装置、存储介质和计算机设备
CN111079714A (zh) * 2020-01-02 2020-04-28 上海乂学教育科技有限公司 智能在线笔记生成系统
US20200250261A1 (en) * 2019-02-01 2020-08-06 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070143103A1 (en) * 2005-12-21 2007-06-21 Cisco Technology, Inc. Conference captioning
CN205408020U (zh) * 2015-12-11 2016-07-27 中国农业银行股份有限公司 一种远程会议系统
CN105653511A (zh) * 2015-12-31 2016-06-08 田雪松 文件批注信息生成方法
CN109726367A (zh) * 2017-10-27 2019-05-07 腾讯科技(北京)有限公司 一种批注展示的方法及相关装置
CN108255403A (zh) * 2018-01-16 2018-07-06 广州视源电子科技股份有限公司 信息批注系统、方法、装置和存储介质
WO2019148583A1 (zh) * 2018-02-02 2019-08-08 深圳市鹰硕技术有限公司 一种会议智能管理方法及系统
CN108595645A (zh) * 2018-04-26 2018-09-28 深圳市鹰硕技术有限公司 会议发言管理方法以及装置
CN109862308A (zh) * 2019-01-28 2019-06-07 视联动力信息技术股份有限公司 一种批注处理方法和系统
US20200250261A1 (en) * 2019-02-01 2020-08-06 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium
CN110381382A (zh) * 2019-07-23 2019-10-25 腾讯科技(深圳)有限公司 视频笔记生成方法、装置、存储介质和计算机设备
CN111079714A (zh) * 2020-01-02 2020-04-28 上海乂学教育科技有限公司 智能在线笔记生成系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541495A (zh) * 2020-12-22 2021-03-23 厦门亿联网络技术股份有限公司 会议消息的检测方法、装置、服务器及存储介质
CN112966480A (zh) * 2021-03-18 2021-06-15 深圳云之家网络有限公司 一种远程会议注解方法及其相关设备
WO2023050995A1 (zh) * 2021-09-29 2023-04-06 中兴通讯股份有限公司 数据处理方法、装置、计算机可读存储介质和程序产品
WO2023246328A1 (zh) * 2022-06-24 2023-12-28 京东方科技集团股份有限公司 视频会议的标记方法、系统、终端、服务器及存储介质

Also Published As

Publication number Publication date
CN112084756B (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
CN112087656B (zh) 在线笔记生成方法、装置及电子设备
CN112084756B (zh) 会议文件生成方法、装置及电子设备
JP4985974B2 (ja) コミュニケーション支援方法、システムおよびサーバ装置
CN110968736B (zh) 视频生成方法、装置、电子设备及存储介质
US20180130496A1 (en) Method and system for auto-generation of sketch notes-based visual summary of multimedia content
CN101295313B (zh) 显示控制设备和显示控制方法
CN109817210B (zh) 语音写作方法、装置、终端和存储介质
US20080077869A1 (en) Conference supporting apparatus, method, and computer program product
CN110781328A (zh) 基于语音识别的视频生成方法、系统、装置和存储介质
CN112689189A (zh) 一种视频展示、生成方法及装置
CN105654532A (zh) 一种照片拍摄及处理方法及系统
CN111290688A (zh) 多媒体笔记的方法、终端及计算机可读存储介质
CN113536172B (zh) 一种百科信息展示的方法、装置及计算机存储介质
CN112084305A (zh) 应用于聊天应用的搜索处理方法、装置、终端及存储介质
CN111276149A (zh) 语音识别方法、装置、设备及可读存储介质
CN108121987B (zh) 一种信息处理方法和电子设备
CN112199932A (zh) Ppt生成方法、装置、计算机可读存储介质及处理器
CN116127054A (zh) 图像处理方法、装置、设备、存储介质及计算机程序
CN114938473A (zh) 评论视频生成方法及装置
KR20220130863A (ko) 음성-텍스트 변환 영상 리소스 매칭 기반 멀티미디어 변환 콘텐츠 제작 서비스 제공 장치
CN110297965B (zh) 课件页面的显示及页面集的构造方法、装置、设备和介质
CN110110144A (zh) 视频的处理方法和设备
JP6506427B1 (ja) 情報処理装置、動画検索方法、生成方法及びプログラム
CN115174506A (zh) 会话信息处理方法、装置、可读存储介质和计算机设备
CN115481254A (zh) 一种对影视剧剧本进行视效内容分析的方法、系统、可读存储介质和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant