CN112231464B - 信息处理方法、装置、设备及存储介质 - Google Patents
信息处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112231464B CN112231464B CN202011286153.9A CN202011286153A CN112231464B CN 112231464 B CN112231464 B CN 112231464B CN 202011286153 A CN202011286153 A CN 202011286153A CN 112231464 B CN112231464 B CN 112231464B
- Authority
- CN
- China
- Prior art keywords
- information
- processed
- preset
- key
- schema
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 59
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 239000012634 fragment Substances 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 15
- 238000012550 audit Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 6
- 238000012552 review Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90348—Query processing by searching ordered data, e.g. alpha-numerically ordered data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Abstract
本申请实施例公开了一种信息处理方法、装置、设备及存储介质,信息处理方法包括:获取待处理信息;从待处理信息中提取关键信息,关键信息包括以下至少一项:与预设关键词相关的信息、待处理信息中被标记的信息以及与多个片段相关的信息,多个片段为待处理信息中内容相关联的信息片段;根据关键信息,生成待处理信息的纲要信息;输出纲要信息。利用本申请实施例能够解决由于用户自己得到纲要信息而导致需要占用用户比较多的时间以及用户自己得到的纲要信息不够准确的问题。
Description
技术领域
本申请实施例涉及计算机领域,尤其涉及一种信息处理方法、装置、设备及存储介质。
背景技术
现在的信息越来越多,为了用户查看,需要从众多信息中提取纲要信息。比如,在学习过程中,用户需要根据老师讲课的内容总结知识点,形成课堂纲要信息,以便于后期复习。再比如,在开会时,用户需要根据与会人员的讲话,总结关键信息,形成会议纲要信息。
在相关技术中,需要用户自己总结关键信息来得到纲要信息,但是,用户自己得到纲要信息时需要占用比较多的时间,而且有时候用户自己得到的纲要信息不够准确。
发明内容
本申请实施例提供一种信息处理方法、装置、设备及存储介质,以解决由于用户自己得到纲要信息而导致需要占用用户比较多的时间以及用户自己得到的纲要信息不够准确的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种信息处理方法,包括:
获取待处理信息;
从所述待处理信息中提取关键信息,所述关键信息包括以下至少一项:与预设关键词相关的信息、所述待处理信息中被标记的信息以及与多个片段相关的信息,所述多个片段为所述待处理信息中内容相关联的信息片段;
根据所述关键信息,生成所述待处理信息的纲要信息;
输出所述纲要信息。
第二方面,本申请实施例提供了一种信息处理装置,包括:
信息获取模块,用于获取待处理信息;
信息提取模块,用于从所述待处理信息中提取关键信息,所述关键信息包括以下至少一项:与预设关键词相关的信息、所述待处理信息中被标记的信息以及与多个片段相关的信息,所述多个片段为所述待处理信息中内容相关联的信息片段;
信息生成模块,用于根据所述关键信息,生成所述待处理信息的纲要信息;
信息输出模块,用于输出所述纲要信息。
第三方面,本申请实施例提供了一种信息处理设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述信息处理方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述信息处理方法的步骤。
在本申请实施例中,先获取待处理信息,然后,从待处理信息中提取关键信息,关键信息包括以下至少一项:与预设关键词相关的信息、待处理信息中被标记的信息以及与多个片段相关的信息。再然后,根据关键信息,生成待处理信息的纲要信息。最后输出纲要信息。由此,实现了自动对待处理信息中的关键信息进行汇总,并生成待处理信息的纲要信息,避免用户自己总结关键信息来得到纲要信息,不需要占用用户比较多的时间。而且从待处理信息中提取的关键信息满足上述的至少一项,可以避免漏掉部分的关键信息,从而保证得到的纲要信息的准确性。
附图说明
图1是本申请提供的一种信息处理系统的一个实施例的结构示意图;
图2是本申请提供的一种信息处理系统的另一个实施例的结构示意图;
图3是本申请提供的一种信息处理方法的一个实施例的流程示意图;
图4是本申请提供的一种待处理信息的一个实施例的示意图;
图5是本申请提供的一种信息处理方法的另一个实施例的流程示意图;
图6是本申请提供的一种信息处理方法的又一个实施例的流程示意图;
图7是本申请提供的一种纲要信息的一个实施例的示意图;
图8是本申请提供的信息处理装置的一个实施例的结构示意图;
图9是本申请提供的信息处理设备的一个实施例的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决背景技术部分提出的技术问题,本申请提供一种信息处理方法,该信息处理方法可以应用于信息处理设备,该信息处理设备可以是移动电话、计算机、平板设备以及个人数字助理等。
在本申请实施例的信息处理方法中,首先获取待处理信息,然后,从待处理信息中提取反映待处理信息的关键内容的关键信息,并根据该关键信息生成待处理信息的纲要信息,使得纲要信息中具有待处理信息的关键内容;最后在得到纲要信息之后,输出纲要信息。由此,实现了机器自动生成待处理信息的纲要信息,避免用户自己对待处理信息进行整理来纲要信息,不需要占用用户比较多的时间。
图1是本申请提供的一种信息处理方法的一个实施例的流程示意图。如图1所示,信息处理方法包括:
S102,获取待处理信息。
作为一个示例,获取待处理信息具体可以包括:获取显示装置上显示的多媒体文件,该多媒体文件即为待处理信息。比如,在讲师在讲课的过程中,在显示装置上显示课件,获取显示装置上显示的课件,该课件即是待处理信息。其中,多媒体文件可以包括以下至少一项:文本文件、图像以及视频文件。
作为另一个示例,获取待处理信息具体可以包括:获取录音装置录取的音频文件,该音频文件即为待处理信息。比如,在讲师在讲课的过程中,通过录音装置录取讲师讲课的内容,然后,获取录音装置录取的音频文件。
作为又一个示例,获取待处理信息具体可以包括:接收设备发送的待处理信息,或者,从互联网上下载待处理信息。
在S102之后,信息处理方法还包括:
S104,从待处理信息中提取关键信息,关键信息包括以下至少一项:与预设关键词相关的信息、待处理信息中被标记的信息以及与多个片段相关的信息,多个片段为待处理信息中内容相关联的信息片段。
作为一个示例,从待处理信息中提取关键信息具体可以包括:识别待处理信息的内容,从待处理信息的内容中提取关键信息。其中,识别待处理信息的内容可以包括:在待处理信息包括图像的情况下,通过图文识别模型识别图像中的内容;在待处理信息包括音频文件或视频文件的情况下,通过语音识别模型识别音频文件或视频文件中语音对应的文本内容。
待处理信息中被标记的信息可以包括以下至少一项:被预设符号标记的信息以及被标记工具所标记的信息。
下面通过一个例子说明被预设符号标记的信息。
比如,预设符号可以为星号、实心圆点等符号。在此情况下,被预设符号标记的信息可以是预设符号之后的内容。
下面通过一个例子说明被标记工具所标记的信息。
比如,标记工具为直线工具、波浪线工具以及用于标记注释内容的工具等。在此情况下,被标记工具所标记的信息可以是画有直线或者波浪线的内容。被标记工具所标记的信息还可以是具有注释内容的信息。
下面通过图2的示例说明待处理信息中被标记的信息。
假设待处理信息为图2所示的课件,在待处理信息的第一句开头具有星号“※”,可以将星号之后的一句话或者两句话确定为被标记的信息。另外,待处理信息的第二段中“主峰是最高的山峰:珠穆朗玛峰”被直线所标记,那么被直线所标记的内容是被标记的信息。除此之外,第一段的最后“全长2450km,宽200~350km”具有注释202,因此,“全长2450km,宽200~350km”是被标记的信息。
作为一个示例,与多个片段相关的信息可以是多个片段。
作为另一个示例,与多个片段相关的信息可以是对多个片段的内容进行合并处理之后得到的信息。
作为一个示例,多个片段满足以下至少一项:多个片段中任两个片段之间的相似度大于预设相似度阈值,多个片段中的任两个片段之间具有相同词语的数量大于预设数量阈值。因此,多个片段是在待处理信息中出现多次的内容,也就是说多个片段的内容在待处理信息中比较重要。然后,将与多个片段相关的信息作为关键信息。
下面通过一个例子说明本申请实施例中的多个片段。
假设待处理信息包括文本文件,文本文件中包括语句A和语句B。
可以计算语句A和语句B之间的余弦相似度,在语句A和语句B之间的余弦相似度大于预设相似度阈值(比如预设相似度阈值为80%)的情况下,或者,在语句A和语句B之间具有相同词语的数量大于预设数量阈值的情况下,可以确定语句A和语句B相似,说明语句A和语句B的内容重复出现。因此,将与语句A和语句B相关的内容确定为关键信息。
其中,预设数量阈值可以根据语句A和语句B中最少字数的语句来确定。比如,语句A有15个字,语句B有13个字,根据13个字可以确定预设数量阈值为5。
在S104之后,信息处理方法还包括:
S106,根据关键信息,生成待处理信息的纲要信息。
作为一个示例,关键信息的数量可以为多个,根据关键信息,生成待处理信息的纲要信息具体可以包括:先将多个关键信息中相同的信息或者相似度大于预定相似度阈值的信息进行合并,得到合并结果;然后,将合并结果添加至预设的纲要模板中,得到纲要信息。由此,可以使得生成的纲要信息中包括待处理信息的关键内容。
另外,在将合并结果添加至预设的纲要模板中,得到纲要信息之后,还可以获取纲要信息中表征主题的关键词;根据表征主题的关键词生成纲要标题;向纲要信息中添加纲要标题。还可以向纲要信息中添加纲要信息的生成日期。
在S106之后,信息处理方法还包括:
S108,输出纲要信息。
作为一个示例,输出纲要信息具体可以包括:将纲要信息发送至服务器、电子设备以及预定账号中的至少一项。
在将纲要信息发送至服务器的情况下,可以实现纲要信息的上传,方便用户从服务器中下载纲要信息。比如,服务器可以是云服务器,由此,将纲要信息上传至云端,方便用户从云端下载纲要信息。
在将纲要信息发送至电子设备或者预定账号的情况下,实现了将纲要信息下发给用户。比如,在生成课堂内容的纲要信息之后,将纲要信息发送至学生的电子设备或者学生的邮箱。在学生需要复习课堂上老师讲的内容时,可以通过电子设备或者邮箱接收到的纲要信息进行复习。
在本申请实施例中,通过从待处理信息中提取关键信息,并根据关键信息,生成待处理信息的纲要信息。最后输出纲要信息。由此,实现了机器自动总结待处理信息中的关键信息,并生成待处理信息的纲要信息,避免用户自己总结关键信息来得到纲要信息,不需要占用用户比较多的时间。
在本申请的一个或多个实施例中,在关键信息包括与预设关键词相关的信息的情况下,如图3所示,S104可以包括:
S1042,根据预设关键词,从待处理信息中获取第一信息,第一信息包括以下至少一项:在预设关键词之后的信息片段以及具有预设关键词的信息片段;
S1044,将第一信息确定为关键信息。
其中,预设关键词可以包括以下至少一项:“重点”、“关键点”、“注意”以及“留意”等词。如果待处理信息是与考试相关的信息,预设关键词还可以包括以下至少一项:“考点”、“难点”以及“考试必考”。
S1042的具体实现方式可以包括:从文本文件(该文本文件可以为待处理信息中的文本文件或者待处理信息中的音频文件对应的文本文件)中获取预设关键词所在段落,将该段落作为上述的第一信息;或者,从该段落中获取位于预设关键词之后的文本片段,该文本片段为上述的第一信息。
在得到第一信息之后,将第一信息确定为关键信息,并根据关键信息生成待处理信息的纲要信息。由此,实现了自动生成待处理信息的纲要信息,避免用户自己总结关键信息来得到纲要信息,不需要占用用户比较多的时间。而且关键信息与预设关键词相关,可以避免由于人为汇总而漏掉部分的关键信息。
在本申请的一个或多个实施例中,在关键信息包括与预设关键词相关的信息的情况下,S104可以包括:
根据预设关键词,从待处理信息中获取第一信息,第一信息包括以下至少一项:在预设关键词之后的信息片段以及具有预设关键词的信息片段;
在第一信息的N个字符范围内存在预设关联词,且第一信息位于预设关联词一侧的情况下,根据预设关联词,从待处理信息中获取所述预设关联词关联且位于预设关联词另一侧的第二信息,N为正整数;
将第二信息片段确定为关键信息。
在本实施例中,预设关联词可以为“因此”、“结果”以及“于是”等关联词。根据预设关联词,获取位于预设关联词另一侧的第二信息具体可以包括:在第一信息位于预设关联词之后的情况下,将与预设关联词相邻且在预设关联词之前的信息片段确定为第二信息;在第一信息在预设关联词之前的情况下,将与预设关联词相邻且在预设关联词之后的信息片段确定为第二信息。
在得到第二信息之后,将第二信息片段确定为关键信息。由于关联词前后内容相互关联,因此,在确定预设关联词一侧的第一信息为关键信息的情况下,可以确定预设关联词另一侧的第二信息也为关键信息。由此,将预设关联词的前后内容确定为关键信息,避免出现漏掉部分的关键信息,从而保证纲要信息覆盖的内容更加全面。
在本申请的一个或多个实施例中,在待处理信息包括音频文件,关键信息包括与多个片段相关的信息的情况下,S104可以包括:
从音频文件中获取多个片段;
在多个片段中存在音量大于预设音量阈值的片段的情况下,根据多个片段,确定关键信息。
需要说明的是,从音频文件中获取的多个片段为音频片段。
在本申请实施例中,从音频文件中获取多个片段,由于多个片段的内容相关联,因此,多个片段的内容相似,也就是说多个片段的内容在待处理信息中出现多次,进而说明多个片段的内容在待处理信息中比较重要。在多个片段中存在音量大于预设音量阈值(比如预设音量阈值为70分贝)的片段的情况下,说明用户使用较高的音量讲解多个片段的内容,进一步证实了多个片段的内容在待处理信息中比较重要。因此,可以根据多个片段,确定关键信息,然后,根据关键信息生成纲要信息。由此,使得纲要信息包括了待处理信息中比较重要的内容。
在本申请的一个或多个实施例中,如图4所示,S106可以包括:
S1062,在关键信息的数量为多个的情况下,按照各个关键信息在待处理信息中出现的先后顺序,排列各个关键信息,得到纲要信息。
下面通过图5示出的一个示例说明纲要信息。
如图5所示,纲要信息包括纲要标题、纲要信息生成的时间以及按顺序排列的各个关键信息。
在本申请实施例中,按照各个关键信息在待处理信息中出现的先后顺序,排列各个关键信息,得到纲要信息,方便用户对纲要信息进行查看。
在本申请的一个或多个实施例中,S108可以包括:
将纲要信息发送至第一预设账号;
在接收到第一预设账号发送的目标信息,且目标信息表征纲要信息审核通过的情况下,将纲要信息发送至第二预设账号。
作为一个示例,第一预设账号和第二预设账号可以为邮箱或者即时通讯应用程序的账号。
下面以第一预设账号和第二预设账号为邮箱为例说明输出纲要信息。
假设待处理信息为教学文件,第一预设账号为老师的邮箱,第二预设账号为学生的邮箱。
在生成纲要信息之后,先将纲要信息发送至老师的邮箱。然后,老师可以对纲要信息进行审核,在老师对纲要信息审核通过的情况下,可以将纲要信息发送至学生邮箱,学生可以自行进行下载,以复习老师讲课的内容。
信息处理设备将纲要信息发送至老师的邮箱,老师在对纲要信息进行审核时,老师可以根据需求修改纲要信息的内容,并将修改后的纲要信息发送至信息处理设备。然后,信息处理设备可以将修改后的纲要信息发送至学生邮箱。
可见,本申请实施例的信息处理方法可以应用于教学场景中,老师获取纲要信息,可以回顾自己授课的知识点是否覆盖全面。学生获取纲要信息便于学习。老师和学生都不需要自己手动撰写纲要信息。不仅提高了老师的教学效率,还提高了学生的学习效率。
在本申请实施例中,先将纲要信息发送至第一预设账号,以使第一预设账号对应的用户先对纲要信息进行审核,在对纲要信息审核通过的情况下,再将纲要信息发送至第二预设账号。由此,避免发送至第二预设账号的纲要信息存在问题。
在本申请的一个或多个实施例中,S108可以包括:
显示纲要信息;
在接收到对纲要信息审核通过的输入的情况下,将纲要信息发送至第三预设账号,或者将纲要信息发送至存储器中进行存储。
下面以待处理信息为教学文件为例,对输出纲要信息进行说明。
在老师的电子设备生成教学文件的纲要信息之后,先将纲要信息显示在老师的电子设备上,以供老师对纲要信息进行审核。在老师对纲要信息审核通过的情况下,可以将纲要信息进行存储或者将纲要信息发送至学生的账号。
在本申请实施例中,在信息处理方法应用于电子设备的情况下,电子设备在生成纲要信息之后,可以显示纲要信息,以供用户先对纲要信息进行审核。在接收到用户对纲要信息审核通过的输入的情况下,可以将纲要信息发送至第三预设账号或者存储纲要信息。由此,避免发送至第三预设账号的纲要信息或者存储的纲要信息存在问题。
下面说明本申请实施例的信息处理方法的应用场景。该信息处理方法可以应用于信息处理系统中。
图6是本申请提供的一种信息处理系统的一个实施例的结构示意图。如图6所示,信息处理系统包括:显示装置3022、麦克风3024和电子设备3026和服务器304。上述的信息处理系统可以应用于教学场景、培训场景以及开会场景等。
电子设备3026分别与显示装置3022和麦克风3024相连,电子设备3026控制显示装置3022上显示的信息,同时用户可以对着麦克风3024进行讲话,通过麦克风3024采集用户的音频数据。比如,该信息处理系统应用于教学场景,老师通过电子设备3026控制显示装置3022上显示教学课件,老师通过电子设备3026显示的教学课件进行讲课,而对面的学生通过显示装置3022上显示的教学课件进行学习。
由于电子设备3026分别与显示装置3022和麦克风3024相连,因此,电子设备3026可以获取显示装置3022显示的信息以及麦克风3024采集的音频数据,并将显示装置3022显示的信息以及音频数据作为待处信息,发送至服务器304。
服务器304接收到待处理信息之后,基于上述任意一项的信息处理方法对待处理信息进行处理来得到纲要信息。
在本示例中,是由服务器304对待处理信息进行处理得到纲要信息。当然,也可以是由电子设备3026对待处理信息进行处理得到纲要信息,具体实现方式与服务器304得到纲要信息的方式类似,在此不再重复赘述。
图7是本申请提供的一种信息处理系统的另一个实施例的结构示意图。如图7所示,信息处理系统包括电子设备3026’和服务器304。电子设备3026’首先获取待处理信息,比如,电子设备3026’利用摄像头拍摄课本内容,得到待处理信息,或者电子设备3026’从互联网中下载学习内容或者工作内容,得到待处理信息。
电子设备3026’可以将待处理信息发送至服务器304,由服务器304根据待处理信息生成纲要信息。然后,服务器304输出纲要信息。
在本示例中,是由服务器304对待处理信息进行处理得到纲要信息。当然,也可以是由电子设备3026’对待处理信息进行处理得到纲要信息,具体实现方式与服务器304得到纲要信息的方式类似,在此不再重复赘述。
与本申请提供的信息处理方法对应地,本申请提供一种信息处理装置。
图8是本申请提供的信息处理装置的一个实施例的结构示意图。如图8所示,信息处理装置400包括:
信息获取模块402,用于获取待处理信息;
信息提取模块404,用于从待处理信息中提取关键信息,关键信息包括以下至少一项:与预设关键词相关的信息、待处理信息中被标记的信息以及与多个片段相关的信息,多个片段为待处理信息中内容相关联的信息片段;
信息生成模块406,用于根据关键信息,生成待处理信息的纲要信息;
信息输出模块408,用于输出纲要信息。
在本申请实施例中,先获取待处理信息,然后,从待处理信息中提取关键信息,关键信息包括以下至少一项:与预设关键词相关的信息、待处理信息中被标记的信息以及与多个片段相关的信息。再然后,根据关键信息,生成待处理信息的纲要信息。最后输出纲要信息。由此,实现了自动对待处理信息中的关键信息进行汇总,并生成待处理信息的纲要信息,避免用户自己总结关键信息来得到纲要信息,不需要占用用户比较多的时间。而且从待处理信息中提取的关键信息满足上述的至少一项,可以避免漏掉部分的关键信息,从而保证得到的纲要信息的准确性。
在本申请的一个或多个实施例中,在关键信息包括与预设关键词相关的信息的情况下,信息提取模块404可以包括:
第一获取单元,用于根据预设关键词,从待处理信息中获取第一信息,第一信息包括以下至少一项:在预设关键词之后的信息片段以及具有预设关键词的信息片段;
第一确定单元,用于将第一信息确定为关键信息。
在本申请实施例中,根据预设关键词,从待处理信息中获取与预设关键词相关的关键信息,并根据关键信息生成待处理信息的纲要信息。由此,实现了自动生成待处理信息的纲要信息,避免用户自己总结关键信息来得到纲要信息,不需要占用用户比较多的时间。而且关键信息与预设关键词相关,可以避免由于人为汇总而漏掉部分的关键信息。
在本申请的一个或多个实施例中,在关键信息包括与预设关键词相关的信息的情况下,信息提取模块404可以包括:
第一获取单元,用于根据预设关键词,从待处理信息中获取第一信息,第一信息包括以下至少一项:在预设关键词之后的信息片段以及具有预设关键词的信息片段;
第二获取单元,用于在待处理信息中存在与第一信息相邻的预设关联词,且第一信息位于预设关联词一侧的情况下,根据预设关联词,从待处理信息中获取与预设关联词相邻且位于预设关联词另一侧的第二信息;
第二确定单元,用于将第二信息片段确定为关键信息。
在本申请实施例中,由于关联词前后内容相互关联,因此,在确定预设关联词一侧的第一信息为关键信息的情况下,可以确定预设关联词另一侧的第二信息也为关键信息。由此,将预设关联词的前后内容确定为关键信息,避免出现漏掉部分的关键信息,从而保证纲要信息覆盖的内容更加全面。
在本申请的一个或多个实施例中,在待处理信息包括音频文件,关键信息包括与多个片段相关的信息的情况下,信息提取模块404包括:
第三获取单元,用于从音频文件中获取多个片段;
第三确定单元,用于在多个片段中存在音量大于预设音量阈值的片段的情况下,根据多个片段,确定关键信息。
在本申请实施例中,从音频文件中获取多个片段,由于多个片段的内容相关联,因此,多个片段的内容相似,也就是说多个片段的内容在待处理信息中出现多次,进而说明多个片段的内容在待处理信息中比较重要。在多个片段中存在音量大于预设音量阈值(比如预设音量阈值为70分贝)的片段的情况下,说明用户使用较高的音量讲解多个片段的内容,进一步证实了多个片段的内容在待处理信息中比较重要。因此,可以根据多个片段,确定关键信息,然后,根据关键信息生成纲要信息。由此,使得纲要信息包括了待处理信息中比较重要的内容。
在本申请的一个或多个实施例中,多个片段满足以下至少一项:多个片段中任两个片段之间的相似度大于预设相似度阈值,多个片段中的任两个片段之间具有相同词语的数量大于预设数量阈值。
在本实施例中,从待处理信息中获取内容相关联的多个片段,将与多个片段相关的信息确定为关键信息。由于多个片段比较相似,因此,多个片段的内容在待处理信息中重复出现,因此,多个片段的内容在待处理信息中比较重要。由此,本实施例中,通过提取待处理信息中比较重要的内容,并作为关键信息,使得纲要信息中记录了待处理信息中比较重要的内容。
在本申请的一个或多个实施例中,信息生成模块406具体用于在关键信息的数量为多个的情况下,按照各个关键信息在待处理信息中出现的先后顺序,排列各个关键信息,得到纲要信息。
在本申请实施例中,按照各个关键信息在待处理信息中出现的先后顺序,排列各个关键信息,得到纲要信息,方便用户对纲要信息进行查看。
在本申请的一个或多个实施例中,信息输出模块408可以包括:
第一发送单元,用于将纲要信息发送至第一预设账号;
第二发送单元,用于在接收到第一预设账号发送的目标信息,且目标信息表征纲要信息审核通过的情况下,将纲要信息发送至第二预设账号。
在本申请实施例中,先将纲要信息发送至第一预设账号,以使第一预设账号对应的用户先对纲要信息进行审核,在对纲要信息审核通过的情况下,再将纲要信息发送至第二预设账号。由此,避免发送至第二预设账号的纲要信息存在问题。
在本申请的一个或多个实施例中,信息输出模块408可以包括:
显示单元,用于显示纲要信息;
第三发送单元,用于在接收到对纲要信息审核通过的输入的情况下,将纲要信息发送至第三预设账号,或者将纲要信息发送至存储器中进行存储。
在本申请实施例中,在信息处理方法应用于电子设备的情况下,电子设备在生成纲要信息之后,可以显示纲要信息,以供用户先对纲要信息进行审核。在接收到用户对纲要信息审核通过的输入的情况下,可以将纲要信息发送至第三预设账号或者存储纲要信息。由此,避免发送至第三预设账号的纲要信息或者存储的纲要信息存在问题。
本申请还提供一种信息处理设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任意一项的信息处理方法的步骤。
图9是本申请提供的信息处理设备的一个实施例的硬件结构示意图。
如图9所示,信息处理设备可以包括处理器501以及存储有计算机程序指令的存储器502。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的任意一种信息处理方法。
在一个示例中,信息处理设备还可包括通信接口503和总线510。其中,如图9所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的信息处理方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种信息处理方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (8)
1.一种信息处理方法,其特征在于,包括:
获取待处理信息;
从所述待处理信息中提取关键信息,所述关键信息包括以下至少一项:与预设关键词相关的信息、所述待处理信息中被标记的信息以及与多个片段相关的信息,所述多个片段为所述待处理信息中内容相关联的信息片段;
根据所述关键信息,生成所述待处理信息的纲要信息;
输出所述纲要信息;
在所述关键信息包括与所述预设关键词相关的信息的情况下,所述从所述待处理信息中提取关键信息,包括:
根据所述预设关键词,从所述待处理信息中获取第一信息,所述第一信息包括以下至少一项:在所述预设关键词之后的信息片段以及具有所述预设关键词的信息片段;
将所述第一信息确定为所述关键信息;
在所述第一信息的N个字符范围内存在预设关联词,且所述第一信息位于所述预设关联词一侧的情况下,根据所述预设关联词,从所述待处理信息中获取所述预设关联词关联且位于所述预设关联词另一侧的第二信息,N为正整数;
将所述第二信息确定为所述关键信息。
2.根据权利要求1所述的方法,其特征在于,在所述待处理信息包括音频文件,所述关键信息包括与所述多个片段相关的信息的情况下,
所述从所述待处理信息中提取关键信息,包括:
从所述音频文件中获取所述多个片段;
在所述多个片段中存在音量大于预设音量阈值的片段的情况下,根据所述多个片段,确定所述关键信息。
3.根据权利要求1所述的方法,其特征在于,所述多个片段满足以下至少一项:所述多个片段中任两个片段之间的相似度大于预设相似度阈值,所述多个片段中的任两个片段之间具有相同词语的数量大于预设数量阈值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述关键信息,生成所述待处理信息的纲要信息,包括:
在所述关键信息的数量为多个的情况下,按照各个所述关键信息在所述待处理信息中出现的先后顺序,排列各个所述关键信息,得到所述纲要信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述输出所述纲要信息,包括:
将所述纲要信息发送至第一预设账号;
在接收到所述第一预设账号发送的目标信息,且所述目标信息表征所述纲要信息审核通过的情况下,将所述纲要信息发送至第二预设账号。
6.一种信息处理装置,其特征在于,包括:
信息获取模块,用于获取待处理信息;
信息提取模块,用于从所述待处理信息中提取关键信息,所述关键信息包括以下至少一项:与预设关键词相关的信息、所述待处理信息中被标记的信息以及与多个片段相关的信息,所述多个片段为所述待处理信息中内容相关联的信息片段;
信息生成模块,用于根据所述关键信息,生成所述待处理信息的纲要信息;
信息输出模块,用于输出所述纲要信息;
在关键信息包括与预设关键词相关的信息的情况下,信息提取模块,包括:
第一获取单元,用于根据预设关键词,从待处理信息中获取第一信息,第一信息包括以下至少一项:在预设关键词之后的信息片段以及具有预设关键词的信息片段;
第一确定单元,用于将第一信息确定为关键信息;
第二获取单元,用于在待处理信息中存在与第一信息相邻的预设关联词,且第一信息位于预设关联词一侧的情况下,根据预设关联词,从待处理信息中获取与预设关联词相邻且位于预设关联词另一侧的第二信息;
第二确定单元,用于将第二信息确定为关键信息。
7.一种信息处理设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的信息处理方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011286153.9A CN112231464B (zh) | 2020-11-17 | 2020-11-17 | 信息处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011286153.9A CN112231464B (zh) | 2020-11-17 | 2020-11-17 | 信息处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112231464A CN112231464A (zh) | 2021-01-15 |
CN112231464B true CN112231464B (zh) | 2023-12-22 |
Family
ID=74123471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011286153.9A Active CN112231464B (zh) | 2020-11-17 | 2020-11-17 | 信息处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112231464B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0896163A (ja) * | 1994-09-28 | 1996-04-12 | Sumitomo Metal Ind Ltd | Cad装置 |
EP0781034A2 (en) * | 1995-12-21 | 1997-06-25 | Canon Kabushiki Kaisha | Image processing apparatus and method |
CN101053252A (zh) * | 2004-08-10 | 2007-10-10 | 索尼株式会社 | 信息信号处理方法和设备以及计算机程序产品 |
CN101604312A (zh) * | 2007-12-07 | 2009-12-16 | 宗刚 | 信息的检索管理交流的方法和系统 |
CN107729492A (zh) * | 2017-10-18 | 2018-02-23 | 广东小天才科技有限公司 | 一种习题的推送方法、系统及终端设备 |
CN108287927A (zh) * | 2018-03-05 | 2018-07-17 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN109034613A (zh) * | 2018-07-25 | 2018-12-18 | 深圳市异度信息产业有限公司 | 一种判断教案是否合格的方法、装置及设备 |
CN109558593A (zh) * | 2018-11-30 | 2019-04-02 | 北京字节跳动网络技术有限公司 | 用于处理文本的方法和装置 |
CN110211590A (zh) * | 2019-06-24 | 2019-09-06 | 新华智云科技有限公司 | 一种会议热点的处理方法、装置、终端设备及存储介质 |
CN110517689A (zh) * | 2019-08-28 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法、装置及存储介质 |
CN110889280A (zh) * | 2018-09-06 | 2020-03-17 | 上海智臻智能网络科技股份有限公司 | 基于文档拆分的知识库建设方法及装置 |
CN110968684A (zh) * | 2019-12-18 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置、设备及存储介质 |
CN111462554A (zh) * | 2020-04-22 | 2020-07-28 | 浙江蓝鸽科技有限公司 | 网上课堂视频知识点识别方法和装置 |
CN111753042A (zh) * | 2019-03-29 | 2020-10-09 | 湖南本地星网络科技有限公司 | 一种基于人工智能辅助写作系统 |
CN111935552A (zh) * | 2020-07-30 | 2020-11-13 | 安徽鸿程光电有限公司 | 信息标注方法、装置、设备及介质 |
-
2020
- 2020-11-17 CN CN202011286153.9A patent/CN112231464B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0896163A (ja) * | 1994-09-28 | 1996-04-12 | Sumitomo Metal Ind Ltd | Cad装置 |
EP0781034A2 (en) * | 1995-12-21 | 1997-06-25 | Canon Kabushiki Kaisha | Image processing apparatus and method |
CN101053252A (zh) * | 2004-08-10 | 2007-10-10 | 索尼株式会社 | 信息信号处理方法和设备以及计算机程序产品 |
CN101604312A (zh) * | 2007-12-07 | 2009-12-16 | 宗刚 | 信息的检索管理交流的方法和系统 |
CN107729492A (zh) * | 2017-10-18 | 2018-02-23 | 广东小天才科技有限公司 | 一种习题的推送方法、系统及终端设备 |
CN108287927A (zh) * | 2018-03-05 | 2018-07-17 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN109034613A (zh) * | 2018-07-25 | 2018-12-18 | 深圳市异度信息产业有限公司 | 一种判断教案是否合格的方法、装置及设备 |
CN110889280A (zh) * | 2018-09-06 | 2020-03-17 | 上海智臻智能网络科技股份有限公司 | 基于文档拆分的知识库建设方法及装置 |
CN109558593A (zh) * | 2018-11-30 | 2019-04-02 | 北京字节跳动网络技术有限公司 | 用于处理文本的方法和装置 |
CN111753042A (zh) * | 2019-03-29 | 2020-10-09 | 湖南本地星网络科技有限公司 | 一种基于人工智能辅助写作系统 |
CN110211590A (zh) * | 2019-06-24 | 2019-09-06 | 新华智云科技有限公司 | 一种会议热点的处理方法、装置、终端设备及存储介质 |
CN110517689A (zh) * | 2019-08-28 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法、装置及存储介质 |
CN110968684A (zh) * | 2019-12-18 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置、设备及存储介质 |
CN111462554A (zh) * | 2020-04-22 | 2020-07-28 | 浙江蓝鸽科技有限公司 | 网上课堂视频知识点识别方法和装置 |
CN111935552A (zh) * | 2020-07-30 | 2020-11-13 | 安徽鸿程光电有限公司 | 信息标注方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
基于学习行为分析的英语网络自主学习中心架构研究;王峥;《中国电化教育 》;第96-102页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112231464A (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107193792B (zh) | 基于人工智能的生成文章的方法和装置 | |
CN109800320B (zh) | 一种图像处理方法、设备及计算机可读存储介质 | |
CN110969012B (zh) | 文本纠错方法、装置、存储介质及电子设备 | |
US9672204B2 (en) | System and method to acquire paraphrases | |
CN109919244B (zh) | 用于生成场景识别模型的方法和装置 | |
US9525896B2 (en) | Automatic summarizing of media content | |
CN107566906A (zh) | 一种视频评论处理方法及装置 | |
CN110019906B (zh) | 用于显示信息的方法和装置 | |
CN111460185A (zh) | 书籍搜索方法、装置和系统 | |
CN109657043B (zh) | 自动生成文章的方法、装置、设备及存储介质 | |
CN112231464B (zh) | 信息处理方法、装置、设备及存储介质 | |
CN106202360B (zh) | 试题搜索方法及装置 | |
CN111767259A (zh) | 内容分享的方法、装置、可读介质和电子设备 | |
CN112307246A (zh) | 一种学习小组的获取方法、装置、服务器和存储介质 | |
US20200226208A1 (en) | Electronic presentation reference marker insertion | |
CN110659208A (zh) | 测试数据集的更新方法和装置 | |
CN107133644B (zh) | 数字化图书馆内容分析系统及方法 | |
CN111859970B (zh) | 用于处理信息的方法、装置、设备和介质 | |
CN113971402A (zh) | 内容识别方法、装置、介质及电子设备 | |
CN111523310B (zh) | 数据处理方法、数据处理装置、存储介质和电子设备 | |
CN110381367B (zh) | 一种视频处理方法、设备及计算机可读存储介质 | |
CN112699687A (zh) | 内容编目方法、装置和电子设备 | |
CN112905838A (zh) | 信息检索方法和装置、存储介质和电子设备 | |
CN111027332A (zh) | 生成翻译模型的方法和装置 | |
CN112214695A (zh) | 信息处理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |