CN109918502A - 文档讲解方法、装置、计算机装置及计算机可读存储介质 - Google Patents

文档讲解方法、装置、计算机装置及计算机可读存储介质 Download PDF

Info

Publication number
CN109918502A
CN109918502A CN201910075867.6A CN201910075867A CN109918502A CN 109918502 A CN109918502 A CN 109918502A CN 201910075867 A CN201910075867 A CN 201910075867A CN 109918502 A CN109918502 A CN 109918502A
Authority
CN
China
Prior art keywords
document
keyword
text
paraphrase
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910075867.6A
Other languages
English (en)
Inventor
付伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910075867.6A priority Critical patent/CN109918502A/zh
Publication of CN109918502A publication Critical patent/CN109918502A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种文档讲解方法、装置、计算机装置及计算机可读存储介质。所述的文档讲解方法通过获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。本发明涉及音频转换领域,以实现节省人力且减少失误的目的。

Description

文档讲解方法、装置、计算机装置及计算机可读存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种文档讲解方法、装置、计算机装置及计算机可读存储介质。
背景技术
本部分旨在为权利要求书及具体实施方式中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,会议分享一般采用PPT人工讲解的方式进行。一般地,在讲解在开始之前,需要分享者做好充足地准备,以达到较好的分享效果。然而,这种讲解方式耗费人力,且讲解过程易出现失误。
发明内容
鉴于上述,本发明提供一种文档讲解方法、装置、计算机装置及计算机可读存储介质,以实现节省人力且减少失误的目的。
本申请一实施方式提供一种文档讲解方法,所述方法包括:
获取用户上传的文档,并提取所述文档中的文本信息;
根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;
检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及
若是,则中断讲解,并提取所述问题中的关键词;
搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。
在其中一个实施例中,所述获取用户上传的文档,并提取所述文档中的文本信息的步骤包括:
对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;
计算标识每一所述聚类位置信息的特征值;
根据每一所述类的特征值,确定所述文档的方向;
所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及
将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。
在其中一个实施例中,所述讲解点为文档标题、段落关键词及文档内容。
在其中一个实施例中,所述根据所述文本信息划分所述文档的讲解点的步骤包括:
扫描所述文档,并提取文档中的讲解点,其中所述讲解点为所述文档的一级标题、二级标题、三级标题及文档内容;
以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构;及
以所述一级标题为所述树形结构的根节点,所述二级标题、所述文档内容为所述树形结构的子节点,以划分所述文档的讲解点。
在其中一个实施例中,所述根据所述讲解点将所述文本信息进行语音合成并转化为语音信息的步骤包括:
构建预设词条语音库;
在所述文档中切分出与预设词库匹配的多组词;
对多组词中的每一组词进行评分并排序,选出评分排序为第一名的一组词作为所述文档的分词结果;及
在所述词条语音库中查找与所述分词结果对应的语音信息。
在其中一个实施例中,所述搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音的步骤包括:
通过预设关键词库或者预设浏览器搜索所述关键词对应的关键词释义;
提取所述关键词释义对应的文本信息;及
将所述关键词释义对应的文本信息转化成语音并输出。
在其中一个实施例中,所述文本信息为所述文档中的文字、文字字号及文字行数。
一种文档讲解装置,所述装置包括:
获取模块,用于获取用户上传的文档,并提取所述文档中的文本信息;
转化模块,用于根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;
检测模块,用于检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及
提取模块,用于中断讲解,并提取所述问题中的关键词;
输出模块,用于搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。
本申请一实施方式提供一种计算机装置,所述计算机装置包括处理器及存储器,所述存储器上存储有若干计算机程序,所述处理器用于执行存储器中存储的计算机程序时实现如前面所述的文档讲解方法的步骤。
本申请一实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前面所述的文档讲解方法的步骤。
上述文档讲解方法、装置、计算机装置及计算机可读存储介质,通过获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。从而,以实现节省人力且减少失误的目的。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的文档讲解方法的流程图。
图2是本发明实施例二提供的文档讲解装置较佳实施例中的功能模块图。
图3是本发明实施例三提供的计算机装置的示意图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施方式及实施方式中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。
优选地,本发明的文档讲解方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机装置可以是桌上型计算机、笔记本电脑、平板电脑、服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
实施例一:
图1是本发明文档讲解方法较佳实施例的步骤流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。
参阅图1所示,所述文档讲解方法具体包括以下步骤。
步骤S1、获取用户上传的文档,并提取所述文档中的文本信息。
本实施例中,所述文档的类型不限,只要所述文档中含有文本信息即可。所述文档可选择为PPT档、WORD档、PDF档等。所述文本信息为所述文档中的文字、文字字号、文字行数等信息。扫描所述文档,即可读取所述文档中的文字。
在一个实施例中,读取文档中的文字可通过提取文档中的文本行的方法进行。其中,“文本行”是指在文档中由文本文字所构成的行,此处所述的“行”并不涉及方向,既可以表示横向的“行”,也可以表示纵向的“行”。所述步骤具体包括:对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;计算标识每一所述聚类位置信息的特征值;根据每一所述类的特征值,确定所述文档的方向;所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。
步骤S2、根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息。
本实施例中,所述讲解点为文档标题、段落关键词及文档内容。根据所述讲解点,可得到所述文档的讲解顺序,而所述文档的讲解顺序能够反映所述文档讲解时的内在逻辑。例如,提取文档标题或者段落关键词,并对这些标题及段落关键词进行编号(1,2,3……),这些编号代表了文档讲解的顺序,所述标题及所述段落关键词为讲解点。
在一个实施例中,扫描所述文档,并依次提取所述文档中的讲解点,即一级标题、二级标题、三级标题及文档内容。接着以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构。其中,所述树形结构以所述一级标题为根节点,所述二级标题、所述文档内容为子节点,以设置所述文档的讲解顺序。根据所述讲解顺序将所述文字信息进行语音合成。
在另一个实施例中,构建一个词条语音库,然后基于字符串匹配的分词方法对所述所述文档进行分词。其中,对所述字符串匹配的分词采用全切分法,即切分出与预设词库匹配的所有可能的词,并通过统计语言模型对这些词进行评分,选出评分最高的一组词即为最优分词结果。最后在词条语音库中查找所述分词对应的语音信息并输出该语音信息。
步骤S3、检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题。
在一个实施例中,根据目标用户需求可以选择红外感应、遥控手动或者云端对讲解课程进行控制。通过无线通讯系统与云端人工智能综合应答平台实时联系,形成在线方式的智能应答,且可以选择进行人工干预或者非人工干预模式。例如,当用户进入会议分享厅时,可以通过红外感应发出开启讲解模式指令,接收到所述开启讲解模式指令后进行讲解模式。
例如,根据预先设定的讲解模式引领目标用户到第一个讲解点时,从预设数据库中调取该讲解点对应的讲解内容进行讲解。期间所述目标用户可能会打断机器人讲解进行提问,当接收到所述目标用户提出的问题时,中断讲解,并获取所述目标用户针对所述文档提出的问题。
在另一个实施例中,若所述目标用户希望中断现有讲解,直接跳跃至第N个讲解点,则首先和用户进行跳跃确认,并跳过无需讲解的定位点,直接进入所需要的定位点,输出讲解内容。例如,可全程监控应答内容和应答状态,所述目标用户的提问也会实时通过文本方式呈现。
在一个实施例中。若所述目标用户提出无法回答的问题,或者回答的不满意时,可以直接介入人工干预,进行人工应答。当人工干预解除后,仍旧按照既定程序进行应答或者讲解,按照定位或者所述目标用户问题或者人工干预后的最后指令进行下一步讲解,直至讲解结束。
步骤S4、中断讲解,并提取所述问题中的关键词。
在一个实施例中,提取所述问题中的关键词的步骤之前包括:创建关键词库,搜索所述关键词对应的释义,并将所述文字释义存储于所述关键词库中。进而当提取到所述问题中的关键词时,在所述关键词库中搜索所述关键词对应的文字释义。
在另一个实施例中,在提取所述问题中的关键词之后,所述方法包括调用浏览器进行在线搜索,即将所述关键词输入所述浏览器的搜索框内,并搜索所述关键词的释义。若搜索到所述关键词释义,则提取该关键词释义的文本信息,并将该文本信息进行语音合成。若搜索不到所述关键词释义,则返回无此关键词释义的通知或者请求人工干预。
步骤S5、搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。
在一个实施例中,当进入应答模式时,根据用户提出的问题,从所述关键词数据库获取答案,并用语音方式回答提问者。如果用户不打断讲解,则根据预先设置好的讲解定位点按照顺序前往,并完成讲解。
在另一个实施例中,输出并播放所述关键词对应释义的语音,以对该关键词释义进行讲解。当所有讲解活动结束后,根据既定程序答谢用户的聆听,并欢迎再次到来,然后归位到待播放状态以等待下一次会议分享讲解的开始。
在另一个实施例中,所述获取用户上传的文档,并提取所述文档中的文本信息的步骤包括:对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;计算标识每一所述聚类位置信息的特征值;根据每一所述类的特征值,确定所述文档的方向;所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。
在另一个实施例中,所述根据所述文本信息划分所述文档的讲解点的步骤包括:扫描所述文档,并提取文档中的讲解点,其中所述讲解点为所述文档的一级标题、二级标题、三级标题及文档内容;以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构;及以所述一级标题为所述树形结构的根节点,所述二级标题、所述文档内容为所述树形结构的子节点,以划分所述文档的讲解点。
在另一个实施例中,所述根据所述讲解点将所述文本信息进行语音合成并转化为语音信息的步骤包括:构建预设词条语音库;在所述文档中切分出与预设词库匹配的多组词;对多组词中的每一组词进行评分并排序,选出评分排序为第一名的一组词作为所述文档的分词结果;及在所述词条语音库中查找与所述分词结果对应的语音信息。
在另一个实施例中,所述搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音的步骤包括:通过预设关键词库或者预设浏览器搜索所述关键词对应的关键词释义;提取所述关键词释义对应的文本信息;及将所述关键词释义对应的文本信息转化成语音并输出。
综上,上述文档讲解方法,通过获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。从而,以实现节省人力且减少失误的目的。
实施例二:
图2为本发明文档讲解装置较佳实施例的功能模块图。
参阅图2所示,所述文档讲解装置20可以包括获取模块201、转化模块202、检测模块203、提取模块204及输出模块205。
所述获取模块201用于获取用户上传的文档,并提取所述文档中的文本信息。
本实施例中,所述文档的类型不限,只要所述文档中含有文本信息即可。所述文档可选择为PPT档、WORD档、PDF档等。所述文本信息为所述文档中的文字、文字字号、文字行数等信息。扫描所述文档,即可读取所述文档中的文字。
在一个实施例中,所述获取模块201读取文档中的文字可通过提取文档中的文本行的方法进行。其中,“文本行”是指在文档中由文本文字所构成的行,此处所述的“行”并不涉及方向,既可以表示横向的“行”,也可以表示纵向的“行”。所述步骤具体包括:对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;计算标识每一所述聚类位置信息的特征值;根据每一所述类的特征值,确定所述文档的方向;所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。
所述转化模块202用于根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息。
本实施例中,所述讲解点为文档标题、段落关键词及文档内容。根据所述讲解点,可得到所述文档的讲解顺序,而所述文档的讲解顺序能够反映所述文档讲解时的内在逻辑。例如,提取文档标题或者段落关键词,并对这些标题及段落关键词进行编号(1,2,3……),这些编号代表了文档讲解的顺序,所述标题及所述段落关键词为讲解点。
在一个实施例中,所述转化模块202扫描所述文档,并依次提取所述文档中的讲解点,即一级标题、二级标题、三级标题及文档内容。接着以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构。其中,所述树形结构以所述一级标题为根节点,所述二级标题、所述文档内容为子节点,以设置所述文档的讲解顺序。根据所述讲解顺序将所述文字信息进行语音合成。
在另一个实施例中,所述转化模块202构建一个词条语音库,然后基于字符串匹配的分词方法对所述所述文档进行分词。其中,对所述字符串匹配的分词采用全切分法,即切分出与预设词库匹配的所有可能的词,并通过统计语言模型对这些词进行评分,选出评分最高的一组词即为最优分词结果。最后在词条语音库中查找所述分词对应的语音信息并输出该语音信息。
所述检测模块203用于检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题。
在一个实施例中,所述检测模块203根据目标用户需求可以选择红外感应、遥控手动或者云端对讲解课程进行控制。通过无线通讯系统与云端人工智能综合应答平台实时联系,形成在线方式的智能应答,且可以选择进行人工干预或者非人工干预模式。例如,当用户进入会议分享厅时,可以通过红外感应发出开启讲解模式指令,接收到所述开启讲解模式指令后进行讲解模式。
例如,根据预先设定的讲解模式引领目标用户到第一个讲解点时,从预设数据库中调取该讲解点对应的讲解内容进行讲解。期间所述目标用户可能会打断机器人讲解进行提问,当接收到所述目标用户提出的问题时,中断讲解,并获取所述目标用户针对所述文档提出的问题。
在另一个实施例中,若所述目标用户希望中断现有讲解,所述检测模块203直接跳跃至第N个讲解点,则首先和用户进行跳跃确认,并跳过无需讲解的定位点,直接进入所需要的定位点,输出讲解内容。例如,可全程监控应答内容和应答状态,所述目标用户的提问也会实时通过文本方式呈现。
在一个实施例中。若所述目标用户提出无法回答的问题,或者回答的不满意时,所述检测模块203可以直接介入人工干预,进行人工应答。当人工干预解除后,仍旧按照既定程序进行应答或者讲解,按照定位或者所述目标用户问题或者人工干预后的最后指令进行下一步讲解,直至讲解结束。
所述提取模块204用于中断讲解,并提取所述问题中的关键词。
在一个实施例中,所述提取模块204提取所述问题中的关键词的步骤之前包括:创建关键词库,搜索所述关键词对应的释义,并将所述文字释义存储于所述关键词库中。进而当提取到所述问题中的关键词时,在所述关键词库中搜索所述关键词对应的文字释义。
在另一个实施例中,所述提取模块204在提取所述问题中的关键词之后,所述方法包括调用浏览器进行在线搜索,即将所述关键词输入所述浏览器的搜索框内,并搜索所述关键词的释义。若搜索到所述关键词释义,则提取该关键词释义的文本信息,并将该文本信息进行语音合成。若搜索不到所述关键词释义,则返回无此关键词释义的通知或者请求人工干预。
所述输出模块205用于搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。
在一个实施例中,当进入应答模式时,所述输出模块205根据用户提出的问题,从所述关键词数据库获取答案,并用语音方式回答提问者。如果用户不打断讲解,则根据预先设置好的讲解定位点按照顺序前往,并完成讲解。
在另一个实施例中,所述输出模块205输出并播放所述关键词对应释义的语音,以对该关键词释义进行讲解。当所有讲解活动结束后,根据既定程序答谢用户的聆听,并欢迎再次到来,然后归位到待播放状态以等待下一次会议分享讲解的开始。
在另一个实施例中,所述获取用户上传的文档,并提取所述文档中的文本信息的步骤包括:对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;计算标识每一所述聚类位置信息的特征值;根据每一所述类的特征值,确定所述文档的方向;所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。
在另一个实施例中,所述根据所述文本信息划分所述文档的讲解点的步骤包括:扫描所述文档,并提取文档中的讲解点,其中所述讲解点为所述文档的一级标题、二级标题、三级标题及文档内容;以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构;及以所述一级标题为所述树形结构的根节点,所述二级标题、所述文档内容为所述树形结构的子节点,以划分所述文档的讲解点。
在另一个实施例中,所述根据所述讲解点将所述文本信息进行语音合成并转化为语音信息的步骤包括:构建预设词条语音库;在所述文档中切分出与预设词库匹配的多组词;对多组词中的每一组词进行评分并排序,选出评分排序为第一名的一组词作为所述文档的分词结果;及在所述词条语音库中查找与所述分词结果对应的语音信息。
在另一个实施例中,所述搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音的步骤包括:通过预设关键词库或者预设浏览器搜索所述关键词对应的关键词释义;提取所述关键词释义对应的文本信息;及将所述关键词释义对应的文本信息转化成语音并输出。
综上,上述文档讲解装置,通过获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。从而,以实现节省人力且减少失误的目的。
实施例三
图3为本发明计算机装置较佳实施例的示意图。
所述计算机装置30包括存储器31、处理器32以及存储在所述存储器31中并可在所述处理器32上运行的计算机程序33,例如文档讲解程序。所述处理器32执行所述计算机程序33时实现上述文档讲解方法实施例中的步骤,例如图1所示的步骤S1~S5。或者,所述处理器32执行所述计算机程序33时实现上述文档讲解装置实施例中各模块的功能,例如图2中的模块201~205。
示例性的,所述计算机程序33可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器32执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序33在所述计算机装置30中的执行过程。例如,所述计算机程序33可以被分割成图2中的获取模块201、转化模块202、检测模块203、提取模块204及输出模块205。各模块具体功能参见实施例二。
所述计算机装置30可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图仅仅是计算机装置30的示例,并不构成对计算机装置30的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置30还可以包括输入输出设备、网络接入设备、总线等。
所称处理器32可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器32也可以是任何常规的处理器等,所述处理器32是所述计算机装置30的控制中心,利用各种接口和线路连接整个计算机装置30的各个部分。
所述存储器31可用于存储所述计算机程序33和/或模块/单元,所述处理器32通过运行或执行存储在所述存储器31内的计算机程序和/或模块/单元,以及调用存储在存储器31内的数据,实现所述计算机装置30的各种功能。所述存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据计算机装置30的使用所创建的数据等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置30集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种文档讲解方法,其特征在于,所述方法包括:
获取用户上传的文档,并提取所述文档中的文本信息;
根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;
检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及
若是,则中断讲解,并提取所述问题中的关键词;
搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。
2.如权利要求1所述的文档讲解方法,其特征在于,所述获取用户上传的文档,并提取所述文档中的文本信息的步骤包括:
对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;
计算标识每一所述聚类位置信息的特征值;
根据每一所述类的特征值,确定所述文档的方向;
所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及
将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。
3.如权利要求1所述的文档讲解方法,其特征在于,所述讲解点为文档标题、段落关键词及文档内容。
4.如权利要求1所述的文档讲解方法,其特征在于,所述根据所述文本信息划分所述文档的讲解点的步骤包括:
扫描所述文档,并提取文档中的讲解点,其中所述讲解点为所述文档的一级标题、二级标题、三级标题及文档内容;
以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构;及
以所述一级标题为所述树形结构的根节点,所述二级标题、所述文档内容为所述树形结构的子节点,以划分所述文档的讲解点。
5.如权利要求1所述的文档讲解方法,其特征在于,所述根据所述讲解点将所述文本信息进行语音合成并转化为语音信息的步骤包括:
构建预设词条语音库;
在所述文档中切分出与预设词库匹配的多组词;
对多组词中的每一组词进行评分并排序,选出评分排序为第一名的一组词作为所述文档的分词结果;及
在所述词条语音库中查找与所述分词结果对应的语音信息。
6.如权利要求1所述的文档讲解方法,其特征在于,所述搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音的步骤包括:
通过预设关键词库或者预设浏览器搜索所述关键词对应的关键词释义;
提取所述关键词释义对应的文本信息;及
将所述关键词释义对应的文本信息转化成语音并输出。
7.如权利要求1所述的文档讲解方法,其特征在于,所述文本信息为所述文档中的文字、文字字号及文字行数。
8.一种文档讲解装置,其特征在于,所述装置包括:
获取模块,用于获取用户上传的文档,并提取所述文档中的文本信息;
转化模块,用于根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;
检测模块,用于检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及
提取模块,用于中断讲解,并提取所述问题中的关键词;
输出模块,用于搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。
9.一种计算机装置,其特征在于,所述计算机装置包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的文档讲解方法。
10.一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的文档讲解方法。
CN201910075867.6A 2019-01-25 2019-01-25 文档讲解方法、装置、计算机装置及计算机可读存储介质 Pending CN109918502A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910075867.6A CN109918502A (zh) 2019-01-25 2019-01-25 文档讲解方法、装置、计算机装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910075867.6A CN109918502A (zh) 2019-01-25 2019-01-25 文档讲解方法、装置、计算机装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN109918502A true CN109918502A (zh) 2019-06-21

Family

ID=66960791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910075867.6A Pending CN109918502A (zh) 2019-01-25 2019-01-25 文档讲解方法、装置、计算机装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109918502A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289239A (zh) * 2020-12-28 2021-01-29 之江实验室 一种可动态调整的讲解方法、装置及电子设备
CN113591489A (zh) * 2021-07-30 2021-11-02 中国平安人寿保险股份有限公司 语音交互方法、装置及相关设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145289A (zh) * 2007-09-13 2008-03-19 上海交通大学 基于代理技术的远程教育环境中语音答疑系统
CN102280104A (zh) * 2010-06-11 2011-12-14 北大方正集团有限公司 一种基于智能标引的文件语音化处理方法和系统
CN102867512A (zh) * 2011-07-04 2013-01-09 余喆 自然语音识别方法和装置
CN103838866A (zh) * 2014-03-20 2014-06-04 广东小天才科技有限公司 一种文本转换方法及装置
CN105574530A (zh) * 2014-10-08 2016-05-11 富士通株式会社 提取文档中的文本行的方法和装置
CN107122824A (zh) * 2017-05-04 2017-09-01 中兴耀维科技江苏有限公司 一种企业展厅在线讲解的方法
CN107273285A (zh) * 2017-05-16 2017-10-20 北京金山安全软件有限公司 测试项目的生成方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145289A (zh) * 2007-09-13 2008-03-19 上海交通大学 基于代理技术的远程教育环境中语音答疑系统
CN102280104A (zh) * 2010-06-11 2011-12-14 北大方正集团有限公司 一种基于智能标引的文件语音化处理方法和系统
CN102867512A (zh) * 2011-07-04 2013-01-09 余喆 自然语音识别方法和装置
CN103838866A (zh) * 2014-03-20 2014-06-04 广东小天才科技有限公司 一种文本转换方法及装置
CN105574530A (zh) * 2014-10-08 2016-05-11 富士通株式会社 提取文档中的文本行的方法和装置
CN107122824A (zh) * 2017-05-04 2017-09-01 中兴耀维科技江苏有限公司 一种企业展厅在线讲解的方法
CN107273285A (zh) * 2017-05-16 2017-10-20 北京金山安全软件有限公司 测试项目的生成方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289239A (zh) * 2020-12-28 2021-01-29 之江实验室 一种可动态调整的讲解方法、装置及电子设备
CN113591489A (zh) * 2021-07-30 2021-11-02 中国平安人寿保险股份有限公司 语音交互方法、装置及相关设备
CN113591489B (zh) * 2021-07-30 2023-07-18 中国平安人寿保险股份有限公司 语音交互方法、装置及相关设备

Similar Documents

Publication Publication Date Title
WO2021073298A1 (zh) 一种语音信息的处理方法、装置、智能终端以及存储介质
CN111414479B (zh) 基于短文本聚类技术的标签抽取方法
US20190286996A1 (en) Human-machine interactive method and device based on artificial intelligence
WO2018000272A1 (zh) 一种语料生成装置和方法
JP6813591B2 (ja) モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、及びプログラム
CN111933127B (zh) 一种具备自学习能力的意图识别方法及意图识别系统
CN111090727B (zh) 语言转换处理方法、装置及方言语音交互系统
CN110491383A (zh) 一种语音交互方法、装置、系统、存储介质及处理器
CN110930980B (zh) 一种中英文混合语音的声学识别方法及系统
CN107491436A (zh) 一种标题党识别方法和装置、服务器、存储介质
CN109314660A (zh) 在自动聊天中提供新闻推荐
CN110619051B (zh) 问题语句分类方法、装置、电子设备及存储介质
CN109241330A (zh) 用于识别音频中的关键短语的方法、装置、设备和介质
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN106202056B (zh) 中文分词场景库更新方法和系统
CN111046225B (zh) 音频资源处理方法、装置、设备及存储介质
CN113505209A (zh) 一种面向汽车领域的智能问答系统
CN110795913A (zh) 一种文本编码方法、装置、存储介质及终端
CN108920649A (zh) 一种信息推荐方法、装置、设备和介质
CN110297893A (zh) 自然语言问答方法、装置、计算机装置及存储介质
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
WO2024066920A1 (zh) 虚拟场景的对话方法、装置、电子设备、计算机程序产品及计算机存储介质
JP2023076413A (ja) 言語モデルを利用してドメインに特化した対話を提供する方法、コンピュータ装置、およびコンピュータプログラム
CN114254158A (zh) 视频生成方法及其装置、神经网络的训练方法及其装置
CN109918502A (zh) 文档讲解方法、装置、计算机装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination