CN110222168A - 一种数据处理的方法及相关装置 - Google Patents

一种数据处理的方法及相关装置 Download PDF

Info

Publication number
CN110222168A
CN110222168A CN201910420391.5A CN201910420391A CN110222168A CN 110222168 A CN110222168 A CN 110222168A CN 201910420391 A CN201910420391 A CN 201910420391A CN 110222168 A CN110222168 A CN 110222168A
Authority
CN
China
Prior art keywords
text
data
text data
type
abstract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910420391.5A
Other languages
English (en)
Other versions
CN110222168B (zh
Inventor
郭鸿程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910420391.5A priority Critical patent/CN110222168B/zh
Priority to PCT/CN2019/102348 priority patent/WO2020232864A1/zh
Publication of CN110222168A publication Critical patent/CN110222168A/zh
Application granted granted Critical
Publication of CN110222168B publication Critical patent/CN110222168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及智能决策领域,提供一种数据处理的方法及相关装置。一种数据处理的方法包括:获取终端发送的书籍的图像数据;对图像数据进行字符识别处理以得到图像数据对应的文本数据;对文本数据进行文本类型检测以判断文本数据的文本类型是否满足预设文本类型;当文本类型满足预设文本类型时,将文本数据输入神经网络编码器以得到文本数据的摘要向量;将文本数据的摘要向量输入神经网络解码器以得到文本数据的摘要;提取文本数据的摘要中的N个关键词;将N个关键词进行组合以得到文本数据的问题;通过神经网络语义表示模型确定文本数据的问题对应的答案。本发明实施例的技术方案,提高了检验阅读效果的效率。

Description

一种数据处理的方法及相关装置
技术领域
本发明涉及智能决策领域,尤其涉及一种数据处理的方法及相关装置。
背景技术
目前,孩童或者学生阅读完书籍后,家长或者老师检验阅读效果的方法就是通过作业来确认,例如对于课本上的文章,孩童或者学生阅读完后往往需要做课后练习,家长或者老师通过课后练习来检验阅读效果。
但是,有时候孩童或者学生阅读的书籍后面没有对应的作业或者练习,如果要检验阅读效果,家长或者老师只有先看一遍书籍,了解书籍的内容,才能对孩童或者学生的阅读效果进行检验,这样,浪费了阅读书籍的时间,而且如果阅读的书籍很长,那么检验阅读效果的效率较低。
发明内容
本发明实施例提供一种数据处理的方法及相关装置,以提高检验阅读效果的效率。
本发明第一方面提供一种数据处理的方法,包括:
获取终端发送的书籍的图像数据;
对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
本发明第二方面提供了一种数据处理的装置,包括:
获取模块,用于获取终端发送的书籍的图像数据;
字符识别模块,用于对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
检测模块,用于对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
编码模块,用于当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
解码模块,用于将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
提取模块,用于对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
组合模块,用于对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
处理模块,用于通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
可以看到,通过本发明提出的数据处理的方法及相关装置,当孩童或者学生阅读的书籍后面没有对应的作业或者练习,如果要检验阅读效果,家长或者老师可以通过扫描工具对书籍进行扫描,得到书籍的扫描图像,或者还可以对书籍进行拍照,得到书籍的照片,然后通过终端将书籍的图像数据发给服务器,服务器对图像数据进行处理,得到图像数据对应的文本数据,再对文本数据进行处理,得到文本数据的摘要、文本数据的问题和文本数据的问题对应的答案,并返回给终端,以便于家长或者老师根据摘要了解书籍的内容,通过问题和问题对应的答案对孩童或者学生的阅读效果进行检验,避免了家长或者老师花费大量时间阅读书籍,提高了检验阅读效果的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据处理的方法的流程图;
图2为本发明实施例提供的另一种数据处理的方法的流程图;
图3为本发明实施例提供的另一种数据处理的方法的流程图;
图4为本发明实施例提供的一种系统结构示意图;
图5为本发明实施例提供的一种对图像数据进行字符识别处理的示意图;
图6为本发明实施例提供的一种数据处理的装置的示意图;
图7为本发明实施例涉及的硬件运行环境的电子设备结构示意图。
具体实施方式
本发明实施例提供的数据处理的方法及相关装置,以提高检验阅读效果的效率。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
以下分别进行详细说明。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明的实施例中,人工智能服务器获取终端发送的图像数据,然后对图像数据进行处理以得到图像数据对应的文本数据,再对文本数据进行处理以得到文本数据的摘要、文本数据的问题和文本数据的问题对应的答案,并返回给终端。
首先参见图1,图1为本发明的一个实施例提供的一种数据处理的方法的流程图。其中,如图1所示,本发明的一个实施例提供的一种数据处理的方法可以包括:
101、获取终端发送的书籍的图像数据。
其中,终端可以是手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备、或其他类型的终端。
如果孩童或者学生阅读的书籍是纸质书籍,那么先对纸质书籍进行扫描以得到纸质书籍的扫描图像,然后终端将扫描图像发给人工智能服务器。
102、对该图像数据进行字符识别处理以得到该图像数据对应的文本数据。
可选的,当该图像数据为扫描图像时,由于扫描图像是由扫描工具扫描生成的,所以可能出现部分未扫描到或者扫描不清晰的问题,也可能出现扫描歪斜的问题,所以在对图像数据进行字符识别处理之前,需要对图像数据进行标准化处理,其中,对图像数据进行标准化处理的方法可以是:
当该图像数据的倾斜度超过预设倾斜度阈值时,通过图像校正算法对该图像数据进行处理,其中,图像校正算法包括拉东算法、霍夫变换和线性回归算法的任意一种。
或者,当该图像数据的清晰度低于预设清晰度阈值时,通过图像增强算法对该图像数据进行处理,其中,图像增强算法包括直方图均衡、图像平滑、图像锐化的任意一种。
或者,当该图像数据的倾斜度超过预设倾斜度阈值以及该图像数据的清晰度低于预设清晰度阈值时,通过图像校正算法以及图像增强算法对该图像数据进行处理。
当该图像数据为扫描图像时,由于扫描图像不能直接被识别,所以需要人工智能服务器对该图像数据进行字符识别处理以得到该图像数据对应的文本数据,文本数据可以直接被识别。
其中,人工智能服务器对该图像数据进行字符识别处理以得到该图像数据对应的文本数据的方法可以是:
对该图像数据进行字符切割以得到M个字符,其中,M为正整数。
对M个字符进行特征提取以得到M个字符特征,其中,M个字符与M个字符特征一一对应。
将M个字符特征与字符特征数据库进行对比以识别M个字符特征对应的M个文本字符,其中,M个字符特征与M个文本字符一一对应,其中,比对方法包括欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP)、类神经网络的数据库建立及比对法、HMM(Hidden Markov Model)等方法。
将M个文本字符进行组合以得到该图像数据对应的文本数据。
103、对该文本数据进行文本类型检测以判断该文本数据的文本类型是否满足预设文本类型。
可选的,文本类型包括语言类型和文体类型,语言类型包括中文、英文、日文等等,文体类型包括现代文体(包括小说、散文、童话、记叙文、说明文、议论文等等)和古代文体(包括诗、词、歌、赋等等)。
人工智能服务器对该文本数据进行文本类型检测以判断该文本数据的文本类型是否满足预设文本类型的方法可以是:
对该文本数据进行语言类型检测以得到该文本数据的语言类型,对该文本数据进行文体类型检测以得到该文本数据的文体类型。
当该文本数据的语言类型满足预设语言类型以及该文本数据的文体类型满足预设文体类型时,确定该文本数据的文本类型满足该预设文本类型,其中,该预设语言类型包括中文,该预设文体类型包括现代文体。
当该文本数据的语言类型不满足该预设语言类型、或者该文本数据的文体类型不满足该预设文体类型、或者该文本数据的语言类型不满足该预设语言类型以及该文本数据的文体类型不满足该预设文体类型时,确定该文本数据的文本类型不满足该预设文本类型。
进一步可选的,人工智能服务器确定该文本数据的文本类型不满足该预设文本类型之后,包括:
当该文本数据的语言类型不满足预设语言类型时,人工智能服务器向终端发送语言类型错误消息,其中,语言类型错误消息用于指示终端生成提示该书籍的语言类型错误的弹窗或者界面,例如,人工智能服务器识别出终端发送的文本数据的语言类型为英文,那么人工智能服务器向终端发送语言类型错误消息,终端接收语言类型错误消息时,生成提示书籍的语言类型不能为英文的弹窗或者界面。
当该文本数据的文体类型不满足预设文体类型时,向终端发送文体类型错误消息,其中,文体类型错误消息用于指示终端生成提示该书籍的文体类型错误的弹窗或者界面,例如,人工智能服务器识别出终端发送的文本数据的文体类型为古代文体,那么人工智能服务器向终端发送文体类型错误消息,终端接收文体类型错误消息时,生成提示书籍的文体类型不能为古代文体的弹窗或者界面。
当该文本数据的语言类型不满足预设语言类型以及该文本数据的文体类型不满足预设文体类型时,向终端发送语言及文体类型错误消息,其中,语言及文体类型错误消息用于指示终端生成提示该书籍的语言及文体类型错误的弹窗或者界面,例如,人工智能服务器识别出终端发送的文本数据的语言类型为日文,图像数据的文体类型为古代文体,那么人工智能服务器向终端发送语言及文体类型错误消息,终端接收语言及文体类型错误消息时,生成提示书籍的语言类型不能为日文以及书籍的文体类型不能为古代文体的弹窗或者界面。
104、当文本类型满足该预设文本类型时,将该文本数据输入神经网络编码器以得到该文本数据的摘要向量。
其中,该神经网络编码器用于对该文本数据进行压缩编码,由递归神经网络(RNN)实现,神经网络编码器接收输入的文本数据,在开始时刻将原文本数据中的字输入到神经网络,将这个字压缩成一个向量,然后将压缩得到的向量传入下一时刻,下一时刻将上一时刻的压缩向量和原文本数据中的字输入到神经网络,再将压缩得到的新向量传入下一时刻,在压缩完所有的文本数据后得到的编码向量,即是文本数据的摘要向量。
105、将该文本数据的摘要向量输入神经网络解码器以得到该文本数据的摘要。
其中,该神经网络解码器用于对该文本数据的摘要向量进行解码,也由递归神经网络(RNN)实现,将该文本数据的摘要向量输入神经网络解码器后,神经网络解码器对该文本数据的摘要向量进行预测得到一个时刻的输出字,然后神经网络解码器再根据该时刻的输出字和摘要向量进行预测得到下一个时刻的输出字,以此类推,上一个时刻的输出字会影响下一个输出字,最后神经网络解码器得到的所有的输出字连接起来即为该文本数据的摘要。
106、对该文本数据的摘要进行分词处理,按照词频由大到小的顺序提取该文本数据的摘要中的N个关键词,其中,N为正整数。
可选的,对该文本数据的摘要进行分词处理,按照词频由大到小的顺序提取该文本数据的摘要中的N个关键词的方法可以是:
对该文本数据的摘要进行分词处理以得到该文本数据的摘要对应的K个分词,其中,K为大于N的正整数。
计算该K个分词对应的K个词频,其中,该K个分词与该K个词频一一对应。
按照词频由大到小的顺序确定该K个分词中的N个分词,提取该N个分词。
其中,对该文本数据的摘要进行分词处理的方法有基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
基于字符串匹配的分词方法是按照一定的策略将待分词的汉字串与一个词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功,即识别出一个词。基于理解的分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。基于统计的分词方法要使用基本的分词词典进行串匹配分词,同时使用统计方法识别一些新的词,即将串频统计和串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。
107、对该N个关键词进行词性分类,根据所述N个关键词的词性将该N个关键词按照预设问句语序进行组合以得到该文本数据的问题。
108、通过神经网络语义表示模型计算该文本数据的问题和该文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为该文本数据的问题对应的答案。
其中,通过神经网络语义表示模型计算该文本数据的问题和该文本数据中的文本的语义相关程度包括:
将该文本数据的问题和该文本数据中的文本输入到神经网络语义表示模型中,使用神经网络对该文本数据的问题和该文本数据中的文本进行编码,通过对语义的挖掘获得其向量表示,最终通过计算该文本数据的问题和该文本数据中的文本的语义向量的相似度得到其语义相关程度。其中,计算该文本数据的问题与该文本数据中的文本的语义相关程度的方法可以是词汇重叠法、字符串法、余弦相似度法或者最大共同子序列法。
具体过程为,在该文本数据中查找与该N个关键词匹配的Q段文本,其中,Q为正整数。
计算该文本数据的问题与该Q段文本的Q个语义相关程度,其中,该Q段文本与该Q个语义相关程度一一对应。
获取该Q个语义相关程度中最高的第一语义相关程度,确定该第一语义相关程度对应的文本为该文本数据的问题对应的答案。
参见图2,图2为本发明的另一个实施例提供的另一种数据处理的方法的流程图。其中,如图2所示,本发明的另一个实施例提供的另一种数据处理的方法可以包括:
201、终端将书籍的图像数据发给人工智能服务器。
其中,终端可以是手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备、或其他类型的终端。
如果孩童或者学生阅读的书籍是纸质书籍,那么先对纸质书籍进行扫描以得到纸质书籍的扫描图像,然后终端将扫描图像发给人工智能服务器。
202、人工智能服务器对该图像数据进行字符识别处理以得到该图像数据对应的文本数据。
可选的,当该图像数据为扫描图像时,由于扫描图像是由扫描工具扫描生成的,所以可能出现部分未扫描到或者扫描不清晰的问题,也可能出现扫描歪斜的问题,所以在对图像数据进行字符识别处理之前,需要对图像数据进行标准化处理,其中,对图像数据进行标准化处理的方法可以是:
当该图像数据的倾斜度超过预设倾斜度阈值时,通过图像校正算法对该图像数据进行处理,其中,图像校正算法包括拉东算法、霍夫变换和线性回归算法的任意一种。
或者,当该图像数据的清晰度低于预设清晰度阈值时,通过图像增强算法对该图像数据进行处理,其中,图像增强算法包括直方图均衡、图像平滑、图像锐化的任意一种。
或者,当该图像数据的倾斜度超过预设倾斜度阈值以及该图像数据的清晰度低于预设清晰度阈值时,通过图像校正算法以及图像增强算法对该图像数据进行处理。
当该图像数据为扫描图像时,由于扫描图像不能直接被识别,所以需要人工智能服务器对该图像数据进行字符识别处理以得到该图像数据对应的文本数据,文本数据可以直接被识别。
其中,人工智能服务器对该图像数据进行字符识别处理以得到该图像数据对应的文本数据的方法可以是:
对该图像数据进行字符切割以得到M个字符,其中,M为正整数。
对M个字符进行特征提取以得到M个字符特征,其中,M个字符与M个字符特征一一对应。
将M个字符特征与字符特征数据库进行对比以识别M个字符特征对应的M个文本字符,其中,M个字符特征与M个文本字符一一对应,其中,比对方法包括欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP)、类神经网络的数据库建立及比对法、HMM(Hidden Markov Model)等方法。
将M个文本字符进行组合以得到该图像数据对应的文本数据。
203、人工智能服务器识别该文本数据的语言类型是否满足预设语言类型。
其中,语言类型包括中文、英文、日文等等,预设语言类型包括中文。
204、当该文本数据的语言类型不满足该预设语言类型时,人工智能服务器识别该文本数据的文体类型是否满足预设文体类型。
其中,文体类型包括现代文体(包括小说、散文、童话、记叙文、说明文、议论文等等)和古代文体(包括诗、词、歌、赋等等),预设文体类型包括现代文体。
205、当该文本数据的文体类型不满足该预设文体类型时,人工智能服务器向终端发送语言及文体类型错误消息。
206、终端生成提示该书籍的语言及文体类型错误的弹窗或者界面。
例如,人工智能服务器识别出文本数据的语言类型为日文,文体类型为古代文体,那么人工智能服务器向终端发送语言及文体类型错误消息,终端接收语言及文体类型错误消息时,生成提示书籍的语言类型不能为日文以及文体类型不能为古代文体的弹窗或者界面。
参见图3,图3为本发明的另一个实施例提供的另一种数据处理的方法的流程图。其中,如图3所示,本发明的另一个实施例提供的另一种数据处理的方法可以包括:
301、终端将书籍的图像数据发给人工智能服务器。
其中,终端可以是手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备、或其他类型的终端。
孩童或者学生阅读的书籍是纸质书籍,先通过终端对纸质书籍进行扫描以得到纸质书籍的扫描图像,然后终端将扫描图像发给人工智能服务器。
302、当该图像数据的倾斜度超过预设倾斜度阈值时,人工智能服务器通过图像校正算法对该图像数据进行处理。
当该图像数据为扫描图像时,由于扫描图像是由扫描工具扫描生成的,所以可能出现部分未扫描到或者扫描不清晰的问题,也可能出现扫描歪斜的问题,所以需要通过图像校正算法对该图像数据进行处理,其中,图像校正算法包括拉东算法、霍夫变换和线性回归算法的任意一种。
303、当该图像数据的清晰度低于预设清晰度阈值时,人工智能服务器通过图像增强算法对该图像数据进行处理。
其中,图像增强算法包括直方图均衡、图像平滑、图像锐化的任意一种。
304、人工智能服务器对该图像数据进行字符切割以得到M个字符,其中,M为正整数。
305、人工智能服务器对M个字符进行特征提取以得到M个字符特征。
其中,M个字符与M个字符特征一一对应,特征提取可分为两类:一类为统计的特征,获取该图像数据的字符区域内的黑点数比或白点数比,当字符区域分成好几个区域时,这一个个区域黑点数比或白点数比联合成空间的一个数值向量,而另一类为结构的特征,对该图像数据的字符进行细线化处理后,获取字符的笔划端点和交叉点的数量及位置。
306、人工智能服务器将M个字符特征与字符特征数据库进行对比以识别M个字符特征对应的M个文本字符。
其中,M个字符特征与M个文本字符一一对应,其中,比对方法包括欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP)、类神经网络的数据库建立及比对法、HMM(Hidden Markov Model)等方法。
307、人工智能服务器将M个文本字符进行组合以得到该图像数据对应的文本数据。
308、人工智能服务器对该文本数据进行文本类型检测以判断该文本数据的文本类型是否满足预设文本类型。
可选的,文本类型包括语言类型和文体类型,语言类型包括中文、英文、日文等等,文体类型包括现代文体(包括小说、散文、童话、记叙文、说明文、议论文等等)和古代文体(包括诗、词、歌、赋等等)。
人工智能服务器对该文本数据进行文本类型检测以判断该文本数据的文本类型是否满足预设文本类型的方法可以是:
对该文本数据进行语言类型检测以得到该文本数据的语言类型,对该文本数据进行文体类型检测以得到该文本数据的文体类型。
当该文本数据的语言类型满足预设语言类型以及该文本数据的文体类型满足预设文体类型时,确定该文本数据的文本类型满足该预设文本类型,其中,该预设语言类型包括中文,该预设文体类型包括现代文体。
当该文本数据的语言类型不满足该预设语言类型、或者该文本数据的文体类型不满足该预设文体类型、或者该文本数据的语言类型不满足该预设语言类型以及该文本数据的文体类型不满足该预设文体类型时,确定该文本数据的文本类型不满足该预设文本类型。
309、当文本类型满足该预设文本类型时,将该文本数据输入神经网络编码器以得到该文本数据的摘要向量。
其中,该神经网络编码器用于对该文本数据进行压缩编码,由递归神经网络(RNN)实现,神经网络编码器接收输入的文本数据,在开始时刻将原文本数据中的字输入到神经网络,将这个字压缩成一个向量,然后将压缩得到的向量传入下一时刻,下一时刻将上一时刻的压缩向量和原文本数据中的字输入到神经网络,再将压缩得到的新向量传入下一时刻,在压缩完所有的文本数据后得到的编码向量,即是文本数据的摘要向量。
310、将该文本数据的摘要向量输入神经网络解码器以得到该文本数据的摘要。
其中,该神经网络解码器用于对该文本数据的摘要向量进行解码,也由递归神经网络(RNN)实现,将该文本数据的摘要向量输入神经网络解码器后,神经网络解码器对该文本数据的摘要向量进行预测得到一个时刻的输出字,然后神经网络解码器再根据该时刻的输出字和摘要向量进行预测得到下一个时刻的输出字,以此类推,上一个时刻的输出字会影响下一个输出字,最后神经网络解码器得到的所有的输出字连接起来即为该文本数据的摘要。
311、提取该文本数据的摘要中的N个关键词,其中,N为正整数。
可选的,提取该文本数据的摘要中的N个关键词的方法可以是:
对该文本数据的摘要进行分词处理以得到该文本数据的摘要对应的K个分词,其中,K为大于N的正整数。
计算该K个分词对应的K个词频,其中,该K个分词与该K个词频一一对应。
按照词频由大到小的顺序确定该K个分词中的N个分词,提取该N个分词。
其中,对该文本数据的摘要进行分词处理的方法有基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
基于字符串匹配的分词方法是按照一定的策略将待分词的汉字串与一个词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功,即识别出一个词。基于理解的分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。基于统计的分词方法要使用基本的分词词典进行串匹配分词,同时使用统计方法识别一些新的词,即将串频统计和串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。
312、将该N个关键词进行组合以得到该文本数据的问题。
313、通过神经网络语义表示模型对该文本数据的问题和该文本数据进行处理,以得到该文本数据的问题对应的答案。
其中,通过神经网络语义表示模型计算该文本数据的问题和该文本数据中的文本的语义相关程度包括:
将该文本数据的问题和该文本数据中的文本输入到神经网络语义表示模型中,使用神经网络对该文本数据的问题和该文本数据中的文本进行编码,通过对语义的挖掘获得其向量表示,最终通过计算该文本数据的问题和该文本数据中的文本的语义向量的相似度得到其语义相关程度。其中,计算该文本数据的问题与该文本数据中的文本的语义相关程度的方法可以是词汇重叠法、字符串法、余弦相似度法或者最大共同子序列法。
具体过程为,在该文本数据中查找与该N个关键词匹配的Q段文本,其中,Q为正整数。
计算该文本数据的问题与该Q段文本的Q个语义相关程度,其中,该Q段文本与该Q个语义相关程度一一对应。
获取该Q个语义相关程度中最高的第一语义相关程度,确定该第一语义相关程度对应的文本为该文本数据的问题对应的答案。
参见图6,图6为本发明的另一个实施例提供的一种数据处理的装置的示意图。其中,如图6所示,本发明的另一个实施例提供的一种数据处理的装置可以包括:
获取模块601,用于获取终端发送的书籍的图像数据;
字符识别模块602,用于对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
检测模块603,用于对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
编码模块604,用于当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
解码模块605,用于将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
提取模块606,用于对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
组合模块607,用于对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
处理模块608,用于通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
本发明数据处理的装置的具体实施可参见上述数据处理的方法的各实施例,在此不做赘述。
参见图7,图7为本发明的实施例涉及的硬件运行环境的电子设备结构示意图。其中,如图7所示,本发明的实施例涉及的硬件运行环境的电子设备可以包括:
处理器701,例如CPU。
存储器702,可选的,存储器可以为高速RAM存储器,也可以是稳定的存储器,例如磁盘存储器。
通信接口703,用于实现处理器701和存储器702之间的连接通信。
本领域技术人员可以理解,图7中示出的数据处理的电子设备的结构并不构成对数据处理的电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图7所示,存储器702中可以包括操作系统、网络通信模块以及数据处理的程序。操作系统是管理和控制数据处理的电子设备硬件和软件资源的程序,支持数据处理的程序以及其他软件或程序的运行。网络通信模块用于实现存储器702内部各组件之间的通信,以及与数据处理的电子设备中其他硬件和软件之间通信。
在图7所示的数据处理的电子设备中,处理器701用于执行存储器702中存储的数据处理的程序,实现以下步骤:
获取终端发送的书籍的图像数据;
对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
本发明数据处理的电子设备的具体实施可参见上述数据处理的方法的各实施例,在此不做赘述。
本发明的另一个实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行以实现以下步骤:
获取终端发送的书籍的图像数据;
对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
本发明计算机可读存储介质的具体实施可参见上述数据处理的方法的各实施例,在此不做赘述。
还需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种数据处理的方法,其特征在于,包括:
获取终端发送的书籍的图像数据;
对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
2.根据权利要求1所述的方法,其特征在于,所述对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据之前,包括:
当所述图像数据的倾斜度超过预设倾斜度阈值时,通过图像校正算法对所述图像数据进行处理,其中,所述图像校正算法包括拉东算法、霍夫变换和线性回归算法的任意一种;
或者,当所述图像数据的清晰度低于预设清晰度阈值时,通过图像增强算法对所述图像数据进行处理,其中,所述图像增强算法包括直方图均衡、图像平滑、图像锐化的任意一种;
或者,当所述图像数据的倾斜度超过所述预设倾斜度阈值以及所述图像数据的清晰度低于所述预设清晰度阈值时,通过所述图像校正算法以及所述图像增强算法对所述图像数据进行处理。
3.根据权利要求2所述的方法,其特征在于,所述对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据包括:
对所述图像数据进行字符切割以得到M个字符,其中,M为正整数;
对所述M个字符进行特征提取以得到M个字符特征,其中,所述M个字符与所述M个字符特征一一对应;
将所述M个字符特征与字符特征数据库进行对比以识别所述M个字符特征对应的M个文本字符,其中,所述M个字符特征与所述M个文本字符一一对应;
将所述M个文本字符进行组合以得到所述图像数据对应的文本数据。
4.根据权利要求1所述的方法,其特征在于,所述文本类型包括语言类型和文体类型,所述对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型包括:
对所述文本数据进行语言类型检测以得到所述文本数据的语言类型;
对所述文本数据进行文体类型检测以得到所述文本数据的文体类型;
当所述语言类型满足预设语言类型以及所述文体类型满足预设文体类型时,确定所述文本类型满足所述预设文本类型;
当所述语言类型不满足所述预设语言类型、或者所述文体类型不满足所述预设文体类型、或者所述语言类型不满足所述预设语言类型以及所述文体类型不满足所述预设文体类型时,确定所述文本类型不满足所述预设文本类型。
5.根据权利要求4所述的方法,其特征在于,所述确定所述文本类型不满足所述预设文本类型之后,包括:
当所述语言类型不满足所述预设语言类型时,向所述终端发送语言类型错误消息,其中,所述语言类型错误消息用于指示所述终端生成提示所述书籍的语言类型错误的弹窗或者界面;
当所述文体类型不满足所述预设文体类型时,向所述终端发送文体类型错误消息,其中,所述文体类型错误消息用于指示所述终端生成提示所述书籍的文体类型错误的弹窗或者界面;
当所述语言类型不满足所述预设语言类型以及所述文体类型不满足所述预设文体类型时,向所述终端发送语言及文体类型错误消息,其中,所述语言及文体类型错误消息用于指示所述终端生成提示所述书籍的语言及文体类型错误的弹窗或者界面。
6.根据权利要求1所述的方法,其特征在于,所述对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,包括:
对所述文本数据的摘要进行分词处理以得到所述文本数据的摘要对应的K个分词,其中,K为大于N的正整数;
计算所述K个分词对应的K个词频,其中,所述K个分词与所述K个词频一一对应;
按照词频由大到小的顺序确定所述K个分词中的N个分词;
提取所述N个分词。
7.根据权利要求6所述的方法,其特征在于,所述通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案,包括:
在所述文本数据中查找与所述N个关键词匹配的Q段文本,其中,Q为正整数;
计算所述文本数据的问题与所述Q段文本的Q个语义相关程度,其中,所述Q段文本与所述Q个语义相关程度一一对应;
获取所述Q个语义相关程度中最高的第一语义相关程度;
确定所述第一语义相关程度对应的文本为所述文本数据的问题对应的答案。
8.一种数据处理的装置,其特征在于,所述装置包括:
获取模块,用于获取终端发送的书籍的图像数据;
字符识别模块,用于对所述图像数据进行字符识别处理以得到所述图像数据对应的文本数据;
检测模块,用于对所述文本数据进行文本类型检测以判断所述文本数据的文本类型是否满足预设文本类型;
编码模块,用于当所述文本类型满足所述预设文本类型时,将所述文本数据输入神经网络编码器以得到所述文本数据的摘要向量,其中,所述神经网络编码器用于对所述文本数据进行压缩编码;
解码模块,用于将所述文本数据的摘要向量输入神经网络解码器以得到所述文本数据的摘要,其中,所述神经网络解码器用于通过神经网络对所述文本数据的摘要向量进行预测以得到多个预测的字,所述多个预测的字连接为所述文本数据的摘要;
提取模块,用于对所述文本数据的摘要进行分词处理,按照词频由大到小的顺序提取所述文本数据的摘要中的N个关键词,其中,N为正整数;
组合模块,用于对所述N个关键词进行词性分类,根据所述N个关键词的词性将所述N个关键词按照预设问句语序进行组合以得到所述文本数据的问题;
处理模块,用于通过神经网络语义表示模型计算所述文本数据的问题和所述文本数据中的文本的语义相关程度,确定语义相关程度最高的文本为所述文本数据的问题对应的答案。
9.一种数据处理的电子设备,其特征在于,所述电子设备包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1至7任一项方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1至7任意一项所述的方法。
CN201910420391.5A 2019-05-20 2019-05-20 一种数据处理的方法及相关装置 Active CN110222168B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910420391.5A CN110222168B (zh) 2019-05-20 2019-05-20 一种数据处理的方法及相关装置
PCT/CN2019/102348 WO2020232864A1 (zh) 2019-05-20 2019-08-23 一种数据处理的方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910420391.5A CN110222168B (zh) 2019-05-20 2019-05-20 一种数据处理的方法及相关装置

Publications (2)

Publication Number Publication Date
CN110222168A true CN110222168A (zh) 2019-09-10
CN110222168B CN110222168B (zh) 2023-08-18

Family

ID=67821511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910420391.5A Active CN110222168B (zh) 2019-05-20 2019-05-20 一种数据处理的方法及相关装置

Country Status (2)

Country Link
CN (1) CN110222168B (zh)
WO (1) WO2020232864A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110730389A (zh) * 2019-12-19 2020-01-24 恒信东方文化股份有限公司 一种视频节目自动生成互动问答的方法及装置
CN111242741A (zh) * 2020-01-15 2020-06-05 新石器慧通(北京)科技有限公司 一种基于场景的商品文案生成方法、系统及无人零售车
CN112863010A (zh) * 2020-12-29 2021-05-28 宁波友好智能安防科技有限公司 一种防盗锁的视频图像处理系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663537B (zh) * 2023-07-26 2023-11-03 中信联合云科技有限责任公司 基于大数据分析的选题策划信息处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040255249A1 (en) * 2001-12-06 2004-12-16 Shih-Fu Chang System and method for extracting text captions from video and generating video summaries
CN106409290A (zh) * 2016-09-29 2017-02-15 深圳市唯特视科技有限公司 一种基于图像分析的幼儿智能语音教育的方法
CN108319668A (zh) * 2018-01-23 2018-07-24 义语智能科技(上海)有限公司 生成文本摘要的方法及设备
CN108537283A (zh) * 2018-04-13 2018-09-14 厦门美图之家科技有限公司 一种图像分类方法及卷积神经网络生成方法
CN109325180A (zh) * 2018-09-21 2019-02-12 北京字节跳动网络技术有限公司 文章摘要推送方法、装置、终端设备、服务器及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108287858B (zh) * 2017-03-02 2021-08-10 腾讯科技(深圳)有限公司 自然语言的语义提取方法及装置
CN107680580B (zh) * 2017-09-28 2020-08-18 百度在线网络技术(北京)有限公司 文本转换模型训练方法和装置、文本转换方法和装置
CN108334492B (zh) * 2017-12-05 2021-11-02 腾讯科技(深圳)有限公司 文本分词、即时消息处理方法和装置
CN109522553B (zh) * 2018-11-09 2020-02-11 龙马智芯(珠海横琴)科技有限公司 命名实体的识别方法及装置
CN109726281A (zh) * 2018-12-12 2019-05-07 Tcl集团股份有限公司 一种文本摘要生成方法、智能终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040255249A1 (en) * 2001-12-06 2004-12-16 Shih-Fu Chang System and method for extracting text captions from video and generating video summaries
CN106409290A (zh) * 2016-09-29 2017-02-15 深圳市唯特视科技有限公司 一种基于图像分析的幼儿智能语音教育的方法
CN108319668A (zh) * 2018-01-23 2018-07-24 义语智能科技(上海)有限公司 生成文本摘要的方法及设备
CN108537283A (zh) * 2018-04-13 2018-09-14 厦门美图之家科技有限公司 一种图像分类方法及卷积神经网络生成方法
CN109325180A (zh) * 2018-09-21 2019-02-12 北京字节跳动网络技术有限公司 文章摘要推送方法、装置、终端设备、服务器及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110730389A (zh) * 2019-12-19 2020-01-24 恒信东方文化股份有限公司 一种视频节目自动生成互动问答的方法及装置
CN111242741A (zh) * 2020-01-15 2020-06-05 新石器慧通(北京)科技有限公司 一种基于场景的商品文案生成方法、系统及无人零售车
CN111242741B (zh) * 2020-01-15 2023-08-04 新石器慧通(北京)科技有限公司 一种基于场景的商品文案生成方法、系统及无人零售车
CN112863010A (zh) * 2020-12-29 2021-05-28 宁波友好智能安防科技有限公司 一种防盗锁的视频图像处理系统
CN112863010B (zh) * 2020-12-29 2022-08-05 宁波友好智能安防科技有限公司 一种防盗锁的视频图像处理系统

Also Published As

Publication number Publication date
WO2020232864A1 (zh) 2020-11-26
CN110222168B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN110096570B (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN109117777B (zh) 生成信息的方法和装置
CN110222168A (zh) 一种数据处理的方法及相关装置
CN110428820B (zh) 一种中英文混合语音识别方法及装置
CN112784696B (zh) 基于图像识别的唇语识别方法、装置、设备及存储介质
CN111931517A (zh) 文本翻译方法、装置、电子设备以及存储介质
CN111538809B (zh) 一种语音服务质量检测方法、模型训练方法及装置
CN114245203B (zh) 基于剧本的视频剪辑方法、装置、设备及介质
CN110058838B (zh) 语音控制方法、装置、计算机可读存储介质和计算机设备
CN111985243B (zh) 情感模型的训练方法、情感分析方法、装置及存储介质
CN114298121A (zh) 基于多模态的文本生成方法、模型训练方法和装置
CN111694937A (zh) 基于人工智能的面试方法、装置、计算机设备及存储介质
CN116543404A (zh) 基于单元格坐标优化的表格语义信息抽取方法、系统、设备及介质
CN113705315B (zh) 视频处理方法、装置、设备及存储介质
KR20200087977A (ko) 멀티모달 문서 요약 시스템 및 방법
Zhang et al. Image captioning via semantic element embedding
CN113392265A (zh) 多媒体处理方法、装置及设备
CN115408488A (zh) 用于小说场景文本的分割方法及系统
Peng et al. Image to LaTeX with graph neural network for mathematical formula recognition
CN114881043A (zh) 基于深度学习模型的法律文书语义相似度评估方法及系统
CN113761377B (zh) 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质
CN111680529A (zh) 一种基于层聚合的机器翻译算法及装置
Wang et al. Wavenet with cross-attention for audiovisual speech recognition
CN113449081A (zh) 文本特征的提取方法、装置、计算机设备及存储介质
CN113836929A (zh) 命名实体识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant