CN113407663A - 基于人工智能的图文内容质量识别方法和装置 - Google Patents

基于人工智能的图文内容质量识别方法和装置 Download PDF

Info

Publication number
CN113407663A
CN113407663A CN202011222592.3A CN202011222592A CN113407663A CN 113407663 A CN113407663 A CN 113407663A CN 202011222592 A CN202011222592 A CN 202011222592A CN 113407663 A CN113407663 A CN 113407663A
Authority
CN
China
Prior art keywords
article
image
vector
text
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011222592.3A
Other languages
English (en)
Other versions
CN113407663B (zh
Inventor
朱灵子
衡阵
马连洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011222592.3A priority Critical patent/CN113407663B/zh
Publication of CN113407663A publication Critical patent/CN113407663A/zh
Application granted granted Critical
Publication of CN113407663B publication Critical patent/CN113407663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请涉及一种基于人工智能的图文内容质量识别方法和装置。所述方法包括:获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征。对各文章先验特征进行特征交叉处理,得到交叉先验特征向量。根据文本内容生成待识别文章的文档特征向量。对各图文序列特征进行加权处理,得到加权处理后的图文序列特征向量,进而将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量,基于综合特征向量确定待识别文章的图文内容质量。采用本方法结合了待识别文章的多个维度,对图文内容质量进行判定和识别,避免单一维度判断方式得到的片面结果,提升图文内容质量判定结果的准确度。

Description

基于人工智能的图文内容质量识别方法和装置
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于人工智能的图文内容质量识别方法和装置。
背景技术
随着人工智能技术的不断发展,以及互联网技术的广泛应用,通过互联网获取和传播图文信息的方式日渐普及。而由于信息量巨大,往往很难识别到优质且合适的内容,并推送至不同用户,进而需要提升用户获取优质信息以及企业进行优质业务信息推广的便捷性。
传统上,多采用有监督或无监督的图文优质内容识别技术,其中,有监督的图文识别技术主要从文本角度进行内容质量的判定,而无监督的图文识别技术主要从文章词法多样性和句法多样性等统计学角度进行内容质量判定。
但由于有监督的图文识别技术,比如使用fastText、textcnn、bert等从文本角度进行内容质量判定的方法,涉及的维度较为单一,不够全面。同时,无监督的图文识别技术从文章词法多样性或句法多样性等统计学角度进行内容质量判定时,未引入不同语义信息对应的不同特殊语言场景,容易产生判定错误。因此,传统的图文识别技术,进行内容质量判定得到判定结果的准确度仍然较为低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升图文内容质量判定结果的准确度的基于人工智能的图文内容质量识别方法和装置。
一种基于人工智能的图文内容质量识别方法,所述方法包括:
获取待识别文章,并提取所述待识别文章的文章先验特征、文本内容和图文序列特征;
对各所述文章先验特征进行特征交叉处理,得到交叉先验特征向量;
根据所述文本内容生成所述待识别文章的文档特征向量;
对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量;
将所述交叉先验特征向量、所述文档特征向量和加权处理后的所述图文序列特征向量进行全连接处理,得到所述待识别文章的综合特征向量;
基于所述综合特征向量确定所述待识别文章的图文内容质量。
一种基于人工智能的图文内容质量识别装置,所述装置包括:
待识别文章获取模块,用于获取待识别文章,并提取所述待识别文章的文章先验特征、文本内容和图文序列特征;
交叉先验特征向量生成模块,用于对各所述文章先验特征进行特征交叉处理,得到交叉先验特征向量;
文档特征向量生成模块,用于根据所述文本内容生成所述待识别文章的文档特征向量;
图文序列特征向量生成模块,用于对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量;
综合特征向量生成模块,用于将所述交叉先验特征向量、所述文档特征向量和加权处理后的所述图文序列特征向量进行全连接处理,得到所述待识别文章的综合特征向量;
图文内容质量确定模块,用于基于所述综合特征向量确定所述待识别文章的图文内容质量。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待识别文章,并提取所述待识别文章的文章先验特征、文本内容和图文序列特征;
对各所述文章先验特征进行特征交叉处理,得到交叉先验特征向量;
根据所述文本内容生成所述待识别文章的文档特征向量;
对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量;
将所述交叉先验特征向量、所述文档特征向量和加权处理后的所述图文序列特征向量进行全连接处理,得到所述待识别文章的综合特征向量;
基于所述综合特征向量确定所述待识别文章的图文内容质量。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待识别文章,并提取所述待识别文章的文章先验特征、文本内容和图文序列特征;
对各所述文章先验特征进行特征交叉处理,得到交叉先验特征向量;
根据所述文本内容生成所述待识别文章的文档特征向量;
对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量;
将所述交叉先验特征向量、所述文档特征向量和加权处理后的所述图文序列特征向量进行全连接处理,得到所述待识别文章的综合特征向量;
基于所述综合特征向量确定所述待识别文章的图文内容质量。
上述基于人工智能的图文内容质量识别方法和装置中,通过获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征。通过对各文章先验特征进行特征交叉处理,得到交叉先验特征向量,并根据文本内容生成待识别文章的文档特征向量。通过对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量,进而将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量,可基于综合特征向量确定待识别文章的图文内容质量。由于结合了待识别文章的文章先验特征、文本内容以及图文序列特征等多个维度,对待识别文章的图文内容质量进行判定和识别,避免出现由单一维度判断方式得到的片面结果,从而提升了对图文内容质量判定结果的准确度。
附图说明
图1为一个实施例中基于人工智能的图文内容质量识别方法的应用环境图;
图2为一个实施例中基于人工智能的图文内容质量识别方法的流程示意图;
图3为一个实施例中基于文章层次结构的语言表征模型的网络结构示意图;
图4为一个实施例中基于文章层次结构的语言表征模型与基于文章排版结构的集成模型的结构示意图;
图5为一个实施例中多层注意力模型的网络结构示意图;图6为另一个实施例中基于人工智能的图文内容质量识别方法的流程示意图;
图7为一个实施例中基于人工智能的图文内容质量识别装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于人工智能的图文内容质量识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104通过从终端102获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征,进而对各文章先验特征进行特征交叉处理,得到交叉先验特征向量,并根据文本内容生成待识别文章的文档特征向量。通过对各图文序列特征进行加权处理,得到加权处理后的图文序列特征向量,进而将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量,进而基于综合特征向量确定待识别文章的图文内容质量。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于人工智能的图文内容质量识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征。
具体地,当检测到与图文内容质量关联的质量识别指令时,响应质量识别指令,并获取与质量识别指令对应的待识别文章。
进一步地,从所获取的待识别文章中提取对应的文章先验特征、文本内容和图文序列特征。其中,文本内容为待识别文章的文字内容部分,图文序列特征为根据训练好的排版结构模型生成,包括文章的图/文/图/文序列特征。
其中,文章先验特征表示文章的客观先验特征,包括文章整体词法多样性、句法多样性、文章长度与高度、文章图片数量、文章图片清晰美观度、文章排版分、文章账号等级、文章标题优质程度以及文章标题与正文的匹配程度等不同特征。
步骤204,对各文章先验特征进行特征交叉处理,得到交叉先验特征向量。
具体地,根据各文章先验特征,包括文章整体词法多样性、句法多样性、文章长度与高度、文章图片数量、文章图片清晰美观度、文章排版分、文章账号等级、文章标题优质程度以及文章标题与正文的匹配程度等,分别构建稀疏特征嵌入层和稠密特征嵌入层,进而基于所构建的稀疏特征嵌入层和稠密特征嵌入层,对各文章先验特征进行特征交叉处理,生成交叉先验特征向量。
其中,神经网络模型中的稠密特征嵌入层即dense embedding,当需要对文章先验特征进行数值化表示时,其可接收的输入项为独热编码格式,即需要采用one-hot方式对文章先验特征进行特征向量提取,得到独热编码格式的特征向量。而稀疏特征嵌入层即sparse embedding,在对文章先验特征进行数值化表示时,无需转换成独热编码格式,而对稀疏特征嵌入层的文章先验特征对应的特征向量,进行降维运算时,可得到稠密特征嵌入层对应的特征向量。
步骤206,根据文本内容生成待识别文章的文档特征向量。
具体地,根据训练好的多层注意力模型,确定与文本内容对应的层次结构,进而基于层次结构和训练好的语言表征模型,生成与文本内容对应的文档特征向量。
进一步地,训练好的多层注意力模型为HAN(Hierarchical Attention Network)模型,由于文章的文本内容包含层次结构,例如由“词”组成“句子”,再由“句子”组成文档,进而可利用多层注意力模型,确定出文本内容对应的层次结构。
其中,训练好的语言表征模型为BERT(BidirectionalEncoder Representationsfrom Transformers)模型,即来自变换器的双向编码器表征量模型。语音表征模型即BERT模型由多层Transformer Encoder堆叠得到。其中,Transformer模型为self-attention神经网络层组成的Encoder-Decoder结构的神经网络模型,模型分为编码器Encoder和解码器Decoder两部分,编码器部分由6个相同编码器叠在一起,解码器部分由6个相同解码器叠在一起,编码器之间不共享参数。
在一个实施例中,基于文章层次结构的语言表征模型的网络结构示意图如图3所示,参照图3可知,在根据训练好的多层注意力模型确定文本内容对应的层次结构的基础上,利用训练好的语言表征模型(BERT模型),生成与所输入的词向量对应的句子向量,经由训练好的语言表征模型的Transformer Encoder(编码器层),生成与待识别文章对应的文档特征向量。
步骤208,对各图文序列特征进行加权处理,得到加权处理后的图文序列特征向量。
具体地,通过获取根据训练好的排版结构模型生成的图文序列特征,并根据训练好的双向记忆网络模型,生成与各图文序列特征对应的图文序列特征向量,并根据加权机制对各图文序列特征向量进行加权处理,生成加权处理后的图文序列特征向量。
其中,排版结构模型可根据预设阅读习惯或历史阅读习惯,基于待识别文章构建得到待识别文章的图文序列特征。而通过将图文序列特征输入训练好的双向记忆网络模型,即根据前向的LSTM与后向的LSTM结合生成的BiLstm,生成与各图文序列特征对应的图文序列特征向量。其中,LSTM表示长短期记忆网络模型,则BiLstm表示为双向长短期记忆网络模型。
进一步地,通过采用Attention加权机制,对与各图文序列特征对应的图文序列特征向量进行加权处理,得到加权处理后的图文序列特征向量。其中,由于LSTM模型所获得每个时间点的输出信息之间的“影响程度”都是一样的,而在关系分类中,为了能够突出部分输出结果对分类的重要性,需要引入加权机制,进行加权求和,以得到加权处理后的图文序列特征向量。
步骤210,将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量。
具体地,通过将交叉先验特征向量,文档特征向量,以及加权处理后的图文序列特征向量接入全连接层,进行全连接处理,可得到待识别文章的综合特征向量。
步骤212,基于综合特征向量确定待识别文章的图文内容质量。
具体地,根据训练好的质量评估集成模型,计算得到综合特征向量的质量数据,进而根据质量数据确定待识别文章的图文内容质量。
进一步地,如图4所示,提供了一种基于文章层次结构的语言表征模型与基于文章排版结构的集成模型,参照图4可知,通过将结合文章层次结构的语言表征模型,即文本子网络,根据各文章先验特征构建得到稀疏特征嵌入层和稠密特征嵌入层,所组成的客观先验特征子网络,以及基于文章排版结构的排版子网络,进行集成,可得到基于文章层次结构的语言表征模型与基于文章排版结构的集成模型,即可训练得到最终的质量评估模型。
其中,文本子网络包括待识别文章的词向量、句子向量以及文档特征向量,还包括文章层次结构的语言表征模型BERT模型、以及Transformer Encoder(编码器层),客观先验特征子网络包括根据各文章先验特征构建得到稀疏特征嵌入层(sparse embedding)和稠密特征嵌入层(dense embedding),以及FM交叉层,排版子网络包括(段落嵌入层)Textparagraph embedding和image embedding(图片嵌入层)、BiLstm双向长短期记忆网络模型以及Attention加权机制。
在一个实施例中,在根据质量数据确定待识别文章的图文内容质量之后,还包括:
根据图文内容质量确定对应的加权处理方式;
根据加权处理方式,对相应图文内容进行层次化加权处理。
具体地,在根据质量数据确定待识别文章的图文内容质量之后,即确定待识别文章的图文内容属于优质内容还是低质内容之后,获取与优质内容或低质内容对应的加权处理方式。
进一步地,根据与优质内容对应的推荐加权处理方式,以及与低质内容对应的推荐降权处理方式,对相应图文内容进行层次化加权处理。
其中,通过对识别出来的优质内容进行推荐加权,可将调性高、体验优的优质内容优先推荐给用户,提升推荐成功率和业务效果。
上述基于人工智能的图文内容质量识别方法和装置中,通过获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征。通过对各文章先验特征进行特征交叉处理,得到交叉先验特征向量,并根据文本内容生成待识别文章的文档特征向量。对各图文序列特征进行加权处理,得到加权处理后的图文序列特征向量,进而将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量,可基于综合特征向量确定待识别文章的图文内容质量。由于结合了待识别文章的文章先验特征、文本内容以及图文序列特征等多个维度,对待识别文章的图文内容质量进行判定和识别,避免出现由单一维度判断方式得到的片面结果,从而提升了对图文内容质量判定结果的准确度。
在一个实施例中,生成与文本内容对应的文档特征向量的步骤,即基于层次结构和训练好的语言表征模型,生成与文本内容对应的文档特征向量的步骤,具体包括:
基于层次结构和训练好的语言表征模型,生成与各词向量对应的第一隐向量;根据词向量和对应的第一隐向量,确定与各词向量对应的第一贡献重要度权重;根据第一贡献重要度权重对词向量进行加权处理,生成与待识别文章对应的句子向量;基于层次结构和训练好的语言表征模型,生成与句子向量对应的第二隐向量;根据句子向量和第二隐向量,确定与各句子向量对应的第二贡献重要度权重;根据第二贡献重要度权重对句子向量进行加权处理,生成与待识别文章对应的文档特征向量。
具体地,如图5所示,提供了一种多层注意力模型的网络结构示意图,参照图5可知,在多层注意力模型结构中,首先输入词向量序列,包括w21至w2T,而通过词级别的双向门限循环(Bi-GRU)结构,得到与每个词对应的第一隐向量h,包括h21至h2T,再通过uw向量与每个h向量的点积得到attention权重,即第一贡献度重要度权重,进而将然后把h序列做一个根据attention权重的加权和,得到句子summary向量,包括s1至sL,进而每个句子在通过同样的双向门限循环(Bi-GRU)结构,得到与句子向量对应的第二隐向量h,包括h1至hL,再确定与各句子向量对应的第二贡献重要度权重,经由attention机制进行加权处理,得到最终输出的文档特征向量v向量,然后根据v向量通过后级dense层再加分类器,得到最终的文本分类结果。该多层注意力模型的网络结构符合人的从词->句子->再到篇章的理解过程。
参照图5,其中,WordEncoder表示可用于对文档中的每一个句子分别进行处理,对于该句子中的每一个单词,通过一个嵌入层得到相应的嵌入表示,然后通过一个双向的GRU/LSTM来编码句子信息,其中,每一个时间步骤,输入句子中的一个词。通过把两个方向上的隐藏状态进行拼接,可以构成句子的表示,同时可以捕获上下文信息。
Word Attention表示可通过Attention机制,得到双向GRU/LSTM每一个时间步骤上隐藏状态对应的权重,然后对隐藏状态加权求和,得到句子的表示信息。同理可以得到文档中所有句子的表示信息。
Sentence Encoder表示可在得到文档中每个句子的表示信息后,同样使用一个双向的GRU/LSTM来编码文档信息,进而把两个方向上的隐藏状态进行拼接,可以构成文档的表示,同时可以捕获上下文信息。
Sentence Attention表示可通过Attention机制,得到双向GRU/LSTM每一个时间步骤上隐藏状态对应的权重,然后对隐藏状态加权求和,得到整个文档的表示信息。
Softmax(FC+Softmax)用于表示对得到的文档的表示信息,通过一个Softmax层(输出层使用softmax激活函数)进行多分类。
其中,根据训练好的多层注意力模型,可确定与文本内容对应的层次结构,其中,由于文章的文本内容包含层次结构,例如由“词”组成“句子”,再由“句子”组成文档,进而可利用多层注意力模型,确定出文本内容对应的层次结构。而不同的“词”对“句子”的贡献不同,不同的“句子”对文档的贡献不同,则通过使用多层注意力模型中Attention机制(加权机制)获得词或句子的贡献重要程度的权重。其中,贡献重要程度的权重包括与词向量对应的第一贡献重要度权重。
针对与训练好的多层注意力模型对应的层次结构,以及训练好的语言表征模型,通过输入所获取的文章的词向量序列,经由词级别的双向门限循环(Bi-GRU)结构,生成与每个所输入的词向量对应的第一隐向量并输出,通过计算第一隐向量和各词向量序列的点积,可生成与各词向量对应的第一贡献重要度权重。进而根据第一贡献重要度权重对词向量进行加权处理,即得到所输入的词向量序列和贡献重要度权重对应的加权和,生成与待识别文章对应的句子向量。
进一步地,贡献重要程度的权重还包括与句子向量对应的第二贡献重要度权重,针对与训练好的多层注意力模型对应的层次结构,以及训练好的语言表征模型,通过输入所生成的文章的句子向量,经由句子级别的双向门限循环(Bi-GRU)结构,生成与每个所输入的句子向量对应的第二隐向量并输出,通过计算第二隐向量和各句子向量的点积,可生成与各句子向量对应的第二贡献重要度权重。进而根据第二贡献重要度权重对句子向量进行加权处理,生成与待识别文章对应的文档特征向量。
本实施例中,基于层次结构和训练好的语言表征模型,生成与各词向量对应的第一隐向量,并根据词向量和对应的第一隐向量,确定与各词向量对应的第一贡献重要度权重,进而利用第一贡献重要度权重对词向量进行加权处理,生成与待识别文章对应的句子向量。基于层次结构和训练好的语言表征模型,生成与句子向量对应的第二隐向量,并根据句子向量和第二隐向量,确定与各句子向量对应的第二贡献重要度权重,进而根据第二贡献重要度权重对句子向量进行加权处理,生成与待识别文章对应的文档特征向量。实现了通过获取待识别文章从词到句子,再到篇章的层次化结构,结合训练好的语言表征模型,输出得到待识别文章的文档特征向量,避免由单一维度比如根据少量关键词或关键句的进行文章内容识别的方式,进而提升针对文章内容识别的全面性。
在一个实施例中,如图6所示,提供了另一种基于人工智能的图文内容质量识别方法,具体包括以下步骤:
1)获取待识别文章,并提取待识别文章的文章先验特征和文本内容。
2)根据各文章先验特征,分别构建稀疏特征嵌入层和稠密特征嵌入层。
3)基于稀疏特征嵌入层和稠密特征嵌入层,对各文章先验特征进行特征交叉处理,生成交叉先验特征向量。
4)根据训练好的多层注意力模型,确定与文本内容对应的层次结构。
5)基于层次结构和训练好的语言表征模型,生成与各词向量对应的第一隐向量。
6)根据词向量和对应的第一隐向量,确定与各词向量对应的第一贡献重要度权重。
7)根据第一贡献重要度权重对词向量进行加权处理,生成与待识别文章对应的句子向量。
8)基于层次结构和训练好的语言表征模型,生成与句子向量对应的第二隐向量。
9)根据句子向量和第二隐向量,确定与各句子向量对应的第二贡献重要度权重。
10)根据第二贡献重要度权重对句子向量进行加权处理,生成与待识别文章对应的文档特征向量。
11)根据训练好的排版结构模型,生成与待识别文章对应的图文序列特征。
12)根据训练好的双向记忆网络模型,生成与各图文序列特征对应的图文序列特征向量。
13)对各图文序列特征向量进行加权处理,生成加权处理后的图文序列特征向量。
14)将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量。
15)根据训练好的质量评估集成模型,计算得到综合特征向量的质量数据。
16)根据质量数据确定待识别文章的图文内容质量。
17)根据图文内容质量确定对应的加权处理方式,并根据加权处理方式,对相应图文内容进行层次化加权处理。
上述基于人工智能的图文内容质量识别方法中,由于结合了待识别文章的文章先验特征、文本内容以及图文序列特征等多个维度,对待识别文章的图文内容质量进行判定和识别,避免出现由单一维度判断方式得到的片面结果,从而提升了对图文内容质量判定结果的准确度。
应该理解的是,虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种基于人工智能的图文内容质量识别装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:待识别文章获取模块702、交叉先验特征向量生成模块704、文档特征向量生成模块706、图文序列特征向量生成模块708、综合特征向量生成模块710以及图文内容质量确定模块712,其中:
待识别文章获取模块702,用于获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征。
交叉先验特征向量生成模块704,用于对各文章先验特征进行特征交叉处理,得到交叉先验特征向量。
文档特征向量生成模块706,用于根据文本内容生成待识别文章的文档特征向量。
图文序列特征向量生成模块708,用于对各图文序列特征进行加权处理,得到加权处理后的图文序列特征向量。
综合特征向量生成模块710,用于将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量。
图文内容质量确定模块712,用于基于综合特征向量确定待识别文章的图文内容质量。
上述基于人工智能的图文内容质量识别装置中,通过获取待识别文章,并提取待识别文章的文章先验特征、文本内容和图文序列特征。通过对各文章先验特征进行特征交叉处理,得到交叉先验特征向量,并根据文本内容生成待识别文章的文档特征向量。通过对各图文序列特征进行加权处理,得到加权处理后的图文序列特征向量,进而将交叉先验特征向量、文档特征向量和加权处理后的图文序列特征向量进行全连接处理,得到待识别文章的综合特征向量,可基于综合特征向量确定待识别文章的图文内容质量。由于结合了待识别文章的文章先验特征、文本内容以及图文序列特征等多个维度,对待识别文章的图文内容质量进行判定和识别,避免出现由单一维度判断方式得到的片面结果,从而提升了对图文内容质量判定结果的准确度。
在一个实施例中,文档特征向量生成模块还用于:
基于层次结构和训练好的语言表征模型,生成与各词向量对应的第一隐向量;根据词向量和对应的第一隐向量,确定与各词向量对应的第一贡献重要度权重;根据第一贡献重要度权重对词向量进行加权处理,生成与待识别文章对应的句子向量;基于层次结构和训练好的语言表征模型,生成与句子向量对应的第二隐向量;根据句子向量和第二隐向量,确定与各句子向量对应的第二贡献重要度权重;根据第二贡献重要度权重对句子向量进行加权处理,生成与待识别文章对应的文档特征向量。
本实施例中,基于层次结构和训练好的语言表征模型,生成与各词向量对应的第一隐向量,并根据词向量和对应的第一隐向量,确定与各词向量对应的第一贡献重要度权重,进而利用第一贡献重要度权重对词向量进行加权处理,生成与待识别文章对应的句子向量。基于层次结构和训练好的语言表征模型,生成与句子向量对应的第二隐向量,并根据句子向量和第二隐向量,确定与各句子向量对应的第二贡献重要度权重,进而根据第二贡献重要度权重对句子向量进行加权处理,生成与待识别文章对应的文档特征向量。实现了通过获取待识别文章从词到句子,再到篇章的层次化结构,结合训练好的语言表征模型,输出得到待识别文章的文档特征向量,避免由单一维度比如根据少量关键词或关键句的进行文章内容识别的方式,进而提升针对文章内容识别的全面性。
在一个实施例中,交叉先验特征向量生成模块还用于:
根据各文章先验特征,分别构建稀疏特征嵌入层和稠密特征嵌入层;基于稀疏特征嵌入层和稠密特征嵌入层,对各文章先验特征进行特征交叉处理,生成交叉先验特征向量。
在一个实施例中,图文序列特征向量生成模块还用于:
根据训练好的双向记忆网络模型,生成与各图文序列特征对应的图文序列特征向量;图文序列特征根据训练好的排版结构模型生成;对各图文序列特征向量进行加权处理,生成加权处理后的图文序列特征向量。
在一个实施例中,文档特征向量生成模块还用于:
根据训练好的多层注意力模型,确定与文本内容对应的层次结构;基于层次结构和训练好的语言表征模型,生成与文本内容对应的文档特征向量。
在一个实施例中,图文内容质量确定模块还用于:
根据训练好的质量评估集成模型,计算得到综合特征向量的质量数据;根据质量数据确定待识别文章的图文内容质量。
在一个实施例中,提供了一种基于人工智能的图文内容质量识别装置,还包括:
加权处理方式确定模块,用于根据图文内容质量确定对应的加权处理方式;
层次化加权处理模块,用于根据加权处理方式,对相应图文内容进行层次化加权处理。
关于基于人工智能的图文内容质量识别装置的具体限定可以参见上文中对于基于人工智能的图文内容质量识别方法的限定,在此不再赘述。上述基于人工智能的图文内容质量识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待识别文章的文章先验特征、文本内容和图文序列特征等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的图文内容质量识别方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于人工智能的图文内容质量识别方法,其特征在于,所述方法包括:
获取待识别文章,并提取所述待识别文章的文章先验特征、文本内容和图文序列特征;
对各所述文章先验特征进行特征交叉处理,得到交叉先验特征向量;
根据所述文本内容生成所述待识别文章的文档特征向量;
对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量;
将所述交叉先验特征向量、所述文档特征向量和加权处理后的所述图文序列特征向量进行全连接处理,得到所述待识别文章的综合特征向量;
基于所述综合特征向量确定所述待识别文章的图文内容质量。
2.根据权利要求1所述的方法,其特征在于,所述对各所述文章先验特征进行特征交叉处理,得到交叉先验特征向量,包括:
根据各所述文章先验特征,分别构建稀疏特征嵌入层和稠密特征嵌入层;
基于所述稀疏特征嵌入层和所述稠密特征嵌入层,对各所述文章先验特征进行特征交叉处理,生成交叉先验特征向量。
3.根据权利要求1所述的方法,其特征在于,所述对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量,包括:
根据训练好的双向记忆网络模型,生成与各所述图文序列特征对应的图文序列特征向量;所述图文序列特征根据训练好的排版结构模型生成;
根据加权机制对各所述图文序列特征向量进行加权处理,生成加权处理后的图文序列特征向量。
4.根据权利要求1所述的方法,其特征在于,所述根据所述文本内容生成所述待识别文章的文档特征向量,包括:
根据训练好的多层注意力模型,确定与所述文本内容对应的层次结构;
基于所述层次结构和训练好的语言表征模型,生成与所述文本内容对应的文档特征向量。
5.根据权利要求1至3任意一项所述的方法,其特征在于,所述基于所述综合特征向量确定所述待识别文章的图文内容质量,包括:
根据训练好的质量评估集成模型,计算得到所述综合特征向量的质量数据;
根据所述质量数据确定所述待识别文章的图文内容质量。
6.根据权利要求4所述的方法,其特征在于,所述基于所述层次结构和训练好的语言表征模型,生成与所述文本内容对应的文档特征向量,包括:
基于所述层次结构和训练好的语言表征模型,生成与各词向量对应的第一隐向量;
根据所述词向量和对应的所述第一隐向量,确定与各所述词向量对应的第一贡献重要度权重;
根据所述第一贡献重要度权重对所述词向量进行加权处理,生成与所述待识别文章对应的句子向量;
基于所述层次结构和训练好的语言表征模型,生成与所述句子向量对应的第二隐向量;
根据所述句子向量和所述第二隐向量,确定与各所述句子向量对应的第二贡献重要度权重;
根据所述第二贡献重要度权重对所述句子向量进行加权处理,生成与所述待识别文章对应的文档特征向量。
7.根据权利要求5所述的方法,其特征在于,在所述根据所述质量数据确定所述待识别文章的图文内容质量,还包括:
根据所述图文内容质量确定对应的加权处理方式;
根据所述加权处理方式,对相应图文内容进行层次化加权处理。
8.一种基于人工智能的图文内容质量识别装置,其特征在于,所述装置包括:
待识别文章获取模块,用于获取待识别文章,并提取所述待识别文章的文章先验特征、文本内容和图文序列特征;
交叉先验特征向量生成模块,用于对各所述文章先验特征进行特征交叉处理,得到交叉先验特征向量;
文档特征向量生成模块,用于根据所述文本内容生成所述待识别文章的文档特征向量;
图文序列特征向量生成模块,用于对各所述图文序列特征进行加权处理,得到加权处理后的图文序列特征向量;
综合特征向量生成模块,用于将所述交叉先验特征向量、所述文档特征向量和加权处理后的所述图文序列特征向量进行全连接处理,得到所述待识别文章的综合特征向量;
图文内容质量确定模块,用于基于所述综合特征向量确定所述待识别文章的图文内容质量。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202011222592.3A 2020-11-05 2020-11-05 基于人工智能的图文内容质量识别方法和装置 Active CN113407663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011222592.3A CN113407663B (zh) 2020-11-05 2020-11-05 基于人工智能的图文内容质量识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011222592.3A CN113407663B (zh) 2020-11-05 2020-11-05 基于人工智能的图文内容质量识别方法和装置

Publications (2)

Publication Number Publication Date
CN113407663A true CN113407663A (zh) 2021-09-17
CN113407663B CN113407663B (zh) 2024-03-15

Family

ID=77677436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011222592.3A Active CN113407663B (zh) 2020-11-05 2020-11-05 基于人工智能的图文内容质量识别方法和装置

Country Status (1)

Country Link
CN (1) CN113407663B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822045A (zh) * 2021-09-29 2021-12-21 深圳市易平方网络科技有限公司 一种基于多模态数据的影评质量的识别方法及相关装置
CN114416914A (zh) * 2022-03-30 2022-04-29 中建电子商务有限责任公司 一种基于图片问答的处理方法
WO2022161470A1 (zh) * 2021-01-29 2022-08-04 腾讯科技(深圳)有限公司 内容的评价方法、装置、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175687A1 (en) * 2002-06-24 2004-09-09 Jill Burstein Automated essay scoring
CN104536991A (zh) * 2014-12-10 2015-04-22 乐娟 答案抽取方法及装置
CN108073571A (zh) * 2018-01-12 2018-05-25 中译语通科技股份有限公司 一种多语言文本质量评估方法及系统、智能文本处理系统
US20180365574A1 (en) * 2017-06-20 2018-12-20 Beijing Baidu Netcom Science And Technology Co., L Td. Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium
CN110390032A (zh) * 2019-07-26 2019-10-29 江苏曲速教育科技有限公司 一种手写作文的批阅方法及系统
US20200167690A1 (en) * 2018-11-28 2020-05-28 Adobe Inc. Multi-task Equidistant Embedding
CN111488931A (zh) * 2020-04-10 2020-08-04 腾讯科技(深圳)有限公司 文章质量评估方法、文章推荐方法及其对应的装置
CN111538761A (zh) * 2020-04-21 2020-08-14 中南大学 基于注意力机制的点击率预测方法
CN111737578A (zh) * 2020-06-22 2020-10-02 陕西师范大学 一种推荐方法及系统
CN111737446A (zh) * 2020-06-22 2020-10-02 北京百度网讯科技有限公司 用于构建质量评估模型的方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175687A1 (en) * 2002-06-24 2004-09-09 Jill Burstein Automated essay scoring
CN104536991A (zh) * 2014-12-10 2015-04-22 乐娟 答案抽取方法及装置
US20180365574A1 (en) * 2017-06-20 2018-12-20 Beijing Baidu Netcom Science And Technology Co., L Td. Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium
CN108073571A (zh) * 2018-01-12 2018-05-25 中译语通科技股份有限公司 一种多语言文本质量评估方法及系统、智能文本处理系统
US20200167690A1 (en) * 2018-11-28 2020-05-28 Adobe Inc. Multi-task Equidistant Embedding
CN110390032A (zh) * 2019-07-26 2019-10-29 江苏曲速教育科技有限公司 一种手写作文的批阅方法及系统
CN111488931A (zh) * 2020-04-10 2020-08-04 腾讯科技(深圳)有限公司 文章质量评估方法、文章推荐方法及其对应的装置
CN111538761A (zh) * 2020-04-21 2020-08-14 中南大学 基于注意力机制的点击率预测方法
CN111737578A (zh) * 2020-06-22 2020-10-02 陕西师范大学 一种推荐方法及系统
CN111737446A (zh) * 2020-06-22 2020-10-02 北京百度网讯科技有限公司 用于构建质量评估模型的方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PAU RODRÍGUEZ等: "Beyond one-hot encoding: Lower dimensional target embedding", 《IMAGE AND VISION COMPUTING》, 31 July 2018 (2018-07-31), pages 21 - 31 *
ZICHAO YANG等: "Hierarchical Attention Networks for Document Classification", 《PROCEEDINGS OF NAACL-HLT 2016》, pages 1480 - 1489 *
莫中勤: "基于深度学习的文本质量分类研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 8, 15 August 2020 (2020-08-15), pages 138 - 781 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022161470A1 (zh) * 2021-01-29 2022-08-04 腾讯科技(深圳)有限公司 内容的评价方法、装置、设备及介质
CN113822045A (zh) * 2021-09-29 2021-12-21 深圳市易平方网络科技有限公司 一种基于多模态数据的影评质量的识别方法及相关装置
CN113822045B (zh) * 2021-09-29 2023-11-17 重庆市易平方科技有限公司 一种基于多模态数据的影评质量的识别方法及相关装置
CN114416914A (zh) * 2022-03-30 2022-04-29 中建电子商务有限责任公司 一种基于图片问答的处理方法
CN114416914B (zh) * 2022-03-30 2022-07-08 中建电子商务有限责任公司 一种基于图片问答的处理方法

Also Published As

Publication number Publication date
CN113407663B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN111554268B (zh) 基于语言模型的语言识别方法、文本分类方法和装置
Gao et al. Video captioning with attention-based LSTM and semantic consistency
Wang et al. Disentangled representation learning
Han et al. Adversarial training in affective computing and sentiment analysis: Recent advances and perspectives
CN113407663B (zh) 基于人工智能的图文内容质量识别方法和装置
CN111026861B (zh) 文本摘要的生成方法、训练方法、装置、设备及介质
CN110704601A (zh) 利用问题-知识引导的渐进式时空注意力网络解决需要常识的视频问答任务的方法
CN113723166A (zh) 内容识别方法、装置、计算机设备和存储介质
CN110991290A (zh) 基于语义指导与记忆机制的视频描述方法
CN112131883A (zh) 语言模型训练方法、装置、计算机设备和存储介质
CN114443899A (zh) 视频分类方法、装置、设备及介质
Yang et al. Open domain dialogue generation with latent images
CN114491077A (zh) 文本生成方法、装置、设备及介质
CN114282013A (zh) 一种数据处理方法、装置及存储介质
CN111079374A (zh) 字体生成方法、装置和存储介质
CN113392265A (zh) 多媒体处理方法、装置及设备
CN112131345A (zh) 文本质量的识别方法、装置、设备及存储介质
CN113705315B (zh) 视频处理方法、装置、设备及存储介质
CN113657272B (zh) 一种基于缺失数据补全的微视频分类方法及系统
KR20210058059A (ko) 문장 임베딩 기반의 비지도 학습 문서 요약 방법 및 이를 이용한 문서 요약용 디바이스
CN113420179A (zh) 基于时序高斯混合空洞卷积的语义重构视频描述方法
CN113590983A (zh) 描述文本生成方法和装置、文本处理模型的训练方法
CN116977992A (zh) 文本信息识别方法、装置、计算机设备和存储介质
CN116956953A (zh) 翻译模型的训练方法、装置、设备、介质及程序产品
Parmar et al. Abstractive text summarization using artificial intelligence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40053417

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant