CN112035671A - 状态检测方法、装置、计算机设备及存储介质 - Google Patents

状态检测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112035671A
CN112035671A CN202011220330.3A CN202011220330A CN112035671A CN 112035671 A CN112035671 A CN 112035671A CN 202011220330 A CN202011220330 A CN 202011220330A CN 112035671 A CN112035671 A CN 112035671A
Authority
CN
China
Prior art keywords
words
target
word
state
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011220330.3A
Other languages
English (en)
Other versions
CN112035671B (zh
Inventor
赵瑞辉
王婧雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011220330.3A priority Critical patent/CN112035671B/zh
Publication of CN112035671A publication Critical patent/CN112035671A/zh
Application granted granted Critical
Publication of CN112035671B publication Critical patent/CN112035671B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了一种状态检测方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:确定状态描述文本对应的关系矩阵,关系矩阵包括状态描述文本中的每两个词语之间的第一关联权重;基于关系矩阵,对状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵;根据目标词向量矩阵进行检测处理,得到检测结果。采用词语之间的关联权重对词语进行特征增强,得到的目标词向量矩阵不仅能够表示词语的特征,还能够表示词语之间的关联程度以及词语与目标类型状态的关联程度。因此,根据目标词向量矩阵进行状态检测,充分考虑了词语本身的特征和词语之间的关联关系,使得考虑的因素更加丰富,能够提高状态检测的准确度。

Description

状态检测方法、装置、计算机设备及存储介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种状态检测方法、装置、计算机设备及存储介质。
背景技术
随着人工智能技术和数据分析技术的不断发展,多个领域均可应用文本检测技术实现对文本的自动检测。例如,采用结合人工智能技术的自动化系统,对某一对象的状态描述文本进行状态检测,根据检测结果确定该对象的状态。
相关技术中,采用基于深度学习的方法对目标对象的状态描述文本进行状态检测。首先提取状态描述文本中与状态有关的词语,然后调用具有状态检测功能的神经网络对提取的词语进行处理,得到检测结果,以确定目标对象的状态。但是上述方法仅考虑了状态描述文本中的词语本身对检测结果的影响,考虑的因素较少,导致状态检测的准确度较低。
发明内容
本申请实施例提供了一种状态检测方法、装置、计算机设备及存储介质,能够提高状态检测的准确度。所述技术方案包括以下方面。
一方面,提供了一种状态检测方法,所述方法包括:
确定状态描述文本对应的关系矩阵,所述状态描述文本包括多个词语,所述关系矩阵包括所述状态描述文本中的每两个词语之间的第一关联权重,所述第一关联权重用于表示所述两个词语之间的关联程度以及所述两个词语与目标类型状态的关联程度;
基于所述关系矩阵,对所述状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵,所述原始词向量矩阵包括所述多个词语中的每个词语的词向量;
根据所述目标词向量矩阵进行检测处理,得到检测结果,所述检测结果用于表示所述状态描述文本所描述的状态是否属于所述目标类型状态。
可选地,所述根据所述目标词向量矩阵进行检测处理,得到检测结果,包括:
对所述目标词向量矩阵进行特征提取处理,得到所述目标词向量矩阵对应的第一特征向量;
对所述第一特征向量进行分类处理,得到所述检测结果。
另一方面,提供了一种状态检测装置,所述装置包括:
矩阵确定模块,用于确定状态描述文本对应的关系矩阵,所述状态描述文本包括多个词语,所述关系矩阵包括所述状态描述文本中的每两个词语之间的第一关联权重,所述第一关联权重用于表示所述两个词语之间的关联程度以及所述两个词语与目标类型状态的关联程度;
特征增强模块,用于基于所述关系矩阵,对所述状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵,所述原始词向量矩阵包括所述多个词语中的每个词语的词向量;
状态检测模块,用于根据所述目标词向量矩阵进行检测处理,得到检测结果,所述检测结果用于表示所述状态描述文本所描述的状态是否属于所述目标类型状态。
可选地,所述矩阵确定模块,包括:
知识库确定单元,用于确定目标知识库,所述目标知识库中包括目标类型状态词语、与所述目标类型状态词语关联的词语、词语之间的因果关系和每两个具有因果关系的词语之间的第二关联权重,所述目标类型状态词语为表明是所述目标类型状态的词语;
第一权重确定单元,用于对于所述状态描述文本中的每两个词语,在所述目标知识库中查询到所述两个词语具有因果关系的情况下,对所述两个词语之间的第二关联权重进行调整,得到所述两个词语之间的所述第一关联权重。
可选地,所述第一权重确定单元,用于:
将所述两个词语之间的第二关联权重与目标权重的和,作为所述两个词语之间的第一关联权重。
可选地,所述矩阵确定模块,包括:
所述知识库确定单元,用于确定目标知识库,所述目标知识库中包括目标类型状态词语、与所述目标类型状态词语关联的词语、词语之间的因果关系和每两个具有因果关系的词语之间的第二关联权重,所述目标类型状态词语为表明是所述目标类型状态的词语;
第二权重确定单元,用于对于所述状态描述文本中的每两个词语,在所述目标知识库中未查询到所述两个词语具有因果关系的情况下,将目标权重作为所述两个词语之间的第一关联权重。
可选地,所述知识库确定单元,用于:
获取所述目标类型状态词语对应的目标词语集合,所述目标词语集合中包括所述目标类型状态词语以及与所述目标类型状态词语关联的词语;
基于参考描述文本中的词语之间的因果关系,创建所述目标词语集合中的多个词语之间的因果关系,所述参考描述文本中包括样本状态描述词语和样本类型状态词语,所述样本状态描述词语用于描述样本类型状态,所述样本类型状态词语为表明是所述样本类型状态的词语;
基于所述参考描述文本中的词语之间的因果关系,确定所述目标词语集合中每两个具有因果关系的词语之间的第二关联权重;
将所述目标词语集合中的多个词语、创建的多个因果关系和确定的多个第二关联权重,组成所述目标知识库。
可选地,所述目标知识库为因果图,所述知识库确定单元,用于:
创建所述目标词语集合中的每个词语对应的词语节点;
对于所述参考描述文本中具有因果关系的任两个词语,创建所述两个词语对应的词语节点之间的因果指向线;
所述将所述目标词语集合中的多个词语、创建的多个因果关系和确定的多个第二关联权重,组成所述目标知识库,包括:
将创建的多个词语节点、创建的多个因果指向线和所述多个第二关联权重,组成所述因果图。
可选地,所述知识库确定单元,用于:
在语料数据中提取多个词语;
确定提取的每个词语与所述目标类型状态词语之间的相似度;
在提取的多个词语中,选取所述相似度大于目标阈值的词语;
将所述目标类型状态词语与选取的词语,组成所述目标词语集合。
可选地,所述知识库确定单元,用于:
对于提取的每个词语,确定所述词语的词向量与所述目标类型状态词语的词向量之间的相似度。
可选地,所述知识库确定单元,用于:
在语料数据中提取多个三元组,每个三元组中包括两个实体词语和一个关联词语,所述实体词语为状态描述词语或者类型状态词语,所述关联词语表示所述两个实体词语之间的因果关系;
对于多个三元组中的每个实体词语,根据所述实体词语的出现次数、所述目标类型状态词语的出现次数以及所述实体词语和所述目标类型状态词语在同一三元组的出现次数,确定所述实体词语与所述目标类型状态词语之间的相似度;
在提取的多个词语中,选取所述相似度大于目标阈值的词语;
将所述目标类型状态词语与选取的词语,组成所述目标词语集合。
可选地,所述状态检测模块,包括:
特征提取单元,用于对所述目标词向量矩阵进行特征提取处理,得到所述目标词向量矩阵对应的第一特征向量;
分类处理单元,用于对所述第一特征向量进行分类处理,得到所述检测结果。
可选地,所述状态检测模块,包括:
检测处理单元,用于根据所述目标词向量矩阵和所述关系矩阵进行检测处理,得到所述检测结果。
可选地,所述检测处理单元,用于:
对所述目标词向量矩阵进行特征提取处理,得到所述目标词向量矩阵对应的第一特征向量;
对所述目标词向量矩阵和所述关系矩阵进行特征提取处理,得到所述目标词向量矩阵和所述关系矩阵对应的第二特征向量;
将所述第一特征向量和所述第二特征向量进行拼接处理,得到目标特征向量;
对所述目标特征向量进行分类处理,得到所述检测结果。
可选地,所述检测处理单元,用于:
调用包括k个第一特征提取层的第一特征提取网络,对所述目标词向量矩阵进行特征提取处理,得到所述k个第一特征提取层分别输出的第一特征向量,所述k为正整数;
所述对所述目标词向量矩阵和所述关系矩阵进行特征提取处理,得到所述目标词向量矩阵和所述关系矩阵对应的第二特征向量,包括:
调用包括所述k个第二特征提取层的第二特征提取网络,对所述目标词向量矩阵和所述关系矩阵进行特征提取处理,得到所述k个第二特征提取层分别输出的第二特征向量;
所述将所述第一特征向量和所述第二特征向量进行拼接处理,得到目标特征向量,包括:
将每个所述第一特征提取层输出的第一特征向量和对应的第二特征提取层输出的第二特征向量进行拼接处理,得到多个参考特征向量,其中,第m个第一特征提取层与第m个第二特征提取层对应,所述m为不大于所述k的正整数;
根据所述多个参考特征向量,确定所述目标特征向量。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行以实现如上述方面所述的状态检测方法中所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行以实现如上述方面所述的状态检测方法中所执行的操作。
另一方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取所述计算机程序代码,处理器执行所述计算机程序代码,使得所述计算机设备实现如上述方面所述的状态检测方法中所执行的操作。
本申请实施例提供了一种通过状态描述文本进行状态检测的方法,采用状态描述文本中的词语之间的关联权重对词语进行特征增强,得到的目标词向量矩阵不仅能够表示状态描述文本中的词语的特征,还能够表示词语之间的关联程度以及词语与目标类型状态的关联程度。因此,根据目标词向量矩阵进行状态检测,充分考虑了词语本身的特征和词语之间的关联关系,使得考虑的因素更加丰富,能够提高状态检测的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种状态检测方法的流程图;
图2是本申请实施例提供的另一种状态检测方法的流程图;
图3是本申请实施例提供的一种创建因果图的流程图;
图4是本申请实施例提供的一种提取特征的流程图;
图5是本申请实施例提供的另一种提取特征的流程图;
图6是本申请实施例提供的一种状态检测装置的结构示意图;
图7是本申请实施例提供的另一种状态检测装置的结构示意图;
图8是本申请实施例提供的一种终端的结构示意图;
图9是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一关联权重称为第二关联权重,且类似地,可将第二关联权重称为第一关联权重。
其中,至少一个是指一个或者一个以上,例如,至少一个词语可以是一个词语、两个词语、三个词语等任一大于等于一的整数个词语。多个是指两个或者两个以上,例如,多个词语可以是两个词语、三个词语等任一大于等于二的整数个词语。每个是指至少一个中的每一个,例如,每个词语是指多个词语中的每一个词语,若多个词语为3个词语,则每个词语是指3个词语中的每一个词语。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术包括自然语言处理技术和机器学习。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
以下将基于人工智能技术和自然语言处理技术,对本申请实施例提供的状态检测方法进行说明。
本申请实施例提供了一种状态检测方法,执行主体为计算机设备。
在一种可能实现方式中,该计算机设备为终端,终端可以为便携式、袖珍式、手持式等多种类型的终端,如智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱和智能手表等,但并不局限于此。
在另一种可能实现方式中,该计算机设备为服务器,服务器是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDelivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,本申请在此不做限制。
图1是本申请实施例提供的一种状态检测方法的流程图。本申请实施例的执行主体为计算机设备,参见图1,该方法包括以下步骤。
101、确定状态描述文本对应的关系矩阵。
本申请实施例提供的是一种通过状态描述文本检测目标对象的状态的方法,其中,目标对象是指待检测的对象,应用场景不同,目标对象为不同的对象。例如,在设备检修领域,该目标对象为电子设备或者机械设备等;在气象预报领域,该目标对象为天气;在种植领域,该目标对象为植物;在医学领域,该目标对象为人体。除此之外,目标对象还可以为任一其他物体。
其中,状态描述文本是指用于描述目标对象的状态的文本,该状态描述文本中包括多个词语。例如,在目标对象为电脑的情况下,状态描述文本为“电脑中的应用程序打不开,双击鼠标后鼠标指针呈现运行状态”,则“电脑”、“应用程序”、“打不开”、“双击”、“鼠标”、“鼠标指针”、“呈现”和“运行状态”均属于该状态描述文本中的词语。再例如,在目标对象为人体的情况下,状态描述文本为“腹痛持续两个月,位于上腹部呈性疼痛,偶尔出现晕厥状态”。再例如,在目标对象为植物的情况下,状态描述文本为“顶部叶片小而黄,有叶脉绿色,严重出现褐斑”。
状态描述文本对应的关系矩阵中包括该状态描述文本中的每两个词语之间的第一关联权重。其中,两个词语之间的第一关联权重用于表示这两个词语之间的关联程度以及这两个词语与目标类型状态的关联程度。这两个词语之间的关联程度越高,这两个词语之间的第一关联权重越大;这两个词语与目标类型状态的关联程度越高,这两个词语之间的第一关联权重也越大。
其中,目标对象的状态包括多种类型。例如,在目标对象为电子设备的情况下,该目标对象的多种类型的状态包括正常状态、关机状态、卡顿状态和断网状态等。再例如,在目标对象为植物的情况下,该目标对象的多种类型的状态包括缺肥状态、病变状态、光照不足状态或者虫害状态等。
本申请实施例中,需要确定状态描述文本所描述的状态是否属于目标类型状态,因此确定的状态描述文本对应的关系矩阵,是与目标类型状态相关的关系矩阵。该目标类型状态可以为任一类型的状态,例如在设备检修场景下,目标类型状态为“故障”状态;在医学场景下,目标类型状态为“可能出现病变”状态。
102、基于关系矩阵,对状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵。
计算机设备获取该状态描述文本对应的原始词向量矩阵,该原始词向量矩阵包括多个词语中的每个词语的词向量,因此原始词向量矩阵能够表示该状态描述文本中的词语的特征。
计算机设备基于确定的关系矩阵,对该原始词向量矩阵进行特征增强处理,得到目标词向量矩阵。由于目标词向量矩阵是根据关系矩阵和原始词向量矩阵得到的,因此该目标词向量矩阵不仅能够表示状态描述文本中的词语的特征,还能够表示词语之间的关联程度以及词语与目标类型状态的关联程度。
103、根据目标词向量矩阵进行检测处理,得到检测结果。
计算机设备确定目标词向量矩阵之后,根据该目标词向量矩阵进行检测处理,得到检测结果,该检测结果用于表示状态描述文本所描述的状态是否属于目标类型状态。
本申请实施例提供了一种通过状态描述文本进行状态检测的方法,采用状态描述文本中的词语之间的关联权重对词语进行特征增强,得到的目标词向量矩阵不仅能够表示状态描述文本中的词语的特征,还能够表示词语之间的关联程度以及词语与目标类型状态的关联程度。因此,根据目标词向量矩阵进行状态检测,充分考虑了词语本身的特征和词语之间的关联关系,考虑的因素更加丰富,能够提高状态检测的准确度。
图2是本申请实施例提供的一种状态检测方法的流程图。本申请实施例的执行主体为计算机设备,参见图2,该方法包括以下步骤。
201、计算机设备获取目标类型状态词语对应的目标词语集合。
本申请实施例提供的是一种检测目标对象的状态的方法,该目标对象为电子设备、机械设备、天气、植物,甚至是人体,或者任一其他物体等。目标对象的状态包括多种类型,本申请实施例所说的状态检测是指检测状态描述文本所描述的状态是否属于目标类型状态,也即是目标对象是否处于目标类型状态。其中,目标类型状态可以为任一类型的状态。其中,目标类型状态词语为表明是目标类型状态的词语。例如,在目标对象为计算机设备的情况下,多种类型的状态包括正常状态、关机状态、卡顿状态和断网状态等,相应地,类型状态词语为“正常”、“关机”、“卡顿”和“断网”等。若目标类型状态为断网状态,则该目标类型状态词语为“断网”。
计算机设备先获取该目标类型状态词语对应的目标词语集合,该目标词语集合中包括目标类型状态词语以及与目标类型状态词语关联的词语。可选地,与目标类型状态词语关联是指与目标类型状态词语具有因果关系。可选地,与目标类型状态词语关联的词语包括直接与目标类型状态词语关联的词语,或者还包括间接与目标类型状态词语关联的词语。例如,目标类型状态词语为词语A,词语A与词语B直接关联,词语B与词语C直接关联,则词语A与词语C间接关联,目标词语集合中包括词语A、词语B以及词语C。
在一种可能实现方式中,计算机设备获取语料数据,在语料数据中提取多个词语,确定提取的每个词语与目标类型状态词语之间的相似度,在提取的多个词语中,选取相似度大于目标阈值的词语,将目标类型状态词语与选取的词语,组成目标词语集合。其中,在不同的应用场景下,计算机设备确定目标词语集合时所使用的语料数据也不同。例如,在气象预报领域,该语料数据为气象语料数据;在医学领域,该语料数据为医学语料数据,如医学文献等。
该实现方式中,计算机设备根据词语之间的相似度来选取与目标类型状态词语关联的词语,当某一词语与目标类型状态词语之间的相似度大于目标阈值时,认为该词语与目标类型状态词语关联。可选地,该目标阈值由计算机设备默认设置。
可选地,计算机设备对语料数据进行实体抽取(Entity Extraction)来得到语料数据中的多个词语。实体抽取是指从文本识别并且标注出有特定意义的实体的过程。可选地,实体抽取方法包括基于规则和字典的方法、基于统计的机器学习方法以及基于深度学习的方法等,本申请实施例对此不做限定。
可选地,对于提取的每个词语,计算机设备获取该词语的词向量,以及目标类型状态词语的词向量,确定该词语的词向量与目标类型状态词语的词向量之间的相似度,作为该词语与目标类型状态词语之间的相似度。可选地,计算机设备采用Word2Vec模型(Wordto Vector,用来产生词向量的相关模型)分别对该词语和目标类型状态词语进行处理,得到词语的word embedding(词嵌入向量)以及目标类型状态词语的word embedding,计算机设备获取该词语的word embedding和目标类型状态词语的word embedding之间的余弦相似度,作为该词语与目标类型状态词语之间的相似度。
在另一种可能实现方式中,计算机设备为了在语料数据中提取出多个词语组成目标词语集合,首先在语料数据中提取多个三元组,每个三元组中包括两个实体词语和一个关联词语,实体词语为状态描述词语或者类型状态词语,关联词语表示两个实体词语之间的因果关系。其中,状态描述词语与类型状态词语之间可能存在因果关系,状态描述词语与状态描述词语之间也可能存在因果关系,类型状态词语与类型状态词语之间也可能存在因果关系。所以三元组中的两个实体词语可能为一个状态描述词语和一个类型状态词语,也可能为两个状态描述词语,或者为两个类型状态词语。
可选地,计算机设备对语料数据进行三元组提取,得到语料数据中的多个三元组。其中每个三元组中包括两个实体词语和一个谓语词语,计算机设备在提取的多个三元组中,选取谓语词语为表示两个实体词语之间的因果关系的关联词语的三元组。
可选地,计算机设备采用三元组提取工具对语料数据进行处理,得到语料数据中的三元组。例如,该三元组提取工具为SemRep(一种语义表达工具),或者为其他类型的三元组提取工具,本申请实施例对此不做限定。
当计算机设备获取到多个包括两个实体词语和一个关联词语的三元组,对于多个三元组中的每个实体词语,计算机设备根据实体词语的出现次数、目标类型状态词语的出现次数以及实体词语和目标类型状态词语在同一三元组的出现次数,确定实体词语与目标类型状态词语之间的相似度,在提取的多个词语中,选取相似度大于目标阈值的词语,将目标类型状态词语与选取的词语,组成目标词语集合。
其中,实体词语在多个三元组中的出现次数,也即是在多个三元组中,包含该实体词语的三元组的个数。实体词语和目标类型状态词语在同一三元组的出现次数,也即是在多个三元组中,同时包含该实体词语和该目标类型状态词语的三元组的个数。
可选地,计算机设备在通过提取三元组来确定目标词语集合的情况下,在确定词语之间的相似度时,除了考虑词语在三元组中的出现次数,还考虑词语的词向量之间的相似度。则对于多个三元组中的每个实体词语,计算机设备根据实体词语的出现次数、目标类型状态词语的出现次数、实体词语和目标类型状态词语在同一三元组的出现次数,以及实体词语的词向量和目标类型状态词语的词向量之间的相似度,确定该实体词语与该目标类型状态词语之间的相似度。
可选地,计算机设备根据下述公式获取实体词语与目标类型状态词语之间的相似度:
Figure DEST_PATH_IMAGE001
其中,d1表示实体词语,d2表示目标类型状态词语,S表示d1和d2之间的相似度,
Figure DEST_PATH_IMAGE002
表示d1和d2的共现相似度,
Figure DEST_PATH_IMAGE003
表示d1和d2在同一三元组的出现次数,
Figure DEST_PATH_IMAGE004
表示d1的出现次数,
Figure DEST_PATH_IMAGE005
表示d2的出现次数,
Figure DEST_PATH_IMAGE006
表示d1的词嵌入向量与d2的词嵌入向量之间的余弦相似度。
Figure DEST_PATH_IMAGE007
表示取平均值。需要说明的是,除上述公式之外,计算机设备还可以采用其他方法对
Figure DEST_PATH_IMAGE008
Figure 914898DEST_PATH_IMAGE006
进行综合处理,来得到d1和d2之间的相似度。
202、计算机设备基于参考描述文本中的词语之间的因果关系,创建目标词语集合中的多个词语之间的因果关系。
计算机设备获取参考描述文本,该参考描述文本中包括样本状态描述词语和样本类型状态词语,样本状态描述词语用于描述样本类型状态,样本类型状态词语为表明是样本类型状态的词语。其中,样本类型状态词语中至少包括目标类型状态词语,还可以包括其他与目标类型状态词语不同的类型状态词语。可选地,计算机设备获取的参考描述文本包括多个不同的参考描述文本。
其中,在不同的应用场景下,计算机设备创建因果关系时所采用的参考描述文本也不同。例如,在气象预报领域,该参考描述文本为气象数据和该气象数据对应的气象预报;在医学领域,该参考描述文本为电子医疗记录(Electronic Medical Record,EMR),电子医疗记录以电子形式存储的患者的健康信息以及诊断信息等,比如患者的病史、用药史、过敏史、免疫状况、实验室检查结果、年龄、体重等信息。本申请实施例中,电子医疗记录中至少包括患者的症状描述词语和症状描述词语对应的疾病词语。
计算机设备获取参考描述文本后,基于该参考描述文本中的词语之间的因果关系,创建目标词语集合中的多个词语之间的因果关系。其中,计算机设备对参考描述文本进行语义分析,得到参考描述文本中的词语之间的因果关系。例如,参考描述文本中包括词语A和词语B,目标词语集合中包括词语A和词语B,计算机设备确定在参考描述文本中词语A和词语B之间存在因果关系,则创建目标词语集合中的词语A和词语B之间的因果关系。
其中,计算机设备创建的多个词语之间的因果关系为有向因果关系,具有因果关系的两个词语中,其中一个词语为原因,另一个词语为结果。例如,词语A与词语B之间具有从词语A指向词语B的因果关系,是指词语A为词语B的原因,词语B为词语A的结果。
203、计算机设备基于参考描述文本中的词语之间的因果关系,确定目标词语集合中每两个具有因果关系的词语之间的第二关联权重。
计算机设备创建目标词语集合中的多个词语之间的因果关系之后,继续基于该参考描述文本中的词语之间的因果关系,确定目标词语集合中每两个具有因果关系的词语之间的第二关联权重,该第二关联权重用于表示两个词语之间的关联程度,在参考描述文本中两个词语之间的因果关系越密切,则这两个词语之间的第二关联权重越大。
204、计算机设备将目标词语集合中的多个词语、创建的多个因果关系和确定的多个第二关联权重,组成目标知识库。
目标词语集合中包括目标类型状态词语以及与该目标类型状态词语关联的词语,因此计算机设备所组成的目标知识库中包括目标类型状态词语、与目标类型状态词语关联的词语、词语之间的因果关系和每两个具有因果关系的词语之间的第二关联权重。
在一种可能实现方式中,目标知识库为因果图(Causal Graph),因果图又称为因果贝叶斯信念网络或者贝叶斯网络,是用来对数据生成过程进行编码的概率图模型,能够用于对推断过程进行建模。作为一种推断工具,因果图能够从非实验数据中估计某些因素对结论的影响。
则上述步骤202由以下步骤代替:计算机设备创建目标词语集合中的每个词语对应的词语节点,对于参考描述文本中具有因果关系的任两个词语,创建两个词语对应的词语节点之间的因果指向线。上述步骤203由以下步骤代替:计算机设备基于参考描述文本中的词语之间的因果关系,确定每两个具有因果指向线的词语节点之间的第二关联权重。上述步骤204由以下步骤代替:计算机设备将创建的多个词语节点、创建的多个因果指向线和多个第二关联权重,组成因果图。
本申请实施例中的因果图中,具有因果关系的两个词语对应的两个词语节点之间存在因果指向线,以及两个词语节点对应的第二关联权重。其中,因果图中的因果指向线又称为因果图中两个词语节点之间的边。该因果图又称为贝叶斯网络,相应地,因果图中的第二关联权重又称为贝叶斯网络的参数。在一种可能实现方式中,计算机设备采用Netica软件(一种贝叶斯网络分析软件),基于参考描述文本中的词语之间的因果关系,学习词语节点之间的第二关联权重。或者,计算机设备还可以采用其他方法,基于参考描述文本中的词语之间的因果关系,学习词语节点之间的第二关联权重,本申请实施例对此不做限定。
图3是本申请实施例提供的一种创建因果图的流程图,参见图3,创建因果图包括以下步骤:
301、计算机设备在语料数据中提取三元组,三元组中包括实体词语;
302、根据提取的三元组建立原始因果图,原始因果图中包括实体词语对应的词语节点;
303、计算机设备利用相似函数对词语节点进行筛选;
304、计算机设备基于参考描述文本中的词语之间的因果关系,建立筛选出来的词语节点之间的因果指向线;
305、计算机设备基于参考描述文本的词语之间的因果关系,学习具有因果指向线的词语节点之间的关联权重;
306、计算机设备将词语节点、因果指向线和关联权重组成目标因果图。
相关技术中,需要人为创建用于表示词语之间的因果关系的知识库,会耗费大量的人力和时间,效率较低。而本申请实施例中,由计算机设备基于参考描述文本和语料数据,自动提取词语以及自动学习词语之间的因果关系和关联权重,实现了创建知识库的智能化和自动化,能够提高创建知识库的效率。
相关技术中,在创建知识库时,仅考虑状态描述词语与类型状态词语之间的因果关系,导致知识库中的因果关系不够丰富,会损失一部分信息。而本申请实施例中,在创建知识库时,不仅考虑状态描述词语与类型状态词语之间的因果关系,还考虑状态描述词语与状态描述词语之间的因果关系,以及类型状态词语与类型状态词语之间的因果关系,使得知识库中的因果关系更加丰富,提高了知识库中的因果关系的多样性。
相关技术中,在创建知识库时,仅将参考描述文本中的词语之间的因果关系作为参考,由于参考的信息较少,导致知识库中可能会存在较多关联程度并不密切的因果关系,创建的知识库不够精确。而本申请实施例中,在创建知识库时,将参考描述文本和语料数据同时作为参考,利用参考描述文本对从语料数据中提取出来的信息进行筛选整合,从而过滤掉噪声信息,使得知识库中包含的信息的质量更高。
205、计算机设备基于目标知识库,确定状态描述文本对应的关系矩阵。
该状态描述文本是指对目标对象的状态进行描述的文本,因此计算机设备通过对状态描述文本进行检测,来检测目标对象的状态。其中,状态描述文本中包括多个词语,该多个词语中至少包括状态描述词语。
计算机设备基于获取的目标知识库,确定该状态描述文本对应的关系矩阵。其中,关系矩阵包括状态描述文本中的每两个词语之间的第一关联权重,第一关联权重用于表示两个词语之间的关联程度以及两个词语与目标类型状态的关联程度。这两个词语之间的关联程度越高,这两个词语之间的第一关联权重越大;这两个词语与目标类型状态的关联程度越高,这两个词语之间的第一关联权重也越大。
在一种可能实现方式中,目标知识库中包括词语之间的因果关系,以及具有因果关系的两个词语之间的第二关联权重。则计算机设备对状态描述文本进行分词处理,得到状态描述文本中的多个词语。对于状态描述文本中的每两个词语,计算机设备在目标知识库中查询这两个词语是否具有因果关系。根据查询结果来确定这两个词语之间的第一关联权重,然后将获取的多个第一关联权重,组成关系矩阵。
其中,在目标知识库中查询到两个词语具有因果关系的情况下,计算机设备对两个词语之间的第二关联权重进行调整,得到两个词语之间的第一关联权重。其中,两个词语之间的因果关系越密切,这两个词语之间的第二关联权重越大,相应地,这两个词语之间的第一关联权重也越大。
可选地,在目标知识库中查询到两个词语具有因果关系的情况下,计算机设备获取目标权重,将这两个词语之间的第二关联权重与该目标权重的和,作为两个词语之间的第一关联权重。或者,计算机设备将第二关联权重与目标权重进行加权之后再求和,将得到的结果作为第一关联权重。其中,该目标权重由计算机设备默认设置,为了后续根据关系矩阵中的第一关联权重对状态描述文本的特征进行增强,该目标权重设置为不小于1的数值,例如,计算机设备将目标权重设置为1。
其中,在目标知识库中未查询到两个词语具有因果关系的情况下,计算机设备将目标权重作为两个词语之间的第一关联权重。可选地,该目标权重与查询到因果关系的情况下所说的目标权重相同。
可选地,计算机设备根据下述公式来确定两个词语之间的第一关联权重:
Figure DEST_PATH_IMAGE009
其中,
Figure DEST_PATH_IMAGE010
表示词语1和词语2之间的第一关联权重,
Figure DEST_PATH_IMAGE011
表示在目标知识库中查询到词语1与词语2具有因果关系的情况下,词语1与词语2之间的第二关联权重。其中,上述公式中,以目标权重为1为例。
需要说明的是,本申请实施例仅以根据目标知识库来确定关系矩阵为例进行说明,在另一实施例中,还可以采用其他方式确定状态描述文本对应的关系矩阵。
206、计算机设备基于关系矩阵,对状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵。
计算机设备获取状态描述文本对应的原始词向量,该原始词向量矩阵包括多个词语中的每个词语的词向量,因此原始词向量矩阵能够表示该状态描述文本中的词语的特征。计算机设备基于状态描述文本对应的关系矩阵,对该原始词向量矩阵进行特征增强处理,得到目标词向量矩阵。由于目标词向量矩阵是根据关系矩阵和原始词向量矩阵得到的,因此该目标词向量矩阵不仅能够表示状态描述文本中的词语的特征,还能够表示词语之间的关联程度以及词语与目标类型状态的关联程度。
在一种可能实现方式中,计算机设备对状态描述文本中的多个词语进行特征提取,得到每个词语对应的词向量,将得到的多个词向量进行组合处理,得到原始词向量矩阵。
可选地,计算机设备先获取关系矩阵,则按照关系矩阵中的词语之间的第一关联权重的排列顺序,对词语对应的词向量进行排序,将排序后的多个词向量进行组合处理,得到原始词向量矩阵。或者,计算机设备先获取原始词向量矩阵,则按照词向量矩阵中的词语对应的词向量的排列顺序,对词语之间的第一关联权重进行排序,将排序后的多个第一关联权重进行组合处理,得到关系矩阵。
在另一种可能实现方式中,状态描述文本中包括h个词语,则状态描述文本对应的关系矩阵的大小为h*h,状态描述文本对应的原始词向量矩阵的大小为h*1,则计算机设备将关系矩阵与原始词向量矩阵相乘,得到大小为h*1的目标词向量矩阵。除此之外,计算机设备还可以采用其他方式基于关系矩阵对原始词向量矩阵进行特征增强处理,本申请实施例对此不做限定。
207、计算机设备根据目标词向量矩阵进行检测处理,得到检测结果。
计算机设备获取到目标词向量矩阵之后,根据该目标词向量矩阵进行检测处理,得到检测结果,该检测结果用于表示状态描述文本所描述的状态是否属于目标类型状态,也即是表示目标对象所处的状态是否属于目标类型状态。其中,计算机可采用基于深度学习的方法,根据目标词向量矩阵进行检测处理,或者其他方法进行检测处理。其中,由于该目标词向量矩阵是基于关系矩阵得到的,关系矩阵是基于参考描述文本和语料数据得到的,目标词向量矩阵融合了参考描述文本和语料数据中的先验知识。因此,根据目标词向量矩阵进行检测处理所得到检测结果,可由参考描述文本和语料数据进行解释,提高了状态检测的可解释性。
在一种可能实现方式中,计算机设备对目标词向量矩阵进行特征提取处理,得到目标词向量矩阵对应的第一特征向量,对第一特征向量进行分类处理,得到检测结果。
可选地,计算机设备调用特征提取网络对目标词向量矩阵进行特征提取处理,得到第一特征向量。例如,特征提取网络为卷积神经网络(Convolutional Neural Network,CNN),卷积神经网络是指能够进行卷积处理或者相关处理的具有深度结构的前馈神经网络,能够用来执行特征提取、图像分类、文本分类等任务。
可选地,计算机设备调用分类网络对第一特征向量进行分类处理,得到检测结果。例如,分类网络为二元线性分类器,则分类网络输出的检测结果为第一数值或者第二数值,其中输出第一数值表示状态描述文本所描述的状态属于目标类型状态,输出第二数值表示状态描述文本所描述的状态不属于目标类型状态。再例如,分类网络为其他类型的分类器,分类网络输出的检测结果为概率,该概率表示状态描述文本所描述的状态属于目标类型状态的可能性,概率越大表示状态描述文本所描述的状态属于目标类型状态的可能性越大。
在另一种可能实现方式中,计算机设备根据目标词向量矩阵和关系矩阵进行检测处理,得到检测结果。
可选地,计算机设备对目标词向量矩阵进行特征提取处理,得到目标词向量矩阵对应的第一特征向量,对目标词向量矩阵和关系矩阵进行特征提取处理,得到目标词向量矩阵和关系矩阵对应的第二特征向量,将第一特征向量和第二特征向量进行拼接处理,得到目标特征向量,对目标特征向量进行分类处理,得到检测结果。
可选地,计算机设备采用特征提取网络进行特征提取处理,其中,第一特征提取网络用于提取目标词向量矩阵的特征向量,第二特征提取网络用于提取目标词向量矩阵和关系矩阵的特征向量。如图4所示,采用特征提取网络进行特征提取包括以下步骤。
401、调用包括k个第一特征提取层的第一特征提取网络,对目标词向量矩阵进行特征提取处理,得到k个第一特征提取层分别输出的第一特征向量。
第一特征提取网络中包括k个第一特征提取层,k为正整数。将目标词向量矩阵输入第一特征提取网络之后,该第一特征提取网络中的每一个第一特征提取层均会输出一个第一特征向量。可选地,第一特征提取网络为卷积神经网络。
402、调用包括k个第二特征提取层的第二特征提取网络,对目标词向量矩阵和关系矩阵进行特征提取处理,得到k个第二特征提取层分别输出的第二特征向量。
第二特征提取网络中包括k个第二特征提取层。将目标词向量矩阵和关系矩阵输入第二特征提取网络之后,该第二特征提取网络中的每一个第二特征提取层均会输出一个第二特征向量。
可选地,第二特征提取网络为图卷积神经网络(Graph Convolutional Network,GCN)。图卷积神经网络是卷积神经网络的拓展,能够在不规则排列的拓扑图结构上进行卷积,从而完成提取特征、分类处理等任务。其中,关系矩阵为输入图卷积神经网络的邻接矩阵,邻接矩阵用于表示节点之间的相邻关系,本申请实施例中的词语即为节点。可选地,图卷积神经网络中的图卷积使用GraphSage(一种图卷积算法)等卷积操作,公式如下:
Figure DEST_PATH_IMAGE012
其中,第一个公式表示词向量的聚集过程(Aggregation)。
Figure DEST_PATH_IMAGE013
表示节点v在第n个第二特征提取层的特征向量,
Figure DEST_PATH_IMAGE014
表示节点u在第n-1个第二特征提取层的特征向量,N(v)是指节点v的邻居节点。W表示可学习矩阵,ReLU(∙)表示线性整流函数(Rectified LinearUnit,ReLU)。Max(∙)表示取最大值。其中,n为大于1且不大于k的正整数。
其中,第二个公式表示词向量的结合过程(combine),
Figure DEST_PATH_IMAGE015
表示将
Figure DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE017
进行拼接,
Figure DEST_PATH_IMAGE018
表示节点v在第n-1个第二特征提取层的特征向量。
403、将每个第一特征提取层输出的第一特征向量和对应的第二特征提取层输出的第二特征向量进行拼接处理,得到多个参考特征向量。
为了充分利用第一特征提取网络和第二特征提取网络的各个层次之间的信息,计算机设备分别将两个特征提取网络中相互对应的特征提取层输出的第一特征向量和第二特征向量进行拼接处理。其中,第m个第一特征提取层与第m个第二特征提取层对应,m为不大于k的正整数。
可选地,计算机设备根据下述公式,确定第m个第一特征提取层和第m个第二特征提取层对应的参考特征向量:
Figure DEST_PATH_IMAGE019
其中,
Figure DEST_PATH_IMAGE020
表示第m个第一特征提取层输出的第一特征向量,
Figure DEST_PATH_IMAGE021
表示第m个第二特征提取层输出的第二特征向量,concat(∙)表示拼接处理函数。
Figure DEST_PATH_IMAGE022
表示第m个第一特征提取层和第m个第二特征提取层对应的参考特征向量。
404、根据多个参考特征向量,确定目标特征向量。
计算机设备得到每个特征提取层对应的参考特征向量,根据得到的多个参考特征向量确定目标特征向量。可选地,计算机设备将多个参考特征向量的均值,确定为目标特征向量。除此之外,计算机设备还可以采用其他方法根据多个参考特征向量,确定目标特征向量。例如对多个参考特征向量进行加权平均、求和、取最大值或者取最小值等,本申请实施例对此不做限定。
可选地,计算机设备根据下述公式,确定目标特征向量:
Figure DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE024
表示目标特征向量,Avg(∙)表示取平均值,
Figure 303810DEST_PATH_IMAGE022
表示第m个第一特征提取层和第m个第二特征提取层对应的参考特征向量。
本申请实施例提供了一种通过状态描述文本进行状态检测的方法,采用状态描述文本中的词语之间的关联权重对词语进行特征增强,得到的目标词向量矩阵不仅能够表示状态描述文本中的词语的特征,还能够表示词语之间的关联程度以及词语与目标类型状态的关联程度。因此,根据目标词向量矩阵进行状态检测,充分考虑了词语本身的特征和词语之间的关联关系,使得考虑的因素更加丰富,能够提高状态检测的准确度。
并且,基于参考描述文本和语料数据,自动提取词语以及自动学习词语之间的因果关系以及关联权重,实现了创建知识库的智能化和自动化,能够提高创建知识库的效率。
并且,在创建知识库时,不仅考虑状态描述词语与类型状态词语之间的因果关系,还考虑状态描述词语与状态描述词语之间的因果关系,以及类型状态词语与类型状态词语之间的因果关系,使得知识库中的因果关系更加丰富,提高了知识库中的因果关系的多样性。
并且,在创建知识库时,将参考描述文本和语料数据同时作为参考,利用参考描述文本对从语料数据中提取出来的信息进行筛选整合,从而过滤掉噪声信息,使得知识库中包含的信息的质量更高。
并且,由于该目标词向量矩阵是基于关系矩阵得到的,关系矩阵是基于参考描述文本和语料数据得到的,目标词向量矩阵融合了参考描述文本和语料数据中的先验知识。因此,根据目标词向量矩阵进行检测处理所得到检测结果,可由参考描述文本和语料数据进行解释,提高了状态检测的可解释性。
并且,采用第一特征提取网络和第二特征提取网络进行特征提取,充分挖掘了关系矩阵中的信息,使得关系矩阵所表示的词语与词语之间的关系能够得到充分利用,因此提取的特征向量更加准确,使用于状态检测的信息更加全面。
并且,为了充分利用特征提取网络中各层的信息,并让两个特征提取网络结合更加紧密,将两个特征提取网络每层输出的特征向量拼接起来,进一步提高了得到的目标特征向量的准确性,使用于状态检测的信息更加全面。
本申请实施例提供的状态检测方法,可应用于通过状态描述文本对目标对象的状态进行检测的任一场景下。
例如,在医学领域进行疾病检测的场景下,目标对象为人体,状态描述文本为症状描述文本,状态的类型为症状可能所属的疾病类型。以目标类型状态为糖尿病为例,计算机设备通过医学文献数据创建糖尿病对应的词语集合,通过该词语集合创建糖尿病对应的知识库。参见图5,根据知识库来检测病人是否具有患糖尿病的可能性包括以下步骤。
1、计算机设备获取病人的症状描述文本501,症状描述文本501为“病人腹痛持续2月,位于上腹部呈阵发性疼痛,大便不成形且有血便,有时会感到恶心干呕,偶尔会出现晕厥的状况”。该症状描述文本501中包括“晕厥”、“出现”、“血便”、“腹痛”以及“病人”等词语。
2、计算机设备根据糖尿病对应的知识库,创建该症状描述文本501对应的关系矩阵502,该关系矩阵502中包括症状描述文本501中的词语之间的第一关联权重。
3、计算机设备对症状描述文本501进行特征提取处理,得到该症状描述文本501对应的原始词向量矩阵503。
4、计算机设备将该关系矩阵502与原始词向量矩阵503相乘,得到目标词向量矩阵504。
5、计算机设备将目标词向量矩阵504输入至卷积神经网络505中,将关系矩阵502和目标词向量矩阵504输入至图卷积神经网络506中,将卷积神经网络505和图卷积神经网络506对应的卷积层输出的特征向量进行拼接处理后得到的多个特征向量取平均值,得到目标特征向量507。
6、计算机设备对目标特征向量507进行分类处理,得到检测结果508。该检测结果508能够表示病人具有患糖尿病的可能性。
需要说明的一点是,本申请实施例中仅是根据病人的症状描述文本得到检测结果,得到的检测结果仅是一种判断病人是否患有糖尿病的依据,还需要结合病人的其他相关信息,确定病人是否患有糖尿病。另外,医生在对病人进行诊断时,病人的症状描述文本也仅是辅助医生判断的一种依据,还需要结合其他与病人相关的信息,来确定诊断结果。
需要说明的另一点是,本申请实施例仅以检测是否具有患糖尿病的可能性为例进行说明,在另一实施例中,状态检测方法还可以应用于检测病人具有患其他疾病的可能性的场景下。
图6是本申请实施例提供的一种状态检测装置的结构示意图。参见图6,该装置包括:
矩阵确定模块601,用于确定状态描述文本对应的关系矩阵,状态描述文本包括多个词语,关系矩阵包括状态描述文本中的每两个词语之间的第一关联权重,第一关联权重用于表示两个词语之间的关联程度以及两个词语与目标类型状态的关联程度;
特征增强模块602,用于基于关系矩阵,对状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵,原始词向量矩阵包括多个词语中的每个词语的词向量;
状态检测模块603,用于根据目标词向量矩阵进行检测处理,得到检测结果,检测结果用于表示状态描述文本所描述的状态是否属于目标类型状态。
可选地,参见图7,矩阵确定模块601,包括:
知识库确定单元6011,用于确定目标知识库,目标知识库中包括目标类型状态词语、与目标类型状态词语关联的词语、词语之间的因果关系和每两个具有因果关系的词语之间的第二关联权重,目标类型状态词语为表明是目标类型状态的词语;
第一权重确定单元6012,用于对于状态描述文本中的每两个词语,在目标知识库中查询到两个词语具有因果关系的情况下,对两个词语之间的第二关联权重进行调整,得到两个词语之间的第一关联权重。
可选地,参见图7,第一权重确定单元6012,用于:
将两个词语之间的第二关联权重与目标权重的和,作为两个词语之间的第一关联权重。
可选地,参见图7,矩阵确定模块601,包括:
知识库确定单元6011,用于确定目标知识库,目标知识库中包括目标类型状态词语、与目标类型状态词语关联的词语、词语之间的因果关系和每两个具有因果关系的词语之间的第二关联权重,目标类型状态词语为表明是目标类型状态的词语;
第二权重确定单元6013,用于对于状态描述文本中的每两个词语,在目标知识库中未查询到两个词语具有因果关系的情况下,将目标权重作为两个词语之间的第一关联权重。
可选地,参见图7,知识库确定单元6011,用于:
获取目标类型状态词语对应的目标词语集合,目标词语集合中包括目标类型状态词语以及与目标类型状态词语关联的词语;
基于参考描述文本中的词语之间的因果关系,创建目标词语集合中的多个词语之间的因果关系,参考描述文本中包括样本状态描述词语和样本类型状态词语,样本状态描述词语用于描述样本类型状态,样本类型状态词语为表明是样本类型状态的词语;
基于参考描述文本中的词语之间的因果关系,确定目标词语集合中每两个具有因果关系的词语之间的第二关联权重;
将目标词语集合中的多个词语、创建的多个因果关系和确定的多个第二关联权重,组成目标知识库。
可选地,参见图7,目标知识库为因果图,知识库确定单元6011,用于:
创建目标词语集合中的每个词语对应的词语节点;
对于参考描述文本中具有因果关系的任两个词语,创建两个词语对应的词语节点之间的因果指向线;
将目标词语集合中的多个词语、创建的多个因果关系和确定的多个第二关联权重,组成目标知识库,包括:
将创建的多个词语节点、创建的多个因果指向线和多个第二关联权重,组成因果图。
可选地,参见图7,知识库确定单元6011,用于:
在语料数据中提取多个词语;
确定提取的每个词语与目标类型状态词语之间的相似度;
在提取的多个词语中,选取相似度大于目标阈值的词语;
将目标类型状态词语与选取的词语,组成目标词语集合。
可选地,参见图7,知识库确定单元6011,用于:
对于提取的每个词语,确定词语的词向量与目标类型状态词语的词向量之间的相似度。
可选地,参见图7,知识库确定单元6011,用于:
在语料数据中提取多个三元组,每个三元组中包括两个实体词语和一个关联词语,实体词语为状态描述词语或者类型状态词语,关联词语表示两个实体词语之间的因果关系;
对于多个三元组中的每个实体词语,根据实体词语的出现次数、目标类型状态词语的出现次数以及实体词语和目标类型状态词语在同一三元组的出现次数,确定实体词语与目标类型状态词语之间的相似度;
在提取的多个词语中,选取相似度大于目标阈值的词语;
将目标类型状态词语与选取的词语,组成目标词语集合。
可选地,参见图7,状态检测模块603,包括:
特征提取单元6031,用于对目标词向量矩阵进行特征提取处理,得到目标词向量矩阵对应的第一特征向量;
分类处理单元6032,用于对第一特征向量进行分类处理,得到检测结果。
可选地,参见图7,状态检测模块603,包括:
检测处理单元6033,用于根据目标词向量矩阵和关系矩阵进行检测处理,得到检测结果。
可选地,参见图7,检测处理单元6033,用于:
对目标词向量矩阵进行特征提取处理,得到目标词向量矩阵对应的第一特征向量;
对目标词向量矩阵和关系矩阵进行特征提取处理,得到目标词向量矩阵和关系矩阵对应的第二特征向量;
将第一特征向量和第二特征向量进行拼接处理,得到目标特征向量;
对目标特征向量进行分类处理,得到检测结果。
可选地,参见图7,检测处理单元6033,用于:
调用包括k个第一特征提取层的第一特征提取网络,对目标词向量矩阵进行特征提取处理,得到k个第一特征提取层分别输出的第一特征向量,k为正整数;
对目标词向量矩阵和关系矩阵进行特征提取处理,得到目标词向量矩阵和关系矩阵对应的第二特征向量,包括:
调用包括k个第二特征提取层的第二特征提取网络,对目标词向量矩阵和关系矩阵进行特征提取处理,得到k个第二特征提取层分别输出的第二特征向量;
将第一特征向量和第二特征向量进行拼接处理,得到目标特征向量,包括:
将每个第一特征提取层输出的第一特征向量和对应的第二特征提取层输出的第二特征向量进行拼接处理,得到多个参考特征向量,其中,第m个第一特征提取层与第m个第二特征提取层对应,m为不大于k的正整数;
根据多个参考特征向量,确定目标特征向量。
需要说明的是:上述实施例提供的状态检测装置在检测状态时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的状态检测装置与状态检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例提供的状态检测装置,采用状态描述文本中的词语之间的关联权重对词语进行特征增强,得到的目标词向量矩阵不仅能够表示状态描述文本中的词语的特征,还能够表示词语之间的关联程度以及词语与目标类型状态的关联程度。因此,根据目标词向量矩阵进行状态检测,充分考虑了词语本身的特征和词语之间的关联关系,使得考虑的因素更加丰富,能够提高状态检测的准确度。
图8示出了本申请一个示例性实施例提供的终端800的结构示意图。终端800可以用于执行上述状态检测方法中计算机设备所执行的步骤。
终端800包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(FieldProgrammable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以集成有GPU(Graphics Processing Unit,图像处理的交互器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一条程序代码,该至少一条程序代码用于被处理器801所具有以实现本申请中方法实施例提供的状态检测方法。
在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。可选地,外围设备包括:射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
外围设备接口803可被用于将I/O(Input /Output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置在终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在另一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。前置摄像头设置在终端800的前面板,后置摄像头设置在终端800的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
定位组件808用于定位终端800的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图9是本申请实施例提供的一种服务器的结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central ProcessingUnits,CPU)901和一个或一个以上的存储器902,其中,所述存储器902中存储有至少一条程序代码,所述至少一条程序代码由所述处理器901加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
服务器900可以用于执行上述状态检测方法中计算机设备所执行的步骤。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条程序代码,该至少一条程序代码由处理器加载并执行,以实现上述实施例的状态检测方法中所执行的操作。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条程序代码,该至少一条程序代码由处理器加载并执行,以实现上述实施例的状态检测方法中所执行的操作。
本申请实施例还提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机程序代码,计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取计算机程序代码,处理器执行计算机程序代码,使得计算机设备实现如上述实施例的状态检测方法中所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种状态检测方法,其特征在于,所述方法包括:
确定状态描述文本对应的关系矩阵,所述状态描述文本包括多个词语,所述关系矩阵包括所述状态描述文本中的每两个词语之间的第一关联权重,所述第一关联权重用于表示所述两个词语之间的关联程度以及所述两个词语与目标类型状态的关联程度;
基于所述关系矩阵,对所述状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵,所述原始词向量矩阵包括所述多个词语中的每个词语的词向量;
根据所述目标词向量矩阵进行检测处理,得到检测结果,所述检测结果用于表示所述状态描述文本所描述的状态是否属于所述目标类型状态。
2.根据权利要求1所述的方法,其特征在于,所述确定状态描述文本对应的关系矩阵,包括:
确定目标知识库,所述目标知识库中包括目标类型状态词语、与所述目标类型状态词语关联的词语、词语之间的因果关系和每两个具有因果关系的词语之间的第二关联权重,所述目标类型状态词语为表明是所述目标类型状态的词语;
对于所述状态描述文本中的每两个词语,在所述目标知识库中查询到所述两个词语具有因果关系的情况下,对所述两个词语之间的第二关联权重进行调整,得到所述两个词语之间的所述第一关联权重。
3.根据权利要求2所述的方法,其特征在于,所述对所述两个词语之间的第二关联权重进行调整,得到所述两个词语之间的所述第一关联权重,包括:
将所述两个词语之间的第二关联权重与目标权重的和,作为所述两个词语之间的第一关联权重。
4.根据权利要求1所述的方法,其特征在于,所述确定状态描述文本对应的关系矩阵,包括:
确定目标知识库,所述目标知识库中包括目标类型状态词语、与所述目标类型状态词语关联的词语、词语之间的因果关系和每两个具有因果关系的词语之间的第二关联权重,所述目标类型状态词语为表明是所述目标类型状态的词语;
对于所述状态描述文本中的每两个词语,在所述目标知识库中未查询到所述两个词语具有因果关系的情况下,将目标权重作为所述两个词语之间的第一关联权重。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述确定目标知识库,包括:
获取所述目标类型状态词语对应的目标词语集合,所述目标词语集合中包括所述目标类型状态词语以及与所述目标类型状态词语关联的词语;
基于参考描述文本中的词语之间的因果关系,创建所述目标词语集合中的多个词语之间的因果关系,所述参考描述文本中包括样本状态描述词语和样本类型状态词语,所述样本状态描述词语用于描述样本类型状态,所述样本类型状态词语为表明是所述样本类型状态的词语;
基于所述参考描述文本中的词语之间的因果关系,确定所述目标词语集合中每两个具有因果关系的词语之间的第二关联权重;
将所述目标词语集合中的多个词语、创建的多个因果关系和确定的多个第二关联权重,组成所述目标知识库。
6.根据权利要求5所述的方法,其特征在于,所述目标知识库为因果图,所述基于参考描述文本中的词语之间的因果关系,创建所述目标词语集合中的多个词语之间的因果关系,包括:
创建所述目标词语集合中的每个词语对应的词语节点;
对于所述参考描述文本中具有因果关系的任两个词语,创建所述两个词语对应的词语节点之间的因果指向线;
所述将所述目标词语集合中的多个词语、创建的多个因果关系和确定的多个第二关联权重,组成所述目标知识库,包括:
将创建的多个词语节点、创建的多个因果指向线和所述多个第二关联权重,组成所述因果图。
7.根据权利要求5所述的方法,其特征在于,所述获取所述目标类型状态词语对应的目标词语集合,包括:
在语料数据中提取多个词语;
确定提取的每个词语与所述目标类型状态词语之间的相似度;
在提取的多个词语中,选取所述相似度大于目标阈值的词语;
将所述目标类型状态词语与选取的词语,组成所述目标词语集合。
8.根据权利要求7所述的方法,其特征在于,所述确定提取的每个词语与所述目标类型状态词语之间的相似度,包括:
对于提取的每个词语,确定所述词语的词向量与所述目标类型状态词语的词向量之间的相似度。
9.根据权利要求5所述的方法,其特征在于,所述获取所述目标类型状态词语对应的目标词语集合,包括:
在语料数据中提取多个三元组,每个三元组中包括两个实体词语和一个关联词语,所述实体词语为状态描述词语或者类型状态词语,所述关联词语表示所述两个实体词语之间的因果关系;
对于多个三元组中的每个实体词语,根据所述实体词语的出现次数、所述目标类型状态词语的出现次数以及所述实体词语和所述目标类型状态词语在同一三元组的出现次数,确定所述实体词语与所述目标类型状态词语之间的相似度;
在提取的多个词语中,选取所述相似度大于目标阈值的词语;
将所述目标类型状态词语与选取的词语,组成所述目标词语集合。
10.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述目标词向量矩阵进行检测处理,得到检测结果,包括:
根据所述目标词向量矩阵和所述关系矩阵进行检测处理,得到所述检测结果。
11.根据权利要求10所述的方法,其特征在于,所述根据所述目标词向量矩阵和所述关系矩阵进行检测处理,得到所述检测结果,包括:
对所述目标词向量矩阵进行特征提取处理,得到所述目标词向量矩阵对应的第一特征向量;
对所述目标词向量矩阵和所述关系矩阵进行特征提取处理,得到所述目标词向量矩阵和所述关系矩阵对应的第二特征向量;
将所述第一特征向量和所述第二特征向量进行拼接处理,得到目标特征向量;
对所述目标特征向量进行分类处理,得到所述检测结果。
12.根据权利要求11所述的方法,其特征在于,所述对所述目标词向量矩阵进行特征提取处理,得到所述目标词向量矩阵对应的第一特征向量,包括:
调用包括k个第一特征提取层的第一特征提取网络,对所述目标词向量矩阵进行特征提取处理,得到所述k个第一特征提取层分别输出的第一特征向量,所述k为正整数;
所述对所述目标词向量矩阵和所述关系矩阵进行特征提取处理,得到所述目标词向量矩阵和所述关系矩阵对应的第二特征向量,包括:
调用包括所述k个第二特征提取层的第二特征提取网络,对所述目标词向量矩阵和所述关系矩阵进行特征提取处理,得到所述k个第二特征提取层分别输出的第二特征向量;
所述将所述第一特征向量和所述第二特征向量进行拼接处理,得到目标特征向量,包括:
将每个所述第一特征提取层输出的第一特征向量和对应的第二特征提取层输出的第二特征向量进行拼接处理,得到多个参考特征向量,其中,第m个第一特征提取层与第m个第二特征提取层对应,所述m为不大于所述k的正整数;
根据所述多个参考特征向量,确定所述目标特征向量。
13.一种状态检测装置,其特征在于,所述装置包括:
矩阵确定模块,用于确定状态描述文本对应的关系矩阵,所述状态描述文本包括多个词语,所述关系矩阵包括所述状态描述文本中的每两个词语之间的第一关联权重,所述第一关联权重用于表示所述两个词语之间的关联程度以及所述两个词语与目标类型状态的关联程度;
特征增强模块,用于基于所述关系矩阵,对所述状态描述文本对应的原始词向量矩阵进行特征增强处理,得到目标词向量矩阵,所述原始词向量矩阵包括所述多个词语中的每个词语的词向量;
状态检测模块,用于根据所述目标词向量矩阵进行检测处理,得到检测结果,所述检测结果用于表示所述状态描述文本所描述的状态是否属于所述目标类型状态。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1至12任一项所述的状态检测方法中所执行的操作。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至12任一项所述的状态检测方法中所执行的操作。
CN202011220330.3A 2020-11-05 2020-11-05 状态检测方法、装置、计算机设备及存储介质 Active CN112035671B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011220330.3A CN112035671B (zh) 2020-11-05 2020-11-05 状态检测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011220330.3A CN112035671B (zh) 2020-11-05 2020-11-05 状态检测方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112035671A true CN112035671A (zh) 2020-12-04
CN112035671B CN112035671B (zh) 2021-02-26

Family

ID=73572890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011220330.3A Active CN112035671B (zh) 2020-11-05 2020-11-05 状态检测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112035671B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011167A (zh) * 2021-02-09 2021-06-22 腾讯科技(深圳)有限公司 基于人工智能的作弊识别方法、装置、设备及存储介质
CN113257412A (zh) * 2021-06-16 2021-08-13 腾讯科技(深圳)有限公司 信息处理方法、装置、计算机设备及存储介质
CN113988464A (zh) * 2021-11-17 2022-01-28 国家电网有限公司客户服务中心 基于图神经网络的网络链路属性关系预测方法及设备
CN115186775A (zh) * 2022-09-13 2022-10-14 北京远鉴信息技术有限公司 一种图像描述文字的匹配度检测方法、装置及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120089547A1 (en) * 2001-05-02 2012-04-12 Victor Gogolak Method and system for analyzing drug adverse effects
JP2015108983A (ja) * 2013-12-05 2015-06-11 日本電信電話株式会社 アイテム推薦装置、アイテム推薦方法、およびアイテム推薦プログラム
CN108984555A (zh) * 2017-06-01 2018-12-11 腾讯科技(深圳)有限公司 用户状态挖掘和信息推荐方法、装置以及设备
US20190163817A1 (en) * 2017-11-29 2019-05-30 Oracle International Corporation Approaches for large-scale classification and semantic text summarization
CN110033022A (zh) * 2019-03-08 2019-07-19 腾讯科技(深圳)有限公司 文本的处理方法、装置和存储介质
CN110245228A (zh) * 2019-04-29 2019-09-17 阿里巴巴集团控股有限公司 确定文本类别的方法和装置
CN110852374A (zh) * 2019-11-08 2020-02-28 腾讯云计算(北京)有限责任公司 数据检测方法、装置、电子设备以及存储介质
CN110866114A (zh) * 2019-10-16 2020-03-06 平安科技(深圳)有限公司 对象行为的识别方法、装置及终端设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120089547A1 (en) * 2001-05-02 2012-04-12 Victor Gogolak Method and system for analyzing drug adverse effects
JP2015108983A (ja) * 2013-12-05 2015-06-11 日本電信電話株式会社 アイテム推薦装置、アイテム推薦方法、およびアイテム推薦プログラム
CN108984555A (zh) * 2017-06-01 2018-12-11 腾讯科技(深圳)有限公司 用户状态挖掘和信息推荐方法、装置以及设备
US20190163817A1 (en) * 2017-11-29 2019-05-30 Oracle International Corporation Approaches for large-scale classification and semantic text summarization
CN110033022A (zh) * 2019-03-08 2019-07-19 腾讯科技(深圳)有限公司 文本的处理方法、装置和存储介质
CN110245228A (zh) * 2019-04-29 2019-09-17 阿里巴巴集团控股有限公司 确定文本类别的方法和装置
CN110866114A (zh) * 2019-10-16 2020-03-06 平安科技(深圳)有限公司 对象行为的识别方法、装置及终端设备
CN110852374A (zh) * 2019-11-08 2020-02-28 腾讯云计算(北京)有限责任公司 数据检测方法、装置、电子设备以及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011167A (zh) * 2021-02-09 2021-06-22 腾讯科技(深圳)有限公司 基于人工智能的作弊识别方法、装置、设备及存储介质
CN113011167B (zh) * 2021-02-09 2024-04-23 腾讯科技(深圳)有限公司 基于人工智能的作弊识别方法、装置、设备及存储介质
CN113257412A (zh) * 2021-06-16 2021-08-13 腾讯科技(深圳)有限公司 信息处理方法、装置、计算机设备及存储介质
CN113257412B (zh) * 2021-06-16 2022-02-11 腾讯科技(深圳)有限公司 信息处理方法、装置、计算机设备及存储介质
CN113988464A (zh) * 2021-11-17 2022-01-28 国家电网有限公司客户服务中心 基于图神经网络的网络链路属性关系预测方法及设备
CN115186775A (zh) * 2022-09-13 2022-10-14 北京远鉴信息技术有限公司 一种图像描述文字的匹配度检测方法、装置及电子设备
CN115186775B (zh) * 2022-09-13 2022-12-16 北京远鉴信息技术有限公司 一种图像描述文字的匹配度检测方法、装置及电子设备

Also Published As

Publication number Publication date
CN112035671B (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
CN112035671B (zh) 状态检测方法、装置、计算机设备及存储介质
CN112749728A (zh) 学生模型训练方法、装置、计算机设备及存储介质
CN113515942A (zh) 文本处理方法、装置、计算机设备及存储介质
CN112989767B (zh) 医学词语标注方法、医学词语映射方法、装置及设备
CN110807325A (zh) 谓词识别方法、装置及存储介质
CN111598168B (zh) 图像分类方法、装置、计算机设备及介质
CN112669928A (zh) 结构化信息构建方法、装置、计算机设备及存储介质
CN114332530A (zh) 图像分类方法、装置、计算机设备及存储介质
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
CN113569042A (zh) 文本信息分类方法、装置、计算机设备及存储介质
CN113505256B (zh) 特征提取网络训练方法、图像处理方法及装置
CN113610750A (zh) 对象识别方法、装置、计算机设备及存储介质
CN111243668A (zh) 分子结合位点检测方法、装置、电子设备及存储介质
CN113674856B (zh) 基于人工智能的医学数据处理方法、装置、设备及介质
CN111914180B (zh) 基于图结构的用户特征确定方法、装置、设备及介质
CN112419326A (zh) 图像分割数据处理方法、装置、设备及存储介质
CN111753498A (zh) 文本处理方法、装置、设备及存储介质
CN114281956A (zh) 文本处理方法、装置、计算机设备及存储介质
CN113257412B (zh) 信息处理方法、装置、计算机设备及存储介质
CN112287070B (zh) 词语的上下位关系确定方法、装置、计算机设备及介质
CN112037305B (zh) 对图像中的树状组织进行重建的方法、设备及存储介质
CN114333997A (zh) 数据处理、数据处理模型的训练方法、装置、设备及介质
CN116580211B (zh) 关键点检测方法、装置、计算机设备及存储介质
CN113761195A (zh) 文本分类方法、装置、计算机设备及计算机可读存储介质
CN112163095A (zh) 数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40034952

Country of ref document: HK