CN111651579A - 信息查询方法、装置、计算机设备和存储介质 - Google Patents

信息查询方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111651579A
CN111651579A CN202010492461.0A CN202010492461A CN111651579A CN 111651579 A CN111651579 A CN 111651579A CN 202010492461 A CN202010492461 A CN 202010492461A CN 111651579 A CN111651579 A CN 111651579A
Authority
CN
China
Prior art keywords
user
decision tree
information
node
vertex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010492461.0A
Other languages
English (en)
Other versions
CN111651579B (zh
Inventor
孙继超
于苗苗
陈曦
郑冶枫
赵博
高文龙
赖盛章
赵静
文瑞
张子恒
刘博�
向玥佳
郇文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010492461.0A priority Critical patent/CN111651579B/zh
Publication of CN111651579A publication Critical patent/CN111651579A/zh
Application granted granted Critical
Publication of CN111651579B publication Critical patent/CN111651579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种信息查询方法、装置、计算机设备和存储介质。该方法包括:展示包括用户特征关联问题和相应候选答案的信息查询界面;当获取到从候选答案中选定的目标答案、且目标答案指向决策树中的非叶子节点时,展示与目标答案在决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案;当目标答案指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户状态相应的建议信息。采用本方法能够提高查询效率。

Description

信息查询方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能技术领域,具体涉及自然语言处理技术领域,特别是涉及一种信息查询方法、装置、计算机设备和存储介质。
背景技术
随着科学技术的飞速发展,人工智能技术应运而生。人工智能技术凭借其智能性,给人们的日常生活带来了很多的便利。目前有很多场景都会应用人工智能技术来解决问题。然而,仍然有一些场景未能使用到人工智能技术。比如,对于用户查询自身所处状态的场景中,目前尚未通过人工智能技术来进行实现。
传统方法中,需要用户自己根据标准化手册或标准指南,来翻看查找,并自行判断自己所处的状态。然而,标准化手册或标准指南,具有复杂的专业术语以及多重逻辑,对于普通人来说很难理解,且操作比较繁琐,导致查询效率比较低。因此,如何使用人工智能技术来实现便捷查询,以提高查询效率是需要解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高查询效率的信息查询方法、装置、计算机设备和存储介质。
一种信息查询方法,方法包括:
展示包括用户特征关联问题和相应候选答案的信息查询界面;用户特征关联问题,对应于预先构建的决策树中的用户特征节点;决策树,是基于知识图谱中的用户特征和用户状态之间的关联关系构建得到;决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户状态的节点;
当获取到从候选答案中选定的目标答案、且目标答案指向决策树中的非叶子节点时,展示与目标答案在决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案;
当目标答案指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户状态相应的建议信息。
一种信息查询装置,装置包括:
查询模块,用于展示包括用户特征关联问题和相应候选答案的信息查询界面;用户特征关联问题,对应于预先构建的决策树中的用户特征节点;决策树,是基于知识图谱中的用户特征和用户状态之间的关联关系构建得到;决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户状态的节点;
查询模块还用于当获取到从候选答案中选定的目标答案、且目标答案指向决策树中的非叶子节点时,展示与目标答案在决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案;
建议指导模块,用于当目标答案指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户状态相应的建议信息。
在一个实施例中,装置还包括:
模型训练模块,用于获取初始决策树;初始决策树中的非叶子节点为初始的用户特征节点,以及叶子节点为对应于用户状态的节点;获取知识图谱中的用户特征和用户状态之间的关联关系;根据关联关系,对初始决策树进行微调,得的最终的决策树。
在一个实施例中,模型训练模块还用于针对初始决策树中与叶子节点相连接的待调整用户特征节点,从知识图谱中,查询待调整用户特征节点所对应的关联权重;关联权重,是待调整用户特征节点所对应的用户特征,与相连接的叶子节点所对应的用户状态之间的关联权重;当关联权重小于或等于预设权重阈值时,则断开待调整用户特征节点和叶子节点之间的连接;重新确定待调整用户特征节点所指向的节点、以及断开连接的叶子节点所待连接的用户特征节点,得的最终的决策树。
在一个实施例中,模型训练模块还用于获取包括至少两组的样本用户信息的训练集;同一组样本用户信息中包括用户状态和预设用户特征下的用户特征值;将训练集输入至待训练的决策树中进行迭代训练,并在每轮迭代中,寻找本轮待切分的预设用户特征,以及待切分的预设用户特征对应的目标切分点,直至满足迭代停止条件,生成初始决策树;其中,目标切分点,是使本轮迭代的切分损失最小的用户特征值。
在一个实施例中,模型训练模块还用于对标准指南信息进行逻辑拆解转换处理,得到转换后的信息;根据转换后的信息,确定预设用户特征;从预设的第一集合中,获取用户状态以及在预设用户特征下的用户特征值;将同一用户对应的用户状态及预设用户特征下的用户特征值,作为一组样本用户信息,得到训练集。
在一个实施例中,知识图谱中的顶点包括用户特征和用户状态所分别对应的顶点;知识图谱中的边,建立于具有关联关系的用户特征和用户状态所对应的顶点之间;装置还包括:
知识图谱处理模块,用于将知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量;针对同一条边上的顶点,确定顶点各自对应的顶点向量之间的相似度,得到顶点所对应的用户特征和用户状态之间的关联权重。
在一个实施例中,知识图谱处理模块还用于通过在知识图谱中随机游走,得到顶点序列;同一顶点序列中包括起始顶点和随机游走所经历的顶点;在每轮迭代中,将顶点序列中的起始顶点,输入至当前轮的顶点向量表示模型中,输出起始顶点的顶点向量;根据顶点向量,确定顶点序列中出现在起始顶点的预设窗口范围内的顶点的出现概率;根据出现概率,确定当前轮的损失值,并根据损失值,调整当前轮的顶点向量表示模型的模型参数,并将下一轮作为当前轮进行迭代处理,直至满足训练停止条件,得到最终的顶点向量表示模型;根据最终的顶点向量表示模型,确定知识图谱中各顶点的顶点向量。
在一个实施例中,知识图谱处理模块还用于对预设的第二集合进行实体抽取,得到用户状态实体和用户特征实体;对用户状态实体和用户特征实体进行关系抽取,得到用户状态实体和用户特征实体之间的关联关系;将用户状态实体和用户特征实体表示为顶点,并将有关联关系的用户状态实体和用户特征实体所对应的顶点之间建边,生成知识图谱。
在一个实施例中,建议指导模块还用于当目标答案指向决策树中的第一叶子节点时,展示与第一叶子节点所对应的第一用户状态相应的第一建议信息;当目标答案指向决策树中的第二叶子节点时,展示与第二叶子节点所对应的第二用户状态相应的第二建议信息;其中,第一用户状态不同于第二用户状态。
在一个实施例中,建议指导模块还用于确定与指向的叶子节点对应的用户状态;根据选定的各目标答案和用户状态,进行风险评估;确定与风险评估得到的风险评估结果对应的建议模板;将选定的目标答案填充至建议模板中的预设槽位中,生成最终的建议信息。
一种信息查询方法,方法包括:
展示包括用户健康关联问题和相应候选答案的健康信息查询界面;用户健康关联问题,对应于预先构建的决策树中的用户特征节点;决策树,是基于医疗知识图谱中的用户特征和用户健康状态之间的关联关系构建得到;用户特征,是与用户健康状态相关的特征;决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户健康状态的节点;
当获取到从候选答案中选定的目标答案、且目标答案指向决策树中的非叶子节点时,展示与目标答案在决策树中所指向的用户特征节点对应的用户健康关联问题用户特征关联问题以及相应的候选答案;
当目标答案指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户健康状态相应的医疗建议信息。
一种信息查询装置,装置包括:
查询模块,用于展示包括用户健康关联问题和相应候选答案的健康信息查询界面;用户健康关联问题,对应于预先构建的决策树中的用户特征节点;决策树,是基于医疗知识图谱中的用户特征和用户健康状态之间的关联关系构建得到;用户特征,是与用户健康状态相关的特征;决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户健康状态的节点;
查询模块还用于当获取到从候选答案中选定的目标答案、且目标答案指向决策树中的非叶子节点时,展示与目标答案在决策树中所指向的用户特征节点对应的用户健康关联问题用户特征关联问题以及相应的候选答案;
建议指导模块,用于当目标答案指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户健康状态相应的医疗建议信息。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现本申请各实施例中所述的信息查询方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请各实施例中所述的信息查询方法的步骤。
上述信息查询方法、装置、计算机设备和存储介质,预先基于知识图谱中的用户特征和用户状态之间的关联关系构建得到决策树,通过与决策树中的用户特征节点对应的用户特征关联问题,引导用户从相应的候选答案中选择目标答案,并展示与选定的目标答案在决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案,从而通过决策树逐级的引导,以获取用户特征信息,实现人机交互对话。当目标答案指向叶子节点时,即通过决策树基于所选择的用户特征信息决策分析出了用户状态,进而可以向用户提供与该用户状态相应的建议信息。通过人工智能技术,实现了对用户状态的决策分析并提供相应建议,相较于由用户自己根据指南来进行查询而言,更加便捷,提高了信息查询的效率。
附图说明
图1为一个实施例中信息查询方法的应用环境图;
图2为一个实施例中信息查询方法的流程示意图;
图3至图5为一个实施例中人机交互对话的界面示意图;
图6至图8为一个实施例中建议信息的界面示意图;
图9为一个实施例语义距离示意图;
图10为一个实施例中知识图谱构建过程示意图;
图11为另一个实施例中信息查询方法的流程示意图;
图12为一个实施例中信息查询方法的原理示意图;
图13为一个实施例中处置建议分布图;
图14为一个实施例中信息查询装置的结构框图;
图15为另一个实施例中信息查询装置的结构框图;
图16为一个实施例中计算机设备的内部结构图;
图17为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的信息查询方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。服务器104可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
用户可以基于终端102进入信息查询界面,终端102在信息查询界面中展示用户特征关联问题和相应候选答案。用户可以从终端102展示的候选答案中选定目标答案。终端102可以将选定的目标答案上报至服务器104。服务器104可以在决策树中确定该目标答案所指向的节点,当目标答案指向决策树中的非叶子节点时,服务器104可以确定该目标答案在决策树中所指向的用户特征节点,并确定该用户特征节点所对应的用户特征关联问题以及相应的候选答案。服务器104可以将所确定的用户特征关联问题和相应的候选答案返回至终端102。终端102可以在信息查询界面中展示该返回的用户特征关联问题和相应候选答案。用户可以再次从中选择目标答案,从而实现多次人机交互对话。当目标答案指向决策树中的叶子节点时,服务器104可以获取确定所指向的叶子节点所对应的用户状态。服务器104可以获取与该用户状态相应的建议信息,并将建议信息返回至终端102。终端102可以展示该建议信息。
需要说明的是,在计算机算力允许的情况下,终端102也可以不将目标答案发送至服务器104,而是终端102自身在本地执行本申请各实施例中的信息查询方法。
可以理解,本申请各实施例中的信息查询方法,相当于使用了人工智能技术来实现人机交互对话,从而自动引导用户查询了解自身的用户状态,以及查询与用户状态相应的建议信息。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
可以理解,本申请各实施例中的信息查询方法,使用了人工智能技术中的自然语言处理技术,实现了人机交互对话,从而自动引导用户查询了解自身的用户状态、以及与用户状态相应的建议信息
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答和知识图谱等技术。
在一个实施例中,如图2所示,提供了一种信息查询方法,以该方法应用于计算机设备为例进行说明,计算机设备可以是图1中的终端,包括以下步骤:
步骤202,展示包括用户特征关联问题和相应候选答案的信息查询界面。
其中,用户特征关联问题,是与用户特征相关联的问题。用户特征关联问题,用于引导用户选择答案,以获取具体用户特征信息(即具体的用户特征值)。用户特征关联问题,对应于预先构建的决策树中的用户特征节点。
决策树,是基于知识图谱中的用户特征和用户状态之间的关联关系构建得到的树形结构。决策树中的非叶子节点为用户特征节点。决策树中的叶子节点,是对应于用户状态的节点。即,决策树,是基于知识图谱训练得到的、且用于通过用户特征识别用户状态的树形结构模型。
用户特征关联问题相应的候选答案,是针对用户特征关联问题,预先设置的供用户选择的用户特征值。可以理解,候选答案为至少两个。每个候选答案在决策树中具有所指向的用户特征节点。即,候选答案被选中后,能够在决策树中定位到相应所指向的用户特征节点。可以理解,所指向的用户特征节点,是与候选答案一同展示的用户特征关联问题所对应的用户特征节点的下级节点。
用户特征节点,是与用户特征相对应的节点。比如,假设“年龄”是一个用户特征,那么,在决策树中的一个节点即为年龄节点。用户状态,是用户所处的状况或者所表现出的形态。可以理解,用户状态可以为至少一种。即,可以有一种或多种用户状态。每种用户状态又可以包括多种层级的状态。
在一个实施例中,用户特征可以包括用户生理特征和用户行为特征等中的至少一种。在一个实施例中,用户状态可以包括用户健康状态和用户经济状态中的至少一种。
在一个实施例中,用户特征可以是与用户健康状态相关的特征。即,用户特征可以包括用于体现用户健康状态的用户行为特征和用户生理特征中的至少一种。比如,用户探访过患有传染性疾病的亲属,那么,该用户行为特征一定程度上就能够体现用户健康状态。
具体地,用户可以基于计算机设备进入信息查询界面。在进入到信息查询界面后,服务器则可以将决策树根节点所对应的用户特征关联问题及该用户特征关联问题相应的候选答案,返回至计算机设备。计算机设备可以在信息查询界面中展示用户特征关联问题和相应候选答案。
需要说明的是,步骤202中并不限定展示最初始的根节点所对应的用户特征关联问题和相应的候选答案,而可以是展示在查询过程中任意阶段下的用户特征关联问题和相应候选答案。因为本申请各实施例的方法,是通过人机交互对话来进行信息查询,所以,除了展示根节点对应的用户特征关联问题和相应的候选答案以外,还可以展示在接下来的对话过程中获取的用户特征关联问题和相应候选答案。
步骤204,当获取到从候选答案中选定的目标答案、且目标答案指向决策树中的非叶子节点时,展示与目标答案在决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案。
其中,目标答案,是从候选答案中选定的、且与用户特征关联问题所对应的用户特征节点对应的具体的用户特征值。
具体地,用户可以从计算机设备展示的候选答案中选定目标答案。计算机设备可以将选定的目标答案上报至服务器。服务器可以在决策树中确定该目标答案所指向的节点。目标答案在决策树中所指向的节点,可以是叶子节点或非叶子节点。
当目标答案指向决策树中的非叶子节点时,服务器可以确定该目标答案在决策树中所指向的用户特征节点,并确定该用户特征节点所对应的用户特征关联问题以及相应的候选答案。服务器可以将所确定的新的用户特征关联问题以及相应的候选答案返回至计算机设备。计算机设备可以将该确定的用户特征关联问题以及相应的候选答案,更新显示在信息查询界面中。
可以理解,用户可以再从新的候选答案中,选定针对新的用户特征关联问题的目标答案,并再次上报至服务器,以使得服务器再根据新上报的目标答案在决策树中定位所对应的节点及执行后续步骤。即,可以通过人机交互,循环触发执行步骤204,如此实现人机交互对话。
需要说明的是,本申请各实施例中的服务器所执行的处理,也可以由计算机设备本身来实现,这里仅以计算机设备和服务器之间的交互来进行示意说明,而并不限定必须由服务器来执行。
图3至图5为一个实施例中人机交互对话的界面示意图。参照图3,为用户最开始进入信息查询界面时,所展示的用户特征关联问题和候选答案。从图3中可知,“请问您的年龄阶段是?”属于决策树根节点对应的用户特征关联问题,以引导用户从302中的多个候选答案中选择目标答案。假设,用户选择“5~14岁”作为目标答案,那么,该目标答案即为“请问您的年龄阶段是?”所对应的用户特征节点的具体用户特征值。决策树可以定位该目标答案所指向的节点,如果为非叶子节点,则会呈现其所指向的用户特征节点对应的用户特征关联问题和候选答案,即参照图4,在用户针对用户特征关联问题“了解,请问您是否患有一下慢性疾病?”选择“免疫力低下”这一目标答案后,决策树可以定位该目标答案指向的下一用户特征节点,展示其相应的用户特征关联问题“好的,最近两周内,是否有以下先关情况或接触史?”、以及该用户特征关联问题相应的各个候选答案(即如402所示)。参加图5,同样地,在用户针对用户特征关联问题“了解,请问您是否发热?”选择“否”这一目标答案后,决策树可以定位该目标答案指向的下一用户特征节点,展示其相应的用户特征关联问题“收到,请问最近两周内是否还有其它症状”、以及该用户特征关联问题相应的各个候选答案(即如502所示)。可以理解,图3至图5,即为当目标答案未指向叶子节点时,通过与用户之间的交互,循环执行步骤204,以实现人机交互对话。
步骤206,当目标答案在指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户状态相应的建议信息。
其中,建议信息,可以是针对用户状态给出的指导性的建议。当用户状态异常时,建议信息则是用于描述该异常、且用于解决异常的用户状态的指导性建议信息。当用户状态正常时,建议信息则是对该正常的用户状态进行描述的信息。
可以理解,不同用户状态对应不同的建议信息。
具体地,当目标答案在指向决策树中的叶子节点时,服务器可以获取确定所指向的叶子节点所对应的用户状态。进一步地,服务器对所确定的用户状态进行分析,获取与该用户状态相应的建议信息,并将建议信息返回至计算机设备。计算机设备可以展示该建议信息。
需要说明的是,并不限定仅根据用户状态确定相应的建议信息,还可以结合用户在人机交互对话过程中选择的目标答案,生成相应的建议信息。
在一个实施例中,用户状态可以包括用户健康状态和用户经济状态中的至少一种。
在一个实施例中,用户健康状态可以包括用户生理健康状态和用户心理健康状态中的至少一种。可以理解,用户生理健康状态可以包括至少一种,每种用户生理健康状态又可以包括不同层级(即不同的严重程度)。比如,用户疑似患有不同的疾病,就属于对应不同的用户生理健康状态。同一种疾病,又可以划分不同的风险等级(即不同层级)。举例说明,当用户疑似患有疾病1和疑似患有疾病2时,就属于对应不同的用户生理健康状态,假设,疑似患有疾病1,又分高风险和低风险等不同层级。
可以理解,不同的叶子节点对应不同的用户状态,不同的用户状态可以对应不同的建议信息。
在一个实施例中,步骤206包括:当目标答案指向决策树中的第一叶子节点时,展示与第一叶子节点所对应的第一用户状态相应的第一建议信息;当目标答案指向决策树中的第二叶子节点时,展示与第二叶子节点所对应的第二用户状态相应的第二建议信息;其中,第一用户状态不同于第二用户状态。
需要说明的是,这里并不限定用户状态仅包括第一用户状态和第二用户状态这两种,还可以包括更多的用户状态。同一用户状态中又可以对应至少一个层级。比如,第一用户状态还可以包括不同层级。不同层级所对应的建议信息也可以不同。
在一个实施例中,第一用户状态和第二用户状态属于用户健康状态中的不同类型的状态。比如,第一用户状态为疑似患有肺炎,第二用户状态为疑似患有非肺炎的呼吸道系统疾病,就属于不同类型的用户状态,但皆属于用户健康状态这一大类。同一种用户状态又可以包括不同层级。比如,第一用户状态为疑似患有肺炎,那么,其还可以划分为疑似患有肺炎的高风险、低风险和无风险等不同层级。
图6至图8为一个实施例中建议信息的界面示意图。图6至图8,即示出新冠肺炎在不同风险等级(即不同层级)下的不同建议信息。图6即为高风险的建议信息,图7即为低风险的建议信息,图8即为无风险的建议信息。
在一个实施例中,建议信息可以包括对于用户特征的描述信息、与用户状态对应的指导性建议、与该指导性建议相关的关联辅助信息、以及建议报告生成入口中的至少一种。
其中,与用户状态对应的指导性建议,用于描述与该用户状态匹配的处置方案。与指导性建议相关的关联辅助信息,是对该指导性建议所描述的处置方案的实施起辅助性作用的信息。建议报告生成入口,是用于触发生成建议报告文件的入口。建议报告生成入口被触发操作后,会触发将建议信息生成独立的报告文件进行保存。
可以理解,当用户状态异常时,其所对应的指导性建议,则用于描述解决该异常的用户状态的处置方案。不同用户状态对应于不同的指导性建议。比如,用户状态为处于疑似患有新冠肺炎的高风险等级时,对应的指导性建议则用于描述解决新冠肺炎高风险等级的处置方案,又比如,用户状态为疑似患有其他呼吸道系统疾病时,对应的指导性建议则为描述该呼吸道系统疾病的处置方案。
在一个实施例中,建议信息中可以包括至少一个指导性建议。当有多个指导性建议时,则建议信息中可以包括与至少一个指导性建议相关的关联辅助信息。
在一个实施例中,与指导性建议相关的关联辅助信息的生成步骤可以包括:提取指导性建议中的建议关键词,生成与该建议关键词相应的、且用于实现该指导性建议所描述的处置方案的关联辅助信息。其中,建议关键词,是用于表达建议的关键词。
在一个实施例中,指导性建议包括线上处置方案、线下处置方案、以及待观察方案中的至少一种。
其中,线上处置方案,是指通过线上的方式对用户状态所存在的异常问题进行处置的方案。线下处置方案,是指通过线下的方式对用户状态所存在的异常问题进行处置的方案。待观察方案,是指不需要做处置,仅进行观察的方案。
在一个实施例中,线上处置方案,可以包括在线咨询用于解决该用户状态所存在异常问题的对象。
那么,与该线上处置方案相应的关联辅助信息,则包括实施该线上处置方案的触发入口和在线咨询的指南信息等中的至少一种。实施该线上处置方案的触发入口,用于触发实施该线上处置方案。在线咨询的指南信息,用于描述在线咨询的注意事项。
在一个实施例中,线上处置方案可以包括在线咨询专业医学对象。其中,专业医学对象,是指具备专业医学知识的对象。专业医学对象可以包括医生、专业医学人员和专业医学机构等中的至少一种对象。
比如,如图6所示,601中包括“您没有明显的发热症状,但因为有头痛……流行病接触史”属于对用户特征的描述,601中“建议您……是否前往附近发热门诊就诊”就属于指导性建议。其中,“在线咨询医生”为线上处置方案,那么,相关的关联辅助信息,即包括“在线咨询医生”的触发入口602。该触发入口602,用于被触发后,跳转至在线咨询医生的页面,从而辅助完成在线咨询医生这一处置方案。“查看自查报告”604即为建议报告生成入口,其被触发后,可以获取展示的建议信息,并确定预设的报告生成模板,将获取的建议信息填充至报告生成模板中,以生成独立的报告文件保存到手机上(比如,图片格式的建议报告)。
在一个实施例中,线下处置方案,可以包括线下就诊。那么,与该线下处置方案相应的关联辅助信息,则包括线下就诊的就诊医院信息、以及线下就诊的指南信息等中的至少一种。其中,线下就诊的指南信息,用于描述线下就诊的注意事项。
可以理解,线下就诊的就诊医院信息的获取步骤可以包括:获取计算机设备的当前位置,查找具备线下就诊条件的医院,根据查找到的医院的位置信息与当前位置之间的当前距离,按照当前距离由小到大的顺序,筛选距离在前预设位次的医院作为目标医院,然后获取目标医院的名称和地址等基础信息,根据目标医院的基础信息和当前距离,生成就诊医院信息添加至建议信息中。这样一来,在展示建议信息时,则可以展示就诊医院信息。
在一个实施例,还可以在展示建议信息的界面中,实时更新用户与就诊医院的当前距离,从而让用户实时获知距离最近的医院。
在一个实施例中,线下就诊的指南信息,可以是通用的指南信息,也可以是结合所推荐的就诊医院的信息,生成的与该就诊医院匹配的个性化指南信息。比如,所推荐的就诊医院有一些特殊化、个性化要求时,则可以在指南信息中生成针对这些特殊化、个性化要求的指引提示信息。
在一个实施例中,线下就诊包括前往附近发热门诊就诊。那么,相应的关联辅助信息,则包括附近发热门诊医院的信息,以辅助完成到达附近发热门诊医院就诊这一处置方案。附近发热门诊医院的信息,可以包括附近的就诊医院的名称、地址以及当前距离。其中,当前距离,即为发热门诊医院与用户当前位置的距离。
在一个实施例中,当对所展示的附近发热门诊医院的信息进行触发时,可以调用地图接口,跳转至地图界面,以在地图界面中展示由用户当前位置到附近发热门诊医院的地图信息和/或交通信息。
如图6所示,601中包括线上处置方案“在线咨询医生”、以及线下处置方案“前往附近发热门诊就诊”。那么,分别对应了相应的辅助关联信息:在线咨询医生的触发入口602、附近发热门诊医院的信息606(包括医院名称、地址和当前距离等)、以及线下就诊的指南信息608(描述了线下就诊的注意事项)。用户对606中展示的附近发热门诊医院的信进行触发后,则可以跳转至地图界面,以便用户快捷查询如何从当前位置到该发热门诊医院就诊。
在一个实施例,还可以根据用户状态,生成与该用户状态相关的全局动态信息。即,建议信息中还可以包括全局动态信息。其中,全局动态信息,用于描述该用户状态对全局环境的影响。比如,用户状态为疑似患有新冠肺炎,那么,全局动态信息,即为新冠肺炎的疫情动态信息(即在全球或者全国等全局环境中的动态信息)。可以理解,全局动态信息被触发后,可以进入详情展示页面,以展示详细的动态信息。
又比如,如图7所示,建议信息中包括线上处置方案“在线咨询医生”和线下处置方案“前往医院就诊”。那么就可以生成并展示在线咨询医生的触发入口702,以及就诊指南704这些关联辅助信息。此外,还可以展示“疫情动态”关联信息706,以帮助用户了解当前疫情情况。可以理解,由于图7为针对处于疑似患有新冠肺炎的低风险等级的建议,相较于图6中高风险等级而言,没有紧急程度没有那么高,所以没有图6中的附近发热门诊医院的信息606这部分内容。从而,实现了针对不同层级或风险等级给出不同针对性的建议信息。
再比如,如图8所示,为无风险的建议,所以,处置方案即为无需处置、居家观察的方案。那么,则可以生成与该居家观察方案相应的居家观察指南802、以及建议报告生成入口804。此外,还可以展示“疫情动态”关联信息806,以帮助用户了解当前疫情情况。可以理解,居家观察指南802可以是通用的居家观察注意事项,也可以获取用户当前所在的地区或城市,根据所在区域或城市的特征,生成针对性的、个性化的居家观察指南。比如,用户在天气比较热的区域和比较冷的区域,居家观察指南可以不同。
上述信息查询方法,预先基于知识图谱中的用户特征和用户状态之间的关联关系构建得到决策树,通过与决策树中的用户特征节点对应的用户特征关联问题,引导用户从相应的候选答案中选择目标答案,并展示与选定的目标答案在决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案,从而通过决策树逐级的引导,获取用户特征信息,实现人机交互对话,当目标答案指向叶子节点时,即通过决策树基于所选择的用户特征信息决策分析出了用户状态,进而可以向用户提供与该用户状态相应的建议信息。通过人工智能技术,实现了对用户状态的决策分析并提供相应建议,相较于由用户自己根据指南来进行查询而言,更加便捷,提高了信息查询的效率。
在一个实施例中,决策树是通过决策树构建步骤得到的。决策树构建步骤包括:获取初始决策树;获取知识图谱中的用户特征和用户状态之间的关联关系;根据关联关系,对初始决策树进行微调,得的最终的决策树。
其中,初始决策树中的非叶子节点为初始的用户特征节点,以及叶子节点为对应于用户状态的节点。
知识图谱,是顶点分别对应用户特征和用户状态,且具有关联关系的用户特征和用户状态所对应的顶点之间具有边的图谱。
可以理解,本实施例中,计算机设备可以预先训练初始决策树,然后从知识图谱中获取用户特征和用户状态之间的关联关系,进而基于该关联关系,对初始决策树进行微调,得到更为准确的决策树。
在一个实施例中,从知识图谱中获取的用户特征和用户状态之间的关联关系,可以是用户特征和用户状态之间的关联权重。
在一个实施例中,根据关联关系,对初始决策树进行微调,得的最终的决策树,包括:针对初始决策树中与叶子节点相连接的待调整用户特征节点,从知识图谱中,查询待调整用户特征节点所对应的关联权重;当关联权重小于或等于预设权重阈值时,则断开待调整用户特征节点和叶子节点之间的连接;重新确定待调整用户特征节点所指向的节点、以及断开连接的叶子节点所待连接的用户特征节点,得的最终的决策树。
其中,待调整用户特征节点,是待评估是否需要调整的用户特征节点。可以理解,用户特征节点与叶子节点相连接,说明该用户特征节点所对应的用户特征,将该用户归于该叶子节点所对应的分类结果(即,将该用户归于该叶子节点所对应的用户状态)。所以,微调过程相当于对分类结果不够准确的情况进行调整的过程。
其中,待调整用户特征节点所对应的关联权重,是待调整用户特征节点所对应的用户特征,与相连接的叶子节点所对应的用户状态之间的关联权重。可以理解,在知识图谱中,顶点之间的关联权重,能够表征顶点与顶点之间的语义距离,顶点之间的关联权重越大,语义距离就越接近,就说明顶点之间越相关。
参照图9可知,流涕、咳嗽(症状,即用户特征)与感冒(疾病,即用户状态)关联权重更大,那么,它们之间的语义距离就比较接近。干咳、胸闷(症状,即用户特征)与肺炎(疾病,即用户状态)关联权重更大,那么,它们之间的语义距离就比较接近。
因此,当关联权重小于或等于预设权重阈值时,说明待调整用户特征节点所对应的用户特征,与相连接的叶子节点所对应的用户状态之间的相关性较低,直接由待调整用户特征节点指向叶子节点不够准确,需要对该待调整用户特征节点进行微调。当该关联权重大于预设权重阈值时,说明待调整用户特征节点所对应的用户特征,与相连接的叶子节点所对应的用户状态之间相关性较高,可以保持该待调整用户特征节点和叶子节点之间的连接,不需要进行微调。
在对待调整用户特征节点进行微调时,可以断开待调整用户特征节点和叶子节点之间的连接,然后,重新确定待调整用户特征节点所指向的节点、以及重新确定该断开连接的叶子节点所待连接的用户特征节点,从而生成最终的决策树。
在一个实施例中,重新确定待调整用户特征节点所指向的节点、以及断开连接的叶子节点所待连接的用户特征节点,得的最终的决策树包括:从知识图谱中,查找与断开连接的叶子节点对应的候选用户特征节点;在待调整用户特征节点和断开连接的叶子节点之间,加入候选用户特征节点和相应的分支判断条件,得到最终的决策树。
其中,候选用户特征节点所对应的用户特征与断开连接的叶子节点所对应的用户状态之间的关联权重,大于预设权重阈值。
具体地,服务器可以从知识图谱中,查找与断开连接的叶子节点对应的候选用户特征节点。可以理解,查找到的候选用户特征节点与叶子节点比较相关,所以,可以在待调整用户特征节点和断开连接的叶子节点之间,加入候选用户特征节点和相应的分支判断条件,得到最终的决策树。即,可以在根据待调整用户特征节点进行分支判断后,再进一步地对候选用户特征节点进行分支判断,从而根据候选用户特征节点的分支判断结果,确定相应的叶子节点,从而生成最终的决策树。
现结合图9进行举例说明。假设,初始决策树中直接将“咳嗽”这一用户特征节点(即症状)与“肺炎”这一叶子节点(即对应用户状态)进行连接。然而,基于图9中的关联权重所表征的语义距离可知,“咳嗽”与“感冒”更相关(即。与“肺炎”之间的关联权重小于预设权重阈值)。所以,由咳嗽症状直接判断为肺炎不够准确。故,可以断开“咳嗽”这一用户特征节点(即症状)与“肺炎”这一叶子节点(即对应用户状态)之间的连接。然后,确定与“肺炎”更相关的症状作为候选用户特征节点,比如,“干咳”、“胸闷”和“咳痰”中的至少一种(即,“干咳”等节点与“肺炎”之间的关联权重大于预设权重阈值)。假设,可以将候选用户特征节点“干咳”加入到“咳嗽”和“肺炎”这两个节点之间。即,在判断完“咳嗽”后,进一步判断是否“干咳”,如果干咳,则将用户分类到“肺炎”这一叶子节点中。从而实现对初始决策树的微调,得到最终的决策树。
上述实施例中,根据知识图谱中的用户特征和用户状态之间的关联关系,对初始决策树进行微调,提高了决策树的准确性。后续,基于该决策树进行推理查询时,也就使得查询到的结果更加准确。即,能够查询到更加准确的用户状态和建议信息。
在一个实施例中,初始决策树的训练步骤包括:获取包括至少两组的样本用户信息的训练集;同一组样本用户信息中包括用户状态和预设用户特征下的用户特征值;将训练集输入至待训练的决策树中进行迭代训练,并在每轮迭代中,寻找本轮待切分的预设用户特征,以及待切分的预设用户特征对应的目标切分点,直至满足迭代停止条件,生成初始决策树;其中,目标切分点,是使本轮迭代的切分损失最小的用户特征值。
具体地,服务器可以直接获取包括至少两组的样本用户信息的训练集,同一组样本用户信息中包括用户状态和预设用户特征下的用户特征值。服务器也可以先确定预设用户特征,按照预设用户特征,从源数据集中针对同一用户,提取用户状态以及预设用户特征下的用户特征值,从而将同一用户对应的用户状态以及该预设用户特征下的用户特征值得到一组样本用户信息。
比如,预设用户特征包括性别,年龄,慢病史,流行病史和症状等中的至少一种。那么,同一组样本用户信息中则包括用户的用户状态,以及该用户在性别,年龄,慢病史,流行病史,症状等至少一种预设用户特征下对应的用户特征值(即,具体的性别、年龄数值等)。
可以理解,训练集中可以包括属于不同用户状态的样本用户信息,从而训练能够分类出不同用户状态的决策树。比如,在训练用于区分新冠肺炎和患有普通呼吸道疾病的决策树时,则可以采集新冠肺炎患者的信息,和没有患有新冠肺炎的人员的信息,一并作为训练集进行决策树的训练。
具体地,服务器可以将训练集输入至待训练的决策树中进行迭代训练,并在每轮迭代中,寻找本轮待切分的预设用户特征,以及待切分的预设用户特征对应的目标切分点,直至满足迭代停止条件,生成初始决策树;其中,目标切分点,是使本轮迭代的切分损失最小的用户特征值。
在一个实施例中,可以采用CART(Classification And Regression Tree)回归树模型来训练决策树。对于输入的训练集,假设最终形成的决策树有M个叶子节点,那么,决策树的模型公式可以表示为
Figure BDA0002521580080000191
其中,T(x)即为决策树预测输出的输出值;xi表示输入的第i个样本输入值(即任意一个x);I为指示函数,当x属于Rm时,其值为1,否则为0;Rm是第i个样本子集;cm是第m个叶子节点的输出值。
那么,使用的是最小化平方误差损失函数,即训练过程中需要最小化以下损失函数:
Figure BDA0002521580080000192
其中,N为样本数量,yi为第i个样本真实值,
Figure BDA0002521580080000193
即为决策树预测输出的输出值;M为叶子节点的数量。
由于CART回归树模型使用的是二叉树分裂节点,所以,可以遍历每个样本的每个特征值,要让每一次的切分损失都是最小的。每轮迭代切分的损失函数即为(即,每轮迭代确定使该损失函数最小的切分点,作为本轮的目标切分点):
Figure BDA0002521580080000194
其中,j表示待切分的预设用户特征,s表示切分点的第j个用户特征的用户特征值,c1表示所有第j个用户特征的用户特征值小于等于s的样本点所对应的输出值,c2表示所有第j个用户特征的用户特征值小于等于s的样本点所对应的输出值;R1和R2分别为被划分的两个子集(由于决策树是二叉树,所以有两个子集);xi∈R1表示在子集R1上的样本点;xi∈R2表示在子集R2上的样本点。因为c1和c2的选择也要符合区间内的最小平方误差准则,因此c1和c2取各自子集区间上所有样本点对应的样本真实值的均值。
即:
c1=ave(yi|xi∈R1(j,s));
c2=ave(yi|xi∈R2(j,s));
其中,c1即为在子集区间R1(j,s)上的所有样本点xi对应的样本真实值yi的均值;c2即为在子集区间R2(j,s)上的所有样本点xi对应的样本真实值yi的均值。
可以理解,每轮迭代切分,都是找到使本轮切分损失最小的目标切分点,所以,通过迭代地重复地执行上述寻找目标切分点的步骤,就可以不断得到各个目标切分点,从而建立起整棵决策树。
在其他实施例中,还可以使用ID3算法(Iterative Dichotomiser 3)或C4.5算法(是由Ross Quinlan开发的用于产生决策树的算法)构建决策树。进一步地,还可以在决策树的基础上增加剪枝的操作。
在一个实施例中,可以获取预设的树深(即决策树的深度),当满足该预设的树深时,则可以停止迭代,得到符合该树深的决策树。
需要说明的是,用于训练决策树的训练集中的预设用户特征,可以包括从标准指南信息中提取得到的用户特征。即,可以对标准指南信息中拗口的、逻辑复杂的信息进行逻辑拆解,以提取出用户可以自我判断的用户特征,作为预设用户特征。
在一个实施例中,获取包括至少两组的样本用户信息的训练集,包括:对标准指南信息进行逻辑拆解转换处理,得到转换后的信息;转换后的信息,保留有标准指南信息中的语意;根据转换后的信息,确定预设用户特征;从预设的第一集合中,获取用户状态以及在预设用户特征下的用户特征值;将同一用户的用户状态以及预设用户特征下的用户特征值,作为一组样本用户信息,得到训练集。
其中,标准指南信息,是一种官方的具有专业术语的专项评判标准。标准指南信息中的用语具有多重逻辑,且比较晦涩难懂。专项评判标准,是指专门用于指引判断一种用户状态。比如,卫健委发布的《新型冠状病毒感染的肺炎诊疗方案》,就属于专门用来指引判断是否患有新冠肺炎的专项评判标准。
具体地,服务器可以对标准指南信息进行解读、以及逻辑拆解,以对标准指南信息进行转换,得到转换后的信息。可以理解,转换后的信息保留有标准指南信息中的语意(即对标准指南信息中的晦涩难懂的用词进行了意思保真),且,相较于标准指南信息而言,更便于用户理解。服务器可以根据转换后的信息,确定预设用户特征。即,基于转换后的信息,能够抽取让用户自我判断的预设用户特征。
比如,标准指南信息中“聚集性发病”就比较专业,一般用户难以理解其意思,通过对其进行解读和逻辑拆解,可以转换成“接触过的家人、同事或朋友多人同时出现发热或呼吸道症状”——即为转换后的信息,这样用户就便于理解。可以理解,该转换后的信息,即为用户可以自我判断的流行病学接触史,因此,可以基于该转换后的信息,抽象生成相应的预设用户特征——即流行病学接触史。再比如,标准指南信息中“呼吸道症状”就比较专业晦涩,通过对其进行解读和逻辑拆解,可以转换成“鼻塞、咽痛、咳嗽、流涕、胸闷、憋喘…”——即为转换后的信息,这样用户就便于理解。可以理解,该转换后的信息,即为用户可以自我判断的症状,因此,可以抽象生成相应的预设用户特征——症状。
可以理解,预设用户特征只是比较概述的特征属性,训练集中则需要具体的用户特征值作为训练数据,所以,服务器可以从预设的第一集合中,获取用户状态以及在预设用户特征下的用户特征值;将同一用户的用户状态以及预设用户特征下的用户特征值,作为一组样本用户信息,得到训练集。第一集合,是用于生成训练集的用户信息集合。
需要说明的是,用于训练决策树的训练集中,不仅包括由标准指南信息抽象得到的预设用户特征,还可以包括除该标准指南信息中所指引的用户状态以外的用户状态所对应的用户特征。可以理解,由于标准指南信息用于指引判断一种用户状态的专项评判标准。而本申请各实施例中的决策树不仅仅用于判断一种用户状态,而是可以判断多种用户状态,所以,训练集的预设用户特征中包括除该标准指南信息中所指引的用户状态以外的用户状态所对应的用户特征。比如,除了包括基于针对新冠肺炎的诊疗方案抽取的预设用户特征以外,还包括普通呼吸道系统疾病所对应的用户特征。
此外,对标准指南信息进行转换得到的转换后的信息,并不限定于用于抽取出预设用户特征,其中需要规范化检测的评判标准,还可以被添加至建议信息中。比如,将对血液检查和影像检查等医学评判标准则,放入到用户状态为疑似患有新冠肺炎的建议信息中。在其他实施例中,对标准指南信息进行转换得到的转换后的信息,还可以用于生成与用户特征关联问题相应的候选答案,以展示给用户通俗易懂的候选答案,供用户选择。
上述实施例中,将由标准指南信息转换后的信息,结合知识图谱中的用户特征和用户状态之间的关联关系,训练决策树,增强了决策树的逻辑性,因而,能提高后续信息查询的准确性。
此外,基于本申请实施例训练得到的决策树,可以预测不同用户状态及给出相应的建议,而不限定于对单一用户状态的预测,实现了对不同用户状态的区分查询,进一步地提高了信息查询的准确性及适用性。
在一个实施例中,知识图谱中的顶点包括用户特征和用户状态所分别对应的顶点;知识图谱中的边,建立于具有关联关系的用户特征和用户状态所对应的顶点之间。知识图谱中的用户特征和用户状态之间的关联关系的确定步骤包括:将知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量;针对同一条边上的顶点,确定顶点各自对应的顶点向量之间的相似度,得到顶点所对应的用户特征和用户状态之间的关联权重。
在一个实施例中,针对同一条边上的顶点,计算机设备可以确定顶点各自对应的顶点向量之间的相似度,根据确定的相似度,得到同一条边上的顶点所对应的用户特征和用户状态之间的关联权重。
在一个实施例中,可以按照以下计算公式,计算同一条边上的顶点各自对应的顶点向量之间的相似度(即计算用户特征与用户状态之间的相似度):
Figure BDA0002521580080000221
其中,
Figure BDA0002521580080000231
表示第i个用户特征所对应的顶点,
Figure BDA0002521580080000232
表示第j个用户状态所对应的顶点,
Figure BDA0002521580080000233
表示第i个用户特征所对应的顶点的顶点向量,
Figure BDA0002521580080000234
表示第j个用户状态所对应的顶点的顶点向量;S用于标识用户特征,D用于标识用户状态。
在一个实施例中,可以按照以下公式,计算同一条边上的顶点所对应的用户特征和用户状态之间的关联权重:
Figure BDA0002521580080000235
其中,
Figure BDA0002521580080000236
为第i个用户特征所对应的顶点的顶点向量与第j个用户状态所对应的顶点的顶点向量之间的相似度;
Figure BDA0002521580080000237
为第i个用户特征与第j个用户状态之间的关联权重。
在其他实施例中,可以使用矩阵的点积等方法计算相似度。
可以理解,计算机设备可以获取预先构建的知识图谱,也可以通过自身构建知识图谱。
在一个实施例中,知识图谱构建步骤包括:对预设的第二集合进行实体抽取,得到用户状态实体和用户特征实体;对用户状态实体和用户特征实体进行关系抽取,得到用户状态实体和用户特征实体之间的关联关系;将用户状态实体和用户特征实体表示为顶点,并将有关联关系的用户状态实体和用户特征实体所对应的顶点之间建边,生成知识图谱。
其中,第二集合,是用于描述用户特征和用户状态的集合。即,第二集合中包括多组数据,每组数据中包括用户特征和用户状态(比如,症状-疾病为一组数据)。用户状态实体,是由抽取出来的用户状态得到的实体。用户特征实体,是由抽取出来的用户特征得到的实体。
在一个实施例中,第二集合,可以包括呼吸道疾病百科词条、医学文献、医疗文档和医学教科书中描述的信息。
具体地,计算机设备可以对预设的第二集合进行实体抽取,得到用户状态实体和用户特征实体。进一步地,计算机设备可以对用户状态实体和用户特征实体进行关系抽取,得到用户状态实体和用户特征实体之间的关联关系。计算机设备可以将用户状态实体和用户特征实体表示为顶点,并将有关联关系的用户状态实体和用户特征实体所对应的顶点之间建边,生成知识图谱。
图10为一个实施例中知识图谱构建过程示意图。参见图10,对第二集合进行实体抽取、实体链接、关系抽取、知识融合等处理,生成知识图谱。图10中的知识图谱中,流感和肺炎所对应的顶点,即为疾病所对应的顶点,与流感顶点和肺炎顶点各自对应的顶点,即为症状顶点。图10中的知识图谱示出了症状和疾病之间的关联关系。
上述实施例中,通过将知识图谱的顶点进行向量化表示,而不需要复杂的图形运算,从而能够准确、且快捷地计算用户状态和用户特征之间的关联权重。
在一个实施例中,将知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量包括:通过在知识图谱中随机游走,得到顶点序列;同一顶点序列中包括起始顶点和随机游走所经历的顶点;在每轮迭代中,将顶点序列中的起始顶点,输入至当前轮的顶点向量表示模型中,输出起始顶点的顶点向量;根据顶点向量,确定顶点序列中出现在起始顶点的预设窗口范围内的顶点的出现概率;根据出现概率,确定当前轮的损失值,并根据损失值,调整当前轮的顶点向量表示模型的模型参数,并将下一轮作为当前轮进行迭代处理,直至满足训练停止条件,得到最终的顶点向量表示模型;根据最终的顶点向量表示模型,确定知识图谱中各顶点的顶点向量。
其中,随机游走(random walk),是指在知识图谱上不断重复地随机选择游走路径,最终形成一个顶点序列的过程。即,从知识图谱中某个特定的起始顶点开始,游走的每一步都从与当前顶点相连的边中随机选择一条,沿着选定的边移动到下一个顶点,不断重复这个过程,最后得到顶点序列的过程。起始顶点,是开始随机游走的端点。
在一个实施例中,可以在知识图谱中进行截断随机游走(truncatedrandomwalk),以得到固定长度的顶点序列。
顶点向量表示模型,是用于生成知识图谱中的顶点的向量化表示的机器学习模型。
具体地,计算机设备可以基于随机游走得到的顶点序列迭代地训练顶点向量表示模型。在每轮迭代中,将顶点序列中的起始顶点,输入至当前轮的顶点向量表示模型中,输出起始顶点的顶点向量。计算机设备可以根据顶点向量,确定顶点序列中出现在起始顶点的预设窗口范围内的顶点的出现概率。计算机设备可以根据出现概率,确定当前轮的损失值,并根据损失值,调整当前轮的顶点向量表示模型的模型参数,并将下一轮作为当前轮进行迭代处理,直至满足训练停止条件,得到最终的顶点向量表示模型;根据最终的顶点向量表示模型,确定知识图谱中各顶点的顶点向量。
在一个实施例中,可以使用SkipGram的方法计算顶点的向量表示。那么,损失函数的公式如下:
Figure BDA0002521580080000251
其中,w为窗口范围;vi为起始顶点;vi-w,...,vi+w出现在起始顶点的预设窗口范围w内的顶点;Pr({vi-w,...,vi+w}|Φ(vi))即为顶点序列中出现在起始顶点的预设窗口范围内的顶点的出现概率。
可以理解,上述损失函数计算出来的即为损失值,根据当前轮的损失值调整当前轮的顶点向量表示模型的模型参数,并将下一轮作为当前轮进行迭代处理,得到最终的顶点向量表示模型。根据最终的顶点向量表示模型,可以确定知识图谱中各顶点的顶点向量。
上述实施例中,在知识图谱中随机游走得到顶点序列,能够实现并行处理,而且不需要计算整个网络,节省了计算量。进而,根据随机游走得到的顶点序列,无监督地迭代训练顶点向量表示模型,能够快速、便捷地知识图谱中各顶点的顶点向量。
在一个实施例中,步骤206中展示的建议信息的获取步骤包括:确定与指向的叶子顶点对应的用户状态;根据选定的各所述目标答案和所述用户状态,进行风险评估;确定与风险评估得到的风险评估结果对应的建议模板;将选定的所述目标答案填充至所述建议模板中的预设槽位中,生成最终的建议信息。
其中,建议模板,是预先根据至少一种条件组合得到的用于生成建议信息的模板。可以理解,建议模板中包括预设槽位和固定的模板描述。固定的模板描述,是固定的模板化的表述,不会因为用户选择的目标答案发生变化。预设槽位(slot),即为预先空留的位置,用于填充至用户选择的个性化的目标答案。
可以理解,决策树中包括对应于不同用户状态的叶子节点,即,用户状态可以包括多种。计算机设备可以确定与指向的叶子顶点对应的用户状态。计算机设备可以根据用户在人机交互对话过程中选定的各目标答案、以及所确定的用户状态,对用户进行风险评估,以评估用户处于该用户状态下的风险等级,得到风险评估结果。计算机设备可以确定与风险评估结果对应的建议模板。其中,不同的风险评估结果,对应不同的建议模板。
计算机设备可以将用户在人机交互对话过程中所选定的各目标答案,填充至建议模板中的预设槽位中,生成最终的建议信息。可以理解,由于填充了用户选择的个性化的目标答案,所以,该建议信息具有个性化,而并非固定不变的通用式信息。
在一个实施例中,针对同一用户状态,可以得到不同风险等级的风险评估结果。即,风险评估结果可以包括高风险等级、低风险等级和特低(无)风险等级。
可以理解,决策树用于决策输出用户处于哪种用户状态,但,并不能确定用户处于该种用户状态下的风险等级(即,无法输出用户处于该种用户状态下所存在的风险程度),所以,通过风险评估,能够准确地确定用户属于该用户状态下的风险情况。进而,根据风险评估结果生成相应的建议模板,能够提供给用户更为科学、准确、且合理的指导建议,避免用户仅知晓自己处于该种用户状态,而不知如何解决所造成的恐慌,提高了查询的信息量。
可以理解,不同风险等级的风险评估结果,所生成的建议信息不同。即可以生成与风险等级相应的建议信息。
比如,当确定用户疑似患有新冠肺炎时,则可以进一步进行风险评估,确定用户患有新冠肺炎的风险等级,由于患有新冠肺炎的严重程度不同,所以,得到的风险评估结果也不同。针对不同的风险评估结果,可以给出不同的建议信息。比如,针对高风险等级的用户,则给出“建议咨询医生后决定是否前往发热门诊就诊”的建议信息(如图6所示)。针对低风险等级的用户,则给出“建议在线咨询医生或医院就诊”的建议信息(如图7所示)。针对基本无风险的用户,则给出“新型冠状病毒感染肺炎可能性很小”的建议信息(如图8所示)。需要说明的是,建议信息并不仅限于上述简单表述,还可以包括具体的建议详情信息。
又比如,当确定用户未患有新冠肺炎,但疑似患有严重的基础慢性病时,也可以根据其选定的目标答案,进行风险评估,当评估病情严重时,也会生成针对慢性病的建议信息。
上述实施例中,根据决策出来的用户状态和用户在对话中输入的内容(即,选定的各所述目标答案)进行风险评估,能够得到准确地风险评估结果。此外,根据与风险评估结果对应的建议模板;将选定的所述目标答案填充至所述建议模板中的预设槽位中,能够生成个性化建议信息,从而提高了生成建议信息的准确性。
在一个实施例中,如图11所示,提供了一种信息查询方法,以该方法应用于计算机设备为例,该计算机设备可以为图1所示的计算机设备。该方法包括以下步骤:
步骤1102,展示包括用户健康关联问题和相应候选答案的健康信息查询界面。
其中,健康信息查询界面,是供用户对健康状态进行自主查询的界面。
用户健康关联问题,是与用户健康相关联的问题。用户健康关联问题,用于引导用户选择答案,以获取具体用户特征信息(即具体的与用户健康状态相关的用户特征值)。用户健康关联问题,对应于预先构建的决策树中的用户特征节点。
决策树,是基于医疗知识图谱中的用户特征和用户健康状态之间的关联关系构建得到。用户特征,是与用户健康状态相关的特征。在一个实施例中,用户特征可以包括与用户健康状态相关的用户生理特征和用户行为特征中的至少一种。决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户健康状态的节点。
医疗知识图谱,是以疾病和症状作为顶点、且在具有关联关系的疾病和症状之间建边生成的知识图谱。
步骤1104,当获取到从候选答案中选定的目标答案、且目标答案指向决策树中的非叶子节点时,展示与目标答案在决策树中所指向的用户特征节点对应的用户健康关联问题用户特征关联问题以及相应的候选答案。
步骤1106,当目标答案指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户健康状态相应的医疗建议信息。
其中,医疗建议信息,是针对用户健康状态,提供给用户医疗方面的建议信息。医疗建议信息,是用于解决用户健康状态所存在的异常情况的参考性信息。医疗建议信息可以包括就诊、自我防护等方面的建议信息。
在一个实施例中,决策树是通过决策树构建步骤得到的;决策树构建步骤包括:获取初始决策树;初始决策树中的非叶子节点为初始的用户特征节点,以及叶子节点为对应于用户健康状态的节点;获取医疗知识图谱中的用户特征和用户健康状态之间的关联关系;根据关联关系,对初始决策树进行微调,得的最终的决策树。
在一个实施例中,根据关联关系,对初始决策树进行微调,得的最终的决策树,包括:针对初始决策树中与叶子节点相连接的待调整用户特征节点,从医疗知识图谱中,查询待调整用户特征节点所对应的关联权重;关联权重,是待调整用户特征节点所对应的用户特征,与相连接的叶子节点所对应的用户健康状态之间的关联权重;当关联权重小于或等于预设权重阈值时,则断开待调整用户特征节点和叶子节点之间的连接;重新确定待调整用户特征节点所指向的节点、以及断开连接的叶子节点所待连接的用户特征节点,得的最终的决策树。
在一个实施例中,初始决策树是通过初始决策树训练步骤得到的,初始决策树训练步骤包括:获取包括至少两组的样本用户信息的训练集;同一组样本用户信息中包括用户健康状态和预设用户特征下的用户特征值;将训练集输入至待训练的决策树中进行迭代训练,并在每轮迭代中,寻找本轮待切分的预设用户特征,以及待切分的预设用户特征对应的目标切分点,直至满足迭代停止条件,生成初始决策树;其中,目标切分点,是使本轮迭代的切分损失最小的用户特征值。
在一个实施例中,获取包括至少两组的样本用户信息的训练集,包括:对标准指南信息进行逻辑拆解转换处理,得到转换后的信息;根据转换后的信息,确定预设用户特征;从预设的第一集合中,获取用户健康状态以及在预设用户特征下的用户特征值;将同一用户对应的用户健康状态及预设用户特征下的用户特征值,作为一组样本用户信息,得到训练集。
在一个实施例中,医疗知识图谱中的顶点包括用户特征和用户健康状态所分别对应的顶点;医疗知识图谱中的边,建立于具有关联关系的用户特征和用户健康状态所对应的顶点之间;医疗知识图谱中的用户特征和用户健康状态之间的关联关系,通过关联关系确定步骤得到;关联关系确定步骤包括:将医疗知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量;针对同一条边上的顶点,确定顶点各自对应的顶点向量之间的相似度,得到顶点所对应的用户特征和用户健康状态之间的关联权重。
在一个实施例中,将医疗知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量包括:通过在医疗知识图谱中随机游走,得到顶点序列;同一顶点序列中包括起始顶点和随机游走所经历的顶点;在每轮迭代中,将顶点序列中的起始顶点,输入至当前轮的顶点向量表示模型中,输出起始顶点的顶点向量;根据顶点向量,确定顶点序列中出现在起始顶点的预设窗口范围内的顶点的出现概率;根据出现概率,确定当前轮的损失值,并根据损失值,调整当前轮的顶点向量表示模型的模型参数,并将下一轮作为当前轮进行迭代处理,直至满足训练停止条件,得到最终的顶点向量表示模型;根据最终的顶点向量表示模型,确定医疗知识图谱中各顶点的顶点向量。
在一个实施例中,医疗知识图谱是通过医疗知识图谱构建步骤得到的,医疗知识图谱构建步骤包括:对预设的第二集合进行实体抽取,得到用户健康状态实体和用户特征实体;对用户健康状态实体和用户特征实体进行关系抽取,得到用户健康状态实体和用户特征实体之间的关联关系;将用户健康状态实体和用户特征实体表示为顶点,并将有关联关系的用户健康状态实体和用户特征实体所对应的顶点之间建边,生成医疗知识图谱。
在一个实施例中,当目标答案指向决策树中的叶子节点时,展示与指向的叶子节点所对应的用户健康状态相应的医疗建议信息包括:当目标答案指向决策树中的第一叶子节点时,展示与第一叶子节点所对应的第一用户健康状态相应的第一医疗建议信息;当目标答案指向决策树中的第二叶子节点时,展示与第二叶子节点所对应的第二用户健康状态相应的第二医疗建议信息;其中,第一用户健康状态不同于第二用户健康状态。
在一个实施例中,第一用户健康状态可以为疑似患有新冠肺炎。第二用户健康状态可以为基础呼吸道疾病。
在一个实施例中,医疗建议信息是通过医疗建议信息获取步骤得到;医疗建议信息获取步骤包括:确定与指向的叶子节点对应的用户健康状态;根据选定的各目标答案和用户健康状态,进行风险评估;确定与风险评估得到的风险评估结果对应的建议模板;将选定的目标答案填充至建议模板中的预设槽位中,生成最终的医疗建议信息。
为了便于理解,现结合图12对本申请的方法进行详细示意说明。计算机设备可以对卫健委发布的《新型冠状病毒感染的肺炎诊疗方案》,简称,医学诊疗方案(即官方发布的标准指南信息)进行解读、逻辑拆解以及术语通俗化等转换处理,以将其转换为便于用户理解的信息。然后,基于转换后的信息,将新冠肺炎疑似病例的评判标准中用户可以自我判断的发热、症状、流行病学接触史等用户特征进行抽取,得到预设用户特征,并从用户信息集中获取该预设用户特征下的用户特征值,以生成用于训练决策树的训练集。训练集中一组样本用户信息中包括用户健康状态和预设用户特征下的用户特征值。用户健康状态,即疑似患有的疾病,包括疑似患有新冠肺炎和患有普通呼吸道疾病。需要说明的是,除了从医学诊疗方案中抽取的预设用户特征以外,计算机设备还可以获取其他预设用户特征,一起来生成训练集。1202中的各项用户特征,即为用于构建决策树的预设用户特征,其中有部分是从医学诊疗方案中抽取得到的,有部分自行设置的预设用户特征。比如,“是否孕妇”这一预设用户特征即为医学诊疗方案中没有的。可以理解,预设用户特征,是与用户健康状态相关的用户特征,包括但不限于症状。预设用户特征可以包括用户生理特征和用户行为特征。比如,流行病史,即属于用户行为特征。
此外,计算机设备还可以从大量的呼吸道疾病百科词条、医学文献、教科书等源数据中,通过实体抽取(即实体识别)、症状疾病链接(即实体链接)、实体关系等知识图谱技术构建出医学知识图谱(即呼吸道疾病知识图谱)。该医学知识图谱中的顶点为症状和疾病,边用于表示症状和疾病之前的关联关系。该计算机设备可以计算医学知识图谱中各顶点的顶点向量,并根据顶点向量之间的相似度,计算顶点之间的关联权重,即症状和疾病之间的关联权重。
计算机设备可以基于由医学诊疗方案得到的训练集,训练初始决策树,并使用医学知识图谱中症状和疾病之间的关联权重,来微调初始决策树,得到最终的决策树。最终的决策树的叶子节点即对应于疾病(疑似患有新冠肺炎和患有普通呼吸道疾病),预设用户特征即对应于决策树中的非叶子节点。
计算机设备可以通过任务型对话生成引擎,将决策树的节点转换为人机交互的对话。从而展示人机交互对话界面,即图3所示的新冠肺炎自查界面。可以理解,图3中展示的即为决策树的根节点所对应的用户特征关联问题——即年龄阶段所对应的问题,与年龄阶段这一问题对应的候选答案即为“小于5岁”“5~14岁”等。用户可以从候选答案中根据自身情况选择目标答案,然后,在目标答案未指向叶子节点时,则从决策树中定位到目标答案所指向的用户特征节点,以展示该用户特征节点所对应的用户特征关联问题及相应的候选答案,用户可以再次进行选择,从而通过决策树的层层推理,实现人机交互对话,具体对话情况如图4至图5所示。通过多次人机交互对话后,则可以确定最终的分类,即目标答案最终指向了决策树中的叶子节点,该叶子节点所对应的疾病即为最终判定用户可能感染的疾病。可以理解,在人机交互对话中生成的候选答案,也可以基于对医学诊疗方案进行转换后的信息生成,便于用户理解。
在确定出叶子节点所对应的疾病后,计算机设备可以结合用户在人机交互对话过程中选定的目标答案,对用户进行风险评估,以评估用户疑似感染该疾病所对应的风险等级。如图12所示,在进行新冠肺炎风险评估时,可以结合用户选择的接触史、发热信息和症状,来评估用户感染新冠肺炎的风险等级。然后,根据风险评估结果获取相应的建议模板,将在人机交互对话过程中选定的目标答案填充至建议模板中的预设槽位中,生成最终的个性化的医疗建议信息。(比如,图6中的建议信息中“因为有头痛、腹泻症状,同时最近两周有过相关流行病接触史”,这些都是用户在人机对话过程中选择的目标答案,在生成建议信息时,将该选择的目标答案填充至建议模板中相应的预设槽位中,才得到个性化的医疗建议信息)。如图6至图8所示,即为针对评估出的用户感染新冠肺炎的不同风险等级,给出的个性化建议信息。从图6可知,可以将转换后的易于理解的对血液检查和影像检查等医学判断标准则放入到个性化建议信息中。
从图12可知,除了能够进行新冠肺炎风险评估以外,当在决策树中最终指向的叶子节点对应的是普通呼吸道疾病时,也可以基于在人机交互对话过程中选定的目标答案,比如,基础慢病史(即,基础的慢性病史)、症状种类、症状进展、发热温度和接触史等,对其中的特殊人群(比如,老孕儿,即,老人、孕妇和儿童)进行病情严重程度评估(即风险评估),以评估其患普通呼吸道疾病的严重程度。根据评估结果,给出个性化建议信息。
需要说明的是,采用本申请实施例中的方法,能够让用户自主查询到相应的用户状态及相应的建议信息(比如就诊建议及疫情科普知识),缓解广大用户的焦虑感,目前已累计服务1400万多用户。而且,已经向社区、医疗机构、防疫中心反馈用户使用数据,包括处置建议的分布、高风险用户的基本信息、地域分布等,为防控管理提供数据支撑。比如,图13即为示意的给出用户的处置建议分布图,该分布图能够向社区、医疗机构、防疫中心等疫情防控部门提供基础数据,为防控管理提供数据支撑。
此外,该方法可以应用于公众账号和小程序中,即,公众可通过相关微信公众号、小程序等进入使用自查和问答服务。为用户提供了信息查询的信息量和价值量,而且,极大地各个机构或医院减少了就诊或问诊压力。
如图14所示,在一个实施例中,提供了一种信息查询装置,该装置具体包括:查询模块1402以及建议指导模块1404,其中:
查询模块1402,用于展示包括用户特征关联问题和相应候选答案的信息查询界面;所述用户特征关联问题,对应于预先构建的决策树中的用户特征节点;所述决策树,是基于知识图谱中的用户特征和用户状态之间的关联关系构建得到;所述决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户状态的节点。
所述查询模块1402还用于当获取到从所述候选答案中选定的目标答案、且所述目标答案指向决策树中的非叶子节点时,展示与所述目标答案在所述决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案。
建议指导模块1404,用于当所述目标答案指向所述决策树中的叶子节点时,展示与指向的所述叶子节点所对应的用户状态相应的建议信息。
在一个实施例中,该装置还包括:
模型训练模块1401b,用于获取初始决策树;所述初始决策树中的非叶子节点为初始的用户特征节点,以及叶子节点为对应于用户状态的节点;获取知识图谱中的用户特征和用户状态之间的关联关系;根据所述关联关系,对所述初始决策树进行微调,得的最终的决策树。
在一个实施例中,所述模型训练模块1401b还用于针对所述初始决策树中与叶子节点相连接的待调整用户特征节点,从所述知识图谱中,查询所述待调整用户特征节点所对应的关联权重;所述关联权重,是所述待调整用户特征节点所对应的用户特征,与相连接的叶子节点所对应的用户状态之间的关联权重;当所述关联权重小于或等于预设权重阈值时,则断开所述待调整用户特征节点和所述叶子节点之间的连接;重新确定所述待调整用户特征节点所指向的节点、以及断开连接的所述叶子节点所待连接的用户特征节点,得的最终的决策树。
在一个实施例中,模型训练模块1401b还用于获取包括至少两组的样本用户信息的训练集;同一组样本用户信息中包括用户状态和预设用户特征下的用户特征值;将所述训练集输入至待训练的决策树中进行迭代训练,并在每轮迭代中,寻找本轮待切分的预设用户特征,以及所述待切分的预设用户特征对应的目标切分点,直至满足迭代停止条件,生成初始决策树;其中,所述目标切分点,是使本轮迭代的切分损失最小的用户特征值。
在一个实施例中,模型训练模块1401b还用于对标准指南信息进行逻辑拆解转换处理,得到转换后的信息;根据所述转换后的信息,确定预设用户特征;从预设的第一集合中,获取用户状态以及在所述预设用户特征下的用户特征值;将同一用户对应的用户状态及所述预设用户特征下的用户特征值,作为一组样本用户信息,得到训练集。
在一个实施例中,所述知识图谱中的顶点包括用户特征和用户状态所分别对应的顶点;所述知识图谱中的边,建立于具有关联关系的用户特征和用户状态所对应的顶点之间。
如图15所示,该装置还包括:知识图谱处理模块1401a和模型训练模块1401b;其中:
知识图谱处理模块1401a,用于将所述知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量;针对同一条边上的顶点,确定所述顶点各自对应的顶点向量之间的相似度,得到所述顶点所对应的用户特征和用户状态之间的关联权重。
在一个实施例中,知识图谱处理模块1401a还用于通过在所述知识图谱中随机游走,得到顶点序列;同一所述顶点序列中包括起始顶点和随机游走所经历的顶点;在每轮迭代中,将所述顶点序列中的起始顶点,输入至当前轮的顶点向量表示模型中,输出起始顶点的顶点向量;根据所述顶点向量,确定所述顶点序列中出现在所述起始顶点的预设窗口范围内的顶点的出现概率;根据所述出现概率,确定当前轮的损失值,并根据所述损失值,调整所述当前轮的顶点向量表示模型的模型参数,并将下一轮作为当前轮进行迭代处理,直至满足训练停止条件,得到最终的顶点向量表示模型;根据最终的顶点向量表示模型,确定所述知识图谱中各顶点的顶点向量。
在一个实施例中,知识图谱处理模块1401a还用于对预设的第二集合进行实体抽取,得到用户状态实体和用户特征实体;对所述用户状态实体和用户特征实体进行关系抽取,得到所述用户状态实体和用户特征实体之间的关联关系;将所述用户状态实体和用户特征实体表示为顶点,并将有关联关系的用户状态实体和用户特征实体所对应的顶点之间建边,生成知识图谱。
在一个实施例中,建议指导模块1404还用于当所述目标答案指向所述决策树中的第一叶子节点时,展示与所述第一叶子节点所对应的第一用户状态相应的第一建议信息;当所述目标答案指向所述决策树中的第二叶子节点时,展示与所述第二叶子节点所对应的第二用户状态相应的第二建议信息;其中,所述第一用户状态不同于所述第二用户状态。
在一个实施例中,建议指导模块1404还用于确定与指向的所述叶子节点对应的用户状态;根据选定的各所述目标答案和所述用户状态,进行风险评估;确定与风险评估得到的风险评估结果对应的建议模板;将选定的所述目标答案填充至所述建议模板中的预设槽位中,生成最终的建议信息。
在一个实施例中,提供了另一种信息查询装置,所述装置包括:
查询模块,用于展示包括用户健康关联问题和相应候选答案的健康信息查询界面;所述用户健康关联问题,对应于预先构建的决策树中的用户特征节点;所述决策树,是基于医疗知识图谱中的用户特征和用户健康状态之间的关联关系构建得到;所述用户特征,是与用户健康状态相关的特征;所述决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户健康状态的节点。
所述查询模块还用于当获取到从所述候选答案中选定的目标答案、且所述目标答案指向决策树中的非叶子节点时,展示与所述目标答案在所述决策树中所指向的用户特征节点对应的用户健康关联问题用户特征关联问题以及相应的候选答案。
建议指导模块,用于当所述目标答案指向所述决策树中的叶子节点时,展示与指向的所述叶子节点所对应的用户健康状态相应的医疗建议信息。
关于信息查询装置的具体限定可以参见上文中对于信息查询方法的限定,在此不再赘述。上述信息查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是计算机设备,其内部结构图可以如图16所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的计算机设备进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种信息查询方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图17所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储搜索数据。该计算机设备的网络接口用于与外部的计算机设备通过网络连接通信。该计算机程序被处理器执行时以实现一种信息查询方法。可以理解,服务器实现的是信息查询方法中的后台处理步骤。
本领域技术人员可以理解,图16和17中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random AccessMemory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种信息查询方法,其特征在于,所述方法包括:
展示包括用户特征关联问题和相应候选答案的信息查询界面;所述用户特征关联问题,对应于预先构建的决策树中的用户特征节点;所述决策树,是基于知识图谱中的用户特征和用户状态之间的关联关系构建得到;所述决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户状态的节点;
当获取到从所述候选答案中选定的目标答案、且所述目标答案指向决策树中的非叶子节点时,展示与所述目标答案在所述决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案;
当所述目标答案指向所述决策树中的叶子节点时,展示与指向的所述叶子节点所对应的用户状态相应的建议信息。
2.根据权利要求1所述的方法,其特征在于,所述决策树是通过决策树构建步骤得到的;所述决策树构建步骤包括:
获取初始决策树;所述初始决策树中的非叶子节点为初始的用户特征节点,以及叶子节点为对应于用户状态的节点;
获取知识图谱中的用户特征和用户状态之间的关联关系;
根据所述关联关系,对所述初始决策树进行微调,得的最终的决策树。
3.根据权利要求2所述的方法,其特征在于,所述根据所述关联关系,对所述初始决策树进行微调,得的最终的决策树,包括:
针对所述初始决策树中与叶子节点相连接的待调整用户特征节点,从所述知识图谱中,查询所述待调整用户特征节点所对应的关联权重;所述关联权重,是所述待调整用户特征节点所对应的用户特征,与相连接的叶子节点所对应的用户状态之间的关联权重;
当所述关联权重小于或等于预设权重阈值时,则断开所述待调整用户特征节点和所述叶子节点之间的连接;
重新确定所述待调整用户特征节点所指向的节点、以及断开连接的所述叶子节点所待连接的用户特征节点,得的最终的决策树。
4.根据权利要求2所述的方法,其特征在于,所述初始决策树是通过初始决策树训练步骤得到的,所述初始决策树训练步骤包括:
获取包括至少两组的样本用户信息的训练集;同一组样本用户信息中包括用户状态和预设用户特征下的用户特征值;
将所述训练集输入至待训练的决策树中进行迭代训练,并在每轮迭代中,寻找本轮待切分的预设用户特征,以及所述待切分的预设用户特征对应的目标切分点,直至满足迭代停止条件,生成初始决策树;其中,所述目标切分点,是使本轮迭代的切分损失最小的用户特征值。
5.根据权利要求4所述的方法,其特征在于,所述获取包括至少两组的样本用户信息的训练集,包括:
对标准指南信息进行逻辑拆解转换处理,得到转换后的信息;
根据所述转换后的信息,确定预设用户特征;
从预设的第一集合中,获取用户状态以及在所述预设用户特征下的用户特征值;
将同一用户对应的用户状态及所述预设用户特征下的用户特征值,作为一组样本用户信息,得到训练集。
6.根据权利要求1所述的方法,其特征在于,所述知识图谱中的顶点包括用户特征和用户状态所分别对应的顶点;所述知识图谱中的边,建立于具有关联关系的用户特征和用户状态所对应的顶点之间;
所述知识图谱中的用户特征和用户状态之间的关联关系,通过关联关系确定步骤得到;所述关联关系确定步骤包括:
将所述知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量;
针对同一条边上的顶点,确定所述顶点各自对应的顶点向量之间的相似度,得到所述顶点所对应的用户特征和用户状态之间的关联权重。
7.根据权利要求6所述的方法,其特征在于,所述将所述知识图谱中的顶点进行向量化表示,得到各顶点所对应的顶点向量包括:
通过在所述知识图谱中随机游走,得到顶点序列;同一所述顶点序列中包括起始顶点和随机游走所经历的顶点;
在每轮迭代中,将所述顶点序列中的起始顶点,输入至当前轮的顶点向量表示模型中,输出起始顶点的顶点向量;
根据所述顶点向量,确定所述顶点序列中出现在所述起始顶点的预设窗口范围内的顶点的出现概率;
根据所述出现概率,确定当前轮的损失值,并根据所述损失值,调整所述当前轮的顶点向量表示模型的模型参数,并将下一轮作为当前轮进行迭代处理,直至满足训练停止条件,得到最终的顶点向量表示模型;
根据最终的顶点向量表示模型,确定所述知识图谱中各顶点的顶点向量。
8.根据权利要求1所述的方法,其特征在于,所述知识图谱是通过知识图谱构建步骤得到的,所述知识图谱构建步骤包括:
对预设的第二集合进行实体抽取,得到用户状态实体和用户特征实体;
对所述用户状态实体和用户特征实体进行关系抽取,得到所述用户状态实体和用户特征实体之间的关联关系;
将所述用户状态实体和用户特征实体表示为顶点,并将有关联关系的用户状态实体和用户特征实体所对应的顶点之间建边,生成知识图谱。
9.根据权利要求1所述的方法,其特征在于,所述当所述目标答案指向所述决策树中的叶子节点时,展示与指向的所述叶子节点所对应的用户状态相应的建议信息包括:
当所述目标答案指向所述决策树中的第一叶子节点时,展示与所述第一叶子节点所对应的第一用户状态相应的第一建议信息;
当所述目标答案指向所述决策树中的第二叶子节点时,展示与所述第二叶子节点所对应的第二用户状态相应的第二建议信息;
其中,所述第一用户状态不同于所述第二用户状态。
10.根据权利要求1至9中任一项所述的方法,其特征在于,所述建议信息是通过建议信息获取步骤得到;所述建议信息获取步骤包括:
确定与指向的所述叶子节点对应的用户状态;
根据选定的各所述目标答案和所述用户状态,进行风险评估;
确定与风险评估得到的风险评估结果对应的建议模板;
将选定的所述目标答案填充至所述建议模板中的预设槽位中,生成最终的建议信息。
11.一种信息查询方法,其特征在于,所述方法包括:
展示包括用户健康关联问题和相应候选答案的健康信息查询界面;所述用户健康关联问题,对应于预先构建的决策树中的用户特征节点;所述决策树,是基于医疗知识图谱中的用户特征和用户健康状态之间的关联关系构建得到;所述用户特征,是与用户健康状态相关的特征;所述决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户健康状态的节点;
当获取到从所述候选答案中选定的目标答案、且所述目标答案指向决策树中的非叶子节点时,展示与所述目标答案在所述决策树中所指向的用户特征节点对应的用户健康关联问题用户特征关联问题以及相应的候选答案;
当所述目标答案指向所述决策树中的叶子节点时,展示与指向的所述叶子节点所对应的用户健康状态相应的医疗建议信息。
12.一种信息查询装置,其特征在于,所述装置包括:
查询模块,用于展示包括用户特征关联问题和相应候选答案的信息查询界面;所述用户特征关联问题,对应于预先构建的决策树中的用户特征节点;所述决策树,是基于知识图谱中的用户特征和用户状态之间的关联关系构建得到;所述决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户状态的节点;
所述查询模块还用于当获取到从所述候选答案中选定的目标答案、且所述目标答案指向决策树中的非叶子节点时,展示与所述目标答案在所述决策树中所指向的用户特征节点对应的用户特征关联问题以及相应的候选答案;
建议指导模块,用于当所述目标答案指向所述决策树中的叶子节点时,展示与指向的所述叶子节点所对应的用户状态相应的建议信息。
13.一种信息查询装置,其特征在于,所述装置包括:
查询模块,用于展示包括用户健康关联问题和相应候选答案的健康信息查询界面;所述用户健康关联问题,对应于预先构建的决策树中的用户特征节点;所述决策树,是基于医疗知识图谱中的用户特征和用户健康状态之间的关联关系构建得到;所述用户特征,是与用户健康状态相关的特征;所述决策树中的非叶子节点和叶子节点,分别为用户特征节点和对应于用户健康状态的节点;
所述查询模块还用于当获取到从所述候选答案中选定的目标答案、且所述目标答案指向决策树中的非叶子节点时,展示与所述目标答案在所述决策树中所指向的用户特征节点对应的用户健康关联问题用户特征关联问题以及相应的候选答案;
建议指导模块,用于当所述目标答案指向所述决策树中的叶子节点时,展示与指向的所述叶子节点所对应的用户健康状态相应的医疗建议信息。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
CN202010492461.0A 2020-06-03 2020-06-03 信息查询方法、装置、计算机设备和存储介质 Active CN111651579B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010492461.0A CN111651579B (zh) 2020-06-03 2020-06-03 信息查询方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010492461.0A CN111651579B (zh) 2020-06-03 2020-06-03 信息查询方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111651579A true CN111651579A (zh) 2020-09-11
CN111651579B CN111651579B (zh) 2023-05-09

Family

ID=72347532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010492461.0A Active CN111651579B (zh) 2020-06-03 2020-06-03 信息查询方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111651579B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307174A (zh) * 2020-11-20 2021-02-02 深圳壹账通创配科技有限公司 多平台数据整合方法、装置、计算机设备及可读存储介质
CN112434147A (zh) * 2020-12-02 2021-03-02 北京沃东天骏信息技术有限公司 答复信息生成方法、装置、电子设备和计算机可读介质
CN112859822A (zh) * 2021-04-25 2021-05-28 北京邮电大学 基于人工智能的设备健康分析及故障诊断的方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030163447A1 (en) * 2002-02-28 2003-08-28 Monika Sandman Method and tool for assignment of item number by mapping of classification and generation of a decision tree
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统
CN107357849A (zh) * 2017-06-27 2017-11-17 北京百度网讯科技有限公司 基于测试类应用的交互方法和装置
CN109273101A (zh) * 2018-09-05 2019-01-25 百度在线网络技术(北京)有限公司 基于决策树的人机交互方法、装置、计算机设备及介质
CN110399496A (zh) * 2019-07-02 2019-11-01 厦门耐特源码信息科技有限公司 一种基于cr决策树的知识图谱构建方法
CN110766272A (zh) * 2019-09-11 2020-02-07 国网浙江省电力有限公司杭州供电公司 基于id3决策树算法的电力业务协同分类方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030163447A1 (en) * 2002-02-28 2003-08-28 Monika Sandman Method and tool for assignment of item number by mapping of classification and generation of a decision tree
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统
CN107357849A (zh) * 2017-06-27 2017-11-17 北京百度网讯科技有限公司 基于测试类应用的交互方法和装置
CN109273101A (zh) * 2018-09-05 2019-01-25 百度在线网络技术(北京)有限公司 基于决策树的人机交互方法、装置、计算机设备及介质
CN110399496A (zh) * 2019-07-02 2019-11-01 厦门耐特源码信息科技有限公司 一种基于cr决策树的知识图谱构建方法
CN110766272A (zh) * 2019-09-11 2020-02-07 国网浙江省电力有限公司杭州供电公司 基于id3决策树算法的电力业务协同分类方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LAN HUANG 等: "Towards smart healthcare management based on knowledge graph technology" *
M. SACHAN 等: "Using Abstract Information and Community Alignment Information for Link Prediction" *
孙晨 等: "面向企业知识图谱构建的中文实体关系抽取" *
龚乐君 等: "基于决策树的乳腺癌病历文本的挖掘与决策" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307174A (zh) * 2020-11-20 2021-02-02 深圳壹账通创配科技有限公司 多平台数据整合方法、装置、计算机设备及可读存储介质
CN112434147A (zh) * 2020-12-02 2021-03-02 北京沃东天骏信息技术有限公司 答复信息生成方法、装置、电子设备和计算机可读介质
CN112859822A (zh) * 2021-04-25 2021-05-28 北京邮电大学 基于人工智能的设备健康分析及故障诊断的方法及系统

Also Published As

Publication number Publication date
CN111651579B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
US9990380B2 (en) Proximity search and navigation for functional information systems
CN111785368A (zh) 基于医疗知识图谱的分诊方法、装置、设备及存储介质
CN111651579B (zh) 信息查询方法、装置、计算机设备和存储介质
CN112863630A (zh) 基于数据和知识的个性化精准医疗问答系统
CN112015917A (zh) 基于知识图谱的数据处理方法、装置及计算机设备
US20190057773A1 (en) Method and system for performing triage
Gupta et al. PCA-RF: an efficient Parkinson's disease prediction model based on random forest classification
WO2023029506A1 (zh) 病情分析方法、装置、电子设备及存储介质
CN111666477A (zh) 一种数据处理方法、装置、智能设备及介质
WO2023178971A1 (zh) 就医的互联网挂号方法、装置、设备及存储介质
CN115688760B (zh) 一种智能化导诊方法、装置、设备及存储介质
CN111370102A (zh) 科室导诊方法、装置以及设备
JP6908977B2 (ja) 医療情報処理システム、医療情報処理装置及び医療情報処理方法
CN113707299A (zh) 基于问诊会话的辅助诊断方法、装置及计算机设备
KR20220070398A (ko) 임상시험 데이터 매칭 방법 및 장치
CN111696656A (zh) 一种互联网医疗平台的医生评价方法、装置
Chandrasekar et al. Lung cancer disease detection using service-oriented architectures and multivariate boosting classifier
CN113722507A (zh) 基于知识图谱的住院费用预测方法、装置及计算机设备
CN111403011B (zh) 挂号科室推送方法、装置、系统、电子设备及存储介质
CN111339252B (zh) 一种搜索方法、装置及存储介质
WO2021139271A1 (zh) 基于fm模型的医学热点的预测方法、装置和计算机设备
CN113536784A (zh) 文本处理方法、装置、计算机设备和存储介质
CN116956934A (zh) 任务处理方法、装置、设备及存储介质
CN112151187B (zh) 信息查询方法、装置、计算机设备和存储介质
WO2022217715A1 (zh) 相似患者的识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant