CN111008269A - 数据处理方法及装置、存储介质及电子终端 - Google Patents

数据处理方法及装置、存储介质及电子终端 Download PDF

Info

Publication number
CN111008269A
CN111008269A CN201911107944.8A CN201911107944A CN111008269A CN 111008269 A CN111008269 A CN 111008269A CN 201911107944 A CN201911107944 A CN 201911107944A CN 111008269 A CN111008269 A CN 111008269A
Authority
CN
China
Prior art keywords
data
matching result
matching
result
consultation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911107944.8A
Other languages
English (en)
Inventor
白先兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201911107944.8A priority Critical patent/CN111008269A/zh
Publication of CN111008269A publication Critical patent/CN111008269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开涉及计算机技术领域,具体涉及一种数据处理方法、一种数据处理装置、一种存储介质以及一种电子终端。所述方法包括:获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据;对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果;以及利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果;结合所述第一匹配结果与第二匹配结果生成咨询答复结果。本方法可以为用户提供更加精准的咨询答复结果。

Description

数据处理方法及装置、存储介质及电子终端
技术领域
本公开涉及计算机技术领域,具体涉及一种数据处理方法、一种数据处理装置、一种存储介质以及一种电子终端。
背景技术
随着互联网的快速发展,人们可以通过网络处理更多的事务,例如购物、问题咨询、办理行政事务等等。
现有技术中,用户还可以通过互联网对疾病进行咨询,进行网上问诊。现有的咨询系统中,大多采用基于问答库检索用户问题答案的方式。问答库是根据收集的问题、答案等数据整理后存储的问答库。当客户提问时,用一定的检索算法或相似度算法去问答库中搜索该问题的答案,返回最为匹配的答案。当这样的方式无法针对用户的个人特点进行解答;对于不同的问题,可能会给出相同的答案,无法实现精准的解答。或者,现有的咨询系统中还包括采用人工客服的方式,但客服人员往往没有足够的专业知识,也无法提供专业的解答。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种数据处理方法、一种数据处理装置、一种存储介质以及一种电子终端,实现实时的根据用户的咨询请求提供精准的答复结果,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种数据处理方法,包括:
获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据;
对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果;以及
利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果;
结合所述第一匹配结果与第二匹配生成咨询答复结果。
在本公开的一种示例性实施例中,所述咨询请求还包括图像数据;所述方法还包括:
对所述图像数据进行识别以提取图像特征数据,并利用所述图像特征数据与目标知识图谱进行匹配以获取第三匹配结果;
结合所述第三匹配结果与所述第一匹配结果、第二匹配生成咨询答复结果。
在本公开的一种示例性实施例中,所述结合所述第三匹配结果与所述第一匹配结果、第二匹配生成咨询答复结果,包括:
根据所述第一匹配结果、第二匹配结果和第三匹配结果的匹配交集生成答复内容;
根据所述答复内容提取对应的答复模板,并根据所述答复模板和所述答复内容生成所述咨询答复结果。
在本公开的一种示例性实施例中,所述接收终端的咨询请求,包括:
接收终端发送的用户描述数据,并向终端发送一体征数据采集指令,以用于所述终端在接收到所述征数据采集指令后,激活与所述终端相关联的可穿戴设备,并利用所述可穿戴设备采集所述体征数据。
在本公开的一种示例性实施例中,所述方法还包括:预先构建所述知识图谱,包括:
获取样本数据,对所述样本数据进行识别以提取实体信息、属性信息和关系信息;
根据提取的所述实体信息、属性信息和关系信息构建所述目标知识图谱。
在本公开的一种示例性实施例中,所述样本数据还包括图像样本和体征数据样本;所述方法还包括:
对所述图像样本进行识别,以根据识别结果标记所述图像样本并获取对应的特征描述信息;以及
根据所述图样样本的标记以及特征描述信息和所述体征数据与所述实体之间的关系,将所述图像样本和所述体征数据样本添加至所述目标知识图谱。
在本公开的一种示例性实施例中,所述方法还包括:
按预设规则对所述知识图谱进行评估,以清除可信度低于预设阈值的实体、属性信息和关系信息。
根据本公开的第二方面,提供一种数据处理装置,包括:
咨询请求接收模块,用于获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据;
第一匹配结果生成模块,用于对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果;以及
第二匹配结果生成模块,用于利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果;
答复结果生成模块,用于结合所述第一匹配结果与第二匹配结果生成咨询答复结果。
根据本公开的第三方面,提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的数据处理方法。
根据本公开的第四方面,提供一种电子终端,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述的数据处理方法
本公开的一种实施例所提供的数据处理方法中,通过预先构建目标知识图谱,并在接收到终端的咨询请求后,可以根据接收的用户描述数据所包含的文本特征数据,以及接收的体征数据分别与目标知识图谱进行匹配来获取第一匹配结果和第二匹配结果,再根据第一匹配结果和第二匹配结果来生成对应的咨询答复结果。通过实时采集用户的体征数据,并将用户描述数据结合体征数据对用户咨询的问题进行解答,从而为用户提供更加精准的咨询答复结果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出本公开示例性实施例中一种数据处理方法的流程示意图;
图2示意性示出本公开示例性实施例中另一种数据处理方法的流程示意图;
图3示意性示出本公开示例性实施例中一种构建知识图谱的方法的流程示意图;
图4示意性示出本公开示例性实施例中一种数据处理装置的组成示意图;
图5示意性示出本公开示例性实施例中一种电子设备的组成示意图;
图6示意性示出本公开示例性实施例中一种程序产品的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
目前,口腔疾病越来越多,而口腔医生相对较少。民众对口腔疾病咨询的需求越来多,当有口腔问题的时候,很难挂上号,经常得不到及时的医治。或者,患者根据自己的口腔情况,去网上查找症状,利用有限的知识自行判断口腔的治疗方案,这样有可能会造成得到错误的治疗,导致口腔问题更加严重。现有技术中存在一些咨询服务,可以但人工服务的客服人员大多不具备专业的口腔医学知识,往往不能给出专业的解答,他们主要是提供给客户咨询口腔挂号预约等功能,或者售后服务。或者,现有的口腔咨询系统服务应用大多基于问答库的检索然后回答。问答库是根据收集的问题、答案,整理后存储问题和答案,当客户提问时,用一定的检索算法及相似度算法去问答库中搜索该问题的答案,返回最为匹配的答案。现有的技术方案无法针对用户的特点进行个性化回答,对于不同的情况,往往给出相同的解答。而且,答复结果可能不准确。
针对现有技术存在的问题,本示例实施方式中首先提供了一种数据处理方法,可以应用于对口腔等学科的医学问题咨询,提供准确的答复。参考图1中所示,上述的数据处理方法可以包括以下步骤:
步骤S11,获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据;
步骤S12,对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果;以及
步骤S13,利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果;
步骤S14,结合所述第一匹配结果与第二匹配结果生成咨询答复结果。
本示例实施方式所提供的数据处理方法,通过预先构建目标知识图谱,并在接收到终端的咨询请求后,可以根据接收的用户描述数据所包含的文本特征数据,以及接收的体征数据分别与目标知识图谱进行匹配来获取第一匹配结果和第二匹配结果,再根据第一匹配结果和第二匹配结果来生成对应的咨询答复结果。通过实时采集用户的体征数据,并将用户描述数据结合体征数据对用户咨询的问题进行解答,从而为用户提供更加精准的咨询答复结果。
下面,将结合附图及实施例对本示例实施方式中的数据处理方法中各个步骤进行更详细的说明。
步骤S11,获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据。
本示例实施方式中,上述的数据处理方法可以在服务器端执行,或者,也可以在服务器端与终端设备协作执行。可以应用于对口腔、骨科、内科、神经学科或者美容等学科的医学问题的咨询。以下以应用于口腔学科相关医学问题的咨询为例,对本方案进行详细说明。
本示例实施方式中,还可以为用户侧提供一与服务器端进行数据通讯的智能终端设备,并在终端设备提供一交互界面,用户可以在交互界面上提交咨询请求。此外,终端设备还可以预先与一可穿戴设备建立数据连接。例如,可穿戴设备可以是智能手环、智能手表等智能检测设备,可以用于检测用户当前的体征数据,例如体温、血压、脉搏以及心率等参数。
举例来说,用户可以在终端侧输入用户描述数据,用于描述描述症状信息或者感知信息,或者是表达康复相关的问题。例如,用户可以通过语音或者文本的形式输入用户描述数据。
同时,还可以通过可穿戴设备来采集用户当前的体征数据。在终端侧,根据用户输入的用户描述数据以及实时采集的体征数据生成咨询请求,并发送至服务器端。此外,咨询请求还可以包括用户id或者终端id,以及服务器的地址等参数。
本示例实施方式中,可以是通过服务器端的控制指令来采集体征数据。具体来说,终端侧可以根据用户描述数据生成一咨询请求,并发送至服务器端。
服务器端接收终端发送的用户描述数据,并向终端发送一体征数据采集指令,以用于所述终端在接收到所述征数据采集指令后,激活与所述终端相关联的可穿戴设备,并利用所述可穿戴设备采集所述体征数据。并将采集的体征数据发送至服务器端,从而使得服务器端获取用户的用户描述数据和体征数据。
或者,在本公开的一些示例性实施例中,还可以是由终端设备控制采集体征数据。具体来说,当用户输入用户描述数据后,终端可以响应用户描述数据的输入完成状态,生成一体征数据采集指令,并根据才体征数据采集指令激活可穿戴设备,从而采集用户当前的体征数据。
此外,在本公开的其他示例性实施例中,上传至服务器端的体征数据也可以是可穿戴设备的历史采集数据,例如,采集的用户前一个月内的体征数据。
步骤S12,对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果。
本示例实施方式中,在用户利用语音的方式输入用户描述数据时,可以对语音数据进行识别并转换为对应的文本,再利用NLP(natural language processing,自然语言处理)算法来对转换后的文本进行识别,并抽取核心信息,作为文本特征数据。或者,若用户输入为文本格式的用户描述数据,则可以直接对文本数据进行识别,并提取核心信息。举例来说,被抽取的核心信息可以包括:咨询对象的年龄、性别、病史、用药历史、当前症状表现等等。并对该些核心信息进行识别,抽取其中的实体信息、属性信息以及关系信息等等。例如,被抽取的核心信息可以包括:牙齿损坏、损坏牙齿位置、伴随牙痛的症状,以及患者年龄和性别,及一段时间内的饮食信息等等。
在获取该些信息后,便可以将其与预先获取的口腔疾病对应的目标知识图谱进行比对,获取该些信息中包含的实体、属性以及关系信息与目标知识图谱之间的匹配范围,根据匹配内容所对应的子图范围生成用户描述数据与目标知识图谱之间的第一匹配结果。或者,在评估第一匹配结果时,还可以通过计算文本相似度的方式进行比对和确认匹配结果。
或者,在匹配时,也可以将实体信息和关系信息转换为对应的实体向量和关系向量数据,从而可以利用向量数据进行内容匹配。
步骤S13,利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果。
本示例实施方式中,还可以利用采集的用户的体征数据,与目标知识图谱中包含的体征信息进行匹配,获取与用户体征数据所匹配的目标知识图谱的内容和范围,并根据匹配内容对应的子图范围生成第二匹配结果。具体来说,该第二匹配结果可以包括匹配的体征数据,以及与体征数据关联的实体、属性以及关系信息。
在本公开的一些示例性实施方式中,上述的利用文本特征数据与目标知识图谱和利用体征数据与目标知识图进行匹配的方法可以同时执行,从而同时获取第一匹配结果和第二匹配结果。
步骤S14,结合所述第一匹配结果与第二匹配结果生成咨询答复结果。
本示例实施方式中,在获取第一匹配结果和第二匹配结果后,便可以将两个匹配结果对应的子图范围进行比对,从而获取相互重叠的子图部分,并将该重叠部分作为咨询答复结果。或者,也可以根据第一匹配结果中包含的实体、属性和关系数据,与第二匹配结果中包含的实体、属性和关系数据,在两数据范围之间取交集,并将交集包含的实体、属性和关系信息作为咨询答复结果。
在本公开的其他示例性实施例中,咨询请求中还可以包含用户提交的图像数据。参考图2所示,具体来说,数据处理方法可以包括:
步骤S21,获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据、体征数据以及图像数据;
步骤S22,对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果;以及
步骤S23,利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果;
步骤S24,对所述图像数据进行识别以提取图像特征数据,并利用所述图像特征数据与目标知识图谱进行匹配以获取第三匹配结果;
步骤S25,结合所述第三匹配结果与所述第一匹配结果、第二匹配生成咨询答复结果。
本示例实施方式中,用户在提交咨询请求时,还可以对口腔疾病的病灶处进行拍摄,获取相关的图像数据,并将图像数据和用户描述数据、体征数据进行整理和打包,发送至服务器端。例如,用户可以通过终端设备自带的摄像组件或者外接的摄像组件进行拍摄,获取图像数据。
服务器端在接收到图像数据后,可以对图像进行识别,提取对应的图像特征数据,其中,图像特征数据可以包括图像的描述信息、标识或者症状描述信息等内容。举例来说,可以预先利用已标记的图像样本训练一图像识别模型,服务器端在接收到用户的图像数据后可以调用该图像识别模型对图像进行识别并提取特征数据。图像识别模型的训练采用常规方法即可实现,本公开对此不做特殊限定。
在获取图像特征数据后,再将图像特征数据与目标知识图谱中的图像数据进行对比,获取目标知识图谱中与图像特征数据相匹配的第三匹配结果。其中,第三匹配结果可以包括图像、与图像关联的实体信息、属性信息以及关系信息等。
在获取第一匹配结果、第二匹配结果和第三匹配结果后,便可以将三个匹配结果的数据内容进行比对,获取三个匹配结果的数据交集,并将该数据交集作为咨询答复结果。
此外,在获取答复内容后,还可以根据答复内容从模板库中选定对应的模板,在将答复内容添加至模板中,生成咨询答复结果并发送至终端。
举例来说,答复内容可以包括实体信息、属性信息和关系信息描述的信息,例如,可以是口腔中疾病的诊断结果、疾病等级、当前症状表现、治疗方案以及图像等;还可以包括是否需要检查、检查内容等等。将该些信息添加至指定的模板中,生成格式化的咨询答复结果,并反馈至用户。
或者,在本公开的其他示例性实施方式中,用户提交的咨询请求中也可以仅包含用户描述数据和图像数据,从而使服务器端可以根据用户描述数据和图像数据中包含的实体、属性和关系信息进行数据匹配,并生成对应的咨询答复结果。
在本公开的一些示例性实施方式中,还可以预先构建某一疾病或者某一学科对应目标知识图谱。举例来说,对于口腔学科而言,可以预先构建口腔学科的目标知识图谱。参考图3所示,具体可以包括:
步骤S31,获取样本数据,对所述样本数据进行识别以提取实体信息、属性信息和关系信息。
本示例实施方式中,以口腔学科为例,样本数据可以包括:病例数据、就诊数据、牙片图像,以及专业书籍、论文等等。其中,病例数据和就诊数据可以包括患者的年龄、性别、诊断结果、检验结果、医嘱信息、药品医嘱、治疗方案、治疗过程中的用户体征信息以及生活习惯信息等数据。生活习惯信息可以包括睡眠、饮食、饮水习惯、吸烟、饮酒等等。
可以利用医学辞典对样本数据进行归一化处理,以及数据清洗、脱敏等预处理操作。再对预处理后的样本数据进行识别,抽取实体数据、属性数据和关系信息。
举例来说,实体可以包括:疾病名称、诊断结果等,例如:牙齿损坏、位置异常、牙松动或者牙龈退缩等等。关系信息可以是疾病与症状之间的关联关系,或者是不同疾病或者不同症状之间的关联关系。例如:儿童有龋齿,牙齿损坏经常伴随着牙痛的症状等,口腔溃疡的患者的生活习惯熬夜、吃刺激性食物等等。属性信息可以是体征信息、治疗方案、症状表现等等。
步骤S32,根据提取的所述实体信息、属性信息和关系信息构建所述目标知识图谱。
本示例实施方式中,在获取上述的各项数据后,可以利用在Neo4j图形数据库,以各实体数据为节点,以关系数据为边构建知识图谱。其中,节点即实体,由一个全局唯一的ID标示;关系(属性)用于连接两个节点,完成对知识图谱的构建。此外,还可以将图像数据、体征数据关联至知识图谱中对应的实体,加强个人数据与知识图谱的联系,从而获取结构化、网络化的知识体系。
此外,在构建知识图谱后,还可以对其进行评估,将知识图谱中可信度较低的关系信息、属性信息进行剔除,从而保证知识图谱的质量。
此外,在本公开的一些示例性实施方式中,上述的方法在根据用户咨询请求与目标知识图谱进行匹配时,若当前的咨询请求中的描述数据和体征数据与目标知识图谱不存在匹配结果,便可根据本次咨询请求中的描述数据中包含的相关特征、图像数据和体征数据添加至目标知识图谱中的相关位置,从而实现在模型使用的过程中对目标知识图谱的学习、完善和补充。
本公开各实施例所提供的数据处理方法中,预先构建目标学科对应的目标知识图谱,并在知识图谱中关联的个人体征数据以及图像数据等内容,从而在接收到用户的咨询请求时,可以根据用户描述信息、体征信息以及图像数据分别与目标知识图谱进行比对获取多个匹配结果,再将多个匹配结果进行对比,从而获取更加准确的咨询答复结果。通过在咨询时添加了用户的体征数据和图像数据,可以使得咨询答复结果更加贴合用户自身的实际情况,实现对咨询的精准答复。
本公开的方法可以智能为客户解答口腔问题,并准确提供相关口腔疾病知识。通过使用户输入当前自己口腔图片,可以快速了解口腔症状信息。实时采集体征数据和口腔影像图片,结合客户的语音输入,智能的为患者提供口腔问题的各种咨询。大大减少了口腔医院咨询的工作量,减少了人力投入,提升了客户满意度。
需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
进一步的,参考图4所示,本示例的实施方式中还提供了一种数据处理装置40,包括:咨询请求接收模块401、第一匹配结果生成模块402、第二匹配结果生成模块403以及答复结果生成模块404。其中:
所述咨询请求接收模块401可以用于获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据。
所述第一匹配结果生成模块402可以用于对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果。
所述第二匹配结果生成模块403可以用于利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果。
所述答复结果生成模块404可以用于结合所述第一匹配结果与第二匹配结果生成咨询答复结果。
在本示例性实施方式中,所述咨询请求还包括图像数据;所述装置40还可以包括:第三匹配结果生成模块。
所述第三匹配结果生成模块可以用于对所述图像数据进行识别以提取图像特征数据,并利用所述图像特征数据与目标知识图谱进行匹配以获取第三匹配结果;以用于结合所述第三匹配结果与所述第一匹配结果、第二匹配生成咨询答复结果。
在本示例性实施方式中,所述答复结果生成模块404可以包括:匹配单元和答复结果生成单元。其中,
所述匹配单元可以用于根据所述第一匹配结果、第二匹配结果和第三匹配结果的匹配交集生成答复内容。
所述答复结果生成单元可以用于根据所述答复内容提取对应的答复模板,并根据所述答复模板和所述答复内容生成所述咨询答复结果。
在本示例性实施方式中,所述咨询请求接收模块还包括:体征数据采集单元。
所述体征数据采集单元可以用于接收终端发送的用户描述数据,并向终端发送一体征数据采集指令,以用于所述终端在接收到所述征数据采集指令后,激活与所述终端相关联的可穿戴设备,并利用所述可穿戴设备采集所述体征数据。
在本示例性实施方式中,所述装置40还可以包括:预处理单元、知识图谱构建单元。其中,
所述预处理单元可以用于获取样本数据,对所述样本数据进行识别以提取实体信息、属性信息和关系信息。
所述知识图谱构建单元可以用于根据提取的所述实体信息、属性信息和关系信息构建所述目标知识图谱。
在本示例性实施方式中,所述样本数据还包括图像样本和体征数据样本。所述装置40还可以包括:个人数据处理单元。
所述个人数据处理单元可以用于对所述图像样本进行识别,以根据识别结果标记所述图像样本并获取对应的特征描述信息;以及根据所述图样样本的标记以及特征描述信息和所述体征数据与所述实体之间的关系,将所述图像样本和所述体征数据样本添加至所述目标知识图谱。
在本示例性实施方式中,所述装置40还可以包括:评估模块。
所述评估模块可以用于预设规则对所述知识图谱进行评估,以清除可信度低于预设阈值的实体、属性信息和关系信息。
本示例的实施方式中还提供了一种数据处理装置,可以包括:咨询请求接收模块、第一匹配结果生成模块、第二匹配结果生成模块、第三匹配结果生成模块以及答复结果生成模块。其中:
所述咨询请求接收模块可以用于获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据。
所述第一匹配结果生成模块可以用于对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果。
所述第二匹配结果生成模块可以用于利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果。
所述第三匹配结果生成模块可以用于对所述图像数据进行识别以提取图像特征数据,并利用所述图像特征数据与目标知识图谱进行匹配以获取第三匹配结果。
所述答复结果生成模块可以用于结合所述第三匹配结果与所述第一匹配结果、第二匹配结果生成咨询答复结果。
本示例的实施方式中还提供了一种数据处理装置,可以包括:咨询请求接收模块、第一匹配结果生成模块、第三匹配结果生成模块以及答复结果生成模块。其中:
所述咨询请求接收模块可以用于获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据。
所述第一匹配结果生成模块可以用于对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果。
所述第三匹配结果生成模块可以用于对所述图像数据进行识别以提取图像特征数据,并利用所述图像特征数据与目标知识图谱进行匹配以获取第三匹配结果。
所述答复结果生成模块可以用于结合所述第三匹配结果与所述第一匹配结果生成咨询答复结果。
上述的数据处理装置40中各模块的具体细节已经在对应的数据处理方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1中所示方法。
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备60(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据;
对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果;以及
利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果;
结合所述第一匹配结果与第二匹配结果生成咨询答复结果。
2.根据权利要求1所述的方法,其特征在于,所述咨询请求还包括图像数据;所述方法还包括:
对所述图像数据进行识别以提取图像特征数据,并利用所述图像特征数据与目标知识图谱进行匹配以获取第三匹配结果;
结合所述第三匹配结果与所述第一匹配结果、第二匹配生成咨询答复结果。
3.根据权利要求2所述的方法,其特征在于,所述结合所述第三匹配结果与所述第一匹配结果、第二匹配生成咨询答复结果,包括:
根据所述第一匹配结果、第二匹配结果和第三匹配结果的匹配交集生成答复内容;
根据所述答复内容提取对应的答复模板,并根据所述答复模板和所述答复内容生成所述咨询答复结果。
4.根据权利要求1所述的方法,其特征在于,所述接收终端的咨询请求,包括:
接收终端发送的用户描述数据,并向终端发送一体征数据采集指令,以用于所述终端在接收到所述征数据采集指令后,激活与所述终端相关联的可穿戴设备,并利用所述可穿戴设备采集所述体征数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:预先构建所述知识图谱,包括:
获取样本数据,对所述样本数据进行识别以提取实体信息、属性信息和关系信息;
根据提取的所述实体信息、属性信息和关系信息构建所述目标知识图谱。
6.根据权利要求5所述的方法,其特征在于,所述样本数据还包括图像样本和体征数据样本;所述方法还包括:
对所述图像样本进行识别,以根据识别结果标记所述图像样本并获取对应的特征描述信息;以及
根据所述图样样本的标记以及特征描述信息和所述体征数据与所述实体之间的关系,将所述图像样本和所述体征数据样本添加至所述目标知识图谱。
7.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:
按预设规则对所述知识图谱进行评估,以清除可信度低于预设阈值的实体、属性信息和关系信息。
8.一种数据处理装置,其特征在于,包括:
咨询请求接收模块,用于获取终端的咨询请求;其中,所述咨询请求包括:用户描述数据以及体征数据;
第一匹配结果生成模块,用于对所述用户描述数据进行解析以提取文本特征数据,并利用所述文本特征数据与目标知识图谱进行匹配以获取第一匹配结果;以及
第二匹配结果生成模块,用于利用所述体征数据与目标知识图谱进行匹配以获取第二匹配结果;
答复结果生成模块,用于结合所述第一匹配结果与第二匹配结果生成咨询答复结果。
9.一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现根据权利要求1至7中任一项所述的数据处理方法。
10.一种电子终端,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任一项所述的数据处理方法。
CN201911107944.8A 2019-11-13 2019-11-13 数据处理方法及装置、存储介质及电子终端 Pending CN111008269A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911107944.8A CN111008269A (zh) 2019-11-13 2019-11-13 数据处理方法及装置、存储介质及电子终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911107944.8A CN111008269A (zh) 2019-11-13 2019-11-13 数据处理方法及装置、存储介质及电子终端

Publications (1)

Publication Number Publication Date
CN111008269A true CN111008269A (zh) 2020-04-14

Family

ID=70113302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911107944.8A Pending CN111008269A (zh) 2019-11-13 2019-11-13 数据处理方法及装置、存储介质及电子终端

Country Status (1)

Country Link
CN (1) CN111008269A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933306A (zh) * 2020-08-19 2020-11-13 泰康保险集团股份有限公司 医疗咨询系统及方法、存储介质及电子设备
CN112185533A (zh) * 2020-10-23 2021-01-05 泰康保险集团股份有限公司 远程医疗系统及远程医疗的医生资源分配方法、存储介质
WO2021114736A1 (zh) * 2020-07-07 2021-06-17 平安科技(深圳)有限公司 医疗问诊辅助方法、装置、电子设备及介质
CN113902558A (zh) * 2021-10-12 2022-01-07 深圳格隆汇信息科技有限公司 信息的推荐方法及相关产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107242857A (zh) * 2017-06-12 2017-10-13 南开大学 基于深度学习的智能中医综合诊疗系统
CN109448838A (zh) * 2018-09-28 2019-03-08 小伍健康科技(上海)有限责任公司 一种基于深度神经网络的症状诊断方法及设备
CN109658208A (zh) * 2019-01-15 2019-04-19 京东方科技集团股份有限公司 药品的推荐方法、装置、介质和电子设备
CN109754886A (zh) * 2019-01-07 2019-05-14 广州达美智能科技有限公司 治疗方案智能生成系统、方法及可读存储介质、电子设备
CN109886740A (zh) * 2019-01-31 2019-06-14 泰康保险集团股份有限公司 医疗信息咨询方法、医疗信息咨询装置、存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107242857A (zh) * 2017-06-12 2017-10-13 南开大学 基于深度学习的智能中医综合诊疗系统
CN109448838A (zh) * 2018-09-28 2019-03-08 小伍健康科技(上海)有限责任公司 一种基于深度神经网络的症状诊断方法及设备
CN109754886A (zh) * 2019-01-07 2019-05-14 广州达美智能科技有限公司 治疗方案智能生成系统、方法及可读存储介质、电子设备
CN109658208A (zh) * 2019-01-15 2019-04-19 京东方科技集团股份有限公司 药品的推荐方法、装置、介质和电子设备
CN109886740A (zh) * 2019-01-31 2019-06-14 泰康保险集团股份有限公司 医疗信息咨询方法、医疗信息咨询装置、存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021114736A1 (zh) * 2020-07-07 2021-06-17 平安科技(深圳)有限公司 医疗问诊辅助方法、装置、电子设备及介质
CN111933306A (zh) * 2020-08-19 2020-11-13 泰康保险集团股份有限公司 医疗咨询系统及方法、存储介质及电子设备
CN112185533A (zh) * 2020-10-23 2021-01-05 泰康保险集团股份有限公司 远程医疗系统及远程医疗的医生资源分配方法、存储介质
CN112185533B (zh) * 2020-10-23 2024-07-16 泰康保险集团股份有限公司 远程医疗系统及远程医疗的医生资源分配方法、存储介质
CN113902558A (zh) * 2021-10-12 2022-01-07 深圳格隆汇信息科技有限公司 信息的推荐方法及相关产品
CN113902558B (zh) * 2021-10-12 2022-06-24 深圳格隆汇信息科技有限公司 信息的推荐方法及相关产品

Similar Documents

Publication Publication Date Title
CN110675951A (zh) 智能化的疾病诊断方法及装置、计算机设备与可读介质
CN111008269A (zh) 数据处理方法及装置、存储介质及电子终端
KR102041186B1 (ko) 진료 보조 시스템 및 방법
CN112037910B (zh) 健康信息管理方法、装置、设备及存储介质
CN111666477B (zh) 一种数据处理方法、装置、智能设备及介质
CN112863630A (zh) 基于数据和知识的个性化精准医疗问答系统
CN110021391B (zh) 一种分诊方法和装置
CN105260588A (zh) 一种健康守护机器人系统及其数据处理方法
CN112015917A (zh) 基于知识图谱的数据处理方法、装置及计算机设备
US20130311201A1 (en) Medical record generation and processing
US20210202085A1 (en) Apparatus for automatically triaging patient and automatic triage method
WO2023178971A1 (zh) 就医的互联网挂号方法、装置、设备及存储介质
CN114220537B (zh) 一种基于互联网医院的ai智能在线诊断方法及云系统
CN111933239A (zh) 数据处理的方法及装置、系统、存储介质
CN112259243B (zh) 一种基于双向GRUs的单病种临床路径构建方法及系统
CN105956412A (zh) 基于智能图文识别实现冠心病临床数据收集的系统及方法
CN117558439A (zh) 基于大语言模型的问诊交互方法、装置及相关设备
CN111383754A (zh) 医疗决策方法、医疗决策装置、电子设备及存储介质
CN111429985B (zh) 电子病历数据处理方法及系统
CN111613311A (zh) 一种智能ai导诊实现技术
CN114898860A (zh) 基于跨模态transformer的多模态焦虑症检测方法和系统
CN117438070A (zh) 基于智能语音交互的医疗问诊诊断系统
CN112750512A (zh) 数据处理方法、客户端、服务器、系统及存储介质
CN110993096A (zh) 一种脓毒血症的预警装置、设备及存储介质
WO2022141925A1 (zh) 一种智能医学服务系统、方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200414