CN110516260A - 实体推荐方法、装置、存储介质及设备 - Google Patents
实体推荐方法、装置、存储介质及设备 Download PDFInfo
- Publication number
- CN110516260A CN110516260A CN201910818361.XA CN201910818361A CN110516260A CN 110516260 A CN110516260 A CN 110516260A CN 201910818361 A CN201910818361 A CN 201910818361A CN 110516260 A CN110516260 A CN 110516260A
- Authority
- CN
- China
- Prior art keywords
- entity
- word
- entity word
- seed
- intended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种实体推荐方法、装置、存储介质及设备,在获取得到输入文本后,首先对该输入文本进行语义理解,确定搜索意图和种子实体词,在搜索意图与种子实体词相匹配,且搜索意图属于精确推荐意图时,才基于搜索意图确定实体关系,并将种子实体词映射为医疗知识图谱中的标准实体词;将医疗知识图谱中与标准实体词具有实体关系的实体词作为推荐实体进行推荐。也就是说,本申请实施例中,只有在搜索意图与种子实体词相匹配,且搜索意图属于精确推荐意图时,才基于医疗知识图谱进行实体推荐,保证了医疗实体推荐的准确性。
Description
技术领域
本申请涉及信息处理技术领域,具体涉及一种实体推荐方法、装置、存储介质及设备。
背景技术
实体推荐,是搜索引擎的常见功能,它能够利用命名实体识别(Named EntitiesRecognition,NER)算法从用户输入文本中提取实体词,然后推荐出与提取的实体词相关的最可能满足用户需求的其他实体词及其资料链接,免去了用户自己在搜索结果(即基于用户输入文本进行搜索得到的搜索结果)中寻找答案的麻烦,极大改善了用户体验。
然而,发明人在实现本申请的过程中发现,现有的实体推荐方法只考虑待推荐的实体词与搜索实体(即上述从用户输入的搜索内容中提取的实体词)的相关度。而在对于实体推荐的精确度要求非常高的医疗领域,这种推荐方法的推荐结果过于模糊,推荐错误的风险很大。因此,如何提高医疗实体推荐的准确性成为亟待解决的技术问题。
发明内容
有鉴于此,本申请实施例提供一种实体推荐方法、装置、存储介质及设备,以提高医疗实体推荐的准确性。
为实现上述目的,本申请实施例提供如下技术方案:
第一方面,提供一种实体推荐方法,包括:
获取输入文本;
对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词;
若所述搜索意图与所述种子实体词相匹配,且所述搜索意图属于精确推荐意图,则基于所述搜索意图确定实体关系,并将所述种子实体词映射为医疗知识图谱中的标准实体词;
将所述医疗知识图谱中与所述标准实体词具有所述实体关系的实体词作为推荐实体进行推荐。
第二方面,提供一种实体推荐装置,包括:
获取模块,用于获取输入文本;
理解模块,用于对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词;
确定模块,用于若所述搜索意图与所述种子实体词相匹配,且所述搜索意图属于精确推荐意图,则基于所述搜索意图确定实体关系,并将所述种子实体词映射为医疗知识图谱中的标准实体词;
推荐模块,用于将所述医疗知识图谱中与所述标准实体词具有所述实体关系的实体词作为推荐实体进行推荐。
第三方面,提供一种电子设备,包括存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如上任一项所述的实体推荐方法的各个步骤。
第四方面,提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上任意一项所述的实体推荐方法的各个步骤。
本申请实施例提供的实体推荐方法、装置、存储介质及设备,在获取得到输入文本后,首先对该输入文本进行语义理解,确定搜索意图和种子实体词,在搜索意图与种子实体词相匹配,且搜索意图属于精确推荐意图时,才基于搜索意图确定实体关系,并将种子实体词映射为医疗知识图谱中的标准实体词;将医疗知识图谱中与标准实体词具有实体关系的实体词作为推荐实体进行推荐。也就是说,本申请实施例中,只有在搜索意图与种子实体词相匹配,且搜索意图属于精确推荐意图时,才基于医疗知识图谱进行实体推荐,保证了医疗实体推荐的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的实体推荐方法的一种实现流程图;
图2为本申请实施例提供的语义理解模型的一种结构示意图;
图3为本申请实施例提供的的医疗知识图谱的局部示例图;
图4为本申请实施例提供的将种子实体词映射为医疗知识图谱中的标准实体词的一种实现流程图;
图5为本申请实施例提供的实体推荐方法的程序逻辑示意图;
图6为本申请实施例提供的实体推荐装置的一种结构示意图;
图7为本申请实施例提供的电子设备的硬件结构框图的示例图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1为本申请实施例提供的实体推荐方法的一种实现流程图,可以包括:
步骤S11:获取输入文本。
当用户想要了解医疗领域的相关信息时,可以在搜索引擎中输入医疗领域的搜索字符串,例如,用户身体不舒服或朋友不舒服时,可能会在搜索引擎中询问症状相关的信息,例如,头上长个包是怎么了。基于此,上述输入文本可以是用户输入到搜索引擎中的搜索字符串。
其中,搜索引擎可以是医疗领域的专用搜索引擎,也可以是通用的搜索引擎。
步骤S12:对上述输入文本进行语义理解,以确定搜索意图并提取种子实体词。
本申请实施例中,除了通过输入文本确定用户的搜索意图外,还从输入文本中提取实体词,由于输入文本是医疗相关的输入文本,因而,搜索意图是医疗领域的搜索意图,所提取的实体词也是医疗领域的实体词。
由于从输入文本中提取的实体词是获取要推荐的实体词一个依据,因此,为便于区分,将从输入文本中提取的实体词记为种子实体词。
可以利用预先训练好的语义理解模型对输入文本进行语义理解,从而得到搜索意图和种子实体词。
步骤S13:若搜索意图与种子实体词相匹配,且搜索意图属于精确推荐意图,则基于搜索意图确定实体关系,并将种子实体词映射为医疗知识图谱中的标准实体词。
基于搜索意图可以确定一个实体关系,也可以确定多个实体关系,具体个数由医疗知识图谱中定义的实体关系确定,若医疗知识图谱中针对该搜索意图定义了一个实体关系,则基于搜索意图确定一个实体关系,若医疗知识图谱中针对该搜索意图定义了多个实体关系,则基于搜索意图确定多个实体关系。
可选的,可以预先定义相互匹配的搜索意图和实体词间的对应关系,以及精确推荐意图。即预先定义哪个搜索意图和哪个实体词是匹配的,以及哪个搜索意图属于精确推荐意图。
例如,若搜索意图是问症状,实体词是一个医院名,显然问症状和医院名在逻辑上是冲突的,因此,问症状和医院名是不匹配的,也就不会建立问症状和医院名之间的对应关系。而如果搜索意图是问症状,实体词是一个疾病名,由于生病时通常会有一定的症状,因此,问症状和疾病名是匹配的,可以建立问症状和疾病名之间的对应关系。再例如,“找医院”就是一个精确推荐意图,需要直接精确返回医院名称。而“乳腺癌”则没有明确意图,因而,“乳腺癌”不属于精确推荐意图。
若搜索意图与种子实体之间定义了对应关系(即,种子实体词为与搜索意图具有预定义的对应关系的实体词),则可以确定搜索意图与种子实体词相匹配,否则,确定搜索意图与种子实体词不匹配。若搜索意图属于预定义的精确推荐意图,则搜索意图属于精确推荐意图。
若搜索意图与种子实体词不匹配,需要进行错误处理,即:不进行实体推荐,而是执行传统的搜索方法为用户服务。
而如果搜索意图与种子实体词匹配,但种子实体不是精确推荐意图,则进行模糊处理,即,假定同时拥有种子实体词相关的多种意图。如输入“乳腺癌”,其并没有明确意图,则同时依据“找医生”,“问疾病”等多种常见意图进行实体推荐。
可选的,基于搜索意图确定实体关系可以包括:根据预先建立的搜索意图与实体关系的对应关系,确定搜索意图对应的实体关系。例如,假设意图为“找医生”,实体词为“乳腺癌”,那么实体关系可以为“擅长医生”,那么,与“乳腺癌”这个实体词具有“擅长医生”的实体词可以为“医生姓名”,也就是说,具有“医生姓名”的这个医生是擅长处理“乳腺癌”的医生。
可选的,将种子实体词映射为医疗知识图谱中的标准实体词可以包括:根据预置的映射关系(比如,映射表)将种子实体词映射为医疗知识图谱中的标准实体词。
为了能够将种子实体正确匹配到医疗知识图谱中的节点,预先建立了词库别名映射模块,该映射模块用于将口语化的实体词映射到知识图谱中的标准实体词。具体方法是,将在用户说的医疗语料中挖掘到的口语化实体词经过实体链接(即口语化实体到标准化实体的映射关系)作为初始词库,然后经过专业人工复核保证映射的正确性。
另外,如果搜索引擎不是医疗领域的专用搜索引擎,而是一般的通用搜索引擎,则在确定搜索意图与种子实体词是否匹配,搜索意图是否属于精确推荐意图之前,可以先判断搜索意图或种子实体词是否为医疗领域的搜索意图或种子实体词,若搜索意图是医疗领域的搜索意图,和/或,种子实体词是医疗领域的实体词,再确定搜索意图与种子实体词是否匹配,搜索意图是否属于精确推荐意图。
步骤S14:将医疗知识图谱中与标准实体词具有上述实体关系的实体词作为推荐实体进行推荐。
当然,除了进行实体推荐外,还可以向用户返回基于传统的搜索方法得到的搜索结果(通常为网页链接)。
本申请实施例提供的实体推荐方法,在获取得到输入文本后,首先对该输入文本进行语义理解,确定搜索意图和种子实体词,只有在搜索意图与种子实体词相匹配,且搜索意图属于精确推荐意图时,才基于医疗知识图谱进行实体推荐,保证了医疗实体推荐的准确性。
在一可选的实施例中,上述语义理解模型的一种结构示意图如图2所示,可以包括:
基于变换器的双向编码表示(Bidirectional Encoder Representation fromTransformers,BERT)网络;
与BERT网络的第一输出单元连接的前馈神经网络,该前馈神经网络用于预测搜索意图;
与BERT网络的多个第二输出单元连接的条件随机场CRF模型,该条件随机场模型用于提取输入文本中的种子实体词。
其中,BERT网络的输入也就是语义理解模型的输入,在训练阶段,语义理解模型的输入为标注有意图标签和词槽标签的样本数据。图2中,输入query即为输入的样本数据,Toki(i=1,2,……,N)表示输入query中的第i个字,CLS和SEP为预置的标志符,BERT网络每接收到一个输入query,都会在该输入query前添加标志符CLS,在该输入query的最后添加标志符SEP,并对添加标志符后的文本进行处理,得到标志符CLS对应的隐层向量表达C,标志符SEP对应的隐层向量表达S,以及各个字对应的隐层向量表达Ti。BERT网络对应每个字都有一个输出单元,对应标志符CLS有一个输出单元,对应标志符SEP也有一个输出单元。可选的,可以采用基于google开源BERT中文预训练模型fine-tuning的方法对分诊模型进行训练。当然,也可以采用其他方法对分诊模型进行训练,这里不做具体限定。
本申请实施例中,前馈神经网络是与BERT网络的标志符CLS对应的输出单元(即第一输出单元)连接的,即前馈神经网络对标志符CLS对应的隐层向量表达进行处理,并利用分类函数(如,softmax函数)对前馈神经网络的处理结果进行处理,得到意图标签并输出。
CRF模型与输入query中的各个字对应的输出单元(每个字对应的输出单元为一个第二输出单元)连接,即CRF模型对与输入query中的各个字对应的隐层向量表达进行处理,得到各个字对应的词槽标签。一个字对应的词槽标签表征一个字属于哪个实体词。
确定各个字的词槽标签后,将相邻的具有相同词槽标签的字提取出来作为种子实体词。在一些情况下,不同的实体词之间会有重叠,例如,其中一个实体词是另一个实体词的一部分,比如,“乳腺”是“乳腺癌”的一部分,则选最长的词作为种子实体词,即选择“乳腺癌”作为种子实体词。
当然,语义理解模型中除了包括上述几个部分外,还会包含损失函数(图中未示出),通过损失函数计算预测结果与标注数据标注的标签之间的差异,从而根据差异对模型进行迭代优化训练。
本申请实施例中,使用强大的BERT意图词槽联合模型进行query理解,有非常高的准确率和召回率,进一步提高实体推荐的准确性。
在一可选的实施例中,搜索意图至少可以包括:问相关疾病意图、问症状意图和找医生意图中的任意一项。
问相关疾病意图通常是指用户知道具体的疾病,想查询与该疾病相关的信息,例如,用户输入文本是:皮肤过敏应该注意什么?或者怎么避免皮肤过敏,等等,则搜索意图是:问相关疾病意图,这里的相关疾病是指皮肤过敏。
问症状意图通常是用户不知道是什么疾病,只知道症状,可能会通过症状信息查找病因或属于哪种疾病,例如,用户输入文本是:头上长个红疙瘩是什么原因?则搜索意图为问症状意图,这里的症状是指头上长个红疙瘩。
找医生意图通常是用户想去医院就诊了,此时用户可能会通过输入疾病名称和/或症状信息搜索对症的医生,例如,用户输入文本为:治疗青光眼最专业的医生。
本申请实施例中,为了适配医疗领域的实体推荐,对推荐策略进行了医疗领域的深度定制。具体可以体现为:
可选的,当搜索意图为问相关疾病意图时,基于搜索意图确定实体关系可以包括:
基于搜索意图确定发病病理相关关系和发病部位相关关系。
如图3所示,为本申请实施例提供的医疗知识图谱的局部示例图。本申请实施例中,对应问相关疾病意图,采取部位相关和病理相关双策略,如针对“感染性皮疹”这个疾病实体词,依据部位相关性可推荐实体词“皮肤过敏”,依据病理相关性可以推荐实体词“支原体肺炎”。在医疗知识图谱中,部位相关可以转化为两度搜索策略,即种子实体->部位,然后部位->推荐实体,病理相关的推荐策略同理,即种子实体->病理,然后病理->推荐实体。
可选的,当搜索意图为问症状意图,种子实体为症状的实体词时,上述将种子实体词映射为医疗知识图谱中的标准实体词的一种实现流程图如图4所示可以包括:
步骤S41:从医疗知识图谱中的标准实体词中选取候选实体词,该候选实体词与种子实体词的相似度最大。
步骤S42:将候选实体词中的部位实体词与种子实体词中的部位实体词进行匹配,若匹配结果满足匹配条件,将种子实体词映射为候选实体词。
由于口语化的症状实体词非常繁杂,因此用预先建立的映射关系(如映射表)处理所有症状实体词不现实,即无法穷举所有的症状实体词,这就容易出现不能映射的情况,导致实体词召回率较低,进而降低了实体推荐的准确度。为了进一步提高实体推荐的准确率,本申请实施例中,采取相似度策略和知识强约束的混合策略来进行实体链接,具体来说,
可以使用fasttext平均词向量计算标准实体词与种子实体词余弦相似度,根据余弦相似度选择与种子实体词最相似的一个标准实体词作为候选实体词。然后,再从候选实体词中提取部位实体词(为便于区分,记为第一部位实体词),从种子实体词中提取部位实体词(为便于区分,记为第二部位实体词),将提取的第一部位实体词和第二部位实体词进行匹配,若匹配结果满足匹配条件(如,匹配度大于阈值),说明候选实体词是正确的,将种子实体词映射为候选实体词。若匹配结果不满足匹配条件,则认为候选实体为错误的,则不进行实体词推荐,仅执行传统的搜索方法。例如,假设种子实体词是“头上长包”,而候选实体词是“脚上长包”,由于“头上长包”中的部位实体词是“头”,而“脚上长包”中的部位实体词是“脚”,二者的部位实体词不同,因此,候选实体词“脚上长包”是错误的,不能将“头上长包”映射为“脚上长包”。而如果候选实体词是“头上长疙瘩”,由于“头上长包”中的部位实体词是“头”,“头上长疙瘩”中的部位实体词也是“头”,二者的部位实体词相同,因此,候选实体词“头上长疙瘩”是正确的,可以将“头上长包”映射为“头上长疙瘩”。
也就说,本申请实施例中,若搜索意图为问症状意图可以采用相似度策略和知识强约束的混合策略来将种子实体词映射为医疗知识图谱中的标准实体词;若搜索意图不是问症状意图,则可以采用预设的映射关系来将种子实体词映射为医疗知识图谱中的标准实体词。在保证数据处理效率的同时提高实体推荐的准确率。
在一可选的实施例中,当搜索意图为找医生意图,种子实体词包括症状实体词,不包括疾病实体词时,基于搜索意图确定实体关系的一种实现方式可以为:
基于问症状意图,确定第一实体关系,并在医疗知识图谱中确定与种子实体(具体是种子实体词中的症状实体词)具有第一实体关系的疾病实体词。第一实体关系即是与问症状意图对应的实体关系。该第一实体关系表征症状实体词所述的症状是属于哪种疾病。
基于找医生意图,确定第二实体关系。该第二实体关系可以是疾病处理相关关系,疾病处理相关关系可以是指医生处理疾病的经验,专业度,知名度,职称等
相应的,将医疗知识图谱中与标准实体词具有实体关系的实体词作为推荐实体进行推荐,包括:
将医疗知识图谱中与疾病实体词具有第二实体关系的医生姓名实体词作为推荐实体进行推荐。
本申请实施例中,针对搜索意图为找医生意图,而种子实体词只有症状实体词而没有疾病实体词的情况,分解为“问症状”和“找医生”两个阶段,先根据“问症状”意图策略确定疾病实体词,然后,根据疾病实体词来推荐合适的医生。
综上,本申请实施例中,为确保实体推荐的准确性,在实体链接阶段选择利用专业词库映射的方法,在实体推荐阶段采取深度定制策略,能够更有效、更准确地处理多种搜索意图,提高了医疗实体推荐的准确性和有用性,增强可解释性,降低风险。
当然,上述只是举例说明了在医疗领域进行深度定制的三种搜索意图,本申请实施例中,搜索意图并不限于上述三种,还可以包括其它搜索意图,例如找医院、问治疗药物等,这里不再一一举例说明。
请参阅图5,图5为本申请实施例提供的实体推荐方法的程序逻辑示意图,可以包括:
在获得搜索意图和种子实体词后,先判断搜索意图和种子实体词是否匹配,若搜索意图和种子实体词匹配,则判断搜索意图是否为精确推荐意图,若搜索意图是精确推荐意图,则基于搜索意图,以及医疗知识图谱中与种子实体对应的标准实体在医疗知识图谱中选择需要推荐的实体词(对应图5中的“实体词选择策略”);若搜索意图不是精确推荐意图,则进行模糊处理,即,假定同时拥有种子实体词相关的多种意图,然后基于该多种意图,以及医疗知识图谱中与种子实体对应的标准实体在医疗知识图谱中选择需要推荐的实体词(对应图5中的“实体词选择策略”)。另外,在执行实体词选择策略之前,需要先将种子实体通过别名映射转换为图谱节点,实体词选择策略是根据图谱节点处的实体词进行实体推荐。若搜索意图和种子实体词不匹配,则进行错误处理。
与方法的实施例相对应,本申请还提供一种实体推荐装置,本申请实施例提供的实体推荐装置的一种结构示意图如图6所示,可以包括:
获取模块61,理解模块62,确定模块63和推荐模块64;其中,
获取模块61用于获取输入文本;
理解模块62用于对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词;
确定模块63用于若所述搜索意图与所述种子实体词相匹配,且所述搜索意图属于精确推荐意图,则基于所述搜索意图确定实体关系,并将所述种子实体词映射为医疗知识图谱中的标准实体词;
推荐模块64用于将所述医疗知识图谱中与所述标准实体词具有所述实体关系的实体词作为推荐实体进行推荐。
本申请实施例提供的实体推荐装置,在获取得到输入文本后,首先对该输入文本进行语义理解,确定搜索意图和种子实体词,只有在搜索意图与种子实体词相匹配,且搜索意图属于精确推荐意图时,才基于医疗知识图谱进行实体推荐,保证了医疗实体推荐的准确性。
在一可选的实施例中,理解模块62具体可以用于:将所述输入文本输入预置的语义理解模型,得到所述搜索意图和种子实体词;其中,所述语义理解模型包括:
基于变换器的双向编码表示BERT网络;
与所述BERT网络的第一输出单元连接的前馈神经网络,所述前馈神经网络用于预测搜索意图;
与所述BERT网络的多个第二输出单元连接的条件随机场模型,所述条件随机场模型用于提取所述输入文本中的种子实体词。
在一可选的实施例中,所述搜索意图与所述种子实体词相匹配可以包括:
所述种子实体词为与所述搜索意图具有预定义的对应关系的实体词。
在一可选的实施例中,所述搜索意图至少包括:问相关疾病意图、问症状意图和找医生意图中的任意一项。
在一可选的实施例中,当所述搜索意图为问相关疾病意图时,确定模块63基于所述搜索意图确定实体关系时,具体可以用于:
基于所述搜索意图确定发病病理相关关系和发病部位相关关系。
在一可选的实施例中,当所述搜索意图为问症状意图,所述种子实体词为症状实体词时,确定模块63将所述种子实体词映射为医疗知识图谱中的标准实体词时,具体可以用于:
从所述医疗知识图谱中的标准实体词中选取候选实体词,所述候选实体词与所述种子实体词的相似度最大;
将所述候选实体词中的部位实体词与所述种子实体词中的部位实体词进行匹配,若匹配结果满足匹配条件,将所述种子实体词映射为所述候选实体词。
在一可选的实施例中,当所述搜索意图为找医生意图,所述种子实体词包括症状实体词,不包括疾病实体词时,所述基于所述搜索意图确定实体关系,包括:
基于问症状意图,确定第一实体关系,并在所述医疗知识图谱中确定与所述种子实体具有第一实体关系的疾病实体词。
基于所述找医生意图,确定第二实体关系,以确定与所述疾病实体词具有所述第二实体关系的医生姓名实体词。
本申请实施例还提供一种电子设备,该电子设备可以是终端设备(如计算机),也可以是服务器或服务器集群,该电子设备可以配置上述实体推荐装置。本申请实施例提供的电子设备的硬件结构框图的示例图如图7所示,可以包括:
处理器1,通信接口2,存储器3和通信总线4;
其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,处理器1具体用于执行存储器中存储的程序,执行如下步骤:
获取输入文本;
对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词;
若所述搜索意图与所述种子实体词相匹配,且所述搜索意图属于精确推荐意图,则基于所述搜索意图确定实体关系,并将所述种子实体词映射为医疗知识图谱中的标准实体词;
将所述医疗知识图谱中与所述标准实体词具有所述实体关系的实体词作为推荐实体进行推荐。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种可读存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
获取输入文本;
对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词;
若所述搜索意图与所述种子实体词相匹配,且所述搜索意图属于精确推荐意图,则基于所述搜索意图确定实体关系,并将所述种子实体词映射为医疗知识图谱中的标准实体词;
将所述医疗知识图谱中与所述标准实体词具有所述实体关系的实体词作为推荐实体进行推荐。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的核心思想或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种实体推荐方法,其特征在于,包括:
获取输入文本;
对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词;
若所述搜索意图与所述种子实体词相匹配,且所述搜索意图属于精确推荐意图,则基于所述搜索意图确定实体关系,并将所述种子实体词映射为医疗知识图谱中的标准实体词;
将所述医疗知识图谱中与所述标准实体词具有所述实体关系的实体词作为推荐实体进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词,包括:
将所述输入文本输入预置的语义理解模型,得到所述搜索意图和种子实体词;其中,所述语义理解模型包括:
基于变换器的双向编码表示BERT网络;
与所述BERT网络的第一输出单元连接的前馈神经网络,所述前馈神经网络用于预测搜索意图;
与所述BERT网络的多个第二输出单元连接的条件随机场模型,所述条件随机场模型用于提取所述输入文本中的种子实体词。
3.根据权利要求1所述的方法,其特征在于,所述搜索意图与所述种子实体词相匹配包括:
所述种子实体词为与所述搜索意图具有预定义的对应关系的实体词。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述搜索意图至少包括:问相关疾病意图、问症状意图和找医生意图中的任意一项。
5.根据权利要求4所述的方法,其特征在于,当所述搜索意图为问相关疾病意图时,所述基于所述搜索意图确定实体关系包括:
基于所述搜索意图确定发病病理相关关系和发病部位相关关系。
6.根据权利要求4所述的方法,其特征在于,当所述搜索意图为问症状意图,所述种子实体词为症状实体词时,所述将所述种子实体词映射为医疗知识图谱中的标准实体词,包括:
从所述医疗知识图谱中的标准实体词中选取候选实体词,所述候选实体词与所述种子实体词的相似度最大;
将所述候选实体词中的部位实体词与所述种子实体词中的部位实体词进行匹配,若匹配结果满足匹配条件,将所述种子实体词映射为所述候选实体词。
7.根据权利要求4所述的方法,其特征在于,当所述搜索意图为找医生意图,所述种子实体词包括症状实体词,不包括疾病实体词时,所述基于所述搜索意图确定实体关系,包括:
基于问症状意图,确定第一实体关系,并在所述医疗知识图谱中确定与所述种子实体具有所述第一实体关系的疾病实体词;
基于所述找医生意图,确定第二实体关系,以确定与所述疾病实体词具有所述第二实体关系的医生姓名实体词。
8.一种实体推荐装置,其特征在于,包括:
获取模块,用于获取输入文本;
理解模块,用于对所述输入文本进行语义理解,以确定搜索意图并提取种子实体词;
确定模块,用于若所述搜索意图与所述种子实体词相匹配,且所述搜索意图属于精确推荐意图,则基于所述搜索意图确定实体关系,并将所述种子实体词映射为医疗知识图谱中的标准实体词;
推荐模块,用于将所述医疗知识图谱中与所述标准实体词具有所述实体关系的实体词作为推荐实体进行推荐。
9.一种电子设备,其特征在于,包括存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1-7中任一项所述的实体推荐方法的各个步骤。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7中任意一项所述的实体推荐方法的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910818361.XA CN110516260A (zh) | 2019-08-30 | 2019-08-30 | 实体推荐方法、装置、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910818361.XA CN110516260A (zh) | 2019-08-30 | 2019-08-30 | 实体推荐方法、装置、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110516260A true CN110516260A (zh) | 2019-11-29 |
Family
ID=68628759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910818361.XA Pending CN110516260A (zh) | 2019-08-30 | 2019-08-30 | 实体推荐方法、装置、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110516260A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111104498A (zh) * | 2019-12-12 | 2020-05-05 | 华南理工大学 | 一种任务型对话系统中的语义理解方法 |
CN111339267A (zh) * | 2020-02-17 | 2020-06-26 | 京东方科技集团股份有限公司 | 基于知识图谱的问答方法及系统、计算机设备及介质 |
CN111341308A (zh) * | 2020-02-12 | 2020-06-26 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN111414393A (zh) * | 2020-03-26 | 2020-07-14 | 湖南科创信息技术股份有限公司 | 一种基于医学知识图谱的语义相似病例检索方法及设备 |
CN111428009A (zh) * | 2020-06-12 | 2020-07-17 | 太平金融科技服务(上海)有限公司 | 关系查询方法、装置、计算机设备和存储介质 |
CN111552818A (zh) * | 2020-04-27 | 2020-08-18 | 中国银行股份有限公司 | 一种客服知识库查询方法及装置 |
CN111625680A (zh) * | 2020-05-15 | 2020-09-04 | 青岛聚看云科技有限公司 | 确定搜索结果的方法及装置 |
CN111813957A (zh) * | 2020-07-14 | 2020-10-23 | 深圳中兴网信科技有限公司 | 基于知识图谱的医疗导诊方法和可读存储介质 |
CN111858903A (zh) * | 2020-06-11 | 2020-10-30 | 创新工场(北京)企业管理股份有限公司 | 一种用于负面新闻预警的方法和装置 |
CN112307172A (zh) * | 2020-10-31 | 2021-02-02 | 平安科技(深圳)有限公司 | 一种语义解析设备、方法、终端及存储介质 |
CN112380421A (zh) * | 2020-11-11 | 2021-02-19 | 北京希瑞亚斯科技有限公司 | 简历的搜索方法、装置、电子设备及计算机存储介质 |
CN113064984A (zh) * | 2021-04-25 | 2021-07-02 | 深圳壹账通智能科技有限公司 | 意图识别方法、装置、电子设备及可读存储介质 |
WO2021139232A1 (zh) * | 2020-06-30 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于医疗知识图谱的分诊方法、装置、设备及存储介质 |
CN111680207B (zh) * | 2020-03-11 | 2023-08-04 | 华中科技大学鄂州工业技术研究院 | 一种用于确定用户搜索意图的方法及装置 |
-
2019
- 2019-08-30 CN CN201910818361.XA patent/CN110516260A/zh active Pending
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111104498A (zh) * | 2019-12-12 | 2020-05-05 | 华南理工大学 | 一种任务型对话系统中的语义理解方法 |
CN111104498B (zh) * | 2019-12-12 | 2023-04-25 | 华南理工大学 | 一种任务型对话系统中的语义理解方法 |
CN111341308A (zh) * | 2020-02-12 | 2020-06-26 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN111341308B (zh) * | 2020-02-12 | 2023-07-21 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
WO2021164618A1 (zh) * | 2020-02-17 | 2021-08-26 | 京东方科技集团股份有限公司 | 基于知识图谱的问答方法及装置、计算机设备及介质 |
CN111339267A (zh) * | 2020-02-17 | 2020-06-26 | 京东方科技集团股份有限公司 | 基于知识图谱的问答方法及系统、计算机设备及介质 |
CN111680207B (zh) * | 2020-03-11 | 2023-08-04 | 华中科技大学鄂州工业技术研究院 | 一种用于确定用户搜索意图的方法及装置 |
CN111414393A (zh) * | 2020-03-26 | 2020-07-14 | 湖南科创信息技术股份有限公司 | 一种基于医学知识图谱的语义相似病例检索方法及设备 |
CN111552818A (zh) * | 2020-04-27 | 2020-08-18 | 中国银行股份有限公司 | 一种客服知识库查询方法及装置 |
CN111625680A (zh) * | 2020-05-15 | 2020-09-04 | 青岛聚看云科技有限公司 | 确定搜索结果的方法及装置 |
CN111625680B (zh) * | 2020-05-15 | 2023-08-25 | 青岛聚看云科技有限公司 | 确定搜索结果的方法及装置 |
CN111858903A (zh) * | 2020-06-11 | 2020-10-30 | 创新工场(北京)企业管理股份有限公司 | 一种用于负面新闻预警的方法和装置 |
CN111428009A (zh) * | 2020-06-12 | 2020-07-17 | 太平金融科技服务(上海)有限公司 | 关系查询方法、装置、计算机设备和存储介质 |
WO2021139232A1 (zh) * | 2020-06-30 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于医疗知识图谱的分诊方法、装置、设备及存储介质 |
CN111813957A (zh) * | 2020-07-14 | 2020-10-23 | 深圳中兴网信科技有限公司 | 基于知识图谱的医疗导诊方法和可读存储介质 |
CN112307172A (zh) * | 2020-10-31 | 2021-02-02 | 平安科技(深圳)有限公司 | 一种语义解析设备、方法、终端及存储介质 |
WO2021190653A1 (zh) * | 2020-10-31 | 2021-09-30 | 平安科技(深圳)有限公司 | 一种语义解析设备、方法、终端及存储介质 |
CN112307172B (zh) * | 2020-10-31 | 2023-08-01 | 平安科技(深圳)有限公司 | 一种语义解析设备、方法、终端及存储介质 |
CN112380421A (zh) * | 2020-11-11 | 2021-02-19 | 北京希瑞亚斯科技有限公司 | 简历的搜索方法、装置、电子设备及计算机存储介质 |
CN113064984A (zh) * | 2021-04-25 | 2021-07-02 | 深圳壹账通智能科技有限公司 | 意图识别方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110516260A (zh) | 实体推荐方法、装置、存储介质及设备 | |
CN110297908B (zh) | 诊疗方案预测方法及装置 | |
CN107833603B (zh) | 电子病历文档分类方法、装置、电子设备及存储介质 | |
CN108182972B (zh) | 基于分词网络的中文疾病诊断的智能编码方法及系统 | |
CN108182207B (zh) | 基于分词网络的中文手术操作的智能编码方法及系统 | |
CN112329964B (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
CN111274365B (zh) | 基于语义理解的智能问诊方法、装置、存储介质及服务器 | |
JP2020027649A (ja) | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 | |
CN109345282A (zh) | 一种业务咨询的响应方法及设备 | |
CN111046154A (zh) | 信息检索方法、装置、介质及电子设备 | |
CN104462084A (zh) | 基于多个查询提供搜索细化建议 | |
CN112732870B (zh) | 基于词向量的搜索方法、装置、设备及存储介质 | |
CN111831911A (zh) | 查询信息的处理方法、装置、存储介质和电子装置 | |
CN112650854A (zh) | 基于多知识图谱的智能答复方法、装置及计算机设备 | |
CN112599213B (zh) | 一种分类编码确定方法、装置、设备及存储介质 | |
EP3497580A1 (en) | Methods and apparatus for semantic knowledge transfer | |
CN110209781A (zh) | 一种文本处理方法、装置以及相关设备 | |
US20150127657A1 (en) | Method and Computer for Indexing and Searching Structures | |
CN114141384A (zh) | 用于检索医学数据的方法、设备和介质 | |
CN115862840A (zh) | 关节疼痛疾病的智能辅助诊断方法和装置 | |
CN109471969A (zh) | 一种应用搜索方法、装置及设备 | |
CN112541357B (zh) | 实体识别方法、装置及智能设备 | |
CN112287217B (zh) | 医学文献检索方法、装置、电子设备及存储介质 | |
CN115114441A (zh) | 查询图构造方法、装置、存储介质以及电子设备 | |
US10956443B2 (en) | System and method for enabling interoperability between a first knowledge base and a second knowledge base |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |