CN109543179A - 口语化症状归一化的方法及系统 - Google Patents

口语化症状归一化的方法及系统 Download PDF

Info

Publication number
CN109543179A
CN109543179A CN201811309435.9A CN201811309435A CN109543179A CN 109543179 A CN109543179 A CN 109543179A CN 201811309435 A CN201811309435 A CN 201811309435A CN 109543179 A CN109543179 A CN 109543179A
Authority
CN
China
Prior art keywords
symptom
colloquial style
classical
training
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811309435.9A
Other languages
English (en)
Inventor
霍华荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kang Master Technology Co Ltd
Original Assignee
Beijing Kang Master Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kang Master Technology Co Ltd filed Critical Beijing Kang Master Technology Co Ltd
Priority to CN201811309435.9A priority Critical patent/CN109543179A/zh
Publication of CN109543179A publication Critical patent/CN109543179A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Landscapes

  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例提供一种口语化症状归一化的方法,该方法包括:接收用户输入的口语化症状;将该口语化症状映射至预存的标准症状集合中;以及获取所述标准症状集合中与所述口语化症状的字向量余弦相似度得分最高的标准症状,并将该得分最高的标准症状设定为该口语化症状的归一化后症状。将用户输入的口语化症状映射至预存的标准症状集合中,直接将与口语化症状的字向量余弦相似度得分最高的标准症状作为口语化症状的归一化后症状。避免了用户输入的内容无法通过智能终端进行信息处理。同时避免了耗费大量人力时间进行人工标注。症状归一化为标准形式以后,将非常有利于医疗记录标准化、基于医疗图谱的推理、电子信息交换等等应用。

Description

口语化症状归一化的方法及系统
技术领域
本发明涉及自然语言处理技术,具体地涉及一种口语化症状归一化的方法。
背景技术
目前自然语言处理技术作为人工智能最重要的一个领域之一,已经在搜索、广告、对话等方向体现了巨大的价值。在医疗领域,海量的医疗病历文本、教材、论文、问答等医疗数据,亟待自然语言处理技术的开发。语义理解技术是实现人工智能的关键技术,它能将各种不同的用户表达,理解为计算机能够处理的标准表示。现有的类似技术都用于解决非医疗领域的问题,无法直接移植到医疗行业。
目前的术语归一化,主要是基于词典的关键字匹配方法。存在以下问题:
1、建立术语词典需要大量的专家知识和人工标注,费时费力,而且容易发生冲突。
2、用户的口语化表达千变万化,关键字匹配只能包括其中很少一部分,严重限制了归一化的覆盖面。
发明内容
本发明实施例的目的是提供一种口语化症状归一化的方法,该方法可以通过将用户输入的口语化症状映射至预存的标准症状集合中,直接将与口语化症状的字向量余弦相似度得分最高的标准症状作为口语化症状的归一化后症状。避免了用户输入的内容无法通过智能终端进行信息处理。同时避免了耗费大量人力时间进行人工标注。
为了实现上述目的,本发明实施例提供一种口语化症状归一化的方法,该方法包括:
接收用户输入的口语化症状;
将该口语化症状映射至预存的标准症状集合中;以及
获取所述标准症状集合中与所述口语化症状的字向量余弦相似度得分最高的标准症状,并将该得分最高的标准症状设定为该口语化症状的归一化后症状。
可选的,所述将该口语化症状映射至预存的标准症状集合中包括:
分别提取所述标准症状集合中的标准症状;
将该口语化症状以及由所述标准症状集合中提取的相应标准症状按照字粒度的形式映射为一个字嵌入层,其中,该口语化症状和标准症状中每个字被映射为一个定长的向量,每个症状被表示为一个矩阵。
可选的,该方法还包括:
在工作人员进行人工审定口语化症状的归一化后症状错误的情况下,判断所述口语化症状的归一化后症状异常;
在设定的所述口语化症状的归一化后症状异常的情况下,添加人工标注的归一化症状词对,其中,所述人工标注的归一化症状词对包括本次出现归一化异常的口语化症状及相对应的标准症状;
将该归一化异常的口语化症状相对应的标准症状添加至所述标准症状集合,并将该归一化异常的口语化症状与相对应的标准症状的余弦相似度设置为最高值。
可选的,该方法还包括在进行口语化症状归一化前通过训练模型进行数据训练,该数据训练包含:
根据正样本与多个负样本中任一者分别建立相应数量的训练数据,其中,所述正样本为所述人工标注的可归一症状对,所述负样本为由预存的症状集合中随机获取的症状;
分别计算所述训练数据的正向得分及负向得分,其中,所述正向得分为所述标准症状向量与所述正样本向量的余弦相似度,所述负向得分为所述标准症状向量与所述负样本向量的余弦相似度;
根据以下公式计算训练得分:训练得分=(正向得分-负向得分)/2,其中,该训练得分存在的区间为[-1,1];
根据以下公式计算损失函数:损失函数=(1-训练得分)/2,其中,该损失函数的区间为[0,1];以及
经多次数据训练以使所述损失函数最小化。
本发明实施例还提供一种一种口语化症状归一化系统,该系统包括预测模型,该预测模型包括:
输入层,用于接收用户输入的口语化症状;
嵌入层,用于将该口语化症状映射至预存的标准症状集合中;以及
输出层,获取所述标准症状集合中与所述口语化症状的字向量余弦相似度得分最高的标准症状,并将该得分最高的标准症状设定为该口语化症状的归一化后症状。
可选的,所述将该口语化症状映射至预存的标准症状集合中包括:
所述嵌入层分别提取所述标准症状集合中的标准症状;
所述嵌入层将该口语化症状以及由所述标准症状集合中提取的相应标准症状按照字粒度的形式映射为一个字嵌入层,其中,该口语化症状和标准症状中每个字被映射为一个定长的向量,每个症状被表示为一个矩阵。
可选的,该系统还可以包括:
隐藏层,用于将所述嵌入层输出的所述定长的向量转变为128维的语义向量。
可选的,该系统还包括校正单元,
在工作人员进行人工审定口语化症状的归一化后症状错误的情况下,判断所述口语化症状的归一化后症状异常;
该校正单元在设定的所述口语化症状的归一化后症状异常的情况下,接收管理员上传的人工标注的归一化症状词对,其中,所述人工标注的归一化症状词对包括本次出现归一化异常的口语化症状及相对应的标准症状;
将该归一化异常的口语化症状相对应的标准症状添加至所述标准症状集合,并将该归一化异常的口语化症状与相对应的标准症状的余弦相似度设置为最高值。
可选的,该系统还包括训练模型,在所述预测模型进行口语化症状归一化前通过该训练模型进行数据训练,该训练模型包括:
训练输入层,用于接收训练数据,其中根据正样本与多个负样本中任一者分别建立相应数量的训练数据,所述正样本为所述人工标注的可归一症状对,所述负样本为由预存的症状集合中随机获取的症状;
训练嵌入层,用于将训练输入层的症状,按照字粒度的形式映射为一个字嵌入层,将每个症状中的每个字映射为定长的向量,将每个症状表示为一个矩阵;
训练隐藏层,用于将所述训练嵌入层输出的所述定长的向量转变为128维的语义向量;
训练输出层,用于分别计算所述训练数据的正向得分及负向得分,其中,所述正向得分为所述标准症状向量与所述正样本向量的余弦相似度,所述负向得分为所述标准症状向量与所述负样本向量的余弦相似度;
根据以下公式计算训练得分:训练得分=(正向得分-负向得分)/2,其中,该训练得分存在的区间为[-1,1];
根据以下公式计算损失函数:损失函数=(1-训练得分)/2,其中,该损失函数的区间为[0,1];以及
经多次数据训练以使所述损失函数最小化。
通过上述技术方案,将用户输入的口语化症状映射至预存的标准症状集合中,直接将与口语化症状的字向量余弦相似度得分最高的标准症状作为口语化症状的归一化后症状,避免了用户输入的内容无法通过智能终端进行信息处理,同时避免了耗费大量人力时间进行人工标注。症状归一化为标准形式以后,将非常有利于医疗记录标准化、基于医疗图谱的推理、电子信息交换等等应用。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是本发明实施例提供的一种口语化症状归一化的训练过程示意图;
图2是本发明实施例提供的一种口语化症状归一化的预测流程示意图;
图3是本发明实施例提供的一种口语化症状归一化的预测过程示意图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
在本发明实施例中,在未作相反说明的情况下,使用的方位词如“上、下、左、右”、“内、外”、“远、近”是指参考附图的方向,因此,使用方向用语是用来说明并非来限制本发明。
用户在与智能终端交互过程中,需将预想的症状信息输入并提供至智能终端,该智能终端针对用户输入的口语化症状进行相应处理,然而不同的用户根据自身不同的理解与习惯,智能终端为对信息的统一管理需将不同用户输入的口语化症状进行归一化处理。具体地,接收用户输入的口语化症状并将该口语化症状映射至预存的标准症状中。获取所述标准症状集合中与所述口语化症状的字向量余弦相似度得分最高的标准症状,并将该得分最高的标准症状设定为该口语化症状的归一化后症状。即将用户的口语化症状转变为规范化的医学标准症状。例如,将用户输入的日常用语『发烧』转变为在医学上称为『发热』的症状表达。尊重患者和医生的语言习惯,无论他们如何表达,通过口语化症状归一化的方法将口语化症状转变为标准症状。
图1示出了本发明实施例提供的一种口语化症状归一化的训练过程示意图,如图1所示,通过建立训练模型进行数据训练,该训练模型为如图1所示的一个多层神经网络模型,训练数据由正样本和负样本组成。根据正样本与多个负样本中任一者分别建立相应数量的训练数据,其中,所述正样本为所述人工标注的可归一症状对,所述负样本为由预存的症状集合中随机获取的症状。例如『晚上睡不着觉』和『失眠』组成一条可归一数据,作为训练的正样本。从所有症状集合中随机抽取20条症状,与正样本中的标准症状组成一对,作为训练的负样本。一条正样本和一条负样本组成一条完整训练数据。如此,一个可归一的症状对可以得到20条训练数据。训练数据格式如表1所示。
表1
正样本 标准症状 负样本
晚上睡不着觉 失眠 总是睡不醒
该训练模型可以包括:训练输入层、训练字嵌入层、训练隐藏层以及训练输出层。
该训练输入层为固定格式的训练数据,从左到右,分别为正样本、标准症状、负样本。症状最大程度限定为10个字。
将训练输入层的症状,按照字粒度的形式映射为一个字嵌入层(Embedding),每个字会被映射为一个长度为64的向量。因此每一个症状会被表示成一个形状为10*64的矩阵。
字的向量可以包括以下三种学习方式:
1、初始化为0,在训练过程中跟随网络参数一起学习。
2、利用网上轻问诊和病历数据,使用word2vec方法预训练的字粒度向量进行初始化,在本网络训练过程中,字向量保持不变。
3、利用网上轻问诊和病历数据,使用word2vec方法预训练的字粒度向量进行初始化,字向量在训练过程中跟随网络参数一起学习。
训练隐藏层为一个双向RNN模型,其中RNN模型采用它的一种子类,LSTM模型,能够较好地捕获长距离信息。GRU层设定为128维。经过训练隐藏层之后,标准症状、正样本、负样本分别被表示成了一个128维的语义向量表示。
训练输出层分别计算所述训练数据的正向得分(PosScore)及负向得分(NegScore),其中,所述正向得分为所述标准症状向量与所述正样本向量的余弦相似度,所述负向得分为所述标准症状向量与所述负样本向量的余弦相似度。根据以下公式计算训练得分:训练得分(Score)=(正向得分-负向得分)/2,其中,该训练得分存在的区间为[-1,1]。数据训练的目的在于最大化正向得分(PosScore),且最小化负向得分(NegScore),因此可以统一为最大化Score的值。
该训练输出层再根据以下公式计算损失函数:损失函数=(1-训练得分)/2,其中,该损失函数的区间为[0,1]。神经网络模型的目标是优化模型的损失函数,即经多次数据训练以使所述损失函数最小化。
图2示出了本发明实施例提供的一种口语化症状归一化的预测流程示意图,在经多次数据训练以使所述损失函数最小化后,即可通过相应方式进行口语化症状相应归一化后的症状的预测。接收用户输入的口语化症状并将该口语化症状映射至预存的标准症状中。获取所述标准症状集合中与所述口语化症状的字向量余弦相似度得分最高的标准症状,并将该得分最高的标准症状设定为该口语化症状的归一化后症状。即将用户的口语化症状转变为规范化的医学标准症状。
图3示出了本发明实施例提供的一种口语化症状归一化的预测过程示意图,如图3所示,通过经过训练后的模型(预测模型)以相应方式进行口语化症状相应归一化后的症状的预测,具体如下:
首先,输入层接收用户输入的的口语化症状q以及由标准症状集合中提取的标准症状c。将输入层的症状,按照字粒度的形式映射为一个字嵌入层(Embedding),每个字会被映射为一个长度为64的向量。因此每一个症状会被表示成一个形状为10*64的矩阵。经过隐藏层之后,口语化症状q和标准症状c分别被表示成了一个128维的语义向量表示。
其次,输出层计算口语化症状向量vq与由标准症状集合中提取的标准症状向量vc的余弦相似度。
重复以上过程,计算口语化症状向量vq与标准症状集合中的所有症状向量vc的余弦相似度得分。获取得分最高的标准症状设定为该口语化症状的归一化后症状。
为了获得更好的效果,还可以接收用户对口语化症状的归一化结果的反馈信息,例如,用户判断口语化症状归一化的预测结果明显错误或不符合用户预想,用户可以发送反馈信息。在工作人员进行人工审定口语化症状的归一化后症状错误的情况下,判断所述口语化症状的归一化后症状异常。在设定的所述口语化症状的归一化后症状异常的情况下,该校正单元接收管理员上传的人工标注的归一化症状词对,其中,所述人工标注的归一化症状词对包括本次出现归一化异常的口语化症状及相对应的标准症状。校正单元将该归一化异常的口语化症状相对应的标准症状添加至所述标准症状集合,并将该归一化异常的口语化症状与相对应的标准症状的余弦相似度设置为最高值。例如,用户输入的口语化症状为『晚上打呼噜』,然而在预测结果错误或不符合用户预想的情况下,可以添加人工标注的归一化症状词对『晚上打呼噜』与『打鼾』。并将『晚上打呼噜』向量与『打鼾』向量的余弦相似度设置为最高值(最高值为:1)。同样可以省去再一次数据训练的过程,相应的减少了工作量。
通过机器学习和人工干预的有机结合,在充分利用机器学习的高覆盖和自动化学习优势的情况下,使用人工总结的高准确规则干预结果,并提高机器学习的泛化能力。
在实施例中,该方法可以应用在以下任何载体上:智能手机APP微信公众号、小程序、智能音响、电视、药店机器人、医院机器人。
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。

Claims (9)

1.一种口语化症状归一化的方法,其特征在于,该方法包括:
接收用户输入的口语化症状;
将该口语化症状映射至预存的标准症状集合中;以及
获取所述标准症状集合中与所述口语化症状的字向量余弦相似度得分最高的标准症状,并将该得分最高的标准症状设定为该口语化症状的归一化后症状。
2.根据权利要求1所述的方法,其特征在于,所述将该口语化症状映射至预存的标准症状集合中包括:
分别提取所述标准症状集合中的标准症状;
将该口语化症状以及由所述标准症状集合中提取的相应标准症状按照字粒度的形式映射为一个字嵌入层,其中,该口语化症状和标准症状中每个字被映射为一个定长的向量,每个症状被表示为一个矩阵。
3.根据权利要求1所述的方法,其特征在于,该方法还包括:
在工作人员进行人工审定口语化症状的归一化后症状错误的情况下,判断所述口语化症状的归一化后症状异常;
在设定的所述口语化症状的归一化后症状异常的情况下,添加人工标注的归一化症状词对,其中,所述人工标注的归一化症状词对包括本次出现归一化异常的口语化症状及相对应的标准症状;
将该归一化异常的口语化症状相对应的标准症状添加至所述标准症状集合,并将该归一化异常的口语化症状与相对应的标准症状的余弦相似度设置为最高值。
4.根据权利要求1所述的方法,其特征在于,该方法还包括在进行口语化症状归一化前通过训练模型进行数据训练,该数据训练包含:
根据正样本与多个负样本中任一者分别建立相应数量的训练数据,其中,所述正样本为所述人工标注的可归一症状对,所述负样本为由预存的症状集合中随机获取的症状;
分别计算所述训练数据的正向得分及负向得分,其中,所述正向得分为所述标准症状向量与所述正样本向量的余弦相似度,所述负向得分为所述标准症状向量与所述负样本向量的余弦相似度;
根据以下公式计算训练得分:训练得分=(正向得分-负向得分)/2,其中,该训练得分存在的区间为[-1,1];
根据以下公式计算损失函数:损失函数=(1-训练得分)/2,其中,该损失函数的区间为[0,1];以及
经多次数据训练以使所述损失函数最小化。
5.一种口语化症状归一化系统,其特征在于,该系统包括预测模型,该预测模型包括:
输入层,用于接收用户输入的口语化症状;
嵌入层,用于将该口语化症状映射至预存的标准症状集合中;以及
输出层,获取所述标准症状集合中与所述口语化症状的字向量余弦相似度得分最高的标准症状,并将该得分最高的标准症状设定为该口语化症状的归一化后症状。
6.根据权利要求5所述的系统,其特征在于,所述将该口语化症状映射至预存的标准症状集合中包括:
所述嵌入层分别提取所述标准症状集合中的标准症状;
所述嵌入层将该口语化症状以及由所述标准症状集合中提取的相应标准症状按照字粒度的形式映射为一个字嵌入层,其中,该口语化症状和标准症状中每个字被映射为一个定长的向量,每个症状被表示为一个矩阵。
7.根据权利要求6所述的系统,其特征在于,该系统还可以包括:
隐藏层,用于将所述嵌入层输出的所述定长的向量转变为128维的语义向量。
8.根据权利要求5所述的系统,其特征在于,该系统还包括校正单元,
在工作人员进行人工审定口语化症状的归一化后症状错误的情况下,判断所述口语化症状的归一化后症状异常;
该校正单元在设定的所述口语化症状的归一化后症状异常的情况下,接收管理员上传的人工标注的归一化症状词对,其中,所述人工标注的归一化症状词对包括本次出现归一化异常的口语化症状及相对应的标准症状;
将该归一化异常的口语化症状相对应的标准症状添加至所述标准症状集合,并将该归一化异常的口语化症状与相对应的标准症状的余弦相似度设置为最高值。
9.根据权利要求5所述的系统,其特征在于,该系统还包括训练模型,在所述预测模型进行口语化症状归一化前通过该训练模型进行数据训练,该训练模型包括:
训练输入层,用于接收训练数据,其中根据正样本与多个负样本中任一者分别建立相应数量的训练数据,所述正样本为所述人工标注的可归一症状对,所述负样本为由预存的症状集合中随机获取的症状;
训练嵌入层,用于将训练输入层的症状,按照字粒度的形式映射为一个字嵌入层,将每个症状中的每个字映射为定长的向量,将每个症状表示为一个矩阵;
训练隐藏层,用于将所述训练嵌入层输出的所述定长的向量转变为128维的语义向量;
训练输出层,用于分别计算所述训练数据的正向得分及负向得分,其中,所述正向得分为所述标准症状向量与所述正样本向量的余弦相似度,所述负向得分为所述标准症状向量与所述负样本向量的余弦相似度;
根据以下公式计算训练得分:训练得分=(正向得分-负向得分)/2,其中,该训练得分存在的区间为[-1,1];
根据以下公式计算损失函数:损失函数=(1-训练得分)/2,其中,该损失函数的区间为[0,1];以及
经多次数据训练以使所述损失函数最小化。
CN201811309435.9A 2018-11-05 2018-11-05 口语化症状归一化的方法及系统 Pending CN109543179A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811309435.9A CN109543179A (zh) 2018-11-05 2018-11-05 口语化症状归一化的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811309435.9A CN109543179A (zh) 2018-11-05 2018-11-05 口语化症状归一化的方法及系统

Publications (1)

Publication Number Publication Date
CN109543179A true CN109543179A (zh) 2019-03-29

Family

ID=65846244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811309435.9A Pending CN109543179A (zh) 2018-11-05 2018-11-05 口语化症状归一化的方法及系统

Country Status (1)

Country Link
CN (1) CN109543179A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131838A (zh) * 2020-09-29 2020-12-25 无锡医迈德科技有限公司 一种将非标准型号字符串映射为标准型字符串的方法
CN112347257A (zh) * 2020-11-11 2021-02-09 北京嘉和海森健康科技有限公司 一种患者症状口语化标准化方法和装置
CN112434200A (zh) * 2020-11-30 2021-03-02 北京思特奇信息技术股份有限公司 一种数据展示方法、系统及电子设备
CN112711652A (zh) * 2021-01-15 2021-04-27 清华大学 术语标准化方法及装置
CN113409935A (zh) * 2021-06-04 2021-09-17 新大陆数字技术股份有限公司 一种禽畜疾病问诊方法及系统
CN113793668A (zh) * 2021-09-17 2021-12-14 平安科技(深圳)有限公司 基于人工智能的症状标准化方法、装置、电子设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809465A (zh) * 2014-01-23 2015-07-29 北京三星通信技术研究有限公司 分类器训练方法、目标检测、分割或分类方法和装置
CN106897568A (zh) * 2017-02-28 2017-06-27 北京大数医达科技有限公司 病历结构化的处理方法和装置
CN107330289A (zh) * 2017-07-10 2017-11-07 叮当(深圳)健康机器人科技有限公司 一种症状信息分析方法及装置
US20170330054A1 (en) * 2016-05-10 2017-11-16 Baidu Online Network Technology (Beijing) Co., Ltd. Method And Apparatus Of Establishing Image Search Relevance Prediction Model, And Image Search Method And Apparatus
CN107368547A (zh) * 2017-06-28 2017-11-21 西安交通大学 一种基于深度学习的智能医疗自动问答方法
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及系统
CN107633079A (zh) * 2017-09-25 2018-01-26 重庆邮电大学 一种基于数据库与神经网络的车机自然语言人机交互算法
CN107704563A (zh) * 2017-09-29 2018-02-16 广州多益网络股份有限公司 一种问句推荐方法及系统
CN108009591A (zh) * 2017-12-14 2018-05-08 西南交通大学 一种基于深度学习的接触网关键部件识别方法
CN108021555A (zh) * 2017-11-21 2018-05-11 浪潮金融信息技术有限公司 一种基于深度卷积神经网络的问句相似度度量方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809465A (zh) * 2014-01-23 2015-07-29 北京三星通信技术研究有限公司 分类器训练方法、目标检测、分割或分类方法和装置
US20170330054A1 (en) * 2016-05-10 2017-11-16 Baidu Online Network Technology (Beijing) Co., Ltd. Method And Apparatus Of Establishing Image Search Relevance Prediction Model, And Image Search Method And Apparatus
CN106897568A (zh) * 2017-02-28 2017-06-27 北京大数医达科技有限公司 病历结构化的处理方法和装置
CN107368547A (zh) * 2017-06-28 2017-11-21 西安交通大学 一种基于深度学习的智能医疗自动问答方法
CN107330289A (zh) * 2017-07-10 2017-11-07 叮当(深圳)健康机器人科技有限公司 一种症状信息分析方法及装置
CN107633079A (zh) * 2017-09-25 2018-01-26 重庆邮电大学 一种基于数据库与神经网络的车机自然语言人机交互算法
CN107704563A (zh) * 2017-09-29 2018-02-16 广州多益网络股份有限公司 一种问句推荐方法及系统
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及系统
CN108021555A (zh) * 2017-11-21 2018-05-11 浪潮金融信息技术有限公司 一种基于深度卷积神经网络的问句相似度度量方法
CN108009591A (zh) * 2017-12-14 2018-05-08 西南交通大学 一种基于深度学习的接触网关键部件识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林予松等: "基于VSM权重改进算法的智能导医系统", 《计算机应用与软件》 *
谢刚等: "面向患者的智能医生框架研究", 《计算机科学与探索》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131838A (zh) * 2020-09-29 2020-12-25 无锡医迈德科技有限公司 一种将非标准型号字符串映射为标准型字符串的方法
CN112347257A (zh) * 2020-11-11 2021-02-09 北京嘉和海森健康科技有限公司 一种患者症状口语化标准化方法和装置
CN112434200A (zh) * 2020-11-30 2021-03-02 北京思特奇信息技术股份有限公司 一种数据展示方法、系统及电子设备
CN112711652A (zh) * 2021-01-15 2021-04-27 清华大学 术语标准化方法及装置
CN113409935A (zh) * 2021-06-04 2021-09-17 新大陆数字技术股份有限公司 一种禽畜疾病问诊方法及系统
CN113793668A (zh) * 2021-09-17 2021-12-14 平安科技(深圳)有限公司 基于人工智能的症状标准化方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN109543179A (zh) 口语化症状归一化的方法及系统
CN107391906B (zh) 基于神经网络和图谱结构的健康饮食知识网络构建方法
CN111538894B (zh) 查询反馈方法、装置、计算机设备及存储介质
CN109145120B (zh) 医学健康领域知识图谱的关系抽取方法及系统
CN108509519A (zh) 基于深度学习的通用知识图谱增强问答交互系统及方法
WO2022068314A1 (zh) 神经网络训练的方法、神经网络的压缩方法以及相关设备
CN107368547A (zh) 一种基于深度学习的智能医疗自动问答方法
CN109669994A (zh) 一种健康知识图谱的构建方法及系统
CN109325131A (zh) 一种基于生物医学知识图谱推理的药物识别方法
CN110047584A (zh) 基于深度学习的医院分诊方法、系统、装置及介质
CN109753602A (zh) 一种基于机器学习的跨社交网络用户身份识别方法和系统
CN108804591A (zh) 一种病历文本的文本分类方法及装置
US11321530B2 (en) Interpreting a meaning of a word string
CN112052318A (zh) 一种语义识别方法、装置、计算机设备和存储介质
Shao et al. Collaborative learning for answer selection in question answering
Goldstone et al. Comparison
US20210089965A1 (en) Data Conversion/Symptom Scoring
CN112418059A (zh) 一种情绪识别的方法、装置、计算机设备及存储介质
CN109815478A (zh) 基于卷积神经网络的药化实体识别方法及系统
US20220245358A1 (en) Creating a superset of knowledge
Fang et al. Knowledge-enhanced ensemble learning for word embeddings
Guo et al. Purpose Driven DIKW Modeling and Analysis of Meteorology and Depression
CN111128388A (zh) 一种值域数据匹配方法、装置及相关产品
CN113380360B (zh) 一种基于多模态病历图的相似病历检索方法及系统
CN114255851A (zh) 基于超图神经网络的中草药方剂推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100044 area a (T4) 02a1, 2f, No. 6, gaoliangqiao Road, Xicheng District, Beijing

Applicant after: Beijing Zuoyi Technology Co.,Ltd.

Address before: 100082, No. 2, courtyard 2, No. 1, Haidian District high Li Li Road, Beijing City, 201-148

Applicant before: BEIJING KANGFUZI TECHNOLOGY CO.,LTD.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190329