CN112328775A - 病例文本信息检索系统 - Google Patents

病例文本信息检索系统 Download PDF

Info

Publication number
CN112328775A
CN112328775A CN202011595960.9A CN202011595960A CN112328775A CN 112328775 A CN112328775 A CN 112328775A CN 202011595960 A CN202011595960 A CN 202011595960A CN 112328775 A CN112328775 A CN 112328775A
Authority
CN
China
Prior art keywords
word
cid
disease
vector
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011595960.9A
Other languages
English (en)
Other versions
CN112328775B (zh
Inventor
杨冬梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shengu Network Technology Co.,Ltd.
Original Assignee
Beijing Bozhong Shuji Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Bozhong Shuji Technology Co ltd filed Critical Beijing Bozhong Shuji Technology Co ltd
Priority to CN202011595960.9A priority Critical patent/CN112328775B/zh
Publication of CN112328775A publication Critical patent/CN112328775A/zh
Application granted granted Critical
Publication of CN112328775B publication Critical patent/CN112328775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了的病例文本信息检索系统,对每个病例记录都进行了分词处理,在进行相似病例检索时,先计算待检索病例记录的词向量集合与病例数据库中的每个词向量集合的相似度,将相似度小于预设的相似度阈值的对应病例记录进行删除,得到相似度大于预设的相似度阈值的多个病例记录和疾病ID向量;接着,对多个疾病ID向量进行去重处理,得到去重后的多个疾病ID向量,最后,按照疾病DID出现次数的升序方式呈现去重后的多个疾病ID向量,能够将出现次数最少的DID排列在最前面,这对于按照常见症状进行诊疗而没有得到改善的特殊症状,在重新检索时能够得到理想的检索结果,能够确保检索更准确。

Description

病例文本信息检索系统
技术领域
本发明涉及数据处理技术领域,具体涉及一种病例文本信息检索系统。
背景技术
专利文献1(CN107657062A)提供了一种相似病例检索方法,该包括:通过提取病例数据库中的多个病例的多个字段内容并将多个字段内容转化为词向量,依据词向量对多个所述病例进行聚类并划分为多个聚类簇;提取原始病历中的字段内容并将字段内容转化为原始词向量;搜索与原始词向量最近的聚类簇,并将聚类簇内的多个病例进行排序并反馈。该方法能够减少检索时的数据计算量和提高检索效率,但是,并没有针对病例文本的特点进行处理,而是将病例文本按照通用文件进行处理,因此,会存在病例检索结果不准确和检索效率低的问题。
发明内容
有鉴于此,本发明的目的是提供一种病例文本信息检索系统,以解决现有技术中病例检索结果不准确和检索效率低的问题。
本发明采用的技术方案为:
本发明实施例提供一种病例文本信息检索系统,包括:通信连接的服务器和客户端;
所述服务器,存储有M条病例记录,其中,第i条病例记录包括记录ID、疾病ID和词向量集合Wi=(Wi1,Wi2,......,Win),Win为词向量集合Wi中的第n个词;
所述客户端包括处理器和显示界面,所述处理器用于执行计算机程序实现如下步骤:
S100,接收输入的文本信息并将文本信息生成词向量集合W=(W1,W2,......,Wn);
S200,确定W和Wi的相似度Si;
S300,根据步骤S200获得的相似度Si,在所述显示界面上输出对应的检索结果,具体包括:
S310,如果Si大于D,则保留对应的第i条病例记录,作为显示的检索结果;否则,将第i条病例记录舍弃;D为预设的相似度阈值;
S320,根据S310,形成相似度大于D的检索结果集合,所述检索结果集合包括R条病例记录和R个疾病ID向量=(DID1,DID2,......,DIDR),R≤M;
S330,对R个疾病ID向量进行去重,形成去重后的升序排序的Q个疾病ID向量=(CID1,CID2,......,CIDQ)和对应的次数=(N1,N2,......,NQ),其中,Q≤R,N1≤N2≤......≤NQ
S340,在所述客户端的显示界面上输出(CID1,CID2,......,CIDQ)。
本发明实施例提供的病例文本信息检索系统,对每个病例记录都进行了分词处理,在进行相似病例检索时,先计算待检索病例记录的词向量集合与病例数据库中的每个词向量集合的相似度,将相似度小于预设的相似度阈值的对应病例记录进行删除,得到相似度大于预设的相似度阈值的多个病例记录和疾病ID向量;接着,对多个疾病ID向量进行去重处理,得到去重后的多个疾病ID向量,最后,按照疾病DID出现次数的升序方式呈现去重后的多个疾病ID向量,能够将出现次数最少的DID排列在最前面,这对于病例普遍存在但病因罕见的情况,能够在海量病例文本中快速且准确的获取相似病因的病例文本。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合具体实施例进行详细描述。
在本发明的说明书和权利要求书的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的病例文本信息检索系统,包括:包括:通信连接的服务器和客户端。
所述服务器,可部署在云端,存储有M条病例记录,其中,第i条病例记录包括记录ID(RIDi)、疾病ID(DIDi)和词向量集合Wi=(Wi1,Wi2,......,Win),Win为词向量集合Wi中的第n个词。例如,记录RID为描述病例的唯一代码文本,作为主索引,疾病DID为唯一描述疾病的代码文本或者疾病名称文本。词向量根据反应对应疾病DID的症状的结构化文本例如化验单,或非结构化文本例如病症病情描述文本确定,具体确定方法可以采用现有分词技术。
所述客户端,可部署在用户例如医生的办公室,包括处理器和显示界面,所述处理器用于执行计算机程序实现如下步骤:
S100,接收输入的文本信息并将文本信息生成词向量集合W=(W1,W2,......,Wn)。
输入的文本信息为需要检索的病例记录,可以自动输入或手动输入。自动输入例如即从化验设备读取的化验信息,手动输入例如用户(医生)通过键盘或语音输入设备输入的病症病情信息。生成词向量的方法优选与服务器中生成词向量的方法一致。
S200,确定W和Wi的相似度Si。
S300,根据步骤S200获得的相似度Si,在所述显示界面上输出对应的检索结果,具体包括:
S310,如果Si大于D,则保留对应的第i条病例记录,作为显示的检索结果;否则,将第i条病例记录舍弃;D为预设的相似度阈值,可根据经验设置,例如,在设置D为0~1之间的系数时,优选,D可为0.3~0.5。
S320,根据S310,形成相似度大于D的检索结果集合,所述检索结果集合包括R条病例记录和R个疾病ID向量=(DID1,DID2,......,DIDR),R≤M;
显然,得到的R个疾病ID向量中的DID里面是可以有重复的。
S330,对R个疾病ID向量进行去重,形成去重后的升序排序的Q个疾病ID向量=(CID1,CID2,......,CIDQ)和对应的次数=(N1,N2,......,NQ),其中,Q≤R,N1≤N2≤......≤NQ
通过步骤S330,能够将步骤S320中重复的DID进行去重合并成一个CID,即去重后的Q个疾病ID向量中某个向量CIDk可能对应多个DID,k的取值为1到Q。
S340,在所述客户端的显示界面上输出(CID1,CID2,......,CIDQ),即按照DID出现的次数的升序方式进行呈现,DID出现的次数越少,排列越靠前。可选的,以瀑布流的方式输出(CID1,CID2,......,CIDQ),优选的,在输出的每个疾病ID向量CIDk的后面输出对应的一个或多个病例链接。
本发明实施例提供的病例文本信息检索系统,通过上述步骤对病例文本进行检索,对于病例普遍存在但病因罕见的情况,能够在海量病例文本中快速且准确的获取相似病因的病例文本。
进一步地,在本发明实施例中,步骤S200中可采用现有技术来确定相似度Si。优选,在本发明实施例中,W和Wi的相似度Si=
Figure 752026DEST_PATH_IMAGE001
,其中,z1为词向量W和词向量Wi的交集中的词的数量,z2为词向量W和词向量Wi的差集中的词的数量,
Figure 585990DEST_PATH_IMAGE002
为词向量W和词向量Wi的交集中第j个词的权重,
Figure 67787DEST_PATH_IMAGE003
为词向量W和词向量Wi的差集中第j个词的权重,
Figure 747030DEST_PATH_IMAGE004
为词向量集合Wi中的词Wij的权重。
本发明实施例中,适配病例文本的特点,将病例记录之间的相似度可通过两个病例记录对应的词向量集合的交集和并集得到,相比现有技术主要采用余弦距离或者专利文献1采用的方式来获得相似度,在保证相似度计算准确性的前提下,能够节约计算量,从而能够提高检索效率,简单高效。
进一步地,在本发明的一个示例中,
Figure 896251DEST_PATH_IMAGE002
=1;
Figure 635537DEST_PATH_IMAGE005
=1;
Figure 604630DEST_PATH_IMAGE006
=1。进一步的,Si=z1/(z2+n)。
进一步地,在本发明实施例中,
Figure 87564DEST_PATH_IMAGE006
可与M条病例记录中词Wij出现的次数的总和反相关。
由于每天都会产生新的病例,服务器中的病例总数M也在不停的增加,
Figure 91292DEST_PATH_IMAGE006
也应该会发生变化,但是也不能说每增加一条病例记录,就更新
Figure 1480DEST_PATH_IMAGE006
,这样会占用过多的服务器资源。因此,需要一种平衡。具体的,本发明按照如下方式对
Figure 457869DEST_PATH_IMAGE006
进行更新:
进一步地,
Figure 481844DEST_PATH_IMAGE007
被存储到病例记录中,且进行动态更新。可选的,可按照预设周期例如每周更新一次或者当病例记录更新量超过预设阈值时更新,预设阈值可根据实际情况进行设置,例如,可为2000万条。进一步地,Wij
Figure 74499DEST_PATH_IMAGE006
可作为索引对被存储到服务器中(不是病例记录)中,且进行动态更新。可选的,按照预设周期进行更新例如每周更新一次。相当于M个病例记录中所有去重后的词和对应的权重都被存储到服务器中。显然的,词向量W和词向量Wi的交集中第j个词的权重
Figure 155588DEST_PATH_IMAGE002
可通过在服务器中查询对应词的权重
Figure 99273DEST_PATH_IMAGE006
获取。进一步的,对于词向量W和词向量Wi的差集中第j个词的权重
Figure 924010DEST_PATH_IMAGE003
,如果词向量W与词向量Wi的差集中第j个词在服务器中的索引对中能够检索到,那么相对应的权重作为
Figure 636751DEST_PATH_IMAGE003
。如果检索不到,优选的,
Figure 623161DEST_PATH_IMAGE003
=0,且在显示界面上以特殊标记(例如颜色)呈现第j个词。
进一步地,在本发明实施例中,在S330中,还形成对应的相似度集合=(S1,S2,......,SQ),其中,Sk为疾病ID向量CIDk对应的所有的词向量集合与词向量集合W的相似度的均值或者最大值。
具体地,如果疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度满足
Figure 54143DEST_PATH_IMAGE008
,则将
Figure DEST_PATH_IMAGE010
作为疾病ID向量CIDk对应的相似度Sk;其中,X为疾病ID向量CIDk对应的DID的数量即对应的词向量集合的数量,Sk1,Sk2,…,Skx分别为疾病ID向量CIDk对应的X个词向量集合与词向量集合W的相似度,每个相似度已经通过上述步骤S200确定。
Figure 479308DEST_PATH_IMAGE010
为疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度的均值;A为预设阈值,可根据现有技术确定。
如果疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度满足
Figure DEST_PATH_IMAGE011
,则将max(Sk1,Sk2,…,Skx)作为疾病ID向量CIDk对应的相似度Sk;其中,X为疾病ID向量CIDk对应的词向量集合的数量,Sk1,Sk2,…,Skx分别为疾病ID向量CIDk对应的X个词向量集合与词向量集合W的相似度,
Figure 108872DEST_PATH_IMAGE010
为疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度的均值;A为预设阈值。
进一步地,在本发明实施例中,S340进一步包括:按照Sk/Nk降序的方式在客户端的显示界面上输出(CID1,CID2,......,CIDQ),即输出结果与相似度正相关,DID出现次数反相关。
综上,本发明实施例提供的病例文本信息检索系统,对每个病例记录都进行了分词处理,在进行相似病例检索时,先计算待检索病例记录的词向量集合与病例数据库中的每个词向量集合的相似度,将相似度小于预设的相似度阈值的对应病例记录进行删除,得到相似度大于预设的相似度阈值的多个病例记录和疾病ID向量;接着,对多个疾病ID向量进行去重处理,得到去重后的多个疾病ID向量,最后,按照疾病DID出现次数的升序方式呈现去重后的多个疾病ID向量,能够将出现次数最少的DID排列在最前面,这对于病例普遍存在但病因罕见的情况,能够在海量病例文本中快速且准确的获取相似病因的病例文本。此外,直接利用待检索病例记录的词向量集合与病例数据库中的每个词向量集合的交集的权重和并集的权重来计算两者的相似度,相比现有技术主要采用余弦距离或者专利文献1采用的方式来获得相似度,能够节约计算量,从而能够提高检索效率,简单高效。并且,本发明中,针对病例记录的医疗术语是统一且有限的特点,对每个词的权重预先进行了设置,在检索时就能得到相应的权重,无需按照现有技术例如采用TF-IDF进行计算,能够进一步地提高检索效率和检索结果的准确性。
以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种病例文本信息检索系统,其特征在于,包括:通信连接的服务器和客户端;
所述服务器,存储有M条病例记录,其中,第i条病例记录包括记录ID、疾病ID和词向量集合Wi=(Wi1,Wi2,......,Win),Win为词向量集合Wi中的第n个词;
所述客户端包括处理器和显示界面,所述处理器用于执行计算机程序实现如下步骤:
S100,接收输入的文本信息并将文本信息生成词向量集合W=(W1,W2,......,Wn);
S200,确定W和Wi的相似度Si;
S300,根据步骤S200获得的相似度Si,在所述显示界面上输出对应的检索结果,具体包括:
S310,如果Si大于D,则保留对应的第i条病例记录,作为显示的检索结果;否则,将第i条病例记录舍弃;D为预设的相似度阈值;
S320,根据S310,形成相似度大于D的检索结果集合,所述检索结果集合包括R条病例记录和R个疾病ID向量=(DID1,DID2,......,DIDR),R≤M;
S330,对R个疾病ID向量进行去重,形成去重后的升序排序的Q个疾病ID向量=(CID1,CID2,......,CIDQ)和对应的次数=(N1,N2,......,NQ),其中,Q≤R,N1≤N2≤......≤NQ
S340,在所述客户端的显示界面上输出(CID1,CID2,......,CIDQ)。
2.根据权利要求1所述的病例文本信息检索系统,其特征在于,在S330中,还形成对应的相似度集合=(S1,S2,......,SQ),其中,Sk为疾病ID向量CIDk对应的所有的词向量集合与词向量集合W的相似度的均值或者最大值。
3.根据权利要求2所述的病例文本信息检索系统,其特征在于,其中,如果疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度满足
Figure 438976DEST_PATH_IMAGE001
,则将
Figure 824958DEST_PATH_IMAGE002
作为疾病ID向量CIDk对应的相似度Sk;其中, X为疾病ID向量CIDk对应的词向量集合的数量,Sk1,Sk2,…,Skx分别为疾病ID向量CIDk对应的X个词向量集合与词向量集合W的相似度,
Figure 57226DEST_PATH_IMAGE002
为疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度的均值;A为预设阈值。
4.根据权利要求2所述的病例文本信息检索系统,其特征在于,其中,如果疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度满足
Figure 655697DEST_PATH_IMAGE003
,则将max(Sk1,Sk2,…,Skx)作为疾病ID向量CIDk对应的相似度Sk;其中, X为疾病ID向量CIDk对应的词向量集合的数量,Sk1,Sk2,…,Skx分别为疾病ID向量CIDk对应的X个词向量集合与词向量集合W的相似度,
Figure 922599DEST_PATH_IMAGE005
为疾病ID向量CIDk对应的所有词向量集合与词向量集合W的相似度的均值;A为预设阈值。
5.根据权利要求2所述的病例文本信息检索系统,其特征在于,S340进一步包括:按照Sk/Nk降序的方式在客户端的显示界面上输出(CID1,CID2,......,CIDQ)。
6.根据权利要求1所述的病例文本信息检索系统,其特征在于,在S200中,Si=
Figure 682745DEST_PATH_IMAGE006
Figure 418620DEST_PATH_IMAGE006
,其中,z1为词向量W和词向量Wi的交集中的词的数量,z2为词向量W和词向量Wi的差集中的词的数量,
Figure 807400DEST_PATH_IMAGE007
为词向量W和词向量Wi的交集中第j个词的权重,
Figure 945121DEST_PATH_IMAGE008
为词向量W和词向量Wi的差集中第j个词的权重,
Figure 141747DEST_PATH_IMAGE009
为词向量集合Wi中的词Wij的权重。
7.根据权利要求1所述的病例文本信息检索系统,其特征在于,
Figure 614185DEST_PATH_IMAGE009
与所述M条病例记录中词Wij出现的次数的总和反相关。
8.根据权利要求7所述的病例文本信息检索系统,其特征在于,
Figure 554459DEST_PATH_IMAGE010
被存储到病例记录中,并进行动态更新。
9.根据权利要求7所述的病例文本信息检索系统,其特征在于,
Figure 546686DEST_PATH_IMAGE010
和Wij作为索引对被存储到所述服务器中,并进行动态更新。
10.根据权利要求9所述的病例文本信息检索系统,其特征在于,如果词向量W和词向量Wi的差集中第j个词在所述索引对中能够检索到,则将相对应的权重作为
Figure 429060DEST_PATH_IMAGE008
;否则,则设置
Figure 139527DEST_PATH_IMAGE008
=0,并以特殊标记呈现第j个词。
CN202011595960.9A 2020-12-30 2020-12-30 病例文本信息检索系统 Active CN112328775B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011595960.9A CN112328775B (zh) 2020-12-30 2020-12-30 病例文本信息检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011595960.9A CN112328775B (zh) 2020-12-30 2020-12-30 病例文本信息检索系统

Publications (2)

Publication Number Publication Date
CN112328775A true CN112328775A (zh) 2021-02-05
CN112328775B CN112328775B (zh) 2021-04-13

Family

ID=74301961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011595960.9A Active CN112328775B (zh) 2020-12-30 2020-12-30 病例文本信息检索系统

Country Status (1)

Country Link
CN (1) CN112328775B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821730A (zh) * 2021-11-23 2021-12-21 北京嘉和海森健康科技有限公司 一种医疗信息推送方法、装置及电子设备
CN116401336A (zh) * 2023-03-31 2023-07-07 华院计算技术(上海)股份有限公司 认知智能查询方法及装置、计算机可读存储介质、终端

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080212856A1 (en) * 2007-03-02 2008-09-04 Fujifilm Corporation Similar case search apparatus and method, and recording medium storing program therefor
CN105893597A (zh) * 2016-04-20 2016-08-24 上海家好科技有限公司 一种相似病历检索方法及系统
CN107657062A (zh) * 2017-10-25 2018-02-02 医渡云(北京)技术有限公司 相似病例检索方法及装置、存储介质、电子设备
CN108363721A (zh) * 2018-01-03 2018-08-03 国网信通亿力科技有限责任公司 一种用户信息检索系统
CN109887562A (zh) * 2019-02-20 2019-06-14 广州天鹏计算机科技有限公司 电子病历的相似度确定方法、装置、设备和存储介质
CN111445463A (zh) * 2020-03-31 2020-07-24 上海联影智能医疗科技有限公司 相似肺部疾病病例的检索方法、装置和计算机设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080212856A1 (en) * 2007-03-02 2008-09-04 Fujifilm Corporation Similar case search apparatus and method, and recording medium storing program therefor
CN105893597A (zh) * 2016-04-20 2016-08-24 上海家好科技有限公司 一种相似病历检索方法及系统
CN107657062A (zh) * 2017-10-25 2018-02-02 医渡云(北京)技术有限公司 相似病例检索方法及装置、存储介质、电子设备
CN108363721A (zh) * 2018-01-03 2018-08-03 国网信通亿力科技有限责任公司 一种用户信息检索系统
CN109887562A (zh) * 2019-02-20 2019-06-14 广州天鹏计算机科技有限公司 电子病历的相似度确定方法、装置、设备和存储介质
CN111445463A (zh) * 2020-03-31 2020-07-24 上海联影智能医疗科技有限公司 相似肺部疾病病例的检索方法、装置和计算机设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821730A (zh) * 2021-11-23 2021-12-21 北京嘉和海森健康科技有限公司 一种医疗信息推送方法、装置及电子设备
CN116401336A (zh) * 2023-03-31 2023-07-07 华院计算技术(上海)股份有限公司 认知智能查询方法及装置、计算机可读存储介质、终端
CN116401336B (zh) * 2023-03-31 2024-03-29 华院计算技术(上海)股份有限公司 认知智能查询方法及装置、计算机可读存储介质、终端

Also Published As

Publication number Publication date
CN112328775B (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
CN112287094B (zh) 相似病例文本检索系统
CN109408665B (zh) 一种信息推荐方法及装置、存储介质
US8140541B2 (en) Time-weighted scoring system and method
CN112328775B (zh) 病例文本信息检索系统
WO2006115260A1 (ja) 情報解析報告書自動作成装置、情報解析報告書自動作成プログラムおよび情報解析報告書自動作成方法
US20130110829A1 (en) Method and Apparatus of Ranking Search Results, and Search Method and Apparatus
KR20160098084A (ko) 관심대상 문서 필터링 시스템 및 그 방법
CN110928986B (zh) 法律证据的排序和推荐方法、装置、设备及存储介质
CN112231555A (zh) 基于用户画像标签的召回方法、装置、设备及存储介质
CN103580939A (zh) 一种基于账号属性的异常消息检测方法及设备
JPWO2008108297A1 (ja) 相同性検索システム
CN108664605B (zh) 一种模型评估方法及系统
JP5281104B2 (ja) 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体
WO2017215245A1 (zh) 简历搜索方法和装置
CN111091883B (zh) 一种医疗文本处理方法、装置、存储介质及设备
CN114281983B (zh) 分层结构的文本分类方法、系统、电子设备和存储介质
JP5281105B2 (ja) 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体
CN116881432A (zh) 文本推送方法、装置、电子设备和存储介质
CN112487782B (zh) 一种基于文章相似数量的文章热度计算方法
CN109857859A (zh) 新闻信息的处理方法、装置、设备以及存储介质
CN110929849B (zh) 一种基于神经网络模型压缩的视频检测方法和装置
US11468006B2 (en) Systems and methods to facilitate prioritization of documents in electronic discovery
CN108052554B (zh) 多维度拓展关键词的方法和装置
CN112612614A (zh) 一种数据排序方法、装置及系统
CN118503509B (zh) 基于大数据的招标网数据采集方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211124

Address after: 518000 311, block a, xinhefeng business building, No. 33, Baomin Second Road, Liutang community, Xixiang street, Shenzhen, Guangdong

Patentee after: Shenzhen Shengu Network Technology Co.,Ltd.

Address before: 100085 no.226, 2nd floor, No.5 Shangdi 5th Street, Haidian District, Beijing

Patentee before: Beijing Bozhong Shuji Technology Co.,Ltd.

TR01 Transfer of patent right