CN104199855A - 一种针对中医药学信息的检索系统和方法 - Google Patents

一种针对中医药学信息的检索系统和方法 Download PDF

Info

Publication number
CN104199855A
CN104199855A CN201410397651.9A CN201410397651A CN104199855A CN 104199855 A CN104199855 A CN 104199855A CN 201410397651 A CN201410397651 A CN 201410397651A CN 104199855 A CN104199855 A CN 104199855A
Authority
CN
China
Prior art keywords
user
classification
term
attribute
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410397651.9A
Other languages
English (en)
Other versions
CN104199855B (zh
Inventor
唐力
王和平
周晋
黄权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Haiwei Credible Data Service Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410397651.9A priority Critical patent/CN104199855B/zh
Publication of CN104199855A publication Critical patent/CN104199855A/zh
Application granted granted Critical
Publication of CN104199855B publication Critical patent/CN104199855B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Abstract

本发明公开一种针对中医药学信息的检索系统和方法,该检索方法包括:在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型;按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果。本发明通过对用户提供的一组关键词进行分析和处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望,提高检索结果的准确度。

Description

一种针对中医药学信息的检索系统和方法
技术领域
本发明涉及医药领域,具体而言,涉及一种针对中医药学信息的检索系统和方法。
背景技术
针对中医药学的信息检索结构包含以下四种不同类型的信息单元:
方剂:在辨证审因确定治法之后,选择合适的药物,酌定用量,按照组方结构的要求,妥善配伍而成。
本草:在中医理论指导下,用于预防、治疗、诊断疾病并具有康复与保健作用的物质。
病证:即疾病,是致病邪气作用于人体,人体正气与之抗争二引起的机体阴阳失调、脏腑组织损伤、生理机能失常或心理活动障碍的一个完整的生命过程。
医案:即病案,是医生治疗疾病时辨证、立法、处方用药的连续记录。
症状:是疾病过程中表现出的个别、孤立的现象,可以是病人异常的主观感觉或行为表现,也可以是医生检查病人时发现的异常征象。
随着信息化程度的日益提高,人们已经可以通过各种信息终端获取医疗信息,但如何推测用户的意图以便为用户提供更准确的中医药信息仍是一个亟需解决的问题。
发明内容
本发明提供一种针对中医药学信息的检索系统和方法,用以根据用户提供的检索词推测用户的意图以便为用户提供更准确的中医药信息。
为达到上述目的,本发明提供了一种针对中医药学信息的检索系统,包括:
属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
进一步地,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
进一步地,所述意图推测模块包括:
聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
进一步地,所述结果返回模块包括:
结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
分类单元,用于将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
进一步地,上述系统还包括:
更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
为达到上述目的,本发明还提供了一种针对中医药学信息的检索方法,包括以下步骤:
在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
进一步地,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
进一步地,所述按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图步骤包括:
假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中t∈P;
用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
进一步地,所述根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果步骤包括:
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
进一步地,上述检索方法还包括以下步骤:
对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加或更新;和/或
创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
本发明通过对用户提供的一组关键词进行分析和处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望,提高检索结果的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例的针对中医药学信息的检索方法流程图;
图2为本发明一个实施例的针对中医药学信息的检索系统模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一个实施例的针对中医药学信息的检索方法流程图;如图所示,该检索方法包括以下步骤:
S110,在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
例如,假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状}。
S120,按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;其中,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
例如,按照属性类型对该组检索词K进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中t∈P;
用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
S130,根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引,给定一个词W,能够通过查询该索引表得到知识单元数据库中所有包含W的知识单元的索引位置集。
例如,根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
此外,上述检索方法还包括以下步骤:
对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加或更新;和/或
创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
与上述方法实施例相对应,以下为本发明的针对中医药学信息的检索系统实施例,该检索系统包括:
属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
其中,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
例如,所述意图推测模块可以包括:
聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
例如,所述结果返回模块可以包括:
结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
分类单元,用于将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
此外,上述检索系统还可以包括:
更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
本发明的上述检索系统和方法通过对用户提供的一组关键词进行分析和处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望,提高检索结果的准确度。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (10)

1.一种针对中医药学信息的检索系统,其特征在于,包括:
属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
2.根据权利要求1所述的检索系统,其特征在于,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
3.根据权利要求1所述的检索系统,其特征在于,所述意图推测模块包括:
聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
4.根据权利要求3所述的检索系统,其特征在于,所述结果返回模块包括:
结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
分类单元,用于将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
5.根据权利要求1所述的检索系统,其特征在于,还包括:
更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
6.一种针对中医药学信息的检索方法,其特征在于,包括以下步骤:
在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
7.根据权利要求6所述的检索方法,其特征在于,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
8.根据权利要求6所述的检索方法,其特征在于,所述按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图步骤包括:
假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中t∈P;
用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
9.根据权利要求8所述的检索方法,其特征在于,所述根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果步骤包括:
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
10.根据权利要求6所述的检索方法,其特征在于,还包括以下步骤:
对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加或更新;和/或
创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
CN201410397651.9A 2014-08-13 2014-08-13 一种针对中医药学信息的检索系统和方法 Active CN104199855B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410397651.9A CN104199855B (zh) 2014-08-13 2014-08-13 一种针对中医药学信息的检索系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410397651.9A CN104199855B (zh) 2014-08-13 2014-08-13 一种针对中医药学信息的检索系统和方法

Publications (2)

Publication Number Publication Date
CN104199855A true CN104199855A (zh) 2014-12-10
CN104199855B CN104199855B (zh) 2017-07-28

Family

ID=52085148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410397651.9A Active CN104199855B (zh) 2014-08-13 2014-08-13 一种针对中医药学信息的检索系统和方法

Country Status (1)

Country Link
CN (1) CN104199855B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677787A (zh) * 2015-12-29 2016-06-15 广州神马移动信息科技有限公司 信息搜索装置及信息搜索方法
CN105912856A (zh) * 2016-04-11 2016-08-31 北京科技大学 一种中医症状结构化方法
CN106408320A (zh) * 2015-07-31 2017-02-15 北京奇虎科技有限公司 广告索引构建方法和装置、广告检索方法和系统
WO2017173773A1 (zh) * 2016-04-07 2017-10-12 北京百度网讯科技有限公司 信息搜索方法和装置
CN107506463A (zh) * 2017-08-30 2017-12-22 宁波城市职业技术学院 一种数据分类和处理方法及设备
CN107832442A (zh) * 2017-11-17 2018-03-23 陆光辉 一种中医药信息查询系统和方法
CN107908628A (zh) * 2017-06-12 2018-04-13 上海壹账通金融科技有限公司 电子装置、信息查询控制方法和计算机可读存储介质
CN108735304A (zh) * 2018-04-13 2018-11-02 东莞广州中医药大学中医药数理工程研究院 一种中药复方信息检索系统
CN109063094A (zh) * 2018-07-27 2018-12-21 吉首大学 一种建立中医药知识图谱的方法
CN110120267A (zh) * 2019-04-24 2019-08-13 江苏医药职业学院 一种智能药学创新管理服务系统及方法
CN110865991A (zh) * 2019-10-28 2020-03-06 武汉药联众科技有限公司 医药数据平台
CN110889020A (zh) * 2019-11-22 2020-03-17 百度在线网络技术(北京)有限公司 站点资源挖掘方法、装置以及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085753B2 (en) * 2001-03-22 2006-08-01 E-Nvent Usa Inc. Method and system for mapping and searching the Internet and displaying the results in a visual form
CN101241502A (zh) * 2008-03-13 2008-08-13 复旦大学 基于语义距离模型的xml文档关键字搜索聚类方法
CN101266603A (zh) * 2007-03-12 2008-09-17 北京搜狗科技发展有限公司 一种网页信息分类方法、系统及应用该分类的服务系统
CN101364239A (zh) * 2008-10-13 2009-02-11 中国科学院计算技术研究所 一种分类目录自动构建方法及相关系统
CN102411626A (zh) * 2011-12-13 2012-04-11 北京大学 基于相关性分数分布对查询意图进行分类的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085753B2 (en) * 2001-03-22 2006-08-01 E-Nvent Usa Inc. Method and system for mapping and searching the Internet and displaying the results in a visual form
CN101266603A (zh) * 2007-03-12 2008-09-17 北京搜狗科技发展有限公司 一种网页信息分类方法、系统及应用该分类的服务系统
CN101241502A (zh) * 2008-03-13 2008-08-13 复旦大学 基于语义距离模型的xml文档关键字搜索聚类方法
CN101364239A (zh) * 2008-10-13 2009-02-11 中国科学院计算技术研究所 一种分类目录自动构建方法及相关系统
CN102411626A (zh) * 2011-12-13 2012-04-11 北京大学 基于相关性分数分布对查询意图进行分类的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王静: "《基于本体的中医文献诊疗信息的智能检索示范研究》", 《中国博士学位论文全文数据库 医药卫生科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408320A (zh) * 2015-07-31 2017-02-15 北京奇虎科技有限公司 广告索引构建方法和装置、广告检索方法和系统
CN105677787B (zh) * 2015-12-29 2017-10-13 广州神马移动信息科技有限公司 信息搜索装置及信息搜索方法
CN105677787A (zh) * 2015-12-29 2016-06-15 广州神马移动信息科技有限公司 信息搜索装置及信息搜索方法
WO2017173773A1 (zh) * 2016-04-07 2017-10-12 北京百度网讯科技有限公司 信息搜索方法和装置
CN105912856A (zh) * 2016-04-11 2016-08-31 北京科技大学 一种中医症状结构化方法
CN107908628A (zh) * 2017-06-12 2018-04-13 上海壹账通金融科技有限公司 电子装置、信息查询控制方法和计算机可读存储介质
CN107506463B (zh) * 2017-08-30 2020-08-18 宁波城市职业技术学院 一种数据分类和处理方法及设备
CN107506463A (zh) * 2017-08-30 2017-12-22 宁波城市职业技术学院 一种数据分类和处理方法及设备
CN107832442A (zh) * 2017-11-17 2018-03-23 陆光辉 一种中医药信息查询系统和方法
CN108735304A (zh) * 2018-04-13 2018-11-02 东莞广州中医药大学中医药数理工程研究院 一种中药复方信息检索系统
CN109063094A (zh) * 2018-07-27 2018-12-21 吉首大学 一种建立中医药知识图谱的方法
CN110120267A (zh) * 2019-04-24 2019-08-13 江苏医药职业学院 一种智能药学创新管理服务系统及方法
CN110120267B (zh) * 2019-04-24 2022-07-12 江苏医药职业学院 一种智能药学创新管理服务系统及方法
CN110865991A (zh) * 2019-10-28 2020-03-06 武汉药联众科技有限公司 医药数据平台
CN110889020A (zh) * 2019-11-22 2020-03-17 百度在线网络技术(北京)有限公司 站点资源挖掘方法、装置以及电子设备
CN110889020B (zh) * 2019-11-22 2022-08-23 百度在线网络技术(北京)有限公司 站点资源挖掘方法、装置以及电子设备

Also Published As

Publication number Publication date
CN104199855B (zh) 2017-07-28

Similar Documents

Publication Publication Date Title
CN104199855A (zh) 一种针对中医药学信息的检索系统和方法
US11537820B2 (en) Method and system for generating and correcting classification models
CN108388580B (zh) 融合医学知识及应用病例的动态知识图谱更新方法
CN113707297B (zh) 医疗数据的处理方法、装置、设备及存储介质
US20190035506A1 (en) Intelligent auxiliary diagnosis method, system and machine-readable medium thereof
Oesper et al. WordCloud: a Cytoscape plugin to create a visual semantic summary of networks
US9183285B1 (en) Data clustering system and methods
Liu et al. Literature retrieval based on citation context
CN111414393A (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
Beykikhoshk et al. Discovering topic structures of a temporally evolving document corpus
CN113707303A (zh) 基于知识图谱的医疗问题解答方法、装置、设备及介质
Jimeno-Yepes et al. GeneRIF indexing: sentence selection based on machine learning
CN110929752A (zh) 基于知识驱动和数据驱动的分群方法及相关设备
US20180067986A1 (en) Database model with improved storage and search string generation techniques
US20230334255A1 (en) Sentence classification apparatus, sentence classification method, and sentence classification program
EP2922018A1 (en) Medical information analysis program, medical information analysis device, and medical information analysis method
CN113641707B (zh) 知识图谱消歧方法、装置、设备及存储介质
CN110569349A (zh) 基于大数据的患教文章推送方法、系统、设备及存储介质
CN114860887A (zh) 基于智能联想的疾病内容推送方法、装置、设备及介质
CN111785383A (zh) 数据处理方法及相关设备
CN113836272A (zh) 关键信息的展示方法、系统、计算机设备及可读存储介质
CN113111159A (zh) 问答记录生成方法、装置、电子设备及存储介质
CN112667781A (zh) 一种恶性肿瘤文献获取方法及装置
CN113555105A (zh) 一种推荐医疗产品的方法及装置
John et al. Medication recommendation system based on clinical documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221213

Address after: No. 1201, Floor 12, No. 33, Guangju Road, Jianye District, Nanjing, Jiangsu Province, 210019

Patentee after: Nanjing Haiwei credible data service Co.,Ltd.

Address before: No. 603, Block A, Nanxincang Business Building, No. 22 A, Dongsi Shitiao, Dongcheng District, Beijing 100007

Patentee before: Wang Heping