CN104199855B - 一种针对中医药学信息的检索系统和方法 - Google Patents
一种针对中医药学信息的检索系统和方法 Download PDFInfo
- Publication number
- CN104199855B CN104199855B CN201410397651.9A CN201410397651A CN104199855B CN 104199855 B CN104199855 B CN 104199855B CN 201410397651 A CN201410397651 A CN 201410397651A CN 104199855 B CN104199855 B CN 104199855B
- Authority
- CN
- China
- Prior art keywords
- term
- user
- attribute
- group
- blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种针对中医药学信息的检索系统和方法,该检索方法包括:在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型;按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果。本发明通过对用户提供的一组关键词进行分析和处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望,提高检索结果的准确度。
Description
技术领域
本发明涉及医药领域,具体而言,涉及一种针对中医药学信息的检索系统和方法。
背景技术
针对中医药学的信息检索结构包含以下四种不同类型的信息单元:
方剂:在辨证审因确定治法之后,选择合适的药物,酌定用量,按照组方结构的要求,妥善配伍而成。
本草:在中医理论指导下,用于预防、治疗、诊断疾病并具有康复与保健作用的物质。
病证:即疾病,是致病邪气作用于人体,人体正气与之抗争二引起的机体阴阳失调、脏腑组织损伤、生理机能失常或心理活动障碍的一个完整的生命过程。
医案:即病案,是医生治疗疾病时辨证、立法、处方用药的连续记录。
症状:是疾病过程中表现出的个别、孤立的现象,可以是病人异常的主观感觉或行为表现,也可以是医生检查病人时发现的异常征象。
随着信息化程度的日益提高,人们已经可以通过各种信息终端获取医疗信息,但如何推测用户的意图以便为用户提供更准确的中医药信息仍是一个亟需解决的问题。
发明内容
本发明提供一种针对中医药学信息的检索系统和方法,用以根据用户提供的检索词推测用户的意图以便为用户提供更准确的中医药信息。
为达到上述目的,本发明提供了一种针对中医药学信息的检索系统,包括:
属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
进一步地,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
进一步地,所述意图推测模块包括:
聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
进一步地,所述结果返回模块包括:
结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
分类单元,用于将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
进一步地,上述系统还包括:
更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
为达到上述目的,本发明还提供了一种针对中医药学信息的检索方法,包括以下步骤:
在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
进一步地,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
进一步地,所述按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图步骤包括:
假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中t∈P;
用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
进一步地,所述根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果步骤包括:
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
进一步地,上述检索方法还包括以下步骤:
对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加或更新;和/或
创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
本发明通过对用户提供的一组关键词进行分析和处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望,提高检索结果的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例的针对中医药学信息的检索方法流程图;
图2为本发明一个实施例的针对中医药学信息的检索系统模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一个实施例的针对中医药学信息的检索方法流程图;如图所示,该检索方法包括以下步骤:
S110,在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
例如,假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状}。
S120,按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;其中,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
例如,按照属性类型对该组检索词K进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中t∈P;
用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
S130,根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引,给定一个词W,能够通过查询该索引表得到知识单元数据库中所有包含W的知识单元的索引位置集。
例如,根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
此外,上述检索方法还包括以下步骤:
对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加或更新;和/或
创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
与上述方法实施例相对应,以下为本发明的针对中医药学信息的检索系统实施例,该检索系统包括:
属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。
其中,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
例如,所述意图推测模块可以包括:
聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
例如,所述结果返回模块可以包括:
结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
分类单元,用于将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
此外,上述检索系统还可以包括:
更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
本发明的上述检索系统和方法通过对用户提供的一组关键词进行分析和处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望,提高检索结果的准确度。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
Claims (8)
1.一种针对中医药学信息的检索系统,其特征在于,包括:
属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引;
所述意图推测模块包括:
聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
2.根据权利要求1所述的检索系统,其特征在于,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
3.根据权利要求1所述的检索系统,其特征在于,所述结果返回模块包括:
结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得到匹配结果集其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
分类单元,用于将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
4.根据权利要求1所述的检索系统,其特征在于,还包括:
更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
5.一种针对中医药学信息的检索方法,其特征在于,包括以下步骤:
在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;
按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引;
所述按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图步骤包括:
假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};
按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然数,1≤j≤m},其中t∈P;
用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:
情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;
情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;
情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p的信息单元。
6.根据权利要求5所述的检索方法,其特征在于,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症状的优先级顺序确定用户的检索意图。
7.根据权利要求5所述的检索方法,其特征在于,所述根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果步骤包括:
根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引位置集;
将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其中t∈P;
根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:
对于情况C1,将方剂类结果作为默认类别的结果页面卡片;
对于情况C2,将病症类结果作为默认类别的结果页面卡片;
对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;
对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小的顺序进行排列。
8.根据权利要求5所述的检索方法,其特征在于,还包括以下步骤:
对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加或更新;和/或
创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410397651.9A CN104199855B (zh) | 2014-08-13 | 2014-08-13 | 一种针对中医药学信息的检索系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410397651.9A CN104199855B (zh) | 2014-08-13 | 2014-08-13 | 一种针对中医药学信息的检索系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104199855A CN104199855A (zh) | 2014-12-10 |
CN104199855B true CN104199855B (zh) | 2017-07-28 |
Family
ID=52085148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410397651.9A Active CN104199855B (zh) | 2014-08-13 | 2014-08-13 | 一种针对中医药学信息的检索系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104199855B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106408320A (zh) * | 2015-07-31 | 2017-02-15 | 北京奇虎科技有限公司 | 广告索引构建方法和装置、广告检索方法和系统 |
CN105677787B (zh) * | 2015-12-29 | 2017-10-13 | 广州神马移动信息科技有限公司 | 信息搜索装置及信息搜索方法 |
CN105677931B (zh) * | 2016-04-07 | 2018-06-19 | 北京百度网讯科技有限公司 | 信息搜索方法和装置 |
CN105912856B (zh) * | 2016-04-11 | 2018-09-28 | 北京科技大学 | 一种中医症状结构化方法 |
CN107908628B (zh) * | 2017-06-12 | 2021-06-22 | 深圳壹账通智能科技有限公司 | 电子装置、信息查询控制方法和计算机可读存储介质 |
CN107506463B (zh) * | 2017-08-30 | 2020-08-18 | 宁波城市职业技术学院 | 一种数据分类和处理方法及设备 |
CN107832442A (zh) * | 2017-11-17 | 2018-03-23 | 陆光辉 | 一种中医药信息查询系统和方法 |
CN108735304A (zh) * | 2018-04-13 | 2018-11-02 | 东莞广州中医药大学中医药数理工程研究院 | 一种中药复方信息检索系统 |
CN109063094A (zh) * | 2018-07-27 | 2018-12-21 | 吉首大学 | 一种建立中医药知识图谱的方法 |
CN110120267B (zh) * | 2019-04-24 | 2022-07-12 | 江苏医药职业学院 | 一种智能药学创新管理服务系统及方法 |
CN110865991A (zh) * | 2019-10-28 | 2020-03-06 | 武汉药联众科技有限公司 | 医药数据平台 |
CN110889020B (zh) * | 2019-11-22 | 2022-08-23 | 百度在线网络技术(北京)有限公司 | 站点资源挖掘方法、装置以及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7085753B2 (en) * | 2001-03-22 | 2006-08-01 | E-Nvent Usa Inc. | Method and system for mapping and searching the Internet and displaying the results in a visual form |
CN101241502A (zh) * | 2008-03-13 | 2008-08-13 | 复旦大学 | 基于语义距离模型的xml文档关键字搜索聚类方法 |
CN101266603A (zh) * | 2007-03-12 | 2008-09-17 | 北京搜狗科技发展有限公司 | 一种网页信息分类方法、系统及应用该分类的服务系统 |
CN101364239A (zh) * | 2008-10-13 | 2009-02-11 | 中国科学院计算技术研究所 | 一种分类目录自动构建方法及相关系统 |
CN102411626A (zh) * | 2011-12-13 | 2012-04-11 | 北京大学 | 基于相关性分数分布对查询意图进行分类的方法 |
-
2014
- 2014-08-13 CN CN201410397651.9A patent/CN104199855B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7085753B2 (en) * | 2001-03-22 | 2006-08-01 | E-Nvent Usa Inc. | Method and system for mapping and searching the Internet and displaying the results in a visual form |
CN101266603A (zh) * | 2007-03-12 | 2008-09-17 | 北京搜狗科技发展有限公司 | 一种网页信息分类方法、系统及应用该分类的服务系统 |
CN101241502A (zh) * | 2008-03-13 | 2008-08-13 | 复旦大学 | 基于语义距离模型的xml文档关键字搜索聚类方法 |
CN101364239A (zh) * | 2008-10-13 | 2009-02-11 | 中国科学院计算技术研究所 | 一种分类目录自动构建方法及相关系统 |
CN102411626A (zh) * | 2011-12-13 | 2012-04-11 | 北京大学 | 基于相关性分数分布对查询意图进行分类的方法 |
Non-Patent Citations (1)
Title |
---|
《基于本体的中医文献诊疗信息的智能检索示范研究》;王静;《中国博士学位论文全文数据库 医药卫生科技辑》;20130115(第01期);论文第6.2.4节 * |
Also Published As
Publication number | Publication date |
---|---|
CN104199855A (zh) | 2014-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104199855B (zh) | 一种针对中医药学信息的检索系统和方法 | |
CN113707297B (zh) | 医疗数据的处理方法、装置、设备及存储介质 | |
CN111414393B (zh) | 一种基于医学知识图谱的语义相似病例检索方法及设备 | |
CN108388580B (zh) | 融合医学知识及应用病例的动态知识图谱更新方法 | |
CN104572675B (zh) | 一种相似病历检索的系统及方法 | |
CN105893597B (zh) | 一种相似病历检索方法及系统 | |
AU2017250467B2 (en) | Query optimizer for combined structured and unstructured data records | |
CN111191048A (zh) | 基于知识图谱的急诊问答系统构建方法 | |
US20170286604A1 (en) | Computer System and Information Processing Method | |
CN113707303A (zh) | 基于知识图谱的医疗问题解答方法、装置、设备及介质 | |
US10509795B2 (en) | Semantic distance systems and methods for determining related ontological data | |
CN112885478A (zh) | 医疗文献的检索方法、装置、电子设备及存储介质 | |
CN107273405B (zh) | 基于MeSH表的电子病历档案的智能检索系统 | |
Nabi et al. | Machine learning approach: Detecting polycystic ovary syndrome & it's impact on bangladeshi women | |
JP2024041946A (ja) | クラスタ解析方法、クラスタ解析システム、及びクラスタ解析プログラム | |
Klüver | Steering clustering of medical data in a Self-Enforcing Network (SEN) with a cue validity factor | |
CN109408635A (zh) | 一种病历文档标准化处理系统及方法 | |
CN112635072A (zh) | 基于相似度计算的icu相似病例检索方法、系统及存储介质 | |
CN109522331B (zh) | 以个人为中心的区域化多维度健康数据处理方法及介质 | |
CN112236824A (zh) | 使用基于图的参考基因组的等位基因解读的系统和方法 | |
John et al. | Medication recommendation system based on clinical documents | |
CN115631823A (zh) | 相似病例推荐方法及系统 | |
Zhu et al. | Better understand rare disease Patients’ needs by analyzing social media data–a case study of cystic fibrosis | |
Niaksu et al. | A systematic literature review of data mining applications in healthcare | |
Cheng et al. | Enhancing the accuracy of knowledge discovery: a supervised learning method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20221213 Address after: No. 1201, Floor 12, No. 33, Guangju Road, Jianye District, Nanjing, Jiangsu Province, 210019 Patentee after: Nanjing Haiwei credible data service Co.,Ltd. Address before: No. 603, Block A, Nanxincang Business Building, No. 22 A, Dongsi Shitiao, Dongcheng District, Beijing 100007 Patentee before: Wang Heping |