CN108460132B - 基于中药学理论的中药材属性特征编码及检索系统 - Google Patents
基于中药学理论的中药材属性特征编码及检索系统 Download PDFInfo
- Publication number
- CN108460132B CN108460132B CN201810178583.5A CN201810178583A CN108460132B CN 108460132 B CN108460132 B CN 108460132B CN 201810178583 A CN201810178583 A CN 201810178583A CN 108460132 B CN108460132 B CN 108460132B
- Authority
- CN
- China
- Prior art keywords
- chinese medicinal
- attribute
- medicinal material
- coding
- medicinal materials
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Medicines Containing Plant Substances (AREA)
Abstract
本发明公开了一种基于中药学理论的中药材属性特征编码及检索系统。该系统包括:数据预处理模块,将存储的中药学文本信息中各味中药材属性特征进行提取,形成与各味中药材对应的数据元素;数据库模块,基于各味中药材对应的数据元素构建结构化数据表,形成中药材属性特征数据库;编码模块,将中药材属性特征数据库中的每一味中药材按属性特征编码为8层15位的十进制数字编码;及检索模块,将搜索内容转换为相应属性特征类别的编码发出查询请求,并输出查询结果。本发明提供的基于中药学理论的中药材属性特征编码及检索系统,可实现中药材药性、功效等特征属性精简编码,从而方便中药材特征属性的表示及组方分析。
Description
技术领域
本发明涉及中医药信息化技术领域,特别涉及一种基于中药学理论的中药材属性特征编码及检索系统。
背景技术
中医药是我国传统医学和中华民族传统文化的重要组成部分,内涵丰富,数千年来发挥着防治疾病、养生保健的重要作用。中医药基于独特的哲学思维模式,其理论内涵往往语言表述抽象模糊,用词表述复杂,使中医药研究难以量化和系统化。中药材品种繁多、来源复杂、药材药性内涵丰富,已有的多类型中医药数据库检索系统包括中医药期刊文献数据库、疾病诊疗数据库、各类中药数据库、方剂数据库等提供了丰富的中医药知识库及内容检索功能。但中药学知识往往以文本表述,难以深入研究其丰富的药性内涵和使用规律,难以形成结构化、模式化的方法和流程。
中医药信息的客观化和标准化,并利用计算机技术对中医药的相关信息加以表达和管理,将对中医药的信息化处理提供支撑和保障。传统中药药性理论是中医药的组成部分,中药编码可实现中药材基本信息的数字化,使用一个信息链表述了中药学含义,代表中药材个体特征,且具有特征性、唯一性。中药材的特征包括中药的名称、分类、来源、药用部位、药性、炮制方法、功效等中药学内涵。因中药材品种繁多,来源复杂,为促进中医药的数字化、信息化和标准化,中医药学者对中药编码进行了长期探索和相关研究。
现有技术中,有编码方法中涉及收录顺序,该方法难以实现标准化和通用化;有研究对炮制未统一进行编码;有研究采用药用来源与药性相结合的编码方法,仅对500种常用药实现唯一编码。现有国家标准为《中药编码规则及编码》(GB/T 31774-2015),采用10层17位数字,由农林(牧)渔业(包括中药产品)大部类识别代码、中药类产品代码、药用来源大类代码、药用科属品种细类代码、药用部位大类代码、药用部位细类代码、药材种类序号代码、中药规格(片型)及中药材代码、中药炮制方法代码、校验码组成,在全国范围内实现了中药名称、品种和规格的标准化;《中药编码系统》(ISO 18668-1,2,3,4)采用与GB/T 31774-2015相同的编码规则和具体编码,实现了国家标准与国际标准完全对接。
上述国家标准和技术规范以国际代码、生物分类学、药用来源、药用部位、炮制等作为分类依据,体现中药材基于自然产物的药用取材及炮制特征,是适用于指导生产、经营、使用、市场监管等流通环节的标准与规范。但该编码系统主要依据药材的自然属性,所表示的中药材特征局限于自然产物和炮制方法,未体现中药材作用于人体的生物效应和治疗作用等中医药原创思维,难以基于其编码实现具有中医药特色的药性以及组方规律分析,难以深入挖掘出中医辨证论治的潜在规律。
鉴于此,有必要提供一种新的编码系统解决上述技术问题。
发明内容
本发明要解决的技术问题是提供一种基于中药学理论的中药材属性特征编码及检索系统,可实现中药材药性、功效等特征属性精简编码,从而方便中药材特征属性的表示及组方分析。
为了解决上述问题,本发明的技术方案如下:
一种基于中药学理论的中药材属性特征编码及检索系统,包括:
数据预处理模块,将存储的中药学文本信息中各味中药材属性特征进行提取,形成与各味中药材对应的数据元素;
数据库模块,基于各味中药材对应的数据元素构建结构化数据表,形成中药材属性特征数据库;
编码模块,将中药材属性特征数据库中的每一味中药材按属性特征编码为8层15位的十进制数字编码;
及检索模块,将搜索内容转换为相应属性特征类别的编码发出查询请求,并输出查询结果。
优选的,所述中药材属性特征包括四性、五味、归经、功效、毒性、炮制方法及辅料。
优选的,所述数据预处理模块包括:
文本导入单元,将中药学相关文本信息输入,提供信息处理基础数据;
抽取单元,针对输入的文本信息,对各味中药材属性特征对应的文本内容进行解析与标记,实现元数据和中药材属性特征相关文本内容的抽取;
分词单元,读取抽取后的文本信息,并进行分词;
提取单元,基于分词后的文本信息,提取每一味中药材的属性特征。
优选的,所述编码模块包括:
编码信息结构单元,将各味中药材的属性特征进行层次划分,并提供8层15位十进制数字的统一编码空间;
数据编码定义与编码单元,基于所述中药材属性特征数据库,将所述中药材数据库中的每一味中药材按规则编码为8层15位的十进制数字编码。
优选的,所述数据编码定义与编码单元的编码方法包括:
根据所述编码信息结构单元各层次中不同中药材药性的属性特征,对自然语言的知识内涵和表述进行规范,形成编码信息结构单元中每层次个体属性集合;
根据中药材各层次中属性内容的不同特点,若某个层次的具体属性内容只具有该层次个体属性集合中某一单项,则建立内涵与编码的标准对应关系,以十进制表示;
若某个层次的具体属性内容具有多项个体属性相组合特点,则根据个体属性具体内容结合计算思维进行编码预处理,采用二进制的“0”、“1”表示其对应个体属性特征的有无,体现不同个体属性组合,并将二进制最终转换成十进制表示;
确定知识内涵完备表达的数据形式,以阿拉伯数字对中药材各层次进行编码,以实现将每一味中药材编码为8层15位的十进制数字编码。
优选的,8层15位十进制数字编码中,第1层1位表示药性四气,第2层3位表示药性五味,第3层4位表示药材归经,第4层1位表示毒性,第5层2位表示中药材功效大类,第6层1位表示中药材功效细类,第7层2位表示炮制方法及辅料,第8层1位表示区分位,用于区分前7层编码相同的药材。
优选的,其中,药性四气、功效大类、功效细类、毒性、炮制方法和区分位分别直接以十进制编码,药性五味和药材归经分别运用二进制“0”、“1”表示其单层次下多个并列属性特征的有无,经二进制预编码后再转化为十进制编码。
优选的,所述检索模块包括精确查询单元和模糊查询单元。
优选的,所述精确查询单元,用于将搜索内容转换为相应属性类别的编码发出查询请求,遍历所有中药材的十进制数字编码对应数字位,输出遍历结果;
所述模糊查询单元,用于将搜索内容转换为相应属性类别的编码发出查询请求,并将转换得到的编码与所有中药材的十进制数字编码相对应数字位以近似匹配原则相运算,将符合近似匹配条件的运算结果转换为相应属性类别的加权空间向量,并以各空间向量的权值为依据排序输出查询结果。
优选的,针对所述检索模块,检索策略包括基于中药材名称或药材编码,对其属性特征进行查询;或基于属性特征中的单个属性特征或多个属性特征的组合,对中药材进行查询。
相较于现有技术,本发明提供的基于中药学理论的中药材属性特征编码及检索系统,有益效果在于:
一、本发明提供的基于中药学理论的中药材属性特征编码及检索系统,将中药材属性特征以离散化数值表示,并结合计算思维构建基于药性的层次化编码结构,实现一药一编码,充实和完善了中药材编码体系,从而为深入分析中药材的属性特征提供了系统的研究方法。
二、本发明提供的基于中药学理论的中药材属性特征编码及检索系统,涉及的实现过程结构清晰,对文本信息的提取和操作方便,适合大数据量的中药材药性等相关属性特征的提取,适合于智能构建数据库。
三、本发明提供的基于中药学理论的中药材属性特征编码及检索系统,依托于中药材编码标准,既能体现药性的总体特征,又能展现其微观具体属性,可以多种不同类型的中药材属性为索引,实现快速准确检索。
四、本发明提供的基于中药学理论的中药材属性特征编码及检索系统,基于中医思维针对中药学内涵开发,是一个综合性的应用平台,可根据需要扩展其他的分析和计算功能,如分析药物的综合药性表达,揭示中药的四气、五味、归经、毒性、炮制等的科学内涵;依据该药性编码还有助于挖掘遣药组方思路,明确方剂配伍原理,从而为阐明中医原创思维提供新的研究方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于中药学理论的中药材属性特征编码及检索系统的结构示意图;
图2为图1所示基于中药学理论的中药材属性特征编码及检索系统中编码模块提供的编码示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面对本发明的具体实施方式作进一步的说明。
在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面结合附图所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
需要说明的是,本发明中所提及的中药材属性特征主要包括四性、五味、归经、功效、毒性、炮制方法及辅料。且“四性”与“四气”是相同的意思,因此,在本发明中可混用。
当中药材属性特征有扩展时,对其进行编码及检索的系统原理与本发明相同。
请参阅图1,为本发明提供的基于中药学理论的中药材属性特征编码及检索系统的结构示意图。一种基于中药学理论的中药材属性特征编码及检索系统,包括:数据预处理模块11、数据库模块12、编码模块13及检索模块14。其中,数据预处理模块11处理形成的数据作为数据库模块12的输入数据,数据库模块12构建的数据作为编码模块13的输入数据,且编码模块13形成的数字编码作为检索模块14的输入数据。各功能模块的作用、工作原理具体阐述如下:
数据预处理模块11,将存储的中药学文本信息中各味中药材属性特征进行提取,形成与各味中药材对应的数据元素。
具体的,中药学文本信息为《中药学》教材电子文档数据源的自然语言文本信息,也可以扩充其他中药学理论的电子文档文本信息;
数据预处理模块11包括文本导入功能、元数据和文本相关内容的抽取功能、分词功能和分词的提取功能,且依据其功能结构,将数据预处理模块11划分为多个处理单元,分别为:
文本导入单元111,将中药学相关文本信息输入,提供信息处理基础数据;其中的中药学相关文本信息包括上述《中药学》电子文档文本信息;
抽取单元112,针对输入的信息结构和文本形式,基于开源ApacheTika工具箱对《中药学》文本信息中各味药材的药性、功效、炮制等属性特征对应的文本内容特征进行解析与标记,实现元数据和中药材属性特征相关文本内容的抽取;
分词单元113,基于开源的ansj_seg.jar读取抽取后的文本信息,并根据默认字典和自定义字典进行分词;也就是说,在数据预处理模块11中还可输入作为分词依据的字典;
提取单元114,基于分词后的文本信息,提取每一味中药材的属性特征;具体提取方法为:对解析且分词后的文本信息构建基于属性元数据和语义的向量空间模型,基于元数据的提取规则提取中药材的药性或属性类别,基于语义的向量空间模型的提取规则提取具体属性值,实现基于模板的文本信息提取。提取的结果包含电子文档文本中的所有中药材,每一味药提取的内容包括药材名称、药性、功效、炮制等多个属性,形成结构化数据元素,每一味中药对应一条数据元素,数据元素的集合为数据库模块的输入数据。
属性特征提取示例:根据《中药学》第八章第一节的相关内容提取各味中药材对应的属性特征示例,电子文档文本信息如下:
第八章 解表药
第一节 发散风寒药
本类药物性味多属辛温,辛以发散,温可祛寒,故以发散肌表风寒邪气为主要作用。主治风寒表证,症见恶寒发热,无汗或汗出不畅,头身疼痛,鼻塞流涕,口不渴,舌苔薄自,脉浮紧等。部分发散风寒药分别兼有祛风止痒、止痛、止咳平喘、利水消肿、消疮等功效,又可用治风疹瘙痒、风湿痹证、咳喘以及水肿、疮疡初起等兼有风寒表证者。
麻黄Mahuang
《神农本草经》
为麻黄科植物草麻黄Ephedra sinica Stapf、中麻黄Ephedra Intermedia Schrenk etc.A.Mey,或木贼麻黄Ephedra equisetina Bge.的草质茎。主产于河北、山西、内蒙古、甘肃等地。秋季采割绿色的草质茎,晒干,除去木质茎、残根及杂质,切段。生用、蜜炙或捣绒用。
【药性】辛、微苦,温。归肺、膀胱经。
【功效】发汗解表、宣肺平喘、利水消肿。
桂枝Guizhi
《名医别录》
为樟科植物肉桂Cinnamomum cassia Presl的干燥嫩枝。主产于广东、广西及云南省。春、夏二季采收,除去叶,晒干或切片晒干。生用。
【性能】辛、甘,温。归心、肺、膀胱经。
【功效】发汗解肌,温通经脉,助阳化气。
紫苏Zisu
《名医别录》
为唇形科植物紫苏Perilla frutescens(L.)Britt的茎、叶,其叶称紫苏叶,其茎称紫苏梗。我国南北均产。夏秋季采收。除去杂质,晒干,生用。
【性能】辛,温。归肺、脾经。
【功效】解表散寒,行气宽中。
附药:紫苏梗
为紫苏的茎。性味辛、甘,微温。归肺、脾、胃经。功能宽胸利膈,顺气安胎。适用于胸腹气滞、痞闷作胀及胎动不安、胸胁胀痛等症。
数据预处理模块11处理后,提取获得的每味中药材属性特征数据元素如下:
“解表药
发散风寒药
麻黄 生用 蜜炙 辛 微苦 温 肺 膀胱 发汗解表 宣肺平喘 利水消肿
桂枝 生用 辛 甘 温 心 肺 膀胱 发汗解肌 温通经脉 助阳化气
紫苏 辛 温 肺 脾 解表散寒 行气宽中 附药 紫苏梗 辛 甘 微温 肺 脾 胃经”。
数据库模块12,基于各味中药材对应的数据元素构建结构化数据表,形成中药材属性特征数据库。
其中,结构化数据表包含四性、五味、归经、功效、毒性、炮制方法等多个属性类别,并使用数据库管理工具查看和维护数据库内容。
以上述发散风寒药提取结果为示例,构建的结构化数据表如下:
表1:四性数据表
ID | 名称 | 寒 | 凉 | 平 | 温 | 热 |
1 | 麻黄 | 温 | ||||
2 | 蜜麻黄 | 温 | ||||
3 | 桂枝 | 温 | ||||
4 | 紫苏 | 温 | ||||
5 | 紫苏梗 | 微温 |
表2:五味数据表
ID | 名称 | 辛 | 酸 | 甘 | 苦 | 咸 | 淡 | 涩 |
1 | 麻黄 | 辛 | 微苦 | |||||
2 | 蜜麻黄 | 辛 | 微苦 | |||||
3 | 桂枝 | 辛 | 甘 | |||||
4 | 紫苏 | 辛 | ||||||
5 | 紫苏梗 | 辛 | 甘 |
表3:归经数据表
II | 名称 | 肝 | 心 | 脾 | 肺 | 肾 | 胆 | 大肠 | 小肠 | 胃 | 膀胱 | 心包 | 三焦 |
1 | 麻黄 | 肺 | 膀胱 | ||||||||||
2 | 蜜麻黄 | 肺 | 膀胱 | ||||||||||
3 | 桂枝 | 心 | 肺 | 膀胱 | |||||||||
4 | 紫苏 | 脾 | 肺 | ||||||||||
5 | 紫苏梗 | 脾 | 肺 | 胃 |
表4:功效数据表
II | 功效大类 | 功效细类 | 名称 |
1 | 解表药 | 发散风寒药 | 麻黄 |
2 | 解表药 | 发散风寒药 | 蜜麻黄 |
3 | 解表药 | 发散风寒药 | 桂枝 |
4 | 解表药 | 发散风寒药 | 紫苏 |
5 | 解表药 | 发散风寒药 | 紫苏梗 |
表5:炮制及毒性数据表
ID | 名称 | 炮制大类 | 炮制小类 | 毒性 |
1 | 麻黄 | 生用 | ||
2 | 蜜麻黄 | 炙法 | 蜜炙 | |
3 | 桂枝 | 生用 | ||
4 | 紫苏 | 生用 | ||
5 | 紫苏梗 | 生用 |
编码模块13,将中药材属性特征数据库中的每一味中药材按属性特征编码为8层15位的十进制数字编码。
本实施方式中,编码模块13包括:
编码信息结构单元131,将各味中药材的属性特征进行层次划分,并提供8层15位十进制数字的统一编码空间;
具体的,基于药性及中药属性进行层次划分,根据中药传统药性理论中药物对病证所产生作用的归纳和抽象,突出药性形成多源性、表达多样性的特点,将四性、五味、归经、功效、毒性、炮制等多角度药性内容整合形成为8层代码结构,以综合体现中药的性质和特征;并根据中药材属性特征提供15位十进制数字的代码空间。
数据编码定义与编码单元132,基于所述中药材属性特征数据库,将所述中药材数据库中的每一味中药材按规则编码为8层15位的十进制数字编码。
具体编码方法包括:
①根据编码信息结构单元131各层次中不同中药材药性的属性特征,对自然语言的知识内涵和表述进行规范,形成编码信息结构单元中每层次个体属性集合;
②根据中药材各层次中属性内容的不同特点,若某个层次的具体属性内容只具有该层次个体属性集合中某一单项,如某药材的四性属性为寒、热、温、凉、平中的一种,则建立内涵与编码的标准对应关系,以十进制表示;
③若某个层次的具体属性内容具有多项个体属性相组合特点,如五味中包含辛和苦,则根据个体属性具体内容结合计算思维进行编码预处理,如以中药五味的个体属性集合形成组合信息,针对中药五味的具体属性特征,采用二进制的“0”、“1”表示其对应个体属性特征的有无,体现不同个体属性组合,并将二进制最终转换成十进制表示,解决表示的统一性并缩短编码长度;
④确定知识内涵完备表达的数据形式,以阿拉伯数字对中药材各层次进行编码,以实现将每一味中药材编码为8层15位的十进制数字编码。
其中,药性四气、功效大类、功效细类、毒性、炮制方法和区分位分别直接以十进制编码,药性五味和药材归经分别运用二进制“0”、“1”表示其单层次下多个并列属性特征的有无,经二进制预编码后再转化为十进制编码。
请结合参阅图2,为图1所示基于中药学理论的中药材属性特征编码及检索系统中编码模块提供的编码示意图。8层15位十进制数字编码中,第1层1位表示药性四气,编码空间不超过10个,十进制编码表示;第2层3位表示药性五味,某一具体中药其五味中的每一味可能为“有”或“无”两种状态中的一种,故对每一味用二进制表示,可完整表示中药材五味可能的各种组合;第3层4位表示药材归经,某一具体中药其12条归经可能为“有”或“无”两种状态,故对归经采用12位二进制编码,可完整表示中药材归经所具有的各种组合;第4层1位表示毒性,编码空间不超过10个,区分毒性;第5层2位表示中药材功效大类,编码空间不超过100个,常用的有“解表、清热、泻下、祛风湿、化湿、利水渗湿…”等共20个功效大类,十进制编码表示;第6层1位表示中药材功效细类,如清热分“清热泻火、清热燥湿、清热解毒、清热凉血、清虚热”等5个功效细类,十进制编码表示;第7层2位表示炮制方法及辅料,编码空间不超过100个,其中第1位是炮制大类,如“炒法、炙法、煅法、蒸、炖法…”等共10层,其中第2位是炮制细类,如炒法中细分为“炒黄、炒焦、炒炭、麦麸炒、米炒、土炒、砂炒、蛤粉炒、滑石粉炒”共9个炮制细类,十进制编码表示;第8层1位表示区分位,用于区分前7层编码相同的药材,十进制编码表示。
例如:大青叶编码为100810320023000,第1层第1位数字1代表寒,第2层第2-4位二进制位0001000十进制为008代表苦味,第3层第5-8位二进制位010000001000十进制为1032,代表归心经和胃经,第4层第9位0代表无毒,第5层第10、11位02代表清热功效大类,第6层第12位3代表清热功效细类中的清热解毒,第7层第13、14位00代表生用,第8层第15位0作为区分标识,代表第1个前14位药性属性编码为10081032002300的中药材。板蓝根与大青叶前7层即前14位编码完全相同,则板蓝根第8层即第15位编码为1,板蓝根完整编码为:100810320023001。若有其他中药材也与大青叶和板蓝根前14位编码相同,则第8层即第15位编码为2,并以此类推。
检索模块14,将搜索内容转换为相应属性特征类别的编码发出查询请求,并输出查询结果。
具体的,检索模块14包括精确查询单元141和模糊查询单元142。
其中精确查询单元141,用于将搜索内容转换为相应属性类别的编码发出查询请求,遍历所有中药材的十进制数字编码对应数字位,输出遍历结果;
模糊查询单元142,用于将搜索内容转换为相应属性类别的编码发出查询请求,并将转换得到的编码与所有中药材的十进制数字编码相对应数字位以近似匹配原则相运算,将符合近似匹配条件的运算结果转换为相应属性类别的加权空间向量,并以各空间向量的权值为依据排序输出查询结果。
针对检索模块14,检索策略包括基于中药材名称或药材编码,对其属性特征进行查询,或基于属性特征中的单个属性特征或多个属性特征的组合,对中药材进行查询。
在实际应用中,将编码模块和检索模块合并为一个界面,依据数据库中的中药材信息,提供信息显示、编码,并可依据中药材名称、药材编码、药性或功效等提供检索。
以上对本发明的实施方式作出详细说明,但本发明不局限于所描述的实施方式。对本领域的技术人员而言,在不脱离本发明的原理和精神的情况下对这些实施例进行的多种变化、修改、替换和变型均仍落入在本发明的保护范围之内。
Claims (7)
1.一种基于中药学理论的中药材属性特征编码及检索系统,其特征在于,包括:
数据预处理模块,将存储的中药学文本信息中各味中药材属性特征进行提取,形成与各味中药材对应的数据元素;
数据库模块,基于各味中药材对应的数据元素构建结构化数据表,形成中药材属性特征数据库;
编码模块,将中药材属性特征数据库中的每一味中药材按属性特征编码为8层15位的十进制数字编码;所述编码模块包括:
编码信息结构单元,将各味中药材的属性特征进行层次划分,并提供8层15位十进制数字的统一编码空间;
数据编码定义与编码单元,基于所述中药材属性特征数据库,将所述中药材数据库中的每一味中药材按规则编码为8层15位的十进制数字编码;
所述数据编码定义与编码单元的编码方法包括:
根据所述编码信息结构单元各层次中不同中药材药性的属性特征,对自然语言的知识内涵和表述进行规范,形成编码信息结构单元中每层次个体属性集合;
根据中药材各层次中属性内容的不同特点,若某个层次的具体属性内容只具有该层次个体属性集合中某一单项,则建立内涵与编码的标准对应关系,以十进制表示;
若某个层次的具体属性内容具有多项个体属性相组合特点,则根据个体属性具体内容结合计算思维进行编码预处理,采用二进制的“0”、“1”表示其对应个体属性特征的有无,体现不同个体属性组合,并将二进制最终转换成十进制表示;
确定知识内涵完备表达的数据形式,以阿拉伯数字对中药材各层次进行编码,以实现将每一味中药材编码为8层15位的十进制数字编码;
8层15位十进制数字编码中,第1层1位表示药性四气,第2层3位表示药性五味,第3层4位表示药材归经,第4层1位表示毒性,第5层2位表示中药材功效大类,第6层1位表示中药材功效细类,第7层2位表示炮制方法及辅料,第8层1位表示区分位,用于区分前7层编码相同的药材;
及检索模块,将搜索内容转换为相应属性特征类别的编码发出查询请求,并输出查询结果。
2.根据权利要求1所述的基于中药学理论的中药材属性特征编码及检索系统,其特征在于,所述中药材属性特征包括四性、五味、归经、功效、毒性、炮制方法及辅料。
3.根据权利要求1所述的基于中药学理论的中药材属性特征编码及检索系统,其特征在于,所述数据预处理模块包括:
文本导入单元,将中药学相关文本信息输入,提供信息处理基础数据;
抽取单元,针对输入的文本信息,对各味中药材属性特征对应的文本内容进行解析与标记,实现元数据和中药材属性特征相关文本内容的抽取;
分词单元,读取抽取后的文本信息,并进行分词;
提取单元,基于分词后的文本信息,提取每一味中药材的属性特征。
4.根据权利要求1所述的基于中药学理论的中药材属性特征编码及检索系统,其特征在于,其中,药性四气、功效大类、功效细类、毒性、炮制方法和区分位分别直接以十进制编码,药性五味和药材归经分别运用二进制“0”、“1”表示其单层次下多个并列属性特征的有无,经二进制预编码后再转化为十进制编码。
5.根据权利要求1所述的基于中药学理论的中药材属性特征编码及检索系统,其特征在于,所述检索模块包括精确查询单元和模糊查询单元。
6.根据权利要求5所述的基于中药学理论的中药材属性特征编码及检索系统,其特征在于,所述精确查询单元,用于将搜索内容转换为相应属性类别的编码发出查询请求,遍历所有中药材的十进制数字编码对应数字位,输出遍历结果;
所述模糊查询单元,用于将搜索内容转换为相应属性类别的编码发出查询请求,并将转换得到的编码与所有中药材的十进制数字编码相对应数字位以近似匹配原则相运算,将符合近似匹配条件的运算结果转换为相应属性类别的加权空间向量,并以各空间向量的权值为依据排序输出查询结果。
7.根据权利要求6所述的基于中药学理论的中药材属性特征编码及检索系统,其特征在于,针对所述检索模块,检索策略包括基于中药材名称或药材编码,对其属性特征进行查询,或基于属性特征中的单个属性特征或多个属性特征的组合,对中药材进行查询。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810178583.5A CN108460132B (zh) | 2018-03-05 | 2018-03-05 | 基于中药学理论的中药材属性特征编码及检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810178583.5A CN108460132B (zh) | 2018-03-05 | 2018-03-05 | 基于中药学理论的中药材属性特征编码及检索系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108460132A CN108460132A (zh) | 2018-08-28 |
CN108460132B true CN108460132B (zh) | 2021-08-03 |
Family
ID=63216561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810178583.5A Active CN108460132B (zh) | 2018-03-05 | 2018-03-05 | 基于中药学理论的中药材属性特征编码及检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108460132B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109378080A (zh) * | 2018-09-14 | 2019-02-22 | 浙江大学 | 一种基于特征词袋模型的相似中药检索方法 |
CN109871960A (zh) * | 2018-12-28 | 2019-06-11 | 苏州安全精灵智能科技有限公司 | Ppe智能选型方法及装置 |
CN110570927A (zh) * | 2019-01-02 | 2019-12-13 | 北京归源易生软件开发有限公司 | 一种直观显示中草药药性的方法 |
CN113643782A (zh) * | 2021-07-29 | 2021-11-12 | 天地云图医药信息(广州)有限公司 | 基于药品编码的药品信息处理方法、系统、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101673291A (zh) * | 2009-10-28 | 2010-03-17 | 北京东方灵盾科技有限公司 | 一种专利文献数据检索的方法、系统和装置 |
CN103729708A (zh) * | 2012-10-16 | 2014-04-16 | 廖利平 | 一种基于编码的中药方剂管理系统 |
CN105095424A (zh) * | 2015-07-17 | 2015-11-25 | 四川久远银海软件股份有限公司 | 一种实现医院his系统中药品的高并发检索方法 |
WO2016172503A1 (en) * | 2015-04-23 | 2016-10-27 | I-Property Holding Corp. | Simple authentication of elements in blister packages |
CN107480425A (zh) * | 2017-07-14 | 2017-12-15 | 广东医睦科技有限公司 | 一种基于药品编码的药品信息处理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8219570B2 (en) * | 2005-05-10 | 2012-07-10 | Apteryx, Inc. | System and method for the automatic generation of a query to a DICOM server |
-
2018
- 2018-03-05 CN CN201810178583.5A patent/CN108460132B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101673291A (zh) * | 2009-10-28 | 2010-03-17 | 北京东方灵盾科技有限公司 | 一种专利文献数据检索的方法、系统和装置 |
CN103729708A (zh) * | 2012-10-16 | 2014-04-16 | 廖利平 | 一种基于编码的中药方剂管理系统 |
WO2016172503A1 (en) * | 2015-04-23 | 2016-10-27 | I-Property Holding Corp. | Simple authentication of elements in blister packages |
CN105095424A (zh) * | 2015-07-17 | 2015-11-25 | 四川久远银海软件股份有限公司 | 一种实现医院his系统中药品的高并发检索方法 |
CN107480425A (zh) * | 2017-07-14 | 2017-12-15 | 广东医睦科技有限公司 | 一种基于药品编码的药品信息处理方法 |
Non-Patent Citations (1)
Title |
---|
"临床中药信息分类与编码研究";吴莉,等;《医学信息学杂志》;20180131;第2-3节 * |
Also Published As
Publication number | Publication date |
---|---|
CN108460132A (zh) | 2018-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460132B (zh) | 基于中药学理论的中药材属性特征编码及检索系统 | |
CN106803012B (zh) | 基于概率主题模型和中药基本属性的方剂功能预测方法 | |
Hu et al. | An analysis model of diagnosis and treatment for COVID-19 pandemic based on medical information fusion | |
CN111370140A (zh) | 一种基于节点相似度的Kmeans中药材功效聚类方法 | |
Liu et al. | Application of the data mining algorithm in the clinical guide medical records | |
CN110970115B (zh) | 中药方剂性味归经的信息化表示方法 | |
CN113488188A (zh) | 中医经方古籍知识图谱构建及证候挖掘系统 | |
Zhu et al. | Research on characteristic manifestations of Xiaochaihu decoction based on association rules mining | |
Yang et al. | Understanding traditional Chinese medicine via statistical learning of expert‐specific Electronic Medical Records | |
Zhang et al. | Discovery of regularities in the use of herbs in traditional chinese medicine prescriptions | |
Fan et al. | Research on compatibility of prescription of TCP based on the principle of attribute partial order chart | |
Wei et al. | Summarizing professor Chen Ruquan's therapeutic experience of thyroid disease based on machine learning | |
Li et al. | Data Exploration and Mining on Traditional Chinese Medicine | |
Jin et al. | Construction and application of the multidimensional table for knowledge discovery in ancient Chinese books on materia medica | |
CAO | Analysis on compatibility and application of Glycyrrhizae Radix et Rhizoma and its herb pairs based on data mining method | |
LIU et al. | Discussion on the Rule of Drug Use of Flos Puerariae Based on Association Rules | |
Cheng et al. | A Support Vector Machine Learning for the Upward and Downward Tendency Theory of Traditional Chinese Medicine | |
Xiu et al. | Achievements of the Compendium Bencao Tujing (Illustrated Classic of Materia Medica): A preliminary study | |
Liu et al. | Study on Zhang Yunlings medication law in treating vertigo based on data mining. | |
CN116340480A (zh) | 一种基于文档主题生成模型的中医辨证系统及存储介质 | |
Huang et al. | A Multilayer Network Constructed for Herb and Prescription Efficacy Analysis. | |
Zhang et al. | Based on Association Rules of the System Construction of Chinese Medicine Prescription Data Mining and Mining Research on the Spleen and Heat Type of Prescription | |
Gong et al. | A method to discover compatibility regulation of Chinese herbs based on the combination of clustering analysis and herbs nature | |
CN117153428A (zh) | 一种防治放射性肺损伤的用药规律及作用机制的研究方法 | |
Lu et al. | Analysis of TCM hypertension syndrome types and core prescriptions based on SVD dimension reduction algorithms and association rules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |