CN116578677A - 一种针对医疗检验信息的检索系统和方法 - Google Patents

一种针对医疗检验信息的检索系统和方法 Download PDF

Info

Publication number
CN116578677A
CN116578677A CN202310861003.3A CN202310861003A CN116578677A CN 116578677 A CN116578677 A CN 116578677A CN 202310861003 A CN202310861003 A CN 202310861003A CN 116578677 A CN116578677 A CN 116578677A
Authority
CN
China
Prior art keywords
medical examination
examination information
data
information
medical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310861003.3A
Other languages
English (en)
Other versions
CN116578677B (zh
Inventor
于钦森
王晓燕
潘琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gaomi Traditional Chinese Medicine Hospital
Original Assignee
Gaomi Traditional Chinese Medicine Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gaomi Traditional Chinese Medicine Hospital filed Critical Gaomi Traditional Chinese Medicine Hospital
Priority to CN202310861003.3A priority Critical patent/CN116578677B/zh
Publication of CN116578677A publication Critical patent/CN116578677A/zh
Application granted granted Critical
Publication of CN116578677B publication Critical patent/CN116578677B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及医疗信息检索技术领域,尤其涉及一种针对医疗检验信息的检索系统和方法。所述方法包括以下步骤:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;并利用信息降噪算法对医疗检验信息进行降噪处理,以得到医疗检验信息降噪数据;利用基于机器学习的检验信息分类模型对医疗检验信息降噪数据进行分类处理,得到医疗检验信息类型数据;构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,以得到医疗检验信息结构化数据并存储至医疗检验信息数据库中。本发明通过使用关键词索引算法构建医疗检验信息关键词索引表,从而实现快速有效地提高医疗检验信息数据的检索速率。

Description

一种针对医疗检验信息的检索系统和方法
技术领域
本发明涉及医疗信息检索技术领域,尤其涉及一种针对医疗检验信息的检索系统和方法。
背景技术
在医疗卫生领域,记录和管理医疗检验数据是一个非常重要的工作,而如何快速有效地检索医疗检验数据,对于医疗检验、治疗、疾病监测和流行病学研究等方面有着至关重要的意义。医生通过对医疗检验数据的分析和解读,可以确定病人疾病情况、制定治疗方案并跟踪病人的病情。然而,对于大型医院等医疗机构而言,病人常常需要进行大量的医疗检验,且这些医疗检验数据通常存储在不同的医疗信息系统中,如何从海量的医疗信息中快速、准确地获取病人的医疗检验数据和相关报告等信息,且不影响医生工作效率,成为亟待解决的问题。另外,在大数据时代,医疗检验数据量呈指数级增长,传统的检索方法难以满足人们对于数据检索速度和准确性的需求。
发明内容
基于此,本发明有必要提供一种针对医疗检验信息的检索方法,以解决至少一个上述技术问题。
为实现上述目的,一种针对医疗检验信息的检索方法,包括以下步骤:
步骤S1:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;并利用信息降噪算法对医疗检验信息进行降噪处理,以得到医疗检验信息降噪数据;
步骤S2:利用基于机器学习的检验信息分类模型对医疗检验信息降噪数据进行分类处理,得到医疗检验信息类型数据;构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,以得到医疗检验信息结构化数据并存储至医疗检验信息数据库中;
步骤S3:通过特征提取技术对医疗检验信息结构化数据进行特征提取处理,得到医疗检验信息结构化数据特征;利用基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行索引处理,得到医疗检验信息关键词索引表;
步骤S4:利用预设的搜索引擎获取医疗专业人员输入的搜索词,以得到用户关键搜索词;利用索引匹配技术对用户关键搜索词与医疗检验信息关键词索引表进行匹配处理,得到搜索匹配结果信息;
步骤S5:根据搜索匹配结果信息利用实时检索技术对医疗检验信息数据库进行检索处理,得到医疗检验信息检索结果;利用可视化技术将医疗检验信息检索结果可视化展示以供相应的检验决策参考。
本发明通过使用自然语言处理技术可以有效地从医疗数据信息源中提取出医疗检验信息,包括检验名称、检验结果、检验时间等。此外,通过利用信息降噪算法可以去除医疗检验信息中的噪声或冗余的信息,从而提高后续处理的效率和准确性。利用基于机器学习的检验信息分类模型可以将降噪后的医疗检验信息降噪数据按照其类型进行分类,通过构建医疗检验信息数据库可以存储和管理结构化转换后的医疗检验信息结构化数据,以便于后续的检索和应用。利用结构化转换算法可以帮助提高医疗检验信息类型数据的可读性和可操作性,使其更易于被相关人员所理解和使用。然后,通过使用特征提取技术可以从医疗检验信息结构化数据中提取出关键特征,这些特征可以帮助后续的搜索和检索过程。另外,通过利用基于特征向量的关键词索引算法可以将医疗检验信息结构化数据特征转化为向量形式,并进行索引处理生成医疗检验信息关键词索引表,以便后续的计算和检索匹配处理。通过利用搜索引擎获取医疗专业人员输入的搜索词可以帮助医疗专业人员快速地提取关键搜索词。另外,通过利用合适的索引匹配技术可以根据关键搜索词匹配医疗检验信息关键词索引表,以得到更合适的搜索匹配结果信息。这能够提高搜索的精确度和效率,使搜索结果更符合用户的需求和期望。最后,通过实时检索技术可以迅速地从医疗检验信息数据库中获取相关医疗检验信息,并快速地返回医疗检验信息检索结果给医疗专业人员,从而提供更及时的反馈和决策支持。而可视化技术可以更直观地展示医疗检验信息检索结果,帮助医疗专业人员更快速地进行决策和判断,从而提高检索工作效率和准确性。
优选地,本发明还提供了一种针对医疗检验信息的检索系统,包括:
至少一个处理器;
与至少一个处理器通信连接的存储器;
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上任一项所述的针对医疗检验信息的检索方法。
综上所述,本发明提供了一种针对医疗检验信息的检索系统,该系统能够实现本发明所述任意一种针对医疗检验信息的检索方法,用于联合存储器、处理器及存储器上运行的计算机程序之间的操作实现一种针对医疗检验信息的检索方法,系统内部结构互相协作,该检索系统通过使用自然语言处理技术和信息降噪算法,可以高效、准确地从医疗数据信息源中提取出医疗检验信息,并去除无用或冗余信息,从而提高后续处理的效率和准确性。利用基于机器学习的检验信息分类模型和结构化转换算法,可以对医疗检验信息进行分类、结构化,并存储到医疗检验信息数据库中。这将有助于医疗专业人员更好地管理医疗检验信息数据,并且有助于后续的检索和分析。然后,通过使用特征提取技术和关键词索引算法有助于提高检索的准确性和效率。其中特征提取技术可以从医疗检验信息数据中提取出关键特征,以便于后续的搜索和检索过程。而关键词索引算法可以将特征转换为向量形式,并对其进行索引处理,以便快速地匹配医疗专业人员输入的关键词。通过索引匹配技术对医疗专业人员输入的关键词进行匹配,以得到搜索匹配结果信息,这将大大提高搜索匹配的精确度和效率。最后,通过使用实时检索技术和可视化技术可以帮助医疗专业人员更好地执行检验治疗决策。其中实时检索技术可以从医疗检验信息数据库中获取相关医疗检验信息,并快速地返回给用户。而可视化技术可以将医疗检验信息检索结果以可视化的方式展示,从而帮助医疗专业人员更好地理解和解释相关医疗检验信息。通过多种算法和技术对医疗检验信息进行检索处理,可以大大减少重复工作和人力投入,能够快速有效地检索医疗检验信息数据,以提高医疗检验信息数据检索的效率,从而简化了针对医疗检验信息的检索系统的操作流程。
附图说明
通过阅读参照以下附图所作的对非限制性实施所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明针对医疗检验信息的检索方法的步骤流程示意图;
图2为图1中步骤S1的详细步骤流程示意图;
图3为图2中步骤S13的详细步骤流程示意图;
图4为图1中步骤S2的详细步骤流程示意图。
具体实施方式
下面结合附图对本发明专利的技术方法进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器方法和/或微控制器方法中实现这些功能实体。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
为实现上述目的,请参阅图1至图4,本发明提供了一种针对医疗检验信息的检索方法,所述方法包括以下步骤:
步骤S1:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;并利用信息降噪算法对医疗检验信息进行降噪处理,以得到医疗检验信息降噪数据;
步骤S2:利用基于机器学习的检验信息分类模型对医疗检验信息降噪数据进行分类处理,得到医疗检验信息类型数据;构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,以得到医疗检验信息结构化数据并存储至医疗检验信息数据库中;
步骤S3:通过特征提取技术对医疗检验信息结构化数据进行特征提取处理,得到医疗检验信息结构化数据特征;利用基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行索引处理,得到医疗检验信息关键词索引表;
步骤S4:利用预设的搜索引擎获取医疗专业人员输入的搜索词,以得到用户关键搜索词;利用索引匹配技术对用户关键搜索词与医疗检验信息关键词索引表进行匹配处理,得到搜索匹配结果信息;
步骤S5:根据搜索匹配结果信息利用实时检索技术对医疗检验信息数据库进行检索处理,得到医疗检验信息检索结果;利用可视化技术将医疗检验信息检索结果可视化展示以供相应的检验决策参考。
本发明实施例中,请参考图1所示,为本发明针对医疗检验信息的检索方法的步骤流程示意图,在本实例中,所述针对医疗检验信息的检索方法的步骤包括:
步骤S1:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;并利用信息降噪算法对医疗检验信息进行降噪处理,以得到医疗检验信息降噪数据;
本发明实施例通过利用自然语言处理技术对医疗数据信息源进行分析和信息提取处理,以得到医疗检验信息。然后,通过设置一个合适的信息降噪算法对医疗检验信息进行降噪处理,消除医疗检验信息中噪声源的影响,最终得到医疗检验信息降噪数据。
步骤S2:利用基于机器学习的检验信息分类模型对医疗检验信息降噪数据进行分类处理,得到医疗检验信息类型数据;构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,以得到医疗检验信息结构化数据并存储至医疗检验信息数据库中;
本发明实施例通过支持向量机算法构建一个适当的检验信息分类模型,将医疗检验信息降噪数据作为该检验信息分类模型的输入对不同的医疗检验信息类型进行分类处理,以得到医疗检验信息类型数据。然后,构建医疗检验信息数据库,并通过设置一个合适的结构化转换算法将医疗检验信息类型数据中的非结构化或半结构化数据转化为结构化数据,以得到医疗检验信息结构化数据。最后,将转换后的医疗检验信息结构化数据存储至构建的医疗检验信息数据库中。
步骤S3:通过特征提取技术对医疗检验信息结构化数据进行特征提取处理,得到医疗检验信息结构化数据特征;利用基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行索引处理,得到医疗检验信息关键词索引表;
本发明实施例通过特征提取技术对结构化转换后的医疗检验信息结构化数据进行特征提取处理,以得到医疗检验信息结构化数据特征。然后,通过设置一个合适的基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行关键权值索引计算,将计算到的关键词索引权值按照从大到小的顺序进行排序,选取关键词索引权值排名靠前的医疗检验信息结构化数据特征进行索引构建,最终得到医疗检验信息关键词索引表。
步骤S4:利用预设的搜索引擎获取医疗专业人员输入的搜索词,以得到用户关键搜索词;利用索引匹配技术对用户关键搜索词与医疗检验信息关键词索引表进行匹配处理,得到搜索匹配结果信息;
本发明实施例通过设置一个合适的搜索引擎,并在搜索引擎的搜索框中获取医疗专业人员输入的搜索词,并利用相关关键词提取技术提取搜索词中的关键词,以得到用户关键搜索词。然后,通过采用前向索引、后向索引、反向索引等多种索引匹配技术对户关键搜索词与医疗检验信息关键词索引表进行匹配处理,最终得到搜索匹配结果信息。
步骤S5:根据搜索匹配结果信息利用实时检索技术对医疗检验信息数据库进行检索处理,得到医疗检验信息检索结果;利用可视化技术将医疗检验信息检索结果可视化展示以供相应的检验决策参考。
本发明实施例根据搜索匹配结果信息设置相应的检索规则和参数,并利用实时检索技术对医疗检验信息数据库进行实时检索处理,根据检索规则和参数将检索匹配的医疗检验信息数据记录下来,以得到医疗检验信息检索结果。然后,通过可视化技术将医疗检验信息检索结果以图形可视化方式展示给医疗专业人员,医疗专业人员通过对医疗检验信息检索结果进行研究和评估,根据研究和评估结果进行相应针对性的检验治疗决策。
本发明通过使用自然语言处理技术可以有效地从医疗数据信息源中提取出医疗检验信息,包括检验名称、检验结果、检验时间等。此外,通过利用信息降噪算法可以去除医疗检验信息中的噪声或冗余的信息,从而提高后续处理的效率和准确性。利用基于机器学习的检验信息分类模型可以将降噪后的医疗检验信息降噪数据按照其类型进行分类,通过构建医疗检验信息数据库可以存储和管理结构化转换后的医疗检验信息结构化数据,以便于后续的检索和应用。利用结构化转换算法可以帮助提高医疗检验信息类型数据的可读性和可操作性,使其更易于被相关人员所理解和使用。然后,通过使用特征提取技术可以从医疗检验信息结构化数据中提取出关键特征,这些特征可以帮助后续的搜索和检索过程。另外,通过利用基于特征向量的关键词索引算法可以将医疗检验信息结构化数据特征转化为向量形式,并进行索引处理生成医疗检验信息关键词索引表,以便后续的计算和检索匹配处理。通过利用搜索引擎获取医疗专业人员输入的搜索词可以帮助医疗专业人员快速地提取关键搜索词。另外,通过利用合适的索引匹配技术可以根据关键搜索词匹配医疗检验信息关键词索引表,以得到更合适的搜索匹配结果信息。这能够提高搜索的精确度和效率,使搜索结果更符合用户的需求和期望。最后,通过实时检索技术可以迅速地从医疗检验信息数据库中获取相关医疗检验信息,并快速地返回医疗检验信息检索结果给医疗专业人员,从而提供更及时的反馈和决策支持。而可视化技术可以更直观地展示医疗检验信息检索结果,帮助医疗专业人员更快速地进行决策和判断,从而提高检索工作效率和准确性。
优选地,步骤S1包括以下步骤:
步骤S11:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;
步骤S12:利用信息转换算法对医疗检验信息进行信息数据转换处理,以得到医疗检验信息待处理数据;
其中,信息转换算法函数如下所示:
式中,为转换后的医疗检验信息待处理数据,/>为控制信息转换过程的带宽参数,/>为控制信息转换过程的形态参数,/>为控制信息转换过程的时间参数,/>为信息转换过程的时间间隔,/>为信息转换过程的固定时间参数,/>为时间标准差系数,/>为伽马函数,/>为控制伽马函数的权重参数,/>为医疗检验信息待处理数据的修正值;
步骤S13:利用信息降噪算法对医疗检验信息数据进行降噪处理,以得到医疗检验信息降噪数据。
作为本发明的一个实施例,参考图2所示,为图1中步骤S1的详细步骤流程示意图,在本实施例中步骤S1包括以下步骤:
步骤S11:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;
本发明实施例通过利用自然语言处理技术对不同的医疗数据信息源进行分析和信息提取处理,从医疗数据信息源中提取出有效的信息,最终得到医疗检验信息。
步骤S12:利用信息转换算法对医疗检验信息进行信息数据转换处理,以得到医疗检验信息待处理数据;
本发明实施例通过设置合适的伽马函数、控制伽马函数的权重参数、控制信息转换的带宽参数、形态参数和时间参数以及修正值等参数来构建一个适当的信息转换算法,通过构建的信息转换算法对医疗检验信息快速进行信息数据转换,最终得到医疗检验信息待处理数据。
其中,信息转换算法函数如下所示:
式中,为转换后的医疗检验信息待处理数据,/>为控制信息转换过程的带宽参数,/>为控制信息转换过程的形态参数,/>为控制信息转换过程的时间参数,/>为信息转换过程的时间间隔,/>为信息转换过程的固定时间参数,/>为时间标准差系数,/>为伽马函数,/>为控制伽马函数的权重参数,/>为医疗检验信息待处理数据的修正值;
本发明构建了一个信息转换算法函数的公式,用于对医疗检验信息进行信息数据转换处理,该信息转换算法通过控制信息转换的带宽、形态和时间等参数,可以将医疗检验信息进行快速转换,使得医疗检验信息得到更好的数据关联性,从而提高数据处理速度和数据质量,增强数据关联性和可解释性。该算法函数公式充分考虑了控制信息转换过程的带宽参数,控制信息转换过程的形态参数/>,控制信息转换过程的时间参数/>,信息转换过程的时间间隔/>,信息转换过程的固定时间参数/>,时间标准差系数/>,伽马函数/>,控制伽马函数的权重参数/>,根据转换后的医疗检验信息待处理数据/>与以上各参数之间的相互关联关系构成了一种函数关系,该算法函数公式实现了对医疗检验信息的信息数据转换处理,同时,通过医疗检验信息待处理数据的修正值/>的引入可以根据实际情况进行调整,从而提高信息转换算法的准确性和适用性。
步骤S13:利用信息降噪算法对医疗检验信息数据进行降噪处理,以得到医疗检验信息降噪数据。
本发明实施例通过设置一个合适的信息降噪算法对医疗检验信息数据进行降噪处理,该信息降噪算法通过对医疗检验信息数据在频域上进行二维离散傅里叶变换,消除医疗检验信息数据中噪声源的影响,最终得到医疗检验信息降噪数据。
本发明通过使用自然语言处理技术对医疗数据信息源进行分析和信息提取,能够将医疗数据信息源中的关键信息自动提取处理,从而转化为有效的医疗检验信息,为后续的信息转换和降噪工作提供了数据基础。然后,通过利用合适的信息转换算法对提取的医疗检验信息进行数据转换处理,能够将非结构化的医疗检验信息数据转换为结构化数据,该信息转换算法通过控制信息转换的带宽、形态和时间等参数,从而使得信息转换算法适应不同种类、不同来源的医疗检验信息,为后续的降噪处理过程提供更加准确的医疗检验信息数据。最后,在医疗检验信息处理的过程中,有些信息数据可能带有误差或噪声干扰,通过利用信息降噪算法对医疗检验信息数据进行滤波和降噪处理,能够进一步提升医疗检验信息数据的质量,并且有利于后续的数据索引和检索过程,通过利用信息降噪算法,医疗检验信息数据可以被更加准确地分析和处理,从而提高医疗检验信息数据的质量和可靠性。
优选地,步骤S13包括以下步骤:
步骤S131:对医疗检验信息待处理数据进行数据清洗处理,得到医疗检验信息待降噪数据;
步骤S132:利用信息降噪算法对医疗检验信息待降噪数据进行噪声值计算,得到医疗检验信息噪声值;
其中,信息降噪算法函数如下所示:
式中,为第/>个医疗检验信息待降噪数据的医疗检验信息噪声值,/>为医疗检验信息待降噪数据的数量,/>为第/>个医疗检验信息待降噪数据在频域中的原始横坐标,/>为第/>个医疗检验信息待降噪数据在频域中的原始纵坐标,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的横坐标,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的纵坐标,/>为二维离散傅里叶变换核函数的距离调节指数,/>为医疗检验信息噪声值的修正值;
步骤S133:根据预设的医疗检验信息噪声阈值对医疗检验信息噪声值进行判断,当医疗检验信息噪声值大于或等于预设的医疗检验信息噪声阈值时,则剔除该医疗检验信息噪声值对应的医疗检验信息待降噪数据,得到医疗检验信息降噪数据;
步骤S134:根据预设的医疗检验信息噪声阈值对医疗检验信息噪声值进行判断,当医疗检验信息噪声值小于预设的医疗检验信息噪声阈值时,则直接将该医疗检验信息噪声值对应的医疗检验信息待降噪数据定义为医疗检验信息降噪数据。
作为本发明的一个实施例,参考图3所示,为图2中步骤S13的详细步骤流程示意图,在本实施例中步骤S13包括以下步骤:
步骤S131:对医疗检验信息待处理数据进行数据清洗处理,得到医疗检验信息待降噪数据;
本发明实施例通过对医疗检验信息待处理数据进行数据清洗、去除重复数据、异常数据、无效数据以及缺失值填充等处理后,最终得到医疗检验信息待降噪数据。
步骤S132:利用信息降噪算法对医疗检验信息待降噪数据进行噪声值计算,得到医疗检验信息噪声值;
本发明实施例通过设置一个合适的信息降噪算法对医疗检验信息待降噪数据进行噪声值计算,该信息降噪算法通过对医疗检验信息待降噪数据进行二维离散傅里叶变换,根据信息降噪算法对医疗检验信息待降噪数据中每个噪声频域信号点进行噪声值计算,最终得到医疗检验信息噪声值。
其中,信息降噪算法函数如下所示:
式中,为第/>个医疗检验信息待降噪数据的医疗检验信息噪声值,/>为医疗检验信息待降噪数据的数量,/>为第/>个医疗检验信息待降噪数据在频域中的原始横坐标,/>为第/>个医疗检验信息待降噪数据在频域中的原始纵坐标,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的横坐标,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的纵坐标,/>为二维离散傅里叶变换核函数的距离调节指数,/>为医疗检验信息噪声值的修正值;
本发明构建了一个信息降噪算法函数的公式,用于对医疗检验信息待降噪数据进行噪声值计算,为了消除医疗检验信息待降噪数据中的噪声源对后续的医疗检验信息数据检索过程的影响,需要对医疗检验信息待降噪数据进行降噪处理,以得到更加干净。准确的医疗检验信息待降噪数据,通过该信息降噪算法能够有效地去除医疗检验信息待降噪数据中的噪声和干扰数据,从而提高医疗检验信息待降噪数据的准确性和可靠性。该算法函数公式充分考虑了医疗检验信息待降噪数据的数量,第/>个医疗检验信息待降噪数据在频域中的原始横坐标/>,第/>个医疗检验信息待降噪数据在频域中的原始纵坐标/>,进行二维离散傅里叶变换后的医疗检验信息待降噪数据/>,进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的横坐标/>,进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的纵坐标/>,二维离散傅里叶变换核函数的距离调节指数/>,并需要对计算得到的医疗检验信息噪声值进行归一化处理,根据第/>个医疗检验信息待降噪数据的医疗检验信息噪声值/>与以上相互关联关系构成了一种函数关系,该算法函数公式实现了对医疗检验信息待降噪数据的噪声值进行计算,同时,该算法函数公式中的医疗检验信息噪声值的修正值/>可以根据实际情况进行调整,从而提高信息降噪算法的准确性和适用性。
步骤S133:根据预设的医疗检验信息噪声阈值对医疗检验信息噪声值进行判断,当医疗检验信息噪声值大于或等于预设的医疗检验信息噪声阈值时,则剔除该医疗检验信息噪声值对应的医疗检验信息待降噪数据,得到医疗检验信息降噪数据;
本发明实施例根据预设的医疗检验信息噪声阈值,判断计算得到的医疗检验信息噪声值是否超过预设的医疗检验信息噪声阈值,当医疗检验信息噪声值大于或等于预设的医疗检验信息噪声阈值时,说明该医疗检验信息噪声值对应的医疗检验信息待降噪数据中的噪声源的干扰影响较大,则剔除该医疗检验信息噪声值对应的医疗检验信息待降噪数据,最终得到医疗检验信息降噪数据。
步骤S134:根据预设的医疗检验信息噪声阈值对医疗检验信息噪声值进行判断,当医疗检验信息噪声值小于预设的医疗检验信息噪声阈值时,则直接将该医疗检验信息噪声值对应的医疗检验信息待降噪数据定义为医疗检验信息降噪数据。
本发明实施例根据预设的医疗检验信息噪声阈值,判断计算得到的医疗检验信息噪声值是否超过预设的医疗检验信息噪声阈值,当医疗检验信息噪声值小于预设的医疗检验信息噪声阈值时,说明该医疗检验信息噪声值对应的医疗检验信息待降噪数据中的噪声源的干扰影响较小,则直接将该医疗检验信息噪声值对应的医疗检验信息待降噪数据定义为医疗检验信息降噪数据。
本发明通过对医疗检验信息待处理数据进行数据清洗,在进行信息降噪处理之前,通过去除医疗检验信息待处理数据中可能存在的数据异常点、错误数据以及重复数据等,从而确保提取到的医疗检验信息待处理数据准确可靠。而得到的医疗检验信息待降噪数据中可能存在噪声干扰以及异常噪声源等情况,会对后续的医疗检验信息数据的检索工作造成不良影响,所以通过设置一个合适的信息降噪算法对医疗检验信息待降噪数据进行噪声值计算,能够识别和测量出医疗检验信息待降噪数据中存在的噪声和干扰信号,从源头上去除噪声信号,从而提高医疗检验信息待降噪数据的准确性和可靠性。该信息降噪算法通过对医疗检验信息待降噪数据进行二维离散傅里叶变换,并通过二维离散傅里叶变换距离调节指数对变换降噪过程进行调整和优化处理,以获得最佳的降噪效果和计算结果,从而较为精确地计算出医疗检验信息噪声值。然后,在信息降噪过程中,根据具体的数据降噪处理需求和质量标准,通过设定合适的医疗检验信息噪声阈值对计算得到的医疗检验信息噪声值进行判断,能够有效地剔除医疗检验信息噪声值较大的医疗检验信息待降噪数据,避免这些医疗检验信息待降噪数据对整体数据的影响,有助于进一步提高医疗检验信息降噪数据的质量,减少不必要的噪声干扰和误差,从而保证了医疗检验信息降噪数据的准确性和可靠性。最后,通过使用设定的医疗检验信息噪声阈值对医疗检验信息噪声值进行判断,将医疗检验信息噪声值较小的医疗检验信息待降噪数据定义为医疗检验信息降噪数据,可以得到更加准确和可靠的医疗检验信息降噪数据,避免过多的数据损失并保留更多的数据信息,这些数据较少受到噪声的干扰,能够为后续的检验信息分类处理提供更加稳定的数据基础,从而提高医疗检验信息降噪数据的可用性和有效性。
优选地,步骤S2包括以下步骤:
步骤S21:对医疗检验信息降噪数据进行数据预处理,得到医疗检验信息数据集;
步骤S22:利用基于支持向量机算法的检验信息分类模型对医疗检验信息数据集进行分类处理,得到医疗检验信息类型数据;
步骤S23:构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,得到医疗检验信息结构化数据,并将医疗检验信息结构化数据存储至医疗检验信息数据库。
作为本发明的一个实施例,参考图4所示,为图1中步骤S2的详细步骤流程示意图,在本实施例中步骤S2包括以下步骤:
步骤S21:对医疗检验信息降噪数据进行数据预处理,得到医疗检验信息数据集;
本发明实施例通过对降噪后的医疗检验信息降噪数据进行缺失值填充、去除重复数据、异常数据、无效数据、归一化以及标准化等预处理后,最终得到医疗检验信息数据集。
步骤S22:利用基于支持向量机算法的检验信息分类模型对医疗检验信息数据集进行分类处理,得到医疗检验信息类型数据;
本发明实施例通过支持向量机算法构建一个适当的检验信息分类模型,将医疗检验信息数据集作为该检验信息分类模型的输入对不同的医疗检验信息类型进行分类处理,最终得到医疗检验信息类型数据。
步骤S23:构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,得到医疗检验信息结构化数据,并将医疗检验信息结构化数据存储至医疗检验信息数据库。
本发明实施例通过构建一个备份储存医疗检验信息结构化数据的医疗检验信息数据库,并通过设置一个合适的结构化转换算法将医疗检验信息类型数据中的非结构化或半结构化数据转化为结构化数据,以得到医疗检验信息结构化数据,然后,将转换后的医疗检验信息结构化数据存储至构建的医疗检验信息数据库中。
本发明通过对医疗检验信息降噪数据进行数据预处理,通过数据清洗、去重、标准化等操作,能够大幅提升医疗检验信息降噪数据的质量和可靠性,从而得到高质量、可用性更高的医疗检验信息数据集,为后续的检验信息分类过程提供数据支持。然后,通过利用基于支持向量机算法的检验信息分类模型对医疗检验信息数据集进行分类、标识和归类,使得医疗检验信息数据集更加具有可读性和易理解性,为后续的结构化转换处理提供了数据保障,通过支持向量机算法构建分类模型进行分类处理,可以有效地提高分类准确度和精度,为下一步的数据处理提供更加准确和可靠的数据基础。最后,通过构建一个高可靠性、高可用性的医疗检验信息数据库,通过使用适当的结构化转换算法对分类处理后的医疗检验信息类型数据进行结构转换处理,将医疗检验信息类型数据中的非结构化或半结构化数据转化为结构化数据并存储至构建的医疗检验信息数据库中,为后续的数据分析和挖掘过程提供更好的数据支撑。将医疗检验信息结构化数据存储至医疗检验信息数据库中,方便对医疗检验信息结构化数据进行管理、查询和更新,挖掘医疗检验信息结构化数据中的隐藏信息和潜在规律,从而提高医疗检验信息结构化数据的整体管理效率,进一步提高医疗检验信息结构化数据的应用价值。
优选地,步骤S22包括以下步骤:
步骤S221:按照预设的划分规则将医疗检验信息数据集划分为医疗检验信息训练数据集、医疗检验信息验证数据集和医疗检验信息测试数据集;
本发明实施例通过将医疗检验信息数据集按照一定的划分比例划分为医疗检验信息训练数据集、医疗检验信息验证数据集和医疗检验信息测试数据集,根据预设的划分比例7:2:1将医疗检验信息数据集划分为70%的医疗检验信息训练数据集、20%的医疗检验信息验证数据集和10%的医疗检验信息测试数据集。
步骤S222:构建基于支持向量机算法的检验信息分类模型,其中检验信息分类模型包括模型训练、模型验证和模型评估;
本发明实施例根据实际情况,利用支持向量机算法构建检验信息分类模型,该检验信息分类模型包括模型训练、模型验证和模型评估,通过医疗检验信息训练数据集对检验信息分类模型进行模型训练,医疗检验信息验证数据集对检验信息分类模型进行模型验证,同时利用医疗检验信息测试数据集对检验信息分类模型进行模型评估,用来提高检验信息分类模型的泛化性能和鲁棒性。
步骤S223:将医疗检验信息训练数据集输入至基于支持向量机算法的检验信息分类模型进行模型训练,并通过交叉验证技术对模型参数进行优化处理,以生成验证模型;将医疗检验信息验证数据集输入至验证模型进行模型验证,以生成测试模型;
本发明实施例通过将划分后的医疗检验信息训练数据集输入至构建的检验信息分类模型中进行模型训练,并通过选择合适的交叉验证技术对模型参数进行优化处理,首先,将医疗检验信息训练数据集随机分为K个互不相交的子集,其中K通常取5或10,随机使用其中的K-1个子集作为模型的训练数据,剩余的1个子集作为验证数据,用来评估模型的性能,重复以上过程K次后,每次都将不同的子集作为验证数据来对模型进行评估,得到K个不同的评估结果。然后,计算K个评估结果的平均值,得到验证模型的评估结果。最后,使用验证模型对划分后的医疗检验信息验证数据集进行模型验证,以生成最终的测试模型。
步骤S224:将医疗检验信息测试数据集输入至测试模型中进行模型评估,以得到优化的检验信息分类模型;将医疗检验信息数据集重新输入至优化的检验信息分类模型中进行分类处理,以得到医疗检验信息类型数据。
本发明实施例通过将划分后的医疗检验信息测试数据集输入至经过参数优化后的测试模型中进行模型评估,通过计算模型的准确率、召回率、F1值等指标,对模型参数进一步检查和优化处理,获得更高效更准确的优化的检验信息分类模型,同时,将医疗检验信息数据集重新输入至优化的检验信息分类模型中进行分类处理,最终得到医疗检验信息类型数据。
本发明通过预设的划分规则对医疗检验信息数据集的划分,可以更好地利用医疗检验信息数据集对检验信息分类模型进行训练、验证和评估。同时,通过分离医疗检验信息数据集,可以避免过度拟合检验信息分类模型和提高检验信息分类模型的泛化能力,能够有效评估检验信息分类模型的性能,并通过评估结果为后续的参数调整提供依据。通过支持向量机算法构建一个适用于分类处理的检验信息分类模型,通过对构建的检验信息分类模型进行模型训练、模型验证以及模型评估等过程,能够实现对检验信息分类模型的全方位优化。支持向量机算法具有高效的分类能力,能够进行准确的分类和预测,极大地提高了医疗检验信息的分类准确率。然后,通过输入医疗检验信息训练数据集以及医疗检验信息验证数据集对检验信息分类模型进行训练和验证处理,并通过采用交叉验证技术优化模型参数,可以有效避免模型过拟合,从而提高检验信息分类模型的泛化性能。最后,通过输入医疗检验信息测试数据集,对生成的测试模型进行评估,获取检验信息分类模型的准确率来评估模型的可行性,以得到优化的检验信息分类模型。将医疗检验信息数据集重新输入至优化的检验信息分类模型中进行分类处理,能够准确地判断输入的医疗检验信息数据集属于哪个检验信息类别,从而提高分类准确性和分类速度。利用基于支持向量机算法的检验信息分类模型,通过对医疗检验信息数据集划分、模型训练、模型验证和模型评估等步骤,可以更加有效地优化医疗检验信息数据分类过程,从而达到更加完善的医疗检验信息分类效果。
优选地,步骤S23中的结构化转换算法的函数公式具体为:
式中,为结构化转换算法函数,/>为医疗检验信息类型数据,/>为医疗检验信息类型数据中数据记录的数量,/>为医疗检验信息类型数据中数据记录的索引参数,/>为医疗检验信息类型数据中第/>条数据记录结构化后的占用存储空间大小,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换指标值,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换时间戳,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的高斯分布标准差,/>为指数函数,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的调整平滑函数,/>为结构化转换算法函数的修正值。
本发明构建了一个结构化转换算法函数的公式,用于对医疗检验信息类型数据进行数据结构转换处理,该结构化转换算法能够将医疗检验信息类型数据中的非结构化或半结构化数据转化为结构化数据,通过将医疗检验信息类型数据进行结构化转换,从而大大提高了医疗检验信息类型数据在存储时的效率,节省存储空间,增强医疗检验信息类型数据的可读性和可解释性。该算法函数公式充分考虑了医疗检验信息类型数据,医疗检验信息类型数据中数据记录的数量/>,医疗检验信息类型数据中数据记录的索引参数/>,医疗检验信息类型数据中第/>条数据记录结构化后的占用存储空间大小/>,医疗检验信息类型数据中第/>条数据记录的结构化转换指标值/>,医疗检验信息类型数据中第/>条数据记录的结构化转换时间戳/>,医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的高斯分布标准差/>,医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的调整平滑函数,结构化转换算法函数的修正值/>,其中通过医疗检验信息类型数据/>,医疗检验信息类型数据中数据记录的数量/>,医疗检验信息类型数据中数据记录的索引参数/>,医疗检验信息类型数据中第/>条数据记录结构化后的占用存储空间大小/>,医疗检验信息类型数据中第/>条数据记录的结构化转换指标值/>,医疗检验信息类型数据中第/>条数据记录的结构化转换时间戳/>构成了一种结构化转换函数关系/>,另外,还通过医疗检验信息类型数据中数据记录的数量/>,医疗检验信息类型数据中数据记录的索引参数/>,医疗检验信息类型数据中第/>条数据记录的结构化转换指标值/>,医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的高斯分布标准差/>以及医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的调整平滑函数/>等参数之间的相互关系构成了一种结构化转换指标值的高斯分布函数关系/>,根据结构化转换算法函数/>与以上参数的关系构成了一种函数关系,该算法函数公式实现了对医疗检验信息类型数据的数据结构转换处理,同时,通过结构化转换算法函数的修正值/>的引入可以根据实际情况进行调整,从而提高结构化转换算法的准确性和鲁棒性。
优选地,步骤S3包括以下步骤:
步骤S31:通过特征提取技术对医疗检验信息结构化数据进行特征提取处理,得到医疗检验信息结构化数据特征;
本发明实施例通过特征提取技术对结构化转换后的医疗检验信息结构化数据进行特征提取处理,提取出相关的数据特征,最终得到医疗检验信息结构化数据特征。
步骤S32:利用基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行关键权值索引计算,得到关键词索引权值;
本发明实施例通过设置一个合适的基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行关键权值索引计算,该关键词索引算法通过使用关键词词频、特征权重值以及相关贡献参数准确计算和衡量医疗检验信息结构化数据特征中关键词的重要性和相关性,最终得到关键词索引权值。
其中,关键词索引算法函数如下所示:
式中,为医疗检验信息结构化数据特征中第/>个关键词的关键词索引权值,/>为医疗检验信息结构化数据特征中的关键词数量,/>为医疗检验信息结构化数据特征的特征数量,/>为第/>个关键词在第/>个医疗检验信息结构化数据特征中的出现频次,/>为第/>个关键词在第/>个医疗检验信息结构化数据特征中的出现频次,/>为医疗检验信息结构化数据特征的特征权重数量,/>为医疗检验信息结构化数据特征的第/>个特征权重值,/>为特征权重值的附加参数数量,/>为特征权重值中的第/>个附加参数,/>为第/>个特征权重值中的第/>个附加参数在第/>个医疗检验信息结构化数据特征中的贡献参数,/>为第/>个特征权重值中的第/>个附加参数在第/>个医疗检验信息结构化数据特征中的贡献参数,/>为指数函数,/>为积分调和平滑参数,/>为关键权值索引时间变量,/>为关键词索引权值的修正值;
本发明构建了一个关键词索引算法函数的公式,用于对医疗检验信息结构化数据特征进行关键权值索引计算,该关键词索引算法能够对医疗检验信息结构化数据特征中的各个关键词进行索引权值计算,快速定位与查询关键词相关的医疗检验信息结构化数据,并能够准确地计算和衡量医疗检验信息结构化数据特征中关键词的重要性和相关性,从而帮助用户快速地定位和查找需要的医疗检验信息。该算法函数公式充分考虑了医疗检验信息结构化数据特征中的关键词数量,医疗检验信息结构化数据特征的特征数量/>,第/>个关键词在第/>个医疗检验信息结构化数据特征中的出现频次/>,第/>个关键词在第/>个医疗检验信息结构化数据特征中的出现频次/>,医疗检验信息结构化数据特征的特征权重数量/>,医疗检验信息结构化数据特征的第/>个特征权重值/>,特征权重值的附加参数数量/>,特征权重值中的第/>个附加参数/>,第/>个特征权重值中的第/>个附加参数在第/>个医疗检验信息结构化数据特征中的贡献参数/>,第/>个特征权重值中的第/>个附加参数在第/>个医疗检验信息结构化数据特征中的贡献参数/>,积分调和平滑参数/>,关键权值索引时间变量/>,根据医疗检验信息结构化数据特征中第/>个关键词的关键词索引权值/>与以上各参数之间的相互关系构成了一种函数关系,实现了对医疗检验信息结构化数据特征的关键权值索引计算,同时,通过关键词索引权值的修正值/>的引入可以根据实际情况进行调整,从而提高关键词索引算法的稳定性和泛化能力。
步骤S33:按照从大到小的顺序对关键词索引权值进行排序,选取排名靠前的关键词索引权值对应的医疗检验信息结构化数据特征进行索引构建处理,得到医疗检验信息关键词索引表。
本发明实施例通过将计算到的关键词索引权值按照从大到小的顺序进行排序,根据排序后的结果,选取排名靠前的关键词索引权值对应的医疗检验信息结构化数据特征进行索引构建,最终得到医疗检验信息关键词索引表。
本发明通过特征提取技术对医疗检验信息结构化数据进行特征提取处理,特征提取是将大量的医疗检验信息结构化数据压缩成更少、更有代表性的特征的过程,能够从原始的医疗检验信息结构化数据中提取出有用的信息并生成更简化、更易处理的特征表示形式。通过对医疗检验信息结构化数据进行特征提取,有助于识别出医疗检验信息结构化数据中的模式和规律,为后续的关键词索引和索引构建提供数据基础。然后,通过使用基于特征向量的关键词索引算法计算出医疗检验信息结构化数据特征中的关键词索引权值,能够准确地计算和衡量医疗检验信息结构化数据特征中关键词的重要性和相关性,从而帮助用户快速地定位和查找需要的医疗检验信息,提高搜索准确性和效率。最后,通过对计算得到的关键词索引权值进行排序,筛选出一定数量的高质量、高频率的关键词,对这些关键词进行索引构建,可以构建出一个高速且有效的医疗检验信息关键词索引表,为后续的数据检索和分析过程提供了数据支持。
优选地,步骤S4包括以下步骤:
步骤S41:利用预设的搜索引擎获得医疗专业人员输入的搜索词,以得到用户搜索词;
本发明实施例通过设置一个合适的搜索引擎,并在搜索引擎的搜索框中获取医疗专业人员输入的搜索词,最终得到用户搜索词。
步骤S42:对用户搜索词进行关键词提取处理,得到用户关键搜索词;
本发明实施例通过对用户搜索词进行去停用词、分词等自然语言处理技术提取出用户搜索词的关键词,并对关键词进行一定的筛选和加权处理,最终得到用户关键搜索词。
步骤S43:利用索引匹配技术对用户关键搜索词与医疗检验信息关键词索引表进行匹配处理,得到搜索匹配结果信息。
本发明实施例通过采用前向索引、后向索引、反向索引等多种索引匹配技术对户关键搜索词与医疗检验信息关键词索引表进行匹配处理,最终得到搜索匹配结果信息。
本发明通过利用预设的搜索引擎获取医疗专业人员输入的搜索词并对用户搜索词进行关键词提取处理,能够将用户搜索词变得更加精准和合理,从而提高搜索精度,通过搜索引擎快速获取用户关键搜索词,利用索引匹配技术对用户关键搜索词与医疗检验信息关键词索引表进行匹配处理得到搜索匹配结果信息,并对搜索匹配结果信息进行精细化排序,将相关度高的搜索匹配结果排在前面,使得搜索结果更符合医疗专业人员的需求。通过索引匹配技术的应用,可以实现对大量医疗检验信息数据的快速检索和查找,从而提高了医疗专业人员的工作效率。
优选地,步骤S5包括以下步骤:
步骤S51:根据搜索匹配结果信息利用实时检索技术对医疗检验信息数据库进行检索处理,得到医疗检验信息检索结果;
本发明实施例根据搜索匹配结果信息设置相应的检索规则和参数,利用实时检索技术对医疗检验信息数据库进行实时检索处理,根据检索规则和参数将检索匹配的医疗检验信息数据记录下来,最终得到医疗检验信息检索结果。
步骤S52:利用可视化技术将医疗检验信息检索结果可视化展示给医疗专业人员,通过对医疗检验信息检索结果进行研究和评估,得到医疗检验治疗方案;
本发明实施例通过数据可视化技术将医疗检验信息检索结果以图形可视化方式展示给医疗专业人员,医疗专业人员通过对医疗检验信息检索结果进行研究和评估,根据研究和评估结果制定检验治疗方案,最终得到医疗检验治疗方案。
步骤S53:根据医疗检验治疗方案制定相应的检验治疗决策,通过可视化展示医疗检验信息检索结果以执行相应针对性的检验治疗决策。
本发明实施例根据得到的医疗检验治疗方案制定相应的检验治疗决策,将医疗检验信息检索结果通过可视化展示方式呈现给医疗专业人员,根据呈现的医疗检验信息检索结果进行相应针对性的检验治疗决策。
本发明根据搜索匹配结果信息通过使用实时检索技术对医疗检验信息数据库进行检索处理,能够将检索结果快速地呈现给医疗专业人员,并根据匹配度对检索结果进行排序,从而提供更准确的医疗检验信息检索结果。然后,利用可视化技术将医疗检验信息检索结果可视化展示给医疗专业人员,可以方便医疗专业人员对医疗检验信息检索结果进行研究和评估,快速地了解医疗检验信息的关联和趋势。通过对医疗检验信息进行分析,医疗专业人员可以得到更全面、准确的医疗检验治疗方案,并根据医疗检验治疗方案制定合理的检验治疗决策,更好地为患者提供精准的检验治疗决策。
优选地,本发明还提供了一种针对医疗检验信息的检索系统,包括:
至少一个处理器;
与至少一个处理器通信连接的存储器;
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上任一项所述的针对医疗检验信息的检索方法。
综上所述,本发明提供了一种针对医疗检验信息的检索系统,该系统能够实现本发明所述任意一种针对医疗检验信息的检索方法,用于联合存储器、处理器及存储器上运行的计算机程序之间的操作实现一种针对医疗检验信息的检索方法,系统内部结构互相协作,该检索系统通过使用自然语言处理技术和信息降噪算法,可以高效、准确地从医疗数据信息源中提取出医疗检验信息,并去除无用或冗余信息,从而提高后续处理的效率和准确性。利用基于机器学习的检验信息分类模型和结构化转换算法,可以对医疗检验信息进行分类、结构化,并存储到医疗检验信息数据库中。这将有助于医疗专业人员更好地管理医疗检验信息数据,并且有助于后续的检索和分析。然后,通过使用特征提取技术和关键词索引算法有助于提高检索的准确性和效率。其中特征提取技术可以从医疗检验信息数据中提取出关键特征,以便于后续的搜索和检索过程。而关键词索引算法可以将特征转换为向量形式,并对其进行索引处理,以便快速地匹配医疗专业人员输入的关键词。通过索引匹配技术对医疗专业人员输入的关键词进行匹配,以得到搜索匹配结果信息,这将大大提高搜索匹配的精确度和效率。最后,通过使用实时检索技术和可视化技术可以帮助医疗专业人员更好地执行检验治疗决策。其中实时检索技术可以从医疗检验信息数据库中获取相关医疗检验信息,并快速地返回给用户。而可视化技术可以将医疗检验信息检索结果以可视化的方式展示,从而帮助医疗专业人员更好地理解和解释相关医疗检验信息。通过多种算法和技术对医疗检验信息进行检索处理,可以大大减少重复工作和人力投入,能够快速有效地检索医疗检验信息数据,以提高医疗检验信息数据检索的效率,从而简化了针对医疗检验信息的检索系统的操作流程。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种针对医疗检验信息的检索方法,其特征在于,包括以下步骤:
步骤S1:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;并利用信息降噪算法对医疗检验信息进行降噪处理,以得到医疗检验信息降噪数据;
步骤S2:利用基于机器学习的检验信息分类模型对医疗检验信息降噪数据进行分类处理,得到医疗检验信息类型数据;构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,以得到医疗检验信息结构化数据并存储至医疗检验信息数据库中;
步骤S3:通过特征提取技术对医疗检验信息结构化数据进行特征提取处理,得到医疗检验信息结构化数据特征;利用基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行索引处理,得到医疗检验信息关键词索引表;
步骤S4:利用预设的搜索引擎获取医疗专业人员输入的搜索词,以得到用户关键搜索词;利用索引匹配技术对用户关键搜索词与医疗检验信息关键词索引表进行匹配处理,得到搜索匹配结果信息;
步骤S5:根据搜索匹配结果信息利用实时检索技术对医疗检验信息数据库进行检索处理,得到医疗检验信息检索结果;利用可视化技术将医疗检验信息检索结果可视化展示以供相应的检验决策参考。
2.根据权利要求1所述的针对医疗检验信息的检索方法,其特征在于,步骤S1包括以下步骤:
步骤S11:利用自然语言处理技术对医疗数据信息源进行信息提取处理,得到医疗检验信息;
步骤S12:利用信息转换算法对医疗检验信息进行信息数据转换处理,以得到医疗检验信息待处理数据;
其中,信息转换算法函数如下所示:
式中,为转换后的医疗检验信息待处理数据,/>为控制信息转换过程的带宽参数,/>为控制信息转换过程的形态参数,/>为控制信息转换过程的时间参数,/>为信息转换过程的时间间隔,/>为信息转换过程的固定时间参数,/>为时间标准差系数,/>为伽马函数,/>为控制伽马函数的权重参数,/>为医疗检验信息待处理数据的修正值;
步骤S13:利用信息降噪算法对医疗检验信息数据进行降噪处理,以得到医疗检验信息降噪数据。
3.根据权利要求2所述的针对医疗检验信息的检索方法,其特征在于,步骤S13包括以下步骤:
步骤S131:对医疗检验信息待处理数据进行数据清洗处理,得到医疗检验信息待降噪数据;
步骤S132:利用信息降噪算法对医疗检验信息待降噪数据进行噪声值计算,得到医疗检验信息噪声值;
其中,信息降噪算法函数如下所示:
式中,为第/>个医疗检验信息待降噪数据的医疗检验信息噪声值,/>为医疗检验信息待降噪数据的数量,/>为第/>个医疗检验信息待降噪数据在频域中的原始横坐标,/>为第/>个医疗检验信息待降噪数据在频域中的原始纵坐标,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的横坐标,/>为进行二维离散傅里叶变换后的医疗检验信息待降噪数据在频域中的纵坐标,/>为二维离散傅里叶变换核函数的距离调节指数,/>为医疗检验信息噪声值的修正值;
步骤S133:根据预设的医疗检验信息噪声阈值对医疗检验信息噪声值进行判断,当医疗检验信息噪声值大于或等于预设的医疗检验信息噪声阈值时,则剔除该医疗检验信息噪声值对应的医疗检验信息待降噪数据,得到医疗检验信息降噪数据;
步骤S134:根据预设的医疗检验信息噪声阈值对医疗检验信息噪声值进行判断,当医疗检验信息噪声值小于预设的医疗检验信息噪声阈值时,则直接将该医疗检验信息噪声值对应的医疗检验信息待降噪数据定义为医疗检验信息降噪数据。
4.根据权利要求1所述的针对医疗检验信息的检索方法,其特征在于,步骤S2包括以下步骤:
步骤S21:对医疗检验信息降噪数据进行数据预处理,得到医疗检验信息数据集;
步骤S22:利用基于支持向量机算法的检验信息分类模型对医疗检验信息数据集进行分类处理,得到医疗检验信息类型数据;
步骤S23:构建医疗检验信息数据库,通过结构化转换算法对医疗检验信息类型数据进行数据结构转换处理,得到医疗检验信息结构化数据,并将医疗检验信息结构化数据存储至医疗检验信息数据库。
5.根据权利要求4所述的针对医疗检验信息的检索方法,其特征在于,步骤S22包括以下步骤:
步骤S221:按照预设的划分规则将医疗检验信息数据集划分为医疗检验信息训练数据集、医疗检验信息验证数据集和医疗检验信息测试数据集;
步骤S222:构建基于支持向量机算法的检验信息分类模型,其中检验信息分类模型包括模型训练、模型验证和模型评估;
步骤S223:将医疗检验信息训练数据集输入至基于支持向量机算法的检验信息分类模型进行模型训练,并通过交叉验证技术对模型参数进行优化处理,以生成验证模型;将医疗检验信息验证数据集输入至验证模型进行模型验证,以生成测试模型;
步骤S224:将医疗检验信息测试数据集输入至测试模型中进行模型评估,以得到优化的检验信息分类模型;将医疗检验信息数据集重新输入至优化的检验信息分类模型中进行分类处理,以得到医疗检验信息类型数据。
6.根据权利要求4所述的针对医疗检验信息的检索方法,其特征在于,步骤S23中的结构化转换算法的函数公式具体为:
式中,为结构化转换算法函数,/>为医疗检验信息类型数据,/>为医疗检验信息类型数据中数据记录的数量,/>为医疗检验信息类型数据中数据记录的索引参数,/>为医疗检验信息类型数据中第/>条数据记录结构化后的占用存储空间大小,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换指标值,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换时间戳,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的高斯分布标准差,/>为指数函数,/>为医疗检验信息类型数据中第/>条数据记录的结构化转换指标值的调整平滑函数,/>为结构化转换算法函数的修正值。
7.根据权利要求1所述的针对医疗检验信息的检索方法,其特征在于,步骤S3包括以下步骤:
步骤S31:通过特征提取技术对医疗检验信息结构化数据进行特征提取处理,得到医疗检验信息结构化数据特征;
步骤S32:利用基于特征向量的关键词索引算法对医疗检验信息结构化数据特征进行关键权值索引计算,得到关键词索引权值;
其中,关键词索引算法函数如下所示:
式中,为医疗检验信息结构化数据特征中第/>个关键词的关键词索引权值,/>为医疗检验信息结构化数据特征中的关键词数量,/>为医疗检验信息结构化数据特征的特征数量,/>为第/>个关键词在第/>个医疗检验信息结构化数据特征中的出现频次,/>为第/>个关键词在第/>个医疗检验信息结构化数据特征中的出现频次,/>为医疗检验信息结构化数据特征的特征权重数量,/>为医疗检验信息结构化数据特征的第/>个特征权重值,/>为特征权重值的附加参数数量,/>为特征权重值中的第/>个附加参数,/>为第/>个特征权重值中的第/>个附加参数在第/>个医疗检验信息结构化数据特征中的贡献参数,/>为第/>个特征权重值中的第/>个附加参数在第/>个医疗检验信息结构化数据特征中的贡献参数,/>为指数函数,/>为积分调和平滑参数,/>为关键权值索引时间变量,/>为关键词索引权值的修正值;
步骤S33:按照从大到小的顺序对关键词索引权值进行排序,选取排名靠前的关键词索引权值对应的医疗检验信息结构化数据特征进行索引构建处理,得到医疗检验信息关键词索引表。
8.根据权利要求1所述的针对医疗检验信息的检索方法,其特征在于,步骤S4包括以下步骤:
步骤S41:利用预设的搜索引擎获得医疗专业人员输入的搜索词,以得到用户搜索词;
步骤S42:对用户搜索词进行关键词提取处理,得到用户关键搜索词;
步骤S43:利用索引匹配技术对用户关键搜索词与医疗检验信息关键词索引表进行匹配处理,得到搜索匹配结果信息。
9.根据权利要求1所述的针对医疗检验信息的检索方法,其特征在于,步骤S5包括以下步骤:
步骤S51:根据搜索匹配结果信息利用实时检索技术对医疗检验信息数据库进行检索处理,得到医疗检验信息检索结果;
步骤S52:利用可视化技术将医疗检验信息检索结果可视化展示给医疗专业人员,通过对医疗检验信息检索结果进行研究和评估,得到医疗检验治疗方案;
步骤S53:根据医疗检验治疗方案制定相应的检验治疗决策,通过可视化展示医疗检验信息检索结果以执行相应针对性的检验治疗决策。
10.一种针对医疗检验信息的检索系统,其特征在于,包括:
至少一个处理器;
与至少一个处理器通信连接的存储器;
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如权利要求1至9中任一项所述的针对医疗检验信息的检索方法。
CN202310861003.3A 2023-07-14 2023-07-14 一种针对医疗检验信息的检索系统和方法 Active CN116578677B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310861003.3A CN116578677B (zh) 2023-07-14 2023-07-14 一种针对医疗检验信息的检索系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310861003.3A CN116578677B (zh) 2023-07-14 2023-07-14 一种针对医疗检验信息的检索系统和方法

Publications (2)

Publication Number Publication Date
CN116578677A true CN116578677A (zh) 2023-08-11
CN116578677B CN116578677B (zh) 2023-09-15

Family

ID=87541742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310861003.3A Active CN116578677B (zh) 2023-07-14 2023-07-14 一种针对医疗检验信息的检索系统和方法

Country Status (1)

Country Link
CN (1) CN116578677B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076454A (zh) * 2023-08-21 2023-11-17 广州地铁集团有限公司 一种工程质量验收表单数据结构化存储方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007051397A1 (fr) * 2005-11-01 2007-05-10 Huawei Technologies Co., Ltd. Systeme d’extraction d’informations et procede d’extraction d’informations
CN102043812A (zh) * 2009-10-13 2011-05-04 北京大学 一种医疗信息的检索方法及系统
WO2014033855A1 (ja) * 2012-08-29 2014-03-06 株式会社日立製作所 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法
CN104834736A (zh) * 2015-05-19 2015-08-12 深圳证券信息有限公司 构建索引库的方法、装置及检索的方法、装置和系统
CN105335456A (zh) * 2015-09-23 2016-02-17 昆明理工大学 一种用于环境保护法规检索的关联优先排序方法
CN105335487A (zh) * 2015-10-16 2016-02-17 北京农业信息技术研究中心 基于农业技术信息本体库的农业专家信息检索系统及方法
CN107066599A (zh) * 2017-04-20 2017-08-18 北京文因互联科技有限公司 一种基于知识库推理的相似上市公司企业检索分类方法及系统
CN109063094A (zh) * 2018-07-27 2018-12-21 吉首大学 一种建立中医药知识图谱的方法
CN112559684A (zh) * 2020-12-10 2021-03-26 中科院计算技术研究所大数据研究院 一种关键词提取及信息检索方法
CN113628734A (zh) * 2021-08-02 2021-11-09 浙江海心智惠科技有限公司 一种带临床决策智能推荐功能的肿瘤科电子医嘱系统设计方法
CN115858906A (zh) * 2022-12-26 2023-03-28 中移动信息技术有限公司 企业搜索方法、装置、设备、计算机存储介质及程序

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007051397A1 (fr) * 2005-11-01 2007-05-10 Huawei Technologies Co., Ltd. Systeme d’extraction d’informations et procede d’extraction d’informations
CN102043812A (zh) * 2009-10-13 2011-05-04 北京大学 一种医疗信息的检索方法及系统
WO2014033855A1 (ja) * 2012-08-29 2014-03-06 株式会社日立製作所 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法
CN104834736A (zh) * 2015-05-19 2015-08-12 深圳证券信息有限公司 构建索引库的方法、装置及检索的方法、装置和系统
CN105335456A (zh) * 2015-09-23 2016-02-17 昆明理工大学 一种用于环境保护法规检索的关联优先排序方法
CN105335487A (zh) * 2015-10-16 2016-02-17 北京农业信息技术研究中心 基于农业技术信息本体库的农业专家信息检索系统及方法
CN107066599A (zh) * 2017-04-20 2017-08-18 北京文因互联科技有限公司 一种基于知识库推理的相似上市公司企业检索分类方法及系统
CN109063094A (zh) * 2018-07-27 2018-12-21 吉首大学 一种建立中医药知识图谱的方法
CN112559684A (zh) * 2020-12-10 2021-03-26 中科院计算技术研究所大数据研究院 一种关键词提取及信息检索方法
CN113628734A (zh) * 2021-08-02 2021-11-09 浙江海心智惠科技有限公司 一种带临床决策智能推荐功能的肿瘤科电子医嘱系统设计方法
CN115858906A (zh) * 2022-12-26 2023-03-28 中移动信息技术有限公司 企业搜索方法、装置、设备、计算机存储介质及程序

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIMING XU; XIAOPENG YAO; LISHA ZHONG; JIANBO LEI; ZHIWEI HUANG: "Graph Regularized Hierarchical Diffusion Process With Relevance Feedback for Medical Image Retrieval", IEEE ACCESS, pages 25062 - 25072 *
宁健: "面向生物医学领域的跨语言信息检索", 中国优秀硕士学位论文全文数据库, pages 138 - 1361 *
曹艳蓉;章韵;李涛;李华康;: "基于可信评价的医疗社区咨询检索优化算法", 计算机科学, no. 10, pages 157 - 161 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076454A (zh) * 2023-08-21 2023-11-17 广州地铁集团有限公司 一种工程质量验收表单数据结构化存储方法及系统
CN117076454B (zh) * 2023-08-21 2024-03-12 广州地铁集团有限公司 一种工程质量验收表单数据结构化存储方法及系统

Also Published As

Publication number Publication date
CN116578677B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
CN110680326B (zh) 基于深度卷积神经网络的尘肺病鉴别及分级判定方法
CN110299209B (zh) 相似病历查找方法、装置、设备及可读存储介质
CN116578677B (zh) 一种针对医疗检验信息的检索系统和方法
CN109801687B (zh) 一种面向健康领域的因果关系知识库的构建方法和系统
EP2562690A2 (en) Assigning a number of reference measurement data sets to an input measurement data set
CN111524570B (zh) 一种基于机器学习的超声随访患者筛选方法
CN116597939A (zh) 基于大数据的药品质量控制管理分析系统及方法
CN115438040A (zh) 一种病理档案信息管理方法及系统
JP4250284B2 (ja) 診療報酬明細書分析システム
Malik et al. A comprehensive approach towards data preprocessing techniques & association rules
Theron The use of data mining for predicting injuries in professional football players
Manikandan et al. A mathematical approach for feature selection and image retrieval of ultra sound kidney image databases
CN109300030A (zh) 实现股票投资推荐的方法和装置
US11321372B2 (en) Method and system for a natural language processing using data streaming
CN114444563A (zh) 一种异常医疗费用的检测方法、装置及存储介质
Ribeiro et al. How to improve medical image diagnosis through association rules: The IDEA method
JPH0512351A (ja) 診断支援システム
Tirunagari et al. Automatic classification of irregularly sampled time series with unequal lengths: A case study on estimated glomerular filtration rate
Nejad et al. A novel image categorization strategy based on salp swarm algorithm to enhance efficiency of MRI images
Dutta et al. Cross-validated AdaBoost classifier used for brain tumor detection
Setiawan et al. ANALYSIS OF CLASSIFICATION OF LUNG CANCER USING THE DECISION TREE CLASSIFIER METHOD
US11941020B2 (en) Displaying query results using machine learning model-determined query results visualizations
Yan Gingivitis Detection by Wavelet Energy Entropy and Linear Regression Classifier
CN114238630A (zh) 一种不良事件影响因素分析系统及方法
CN116664319A (zh) 一种基于大数据的金融保单分类系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant