CN117251556A - 一种登记队列中患者筛选系统及方法 - Google Patents

一种登记队列中患者筛选系统及方法 Download PDF

Info

Publication number
CN117251556A
CN117251556A CN202311534750.2A CN202311534750A CN117251556A CN 117251556 A CN117251556 A CN 117251556A CN 202311534750 A CN202311534750 A CN 202311534750A CN 117251556 A CN117251556 A CN 117251556A
Authority
CN
China
Prior art keywords
screening
patient
language
module
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311534750.2A
Other languages
English (en)
Inventor
张洪亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Longleding Medical Technology Co ltd
Original Assignee
Beijing Longleding Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Longleding Medical Technology Co ltd filed Critical Beijing Longleding Medical Technology Co ltd
Priority to CN202311534750.2A priority Critical patent/CN117251556A/zh
Publication of CN117251556A publication Critical patent/CN117251556A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • G06F16/3328Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及医疗数据处理技术领域,更具体的,涉及一种登记队列中患者筛选系统及方法。本发明公开了一种登记队列中患者筛选系统,包括:语言输入模块、语言处理模块、筛选处理模块、数据库模块、图形交互模块。本发明通过预先训练好的大语言模型将自然语言转换为筛选指令,再由筛选处理模块将其转换为查询命令,可以让医护人员能够通过自然语言与筛选系统进行交互。相较于人工编写代码,本发明使用自然语言进行交互更加高效,可以实时观察到筛选效果,大大提高工作效率;并且本发明避免了医护人员和编码工程师之间的沟通,从而降低因不同的理解出现错误的可能性。本发明解决了现有采用人工编写代码的方式实现复杂筛选条件存在效率低的问题。

Description

一种登记队列中患者筛选系统及方法
技术领域
本发明涉及医疗数据处理技术领域,更具体的,涉及一种登记队列中患者筛选系统、以及应用在该系统的登记队列中患者筛选方法。
背景技术
当前的登记队列研究中,简单的患者筛选条件可以使用图形交互界面进行配置,对于复杂的筛选条件,则只能通过编写代码(如使用R语言编写脚本)实现。这项工作存在以下缺点:
1. 代码编写效率远不如图形交互界面配置。图形交互界面可以实时反馈筛选结果,并复核配置是否正确;编写代码需要调试、测试、运行,再查看结果。使用图形交互界面配置需要几分钟,而编写代码往往需要一天左右;
2. 代码编写需要有相关的专业能力、存在较高的技术门槛。一般的医护人员不具备编写代码的技能,从而无法进行复杂条件的筛选,这限制了医护人员在临床研究中的工作;
3. 医护人员遇到复杂筛选需求时,只能委托编码工程师进行相关工作。医护人员与编码工程师之间的沟通存在专业隔阂,可能会因不同的理解出现需求供给不匹配而发生错误。
总结来说就是,现有通过人工编写代码实现复杂筛选条件的方式存在效率上的不足。
发明内容
基于此,有必要针对现有采用人工编写代码的方式实现复杂筛选条件存在效率低的问题,提供了一种登记队列中患者筛选系统、方法。
本发明采用以下技术方案实现:
第一方面,本发明公开了一种登记队列中患者筛选系统,包括:语言输入模块、语言处理模块、筛选处理模块、数据库模块、图形交互模块。
语言输入模块用于输入用户的自然语言;其中,自然语言包含了用户提出的筛选条件。语言处理模块加载有预先训练完成好的大语言模型,用于处理来自语言输入模块的自然语言、并将自然语言转换成筛选指令。筛选处理模块用于接收来自语言处理模块的筛选指令、并将筛选指令转换成查询命令。数据库模块存储有患者信息;数据库模块依据查询命令进行查询并返回查询结果。图形交互模块用于进行人机交互、并反映出实时结果。
该种登记队列中患者筛选系统实现根据本公开的实施例的方法或过程。
第二方面,本发明公开了一种登记队列中患者筛选方法,应用在第一方面公开的登记队列中患者筛选系统,包括:
用户通过语言输入模块输入包含筛选条件的自然语言;
待自然语言被用户确认后,语言处理模块再将自然语言转换成筛选指令;
待筛选指令被用户确认后,筛选处理模块再将筛选指令转换成查询命令;
数据库模块依据查询命令查询并返回查询结果,查询结果通过图形交互模块显示给用户。
该种登记队列中患者筛选方法实现根据本公开的实施例的方法或过程。
与现有技术相比,本发明具备如下有益效果:
1,本发明通过预先训练好的大语言模型将自然语言转换为筛选指令,再由筛选处理模块将其转换为查询命令,可以让医护人员能够通过自然语言与筛选系统进行交互,为临床研究工作带来益处。
2,本发明可以让医护人员通过自然语言与筛选系统交互,来实现复杂条件的筛选;对于不擅长编写代码的医护人员来说,降低了使用门槛,并能极大丰富他们的筛选能力,提升他们的科研能力。
3,相较于人工编写代码,本发明使用自然语言进行交互更加高效,可以实时观察到筛选效果,大大提高工作效率;并且本发明避免了医护人员和编码工程师之间的沟通,从而降低因不同的理解出现错误的可能性。
附图说明
图1为本发明实施例1中登记队列中患者筛选系统的结构图;
图2为本发明实施例2中登记队列中患者筛选系统的图形化交互界面。
具体实施方式
面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,当组件被称为“安装于”另一个组件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“设置于”另一个组件,它可以是直接设置在另一个组件上或者可能同时存在居中组件。当一个组件被认为是“固定于”另一个组件,它可以是直接固定在另一个组件上或者可能同时存在居中组件。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“或/及”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例1
请参阅图1,图1为本实施例1提供的登记队列中患者筛选系统,包括:数据库模块、语言输入模块、语言处理模块、筛选处理模块、图形交互模块。
下面对各模块逐个进行说明:
1,数据库模块存储有患者信息。其中,患者信息包括:身份信息、就诊信息。具体的,身份信息即患者的姓名、性别、年龄、籍贯、住址等。就诊信息即患者何时进行了何种检查、以及对应的检查结果。
一般的,患者信息采用关系型数据库,例如以SQL数据库的方式进行存储。SQL数据库的结构可以视作:存在多个患者,每一个患者有多次事件,每一次事件有多个表单,每一个表单有多个字段。例如:患者A于B月C日在医院门诊,即为一次事件;该门诊做了血常规检查即为一个表单;得到的血红细胞计数D即为一个字段。
2,语言输入模块用于输入用户的自然语言。其中,自然语言包含了用户提出的筛选条件。
对于语言输入模块来说,可以是手动输入式,例如采用键盘输入或者手写板输入语言文本;也可以是语音输入式,例如采用麦克风对用户语音进行收集、并通过语音转文本技术转换成语言文本。
3,语言处理模块加载有预先训练完成好的大语言模型,用于处理来自语言输入模块的自然语言、并将自然语言转换成筛选指令。
需要说明的是,本发明采用的预先训练完成好的大语言模型是在通用大语言模型的基础进行调整训练得到的。
通用大语言模型基于深度学习的人工智能技术,旨在生成自然语言文本。通用大语言模型由一个庞大的神经网络组成,具有数十亿个参数,能够学习并理解输入文本的上下文,并生成连贯、富有语义的回复。由于通用大语言模型具有一定的自然语言理解的能力,因此本发明在使用特定训练数据对其进行微调后,能够将自然语言进行翻译,得到筛选指令,以用于本发明的场景中。
具体的,对于大语言模型的训练方法包括:
获取样本数据集,并将样本数据集分成训练集和测试集;
需要说明的是,样本数据集是从已收集的病例信息数据库中随机选取一部分患者数据,对其进行隐私数据脱敏处理得到的。
使用训练集对大语言模型进行多轮训练调整,使用测试集对每轮训练后的大语言模型进行性能测试;
保留性能测试最佳的大语言模型、并作为预先训练好的大语言模型。
其中,在训练时,将除输出层以外的所有权重“冻结”,然后再以迁移学习的方式训练,更新输出层权重,以此方法获得的调整过参数的微调模型,可以在本发明场下有更先进的性能。
具体训练步骤及方式如下:
a.数据准备:收集和整理用于训练的数据集。即部分登记队列中的患者信息、病历记录、诊断报告等相关数据,并对其进行隐私数据脱敏处理。
b.基础模型选择:选择一个与患者筛选任务相关的通用大语言模型作为基础模型。
c.大语言模型构建:基于选择的通用大语言模型,构建一个适用于患者筛选任务的大语言模型。通常,除了输出层,将所有权重(参数)冻结,以保留基础模型的特征表示能力。
d.输出层设计:为患者筛选任务设计输出层,该层将根据患者的特征进行分类或预测。对于患者筛选系统,应设计一个具有一个神经元的输出层。激活函数可以选择sigmoid函数,它将输出限制在0到1之间,表示概率。
e.迁移学习和微调:使用冻结的权重初始化模型,将大语言模型应用于患者筛选任务的训练数据。只更新输出层的权重,通过迭代训练来优化模型在患者筛选任务上的性能。这种方式利用了基础模型的表示能力,并通过微调输出层权重来适应特定任务。
f.大语言模型评估和调优:使用验证集来评估训练后的大语言模型性能。根据评估结果,可以进行超参数调整、模型结构修改等优化步骤,以达到更好的性能。
经过语言处理模块处理得到的筛选指令,为描述患者筛选条件的程序指令。筛选指令支持以患者为对象和以事件为对象两种维度的筛选,基于这两个维度,绝大多数队列登记研究的筛选条件都可以被正确描述。
参考数据库模块的举例,两个维度可以是符合筛选条件的患者和符合筛选条件的事件,例如:筛选条件为拥有血红细胞计数值D的患者,对象就是患者,即为一个维度;筛选条件为拥有血红细胞计数值D的事件,对象就是门诊事件,即为另一个维度。
4,筛选处理模块用于接收来自语言处理模块的筛选指令、并将筛选指令转换成查询命令。而数据库模块依据查询命令进行查询并返回查询结果。
其中,筛选处理模块基于固定的转换规则——从筛选指令到数据库可理解的查询命令的对应解析规则;例如,可以采用将筛选指令转换为查询命令的ETL(提取、转换、加载)工具,这类较为常用的有Apache Spark等。
本实施例1中,筛选指令以json序列化的方式进行存储与表达,其实质为多个条件组成的条件树。
需要注意的是,复杂筛选条件可以视作若干个简单筛选条件的交集,因此,复杂筛选条件可以转换成多个筛选指令,进而得到多个查询命令。具体的,当筛选条件被转换成多个查询命令时,筛选处理模块对多个查询命令赋予对应的优先级,数据库模块按照优先级等级依据对应的查询命令依次进行查询、并返回查询结果。也就是说,筛选处理模块可以基于临时表继续查询或数据库多次查询,以实现复杂条件查询。
查询命令以SQL语句的方式进行存储与表达,来匹配以SQL数据库存储的患者信息。
5,图形交互模块用于进行人机交互、并反映出实时结果。
图形交互模块即采用图形化界面将用户与系统实现交互。其中,参看图2,图形交互模块实时向用户反映输入的自然语言、转换成的筛选指令、以及返回的查询结果,用户可以依据界面显示信息进行操作。
需要说明的是,本筛选系统可以配置为自动模式和手动模式:
在自动模式下,图形交互模块先显示输入的自然语言,然后显示转换成的筛选指令,最后显示返回的查询结果。
在手动模式下,图形交互模块先显示输入的自然语言,用户可根据实际情况选择是否对自然语言进行修改——若不修改,则直接确认;若进行修改,则修改完成后再确认;语言处理模块将确认后的自然语言转换成筛选指令,并显示在图形交互模块,用户可根据实际情况选择是否对筛选指令进行修改——若不修改,则直接确认;若进行修改,则修改完成后再确认;筛选处理模块将确认后的筛选指令转换成查询命令,数据库模块依据查询命令进行查询并返回查询结果,最后查询结果显示到图形交互模块上。
当然,查询结果还可以保存为文本文件,并提供给用户下载使用。
上述的筛选系统形成了基于自然语言进行患者筛选条件设计的系统,在使用自然语言这种高效的交互方式同时,也能保持使用图像界面交互的使用习惯的延续性。由于使用自然语言生成筛选指令、再生成查询命令,可以进一步扩大数据筛选与查询的能力,更加适用于医疗场景下使用,并且更加适用于以患者为中心的数据结构。
本实施例1还公开了一种登记队列中患者筛选方法,应用在上述的登记队列中患者筛选系统。该种登记队列中患者筛选方法包括:
用户通过语言输入模块输入包含筛选条件的自然语言;
在自动模式下,语言处理模块直接将自然语言转换成筛选指令,筛选处理模块直接将筛选指令转换成数据库模块可理解的查询命令;
在手动模式下,待自然语言被用户确认后,语言处理模块再将自然语言转换成筛选指令;待筛选指令被用户确认后,筛选处理模块再将筛选指令转换成查询命令;
数据库模块依据查询命令查询并返回查询结果,查询结果通过图形交互模块显示给用户。
实施例2
本实施例2提供了实施例1系统的两个应用实例:
1,用户通过语言输入模块输入自然语言,包含的筛选条件为——筛选“年龄大于60岁的男性,或年龄大于55岁的女性患者”。
该筛选条件为字段的基本逻辑运算,则无需多事件比较查询。
语言处理模块对该自然语言转换成的筛选指令为:
{
"or": [
{ "age": { "gt": 60 }, "sex": { "eq": "m" } },
{ "age": { "gt": 55 }, "sex": { "eq": "f" } }
]
}
参看图2,该筛选指令即以图形化界面进行展示。
筛选处理模块对该筛选指令转换成的查询命令(格式化显示)为:
SELECT t003.patient_id AS patient_id
FROM
(SELECT t001.patient_id AS patient_id
FROM
(SELECT patient_id
FROM field
WHERE code='age' AND int_var>60) AS t001
JOIN
(SELECT patient_id
FROM field
WHERE code='sex' AND str_var='m') AS t002
ON t001.patient_id=t002.patient_id) AS t003
OUTER JOIN
(SELECT t004.patient_id
FROM
(SELECT patient_id
FROM field
WHERE code='age' AND int_var>55) AS t004
JOIN
(SELECT patient_id
FROM field
WHERE code='sex' AND str_var='f') AS t005
ON t004.patient_id=t005.patient_id) AS t006
ON t003.patient_id=t006.patient_id;
该查询命令即作为数据库模块进行查询的依据,并基于临时表继续联表查询即可。
在这个查询中,使用了多个子查询来创建临时表,并将这些临时表用于连续联表查询,具体查询步骤详细描述如下:
a.子查询 t001 和 t002:这两个子查询分别从 field 表中选择满足条件的patient_id:其中一个子查询选择 code='age' AND int_var>60,另一个子查询选择 code='sex' AND str_var='m'。这些子查询作为临时表1、2被创建。
b.子查询 t003:这个子查询在 t001 和 t002 之间进行联接,通过t001.patient_id=t002.patient_id 进行关联。这个子查询将结果存储在临时表 3中。
c.子查询 t004 和 t005:这些子查询类似于 t001 和 t002,选择满足条件的patient_id:其中一个子查询选择 code='age' AND int_var>55,另一个子查询选择 code='sex' AND str_var='f'。这些子查询作为临时表4、5被创建。
d.子查询 t006:这个子查询在 t004 和 t005 之间进行联接,通过t004.patient_id=t005.patient_id 进行关联。这个子查询将结果存储在临时表6中。
e.最后,主查询从临时表 3、6 中检索 patient_id 并返回结果。
因此,该查询命令使用了多个子查询,并将子查询的结果存储在临时表中,然后在主查询中使用这些临时表进行连续联表查询。
2,用户通过语言输入模块输入自然语言,包含的筛选条件为——筛选“两次手术时间间隔小于5年的患者”。
该筛选条件在临床上可以用来筛选手术后复发患者。该筛选条件实际上就包含了更复杂查询要求——同一患者多个手术时间之间的比较。
语言处理模块对该自然语言转换成的筛选指令为:
{
"query": {
"type": "filter",
"condition": {
"type": "comparison",
"operator": "<",
"left": {
"type": "field",
"name": "surgery_time_2" // 第二次手术时间字段名
},
"right": {
"type": "expression",
"value": "DATE_ADD(surgery_time_1, INTERVAL 5 YEAR)" // 第一次手术时间添加5年
}
}
}
}
该筛选条件无法通过一个SQL语句完成查询,因此采用了多SQL语句:
a.从数据库中查询出所有手术时间字段值:
SELECT p.patient_id, f1.field_value AS operation_date1, f2.field_value AS operation_date2
FROM patients p
JOIN events e1 ON p.patient_id = e1.patient_id
JOIN events e2 ON p.patient_id = e2.patient_id
JOIN forms f1 ON e1.event_id = f1.event_id
JOIN forms f2 ON e2.event_id = f2.event_id
JOIN fields fd1 ON f1.form_id = fd1.form_id
JOIN fields fd2 ON f2.form_id = fd2.form_id
WHERE fd1.field_name = '手术时间'
AND fd2.field_name = '手术时间'
b.添加条件筛选出两次手术时间间隔小于5年的患者:
SELECT p.patient_id, f1.field_value AS operation_date1, f2.field_value AS operation_date2
FROM patients p
JOIN events e1 ON p.patient_id = e1.patient_id
JOIN events e2 ON p.patient_id = e2.patient_id
JOIN forms f1 ON e1.event_id = f1.event_id
JOIN forms f2 ON e2.event_id = f2.event_id
JOIN fields fd1 ON f1.form_id = fd1.form_id
JOIN fields fd2 ON f2.form_id = fd2.form_id
WHERE fd1.field_name = '手术时间'
AND fd2.field_name = '手术时间'
AND f1.field_value < f2.field_value
AND DATEDIFF(f2.field_value, f1.field_value) < 5 * 365
基于上述SQL语句,即可完成该复杂查询要求。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种登记队列中患者筛选系统,其特征在于,包括:
语言输入模块,其用于输入用户的自然语言;其中,所述自然语言包含了用户提出的筛选条件;
语言处理模块,其加载有预先训练好的大语言模型,用于处理来自语言输入模块的自然语言、并将自然语言转换成筛选指令;
筛选处理模块,其用于接收来自语言处理模块的筛选指令、并将筛选指令转换成查询命令;
数据库模块,其存储有患者信息;所述数据库模块依据查询命令进行查询并返回查询结果;
以及
图形交互模块,其用于进行人机交互、并反映出实时结果。
2.根据权利要求1所述的登记队列中患者筛选系统,其特征在于,所述语言输入模块为手动输入式或语音输入式。
3.根据权利要求1所述的登记队列中患者筛选系统,其特征在于,所述大语言模型的训练方法包括:
获取样本数据集,并将样本数据集分成训练集和测试集;
使用训练集对大语言模型进行多轮训练调整,使用测试集对每轮训练后的大语言模型进行性能测试;
保留性能测试最佳的大语言模型、并作为预先训练好的大语言模型。
4.根据权利要求1所述的登记队列中患者筛选系统,其特征在于,所述患者信息以SQL数据库的方式进行存储;
所述筛选指令以json序列化的方式进行存储与表达;
所述查询命令以SQL语句的方式进行存储与表达。
5.根据权利要求1或4所述的登记队列中患者筛选系统,其特征在于,所述患者信息包括身份信息、就诊信息。
6.根据权利要求1或4所述的登记队列中患者筛选系统,其特征在于,所述筛选指令支持两种维度的筛选;其中,两种维度包括以患者为对象和以事件为对象。
7.根据权利要求1或4所述的登记队列中患者筛选系统,其特征在于,当筛选条件被转换成多个查询命令时,筛选处理模块对多个查询命令赋予对应的优先级,数据库模块按照优先级等级依据对应的查询命令依次进行查询、并返回查询结果。
8.根据权利要求1所述的登记队列中患者筛选系统,其特征在于,所述图形交互模块实时向用户反映输入的自然语言、转换成的筛选指令、以及返回的查询结果。
9.根据权利要求1所述的登记队列中患者筛选系统,其特征在于,所述图形交互模块还用于用户对输入的自然语言或/和转换成的筛选指令进行手动调整。
10.一种登记队列中患者筛选方法,其特征在于,应用在如权利要求1-9中任一所述的登记队列中患者筛选系统;
所述登记队列中患者筛选方法包括:
用户通过语言输入模块输入包含筛选条件的自然语言;
待自然语言被用户确认后,语言处理模块再将自然语言转换成筛选指令;
待筛选指令被用户确认后,筛选处理模块再将筛选指令转换成查询命令;
数据库模块依据查询命令查询并返回查询结果,查询结果通过图形交互模块显示给用户。
CN202311534750.2A 2023-11-17 2023-11-17 一种登记队列中患者筛选系统及方法 Pending CN117251556A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311534750.2A CN117251556A (zh) 2023-11-17 2023-11-17 一种登记队列中患者筛选系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311534750.2A CN117251556A (zh) 2023-11-17 2023-11-17 一种登记队列中患者筛选系统及方法

Publications (1)

Publication Number Publication Date
CN117251556A true CN117251556A (zh) 2023-12-19

Family

ID=89126840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311534750.2A Pending CN117251556A (zh) 2023-11-17 2023-11-17 一种登记队列中患者筛选系统及方法

Country Status (1)

Country Link
CN (1) CN117251556A (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366742A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
CN106682439A (zh) * 2016-12-30 2017-05-17 广州慧扬信息系统科技有限公司 基于研究性随访的病历筛选方法
CN108710636A (zh) * 2018-04-09 2018-10-26 平安科技(深圳)有限公司 一种筛选病历的方法、终端设备及计算机可读存储介质
CN109493928A (zh) * 2018-11-09 2019-03-19 贵州医渡云技术有限公司 基于条件树的患者数据筛选方法、系统、设备及存储介质
CN110400613A (zh) * 2019-06-10 2019-11-01 南京医基云医疗数据研究院有限公司 一种随访患者筛选方法、装置、可读介质及电子设备
US10552541B1 (en) * 2018-08-27 2020-02-04 International Business Machines Corporation Processing natural language queries based on machine learning
CN112712886A (zh) * 2020-12-28 2021-04-27 西安科锐盛创新科技有限公司 一种患者信息展示方法、装置及医用数字终端
US20210141793A1 (en) * 2019-11-11 2021-05-13 Honeywell International Inc. Systems and methods for natural language queries
US20210200766A1 (en) * 2019-12-31 2021-07-01 Cerner Innovation, Inc. Systems, methods, and storage media useful in a computer healthcare system to consume clinical quality language queries in a programmatic manner
CN113360530A (zh) * 2021-06-07 2021-09-07 重庆南鹏人工智能科技研究院有限公司 一种事件筛选器系统
US20210343411A1 (en) * 2018-06-29 2021-11-04 Ai Technologies Inc. Deep learning-based diagnosis and referral of diseases and disorders using natural language processing
CN113779062A (zh) * 2021-02-23 2021-12-10 北京沃东天骏信息技术有限公司 Sql语句生成方法、装置、存储介质及电子设备
CN115329085A (zh) * 2022-08-29 2022-11-11 北京信息科技大学 一种社交机器人分类方法及系统
CN116738959A (zh) * 2023-08-15 2023-09-12 贵州优特云科技有限公司 一种基于人工智能的简历改写方法及系统
CN116798087A (zh) * 2022-03-14 2023-09-22 中国移动通信集团江苏有限公司 员工在岗状态检测方法及系统
CN116958693A (zh) * 2023-07-28 2023-10-27 上海联影智能医疗科技有限公司 图像分析方法、装置、设备、存储介质和程序产品
CN116994694A (zh) * 2023-09-27 2023-11-03 之江实验室 基于信息提取的患者病历数据筛选方法、装置和介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366742A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
CN106682439A (zh) * 2016-12-30 2017-05-17 广州慧扬信息系统科技有限公司 基于研究性随访的病历筛选方法
CN108710636A (zh) * 2018-04-09 2018-10-26 平安科技(深圳)有限公司 一种筛选病历的方法、终端设备及计算机可读存储介质
US20210343411A1 (en) * 2018-06-29 2021-11-04 Ai Technologies Inc. Deep learning-based diagnosis and referral of diseases and disorders using natural language processing
US10552541B1 (en) * 2018-08-27 2020-02-04 International Business Machines Corporation Processing natural language queries based on machine learning
CN109493928A (zh) * 2018-11-09 2019-03-19 贵州医渡云技术有限公司 基于条件树的患者数据筛选方法、系统、设备及存储介质
CN110400613A (zh) * 2019-06-10 2019-11-01 南京医基云医疗数据研究院有限公司 一种随访患者筛选方法、装置、可读介质及电子设备
US20210141793A1 (en) * 2019-11-11 2021-05-13 Honeywell International Inc. Systems and methods for natural language queries
US20210200766A1 (en) * 2019-12-31 2021-07-01 Cerner Innovation, Inc. Systems, methods, and storage media useful in a computer healthcare system to consume clinical quality language queries in a programmatic manner
CN112712886A (zh) * 2020-12-28 2021-04-27 西安科锐盛创新科技有限公司 一种患者信息展示方法、装置及医用数字终端
CN113779062A (zh) * 2021-02-23 2021-12-10 北京沃东天骏信息技术有限公司 Sql语句生成方法、装置、存储介质及电子设备
CN113360530A (zh) * 2021-06-07 2021-09-07 重庆南鹏人工智能科技研究院有限公司 一种事件筛选器系统
CN116798087A (zh) * 2022-03-14 2023-09-22 中国移动通信集团江苏有限公司 员工在岗状态检测方法及系统
CN115329085A (zh) * 2022-08-29 2022-11-11 北京信息科技大学 一种社交机器人分类方法及系统
CN116958693A (zh) * 2023-07-28 2023-10-27 上海联影智能医疗科技有限公司 图像分析方法、装置、设备、存储介质和程序产品
CN116738959A (zh) * 2023-08-15 2023-09-12 贵州优特云科技有限公司 一种基于人工智能的简历改写方法及系统
CN116994694A (zh) * 2023-09-27 2023-11-03 之江实验室 基于信息提取的患者病历数据筛选方法、装置和介质

Similar Documents

Publication Publication Date Title
US11500818B2 (en) Method and system for large scale data curation
CN107731269B (zh) 基于原始诊断数据和病历文件数据的疾病编码方法及系统
CN107705839B (zh) 疾病自动编码方法及系统
CN107577826B (zh) 基于原始诊断数据的疾病分类编码方法及系统
CN107622103B (zh) 管理数据查询
DE102013209868B4 (de) Abfragen und Integrieren strukturierter und unstrukturierter Daten
EP3671526B1 (en) Dependency graph based natural language processing
CN106250382A (zh) 一种元数据管理引擎系统及实现方法
EP3127020A1 (en) Ontology mapping method and apparatus
CN108182972A (zh) 基于分词网络的中文疾病诊断的智能编码方法及系统
CN108846020A (zh) 基于多源异构数据进行知识图谱自动化构建方法、系统
CN104137095B (zh) 用于演进分析的系统
WO2020010834A1 (zh) 一种faq问答库泛化方法、装置及设备
CN111930948B (zh) 一种信息收集和分级方法、装置、计算机设备及存储介质
CN112667735A (zh) 一种基于大数据的可视化模型建立分析系统和方法
CN114049927A (zh) 疾病数据处理方法、装置、电子设备及可读介质
CN114201616A (zh) 一种基于多源数据库的知识图谱构建方法及系统
CN110442620A (zh) 一种大数据探索和认知方法、装置、设备以及计算机存储介质
CN106528778A (zh) 用户留存类数据获取方法及装置
Arasteh et al. Bölen: Software module clustering method using the combination of shuffled frog leaping and genetic algorithm
Krutanard et al. Discovering organizational process models of resources in a hospital using Role Hierarchy Miner
CN108073641B (zh) 查询数据表的方法和装置
Danubianu Step by step data preprocessing for data mining. A case study
CN110321556A (zh) 一种医生诊疗医保控费智能推荐方案的方法及其系统
CN117290376A (zh) 基于大语言模型的两阶段Text2SQL模型、方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination