CN108735275A - 一种自动报告生成系统及报告生成方法 - Google Patents
一种自动报告生成系统及报告生成方法 Download PDFInfo
- Publication number
- CN108735275A CN108735275A CN201810524343.6A CN201810524343A CN108735275A CN 108735275 A CN108735275 A CN 108735275A CN 201810524343 A CN201810524343 A CN 201810524343A CN 108735275 A CN108735275 A CN 108735275A
- Authority
- CN
- China
- Prior art keywords
- information
- report
- standard
- user state
- raw
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种自动报告生成系统及报告生成方法,该自动报告生成方法包括如下步骤:在界面输入单元输入报告原始信息,报告原始信息为采集的一个或多个用户的信息,用户信息包括用户基本信息和用户状态信息;调取模板数据单元存储的与报告原始信息中的用户状态信息对应的标准信息,标准信息的数量小于或等于报告原始信息中用户状态信息的数量;数据匹配单元将报告原始信息中的用户状态信息与标准信息进行匹配并生成报告,报告中根据匹配结果用户状态信息显示为标准信息或原始信息。本发明针对多个用户的数据同时生成一份报告,提高了效率,节省了人力物力消耗。
Description
技术领域
本发明涉及一种信息技术领域,特别涉及一种药品研发和实验中统计数据的自动报告生成系统及报告生成方法。
背景技术
药品上市需要严格的过程,一般分为如下阶段:药物靶点的确认;化合物的合成;活性化合物的筛选;在动物体上评估药物的药理作用,安全性与毒性,药物的吸收、分布、代谢和排泄情况;制剂的开发;临床研究。在临床研究阶段,需要对大数量实验人群进行参数采集(可以采用调查问卷的形式),采集出的数据又要汇总生成可视化报告。在生成报告这个阶段,现有的方法针对采集到的原始数据进行手动修改匹配,非常耗费人力,效率极慢。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种自动报告生成系统及报告生成方法,解决现有报告生成过程中耗费人力,效率慢的问题。
为了实现本发明的上述目的,根据本发明的第一个方面,本发明提供了一种自动报告生成方法,其包括如下步骤:
S1,在界面输入单元输入报告原始信息,所述报告原始信息为采集的一个或多个用户的信息,所述用户信息包括用户基本信息和用户状态信息;调取模板数据单元存储的与报告原始信息中的用户状态信息对应的标准信息,所述标准信息的数量小于或等于报告原始信息中用户状态信息的数量;
S2,数据匹配单元将报告原始信息中的用户状态信息与标准信息进行匹配并生成报告,所述报告中根据匹配结果用户状态信息显示为标准信息或原始信息。
本发明的自动报告生成方法针对多个用户的数据同时生成一份报告,提高了效率,节省了人力物力消耗。
在本发明的一种优选实施方式中,还包括选择报告原始信息数据源的步骤,具体为:
根据调查主题不同将数据源分为m类,所述m为正整数;每一类信息包括多个原始样本,将部分或者全部的原始样本作为一个集合,汇总输出为一个报告原始信息数据包,每一个原始样本在数据包中占据一行或者一列。
可以同时处理多个用户的数据信息,提高了报告生成效率。
在本发明的另一种优选实施方式中,所述步骤S2中的匹配方法为:
S31,将报告原始信息中的用户状态信息分为n级,所述标准信息与其对应的也分为n级,所述n为正整数;
S32,进行第一级信息匹配,所述第一级信息包括年龄、性别信息,当输入年龄性别时,匹配为标准信息中的年龄段和性别信息;
S33,进行第二级信息匹配,所述第二级信息包括被调查者症状信息,当输入被调查者症状信息时,匹配为标准信息中的症状对应的器官;
S34,进行第三级信息匹配,所述第三级信息包括被调查者服药情况信息,当输入被调查者服药情况信息时,匹配为标准信息中的药品分类信息;
S35,进行第i级信息匹配,当输入第i级的用户状态信息时,匹配为与其对应的标准信息,所述i=4,5,……,n;
S36,如果步骤S32-S35均匹配失败,则直接到导出的数据包中对应行或者对应列的内容填入原文。
将用户数据中的不规范用于自动替换为标准用语,提高了报告的可读性。
在本发明的另一种优选实施方式中,还包括统计图表生成方法,具体包括生成一元分布排名百分比,一元分布统计总体排名平均数,二元分布排名百分比的方法和二元分布统计总体排名平均数,在编辑器中显示指定统计的指定排名的百分比以及总体排名中某一项占其总数的百分比,按照数量从大到下依次排列,即数量越大,排名越小,数量越小,排名越大,默认输出最后一个排名。图表化显示统计结果,提高报告的可读性。为了实现本发明的上述目的,根据本发明的第二个方面,本发明提供了一种自动报告生成系统,其包括界面输入单元、模板数据单元和数据匹配单元;
所述界面输入单元输入报告原始信息,所述报告原始信息为采集的用户信息,所述用户信息包括用户基本信息和用户状态信息;
所述模板数据单元存储有与报告原始信息中的用户状态信息对应的标准信息,所述标准信息的数量小于或等于报告原始信息中用户状态信息的数量;
所述数据匹配单元将报告原始信息中的用户状态信息与标准进行匹配并生成报告,在报告中根据匹配结果用户状态信息显示为标准信息或原始信息。
本发明的自动报告生成系统能够针对多个用户的数据同时生成一份报告,提高了效率,节省了人力物力消耗。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一种优选实施方式中自动报告生成方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明提供了一种自动报告生成方法,如图1所示,其包括如下步骤:
S1,在界面输入单元输入报告原始信息,报告原始信息为采集的一个或多个用户的信息,用户信息包括用户基本信息和用户状态信息;调取模板数据单元存储的与报告原始信息中的用户状态信息对应的标准信息,标准信息的数量小于或等于报告原始信息中用户状态信息的数量;
S2,数据匹配单元将报告原始信息中的用户状态信息与标准信息进行匹配并生成报告,报告中根据匹配结果用户状态信息显示为标准信息或原始信息。
本发明的自动报告生成方法针对多个用户的数据同时生成一份报告,提高了效率,节省了人力物力消耗。
在本发明的一种优选实施方式中,还包括选择报告原始信息数据源的步骤,具体为:
根据调查主题不同将数据源分为m类,其中,m为正整数;每一类信息包括多个原始样本,将部分或者全部的原始样本作为一个集合,汇总输出为一个报告原始信息数据包,每一个原始样本在数据包中占据一行或者一列。例如,可以按照调查主题不同将数据源分为m类,即问卷A、问卷B、……、问卷m,其中,m为正整数;每一种问卷又有多个采集原始样本,即多份问卷。将部分或者全部的原始样本作为一个集合,汇总输出为一个报告原始信息数据包,每一个原始样本在数据包中占据一行或者一列。可以同时处理多个用户的数据信息,提高了报告生成效率。
在本发明的另一种优选实施方式中,步骤S2中的匹配方法为:
S31,将报告原始信息中的用户状态信息分为n级,所述标准信息与其对应的也分为n级,所述n为正整数;
S32,进行第一级信息匹配,所述第一级信息包括年龄、性别信息,当输入年龄性别时,匹配为标准信息中的年龄段和性别信息;
S33,进行第二级信息匹配,所述第二级信息包括被调查者症状信息,当输入被调查者症状信息时,匹配为标准信息中的症状对应的器官;
S34,进行第三级信息匹配,所述第三级信息包括被调查者服药情况信息,当输入被调查者服药情况信息时,匹配为标准信息中的药品分类信息;
根据实际的需要情况设置以后的分级情况,依次处理以后的分级,将第p级信息的内容匹配为标准信息中的相应内容;
S35,进行第i级信息匹配,当输入第i级的用户状态信息时,匹配为与其对应的标准信息,所述i=4,5,……,n,具体信息可以为但不限于用药的数量、服药后的身体变化情况以及副作用等;
S36,如果步骤S32-S35均匹配失败,则直接到导出的数据包中对应行或者对应列的内容填入原文。
将用户数据中的不规范用于自动替换为标准用语,提高了报告的可读性。同时该模板也适用于绝大部分的用药情况的报告统计。
在本实施方式中,在步骤S36中,还包括判断输入信息是否错误并且删除错误输入信息的步骤:
对步骤S36中输出的报告中的词汇进行拆分,建立其与标准信息的距离模型;其中,pi为输出的报告中的词汇,pj为标准信息,m为词汇的总数量,当距离超出设定阈值时,则认为是错误报告,将其删除,提高报告的准确性。
在本发明另外的优选实施方式中,
其中,αp为第p级信息的权重值,具体权重值根据实际报告要求设定,p=1、2、……、n,mp为第p级信息中的词汇数量,当距离超出设定阈值时,则认为是错误报告,将其删除,提高报告的准确性。
在本实施方式中,还包括统计图表生成方法,具体包括生成一元分布排名百分比,一元分布统计总体排名平均数,二元分布排名百分比的方法和二元分布统计总体排名平均数,在编辑器中显示指定统计的指定排名的百分比以及总体排名中某一项占其总数的百分比,按照数量从大到下依次排列,即数量越大,排名越小,数量越小,排名越大,默认输出最后一个排名。图表化显示统计结果,提高报告的可读性。本发明还提供了一种自动报告生成系统,其包括界面输入单元、模板数据单元和数据匹配单元;
所述界面输入单元输入报告原始信息,所述报告原始信息为采集的用户信息,所述用户信息包括用户基本信息和用户状态信息;
所述模板数据单元存储有与报告原始信息中的用户状态信息对应的标准信息,所述标准信息的数量小于或等于报告原始信息中用户状态信息的数量;
数据匹配单元将报告原始信息中的用户状态信息与标准进行匹配并生成报告,在报告中根据匹配结果用户状态信息显示为标准信息或原始信息。
界面输入单元和数据匹配单元采用本发明前述的方法,在此不做赘述。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (7)
1.一种自动报告生成方法,其特征在于,包括如下步骤:
S1,在界面输入单元输入报告原始信息,所述报告原始信息为采集的一个或多个用户的信息,所述用户信息包括用户基本信息和用户状态信息;调取模板数据单元存储的与报告原始信息中的用户状态信息对应的标准信息,所述标准信息的数量小于或等于报告原始信息中用户状态信息的数量;
S2,数据匹配单元将报告原始信息中的用户状态信息与标准信息进行匹配并生成报告,所述报告中根据匹配结果用户状态信息显示为标准信息或原始信息。
2.根据权利要求1所述的自动报告生成方法,其特征在于,包括选择报告原始信息数据源的步骤,具体为:
根据调查主题不同将数据源分为m类,所述m为正整数;每一类信息包括多个原始样本,将部分或者全部的原始样本作为一个集合,汇总输出为一个报告原始信息数据包,每一个原始样本在数据包中占据一行或者一列。
3.根据权利要求1所述的自动报告生成方法,其特征在于,所述步骤S2中的匹配方法为:
S31,将报告原始信息中的用户状态信息分为n级,所述标准信息与其对应的也分为n级,所述n为正整数;
S32,进行第一级信息匹配,所述第一级信息包括年龄、性别信息,当输入年龄性别时,匹配为标准信息中的年龄段和性别信息;
S33,进行第二级信息匹配,所述第二级信息包括被调查者症状信息,当输入被调查者症状信息时,匹配为标准信息中的症状对应的器官;
S34,进行第三级信息匹配,所述第三级信息包括被调查者服药情况信息,当输入被调查者服药情况信息时,匹配为标准信息中的药品分类信息;
S35,进行第i级信息匹配,当输入第i级的用户状态信息时,匹配为与其对应的标准信息,所述i=4,5,……,n;
S36,如果步骤S32-S35均匹配失败,则直接到导出的数据包中对应行或者对应列的内容填入原文。
4.根据权利要求1所述的自动报告生成方法,其特征在于,还包括统计图表生成方法,具体包括生成一元分布排名百分比,一元分布统计总体排名平均数,二元分布排名百分比的方法和二元分布统计总体排名平均数,
在编辑器中显示指定统计的指定排名的百分比以及总体排名中某一项占其总数的百分比,按照数量从大到下依次排列,即数量越大,排名越小,数量越小,排名越大,默认输出最后一个排名。
5.一种自动报告生成系统,其特征在于,包括界面输入单元、模板数据单元和数据匹配单元;
所述界面输入单元输入报告原始信息,所述报告原始信息为采集的用户信息,所述用户信息包括用户基本信息和用户状态信息;
所述模板数据单元存储有与报告原始信息中的用户状态信息对应的标准信息,所述标准信息的数量小于或等于报告原始信息中用户状态信息的数量;
所述数据匹配单元将报告原始信息中的用户状态信息与标准进行匹配并生成报告,在报告中根据匹配结果用户状态信息显示为标准信息或原始信息。
6.根据权利要求5所述的自动报告生成系统,其特征在于,还包括控制器,所述控制器选择报告原始信息数据源具体为:根据调查主题不同将数据源分为m类,所述m为正整数;每一类信息包括多个原始样本,将部分或者全部的原始样本作为一个集合,汇总输出为一个报告原始信息数据包,每一个原始样本在数据包中占据一行或者一列。
7.根据权利要求5所述的自动报告生成系统,其特征在于,数据匹配单元将报告原始信息中的用户状态信息分为n级,所述标准信息与其对应的也分为n级;首先进行第一级信息匹配,所述第一级信息包括年龄、性别信息,当输入年龄性别时,匹配为标准信息中的年龄段和性别信息;进行第二级信息匹配,所述第二级信息包括被调查者症状信息,当输入被调查者症状信息时,匹配为标准信息中的症状对应的器官;进行第三级信息匹配,所述第三级信息包括被调查者服药情况信息,当输入被调查者服药情况信息时,匹配为标准信息中的药品分类信息;如果以上均匹配失败,则直接到导出的数据包中对应行或者对应列的内容填入原文。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810524343.6A CN108735275A (zh) | 2018-05-28 | 2018-05-28 | 一种自动报告生成系统及报告生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810524343.6A CN108735275A (zh) | 2018-05-28 | 2018-05-28 | 一种自动报告生成系统及报告生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108735275A true CN108735275A (zh) | 2018-11-02 |
Family
ID=63936388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810524343.6A Pending CN108735275A (zh) | 2018-05-28 | 2018-05-28 | 一种自动报告生成系统及报告生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108735275A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028954A (zh) * | 2019-11-29 | 2020-04-17 | 成都易欧科技有限公司 | 基于中文语义技术的传染病预警分析方法及系统 |
CN111414740A (zh) * | 2020-03-17 | 2020-07-14 | 北京三维天地科技股份有限公司 | 一种电子实验记录本报告生成系统 |
CN112184055A (zh) * | 2020-10-19 | 2021-01-05 | 深圳蜂巢互联科技有限公司 | 一种面向制造业的在线调研报告自动生成设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130297364A1 (en) * | 2009-10-14 | 2013-11-07 | Everbridge, Inc. | Incident Communication System |
CN104717085A (zh) * | 2013-12-16 | 2015-06-17 | 中国移动通信集团湖南有限公司 | 一种日志解析方法及装置 |
CN105786912A (zh) * | 2014-12-25 | 2016-07-20 | 远光软件股份有限公司 | 数据采集转换方法及装置 |
CN105843936A (zh) * | 2016-03-31 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种业务数据报表方法与系统 |
CN107783950A (zh) * | 2017-04-11 | 2018-03-09 | 平安医疗健康管理股份有限公司 | 药品说明书处理方法及装置 |
-
2018
- 2018-05-28 CN CN201810524343.6A patent/CN108735275A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130297364A1 (en) * | 2009-10-14 | 2013-11-07 | Everbridge, Inc. | Incident Communication System |
CN104717085A (zh) * | 2013-12-16 | 2015-06-17 | 中国移动通信集团湖南有限公司 | 一种日志解析方法及装置 |
CN105786912A (zh) * | 2014-12-25 | 2016-07-20 | 远光软件股份有限公司 | 数据采集转换方法及装置 |
CN105843936A (zh) * | 2016-03-31 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种业务数据报表方法与系统 |
CN107783950A (zh) * | 2017-04-11 | 2018-03-09 | 平安医疗健康管理股份有限公司 | 药品说明书处理方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111028954A (zh) * | 2019-11-29 | 2020-04-17 | 成都易欧科技有限公司 | 基于中文语义技术的传染病预警分析方法及系统 |
CN111414740A (zh) * | 2020-03-17 | 2020-07-14 | 北京三维天地科技股份有限公司 | 一种电子实验记录本报告生成系统 |
CN112184055A (zh) * | 2020-10-19 | 2021-01-05 | 深圳蜂巢互联科技有限公司 | 一种面向制造业的在线调研报告自动生成设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106202177B (zh) | 一种文本分类方法及装置 | |
CN108735275A (zh) | 一种自动报告生成系统及报告生成方法 | |
CN106815369B (zh) | 一种基于Xgboost分类算法的文本分类方法 | |
CN108628971A (zh) | 不均衡数据集的文本分类方法、文本分类器及存储介质 | |
CN103646086B (zh) | 一种垃圾文件的清理方法和装置 | |
CN107273117A (zh) | 一种编程友好型的敏捷代码自动生成系统 | |
CN107301171A (zh) | 一种基于情感词典学习的文本情感分析方法和系统 | |
CN110413780A (zh) | 文本情感分析方法、装置、存储介质及电子设备 | |
CN106471490A (zh) | 基于分类的集群通信 | |
CN104021248B (zh) | 一种航空机载机械类产品fmeca分析方法 | |
CN107273122A (zh) | 基于解耦机制的可迭代组建业务系统的方法及其终端 | |
JP6976910B2 (ja) | データ分類システム、データ分類方法、および、データ分類装置 | |
CN108595657A (zh) | His系统的数据表分类映射方法和装置 | |
CN108280164A (zh) | 一种基于类别相关单词的短文本过滤与分类方法 | |
CN108710609A (zh) | 一种基于多特征融合的社交平台用户信息的分析方法 | |
US7337395B2 (en) | System and method for hierarchical data document modification | |
CN104965784A (zh) | 自动测试方法及装置 | |
CN104809104A (zh) | 一种微博文本情绪识别方法及系统 | |
CN113268403B (zh) | 时间序列的分析预测方法、装置、设备及存储介质 | |
CN108536868A (zh) | 社交网络上短文本数据的数据处理方法及应用 | |
CN110472256A (zh) | 一种基于篇章的机器翻译引擎测评优选方法及系统 | |
CN107577460A (zh) | 一种从非结构化数据提取结构化数据的方法 | |
CN113946654A (zh) | 一种智能设置监测词系统及方法 | |
US20080244520A1 (en) | Device and method for automatically configuring software | |
CN108647209A (zh) | 一种基于思维导图的题目生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181102 |
|
RJ01 | Rejection of invention patent application after publication |