CN108735275A

CN108735275A - 一种自动报告生成系统及报告生成方法

Info

Publication number: CN108735275A
Application number: CN201810524343.6A
Authority: CN
Inventors: 李小波; 李瀚�; 杨杰; 黄洪涛
Original assignee: Chongqing Ya Shu Yu Technology Co Ltd
Current assignee: Chongqing Ya Shu Yu Technology Co Ltd
Priority date: 2018-05-28
Filing date: 2018-05-28
Publication date: 2018-11-02

Abstract

本发明公开了一种自动报告生成系统及报告生成方法，该自动报告生成方法包括如下步骤：在界面输入单元输入报告原始信息，报告原始信息为采集的一个或多个用户的信息，用户信息包括用户基本信息和用户状态信息；调取模板数据单元存储的与报告原始信息中的用户状态信息对应的标准信息，标准信息的数量小于或等于报告原始信息中用户状态信息的数量；数据匹配单元将报告原始信息中的用户状态信息与标准信息进行匹配并生成报告，报告中根据匹配结果用户状态信息显示为标准信息或原始信息。本发明针对多个用户的数据同时生成一份报告，提高了效率，节省了人力物力消耗。

Description

一种自动报告生成系统及报告生成方法

技术领域

本发明涉及一种信息技术领域，特别涉及一种药品研发和实验中统计数据的自动报告生成系统及报告生成方法。

背景技术

药品上市需要严格的过程，一般分为如下阶段：药物靶点的确认；化合物的合成；活性化合物的筛选；在动物体上评估药物的药理作用，安全性与毒性，药物的吸收、分布、代谢和排泄情况；制剂的开发；临床研究。在临床研究阶段，需要对大数量实验人群进行参数采集(可以采用调查问卷的形式)，采集出的数据又要汇总生成可视化报告。在生成报告这个阶段，现有的方法针对采集到的原始数据进行手动修改匹配，非常耗费人力，效率极慢。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种自动报告生成系统及报告生成方法，解决现有报告生成过程中耗费人力，效率慢的问题。

为了实现本发明的上述目的，根据本发明的第一个方面，本发明提供了一种自动报告生成方法，其包括如下步骤：

S1，在界面输入单元输入报告原始信息，所述报告原始信息为采集的一个或多个用户的信息，所述用户信息包括用户基本信息和用户状态信息；调取模板数据单元存储的与报告原始信息中的用户状态信息对应的标准信息，所述标准信息的数量小于或等于报告原始信息中用户状态信息的数量；

S2，数据匹配单元将报告原始信息中的用户状态信息与标准信息进行匹配并生成报告，所述报告中根据匹配结果用户状态信息显示为标准信息或原始信息。

本发明的自动报告生成方法针对多个用户的数据同时生成一份报告，提高了效率，节省了人力物力消耗。

在本发明的一种优选实施方式中，还包括选择报告原始信息数据源的步骤，具体为：

根据调查主题不同将数据源分为m类，所述m为正整数；每一类信息包括多个原始样本，将部分或者全部的原始样本作为一个集合，汇总输出为一个报告原始信息数据包，每一个原始样本在数据包中占据一行或者一列。

可以同时处理多个用户的数据信息，提高了报告生成效率。

在本发明的另一种优选实施方式中，所述步骤S2中的匹配方法为：

S31，将报告原始信息中的用户状态信息分为n级，所述标准信息与其对应的也分为n级，所述n为正整数；

S32，进行第一级信息匹配，所述第一级信息包括年龄、性别信息，当输入年龄性别时，匹配为标准信息中的年龄段和性别信息；

S33，进行第二级信息匹配，所述第二级信息包括被调查者症状信息，当输入被调查者症状信息时，匹配为标准信息中的症状对应的器官；

S34，进行第三级信息匹配，所述第三级信息包括被调查者服药情况信息，当输入被调查者服药情况信息时，匹配为标准信息中的药品分类信息；

S35，进行第i级信息匹配，当输入第i级的用户状态信息时，匹配为与其对应的标准信息，所述i＝4，5，……，n；

S36，如果步骤S32-S35均匹配失败，则直接到导出的数据包中对应行或者对应列的内容填入原文。

将用户数据中的不规范用于自动替换为标准用语，提高了报告的可读性。

在本发明的另一种优选实施方式中，还包括统计图表生成方法，具体包括生成一元分布排名百分比，一元分布统计总体排名平均数，二元分布排名百分比的方法和二元分布统计总体排名平均数，在编辑器中显示指定统计的指定排名的百分比以及总体排名中某一项占其总数的百分比，按照数量从大到下依次排列，即数量越大，排名越小，数量越小，排名越大，默认输出最后一个排名。图表化显示统计结果，提高报告的可读性。为了实现本发明的上述目的，根据本发明的第二个方面，本发明提供了一种自动报告生成系统，其包括界面输入单元、模板数据单元和数据匹配单元；

所述界面输入单元输入报告原始信息，所述报告原始信息为采集的用户信息，所述用户信息包括用户基本信息和用户状态信息；

所述模板数据单元存储有与报告原始信息中的用户状态信息对应的标准信息，所述标准信息的数量小于或等于报告原始信息中用户状态信息的数量；

所述数据匹配单元将报告原始信息中的用户状态信息与标准进行匹配并生成报告，在报告中根据匹配结果用户状态信息显示为标准信息或原始信息。

本发明的自动报告生成系统能够针对多个用户的数据同时生成一份报告，提高了效率，节省了人力物力消耗。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明一种优选实施方式中自动报告生成方法的流程图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，除非另有规定和限定，需要说明的是，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本发明提供了一种自动报告生成方法，如图1所示，其包括如下步骤：

S1，在界面输入单元输入报告原始信息，报告原始信息为采集的一个或多个用户的信息，用户信息包括用户基本信息和用户状态信息；调取模板数据单元存储的与报告原始信息中的用户状态信息对应的标准信息，标准信息的数量小于或等于报告原始信息中用户状态信息的数量；

S2，数据匹配单元将报告原始信息中的用户状态信息与标准信息进行匹配并生成报告，报告中根据匹配结果用户状态信息显示为标准信息或原始信息。

根据调查主题不同将数据源分为m类，其中，m为正整数；每一类信息包括多个原始样本，将部分或者全部的原始样本作为一个集合，汇总输出为一个报告原始信息数据包，每一个原始样本在数据包中占据一行或者一列。例如，可以按照调查主题不同将数据源分为m类，即问卷A、问卷B、……、问卷m，其中，m为正整数；每一种问卷又有多个采集原始样本，即多份问卷。将部分或者全部的原始样本作为一个集合，汇总输出为一个报告原始信息数据包，每一个原始样本在数据包中占据一行或者一列。可以同时处理多个用户的数据信息，提高了报告生成效率。

在本发明的另一种优选实施方式中，步骤S2中的匹配方法为：

根据实际的需要情况设置以后的分级情况，依次处理以后的分级，将第p级信息的内容匹配为标准信息中的相应内容；

S35，进行第i级信息匹配，当输入第i级的用户状态信息时，匹配为与其对应的标准信息，所述i＝4，5，……，n，具体信息可以为但不限于用药的数量、服药后的身体变化情况以及副作用等；

将用户数据中的不规范用于自动替换为标准用语，提高了报告的可读性。同时该模板也适用于绝大部分的用药情况的报告统计。

在本实施方式中，在步骤S36中，还包括判断输入信息是否错误并且删除错误输入信息的步骤：

对步骤S36中输出的报告中的词汇进行拆分，建立其与标准信息的距离模型；其中，p_i为输出的报告中的词汇，p_j为标准信息，m为词汇的总数量，当距离超出设定阈值时，则认为是错误报告，将其删除，提高报告的准确性。

在本发明另外的优选实施方式中，

其中，α_p为第p级信息的权重值，具体权重值根据实际报告要求设定，p＝1、2、……、n，m_p为第p级信息中的词汇数量，当距离超出设定阈值时，则认为是错误报告，将其删除，提高报告的准确性。

在本实施方式中，还包括统计图表生成方法，具体包括生成一元分布排名百分比，一元分布统计总体排名平均数，二元分布排名百分比的方法和二元分布统计总体排名平均数，在编辑器中显示指定统计的指定排名的百分比以及总体排名中某一项占其总数的百分比，按照数量从大到下依次排列，即数量越大，排名越小，数量越小，排名越大，默认输出最后一个排名。图表化显示统计结果，提高报告的可读性。本发明还提供了一种自动报告生成系统，其包括界面输入单元、模板数据单元和数据匹配单元；

数据匹配单元将报告原始信息中的用户状态信息与标准进行匹配并生成报告，在报告中根据匹配结果用户状态信息显示为标准信息或原始信息。

界面输入单元和数据匹配单元采用本发明前述的方法，在此不做赘述。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种自动报告生成方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的自动报告生成方法，其特征在于，包括选择报告原始信息数据源的步骤，具体为：

3.根据权利要求1所述的自动报告生成方法，其特征在于，所述步骤S2中的匹配方法为：

4.根据权利要求1所述的自动报告生成方法，其特征在于，还包括统计图表生成方法，具体包括生成一元分布排名百分比，一元分布统计总体排名平均数，二元分布排名百分比的方法和二元分布统计总体排名平均数，

在编辑器中显示指定统计的指定排名的百分比以及总体排名中某一项占其总数的百分比，按照数量从大到下依次排列，即数量越大，排名越小，数量越小，排名越大，默认输出最后一个排名。

5.一种自动报告生成系统，其特征在于，包括界面输入单元、模板数据单元和数据匹配单元；

6.根据权利要求5所述的自动报告生成系统，其特征在于，还包括控制器，所述控制器选择报告原始信息数据源具体为：根据调查主题不同将数据源分为m类，所述m为正整数；每一类信息包括多个原始样本，将部分或者全部的原始样本作为一个集合，汇总输出为一个报告原始信息数据包，每一个原始样本在数据包中占据一行或者一列。

7.根据权利要求5所述的自动报告生成系统，其特征在于，数据匹配单元将报告原始信息中的用户状态信息分为n级，所述标准信息与其对应的也分为n级；首先进行第一级信息匹配，所述第一级信息包括年龄、性别信息，当输入年龄性别时，匹配为标准信息中的年龄段和性别信息；进行第二级信息匹配，所述第二级信息包括被调查者症状信息，当输入被调查者症状信息时，匹配为标准信息中的症状对应的器官；进行第三级信息匹配，所述第三级信息包括被调查者服药情况信息，当输入被调查者服药情况信息时，匹配为标准信息中的药品分类信息；如果以上均匹配失败，则直接到导出的数据包中对应行或者对应列的内容填入原文。