CN107330427B

CN107330427B - 图片的处理方法及装置

Info

Publication number: CN107330427B
Application number: CN201710414278.7A
Authority: CN
Inventors: 周列淳; 岳智磊; 刘泓; 江岩
Original assignee: Thorgene Beijing Information Technology Co ltd
Current assignee: Thorgene Beijing Information Technology Co ltd
Priority date: 2017-06-05
Filing date: 2017-06-05
Publication date: 2020-06-12
Anticipated expiration: 2037-06-05
Also published as: CN107330427A

Abstract

本发明提出一种图片的处理方法及装置，其中，该图片的处理方法包括：接收用户上传的待识别图片，其中，所述待识别图片包含体检信息；对所述待识别图片进行OCR识别，以获取所述待识别图片的OCR识别数据；根据所述OCR识别数据生成所述待识别图片的电子体检报告；将所述电子体检报告提供给用户。本发明的图片的处理方法，为用户提供了电子体检报告，方便了用户对于自己的体检报告进行电子化管理，方便用户随时查看体检报告。

Description

图片的处理方法及装置

技术领域

本发明涉及图片技术领域，特别涉及一种图片的处理方法及装置。

背景技术

目前，越来越多的人更加重视自己的身体健康，且大多数人会定期去做体检，但是这些体检信息基本都是以纸质的方式进行保存，时间长了，这些纸质体检报告很可能就会被遗忘或者被丢失，容易出现再次查看体检报告而体检报告已丢失的情况。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种图片的处理方法，该方法为用户提供了电子体检报告，方便了用户对于自己的体检报告进行电子化管理，方便用户随时查看体检报告。

本发明的第二个目的在于提出一种图片的处理装置。

为达上述目的，本发明第一方面实施例提出了一种图片的处理方法，包括：接收用户上传的待识别图片，其中，所述待识别图片包含体检信息；对所述待识别图片进行OCR识别，以获取所述待识别图片的OCR识别数据；根据所述OCR识别数据生成所述待识别图片的电子体检报告；将所述电子体检报告提供给用户。

本发明实施例的图片的处理方法，对用户上传的包含体检信息的待识别图片进行OCR识别，以获取待识别图片的OCR识别数据，并根据OCR识别数据生成待识别图片的电子体检报告，并将所生成的电子体检报告提供给用户。由此，为用户提供了电子体检报告，方便了用户对于自己的体检报告进行电子化管理，方便用户随时查看体检报告。

为达上述目的，本发明第二方面实施例提出了一种使图片的处理装置，包括：接收模块，用于接收用户上传的待识别图片，其中，所述待识别图片包含体检信息；识别模块，用于对所述待识别图片进行OCR识别，以获取所述待识别图片的OCR识别数据；第一生成模块，用于根据所述OCR识别数据生成所述待识别图片的电子体检报告；提供模块，用于将所述电子体检报告提供给用户。

本发明实施例的图片的处理装置，对用户上传的包含体检信息的待识别图片进行OCR识别，以获取待识别图片的OCR识别数据，并根据OCR识别数据生成待识别图片的电子体检报告，并将所生成的电子体检报告提供给用户。由此，为用户提供了电子体检报告，方便了用户对于自己的体检报告进行电子化管理，方便用户随时查看体检报告。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明一个实施例的图片的处理方法的流程图；

图2为根据本发明另一个实施例的图片的处理方法的流程图；

图3为根据本发明再一个实施例的图片的处理方法的流程图；

图4为根据预设的属性名称的字符特征库确定当前数据对应的属性名称的细化流程图；

图5为根据本发明一个实施例的图片的处理装置的结构示意图；

图6为根据本发明另一个实施例的图片的处理装置的结构示意图；

图7为根据本发明再一个实施例的图片的处理装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“多个”指两个或两个以上；术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。

下面参考附图描述根据本发明实施例的图片的处理方法及装置。

图1为根据本发明一个实施例的图片的处理方法的流程图。

如图1所示，根据本发明实施例的图片的处理方法，包括以下步骤。

S11，接收用户上传的待识别图片。

其中，待识别图片包含体检信息。

其中，待识别图片是用户可通过终端的摄像头对体检报告进行拍照所生成的。

其中，终端可以包括但不限于平板电脑、智能手机等具有各种操作系统的硬件设备。

S12，对待识别图片进行OCR识别，以获取待识别图片的OCR识别数据。

具体地，在获取待识别图片后，可通过现有的OCR识别算法对待识别图片进行OCR识别，以获取待识别图片的OCR识别数据。

作为一种示例性的实施例方式，在对待识别图片进行OCR识别的过程中，可确定待识别图片中的表(table)区域，然后，判断待识别图片中表区域的数量是否为多个，若判断表区域的数量为多个，则分别对每个表区域进行OCR识别，以获取每个表区域的OCR识别数据。

另外，若判断待识别图片中包含一个表区域，则直接对待识别图片进行OCR识别。

其中，OCR识别数据中包括数字、中文、字母、符号等字符。

其中，表区域是指待识别图片中体检信息的表格所在的区域。

S13，根据OCR识别数据生成待识别图片的电子体检报告。

作为一种示例性的实施方式，在获取待识别图片的OCR识别数据后，可获取预设体检报告模板，并将OCR识别数据加载至预设体检报告模板中，以生成待识别图片的电子体检报告。

S14，将电子体检报告提供给用户。

图2为根据本发明另一个实施例的图片的处理方法的流程图。

如图2所示，根据本发明实施例的图片的处理方法，包括以下步骤。

S21，接收用户上传的待识别图片。

其中，待识别图片包含体检信息。

S22，对待识别图片进行OCR识别，以获取待识别图片的OCR识别数据。

其中，OCR识别数据中包括数字、中文、字母、符号等字符。

S23，判断OCR识别数据是否包含检查类别。

具体地，在获取待识别图片的OCR识别数据后，判断OCR识别数据识别包含预设关键词例如血常规，尿常规、乙肝检测、生化检验等检查类别词。

S24，若否，则根据OCR识别数据和预存的检查类别与检查项目的对应关系，生成待识别图片的电子体检报告。

其中，检查类别可以包括但不限于血常规，尿常规、乙肝检测、生化检验等。

其中，预存的检查类别与检查项目的对应关系中保存了各种检查类别与检查项目的对应关系。

举例而言，检查类别与检查项目的对应关系可以为：检查类别为血常规，血常规对应的检查项目包括血红蛋白、红细胞计数、红细胞压积、血小板、平均血小板体积、血小板容积分布宽度、淋巴细胞绝对值、中性粒细胞百分比、中间细胞百分比、中间细胞绝对值等检查项目。

该实施例根据OCR识别数据和预存的检查类别与检查项目的对应关系，生成待识别图片的电子体检报告，由此，使得所生成的电子体检报告中提供了检查类别。

S25，若是，则根据OCR识别数据生成待识别图片的电子体检报告。

S26，将电子体检报告提供给用户。

本发明实施例的图片的处理方法，对用户上传的包含体检信息的待识别图片进行OCR识别，以获取待识别图片的OCR识别数据，并判断OCR识别数据中是否包含检查类别，并在OCR识别数据中不包含检查类别时，根据OCR识别数据和预存的检查类别与检查项目的对应关系，生成待识别图片的电子体检报告，并将所生成的电子体检报告提供给用户。由此，为用户提供了电子体检报告，方便了用户对于自己的体检报告进行电子化管理，方便用户随时查看体检报告。

图3为根据本发明再一个实施例的图片的处理方法的流程图。

如图3所示，根据本发明实施例的图片的处理方法，包括以下步骤。

S31，接收用户上传的待识别图片。

其中，待识别图片包含体检信息。

S32，对待识别图片进行OCR识别，以获取待识别图片的OCR识别数据。

其中，OCR识别数据中包括数字、中文、字母、符号等字符。

S33，判断OCR识别数据中是否包含属性名称，若是，则执行步骤S34，若否，则执行步骤S35和S36。

S34，根据OCR识别数据生成待识别图片的电子体检报告。

S35，根据OCR识别数据中的每列数据确定每列数据的属性名称。

其中，属性名称可以包括但不限于检查项目、项目、检测值、单位、参考范围、英文名称等。

在本发明的一个实施例中，可根据预设的属性名称的字符特征库，确定每列数据中每个数据的属性名称，针对每列数据，统计当前列数据中相同属性名称的数量，并将数量最多的属性名称作为当前列数据的属性名称。

具体地，在确定待OCR识别数据中不包含每列数据的属性名后，针对每列数据中的每个数据，可将当前数据中的字符信息与预设的属性名称的字符特征库进行匹配，并根据匹配结果确定当前数据对应的属性名称。然后，统计当前列数据中相同属性名称的数量，并将数量最多的属性名称作为当前列数据的属性名称。

S36，根据每列数据的属性名称、OCR识别数据生成包含属性名称的电子体检报告。

S37，将电子体检报告提供给用户。

本发明实施例的图片的处理方法，对用户上传的包含体检信息的待识别图片进行OCR识别，以获取待识别图片的OCR识别数据，在判断OCR识别数据中不包含属性名称时，根据OCR识别数据中的每列数据确定每列数据的属性名称，根据每列数据的属性名称、OCR识别数据生成包含属性名称的电子体检报告，并将所生成的电子体检报告提供给用户。由此，为用户提供了电子体检报告，方便了用户对于自己的体检报告进行电子化管理，方便用户随时查看体检报告。

在本发明的一个实施例中，如图4所示，根据预设的属性名称的字符特征库确定当前数据对应的属性名称的具体过程为：

S41，判断当前数据中是否包含中文字符，若是，则执行步骤S42，若否，则执行步骤S43。

S42，判断预设的属性名称的字符特征库中是否存在与当前数据中对应的中文字符匹配的检查项目，若是，则执行步骤S421，若否，则执行步骤S422。

S421，确定当前数据的属性名称为检查项目。

S422，判断预设的属性名称的特征字符特征库中是否存在与当前数据中对应的中文字符对应的检测值的关键词，若是，则执行步骤S423，若否，则执行步骤S424。

其中，检测值的关键词可以包括但不限于阴性、阳性等关键词。

S423，确定当前数据的属性名称为检测值。

S424，判断预设的属性名称的特征字符特征库中是否存在与当前数据中对应的中文字符对应的单位的关键词，若是，则执行步骤S425，若否，则执行步骤S426。

其中，单位对应的关键词可以包括但不限于/天、/小时、/L、/小时、/分钟等关键词。

S425，确定当前数据的属性名称为单位。

S426，判断预设的属性名称的特征字符特征库中是否存在与当前数据中对应的中文字符对应的参考范围对应的关键词，若是，则执行步骤S427，若否，则结束。

其中，参考范围对应的关键词可以包括但不限于正常、不正常等关键词。

S427，确定当前数据对应的属性名称为参考范围。

S43，判断当前数据中是否包含数字，若是，则执行步骤S431，若否，则执行步骤S44。

S431，判断预设的属性名称的特征字符特征库中是否存在与当前数据对应的参考范围的关键词，若是，则执行步骤S432。若否，则执行步骤S433。

S432，确定当前数据对应的属性名称为参考范围。

例如，当前数据为：参考范围：20ml～30ml，通过判断当前数据中包括数字，并且当前数据中包括参考范围对应的关键词ml，此时，可确定当前数据对应的属性名称为参考范围。

S433，判断预设的属性名称的特征字符特征库中是否存在与当前数据对应的单位的关键词，若是，则执行步骤S434，若否，则执行步骤S435。

单位的关键词可以包括ng/ml、mg/ml、mg、H、L等。

S434，确定当前数据对应的属性名称为单位。

例如，当前数据为10-9mg/L，通过判断当前数据中包括数字，并且确定当前数据中“mg/L”，其中，mg/L为单位对应的关键词，此时，可确定当前数据对应的属性名称为单位。

S435，确定当前数据对应的属性名称为检测值。

S44，判断当前数据中是否包含英文字符，若是，则执行步骤S45。

S45，判断当前数据中是否包含单位对应的关键词，若是，则执行步骤S46，若否，则执行步骤S47。

S46，确定当前数据对应的属性名称为单位。

S47，确定当前数据对应的属性名称为英文名称。

也就是说，在确定当前数据中不包包含中文字符、而且不包含数字，仅包含英文字符时，此时，可进一步确定当前数据是否包含单位对应的关键词，如果包含，则确定当前数据对应的属性名称为单位，否则，确定当前数据对应的属性名称为英文名称。

例如，当前数据为“mg”，通过分析可确定该当前数据中不包包含中文字符、而且不包含数字，仅包含英文字符，此时，对当前数据进行分析，可确定当前数据“mg”为单位对应的关键词，此时，可确定当前数据对应的属性名称为单位。

为了实现上述实施例，本发明还提出了一种图片的处理装置。

图5为根据本发明一个实施例的图片的处理装置的结构示意图。

如图5所示，该图片的处理装置包括接收模块110、识别模块120、第一生成模块130和提供模块140，其中：

接收模块110用于接收用户上传的待识别图片，其中，待识别图片包含体检信息。

识别模块120用于对待识别图片进行OCR识别，以获取待识别图片的OCR识别数据。

第一生成模块130用于根据OCR识别数据生成待识别图片的电子体检报告。

提供模块140用于将电子体检报告提供给用户。

基于图5所示的基础上，如图6所示，该装置还可以包括判断模块150和第二生成模块160，其中：

判断模块150用于判断OCR识别数据是否包含检查类别。

第二生成模块160用于在判断OCR识别数据不包含检查类别时，根据OCR识别数据和预存的检查类别与检查项目的对应关系，生成待识别图片的电子体检报告。

其中，第一生成模块140用于在判断OCR识别数据包含检查类别时，根据OCR识别数据生成待识别图片的电子体检报告。

在本发明的一个实施例中，在图5所示的基础上，如图7所示，第一生成模块130包括：

判断单元131用于判断OCR识别数据中是否包含属性名称。

确定单元132用于在判断OCR识别数据中不包含属性名称时，根据OCR识别数据中的每列数据确定每列数据的属性名称。

生成单元133用于根据每列数据的属性名称、OCR识别数据生成包含属性名称的电子体检报告。

在本发明的一个实施例中，确定单元132具体用于：

根据预设的属性名称的字符特征库，确定每列数据中每个数据的属性名称；

针对每列数据，统计当前列数据中相同属性名称的数量，并将数量最多的属性名称作为当前列数据的属性名称。

在本发明的一个实施例中，确定单元132具体用于：

针对每个数据，将当前数据中的字符信息与预设的属性名称的字符特征库进行匹配，并根据匹配结果确定当前数据对应的属性名称。

其中，需要说明的是，前述对图片的处理方法实施例的解释说明也适用于该实施例的图片的处理装置，此处不再赘述。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种图片的处理方法，其特征在于，包括以下步骤：

接收用户上传的待识别图片，其中，所述待识别图片包含体检信息；

对所述待识别图片进行OCR识别，以获取所述待识别图片的OCR识别数据；

根据所述OCR识别数据生成所述待识别图片的电子体检报告；

将所述电子体检报告提供给用户；

所述根据所述OCR识别数据生成所述待识别图片的电子体检报告，包括：

判断所述OCR识别数据中是否包含属性名称；

若否，则根据所述OCR识别数据中的每列数据确定每列数据的属性名称；

根据每列数据的属性名称、所述OCR识别数据生成包含属性名称的电子体检报告；

所述根据所述OCR识别数据中的每列数据确定每列数据的属性名称，包括：

针对每列数据，统计当前列数据中相同属性名称的数量，并将数量最多的属性名称作为当前列数据的属性名称；

所述根据预设的属性名称的字符特征库，确定每列数据中每个数据的属性名称，包括：

针对每个字符，在确定当前数据中包含中文字符时，将预设的属性名称的字符特征库中与所述文字符匹配的属性名称作为所述当前数据的属性名称；

在所述当前数据中不包含中文字符，而包含数字时，如果预设的属性名称的特征字符特征库中存在与所述当前数据对应的参考范围的关键词，则确定所述当前数据的属性名称为参考范围，如果预设的属性名称的特征字符特征库中不存在与所述当前数据对应的参考范围的关键词，则进一步判断预设的属性名称的特征字符特征库中是否存在与所述当前数据对应的单位的关键词，如果是，则确定所述当前数据对应的属性名称为单位，如果否，则确定所述当前数据对应的属性名称为检测值；

如果所述当前数据不包含中文字符和数字，而包含英文字符，则进一步判断所述当前数据中是否包含单位对应的关键词，如果所述当前数据包含单位对应的关键词，则确定所述当前数据对应的属性名称为单位，如果所述当前数据不包含单位对应的关键词，则确定所述当前数据对应的属性名称为英文名称。

2.如权利要求1所述的方法，其特征在于，还包括：

判断所述OCR识别数据是否包含检查类别；

若否，则根据所述OCR识别数据和预存的检查类别与检查项目的对应关系，生成所述待识别图片的电子体检报告；

若是，则执行所述根据所述OCR识别数据生成所述待识别图片的电子体检报告步骤。

3.一种图片的处理装置，其特征在于，包括：

接收模块，用于接收用户上传的待识别图片，其中，所述待识别图片包含体检信息；

识别模块，用于对所述待识别图片进行OCR识别，以获取所述待识别图片的OCR识别数据；

第一生成模块，用于根据所述OCR识别数据生成所述待识别图片的电子体检报告；

提供模块，用于将所述电子体检报告提供给用户；

所述第一生成模块，包括：

判断单元，用于判断所述OCR识别数据中是否包含属性名称；

确定单元，用于在判断所述OCR识别数据中不包含属性名称时，根据所述OCR识别数据中的每列数据确定每列数据的属性名称；

生成单元，用于根据每列数据的属性名称、所述OCR识别数据生成包含属性名称的电子体检报告；

所述确定单元，具体用于：

4.如权利要求3所述的装置，其特征在于，还包括：

判断模块，用于判断所述OCR识别数据是否包含检查类别；

第二生成模块，用于在判断所述OCR识别数据不包含检查类别时，根据所述OCR识别数据和预存的检查类别与检查项目的对应关系，生成所述待识别图片的电子体检报告；

其中，所述第一生成模块，用于在判断所述OCR识别数据包含检查类别时，根据所述OCR识别数据生成所述待识别图片的电子体检报告。