CN107330427A - 图片的处理方法及装置 - Google Patents
图片的处理方法及装置 Download PDFInfo
- Publication number
- CN107330427A CN107330427A CN201710414278.7A CN201710414278A CN107330427A CN 107330427 A CN107330427 A CN 107330427A CN 201710414278 A CN201710414278 A CN 201710414278A CN 107330427 A CN107330427 A CN 107330427A
- Authority
- CN
- China
- Prior art keywords
- picture
- identified
- property name
- physical examination
- ocr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
Abstract
本发明提出一种图片的处理方法及装置,其中,该图片的处理方法包括:接收用户上传的待识别图片,其中,所述待识别图片包含体检信息;对所述待识别图片进行OCR识别,以获取所述待识别图片的OCR识别数据;根据所述OCR识别数据生成所述待识别图片的电子体检报告;将所述电子体检报告提供给用户。本发明的图片的处理方法,为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
Description
技术领域
本发明涉及图片技术领域,特别涉及一种图片的处理方法及装置。
背景技术
目前,越来越多的人更加重视自己的身体健康,且大多数人会定期去做体检,但是这些体检信息基本都是以纸质的方式进行保存,时间长了,这些纸质体检报告很可能就会被遗忘或者被丢失,容易出现再次查看体检报告而体检报告已丢失的情况。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种图片的处理方法,该方法为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
本发明的第二个目的在于提出一种图片的处理装置。
为达上述目的,本发明第一方面实施例提出了一种图片的处理方法,包括:接收用户上传的待识别图片,其中,所述待识别图片包含体检信息;对所述待识别图片进行OCR识别,以获取所述待识别图片的OCR识别数据;根据所述OCR识别数据生成所述待识别图片的电子体检报告;将所述电子体检报告提供给用户。
本发明实施例的图片的处理方法,对用户上传的包含体检信息的待识别图片进行OCR识别,以获取待识别图片的OCR识别数据,并根据OCR识别数据生成待识别图片的电子体检报告,并将所生成的电子体检报告提供给用户。由此,为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
为达上述目的,本发明第二方面实施例提出了一种使图片的处理装置,包括:接收模块,用于接收用户上传的待识别图片,其中,所述待识别图片包含体检信息;识别模块,用于对所述待识别图片进行OCR识别,以获取所述待识别图片的OCR识别数据;第一生成模块,用于根据所述OCR识别数据生成所述待识别图片的电子体检报告;提供模块,用于将所述电子体检报告提供给用户。
本发明实施例的图片的处理装置,对用户上传的包含体检信息的待识别图片进行OCR识别,以获取待识别图片的OCR识别数据,并根据OCR识别数据生成待识别图片的电子体检报告,并将所生成的电子体检报告提供给用户。由此,为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的图片的处理方法的流程图;
图2为根据本发明另一个实施例的图片的处理方法的流程图;
图3为根据本发明再一个实施例的图片的处理方法的流程图;
图4为根据预设的属性名称的字符特征库确定当前数据对应的属性名称的细化流程图;
图5为根据本发明一个实施例的图片的处理装置的结构示意图;
图6为根据本发明另一个实施例的图片的处理装置的结构示意图;
图7为根据本发明再一个实施例的图片的处理装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
下面参考附图描述根据本发明实施例的图片的处理方法及装置。
图1为根据本发明一个实施例的图片的处理方法的流程图。
如图1所示,根据本发明实施例的图片的处理方法,包括以下步骤。
S11,接收用户上传的待识别图片。
其中,待识别图片包含体检信息。
其中,待识别图片是用户可通过终端的摄像头对体检报告进行拍照所生成的。
其中,终端可以包括但不限于平板电脑、智能手机等具有各种操作系统的硬件设备。
S12,对待识别图片进行OCR识别,以获取待识别图片的OCR识别数据。
具体地,在获取待识别图片后,可通过现有的OCR识别算法对待识别图片进行OCR识别,以获取待识别图片的OCR识别数据。
作为一种示例性的实施例方式,在对待识别图片进行OCR识别的过程中,可确定待识别图片中的表(table)区域,然后,判断待识别图片中表区域的数量是否为多个,若判断表区域的数量为多个,则分别对每个表区域进行OCR识别,以获取每个表区域的OCR识别数据。
另外,若判断待识别图片中包含一个表区域,则直接对待识别图片进行OCR识别。
其中,OCR识别数据中包括数字、中文、字母、符号等字符。
其中,表区域是指待识别图片中体检信息的表格所在的区域。
S13,根据OCR识别数据生成待识别图片的电子体检报告。
作为一种示例性的实施方式,在获取待识别图片的OCR识别数据后,可获取预设体检报告模板,并将OCR识别数据加载至预设体检报告模板中,以生成待识别图片的电子体检报告。
S14,将电子体检报告提供给用户。
本发明实施例的图片的处理方法,对用户上传的包含体检信息的待识别图片进行OCR识别,以获取待识别图片的OCR识别数据,并根据OCR识别数据生成待识别图片的电子体检报告,并将所生成的电子体检报告提供给用户。由此,为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
图2为根据本发明另一个实施例的图片的处理方法的流程图。
如图2所示,根据本发明实施例的图片的处理方法,包括以下步骤。
S21,接收用户上传的待识别图片。
其中,待识别图片包含体检信息。
其中,待识别图片是用户可通过终端的摄像头对体检报告进行拍照所生成的。
其中,终端可以包括但不限于平板电脑、智能手机等具有各种操作系统的硬件设备。
S22,对待识别图片进行OCR识别,以获取待识别图片的OCR识别数据。
具体地,在获取待识别图片后,可通过现有的OCR识别算法对待识别图片进行OCR识别,以获取待识别图片的OCR识别数据。
作为一种示例性的实施例方式,在对待识别图片进行OCR识别的过程中,可确定待识别图片中的表(table)区域,然后,判断待识别图片中表区域的数量是否为多个,若判断表区域的数量为多个,则分别对每个表区域进行OCR识别,以获取每个表区域的OCR识别数据。
另外,若判断待识别图片中包含一个表区域,则直接对待识别图片进行OCR识别。
其中,OCR识别数据中包括数字、中文、字母、符号等字符。
其中,表区域是指待识别图片中体检信息的表格所在的区域。
S23,判断OCR识别数据是否包含检查类别。
具体地,在获取待识别图片的OCR识别数据后,判断OCR识别数据识别包含预设关键词例如血常规,尿常规、乙肝检测、生化检验等检查类别词。
S24,若否,则根据OCR识别数据和预存的检查类别与检查项目的对应关系,生成待识别图片的电子体检报告。
其中,检查类别可以包括但不限于血常规,尿常规、乙肝检测、生化检验等。
其中,预存的检查类别与检查项目的对应关系中保存了各种检查类别与检查项目的对应关系。
举例而言,检查类别与检查项目的对应关系可以为:检查类别为血常规,血常规对应的检查项目包括血红蛋白、红细胞计数、红细胞压积、血小板、平均血小板体积、血小板容积分布宽度、淋巴细胞绝对值、中性粒细胞百分比、中间细胞百分比、中间细胞绝对值等检查项目。
该实施例根据OCR识别数据和预存的检查类别与检查项目的对应关系,生成待识别图片的电子体检报告,由此,使得所生成的电子体检报告中提供了检查类别。
S25,若是,则根据OCR识别数据生成待识别图片的电子体检报告。
S26,将电子体检报告提供给用户。
本发明实施例的图片的处理方法,对用户上传的包含体检信息的待识别图片进行OCR识别,以获取待识别图片的OCR识别数据,并判断OCR识别数据中是否包含检查类别,并在OCR识别数据中不包含检查类别时,根据OCR识别数据和预存的检查类别与检查项目的对应关系,生成待识别图片的电子体检报告,并将所生成的电子体检报告提供给用户。由此,为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
图3为根据本发明再一个实施例的图片的处理方法的流程图。
如图3所示,根据本发明实施例的图片的处理方法,包括以下步骤。
S31,接收用户上传的待识别图片。
其中,待识别图片包含体检信息。
其中,待识别图片是用户可通过终端的摄像头对体检报告进行拍照所生成的。
其中,终端可以包括但不限于平板电脑、智能手机等具有各种操作系统的硬件设备。
S32,对待识别图片进行OCR识别,以获取待识别图片的OCR识别数据。
具体地,在获取待识别图片后,可通过现有的OCR识别算法对待识别图片进行OCR识别,以获取待识别图片的OCR识别数据。
作为一种示例性的实施例方式,在对待识别图片进行OCR识别的过程中,可确定待识别图片中的表(table)区域,然后,判断待识别图片中表区域的数量是否为多个,若判断表区域的数量为多个,则分别对每个表区域进行OCR识别,以获取每个表区域的OCR识别数据。
另外,若判断待识别图片中包含一个表区域,则直接对待识别图片进行OCR识别。
其中,OCR识别数据中包括数字、中文、字母、符号等字符。
其中,表区域是指待识别图片中体检信息的表格所在的区域。
S33,判断OCR识别数据中是否包含属性名称,若是,则执行步骤S34,若否,则执行步骤S35和S36。
S34,根据OCR识别数据生成待识别图片的电子体检报告。
S35,根据OCR识别数据中的每列数据确定每列数据的属性名称。
其中,属性名称可以包括但不限于检查项目、项目、检测值、单位、参考范围、英文名称等。
在本发明的一个实施例中,可根据预设的属性名称的字符特征库,确定每列数据中每个数据的属性名称,针对每列数据,统计当前列数据中相同属性名称的数量,并将数量最多的属性名称作为当前列数据的属性名称。
具体地,在确定待OCR识别数据中不包含每列数据的属性名后,针对每列数据中的每个数据,可将当前数据中的字符信息与预设的属性名称的字符特征库进行匹配,并根据匹配结果确定当前数据对应的属性名称。然后,统计当前列数据中相同属性名称的数量,并将数量最多的属性名称作为当前列数据的属性名称。
S36,根据每列数据的属性名称、OCR识别数据生成包含属性名称的电子体检报告。
S37,将电子体检报告提供给用户。
本发明实施例的图片的处理方法,对用户上传的包含体检信息的待识别图片进行OCR识别,以获取待识别图片的OCR识别数据,在判断OCR识别数据中不包含属性名称时,根据OCR识别数据中的每列数据确定每列数据的属性名称,根据每列数据的属性名称、OCR识别数据生成包含属性名称的电子体检报告,并将所生成的电子体检报告提供给用户。由此,为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
在本发明的一个实施例中,如图4所示,根据预设的属性名称的字符特征库确定当前数据对应的属性名称的具体过程为:
S41,判断当前数据中是否包含中文字符,若是,则执行步骤S42,若否,则执行步骤S43。
S42,判断预设的属性名称的字符特征库中是否存在与当前数据中对应的中文字符匹配的检查项目,若是,则执行步骤S421,若否,则执行步骤S422。
S421,确定当前数据的属性名称为检查项目。
S422,判断预设的属性名称的特征字符特征库中是否存在与当前数据中对应的中文字符对应的检测值的关键词,若是,则执行步骤S423,若否,则执行步骤S424。
其中,检测值的关键词可以包括但不限于阴性、阳性等关键词。
S423,确定当前数据的属性名称为检测值。
S424,判断预设的属性名称的特征字符特征库中是否存在与当前数据中对应的中文字符对应的单位的关键词,若是,则执行步骤S425,若否,则执行步骤S426。
其中,单位对应的关键词可以包括但不限于/天、/小时、/L、/小时、/分钟等关键词。
S425,确定当前数据的属性名称为单位。
S426,判断预设的属性名称的特征字符特征库中是否存在与当前数据中对应的中文字符对应的参考范围对应的关键词,若是,则执行步骤S427,若否,则结束。
其中,参考范围对应的关键词可以包括但不限于正常、不正常等关键词。
S427,确定当前数据对应的属性名称为参考范围。
S43,判断当前数据中是否包含数字,若是,则执行步骤S431,若否,则执行步骤S44。
S431,判断预设的属性名称的特征字符特征库中是否存在与当前数据对应的参考范围的关键词,若是,则执行步骤S432。若否,则执行步骤S433。
S432,确定当前数据对应的属性名称为参考范围。
例如,当前数据为:参考范围:20ml~30ml,通过判断当前数据中包括数字,并且当前数据中包括参考范围对应的关键词ml,此时,可确定当前数据对应的属性名称为参考范围。
S433,判断预设的属性名称的特征字符特征库中是否存在与当前数据对应的单位的关键词,若是,则执行步骤S434,若否,则执行步骤S435。
单位的关键词可以包括ng/ml、mg/ml、mg、H、L等。
S434,确定当前数据对应的属性名称为单位。
例如,当前数据为10-9mg/L,通过判断当前数据中包括数字,并且确定当前数据中“mg/L”,其中,mg/L为单位对应的关键词,此时,可确定当前数据对应的属性名称为单位。
S435,确定当前数据对应的属性名称为检测值。
S44,判断当前数据中是否包含英文字符,若是,则执行步骤S45。
S45,判断当前数据中是否包含单位对应的关键词,若是,则执行步骤S46,若否,则执行步骤S47。
S46,确定当前数据对应的属性名称为单位。
S47,确定当前数据对应的属性名称为英文名称。
也就是说,在确定当前数据中不包包含中文字符、而且不包含数字,仅包含英文字符时,此时,可进一步确定当前数据是否包含单位对应的关键词,如果包含,则确定当前数据对应的属性名称为单位,否则,确定当前数据对应的属性名称为英文名称。
例如,当前数据为“mg”,通过分析可确定该当前数据中不包包含中文字符、而且不包含数字,仅包含英文字符,此时,对当前数据进行分析,可确定当前数据“mg”为单位对应的关键词,此时,可确定当前数据对应的属性名称为单位。
为了实现上述实施例,本发明还提出了一种图片的处理装置。
图5为根据本发明一个实施例的图片的处理装置的结构示意图。
如图5所示,该图片的处理装置包括接收模块110、识别模块120、第一生成模块130和提供模块140,其中:
接收模块110用于接收用户上传的待识别图片,其中,待识别图片包含体检信息。
识别模块120用于对待识别图片进行OCR识别,以获取待识别图片的OCR识别数据。
第一生成模块130用于根据OCR识别数据生成待识别图片的电子体检报告。
提供模块140用于将电子体检报告提供给用户。
基于图5所示的基础上,如图6所示,该装置还可以包括判断模块150和第二生成模块160,其中:
判断模块150用于判断OCR识别数据是否包含检查类别。
第二生成模块160用于在判断OCR识别数据不包含检查类别时,根据OCR识别数据和预存的检查类别与检查项目的对应关系,生成待识别图片的电子体检报告。
其中,第一生成模块140用于在判断OCR识别数据包含检查类别时,根据OCR识别数据生成待识别图片的电子体检报告。
在本发明的一个实施例中,在图5所示的基础上,如图7所示,第一生成模块130包括:
判断单元131用于判断OCR识别数据中是否包含属性名称。
确定单元132用于在判断OCR识别数据中不包含属性名称时,根据OCR识别数据中的每列数据确定每列数据的属性名称。
生成单元133用于根据每列数据的属性名称、OCR识别数据生成包含属性名称的电子体检报告。
在本发明的一个实施例中,确定单元132具体用于:
根据预设的属性名称的字符特征库,确定每列数据中每个数据的属性名称;
针对每列数据,统计当前列数据中相同属性名称的数量,并将数量最多的属性名称作为当前列数据的属性名称。
在本发明的一个实施例中,确定单元132具体用于:
针对每个数据,将当前数据中的字符信息与预设的属性名称的字符特征库进行匹配,并根据匹配结果确定当前数据对应的属性名称。
其中,需要说明的是,前述对图片的处理方法实施例的解释说明也适用于该实施例的图片的处理装置,此处不再赘述。
本发明实施例的图片的处理装置,对用户上传的包含体检信息的待识别图片进行OCR识别,以获取待识别图片的OCR识别数据,并根据OCR识别数据生成待识别图片的电子体检报告,并将所生成的电子体检报告提供给用户。由此,为用户提供了电子体检报告,方便了用户对于自己的体检报告进行电子化管理,方便用户随时查看体检报告。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种图片的处理方法,其特征在于,包括以下步骤:
接收用户上传的待识别图片,其中,所述待识别图片包含体检信息;
对所述待识别图片进行OCR识别,以获取所述待识别图片的OCR识别数据;
根据所述OCR识别数据生成所述待识别图片的电子体检报告;
将所述电子体检报告提供给用户。
2.如权利要求1所述的方法,其特征在于,还包括:
判断所述OCR识别数据是否包含检查类别;
若否,则根据所述OCR识别数据和预存的检查类别与检查项目的对应关系,生成所述待识别图片的电子体检报告;
若是,则执行所述根据所述OCR识别数据生成所述待识别图片的电子体检报告步骤。
3.如权利要求1所述的方法,其特征在于,所述根据所述OCR识别数据生成所述待识别图片的电子体检报告,包括:
判断所述OCR识别数据中是否包含属性名称;
若否,则根据所述OCR识别数据中的每列数据确定每列数据的属性名称;
根据每列数据的属性名称、所述OCR识别数据生成包含属性名称的电子体检报告。
4.如权利要求3所述的方法,其特征在于,所述根据所述OCR识别数据中的每列数据确定每列数据的属性名称,包括:
根据预设的属性名称的字符特征库,确定每列数据中每个数据的属性名称;
针对每列数据,统计当前列数据中相同属性名称的数量,并将数量最多的属性名称作为当前列数据的属性名称。
5.如权利要求4所述的方法,其特征在于,所述根据预设的属性名称的字符特征库,确定每列数据中每个数据的属性名称,包括:
针对每个数据,将当前数据中的字符信息与预设的属性名称的字符特征库进行匹配,并根据匹配结果确定当前数据对应的属性名称。
6.一种图片的处理装置,其特征在于,包括:
接收模块,用于接收用户上传的待识别图片,其中,所述待识别图片包含体检信息;
识别模块,用于对所述待识别图片进行OCR识别,以获取所述待识别图片的OCR识别数据;
第一生成模块,用于根据所述OCR识别数据生成所述待识别图片的电子体检报告;
提供模块,用于将所述电子体检报告提供给用户。
7.如权利要求6所述的装置,其特征在于,还包括:
判断模块,用于判断所述OCR识别数据是否包含检查类别;
第二生成模块,用于在判断所述OCR识别数据不包含检查类别时,根据所述OCR识别数据和预存的检查类别与检查项目的对应关系,生成所述待识别图片的电子体检报告;
其中,所述第一生成模块,用于在判断所述OCR识别数据包含检查类别时,根据所述OCR识别数据生成所述待识别图片的电子体检报告。
8.如权利要求6所述的装置,其特征在于,所述第一生成模块,包括:
判断单元,用于判断所述OCR识别数据中是否包含属性名称;
确定单元,用于在判断所述OCR识别数据中不包含属性名称时,根据所述OCR识别数据中的每列数据确定每列数据的属性名称;
生成单元,用于根据每列数据的属性名称、所述OCR识别数据生成包含属性名称的电子体检报告。
9.如权利要求8所述的装置,其特征在于,所述确定单元,具体用于:
根据预设的属性名称的字符特征库,确定每列数据中每个数据的属性名称;
针对每列数据,统计当前列数据中相同属性名称的数量,并将数量最多的属性名称作为当前列数据的属性名称。
10.如权利要求9所述的装置,其特征在于,所述确定单元,具体用于:
针对每个数据,将当前数据中的字符信息与预设的属性名称的字符特征库进行匹配,并根据匹配结果确定当前数据对应的属性名称。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710414278.7A CN107330427B (zh) | 2017-06-05 | 2017-06-05 | 图片的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710414278.7A CN107330427B (zh) | 2017-06-05 | 2017-06-05 | 图片的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107330427A true CN107330427A (zh) | 2017-11-07 |
CN107330427B CN107330427B (zh) | 2020-06-12 |
Family
ID=60194497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710414278.7A Active CN107330427B (zh) | 2017-06-05 | 2017-06-05 | 图片的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107330427B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110189808A (zh) * | 2019-06-11 | 2019-08-30 | 深圳孕味十足科技有限公司 | 孕期数据管理方法、系统及存储介质 |
CN112201321A (zh) * | 2020-10-15 | 2021-01-08 | 维沃移动通信有限公司 | 文件管理方法和电子设备 |
CN112560676A (zh) * | 2020-12-15 | 2021-03-26 | 中国平安人寿保险股份有限公司 | 图像文本抽取方法、装置及存储介质 |
CN113065537A (zh) * | 2021-06-03 | 2021-07-02 | 江苏联著实业股份有限公司 | 一种基于模型优化的ocr文件格式转化方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034785A (zh) * | 2012-12-14 | 2013-04-10 | 上海斐讯数据通信技术有限公司 | 移动终端健康信息获取系统及方法 |
CN106528821A (zh) * | 2016-11-16 | 2017-03-22 | 济南浪潮高新科技投资发展有限公司 | 一种变动列数据导入数据库的方法 |
-
2017
- 2017-06-05 CN CN201710414278.7A patent/CN107330427B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034785A (zh) * | 2012-12-14 | 2013-04-10 | 上海斐讯数据通信技术有限公司 | 移动终端健康信息获取系统及方法 |
CN106528821A (zh) * | 2016-11-16 | 2017-03-22 | 济南浪潮高新科技投资发展有限公司 | 一种变动列数据导入数据库的方法 |
Non-Patent Citations (1)
Title |
---|
任向冉: ""网络表格的实体列发现与标识"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110189808A (zh) * | 2019-06-11 | 2019-08-30 | 深圳孕味十足科技有限公司 | 孕期数据管理方法、系统及存储介质 |
CN112201321A (zh) * | 2020-10-15 | 2021-01-08 | 维沃移动通信有限公司 | 文件管理方法和电子设备 |
CN112560676A (zh) * | 2020-12-15 | 2021-03-26 | 中国平安人寿保险股份有限公司 | 图像文本抽取方法、装置及存储介质 |
CN113065537A (zh) * | 2021-06-03 | 2021-07-02 | 江苏联著实业股份有限公司 | 一种基于模型优化的ocr文件格式转化方法及系统 |
CN113065537B (zh) * | 2021-06-03 | 2021-09-14 | 江苏联著实业股份有限公司 | 一种基于模型优化的ocr文件格式转化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107330427B (zh) | 2020-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Coe et al. | Content analysis, quantitative | |
CN107330427A (zh) | 图片的处理方法及装置 | |
US9465791B2 (en) | Method and apparatus for automatic detection of spelling errors in one or more documents | |
CN110135411A (zh) | 名片识别方法和装置 | |
CN107315772B (zh) | 基于深度学习的问题匹配方法以及装置 | |
Liu et al. | POLITICS: Pretraining with same-story article comparison for ideology prediction and stance detection | |
US20180225276A1 (en) | Document segmentation, interpretation, and re-organization | |
Cruz Díaz et al. | A machine‐learning approach to negation and speculation detection in clinical texts | |
US10176890B2 (en) | Segmenting and interpreting a document, and relocating document fragments to corresponding sections | |
Madabushi et al. | AStitchInLanguageModels: Dataset and methods for the exploration of idiomaticity in pre-trained language models | |
CN107273883A (zh) | 决策树模型训练方法、确定ocr结果中数据属性方法及装置 | |
CN105631340B (zh) | 一种xss漏洞检测的方法及装置 | |
CN107885728A (zh) | 一种基于译员在线翻译的qa自动检测方法及系统 | |
CN107291949A (zh) | 信息搜索方法及装置 | |
CN110427375A (zh) | 字段类别的识别方法及装置 | |
Park et al. | Using syntactic features for phishing detection | |
Tahmasebi | A Study on Word2Vec on a Historical Swedish Newspaper Corpus. | |
Niu et al. | Discovering stylistic variations in distributional vector space models via lexical paraphrases | |
Bozdag et al. | Measuring and mitigating gender bias in legal contextualized language models | |
Lagus et al. | Topic identification in natural language dialogues using neural networks | |
CN108563727A (zh) | 数据处理方法及装置 | |
CN109684392A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
Delteil et al. | MATrIX--Modality-Aware Transformer for Information eXtraction | |
CN104462289B (zh) | 直达号关键词的推荐方法和装置 | |
CN108804916A (zh) | 恶意文件的检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |