WO2018233055A1 - 保单信息录入的方法、装置、计算机设备及存储介质 - Google Patents

保单信息录入的方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2018233055A1
WO2018233055A1 PCT/CN2017/100057 CN2017100057W WO2018233055A1 WO 2018233055 A1 WO2018233055 A1 WO 2018233055A1 CN 2017100057 W CN2017100057 W CN 2017100057W WO 2018233055 A1 WO2018233055 A1 WO 2018233055A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
policy
field
information
area
Prior art date
Application number
PCT/CN2017/100057
Other languages
English (en)
French (fr)
Inventor
李斌
吴海波
姜云鹏
凌剑
马向东
丁杰
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2018233055A1 publication Critical patent/WO2018233055A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Definitions

  • the present application relates to the field of computer processing, and in particular, to a method, device, computer device and storage medium for policy information entry.
  • a method, apparatus, computer device, and storage medium for policy information entry are provided.
  • a method for entering policy information including:
  • Identifying information in the target data area to obtain editable data information storing the data information according to the corresponding field information, and completing information entry.
  • a device for entering policy information comprising:
  • a type determining module configured to obtain a policy image of the information to be entered, and determine a policy type of the policy image
  • a template determining module configured to determine, according to the policy type, a field image template corresponding to the policy image
  • a search module configured to search, by using an image matching algorithm, a field area that matches the field image template in the policy image
  • An extracting module configured to determine a corresponding target data area on the policy image according to the field area, and extract the target data area
  • An identification module configured to identify information in the target data area to obtain editable data information
  • the input module is configured to store the data information according to the corresponding field information, and complete information entry.
  • a computer device comprising a memory and a processor, wherein the memory stores computer readable instructions, the computer readable instructions being executed by the processor, such that the processor performs the step of: acquiring information to be entered a policy image to determine the type of policy for the policy image;
  • the data information is stored according to the corresponding field information, and information entry is completed.
  • One or more non-volatile readable storage media storing computer-executable instructions, when executed by one or more processors, cause the one or more processors to perform the steps of: acquiring The policy image of the information to be entered, determining the policy type of the policy image;
  • Identifying information in the target data area to obtain editable data information storing the data information according to the corresponding field information, and completing information entry.
  • FIG. 1 is a block diagram showing the internal structure of a computer device in an embodiment
  • FIG. 2 is a flow chart of a method for policy information entry in an embodiment
  • FIG. 3 is a flow chart of a method for searching a field region matching a field image template by an image matching algorithm in a policy image in an embodiment
  • FIG. 5 is a flowchart of a method for identifying information in the target data area to obtain editable data information in an embodiment
  • FIG. 6 is a structural block diagram of an apparatus for entering policy information in an embodiment
  • FIG. 7 is a structural block diagram of a search module in an embodiment
  • Figure 8 is a block diagram showing the structure of an apparatus for entering policy information in another embodiment.
  • the computer device can be a terminal or a server.
  • the terminal may be a personal computer or a mobile electronic device including at least one of a mobile phone, a tablet, a personal digital assistant, or a wearable device.
  • the server can be a standalone server or a server cluster.
  • the computer device includes a processor connected by a system bus, a non-volatile storage medium, an internal memory, and a network interface.
  • the non-volatile storage medium of the computer device can store an operating system and computer readable instructions that, when executed, cause the processor to perform a method of policy information entry.
  • the processor of the computer device is used to provide computing and control capabilities to support the operation of the entire computer device.
  • the internal memory can store computer readable instructions that, when executed by the processor, cause the processor to perform a method of policy information entry.
  • the network interface of the computer device is used for network communication. It will be understood by those skilled in the art that the structure shown in FIG. 1 is only a block diagram of a part of the structure related to the solution of the present application, and does not constitute a limitation of the computer device to which the solution of the present application is applied.
  • the specific computer device may It includes more or fewer components than those shown in the figures, or some components are combined, or have different component arrangements.
  • a method for policy information entry is proposed, which may be applied to a terminal or a server, and specifically includes the following steps:
  • Step 202 Obtain a policy image of the information to be entered, and determine a policy type of the policy image.
  • the policy image refers to a policy that cannot be directly edited in the form of a picture, such as a scanned copy of a policy, a photo, and the like.
  • the policy is the most intensive insurance contract signed between the insurer and the insured.
  • the name of the insurer and the insured, the subject matter of the insurance, and the insurance are mainly recorded on the policy.
  • the policy type of the policy image There are various ways to determine the policy type of the policy image. For example, you can preset the location where different policy types are stored (for example, different policy types are stored in different folders), and then according to the location of the obtained policy image. The type of policy that directly determines the policy image.
  • the policy type of the policy image may be determined according to the policy image number, wherein the policy image number is used to uniquely identify a policy image, and the policy image number may include a number representing the type of the policy, for example, The second-to-last position of the policy image number can be set to represent the policy type.
  • Step 204 Determine a field image template corresponding to the policy image according to the policy type.
  • the field image template corresponding to the policy image may be obtained according to the policy type.
  • a field image template is an image in units of fields.
  • the field refers to the content of the topic that contains a certain topic information.
  • the items "name”, “gender”, and "date of birth” in a policy are so-called "fields".
  • the fields contained in it are the same, and the specifications of the fields are the same, so the field image template can be set in advance.
  • different policies contain the same fields, and the same field size is often the same, so many times for the same field, only You need to make a field image template.
  • the field image template is created by separately separating the regions in which the fields in the policy are located, and each field is correspondingly formed into a field image template, wherein the field image template adopts a rectangular block diagram, that is, a rectangular frame including field information. .
  • the fields included in the different policy types are different. Therefore, you need to set the corresponding relationship between the policy type and the field in advance. After obtaining the policy type corresponding to the policy image, you can determine the field image template corresponding to the policy image.
  • Step 206 Search for a field area matching the field image template by using an image matching algorithm in the policy image.
  • the field area can search for the field area matching the field image template in the policy image by the image matching algorithm.
  • the field image template is a known small image, and it is known that there is an area in the policy image having the same size and the same content as the image template of the field, and the matching process is found in the large image of the policy image. The same field area of the image and the coordinate position of the field area in the policy image.
  • the field image template T is composed of m ⁇ n pixels
  • the policy image S is composed of W ⁇ H pixels
  • the field image template is superimposed on the searched policy image S and translated, and the field image template overlay is
  • the area searched is called subgraph Sij, where i, j is the coordinates of the upper left corner of the subgraph on the searched policy image S.
  • the search range is l ⁇ i ⁇ W-M, l ⁇ j ⁇ H-N.
  • the process of matching is to calculate the similarity between the subgraph and the field image template, and the subgraph with the highest similarity is used as the matching field area.
  • the similarity between the measurement field image template T and the sub-picture Sij can be calculated by the SAD algorithm.
  • SAD Sud of absolute differences
  • SAD is an image matching algorithm. Basic idea: the sum of the absolute values of the differences. This algorithm is often used for image block matching. The absolute value of the difference between the corresponding values of each pixel is summed, and the similarity between the two image blocks is evaluated accordingly. The smaller the absolute value of the difference, the higher the similarity.
  • Step 208 Determine a target data area corresponding to the field image according to the field area, and extract the target data area.
  • the purpose of performing field area matching is to find a target data area corresponding to the field, so as to facilitate subsequent identification of information in the target data area. Therefore, after the field area matching the field image template is found on the policy image, the corresponding target data area is determined on the policy image according to the field area, and then the target data area is extracted. Specifically, first, the coordinate position of the field area on the policy image is determined. Since the shape and size of the field image template are determined (for example, rectangle, length 3 cm, width 1 cm), the matched field area has an image with the field.
  • the template is the same size, so you only need to determine the coordinate position of one corner of the field, you can find the coordinate position of the other three corners, and in the process of determining the field area matching the field image template by the image matching algorithm.
  • the coordinate position of one of the corners of the field area has been determined, so it is equivalent to determining the coordinate position of the field area on the policy image. Since the field area corresponds to the corresponding target data area, and the target data area also has a fixed size. Therefore, according to the coordinate position of the field area and the size of the target data area, the coordinate position of the target data area can be calculated, and then the target data area can be extracted according to the coordinate position of the target data area.
  • the "name” field, its corresponding target data area has been previously specified to be on the right side of the "name” field, and has the same width as the "name” field, for example, the width is 1em, and the length can be preset to 5cm. Therefore, if the coordinate position of the area where the "name" field is located is determined, the coordinate positions of the four corners of the target data area can be obtained.
  • Step 210 Identify information in the target data area to obtain editable data information.
  • the information in the target data area needs to be identified to obtain editable data information.
  • the data information includes text information, digital information, and symbol information.
  • the identification of the information in the target data area is mainly divided into two steps. The first step is to detect the area where the data information in the target data area is located, that is, to locate the data information in the target data area to determine the corresponding target area. In the second step, the data information in the target area is identified to obtain editable data information.
  • the identification method can adopt the existing picture text recognition technology. For example, OCR (Optical Character Recognition) method can be used for identification.
  • the recognition process is to identify the data information in the picture as editable data information.
  • Step 212 Store the data information according to the corresponding field information, and complete information entry.
  • each policy image has a policy number for uniquely identifying the policy image, and after identifying the data information corresponding to each field information, in addition to storing the data information corresponding to the corresponding field information, The data information corresponding to the same policy image is stored in association, thereby completing information entry.
  • the method of information entry is fully automated, and the data information in the policy image can be recorded into the system without manual participation, which not only saves time and labor, but also can process multiple policy images in parallel, thereby improving the efficiency of input. .
  • the field image template corresponding to the policy image is obtained according to the policy type of the policy image, and the field image template is matched with the field area in the policy image, and determined.
  • the target data area corresponding to the field area is then identified by the information in the target data area to obtain editable data information, and then the data information is automatically entered into the corresponding location.
  • the method automatically acquires and identifies the target data area corresponding to each field in the policy image, and then automatically records the identified data information, and the whole process is fully automated, saving time and labor, and improving the accuracy and efficiency of the input.
  • the step 206 of searching for a field region matching the field image template by the image matching algorithm in the policy image includes:
  • step 206A the field image template is superimposed on the policy image and translated according to a preset rule, and the similarity between the field image template and the corresponding coverage area is calculated by the image matching algorithm.
  • the field image matching the field image template is searched on the policy image according to the field image template, and the search method is performed by stacking the field image template on the policy image and performing translation according to a preset rule.
  • the preset rule refers to the distance (for example, 0.1 mm) of the image image template to be translated on the policy image, and the direction of the movement. For example, the image can be moved up and down, or left and right.
  • the image matching algorithm can use existing matching algorithms, such as the SAD algorithm, the Surf algorithm, and the like.
  • the SAD algorithm is taken as an example to illustrate the calculation process.
  • Step 206B Determine a field area that matches the field image template according to the calculated similarity.
  • the field area matching the field image template is determined by calculating the similarity between the field image template and each sub-picture on the policy image, and then the sub-graph with the highest similarity is used as the matching field area.
  • a method for policy information entry comprising:
  • Step 402 Obtain a policy image of the information to be entered, and determine a policy type of the policy image.
  • Step 404 Determine a field image template corresponding to the policy image according to the policy type.
  • Step 406 Search for a field area matching the field image template by using an image matching algorithm in the policy image.
  • Step 408 calculating a coordinate position corresponding to the matched field area, where the coordinate position of the field area is the coordinate of each vertex of the field area;
  • Step 410 Calculate a coordinate position corresponding to the target data area according to a preset rule according to a coordinate position corresponding to the field area, and extract a corresponding target data area according to the calculated coordinate position corresponding to the target data area.
  • Step 412 Identify information in the target data area to obtain editable data information.
  • step 414 the data information is stored according to the corresponding field information, and information entry is completed.
  • the field image template is superimposed on the searched policy image S, and the field image template covers the searched area, which is called the subgraph Sij, where i, j is the top left corner of the subgraph is searched.
  • the coordinates on the policy image S Therefore, once the subgraph matching the subgraph is determined, the coordinates of the upper left corner of the subgraph are determined.
  • the coordinate positions of the other three vertices of the corresponding subgraph can be determined, that is, the field area is determined.
  • the coordinates of the four corners are then calculated according to preset rules, and the coordinates of the four corners corresponding to the target data region corresponding to the field region are calculated according to the positional relationship between the target data region and the field region and the shape of the target data region itself.
  • the size of the specification determines the coordinates of the vertices of the target data area.
  • the coordinates of the four vertices of the target data area can be calculated. For example, suppose the coordinates of the four corners of the field in which the "name" field is located are: upper left corner (1,1), lower left corner (1,0), upper right corner (4,1), lower right corner ( 4,0). It is assumed that the target data area corresponding to the field area is on the right side of the field area, and the specification of the target data area is: the width is the same as the field area and the length is 5 cm, then the corresponding target data area can be calculated.
  • the coordinates of the four corners are: upper left corner (4, 1), lower left corner (4, 0), upper right corner (9, 1), lower right corner (9, 0).
  • the coordinates of the four corners of the target data region are calculated according to the calculation to extract the corresponding target data region.
  • the target data area can also be set to other shapes, such as triangles, hexagons, etc., depending on the actual situation.
  • the data information in the target data area can be identified, thereby obtaining editable data information, and the data information is stored according to the corresponding field template, thereby completing the entry of the policy information.
  • the step 210 of identifying information in the target data region to obtain editable data information includes:
  • step 210A the data information in the target data area is located.
  • the data information in the target data region image is located, so that the located data information is included in the minimum circumscribed rectangle, that is, the target data.
  • the data information in the area is separately extracted by a minimum circumscribed rectangle to obtain a target area picture, wherein the four sides of the minimum circumscribed rectangle are tangent to the uppermost, lowermost, leftmost, and rightmost ends of the data information.
  • the target area picture containing the data information is subsequently identified as the identification object.
  • step 210B the data information is identified by using a picture text recognition technology to obtain editable data information.
  • the extracted minimum circumscribed rectangular image is used as the identification object, and the image character recognition technology is used to include
  • the data information is identified to obtain editable data information.
  • the image text recognition technology can adopt existing identification methods, for example, OCR (Optical Character Recognition) method can be used for identification.
  • OCR Optical Character Recognition
  • the process of recognition is to identify the data information in the picture as editable data information.
  • the area containing the data information is segmented to form a plurality of sub-images, each of which contains partial data information, and the plurality of sub-images are Recognizing in parallel improves the speed of text recognition.
  • the step of obtaining the policy image of the information to be entered, and determining the policy type of the policy image includes: acquiring the policy image of the information to be entered, and extracting the image number of the policy image, according to the preset image number and the policy type The correspondence relationship determines the policy type of the policy image.
  • the image number is used to uniquely identify a policy image, wherein the image number may directly use the policy number or may be a number assigned to the image separately.
  • the image number is associated with the policy type in advance, for example, the second digit of the image number can be associated with the policy type, for example, if the image number is the second The digit number is 1, which represents the accident insurance. If the second digit is 2, it represents auto insurance.
  • an apparatus for entering policy information comprising:
  • a type determining module 602 configured to acquire a policy image of the information to be entered, and determine a policy type of the policy image
  • the template determining module 604 is configured to determine a field image template corresponding to the policy image according to the policy type
  • the searching module 606 is configured to search, by the image matching algorithm, a field area that matches the field image template in the policy image;
  • the extracting module 608 is configured to determine a corresponding target data area on the policy image according to the field area, and extract the target data area;
  • the identification module 610 is configured to identify information in the target data area to obtain an editable Data information
  • the entry module 612 is configured to store the data information according to the corresponding field information, and complete the information entry.
  • the search module 606 includes:
  • the calculating module 606A is configured to stack the field image template on the policy image and perform translation, and calculate the similarity between the field image template and the corresponding coverage area by using an image matching algorithm;
  • the matching module 606B is configured to determine a field area that matches the field image template according to the calculated similarity.
  • the device for entering the policy information further includes:
  • a coordinate calculation module 607 configured to calculate a coordinate position corresponding to the matched field region, where a coordinate position is a coordinate of each vertex of the field region;
  • the extraction module 608 is further configured to calculate a coordinate position corresponding to the target data region according to a preset rule according to the coordinate position corresponding to the field region, and extract a corresponding target data region according to the calculated coordinate position corresponding to the target data region.
  • the identification module is further configured to locate data information in the target data area, and use the image text recognition technology to identify the data information to obtain editable data information.
  • the type determining module is further configured to acquire a policy image of the information to be entered, extract an image number of the policy image, and determine a policy type of the policy image according to a correspondence between the preset image number and the policy type.
  • the various modules in the device for entering the policy information described above may be implemented in whole or in part by software, hardware, and combinations thereof.
  • the network interface may be an Ethernet card or a wireless network card.
  • the above modules may be embedded in the hardware in the processor or in the memory in the server, or may be stored in the memory in the server, so that the processor calls the corresponding operations of the above modules.
  • the processor can be a central processing unit (CPU), a microprocessor, a microcontroller, or the like.
  • a computer device is proposed.
  • the internal structure of the computer device may correspond to the structure as shown in FIG. 1, that is, the computer device may be either a server or a terminal.
  • the searching by the processor, searching for a field area matching the field image template by using an image matching algorithm in the policy image, including: overlaying the field image template on the policy image And performing translation, the image matching method is used to calculate the similarity between the field image template and the corresponding coverage area; and the field area matching the field image template is determined according to the calculated similarity.
  • the processor before the determining the target data area on the policy image according to the field area, and extracting the target data area, the processor is further configured to perform the following steps: calculating the matched a coordinate position corresponding to the field area, where a coordinate position is a coordinate of each vertex of the field area;
  • the performing, by the processor, the information in the target data area to identify editable data information including: locating data information in the target data area;
  • the picture text recognition technology identifies the data information to obtain editable data information.
  • the policy image obtained by the processor to obtain the policy image to be entered, determining the policy type of the policy image includes: acquiring a policy image of the information to be entered, and extracting the policy The image number of the policy image; determining the policy type of the policy image according to the correspondence between the preset image number and the policy type.
  • a computer readable storage medium having stored thereon computer instructions that, when executed by a processor, implement the steps of: acquiring a policy image of information to be entered, determining a policy type of the policy image Determining, according to the policy type, a field image template corresponding to the policy image; searching, in the policy image, an image region matching the field image template by an image matching algorithm; and the policy image according to the field region Determining a corresponding target data area, extracting the target data area; identifying information in the target data area to obtain editable data information; storing the data information according to the corresponding field information, completing the information Enter.
  • the searching by the processor, searching for a field area matching the field image template by using an image matching algorithm in the policy image, including: overlaying the field image template on the policy image And performing translation, the image matching method is used to calculate the similarity between the field image template and the corresponding coverage area; and the field area matching the field image template is determined according to the calculated similarity.
  • the processor before the determining the target data area on the policy image according to the field area, and extracting the target data area, the processor is further configured to perform the following steps: calculating the matched a coordinate position corresponding to the field area, where a coordinate position is a coordinate of each vertex of the field area;
  • the performing, by the processor, the information in the target data area to identify editable data information including: locating data information in the target data area;
  • the picture text recognition technology identifies the data information to obtain editable data information.
  • the policy image obtained by the processor to obtain the policy image to be recorded, determining the policy type of the policy image includes: acquiring a policy image of the information to be entered, and extracting the image number of the policy image.
  • the policy type of the policy image is determined according to the correspondence between the preset image number and the policy type.
  • the storage medium may be a non-volatile storage medium such as a magnetic disk, an optical disk, or a read-only memory (ROM).

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

一种保单信息录入的方法,包括:获取待录入信息的保单影像,确定所述保单影像的保单类型,根据所述保单类型确定与所述保单影像对应的字段影像模板,在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域,根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域,对所述目标数据区域中的信息进行识别,得到可编辑的数据信息,将所述数据信息按照所对应的字段信息进行存储,完成信息录入。

Description

保单信息录入的方法、装置、计算机设备及存储介质
本申请要求于2017年6月23日提交中国专利局、申请号为2017104878697、发明名称为“保单信息录入的方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及计算机处理领域,特别是涉及一种保单信息录入的方法、装置、计算机设备及存储介质。
背景技术
随着保险业务的发展,越来越多的人开始进行投保,各类保单的数量也越来越多。投保的保单是通过纸质的方式进行签署的,然后通过对该保单进行扫描上传到系统进行保存,由于保单是以图片形式方式保存到系统中的,不能编辑,故不利于后续的查询。因此,为了便于后续的查找,需要将保单中的信息录入到系统,传统的保单信息录入是采用人工录入各项信息的方式,效率低下,而且耗时耗力。
发明内容
根据本申请的各种实施例,提供一种保单信息录入的方法、装置、计算机设备及存储介质。
一种保单信息录入的方法,包括:
获取待录入信息的保单影像,确定所述保单影像的保单类型;
根据所述保单类型确定与所述保单影像对应的字段影像模板;
在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字 段区域;
根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;及
对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
一种保单信息录入的装置,包括:
类型确定模块,用于获取待录入信息的保单影像,确定所述保单影像的保单类型;
模板确定模块,用于根据所述保单类型确定与所述保单影像对应的字段影像模板;
搜索模块,用于在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;
提取模块,用于根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;
识别模块,用于对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;及
录入模块,用于将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:获取待录入信息的保单影像,确定所述保单影像的保单类型;
根据所述保单类型确定与所述保单影像对应的字段影像模板;
在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;
根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;
对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;及
将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
一个或多个存储有计算机可执行指令的非易失性可读存储介质,所述计算机可执行指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:获取待录入信息的保单影像,确定所述保单影像的保单类型;
根据所述保单类型确定与所述保单影像对应的字段影像模板;
在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;
根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;及
对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中计算机设备的内部结构框图;
图2为一个实施例中保单信息录入的方法流程图;
图3为一个实施例中在保单影像中通过图像匹配算法搜索与字段影像模板匹配的字段区域的方法流程图;
图4为另一个实施例中保单信息录入的方法流程图;
图5为一个实施例中对所述目标数据区域中的信息进行识别,得到可编辑的数据信息的方法流程图;
图6为一个实施例中保单信息录入的装置结构框图;
图7为一个实施例中搜索模块的结构框图;
图8为另一个实施例中保单信息录入的装置结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
如图1所示,为一个实施例中计算机设备的内部结构示意图。该计算机设备可以是终端也可以是服务器。终端可以是个人计算机或者移动电子设备,移动电子设备包括手机、平板电脑、个人数字助理或者穿戴式设备等中的至少一种。服务器可以是独立的服务器,也可以是服务器集群。参照图1,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器、网络接口。其中,该计算机设备的非易失性存储介质可存储操作系统和计算机可读指令,该计算机可读指令被执行时,可使得处理器执行一种保单信息录入的方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该内存储器中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种保单信息录入的方法。计算机设备的网络接口用于进行网络通信。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
如图2所示,在一个实施例中,提出了一种保单信息录入的方法,该方法可以应用于终端或服务器中,具体包括以下步骤:
步骤202,获取待录入信息的保单影像,确定保单影像的保单类型。
在本实施例中,保单影像是指以图片形式存在的不能直接编辑的保单,比如,保单的扫描件、照片等。保单是保险人与投保人之间签订的一种最大诚信保险合同,保单上主要记载有保险人和被保险人的名称、保险标的、保 险金额、保险费、保险期限、赔偿或给付的责任范围以及其他规定事项。保单根据险种的不同存在多种不同的类型,所以获取到待录入信息的保单影像后,首先需要确定该保单影像的保单类型,便于后续根据保单类型确定与该保单类型对应的字段,即确定该保单类型中包括哪些字段。确定保单影像的保单类型的方式有多种,比如,可以预先设置不同保单类型存储的位置(比如,不同保单类型存储在不同的文件夹中),然后根据获取到的保单影像所在的位置就可以直接确定保单影像的保单类型。在另一个实施例中,可以根据保单影像编号来确定保单影像的保单类型,其中,保单影像编号用来唯一标识一个保单影像,可以在该保单影像编号中包含有代表保单类型的数字,比如,可以设置保单影像编号的倒数第二位代表保单类型。
步骤204,根据保单类型确定与保单影像对应的字段影像模板。
在本实施例中,确定了保单影像对应的保单类型后,就可以根据保单类型来获取与保单影像对应的字段影像模板。字段影像模板是指以字段为单位的影像。其中,字段是指保单中包含某一专题信息的内容。比如,一个保单中的“姓名”、“性别”、“出生日期”这些项就是所谓的“字段”。对于同一类保单来说,其里面包含的字段是相同的,且字段的规格也都是相同的,所以可以预先设置字段影像模板。在另一个实施例中,对于同一公司来说,即使是不同类型的保单,不同保单里面包含有相同的字段,相同字段的规格大小也往往是相同的,所以很多时候针对于相同的字段,只需要制作一个字段影像模板即可。字段影像模板的制作是通过将保单中的各个字段所在的区域单独分割开来,每个字段对应制作成字段影像模板,其中,字段影像模板采用的是矩形框图,即一个包括字段信息的矩形框。不同保单类型里面包含的字段有所不同,所以需要预先设置保单类型与字段之间的对应关系,获取到保单影像对应的保单类型后,就可以确定与该保单影像对应的字段影像模板。
步骤206,在保单影像中通过图像匹配算法搜索与字段影像模板匹配的字段区域。
在本实施例中,为了根据获取到的字段影像模板在保单影像中找到对应 的字段区域,可以通过图像匹配算法在保单影像中搜索与字段影像模板匹配的字段区域。具体地,字段影像模板是一幅已知的小图像,而且已知保单影像中存在与该字段影像模板相同尺寸和相同内容的区域,匹配的过程就是在保单影像这个大图像中找到与该小图像相同的字段区域,并确定该字段区域在保单影像中的坐标位置。举个例子,假设字段影像模板T由m×n个像素组成,保单影像S由W×H个像素组成,将字段影像模板叠放在被搜索保单影像S上并进行平移,字段影像模板覆盖被搜索的那块区域称为子图Sij,其中,i,j为子图左上角在被搜索保单影像S上的坐标。那么搜索范围是l≤i≤W-M,l≤j≤H-N。进行匹配的过程就是计算子图与字段影像模板相似度的过程,将相似度最高的子图作为匹配到的字段区域。衡量字段影像模板T和子图Sij的相似度可以采用SAD算法计算得到。SAD(Sum of absolute differences)是一种图像匹配算法。基本思想:差的绝对值之和。此算法常用于图像块匹配,将每个像素对应数值之差的绝对值求和,据此评估两个图像块的相似度,差的绝对值越小,相似度越高。
步骤208,根据字段区域在保单影像上确定对应的目标数据区域,提取目标数据区域。
在本实施例中,进行字段区域匹配的目的就是为了找到与该字段对应的目标数据区域,便于后续对目标数据区域中的信息进行识别。所以在保单影像上找到与字段影像模板匹配的字段区域后,还需要根据该字段区域在保单影像上确定对应的目标数据区域,进而提取目标数据区域。具体地,首先,确定字段区域在保单影像上的坐标位置,由于字段影像模板的形状和尺寸大小是确定的(比如,矩形,长3cm,宽1cm),匹配到的字段区域具有与该字段影像模板相同的尺寸大小,所以只需要确定该字段区域的一个角的坐标位置,就可以求得其他三个角的坐标位置,而在通过图像匹配算法确定与字段影像模板匹配的字段区域的过程中就已经确定了字段区域其中一个角的坐标位置,所以也就相当于确定了字段区域在保单影像上的坐标位置。由于字段区域与相应的目标数据区域是对应的,且目标数据区域也是有固定规格大小 的,所以根据字段区域的坐标位置和目标数据区域的规格大小,就可以计算得到目标数据区域的坐标位置,进而就可以根据目标数据区域的坐标位置提取该目标数据区域。比如,“姓名”字段,其对应的目标数据区域预先已经规定是在“姓名”字段的右边,且和“姓名”字段具有相同的宽度,比如,宽度都是1em,长度可以预先设置为5cm。所以如果确定“姓名”字段所在区域的坐标位置,就可以就算得到目标数据区域的四个角的坐标位置。
步骤210,对目标数据区域中的信息进行识别,得到可编辑的数据信息。
在本实施例中,由于提取到的目标数据区域是以图片形式存在的,所以提取到目标数据区域后,还需要对目标数据区域中的信息进行识别,以便得到可编辑的数据信息。其中,数据信息包括文字信息、数字信息以及符号信息。对目标数据区域中的信息进行识别主要分为两步,第一步,检测目标数据区域中数据信息所在的区域,即对目标数据区域中的数据信息进行定位确定相应的目标区域。第二步,对目标区域中的数据信息进行识别得到可编辑的数据信息。识别的方法可以采用现有的图片文字识别技术,比如,可以采用OCR(Optical Character Recognition,光学字符识别)方法进行识别,识别的过程就是将图片中的数据信息识别为可编辑的数据信息。
步骤212,将数据信息按照所对应的字段信息进行存储,完成信息录入。
在本实施例中,识别得到字段对应的可编辑的数据信息后,将数据信息根据对应的字段信息自动存入到相应的位置,并且将同一保单影像中的数据信息需要进行关联存储。具体地,每个保单影像都有一个保单编号,用于唯一标识该保单影像,识别得到各个字段信息对应的数据信息后,除了要将各个数据信息与其对应的字段信息进行对应存储外,还需要将同一保单影像对应的数据信息进行关联存储,从而完成信息录入。该信息录入的方法整个过程都在全自动完成,无需人工参与,即可将保单影像中的数据信息录入到系统中,不仅省时省力,而且可以并行处理多张保单影像,提高了录入的效率。
在本实施例中,通过根据保单影像的保单类型获取与保单影像对应的字段影像模板,通过字段影像模板与保单影像中的字段区域进行匹配,并确定 与字段区域对应的目标数据区域,然后将目标数据区域中的信息进行识别,得到可编辑的数据信息,然后将该数据信息自动录入到相应的位置。该方法通过自动获取保单影像中各个字段对应的目标数据区域并进行识别,然后将识别得到的数据信息进行自动录入,整个过程全自动完成,省时省力,且提高了录入的准确率和效率。
如图3所示,在一个实施例中,在保单影像中通过图像匹配算法搜索与字段影像模板匹配的字段区域的步骤206包括:
步骤206A,将字段影像模板叠放在保单影像上并按照预设的规则进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度。
在本实施例中,根据字段影像模板在保单影像上搜索与该字段影像模板匹配的字段区域,搜索的方法是通过将字段影像模板叠放在该保单影像上并按照预设的规则进行平移,每移动到一个位置,则通过图像匹配算法计算字段影像模板与之在保单影像对应的覆盖区域的相似度。其中,预设的规则是指字段影像模板每次在保单影像上平移的距离(比如,0.1mm),以及移动的方向,比如,可以进行上下平移,也可以进行左右平移。图像匹配算法可以采用现有的匹配算法,比如,SAD算法、Surf算法等。下面以SAD算法为例说明一下计算过程。首先,输入两幅图像,一幅为字段影像模板图像(称为“左图”),一幅为保单影像(称为“右图”)。其次,对字段影像模板图像进行扫描,构造一个窗口,类似于卷积核,用窗口覆盖左图,选择出窗口覆盖区域内的所有像素点,用同样大小的窗口覆盖右图并选择出覆盖区域的像素点;(3)用左图覆盖区域减去右图覆盖区域,求出所有像素点灰度差的绝对值之和;(4)然后移动右边图像的窗口,重复步骤(3)。其中,像素点灰度差的绝对值之和就是用来衡量相似度大小的量,像素点灰度差的绝对值之和越小,相应的相似度越大。
步骤206B,根据计算得到的相似度确定与字段影像模板匹配的字段区域。
在本实施例中,通过计算字段影像模板与保单影像上各个子图之间的相似度来确定与该字段影像模板匹配的字段区域,然后将相似度最高的子图作为匹配的字段区域。
如图4所示,在一个实施例中,提出了一种保单信息录入的方法,该方法包括:
步骤402,获取待录入信息的保单影像,确定保单影像的保单类型。
步骤404,根据保单类型确定与保单影像对应的字段影像模板。
步骤406,在保单影像中通过图像匹配算法搜索与字段影像模板匹配的字段区域。
步骤408,计算匹配到的字段区域对应的坐标位置,字段区域的坐标位置为字段区域的各个顶点的坐标;
步骤410,根据字段区域对应的坐标位置,按照预设的规则计算目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
步骤412,对目标数据区域中的信息进行识别,得到可编辑的数据信息。
步骤414,将数据信息按照所对应的字段信息进行存储,完成信息录入。
在本实施例中,首先,确定获取保单影像的保单类型,然后根据保单类型确定与保单影像对应的字段影像模板,进而根据字段影像模板在保单影像上搜索与之匹配的字段区域,由于在搜索的过程中是将将字段影像模板叠放在被搜索保单影像S上进行平移,字段影像模板覆盖被搜索的那块区域称为子图Sij,其中,i,j为子图左上角在被搜索保单影像S上的坐标。所以一旦确定了与之匹配的子图,也就确定了子图左上角的坐标,根据字段影像模板本身的规格形状就可以确定相应的子图的其它三个顶点坐标位置,即确定了字段区域的四个角的坐标,之后按照预设的规则计算与字段区域对应的目标数据区域所对应的四个角的坐标,具体是根据目标数据区域和字段区域的位置关系以及目标数据区域本身的形状规格大小来确定目标数据区域的各个顶点的坐标。比如,如果确定了目标数据区域为矩形框,且位于字段区域的左 边,而且目标数据区域的长和宽也是已知的,那么就可以计算得到目标数据区域的四个顶点的坐标。举个例子,假设“姓名”这个字段所在的字段区域的四个角的坐标位置为:左上角(1,1),左下角(1,0),右上角(4,1),右下角(4,0)。假设与该字段区域对应的目标数据区域是在该字段区域的右边,且该目标数据区域的规格是:宽度与字段区域相同都是1cm,长度为5cm,那么就可以计算得到目标数据区域对应的四个角的坐标分别为:左上角(4,1),左下角(4,0),右上角(9,1)、右下角(9,0)。根据计算得到目标数据区域的四个角的坐标来提取相应的目标数据区域。根据实际情况需要,目标数据区域也可以设置为其他形状,比如,三角形、六边形等。提到到目标数据区域后就可以对该目标数据区域中的数据信息进行识别,进而得到可编辑的数据信息,并将该数据信息按照对应的字段模板进行存储,从而完成保单信息的录入。
如图5所示,在一个实施例中,对目标数据区域中的信息进行识别,得到可编辑的数据信息的步骤210包括:
步骤210A,对目标数据区域中的数据信息进行定位。
在本实施例中,为了能够快速准确地识别得到目标数据区域中的数据信息,首先对目标数据区域图像中的数据信息进行定位,使被定位的数据信息包含在最小外接矩形中,即将目标数据区域中的数据信息通过一个最小外接矩形单独提取出来,得到一个目标区域图片,其中,最小外接矩形的四条边分别与数据信息的最上端、最下端、最左端以及最右端相切。后续将该包含有数据信息的目标区域图片作为识别对象。
步骤210B,采用图片文字识别技术对数据信息进行识别,得到可编辑的数据信息。
在本实施例中,通过对目标数据区域中的数据信息进行定位提取到包含有数据信息的最小外接矩形图像后,将该提取到的最小外接矩形图像作为识别对象,采用图片文字识别技术对包含的数据信息进行识别,以便得到可编辑的数据信息。其中,图片文字识别技术可以采用现有的识别方法,比如, 可以采用OCR(Optical Character Recognition,光学字符识别)方法进行识别,识别的过程就是将图片中的数据信息识别为可编辑的数据信息。在另一个实施例中,为了能够快速地对图片中的数据信息进行识别,对包含有数据信息的区域进行分割,形成若干个子图像,每个子图像中包含有部分数据信息,通过对多个子图像并行进行识别,提升了文字识别的速度。
在一个实施例中,获取待录入信息的保单影像,确定保单影像的保单类型的步骤包括:获取待录入信息的保单影像,提取保单影像的影像编号,根据预设的影像编号和保单类型之间的对应关系,确定保单影像的保单类型。
在本实施例中,影像编号用于唯一标识一个保单影像,其中,影像编号可以直接使用保单号、也可以是单独为影像分配的编号。为了能够获取到待录入信息的保单影像的保单类型,预先将影像编号和保单类型进行关联,比如,可以使用影像编号的第二位数字与保单类型进行关联,比如,如果影像编号中的第二位数字为1,代表的险种为意外险,如果第二位数字为2,代表的是车险等,通过预先设置影像编号与保单类型之间的对应关系,根据获取到的保单影像的影像编号就可以确定保单影像的保单类型。
如图6所示,在一个实施例中,提出了一种保单信息录入的装置,该装置包括:
类型确定模块602,用于获取待录入信息的保单影像,确定保单影像的保单类型;
模板确定模块604,用于根据保单类型确定与保单影像对应的字段影像模板;
搜索模块606,用于在保单影像中通过图像匹配算法搜索与字段影像模板匹配的字段区域;
提取模块608,用于根据字段区域在保单影像上确定对应的目标数据区域,提取目标数据区域;
识别模块610,用于对目标数据区域中的信息进行识别,得到可编辑的 数据信息;
录入模块612,用于将数据信息按照所对应的字段信息进行存储,完成信息录入。
如图7所示,在一个实施例中,搜索模块606包括:
计算模块606A,用于将字段影像模板叠放在保单影像上并进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度;
匹配模块606B,用于根据计算得到的相似度确定与字段影像模板匹配的字段区域。
如图8所示,在一个实施例中,上述保单信息录入的装置还包括:
坐标计算模块607,用于计算匹配到的字段区域对应的坐标位置,字段区域的坐标位置为字段区域的各个顶点的坐标;
提取模块608还用于根据字段区域对应的坐标位置,按照预设的规则计算目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
在一个实施例中,识别模块还用于对目标数据区域中的数据信息进行定位,采用图片文字识别技术对数据信息进行识别,得到可编辑的数据信息。
在一个实施例中,类型确定模块还用于获取待录入信息的保单影像,提取保单影像的影像编号,根据预设的影像编号和保单类型之间的对应关系,确定保单影像的保单类型。
上述保单信息录入的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。其中,网络接口可以是以太网卡或无线网卡等。上述各模块可以硬件形式内嵌于或独立于服务器中的处理器中,也可以以软件形式存储于服务器中的存储器中,以便于处理器调用执行以上各个模块对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
在一个实施例中,提出了一种计算机设备,计算机设备的内部结构可对应于如图1所示的结构,即该计算机设备既可以是服务器也可以是终端,其 包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取待录入信息的保单影像,确定所述保单影像的保单类型;根据所述保单类型确定与所述保单影像对应的字段影像模板;在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
在一个实施例中,所述处理器所执行的在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域,包括:将所述字段影像模板叠放在所述保单影像上并进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度;根据计算得到的相似度确定与所述字段影像模板匹配的字段区域。
在一个实施例中,在所述根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域之前,所述处理器还用于执行以下步骤:计算匹配到的所述字段区域对应的坐标位置,所述字段区域的坐标位置为字段区域的各个顶点的坐标;
所述处理器所执行的在所述保单影像上确定与所述字段区域对应的目标数据区域,提取所述目标数据区域的步骤包括:根据所述字段区域对应的坐标位置,按照预设的规则计算所述目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
在一个实施例中,所述处理器所执行的所述对所述目标数据区域中的信息进行识别,得到可编辑的数据信息,包括:对所述目标数据区域中的数据信息进行定位;采用图片文字识别技术对所述数据信息进行识别,得到可编辑的数据信息。
在一个实施例中,所述处理器所执行的所述获取待录入信息的保单影像,确定所述保单影像的保单类型,包括:获取待录入信息的保单影像,提取所 述保单影像的影像编号;根据预设的影像编号和保单类型之间的对应关系,确定所述保单影像的保单类型。
在一个实施例中,提出了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现以下步骤:获取待录入信息的保单影像,确定所述保单影像的保单类型;根据所述保单类型确定与所述保单影像对应的字段影像模板;在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
在一个实施例中,所述处理器所执行的在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域,包括:将所述字段影像模板叠放在所述保单影像上并进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度;根据计算得到的相似度确定与所述字段影像模板匹配的字段区域。
在一个实施例中,在所述根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域之前,所述处理器还用于执行以下步骤:计算匹配到的所述字段区域对应的坐标位置,所述字段区域的坐标位置为字段区域的各个顶点的坐标;
所述处理器所执行的在所述保单影像上确定与所述字段区域对应的目标数据区域,提取所述目标数据区域的步骤包括:根据所述字段区域对应的坐标位置,按照预设的规则计算所述目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
在一个实施例中,所述处理器所执行的所述对所述目标数据区域中的信息进行识别,得到可编辑的数据信息,包括:对所述目标数据区域中的数据信息进行定位;采用图片文字识别技术对所述数据信息进行识别,得到可编辑的数据信息。
在一个实施例中,所述处理器所执行的所述获取待录入信息的保单影像,确定所述保单影像的保单类型,包括:获取待录入信息的保单影像,提取所述保单影像的影像编号;根据预设的影像编号和保单类型之间的对应关系,确定所述保单影像的保单类型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (20)

  1. 一种保单信息录入的方法,包括:
    获取待录入信息的保单影像,确定所述保单影像的保单类型;
    根据所述保单类型确定与所述保单影像对应的字段影像模板;
    在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;
    根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;
    对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;及
    将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
  2. 根据权利要求1所述的方法,其特征在于,所述在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域,包括:
    将所述字段影像模板叠放在所述保单影像上并按照预设的规则进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度;
    根据计算得到的相似度确定与所述字段影像模板匹配的字段区域。
  3. 根据权利要求1所述的方法,其特征在于,在所述根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域之前,还包括:
    计算匹配到的所述字段区域对应的坐标位置,所述字段区域的坐标位置为字段区域的各个顶点的坐标;
    在所述保单影像上确定与所述字段区域对应的目标数据区域,提取所述目标数据区域的步骤包括:
    根据所述字段区域对应的坐标位置,按照预设的规则计算所述目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
  4. 根据权利要求1所述的方法,其特征在于,所述对所述目标数据区域中的信息进行识别,得到可编辑的数据信息,包括:
    对所述目标数据区域中的数据信息进行定位;
    采用图片文字识别技术对所述数据信息进行识别,得到可编辑的数据信息。
  5. 根据权利要求1所述的方法,其特征在于,所述获取待录入信息的保单影像,确定所述保单影像的保单类型,包括:
    获取待录入信息的保单影像,提取所述保单影像的影像编号;
    根据预设的影像编号和保单类型之间的对应关系,确定所述保单影像的保单类型。
  6. 一种保单信息录入的装置,包括:
    类型确定模块,用于获取待录入信息的保单影像,确定所述保单影像的保单类型;
    模板确定模块,用于根据所述保单类型确定与所述保单影像对应的字段影像模板;
    搜索模块,用于在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;
    提取模块,用于根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;
    识别模块,用于对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;及
    录入模块,用于将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
  7. 根据权利要求6所述的装置,其特征在于,所述搜索模块包括:
    计算模块,用于将所述字段影像模板叠放在所述保单影像上并按照预设的规则进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度;
    匹配模块,用于根据计算得到的相似度确定与所述字段影像模板匹配的 字段区域。
  8. 根据权利要求6所述的装置,其特征在于,所述装置还包括:
    坐标计算模块,用于计算匹配到的所述字段区域对应的坐标位置,所述字段区域的坐标位置为字段区域的各个顶点的坐标;
    所述提取模块还用于根据所述字段区域对应的坐标位置,按照预设的规则计算所述目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
  9. 根据权利要求6所述的装置,其特征在于,所述识别模块还用于对所述目标数据区域中的数据信息进行定位,采用图片文字识别技术对所述数据信息进行识别,得到可编辑的数据信息。
  10. 根据权利要求6所述的装置,其特征在于,所述类型确定模块还用于获取待录入信息的保单影像,提取所述保单影像的影像编号,根据预设的影像编号和保单类型之间的对应关系,确定所述保单影像的保单类型。
  11. 一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
    获取待录入信息的保单影像,确定所述保单影像的保单类型;
    根据所述保单类型确定与所述保单影像对应的字段影像模板;
    在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;
    根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;
    对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;及
    将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
  12. 根据权利要求11所述的计算机设备,其特征在于,所述在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域,包括:
    将所述字段影像模板叠放在所述保单影像上并按照预设的规则进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度;
    根据计算得到的相似度确定与所述字段影像模板匹配的字段区域。
  13. 根据权利要求11所述的计算机设备,其特征在于,在所述根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域之前,所述处理器还用于执行以下步骤:
    计算匹配到的所述字段区域对应的坐标位置,所述字段区域的坐标位置为字段区域的各个顶点的坐标;
    在所述保单影像上确定与所述字段区域对应的目标数据区域,提取所述目标数据区域的步骤包括:
    根据所述字段区域对应的坐标位置,按照预设的规则计算所述目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
  14. 根据权利要求11所述的计算机设备,其特征在于,所述对所述目标数据区域中的信息进行识别,得到可编辑的数据信息,包括:
    对所述目标数据区域中的数据信息进行定位;
    采用图片文字识别技术对所述数据信息进行识别,得到可编辑的数据信息。
  15. 根据权利要求11所述的计算机设备,其特征在于,所述获取待录入信息的保单影像,确定所述保单影像的保单类型,包括:
    获取待录入信息的保单影像,提取所述保单影像的影像编号;
    根据预设的影像编号和保单类型之间的对应关系,确定所述保单影像的保单类型。
  16. 一个或多个存储有计算机可执行指令的非易失性可读存储介质,所述计算机可执行指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:
    获取待录入信息的保单影像,确定所述保单影像的保单类型;
    根据所述保单类型确定与所述保单影像对应的字段影像模板;
    在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域;
    根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域;
    对所述目标数据区域中的信息进行识别,得到可编辑的数据信息;及
    将所述数据信息按照所对应的字段信息进行存储,完成信息录入。
  17. 根据权利要求16所述的非易失性可读存储介质,其特征在于,所述在所述保单影像中通过图像匹配算法搜索与所述字段影像模板匹配的字段区域,包括:
    将所述字段影像模板叠放在所述保单影像上并按照预设的规则进行平移,通过图像匹配算法计算字段影像模板与相应的覆盖区域的相似度;
    根据计算得到的相似度确定与所述字段影像模板匹配的字段区域。
  18. 根据权利要求16所述的非易失性可读存储介质,其特征在于,在所述根据所述字段区域在所述保单影像上确定对应的目标数据区域,提取所述目标数据区域之前,所述处理器还用于执行以下步骤:
    计算匹配到的所述字段区域对应的坐标位置,所述字段区域的坐标位置为字段区域的各个顶点的坐标;
    在所述保单影像上确定与所述字段区域对应的目标数据区域,提取所述目标数据区域的步骤包括:
    根据所述字段区域对应的坐标位置,按照预设的规则计算所述目标数据区域对应的坐标位置,根据计算得到的目标数据区域对应的坐标位置提取相应的目标数据区域。
  19. 根据权利要求16所述的非易失性可读存储介质,其特征在于,所述对所述目标数据区域中的信息进行识别,得到可编辑的数据信息,包括:
    对所述目标数据区域中的数据信息进行定位;
    采用图片文字识别技术对所述数据信息进行识别,得到可编辑的数据信 息。
  20. 根据权利要求16所述的非易失性可读存储介质,其特征在于,所述获取待录入信息的保单影像,确定所述保单影像的保单类型,包括:
    获取待录入信息的保单影像,提取所述保单影像的影像编号;
    根据预设的影像编号和保单类型之间的对应关系,确定所述保单影像的保单类型。
PCT/CN2017/100057 2017-06-23 2017-08-31 保单信息录入的方法、装置、计算机设备及存储介质 WO2018233055A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710487869.7 2017-06-23
CN201710487869.7A CN107688772B (zh) 2017-06-23 2017-06-23 保单信息录入的方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
WO2018233055A1 true WO2018233055A1 (zh) 2018-12-27

Family

ID=61152701

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/100057 WO2018233055A1 (zh) 2017-06-23 2017-08-31 保单信息录入的方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN107688772B (zh)
WO (1) WO2018233055A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110764721A (zh) * 2019-09-19 2020-02-07 北京三快在线科技有限公司 模板生成方法、装置、电子设备和计算机可读介质
CN111159201A (zh) * 2019-12-31 2020-05-15 上海亿保健康管理有限公司 数据录入方法、装置和设备
CN111199570A (zh) * 2019-12-31 2020-05-26 贵阳朗玛信息技术股份有限公司 一种可多次发布信息的打码方法及系统
CN111813773A (zh) * 2020-04-22 2020-10-23 深圳市科陆电子科技股份有限公司 一种电网抄表数据存储方法、上传方法、装置和存储装置
CN111882429A (zh) * 2020-07-28 2020-11-03 中国银行股份有限公司 一种银行系统字段长度分段方法和装置
CN115034876A (zh) * 2022-05-26 2022-09-09 重庆银行股份有限公司 基于ocr识别技术的贷款信息审核方法、装置及计算机设备

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563618A (zh) * 2018-03-15 2018-09-21 链家网(北京)科技有限公司 一种纸质文件线上化方法和系统
CN108710880A (zh) * 2018-05-16 2018-10-26 深圳市众信电子商务交易保障促进中心 一种数据抓取方法及终端
CN110633457B (zh) * 2018-06-22 2023-05-26 广州金山移动科技有限公司 一种内容替换方法、装置、电子设备及可读存储介质
CN109034735A (zh) * 2018-07-10 2018-12-18 安心财产保险有限责任公司 电子保单生成方法、装置、设备及存储介质
CN109544389A (zh) * 2018-11-29 2019-03-29 爱保科技(横琴)有限公司 基于保单的智能分析系统
CN109783781B (zh) * 2018-12-13 2023-08-11 中国平安财产保险股份有限公司 基于图像识别的保单录入方法和相关装置
CN109840469B (zh) * 2018-12-13 2023-10-24 中国平安财产保险股份有限公司 基于图像识别的保单录入方法和相关装置
CN109918679B (zh) * 2019-03-22 2023-04-11 成都晟堃科技有限责任公司 一种解析纸质保单数据的方法
CN110245530B (zh) * 2019-05-27 2023-03-07 苏州迈洛智能系统有限公司 一种条码信息录入方法、装置及存储介质
CN110490190B (zh) * 2019-07-04 2021-10-26 贝壳技术有限公司 一种结构化图像文字识别方法及系统
CN110362802A (zh) * 2019-07-18 2019-10-22 中国工商银行股份有限公司 用于将单据信息录入系统的方法、装置、计算设备、介质
CN110599338A (zh) * 2019-08-13 2019-12-20 上海陆家嘴国际金融资产交易市场股份有限公司 交易数据处理方法、装置、计算机设备和存储介质
CN110942069A (zh) * 2019-10-22 2020-03-31 云南大学 车险保单的关键信息提取方法、装置、存储介质及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101469986A (zh) * 2007-12-27 2009-07-01 鸿富锦精密工业(深圳)有限公司 模糊边界的自动寻点系统及方法
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101469986A (zh) * 2007-12-27 2009-07-01 鸿富锦精密工业(深圳)有限公司 模糊边界的自动寻点系统及方法
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110764721A (zh) * 2019-09-19 2020-02-07 北京三快在线科技有限公司 模板生成方法、装置、电子设备和计算机可读介质
CN111159201A (zh) * 2019-12-31 2020-05-15 上海亿保健康管理有限公司 数据录入方法、装置和设备
CN111199570A (zh) * 2019-12-31 2020-05-26 贵阳朗玛信息技术股份有限公司 一种可多次发布信息的打码方法及系统
CN111813773A (zh) * 2020-04-22 2020-10-23 深圳市科陆电子科技股份有限公司 一种电网抄表数据存储方法、上传方法、装置和存储装置
CN111882429A (zh) * 2020-07-28 2020-11-03 中国银行股份有限公司 一种银行系统字段长度分段方法和装置
CN111882429B (zh) * 2020-07-28 2023-08-18 中国银行股份有限公司 一种银行系统字段长度分段方法和装置
CN115034876A (zh) * 2022-05-26 2022-09-09 重庆银行股份有限公司 基于ocr识别技术的贷款信息审核方法、装置及计算机设备

Also Published As

Publication number Publication date
CN107688772A (zh) 2018-02-13
CN107688772B (zh) 2019-12-17

Similar Documents

Publication Publication Date Title
WO2018233055A1 (zh) 保单信息录入的方法、装置、计算机设备及存储介质
US12019675B2 (en) Recognizing text in image data
CN109492643B (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN111476227B (zh) 基于ocr的目标字段识别方法、装置及存储介质
CN110348294B (zh) Pdf文档中图表的定位方法、装置及计算机设备
RU2651144C2 (ru) Ввод данных с изображений документов с фиксированной структурой
WO2019169772A1 (zh) 图片处理方法、电子装置及存储介质
ES2609953T3 (es) Procedimiento de recorte de imágenes de texto
EP3940589B1 (en) Layout analysis method, electronic device and computer program product
WO2021017272A1 (zh) 病理图像标注方法、装置、计算机设备及存储介质
WO2018233171A1 (zh) 单证信息录入的方法、装置、计算机设备及存储介质
WO2021051527A1 (zh) 基于图像分割的文字定位方法、装置、设备及存储介质
CN112396047B (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN114463567A (zh) 一种基于区块链的智慧教育作业大数据防抄袭方法与系统
CN110796145B (zh) 基于智能决策的多证件分割关联方法及相关设备
WO2020232866A1 (zh) 扫描文本分段方法、装置、计算机设备和存储介质
CN115205113A (zh) 一种图像拼接方法、装置、设备及存储介质
CN114494751A (zh) 证照信息识别方法、装置、设备及介质
CN113780116A (zh) 发票分类方法、装置、计算机设备和存储介质
CN112308057A (zh) 一种基于文字位置信息的ocr优化方法及系统
CN114220103B (zh) 图像识别方法、装置、设备及计算机可读存储介质
CN116030472A (zh) 文字坐标确定方法及装置
CN116092100A (zh) 文本内容提取方法及装置
Heitzler et al. A modular process to improve the georeferencing of the Siegfried map
TWI384418B (zh) 採用區域架構之影像處理方法及系統

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17914332

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17914332

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 14/05/2020)

122 Ep: pct application non-entry in european phase

Ref document number: 17914332

Country of ref document: EP

Kind code of ref document: A1