WO2021174869A1 - 用户图片数据的处理方法、装置、计算机设备及存储介质 - Google Patents

用户图片数据的处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2021174869A1
WO2021174869A1 PCT/CN2020/122784 CN2020122784W WO2021174869A1 WO 2021174869 A1 WO2021174869 A1 WO 2021174869A1 CN 2020122784 W CN2020122784 W CN 2020122784W WO 2021174869 A1 WO2021174869 A1 WO 2021174869A1
Authority
WO
WIPO (PCT)
Prior art keywords
picture data
user
data
types
user picture
Prior art date
Application number
PCT/CN2020/122784
Other languages
English (en)
French (fr)
Inventor
纪其进
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2021174869A1 publication Critical patent/WO2021174869A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Definitions

  • This application relates to the field of artificial intelligence machine learning technology, and in particular to a method, device, computer equipment and storage medium for processing user picture data.
  • the platform requires users to upload images of ID cards, but users upload pictures of invoices, and the platform requires users to The invoice picture is uploaded, but the user uploads the medical history picture.
  • the necessary materials that are actually needed are missing due to the wrong upload of the image channel.
  • the inventor realizes that it is necessary to propose a technical solution to solve the problem of low efficiency in manually reviewing a large number of image data through the background when users upload data to the platform server through pictures.
  • this application proposes a method, device, computer equipment, and storage medium for processing user picture data, which can perform real-time authentication on user picture data, and
  • this application proposes a method for processing user picture data, the method includes:
  • this application also discloses a device for processing user picture data, and the device for processing user picture data includes:
  • the definition check module is used to preprocess the picture data uploaded by the user terminal to delete part of the picture data whose definition does not meet the preset conditions;
  • the intelligent sorting module is used to sort the preprocessed user picture data through the classifier to obtain M types of user picture data;
  • An authenticity check module configured to perform authenticity check on the M types of user picture data to obtain the authenticity check result corresponding to each type of the sorted user picture data;
  • the result output module is used to store the corresponding user picture data when the authenticity check result meets the preset condition, and when the authenticity check result does not meet the preset condition, delete the corresponding user picture data and Send a notification message to the client.
  • the present application also provides a computer device, including a memory, a processor, and a computer program stored in the memory and running on the processor, and the processor implements the foregoing method when the computer program is executed. A step of.
  • the present application also provides a computer-readable storage medium on which a computer program is stored, and the computer program implements the steps of the foregoing method when the computer program is executed by a processor.
  • the user picture data processing method, device, computer equipment, and storage medium in the embodiments of the present application automatically classify the user picture data that meets the conditions by using machine learning, and then perform the actual classification of the classified pictures. False verification can perform instant identification of the user's picture data and feed it back to the user side for modification, which improves the efficiency of the server side in processing user data on the user side.
  • Fig. 1 is a schematic diagram of an application environment of an embodiment of the application
  • FIG. 2 is a schematic flowchart of a method for processing user picture data according to Embodiment 1 of the application;
  • FIG. 3 is a schematic diagram of the process of preprocessing the image data uploaded by the user terminal in FIG. 2;
  • FIG. 4 is a schematic diagram of the process of training a classifier through a deep learning network in FIG. 2 and sorting pre-processed user image data by the classifier;
  • FIG. 5 is a schematic flowchart of the authenticity check performed on the sorted user picture data in FIG. 2 to obtain the authenticity check result;
  • FIG. 6 is a schematic diagram 2 of a flow chart of a method for processing user picture data in Embodiment 1 of this application;
  • FIG. 7 is a schematic diagram of program modules of Embodiment 2 of a processing device for user picture data of this application;
  • FIG. 8 is a schematic diagram of the hardware structure of the third embodiment of the computer equipment of this application.
  • FIG. 1 a schematic diagram of an implementation environment of an embodiment of the present application is shown.
  • the implementation environment includes: a client 10 and a server 12.
  • the user terminal 10 is an electronic device with a network access function, and the device may be a smart phone, a tablet computer, a personal computer, or the like.
  • the user terminal 10 is installed with a program 11 that can access the server 12, and the user can perform specific operations and input on the server 12 after logging in to the server 12 through the account and password in the program 11.
  • the server 12 is a server, a server cluster composed of several servers, or a cloud computing center.
  • the program 13 is stored in the server 12.
  • the program 13 includes a front-end module and a back-end module.
  • the front-end module and the back-end module can call each other through an interface.
  • the user logs in through the account and password in the program 11 or logs in through the account and password to access the program of the server 12 After 13, you can perform specific operations and inputs on program 13.
  • the user terminal 10 and the server 12 are connected through a network, and the network may include multiple network nodes, and the network may be the Internet, a local area network, or a blockchain network.
  • the method for processing user picture data in the embodiment of this application can be applied to program 11 or program 13 alone, can also be applied to program 11 and program 13 in a distributed manner, or stored in multiple nodes of the network in the form of a blockchain middle.
  • the method for processing user picture data in this embodiment uses the specialization information of the data itself and performs feature screening in the existing feature generation methods or tool automatic feature generation process, which reduces the transmission and error of the feature generation process. Accumulation improves the quality and accuracy of machine learning output data.
  • factor analysis can reduce the generation of a large number of strongly correlated object features, and filtering in the process of generating object features can delete the process The invalid and strongly related object features generated in the, avoiding subsequent reuse of the object features to generate more invalid features.
  • the method for processing front-end and back-end user picture data in this embodiment includes the following steps:
  • Step S100 Generate page data, and deliver the page data to the user side when receiving the user side request instruction, so that the user side renders the page data to generate a user image data submission page.
  • page data is first generated, and when a client request is received, the page data is delivered to the user terminal, wherein the page data is rendered on the user terminal to generate a user page, Used by users to submit user data;
  • step S200 the picture data uploaded by the user terminal is preprocessed to delete part of the picture data whose definition does not meet the preset condition.
  • Preprocessing is to detect the sharpness of the picture to prevent the unrecognizable fuzzy picture from being uploaded and unable to perform subsequent classification operations.
  • Step S200 includes:
  • Step S210 Randomly perform N ROI (region of interest, region of interest) operations on the picture to obtain N slices.
  • ROI is used in machine vision and image processing to outline the area that needs to be processed from the processed image in the form of boxes, circles, ellipses, irregular polygons, etc., called the region of interest.
  • the ROI operation is performed by a specific tool, such as Various operators and functions are commonly used in machine vision software such as Halcon, OpenCV, and Matlab to calculate the ROI of the region of interest, and perform the next step of processing the image.
  • Step S220 Calculate the sharpness of the N slices respectively to obtain N sharpness scores
  • different sharpness detection algorithms are executed on different slices. In other embodiments, only one detection algorithm may be used.
  • Step S230 Calculate the average value of the N sharpness scores to obtain the sharpness value L of the picture
  • Step S240 save the picture when the sharpness value L is higher than a preset threshold, delete the picture when the sharpness value L is lower than the preset threshold, and send a prompt notification to the user terminal;
  • the ROI area is randomly taken from the input image, and the operation is performed 10 times, and a total of 10 small ROI slices are generated. Then, the Brenner, Tenengrad, Variance, Laplacian, and Volath algorithms are used to calculate the sharpness score for each slice. Each algorithm can generate 10 scores on 10 slices. We use the median of the 10 scores as the final score of the algorithm. If the final score is higher than the sharpness threshold of this type of algorithm, the image is considered clear, otherwise the image is considered Vague.
  • the threshold can be self-defined, or it can be obtained by taking the median value based on the results of the default thresholds corresponding to different image definition quality algorithms. For example, out of a total of 5 algorithms, 3 or more methods consider the If the image is clear, it is judged that the image is clear, otherwise it is judged that the image is blurred.
  • S300 Sort the preprocessed user picture data through the classifier to obtain M types of user picture data.
  • the pre-processed pictures are all pictures whose definition meets the preset conditions, and they are stored in the preset location of the platform server, and the pictures are classified and trained through machine learning to realize the automatic sorting of pictures.
  • Step S300 includes:
  • Step S310 Collect multiple different types of pictures and pre-classify them to obtain M types of picture training data of a preset classification model.
  • the deep learning network resnet50 is used to train the classifier.
  • the ID card pictures include the front and back sides, and the other types of pictures are pictures outside the first three types, which are a combination of natural scenes and open source data sets.
  • Step S320 Perform a preset type of data enhancement calculation on the M types of image training data
  • the data enhancement method uses a random combination of five data enhancement methods.
  • the five data enhancement methods include random small-angle rotation within a range, random horizontal direction, and vertical direction.
  • Step S330 Convert the M types of picture training data into training pictures of a preset size and train the preset classification model.
  • the input size of the resnet50 training classifier is set to 224*224.
  • the new short-side length must be less than or equal to 224 length.
  • the fixed pixel value is obtained by calculating the average value of the RGB channels of all images in the training set, for example [155,155,155] , And finally achieve the goal of 224 short sides.
  • Step S340 Calculate the classification confidence probability of the preprocessed image data through the preset classification model, and when the classification confidence probability is greater than the preset classification confidence, combine the preprocessed image data Move to the channel position of the corresponding type in the pre-classification model to obtain the M types of user picture data.
  • Step S400 Perform an authenticity check on the M types of user picture data to obtain an authenticity check result corresponding to each type of the sorted user picture data.
  • step S400 the authenticity check is performed on the M types of user picture data to obtain the authenticity check results corresponding to each type of the sorted user picture data including:
  • Step S410 collecting multiple types of true and false pictures to perform two-classification training on the deep learning network training classifier
  • Step S420 Collect multiple types of true and false pictures to perform two-classification training on the deep learning network training classifier.
  • Step S500 when the authenticity check result meets a preset condition, store the corresponding user picture data, and when the authenticity check result does not meet the preset condition, delete the corresponding user picture data and send it to the user The end sends a notification message.
  • the uploaded invoice must be an original image, not a photocopy or print image.
  • the deep learning network resnet50 is used to train the classifier, and the number of output channels of resnet50 is changed from 1000 to 2.
  • data enhancement is performed on the training set, including random small-angle rotation within a range, image blurring, random brightness adjustment within a range, random saturation adjustment within a range, and RGB channel disturbance and reorganization. These five methods are randomly combined, through Set the input size of the model to 224*224. The method of converting an image of any size into 224*224 is similar to that of automatic sorting. If it is determined that the image uploaded by the user is not a valid image, the user is prompted to upload again.
  • FIG. 6 is a schematic flow diagram of the second embodiment of the user picture data processing method according to the first embodiment of this application.
  • the following steps are further included. In other embodiments, these steps may not be included:
  • Step S600 Store the corresponding user picture data when the authenticity check result meets the preset condition.
  • Step S700 When the authenticity check result does not meet a preset condition, delete the corresponding user picture data and send the notification message to the user terminal.
  • the notification message may be a unified reminder that the user has failed to upload pictures, or it may be based on different types of errors, such as insufficient clarity, failing authenticity check, failing relevance check, picture channel upload error, etc. , Customize the content of the notification message that cannot be communicated, so that you can work 24 hours a day and provide timely feedback. Compared with manual work, this will undoubtedly greatly increase business volume and improve business efficiency, while also improving user experience and gaining user favor.
  • the corresponding summary information is obtained based on the stored user picture data.
  • the summary information is obtained by hashing the stored user picture data, for example, obtained by processing the sha256s algorithm.
  • Uploading summary information to the blockchain can ensure its security and fairness and transparency to users.
  • the user equipment can download the summary information from the blockchain to verify whether the stored user picture data has been tampered with.
  • the blockchain referred to in this example is a new application mode of computer technology such as distributed data storage, point-to-point transmission, consensus mechanism, and encryption algorithm.
  • Blockchain essentially a decentralized database, is a series of data blocks associated with cryptographic methods. Each data block contains a batch of network transaction information for verification. The validity of the information (anti-counterfeiting) and the generation of the next block.
  • the blockchain can include the underlying platform of the blockchain, the platform product service layer, and the application service layer.
  • the user data processing method of this embodiment automatically classifies user picture data that meets the conditions by using machine learning, and then performs authenticity verification on the classified pictures respectively, which can perform instant identification of the user’s picture data and feed it back to Modifications on the user side improve the efficiency of the server for processing user data on the user side.
  • the quality inspection stage through algorithm intervention, good quality samples are accepted, and poor quality samples are excluded.
  • the quality of the image can be checked at the source, and at the same time, it is avoided that the quality is found to be unqualified and returned to the user for resubmission. wait.
  • the sorting stage the images input by the user can be classified in the background, and the input images can be classified into the correct channel. This process avoids complex and tedious manual intervention, saves a lot of labor costs, and also improves Improve the user experience.
  • the stage of invoice verification it can automatically determine whether the invoice meets the conditions through the model-fitting model, which saves manual verification work, saves labor costs, and avoids the risk of false information.
  • algorithm identification can be used to further improve the accuracy of claims settlement materials and reduce the labor burden. Because the algorithm has a fast reasoning speed, high accuracy rate, and can work 24 hours a day, compared with manual work, this will undoubtedly greatly increase business volume, improve business efficiency, and also improve user experience.
  • FIG. 7 shows a schematic diagram of program modules of the device for processing user picture data of the present application.
  • the device 20 for processing user picture data may include or be divided into one or more program modules, one or more program modules are stored in a storage medium and executed by one or more processors,
  • the program module referred to in the embodiments of the present application refers to a series of computer program instruction segments that can complete specific functions, and is more suitable than the program itself to describe the execution process of the user image data processing device 20 in the storage medium. The following description will specifically introduce the functions of each program module in this embodiment:
  • the definition checking module 202 is used to preprocess the picture data uploaded by the user terminal to delete part of the picture data whose definition does not meet the preset condition;
  • the intelligent sorting module 204 is used to sort the preprocessed user picture data through the classifier to obtain M types of user picture data;
  • the authenticity check module 206 is configured to perform authenticity check on the M types of user picture data to obtain the authenticity check result corresponding to each type of the sorted user picture data;
  • the result output module 208 is configured to store the corresponding user picture data when the authenticity check result meets a preset condition, and delete the corresponding user picture data when the authenticity check result does not meet the preset condition And send a notification message to the client.
  • the computer device 2 is a device that can automatically perform numerical calculation and/or information processing in accordance with pre-set or stored instructions.
  • the computer device 2 may be a rack server, a blade server, a tower server, or a cabinet server (including an independent server or a server cluster composed of multiple servers).
  • the computer device 2 at least includes, but is not limited to, a memory 21, a processor 22, a network interface 23, and a processing device 20 for user picture data that can be connected to each other in communication via a system bus.
  • the processor 22 implements a method for processing user picture data when the processor 22 executes the computer program, and the method specifically includes the following steps:
  • Step S100 preprocessing the picture data uploaded by the user terminal to delete part of the picture data whose definition does not meet the preset condition
  • Step S200 sorting the preprocessed user picture data through a classifier to obtain M types of user picture data
  • Step S300 Perform an authenticity check on the M types of user picture data to obtain an authenticity check result corresponding to each type of the sorted user picture data;
  • Step S400 when the authenticity check result meets a preset condition, store the corresponding user picture data, and when the authenticity check result does not meet the preset condition, delete the corresponding user picture data and send it to the user The end sends a notification message.
  • the memory 21 includes at least one type of computer-readable storage medium, and the readable storage medium includes flash memory, hard disk, multimedia card, card-type memory (for example, SD or DX memory, etc.), random access memory ( RAM), static random access memory (SRAM), read only memory (ROM), electrically erasable programmable read only memory (EEPROM), programmable read only memory (PROM), magnetic memory, magnetic disks, optical disks, etc.
  • the memory 21 may be an internal storage unit of the computer device 2, for example, the hard disk or memory of the computer device 2.
  • the memory 21 may also be an external storage device of the computer device 2, such as a plug-in hard disk, a smart media card (SMC), and a secure digital (Secure Digital, SMC) equipped on the computer device 2. SD) card, flash card (Flash Card), etc.
  • the memory 21 may also include both the internal storage unit of the computer device 2 and its external storage device.
  • the memory 21 is generally used to store an operating system and various application software installed in the computer device 2, for example, the program code of the user picture data processing device 20 described in the foregoing embodiment.
  • the memory 21 can also be used to temporarily store various types of data that have been output or will be output.
  • the processor 22 may be a central processing unit (Central Processing Unit, CPU), a controller, a microcontroller, a microprocessor, or other data processing chips.
  • the processor 22 is generally used to control the overall operation of the computer device 2.
  • the processor 22 is used to run the program code or processing data stored in the memory 21, for example, to run the processing device 20 for user picture data, so as to implement the user picture data processing method of the above-mentioned embodiment.
  • the network interface 23 may include a wireless network interface or a wired network interface, and the network interface 23 is generally used to establish a communication connection between the computer device 2 and other electronic devices.
  • the network interface 23 is used to connect the computer device 2 with an external terminal through a network, and establish a data transmission channel and a communication connection between the computer device 2 and the external terminal.
  • the network may be Intranet, Internet, Global System of Mobile Communication (GSM), Wideband Code Division Multiple Access (WCDMA), 4G network, 5G Network, Bluetooth (Bluetooth), Wi-Fi and other wireless or wired networks.
  • Fig. 8 only shows the computer device 2 with components 20-23, but it should be understood that it is not required to implement all the components shown, and more or fewer components may be implemented instead.
  • the device 20 for processing user picture data stored in the memory 21 may also be divided into one or more program modules, and the one or more program modules are stored in the memory 21 and configured by One or more processors (the processor 22 in this embodiment) are executed to complete the application.
  • the computer-readable storage medium may be non-volatile or volatile, such as flash memory, hard disk, multimedia card, card-type memory (for example, SD or DX). Memory, etc.), random access memory (RAM), static random access memory (SRAM), read only memory (ROM), electrically erasable programmable read only memory (EEPROM), programmable read only memory (PROM), magnetic memory , Magnetic disks, optical disks, servers, App application malls, etc., on which computer programs are stored, and the corresponding functions are realized when the programs are executed by the processor.
  • the computer-readable storage medium of this embodiment is used for the processing device 20 for storing user picture data, and when executed by the processor 22, realizes a method for processing user picture data. The method specifically includes the following steps:
  • Step S100 preprocessing the picture data uploaded by the user terminal to delete part of the picture data whose definition does not meet the preset condition
  • Step S200 sorting the preprocessed user picture data through a classifier to obtain M types of user picture data
  • Step S300 Perform an authenticity check on the M types of user picture data to obtain an authenticity check result corresponding to each type of the sorted user picture data;
  • Step S400 when the authenticity check result meets a preset condition, store the corresponding user picture data, and when the authenticity check result does not meet the preset condition, delete the corresponding user picture data and send it to the user The end sends a notification message.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Accounting & Taxation (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

一种用户图片数据的处理方法、装置、计算机设备及存储介质,包括:生成页面数据,并在接收到用户端请求指令时将所述页面数据下发至所述用户端(S100);对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据(S200);对预处理后的用户图片数据通过分类器进行分拣以得到M种类型用户图片数据(S300);对所述M种类型用户图片数据进行真伪度检验以得到每种类型用户图片数据对应的真伪度校验结果(S400);当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息(S500)。上述方法可以对用户的图片数据执行即时鉴别,并反馈给用户端进行修改,提高了服务端处理用户端用户数据的效率。上述方法涉及区块链领域,适用于智慧医疗、智慧政务、科技金融等领域。

Description

用户图片数据的处理方法、装置、计算机设备及存储介质
本申请要求于2020年9月2日提交中国专利局、申请号为202010908098.6,发明名称为“用户图片数据的处理方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及涉及人工智能机器学习技术领域,尤其涉及一种用户图片数据的处理方法、装置、计算机设备及存储介质。
背景技术
随着技术的发展,用户向网络平台提交信息时,往往通过拍照的方式将资料转换成图片,然后通过用户端程序,例如电脑浏览器软件或手机应用程序,将图片上传至网络平台服务器,从而减少用户提交资料的时间,增加效率来提高用户体验。但这种方法,虽然减少了用户提交资料的时间,却增加了网络平台后台审核的工作量,如果用户的资料有误,就会导致用户提交的信息不能即时审核通过,需要不断修改确认,从而延长了用户获取服务的时效,反而降低了用户体验,特别是在对一些对服务时效性和资料准确性要求都很高的应用场景中,这种问题就尤为突出。
例如,在医疗健康保险理赔业务场景中,为了能够快速完成理赔,提升用户体验,很多保险公司都开发了线上受理、线上理赔业务。通常,用户只需要将相关材料如个人信息,病例,费用清单等,以拍照的方式上传至线上平台,即可完成受理和赔付,这无疑大大方便了用户,然而,用户在上传资料时,往往会发生用户上传的资料错误的情形,例如发票并非本人发票、上传的病史和发票不匹配、有虚假发票、拍摄照片模糊曝光失败等问题。另一方面,由于一些用户对电脑、手机知识的掌握程度有限,或者没有看清上传要求按照规定上传指定的图片,比如,平台需要用户上传身份证图片,但是用户上传了发票图片,平台要求用户上传了发票图片,但是用户上传了病史图片,同时也会因为错误上传影像道而导致实际需要的必传材料缺失。上述的这些问题都会增加后台人工处理的人力,延长了理赔审核的时效,往往还需要与客户反复电话沟通补充提交材料,使得客户体验效果也较差。
为此,针对这些问题,发明人意识到,需要提出一种技术方案,来解决用户通过图片上传资料至平台服务器时,平台工作人员通过后台人工审核大量图片资料效率低下的问题。
发明内容
有鉴于此,本申请提出一种用户图片数据的处理方法、装置、计算机设备及存储介质,能够在用户的图片数据执行即时鉴别,并
反馈给用户端进行修改,提高了服务端处理用户端用户数据的效率。
首先,为实现上述目的,本申请提出一种用户图片数据的处理方法,所述方法包括:
对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;
对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据;
对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息。
为了实现上述目的,本申请还公开了一种用户图片数据的处理装置,所述用户图片数据的处理装置包括:
清晰度检验模块,用于对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;用于
智能分拣模块,用于对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据;
真伪度校验模块,用于对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
结果输出模块,用于当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时,删除对应的用户图片数据并向所述用户端发送通知消息。
为了实现上述目的,本申请还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本申请还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
相较于传统技术,本申请实施例的用户图片数据的处理方法、装置、计算机设备及存储介质,通过利用机器学习对符合条件的用户图片数据进行自动分类,然后对分类后的图片分别进行真伪校验,可以对用户的图片数据执行即时鉴别,并反馈给用户端进行修改,提高了服务端处理用户端用户数据的效率。
附图说明
图1为本申请实施例的应用环境示意图;
图2为本申请实施例一的用户图片数据的处理方法的流程示意图;
图3为图2中对用户端上传的图片数据进行预处理的流程示意图;
图4为图2中通过深度学习网络训练分类器并对预处理后的用户图片数据通过所述分类器进行分拣的流程示意图;
图5为图2中对分拣后的所述用户图片数据进行真伪度检验以得到真伪度校验结果的流程示意图;
图6为本申请实施例一的用户图片数据的处理方法的流程示意图二;
图7为本申请用户图片数据的处理装置之实施例二的程序模块示意图;
图8为本申请计算机设备之实施例三的硬件结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
实施例一
参阅图1,示出了本申请实施例的实施环境示意图。该实施环境包括:用户端10和服务器12。
用户端10是具有网络访问功能的电子设备,该设备可以是智能手机、平板电脑或者个人计算机等。
其中,用户端10安装有可以访问服务器12的程序11,用户在程序11通过账号和密码登录访问服务器12后,即可对服务器12执行特定操作和输入。
服务器12是一台服务器、若干服务器构称的服务器集群或者云计算中心。服务器12中存储了程序13,程序13包括前端模块和后端模块,前端模块和后端模块可通过接口互相调用,用户在程序11通过账号和密码登录或者通过账号和密码登录访问服务器12的程序13后,即可对程序13执行特定操作和输入。
用户端10和服务器12通过网络连接,网络中可包括多个网络节点,网络可以是互联网,局域网或者区块链网络。
本申请实施例的用户图片数据的处理方法可单独应用于程序11或程序13中,也可以分布式的同时应用于程序11和程序13中,或者以区块链形式存储于网络的多个节点中。
实施例一
本实施例的一种用户图片数据的处理方法,通过利用数据本身的特异化信息以及在现有的特征生成方法或者工具自动特征生成过程种进行特征筛选,减少了特征生成过程种误差的传递和累积,提升了机器学习输出数据的质量和精度,其中,在进行对象特征生成之前,利用因子分析可以减少大量强相关性的对象特征的生成,在生成对象特征的过程中进行筛选可 以删除掉过程中产生的无效的强相关的对象特征,避免了后续再利用该对象特征生成更多无效特征。
请参考图2,本实施例的一种前后端用户图片数据的处理方法包括以下步骤:
步骤S100,生成页面数据,并在接收到所述用户端请求指令时将所述页面数据下发至所述用户端,以使所述用户端将所述页面数据渲染生成用户图片数据提交页面。
具体的,在本实施例中,首先生成页面数据,当接收到用户端请求时将所述页面数据下发到所述用户端,其中,所述页面数据在用户端通过渲染生成一用户页面,用于用户提交用户数据;
步骤S200,对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据。
进行预处理是对图片进行清晰度检测,以防止无法分辨的模糊图片被上传无法进行后续分类操作。
具体的,请参考图3,步骤S200包括:
步骤S210:随机对所述图片执行N次取ROI(region of interest,感兴趣区域)操作以得到N个切片。
ROI是在机器视觉、图像处理中,从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域,称为感兴趣区域,取ROI操作为通过特定工具,例如Halcon、OpenCV、Matlab等机器视觉软件上常用到各种算子(Operator)和函数来计算得到感兴趣区域ROI,并进行图像的下一步处理。
步骤S220:分别计算所述N个切片的清晰度,得到N个清晰度分值;
在本实施例中,通过对不同的切片执行不同的清晰度检测算法,在其他实施例中,也可以只用一种检测算法。
步骤S230:计算所述N个清晰度分值的平均值以得到所述图片的清晰度值L;
步骤S240,当所述清晰度值L高于预设阈值时保存所述图片,当所述清晰度值L低于预设阈值时删除所述图片并向用户端发送提示通知;
具体的,在本实施例中,通过输入一张用户提交的图片,随机对输入图像取ROI区域,操作10次,总共生成10个ROI小切片。然后对每一个切片分别采用Brenner、Tenengrad、Variance、Laplacian、Vollath算法计算清晰度得分。每种算法在10个切片上能产生10个得分,我们将10个得分的中位数作为该算法的最终得分,若最终得分高于该类算法的清晰度阈值则认为图像清晰,否则认为图像模糊。
其中所述阈值可以是自定义的,也可以是根据对应不同图片清晰度质量算法的默认阈值得到的结果取中值得到,例如总共5种算法中,有3种或者3种以上方法认为该张图像清晰则判定图像清晰,否则判定图像模糊。
S300:对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据。
预处理后的图片都是清晰度满足预设条件的图片,保存在平台服务端的预设位置中,通过机器学习对图片进行分类训练,来实现图片的自动分拣。
具体的,请参考图4,步骤S300包括:
步骤S310:收集多种不同类型的图片并对其预分类得到预设分类模型的M种类型图片训练数据。
具体的,采用深度学习网络resnet50训练分类器。训练阶段,我们收集了4个种类的图片,身份证、发票、病史、其它。其中,身份证图片包含正反面,其它类图片是一些前三类开外的图片,由自然场景和开源数据集组合而来。对应的,将原始resnet50最后的输出通道数1000设置为4。
步骤S320:对所述M种类型的图片训练数据执行预设种类的数据增强计算;
具体的,对训练集的图片执行数据增强,数据增强的方式采用了五种数据增强方式的随机组合而来,这五种数据增强方式包括一个范围内随机小角度旋转、随机水平方向和竖直方向镜像翻转、图像模糊、一个范围内随机亮度调整、一个范围内随机饱和度调整。
步骤S330:将所述M种类型的图片训练数据转换成预设大小的训练图片并对所述预设分类模型进行训练。
具体的,将resnet50训练分类器的输入大小设置成224*224。任意大小图片变形成224*224时,我们先将长边缩放到224大小,并记录下长边的缩放尺度。接着,我们将输入图像的短边乘上长边的缩放尺度得到新的短边输出。此时,得到的新的短边长度肯定是小于等于224长度的,我们再在短边方向填充指定长度的固定像素值,固定像素值由计算训练集所有图像RGB通道均值得到,例如[155,155,155],最终实现短边长度也达到224的目的。具体填充方法如下:以目前高度H=224,宽度是W(W<224)的图像为例,则在目前图像的左边填充的宽度W1=int((224–W)/2),int表示取整操作,图像右边填充的宽度W2=224–W–W1。最终,左右填充后,短边也达到了224的长度输出。对于缩放后宽度是224,高度H(H<224)的图像也是类似的做法。
步骤S340:通过所述预设分类模型计算所述预处理后的图片数据的分类置信度概率,并当所述分类置信度概率大于预设分类置信度时,将所述预处理后的图片数据移动至所述预分类模型中对应类型的通道位置,以得到所述M种类型用户图片数据。
具体的,输入一张预处理后的图片,我们得到一个长度是4的数组,在这个数组中,第i(i=0,1,2,3)个位置的数表示是归类成第i类的概率。我们设置了分类置信度0.95。假设最后的分类得分大于分类置信度,且得到的通道类别与原始输入通道类别不符合的话,则认为用户上传图片通道错误,系统将图片移动至对应的通道中。
步骤S400,对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果。
具体的,请参考图5,步骤S400,对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果包括:
步骤S410,收集多种类型的真伪图片对所述所述深度学习网络训练分类器进行二分类训练;
步骤S420,收集多种类型的真伪图片对所述所述深度学习网络训练分类器进行二分类训练。
步骤S500,当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息。
在处理用户图片数据时,针对特定类型的图片,需要执行真伪校验,例如发票数据,需要对发票的真伪进行验证,以及对某些特定类型的图片,需要验证是否原件,而不是的复印件或者打印件,例如身份证图片。
具体的,发票验证阶段,上传的发票必须是原始图像,而不能是复印或者打印图像。通过训练一个二分类分类器去判断拍摄图片是否符合要求。其中,采用深度学习网络resnet50训练分类器,将resnet50输出通道数1000改成2。训练时,对训练集做数据增强,包括一个范围内随机小角度旋转、图像模糊、一个范围内随机亮度调整、一个范围内随机饱和度调整、RGB通道扰乱重组,这五种方法随机组合,通过设置模型的输入大小是224*224,任意大小的图像转成224*224的方式与自动分拣的类似。如果判断用户上传的图像非有效图像,则提示用户重新上传。
具体的,请参考图6,为本申请实施例一的用户图片数据的处理方法的流程示意图二,在本实施例,还包括以下步骤,在其他实施例中,也可以不包括这些步骤:
步骤S600:当所述真伪度校验结果满足预设条件时存储对应的用户图片数据。
步骤S700,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送所述通知消息。
具体的,对应特种类型的分类图片,需要执行关联校验以进一步校验用户上传的图片数据是否有误,例如,对于用户上传的发票和病史图像,我们采用深度学习技术检测图像上的日期区域,然后通过识别模型识别日期,如果两处的日期相差在7天之内,则判断两者满足关联条件,如果相差超出7天,则判定两者不满足关联条件,提示用户重新上传。
其中,所述通知消息可以是统一提示用户图片上传失败的提示,也可以是根据不同错误类型,例如清晰度不够,未通过真伪度校验,未通过关联度校验,图片通道上传错误等,定制化不通的通知消息内容,从而可以做到24小时工作,及时反馈,相较于人工,这无疑能大大提升业务量,提升业务效率,同时也会提升用户体验,获得用户好感。
S800,将存储的所述用户图片数据上传至区块链中。
基于存储的所述用户图片数据得到对应的摘要信息,具体来说,摘要信息由存储的所述用户图片数据进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息,以便查证存储的所述用户图片数据是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一 个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本实施例的用户数据处理方法,通过利用机器学习对符合条件的用户图片数据进行自动分类,然后对分类后的图片分别进行真伪校验,可以对用户的图片数据执行即时鉴别,并反馈给用户端进行修改,提高了服务端处理用户端用户数据的效率。
具体的,在质量检测阶段,通过算法干预,接受质量好的样本,排除质量差的样本,能够在源头对图像的质量进行把关,同时避免了后期整理时发现质量不合格退回用户重新提交造成的等待。在分拣阶段,能够在后台对用户输入的图像进行分类,并能够将输入图片归类到正确的通道中,此过程避免了复杂、繁琐的人工干预,节约了大量的人力成本,同时也提升了用户体验。在发票验真阶段,能够通过模合型自动判别发票是否符条件,省去了人工核实工作,节约了人力成本,同时了规避了虚假资料的风险。在材料关联阶段,能够通过算法识别,进一步提升了理赔材料的准确性,减轻了人力负担。由于算法推理速度快,准确率高,并且可以做到24小时工作,相较于人工,这无疑能大大提升业务量,提升业务效率,同时也会提升用户体验。
实施例二
请继续参阅图7,示出了本申请用户图片数据的处理装置的程序模块示意图。在本实施例中,用户图片数据的处理装置20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本申请,并可实现上述用户图片数据的处理方法。本申请实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述用户图片数据的处理装置20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
清晰度检验模块202,用于对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;用于
智能分拣模块204,用于对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据;
真伪度校验模块206,用于对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
结果输出模块208,用于当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时,删除对应的用户图片数据并向所述用户端发送通知消息。
实施例三
参阅图8,是本申请实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包 括独立的服务器,或者多个服务器所组成的服务器集群)等。如图8所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及用户图片数据的处理装置20。其中:所述处理器22执行所述计算机程序时实现用户图片数据的处理方法,所述方法具体包括如下步骤:
步骤S100,对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;
步骤S200,对预处理后的用户图片数据通过分类器进行分拣,以得到M种类型用户图片数据;
步骤S300,对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
步骤S400,当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息。
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如上述实施例所述的用户图片数据的处理装置20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行用户图片数据的处理装置20,以实现上述实施例的用户图片数据的处理方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图8仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不 要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述用户图片数据的处理装置20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本申请。
实施例四
本实施例还提供一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性,也可以是易失性,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储用户图片数据的处理装置20,被处理器22执行时实现用户图片数据的处理方法,所述方法具体包括如下步骤:
步骤S100,对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;
步骤S200,对预处理后的用户图片数据通过分类器进行分拣,以得到M种类型用户图片数据;
步骤S300,对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
步骤S400,当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (20)

  1. 一种用户图片数据的处理方法,所述方法包括:
    对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;
    对预处理后的用户图片数据通过分类器进行分拣,以得到M种类型用户图片数据;
    对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
    当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息。
  2. 如权利要求1所述的用户图片数据的处理方法,所述对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据之前还包括:
    生成页面数据,并在接收到所述用户端请求指令时将所述页面数据下发至所述用户端,以使所述用户端将所述页面数据渲染生成用户图片数据提交页面。
  3. 如权利要求1或2所述的用户图片数据的处理方法,所述对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据包括:
    随机对所述图片数据执行N次取ROI操作以得到N个切片;
    分别计算所述N个切片的清晰度,以得到N个清晰度分值;
    计算所述N个清晰度分值的平均值以得到所述图片数据的清晰度值L;
    当所述清晰度值L高于预设阈值时保存所述图片数据,当所述清晰度值L不高于预设阈值时删除所述图片数据并向所述用户端发送所述通知消息。
  4. 如权利要求3所述的用户图片数据的处理方法,所述对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据包括:
    收集多种不同类型的原始图片,并对所述原始图片预分类,以得到预设分类模型的M种类型图片训练数据;
    对所述M种类型图片训练数据执行预设种类的数据增强计算;
    将完成所述数据增强计算的所述M种类型图片训练数据转换成预设大小的训练图片,并通过所述训练图片对所述预设分类模型进行训练;
    通过所述预设分类模型计算所述预处理后的图片数据的分类置信度概率,并当所述分类置信度概率大于预设分类置信度时,将所述预处理后的图片数据移动至所述预分类模型中对应类型的通道位置,以得到所述M种类型用户图片数据。
  5. 如权利要求4所述的用户图片数据的处理方法,所述对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果包括:
    收集多种类型的真伪图片对所述所述深度学习网络训练分类器进行二分类训练;
    通过所述深度学习网络训练分类器对所述分拣后的所述用户图片数据进行真伪度检验以得到所述真伪度检验结果。
  6. 如权利要求5所述的用户图片数据的处理方法,所述通过深度学习网络训练分类器, 并对预处理后的用户图片数据通过所述分类器进行分拣之后还包括:
    对分拣后的预设类型的所述图片数据进行关联度校验以得到真伪度校验结果;
    当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送所述通知消息。
  7. 如权利要求6所述的用户图片数据的处理方法,所述当所述真伪度校验结果满足预设条件时存储对应的用户图片数据之后还包括:
    将存储的所述用户图片数据上传至区块链中。
  8. 一种用户图片数据的处理装置,所述用户图片数据的处理装置包括:
    清晰度检验模块,用于对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;用于
    智能分拣模块,用于对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据;
    真伪度校验模块,用于对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
    结果输出模块,用于当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时,删除对应的用户图片数据并向所述用户端发送通知消息。
  9. 一种设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现用户图片数据的处理方法,所述方法具体包括如下步骤:
    对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;
    对预处理后的用户图片数据通过分类器进行分拣,以得到M种类型用户图片数据;
    对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
    当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息。
  10. 由权利要求9所述的设备,其中,所述对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据之前还包括:
    生成页面数据,并在接收到所述用户端请求指令时将所述页面数据下发至所述用户端,以使所述用户端将所述页面数据渲染生成用户图片数据提交页面。
  11. 由权利要求10所述的设备,其中,所述对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据包括:
    随机对所述图片数据执行N次取ROI操作以得到N个切片;
    分别计算所述N个切片的清晰度,以得到N个清晰度分值;
    计算所述N个清晰度分值的平均值以得到所述图片数据的清晰度值L;
    当所述清晰度值L高于预设阈值时保存所述图片数据,当所述清晰度值L不高于预设阈值时删除所述图片数据并向所述用户端发送所述通知消息。
  12. 由权利要求11所述的设备,其中,所述对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据包括:
    收集多种不同类型的原始图片,并对所述原始图片预分类,以得到预设分类模型的M种类型图片训练数据;
    对所述M种类型图片训练数据执行预设种类的数据增强计算;
    将完成所述数据增强计算的所述M种类型图片训练数据转换成预设大小的训练图片,并通过所述训练图片对所述预设分类模型进行训练;
    通过所述预设分类模型计算所述预处理后的图片数据的分类置信度概率,并当所述分类置信度概率大于预设分类置信度时,将所述预处理后的图片数据移动至所述预分类模型中对应类型的通道位置,以得到所述M种类型用户图片数据。
  13. 由权利要求12所述的设备,其中,所述对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果包括:
    收集多种类型的真伪图片对所述所述深度学习网络训练分类器进行二分类训练;
    通过所述深度学习网络训练分类器对所述分拣后的所述用户图片数据进行真伪度检验以得到所述真伪度检验结果。
  14. 由权利要求13所述的设备,其中,所述通过深度学习网络训练分类器,并对预处理后的用户图片数据通过所述分类器进行分拣之后还包括:
    对分拣后的预设类型的所述图片数据进行关联度校验以得到真伪度校验结果;
    当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送所述通知消息。
  15. 一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现用户图片数据的处理方法,所述方法具体包括如下步骤:
    对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据;
    对预处理后的用户图片数据通过分类器进行分拣,以得到M种类型用户图片数据;
    对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果;
    当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送通知消息。
  16. 由权利要求15所述的计算机可读存储介质,其中,所述对用户端上传的图片数据进行预处理,以删除清晰度不满足预设条件的部分图片数据之前还包括:
    生成页面数据,并在接收到所述用户端请求指令时将所述页面数据下发至所述用户端,以使所述用户端将所述页面数据渲染生成用户图片数据提交页面。
  17. 由权利要求16所述的计算机可读存储介质,其中,所述对用户端上传的图片数据进 行预处理,以删除清晰度不满足预设条件的部分图片数据包括:
    随机对所述图片数据执行N次取ROI操作以得到N个切片;
    分别计算所述N个切片的清晰度,以得到N个清晰度分值;
    计算所述N个清晰度分值的平均值以得到所述图片数据的清晰度值L;
    当所述清晰度值L高于预设阈值时保存所述图片数据,当所述清晰度值L不高于预设阈值时删除所述图片数据并向所述用户端发送所述通知消息。
  18. 由权利要求17所述的基于调度模型的车辆调度方法,其中,所述对预处理后的用户图片数据通过所述分类器进行分拣,以得到M种类型用户图片数据包括:
    收集多种不同类型的原始图片,并对所述原始图片预分类,以得到预设分类模型的M种类型图片训练数据;
    对所述M种类型图片训练数据执行预设种类的数据增强计算;
    将完成所述数据增强计算的所述M种类型图片训练数据转换成预设大小的训练图片,并通过所述训练图片对所述预设分类模型进行训练;
    通过所述预设分类模型计算所述预处理后的图片数据的分类置信度概率,并当所述分类置信度概率大于预设分类置信度时,将所述预处理后的图片数据移动至所述预分类模型中对应类型的通道位置,以得到所述M种类型用户图片数据。
  19. 由权利要求18所述的计算机可读存储介质,其中,所述对所述M种类型用户图片数据进行真伪度检验以得到分拣后的用户图片数据每种类型对应的真伪度校验结果包括:
    收集多种类型的真伪图片对所述所述深度学习网络训练分类器进行二分类训练;
    通过所述深度学习网络训练分类器对所述分拣后的所述用户图片数据进行真伪度检验以得到所述真伪度检验结果。
  20. 由权利要求19所述的计算机可读存储介质,其中,,所述通过深度学习网络训练分类器,并对预处理后的用户图片数据通过所述分类器进行分拣之后还包括:
    对分拣后的预设类型的所述图片数据进行关联度校验以得到真伪度校验结果;
    当所述真伪度校验结果满足预设条件时存储对应的用户图片数据,当所述真伪度校验结果不满足预设条件时删除对应的用户图片数据并向所述用户端发送所述通知消息。
PCT/CN2020/122784 2020-09-02 2020-10-22 用户图片数据的处理方法、装置、计算机设备及存储介质 WO2021174869A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010908098.6A CN112053343A (zh) 2020-09-02 2020-09-02 用户图片数据的处理方法、装置、计算机设备及存储介质
CN202010908098.6 2020-09-02

Publications (1)

Publication Number Publication Date
WO2021174869A1 true WO2021174869A1 (zh) 2021-09-10

Family

ID=73608097

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/122784 WO2021174869A1 (zh) 2020-09-02 2020-10-22 用户图片数据的处理方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN112053343A (zh)
WO (1) WO2021174869A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992496A (zh) * 2023-09-28 2023-11-03 武汉彤新科技有限公司 一种用于企业服务管理的数据资源安全监督系统
CN118134576A (zh) * 2024-05-08 2024-06-04 山东工程职业技术大学 基于人工智能的数字电子发票管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862785A (zh) * 2017-10-16 2018-03-30 深圳市中钞信达金融科技有限公司 票据鉴定方法及装置
CN108288073A (zh) * 2018-01-30 2018-07-17 北京小米移动软件有限公司 图片真伪识别方法及装置、计算机可读存储介质
CN109657694A (zh) * 2018-10-26 2019-04-19 平安科技(深圳)有限公司 图片自动分类方法、装置及计算机可读存储介质
CN111191539A (zh) * 2019-12-20 2020-05-22 江苏常熟农村商业银行股份有限公司 证件真伪验证方法、装置、计算机设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726783A (zh) * 2018-12-28 2019-05-07 大象慧云信息技术有限公司 一种基于ocr图像识别技术的发票采集管理系统及方法
CN110175980A (zh) * 2019-04-11 2019-08-27 平安科技(深圳)有限公司 图像清晰度识别方法、图像清晰度识别装置及终端设备
CN111178345A (zh) * 2019-05-20 2020-05-19 京东方科技集团股份有限公司 一种票据分析方法、分析装置、计算机设备和介质
CN110288755B (zh) * 2019-05-21 2023-05-23 平安银行股份有限公司 基于文本识别的发票检验方法、服务器及存储介质
CN111324874B (zh) * 2020-01-21 2023-06-20 支付宝实验室(新加坡)有限公司 一种证件真伪识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862785A (zh) * 2017-10-16 2018-03-30 深圳市中钞信达金融科技有限公司 票据鉴定方法及装置
CN108288073A (zh) * 2018-01-30 2018-07-17 北京小米移动软件有限公司 图片真伪识别方法及装置、计算机可读存储介质
CN109657694A (zh) * 2018-10-26 2019-04-19 平安科技(深圳)有限公司 图片自动分类方法、装置及计算机可读存储介质
CN111191539A (zh) * 2019-12-20 2020-05-22 江苏常熟农村商业银行股份有限公司 证件真伪验证方法、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992496A (zh) * 2023-09-28 2023-11-03 武汉彤新科技有限公司 一种用于企业服务管理的数据资源安全监督系统
CN116992496B (zh) * 2023-09-28 2023-12-29 武汉彤新科技有限公司 一种用于企业服务管理的数据资源安全监督系统
CN118134576A (zh) * 2024-05-08 2024-06-04 山东工程职业技术大学 基于人工智能的数字电子发票管理方法及系统

Also Published As

Publication number Publication date
CN112053343A (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
US12014350B2 (en) Systems and methods for mobile image capture and processing of documents
US11151369B2 (en) Systems and methods for classifying payment documents during mobile image processing
CN110287971B (zh) 数据验证方法、装置、计算机设备及存储介质
WO2019174130A1 (zh) 票据识别方法、服务器及计算机可读存储介质
US20210295114A1 (en) Method and apparatus for extracting structured data from image, and device
WO2021042747A1 (zh) 发票图片识别及验真方法、系统、设备及可读存储介质
WO2021174869A1 (zh) 用户图片数据的处理方法、装置、计算机设备及存储介质
CN109783781B (zh) 基于图像识别的保单录入方法和相关装置
CN110795714A (zh) 一种身份验证方法、装置、计算机设备及存储介质
WO2019056496A1 (zh) 图片复审概率区间生成方法及图片复审判定方法
CN113239910B (zh) 证件识别方法、装置、设备及存储介质
CN112668640A (zh) 一种文本图像质量评估方法、装置、设备及介质
CN117036073A (zh) 基于互联网的发票审核与自动报销系统
CN113807256A (zh) 票据数据处理方法、装置、电子设备和存储介质
CN112132693A (zh) 交易验证方法、装置、计算机设备与计算机可读存储介质
CN112183520A (zh) 数据信息智能处理方法、装置、电子设备及存储介质
CN111681116A (zh) 理赔资料核实方法、装置、设备及存储介质
CN114820211B (zh) 理赔资料质检核验方法、装置、计算机设备及存储介质
CN112150483B (zh) 图片篡改检测方法、装置、终端设备及存储介质
US11956400B2 (en) Systems and methods for measuring document legibility
CN113837169B (zh) 文本数据处理方法、装置、计算机设备及存储介质
US20230334846A1 (en) Document Image Quality Detection
CN115860686A (zh) 一种数据录入方法、装置、设备及介质
CN114972887A (zh) 信息资料合成方法、装置、设备及存储介质
CN115934994A (zh) 定制卡卡图的图审方法及图审平台

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20923099

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20923099

Country of ref document: EP

Kind code of ref document: A1