WO2024030042A1 - Способ и система обработки изображений документов - Google Patents

Способ и система обработки изображений документов Download PDF

Info

Publication number
WO2024030042A1
WO2024030042A1 PCT/RU2022/000249 RU2022000249W WO2024030042A1 WO 2024030042 A1 WO2024030042 A1 WO 2024030042A1 RU 2022000249 W RU2022000249 W RU 2022000249W WO 2024030042 A1 WO2024030042 A1 WO 2024030042A1
Authority
WO
WIPO (PCT)
Prior art keywords
entity
instance
characterizing
documents
signatory
Prior art date
Application number
PCT/RU2022/000249
Other languages
English (en)
French (fr)
Inventor
Наталия Максимовна СЕЛЮТО
Дина Аликовна НАГИБИНА
Николай Александрович ГЕРАСИМЕНКО
Антон Сергеевич ЧЕРНЯВСКИЙ
Original Assignee
Публичное Акционерное Общество "Сбербанк России"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Публичное Акционерное Общество "Сбербанк России" filed Critical Публичное Акционерное Общество "Сбербанк России"
Priority claimed from RU2022121317A external-priority patent/RU2022121317A/ru
Publication of WO2024030042A1 publication Critical patent/WO2024030042A1/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content

Definitions

  • the presented technical solution relates, in general, to the field of computer technology intended for image analysis, and in particular to methods and systems for processing images of documents, for example, scanned documents or tabular documents necessary for debt collection, in particular images of statements procedural nature on debt collection, powers of attorney, extracts from the Unified State Register of Legal Entities, etc.
  • the known solution comprises the steps of: obtaining an image of a document consisting of at least one page; recognize characters on the image of a document page and convert them into text information; forming a document page vector based on the text information obtained at the previous stage; determine, based on the document page vector, the document type and its page type; determine a list of pages and at least one signer attribute, the presence of which must be checked in this document type; check the presence of the list of pages and at least one signer attribute on the received document image to determine the completeness of the document.
  • a significant drawback of the known solutions is their limited functionality, which is necessary for a complete check of documents and making a decision based on the results of the said check, including for solving the problems of writ proceedings.
  • the technical problem or task posed in this technical solution is the creation of a new effective, simple and reliable method for automated verification of a set of documents, consisting of at least one document that requires consideration and processing as a set, for the correctness and sufficiency of their completion from the point of view of Russian civil procedural law.
  • the technical result is to expand the functionality by providing the ability to verify the authority of the signatory to act on behalf of the applicant.
  • the set of documents additionally contains an extract from the Unified State Register of Legal Entities (USRLE), and the stage of determining the presence of a connection between the instance of the applicant’s entity and the instance of the signatory’s entity contains stages at which:
  • USRLE Unified State Register of Legal Entities
  • connection is formed in the device’s memory between an instance of the entity characterizing the legal entity and an instance of the entity characterizing the head of the legal entity, on the basis of which the existence of a connection between the instance of the applicant’s entity and the instance of the signatory’s entity is determined.
  • the set of documents additionally contains an extract from the Unified State Register of Legal Entities and at least one power of attorney, and the stage of determining the presence of a connection between an instance of the applicant’s entity and an instance of the signatory’s entity contains stages in which:
  • connection is formed in the device’s memory between an instance of the entity characterizing the legal entity and an instance of the entity characterizing the authorized person, on the basis of which the existence of a connection between the instance of the applicant’s entity and the instance of the signatory’s entity is determined.
  • the method further comprises the steps of: - determine the scope of powers given in the power of attorney;
  • the mentioned scope of powers includes the powers of the authorized person to act as a submitter and signatory of the application.
  • the method further comprises the step of determining that the power of the trustee has not expired as of the current date or the date of signing the application.
  • the set of documents additionally contains an extract from the Unified State Register of Legal Entities and at least two powers of attorney, and the stage of determining the presence of a connection between an instance of the applicant’s entity and an instance of the signatory’s entity contains stages in which:
  • the method further comprises the steps of:
  • the mentioned scope of powers of the first power of attorney includes the authority of the first authorized person to transfer the right to submit and sign applications.
  • the method further comprises the step of determining that the power of the trustee has not expired as of the current date or the date of signing the application.
  • a document set verification system comprising at least one computing device and at least one memory device containing machine-readable instructions that, when executed by at least one computing device, perform the above method.
  • FIG. Figure 1 shows a general diagram of the interaction of elements of a document image processing system.
  • FIG. Figure 2 shows an example of a general view of a computing device.
  • a system means including a computer system, a computer (electronic computer), CNC (computer numerical control), PLC (programmable logic controller), computerized control systems and any other devices capable of performing a given, clearly defined sequence of operations (actions, instructions).
  • command processing device is meant an electronic unit, a computing device, or an integrated circuit (microprocessor) that executes machine instructions (programs).
  • a command processing device reads and executes machine instructions (programs) from one or more storage devices.
  • Storage devices can include, but are not limited to, hard drives (HDD), flash memory, ROM (read-only memory), solid-state drives (SSD), and optical drives.
  • Program - a sequence of instructions intended for execution by a computer control device or command processing device.
  • Database (DB) a collection of data organized according to a conceptual structure that describes the characteristics of that data and the relationships between them, and such a collection of data that supports one or more areas of application (ISO/IEC 2382:2015, 2121423 " database”).
  • An entity is any distinguishable object (an object that we can distinguish from another), information about which must be stored in a database.
  • An entity instance is a specific representative of a given entity. For example, a representative of the “Employee” entity can be “Employee Ivanov”. Entity instances must be distinguishable, i.e. entities must have some properties that are unique to each instance of that entity.
  • the document image processing system 10 contains interconnected: data conversion module 11, document classification module 12, entity extraction module 13, document verification module 14 and document generation module 15.
  • These modules can be implemented on the basis of software and hardware of the document image processing system 10, for example, on the basis of at least one computing device, in particular a microprocessor, and at least one memory device containing machine-readable instructions, for example, written in a programming language Python, to implement the functions performed by the modules.
  • the data conversion module 11 can be implemented based on an optical character recognition (OCR) tool.
  • OCR optical character recognition
  • the document classification module 12 may be implemented on system 10 firmware configured to represent text as vectors (for example, TFIDF), and include a set of classification models for these vectors, for example, SVM (Support Vector Machine) or Random Forest.
  • Entity extraction module 13 may include a set of models for analyzing the semantics of natural languages word2vec, pre-trained mathematical models - deep neural networks of various architectures (CNN (convolutional neural network), BiLSTM (Bidirectional Long Short-Term Memory), Transformer) and computing tools for processing natural language (Natural Language Processing, NLP).
  • the document generation module 15 can be implemented on the basis of technical means disclosed, for example, in the patent RU 134341 U1, publ.
  • 11/10/2013 is equipped with a database of template documents used to generate draft documents, as well as information input/output tools, widely known from the prior art, to display 10 images of draft documents to the system user and means of transmitting information via wired or wireless communication channels for transfer of generated draft documents.
  • the data conversion module 11 receives an image of a set of documents, in particular scanned pages of documents, for example, a file in multi-page PDF, JPEG, TIFF or any other known format that can be used to store images of a scanned document .
  • the image of the document set may come from an image data source 1, in particular directly from a document scanning device, such as a scanner, or may be retrieved from a corresponding image database into which the document image data has been previously stored.
  • a set of documents may include any document consisting of at least one page of text information, containing attributes of the signer, in particular his seal and/or signature, and completed in accordance with a known document template.
  • the document may be, for example, an application, in particular for the issuance of a court order for debt collection, an extract from the Unified State Register of Legal Entities, a power of attorney (issued by the head organizations and issued by way of transfer of trust) and other well-known document.
  • the document may contain fields that contain information about the signatory, for example, the full name of the signatory - the representative of the claimant, the address of the location of the claimant, and other information.
  • the data conversion module 11 performs character recognition on the image of a set of documents and converts them into text information, after which the text information of the document set is sent to the document classification module 12.
  • Module 12 converts the received text information into a semantic vector representation of the document (embedding, see, for example, the book “Speech and Language Processing”, Daniel Jurafsky & James H. Martin, chapter “Vector Semantics and Embeddings”, posted on the Internet at: https ://web.stanford.edU/ ⁇ jurafsky/slp3/6.pdf), which is processed by a predefined set of vector classification models to determine the document type that is part of the document set.
  • Methods for processing vectors by a set of vector classification models to determine the type of document are widely known in the art and will not be disclosed in more detail in this application.
  • module 12 based on data about the types of documents included in the set of documents, generates data about the boundaries of the image of the set of documents and the types of document, the image of which is located between the mentioned boundaries.
  • the text information received by module 12, the image of a set of documents, data on the boundaries of the document image and document types are sent to entity extraction module 13, which extracts from the received text information a set of entities in accordance with the document type, as well as data on instances of entities.
  • the set of entities may include at least one: a statement signer entity; the nature of the applicant (claimant); entity related to the legal entity; entity related to the head of the legal entity; entity related to the principal; entity related to the trustee; as well as the name of the organization, the location address of the organization, INN and OGRN of the organization, the date of registration of the organization, the date of issue of the power of attorney, the validity period of the power of attorney, the set of powers under the power of attorney, etc., and data on instances of entities may contain the full name of a specific person, the specific address of the person , name of the organization, specific address of the organization, etc.
  • module 13 To extract a set of entities and instances of entities from the received text information, module 13 performs tokenization text information and provides tokenized text information as input to a set of word2vec models, at the output of which module 13 receives a sequence of vectors for each document.
  • module 13 determines trained machine learning models (for example, neural networks of architectures such as BiLSTM-CNN, BERT) to solve the problem of named entity recognition. Sequences of document vectors are processed by these trained models, which determine a set of entities and entity instances for each document.
  • the trained machine learning models by which entities are extracted may be predefined in the memory of said module 13 by the developer of the system 10 for each document type.
  • Such machine learning models are widely used in various areas of AI, in particular for text processing and machine translation, and are disclosed, for example, in the article “Tuning Multilingual Transformers for Language-Specific Named Entity” by Mikhail Arkhipov, Maria Trofimova, Yuri Kuratov, Alexey Sorokin Recognition”, published on the Internet at: https://www.aclweb.org/antholoqv/W19-3712/ and article by Jason R.S. Chiu, Eric Nichols, “Named Entity Recognition with Bidirectional LSTM-CNNs,” publ., online at: https://arxiv.org/pdf/1511.08308v5.pdf
  • Training of machine learning models can be performed by the developer by sending to the input of said models pre-labeled text information specific to a given document type.
  • the markup may indicate that an instance of the applicant’s entity in the text information is contained after a word characteristic of the applicant, for example, “applicant” or “collect in favor,” and an instance of the entity the signatory is contained after a word characteristic of the signatory, for example, “signer”.
  • the markup may indicate that an instance of the entity is located before a word or phrase characteristic of this entity, for example, for the mentioned application, the markup may indicate that an instance of the applicant’s entity in the text information is contained before the text “hereinafter - Bank, Lender”.
  • trained machine learning models once trained on labeled text information, will provide the ability to extract from text information of all necessary entities required to verify a set of documents.
  • module 13 can extract an entity characterizing the authority for filing a document, in particular an application.
  • This entity may be extracted in the manner previously described from an appropriate region of the document intended to indicate the document filing authority, or by a trained machine learning model, wherein the markup of the textual information used to train said model may indicate that an instance of the document filing authority entity is contained in text information after a word characteristic of the document filing authority, for example, the word “where”.
  • a word characteristic of the document filing authority for example, the word “where”.
  • module 13 will generate the entity of the authority for filing the document, containing an instance of the entity “court relating to to courts of general jurisdiction” and is included in the set of entities.
  • the set of entities extracted by module 13 from the text information will contain the following entities: the principal entity; the nature of the trustee; at least one entity characterizing the scope of powers given in the power of attorney; an entity characterizing the duration of powers.
  • module 13 also uses machine learning models trained on labeled text information specific to powers of attorney.
  • a power of attorney may contain the following text: “By this power of attorney, the Limited Liability Company LLC, represented by General Director I. I. Ivanov, on the basis of the LLC Charter, trusts P.P. Petrov. powers to sign and submit applications to courts of general jurisdiction for a period of 3 years.” Accordingly, the set of entities extracted by module 13 from the given text will contain the following entities:
  • the resulting set of entities for each document type and data on instances of entities is sent by the data extraction module 13 to the document verification module 14, which checks the contents in the documents for correctness of completion of documents and sufficiency based on the extracted set of entities according to the document type.
  • the document verification module 14 can be equipped with a database with reference sets of entities for typical document pages.
  • Document verification module 14 compares the set of entities received from module 13 with a reference set of entities for typical document pages. If the thresholds set by the user of the system 10 for matching entities in the entity set with the entities in the reference entity set are reached, then said module 14 decides that there is enough content in the document. Accordingly, if said matching entity thresholds are not reached, then said module 14 decides that there is not enough content in the document.
  • the set of reference entities may contain entities characterizing the data of the claimant, the debtor, the amount to be collected, the date of filing the application, etc. Accordingly, if, as a result of comparing the entities in the previously described manner, module 14 When checking the documents, it is determined that the received set of entities from the data extraction module 13 does not contain any entity, for example, an entity characterizing the debtor or the applicant, then a decision is made that the contents in the document are insufficient.
  • document verification module 14 To perform content verification to ensure that documents are correctly filled out, document verification module 14 compares entity instances in each entity type using methods known in the art. If the entity instances in each entity type match, then the document verification module 14 decides that the documents are correctly filled out. Accordingly, if entity instances in entity types are not match, then the document verification module 14 makes a decision that the documents are filled out incorrectly.
  • document verification module 14 may compare entity instances of entity types such as debtor. For example, if instances of entities characterizing the full name of the debtor and related to the entity characterizing the debtor’s data extracted from the said application differ from the said instances of entities extracted from the loan agreement, i.e. the instance of the entity extracted from the application relating to the debtor contains the data “Ivanov I.I.”, and the instance of the entity extracted from the loan agreement relating to the debtor contains the data full name “Petrov P.P.”, then the document verification module 14 makes a decision on that the documents were filled out incorrectly.
  • document verification module 14 may be configured to verify the signatory's authority to act on behalf of the applicant. To do this, said module 14 retrieves the applicant entity and the signatory entity from the previously obtained set of entities relating to the application and accesses the memory with which it may be equipped to search for data indicating the existence of a relationship between an instance of the applicant entity and an instance of the signatory entity confirming authority of the signatory to act on behalf of the applicant. Said relationship between the applicant entity instance and the signer entity instance may be predefined by the developer in the memory of said module 14.
  • module 14 determines the presence of a connection between the instance of the applicant entity and the instance of the signatory entity, confirming the authority of the signatory to act on behalf of the applicant, and then generates the results of a successful verification of the set of documents due to the presence of the mentioned connection between entity instances.
  • information about the authority of the signatory to act on behalf of the applicant can be included in the results of checking the document for the correctness of filling out the documents.
  • the document verification module 14 may be configured to form at least one relationship between entity instances in memory during the step of determining whether there is a relationship between the applicant entity instance and the signer entity instance. To do this, module 14 determines the presence of an extract from the Unified State Register of Legal Entities in the set of documents that were previously classified, and extracts from the set of entities related to the extract from the Unified State Register of Legal Entities at least one entity related to the legal entity and at least one entity related to the head of the legal entity .
  • an entity related to a legal entity may contain an instance of the “LLC” entity
  • an entity related to the head of a legal entity may contain an instance of the “Ivanov I. I.” entity.
  • the mentioned module 14 compares the instance of the entity characterizing the legal entity with the instance of the entity of the applicant, and the instance of the entity characterizing the head of the legal entity with the instance of the entity of the signatory. Since in the above example, the instance of the entity characterizing the legal entity and the instance of the entity of the applicant are represented by the legal entity “LLC”, and the instance of the entity characterizing the head of the legal entity and the instance of the entity of the signatory are represented by “Ivanov I.
  • module 14 makes a decision on whether that the instance of the entity characterizing the legal entity corresponds to the instance of the entity of the applicant, and the instance of the entity characterizing the head of the legal entity corresponds to the instance of the entity of the signatory, after which module 14 forms in memory a connection between the instance of the entity characterizing the legal entity and the instance of the entity characterizing the head of the legal entity, based on which will further determine the existence of a connection between an instance of the applicant’s entity and an instance of the signatory’s entity.
  • the mentioned module 14 makes a determination presence of a power of attorney in the set of documents. If the set of documents does not contain a power of attorney, then the mentioned module 14 generates the results of checking the set of documents, indicating that the powers of the representative are not confirmed by the documents attached to the set of documents.
  • document verification module 14 If document verification module 14 has determined the presence of a power of attorney in a set of documents, then said module 14 extracts from the set of entities related to the power of attorney at least one entity related to the principal and at least one entity related to the authorized person.
  • an entity related to the principal may be “Ivanov I.I.”
  • an entity related to the trustee may be “Petrov P.P.”
  • the document verification module 14 compares the entity instance characterizing the principal with the entity instance characterizing the head of the legal entity, and the entity instance characterizing the trustee with the signatory entity instance. Since in the example given earlier, the entity instance characterizing the principal coincides with the entity instance characterizing the head of the legal entity and represents “Ivanov I.I.”, and the entity instance characterizing the trustee coincides with the entity instance of the signatory and represents “Petrov P.P”, then module 14 forms in the device memory a connection between an instance of the entity characterizing the legal entity and an instance of the entity characterizing the authorized person, on the basis of which the presence of a connection between the instance of the applicant’s entity and the instance of the signatory’s entity will be further determined. Accordingly, a connection will be formed in the device memory between an instance of the legal entity “LLC” and an instance of the entity “Petrov P.P.”
  • the document verification module 14 will decide that the documents are filled out correctly, after which said module 14 will generate verification results indicating that the verification of the contents in the documents was successful. Additionally, before forming the mentioned connection between the entity instance characterizing the legal entity and the entity instance characterizing the authorized person, the document verification module 14 can check for the authority of the authorized person to act as a submitter and signatory of the application. For this purpose, module 14, based on the set of entities extracted from the power of attorney, determines the scope of powers given in the power of attorney.
  • module 14 If module 14 has determined that said scope of authority includes the authority of the trustee to act as a submitter and signatory of the application, i.e. the set of entities contains an entity characterizing the right to file applications in courts related to courts of general jurisdiction, and an entity characterizing the right to sign applications filed in courts related to courts of general jurisdiction, then module 14 proceeds to the stage of forming the mentioned connection between an instance of the entity characterizing Legal entity, and an instance of the entity characterizing the authorized person. If the scope of authority does not include the authority of the trustee to act as a submitter or signatory of the application, i.e.
  • module 14 generates the results of checking a set of documents indicating that that the authority of the representative is not confirmed by the documents attached to the set of documents.
  • the document verification module 14 can perform a check of the validity period of the trustee's powers. To do this, module 14 extracts from the set of entities related to the power of attorney information characterizing the validity period of the power of attorney and compares it with the current date or the date of signing the application. If module 14 has determined that the term of office of the authorized person has not expired on the current date or the date of signing the application, then module 14 proceeds to the stage of forming the mentioned connection between the entity instance characterizing the legal entity and the entity instance characterizing the authorized person. If the expiration date authority on the current date or the date of signing the application has expired, then module 14 generates the results of checking the set of documents, indicating that the powers of the representative under the power of attorney are not confirmed by the documents attached to the set of documents.
  • the document verification module 14 may be configured to verify the presence of authority to submit a document to a document filing authority specified, for example, in an application. To do this, module 14, from the set of entities extracted from the application, extracts an entity characterizing the authority for filing the document, for example, containing an entity instance related to a court of general jurisdiction, and checks whether the set of entities extracted from the power of attorney contains an entity characterizing the right to file document to the specified document filing authority.
  • the set of entities contains an entity characterizing the right to file applications in courts related to courts of general jurisdiction, in connection with which module 14 will proceed to the stage of forming the mentioned connection between the entity instance characterizing the legal entity and the entity instance characterizing the trustee. If the set of entities does not contain an entity characterizing the right to submit a document to the specified document filing authority, then module 14 generates the results of checking the set of documents, indicating that the powers of the representative by proxy are not confirmed by the documents attached to the set of documents.
  • the set of documents may contain two powers of attorney.
  • the stage of determining the presence of a connection between a copy of the applicant’s entity and a copy of the signatory’s entity also contains the previously disclosed stages, at which: determining the presence of an extract from the Unified State Register of Legal Entities in the set of documents; extract at least one entity related to a legal entity (LE) and at least one entity related to the head of the LE; determine that the instance of the entity characterizing the legal entity corresponds to the instance of the applicant’s entity.
  • L legal entity
  • module 14 determines that the entity instance characterizing the head of the legal entity does not correspond to the entity instance of the signatory, said module 14 searches and determines the presence of the first power of attorney in the set of documents, retrieves at least one entity related to the at least one first principal, and at least one entity related to at least one first authorized person, and compares an entity instance characterizing the first principal with an entity instance characterizing the head of the legal entity, and an entity instance characterizing the first authorized person with an entity instance of the signatory.
  • module 14 If module 14 has determined that the entity instance characterizing the first principal corresponds to the entity instance characterizing the head of the legal entity, and the entity instance characterizing the first proxy does not correspond to the signatory entity instance, then said module 14 searches and determines the presence of the second powers of attorney in the set of documents, and then retrieves at least one entity related to the second principal and at least one entity related to the second proxy. Next, module 14 compares the entity instance characterizing the second trustee with the entity instance characterizing the first proxy, and the entity instance characterizing the second proxy with the entity instance of the signatory.
  • module 14 determines that the entity instance characterizing the second trustee corresponds to the entity instance characterizing the first proxy, and the entity instance characterizing the second proxy corresponds to the signatory entity instance, then module 14 proceeds to the step of forming a connection in the memory between an instance of the entity characterizing the legal entity and an instance of the entity characterizing the second authorized person, on the basis of which the existence of a connection between the instance of the applicant’s entity and the instance of the signatory’s entity will be determined. Additionally, before forming said relationship between entity instances, said module 14 may analyze the scope of authority contained in the first power of attorney and determine that it includes the authority of the first proxy to delegate the right to submit and sign applications.
  • module 14 If, as a result of comparison, at least one pair of entities does not match or module 14 determines that the scope of powers given in the first power of attorney does not contain the authority of the first authorized person to transfer the right to submit and sign applications, then module 14 generates the results of checking the set of documents , indicating that the authority representative by power of attorney are not confirmed by the documents attached to the set of documents.
  • the document verification module 14 in the previously disclosed manner for the first power of attorney, can determine the scope of powers given in the second power of attorney, as well as determine that the validity period of the powers of the authorized person has not expired on the current date or the date of signing the application and perform checks for the availability of powers on submission of the document to the document filing authority.
  • the generated verification results are sent by the document verification module 14 to the document generation module 15, which, based on the generated verification results, displays information to the user of the system 10, information that the set of documents has not been checked for correct completion of documents and/or sufficiency, and also information about the set of entities and/or instances of entities that failed the check, or said module 15 selects a procedural document template related to the passed and failed check based on the extracted set of entities, taking into account information about at least one relationship between the entity instances.
  • Document templates and corresponding sets of entities can be predefined by the developer of the system 10, and the document template contains textual information of the document for generating a draft document, as well as pointers indicating how the mentioned module 15 should arrange instances of entities in the textual information of the document.
  • Document templates and draft documents can also be generated by widely known methods, for example, those disclosed in the previously mentioned patent RU 134341 U1, publ. 11/10/2013.
  • a computing device contains one or more processors (201), memory devices, such as RAM (202) and ROM (203), and interfaces, united by a common information exchange bus. input/output devices (204), input/output devices (205), and network communication device (206).
  • the processor (201) may be selected from a variety of devices commonly used today, for example, from manufacturers such as: IntelTM, AMDTM, AppleTM, Samsung Exynos TM, MediaTEKTM, Qualcomm SnapdragonTM, etc.
  • the processor or one of the usable processors in the device (200) must also include a graphics processor, for example an NVIDIA GPU with a CUDA-compatible programming model or Graphcore, the type of which is also suitable for carrying out the method in whole or in part, and can also be used for training and application of machine learning models in various information systems.
  • a graphics processor for example an NVIDIA GPU with a CUDA-compatible programming model or Graphcore, the type of which is also suitable for carrying out the method in whole or in part, and can also be used for training and application of machine learning models in various information systems.
  • RAM (202) is a random access memory and is designed to store machine-readable instructions executed by the processor (201) to perform the necessary logical data processing operations.
  • the RAM (202) typically contains executable operating system instructions and associated software components (applications, program modules, etc.). In this case, the available memory capacity of the graphics card or graphics processor can act as RAM (202).
  • the ROM (203) is one or more permanent storage devices, such as a hard disk drive (HDD), a solid state drive (SSD), flash memory (EEPROM, NAND, etc.), optical storage media ( CD-R/RW, DVD-R/RW, BlueRay Disc, MD), etc.
  • I/O interfaces To organize the operation of device components (200) and organize the operation of external connected devices, various types of I/O interfaces (204) are used. The choice of appropriate interfaces depends on the specific design of the computing device, which can be, but is not limited to: PCI, AGP, PS/2, IrDa, FireWire, LPT, COM, SATA, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232, etc.
  • various means (205) of I/O information are used, for example, a keyboard, a display (monitor), a touch display, a touch pad, a joystick, a mouse, a light pen, a stylus, touch panel, trackball, speakers, microphone, augmented reality, optical sensors, tablet, light indicators, projector, camera, biometric identification tools (retina scanner, fingerprint scanner, voice recognition module), etc.
  • the network communication means (206) provides data transmission via an internal or external computer network, for example, an Intranet, the Internet, a LAN, etc.
  • One or more means (206) may be used, but not limited to: Ethernet card, GSM modem, GPRS modem, LTE modem, 5G modem, satellite communication module, NFC module, Bluetooth and/or BLE module, Wi-Fi module and etc.
  • satellite navigation tools can also be used as part of the device (200), for example, GPS, GLONASS, BeiDou, Galileo.

Abstract

Представленное техническое решение относится, в общем, к области вычислительной техники, предназначенной для анализа изображений, а в частности к способам и системам обработки изображений документов, например, отсканированных документов или документов табличной формы, необходимых для взыскания задолженности, в частности изображений заявлений процессуального характера о взыскании задолженности, доверенностей, выписок из ЕГРЮЛ и пр. Техническим результатом является расширение функциональных возможностей за счет обеспечения возможности проверки полномочий подписанта выступать от имени заявителя. Указанный технический результат достигается благодаря осуществлению способа проверки комплекта документов, выполняемого по меньшей мере одним вычислительным устройством, содержащего этапы, на которых: получают комплект документов с текстовой информацией, содержащий по меньшей мере одно заявление; извлекают сущность заявителя и сущность подписанта; определяют наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта, подтверждающей полномочия подписанта выступать от имени заявителя; формируют результаты успешной проверки комплекта документов в связи с наличием упомянутой связи между экземплярами сущностей.

Description

СПОСОБ И СИСТЕМА ОБРАБОТКИ ИЗОБРАЖЕНИЙ ДОКУМЕНТОВ
ОБЛАСТЬ ТЕХНИКИ
[0001] Представленное техническое решение относится, в общем, к области вычислительной техники, предназначенной для анализа изображений, а в частности к способам и системам обработки изображений документов, например, отсканированных документов или документов табличной формы, необходимых для взыскания задолженности, в частности изображений заявлений процессуального характера о взыскании задолженности, доверенностей, выписок из ЕГРЮЛ и пр.
УРОВЕНЬ ТЕХНИКИ
[0002] В настоящее время существует проблема оперативной и качественной обработки данных комплекта отсканированных документов с целью проверки достаточности документов, наличия обязательных заполненных полей в документах, полномочий подписантов и прочего содержимого документов. Из уровня техники известны различные решения, выполненные с возможностью обработки комплекта документов, например, клиента банка, реализованные на базе ПО ABBYY FlexiCapture и пр.
[0003] Известно решение для проведения проверки комплекта документов, раскрытое в заявке US 2011134494 (А1), опубл. 09.06.2011 , в котором осуществляется чтение документа, имеющего множество страниц; проверку данных изображения каждой страницы документа, имеющего множество страниц, при этом проверяются определенные области изображения документа на наличие в них информации и ее отсутствие.
[0004] Также известны способ и система для проверки электронного комплекта документов, раскрытые в патенте RU 2 702 967 С1 , опубл. 14.10.2019. Известное решение содержит этапы, на которых: получают изображение документа, состоящего из по меньшей мере одной страницы; распознают символы на изображении страницы документа и преобразует их в текстовую информацию; формируют вектор страницы документа на основе текстовой информации, полученной на предыдущем этапе; определяют на основе вектора страницы документа тип документа и тип его страницы; определяют перечень страниц и по меньшей мере один атрибут подписанта, наличие которых необходимо проверить в данном типе документа; проверяют наличие перечня страниц и по меньшей мере одного атрибута подписанта на полученном изображении документа для определения комплектности документа.
[0005] Существенным недостатком известных решений является их ограниченный функционал, необходимый для полной проверки документов и принятия решения по результатам упомянутой проверки, в том числе для решения задач приказного судопроизводства.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
[0006] Технической проблемой или задачей, поставленной в данном техническом решении, является создание нового эффективного, простого и надежного метода автоматизированной проверки комплекта документов, состоящего из по меньшей мере одного документа, требующих рассмотрения и обработки именно как комплект, на корректность и достаточность их заполнения с точки зрения гражданского процессуального права России.
[0007] Техническим результатом является расширение функциональных возможностей за счет обеспечения возможности проверки полномочий подписанта выступать от имени заявителя.
[0008] Указанный технический результат достигается благодаря осуществлению способа проверки комплекта документов, выполняемого по меньшей мере одним вычислительным устройством, содержащего этапы, на которых:
- получают комплект документов с текстовой информацией, содержащий по меньшей мере одно заявление;
- извлекают сущность заявителя и сущность подписанта;
- определяют наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта, подтверждающей полномочия подписанта выступать от имени заявителя;
- формируют результаты успешной проверки комплекта документов в связи с наличием упомянутой связи между экземплярами сущностей.
[0009] В одном из частных примеров осуществления способа комплект документов дополнительно содержит выписку из Единого государственного реестра юридических лиц (ЕГРЮЛ), причем этап определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта содержит этапы, на которых:
- определяют наличие выписки из ЕГРЮЛ в комплекте документов; - извлекают по меньшей мере одну сущность, относящуюся к юридическому лицу (ЮЛ) и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ;
- определяют, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя;
- определяют, что экземпляр сущности, характеризующий руководителя ЮЛ, соответствует экземпляру сущности подписанта;
- формируют в памяти устройства связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим руководителя ЮЛ, на основе которой определяется наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта.
[0010] В другом частном примере осуществления способа комплект документов дополнительно содержит выписку из ЕГРЮЛ и по меньшей мере одну доверенность, причем этап определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта содержит этапы, на которых:
- определяют наличие выписки из ЕГРЮЛ в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к юридическому лицу (ЮЛ) и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ;
- определяют, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя;
- определяют, что экземпляр сущности, характеризующий руководителя ЮЛ, не соответствует экземпляру сущности подписанта;
- определяют наличие доверенности в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к доверителю, и по меньшей мере одну сущность, относящуюся к доверенному лицу;
- определяют, что экземпляр сущности, характеризующий доверителя, соответствует экземпляру сущности, характеризующему руководителя ЮЛ;
- определяют, что экземпляр сущности, характеризующий доверенного лица, соответствует экземпляру сущности подписанта;
- формируют в памяти устройства связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо, на основе которой определяется наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта.
[0011] В другом частном примере осуществления способ дополнительно содержит этапы, на которых: - определяют объем полномочий, приведенных в доверенности;
- определяют, что упомянутый объем полномочий включает полномочия доверенного лица выступать в качестве подателя и подписанта заявления.
[0012] В другом частном примере осуществления способ дополнительно содержит этап, на котором определяют, что срок действия полномочий доверенного лица не истек на текущую дату или дату подписания заявления.
[0013] В другом частном примере осуществления способа комплект документов дополнительно содержит выписку из ЕГРЮЛ и по меньшей мере две доверенности, причем этап определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта содержит этапы, на которых:
- определяют наличие выписки из ЕГРЮЛ в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к юридическому лицу (ЮЛ) и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ;
- определяют, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя;
- определяют, что экземпляр сущности, характеризующий руководителя ЮЛ, не соответствует экземпляру сущности подписанта;
- определяют наличие первой доверенности в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к первому доверителю, и по меньшей мере одну сущность, относящуюся к первому доверенному лицу;
- определяют, что экземпляр сущности, характеризующий первого доверителя, соответствует экземпляру сущности, характеризующему руководителя ЮЛ;
- определяют, что экземпляр сущности, характеризующий первого доверенного лица, не соответствует экземпляру сущности подписанта;
- определяют наличие второй доверенности в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к второму доверителю, и по меньшей мере одну сущность, относящуюся к второму доверенному лицу;
- определяют, что экземпляр сущности, характеризующий второго доверителя, соответствует экземпляру сущности, характеризующему первое доверенное лицо;
- определяют, что экземпляр сущности, характеризующий второе доверенное лицо, соответствует экземпляру сущности подписанта; - формируют в памяти устройства связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим второе доверенное лицо, на основе которой определяется наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта.
[0014] В другом частном примере осуществления способ дополнительно содержит этапы, на которых:
- определяют, что упомянутый объем полномочий первой доверенности включает наличие полномочий первого доверенного лица передавать право на подачу и подписание заявлений.
[0015] В другом частном примере осуществления способ дополнительно содержит этап, на котором определяют, что срок действия полномочий доверенного лица не истек на текущую дату или дату подписания заявления.
[0016] В другом предпочтительном варианте осуществления заявленного решения представлена система проверки комплекта документов, содержащая по меньшей мере одно вычислительное устройство и по меньшей мере одно устройство памяти, содержащее машиночитаемые инструкции, которые при их исполнении по меньшей мере одним вычислительным устройством выполняют вышеуказанный способ.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0017] Признаки и преимущества настоящего технического решения станут очевидными из приводимого ниже подробного описания изобретения и прилагаемых чертежей, на которых:
[0018] на Фиг. 1 представлена общая схема взаимодействия элементов системы обработки изображений документов.
[0019] на Фиг. 2 представлен пример общего вида вычислительного устройства.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
[0020] Ниже будут описаны понятия и термины, необходимые для понимания данного технического решения.
[0021] В данном техническом решении под системой подразумевается, в том числе компьютерная система, ЭВМ (электронно-вычислительная машина), ЧПУ (числовое программное управление), ПЛК (программируемый логический контроллер), компьютеризированные системы управления и любые другие устройства, способные выполнять заданную, четко определенную последовательность операций (действий, инструкций).
[0022] Под устройством обработки команд подразумевается электронный блок, вычислительное устройство, либо интегральная схема (микропроцессор), исполняющая машинные инструкции (программы).
[0023] Устройство обработки команд считывает и выполняет машинные инструкции (программы) с одного или более устройств хранения данных. В роли устройства хранения данных могут выступать, но не ограничиваясь, жесткие диски (HDD), флеш-память, ПЗУ (постоянное запоминающее устройство), твердотельные накопители (SSD), оптические приводы.
[0024] Программа - последовательность инструкций, предназначенных для исполнения устройством управления вычислительной машины или устройством обработки команд.
[0025] База данных (БД) - совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, причем такое собрание данных, которое поддерживает одну или более областей применения (ISO/IEC 2382:2015, 2121423 «database»).
[0026] Содержимое документа - данные, представляющие информацию документа и предназначенные для восприятия человеком (ГОСТ Р 52292-2004).
[0027] Сущность - любой различимый объект (объект, который мы можем отличить от другого), информацию о котором необходимо хранить в базе данных. [0028] Экземпляр сущности — это конкретный представитель данной сущности. Например, представителем сущности "Сотрудник" может быть "Сотрудник Иванов". Экземпляры сущностей должны быть различимы, т.е. сущности должны иметь некоторые свойства, уникальные для каждого экземпляра этой сущности.
[0029] В соответствии со схемой, приведенной на фиг. 1 , система 10 обработки изображений документов содержит соединенные между собой: модуль 11 преобразования данных, модуль 12 классификации документов, модуль 13 извлечения сущностей, модуль 14 проверки документов и модуль 15 формирования документов. Указанные модули могут быть реализованы на базе программноаппаратных средств системы 10 обработки изображений документов, например, на базе по меньшей мере одного вычислительного устройства, в частности микропроцессора, и по меньшей мере одного устройства памяти, содержащего машиночитаемые инструкции, например, написанные на языке программирования Python, для осуществления выполняемых модулями функций. Например, модуль 11 преобразования данных может быть реализован на базе инструмента для оптического распознавания символов (англ, optical character recognition, OCR). Модуль 12 классификации документов может быть реализован на базе программно-аппаратных средств системы 10, сконфигурированных для представления текста в виде векторов (например, TFIDF), и включать набор моделей классификации этих векторов, например, SVM (Support Vector Machine) или Random Forest. Модуль 13 извлечения сущностей может включать набор моделей для анализа семантики естественных языков word2vec, заранее обученные математические модели - глубокие нейронные сети различной архитектуры (CNN (convolutional neural network), BiLSTM (Bidirectional Long Short- Term Memory), Transformer) и вычислительные средства для обработки естественного языка (Natural Language Processing, NLP). Модуль 15 формирования документов может быть реализован на базе технических средств, раскрытых, например, в патенте RU 134341 U1 , опубл. 10.11.2013, и оснащен базой данных шаблонных документов, используемых для формирования проектов документов, а также средствами ввода/вывода информации, широко известными из уровня техники, для вывода пользователю системы 10 изображений проектов документов и средствами передачи информации по проводным или беспроводным каналам связи для передачи сформированных проектов документов.
[0030] На первом этапе работы системы 10 в модуль 11 преобразования данных поступает изображение комплекта документов, в частности отсканированных страницы документов, например, файл в формате многостраничного PDF, JPEG, TIFF или любом другом известном формате, который может использоваться для хранения изображений отсканированного документа. Изображение комплекта документов может поступать от источника данных изображений 1 , в частности непосредственно от устройства сканирования документов, например, сканера, либо могут быть извлечены из соответствующей базы данных изображений, в которую данные изображения документов заранее сохранены.
[0031] Комплект документов может включать любой документ, состоящий по меньшей мере из одной страницы с текстовой информацией, содержащий атрибуты подписанта, в частности его печать и/или подпись, и заполненный в соответствии с известным шаблоном документа. Документом может быть, например, заявление, в частности о вынесении судебного приказа о взыскании задолженности, выписка из ЕГРЮЛ, доверенность (выдаваемые руководителем организации и выдаваемые в порядке передоверия) и прочий известный документ. Документ может содержать поля, в которых указана информация о подписанте, например, ФИО подписанта - представителя взыскателя, адрес места нахождения взыскателя, и прочую информацию.
[0032] Модуль 11 преобразования данных осуществляет распознавание символов на изображении комплекта документов и преобразует их в текстовую информацию, после чего текстовая информация комплекта документов направляются в модуль 12 классификации документов. Модуль 12 полученную текстовую информацию преобразует в семантическое векторное представление документа (embedding, см., например, книгу «Speech and Language Processing», Daniel Jurafsky & James H. Martin, главу «Vector Semantics and Embeddings», размещенную в Интернет по адресу: https://web.stanford.edU/~jurafsky/slp3/6.pdf), которое обрабатывается заранее заданным набором моделей классификации векторов для определения типа документа, входящего в состав комплекта документов. Способы обработки векторов набором моделей классификации векторов для определения типа документа широко известны из уровня техники и более подробно не будут раскрываться в настоящей заявке.
[0033] Далее модуль 12 на основе данных о типах документов, входящих в состав комплекта документов, формирует данные о границах изображения комплекта документов и типах документа, изображение которого находится между упомянутыми границами. Полученная модулем 12 текстовая информация, изображение комплекта документов, данные о границах изображения документа и типах документа направляются в модуль 13 извлечения сущностей, который извлекает из полученной текстовой информации набор сущностей в соответствии с типом документа, а также данные об экземплярах сущностей. Набор сущностей может включать по меньшей мере одну: сущность подписанта заявления; сущность заявителя (взыскателя); сущность, относящуюся к ЮЛ; сущность, относящуюся к руководителю ЮЛ; сущность, относящуюся к доверителю; сущность, относящуюся к доверенному лицу; а также наименование организации, адрес местонахождения организации, ИНН и ОГРН организации, дата регистрации организации, дату выдачи доверенности, срок действия доверенности, набор полномочий по доверенности и т.д., а данные об экземплярах сущностей могут содержать ФИО конкретного лица, конкретный адрес лица, наименование организации, конкретный адрес организации и пр. Для извлечения из полученной текстовой информации набора сущностей и экземпляров сущностей модуль 13 выполняет токенизацию текстовой информации и подает токенизированную текстовую информацию на вход набору моделей word2vec, на выходе которого модуль 13 получает последовательность векторов для каждого документа.
[0034] Далее модуль 13 на основе данных о типе документа определяет обученные модели машинного обучения (например, нейронные сети таких архитектур, как BiLSTM-CNN, BERT) для решения задачи извлечения именованных сущностей (named entity recognition). Последовательности векторов документов обрабатываются упомянутыми обученными моделями, которые определяют набор сущностей и экземпляры сущностей для каждого документа. Обученные модели машинного обучения, посредством которых извлекаются сущности, могут быть заранее заданы в памяти упомянутого модуля 13 разработчиком системы 10 для каждого типа документа. Такие модели машинного обучения широко используются в различных областях ИИ, в частности, для обработки текстовой информации и машинного перевода, и раскрыты, например, в статье Mikhail Arkhipov, Maria Trofimova, Yuri Kuratov, Alexey Sorokin «Tuning Multilingual Transformers for Language-Specific Named Entity Recognition», опубл, в Интернет по адресу: https://www.aclweb.org/antholoqv/W19-3712/ и статье Jason Р.С. Chiu, Eric Nichols, «Named Entity Recognition with Bidirectional LSTM-CNNs», опубл, в Интернет по адресу: https://arxiv.org/pdf/1511.08308v5.pdf
[0035] Обучение моделей машинного обучения может быть выполнено разработчиком посредством направления на вход упомянутых моделей заранее размеченной текстовой информации, характерной для данного типа документа. Например, для типа документа «заявление о вынесении судебного приказа о взыскании задолженности» разметка может указывать на то, что экземпляр сущности заявителя в текстовой информации содержится после характерного для заявителя слова, например, «заявитель» или «взыскать в пользу», а экземпляр сущности подписанта содержится после характерного для подписанта слова, например, «подписант». Также разметка может указывать на то, что экземпляр сущности находится перед характерным для данной сущности словом или словосочетанием, например, для упомянутого заявления разметка может указывать на то, что экземпляр сущности заявителя в текстовой информации содержится перед текстом «далее - Банк, Кредитор».
[0036] Таким образом, обученные модели машинного обучения после их обучения на размеченной текстовой информации обеспечат возможность извлечения из текстовой информации всех необходимых сущностей, требуемых для проведения проверки комплекта документов.
[0037] Дополнительно модулем 13 может быть извлечена сущность, характеризующая орган подачи документа, в частности заявления. Данная сущность может быть извлечена описанным ранее способом из соответствующей области документа, предназначенной для указания органа подачи документа, или посредством обученной модели машинного обучения, причем разметка текстовой информации, используемой для обучения упомянутой модели, может указывать на то, что экземпляр сущности органа подачи документа содержится в текстовой информации после характерного для органа подачи документа слова, например, слова «куда». Например, в документе «заявление о вынесении судебного приказа о взыскании задолженности» может быть указано, что он подан в суд, относящийся к судам общей юрисдикции, в связи с чем модулем 13 будет сформирована сущность органа подачи документа, содержащая экземпляр сущности «суд, относящийся к судам общей юрисдикции», и включена в набор сущностей.
[0038] Если данные о типе документа указывают на то, что документ - доверенность, то извлеченный модулем 13 набор сущностей из текстовой информации будет содержать следующие сущности: сущность доверителя; сущность доверенного лица; по меньшей мере одну сущность, характеризующую объем полномочий, приведенных в доверенности; сущность, характеризующую срок действия полномочий. Для извлечения сущностей модулем 13 также используются модели машинного обучения, обученные на размеченной текстовой информации, характерной для доверенностей.
[0039] Например, доверенность может содержать следующий текст: «Настоящей доверенностью Общество с ограниченной ответственностью «ООО» в лице генерального директора Иванова И. И., на основании Устава «ООО» доверяет Петрову П.П. полномочия подписывать и подавать заявления в суды общей юрисдикции заявления скором на 3 года». Соответственно, извлеченный модулем 13 набор сущностей из приведенного текста будет содержать следующие сущности:
- сущность доверителя, содержащую экземпляр сущности «Иванов И. И.»;
- сущность доверенного лица, содержащую экземпляр «Петров П.П.»;
- сущность, характеризующую право подавать заявления в суды, относящиеся к судам общей юрисдикции; - сущность, характеризующую право подписывать заявления, подаваемые в суды, относящиеся к судам общей юрисдикции;
- сущность, характеризующую срок действия полномочий «3 года».
[0040] Полученный набор сущностей для каждого типа документа и данные об экземплярах сущностей модуль 13 извлечения данных направляет в модуль 14 проверки документов, который выполняет проверку содержимого в документах на предмет правильности заполнения документов и достаточности на основе извлеченного набора сущностей согласно типу документа. Для выполнения упомянутой проверки на достаточность заполнения документов модуль 14 проверки документов может быть оснащен базой данных с эталонными наборами сущностей для типовых страниц документов. Модуль 14 проверки документов сравнивает набор сущностей, полученный от модуля 13, с эталонным набором сущностей для типовых страниц документов. Если установленные пользователем системы 10 пороговые значения совпадающих сущностей в наборе сущностей с сущностями эталонного набора сущностей достигнуты, то упомянутый модуль 14 принимает решение о том, что содержимого в документе достаточно. Соответственно, если упомянутые пороговые значения совпадающих сущностей не достигнуты, то упомянутый модуль 14 принимает решение о том, что содержимого в документе недостаточно.
[0041] Например, для типа документа «Заявление о вынесении судебного приказа» набор эталонных сущностей может содержать сущности, характеризующие данные взыскателя, должника, сумму для взыскания, дату подачи заявления и пр. Соответственно, если в результате сравнения сущностей описанным ранее способом модулем 14 проверки документов будет установлено, что в полученном наборе сущностей от модуля 13 извлечения данных отсутствует какая-либо сущность, например, сущность, характеризующая должника или заявителя, то принимается решение о том, что содержимого в документе недостаточно.
[0042] Для выполнения проверки содержимого на предмет правильности заполнения документов модуль 14 проверки документов известными из уровня техники методами сравнивает экземпляры сущностей в каждом типе сущности. Если экземпляры сущностей в каждом типе сущности совпадают, то модуль 14 проверки документов принимает решение о том, что документы правильно заполнены. Соответственно, если экземпляры сущностей в типах сущности не совпадают, то модуль 14 проверки документов принимает решение о том, что документы заполнены неправильно.
[0043] Например, для типов документа «Заявление о вынесении судебного приказа о взыскании задолженности» и «Кредитный договор» модуль 14 проверки документов может сравнить экземпляры сущностей таких типов сущностей, как должник. Например, если экземпляры сущностей, характеризующие ФИО должника, и относящиеся к сущности, характеризующие данные должника, извлеченные из упомянутого заявления, отличаются от упомянутых экземпляров сущностей, извлеченных из кредитного договора, т.е. извлеченный из заявления экземпляр сущности, относящийся к должнику, содержит данные «Иванов И. И.», а извлеченный из кредитного договора экземпляр сущности относящийся к должнику, содержит данные ФИО «Петров П.П.», то модуль 14 проверки документов принимает решение о том, что документы заполнены неправильно. В тоже время если в результате сравнения упомянутым модулем 14 было определено, что упомянутые экземпляры сущности, относящиеся к сущности, характеризующие данные должника, содержат только лишь данные «Иванов И. И.», то принимается решение о том, что документы заполнены правильно. Экземпляры сущностей, сравнение которых необходимо выполнить, могут быть заранее заданы в программно-аппаратном алгоритме разработчиком модуля 14 проверки документов.
[0044] Дополнительно модуль 14 проверки документов может быть выполнен с возможностью проверки полномочий подписанта выступать от имени заявителя. Для этого упомянутый модуль 14 извлекает из полученного ранее набора сущностей, относящегося к заявлению, сущность заявителя и сущность подписанта и обращается к памяти, которой он может быть оснащен, для поиска данных, указывающих на наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта, подтверждающей полномочия подписанта выступать от имени заявителя. Упомянутая связь между экземпляром сущности заявителя и экземпляром сущности подписанта может быть заранее задана разработчиком в памяти упомянутого модуля 14.
[0045] Например, если комплект документов содержит заявление, поданное от имени ЮЛ «ООО» и подписанное его руководителем «Иванов И. И.», то связь между экземпляром сущности заявителя «ООО» и экземпляром сущности подписанта «Иванов И. И.», сохраненная в памяти модуля 14, будет указывать на то, что «Иванов И. И.» имеет полномочия выступать от имени заявителя «ООО». [0046] Если связь между экземпляром сущности заявителя и экземпляром сущности подписанта упомянутым модулем 14 была найдена, то модуль 14 определяет наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта, подтверждающей полномочия подписанта выступать от имени заявителя, после чего формирует результаты успешной проверки комплекта документов в связи с наличием упомянутой связи между экземплярами сущностей. В альтернативном варианте реализации решения информация о наличии полномочий подписанта выступать от имени заявителя может быть включена в результаты проверки документа на предмет правильности заполнения документов. [0047] Дополнительно модуль 14 проверки документов может быть выполнен с возможностью формирования в памяти по меньшей мере одной связи между экземплярами сущностей в процессе выполнения этапа определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта. Для этого модуль 14 определят наличие выписки из ЕГРЮЛ в комплекте документов, которые ранее были проклассифицированы, и извлекает из набора сущностей, относящегося к выписке из ЕГРЮЛ, по меньшей мере одну сущность, относящуюся к ЮЛ и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ. Например, сущность, относящаяся к ЮЛ, может содержать экземпляр сущности «ООО», а сущность, относящаяся к руководителю ЮЛ, может содержать экземпляр сущности «Иванов И. И.».
[0048] Далее упомянутый модуль 14 сравнивает экземпляр сущности, характеризующий ЮЛ, с экземпляром сущности заявителя, а экземпляр сущности, характеризующий руководителя ЮЛ, с экземпляром сущности подписанта. Поскольку в приведенном выше примере экземпляр сущности, характеризующий ЮЛ, и экземпляр сущности заявителя представляют ЮЛ «ООО», а экземпляр сущности, характеризующий руководителя ЮЛ, и экземпляр сущности подписанта представляют «Иванов И. И.», то модуль 14 принимает решение о том, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя, а экземпляр сущности, характеризующий руководителя ЮЛ, соответствует экземпляру сущности подписанта, после чего модуль 14 формирует в памяти связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим руководителя ЮЛ, на основе которой будет в дальнейшем определено наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта. [0049] Если модуль 14 проверки документов в результате сравнения экземпляров сущностей определил, что экземпляр сущности, характеризующий руководителя ЮЛ, не соответствует экземпляру сущности подписанта, например, экземпляр сущности подписанта представляет собой «Петров П.П.», то упомянутый модуль 14 осуществляет определение наличия доверенности в комплекте документов. Если в комплекте документов отсутствует доверенность, то упомянутый модуль 14 формирует результаты проверки комплекта документов, указывающие на то, что полномочия представителя не подтверждены приложенными документами к комплекту документов.
[0050] Если модуль 14 проверки документов определил наличие доверенности в комплекте документов, то упомянутый модуль 14 извлекает из набора сущностей, относящегося к доверенности, по меньшей мере одну сущность, относящуюся к доверителю, и по меньшей мере одну сущность, относящуюся к доверенному лицу. Например, сущность, относящаяся к доверителю, может представлять собой «Иванов И. И.», а сущность, относящаяся к доверенному лицу, может представлять собой «Петров П.П».
[0051] Далее модуль 14 проверки документов сравнивает экземпляр сущности, характеризующий доверителя, с экземпляром сущности, характеризующим руководителя ЮЛ, а экземпляр сущности, характеризующий доверенного лица, с экземпляром сущности подписанта. Поскольку в приведенном ранее примере экземпляр сущности, характеризующий доверителя, совпадает с экземпляром сущности, характеризующим руководителя ЮЛ, и представляют собой ««Иванов И. И.», а экземпляр сущности, характеризующий доверенного лица, совпадает с экземпляром сущности подписанта и представляет собой «Петров П.П», то модуль 14 формирует в памяти устройства связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо, на основе которой далее будет определено наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта. Соответственно, в памяти устройства будет сформирована связь между экземпляром сущности ЮЛ «ООО» и экземпляром сущности «Петров П.П.».
[0052] Таким образом, если в качестве заявителя в заявлении о вынесении судебного приказа будет указано юридическое лицо, а подписантом заявления будет является доверенное лицо, то после проверки документа с учетом сформированной связи между экземплярами сущностей модуль 14 проверки документов примет решение о том, что документы заполнены верно, после чего упомянутый модуль 14 сформирует результаты проверки, указывающие на то, что проверка содержимого в документах прошла успешно. Дополнительно перед формированием упомянутой связи между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо, модуль 14 проверки документа может выполнить проверку наличия полномочий доверенного лица выступать в качестве подателя и подписанта заявления. Для этого модуль 14 на основе набора сущностей, извлеченных из доверенности, определяет объем полномочий, приведенных в доверенности.
[0053] Если модуль 14 определил, что упомянутый объем полномочий включает полномочия доверенного лица выступать в качестве подателя и подписанта заявления, т.е. набор сущностей содержит сущность, характеризующую право подавать заявления в суды, относящиеся к судам общей юрисдикции, и сущность, характеризующую право подписывать заявления, подаваемые в суды, относящиеся к судам общей юрисдикции, то модуль 14 переходит к этапу формирования упомянутой связи между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо. Если объем полномочий не включает полномочия доверенного лица выступать в качестве подателя или подписанта заявления, т.е. набор сущностей не содержит сущность, характеризующую право подавать заявления в суды, относящиеся к судам общей юрисдикции, или сущность, характеризующую право подписывать заявления, подаваемые в суды, относящиеся к судам общей юрисдикции, то модуль 14 формирует результаты проверки комплекта документов, указывающие на то, что полномочия представителя не подтверждены приложенными документами к комплекту документов.
[0054] Также дополнительно перед формированием упомянутой связи между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо, модуль 14 проверки документа может выполнить проверку срока действия полномочий доверенного лица. Для этого модуль 14 извлекает из набора сущностей, относящейся к доверенности, информацию, характеризующую срок действия полномочий доверенного лица, и сравнивает его с текущей датой или датой подписания заявления. Если модуль 14 определил, что срок полномочий доверенного лица не истек на текущую дату или дату подписания заявления, то модуль 14 переходит к этапу формирования упомянутой связи между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо. Если срок действия полномочий на текущую дату или дату подписания заявления истек, то модуль 14 формирует результаты проверки комплекта документов, указывающие на то, что полномочия представителя по доверенности не подтверждены приложенными документами к комплекту документов.
[0055] Кроме того, модуль 14 проверки документов может быть выполнен с возможностью проверки наличия полномочий на подачу документа в орган подачи документа, указанный, например, в заявлении. Для этого модуль 14 из набора сущностей, извлеченного из заявления, извлекает сущность, характеризующую орган подачи документа, например, содержащую экземпляр сущности, относящийся к суду общей юрисдикции, и проверяет, содержится ли в наборе сущностей, извлеченном из доверенности, сущность, характеризующая право подавать документ в указанный орган подачи документа. В приведенном выше примере набор сущностей содержит сущность, характеризующую право подавать заявления в суды, относящиеся к судам общей юрисдикции, в связи с чем модуль 14 прейдет к этапу формирования упомянутой связи между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо. Если в наборе сущностей отсутствует сущность, характеризующая право подавать документ в указанный орган подачи документа, то модуль 14 формирует результаты проверки комплекта документов, указывающие на то, что полномочия представителя по доверенности не подтверждены приложенными документами к комплекту документов.
[0056] В альтернативном варианте реализации заявленного решения комплект документов может содержать две доверенности. В данном варианте этап определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта также содержит раскрытые ранее этапы, на которых: определяют наличие выписки из ЕГРЮЛ в комплекте документов; извлекают по меньшей мере одну сущность, относящуюся к юридическому лицу (ЮЛ) и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ; определяют, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя.
[0057] Далее после того, как модуль 14 определит, что экземпляр сущности, характеризующий руководителя ЮЛ, не соответствует экземпляру сущности подписанта, упомянутый модуль 14 осуществляет поиск и определение наличия первой доверенности в комплекте документов, извлекает по меньшей мере одну сущность, относящуюся к по меньшей мере одному первому доверителю, и по меньшей мере одну сущность, относящуюся к по меньшей мере одну первому доверенному лицу, и сравнивает экземпляр сущности, характеризующий первого доверителя, с экземпляром сущности, характеризующим руководителя ЮЛ, а экземпляр сущности, характеризующий первого доверенного лица, с экземпляром сущности подписанта.
[0058] Если модулем 14 было определено, что экземпляр сущности, характеризующий первого доверителя, соответствует экземпляру сущности, характеризующему руководителя ЮЛ, а экземпляр сущности, характеризующий первого доверенного лица, не соответствует экземпляру сущности подписанта, то упомянуты модуль 14 осуществляет поиск и определение наличия второй доверенности в комплекте документов, после чего извлекает по меньшей мере одну сущность, относящуюся к второму доверителю, и по меньшей мере одну сущность, относящуюся к второму доверенному лицу. Далее модуль 14 сравнивает экземпляр сущности, характеризующий второго доверителя, с экземпляром сущности, характеризующим первое доверенное лицо, а экземпляр сущности, характеризующий второе доверенное лицо, с экземпляром сущности подписанта. [0059] Если упомянутым модулем 14 определено, что экземпляр сущности, характеризующий второго доверителя, соответствует экземпляру сущности, характеризующему первое доверенное лицо, а экземпляр сущности, характеризующий второе доверенное лицо, соответствует экземпляру сущности подписанта, то модуль 14 переходит к этапу формирования в памяти связи между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим второе доверенное лицо, на основе которой будет определяться наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта. Дополнительно перед формированием упомянутой связи между экземплярами сущностей упомянутый модуль 14 может проанализировать объем полномочий, приведенный в первой доверенности, и определить, что он включает полномочия первого доверенного лица передавать право на подачу и подписание заявлений.
[0060] Если в результате сравнения хотя бы одна пара сущностей не совпадает или модулем 14 определено, что объем полномочий, приведенный в первой доверенности, не содержит полномочия первого доверенного лица передавать право на подачу и подписание заявлений, то модуль 14 формирует результаты проверки комплекта документов, указывающие на то, что полномочия представителя по доверенности не подтверждены приложенными документами к комплекту документов.
[0061] Дополнительно модуль 14 проверки документов раскрытым ранее способом для первой доверенности может выполнить определение объема полномочий, приведенных во второй доверенности, а также определить, что срок действия полномочий доверенного лица не истек на текущую дату или дату подписания заявления и выполнить проверки наличия полномочий на подачу документа в орган подачи документа.
[0062] Сформированные результаты проверки модуль 14 проверки документов направляет в модуль 15 формирования документов, который на основе сформированных результатов проверки выводит информацию пользователю системы 10 информацию о том, что комплект документов не прошел проверку на предмет правильности заполнения документов и/или достаточности, а также информацию о наборе сущностей и/или экземпляров сущностей, не проведших проверку, либо упомянутый модуль 15 выбирает шаблон процессуального документа относящийся к проведенной и не пройденной проверке на основе извлеченного набора сущностей с учетом информации о по меньшей мере одной связи между экземплярами сущностей. Шаблоны документов и соответствующие наборы сущностей могут быть заранее заданы разработчиком систему 10, причем шаблон документа содержит текстовую информацию документа для формирования проекта документа, также указатели, указывающие на то, каким образом следует упомянутому модуль 15 расположить экземпляры сущностей в текстовой информации документа. Шаблоны документов и проекты документов могут быть также сформированы широко известными методами, например, раскрытыми в упомянутом ранее патенте RU 134341 U1 , опубл. 10.11.2013.
[0063] После того, как проект документа был выбран, модуль 15 формирования документов формирует проект документа на основании шаблона документа, в частности размещает в проекте документа текстовую информацию документа и экземпляры сущностей в соответствии с упомянутыми указателями. Проект документа может быть выведен упомянутым модулем 15 на средства В/В информации или передан на любое другое устройство посредством средств связи. [0064] В общем виде (см. фиг. 2) вычислительное устройство (200) содержит объединенные общей шиной информационного обмена один или несколько процессоров (201), средства памяти, такие как ОЗУ (202) и ПЗУ (203), интерфейсы ввода/вывода (204), устройства ввода/вывода (205), и устройство для сетевого взаимодействия (206).
[0065] Процессор (201) (или несколько процессоров, многоядерный процессор и т.п.) может выбираться из ассортимента устройств, широко применяемых в настоящее время, например, таких производителей, как: Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. Под процессором или одним из используемых процессоров в устройстве (200) также необходимо учитывать графический процессор, например, GPU NVIDIA с программной моделью, совместимой с CUDA, или Graphcore, тип которых также является пригодным для полного или частичного выполнения способа, а также может применяться для обучения и применения моделей машинного обучения в различных информационных системах.
[0066] ОЗУ (202) представляет собой оперативную память и предназначено для хранения исполняемых процессором (201) машиночитаемых инструкций для выполнения необходимых операций по логической обработке данных. ОЗУ (202), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.). При этом, в качестве ОЗУ (202) может выступать доступный объем памяти графической карты или графического процессора.
[0067] ПЗУ (203) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флэш-память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD-R/RW, BlueRay Disc, MD) и др.
[0068] Для организации работы компонентов устройства (200) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (204). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI, AGP, PS/2, IrDa, FireWire, LPT, COM, SATA, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п.
[0069] Для обеспечения взаимодействия пользователя с вычислительным устройством (200) применяются различные средства (205) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тач-пад, джойстик, манипулятор мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.
[0070] Средство сетевого взаимодействия (206) обеспечивает передачу данных посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п. В качестве одного или более средств (206) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.
[0071] Дополнительно могут применяться также средства спутниковой навигации в составе устройства (200), например, GPS, ГЛОНАСС, BeiDou, Galileo.
[0072] Конкретный выбор элементов устройства (200) для реализации различных программно-аппаратных архитектурных решений может варьироваться с сохранением обеспечиваемого требуемого функционала.
[0073] Модификации и улучшения вышеописанных вариантов осуществления настоящего технического решения будут ясны специалистам в данной области техники. Предшествующее описание представлено только в качестве примера и не несет никаких ограничений. Таким образом, объем настоящего технического решения ограничен только объемом прилагаемой формулы изобретения.

Claims

ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ проверки комплекта документов, выполняемый по меньшей мере одним вычислительным устройством, содержащий этапы, на которых:
- получают комплект документов с текстовой информацией, содержащий по меньшей мере одно заявление;
- извлекают сущность заявителя и сущность подписанта;
- определяют наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта, подтверждающей полномочия подписанта выступать от имени заявителя;
- формируют результаты успешной проверки комплекта документов в связи с наличием упомянутой связи между экземплярами сущностей.
2. Способ по п. 1, характеризующийся тем, что комплект документов дополнительно содержит выписку из единого государственного реестра юридических лиц (ЕГРЮЛ), причем этап определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта содержит этапы, на которых:
- определяют наличие выписки из ЕГРЮЛ в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к юридическому лицу (ЮЛ) и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ;
- определяют, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя;
- определяют, что экземпляр сущности, характеризующий руководителя ЮЛ, соответствует экземпляру сущности подписанта;
- формируют в памяти устройства связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим руководителя ЮЛ, на основе которой определяется наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта.
3. Способ по п. 1 , характеризующийся тем, что комплект документов дополнительно содержит выписку из ЕГРЮЛ и по меньшей мере одну доверенность, причем этап определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта содержит этапы, на которых:
- определяют наличие выписки из ЕГРЮЛ в комплекте документов; - извлекают по меньшей мере одну сущность, относящуюся к юридическому лицу (ЮЛ) и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ;
- определяют, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя;
- определяют, что экземпляр сущности, характеризующий руководителя ЮЛ, не соответствует экземпляру сущности подписанта;
- определяют наличие доверенности в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к доверителю, и по меньшей мере одну сущность, относящуюся к доверенному лицу;
- определяют, что экземпляр сущности, характеризующий доверителя, соответствует экземпляру сущности, характеризующему руководителя ЮЛ;
- определяют, что экземпляр сущности, характеризующий доверенного лица, соответствует экземпляру сущности подписанта;
- формируют в памяти устройства связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим доверенное лицо, на основе которой определяется наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта.
4. Способ по п. 3, характеризующийся тем, что дополнительно содержит этапы, на которых:
- определяют объем полномочий, приведенных в доверенности;
- определяют, что упомянутый объем полномочий включает полномочия доверенного лица выступать в качестве подателя и подписанта заявления.
5. Способ по п. 4, характеризующийся тем, что дополнительно содержит этап, на котором определяют, что срок полномочий доверенного лица не истек на текущую дату или дату подписания заявления.
6. Способ по п. 1 , характеризующийся тем, что комплект документов дополнительно содержит выписку ЕГРЮЛ и по меньшей мере две доверенности, причем этап определения наличия связи между экземпляром сущности заявителя и экземпляром сущности подписанта содержит этапы, на которых:
- определяют наличие выписки из ЕГРЮЛ в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к юридическому лицу (ЮЛ) и по меньшей мере одну сущность, относящуюся к руководителю ЮЛ;
- определяют, что экземпляр сущности, характеризующий ЮЛ, соответствует экземпляру сущности заявителя; - определяют, что экземпляр сущности, характеризующий руководителя ЮЛ, не соответствует экземпляру сущности подписанта;
- определяют наличие первой доверенности в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к первому доверителю, и по меньшей мере одну сущность, относящуюся к первому доверенному лицу;
- определяют, что экземпляр сущности, характеризующий первого доверителя, соответствует экземпляру сущности, характеризующему руководителя ЮЛ;
- определяют, что экземпляр сущности, характеризующий первого доверенного лица, не соответствует экземпляру сущности подписанта;
- определяют наличие второй доверенности в комплекте документов;
- извлекают по меньшей мере одну сущность, относящуюся к второму доверителю, и по меньшей мере одну сущность, относящуюся к второму доверенному лицу;
- определяют, что экземпляр сущности, характеризующий второго доверителя, соответствует экземпляру сущности, характеризующему первое доверенное лицо;
- определяют, что экземпляр сущности, характеризующий второе доверенное лицо, соответствует экземпляру сущности подписанта;
- формируют в памяти устройства связь между экземпляром сущности, характеризующим ЮЛ, и экземпляром сущности, характеризующим второе доверенное лицо, на основе которой определяется наличие связи между экземпляром сущности заявителя и экземпляром сущности подписанта.
7. Способ по п. 6, характеризующийся тем, что дополнительно содержит этапы, на которых:
- определяют, что объем полномочий первой доверенности включает наличие полномочий первого доверенного лица передавать право на подачу и подписание заявлений.
8. Способ по п. 7, характеризующийся тем, что дополнительно содержит этап, на котором определяют, что срок действия полномочий доверенного лица не истек на текущую дату или дату подписания заявления.
9. Система проверки комплекта документов, содержащая по меньшей мере одно вычислительное устройство и по меньшей мере одно устройство памяти, содержащее машиночитаемые инструкции, которые при их исполнении по меньшей мере одним вычислительным устройством выполняют способ по любому из пп. 1-8.
PCT/RU2022/000249 2022-08-04 2022-08-04 Способ и система обработки изображений документов WO2024030042A1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2022121317A RU2022121317A (ru) 2022-08-04 Способ и система обработки изображений документов
RU2022121317 2022-08-04

Publications (1)

Publication Number Publication Date
WO2024030042A1 true WO2024030042A1 (ru) 2024-02-08

Family

ID=89849388

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2022/000249 WO2024030042A1 (ru) 2022-08-04 2022-08-04 Способ и система обработки изображений документов

Country Status (1)

Country Link
WO (1) WO2024030042A1 (ru)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110044547A1 (en) * 2004-02-15 2011-02-24 King Martin T method and system for character recognition
US20170212875A1 (en) * 2016-01-27 2017-07-27 Microsoft Technology Licensing, Llc Predictive filtering of content of documents
US10049096B2 (en) * 2015-06-19 2018-08-14 Infosys Limited System and method of template creation for a data extraction tool
US20180349776A1 (en) * 2017-06-01 2018-12-06 Accenture Global Solutions Limited Data reconciliation
RU2702967C1 (ru) * 2019-03-28 2019-10-14 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система для проверки электронного комплекта документов
EP3640847A1 (en) * 2018-10-17 2020-04-22 Capital One Services, LLC Systems and methods for identifying form fields
RU2739342C1 (ru) * 2019-09-17 2020-12-23 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система интеллектуальной обработки документа

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110044547A1 (en) * 2004-02-15 2011-02-24 King Martin T method and system for character recognition
US10049096B2 (en) * 2015-06-19 2018-08-14 Infosys Limited System and method of template creation for a data extraction tool
US20170212875A1 (en) * 2016-01-27 2017-07-27 Microsoft Technology Licensing, Llc Predictive filtering of content of documents
US20180349776A1 (en) * 2017-06-01 2018-12-06 Accenture Global Solutions Limited Data reconciliation
EP3640847A1 (en) * 2018-10-17 2020-04-22 Capital One Services, LLC Systems and methods for identifying form fields
RU2702967C1 (ru) * 2019-03-28 2019-10-14 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система для проверки электронного комплекта документов
RU2739342C1 (ru) * 2019-09-17 2020-12-23 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ и система интеллектуальной обработки документа

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BRUCHES E.P.: "Methods and algorithms for recognizing and linking entities for building systems for automatically extracting information from scientific texts", DISSERTATSIYA, ,, FGBUN ISI IM. A. P. ERSHOVA SIBIRSKOGO OTDELENIYA AKADEMII NAUK, NOVOSIBIRSK, RUSSIA, Novosibirsk, Russia, XP009553711, Retrieved from the Internet <URL:https://vak.minobrnauki.gov.ru/advert/100062182> [retrieved on 20230322] *

Similar Documents

Publication Publication Date Title
CN104508658B (zh) 基于短语的词典提取和翻译质量评估
US8170868B2 (en) Extracting lexical features for classifying native and non-native language usage style
US10049096B2 (en) System and method of template creation for a data extraction tool
CN109190098A (zh) 一种基于自然语言处理的文档自动生成方法和系统
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
CN112395391B (zh) 概念图谱构建方法、装置、计算机设备及存储介质
CN116912847A (zh) 一种医学文本识别方法、装置、计算机设备及存储介质
US20170178528A1 (en) Method and System for Providing Automated Localized Feedback for an Extracted Component of an Electronic Document File
CN112749277B (zh) 医学数据的处理方法、装置及存储介质
CN112464927B (zh) 一种信息提取方法、装置及系统
RU2702967C1 (ru) Способ и система для проверки электронного комплекта документов
US20140279642A1 (en) Systems and methods for enrollment and identity management using mobile imaging
RU2732071C1 (ru) Способ и система автоматического принятия правового решения
RU2739342C1 (ru) Способ и система интеллектуальной обработки документа
WO2024030042A1 (ru) Способ и система обработки изображений документов
US20220076008A1 (en) Systems and methods for enrollment and identity management using mobile imaging
WO2021054850A1 (ru) Способ и система интеллектуальной обработки документа
CN114842385A (zh) 学科教培视频审核方法、装置、设备及介质
US11423228B2 (en) Weakly supervised semantic entity recognition using general and target domain knowledge
EA040560B1 (ru) Способ и система интеллектуальной обработки документа
CN111882419A (zh) 质检文件的方法、装置及服务器
CN111985935A (zh) 一种商户信息的检验方法、装置及设备
CN116384418B (zh) 一种应用智能手表进行翻译的数据处理方法及系统
US20240061761A1 (en) Device, system, and method for text semantic analysis using source code analysis, and chatbot question-answer service providing method using same
CN110109774B (zh) 一种通过SCM知识库生成Secedit可识别的INF文件的方法与系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22954133

Country of ref document: EP

Kind code of ref document: A1