WO2022102965A1 - Method for analyzing document - Google Patents
Method for analyzing document Download PDFInfo
- Publication number
- WO2022102965A1 WO2022102965A1 PCT/KR2021/013488 KR2021013488W WO2022102965A1 WO 2022102965 A1 WO2022102965 A1 WO 2022102965A1 KR 2021013488 W KR2021013488 W KR 2021013488W WO 2022102965 A1 WO2022102965 A1 WO 2022102965A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- document
- information
- real estate
- analysis data
- contract
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000004458 analytical method Methods 0.000 claims abstract description 121
- 238000012545 processing Methods 0.000 claims abstract description 49
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 12
- 238000012790 confirmation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 26
- 238000004891 communication Methods 0.000 description 21
- 230000010365 information processing Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000011150 reinforced concrete Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Definitions
- the present disclosure relates to a document analysis method, and more particularly, to a document analysis method for providing analysis data for a document by analyzing information meaning a layout and text included in a document.
- the present disclosure is to solve the above problems, and an object of the present disclosure is to recognize information from a layout and text included in a document, and synthesize the information recognized from the document and information received from the outside to analyze data for the document. It is intended to provide a document analysis method provided.
- a document analysis method includes the steps of receiving a document, extracting text included in the document, and corresponding to a plurality of identification items among the extracted texts Recognizing a text to be identified, recognizing a text written in an area adjacent to the identified text as information corresponding to the identification item, classifying the information corresponding to the identification item into a plurality of preset groups, for each group and processing information belonging to the plurality of groups according to a differently set processing process, and providing analysis data for the document based on the processing result.
- the processing of the information belonging to the plurality of groups includes: receiving related information from an external server based on information belonging to at least one of the plurality of groups; and the related information received from the external server and generating analysis data for the document based on information recognized from the document.
- the generating of the analysis data may include comparing the related information received from the external server with corresponding information among information recognized from the document to determine whether they match.
- the document is a real estate contract document
- the generating of the analysis data includes related information received from the external server and information recognized from the document according to the property safety determination process for determining property safety through a preset algorithm can be processed to generate the analysis data.
- the document is a real estate contract document
- the generating of the analysis data includes the related information received from the external server and the The analysis data may be generated by processing information recognized from the document.
- the document is a real estate contract document
- the processing process includes spelling correction, spacing correction, number conversion, term conversion, related content addition, and property safety determination process, applied to the first group among the plurality of groups It includes a first processing process set to be so, spacing correction, number conversion, term conversion, accredited information match determination process, property safety determination process, and property suitability determination process based on user preference information, in the second group of the plurality of groups It includes a second processing process set to be applied to a second processing process, spacing correction, term conversion, a process for determining whether public information matches, and a third processing process set to be applied to a third group among the plurality of groups,
- the plurality of groups may be classified based on information required for each processing process.
- the first group may include information on real estate contract details
- the second group may include information indicating characteristics of real estate
- the third group may include information for specifying real estate.
- the document is a real estate contract document
- the analysis data for the document is at least one of the accuracy of information related to the real estate and the owner specified in the real estate contract document, information on setting rights related to the real estate, and the safety of the real estate contract may include information about
- the information on the safety of the real estate contract may be provided in the form of at least one of text, number, image, or video.
- the document is a real estate contract document
- the step of receiving the related information from the external server includes a certified copy of the register of real estate specified by the document, land ledger, building ledger, cadastral map, land use plan confirmation, real estate price information, Receiving at least one piece of real estate term information from at least one external server, and generating the analysis data, generate analysis data based on the data obtained by statistical processing on the information received from the external server.
- the plurality of identification items may include at least one of an address, a floor number, a lessor, an owner, a land area, a structure, a use, a building area, a deposit, a purchase price, and a special contract.
- the document is a real estate contract document
- the plurality of time points may include at least two of before a real estate contract date, a real estate contract date, and after a real estate contract date.
- the step of extracting the text includes, if the document includes a table layout, extracting a vertical line and a horizontal line from the table layout, respectively, obtaining an intersection point between the vertical line and the horizontal line, and based on the intersection point to identify a cell included in the table layout, and an object located inside the identified cell may be extracted as text.
- the text in the extracting of the text, the text may be extracted by applying the OCR model to the object located inside the identified cell.
- the server device extracts a communication unit, a memory for storing a document, and text included in the document, and identifies texts corresponding to a plurality of identification items from among the extracted texts, a processor for recognizing a text written in an area adjacent to the identified text as information corresponding to the identification item, wherein the processor classifies the information corresponding to the identification item into a plurality of preset groups, and is different for each group
- the information belonging to the plurality of groups is processed according to a set processing process, and analysis data for the document is provided based on the processing result.
- the processor receives related information from an external server based on information belonging to at least one of the plurality of groups, and adds the related information received from the external server and information recognized from the document. Based on the analysis data for the document may be generated.
- the processor may compare the related information received from the external server with corresponding information among information recognized from the document to determine whether they match.
- the document is a real estate contract document
- the processor processes the related information received from the external server and the information recognized from the document according to the property safety determination process for determining property safety through a preset algorithm to analyze the data can be created.
- the program includes the steps of receiving a document, extracting text included in the document, and the extracted text Recognizing a text corresponding to a plurality of identification items from among, recognizing a text written in an area adjacent to the identified text as information corresponding to the identification item, and converting information corresponding to the identification item into a plurality of preset Classifying into groups, processing information belonging to the plurality of groups according to a processing process set differently for each group, and providing analysis data for the document based on the processing result.
- FIG. 1 is a diagram for explaining an operation of a server device that provides a document analysis method according to an embodiment of the present disclosure.
- FIG. 2 is a block diagram illustrating a configuration of a server device according to an embodiment of the present disclosure.
- FIG. 3 is a block diagram illustrating a configuration of a user terminal device according to an embodiment of the present disclosure.
- FIG. 4 is a diagram illustrating an example of a document to be analyzed in a document analysis method according to an embodiment of the present disclosure.
- FIG. 5 is a diagram for explaining an operation of extracting a vertical line from a table layout included in a document.
- FIG. 6 is a diagram for explaining an operation of extracting a horizontal line from a table layout included in a document.
- FIG. 7 is a diagram for explaining an operation of identifying cells included in a table layout by obtaining an intersection between vertical and horizontal lines extracted from the table layout.
- FIG. 8 is a diagram illustrating data acquired for a document.
- FIG. 9 is a diagram for explaining an operation of comparing and analyzing information processed for a document with related information received from an external server device, and generating analysis data for a document.
- FIG. 10 is a diagram for explaining a UI for providing analysis data for a document to a user when it is determined as a safe sale according to a document analysis method according to an embodiment of the present disclosure.
- FIG. 11 is a diagram for explaining a UI for providing analysis data for a document to a user when it is determined that a safety device is required for sale according to a document analysis method according to an embodiment of the present disclosure.
- FIG. 12 is a view for explaining a UI for providing analysis data for a document to a user when it is determined as a dangerous sale according to a document analysis method according to an embodiment of the present disclosure.
- FIG. 13 is a diagram for explaining a UI for providing analysis data for a document to a user when it is determined that there is an abnormality in the document according to the document analysis method according to an embodiment of the present disclosure.
- FIG. 14 is a diagram for explaining a UI for providing analysis data including detailed analysis results for a document to a user according to a document analysis method according to an embodiment of the present disclosure
- 15 is a diagram for explaining a UI for providing analysis data including information related to a document to a user according to a document analysis method according to an embodiment of the present disclosure
- FIG. 16 is a diagram for explaining a UI for providing a user with information on the degree of risk related to whether a deposit can be fully received upon termination of a jeonse contract when the type of property for sale is a collective building.
- FIG. 17 is a diagram for explaining a UI for providing a user with information on the degree of risk related to whether a deposit can be fully received upon termination of a jeonse contract when the type of sale is a multi-family house.
- FIG. 18 is a flowchart illustrating a document analysis method according to an embodiment of the present disclosure.
- each step should be understood as non-limiting unless the preceding step must be logically and temporally performed before the subsequent step. In other words, except for the above exceptional cases, even if the process described as the subsequent step is performed before the process described as the preceding step, the essence of the disclosure is not affected, and the scope of rights should also be defined regardless of the order of the steps.
- expressions such as “have,” “may have,” “include,” or “may include” indicate the presence of a corresponding characteristic (eg, a numerical value, function, operation, or component such as a part). and does not exclude the presence of additional features.
- first, second, etc. may be used to describe various elements, but the elements should not be limited by the terms. The above terms may be used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present disclosure, a first component may be referred to as a second component, and similarly, a second component may also be referred to as a first component.
- the present specification describes components necessary for the description of each embodiment of the present disclosure, the present disclosure is not necessarily limited thereto. Accordingly, some components may be changed or omitted, and other components may be added. In addition, they may be distributed and arranged in different independent devices.
- FIG. 1 is a diagram for explaining an operation of a server device that provides a document analysis method according to an embodiment of the present disclosure.
- the server device 100 may communicate with external devices.
- the server device 100 may communicate with the user terminal device 200 , the external server device 300 , and the third-party terminal device 400 .
- the number of terminals capable of communicating with the server device 100 is not limited thereto, and the type or communication method of the target terminal to communicate with may be implemented in various ways.
- the user terminal device 200 is a terminal device used by a user who wants to receive an analysis result for a document.
- the user may provide the document 10 (refer to FIG. 3 ) to be analyzed to the server device 100 through the user terminal device 200 .
- the user provides the document 10 stored in the memory 220 of the user terminal device 200 to the server device 100 or connects the UBS memory in which the document 10 is stored to the user terminal device 200 to the user terminal device It may be provided to the server device 100 through 200 .
- the document 10 may be a word file or an image file.
- the user can provide the document 10 file to the server device 100 through the user terminal device 200 as well as directly input related information into the user terminal device 200 to the server device 100 can provide
- the user may input information in text form into the user terminal device 200 and provide it to the server device 100 .
- the user terminal device 200 may use various types of devices such as a PC, a laptop PC, a mobile phone, a tablet PC, etc., but is not limited thereto, and the user stores the file of the document 10 in a USB memory,
- the document 10 may be provided to the server device 100 by connecting to 100 ) and directly inputting the document 10 .
- the external server device 300 may communicate with the server device 100 .
- the server device 100 may request the external server device 300 for related information corresponding to information recognized from the document 10 to receive the corresponding information from the external server device 300 .
- the server device 100 may provide a document analysis result to the third party terminal device 400 , and may reflect information received from the third party terminal device 400 in document analysis. Also, the server device 100 may provide information received from the third party terminal device 400 to the user terminal device 200 .
- the server device 100 may be a device for analyzing real estate sales and real estate contract documents and providing an analysis result to a user
- the user terminal device 200 is a terminal used by a user who wants to receive an analysis service It is a device
- the third-party terminal device 400 may be a terminal device used by a real estate agent or an individual who provides real estate sale information to the server device 100
- the external server device 300 may be an external server including information related to real estate specified by a real estate contract, for example, a real estate register copy, land ledger, building ledger, and the like.
- the server device 100 may analyze the real estate for sale information provided from the third party terminal device 400 and provide the analysis result to the user terminal device 200 .
- the server device 100 may analyze the real estate contract document and provide the analysis result to the user terminal device 200 .
- information may be transmitted/received between the user terminal device 200 and the third-party terminal device 400 through the server device 100 .
- FIG. 2 is a block diagram illustrating a configuration of a server device according to an embodiment of the present disclosure.
- the server device 100 may include a communication unit 110 , a memory 120 , and a processor 130 .
- the communication unit 110 may transmit/receive various data by performing communication with an external device.
- the communication unit 110 may receive a document and related information from the user terminal device 200 , the external server device 300 , and the third party terminal device 400 , and transmit analysis data for the document to the user terminal may be transmitted to the device 200 .
- the communication unit 110 may communicate with an external device through a local area network (LAN), an Internet network, and a mobile communication network, as well as BT (Bluetooth), BLE (Bluetooth Low Energy), WI - It is possible to communicate with an external device through various communication methods such as FI (Wireless Fidelity), WI-FI Direct (Wireless Fidelity Direct), Zigbee, NFC, etc.
- the communication unit 110 may include various communication modules for performing network communication.
- the communication unit 110 may include a Bluetooth chip, a Wi-Fi chip, a wireless communication chip, and the like.
- the memory 120 may store an operating system (OS) for controlling overall operations of the components of the server device 100 and commands or data related to components of the server device 100 .
- OS operating system
- the memory 120 may store a file for a document received from the user terminal device 200 . Also, the memory 120 may store document related information received from the external server device 300 .
- the processor 130 may control a plurality of hardware or software components of the server device 100 using various commands or data stored in the memory 120 , and a command received from at least one of the other components or Data may be loaded into a volatile memory for processing, and various data may be stored in a non-volatile memory.
- the processor 130 receives the document 10 stored in the memory 120 or receives the document 10 received from the external device through the communication unit 110, and receives the inputted document ( 10) may be extracted, texts corresponding to a plurality of identification items may be identified among the extracted texts, and a text written in an area adjacent to the identified text may be recognized as information corresponding to the identification items.
- the processor 130 classifies the information corresponding to the identification item into a plurality of preset groups, processes information belonging to the plurality of groups according to a processing process set differently for each group, and processes the information belonging to the plurality of groups based on the processing result. ) can provide analysis data for A detailed description related thereto will be provided later.
- FIG. 3 is a block diagram illustrating a configuration of a user terminal device according to an embodiment of the present disclosure.
- the user terminal device 200 may include a communication unit 210 , a memory 220 , a display 230 , and a processor 240 .
- the communication unit 210 may transmit/receive various data by performing communication with an external device, for example, the server device 100 or the third-party terminal device 400 .
- the communication unit 210 may receive a document and related information from the server device 100 and the third-party terminal device 400 , and may receive analysis data for the document from the server device 100 . .
- the memory 220 may store an operating system (OS) for controlling overall operations of components of the user terminal device 200 and commands or data related to components of the user terminal device 200 .
- OS operating system
- the memory 220 may store a document 10 file, and the document 10 may be a word file or an image file captured by a camera (not shown) included in the user terminal device 200 . .
- the display 230 is a configuration for displaying an image, and includes a liquid crystal display (LCD), an organic light-emitting diode (OLED), a liquid crystal on silicon (LCoS), a digital light processing (DLP), and a quantum dot (QD) display. It may be implemented in various forms, such as a panel.
- LCD liquid crystal display
- OLED organic light-emitting diode
- LCDoS liquid crystal on silicon
- DLP digital light processing
- QD quantum dot
- It may be implemented in various forms, such as a panel.
- the display 230 may display a UI for providing information to the user.
- the display 230 may display a UI that provides analysis data for a document to a user according to the document analysis method according to an embodiment of the present disclosure.
- a detailed description of the UI for providing analysis data for a document will be described later with reference to FIGS. 10 to 15 .
- the processor 240 may control a plurality of hardware or software components of the user terminal device 200 using various commands or data stored in the memory 220 , and a command received from at least one of the other components.
- data may be loaded into a volatile memory for processing, and various data may be stored in a non-volatile memory.
- the processor 240 may control the communication unit 210 to transmit/receive signals to and from an external device, and may control the display 230 to display a UI providing analysis data for a document.
- FIG. 4 is a diagram illustrating an example of a document to be analyzed in a document analysis method according to an embodiment of the present disclosure.
- a document 10 to be analyzed according to an embodiment of the present disclosure may be a real estate contract document.
- the document to be analyzed according to the present disclosure is not limited thereto, and may be applied to various types of documents.
- the document 10 to be analyzed according to an embodiment of the present disclosure is a real estate contract document.
- a document may be composed of a layout and content.
- the layout may include various types of information constituting the form of a document.
- Content means meaningful information filled in the layout.
- the layout may correspond to lines constituting the table, and the content may be various texts filled in the table.
- the layout is not limited thereto, and not only a form such as a table including various lines, but also a layout in which contents are arranged in a certain form even if the line is not included may also correspond to the layout.
- lines constituting a table included in the document 10 may be classified as a layout.
- a form in which the texts 12-8, 12-9, and 12-10 arranged at regular intervals up and down may also correspond to a layout.
- texts 11 and 12 written inside each cell included in the table layout may be classified as content.
- the server device 100 may separate the layout and text included in the document 10 and process them in different ways.
- the document 10 includes a table layout among methods of extracting a layout and text from the document 10 will be described as an example with reference to FIGS. 5 to 7 .
- FIG. 5 is a diagram for explaining an operation of extracting a vertical line from a table layout included in a document
- FIG. 6 is a diagram for explaining an operation of extracting a horizontal line from a table layout included in a document
- the processor 130 of the server device 100 performs vertical lines 13-1, 13-2, 13-3, and 13 in the table layout. -4, 13-5, 13-6, 13-7, 13-8, see Fig. 5) and horizontal lines (14-1, 14-2, 14-3, 14-4, 14-5, 14-6, 6) can be extracted, respectively. Erosion and dilation operations may be used as a method of extracting the vertical and horizontal lines of the table layout, but are not limited thereto. Also, if the interval between components included in the layout is constant, the margin may be recognized as a boundary line.
- the processor 130 of the server device 100 merges the extracted vertical and horizontal lines to obtain intersections between the vertical and horizontal lines, and to identify cells included in the table layout based on the obtained intersections.
- the server device 100 may identify that one cell is located in an area formed by the corresponding intersecting points.
- the processor 130 of the server device 100 may identify a cell included in the table layout and extract an object located inside the identified cell as text.
- the server device 100 may extract and classify text by applying a Deep Learning OCR (Optical Character Recognition) model to an object located inside the cell. For example, when classification is performed by applying the OCR model to a cell containing the text “Location” in FIG. 7, “so”, “jae”, and “ji” are recognized and classified as each syllable, and the three syllables are Since it is located inside one cell, each syllable can be merged into one and completed as the text “Location”.
- OCR Optical Character Recognition
- the processor 130 may determine whether an object disposed inside a cell constitutes text.
- the processor 130 may determine whether or not the text corresponds to the text by comparing the shape of the characters described in the image DB and the image DB of various languages such as Korean, English, Chinese, and Japanese, and the shape of an object disposed inside the cell.
- the processor 130 may determine that the corresponding texts form a uniform layout.
- the processor 130 may recognize texts corresponding to a plurality of identification items and text corresponding to information corresponding to the identification items from among the texts extracted from the document 10 .
- the identification item means an item for identifying each type of various information included in the document 10 .
- the identification item may be an item for identifying a plurality of features included in information on real estate to be contracted in a real estate contract document.
- identification items such as 'location' for specifying real estate may be described in the document 10, and 'land', 'location', 'area', ' Identification items such as 'building', 'structure', and 'use' and identification items such as 'special agreement' including information on the contents of a real estate contract may be described.
- the plurality of identification items is not limited thereto, and addresses (eg, “location” indicating the real estate sale address, address related to the contractor’s personal information, etc.), floor number, lessor, owner, land area, structure, use, building It can include various items such as area, deposit, purchase price, and special contract.
- addresses eg, “location” indicating the real estate sale address, address related to the contractor’s personal information, etc.
- floor number lessor, owner, land area, structure, use, building It can include various items such as area, deposit, purchase price, and special contract.
- the processor 130 may identify a text disposed at a specific location as an identification item or determine whether it is an identification item based on the content of the text. For example, in a tabular layout, the text written inside the cell corresponding to column 1 is identified as the text corresponding to the identification item, or 'lessor', 'tenant', 'location', 'land', 'position', ' By recognizing words that are normally designated as identification items in real estate contract documents, such as 'area', 'building', 'structure', 'use', 'special terms', etc., it can be determined whether the text corresponds to the identification item.
- the information corresponding to each identification item may be information indicated by text written in an area adjacent to the text corresponding to the identification item.
- the information corresponding to the 'location' 11-1 of the real estate is '1234-12 Bongcheon-dong, Gwanak-gu, Seoul' (12-1), and the 'building' (11-5) ' Information corresponding to the 'structure' 11-6 can be recognized as 'reinforced concrete' (12-4).
- the processor 130 records the texts (12-8, 12-9, 12-10) arranged at regular intervals up and down in the area adjacent to the 'special agreement' 11-10 to the 'special agreement' (11-). It can be recognized as information corresponding to 10).
- the processor 130 may classify information corresponding to the identification item into a plurality of preset groups, and process the information for each group.
- FIG. 8 is a diagram illustrating data obtained for a document in a table form.
- the processor 130 may acquire data about the document 10 by recognizing the information 22 corresponding to each identification item 21 .
- the processor 130 classifies the information 22 corresponding to the identification item 21 into a plurality of groups based on the obtained data in this way, and collects information belonging to the plurality of groups according to a processing process set differently for each group. can be processed
- the processor 130 is divided into a first group including information on contract details of real estate, a second group including information indicating characteristics of real estate, and a third group including information for specifying real estate.
- the identification item 21 and the information 22 corresponding to the identification item may be classified.
- the 'special contract' 21 - 8 is information on the contract details of real estate, and thus may be classified into the first group.
- 'structural use' (21-5), 'building area' (21-6), 'deposit' (21-7), etc. are information indicating the characteristics of real estate, so they can be classified into the second group.
- 'address' (21-1), 'floor number' (21-1), 'lessor' (21-3), 'account owner' (21-4), etc. are information for specifying real estate, so the third group can be classified as
- the processor 130 may apply and process different processing processes to information belonging to each group according to the characteristics of the plurality of groups.
- the plurality of groups may be classified based on information required for each processing process.
- the processor 130 processes the information belonging to the first group by applying the first processing process including spelling correction, spacing correction, number conversion, term conversion, related content addition, and property safety determination process to the first group. can do.
- the number conversion may mean converting text with numbers and letters mixed into numbers only (for example, converting '1 million won' to '100000') when expressing the amount, and the term conversion is in the real estate contract document. It may mean converting contained legal terms into ordinary terms.
- Adding related content may mean adding real estate-related legal knowledge, general real estate information, and customs that may be unfamiliar to general users in the information processing process. For example, adding information that there may be difficulties in getting a cheonsei loan if a high mortgage is set on a real estate sale, or in the case of a transaction that meets certain requirements (for example, if the owner is a corporation or the type of building is a neighborhood living facility) Information that it may be difficult to subscribe to Jeonse Guarantee Insurance can be added as related content provided to users.
- the property stability determination process may refer to information processing, such as calculating the safety level of the deposit price, for example.
- the second group includes information 22-5, 22-6, and 22-7 indicating the characteristics of real estate, and it is possible to provide necessary information to the user even though a lower level analysis than the first group is performed. Accordingly, the processor 130 applies a second processing process including spacing correction, number conversion, term conversion, accredited information match determination process, property safety determination process, and property suitability determination process based on user preference information to the second group Thus, information belonging to the second group can be processed.
- the process for determining suitability of a property based on user preference information may refer to information processing for determining whether a property is suitable for sale according to user preference information input from a user.
- the third group includes information (22-1, 22-2, 22-3, and 22-4) for specifying real estate, and the third group also performs a lower level analysis than the first group. information can be provided. Accordingly, the processor 130 may process the information belonging to the third group by applying a third processing process including spacing correction, term conversion, a process for determining whether public information matches, and a process for determining safety for sale to the third group. .
- the processor 130 may process information belonging to each group according to a processing process set differently for each group, and provide analysis data for the document 10 based on the processing result.
- FIG. 9 is a diagram for explaining an operation of comparing and analyzing information processed for a document with related information received from an external server device, and generating analysis data for a document.
- the server device 100 may receive information related to the document 10 from the external server device 300 through the communication unit 110 .
- the server device 100 is a certified copy of the register of real estate specified by the document 10 from the external server device 300, land ledger, building ledger, cadastral map, land use plan confirmation, real estate price information (market price information, It is possible to receive at least one piece of information among public price information, official land price information, etc.), real estate terminformation (information related to laws such as the Enforcement Decree of the Building Act, the Enforcement Decree of the Housing Act, terminology information of apartment houses, type 1 neighborhood living facilities, etc.).
- the processor 130 may generate analysis data for the document 10 based on the related information received from the external server device 300 and information recognized as the document 10 .
- the corresponding information among the related information received from the external server device 300 and the information recognized from the document 10 is compared to determine whether they match. Describe the action to be performed.
- the server device 100 may receive study document related information for real estate specified in the real estate contract document from the external server device 300 .
- the processor 130 compares and analyzes the data 21 and 22 obtained for the document 10 and the data 31 and 32 for the study document, which is the related information received from the external server device 300 , and analyzes the data (40) may be provided to the user.
- the processor 130 matches the identification item 21 of the real estate contract corresponding to the document 10 to be analyzed and the identification item 31 of the study document to correspond, and corresponds to the identification item of the contract By comparing the information (22) and the information (32) corresponding to the identification item of the study document, it is possible to determine whether the match.
- the information corresponding to the account owner of the contract is 'Park ⁇ '
- the information corresponding to the owner described in the registered copy is 'Kim ⁇ '
- the processor 130 is in the contract. It is possible to generate analysis data (40-5) that the recorded information and the information described in the registered copy do not match.
- the processor 130 based on the information corresponding to the security deposit of the contract and the information corresponding to the root mortgage of the registered copy, it is possible to generate analysis data 40-8 for the safe range of the deposit, , data processing for this can be performed on the server.
- the safe range is based on the analyzed information can be calculated.
- the safe amount to be set for the real estate when making a contract for the real estate Since is an amount obtained by subtracting 10/12 times the mortgage amount from 0.8 times the market price of the apartment for sale, it is possible to generate the analysis data 40-8 for recommending a safety setting of a certain amount when the deposit amount is lower than the safe amount.
- the processor 130 recognizes from the related information and document 10 received from the external server device 300 according to the property safety determination process that determines the property safety through a preset algorithm.
- the information can be processed to generate analytic data.
- the processor 130 has a special word such as 'joint collateral' in the certified copy of the register received from the external server device 300, the published price and near-mortgage setting information of several items included in the joint collateral list of the certified copy of the register In consideration of this, it is possible to generate analysis data that comprehensively judges the safety of the product.
- a special word such as 'joint collateral' in the certified copy of the register received from the external server device 300
- the published price and near-mortgage setting information of several items included in the joint collateral list of the certified copy of the register In consideration of this, it is possible to generate analysis data that comprehensively judges the safety of the product.
- the processor 130 is the related information and documents received from the external server device 300 according to the sale suitability determination process for determining the suitability for sale based on the user preference information input from the user.
- Analysis data may be generated by processing the information recognized from (10).
- the server device 100 receives user preference information on 'whether or not to subscribe to HUG Jeonse Guarantee Insurance' from the user, and in the related information received from the external server device 300, the purpose of the contracted real estate is 'neighborhood life'. In the case of 'facility', it is possible to generate analysis data including information that it is not covered by HUG Jeonse Guarantee Insurance.
- the processor 130 may generate analysis data such as the accuracy of information related to the real estate and the owner specified in the real estate contract document, information on setting rights related to the real estate, and the safety of the real estate contract.
- Analysis data for the document 10 generated as described above may be provided to the user.
- the analysis data may be provided to the user through a UI displayed on the user terminal device 200 .
- 10 to 15 are diagrams for explaining a UI for providing analysis data for a document to a user according to a document analysis method according to an embodiment of the present disclosure.
- the server device 100 may transmit the analysis data generated by the processor 130 to the user terminal device 200 through the communication unit 110 .
- the user terminal device 200 may receive the analysis data and provide the analysis data to the user by displaying the UI on the display 230 .
- FIG. 10 exemplarily shows a UI provided to a user when the document 10 is analyzed as a safe sale as the target of the contract as a result of analysis.
- the UI provided to the user may include a UI 1010 for displaying a menu and a UI 1020 for displaying analysis data.
- the UI 1020 for displaying the analysis data may display information on the safety of the real estate contract that the contents of the listing of the sale subject to the contract are on the safe side.
- Information on the safety of a real estate contract may include a value expressing the safety numerically.
- the information on the safety of the real estate contract may be provided in the form of at least one of text or numbers.
- FIG. 11 shows that the document 10 analysis result shows that the sale subject to the contract is a sale that requires a safety device, for example, as shown in FIG.
- the UI that is used is shown as an example.
- the UI provided to the user may include a UI 1110 for displaying a menu and a UI 1120 for displaying analysis data.
- the UI 1120 for displaying the analysis data may display information on the safety of a real estate contract including information that a user can refer to in order to secure a safe right to a sale target of the contract.
- the UI 12 shows that when the content of the contract is analyzed as dangerous as a result of the analysis of the document 10, for example, there is an abnormality in the special clause or there is an abnormality limiting the ownership in the registered copy of the real estate subject to the contract.
- the UI provided to the user is shown as an example.
- the UI provided to the user may include a UI 1210 for displaying a menu and a UI 1220 for displaying analysis data.
- the UI 1220 for displaying the analysis data may display information on the safety of a real estate contract including information that a user can refer to in order to secure a safe right to a sale target of the contract.
- the user terminal device 200 analyzes data for a contract, a registered copy, etc. based on the analysis data received from the server device 100 .
- the UI to be displayed can be provided to the user, and detailed information about the disadvantages that may occur to the user and the rights set in the registered copy can be displayed.
- the user terminal device 200 may provide the user with a UI that displays analysis data related to whether the user can fully receive the deposit at the end of the jeonse contract.
- analysis data analyzed in consideration of different legal considerations for each type of sale can be displayed through an intuitively schematic graph or text.
- 16 and 17 show a UI for providing a user with information on the degree of risk related to whether the deposit can be fully received upon termination of the jeonse contract when the type of sale is an aggregate building and a multi-family house, respectively.
- the UI provided to the user is a UI 1610 indicating that the mortgage on the register is at a risk level, a UI 1620 indicating the level of the mortgage against the market price, and a solution that can be requested from the lessor if the mortgage is at a risk level It may include a UI 1630 for presenting , a UI 1640 for selecting an amount for requesting cancellation of a mortgage, and a UI 1650 for receiving an input for adding a special contract.
- the analysis result determines that the near-mortgage set relative to the market price of the property is at a risky level, it may be suggested to the lessor to request such as a request to cancel the near-mortgage from the lessor or to cancel the near-mortgage with the user's deposit.
- the UI provided to the user may present the recommended amount to cancel the mortgage.
- the server device 100 determines what percentage of the market price is the auction price of a specific area and a specific item for a specific recent period, based on data obtained by performing statistical processing on information received from the external server 300 , recently By analyzing statistical information such as distribution related to the percentage of the actual loan price, the recommended amount to be canceled within a safe range can be calculated.
- Figure 17 shows the UI provided when the sale is a multi-family house. Based on the information on the registered copy and other information (eg, senior rent, the number of small tenants in the multi-family building, etc.), the sale is auctioned If passed to , information on whether the user's deposit can be safely preserved can be displayed.
- information on the registered copy and other information eg, senior rent, the number of small tenants in the multi-family building, etc.
- the risk level of the mortgage right set for the sale based on information such as the relative mortgage setting information on the registered copy, the amount of the senior rental amount, the number of small tenants, and the like, and provide it to the user.
- the above-described information may be received from the external server device 300 or from data input into the third-party terminal device 400 by a lessor or a real estate agent. It is a flowchart for explaining the document analysis method.
- the server device may receive a document input (S1810).
- the document may be a document file created by various programs such as Doc, Hwp, Xls, etc., may be an image file such as PDF, or may be an image file obtained by converting a paper document provided offline using a camera or a scanner. .
- the server device may extract the text included in the document (S1820).
- the server device may identify the text corresponding to the identification item from among the extracted texts (S1830).
- the server device may recognize the text written in the area adjacent to the identified text as information corresponding to the identification item (S1840).
- the server device may classify the information corresponding to the identification item into a plurality of preset groups ( S1850 ).
- the plurality of groups may include first to third groups, the first group includes information on real estate contract details, the second group includes information indicating real estate characteristics, and the third group includes It may include information for specifying real estate.
- the server device may process information belonging to a plurality of groups according to a processing process set differently for each group ( S1660 ).
- the related information is received from the external server, and the related information received from the external server is compared with the corresponding information among the information recognized from the document and matched. can determine whether
- the server device may provide analysis data for the document based on the processing result (S1670).
- the above-described methods according to various embodiments of the present disclosure may be implemented in the form of software or applications that can be installed in an electronic device such as a user terminal device.
- various embodiments of the present disclosure described above may be performed through an embedded server provided in the electronic device or a server external to the electronic device.
- a non-transitory computer readable medium in which a program for sequentially performing the document analysis method according to the present disclosure is stored may be provided.
- the non-transitory readable medium refers to a medium that stores data semi-permanently, rather than a medium that stores data for a short moment, such as a register, cache, memory, and the like, and can be read by a device.
- a non-transitory readable medium such as a CD, DVD, hard disk, Blu-ray disk, USB, memory card, ROM, and the like.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
A method for analyzing a document is disclosed. The present method for analyzing a document comprises steps of: receiving a document; extracting texts included in the document; identifying texts corresponding to a plurality of identification items from among the extracted texts; recognizing, as information corresponding to the identification items, a text written in an area adjacent to the identified texts; classifying the information corresponding to the identification items into a plurality of preset groups; processing pieces of information belonging to the plurality of groups according to processing processes set to be different by group; and providing analysis data about the document on the basis of the processing result.
Description
본 개시는 문서 분석 방법에 관한 것으로, 보다 상세하게는 문서에 포함된 레이아웃 및 텍스트가 의미하는 정보를 분석하여 문서에 대한 분석 데이터를 제공하는 문서 분석 방법에 관한 것이다.The present disclosure relates to a document analysis method, and more particularly, to a document analysis method for providing analysis data for a document by analyzing information meaning a layout and text included in a document.
일상 생활에서 다양한 문서들이 활용되고 있으며, 특히 계약서와 같은 법률 문서의 경우 계약 당사자들은 문서에 포함된 계약의 안전성 여부를 판단해야 할 필요가 있다.Various documents are used in daily life, and in particular, in the case of a legal document such as a contract, the contracting parties need to determine whether the contract included in the document is secure.
일 예로, 부동산 계약 문서의 경우 계약서 내에 포함된 계약 내용뿐만 아니라, 계약의 대상이 되는 부동산 매물의 등기부등본 등 공부서류에 공시된 정보를 종합적으로 고려해야한다. For example, in the case of a real estate contract document, not only the contract details included in the contract, but also the information disclosed in the study documents such as a registered copy of the real estate for sale subject to the contract should be considered comprehensively.
다만, 일반적인 사용자 입장에서 법령 정보 등이 포함된 계약 문서의 내용을 명확하게 분석하고, 관련 정보를 종합적으로 고려하여 부동산 계약의 안전성 여부를 판단하는 것이 어려운 문제가 있었다.However, there was a problem in that it was difficult for the general user to clearly analyze the contents of the contract document including legal information, etc., and to judge the safety of the real estate contract by considering the related information comprehensively.
본 개시는 상술한 문제점을 해결하기 위한 것으로, 본 개시의 목적은 문서에 포함된 레이아웃 및 텍스트로부터 정보를 인식하고, 문서로부터 인식되는 정보 및 외부로부터 수신한 정보를 종합하여 문서에 대한 분석 데이터를 제공하는 문서 분석 방법을 제공함에 있다.The present disclosure is to solve the above problems, and an object of the present disclosure is to recognize information from a layout and text included in a document, and synthesize the information recognized from the document and information received from the outside to analyze data for the document. It is intended to provide a document analysis method provided.
이상과 같은 목적을 달성하기 위해 본 개시의 일 실시예에 따른 문서 분석 방법은, 문서를 입력 받는 단계, 상기 문서에 포함된 텍스트를 추출하는 단계, 상기 추출된 텍스트들 중에서 복수의 식별 항목에 해당하는 텍스트를 식별하는 단계, 상기 식별된 텍스트에 인접한 영역에 기재된 텍스트를 상기 식별 항목에 대응되는 정보로 인식하는 단계, 상기 식별 항목에 대응되는 정보를 기 설정된 복수의 그룹으로 분류하는 단계, 그룹 별로 상이하게 설정된 처리 프로세스에 따라 상기 복수의 그룹에 속하는 정보들을 처리하는 단계 및 상기 처리 결과에 기초하여 상기 문서에 대한 분석 데이터를 제공하는 단계를 포함한다.In order to achieve the above object, a document analysis method according to an embodiment of the present disclosure includes the steps of receiving a document, extracting text included in the document, and corresponding to a plurality of identification items among the extracted texts Recognizing a text to be identified, recognizing a text written in an area adjacent to the identified text as information corresponding to the identification item, classifying the information corresponding to the identification item into a plurality of preset groups, for each group and processing information belonging to the plurality of groups according to a differently set processing process, and providing analysis data for the document based on the processing result.
이 경우, 상기 복수의 그룹에 속하는 정보들을 처리하는 단계는, 상기 복수의 그룹 중 적어도 하나의 그룹에 속하는 정보에 기초하여, 외부 서버로부터 관련 정보를 수신하는 단계 및 상기 외부 서버로부터 수신된 관련 정보와, 상기 문서로부터 인식되는 정보들에 기초하여 상기 문서에 대한 분석 데이터를 생성하는 단계를 포함할 수 있다.In this case, the processing of the information belonging to the plurality of groups includes: receiving related information from an external server based on information belonging to at least one of the plurality of groups; and the related information received from the external server and generating analysis data for the document based on information recognized from the document.
이 경우, 상기 분석 데이터를 생성하는 단계는, 상기 외부 서버로부터 수신된 관련 정보와 상기 문서로부터 인식되는 정보 중 대응되는 정보들을 비교하여 일치 여부를 판단하는 단계를 포함할 수 있다.In this case, the generating of the analysis data may include comparing the related information received from the external server with corresponding information among information recognized from the document to determine whether they match.
한편, 상기 문서는 부동산 계약 문서이며, 상기 분석 데이터를 생성하는 단계는, 기 설정된 알고리즘을 통해 매물 안전성을 판단하는 매물 안전성 판단 프로세스에 따라 상기 외부 서버로부터 수신된 관련 정보 및 상기 문서로부터 인식되는 정보들을 처리하여 상기 분석 데이터를 생성할 수 있다.On the other hand, the document is a real estate contract document, and the generating of the analysis data includes related information received from the external server and information recognized from the document according to the property safety determination process for determining property safety through a preset algorithm can be processed to generate the analysis data.
한편, 상기 문서는 부동산 계약 문서이며, 상기 분석 데이터를 생성하는 단계는, 사용자로부터 입력 받은 사용자 선호 정보에 기초하여 매물 적합성을 판단하는 매물 적합성 판단 프로세스에 따라 상기 외부 서버로부터 수신된 관련 정보 및 상기 문서로부터 인식되는 정보들을 처리하여 상기 분석 데이터를 생성할 수 있다.On the other hand, the document is a real estate contract document, and the generating of the analysis data includes the related information received from the external server and the The analysis data may be generated by processing information recognized from the document.
한편, 상기 문서는 부동산 계약 문서이며, 상기 처리 프로세스는, 맞춤법 교정, 띄어쓰기 교정, 숫자 변환, 용어 변환, 관련 컨텐츠 추가, 매물 안전성 판단 프로세스를 포함하며, 상기 복수의 그룹 중 제1 그룹에 대해 적용되도록 설정된 제1 처리 프로세스, 띄어쓰기 교정, 숫자 변환, 용어 변환, 공인 정보 일치 여부 판단 프로세스, 매물 안전성 판단 프로세스, 사용자 선호 정보에 기초한 매물 적합성 판단 프로세스를 포함하며, 상기 복수의 그룹 중 제2 그룹에 대해 적용되도록 설정된 제2 처리 프로세스, 띄어쓰기 교정, 용어 변환, 공인 정보 일치 여부 판단 프로세스, 매물 안전성 판단 프로세스를 포함하며 상기 복수의 그룹 중 제3 그룹에 대해 적용되도록 설정된 제3 처리 프로세스를 포함하며, 상기 복수의 그룹은 각 처리 프로세스가 필요한 정보들을 기준으로 분류될 수 있다.On the other hand, the document is a real estate contract document, and the processing process includes spelling correction, spacing correction, number conversion, term conversion, related content addition, and property safety determination process, applied to the first group among the plurality of groups It includes a first processing process set to be so, spacing correction, number conversion, term conversion, accredited information match determination process, property safety determination process, and property suitability determination process based on user preference information, in the second group of the plurality of groups It includes a second processing process set to be applied to a second processing process, spacing correction, term conversion, a process for determining whether public information matches, and a third processing process set to be applied to a third group among the plurality of groups, The plurality of groups may be classified based on information required for each processing process.
이 경우, 상기 제1 그룹은 부동산 계약 내용에 대한 정보를 포함하고, 상기 제2 그룹은 부동산 특징을 나타내는 정보를 포함하며, 상기 제3 그룹은 부동산을 특정하기 위한 정보를 포함할 수 있다.In this case, the first group may include information on real estate contract details, the second group may include information indicating characteristics of real estate, and the third group may include information for specifying real estate.
한편, 상기 문서는 부동산 계약 문서이며, 상기 문서에 대한 분석 데이터는, 상기 부동산 계약 문서에서 특정되는 부동산 및 소유자와 관련된 정보의 정확성, 상기 부동산에 관련된 권리 사항 설정 정보, 부동산 계약의 안전성 중 적어도 하나에 대한 정보를 포함할 수 있다.On the other hand, the document is a real estate contract document, and the analysis data for the document is at least one of the accuracy of information related to the real estate and the owner specified in the real estate contract document, information on setting rights related to the real estate, and the safety of the real estate contract may include information about
이 경우, 상기 부동산 계약의 안전성에 대한 정보는 텍스트, 숫자, 이미지 또는 동영상 중 적어도 하나의 형태로 제공될 수 있다.In this case, the information on the safety of the real estate contract may be provided in the form of at least one of text, number, image, or video.
한편, 상기 문서는 부동산 계약 문서이며, 상기 외부 서버로부터 관련 정보를 수신하는 단계는, 상기 문서에 의해 특정되는 부동산의 등기부 등본, 토지 대장, 건축물 대장, 지적도, 토지이용계획확인서, 부동산 가격 정보, 부동산 용어 정보 중 적어도 하나의 정보를 적어도 하나의 외부 서버로부터 수신하고, 상기 분석 데이터를 생성하는 단계는, 상기 외부 서버로부터 수신한 정보에 대해 통계 처리하여 획득한 데이터를 바탕으로 분석 데이터를 생성할 수 있다.On the other hand, the document is a real estate contract document, and the step of receiving the related information from the external server includes a certified copy of the register of real estate specified by the document, land ledger, building ledger, cadastral map, land use plan confirmation, real estate price information, Receiving at least one piece of real estate term information from at least one external server, and generating the analysis data, generate analysis data based on the data obtained by statistical processing on the information received from the external server. can
한편, 상기 복수의 식별 항목은, 주소, 층호수, 임대인, 소유주, 토지 면적, 구조, 용도, 건물 면적, 보증금, 매매 대금, 특약 중 적어도 하나를 포함할 수 있다.Meanwhile, the plurality of identification items may include at least one of an address, a floor number, a lessor, an owner, a land area, a structure, a use, a building area, a deposit, a purchase price, and a special contract.
한편, 상기 외부 서버로부터 관련 정보를 수신하는 단계는, 서로 다른 복수의 시점 각각에 대응되는 관련 정보를 수신하고, 상기 분석 데이터를 제공하는 단계는, 상기 수신한 관련 정보를 기초로 하여, 상기 복수의 시점 각각에 대응되는 복수의 분석 데이터를 생성하여 제공할 수 있다.On the other hand, the step of receiving the related information from the external server, receiving the related information corresponding to each of a plurality of different time points, and the step of providing the analysis data, based on the received related information, the plurality of It is possible to generate and provide a plurality of analysis data corresponding to each time point of .
이 경우, 상기 문서는 부동산 계약 문서이며, 상기 복수의 시점은 부동산 계약일 이전, 부동산 계약일 당일 및 부동산 계약일 이후 중 적어도 두가지를 포함할 수 있다.In this case, the document is a real estate contract document, and the plurality of time points may include at least two of before a real estate contract date, a real estate contract date, and after a real estate contract date.
*한편, 상기 텍스트를 추출하는 단계는, 상기 문서에 표 레이아웃이 포함된 경우, 상기 표 레이아웃에서 수직선 및 수평선을 각각 추출하는 단계, 상기 수직선 및 수평선 사이의 교차점을 획득하는 단계 및 상기 교차점에 기초하여 상기 표 레이아웃에 포함된 셀을 식별하는 단계를 포함하고, 상기 식별된 셀 내부에 위치한 오브젝트를 텍스트로 추출할 수 있다.* On the other hand, the step of extracting the text includes, if the document includes a table layout, extracting a vertical line and a horizontal line from the table layout, respectively, obtaining an intersection point between the vertical line and the horizontal line, and based on the intersection point to identify a cell included in the table layout, and an object located inside the identified cell may be extracted as text.
이 경우, 상기 텍스트를 추출하는 단계는, 상기 식별된 셀 내부에 위치한 오브젝트에 OCR 모델을 적용하여 텍스트를 추출할 수 있다.In this case, in the extracting of the text, the text may be extracted by applying the OCR model to the object located inside the identified cell.
한편, 본 개시의 일 실시예에 따른 서버 장치는, 통신부, 문서를 저장하는 메모리 및 상기 문서에 포함된 텍스트를 추출하고, 상기 추출된 텍스트들 중에서 복수의 식별 항목에 해당하는 텍스트를 식별하며, 상기 식별된 텍스트에 인접한 영역에 기재된 텍스트를 상기 식별 항목에 대응되는 정보로 인식하는 프로세서를 포함하며, 상기 프로세서는, 상기 식별 항목에 대응되는 정보를 기 설정된 복수의 그룹으로 분류하고, 그룹 별로 상이하게 설정된 처리 프로세스에 따라 상기 복수의 그룹에 속하는 정보들을 처리하고, 상기 처리 결과에 기초하여 상기 문서에 대한 분석 데이터를 제공한다.On the other hand, the server device according to an embodiment of the present disclosure extracts a communication unit, a memory for storing a document, and text included in the document, and identifies texts corresponding to a plurality of identification items from among the extracted texts, a processor for recognizing a text written in an area adjacent to the identified text as information corresponding to the identification item, wherein the processor classifies the information corresponding to the identification item into a plurality of preset groups, and is different for each group The information belonging to the plurality of groups is processed according to a set processing process, and analysis data for the document is provided based on the processing result.
이 경우, 상기 프로세서는, 상기 복수의 그룹 중 적어도 하나의 그룹에 속하는 정보에 기초하여, 외부 서버로부터 관련 정보를 수신하고, 상기 외부 서버로부터 수신된 관련 정보와, 상기 문서로부터 인식되는 정보들에 기초하여 상기 문서에 대한 분석 데이터를 생성할 수 있다.In this case, the processor receives related information from an external server based on information belonging to at least one of the plurality of groups, and adds the related information received from the external server and information recognized from the document. Based on the analysis data for the document may be generated.
이 경우, 상기 프로세서는, 상기 외부 서버로부터 수신된 관련 정보와 상기 문서로부터 인식되는 정보 중 대응되는 정보들을 비교하여 일치 여부를 판단할 수 있다.In this case, the processor may compare the related information received from the external server with corresponding information among information recognized from the document to determine whether they match.
한편, 상기 문서는 부동산 계약 문서이며, 상기 프로세서는, 기 설정된 알고리즘을 통해 매물 안전성을 판단하는 매물 안전성 판단 프로세스에 따라 상기 외부 서버로부터 수신된 관련 정보 및 상기 문서로부터 인식되는 정보들을 처리하여 상기 분석 데이터를 생성할 수 있다.On the other hand, the document is a real estate contract document, and the processor processes the related information received from the external server and the information recognized from the document according to the property safety determination process for determining property safety through a preset algorithm to analyze the data can be created.
한편, 본 개시의 일 실시예에 따른 문서를 분석하는 프로그램이 저장된 컴퓨터 판독 가능 기록 매체에 있어서, 상기 프로그램은, 문서를 입력받는 단계, 상기 문서에 포함된 텍스트를 추출하는 단계, 상기 추출된 텍스트들 중에서 복수의 식별 항목에 해당하는 텍스트를 식별하는 단계, 상기 식별된 텍스트에 인접한 영역에 기재된 텍스트를 상기 식별 항목에 대응되는 정보로 인식하는 단계, 상기 식별 항목에 대응되는 정보를 기 설정된 복수의 그룹으로 분류하는 단계, 그룹 별로 상이하게 설정된 처리 프로세스에 따라 상기 복수의 그룹에 속하는 정보들을 처리하는 단계 및 상기 처리 결과에 기초하여 상기 문서에 대한 분석 데이터를 제공하는 단계를 포함한다.Meanwhile, in the computer-readable recording medium storing a program for analyzing a document according to an embodiment of the present disclosure, the program includes the steps of receiving a document, extracting text included in the document, and the extracted text Recognizing a text corresponding to a plurality of identification items from among, recognizing a text written in an area adjacent to the identified text as information corresponding to the identification item, and converting information corresponding to the identification item into a plurality of preset Classifying into groups, processing information belonging to the plurality of groups according to a processing process set differently for each group, and providing analysis data for the document based on the processing result.
도 1은 본 개시의 일 실시예에 따른 문서 분석 방법을 제공하는 서버 장치의 동작을 설명하기 위한 도면이다.1 is a diagram for explaining an operation of a server device that provides a document analysis method according to an embodiment of the present disclosure.
도 2는 본 개시의 일 실시예에 따른 서버 장치의 구성을 설명하기 위한 블록도이다.2 is a block diagram illustrating a configuration of a server device according to an embodiment of the present disclosure.
도 3은 본 개시의 일 실시예에 따른 사용자 단말 장치의 구성을 설명하기 위한 블록도이다.3 is a block diagram illustrating a configuration of a user terminal device according to an embodiment of the present disclosure.
도 4는 본 개시의 일 실시예에 따른 문서 분석 방법에서 분석 대상이 되는 문서의 일 예를 나타내는 도면이다.4 is a diagram illustrating an example of a document to be analyzed in a document analysis method according to an embodiment of the present disclosure.
도 5는 문서에 포함된 표 레이아웃에서 수직선을 추출하는 동작을 설명하기 위한 도면이다.5 is a diagram for explaining an operation of extracting a vertical line from a table layout included in a document.
도 6은 문서에 포함된 표 레이아웃에서 수평선을 추출하는 동작을 설명하기 위한 도면이다.6 is a diagram for explaining an operation of extracting a horizontal line from a table layout included in a document.
도 7은 표 레이아웃에서 추출된 수직선 및 수평선 사이의 교차점을 획득하여 표 레이아웃에 포함된 셀을 식별하는 동작을 설명하기 위한 도면이다.7 is a diagram for explaining an operation of identifying cells included in a table layout by obtaining an intersection between vertical and horizontal lines extracted from the table layout.
도 8은 문서에 대해 획득한 데이터를 나타내는 도면이다.8 is a diagram illustrating data acquired for a document.
도 9는 문서에 대해 처리된 정보와 외부 서버 장치로부터 수신된 관련 정보를 비교 및 분석하고, 문서에 대한 분석 데이터를 생성하는 동작을 설명하기 위한 도면이다.9 is a diagram for explaining an operation of comparing and analyzing information processed for a document with related information received from an external server device, and generating analysis data for a document.
도 10은 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 안전한 매물로 판단된 경우 문서에 대한 분석 데이터를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.10 is a diagram for explaining a UI for providing analysis data for a document to a user when it is determined as a safe sale according to a document analysis method according to an embodiment of the present disclosure.
도 11은 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 안전장치 필요 매물로 판단된 경우 문서에 대한 분석 데이터를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.11 is a diagram for explaining a UI for providing analysis data for a document to a user when it is determined that a safety device is required for sale according to a document analysis method according to an embodiment of the present disclosure.
도 12는 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 위험한 매물로 판단된 경우 문서에 대한 분석 데이터를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.12 is a view for explaining a UI for providing analysis data for a document to a user when it is determined as a dangerous sale according to a document analysis method according to an embodiment of the present disclosure.
도 13은 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 문서에 이상 사항이 있다고 판단된 경우 문서에 대한 분석 데이터를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.13 is a diagram for explaining a UI for providing analysis data for a document to a user when it is determined that there is an abnormality in the document according to the document analysis method according to an embodiment of the present disclosure.
도 14는 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 문서에 대한 상세 분석 결과를 포함하는 분석 데이터를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.14 is a diagram for explaining a UI for providing analysis data including detailed analysis results for a document to a user according to a document analysis method according to an embodiment of the present disclosure;
도 15는 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 문서에 대한 관련 정보를 포함하는 분석 데이터를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.15 is a diagram for explaining a UI for providing analysis data including information related to a document to a user according to a document analysis method according to an embodiment of the present disclosure;
도 16은 매물 유형이 집합 건물인 경우 전세 계약 종료 시 보증금을 온전히 받을 수 있는지 여부와 관련한 위험도에 대한 정보를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.FIG. 16 is a diagram for explaining a UI for providing a user with information on the degree of risk related to whether a deposit can be fully received upon termination of a jeonse contract when the type of property for sale is a collective building.
도 17은 매물 유형이 다가구 주택인 경우 전세 계약 종료 시 보증금을 온전히 받을 수 있는지 여부와 관련한 위험도에 대한 정보를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.FIG. 17 is a diagram for explaining a UI for providing a user with information on the degree of risk related to whether a deposit can be fully received upon termination of a jeonse contract when the type of sale is a multi-family house.
도 18은 본 개시의 일 실시예에 따른 문서 분석 방법을 설명하기 위한 흐름도이다.18 is a flowchart illustrating a document analysis method according to an embodiment of the present disclosure.
이하에서 설명되는 실시 예는 본 개시의 이해를 돕기 위하여 예시적으로 나타낸 것이며, 본 개시는 여기서 설명되는 실시 예들과 다르게, 다양하게 변형되어 실시될 수 있음이 이해되어야 할 것이다. 다만, 이하에서 본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성요소에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명 및 구체적인 도시를 생략한다. 또한, 첨부된 도면은 개시의 이해를 돕기 위하여 실제 축척대로 도시된 것이 아니라 일부 구성요소의 치수가 과장되게 도시될 수 있다.It should be understood that the embodiments described below are illustratively shown to help the understanding of the present disclosure, and the present disclosure may be implemented with various modifications, different from the embodiments described herein. However, in the following description of the present disclosure, if it is determined that a detailed description of a related well-known function or component may unnecessarily obscure the gist of the present disclosure, the detailed description and specific illustration thereof will be omitted. In addition, the accompanying drawings are not drawn to scale in order to help understanding of the disclosure, but dimensions of some components may be exaggerated.
본 명세서 및 청구범위에서 사용되는 용어는 본 개시의 기능을 고려하여 일반적인 용어들을 선택하였다. 하지만, 이러한 용어들은 당 분야에 종사하는 기술자의 의도나 법률적 또는 기술적 해석 및 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 일부 용어는 출원인이 임의로 선정한 용어도 있다. 이러한 용어에 대해서는 본 명세서에서 정의된 의미로 해석될 수 있으며, 구체적인 용어 정의가 없으면 본 명세서의 전반적인 내용 및 당해 기술 분야의 통상적인 기술 상식을 토대로 해석될 수도 있다. The terms used in this specification and claims have been chosen in consideration of the function of the present disclosure. However, these terms may vary depending on the intention of a person skilled in the art, legal or technical interpretation, and emergence of new technology. Also, some terms are arbitrarily selected by the applicant. These terms may be interpreted in the meanings defined herein, and in the absence of specific definitions, they may be interpreted based on the general content of the present specification and common technical common sense in the art.
본 개시의 설명에 있어서 각 단계의 순서는 선행 단계가 논리적 및 시간적으로 반드시 후행 단계에 앞서서 수행되어야 하는 경우가 아니라면 각 단계의 순서는 비제한적으로 이해되어야 한다. 즉, 위와 같은 예외적인 경우를 제외하고는 후행 단계로 설명된 과정이 선행단계로 설명된 과정보다 앞서서 수행되더라도 개시의 본질에는 영향이 없으며 권리범위 역시 단계의 순서에 관계없이 정의되어야 한다. In the description of the present disclosure, the order of each step should be understood as non-limiting unless the preceding step must be logically and temporally performed before the subsequent step. In other words, except for the above exceptional cases, even if the process described as the subsequent step is performed before the process described as the preceding step, the essence of the disclosure is not affected, and the scope of rights should also be defined regardless of the order of the steps.
본 명세서에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.In this specification, expressions such as “have,” “may have,” “include,” or “may include” indicate the presence of a corresponding characteristic (eg, a numerical value, function, operation, or component such as a part). and does not exclude the presence of additional features.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용될 수 있다. 예를 들어, 본 개시의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.Terms such as first, second, etc. may be used to describe various elements, but the elements should not be limited by the terms. The above terms may be used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present disclosure, a first component may be referred to as a second component, and similarly, a second component may also be referred to as a first component.
그리고, 본 명세서에서는 본 개시의 각 실시 예의 설명에 필요한 구성요소를 설명한 것이므로, 반드시 이에 한정되는 것은 아니다. 따라서, 일부 구성요소는 변경 또는 생략될 수도 있으며, 다른 구성요소가 추가될 수도 있다. 또한, 서로 다른 독립적인 장치에 분산되어 배치될 수도 있다.In addition, since the present specification describes components necessary for the description of each embodiment of the present disclosure, the present disclosure is not necessarily limited thereto. Accordingly, some components may be changed or omitted, and other components may be added. In addition, they may be distributed and arranged in different independent devices.
나아가, 이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 개시의 실시 예를 상세하게 설명하지만, 본 개시가 실시 예들에 의해 제한되거나 한정되는 것은 아니다.Further, an embodiment of the present disclosure will be described in detail below with reference to the accompanying drawings and the contents described in the accompanying drawings, but the present disclosure is not limited or limited by the embodiments.
이하, 도 1 내지 도 16을 참고하여 본 개시를 상세히 설명한다.Hereinafter, the present disclosure will be described in detail with reference to FIGS. 1 to 16 .
도 1은 본 개시의 일 실시예에 따른 문서 분석 방법을 제공하는 서버 장치의 동작을 설명하기 위한 도면이다.1 is a diagram for explaining an operation of a server device that provides a document analysis method according to an embodiment of the present disclosure.
서버 장치(100)는 외부 장치들과 통신을 수행할 수 있다. 예를 들어, 도 1을 참고하면, 서버 장치(100)는 사용자 단말 장치(200), 외부 서버 장치(300) 및 제3자 단말 장치(400)와 통신을 수행할 수 있다. 다만, 서버 장치(100)가 통신 가능한 단말의 개수는 이에 한정되지 않으며, 통신할 대상 단말의 종류나 통신 방식 등은 다양하게 구현될 수 있다.The server device 100 may communicate with external devices. For example, referring to FIG. 1 , the server device 100 may communicate with the user terminal device 200 , the external server device 300 , and the third-party terminal device 400 . However, the number of terminals capable of communicating with the server device 100 is not limited thereto, and the type or communication method of the target terminal to communicate with may be implemented in various ways.
서버 장치(100)의 동작과 관련한 상세한 설명은 도 2에서 후술하기로 한다.A detailed description related to the operation of the server device 100 will be described later with reference to FIG. 2 .
사용자 단말 장치(200)는 문서에 대한 분석 결과를 제공 받고자 하는 사용자가 사용하는 단말 장치이다. 사용자는 분석의 대상이 되는 문서(10, 도 3 참고)를 사용자 단말 장치(200)를 통해 서버 장치(100)로 제공할 수 있다. 사용자는 사용자 단말 장치(200)의 메모리(220)에 저장된 문서(10)를 서버 장치(100)로 제공하거나, 문서(10)가 저장된 UBS 메모리를 사용자 단말 장치(200)에 연결하여 사용자 단말 장치(200)를 통해 서버 장치(100)로 제공할 수 있다. 여기에서, 문서(10)는 워드 파일, 이미지 파일일 수 있다.The user terminal device 200 is a terminal device used by a user who wants to receive an analysis result for a document. The user may provide the document 10 (refer to FIG. 3 ) to be analyzed to the server device 100 through the user terminal device 200 . The user provides the document 10 stored in the memory 220 of the user terminal device 200 to the server device 100 or connects the UBS memory in which the document 10 is stored to the user terminal device 200 to the user terminal device It may be provided to the server device 100 through 200 . Here, the document 10 may be a word file or an image file.
한편, 사용자는 사용자 단말 장치(200)를 통해 문서(10) 파일을 서버 장치(100)에 제공할 수 있을 뿐만 아니라, 관련 정보를 사용자 단말 장치(200)에 직접 입력함으로써 서버 장치(100)에 제공할 수 있다. 예를 들어, 사용자는 사용자 단말 장치(200)에 텍스트 형태의 정보를 입력하여 서버 장치(100)에 제공할 수 있다.On the other hand, the user can provide the document 10 file to the server device 100 through the user terminal device 200 as well as directly input related information into the user terminal device 200 to the server device 100 can provide For example, the user may input information in text form into the user terminal device 200 and provide it to the server device 100 .
사용자 단말 장치(200)는 PC, 랩탑 PC, 휴대폰, 태블릿 PC 등과 같은 다양한 형태의 장치가 사용될 수 있으나 이에 한정되지는 않으며, 사용자는 USB 메모리에 문서(10)의 파일을 저장하여, 서버 장치(100)에 연결하여 직접 입력하는 방식으로 문서(10)를 서버 장치(100)에 제공할 수 있다.The user terminal device 200 may use various types of devices such as a PC, a laptop PC, a mobile phone, a tablet PC, etc., but is not limited thereto, and the user stores the file of the document 10 in a USB memory, The document 10 may be provided to the server device 100 by connecting to 100 ) and directly inputting the document 10 .
외부 서버 장치(300)는 서버 장치(100)와 통신을 수행할 수 있다. 예를 들어, 서버 장치(100)는 문서(10)로부터 인식된 정보에 대응되는 관련 정보를 외부 서버 장치(300)에 요청하여 외부 서버 장치(300)로부터 해당 정보를 수신할 수 있다.The external server device 300 may communicate with the server device 100 . For example, the server device 100 may request the external server device 300 for related information corresponding to information recognized from the document 10 to receive the corresponding information from the external server device 300 .
서버 장치(100)는 문서에 대한 분석 결과를 제3자 단말 장치(400)에 제공할 수 있으며, 제3자 단말 장치(400)로부터 수신한 정보를 문서 분석에 반영할 수 있다. 또한, 서버 장치(100)는 제3자 단말 장치(400)로부터 수신한 정보를 사용자 단말 장치(200)에 제공할 수도 있다.The server device 100 may provide a document analysis result to the third party terminal device 400 , and may reflect information received from the third party terminal device 400 in document analysis. Also, the server device 100 may provide information received from the third party terminal device 400 to the user terminal device 200 .
예를 들어, 서버 장치(100)는 부동산 매물 및 부동산 계약 문서를 분석하여 분석 결과를 사용자에게 제공하기 위한 장치일 수 있고, 사용자 단말 장치(200)는 분석 서비스를 제공받고자 하는 사용자가 사용하는 단말 장치이며, 제3자 단말 장치(400)는 부동산 매물 정보를 서버 장치(100)에 제공하는 공인중개사 또는 개인이 사용하는 단말 장치일 수 있다. 또한, 외부 서버 장치(300)는 부동산 계약에 의해 특정되는 부동산과 관련한 정보, 예를 들어 부동산의 등기부 등본, 토지 대장, 건축물 대장 등의 정보를 포함하는 외부 서버일 수 있다.For example, the server device 100 may be a device for analyzing real estate sales and real estate contract documents and providing an analysis result to a user, and the user terminal device 200 is a terminal used by a user who wants to receive an analysis service It is a device, and the third-party terminal device 400 may be a terminal device used by a real estate agent or an individual who provides real estate sale information to the server device 100 . Also, the external server device 300 may be an external server including information related to real estate specified by a real estate contract, for example, a real estate register copy, land ledger, building ledger, and the like.
이 경우, 서버 장치(100)는 제3자 단말 장치(400)로부터 제공 받은 부동산 매물 정보를 분석하여 분석 결과를 사용자 단말 장치(200)로 제공할 수 있다. 사용자가 부동산 계약 문서를 사용자 단말 장치(200)를 통해 서버 장치(100)로 제공하면, 서버 장치(100)는 부동산 계약 문서를 분석하여 분석 결과를 사용자 단말 장치(200)에 제공할 수 있다. 또한, 서버 장치(100)를 통해 사용자 단말 장치(200)와 제3자 단말 장치(400) 상호간에 정보 송수신이 일어날 수도 있다.In this case, the server device 100 may analyze the real estate for sale information provided from the third party terminal device 400 and provide the analysis result to the user terminal device 200 . When the user provides the real estate contract document to the server device 100 through the user terminal device 200 , the server device 100 may analyze the real estate contract document and provide the analysis result to the user terminal device 200 . Also, information may be transmitted/received between the user terminal device 200 and the third-party terminal device 400 through the server device 100 .
이하, 도 2를 참고하여 본 개시의 일 실시예에 따른 서버 장치(100)의 구성 및 동작에 대해 설명한다.Hereinafter, the configuration and operation of the server device 100 according to an embodiment of the present disclosure will be described with reference to FIG. 2 .
도 2는 본 개시의 일 실시예에 따른 서버 장치의 구성을 설명하기 위한 블록도이다.2 is a block diagram illustrating a configuration of a server device according to an embodiment of the present disclosure.
도 2를 참고하면, 본 개시의 일 실시예에 따른 서버 장치(100)는 통신부(110), 메모리(120) 및 프로세서(130)를 포함할 수 있다.Referring to FIG. 2 , the server device 100 according to an embodiment of the present disclosure may include a communication unit 110 , a memory 120 , and a processor 130 .
통신부(110)는 외부 장치와 통신을 수행하여 다양한 데이터를 송수신할 수 있다. 예를 들어, 통신부(110)는 사용자 단말 장치(200), 외부 서버 장치(300) 및 제3자 단말 장치(400)로부터 문서 및 관련 정보를 수신할 수 있고, 문서에 대한 분석 데이터를 사용자 단말 장치(200)에 전송할 수 있다.The communication unit 110 may transmit/receive various data by performing communication with an external device. For example, the communication unit 110 may receive a document and related information from the user terminal device 200 , the external server device 300 , and the third party terminal device 400 , and transmit analysis data for the document to the user terminal may be transmitted to the device 200 .
한편, 통신부(110)는 근거리 통신망(LAN: Local Area Network), 인터넷 네트워크, 이동 통신 네트워크를 통해 외부 장치와 통신을 수행할 수 있음은 물론, BT(Bluetooth), BLE(Bluetooth Low Energy), WI-FI(Wireless Fidelity), WI-FI Direct(Wireless Fidelity Direct), Zigbee, NFC 등과 같은 다양한 통신 방식 등을 통해 외부 장치와 통신을 수행할 수 있다. 이를 위해, 통신부(110)는 네트워크 통신을 수행하기 위한 다양한 통신 모듈을 포함할 수 있다. 예를 들어, 통신부(110)는 블루투스 칩, 와이파이 칩, 무선 통신 칩 등을 포함할 수 있다.Meanwhile, the communication unit 110 may communicate with an external device through a local area network (LAN), an Internet network, and a mobile communication network, as well as BT (Bluetooth), BLE (Bluetooth Low Energy), WI - It is possible to communicate with an external device through various communication methods such as FI (Wireless Fidelity), WI-FI Direct (Wireless Fidelity Direct), Zigbee, NFC, etc. To this end, the communication unit 110 may include various communication modules for performing network communication. For example, the communication unit 110 may include a Bluetooth chip, a Wi-Fi chip, a wireless communication chip, and the like.
메모리(120)는 서버 장치(100)의 구성요소의 전반적인 동작을 제어하기 위한 운영체제(Operating System: OS) 및 서버 장치(100)의 구성요소와 관련된 명령 또는 데이터를 저장할 수 있다. The memory 120 may store an operating system (OS) for controlling overall operations of the components of the server device 100 and commands or data related to components of the server device 100 .
예를 들어, 메모리(120)는 사용자 단말 장치(200)로부터 수신한 문서에 대한 파일을 저장할 수 있다. 또한, 메모리(120)는 외부 서버 장치(300)로부터 수신한 문서 관련 정보를 저장할 수도 있다.For example, the memory 120 may store a file for a document received from the user terminal device 200 . Also, the memory 120 may store document related information received from the external server device 300 .
프로세서(130)는 메모리(120)에 저장된 다양한 명령 또는 데이터 등을 이용하여 서버 장치(100)의 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장(store)할 수 있다.The processor 130 may control a plurality of hardware or software components of the server device 100 using various commands or data stored in the memory 120 , and a command received from at least one of the other components or Data may be loaded into a volatile memory for processing, and various data may be stored in a non-volatile memory.
본 개시의 일 실시예에 따른 프로세서(130)는 메모리(120)에 저장된 문서(10)를 입력 받거나, 통신부(110)를 통해 외부 장치로부터 수신한 문서(10)를 입력 받아, 입력 받은 문서(10)에 포함된 텍스트를 추출하고, 추출된 텍스트들 중에서 복수의 식별 항목에 해당하는 텍스트를 식별하며, 식별된 텍스트에 인접한 영역에 기재된 텍스트를 식별 항목에 대응되는 정보로 인식할 수 있다.The processor 130 according to an embodiment of the present disclosure receives the document 10 stored in the memory 120 or receives the document 10 received from the external device through the communication unit 110, and receives the inputted document ( 10) may be extracted, texts corresponding to a plurality of identification items may be identified among the extracted texts, and a text written in an area adjacent to the identified text may be recognized as information corresponding to the identification items.
또한, 프로세서(130)는 식별 항목에 대응되는 정보를 기 설정된 복수의 그룹으로 분류하고, 그룹 별로 상이하게 설정된 처리 프로세스에 따라 복수의 그룹에 속하는 정보들을 처리하고, 처리 결과에 기초하여 문서(10)에 대한 분석 데이터를 제공할 수 있다. 이와 관련한 상세한 설명은 후술하기로 한다.In addition, the processor 130 classifies the information corresponding to the identification item into a plurality of preset groups, processes information belonging to the plurality of groups according to a processing process set differently for each group, and processes the information belonging to the plurality of groups based on the processing result. ) can provide analysis data for A detailed description related thereto will be provided later.
도 3은 본 개시의 일 실시예에 따른 사용자 단말 장치의 구성을 설명하기 위한 블록도이다.3 is a block diagram illustrating a configuration of a user terminal device according to an embodiment of the present disclosure.
도 3을 참고하면, 본 개시의 일 실시예에 따른 사용자 단말 장치(200)는 통신부(210), 메모리(220), 디스플레이(230) 및 프로세서(240)를 포함할 수 있다.Referring to FIG. 3 , the user terminal device 200 according to an embodiment of the present disclosure may include a communication unit 210 , a memory 220 , a display 230 , and a processor 240 .
통신부(210)는 외부 장치, 예컨대 서버 장치(100) 또는 제3자 단말 장치(400)와 통신을 수행하여 다양한 데이터를 송수신할 수 있다. 예를 들어, 통신부(210)는 서버 장치(100) 및 제3자 단말 장치(400)로부터 문서 및 관련 정보를 수신할 수 있고, 문서에 대한 분석 데이터를 서버 장치(100)로부터 수신할 수 있다.The communication unit 210 may transmit/receive various data by performing communication with an external device, for example, the server device 100 or the third-party terminal device 400 . For example, the communication unit 210 may receive a document and related information from the server device 100 and the third-party terminal device 400 , and may receive analysis data for the document from the server device 100 . .
메모리(220)는 사용자 단말 장치(200)의 구성요소의 전반적인 동작을 제어하기 위한 운영체제(Operating System: OS) 및 사용자 단말 장치(200)의 구성요소와 관련된 명령 또는 데이터를 저장할 수 있다. 예를 들어, 메모리(220)는 문서(10) 파일을 저장할 수 있고, 문서(10)는 워드 파일 또는 사용자 단말 장치(200)에 포함된 카메라(미도시)를 통해 촬상된 이미지 파일일 수 있다.The memory 220 may store an operating system (OS) for controlling overall operations of components of the user terminal device 200 and commands or data related to components of the user terminal device 200 . For example, the memory 220 may store a document 10 file, and the document 10 may be a word file or an image file captured by a camera (not shown) included in the user terminal device 200 . .
디스플레이(230)는 영상을 표시하기 위한 구성으로, LCD(liquid crystal display), OLED(organic light-emitting diode), LCoS(Liquid Crystal on Silicon), DLP(Digital Light Processing), QD(quantum dot) 디스플레이 패널 등과 같은 다양한 형태로 구현될 수 있다.The display 230 is a configuration for displaying an image, and includes a liquid crystal display (LCD), an organic light-emitting diode (OLED), a liquid crystal on silicon (LCoS), a digital light processing (DLP), and a quantum dot (QD) display. It may be implemented in various forms, such as a panel.
이 경우, 디스플레이(230)는 사용자에게 정보를 제공하기 위한 UI를 표시할 수 있다. 예를 들어, 디스플레이(230)는 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 문서에 대한 분석 데이터를 사용자에게 제공하는 UI를 표시할 수 있다. 문서에 대한 분석 데이터를 제공하는 UI와 관련한 상세한 설명은 도 10 내지 도 15에서 후술하기로 한다.In this case, the display 230 may display a UI for providing information to the user. For example, the display 230 may display a UI that provides analysis data for a document to a user according to the document analysis method according to an embodiment of the present disclosure. A detailed description of the UI for providing analysis data for a document will be described later with reference to FIGS. 10 to 15 .
프로세서(240)는 메모리(220)에 저장된 다양한 명령 또는 데이터 등을 이용하여 사용자 단말 장치(200)의 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장(store)할 수 있다.The processor 240 may control a plurality of hardware or software components of the user terminal device 200 using various commands or data stored in the memory 220 , and a command received from at least one of the other components. Alternatively, data may be loaded into a volatile memory for processing, and various data may be stored in a non-volatile memory.
예를 들어, 프로세서(240)는 외부 장치와 신호를 송수신하도록 통신부(210)를 제어하고, 문서에 대한 분석 데이터를 제공하는 UI를 표시하도록 디스플레이(230)를 제어할 수 있다.For example, the processor 240 may control the communication unit 210 to transmit/receive signals to and from an external device, and may control the display 230 to display a UI providing analysis data for a document.
도 4는 본 개시의 일 실시예에 따른 문서 분석 방법에서 분석 대상이 되는 문서의 일 예를 나타내는 도면이다.4 is a diagram illustrating an example of a document to be analyzed in a document analysis method according to an embodiment of the present disclosure.
도 4를 참고하면, 본 개시의 일 실시예에 따른 문서 분석의 대상이 되는 문서(10)는 부동산 계약 문서일 수 있다. 다만, 본 개시에 따른 문서 분석의 대상이 되는 문서는 이에 한정되는 것은 아니며, 다양한 종류의 문서에 대하여 적용될 수 있다.Referring to FIG. 4 , a document 10 to be analyzed according to an embodiment of the present disclosure may be a real estate contract document. However, the document to be analyzed according to the present disclosure is not limited thereto, and may be applied to various types of documents.
이하, 설명의 편의를 위해 본 개시의 일 실시예에 따른 문서 분석의 대상이 되는 문서(10)는 부동산 계약 문서인 것으로 예를 들어 설명하도록 한다.Hereinafter, for convenience of description, the document 10 to be analyzed according to an embodiment of the present disclosure is a real estate contract document.
통상적으로 문서는 레이아웃과 컨텐츠로 구성될 수 있다. 레이아웃이란 문서의 형태를 구성하는 각종 정보를 포함할 수 있다. 컨텐츠란 레이아웃 내에 채워진 의미 있는 정보를 의미한다. 예를 들어, 문서에 표 형태의 정보가 포함된 경우, 레이아웃은 표를 구성하는 선에 해당하고, 컨텐츠는 표 내에 채워진 각종 텍스트일 수 있다. Typically, a document may be composed of a layout and content. The layout may include various types of information constituting the form of a document. Content means meaningful information filled in the layout. For example, when the document includes information in the form of a table, the layout may correspond to lines constituting the table, and the content may be various texts filled in the table.
다만, 레이아웃이 이에 한정되는 것은 아니고, 각종 선을 포함하는 표와 같은 형태뿐만 아니라, 선을 포함하지 않더라도 컨텐츠가 일정한 형태로 배열된 것 또한 레이아웃에 해당될 수 있다. However, the layout is not limited thereto, and not only a form such as a table including various lines, but also a layout in which contents are arranged in a certain form even if the line is not included may also correspond to the layout.
도 4의 문서(10)에서 레이아웃과 텍스트를 구분해보면, 문서(10)에 포함된 표를 구성하는 선이 레이아웃으로 분류될 수 있다. 또한, 위아래로 일정한 간격을 가지고 배열된 텍스트들(12-8, 12-9, 12-10)이 배열된 형태 또한 레이아웃에 해당할 수 있다.When a layout and text are separated in the document 10 of FIG. 4 , lines constituting a table included in the document 10 may be classified as a layout. In addition, a form in which the texts 12-8, 12-9, and 12-10 arranged at regular intervals up and down may also correspond to a layout.
한편, 표 레이아웃에 포함된 각각의 셀 내부에 기재된 텍스트들(11, 12)의 경우 컨텐츠로 분류될 수 있다.Meanwhile, texts 11 and 12 written inside each cell included in the table layout may be classified as content.
서버 장치(100)는 문서(10)에 포함된 레이아웃과 텍스트를 분리하여 서로 다른 방식으로 처리할 수 있다.The server device 100 may separate the layout and text included in the document 10 and process them in different ways.
레이아웃과 텍스트의 분리는 다양한 방식으로 이루어질 수 있다.Separation of layout and text can be accomplished in a variety of ways.
이하, 도 5 내지 7을 참고하여 문서(10)에서 레이아웃과 텍스트를 각각 추출하는 방법 중 문서(10)에 표 레이아웃이 포함된 경우를 일 예로 하여 설명하도록 한다.Hereinafter, a case in which the document 10 includes a table layout among methods of extracting a layout and text from the document 10 will be described as an example with reference to FIGS. 5 to 7 .
도 5는 문서에 포함된 표 레이아웃에서 수직선을 추출하는 동작을 설명하기 위한 도면이고, 도 6은 문서에 포함된 표 레이아웃에서 수평선을 추출하는 동작을 설명하기 위한 도면이며, 도 7은 표 레이아웃에서 추출된 수직선 및 수평선 사이의 교차점을 획득하여 표 레이아웃에 포함된 셀을 식별하는 동작을 설명하기 위한 도면이다.5 is a diagram for explaining an operation of extracting a vertical line from a table layout included in a document, FIG. 6 is a diagram for explaining an operation of extracting a horizontal line from a table layout included in a document, and FIG. A diagram for explaining an operation of identifying a cell included in a table layout by obtaining an intersection between an extracted vertical line and a horizontal line.
도 5 및 도 6을 참고하면, 서버 장치(100)의 프로세서(130)는 문서(10)에 표 레이아웃이 포함된 경우, 표 레이아웃에서 수직선(13-1, 13-2, 13-3, 13-4, 13-5, 13-6, 13-7, 13-8, 도 5 참고) 및 수평선(14-1, 14-2, 14-3, 14-4, 14-5, 14-6, 도 6 참고)을 각각 추출할 수 있다. 표 레이아웃의 수직선 및 수평선을 추출하는 방법에는 침식(Erosion), 확장(Dilation) 연산 등이 사용될 수 있으나, 이에 한정되지는 않는다. 또한, 레이아웃에 포함되는 구성 사이의 간격이 일정하다면, 그 간격(Margin)을 경계선으로 인식할 수도 있다.5 and 6 , when the document 10 includes a table layout, the processor 130 of the server device 100 performs vertical lines 13-1, 13-2, 13-3, and 13 in the table layout. -4, 13-5, 13-6, 13-7, 13-8, see Fig. 5) and horizontal lines (14-1, 14-2, 14-3, 14-4, 14-5, 14-6, 6) can be extracted, respectively. Erosion and dilation operations may be used as a method of extracting the vertical and horizontal lines of the table layout, but are not limited thereto. Also, if the interval between components included in the layout is constant, the margin may be recognized as a boundary line.
도 7을 참고하면, 서버 장치(100)의 프로세서(130)는 추출한 수직선 및 수평선을 병합하여 수직선 및 수평선 사이의 교차점들을 획득하고, 획득한 교차점들에 기초하여 표 레이아웃에 포함된 셀을 식별할 수 있다. 예를 들어, 서로 다른 4개의 교차점들이 각각 꼭지점이 되어 하나의 직사각형을 형성하도록 배치된 경우, 서버 장치(100)는 해당 교차점들이 형성하는 영역에 하나의 셀이 위치하는 것으로 식별할 수 있다.Referring to FIG. 7 , the processor 130 of the server device 100 merges the extracted vertical and horizontal lines to obtain intersections between the vertical and horizontal lines, and to identify cells included in the table layout based on the obtained intersections. can For example, when four different intersecting points are arranged to form a single rectangle as each vertex, the server device 100 may identify that one cell is located in an area formed by the corresponding intersecting points.
서버 장치(100)의 프로세서(130)는 표 레이아웃에 포함된 셀을 식별하고, 식별된 셀 내부에 위치한 오브젝트를 텍스트로 추출할 수 있다. 이 경우, 서버 장치(100)는 셀 내부에 위치한 오브젝트에 Deep Learning OCR(Optical Character Recognition, 광학문자인식) 모델을 적용하여 텍스트를 추출하고 분류할 수 있다. 예를 들어, 도 7에서 “소재지” 텍스트가 포함된 셀에 대하여 OCR 모델을 적용하여 분류를 진행하면, “소”, “재”, “지” 각각의 음절로 인식되어 분류되며, 세 음절은 하나의 셀 내부에 위치되어 있으므로 각 음절들을 하나로 병합하여 “소재지”라는 텍스트로 완성할 수 있다.The processor 130 of the server device 100 may identify a cell included in the table layout and extract an object located inside the identified cell as text. In this case, the server device 100 may extract and classify text by applying a Deep Learning OCR (Optical Character Recognition) model to an object located inside the cell. For example, when classification is performed by applying the OCR model to a cell containing the text “Location” in FIG. 7, “so”, “jae”, and “ji” are recognized and classified as each syllable, and the three syllables are Since it is located inside one cell, each syllable can be merged into one and completed as the text “Location”.
한편, 프로세서(130)는 셀 내부에 배치된 오브젝트가 텍스트를 구성하는지 여부를 판단할 수 있다. 프로세서(130)는 한글이나, 영문, 중문, 일문 등과 같은 각종 언어 DB 및 이미지 DB에 기재된 문자 형태와 셀 내부에 배치된 오브젝트의 형태를 비교하여, 텍스트에 해당하는지 여부를 판단할 수 있다. Meanwhile, the processor 130 may determine whether an object disposed inside a cell constitutes text. The processor 130 may determine whether or not the text corresponds to the text by comparing the shape of the characters described in the image DB and the image DB of various languages such as Korean, English, Chinese, and Japanese, and the shape of an object disposed inside the cell.
또한, 복수의 텍스트가 일정하게 배열된 형태로 나열되어 있다고 판단되면, 프로세서(130)는 해당 텍스트들이 일정한 레이아웃을 이루고 있다고 판단할 수 있다.Also, if it is determined that a plurality of texts are arranged in a uniformly arranged form, the processor 130 may determine that the corresponding texts form a uniform layout.
한편, 프로세서(130)는 문서(10)에서 추출한 텍스트들 중에서 복수의 식별 항목에 해당하는 텍스트 및 식별 항목에 대응되는 정보에 해당하는 텍스트를 인식할 수 있다.Meanwhile, the processor 130 may recognize texts corresponding to a plurality of identification items and text corresponding to information corresponding to the identification items from among the texts extracted from the document 10 .
여기에서, 식별 항목이란 문서(10)에 포함된 다양한 정보 각각의 종류를 식별하기 위한 항목을 의미한다. Here, the identification item means an item for identifying each type of various information included in the document 10 .
예를 들어, 식별 항목은 부동산 계약 문서에서 계약의 대상이 되는 부동산에 대한 정보에 포함된 복수의 특징을 식별하기 위한 항목일 수 있다. 도 4를 참고하면, 문서(10)에는 부동산을 특정하기 위한 '소재지'와 같은 식별 항목이 기재되어 있을 수 있고, 부동산의 특징을 나타내기 위한 '토지', '지목', '면적', '건물', '구조', '용도' 등과 같은 식별 항목 및 부동산 계약 내용에 대한 정보를 포함하는 '특약사항'과 같은 식별 항목이 기재되어 있을 수 있다.For example, the identification item may be an item for identifying a plurality of features included in information on real estate to be contracted in a real estate contract document. Referring to FIG. 4 , identification items such as 'location' for specifying real estate may be described in the document 10, and 'land', 'location', 'area', ' Identification items such as 'building', 'structure', and 'use' and identification items such as 'special agreement' including information on the contents of a real estate contract may be described.
다만, 복수의 식별 항목은 이에 한정되지 않으며, 주소(예컨대, 부동산 매물 주소를 나타내는 “소재지”, 계약자의 인적 사항과 관련한 주소 등), 층호수, 임대인, 소유주, 토지 면적, 구조, 용도, 건물 면적, 보증금, 매매 대금, 특약 등 다양한 항목을 포함할 수 있다.However, the plurality of identification items is not limited thereto, and addresses (eg, “location” indicating the real estate sale address, address related to the contractor’s personal information, etc.), floor number, lessor, owner, land area, structure, use, building It can include various items such as area, deposit, purchase price, and special contract.
프로세서(130)는 특정 위치에 배치된 텍스트를 식별 항목으로 식별하거나, 텍스트의 내용을 통해 식별 항목인지 여부를 판단할 수 있다. 예를 들어, 표 형태의 레이아웃에서 1열에 해당하는 셀 내부에 기재된 텍스트를 식별 항목에 해당하는 텍스트로 식별하거나, '임대인', '임차인', '소재지', '토지', '지목', '면적', '건물', '구조', '용도', '특약사항', 등과 같이 부동산 계약 문서에서 통상적으로 식별 항목으로 지정되는 단어들을 인식함으로써 식별 항목에 해당하는 텍스트인지 판단할 수 있다.The processor 130 may identify a text disposed at a specific location as an identification item or determine whether it is an identification item based on the content of the text. For example, in a tabular layout, the text written inside the cell corresponding to column 1 is identified as the text corresponding to the identification item, or 'lessor', 'tenant', 'location', 'land', 'position', ' By recognizing words that are normally designated as identification items in real estate contract documents, such as 'area', 'building', 'structure', 'use', 'special terms', etc., it can be determined whether the text corresponds to the identification item.
이 경우, 각각의 식별 항목에 대응되는 정보는 식별 항목에 해당하는 텍스트와 인접한 영역에 기재된 텍스트가 나타내는 정보일 수 있다. 예를 들어, 프로세서(130)는 부동산의 '소재지'(11-1)에 대응되는 정보는 '서울특별시 관악구 봉천동 1234-12'(12-1)이고, '건물'(11-5)의 '구조'(11-6)에 대응되는 정보는 '철근콘크리트'(12-4)인 것으로 인식할 수 있다.In this case, the information corresponding to each identification item may be information indicated by text written in an area adjacent to the text corresponding to the identification item. For example, in the processor 130, the information corresponding to the 'location' 11-1 of the real estate is '1234-12 Bongcheon-dong, Gwanak-gu, Seoul' (12-1), and the 'building' (11-5) ' Information corresponding to the 'structure' 11-6 can be recognized as 'reinforced concrete' (12-4).
또한, 프로세서(130)는 '특약사항'(11-10)과 인접한 영역에 상하로 일정한 간격을 가지고 나열된 텍스트들(12-8, 12-9, 12-10)을 '특약사항'(11-10)에 대응되는 정보로 인식할 수 있다.In addition, the processor 130 records the texts (12-8, 12-9, 12-10) arranged at regular intervals up and down in the area adjacent to the 'special agreement' 11-10 to the 'special agreement' (11-). It can be recognized as information corresponding to 10).
한편, 프로세서(130)는 식별 항목에 대응되는 정보를 기 설정된 복수의 그룹으로 분류하고, 그룹 별로 정보들을 처리할 수 있다. Meanwhile, the processor 130 may classify information corresponding to the identification item into a plurality of preset groups, and process the information for each group.
이하, 도 8을 참고하여 프로세서(130)가 식별 항목에 대응되는 정보를 복수의 그룹으로 분류하고, 그룹 별로 정보들을 각각 처리하는 동작에 대해 설명한다.Hereinafter, an operation in which the processor 130 classifies information corresponding to an identification item into a plurality of groups and processes the information for each group will be described with reference to FIG. 8 .
도 8은 문서에 대해 획득한 데이터를 표 형태로 나타낸 도면이다. 도 8을 참고하면, 프로세서(130)는 각각의 식별 항목(21)에 대응되는 정보(22)를 인식함으로써, 문서(10)에 대한 데이터를 획득할 수 있다. 8 is a diagram illustrating data obtained for a document in a table form. Referring to FIG. 8 , the processor 130 may acquire data about the document 10 by recognizing the information 22 corresponding to each identification item 21 .
프로세서(130)는 이와 같이 획득한 데이터에 기초하여, 식별 항목(21)에 대응되는 정보(22)를 복수의 그룹으로 분류하고, 그룹 별로 상이하게 설정된 처리 프로세스에 따라 복수의 그룹에 속하는 정보들을 처리할 수 있다.The processor 130 classifies the information 22 corresponding to the identification item 21 into a plurality of groups based on the obtained data in this way, and collects information belonging to the plurality of groups according to a processing process set differently for each group. can be processed
예를 들어, 프로세서(130)는 부동산의 계약 내용에 대한 정보를 포함하는 제1 그룹, 부동산의 특징을 나타내는 정보를 포함하는 제2 그룹, 그리고 부동산을 특정하기 위한 정보를 포함하는 제3 그룹으로 식별 항목(21) 및 식별 항목에 대응되는 정보(22)를 분류할 수 있다.For example, the processor 130 is divided into a first group including information on contract details of real estate, a second group including information indicating characteristics of real estate, and a third group including information for specifying real estate. The identification item 21 and the information 22 corresponding to the identification item may be classified.
도 4를 참고하면, 식별 항목 중 '특약'(21-8)은 부동산의 계약 내용에 대한 정보이므로 제1 그룹으로 분류될 수 있다. 또한, 식별 항목 중 '구조용도'(21-5), '건물면적'(21-6), '보증금'(21-7) 등은 부동산의 특징을 나타내는 정보이므로 제2 그룹으로 분류될 수 있으며, '주소'(21-1), '층호수'(21-1), '임대인'(21-3), '계좌소유주'(21-4) 등은 부동산을 특정하기 위한 정보이므로 제3 그룹으로 분류될 수 있다.Referring to FIG. 4 , among the identification items, the 'special contract' 21 - 8 is information on the contract details of real estate, and thus may be classified into the first group. In addition, among the identification items, 'structural use' (21-5), 'building area' (21-6), 'deposit' (21-7), etc. are information indicating the characteristics of real estate, so they can be classified into the second group. , 'address' (21-1), 'floor number' (21-1), 'lessor' (21-3), 'account owner' (21-4), etc. are information for specifying real estate, so the third group can be classified as
프로세서(130)는 복수의 그룹의 특성에 따라 각 그룹에 속하는 정보에 대해 서로 다른 처리 프로세스를 적용하여 처리할 수 있다. 이 경우, 복수의 그룹은 각 처리 프로세스가 필요한 정보들을 기준으로 분류될 수 있다.The processor 130 may apply and process different processing processes to information belonging to each group according to the characteristics of the plurality of groups. In this case, the plurality of groups may be classified based on information required for each processing process.
예를 들어, 제1 그룹은 부동산의 계약 내용에 대한 정보(22-8)를 포함하므로, 심층적인 분석이 필요할 수 있다. 이에, 프로세서(130)는 맞춤법 교정, 띄어쓰기 교정, 숫자 변환, 용어 변환, 관련 컨텐츠 추가, 매물 안전성 판단 프로세스를 포함하는 제1 처리 프로세스를 제1 그룹에 적용하여, 제1 그룹에 속하는 정보를 처리할 수 있다.For example, since the first group includes information 22 - 8 on contract details of real estate, an in-depth analysis may be required. Accordingly, the processor 130 processes the information belonging to the first group by applying the first processing process including spelling correction, spacing correction, number conversion, term conversion, related content addition, and property safety determination process to the first group. can do.
여기에서, 숫자 변환은 금액 표현 시 숫자와 문자가 혼용된 텍스트를 숫자만으로 변환(예를 들어, '100만원'을 '1000000'으로 변환)하는 것을 의미할 수 있고, 용어 변환은 부동산 계약 문서에 포함된 법률 용어를 일상적인 용어로 변환하는 것을 의미할 수 있다. Here, the number conversion may mean converting text with numbers and letters mixed into numbers only (for example, converting '1 million won' to '100000') when expressing the amount, and the term conversion is in the real estate contract document. It may mean converting contained legal terms into ordinary terms.
관련 컨텐츠 추가는 일반적인 사용자에게 생소할 수 있는 부동산 관련 법률 지식, 일반 부동산 정보 및 관례 등을 정보 처리 과정에서 추가하는 것을 의미할 수 있다. 예를 들어, 부동산 매물에 높은 근저당이 설정되어 있으면 전세자금대출에 어려움이 있을 수 있다는 정보를 추가하거나, 특정 요건에 해당하는 거래의 경우(예컨대, 소유자가 법인 사업자이거나 건물 종류가 근린생활시설에 해당하는 등) 전세보증보험 가입이 어려울 수 있다는 정보를 사용자에게 제공되는 관련 컨텐츠로 추가할 수 있다.Adding related content may mean adding real estate-related legal knowledge, general real estate information, and customs that may be unfamiliar to general users in the information processing process. For example, adding information that there may be difficulties in getting a cheonsei loan if a high mortgage is set on a real estate sale, or in the case of a transaction that meets certain requirements (for example, if the owner is a corporation or the type of building is a neighborhood living facility) Information that it may be difficult to subscribe to Jeonse Guarantee Insurance can be added as related content provided to users.
또한, 매물 안정성 판단 프로세스는 예를 들어 보증금 가격의 안전도를 산출하는 등의 정보 처리를 의미할 수 있다.In addition, the property stability determination process may refer to information processing, such as calculating the safety level of the deposit price, for example.
제2 그룹은 부동산의 특징을 나타내는 정보(22-5, 22-6, 22-7)를 포함하며, 제1 그룹보다는 낮은 수준의 분석을 진행하여도 사용자에게 필요한 정보를 제공할 수 있다. 이에, 프로세서(130)는 띄어쓰기 교정, 숫자 변환, 용어 변환, 공인 정보 일치 여부 판단 프로세스, 매물 안전성 판단 프로세스, 사용자 선호 정보에 기초한 매물 적합성 판단 프로세스를 포함하는 제2 처리 프로세스를 제2 그룹에 적용하여, 제2 그룹에 속하는 정보를 처리할 수 있다.The second group includes information 22-5, 22-6, and 22-7 indicating the characteristics of real estate, and it is possible to provide necessary information to the user even though a lower level analysis than the first group is performed. Accordingly, the processor 130 applies a second processing process including spacing correction, number conversion, term conversion, accredited information match determination process, property safety determination process, and property suitability determination process based on user preference information to the second group Thus, information belonging to the second group can be processed.
여기에서, 사용자 선호 정보에 기초한 매물 적합성 판단 프로세스란, 사용자로부터 입력 받은 사용자 선호 정보에 부합하는 적합한 매물인지 여부를 판단하는 정보 처리를 의미할 수 있다.Here, the process for determining suitability of a property based on user preference information may refer to information processing for determining whether a property is suitable for sale according to user preference information input from a user.
제3 그룹은 부동산을 특정하기 위한 정보(22-1, 22-2, 22-3, 22-4)를 포함하며, 제3 그룹 또한 제1 그룹보다는 낮은 수준의 분석을 진행하여도 사용자에게 필요한 정보를 제공할 수 있다. 이에, 프로세서(130)는 띄어쓰기 교정, 용어 변환, 공인 정보 일치 여부 판단 프로세스, 매물 안전성 판단 프로세스를 포함하는 제3 처리 프로세스를 제3 그룹에 적용하여, 제3 그룹에 속하는 정보를 처리할 수 있다.The third group includes information (22-1, 22-2, 22-3, and 22-4) for specifying real estate, and the third group also performs a lower level analysis than the first group. information can be provided. Accordingly, the processor 130 may process the information belonging to the third group by applying a third processing process including spacing correction, term conversion, a process for determining whether public information matches, and a process for determining safety for sale to the third group. .
이에 따라, 각각의 그룹에 대하여 상이한 수준의 정보 처리 프로세스를 적용함으로써, 문서(10)에 포함된 정보에 대한 효율적인 정보 처리를 수행할 수 있다.Accordingly, by applying a different level of information processing process to each group, it is possible to efficiently process information included in the document 10 .
프로세서(130)는 그룹 별로 상이하게 설정된 처리 프로세스에 따라 각각의 그룹에 속하는 정보들을 처리하고, 처리 결과에 기초하여 문서(10)에 대한 분석 데이터를 제공할 수 있다.The processor 130 may process information belonging to each group according to a processing process set differently for each group, and provide analysis data for the document 10 based on the processing result.
이하, 도 9를 참고하여 정보 처리 결과에 기초하여 문서(10)에 대한 분석 데이터를 생성하는 동작에 대해 설명한다.Hereinafter, an operation of generating analysis data for the document 10 based on the information processing result will be described with reference to FIG. 9 .
도 9는 문서에 대해 처리된 정보와 외부 서버 장치로부터 수신된 관련 정보를 비교 및 분석하고, 문서에 대한 분석 데이터를 생성하는 동작을 설명하기 위한 도면이다.9 is a diagram for explaining an operation of comparing and analyzing information processed for a document with related information received from an external server device, and generating analysis data for a document.
서버 장치(100)는 통신부(110)를 통해 외부 서버 장치(300)로부터 문서(10)와 관련된 정보를 수신할 수 있다. 예를 들어, 서버 장치(100)는 외부 서버 장치(300)로부터 문서(10)에 의해 특정되는 부동산의 등기부 등본, 토지 대장, 건축물 대장, 지적도, 토지이용계획확인서, 부동산 가격 정보(시세 정보, 공시가격 정보, 공시지가 정보 등), 부동산 용어 정보(건축법 시행령, 주택법 시행령 등의 법령 관련 정보, 공동주택, 제1종 근린생활시설 등의 용어 정보 등) 중 적어도 하나의 정보를 수신할 수 있다.The server device 100 may receive information related to the document 10 from the external server device 300 through the communication unit 110 . For example, the server device 100 is a certified copy of the register of real estate specified by the document 10 from the external server device 300, land ledger, building ledger, cadastral map, land use plan confirmation, real estate price information (market price information, It is possible to receive at least one piece of information among public price information, official land price information, etc.), real estate terminformation (information related to laws such as the Enforcement Decree of the Building Act, the Enforcement Decree of the Housing Act, terminology information of apartment houses, type 1 neighborhood living facilities, etc.).
이 경우, 프로세서(130)는 외부 서버 장치(300)로부터 수신된 관련 정보와, 문서(10)로부서 인식되는 정보들에 기초하여 문서(10)에 대한 분석 데이터를 생성할 수 있다.In this case, the processor 130 may generate analysis data for the document 10 based on the related information received from the external server device 300 and information recognized as the document 10 .
이하, 도 9를 참고하여, 분석 데이터를 생성하는 동작의 다양한 실시예 중 외부 서버 장치(300)로부터 수신된 관련 정보와 문서(10)로부터 인식되는 정보 중 대응되는 정보들을 비교하여 일치 여부를 판단하는 동작에 대해 설명한다.Hereinafter, with reference to FIG. 9 , in various embodiments of the operation of generating analysis data, the corresponding information among the related information received from the external server device 300 and the information recognized from the document 10 is compared to determine whether they match. Describe the action to be performed.
도 9를 참고하면, 서버 장치(100)는 외부 서버 장치(300)로부터 부동산 계약 문서에서 특정되는 부동산에 대한 공부서류 관련 정보를 수신할 수 있다. Referring to FIG. 9 , the server device 100 may receive study document related information for real estate specified in the real estate contract document from the external server device 300 .
프로세서(130)는 문서(10)에 대해 획득한 데이터(21, 22)와 외부 서버 장치(300)로부터 수신한 관련 정보인 공부서류에 대한 데이터(31, 32)를 비교 및 분석하여, 분석 데이터(40)를 사용자에게 제공할 수 있다.The processor 130 compares and analyzes the data 21 and 22 obtained for the document 10 and the data 31 and 32 for the study document, which is the related information received from the external server device 300 , and analyzes the data (40) may be provided to the user.
구체적으로, 프로세서(130)는 분석의 대상이 되는 문서(10)에 해당하는 부동산 계약서의 식별 항목(21)과 공부서류의 식별 항목(31)이 대응되도록 매칭하고, 계약서의 식별 항목에 대응되는 정보(22)와 공부서류의 식별 항목에 대응되는 정보(32)를 비교하여 일치 여부를 판단할 수 있다.Specifically, the processor 130 matches the identification item 21 of the real estate contract corresponding to the document 10 to be analyzed and the identification item 31 of the study document to correspond, and corresponds to the identification item of the contract By comparing the information (22) and the information (32) corresponding to the identification item of the study document, it is possible to determine whether the match.
예를 들어, 도 5에서 계약서의 계좌소유주에 해당하는 정보는 '박○○'인데 반해, 등기부등본에 기재된 소유자에 해당하는 정보는 '김○○'으로 상이하므로, 프로세서(130)는 계약서에 기재된 정보와 등기부등본에 기재된 정보가 불일치한다는 분석 데이터(40-5)를 생성할 수 있다.For example, in FIG. 5, the information corresponding to the account owner of the contract is 'Park○○', whereas the information corresponding to the owner described in the registered copy is 'Kim○○', so the processor 130 is in the contract. It is possible to generate analysis data (40-5) that the recorded information and the information described in the registered copy do not match.
또한, 도 9를 참고하면, 프로세서(130)는 계약서의 보증금에 대응되는 정보 및 등기부등본의 근저당에 대응되는 정보에 기초하여, 보증금 안전 범위에 대한 분석 데이터(40-8)를 생성할 수 있으며, 이를 위한 데이터 처리를 서버에서 진행할 수 있다.In addition, referring to Figure 9, the processor 130, based on the information corresponding to the security deposit of the contract and the information corresponding to the root mortgage of the registered copy, it is possible to generate analysis data 40-8 for the safe range of the deposit, , data processing for this can be performed on the server.
일 예로, 최근 특정 기간의 특정 지역, 특정 매물의 경매가가 시세가의 몇 %인지, 최근 근저당이 실대출가의 몇 %인지와 관련한 분포 등 통계 정보를 분석한 후, 분석한 정보를 바탕으로 안전 범위를 산출할 수 있다. 예컨대, 서울시 관악구 아파트에 대한 매물 분석을 실시하는 경우, 경매가가 시세가 평균의 80%이고 근저당은 실대출가 평균의 120%에 해당한다면, 해당 부동산에 대해 계약할 시 부동산에 대하여 설정하여야 할 안전 금액은 아파트 매물의 시세의 0.8배에서 근저당의 10/12배를 뺀 금액이므로, 보증금 금액이 안전 금액보다 낮은 경우 일정 금액의 안전 설정을 추천하는 분석 데이터(40-8)를 생성할 수 있다.For example, after analyzing statistical information such as distribution related to a specific area in a specific period, what percentage of the market price is the auction price of a specific property, and what percentage of the actual loan price for a recent near-equity mortgage, the safe range is based on the analyzed information can be calculated. For example, when analyzing a sale for an apartment in Gwanak-gu, Seoul, if the auction price is 80% of the average market price and the mortgage is 120% of the average actual loan price, the safe amount to be set for the real estate when making a contract for the real estate Since is an amount obtained by subtracting 10/12 times the mortgage amount from 0.8 times the market price of the apartment for sale, it is possible to generate the analysis data 40-8 for recommending a safety setting of a certain amount when the deposit amount is lower than the safe amount.
한편, 분석 데이터를 생성하는 다른 예로, 프로세서(130)는 기 설정된 알고리즘을 통해 매물 안전성을 판단하는 매물 안전성 판단 프로세스에 따라 외부 서버 장치(300)로부터 수신된 관련 정보 및 문서(10)로부터 인식되는 정보들을 처리하여 분석 데이터를 생성할 수 있다.On the other hand, as another example of generating the analysis data, the processor 130 recognizes from the related information and document 10 received from the external server device 300 according to the property safety determination process that determines the property safety through a preset algorithm. The information can be processed to generate analytic data.
일 예로, 프로세서(130)는 외부 서버 장치(300)로부터 수신한 등기부등본에 '공동 담보'와 같은 특이 단어가 있는 경우, 등기부등본의 공동 담보 목록에 포함된 여러 매물의 공시가격 및 근저당 설정 정보를 고려하여, 매물의 안전성을 종합적으로 판단한 분석 데이터를 생성할 수 있다.For example, when the processor 130 has a special word such as 'joint collateral' in the certified copy of the register received from the external server device 300, the published price and near-mortgage setting information of several items included in the joint collateral list of the certified copy of the register In consideration of this, it is possible to generate analysis data that comprehensively judges the safety of the product.
한편, 분석 데이터를 생성하는 또 다른 예로, 프로세서(130)는 사용자로부터 입력 받은 사용자 선호 정보에 기초하여 매물 적합성을 판단하는 매물 적합성 판단 프로세스에 따라 외부 서버 장치(300)로부터 수신된 관련 정보 및 문서(10)로부터 인식되는 정보들을 처리하여 분석 데이터를 생성할 수 있다.On the other hand, as another example of generating the analysis data, the processor 130 is the related information and documents received from the external server device 300 according to the sale suitability determination process for determining the suitability for sale based on the user preference information input from the user. Analysis data may be generated by processing the information recognized from (10).
일 예로, 서버 장치(100)는 사용자로부터 'HUG 전세보증보험 가입 선호 여부'에 대한 사용자 선호 정보를 입력 받고, 외부 서버 장치(300)로부터 수신된 관련 정보에서 계약 대상 부동산의 용도가 '근린생활시설'인 경우 HUG 전세보증보험 대상에 해당하지 않는다는 정보를 포함하는 분석 데이터를 생성할 수 있다.As an example, the server device 100 receives user preference information on 'whether or not to subscribe to HUG Jeonse Guarantee Insurance' from the user, and in the related information received from the external server device 300, the purpose of the contracted real estate is 'neighborhood life'. In the case of 'facility', it is possible to generate analysis data including information that it is not covered by HUG Jeonse Guarantee Insurance.
이에 따라, 프로세서(130)는 부동산 계약 문서에서 특정되는 부동산 및 소유자와 관련된 정보의 정확성, 부동산에 관련된 권리 사항 설정 정보, 부동산 계약의 안전성과 같은 분석 데이터를 생성할 수 있다.Accordingly, the processor 130 may generate analysis data such as the accuracy of information related to the real estate and the owner specified in the real estate contract document, information on setting rights related to the real estate, and the safety of the real estate contract.
이와 같이 생성된 문서(10)에 대한 분석 데이터는 사용자에게 제공될 수 있다. 일 예로, 분석 데이터는 사용자 단말 장치(200)에 표시되는 UI를 통하여 사용자에게 제공될 수 있다.Analysis data for the document 10 generated as described above may be provided to the user. As an example, the analysis data may be provided to the user through a UI displayed on the user terminal device 200 .
이하, 도 10 내지 도 15를 참고하여 문서(10)에 대해 생성된 분석 데이터를 사용자에게 제공하기 위해 표시되는 UI에 대해 설명한다.Hereinafter, a UI displayed to provide the user with analysis data generated for the document 10 will be described with reference to FIGS. 10 to 15 .
도 10 내지 도 15는 본 개시의 일 실시예에 따른 문서 분석 방법에 따라 문서에 대한 분석 데이터를 사용자에게 제공하는 UI를 설명하기 위한 도면이다.10 to 15 are diagrams for explaining a UI for providing analysis data for a document to a user according to a document analysis method according to an embodiment of the present disclosure.
서버 장치(100)는 프로세서(130)에 의해 생성된 분석 데이터를 통신부(110)를 통해 사용자 단말 장치(200)로 전송할 수 있다. 사용자 단말 장치(200)는 분석 데이터를 수신하여, 디스플레이(230)에 UI를 표시함으로써 분석 데이터를 사용자에게 제공할 수 있다.The server device 100 may transmit the analysis data generated by the processor 130 to the user terminal device 200 through the communication unit 110 . The user terminal device 200 may receive the analysis data and provide the analysis data to the user by displaying the UI on the display 230 .
도 10은 문서(10) 분석 결과 계약의 대상이 되는 매물이 안전한 매물이라고 분석된 경우 사용자에게 제공되는 UI를 예시적으로 나타낸 것이다.FIG. 10 exemplarily shows a UI provided to a user when the document 10 is analyzed as a safe sale as the target of the contract as a result of analysis.
도 10을 참고하면, 사용자에게 제공되는 UI는 메뉴를 표시하는 UI(1010) 및 분석 데이터를 표시하는 UI(1020)를 포함할 수 있다. 분석 데이터를 표시하는 UI(1020)는 계약의 대상이 되는 매물의 등기부상 내용은 안전한 편이라는 부동산 계약의 안전성에 대한 정보를 표시할 수 있다. Referring to FIG. 10 , the UI provided to the user may include a UI 1010 for displaying a menu and a UI 1020 for displaying analysis data. The UI 1020 for displaying the analysis data may display information on the safety of the real estate contract that the contents of the listing of the sale subject to the contract are on the safe side.
부동산 계약의 안전성에 대한 정보에는 안전성을 수치로 표현한 값이 포함될 수 있다. 이 경우, 부동산 계약의 안전성에 대한 정보는 텍스트 또는 숫자 중 적어도 하나의 형태로 제공될 수 있다.Information on the safety of a real estate contract may include a value expressing the safety numerically. In this case, the information on the safety of the real estate contract may be provided in the form of at least one of text or numbers.
도 11은 문서(10) 분석 결과 계약의 대상이 되는 매물이 안전 장치가 필요한 매물, 가령 도 9에서 살펴본 바와 같이 보증금 및 근저당의 금액에 따라 전세금 안전 설정이 필요하다고 분석된 매물인 경우 사용자에게 제공되는 UI를 예시적으로 나타낸 것이다.11 shows that the document 10 analysis result shows that the sale subject to the contract is a sale that requires a safety device, for example, as shown in FIG. The UI that is used is shown as an example.
도 11을 참고하면, 사용자에게 제공되는 UI는 메뉴를 표시하는 UI(1110) 및 분석 데이터를 표시하는 UI(1120)를 포함할 수 있다. 분석 데이터를 표시하는 UI(1120)는 계약의 대상이 되는 매물의 안전한 권리 확보를 위해 사용자가 참고할 수 있는 정보를 포함하는 부동산 계약의 안전성에 대한 정보를 표시할 수 있다.Referring to FIG. 11 , the UI provided to the user may include a UI 1110 for displaying a menu and a UI 1120 for displaying analysis data. The UI 1120 for displaying the analysis data may display information on the safety of a real estate contract including information that a user can refer to in order to secure a safe right to a sale target of the contract.
도 12는 문서(10) 분석 결과 계약의 내용이 위험한 것으로 분석되는 경우, 예를 들어 특약사항 부분에 이상 사항이 존재한다거나 계약의 대상이 되는 부동산의 등기부등본 상 소유권을 제한하는 이상 사항이 존재하는 등으로 분석된 경우 사용자에게 제공되는 UI를 예시적으로 나타낸 것이다.12 shows that when the content of the contract is analyzed as dangerous as a result of the analysis of the document 10, for example, there is an abnormality in the special clause or there is an abnormality limiting the ownership in the registered copy of the real estate subject to the contract. When analyzed as such, the UI provided to the user is shown as an example.
도 12를 참고하면, 사용자에게 제공되는 UI는 메뉴를 표시하는 UI(1210) 및 분석 데이터를 표시하는 UI(1220)를 포함할 수 있다. 분석 데이터를 표시하는 UI(1220)는 계약의 대상이 되는 매물의 안전한 권리 확보를 위해 사용자가 참고할 수 있는 정보를 포함하는 부동산 계약의 안전성에 대한 정보를 표시할 수 있다.Referring to FIG. 12 , the UI provided to the user may include a UI 1210 for displaying a menu and a UI 1220 for displaying analysis data. The UI 1220 for displaying the analysis data may display information on the safety of a real estate contract including information that a user can refer to in order to secure a safe right to a sale target of the contract.
구체적으로, 도 13 내지 도 15를 참고하면, 계약 내용에 위험성이 판단된 경우, 사용자 단말 장치(200)는 서버 장치(100)로부터 수신한 분석 데이터에 기초하여 계약서, 등기부등본 등에 대한 분석 데이터를 표시하는 UI를 사용자에게 제공하고, 사용자에게 생길 수 있는 불이익, 등기부등본 상 설정되어 있는 권리 사항 등에 대한 상세한 정보를 표시할 수 있다.Specifically, with reference to FIGS. 13 to 15 , when the risk is determined in the contract content, the user terminal device 200 analyzes data for a contract, a registered copy, etc. based on the analysis data received from the server device 100 . The UI to be displayed can be provided to the user, and detailed information about the disadvantages that may occur to the user and the rights set in the registered copy can be displayed.
일 예로, 등기부등본 분석 결과 근저당권이 위험 수준이라고 판단되는 경우, 사용자 단말 장치(200)는 전세 계약 종료 시 사용자가 보증금을 온전히 받을 수 있는지 여부와 관련한 분석 데이터를 표시하는 UI를 사용자에게 제공할 수 있다. 이 경우, 매물 유형 별로 서로 다른 법적 검토사항을 고려하여 분석한 분석 데이터를 직관적으로 도식화한 그래프 또는 텍스트를 통해 표시할 수 있다.As an example, when it is determined that the mortgage is at a risk level as a result of the analysis of the certified copy of the register, the user terminal device 200 may provide the user with a UI that displays analysis data related to whether the user can fully receive the deposit at the end of the jeonse contract. there is. In this case, analysis data analyzed in consideration of different legal considerations for each type of sale can be displayed through an intuitively schematic graph or text.
도 16 및 도 17은 각각 매물 유형이 집합 건물인 경우와 다가구 주택인 경우, 전세 계약 종료 시 보증금을 온전히 받을 수 있는지 여부와 관련한 위험도에 대한 정보를 사용자에게 제공하는 UI를 나타낸 것이다.16 and 17 show a UI for providing a user with information on the degree of risk related to whether the deposit can be fully received upon termination of the jeonse contract when the type of sale is an aggregate building and a multi-family house, respectively.
도 16을 참고하면, 사용자에게 제공되는 UI는 등기부 상 근저당권이 위험 수준임을 나타내는 UI(1610), 시세 대비 근저당이 어느 수준인지 나타내는 UI(1620), 근저당이 위험 수준인 경우 임대인에게 요청할 수 있는 해결책을 제시하는 UI(1630), 근저당 말소 요청 금액을 선택하기 위한 UI(1640) 및 특약 사항을 추가하기 위한 입력을 받는 UI(1650)를 포함할 수 있다.Referring to FIG. 16 , the UI provided to the user is a UI 1610 indicating that the mortgage on the register is at a risk level, a UI 1620 indicating the level of the mortgage against the market price, and a solution that can be requested from the lessor if the mortgage is at a risk level It may include a UI 1630 for presenting , a UI 1640 for selecting an amount for requesting cancellation of a mortgage, and a UI 1650 for receiving an input for adding a special contract.
예를 들어, 분석 결과 매물의 시세 대비 설정된 근저당이 위험 수준으로 판단되면, 임대인에게 근저당 말소를 요청하거나 사용자의 보증금으로 근저당을 말소할 것을 요청하는 등 임대인에게 요청할 것을 제시할 수 있다.For example, if the analysis result determines that the near-mortgage set relative to the market price of the property is at a risky level, it may be suggested to the lessor to request such as a request to cancel the near-mortgage from the lessor or to cancel the near-mortgage with the user's deposit.
이 경우, 사용자에게 제공되는 UI는 추천 근저당 말소 금액을 제시할 수 있다. 일 예로, 서버 장치(100)는 외부 서버(300)로부터 수신한 정보에 대해 통계 처리하여 획득한 데이터를 바탕으로, 최근 특정 기간의 특정 지역, 특정 매물의 경매가가 시세가의 몇 %인지, 최근 근저당이 실대출가의 몇 %인지와 관련한 분포 등 통계 정보를 분석하여 안전 범위 내의 추천 근저당 말소 금액을 산출할 수 있다.In this case, the UI provided to the user may present the recommended amount to cancel the mortgage. As an example, the server device 100 determines what percentage of the market price is the auction price of a specific area and a specific item for a specific recent period, based on data obtained by performing statistical processing on information received from the external server 300 , recently By analyzing statistical information such as distribution related to the percentage of the actual loan price, the recommended amount to be canceled within a safe range can be calculated.
한편, 도 17은 매물이 다가구 주택인 경우 제공되는 UI를 나타낸 것으로, 등기부등본 상의 정보 및 그 이외의 정보(예컨대, 선순위 임차금, 해당 다가구 건물의 소액 임차인 명수 등)를 바탕으로, 매물이 경매에 넘어가는 경우 사용자의 보증금이 안전하게 보전될 수 있는지 여부에 대한 정보를 표시할 수 있다.On the other hand, Figure 17 shows the UI provided when the sale is a multi-family house. Based on the information on the registered copy and other information (eg, senior rent, the number of small tenants in the multi-family building, etc.), the sale is auctioned If passed to , information on whether the user's deposit can be safely preserved can be displayed.
예를 들어, 등기부등본 상의 근저당 설정 정보, 선순위 임차금의 액수, 소액 임차인 명수 등의 정보에 기초하여 매물에 설정된 근저당권의 위험 수준을 판단하여 사용자에게 제공할 수 있다.For example, it is possible to determine the risk level of the mortgage right set for the sale based on information such as the relative mortgage setting information on the registered copy, the amount of the senior rental amount, the number of small tenants, and the like, and provide it to the user.
여기에서, 상술한 정보는 외부 서버 장치(300)로부터 수신하거나, 임대인 또는 공인중개사가 제3자 단말 장치(400)에 입력한 데이터로부터 수신할 수 있다.도 18은 본 개시의 일 실시예에 따른 문서 분석 방법을 설명하기 위한 흐름도이다.Here, the above-described information may be received from the external server device 300 or from data input into the third-party terminal device 400 by a lessor or a real estate agent. It is a flowchart for explaining the document analysis method.
서버 장치는 문서를 입력(S1810) 받을 수 있다.The server device may receive a document input (S1810).
여기에서, 문서는 Doc, Hwp, Xls 등의 다양한 프로그램으로 작성된 문서 파일일 수도 있고, PDF와 같은 이미지 파일일 수도 있으며, 오프라인 상에서 제공된 종이 문서를 카메라나 스캐너를 이용하여 변환한 이미지 파일일 수 있다.Here, the document may be a document file created by various programs such as Doc, Hwp, Xls, etc., may be an image file such as PDF, or may be an image file obtained by converting a paper document provided offline using a camera or a scanner. .
그리고, 서버 장치는 문서에 포함된 텍스트를 추출(S1820)할 수 있다.Then, the server device may extract the text included in the document (S1820).
그리고, 서버 장치는 추출된 텍스트들 중에서 식별 항목에 해당하는 텍스트를 식별(S1830)할 수 있다.Then, the server device may identify the text corresponding to the identification item from among the extracted texts (S1830).
그리고, 서버 장치는 식별된 텍스트에 인접한 영역에 기재된 텍스트를 식별 항목에 대응되는 정보로 인식(S1840)할 수 있다.Then, the server device may recognize the text written in the area adjacent to the identified text as information corresponding to the identification item (S1840).
그리고, 서버 장치는 식별 항목에 대응되는 정보를 기 설정된 복수의 그룹으로 분류(S1850)할 수 있다.Then, the server device may classify the information corresponding to the identification item into a plurality of preset groups ( S1850 ).
이 경우, 복수의 그룹은 제1 내지 제3 그룹을 포함할 수 있고, 제1 그룹은 부동산 계약 내용에 대한 정보를 포함하고, 제2 그룹은 부동산 특징을 나타내는 정보를 포함하며, 제3 그룹은 부동산을 특정하기 위한 정보를 포함할 수 있다.In this case, the plurality of groups may include first to third groups, the first group includes information on real estate contract details, the second group includes information indicating real estate characteristics, and the third group includes It may include information for specifying real estate.
그리고, 서버 장치는 그룹 별로 상이하게 설정된 처리 프로세스에 따라 복수의 그룹에 속하는 정보들을 처리(S1660)할 수 있다.In addition, the server device may process information belonging to a plurality of groups according to a processing process set differently for each group ( S1660 ).
이 경우, 복수의 그룹 중 적어도 하나의 그룹에 속하는 정보에 기초하여, 외부 서버로부터 관련 정보를 수신하고, 외부 서버로부터 수신된 관련 정보와, 문서로부터 인식되는 정보들 중 대응되는 정보들을 비교하여 일치 여부를 판단할 수 있다.In this case, based on the information belonging to at least one of the plurality of groups, the related information is received from the external server, and the related information received from the external server is compared with the corresponding information among the information recognized from the document and matched. can determine whether
그리고, 서버 장치는 처리 결과에 기초하여 문서에 대한 분석 데이터를 제공(S1670)할 수 있다.Then, the server device may provide analysis data for the document based on the processing result (S1670).
한편, 상술한 본 개시의 다양한 실시예들에 따른 방법들은, 사용자 단말 장치와 같은 전자 장치에 설치 가능한 소프트웨어 또는 어플리케이션 형태로 구현될 수 있다.Meanwhile, the above-described methods according to various embodiments of the present disclosure may be implemented in the form of software or applications that can be installed in an electronic device such as a user terminal device.
또한, 상술한 본 개시의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드만으로도 구현될 수 있다. In addition, the above-described methods according to various embodiments of the present disclosure may be implemented only by software upgrade or hardware upgrade of an existing electronic device.
또한, 상술한 본 개시의 다양한 실시 예들은 전자 장치에 구비된 임베디드 서버, 또는 전자 장치 외부의 서버를 통해 수행되는 것도 가능하다.In addition, various embodiments of the present disclosure described above may be performed through an embedded server provided in the electronic device or a server external to the electronic device.
한편, 본 개시에 따른 문서 분석 방법을 순차적으로 수행하는 프로그램이 저장된 비일시적 판독 가능 매체(non-transitory computer readable medium)가 제공될 수 있다. Meanwhile, a non-transitory computer readable medium in which a program for sequentially performing the document analysis method according to the present disclosure is stored may be provided.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.The non-transitory readable medium refers to a medium that stores data semi-permanently, rather than a medium that stores data for a short moment, such as a register, cache, memory, and the like, and can be read by a device. Specifically, the various applications or programs described above may be provided by being stored in a non-transitory readable medium such as a CD, DVD, hard disk, Blu-ray disk, USB, memory card, ROM, and the like.
이상에서는 본 개시의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시가 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.In the above, preferred embodiments of the present disclosure have been illustrated and described, but the present disclosure is not limited to the specific embodiments described above, and it is common in the technical field to which the disclosure belongs without departing from the gist of the present disclosure as claimed in the claims. Various modifications may be made by those having the knowledge of
Claims (15)
- 문서를 입력 받는 단계;receiving a document input;상기 문서에 포함된 텍스트를 추출하는 단계;extracting text included in the document;상기 추출된 텍스트들 중에서 복수의 식별 항목에 해당하는 텍스트를 식별하는 단계;identifying texts corresponding to a plurality of identification items from among the extracted texts;상기 식별된 텍스트에 인접한 영역에 기재된 텍스트를 상기 식별 항목에 대응되는 정보로 인식하는 단계;recognizing a text written in an area adjacent to the identified text as information corresponding to the identification item;상기 식별 항목에 대응되는 정보를 기 설정된 복수의 그룹으로 분류하는 단계;classifying the information corresponding to the identification item into a plurality of preset groups;그룹 별로 상이하게 설정된 처리 프로세스에 따라 상기 복수의 그룹에 속하는 정보들을 처리하는 단계; 및processing information belonging to the plurality of groups according to a processing process set differently for each group; and상기 처리 결과에 기초하여 상기 문서에 대한 분석 데이터를 제공하는 단계;를 포함하는, 문서 분석 방법. A document analysis method comprising a; providing analysis data for the document based on the processing result.
- 제1항에 있어서,According to claim 1,상기 복수의 그룹에 속하는 정보들을 처리하는 단계는,The processing of information belonging to the plurality of groups includes:상기 복수의 그룹 중 적어도 하나의 그룹에 속하는 정보에 기초하여, 외부 서버로부터 관련 정보를 수신하는 단계; 및receiving related information from an external server based on information belonging to at least one of the plurality of groups; and상기 외부 서버로부터 수신된 관련 정보와, 상기 문서로부터 인식되는 정보들에 기초하여 상기 문서에 대한 분석 데이터를 생성하는 단계;를 포함하는, 문서 분석 방법.Generating analysis data for the document based on the related information received from the external server and information recognized from the document;
- 제2항에 있어서,3. The method of claim 2,상기 분석 데이터를 생성하는 단계는,The step of generating the analysis data comprises:상기 외부 서버로부터 수신된 관련 정보와 상기 문서로부터 인식되는 정보 중 대응되는 정보들을 비교하여 일치 여부를 판단하는 단계;를 포함하는, 문서 분석 방법.Comparing the related information received from the external server and corresponding information among the information recognized from the document to determine whether or not they match; including, a document analysis method.
- 제2항에 있어서,3. The method of claim 2,상기 문서는 부동산 계약 문서이며,The document is a real estate contract document,상기 분석 데이터를 생성하는 단계는,The step of generating the analysis data comprises:기 설정된 알고리즘을 통해 매물 안전성을 판단하는 매물 안전성 판단 프로세스에 따라 상기 외부 서버로부터 수신된 관련 정보 및 상기 문서로부터 인식되는 정보들을 처리하여 상기 분석 데이터를 생성하는, 문서 분석 방법.A document analysis method for generating the analysis data by processing the related information received from the external server and information recognized from the document according to a property safety determination process of determining property safety through a preset algorithm.
- 제2항에 있어서,3. The method of claim 2,상기 문서는 부동산 계약 문서이며,The document is a real estate contract document,상기 분석 데이터를 생성하는 단계는,The step of generating the analysis data comprises:사용자로부터 입력 받은 사용자 선호 정보에 기초하여 매물 적합성을 판단하는 매물 적합성 판단 프로세스에 따라 상기 외부 서버로부터 수신된 관련 정보 및 상기 문서로부터 인식되는 정보들을 처리하여 상기 분석 데이터를 생성하는, 문서 분석 방법.A document analysis method for generating the analysis data by processing related information received from the external server and information recognized from the document according to a property suitability determination process of determining property suitability based on user preference information input from a user.
- 제1항에 있어서,According to claim 1,상기 문서는 부동산 계약 문서이며,The document is a real estate contract document,상기 처리 프로세스는,The processing process is맞춤법 교정, 띄어쓰기 교정, 숫자 변환, 용어 변환, 관련 컨텐츠 추가, 매물 안전성 판단 프로세스를 포함하며, 상기 복수의 그룹 중 제1 그룹에 대해 적용되도록 설정된 제1 처리 프로세스,A first processing process set to be applied to the first group among the plurality of groups, including spelling correction, spacing correction, number conversion, term conversion, related content addition, and property safety determination process;띄어쓰기 교정, 숫자 변환, 용어 변환, 공인 정보 일치 여부 판단 프로세스, 매물 안전성 판단 프로세스, 사용자 선호 정보에 기초한 매물 적합성 판단 프로세스를 포함하며, 상기 복수의 그룹 중 제2 그룹에 대해 적용되도록 설정된 제2 처리 프로세스,A second process set to be applied to the second group among the plurality of groups, including space correction, number conversion, term conversion, accredited information match determination process, property safety determination process, and property suitability determination process based on user preference information process,띄어쓰기 교정, 용어 변환, 공인 정보 일치 여부 판단 프로세스, 매물 안전성 판단 프로세스를 포함하며 상기 복수의 그룹 중 제3 그룹에 대해 적용되도록 설정된 제3 처리 프로세스를 포함하며,It includes a third processing process set to be applied to a third group among the plurality of groups, including spacing correction, term conversion, a process for determining whether official information matches or not, and a process for determining safety for sale,상기 복수의 그룹은 각 처리 프로세스가 필요한 정보들을 기준으로 분류되는, 문서 분석 방법.The plurality of groups are classified based on information required for each processing process, a document analysis method.
- 제6항에 있어서,7. The method of claim 6,상기 제1 그룹은 부동산 계약 내용에 대한 정보를 포함하고,The first group includes information about the contents of the real estate contract,상기 제2 그룹은 부동산 특징을 나타내는 정보를 포함하며,The second group includes information indicative of real estate characteristics;상기 제3 그룹은 부동산을 특정하기 위한 정보를 포함하는, 문서 분석 방법.The third group includes information for specifying real estate, a document analysis method.
- 제1항에 있어서,According to claim 1,상기 문서는 부동산 계약 문서이며,The document is a real estate contract document,상기 문서에 대한 분석 데이터는, 상기 부동산 계약 문서에서 특정되는 부동산 및 소유자와 관련된 정보의 정확성, 상기 부동산에 관련된 권리 사항 설정 정보, 부동산 계약의 안전성 중 적어도 하나에 대한 정보를 포함하는, 문서 분석 방법.The analysis data for the document includes information on at least one of the accuracy of information related to the real estate and the owner specified in the real estate contract document, information on setting rights related to the real estate, and the safety of the real estate contract, a document analysis method .
- 제8항에 있어서,9. The method of claim 8,상기 부동산 계약의 안전성에 대한 정보는 텍스트, 숫자, 이미지 또는 동영상 중 적어도 하나의 형태로 제공되는, 문서 분석 방법.The information on the safety of the real estate contract is provided in the form of at least one of text, number, image, or video, a document analysis method.
- 제2항에 있어서,3. The method of claim 2,상기 문서는 부동산 계약 문서이며,The document is a real estate contract document,상기 외부 서버로부터 관련 정보를 수신하는 단계는,Receiving the relevant information from the external server comprises:상기 문서에 의해 특정되는 부동산의 등기부 등본, 토지 대장, 건축물 대장, 지적도, 토지이용계획확인서, 부동산 가격 정보, 부동산 용어 정보 중 적어도 하나의 정보를 적어도 하나의 외부 서버로부터 수신하고,Receiving at least one information of a registered copy of real estate specified by the document, land ledger, building ledger, cadastral map, land use plan confirmation, real estate price information, and real estate term information from at least one external server,상기 분석 데이터를 생성하는 단계는,The step of generating the analysis data comprises:상기 외부 서버로부터 수신한 정보에 대해 통계 처리하여 획득한 데이터를 바탕으로 분석 데이터를 생성하는, 문서 분석 방법.A document analysis method for generating analysis data based on data obtained by performing statistical processing on the information received from the external server.
- 제1항에 있어서,According to claim 1,상기 복수의 식별 항목은, 주소, 층호수, 임대인, 소유주, 토지 면적, 구조, 용도, 건물 면적, 보증금, 매매 대금, 특약 중 적어도 하나를 포함하는, 문서 분석 방법. The plurality of identification items include at least one of an address, a floor number, a lessor, an owner, a land area, a structure, a use, a building area, a deposit, a purchase price, and a special contract, a document analysis method.
- 제2항에 있어서,3. The method of claim 2,상기 외부 서버로부터 관련 정보를 수신하는 단계는,Receiving the relevant information from the external server comprises:서로 다른 복수의 시점 각각에 대응되는 관련 정보를 수신하고,Receiving related information corresponding to each of a plurality of different viewpoints,상기 분석 데이터를 제공하는 단계는,The step of providing the analysis data,상기 수신한 관련 정보를 기초로 하여, 상기 복수의 시점 각각에 대응되는 복수의 분석 데이터를 생성하여 제공하는, 문서 분석 방법.Based on the received related information, a document analysis method for generating and providing a plurality of analysis data corresponding to each of the plurality of time points.
- 제12항에 있어서,13. The method of claim 12,상기 문서는 부동산 계약 문서이며,The document is a real estate contract document,상기 복수의 시점은 부동산 계약일 이전, 부동산 계약일 당일 및 부동산 계약일 이후 중 적어도 두가지를 포함하는, 문서 분석 방법.The plurality of time points include at least two of before the real estate contract date, the real estate contract date, and after the real estate contract date, a document analysis method.
- 제1항에 있어서,According to claim 1,상기 텍스트를 추출하는 단계는,The step of extracting the text is상기 문서에 표 레이아웃이 포함된 경우, 상기 표 레이아웃에서 수직선 및 수평선을 각각 추출하는 단계;when the document includes a table layout, extracting a vertical line and a horizontal line from the table layout, respectively;상기 수직선 및 수평선 사이의 교차점을 획득하는 단계; 및obtaining an intersection point between the vertical line and the horizontal line; and상기 교차점에 기초하여 상기 표 레이아웃에 포함된 셀을 식별하는 단계;를 포함하고,Including; identifying a cell included in the table layout based on the intersection point,상기 식별된 셀 내부에 위치한 오브젝트를 텍스트로 추출하는, 문서 분석 방법.A document analysis method for extracting an object located inside the identified cell as text.
- 제14항에 있어서,15. The method of claim 14,상기 텍스트를 추출하는 단계는,The step of extracting the text is상기 식별된 셀 내부에 위치한 오브젝트에 OCR 모델을 적용하여 텍스트를 추출하는, 문서 분석 방법.A document analysis method for extracting text by applying an OCR model to an object located inside the identified cell.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2020-0149323 | 2020-11-10 | ||
KR1020200149323A KR20220063459A (en) | 2020-11-10 | 2020-11-10 | Method of analyzing a document |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022102965A1 true WO2022102965A1 (en) | 2022-05-19 |
Family
ID=81601407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2021/013488 WO2022102965A1 (en) | 2020-11-10 | 2021-10-01 | Method for analyzing document |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20220063459A (en) |
WO (1) | WO2022102965A1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102672368B1 (en) * | 2022-06-30 | 2024-06-10 | 주식회사 리걸케어 | Document management server and method thereof |
KR102642391B1 (en) * | 2023-08-01 | 2024-02-29 | 주식회사 데브올컴퍼니 | System for providing real estate development project management service |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100503909B1 (en) * | 2003-05-19 | 2005-07-26 | 주식회사 로마켓아시아 | Method for Analyzing a Real Estate Right on the Basis of Its Type through Internet |
KR100979504B1 (en) * | 2008-02-05 | 2010-09-02 | 임형택 | Apparatus and method for service conclusion real estate intermediation contract using real estate intermediation information service |
JP2014238629A (en) * | 2013-06-06 | 2014-12-18 | 株式会社野村総合研究所 | Contract analyzing system, program and method |
KR101537503B1 (en) * | 2014-11-17 | 2015-07-17 | 송주형 | Notarizing agent system of verifying notarizing document for smart phone with APP and operating method thereof |
KR20200014546A (en) * | 2018-08-01 | 2020-02-11 | 주식회사 우리은행 | System and Method for Non-Face Banking Process of Consignment on lease deposit return |
-
2020
- 2020-11-10 KR KR1020200149323A patent/KR20220063459A/en unknown
-
2021
- 2021-10-01 WO PCT/KR2021/013488 patent/WO2022102965A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100503909B1 (en) * | 2003-05-19 | 2005-07-26 | 주식회사 로마켓아시아 | Method for Analyzing a Real Estate Right on the Basis of Its Type through Internet |
KR100979504B1 (en) * | 2008-02-05 | 2010-09-02 | 임형택 | Apparatus and method for service conclusion real estate intermediation contract using real estate intermediation information service |
JP2014238629A (en) * | 2013-06-06 | 2014-12-18 | 株式会社野村総合研究所 | Contract analyzing system, program and method |
KR101537503B1 (en) * | 2014-11-17 | 2015-07-17 | 송주형 | Notarizing agent system of verifying notarizing document for smart phone with APP and operating method thereof |
KR20200014546A (en) * | 2018-08-01 | 2020-02-11 | 주식회사 우리은행 | System and Method for Non-Face Banking Process of Consignment on lease deposit return |
Also Published As
Publication number | Publication date |
---|---|
KR20220063459A (en) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022102965A1 (en) | Method for analyzing document | |
WO2021040124A1 (en) | Artificial intelligence-based legal document analysis system and method | |
WO2016013914A1 (en) | Method, apparatus, system and computer program for providing and displaying product information | |
WO2020096098A1 (en) | Method for managing annotation work, and apparatus and system supporting same | |
WO2017111195A1 (en) | Reliability evaluation-based vehicle direct-trade interface providing method, and server operating same | |
WO2020078058A1 (en) | Medical data abnormality identification method and device, terminal, and storage medium | |
WO2020114221A1 (en) | Biometric recognition-based designated medical institution supervision method and related device | |
WO2020204535A1 (en) | Machine learning-based user-customized automatic patent document classification method, device, and system | |
EP3230902A2 (en) | Terminal device and data processing method thereof | |
WO2020087704A1 (en) | Credit information management method, apparatus, and device, and storage medium | |
EP2891041A1 (en) | User interface apparatus in a user terminal and method for supporting the same | |
WO2020233078A1 (en) | User information form construction method, apparatus and device, and storage medium | |
WO2022050551A1 (en) | Legal service provision system and method therefor | |
WO2019135553A1 (en) | Electronic device, control method thereof, and computer readable recording medium | |
WO2017160133A2 (en) | Method for configuring ranking of posts and service server therefor | |
WO2015147599A1 (en) | Data sharing method and electronic device thereof | |
WO2022244997A1 (en) | Method and apparatus for processing data | |
WO2021025465A1 (en) | Method for recognizing voice and electronic device supporting the same | |
WO2020050465A1 (en) | Method, device, and computer-readable recording media for logo matching through analysis of company | |
WO2020171613A1 (en) | Method for displaying visual object regarding contents and electronic device thereof | |
WO2024005242A1 (en) | Method for processing art work transaction-related data | |
WO2022092487A1 (en) | Electronic apparatus and controlling method thereof | |
WO2020034528A1 (en) | Information entry guiding method, apparatus and device, and computer-readable storage medium | |
WO2020197071A1 (en) | Electronic device and control method thereof | |
WO2023282371A1 (en) | Server and method for providing multilingual subtitle service using artificial intelligence learning model, and method for controlling server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21892135 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21892135 Country of ref document: EP Kind code of ref document: A1 |