WO2021049485A1 - 法律分析装置、及び法律分析方法 - Google Patents

法律分析装置、及び法律分析方法 Download PDF

Info

Publication number
WO2021049485A1
WO2021049485A1 PCT/JP2020/033945 JP2020033945W WO2021049485A1 WO 2021049485 A1 WO2021049485 A1 WO 2021049485A1 JP 2020033945 W JP2020033945 W JP 2020033945W WO 2021049485 A1 WO2021049485 A1 WO 2021049485A1
Authority
WO
WIPO (PCT)
Prior art keywords
law
legal
word
analysis
unit
Prior art date
Application number
PCT/JP2020/033945
Other languages
English (en)
French (fr)
Inventor
井奥 章
恭介 村井
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to JP2021545546A priority Critical patent/JP7312841B2/ja
Publication of WO2021049485A1 publication Critical patent/WO2021049485A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Definitions

  • the present invention relates to a technique for analyzing legal documents.
  • Patent Document 1 is a technology capable of presenting necessary legal information according to the contents of a contract so that even a general user other than a legal expert can recognize the dangers and problems of the contract by himself / herself. Is provided.
  • Patent Document 1 for a plurality of legal articles included in a plurality of laws and regulations, a process of generating a document vector for each article and a plurality of articles having similarities of a predetermined threshold or more by comparing the document vectors of each article are compared.
  • the process of generating the article group that combines the above, the process of generating the document vector for each article group for each article group, the process of generating the document vector for each article for the input contract data, and this article.
  • the "document vector” is a technique for expressing the characteristics of a document as a vector based on the combination of keywords included in each document and the frequency of appearance.
  • Patent Document 1 is one of the techniques for efficiently finding a desired document from a large-scale document information, and by finding a document containing an input keyword. , The user can efficiently obtain the desired document.
  • Patent Document 1 what is compared and contrasted with each legal text is the clause of the contract, both of which are intended for documents in the law or a format close to the law, but in the case of an analysis request such as a question from the user, the law Analysis requests are often expressed by keywords (words, etc.) that are not the same as documents (articles, etc.). Even if the words that make up the legal text and the words shown in the analysis request are different, pay attention to the relevance (similarity, etc.) of the meanings of the words, and present the related texts accurately and efficiently. Is not mentioned in Patent Document 1.
  • the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a technique capable of easily and appropriately analyzing a law in response to an analysis request such as an interrogative sentence from a user.
  • a storage unit that stores legal correspondence information indicating the correspondence between related laws and word appearance information that manages the appearance of words contained in a plurality of laws, and a plurality of storage units. It has a legal analysis department that analyzes the laws of the law and a presentation department that presents the analysis results of the legal analysis department.
  • the Legal Analysis Department extracts the designated words from the input reception department that accepts the analysis request including the question text for the law and the essential law to be analyzed, and the analysis request received by the input reception department, and extracts the first law including the designated word.
  • a search unit that searches based on word appearance information, a law identification unit that extracts related laws related to the first law based on legal correspondence information, and outputs the first law and the related law.
  • the analysis department that extracts related words by referring to the vocabulary dictionary based on the required laws and designated words and adds the related words for each law of word appearance information, and the first law output from the law identification department. It has an integrated department that identifies the law to be analyzed based on the vocabulary appearance information including related words added by the analysis department from the law.
  • the "processor unit” is one or more processors.
  • the at least one processor is typically a microprocessor such as a CPU (Central Processing Unit), but may be another type of processor such as a GPU (Graphics Processing Unit).
  • At least one processor may be single-core or multi-core.
  • At least one processor may be a processor in a broad sense such as a hardware circuit (for example, FPGA (Field-Programmable Gate Array) or ASIC (Application Specific Integrated Circuit)) that performs a part or all of the processing.
  • a hardware circuit for example, FPGA (Field-Programmable Gate Array) or ASIC (Application Specific Integrated Circuit)
  • the process may be described with "program” as the subject, but the program is executed by the processor unit to appropriately perform the specified process in the storage unit and / or the interface unit, etc.
  • the subject of the process may be a processor unit (or a device such as a controller having the processor unit).
  • the program may be installed on a device such as a computer, or may be on, for example, a program distribution server or a computer-readable (eg, non-temporary) recording medium. Further, in the following description, two or more programs may be realized as one program, or one program may be realized as two or more programs.
  • the "computer system” is a system including one or more physical computers.
  • the physical computer may be a general-purpose computer or a dedicated computer.
  • the physical computer may function as a computer that issues I / O (Input / Output) requests (called, for example, a host computer or server system), or I / O of data in response to an I / O request. It may function as a computer (for example, a storage device) that performs the above.
  • I / O Input / Output
  • the information may be explained by the expression of "AAA table”, but the information may be expressed by any data structure. That is, the "AAA table” can be referred to as "AAA information” to show that the information does not depend on the data structure.
  • FIG. 1 is an overall configuration diagram of the legal analyzer according to the first embodiment.
  • the legal analysis device 10 is composed of, for example, a general computer, and includes a CPU 100 which is a control unit, a main storage device 101, a storage device 102 as an example of a storage unit, a reading device 104, and an input / output device 105. , A communication device 106 and a bus 107 that connects them in a communicable manner.
  • the CPU 100 executes various processes by executing a program stored in the main storage device 101 or the storage device 102.
  • the main storage device 101 is, for example, a RAM (Random Access Memory), and stores a program executed by the CPU 100 and various information used by the CPU 100.
  • the storage device 102 is composed of, for example, an HDD (Hard Disk Drive) or an SSD (Solid State Drive), and stores various information and various programs.
  • HDD Hard Disk Drive
  • SSD Solid State Drive
  • the reading device 104 reads information from a portable storage medium 103 having portability such as a CD-ROM or a DVD-ROM.
  • the legal analysis program stored in the portable storage medium 103 is read by the reading device 104 and stored in the storage device 102.
  • the input / output device 105 is a display (presentation unit) that presents information, a keyboard or mouse that receives input from the user, and the like.
  • the input / output device 105 may be a device in which the input / output device is integrally configured, such as a display having a user interface function, or a device in which the input device and the output device are independently configured. There may be.
  • the communication device 106 is a NIC (Network Interface Card) or the like, and connects the legal analysis device 10 to the communication network.
  • the legal analysis program is executed by the legal analysis device 10 as an example.
  • the legal analysis program is connected to the legal analysis device 10 via a network. It may be executed by.
  • FIG. 2 is a functional configuration diagram of a part of the legal analyzer according to the first embodiment. The outline of each function will be described with reference to FIG.
  • the storage device 102 of the legal analysis device 10 includes a legal information storage unit 121 and an analysis-related information storage unit 122.
  • the legal information storage unit 121 stores a plurality of legal information to be analyzed.
  • Legal information includes national laws, cabinet orders, ministerial ordinances, local government ordinances, etc. Further, the legal information storage unit 121 includes legal correspondence information 250 (see FIG. 5), phrase appearance information 260 (see FIG. 6), word extraction template 270 (FIG. 7), vocabulary dictionary 280 (FIG. 8), etc., which will be described later. Also stores.
  • the analysis-related information storage unit 122 stores various information necessary for analysis of legal information, for example, information of an external tool (tool for performing preprocessing) that can be used for analysis.
  • the main storage device 101 has a computer program such as a legal analysis program that constitutes the legal analysis unit 130, and various processing function units are configured by executing this program by the CPU 100.
  • the processing function unit configured by the CPU 100 executing the legal analysis program of the main storage device 101 is an input reception unit that receives analysis requests such as questions, question sentences, and the law to be analyzed (essential law) from the user. 131, a search unit 132 that analyzes questions from users, words that make up the law, their parts, etc., and the legal correspondence information 250 shown in FIG. 5, which is related to the essential law to be analyzed.
  • Natural language that extracts related words (attention words) using the words (designated words) included in the question sentence acquired by the law identification unit 133 and the search unit 132 that extract the laws (related laws) of The relationship analysis unit (hereinafter referred to as the analysis unit) 134, the collation / integration unit 135 that narrows down the laws to be analyzed from the outputs of the law identification unit 133 and the analysis unit 134, and the law extracted by the collation / integration unit 135 are presented.
  • the processing of these functional units can be said to be processing executed by the CPU 100.
  • the input reception unit 131 receives an analysis request for analyzing related laws, for example, a question text from a user, via the input / output device 105.
  • the analysis request may be words, phrases, sentences, or sentences used to analyze the related law, but it is assumed that it is an ordinary interrogative sentence that is not a so-called legal document.
  • a word based on the analysis request for example, a word of the analysis request, a word included in the sentence of the analysis request, and the like are referred to as “designated words”.
  • the related law is searched, analyzed, and the like using this demonstrative word as a key.
  • the demonstrative word may be one word or a plurality of words, that is, words and phrases.
  • FIG. 3 is a diagram showing an example of the analysis request of the user and the text to be analyzed.
  • a question sentence 301 "Please tell me about the procedure when a corporation with a head office other than Tokyo establishes a branch office for the first time in Tokyo" is input to the input reception unit 131 and input / output.
  • the state displayed on the display device via the device 105 is shown.
  • the question text contains the designated word "branch” 302, but Article 26 of the Tokyo Metropolitan Tax Ordinance (hereinafter referred to as "the Tokyo Metropolitan Ordinance") 303, which should be searched for the user's question, states "branch office". Because the word "" is not included, it will not be included in the search results.
  • FIG. 4 is a diagram showing an example of a text searched from a user's analysis request.
  • FIG. 4 assumes that the same question text as in FIG. 3 has been input.
  • the Corporate Tax Law 402 shown in FIG. 4 includes the designated word “branch” 302 included in the user's question 301, as well as “business establishment” 403, and “branch office” and “business establishment” are “others”. It indicates that they are connected by the word 402.
  • the purpose of this embodiment is to provide a technique for searching for a metropolitan ordinance to be searched even in such a case.
  • the search unit 132 receives data such as legal information consisting of the text of each law from the legal information storage unit 121 and an analysis tool for preprocessing from the analysis-related information storage unit 122, and morphologically analyzes the text of the law. Then, the phrase appearance table 260 (see FIG. 6) is generated by analyzing the presence or absence of the appearance of each word. It also generates legal correspondence information 250 (see FIG. 5). The generated phrase appearance table 260 and legal correspondence information 250 are stored in the storage device 102.
  • the legal correspondence information 250 may be created based on the knowledge of the analyst, or may be generated by using the information contained in the legal information (articles, etc.). If you use the information in Article 3 of the above-mentioned company accounting rules, the legal correspondence information 250 includes "Company Law” and corporate accounting standards (although it is a document other than the law) (for example, "Corporate Accounting Principles”. ”) May be recorded as a pair having a relationship with.
  • the search unit 132 preprocesses the analysis request of the user input from the input reception unit 131 by morphological analysis, and extracts the designated word "branch” from the analysis request. Further, the search unit 132 receives the generated word / phrase appearance table 260 from the storage device 102, and outputs a law name in which the designated word “branch” appears. For example, the legal name "Corporate Tax Law" including the designated word "branch” included in the question text is output.
  • the law identification unit 133 acquires the law correspondence information 250 from the storage device 102, and inputs the law name from the search unit 132, for example, the law name "corporate tax law” including the designated word “branch” included in the interrogative text. Will be done. With reference to the legal correspondence information 250 from the input "Corporate Tax Law", the “Tokyo Metropolitan Ordinance” is extracted as a related law, and the “Corporate Tax Law” and the “Tokyo Metropolitan Ordinance” are output.
  • the analysis unit 134 acquires the word appearance table 260 from the storage device 102, and based on the word appearance table 260, the analysis unit 134 obtains the demonstrative words included in the analysis request received by the input reception unit 131 and the related words highly related to the demonstrative words (the demonstrative words). Demonstrative words) are extracted.
  • the collation / integration unit 135 collates / integrates the results obtained by the law specification unit 133 and the analysis unit 134, identifies the law related to the analysis request, and uses the specified law as the analysis result.
  • the analysis result presentation unit 136 visualizes the analysis result by the collation / integration unit 135 in an easy-to-understand manner for the user and displays it on the input / output device 105.
  • FIG. 5 is a diagram showing an example of legal correspondence information 250 stored in the legal information storage unit 121 of the storage device 102.
  • the legal correspondence information 250 is a table format of legal correspondence information that manages the corresponding laws by associating them with each other.
  • Each entry of the legal correspondence information 250 includes a law name (notable name) 251 as a lower law name column and a law name (related law name) 252 as a higher law name column.
  • the name of the law which may be a text or the like as a part of the law
  • the name is stored in the lower law name column 251 corresponding to the entry.
  • the name is stored.
  • it may be ID information indicating a description place in the law such as an article number.
  • the law in the lower law name column 251 was created based on the law in the upper law name column 252. More specifically, according to the entry in the second line of FIG. 5, the law f2, which is a subordinate law, is a law for realizing the law (article of law) S1 which is a superordinate law. Shown. It should be noted that the specific example of the correspondence relationship with the lower law name column f and the upper law name S in FIG. 5 is merely an example. In general, the law of the upper law name column 252 (the text of the law) is more effective than the law of the lower law name column 251.
  • the legal correspondence information 250 may be stored in the legal information storage unit 121 by inputting the information created in advance by the user into the legal analyzer 10 from the outside. In the legal analyzer 10, it may be created according to a predetermined algorithm.
  • the legal correspondence information 250 in FIG. 5 shows, as an example, a correspondence relationship by providing columns corresponding to each of the lower-related law and the higher-level related law, but the correspondence is not limited to this, and a plurality of cases are shown. If there is a superordinate relationship, a column corresponding to the law of each superordinate relationship may be provided so that the law of the subordinate relationship and the law of each relationship of a plurality of superordinate relationships can be associated with each other. ..
  • the lower-related law and the higher-level related law are associated with each other, but the laws of the same layer may be associated with each other.
  • the unit of the legal document to be associated may be the whole of each law, each government ordinance, etc., or a part (article) thereof.
  • the legal correspondence information 250 corresponds to an information source in which a rule including a plurality of related laws and a relation type indicating the priority of the plurality of laws is described.
  • information indicating which of the lower law name column 251 and the upper law name column 252 is prioritized is stored.
  • S1 "Civil Code” is stored as the upper law name column 252 with respect to f2 "Company Law” in the lower law column 251, indicating that the company law has priority.
  • Information on general law and special law may be added to this relation type 253 to indicate the application priority of the law.
  • information related to government ordinances and ministerial ordinances other than the "law" enacted through the legislation may be added.
  • the Inheritance Tax Law borrows the provisions of the Civil Code, and the provisions that do not exist in the Civil Code are stipulated in the Inheritance Tax Law.
  • the "Inheritance Tax Law” is interrelated with the Cabinet Order "Inheritance Tax Law Enforcement Ordinance” and the Ministerial Ordinance "Inheritance Tax Law Enforcement Regulations”. Important and basic matters are stipulated in the law, and specific stipulations such as calculation rules, procedural matters and forms are stipulated in government ordinances and ministerial ordinances.
  • the "Inheritance Tax Law-related Circular" which shows the judgment set by the Commissioner of the National Tax Agency, is a document that explains the provisions of the Inheritance Tax Law, and although it is not legally enforceable, it affects the interpretation of the Inheritance Tax Law. It is eligible as information to be recorded in the legal correspondence information 250 in association with the tax law.
  • FIG. 6 is a diagram showing a word / phrase appearance table according to the first embodiment.
  • the word appearance table 260 is a table that manages the presence or absence of the appearance of words in each law.
  • the branch office 262, the office 263, the payment 264, and the amount 265 of the bank indicate the words included in the law.
  • Each word can be extracted by the search unit 132 by morphological analysis processing.
  • S1-Sn and f1-fn indicate a law or a law and a text.
  • the word appearance table 260 shows whether the words shown in the line appear in each law. Specifically, if the corresponding word exists in the corresponding law, "1" meaning that it exists is set, and if it does not exist, it means that it does not exist. "0” is set. For example, the words “branch office” and "business establishment” are included in Law S2 (Corporate Tax Law Article 132). On the other hand, f3 (Article 26 of the Tokyo Metropolitan Ordinance) does not include the word “branch” but includes the word "business establishment”.
  • the row name is the name of each law, for example, the document name, the law file name, the article name, etc.
  • the column name is each of a plurality of words
  • the cell at the intersection of the row name and the column name is The presence or absence of the corresponding word in the corresponding law is set.
  • the word / phrase appearance table 260 shown in FIG. 6 the appearance of words in the law is managed. For example, the appearance of a plurality of words (words, sentences, etc.) is managed as a unit. You may.
  • FIG. 7 is a diagram showing an example of a word extraction template.
  • the word extraction template 270 shows the rules for creating the vocabulary dictionary shown in FIG.
  • the word extraction template 270 defines the relationship 273 between the extracted words 272 and the extracted words according to the legal context pattern 271. For example, if the law states "A, B or other C" and A, B, C have the same part of speech, the extracted words are "A", "B", and "C".
  • the legal context pattern 271 is constructed based on one or more of a literary or legal interpretation of the law in the description of the law.
  • FIG. 8 is a diagram showing an example of a vocabulary dictionary.
  • FIG. 8 is a diagram showing the result of applying the word extraction template 270 (No. 1 pattern) shown in FIG. 7 to the “Corporate Tax Law”.
  • the vocabulary dictionary is used by the collation / integration unit 135 to narrow down the analysis target.
  • the headword 281, the related word 282 related to the heading word, the type 283 indicating the relationship between the heading word 281 and the related word 282, and the law name 284 indicating the applied law are managed correspondingly.
  • the headword 281 in the vocabulary dictionary 280 can be a designated word extracted by the search unit 132.
  • FIG. 9 is a flowchart of the analysis process by the legal analyzer 10 according to the first embodiment.
  • the input receiving unit 131 receives the input of the analysis request for analyzing the related law from the user by the input / output device 105 (S101).
  • S101 input / output device 105
  • an example is when the question in Fig. 3 "Please tell me about the procedure for a corporation with a head office other than Tokyo to set up a branch in Tokyo for the first time.” 301 is entered.
  • the analysis request is not limited to this.
  • step S101 if there is a law that you want to be analyzed as a search target, enter it as "essential law". In the example of the question sentence in FIG. 3, "Tokyo Metropolitan Ordinance" is input.
  • the search unit 132 performs preprocessing on the question sentence 301 (S102).
  • the word "branch” which is a demonstrative word, is extracted from the question sentence 301 by using a tool for analyzing the sentence structure.
  • the search unit 132 extracts the law including the word "branch” extracted in step S102 with reference to the phrase appearance table 260 shown in FIG.
  • S2 Corporate Tax Law
  • f2 Company Law
  • f7 are extracted as laws including demonstrative words, as in Law 1001 extracted from the "branch office" in FIG. 10 (step S103).
  • the law identification department 133 refers to the law correspondence information 250 and extracts the law extracted in step S103, S2 (corporate tax law), f2 (company law), and the law related to f7. That is, f3 Tokyo Ordinance is extracted for S2 (Corporate Tax Law), S1 (Civil Code) for f2 (Company Law), and S4 for f7 as related laws (step S104).
  • FIG. 10 shows the relationship between the law extracted from the designated words in step S103 and the law extracted in step S104. It can be seen that in addition to the law 1001 extracted from the demonstrative words in step S103, the number of related laws 1002 to be analyzed in step S104 is increasing. This process is for performing a complete search by including the relevant law in the analysis target with reference to the law association 250 shown in FIG.
  • the analysis unit 134 executes a process of analyzing the natural language relationship (S105).
  • step S105 the analysis unit 134 processes the designated words specified in the preprocessing of step S102 with reference to the word appearance table 260. For example, when the demonstrative word based on the analysis request is "branch", the analysis unit 134 sets a record in which "1" is set in column 262 having "branch” as the column name in the phrase appearance table 260 ( Specify the name of the line).
  • the analysis unit 134 specifies the laws of S2, f2, and f7 as the names of the records. That is, the word "branch” means that it is included in S2, f2, and f7.
  • the analysis unit 134 includes the designated word “branch” because the designated words “branch” and "business establishment” appear in the two laws S2 and f7 among the laws S2, f2, and f7.
  • "business establishment” is extracted and added to the phrase appearance table 260.
  • the demonstrative word is "amount”
  • the same process is performed to refer to column 265 having "amount” in the column name, and the law closely related to "amount” is used as the analysis result.
  • steps S104 and S105 may be performed in parallel. If the legal correspondence information is not used, the process of step S104 may be omitted. Further, step S104 may be performed and the process of step S105 may be omitted.
  • the collation / integration unit 135 executes a process of narrowing down the analysis target from the law obtained in step S104 and the related words obtained in step S105 (related law extraction process (see FIG. 11)) (S106). At this time, the laws to be analyzed can be narrowed down based on the required laws entered in step S101 as necessary.
  • the analysis result presentation unit 136 controls to present the analysis result obtained by the related law extraction process to the display means connected to the input / output device 105 (S107).
  • the above is the outline of the legal analyzer 10, but another example for adding the related word in step S105 will be described.
  • FIG. 11 is a flowchart showing another method in which the analysis unit 134 extracts related words for the demonstrative words in step S105 and adds them to the word appearance table 260.
  • the analysis unit 134 inputs the legal name "Corporate Tax Law” and the demonstrative word "branch” to be analyzed from the search unit 132 (S201). That is, the "branch office” and the law name 284 of the heading word 281 of the vocabulary dictionary (FIG. 8) are input.
  • the related word "business establishment” is extracted by referring to the vocabulary dictionary 280 based on the entered legal name and designated word ( S202). This is because, in addition to the demonstrative words, related words related to the demonstrative words are analyzed to obtain complete analysis results. That is, the law identification unit 133 expands the law to be analyzed, and the analysis unit 134 expands the words to be analyzed, thereby enabling complete legal analysis.
  • the analysis unit 134 updates the cell corresponding to the column of "business establishment” in the "added attention word” row of the word appearance table 260 in FIG. 6 with a non-zero numerical value.
  • related words are managed as attention words.
  • the cell update value of the attention word "business establishment” may be "0.5” or the like when the weighting is different from that of the attention word "branch” (S203). With this weighting, it is possible to grasp the laws that are highly related to the designated words included in the interrogative sentence in terms of points.
  • the collation / integration unit 135 extracts a law including a demonstrative word and a noteworthy word based on the updated word / phrase appearance table (S301).
  • the collation / integration unit 135 refers to the word appearance table 260, assigns a score for each law, and outputs the result of sorting in descending order of the score to the analysis result presentation unit 136. That is, by adding the weighted demonstrative words and the demonstrative words included in the interrogative sentence, which are added to the phrase appearance table 260, by multiplying the appearance of the demonstrative words and the demonstrative words by weighting for each law. You can ask.
  • step S301 based on the "Tokyo tax ordinance" which is an essential law input in step S101, refer to the legal correspondence table 250 of FIG. 5, and refer to the "Tokyo tax ordinance".
  • the law including the designated word “branch” and the attention word “business establishment” may be narrowed down as the law to be analyzed.
  • the law (related law) extended in step S104 includes S1 (civil law), S2 (corporate tax law), S4, f2 (company law), and f3 (city) as shown in FIG. Ordinance), f7 is included.
  • the “corporate law” including the designated word “branch” is excluded from the analysis target because it is not associated with the “city ordinance” in the legal correspondence table 250.
  • the S3 "criminal law” which includes the notable word “business establishment” and corresponds to f3 "city ordinance” in the legal correspondence table 250, is noted as the designated word "branch”. Since it does not include any of the words "business establishment", it is excluded from the analysis.
  • the collation / integration unit 135 outputs a group of laws related to (strongly related to) the designated word "branch" (S302).
  • the law identification unit 133 expands the law to be analyzed
  • the analysis unit 134 expands the words to be analyzed, and the analysis is performed without omission
  • the collation / integration unit 135 analyzes the analysis target.
  • the accuracy of the analysis results is improved by narrowing down.
  • the collation / integration unit 135 calculates points for each law.
  • the score can be calculated by adding the appearance of the demonstrative word and the noteworthy word multiplied by the weight for each law.
  • the text of the Tokyo Metropolitan Tax Ordinance including the "business establishment” related to the designated word "branch” (eg, Tokyo Metropolitan Tax Ordinance) (F7 in the specific example corresponds to this) can be included in the extraction result.
  • the legal analyzer it is possible to reduce the possibility of leaking information (law, etc.) originally necessary for the user by adding not only the designated word but also the related word as the search word. Also, even when the search range is widened, such as searching for multiple related articles from multiple laws, only the laws that are appropriate in light of the analysis request are displayed, so information on laws that are unnecessary for the user is displayed. You can avoid that. As a result, it is possible to perform analysis with high accuracy and efficiency in terms of analysis time and the like.
  • the word immediately before is an example of the word located immediately after, and "for example, add J at the beginning of the word located immediately before, enclose the whole in parentheses, and position immediately after. Move to the back of the word you want to do.
  • the name of the law for which the law has been amended becomes the information corresponding to the essential law, and the designated word is extracted from the amended part of the law by preprocessing the amended part of the law. If you do, it will be good.
  • Example 3 when the law is amended, it is possible to easily extract the articles and the like that need to be amended accordingly.
  • the characteristics of the document describing the analysis request, the text of the law, etc. are quantified based on the vocabulary appearance table of the first embodiment, and the text, etc. whose numerical value is similar to the document describing the analysis request, etc. Output as a search result that is strongly related to the analysis request.
  • articles and the like having similar numerical values to the articles and the like obtained in Example 1 are also output as search results strongly related to the analysis request.
  • Document vectorization which is also used in Patent Document 1, is a well-known typical means for quantifying features such as articles.
  • Document vectorization is a technique for expressing the characteristics of a document as a vector based on the combination of keywords included in each document and the frequency of appearance. In the analysis based on Patent Document 1, it is considered that legal texts and the like having many words common to both tend to be judged to have high similarity.
  • Example 4 the vocabulary appearance table, which is an input for quantifying the characteristics of sentences and documents, is in a state of being updated with related words for each law extracted based on the legal interpretation and the legal interpretation peculiar to the law. Can be said to be characteristic of the present invention.
  • Document vectorization which is also used in Patent Document 1, is a well-known typical means for quantifying features such as articles, but it is limited to document vectorization as long as it does not deviate from the purpose of Example 4. It is not something that is done.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

法律分析装置においては、関連する法律の対応関係を示す法律対応づけ情報と複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、複数の法律を分析する法律分析部と、法律分析部の分析結果を提示する提示部と、を有する。法律分析部は、法律に対する質問文と分析したい必須法律を含む分析要求を受け付ける入力受付部と、入力受付部によって受け付けられた分析要求から指定語を抽出し、指定語を含む第1の法律を語句出現情報に基づいて、検索する検索部と、法律対応づけ情報に基づいて、第1の法律と関連する関連法律を抽出し、第1の法律と前記関連法律を出力する法律特定部と、必須法律と指定語に基づいて語彙辞書を参照して関連語を抽出し、語句出現情報の法律毎に前記関連語を追加する分析部と、法律特定部から出力された第1の法律と関連法律から、分析部により追加された関連語を含む語彙出現情報に基づいて、分析対象となる法律を特定する統合部とを有する。

Description

法律分析装置、及び法律分析方法
 本発明は、法律文書を分析する技術に関する。
 従来から、社会課題やビジネス環境等の変化に応じて、法律は変化している。新しい法律が施行されたり、既存の法律が改正されたりすることで、社会変化にあわせて法制度は整備される。一方で、過去の事案については、改正前の法律で、引き続き解釈しなければならない事案も多い。総じて、参照すべき法律の母数は、増えており、そのなかかから、目的に応じて法律を解釈する必要がある。かかる状況下、法律情報を効率的に収集し、的確に解釈することは容易ではない。
 裁判所や弁護士等の士業の専門家にとどまらず、法的解釈の主体や対象情報が拡大しており、さらなる効率化が求められる業務が増えている。
 行政の現場での自治体職員で例示すると、国や省庁の法令に違反しない範囲で独自の条例や規則などを定め、それに準拠した制度やサービスを一般市町村民に対して提供する職務がある。そのため、法令が改正されると、それに従い条例や規則などを改正し、提供するサービスを見直すことが必要となる。
 しかし、法令は膨大かつ多岐に渡り、頻繁に改正が発生するため、自治体職員が迅速かつ的確にキャッチアップしていくことが困難である。さらに、参照すべき法令が特定できたとしても、条文構造は複雑になりがちで調査の時間と精度の面で問題が生じやすい。係る状況下でも法令を遵守した業務遂行や行政サービスの担保が求められる。
 例えば、法改正等に際して、特別法と一般法といった複数の法律の間の依存関係の状態などを人間が把握して、適切な影響範囲を探し出そうとすると、分析者の労力や分析に要する時間を多く費やしてしまう。法律間をまたがって依存関係の状態を分析者(ユーザ)が自ら把握することは、各種法的知識(条文の文法、条文間の関係、法律間の関係)の双方への深い理解が必要になるため、法律の数、規模と複雑さの拡大に伴い、一層難しくなっている。
 特許文献1は、法律専門家以外の一般のユーザであっても、契約書が孕む危険性や問題点を自ら認識できるように、契約書の内容に応じて必要な法律情報を提示可能な技術を提供している。
特許第5383943号明細書
 特許文献1は、複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する処理と、各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する処理と、各条文グループについて、条文グループ毎の文書ベクトルを生成する処理と、入力された契約書データについて、条項毎の文書ベクトルを生成する処理と、この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する処理と、契約条項毎に関連条文を列記した分析結果画面を生成する処理と、を実行する契約書分析システムを提供するものである。ここで「文書ベクトル」とは、各文書に含まれるキーワードの組合せと出現頻度に基づいて文書の特徴をベクトルとして表現する技術である。
 特許文献1で開示されている技術は、大規模な文書情報の中から、所望の文書を効率的に発見するための技術の一つであり、入力されたキーワードを含む文書を発見することで、ユーザが所望の文書を効率的に入手することができる。
 特許文献1で各法律条文と比較対比されるものは、契約書の条項であり、共に法律あるいは法律に近い様式の文書を対象としているが、ユーザからの質問文等の分析要求においては、法律文書(条文等)とは同一ではないキーワード(単語等)で分析要求が表現されることが少なくない。法律条文等を構成する単語等と分析要求に示される単語等とが異なる場合にも、単語の意味の関連性(類似性等)に注目し、関連条文を精度よく効率的に提示することについては、特許文献1で言及されていない。
 本発明は、上記事情に鑑みなされたものであり、その目的は、ユーザからの質問文等の分析要求に対し、法律を容易且つ適切に分析することのできる技術を提供することにある。
 上記目的を達成するため、法律分析装置においては、関連する法律の対応関係を示す法律対応づけ情報と複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、複数の法律を分析する法律分析部と、法律分析部の分析結果を提示する提示部と、を有する。法律分析部は、法律に対する質問文と分析したい必須法律を含む分析要求を受け付ける入力受付部と、入力受付部によって受け付けられた分析要求から指定語を抽出し、指定語を含む第1の法律を語句出現情報に基づいて、検索する検索部と、法律対応づけ情報に基づいて、第1の法律と関連する関連法律を抽出し、第1の法律と前記関連法律を出力する法律特定部と、必須法律と指定語に基づいて語彙辞書を参照して関連語を抽出し、語句出現情報の法律毎に前記関連語を追加する分析部と、法律特定部から出力された第1の法律と関連法律から、分析部により追加された関連語を含む語彙出現情報に基づいて、分析対象となる法律を特定する統合部とを有する。
 本発明によれば、目的に応じて関連する法律を容易且つ適切に分析することができる。
実施例に係る法律分析装置の全体構成図である。 実施例に係る法律分析装置の一部の機能構成図である。 実施例に係るユーザの分析要求と検索対象の条文の一例を示した図である。 実施例に係るユーザの分析要求から検索される条文の一例を示した図である。 実施例に係る法律対応づけ表の一例を示した図である。 実施例に係る語句出現表の一例を示した図である。 実施例に係る単語抽出テンプレートの一例を示した図である。 実施例に係る語彙辞書の一例を示した図である。 実施例に係る法律分析装置による分析処理のフローチャートである。 実施例に係る法律対応付け情報取得部による法律抽出の一例を示した図である。 実施例に係る法律分析装置による分析処理のフローチャートである。 実施例に係る法律分析装置による関係法律分析処理の詳細を説明するフローチャートである。
 各実施例について、図面を参照して説明する。これに先立ち、本明細書で使用する用語を定義する。
・「関連語」:ある単語に対する同義語、類義語、対義語、さらには上位語、下位語、などを含む。対訳語などを含めてもよい。さらに、同義語や類義語などの特定の種別への分類は難しいが、ある単語に対して関係性が深い単語は、「関係語」として、関連語の一種として位置づける。ここで「単語」は、複数の単語が組み合わさった複合語等の語句をも包含するものとする。これら「関連語」の単語意味関係の抽出が不十分であると、大規模な文書情報の中から、所望の文書を効率的に検出するための技術(文書検索技術等)においては、検出の漏れ(検索漏れ)を発生しやすくなる。
・「法律記述の特殊なルール」:次に示す「法規的解釈」や「文理解釈」を含む。
・「法規的解釈」:法律の中で置いている定義規定等の規定に注目する法解釈。
・「文理解釈」:法律の条文に固有の字義や単語間の並列関係を定義する法律固有の文法構造に注目する法解釈。
 上記「法規的解釈」の一例を示すため、会社法を例にとると、次に示す会社法(会社計算規則)の条文を手がかりに会社法の解釈において企業会計の基準等の語義をしん酌することが、該当する。
・会社計算規則第三条 この省令の用語の解釈及び規定の適用に関しては、一般に公正妥当と認められる企業会計の基準その他の企業会計の慣行をしん酌しなければならない。

  この条文は会社法に出現する単語等の語義を企業会計の規定を踏まえた語義として解釈すべきことを求めている。語義解釈において法律で特殊なルールを定めている場合に相当し、関連語(同義語や類義語など)の抽出や類似条文の抽出においても留意する必要がある。
 なお、以下に説明する実施例は特許請求の範囲に係る発明を限定するものではなく、また実施例の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
 以下の説明において、「プロセッサ部」は、1以上のプロセッサである。少なくとも1つのプロセッサは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサであるが、GPU(Graphics Processing Unit)のような他種のプロセッサでもよい。少なくとも1つのプロセッサは、シングルコアでもよいしマルチコアでもよい。
 また、少なくとも1つのプロセッサは、処理の一部又は全部を行うハードウェア回路(例えばFPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサでもよい。
 また、以下の説明において、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ部によって実行されることで、定められた処理を、適宜に記憶部及び/又はインターフェース部などを用いながら行うため、処理の主語が、プロセッサ部(或いは、そのプロセッサ部を有するコントローラのようなデバイス)とされてもよい。
 プログラムは、計算機のような装置にインストールされてもよいし、例えば、プログラム配布サーバ又は計算機が読み取り可能な(例えば非一時的な)記録媒体にあってもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
 また、以下の説明において、「計算機システム」は、1以上の物理的な計算機を含んだシステムである。物理的な計算機は、汎用計算機でも専用計算機でもよい。物理的な計算機は、I/O(Input/Output)要求を発行する計算機(例えばホスト計算機やサーバシステムと呼ぶ)として機能してもよいし、I/O要求に応答してデータのI/Oを行う計算機(例えばストレージ装置)として機能してもよい。
 以下の説明では、「AAA表」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「AAA表」を「AAA情報」と呼ぶことができる。
 まず、実施例1に係る法律分析装置について説明する。
 図1は、実施例1に係る法律分析装置の全体構成図である。
  法律分析装置10は、例えば、一般的なコンピュータにより構成され、制御部であるCPU100と、主記憶装置101と、記憶部の一例としての記憶装置102と、読取装置104と、入出力装置105と、通信装置106と、これらを通信可能に接続するバス107とを備える。
 CPU100は、主記憶装置101や記憶装置102に格納されたプログラムを実行することにより、各種処理を実行する。主記憶装置101は、例えば、RAM(Random Access Memory)であり、CPU100で実行されるプログラムや、CPU100で使用される各種情報を記憶する。
 記憶装置102は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)で構成され、各種情報や、各種プログラムを記憶する。
 読取装置104は、CD-ROMやDVD-ROM等の可搬性を有する可搬型記憶媒体103から情報を読み出す。実施例1では、可搬型記憶媒体103に記憶された法律分析プログラムが読取装置104により読み出されて、記憶装置102に格納される。入出力装置105は、情報を提示するディスプレイ(提示部)や、ユーザからの入力を受け付けるキーボードやマウス等である。入出力装置105は、ユーザインターフェース機能を有するディスプレイのように、入出力装置が一体的に構成された装置であってもよく、あるいは、入力装置と出力装置とが独立して構成された装置であってもよい。通信装置106は、NIC(Network Interface Card)等であり、法律分析装置10を通信ネットワークに接続する。
 なお、実施例1では、法律分析プログラムを、法律分析装置10が単体で実行するものを例として説明するが、例えば、法律分析プログラムを、法律分析装置10と、ネットワークを介して接続されたサーバとにより実行するようにしてもよい。
 図2は、実施例1に係る法律分析装置の一部の機能構成図である。図2を用いて、各機能の概略を説明する。
 法律分析装置10の記憶装置102は、法律情報格納部121と、分析関連情報格納部122とを備える。
 法律情報格納部121は、分析対象となる複数の法律情報を格納する。法律情報としては、国の法律、政令、省令、地方自治体の条例等を含む。また、法律情報格納部121には、後述する法律対応づけ情報250(図5参照)、語句出現情報260(図6参照)、単語抽出テンプレート270(図7)、語彙辞書280(図8)等も格納する。分析関連情報格納部122は、法律情報の分析に必要な各種情報、例えば、分析に利用可能な外部ツール(前処理を実施するツール)の情報を格納する。
 主記憶装置101は、法律分析部130を構成する法律分析プログラム等のコンピュータプログラムを保有しており、このプログラムをCPU100が実行することにより、各種処理機能部が構成される。
 主記憶装置101の法律分析プログラムをCPU100が実行することにより構成される処理機能部としては、ユーザからの質問、質問文、分析対象となる法律(必須法律)等の分析要求を受け付ける入力受付部131と、ユーザからの質問文や法律を構成する単語やその品詞等の解析を行う検索部132と、図5に示す法律対応づけ情報250を読み出し、分析対象の必須法律と関連性のある他の法律(関連法律)を抽出する法律特定部133と、検索部132によって、取得された質問文に含まれる単語(指定語)をキーワードとして、関連する単語(注目語)を、抽出する自然言語関係性分析部(以下、分析部)134と、法律特定部133と分析部134の出力から分析対象の法律を絞る照合・統合部135と、照合・統合部135により抽出された法律を提示する分析結果提示部136とがある。なお、これら機能部の処理は、CPU100が実行する処理ということができる。
 入力受付部131は、入出力装置105を介して、関連する法律を分析するための分析要求、例えばユーザからの質問文を受け付ける。分析要求としては、関連する法律を分析するために用いる単語、語句、文、文章であってもよいが、所謂法律文書ではない、通常の質問文を想定する。実施例1では、分析要求に基づく語、例えば、分析要求の語や、分析要求の文に含まれる語等を「指定語」と称する。実施例1では、この指定語をキーとして、関連する法律を検索、分析等を行う。なお、指定語としては、1つの語であってもよく、複数の語、すなわち、語句であってもよい。
 図3は、ユーザの分析要求と分析対象の条文の一例を示した図である。
  図3では、分析要求として、「東京都以外に本店のある法人が、都内に初めて支店を設置する場合の手続きについて教えてください。」という質問文301が入力受付部131に入力され、入出力装置105を介して表示装置に表示された状態を示す。
 質問文には、「支店」302という指定語が含まれているが、ユーザの質問に対して検索されるべき東京都都税条例の第26条(以下、都条例)303には、「支店」という単語が含まれていないため、検索結果に含まれないこととなる。
 図4は、ユーザの分析要求から検索される条文の一例を示した図である。
  図4は、図3と同様の質問文が入力されたことを前提とする。図4に示した法人税法402には、ユーザの質問文301に含まれる「支店」302という指定語の他、「事業所」403が含まれ、「支店」と「事業所」が「その他の」402という単語で結び付けられていることを示している。
 ユーザの質問文に含まれる指定語で単純に検索を行うと、検索結果に含まれるべき都条例が検索結果に含まれない。本実施例では、このような場合であっても、検索されるべき都条例を検索するための技術を提供することを目的としている。
 図2の説明に戻り、法律分析装置10の概要を説明する。
  検索部132は、法律情報格納部121から各法律の条文からなる法律情報等のデータと、分析関連情報格納部122から前処理のための分析ツールとを、それぞれ受け取り、法律の条文を形態素解析し、各単語の出現の有無を分析することで語句出現表260(図6参照)を生成する。また、法律対応づけ情報250(図5参照)を生成する。生成した語句出現表260や法律対応づけ情報250は記憶装置102に格納される。
 法律対応づけ情報250は、分析者の知見に基づいて作成してもよいし法律情報(条文等)に含まれる情報を利用して生成してもよい。前掲した会社計算規則第三条の条文の情報を利用するならば、法律対応づけ情報250には「会社法」と、(法律以外の文書になるが)企業会計の基準(たとえば「企業会計原則」)とが関係を有するペアとして記録されてもよい。
 また、検索部132は、入力受付部131から入力されたユーザの分析要求を形態素解析により前処理し、分析要求から指定語「支店」を抽出する。また、検索部132は、生成した語句出現表260を記憶装置102から受け取り、指定語「支店」が出現する法律名を出力する。例えば、質問文に含まれる「支店」という指定語を含む法律名「法人税法」を出力する。
 法律特定部133は、記憶装置102から法律対応づけ情報250を取得すると共に、検索部132から法律名、例えば、質問文に含まれる「支店」という指定語を含む法律名「法人税法」が入力される。入力された「法人税法」から法律対応づけ情報250を参照して、関連法律として「都条例」を抽出し、「法人税法」と「都条例」を出力する。
 分析部134は、記憶装置102から語句出現表260を取得し、語句出現表260に基づいて、入力受付部131で受け付けた分析要求に含まれる指定語や指定語に関連性が高い関連語(注目語)を抽出する。
 照合・統合部135は、法律特定部133及び分析部134で得られた結果を、照合・統合して、分析要求に関連する法律を特定し、特定した法律を分析結果とする。分析結果提示部136は、照合・統合部135による分析結果を、ユーザにわかりやすく可視化して入出力装置105に表示する。
 図5は、記憶装置102の法律情報格納部121に格納される法律対応づけ情報250の一例を示した図である。
 法律対応づけ情報250は、対応関係のある法律同士を対応づけて管理する法律対応づけ情報をテーブル形式としたものである。法律対応づけ情報250の各エントリは、下位法律名欄として法律名(注目名)251と、上位法律名欄として法律名(関係法律名)252とを含む。下位法律名欄251には、エントリに対応する法律(法律の一部としての条文等でもよい)の名称が格納される。上位法律名欄252には、エントリに対応する下位法律名欄251に名称が格納されている下位関係の法律と対応関係がある上位関係の法律(法律の一部としての条文等でもよい)の名称が格納される。なお、法律名に代えて、条文番号等の法律内における記載箇所を示すID情報としてもよい。
 このエントリによると、下位法律名欄251の法律は、上位法律名欄252の法律に基づいて作成されたものであることがわかる。より具体的には、図5の二行目のエントリによると、下位関係の法律である法律f2が、上位関係の法律である法律(法律の条文)S1を実現するための法律であることを示している。なお、図5の下位法律名欄f、上位法律名Sとの対応関係の具体例は、あくまでも一例を示すものである。一般的には、下位法律名欄251の法律よりも、上位法律名欄252の法律(法律の条文)の方が、効力が強い。
 法律対応づけ情報250は、ユーザが予め作成した情報を外部から、法律分析装置10に入力して法律情報格納部121に格納するようにしてよい。法律分析装置10において、所定のアルゴリズムに従って作成するようにしてもよい。
 なお、図5の法律対応づけ情報250は、一例として、下位関係の法律と、上位関係の法律とのそれぞれに対応する欄を設けて対応関係を示しているが、これに限られず、複数の上位関係がある場合には、それぞれの上位関係ごとの法律に対応する欄を設けるようにして、下位関係の法律と、複数の上位関係のそれぞれの関係の法律とを対応づけるようにしてもよい。
 また、図5の法律対応づけ情報250では、下位関係の法律と、上位関係の法律とを対応づけるようにしているが、同一階層の法律同士を対応づけるようにしてもよい。また、対応付ける法律文書の単位としては、各法律や各政令等の全体としてもよく、それらの一部分(条文)としてもよい。このように、法律対応づけ情報250は、対応関係のある複数の法律と、複数の法律の優先順位を示す関係種別とを含むルールが記述されている情報源に相当する。
 法律対応づけ情報250の関係種別253には、下位法律名欄251と上位法律名欄252の内、どちらが優先されるかを表す情報(優先順位)が格納される。例えば、下位法律欄251のf2「会社法」に対して、上位法律名欄252としてS1「民法」が格納され、会社法が優先されることが示されている。この関係種別253には、一般法、特別法とった情報を追加して、法律の適用優先順位をあらわしても良い。また、議会を通して制定される「法律」以外の政令や省令等との関係情報を追加してもよい。
 税法で例示すると、相続税に関する法律である「相続税法」の場合、「民法」と関係が深い。相続税法では民法の規定を借用しており、民法に存在しない規定が相続税法で規定されている、という関係にある。そして「相続税法」は、政令である「相続税法施行令」、省令である「相続税法施行規則」、と相互に関係している。重要で基本的な事項は法律に示され、計算の規定や手続き的事項や様式などの具体的な規定は政令や省令等に示されている。また、相続税法を含む税法の特例的な位置づけで「租税特別措置法」には相続税法を含む各税法の時限的な規定等が掲げられているが、この租税特別措置法に対しても施行令、施行規則及び関係通達が各々存在する。したがって相続税法の条文(条文を構成する語義等も含む)の理解には、他の法律(民法や租税特別措置法)、関連する上記政令や省令等の規定を把握しておくことが必要となり、法律対応づけ情報250には、これら相互に関係する法律等の情報が記述されることになる。
 また、法律と条例の関係情報を追加してもよい。法人に対する課税を規定する法律であれば、課税主体が国である税金(法人税)を規定する法律(法人税法)と課税主体が地方(都道府県等)である税金(法人住民税や法人事業税)を規定する法律(地方税法)、そして地方税法の規定に基づき、各自治体等が具体的で細かな内容を定めた「条例」の関係情報を追加してもよい。
 さらに、法律ではなくとも法律を説明する「逐条解説」等と呼ばれる文書の情報も法律対応づけ情報250に追加してよい。たとえば国税庁長官が定める判断が示された「相続税法関係通達」は相続税法の規定の説明がなされている文書であり、法的な強制力はないものの相続税法の解釈に影響する点で、相続税法と対応づけて法律対応づけ情報250に計上される情報としての適格性を有する。
 さらに、後法優先の原則に基づき法律間の制定の時期の前後関係の情報を追加して、法律の適用優先順位をあらわしても良い。
 図6は、実施例1に係る語句出現表を示した図である。
  語句出現表260は、各法律における単語の出現の有無を管理する表である。
 行の支店262、事業所263、支払い264、金額265は、法律に含まれる単語を示している。各単語は、検索部132が形態素解析処理により、抽出することができる。S1-Sn、f1-fnは、法律或いは法律と条文を示している。
 語句出現表260は、行に示した単語が各法律に出現しているかを示している。具体的には、対応する法律において対応する単語が存在している場合には、存在していることを意味する「1」が設定され、存在していない場合には、存在しないことを意味する「0」が設定される。例えば、「支店」および「事業所」という単語は、法律S2(法人税法第132条)に含まれる。一方、f3(都条例第26条)には、「支店」という単語は含まれないが、「事業所」という単語が含まれる。
 このように、行名称を各法律の名称、例えば、文書名、法律ファイル名、条文名等とし、列名称を複数の語のそれぞれとし、行名称及び列名称のそれぞれの交点のセルには、対応する法律における、対応する単語の出現有無が設定されている。なお、図6に示す語句出現表260では、法律における単語の出現を管理するようにしているが、例えば、複数の語(語句、文等)を単位として、その単位の出現を管理するようにしてもよい。
 図7は、単語抽出テンプレートの一例を示した図である。
  単語抽出テンプレート270は、図8に示す語彙辞書を作成するためのルールを示している。単語抽出テンプレート270は、法律文脈パターン271に従って、抽出される単語272と、抽出される単語の関係273を規定したものである。例えば、法律に「A、Bその他のC」という記載があり、A、B、Cが同じ品詞である場合、抽出される単語は「A」「B」「C」である。法律文脈パターン271は、法律の記述において、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される。
 この場合、「A」「B」の関係は関係語、「A」「B」は「C」に対して上位語という関係として抽出される。これは法律文書に特徴的な記述作法(条文等に特徴的な構文構造等)に従う解釈に基づいた抽出結果であり、法律の条文に固有の字義や単語間の並列関係を定義する法律固有の文法構造に注目する「文理解釈」を可能にした結果に相当する。
 図8は、語彙辞書の一例を示した図である。図8は、図7に示した単語抽出テンプレート270(No.1のパターン)を「法人税法」に適応した結果を示した図となる。語彙辞書は、照合・統合部135で分析対象を絞り込むために使用される。
 語彙辞書280には、見出し語281、見出し語に関連する関連語282、見出し語281と関連語282との関係を示すタイプ283、適応した法律を示す法律名284が対応して管理される。法律名284の情報をあわせて管理することで、同一の単語等であっても法律毎に関連語が異なる場合の解釈に対応することが可能になる。そして、分析要求に関係する単語等が多義的であり、法律毎に優先されるべき語義が法律記述の特殊なルールに基づいて規定される結果、法律毎に意味が異なる場合であっても、関連語(同義語や類義語等)を抽出することが可能になる。語彙辞書280中の見出し語281は、検索部132によって抽出された指定語とすることができる。
 例えば、「支店、事業所」のような上位、下位の関係にある単語ペアに対し、「支店」が見出し、「事業所」が関連語であり、「事業所」が「支店」の「上位語」(より抽象的な語)であることが格納されている。語彙辞書は、辞書引きの都合上、冗長にデータを保持しているものとする。すなわち、「支店、事業所」という単語ペアに対し、「支店」を見出し語とした行と、「事業所」を見出し語とした行の両方を保持しているものとする。ここで、特に単語ペアが上位、下位の関係にある場合には、順序を逆にしたペアのタイプは同様に逆になることに注意が必要である。例えば、「支店」は「事業所」の下位語となる。
 次に、法律分析装置10の処理動作について説明する。
  図9は、実施例1に係る、法律分析装置10による分析処理のフローチャートである。
  まず、入力受付部131は、入出力装置105により、ユーザから関連する法律を分析するための分析要求の入力を受け付ける(S101)。ここでは、理解を容易にするため、図3の質問文「東京都以外に本店のある法人が、都内に初めて支店を設置する場合の手続きについて教えてください。」301が入力された場合を例に説明するが、分析要求はこれに限るものではない。
 ステップS101で、検索対象として必ず分析対象としたい法律がある場合、「必須法律」として入力する。図3の質問文の例では、「都条例」と入力されることとなる。
 次いで、検索部132は、質問文301に対して、前処理を行う(S102)。このステップで、例えば、質問文301から文構造を解析するツールを用いて指定語となる「支店」という単語が抽出する。
 次に、検索部132は、ステップS102で抽出された「支店」という単語が含まれる法律を図6に示した語句出現表260を参照して抽出する。この例では、S2(法人税法)、f2(会社法)、f7が指定語を含む法律として、図10の「支店」から抽出される法律1001のように抽出される(ステップS103)。
 次いで、法律特定部133は、法律対応づけ情報250を参照し、ステップS103で抽出された法律、S2(法人税法)、f2(会社法)、f7と関連する法律を抽出する。つまり、S2(法人税法)に対してf3都条例、f2(会社法)に対してS1(民法)、f7に対してS4が関連法律として抽出される(ステップS104)。
 ステップS103で指定語から抽出される法律と、ステップS104で抽出された法律の関係を図10に示す。ステップS103で指定語から抽出された法律1001に加え、ステップS104で分析対象となる関連法1002が増えていることが分かる。この処理は、図5に示した法律対応付け250を参照して、関連ある法律を分析対象に含めることで、漏れのない検索を行うためである。
 分析部134は、自然言語関係性を分析する処理を実行する(S105)。
  ステップS105では、分析部134は、ステップS102の前処理で特定された指定語について、語句出現表260を参照して処理を行う。例えば、分析要求に基づく指定語が「支店」である場合には、分析部134は、語句出現表260の「支店」を列名に持つ列262において、「1」が設定されているレコード(行)の名称を特定する。この例では、分析部134は、レコードの名称として、S2、f2、f7の法律を特定する。つまり、「支店」という単語は、S2、f2、f7に含まれていることを意味する。
 次いで、分析部134は、法律S2、f2、f7の内、S2とf7の二つの法律に指定語の「支店」と「事業所」が出現しているため、指定語「支店」が含まれる法律S2、f2、f7と関連性が高い関連語として、「事業所」を抽出し、語句出現表260に追加する。なお、指定語が「金額」である場合には、同様な処理により、「金額」を列名に持つ列265を参照し、「金額」と関係が強い法律を分析結果とする。
 ステップS104とS105の処理は、並列的に実施してもよい。なお、法律対応づけ情報を使用しない場合にはステップS104の処理を省いてもよい。また、ステップS104を実施し、ステップS105の処理を省いてもよい。
 次いで、照合・統合部135は、ステップS104で得られた法律と、ステップS105で得られた関連語から分析対象を絞り込む処理(関係法律抽出処理(図11参照))を実行する(S106)。この際、必要に応じてステップS101で入力される必須法律に基づいて、分析対象の法律を絞り込むことができる。
 次いで、分析結果提示部136は、関係法律抽出処理により得られた分析結果を、入出力装置105に接続された表示手段に提示するよう制御する(S107)。
  以上が、法律分析装置10の概要であるが、ステップS105の関連する単語の追加を行うための他の例について説明する。
 図11は、分析部134がステップS105の指定語に対する関連語の抽出し、語句出現表260に追加する他の方法を示したフローチャートである。
  まず、分析部134は、検索部132から分析対象となる法律名「法人税法」と指定語「支店」が入力される(S201)。つまり、語彙辞書(図8)の見出し語281の「支店」と法律名284が入力される。
 ここで、法律名「法人税法」と、指定語「支店」が入力されると、入力された法律名と指定語に基づき、語彙辞書280を参照して関連語「事業所」を抽出する(S202)。これは、指定語の他に、指定語に関連する関連語を分析対象にすることで漏れのない分析結果を得るためである。つまり、法律特定部133で分析対象の法律を拡張し、分析部134で分析対象の単語を拡張することで、漏れのない法律分析を可能としている。
 次に、分析部134は、図6の語句出現表260の「追加された注目語」行の「事業所」の列に対応するセルに、非ゼロの数値で更新する。この操作により、関連語は、注目語として管理される。注目語「事業所」のセル更新値としては注目語「支店」と重み付けに差をつける場合には「0.5」等でよい(S203)。この重みづけにより、質問文に含まれる指定語に関連の高い法律を点数で把握することができる。
 次に、図12により、図9のステップS106の関係法律分析処理の詳細を説明する。
  照合・統合部135は、更新された語句出現表をもとに指定語や注目語を含む法律を抽出する(S301)。
 次に、ステップS302で、照合・統合部135は、語句出現表260を参照し、法律毎に点数をつけ、点数の高い順に並び替えた結果を分析結果提示部136に出力する。つまり、語句出現表260に追加され、重みづけをされた注目語と質問文に含まれる指定語によって、法律毎に、指定語と注目語の出現に重み付けを掛け合わせたものを加算することによって求めることができる。
 また、他の例としては、ステップS301で、ステップS101で入力された必須法律である「東京都税条例」に基づいて、図5の法律対応づけ表250を参照し、「東京都税条例」と関連付けられた法律の範囲内で、指定語である「支店」と注目語である「事業所」を含む法律を分析対象法律として絞り込んでもよい。
 例えば、質問文301に対し、ステップS104で拡張された法律(関連法)には、図10に示すようにS1(民法)、S2(法人税法)、S4、f2(会社法)、f3(都条例)、f7が含まれる。図6の語句出現表260でも、指定語「支店」を含む「会社法」は、法律対応づけ表250で、「都条例」と対応付けられていないため、分析対象から除外される。また、指定語「支店」は含まないが、注目語である「事業所」を含み、法律対応づけ表250にf3「都条例」と対応するS3「刑法」は、指定語「支店」と注目語「事業所」の何れも含まないため、分析対象から除外する。
 この場合、照合・統合部135から指定語「支店」に関係がある(関係が強い)法律群が出力される(S302)。
 以上のように、法律特定部133で分析対象の法律を拡張し、分析部134で分析対象となる単語を拡張して、漏れのない分析を行うと共に、照合・統合部135では、分析対象の絞り込みを行い、分析結果の精度を向上させている。照合・統合部135では、法律毎に点数を計算する。点数の計算は、法律毎に、指定語と注目語の出現に重み付けを掛け合わせたものを加算することによって求めることができる。
 以上の通り、例えば、必須法律(例 東京都税条例)内にその指定語が記述されていない場合においても、指定語「支店」に関係する「事業所」を含む東京都税条例の条文(具体例におけるf7がこれに対応)を抽出結果に含めることができる。
 実施例1に係る法律分析装置によると、指定語のみではなく関連する語も検索語として追加することで本来ユーザにとって必要な情報(法律等)を漏らす可能性を低減できる。また、複数の法律から複数の関連条文を探すような、探索範囲が広くなる場合にも、分析要求に照らして適切な法律のみが表示されるので、ユーザにとって不要な法律の情報が表示されることを回避できる。結果として、精度よく、かつ、分析時間等の面で効率のよい分析を可能になる。
 図7の単語抽出テンプレートの他の例について説明する。
  法律文書においては、「その他」あるいは「その他の」でつながれた語句は、相互に関係の深い単語であることが明示されている。しかも「その他」の文言と「その他の」の文言とでは異なった意味に解釈され、 「その他」の前後は並列関係であり、「その他の」の場合は、直前の語句は直後の語句の例示にあると解釈される。上記のような法律実務に即した正しい語句の関係性を解釈し関係性の深い語句を取得することができるように、法律固有ルール記述部には例えば以下のような解析ルールが規定されている。
 「その他の」の場合、直前に位置する語は直後に位置する語の例示であり、直前に位置する語の先頭に「例えばJを付加し、全体を括弧で囲んだ上で、直後に位置する語の後ろに移動させる。
 一方、「その他」の場合、直前に位置する語と直後に位置する語とは並列関係であり、それぞれを単独で用いた文を生成する。
 さらに、法律文脈パターン271に法律内の定義規定の構造が登録されている状態も、単語抽出テンプレートの典型的な例である。図7のNo.3のパターンに「法人税法」の「恒久的施設」という用語を適応させると、図8相当の情報として下に示す結果が得られる。
 この結果はその法律に固有で解釈において優先すべき定義等を特記した規定を踏まえる「法規的解釈」を可能にした結果に相当する。尚、「恒久的施設」の定義として図7に適応させた条文は法人税法第二条の次の記述である。
・法人税法第二条十二の十九 恒久的施設 次に掲げるものをいう。(中略)イ 外国法人の国内にある支店、工場その他事業を行う一定の場所で政令で定めるもの。
  ・見出し語: 恒久的施設
  ・関連語: 外国法人の国内にある支店
  ・タイプ: 同義語
  ・法律:  法人税法
 ここで「外国法人の国内にある支店」の部分は単語に分解した結果が示されていてもよい。その場合は以下のような図8への記載内容が一例として想定される。
  ・見出し語: 恒久的施設
  ・関連語: 支店
  ・タイプ: 関係語
  ・法律:  法人税法
 これらの解析ルールに従うことにより、正しく各語句聞の関係性構造を導き、新たな関連語(同義語や類義語等)の取得を行うことができる。
 実施例1では、ユーザによる質問文と必須法律が分析要求として入力される例を示したが、実施例3では、法改正が行われたときに、どの法律や条例が影響を受けるかを分析する。
 実施例3では、実施例1の分析要求として、法改正が行われた法律名が必須法律に対応する情報となり、法改正箇所を前処理することで、法改正箇所から指定語を抽出するようにすれば、良いこととなる。
 実施例3によれば、法改正が行われた際に、それに伴って改正が必要となる条文等を容易に抽出することができる。
 実施例4では、実施例1の語彙出現表をもとに分析要求を記述した文書や法律の条文等の特徴を数値化し、分析要求を記述した文書等とその数値が似ている条文等を分析要求に関係が強い検索結果として出力する。あるいは、実施例1で得た検索結果である条文等と数値が似ている条文等も、分析要求に関係が強い検索結果としてあわせて出力する。
 条文等の特徴の数値化の手段としては特許文献1でも活用されている文書ベクトル化が公知の典型的な手段である。「文書ベクトル化」とは、各文書に含まれるキーワードの組合せと出現頻度に基づいて文書の特徴をベクトルとして表現する技術である。特許文献1にもとづく分析では、双方に共通する単語が多い法律条文等は類似性が高いと判定される傾向になると考えられる。
 実施例4では文や文書の特徴を数値化するための入力となる語彙出現表が,法律固有の文理解釈や法規的解釈にもとづいて抽出した法律毎の関連語で更新された状態であることが本発明に特徴的といえる。条文等の特徴の数値化の手段としては特許文献1でも活用されている文書ベクトル化が公知の典型的な手段であるが、実施例4の趣旨を逸脱しない範囲においては、文書ベクトル化に限定されるものではない。
 実施例4によれば、分析要求に対して関係の深い条文等として、文や文章単位で類似する条文等を容易に抽出することができる。
10:法律分析装置、100:CPU、101:主記憶装置、102:記憶装置、105:入出力装置、121:法律情報格納部、122:分析関連情報格納部、131:入力受付部、132:検索部、133:法律特定部、134:自然言語関係性分析部、135…照合・統合部、136…分析結果提示部。

Claims (12)

  1.  複数の法律の中から分析要求に関連する法律を抽出する法律分析装置であって、
     関連する法律の対応関係を示す法律対応づけ情報と前記複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、
     前記複数の法律を分析する法律分析部と、
     前記法律分析部の分析結果を提示する提示部と、を有し、
     前記法律分析部は、
     法律に対する質問文と分析したい必須法律を含む分析要求を受け付ける入力受付部と、
     前記入力受付部によって受け付けられた分析要求から指定語を抽出し、前記指定語を含む第1の法律を前記語句出現情報に基づいて、検索する検索部と、
     前記法律対応づけ情報に基づいて、前記第1の法律と関連する関連法律を抽出し、前記第1の法律と前記関連法律を出力する法律特定部と、
     前記必須法律と前記指定語に基づいて語彙辞書を参照して関連語を抽出し、前記語句出現情報の法律毎に前記関連語を追加する分析部と、
     前記法律特定部から出力された前記第1の法律と前記関連法律から、前記分析部により追加された前記関連語を含む語彙出現情報に基づいて、分析対象となる法律を特定する統合部と、を有する、
    ことを特徴とする法律分析装置。
  2.  請求項1に記載の法律分析装置において、
     前記分析部は、
     抽出された前記関連語を、前記語彙出現情報の法律毎に重み付けを行って追加することで、前記記憶部に記憶される前記語句出現情報を更新する、
    ことを特徴とする法律分析装置。
  3.  請求項2に記載の法律分析装置において、
     前記記憶部に記憶される法律対応づけ情報は、対応関係のある下位法律と上位法律と、前記下位法律と前記上位法律の優先順位を示す関係種別とを含む
    ことを特徴とする法律分析装置。
  4.  請求項2に記載の法律分析装置において、
     前記記憶部は、法律文脈パターンを格納し、
     前記分析部は、前記指定語から前記関連語を、前記法律文脈パターンに照らして法律毎に抽出し、前記記憶部に記憶される前記語句出現情報を法律毎に更新する、
    ことを特徴とする法律分析装置。
  5.  請求項4に記載の法律分析装置において、
     前記記憶部は、前記法律文脈パターン、見出し語、前記見出し語に関連する前記関連語と法律名を対応して記憶する語彙辞書、及び、前記見出し語とその同義語とを格納した同義語辞書の内、少なくとも一つの辞書を格納し、
     前記語彙辞書及び前記同義語辞書は、前記法律文脈パターンと、前記法律文脈パターンから抽出される少なくとも二つの単語と、前記二つの単語間の関係を対応付けて法律毎に管理するものである
    ことを特徴とする法律分析装置。
  6.  請求項4に記載の法律分析装置において、
     前記記憶部に格納される前記法律文脈パターンは、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される
    ことを特徴とする法律分析装置。
  7.  請求項5に記載の法律分析装置において、
     前記記憶部に格納される前記法律文脈パターンは、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される
    ことを特徴とする法律分析装置。
  8.  請求項7に記載の法律分析装置において、
     前記分析部は、前記検索部から前記指定語が入力され、前記法律特定部から法律名が入力され、前記検索部から入力された指定語と前記法律特定部から入力された法律名に基づき、前記語彙辞書及び前記同義語辞書の内の少なくとも一つを参照して、前記関連語を出力する
    ことを特徴とする法律分析装置。
  9.  請求項4に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
    ことを特徴とする法律分析装置。
  10.  請求項5に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
    ことを特徴とする法律分析装置。
  11.  請求項6に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
    ことを特徴とする法律分析装置。
  12.  関連する法律の対応関係を示す法律対応づけ情報と、複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、前記複数の法律を分析する法律分析部と、前記法律分析部の分析結果を提示する提示部とを有し、前記複数の法律の中から分析要求に関連する法律を抽出する法律分析装置における方法であって、
     前記法律分析部は、
     法律に対する質問文と分析したい必須法律を含む分析要求を受け付け、
     前記受け付けられた分析要求から指定語を抽出し、前記指定語を含む第1の法律を前記語句出現情報に基づいて検索し、
     前記法律対応づけ情報に基づいて、前記第1の法律と関連する関連法律を抽出し、前記第1の法律と前記関連法律を出力し、
     前記必須法律と前記指定語に基づいて語彙辞書を参照して関連語を抽出し、前記語句出現情報の法律毎に前記関連語を追加し、
     前記第1の法律と前記関連法律から、前記関連語が追加された語彙出現情報に基づいて、分析対象となる法律を特定する
    ことを特徴とする方法。
PCT/JP2020/033945 2019-09-10 2020-09-08 法律分析装置、及び法律分析方法 WO2021049485A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021545546A JP7312841B2 (ja) 2019-09-10 2020-09-08 法律分析装置、及び法律分析方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019164516 2019-09-10
JP2019-164516 2019-09-10

Publications (1)

Publication Number Publication Date
WO2021049485A1 true WO2021049485A1 (ja) 2021-03-18

Family

ID=74866140

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/033945 WO2021049485A1 (ja) 2019-09-10 2020-09-08 法律分析装置、及び法律分析方法

Country Status (2)

Country Link
JP (1) JP7312841B2 (ja)
WO (1) WO2021049485A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196718A (ja) * 2004-01-08 2005-07-21 Tsunenori Takemoto 未知概念の背景概念をたどるための方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040193596A1 (en) 2003-02-21 2004-09-30 Rudy Defelice Multiparameter indexing and searching for documents
JP5356197B2 (ja) 2009-12-01 2013-12-04 株式会社日立製作所 単語意味関係抽出装置
JP5383943B1 (ja) 2013-06-06 2014-01-08 株式会社野村総合研究所 契約書分析システム、プログラム及び方法
JP5383942B1 (ja) 2013-06-06 2014-01-08 株式会社野村総合研究所 法律文書解析システム及びプログラム
JP6144133B2 (ja) 2013-07-08 2017-06-07 久美子 石井 検索システム
US10373268B1 (en) 2014-10-05 2019-08-06 Henry A. Orphys Determining correct answers to tax and accounting issues arising from business transactions and generating accounting entries to record those transactions using a computerized predicate logic implementation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196718A (ja) * 2004-01-08 2005-07-21 Tsunenori Takemoto 未知概念の背景概念をたどるための方法

Also Published As

Publication number Publication date
JPWO2021049485A1 (ja) 2021-03-18
JP7312841B2 (ja) 2023-07-21

Similar Documents

Publication Publication Date Title
US10282468B2 (en) Document-based requirement identification and extraction
Chauhan et al. A comprehensive analysis of adverb types for mining user sentiments on amazon product reviews
KR101723862B1 (ko) 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치
Bhatia et al. Towards an information type lexicon for privacy policies
Arendarenko et al. Ontology-based information and event extraction for business intelligence
US9632998B2 (en) Claim polarity identification
Forsyth et al. Document dissimilarity within and across languages: a benchmarking study
KR101541306B1 (ko) 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체
Yalcin et al. An external plagiarism detection system based on part-of-speech (POS) tag n-grams and word embedding
Quirchmayr et al. Semi-automatic Software Feature-Relevant Information Extraction from Natural Language User Manuals: An Approach and Practical Experience at Roche Diagnostics GmbH
Nam et al. Structuralizing biomedical abstracts with discriminative linguistic features
Garg et al. Maulik: A plagiarism detection tool for hindi documents
Quirchmayr et al. Semi-automatic rule-based domain terminology and software feature-relevant information extraction from natural language user manuals: An approach and evaluation at Roche Diagnostics GmbH
Berdyugina et al. Setting up context-sensitive real-time contradiction matrix of a given field using unstructured texts of patent contents and natural language processing
Putri et al. Software feature extraction using infrequent feature extraction
Kama et al. A web search enhanced feature extraction method for aspect-based sentiment analysis for Turkish informal texts
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
Alam et al. Comparing named entity recognition on transcriptions and written texts
WO2021049485A1 (ja) 法律分析装置、及び法律分析方法
Litvak et al. Multilingual Text Analysis: Challenges, Models, and Approaches
Rofiq Indonesian news extractive text summarization using latent semantic analysis
Tschuggnall et al. From plagiarism detection to bible analysis: The potential of machine learning for grammar-based text analysis
Abera et al. Information extraction model for afan oromo news text
Muhammad et al. Revisiting the challenges and surveys in text similarity matching and detection methods.
Khoufi et al. A Framework for Language Resource Construction and Syntactic Analysis: Case of Arabic

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20863820

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021545546

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20863820

Country of ref document: EP

Kind code of ref document: A1