JP5000390B2 - Legal example rules text script term screening device, script term screening system, and script term screening method - Google Patents
Legal example rules text script term screening device, script term screening system, and script term screening method Download PDFInfo
- Publication number
- JP5000390B2 JP5000390B2 JP2007160628A JP2007160628A JP5000390B2 JP 5000390 B2 JP5000390 B2 JP 5000390B2 JP 2007160628 A JP2007160628 A JP 2007160628A JP 2007160628 A JP2007160628 A JP 2007160628A JP 5000390 B2 JP5000390 B2 JP 5000390B2
- Authority
- JP
- Japan
- Prior art keywords
- law
- name
- morpheme
- regulations
- script
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013515 script Methods 0.000 title claims description 148
- 238000000034 method Methods 0.000 title claims description 25
- 238000012216 screening Methods 0.000 title claims description 13
- 230000000877 morphologic effect Effects 0.000 claims description 38
- 238000012552 review Methods 0.000 claims description 21
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 235000016496 Panda oleosa Nutrition 0.000 description 5
- 240000000220 Panda oleosa Species 0.000 description 5
- 230000003628 erosive effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、法令又は例規について作成された条文の用字用語審査に用いられる用字用語審査装置、用字用語審査システム及び用字用語の審査方法に関するものである。 The present invention relates to a script term review device, a script term review system, and a script term review method used for script term review of articles prepared for laws and regulations.
国の法令(法律及び命令等)や地方自治体の例規(条例及び規則等)を新規に制定したり、その一部を改正したりする際には、法令や例規の条文を作成することが必要になる。このような法令や例規の条文作成作業においては、参照する他の法令や条項等が多いためにその確認に煩雑な作業が発生しやすい他、高度な正確性が求められるため、既存の法令や例規に関するデータを活用した条文作成支援のためのコンピュータシステムを利用することが多くなっている。 When newly enacting national laws and regulations (laws and orders, etc.) and local government regulations (bylaws and regulations, etc.) or revising a part of them, it is necessary to prepare the laws and regulations. become. In the preparation of such laws and regulations, since there are many other laws and clauses to be referred to, it is easy to check them, and high accuracy is required. Computer systems for supporting the creation of texts using data related to regulations are increasingly used.
かかるコンピュータシステムとして、例えば、新規に法令等を制定する際に、参考となる類似の文章表現を検索することが可能なシステムに関する発明(例えば、特許文献1参照。)や、法令文書の改正を行う際に、改正法令や新旧対照表を自動作成するシステムに関する発明(例えば、特許文献2、特許文献3参照。)が開示されている。 As such a computer system, for example, an invention relating to a system capable of searching for a similar sentence expression to be used as a reference when newly enacting a law or the like (for example, refer to Patent Document 1) or amendment of a law document. An invention relating to a system for automatically creating revised laws and regulations and old and new comparison tables when performing them (see, for example, Patent Document 2 and Patent Document 3) is disclosed.
上記の発明によって、法令や例規の条文を作成する作業を効率化することが可能になるが、自動化により対応できない部分を人が入力した場合や、過去の法令等で用いられた用語や用字の使用規則がその後に改められた場合などには、作成された条文に用語や用字の誤りが発生してしまうことがある。従って、作成された条文については、用語用字に統一すべき用語や言い換えを必要とする語などの誤り表記がないかをチェックすることが必要である。 The above invention makes it possible to streamline the process of creating laws and regulations, but if a person inputs a part that cannot be handled by automation, or a term or script used in past laws and regulations, etc. If the usage rules are revised afterwards, errors in terminology and script may occur in the created text. Therefore, it is necessary to check the prepared text for whether there is an error notation such as a term that should be unified in the terminology and a word that requires paraphrasing.
かかる用字用語の誤りのチェックについて、特許文献2には、作成された法令文書を不適当用語等のルールに照らし合わせて推敲する手順が説明されているが(特許文献2の段落0070〜0071参照。)、不適当用語をどのように検出するか等の具体的動作については何ら開示されていない。 Regarding checking for errors in script terminology, Patent Document 2 describes a procedure for revising a created legal document against rules such as inappropriate terms (paragraphs 0070 to 0071 of Patent Document 2). No specific operation such as how to detect inappropriate terms is disclosed.
法令文書に限らず、作成された何らかの文書の用字用語の誤りをコンピュータによってチェックするためには、対象となる文書を形態素(何らかの意味を持つ最小単位の単語)等の単語に分解して、正しく表記された単語のみを登録したデータベース等に含まれていないものを誤り表記と判定したり、予めデータベース等に登録しておいた誤りやすい表記に該当するものを誤り表記と判定して正しい表記に自動訂正したりする方法が有効である。しかしながら、法令や例規の条文を形態素解析によって審査する方法を採用しようとすると、次のような問題が生じてしまう。 In order to check the script terminology of any document created, not limited to legal documents, with a computer, break the target document into words such as morphemes (the smallest unit word with some meaning) If the database contains only the correctly written words, it is judged as an error notation if it is not included in the database, or if it is an error notation that is registered in advance in the database etc. An automatic correction method is effective. However, the following problems arise when trying to adopt a method that examines laws and regulations and statutes by morphological analysis.
法令や例規の条文には、他の法令名や例規名が引用されることが多いが、形態素解析のロジックをそのまま適用すると、法令名や例規名も通常の形態素の単位にまで分解されてしまうことになる。例えば、「豪雪に際して地方公共団体が行なう公共の施設の除雪事業に要する費用の補助に関する特別措置法」という法律名が対象となる条文に含まれている場合に、これを通常のルールに従って形態素解析すると、「豪雪/に/際して/地方公共団体/が/行なう/公共/の/施設/の/除雪事業/に/要する/費用/の/補助/に/関する/特別/措置/法」と分解されることになる。このうち「行なう」が誤り表記で「行う」に改めるというルールが登録されていた場合、「行なう」を「行う」に訂正するように警告が促されるので、それに従って訂正を行うと、法令名が「豪雪に際して地方公共団体が行う公共の施設の除雪事業に要する費用の補助に関する特別措置法」に変更されてしまうことになる。法令名や例規名そのものが改正されたわけではないのに、法令名や例規名に含まれる用語があわせて訂正されてしまうのは適切でないため、法令名や例規名に含まれる用語は誤りと判定しないことが求められることになる。 Other laws and regulations are often cited in laws and regulations, but if morphological analysis logic is applied as it is, the names of regulations and regulations will be broken down into normal morpheme units. It will be. For example, if the law name “Special Measures Law on Subsidy for Expenses Required for Snow Removal Projects of Public Facilities Performed by Local Governments in Case of Heavy Snowfall” is included in the applicable text, this is analyzed according to normal rules. Then, “heavy snow / in / outward / local government / go / do / public / of / facility / of / snow removal project / necessary / cost / subsidy / related / special / measures / law” Will be disassembled. If a rule that “do” is changed to “do” with an error notation is registered, a warning is issued to correct “do” to “do”. Will be changed to “Special Measures Law for Subsidies for Expenses Necessary for Snow Removal Projects of Public Facilities Performed by Local Governments in Heavy Snowfall”. Even though the name of the law or the name of the regulation itself has not been revised, it is not appropriate that the terms included in the name of the law or the name of the law are corrected together. It will be required not to.
この他にも、法令や例規の条文に他の法令や例規を引用する場合には、題名改正された法令名や例規名を過去の名称のままで引用してしまう、有効ではなくなっている法令や例規を引用してしまう、引用した法令の法令番号や例規の例規番号を誤って入力してしまう、引用した法令や例規の条項号を誤って入力してしまう、といった誤りが生じやすい。形態素解析によって法令や例規の条文を審査する場合には、他の法令や例規を引用することによって生じるこれらの課題に対応することが必要になる。 In addition, when quoting other laws and regulations in the provisions of laws and regulations, laws and regulations that are no longer valid are cited with the revised titles of laws and regulations as they were in the past. It is easy to make mistakes such as quoting or by-laws, wrongly entering the statute number of a quoted law or by-law, or wrongly entering the clause number of a quoted law or by-law. When examining the provisions of laws and regulations by morphological analysis, it is necessary to deal with these issues that arise from quoting other laws and regulations.
本発明は、かかる課題に対応するためになされたものであり、法令又は例規について作成された条文の用字用語審査において、他の法令や例規を引用することによって生じる課題に対応することが可能な用字用語審査装置、用字用語審査システム及び用字用語の審査方法を提供することを目的とするものである。 The present invention has been made to cope with such a problem, and can deal with a problem caused by quoting other laws and regulations in the script terminology examination of articles prepared for laws and regulations. It is an object of the present invention to provide a script term examination device, a script term examination system, and a script term examination method.
このような課題に対応する本発明は、法令又は例規について作成された条文の用字用語審査を行うための装置であって、法令又は例規の条文に用いられる形態素を記憶する形態素解析辞書記憶手段と、前記形態素解析辞書記憶手段に記憶された形態素の少なくとも一部について、誤り表記とすべき用字用語に対応する形態素を記憶する用字用語辞書記憶手段と、法令又は例規について作成された条文を記述した条文データを受け付ける条文受付手段と、前記条文受付手段が受け付けた条文データを前記形態素解析辞書記憶手段と対照させて、最長一致となる形態素を順に選択し、前記条文データを形態素に分解した分ち書き文を作成する分ち書き文作成手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素を前記用字用語辞書記憶手段と対照させて、誤り表記と一致する形態素を特定する誤り表記特定手段と、前記誤り表記特定手段が特定した形態素について所定の警告メッセージを作成し、用字用語の審査結果として出力する審査結果出力手段と、を備えていて、前記形態素記憶手段には、前記法令又は例規を制定する国又は地方自治体に関連する法令の法令名又は例規の例規名が、品詞分解可能な語であっても一の形態素として記憶されていて、前記分ち書き文作成手段は、前記法令名又は例規の例規名を一の形態素とした分ち書き文を作成することを特徴とする用字用語審査装置である。 The present invention corresponding to such a problem is a device for examining script terminology of a clause prepared for a law or a rule, and a morpheme analysis dictionary storage means for storing a morpheme used for a law or rule And at least a part of the morpheme stored in the morpheme analysis dictionary storage means, a script term dictionary storage means for storing a morpheme corresponding to a script term to be used as an error notation, and a provision prepared for a law or an example The clause receiving means for receiving the clause data describing the sentence, the clause data received by the clause receiving means is compared with the morpheme analysis dictionary storage means, the morpheme having the longest match is sequentially selected, and the clause data is decomposed into morphemes The segmented sentence creating means for creating the segmented sentence and the segmented sentence created by the segmented sentence creating means The morpheme is compared with the script term dictionary storage means, an error notation specifying means for specifying a morpheme that matches the error notation, and a predetermined warning message for the morpheme specified by the error notation specifying means, An examination result output means for outputting as an examination result of terms, and the morpheme storage means has a law name or example name of the law related to a country or local government enacting the law or regulation, Even if the part-of-speech-decomposable word is stored as one morpheme, the segmented sentence creating means creates a segmented sentence with the name of the law or the example rule name as one morpheme. This is a characteristic terminology examination device.
本発明では、法令名や例規名を品詞分解可能な語であっても一の形態素として登録しておくことによって、これらがさらに形態素に分解され、その一部が用語用字に統一すべき用語や言い換えを必要とする語などの誤り表記と判定されてしまうことを回避することを可能にしている。 In the present invention, even if the name of a law or example name is a word that can be decomposed as part of speech, it is further decomposed into morphemes by registering them as one morpheme, and some of the terms should be unified into terminology It is possible to avoid being judged as an error notation of a word or the like that requires paraphrasing.
尚、「法令」の語は、広く地方自治体の条例や規則も含めて解釈されることもあるが、本発明においては、「法令」とは国の法律、規則及び命令を、「例規」とは地方自治体の条例と規則等を意味するものとする。「形態素」とは、何らかの意味を持つ最小単位の単語を意味するものとし、原則として名詞、動詞、接続詞、助詞などの各々の品詞が対応するが、上記のとおり法令名や例規名が例外的に一の形態素として登録される。 The term “laws” may be widely interpreted including local government regulations and rules. In the present invention, “laws” refers to national laws, rules and orders, and “regulations”. Means local ordinances and rules. “Morphology” means a word of the smallest unit that has some meaning, and in principle, each part of speech such as a noun, verb, conjunction, particle, etc. corresponds, but the names of laws and regulations are exceptional as described above. Registered as one morpheme.
また、本発明にかかる用字用語審査装置は、国の法令に関する最新の法令名が記憶された第1の記憶装置、地方自治体の例規に関する最新の例規名が記憶された第2の記憶装置の少なくとも一つの記憶装置に所定のタイミングでアクセスして、前記形態素解析辞書記憶手段に形態素として記憶された法令名又は例規名の差分更新を行う法令例規名更新手段を備えることを特徴とすることもできる。 In addition, the terminology examination apparatus according to the present invention includes a first storage device that stores the latest legal names related to national laws, and a second storage device that stores the latest standard names related to local government rules. It is also characterized by comprising a legal example / regulation name update means for accessing at least one storage device at a predetermined timing and performing a differential update of the legal name or example name stored as a morpheme in the morpheme analysis dictionary storage means. it can.
このように構成すると、形態素として登録される法令名や例規名が常時最新の状態にアップデートされるので、より正確な審査を効率的に行うことが可能になる。尚、ここに登録される法令名や例規名には、現行の法令又は例規に関するものだけでなく、未施行の法令又は例規にかかる法令名や例規名も含まれるものとする。 With this configuration, the names of laws and regulations registered as morphemes are constantly updated to the latest state, so that more accurate examination can be performed efficiently. Note that the names of laws and regulations registered here include not only those related to existing laws and regulations, but also the names of laws and regulations relating to unenforced laws and regulations.
さらに、本発明にかかる用字用語審査装置は、前記法令又は例規を制定する国又は地方自治体に関連する最新の法令名及び例規名を含む法令例規に関する情報を記憶する法令例規情報記憶手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名を前記法令例規情報記憶手段と対照させて、一致する法令名又は例規名が存在しない法令名又は例規名を特定する誤り法令例規名特定手段と、を備えていて、前記審査結果出力手段は、前記誤り法令例規名特定手段が特定した法令名又は例規名が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として出力することを特徴とすることもできる。 Furthermore, the script terminology examination apparatus according to the present invention includes a legal regulation information storage means for storing information on legal regulations including the latest legal names and regulations related to the country or local government that establishes the laws or regulations, For the segmented text created by the segmented text creating means, the law name or example name constituting the segmented sentence is compared with the law ordinance information storing means, and there is a matching law name or example name. An error law / regulation name specifying means for specifying the law name / example name not to be determined, and the examination result output means indicates that the law name / example name specified by the error law / regulation name identification means is incorrect. A warning message can be created and output as a result of examination of script terms.
このように構成すると、例えば、法令名や例規名が変更されている場合や、既に効力を失った法令や例規を誤って引用してしまった場合において、警告メッセージを発することが可能になる。 Such a configuration makes it possible to issue a warning message when, for example, a law name or rule name has been changed, or when a law or rule that has already lost its effectiveness is cited incorrectly.
さらに、本発明にかかる用字用語審査装置は、前記法令又は例規を制定する国又は地方自治体に関連する最新の法令の法令番号及び例規の例規番号を含む法令例規に関する情報を記憶する法令例規番号記憶手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名の直後の形態素が「(」+「元号」である場合に、「)」までの間の全ての形態素を一の法令番号又は例規番号と特定し、前記法令例規番号記憶手段と対照させて、前記法令名又は例規名に対応する法令番号又は例規番号と一致しない場合には、特定した法令番号又は例規番号を誤りと判定する法令例規番号審査手段と、を備えていて、前記審査結果出力手段は、前記法令例規番号審査手段が誤りと判定し法令名又は例規名について、前記法令番号又は例規番号誤りであることを示す警告メッセージを作成し、用字用語の審査結果として出力することを特徴とすることもできる。 Furthermore, the script terminology examination apparatus according to the present invention stores the information relating to the laws and regulations including the latest laws and regulations related to the country or local government enacting the laws or regulations and the regulations. When the morpheme immediately after the name of the law or the name of the rule constituting the segmented sentence is “(” + “general name” for the segmented sentence created by the storage unit and the segmented sentence creating unit , ")" All the morphemes are identified as one legal number or example number, and the legal number or example number corresponding to the legal name or example name is matched with the legal example number storage means If not, a legal regulation number examination means for judging the specified regulation number or the regulation number as an error is provided, and the examination result output means determines that the regulation example number examination means judges the error and the regulation name or For example There are, to create a warning message indicating that the a law number or established rule number error can be and outputs the examination results of the scripts terms.
このように構成すると、引用した法令の法令番号(「平成×年法律第×××号」といった番号)や例規の例規番号(「平成×年○○県条例第×××号」といった番号)を誤って入力してしまった場合において、警告メッセージを発することが可能になる。 When configured in this way, the law number of the cited law (number such as “Heisei x Year Law No. xxx”) or the rule number of the rule (number such as “Heisei x Year XX Prefectural Ordinance No. xxx No.”) Can be issued in the event that is entered by mistake.
さらに、本発明にかかる用字用語審査装置は、前記形態素記憶手段には、法令又は例規の条項号が形態素として記憶されていて、前記法令又は例規を制定する国又は地方自治体に関連する最新の法令の条文及び例規の条文を含む法令例規の条文に関する情報を記憶する法令例規条文記憶手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素のうち、法令名又は例規名と、前記法令名又は例規名の直後にある条項号から法令又は例規の条項号を特定し、前記法令例規条文記憶手段と対照させて、前記法令又は例規の条項号が存在しない場合には、前記法令又は例規の条項号を誤りと判定する法令例規条項号審査手段と、を備えていて、前記審査結果出力手段は、前記法令例規条項号審査手段が誤りと判定した法令又は例規の条項号について、前記法令又は例規の条項号が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として出力することを特徴とすることもできる。 Furthermore, in the script terminology examination apparatus according to the present invention, the morpheme storage means stores the clauses of laws and regulations as morphemes, and is the latest related to the country or local government that establishes the laws or regulations. Legal rules and regulations text storage means for storing information on laws and regulations regulations including legal provisions and regulations, and the morphemes that constitute the split texts for the split texts created by the split text creation means Among them, the provisions of the laws and regulations are identified from the names of laws and regulations and the clauses immediately after the names of the regulations and regulations, and the provisions of the regulations and regulations are compared with the means for storing the regulations and regulations. If there is no issue, the law / regulation / examination means for judging that the provisions of the laws / regulations / regulations are incorrect is provided. The provisions issue of the determined law or established rule, provisions issue of the statute or established rule creates a warning message indicating that an error can be and outputs the examination results of the scripts terms.
この構成においては、本来は二以上の形態素から構成される法令や例規の条項号(「第×条」「第○項」「第△号」といった表記)を、一の形態素として形態素記憶手段に記憶させておくことによって、引用した法令や例規の条項号(「第×条第○項第△号」といった表記における数字部分)を誤って入力してしまった場合において、警告メッセージを発することが可能になる。 In this configuration, the provisions of laws and regulations that are originally composed of two or more morphemes (indicated as “No. x Article”, “No. ○”, “No. △”) are stored in the morpheme storage means as one morpheme. By memorizing it, a warning message may be issued if you accidentally input the clause number of the cited law or regulation (the number part in the notation “No. x Article ○ Item No. △”). It becomes possible.
本発明は、本発明にかかる用字用語審査装置とネットワークを介して接続された端末装置から送信された条文を審査する用字用語審査システムとして構成することもできる。 The present invention can also be configured as a terminology examination system that examines a text transmitted from a terminal device connected to a terminology examination device according to the present invention via a network.
つまり、本発明にかかる用字用語審査システムは、法令又は例規について作成された条文の用字用語審査を行う用字用語審査装置と、前記用字用語審査装置とネットワークを介して接続された前記法令又は例規を制定する国又は地方自治体に設置された端末装置とからなる用字用語審査システムであって、前記端末装置は、法令又は例規について作成された条文を記述した条文データを送信する条文送信手段と、前記用字用語審査装置による審査結果を受信する審査結果受信手段と、を備えていて、前記用字用語審査装置は、法令又は例規の条文に用いられる形態素を記憶する形態素解析辞書記憶手段と、前記形態素解析辞書記憶手段に記憶された形態素の少なくとも一部について、誤り表記とすべき用字用語に対応する形態素を記憶する用字用語辞書記憶手段と、前記端末装置から送信された前記条文データを受信する条文受信手段と、前記条文受信手段が受信した条文データを前記形態素解析辞書記憶手段と対照させて、最長一致となる形態素を順に選択し、前記条文データを形態素に分解した分ち書き文を作成する分ち書き文作成手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素を前記用字用語辞書記憶手段と対照させて、誤り表記と一致する形態素を特定する誤り表記特定手段と、前記誤り表記特定手段が特定した形態素について所定の警告メッセージを作成し、用字用語の審査結果として前記端末装置に送信する審査結果送信手段と、を備えていて、前記形態素記憶手段には、前記法令又は例規を制定する国又は地方自治体に関連する法令の法令名又は例規の例規名が、品詞分解可能な語であっても一の形態素として記憶されていて、前記分ち書き文作成手段は、前記法令名又は例規の例規名を一の形態素とした分ち書き文を作成することを特徴とする用字用語審査システムである。 That is, the script term examination system according to the present invention includes a script term examination device that examines a script term for a clause prepared for a law or a rule, and the script term examination device connected via the network. A script terminology examination system comprising terminal devices installed in a country or local government that establishes laws or regulations, wherein the terminal devices transmit clause data describing the clauses created for the laws or regulations. A morpheme analysis dictionary for storing a morpheme used for a law or a rule of law, comprising: a transmitting unit; and a review result receiving unit for receiving a review result by the script term review device. For storing at least a part of the morpheme stored in the storage unit and the morpheme analysis dictionary storage unit, and storing a morpheme corresponding to a script term to be used as an error notation A term dictionary storage unit, a clause reception unit that receives the clause data transmitted from the terminal device, and a morpheme that is the longest match by comparing the clause data received by the clause reception unit with the morpheme analysis dictionary storage unit Are selected in order, and a segmented sentence creating means for creating a segmented sentence that decomposes the clause data into morphemes, and the segmented sentence created by the segmented sentence creating means, Contrast the morpheme to be configured with the script term dictionary storage means, create an error notation specifying means for specifying a morpheme that matches the error notation, and create a predetermined warning message for the morpheme specified by the error notation specifying means, Examination result transmission means for transmitting to the terminal device as examination results of character terms, and the morpheme storage means includes a country or local government that establishes the laws or regulations. The name of the law related to the body or the name of the example rule is stored as a morpheme even if it is a word that can be decomposed as part of speech, and the sentence creation means is the name of the law or example rule This is a script term examination system characterized by creating a segmented sentence with a single morpheme.
また、本発明にかかる用字用語審査システムは、前記用字用語審査装置は、国の法令に関する最新の法令名が記憶された第1の記憶装置、地方自治体の例規に関する最新の例規名が記憶された第2の記憶装置の少なくとも一つの記憶装置に所定のタイミングでアクセスして、前記形態素解析辞書記憶手段に形態素として記憶された法令名又は例規名の差分更新を行う法令例規名更新手段を備えることを特徴とすることもできる。 In the script terminology examination system according to the present invention, the script terminology examination device stores a first storage device in which a latest law name related to a national law is stored, and a latest example name related to a local government example. A legal example rule name updating unit that accesses at least one storage device of the second storage device that has been registered at a predetermined timing and performs a differential update of a legal name or a rule name stored as a morpheme in the morpheme analysis dictionary storage unit; It can also be characterized by providing.
さらに、本発明にかかる用字用語審査システムは、前記用字用語審査装置は、前記法令又は例規を制定する国又は地方自治体に関連する最新の法令名及び例規名を含む法令例規に関する情報を記憶する法令例規情報記憶手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名を前記法令例規情報記憶手段と対照させて、一致する法令名又は例規名が存在しない法令名又は例規名を特定する誤り法令例規名特定手段と、を備えていて、前記審査結果送信手段は、前記誤り法令例規名特定手段が特定した法令名又は例規名が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として送信することを特徴とすることもできる。 Furthermore, in the script terminology examination system according to the present invention, the script term examination device stores information relating to the laws and regulations including the latest law names and rule names related to the country or local government that establishes the laws or regulations. The statutory example information storage means and the divided sentence created by the divided sentence creation means match the statute name or example name constituting the divided sentence with the statutory example information storage means. A law name or example name specifying means for specifying a law name or example name for which there is no law name or example name to be specified, and the examination result transmitting means is a law name or a law name specified by the error law example name specifying means or A warning message indicating that the example name is incorrect may be created and transmitted as the examination result of the script term.
さらに、本発明にかかる用字用語審査システムは、前記用字用語審査装置は、前記法令又は例規を制定する国又は地方自治体に関連する最新の法令の法令番号及び例規の例規番号を含む法令例規に関する情報を記憶する法令例規番号記憶手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名の直後の形態素が「(」+「元号」である場合に、「)」までの間の全ての形態素を一の法令番号又は例規番号と特定し、前記法令例規番号記憶手段と対照させて、前記法令名又は例規名に対応する法令番号又は例規番号と一致しない場合には、特定した法令番号又は例規番号を誤りと判定する法令例規番号審査手段と、を備えていて、前記審査結果送信手段は、前記法令例規番号審査手段が誤りと判定し法令名又は例規名について、前記法令番号又は例規番号誤りであることを示す警告メッセージを作成し、用字用語の審査結果として送信することを特徴とすることもできる。 Furthermore, the script terminology examination system according to the present invention is characterized in that the script term examination device includes a regulation number and a regulation example number of the latest regulation related to the national or local government enacting the regulation or regulation. Legal code number storage means for storing information related to and the divided text created by the segmented text creating means, the morpheme immediately after the name of the law or the rule name constituting the segmented text is “(” + When it is “Generic name”, all morphemes up to “)” are identified as one law number or rule number, and the law name or rule name is matched with the law rule number storage means. If the specified legal number or example number does not match, the specified legal number or example number is judged as an error. Is wrong For the determined law name or established rule name, create an alert message indicating that the a law number or established rule number error may also be characterized to transmit the examination result of the scripts terms.
さらに、本発明にかかる用字用語審査システムは、前記用字用語審査装置は、前記形態素記憶手段に、法令又は例規の条項号が形態素として記憶されていて、前記法令又は例規を制定する国又は地方自治体に関連する最新の法令の条文及び例規の条文を含む法令例規の条文に関する情報を記憶する法令例規条文記憶手段と、前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素のうち、法令名又は例規名と、前記法令名又は例規名の直後にある条項号から法令又は例規の条項号を特定し、前記法令例規条文記憶手段と対照させて、前記法令又は例規の条項号が存在しない場合には、前記法令又は例規の条項号を誤りと判定する法令例規条項号審査手段と、を備えていて、前記審査結果送信手段は、前記法令例規条項号審査手段が誤りと判定した法令又は例規の条項号について、前記法令又は例規の条項号が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として送信することを特徴とすることもできる。 Furthermore, in the script terminology examination system according to the present invention, the script term examination device has a morpheme storage unit that stores a stipulation of a law or regulation as a morpheme, and a country or law that establishes the law or regulation. Legal regulations provisions storage means for storing information on the latest legal provisions related to local governments and provisions of legal regulations, including provisions of regulations, and the divisional sentences prepared by the divisional sentence preparation means Among the morphemes that make up the text, specify the law or example clause name from the name of the law or example and the clause number immediately after the name of the law or example and contrast it with the means for storing the legal example rule text. And a law / regulation / examination means for judging that the law / regulation or provision clause is wrong, and the examination result transmitting means Creates a warning message indicating that the law or regulation clause is incorrect, and sends it as the result of examination of the script terms for the law or regulation clause that the law determines It can also be.
本発明は、本発明にかかる用字用語審査装置、及び用字用語審査システムによって実行される用字用語の審査方法として特定することもできる。 The present invention can also be specified as a screening method of script terms that is executed by the script term screening device and the script term screening system according to the present invention.
本発明によって、法令又は例規について作成された条文の用字用語審査において、法令名や例規名の一部を誤って誤り表記と判定してしまうなどの他の法令や例規を引用することによって生じる課題に対応することが可能になる。 This is caused by quoting other laws and regulations, such as misjudging part of the names of laws and regulations, in the examination of script terminology of articles prepared for laws and regulations according to the present invention. It becomes possible to respond to the problem.
上記の課題に対応することによって、法令や例規の条文作成作業の自動化が促進され、国や地方自治体における法令や例規の制定、改廃にかかる作業負担が軽減されることが期待できる。 By addressing the above issues, it is expected that automation of the creation of laws and regulations will be promoted, and the burden of establishing and revising laws and regulations in the national and local governments can be expected to be reduced.
本発明を実施するための最良の形態について、図面を用いて以下に詳細に説明する。尚、以下の説明では、本発明を市が制定する例規の条文作成に適用する例について説明するが、本発明は町村やその上位団体である都道府県の例規、さらには国の法令にも適用することが可能であり、本発明は以下の実施形態に限定されるものではない。 The best mode for carrying out the present invention will be described below in detail with reference to the drawings. In the following explanation, an example will be described in which the present invention is applied to the creation of the rules of regulations established by the city, but the present invention is also applicable to the regulations of municipalities and their prefectural governments, as well as national laws. The present invention is not limited to the following embodiments.
図1は、本発明にかかる用字用語審査システムの概要を示す図である。図2は、本発明にかかる用字用語審査システムの構成を示すブロック図である。図3は、本発明にかかる用字用語審査システムにおいて用いられる、形態素解析辞書の構造を示す図である。図4〜図6は、本発明にかかる用字用語審査システムにおいて用いられる、形態素解析辞書の、それぞれ第1〜第3の例を示す図である。図7は、本発明にかかる用字用語審査システムにおいて用いられる、用字用語辞書の例を示す図である。図8は、本発明にかかる用字用語審査システムにおいて用いられる、用字用語辞書の出典部の例を示す図である。図9は、本発明にかかる用字用語審査システムによって形態素解析が行われる前の条文の一例を示す図である。図10は、本発明にかかる用字用語審査システムによって形態素解析が行われた後の分ち書き文の一例を示す図である。図11は、本発明にかかる用字用語審査システムによって形態素解析が行われた分ち書き文のデータ構造の一例を示す図である。図12は、本発明にかかる用字用語審査システムによって分ち書き文が作成されるフローを示すフローチャートである。図13は、本発明にかかる用字用語審査システムによって分ち書き文の用字用語を審査するフローを示すフローチャートである。 FIG. 1 is a diagram showing an overview of a script term examination system according to the present invention. FIG. 2 is a block diagram showing the configuration of the script term examination system according to the present invention. FIG. 3 is a diagram showing the structure of the morphological analysis dictionary used in the script terminology examination system according to the present invention. 4 to 6 are diagrams showing first to third examples of the morphological analysis dictionary used in the script terminology examination system according to the present invention, respectively. FIG. 7 is a diagram showing an example of a script term dictionary used in the script term examination system according to the present invention. FIG. 8 is a diagram showing an example of the source part of the script term dictionary used in the script term examination system according to the present invention. FIG. 9 is a diagram showing an example of the text before the morphological analysis is performed by the script term examination system according to the present invention. FIG. 10 is a diagram showing an example of a segmented sentence after morphological analysis is performed by the script terminology examination system according to the present invention. FIG. 11 is a diagram showing an example of a data structure of a segmented sentence that has been subjected to morphological analysis by the script terminology examination system according to the present invention. FIG. 12 is a flowchart showing a flow in which a sentence is created by the script terminology examination system according to the present invention. FIG. 13 is a flowchart showing a flow for examining script terminology in a divided text by the script term reviewing system according to the present invention.
図1を用いて、本発明にかかる用字用語審査システムの構成の概要について説明する。図1の例では、本発明にかかる用字用語審査システムが市の例規の作成に用いられるものとする。ユーザ端末は例規を作成する市の施設に設置され、例規を立案し、作成した条文を審査する際には、ユーザ端末から例規立案・審査支援システムにインターネット経由でアクセスする。本発明にかかる用字用語審査システムは、ユーザ端末と、例規立案・審査支援システムの一部の機能から構成されている。 The outline of the configuration of the script terminology examination system according to the present invention will be described with reference to FIG. In the example of FIG. 1, the script term examination system according to the present invention is used to create a city rule. The user terminal is installed at a facility in the city where a rule is created. When the rule is drafted and the created clause is examined, the user terminal accesses the rule draft / examination support system via the Internet. The script terminology examination system according to the present invention is composed of a user terminal and a part of functions of an example rule drafting / examination support system.
尚、例規立案・審査支援システムはユーザ端末からインターネット経由で利用される実施形態に限られるものではなく、例規立案・審査支援システムの一部を構成する入力装置を操作して利用する用字用語審査装置として構成されるものであってもよい。 Note that the example rule drafting / examination support system is not limited to the embodiment that is used from the user terminal via the Internet, but the terminology used by operating the input device that forms part of the rule drafting / examination support system. It may be configured as a screening device.
例えば、ある例規の改正文を作成したい場合に、ユーザは市の例規が記憶された例規データベースから対象となる例規の条文を、例規立案・審査支援システムからインターネット等のネットワーク経由でユーザ端末に読み出して、読み出した条文に追加、修正を行うことによって改正する条文を作成する。作成した条文を、用字用語に誤りがないかの審査を行うために、例規立案・審査支援システムにインターネット等のネットワーク経由で送信する。 For example, when a user wants to create an amendment to a specific rule, the user reads the target rule from the rule database where the city rule is stored, to the user terminal from the rule drafting / examination support system via a network such as the Internet. The revised article is created by adding or modifying the read article. The prepared text is sent to the rule-making / examination support system via a network such as the Internet in order to examine the script terms for errors.
例規立案・審査支援システムでユーザが作成した例規の条文を受信すると、形態素解析辞書データベースと対照させて、条文を形態素に分解した分ち書き文を作成する。その後に、作成した分ち書き文を構成する各々の単語について、用字用語辞書データベースと対照させて、誤り表記に該当するものについて警告メッセージを作成し、警告メッセージを含む審査結果がインターネット等のネットワーク経由でユーザ端末に送信される。ここで、法令名や例規名を品詞分解可能な語であっても一の形態素として形態素解析辞書に登録しておくことによって、これらがさらに形態素に分解され、その一部が誤り表記と判定されてしまうことを回避することが可能となっている。 When the rule of the rule created by the user is received by the rule drafting / examination support system, a split sentence is created by dividing the rule into morphemes in contrast to the morphological analysis dictionary database. After that, for each word that composes the created split text, a warning message is created for the word that corresponds to the error notation against the script term dictionary database, and the review result including the warning message is Sent to the user terminal via the network. Here, even if a law name or example name is a word that can be decomposed into parts of speech, by registering it in the morphological analysis dictionary as one morpheme, these are further decomposed into morphemes, and some of them are determined to be error notations. It is possible to avoid that.
形態素解析辞書データベースに登録される法令名と例規名については、最新の法令名や例規名が反映されるように、国の最新の法令が記憶された法令データベース、市の最新の例規が記憶された例規データベース、その市の属する県の最新の例規が記憶された県の住民公開用Webサーバに定期的にアクセスして、形態素解析辞書データベースに登録されている法令名や例規名との差分が自動更新される。 As for the names of laws and regulations registered in the morphological analysis dictionary database, the law database that stores the latest laws of the country and the latest regulations of the city are stored so that the latest laws and regulations names are reflected. Regular access to the prefecture's public database server where the latest regulations of the prefecture to which the city belongs is stored, and the difference between the law name and the regulations name registered in the morphological analysis dictionary database Automatically updated.
図2は、本発明にかかる用字用語審査システムを含んだ、例規立案・審査支援システムと市に設置されたユーザ端末、県の住民公開用Webサーバの構成を示すブロック図である。例規立案・審査システム10は、例規の立案や審査に必要な機能を備えたネットワークに接続可能なコンピュータであって、CPU、メインメモリ、HDDを少なくとも備えて構成されている。例規立案・審査システム10の例規立案部11、例規審査部12、辞書更新部13、情報入力部14は、いずれも機能的に特定されるものであって、これらの機能を実行するためには、各々に対応するアプリケーションプログラムが例規立案・審査システム10のHDDからメインメモリに読み出され、CPUで演算処理が行われる。法令データベース15、例規データベース16、形態素解析辞書データベース17、用字用語辞書データベース18には、それぞれHDDやメインメモリの所定の記憶領域が割り当てられる。入出力装置19には、データの入出力に必要なキーボード、マウス、ディスプレイ等が対応する。 FIG. 2 is a block diagram showing a configuration of an example rule drafting / examination support system, a user terminal installed in a city, and a prefecture public information Web server including a script term examination system according to the present invention. The example rule drafting / examination system 10 is a computer connectable to a network having functions necessary for rule drafting and examination, and includes at least a CPU, a main memory, and an HDD. The example rule drafting unit 11, the rule rule examining unit 12, the dictionary updating unit 13, and the information input unit 14 of the example rule drafting / examination system 10 are all functionally specified, and in order to execute these functions The application program corresponding to each is read from the HDD of the example drafting / examination system 10 to the main memory, and arithmetic processing is performed by the CPU. Predetermined storage areas of the HDD and the main memory are allocated to the law database 15, the example database 16, the morphological analysis dictionary database 17, and the script term dictionary database 18, respectively. The input / output device 19 corresponds to a keyboard, a mouse, a display, and the like necessary for data input / output.
ユーザ端末20には、インターネット等のネットワークに接続することが可能なパーソナルコンピュータ等が用いられる。住民公開用Webサーバ30には、インターネット上でホームページを公開するのに必要な機能を備えたコンピュータが用いられる。 As the user terminal 20, a personal computer or the like that can be connected to a network such as the Internet is used. A computer having a function necessary for publishing a home page on the Internet is used for the public web server 30 for public release.
ある市において例規の制定や改廃を担当する担当者が、新たに制定する例規の条文や既存の例規の改正にかかる条文を作成したい場合には、市の施設に設置されたユーザ端末20を操作して、インターネット等のネットワーク経由で例規立案・審査支援システム10にアクセスする。例規データベース16には、該市において制定されている例規名やその条文に関するデータが記憶されていて、例規立案部11ではユーザ端末20からの命令に従って、新規制定の際には参考となる類似の例規の条文を、改正の際には対象となる例規の条文を例規データベース16から読み出して、ユーザ端末20に送信する。 When a person in charge of establishment, revision or abolition of a rule in a city wants to create a rule for a new rule or a revision for an existing rule, operate the user terminal 20 installed in the city facility Then, the rule-making / examination support system 10 is accessed via a network such as the Internet. The rule database 16 stores data relating to the rule names and the clauses established in the city, and the rule-making section 11 follows similar instructions from the user terminal 20 to provide similar information that can be used as a reference when establishing a new rule. When the rules of the regulations are revised, the rules of the regulations to be used are read from the rules database 16 and transmitted to the user terminal 20.
尚、上記の操作については、インターネット等のネットワーク経由でユーザ端末20を用いることなく、例規立案・審査支援システム10を操作するための入出力装置19を用いることとしてもよい。入出力装置19を用いる実施形態においては、以下に説明するユーザ端末20を用いた操作についても同様に入出力装置19により実行され、ユーザ端末20から受信するデータについては、入出力装置19において入力されたデータが受け付けられ、ユーザ端末に送信するデータについては、入出力装置19に出力されることとなる。 In addition, about said operation, it is good also as using the input / output device 19 for operating the example rule-making / examination support system 10 without using the user terminal 20 via networks, such as the internet. In the embodiment using the input / output device 19, operations using the user terminal 20 described below are similarly executed by the input / output device 19, and data received from the user terminal 20 is input by the input / output device 19. The received data is received and the data to be transmitted to the user terminal is output to the input / output device 19.
ユーザ端末20には、条文の作成専用のエディタが備えられていて、担当者は例規データベース16から読み出した条文を用いて、新規制定の条文又は改正後の条文を作成する。作成した条文を記述したデータは、用字用語等に誤りがないかの審査のために、例規立案・審査支援システム10に送信される。 The user terminal 20 is provided with an editor dedicated to creating a text, and the person in charge creates a newly established text or a revised text using the text read from the rule database 16. The data describing the created article is transmitted to the example rule making / examination support system 10 for examination of whether there is an error in the script terminology or the like.
例規立案・審査支援システム10では、ユーザ端末20から条文を記述したデータを受信すると、例規審査部12が起動されて、受信した条文を記述したデータの用字用語等の誤りをチェックする審査が行われる。例規審査部12での審査においては、法令データベース15、例規データベース16、形態素解析辞書データベース17、用字用語辞書データベース18が用いられる。 In the example drafting / examination support system 10, when the data describing the clause is received from the user terminal 20, the rule examination unit 12 is activated to perform an examination to check for errors such as script terms in the data describing the received clause. Done. In the screening by the rule screening unit 12, a law database 15, a rule database 16, a morphological analysis dictionary database 17, and a script term dictionary database 18 are used.
法令データベース15には、国の法令を対象に、法令名、条文、法令番号など各々の法令に関する情報が記憶されている。これらの情報については、入出力装置19から新たな情報の入力を受け付けて、情報入力部14の機能によって最新の情報への更新が行われている。 The law database 15 stores information on laws and regulations such as law names, texts, and law numbers for national laws and regulations. These pieces of information are updated to the latest information by the function of the information input unit 14 after receiving input of new information from the input / output device 19.
例規データベース16も同様に、例規立案・審査支援システム10を利用する市の例規を対象に、例規名、条文、例規番号など各々の例規に関する情報が記憶されている。これらの情報については、入出力装置19から新たな情報の入力を受け付けて、情報入力部14の機能によって最新の情報への更新が行われている。 Similarly, the rule database 16 stores information on each rule, such as rule names, texts, and rule numbers, for the city rules that use the rule-making / examination support system 10. These pieces of information are updated to the latest information by the function of the information input unit 14 after receiving input of new information from the input / output device 19.
形態素解析辞書データベース17には、審査対象となる条文を形態素に分解する際の基準となる形態素に関する情報が記憶されている。図3は、形態素解析辞書データベース17の構造を示したものである。形態素解析辞書データベース17には、条文の審査の際に誤り表記のチェックの単位となる形態素が登録されているが、登録される形態素には、一般辞書として登録された単語、国の法令の法令名、例規立案・審査支援システム10を利用する地方自治体(この例では○○市)の例規の例規名、該地方自治体の上位団体である地方自治体(この例では△△県)の例規の例規名が含まれている。 The morpheme analysis dictionary database 17 stores information relating to morphemes that serve as a reference when the text to be examined is decomposed into morphemes. FIG. 3 shows the structure of the morphological analysis dictionary database 17. The morpheme analysis dictionary database 17 stores morphemes that serve as units for checking error notation at the time of text review. The registered morphemes include words registered as general dictionaries, national laws and regulations. Name, example rules of local governments (in this example, XX city) that use the drafting / examination support system 10, and example rules of local governments (in this example, △△ prefecture) that are higher-level organizations of the local governments The name is included.
一般辞書には、一般に用いられる名詞、動詞などの単語について、入出力装置19からの入力を情報入力部14で受け付けて、形態素解析辞書データベース17に登録される。ここに登録される単語は、送り仮名がどのように付されても形態素として識別できるように、図4の例に示したように、異なる送り仮名のパターンが存在する場合には全てのパターンの登録が行われる。また、後に説明する誤り表記の基準の相違に対応することができるようにするために、名詞や動詞などの品詞の種類も指定される。 In the general dictionary, input from the input / output device 19 is received by the information input unit 14 and registered in the morphological analysis dictionary database 17 for commonly used words such as nouns and verbs. As shown in the example of FIG. 4, the words registered here can be identified as morphemes regardless of how the sending kana is added. Registration is performed. In addition, the type of part of speech such as a noun or a verb is also designated in order to be able to cope with a difference in error notation criteria described later.
また、動詞については様々な活用形で条文に記述される可能性があるものであるため、一の動詞が登録されると、これを展開させた単語が実行用辞書として登録される。図5は「行う」が展開されて実行用辞書に登録された一例であるが、五段活用した形態や、送り仮名において用いる仮名を戦前の国法条文でも用字用語審査が可能となるように平仮名、カタカナの両方の対応した形態に展開され、いずれの形態で記述された場合にも形態素として識別されるようになっている。尚、このような仮名を変更した形態での登録は、名詞等の他の品詞についても適用することとしてもよい。 Further, since a verb may be described in a clause in various usage forms, when one verb is registered, a word obtained by expanding the verb is registered as an execution dictionary. FIG. 5 is an example in which “done” is expanded and registered in the execution dictionary, so that it is possible to examine script terms even in pre-war national law clauses using forms that have been used in five steps or kana used in sending kana. It is expanded into forms corresponding to both hiragana and katakana, and is described as a morpheme when written in either form. Note that registration in a form in which the kana is changed may be applied to other parts of speech such as nouns.
この他に、形態素解析辞書データベース17には、国の法令の法令名、例規立案・審査支援システム10を利用する地方自治体(○○市)の例規の例規名、該地方自治体の上位団体である地方自治体(△△県)の例規の例規名が登録されている。これらの法令名や例規名については一の形態素として識別しないと、条文審査の際に法令名や例規名が形態素に分解されて、その一部が誤り表記と判定される可能性があるためである。 In addition, the morphological analysis dictionary database 17 includes the names of laws and regulations of the country, the example names of local governments (XX city) that use the example drafting / examination support system 10, and the superordinate organizations of the local governments. The names of rules for local governments (△△ prefectures) are registered. If these law names and example names are not identified as a morpheme, the law names and example names may be decomposed into morphemes during the text review, and some of them may be judged as error notations. is there.
図6は、形態素解析辞書データベース17に登録されている法令名と例規名の一例であるが、このように法令名と例規名を形態素として登録することによって、形態素に分解する際に法令名や例規名は一の形態素として識別され、その一部を構成する単語が誤り表記であると判定されてしまうことを回避することができる。また、あわせて自治体コードを記録しておくことによって、後に説明する法令名や例規名等のチェックのために法令データベース15や例規データベース16を参照する際に、自治体コードをキーに検索することによって、対象となるデータの記憶領域を速やかに特定することが可能になる。 FIG. 6 is an example of the names of laws and regulations registered in the morpheme analysis dictionary database 17. By registering the names of laws and regulations as morphemes in this way, An example name is identified as one morpheme, and it can be avoided that a word constituting a part thereof is determined to be an error notation. In addition, by recording the local government code, when referring to the law database 15 or the rule database 16 for checking the law name or rule name, which will be described later, by searching using the municipal code as a key. It becomes possible to quickly specify the storage area of the target data.
尚、形態素解析辞書データベース17に登録されている法令名と例規名は最新の状態に更新されていることが好ましい。そのため、辞書更新部13が定期的に起動され、国の最新の法令名が記憶された法令データベース15、例規立案・審査支援システム10を利用する地方自治体(○○市)の例規の例規名が記憶された例規データベース16、該地方自治体の上位団体である地方自治体(△△県)の例規の例規名が随時更新されている住民公開用Webサーバ30にアクセスし、形態素解析辞書データベース17に登録されている法令名と例規名との差分更新を行うことによって、形態素解析辞書データベース17に登録されている法令名と例規名を最新の状態に維持することが可能になる。 In addition, it is preferable that the law name and the example name registered in the morphological analysis dictionary database 17 are updated to the latest state. For this reason, the dictionary update unit 13 is periodically activated, and the legal name database 15 in which the latest legal name of the country is stored, and the example name of the local government (XX city) that uses the example rule drafting / examination support system 10 are The stored example database 16 is accessed to the public publishing Web server 30 in which the example name of the example of the local government (△△ prefecture) that is the higher-level organization of the local government is updated and registered in the morphological analysis dictionary database 17 By updating the difference between the name of the law and the name of the example that has been registered, the name of the law and the name of the example that are registered in the morphological analysis dictionary database 17 can be maintained in the latest state.
一般的に用字用語審査は、国法においては、その基準として内閣法制局で決定した「法令における漢字使用等について(昭和56年10月1日決定)」等をよりどころとしているが、地方自治体でもこれらを標準的な基準とするほか、自らも用字用語の基準を定めているところもあり、その基準に従った審査が必要である。用字用語辞書データベース18には、誤りが生じやすい表記が、正しい例と関連付けて登録されている。図7の例に示した用字用語辞書データベース18には、「受入れ額」、「慰藉料」、「侵蝕」などの修正すべき表記が登録され、それぞれ「受入額」、「慰謝料」、「侵食」という正しい表記が関連付けて記憶されている。また、各々の誤り表記には出典コードが付されているが、図8の例のように、出典コード毎に誤りの根拠となる告示等の文献が用字用語辞書データベース18に記憶されている。この他に、用字用語辞書に常用漢字辞書を備えておいて、常用漢字に該当しない漢字を判別できるように構成してもよい。 In general, the examination of script terminology is based on national laws, such as “Use of Kanji in laws and regulations (decided on October 1, 1981)” determined by the Cabinet Law Bureau. However, in addition to using these as standard standards, there are places where they themselves set standards for script terms, and examinations according to those standards are necessary. In the script term dictionary database 18, notation that is likely to cause an error is registered in association with a correct example. In the script term dictionary database 18 shown in the example of FIG. 7, notations to be corrected such as “acceptance amount”, “consolation fee”, “erosion” are registered, and “acceptance amount”, “consolation fee”, The correct notation “erosion” is stored in association. Each error notation is provided with a source code, but as shown in the example of FIG. 8, documents such as notifications that are grounds for errors are stored in the script term dictionary database 18 for each source code. . In addition, the script term dictionary may be provided with a common kanji dictionary so that kanji that do not correspond to the regular kanji can be discriminated.
例規立案・審査支援システム10の例規審査部12における例規の条文の審査は、次のように行われる。まず、条文に記述された文章の先頭の単語から順に形態素解析辞書データベース17と対照させて、形態素解析辞書データベース17に登録された形態素の中から一致するものを順に特定していく。複数の形態素が一致する場合には、その中から最長一致となる一の形態素を選択する。「(」などの記号や、句読点についても、一の形態素として特定される。このように条文の形態素解析を行って、条文を形態素に分解した分ち書き文が作成される。 Examination of the provisions of the regulations in the regulations screening section 12 of the regulations planning / examination support system 10 is performed as follows. First, the morphemes registered in the morpheme analysis dictionary database 17 are identified in order from the morpheme analysis dictionary database 17 in order from the first word of the sentence described in the text. If a plurality of morphemes match, the longest match morpheme is selected from among them. Symbols such as “(” and punctuation marks are also specified as one morpheme, and the morphological analysis of the clause is performed in this way, so that a divided sentence is generated by dividing the clause into morphemes.
ここで、形態素解析辞書データベース17には、法令名や例規名が一の形態素として登録されているので、例えば「行政手続法」という語であれば、単語単位に分解すると「行政/手続/法」となるところが、法令名と一致するために一の形態素として特定される。さらに、「行政手続法施行規則」という語であれば、「行政手続法」より長い「行政手続法施行規則」が法令名として形態素解析辞書データベース17に登録されていると、「行政手続法」で区切られることなくこれが最長一致となり、「行政手続法施行規則」が一の形態素として特定される。 Here, in the morpheme analysis dictionary database 17, the law name and the rule name are registered as one morpheme. For example, if the word “administrative procedure law” is decomposed into words, “administration / procedure / law” "Is identified as one morpheme in order to match the law name. Furthermore, if the term “administrative procedure law enforcement rule” is used, if an “administrative procedure law enforcement rule” longer than the “administrative procedure law” is registered in the morphological analysis dictionary database 17 as a law name, This is the longest match without being separated by, and the “Regulation for Enforcement of Administrative Procedure Law” is specified as one morpheme.
例えば、図9に示した例規の条文を形態素解析によって分解すると、図10のような分ち書き文が作成される。条文は、名詞、動詞、接続詞、助詞等の単語や句読点に分解されることになるが、「行政手続法」「△△県行政手続条例」という法令や例規の名称については、それ以上分解されることなく、一の形態素として特定されている。 For example, when the rule of the example shown in FIG. 9 is decomposed by morphological analysis, a divided sentence as shown in FIG. 10 is created. The text will be broken down into words and punctuation marks such as nouns, verbs, conjunctions, and particles, but the names of laws and regulations such as “Administrative Procedure Act” and “△△ Prefectural Administrative Procedure Ordinance” will be further decomposed. Without being identified as a morpheme.
図11は、形態素解析が行われた分ち書き文のデータ構造の一例を示す図であるが、分解した単語毎に、その単語の品詞、法令名である場合は法令名であることとその法令を制定した国や地方自治体を識別する自治体コードが関連付けて記憶され、これらの情報を分ち書き文の審査に用いることもできる。このような分ち書き文に関するデータは、例規立案・審査支援システム10のメインメモリ等に一時記憶され、分ち書き文の審査に用いられる。 FIG. 11 is a diagram showing an example of the data structure of a segmented sentence that has been subjected to morphological analysis. For each decomposed word, if it is the part of speech of the word, the name of the law, the name of the law and its A local government code for identifying a country or local government that has enacted laws and regulations is stored in association with each other, and this information can also be used for examination of divided text. Data relating to such segmented text is temporarily stored in the main memory or the like of the example rule drafting / examination support system 10 and used for examination of the segmented text.
図12は、ここまでに説明した、形態素解析によって分ち書き文が作成されるフローを示したフローチャートである。審査対象の特定までの手順は特に限定されるものではないが、ここでは条文の一部を改正するケースを想定して、新たな条文が記述された文書ファイルと、そのうちどの部分が改正されているかを示す改正情報をユーザ端末から受信して(S01)、文書ファイルのうち改正されている部分を審査対象の文章として特定することとしている(S02)。 FIG. 12 is a flowchart showing a flow of creating a segmented sentence by morphological analysis described so far. There are no particular restrictions on the procedure for identifying the subject of the review, but here we assume a case where a part of the article is to be revised, and a document file containing the new article and which part of it has been revised. Is received from the user terminal (S01), and the revised part of the document file is specified as the text to be examined (S02).
審査対象となる文章について、形態素解析辞書を参照して(S03)、先頭から順に文字列を切り出し(S04)、最長一致となる形態素を特定する(S05)。このときに、法令名が対象となっている場合には、複数の単語から構成される語であっても、法令名が形態素として登録されているので、法令名全体を一の形態素として特定し、名詞の細分として「法令名」の品詞及びその自治体コード(国、都道府県、市)を設定する(なお、国の自治体コードにも、例えば「00000」のような自治体コードを割り当てる)。形態素が特定されると、さらに次の文字列を対象に、対象となる文章の末尾まで同じ処理を繰り返す(S06)。このようにして文章全体を形態素に分解し、分ち書き文が作成される(S07)。 For the sentence to be examined, the morpheme analysis dictionary is referred to (S03), and character strings are cut out in order from the top (S04), and the morpheme with the longest match is identified (S05). At this time, if the law name is the target, even if it is a word composed of multiple words, the law name is registered as a morpheme, so the whole law name is specified as one morpheme. The part of speech of the “law name” and its local government code (country, prefecture, city) are set as subdivisions of the noun (note that a local government code such as “00000” is also assigned to the local government code). When the morpheme is specified, the same processing is repeated for the next character string until the end of the target sentence (S06). In this way, the entire sentence is decomposed into morphemes, and a divided sentence is created (S07).
続いて、形態素解析が行われた分ち書き文を対象に、メインメモリ等に一時記憶されている形態素について、順に用字用語辞書データベース18と対照させて、誤り表記に該当しないかを確認する。用字用語辞書データベース18には、先に説明したとおり、誤り表記や書き換えを必要とする語(以下、あわせて「誤り表記」とする。)が登録されており、ここに登録された誤り表記のいずれかと一致した場合には、誤り表記であると判定されて警告メッセージが作成され、審査結果の一部としてユーザ端末20に表示される。 Subsequently, with respect to the segmented text that has been subjected to morphological analysis, the morphemes temporarily stored in the main memory or the like are sequentially checked against the script term dictionary database 18 to confirm whether they are not in error. . In the script term dictionary database 18, as described above, words that require error notation and rewriting (hereinafter referred to as “error notation”) are registered, and the error notation registered here is registered. If it matches any of the above, it is determined that it is an error notation and a warning message is created and displayed on the user terminal 20 as part of the examination result.
警告メッセージの内容は特に限定されるものではないが、用字用語辞書データベース18に誤り表記と関連付けて記憶された正しい表記を示す情報を含むものであることが好ましい。警告メッセージには正しい表記部分がブランクとなっている定型のメッセージを記憶させておき、これを読み出して誤り表記に対応する正しい表記を埋め込んだメッセージを警告メッセージとして用いることとすればよい。また、誤り表記と判定された単語に対応する出典情報を用字用語辞書データベース18から読み出して、警告メッセージの一部として記述することとしてもよい。 The content of the warning message is not particularly limited, but preferably includes information indicating the correct notation stored in the script term dictionary database 18 in association with the error notation. A warning message may be stored as a standard message whose correct notation is blank, and a message in which a correct notation corresponding to an error notation is embedded is used as the warning message. In addition, the source information corresponding to the word determined to be error notation may be read from the script term dictionary database 18 and described as a part of the warning message.
ここで、誤り表記かを判定するために、形態素の品詞を特定することが必要になる場合がある。例えば、「取(り)扱」の間に「り」が含まれるか否かについて、名詞と動詞では送り仮名基準が異なる場合があり、このような場合には形態素の品詞を特定しておくことが必要になるため、図11の例に示したように、各々の形態素には形態素解析の際に特定された品詞が関連付けて記憶されている。 Here, it may be necessary to specify the part of speech of the morpheme in order to determine whether it is an error notation. For example, regarding whether or not “ri” is included in “take”, the noun and verb may have different kana criteria, and in such cases, specify the morpheme part of speech. Therefore, as shown in the example of FIG. 11, each morpheme is stored in association with the part of speech specified in the morpheme analysis.
また、法令名については一の形態素として特定されているので、仮に、法令名の中に誤り表記に対応する単語が含まれていたとしても、誤り表記と判定されることはない。例えば、「・・・行なう・・・法律」という法令名について、「行なう」が誤り表記であって正しい表記は「行う」であると用字用語辞書データベース18に登録されていたとしても、この「行なう」は法令名の一部であるため、誤り表記と判定されることはない。 Since the law name is specified as one morpheme, even if the law name includes a word corresponding to the error notation, it is not determined to be an error notation. For example, for a law name “... do ... law”, even if “do” is an error notation and the correct notation is “do”, it is registered in the script term dictionary database 18. Since “perform” is a part of the law name, it is not determined to be an error.
一方で、法令名や例規名と特定された形態素については、法令や例規に関する記述に誤りがないかについて、以下のようなチェックが、用字用語辞書による誤り表記のチェックとは別に行なわれる。 On the other hand, for the morphemes identified as the names of laws and regulations and rules, the following check is performed separately from the error notation check using the script term dictionary for whether there is an error in the description of laws and regulations.
特定された法令名や例規名を、法令データベース15や例規データベース16に記憶されている法令や例規の最新リストと対照させて、法令や例規が有効なものであるかを確認する。法令データベース15や例規データベース16に対応する法令名や例規名が存在しない場合には、その法令や例規の名称が変更されていたり、失効していたりする可能性があると考えられるので、警告メッセージを作成して審査結果の一部としてユーザ端末20に表示させる。 The specified law name or rule name is compared with the latest list of laws and regulations stored in the law database 15 or the rule database 16 to confirm whether the law or rule is valid. If there is no law name or rule name corresponding to the law database 15 or the rule database 16, the name of the law or rule may be changed or expired. Is displayed on the user terminal 20 as a part of the examination result.
また、法令名や例規名の直後の形態素が「(」+「元号」となっている場合、法令名や例規名の後に法令番号(「平成×年法律第×××号」といった番号)や例規番号(「平成×年○○件条例第×××号」といった番号)が記述されていると判断できるので、次に「)」があらわれるまでの間の形態素全体を法令番号又は条例番号を示すものと特定する。その上で、法令名又は例規名をキーに法令データベース15又は例規データベース16を検索して、特定された法令又は例規について法令データベース15又は例規データベース16に記憶された正規の法令番号又は例規番号と一致するかを確認する。法令番号又は例規番号が一致しない場合には、その法令名や例規名、又は法令番号や例規番号が誤りである可能性があると考えられるので、警告メッセージを作成して審査結果の一部としてユーザ端末20に表示させる。 In addition, when the morpheme immediately after the name of the law or example name is “(” + “Generation name”, the law number after the name of the law name or example name (number such as “Heisei x Year Law No. XXX No.”) Because it can be judged that the ordinance number (number such as “Heisei x Year XX Ordinance No. XXX No.”) is described, the entire morpheme until the next “)” is displayed as the legal number or the ordinance number. Is identified. Then, the law database 15 or the rule database 16 is searched using the law name or the rule name as a key, and the specified law or rule number stored in the law database 15 or the rule database 16 for the specified law or rule Check if they match. If the law number or rule number does not match, the law name or rule name, or the law number or rule number may be incorrect. It is displayed on the user terminal 20.
さらに、法令名や例規名の直後の形態素の品詞が「名詞(条)」「名詞(項)」「名詞(号)」等になっている場合、法令名や例規名の後に条項号が記述されていると判断することができる。尚、その前提として、形態素解析辞書データベース17に「第×条」「第×項」「第×号」等を、品詞を「名詞(条)」「名詞(項)」「名詞(号)」と指定し、一の形態素として登録しておく方法や、あるいは例規審査部12の形態素解析のプログラムにおいて条項号と判断するルールを記述しておくなどの方法によって、条項号がそれぞれ一の形態素として分解されるように設定しておくことが必要である。 In addition, if the part of speech of the morpheme immediately after the name of the law or rule name is “Noun (Article)”, “Noun (Section)”, “Noun (No.)”, etc. Can be determined. It is assumed that the morphological analysis dictionary database 17 has “No. x Article”, “No. x Term”, “No. x No.”, etc., and the parts of speech “Noun (Article)” “Noun (Term)” “Noun (No.)”. Each of the clauses as a single morpheme, for example, by registering it as one morpheme, or by writing a rule that determines the clause number in the program for morpheme analysis of the rule review unit 12 It is necessary to set it to be disassembled.
条項号であると判断されると、法令名又は例規名をキーに法令データベース15又は例規データベース16を検索して、特定された法令又は例規について法令データベース15又は例規データベース16に記憶された条文に、該当する条項号が存在しているかを確認する。該当する条項号が存在しない場合には、条項号(「第×条第○項第△号」といった表記における数字部分)を誤って入力してしまった可能性があると考えられるので、警告メッセージを作成して審査結果の一部としてユーザ端末20に表示させる。 If it is determined that it is a clause number, the law database 15 or the law database 16 is searched using the law name or rule name as a key, and the specified law or rule is stored in the law database 15 or the rule database 16 for the specified law. , Check if the relevant clause number exists. If there is no applicable clause number, it is likely that the clause number (the number part in the notation “No. x Article ○ Item No. △”) may have been entered incorrectly, so a warning message Is displayed on the user terminal 20 as a part of the examination result.
条項号であると判断されると、法令名又は例規名をキーに法令データベース15又は例規データベース16を検索して、特定された法令又は例規について法令データベース15又は例規データベース16に記憶された条文に、施行日の範囲において、該当する条項号が存在しているかを確認する。該当する条項号が存在しない場合には、条項号(「第×条第○項第△号」といった表記における数字部分)を誤って入力してしまった可能性があると考えられるので、警告メッセージを作成して審査結果の一部としてユーザ端末20に表示させる。 If it is determined that it is a clause number, the law database 15 or the law database 16 is searched using the law name or rule name as a key, and the specified law or rule is stored in the law database 15 or the rule database 16 for the specified law. In the range of the effective date, check whether the relevant clause number exists. If there is no applicable clause number, it is likely that the clause number (the number part in the notation “No. x Article ○ Item No. △”) may have been entered incorrectly, so a warning message Is displayed on the user terminal 20 as a part of the examination result.
法令名や例規名と特定された形態素については、上記のような記載の誤りの他に、法令の施行期間に関するチェックを加えることとしてもよい。この場合は、例えば、法令データベース15には法令名毎に施行期間を記録した法令名履歴ファイルが設けられ、特定された法令名についての施行期間を参照して、審査対象となる例規名の施行日が該施行期間に含まれるものであるかをチェックする。所定の時期が到来すると適用される法令が切り替わるものも存在しているため、このような法令名履歴を参照することによって、施行日とその根拠法令の施行期間の不一致が生じた場合には、根拠法令名が誤りであると判断して、警告メッセージを作成することができる。 For the morphemes identified as the names of laws and regulations and regulations, in addition to the errors described above, a check regarding the enforcement period of the laws may be added. In this case, for example, the law database 15 is provided with a law name history file that records the enforcement period for each law name, and refers to the enforcement period for the specified law name to enforce the name of the example subject to examination. Check if the day is included in the enforcement period. Since there are cases where applicable laws change when the prescribed time arrives, if there is a discrepancy between the enforcement date and the enforcement period of the underlying law by referring to such law name history, A warning message can be created by determining that the name of the underlying law is incorrect.
また、審査対象の文章の中に句点(。)が含まれる場合、その前にある形態素の品詞に関するルールを特定し(例えば、「・・・こと。」「・・・とき。」等を除く名詞は該当しない等)、このルールを例規審査部12の形態素解析のプログラムに記述しておくことによって、句点の誤りを検出することが可能になる。さらに、文末の「こと」や「とき」にはひらがなが用いられることとされているため、句点の前の「事」や「時」も誤りと検出することができる。 In addition, when a sentence (.) Is included in the text to be examined, a rule related to the part of speech of the morpheme that precedes it is specified (for example, “... that”, “... when”, etc. is excluded). By describing this rule in the morphological analysis program of the regular examination unit 12, it becomes possible to detect a punctuation error. Furthermore, since “Hiragana” is used for “thing” and “time” at the end of the sentence, “thing” and “time” before the punctuation can also be detected as errors.
その他にも、例えば、文章の末尾が「こと」「とき」以外の名詞で終わっていてその後に句点がある場合、文頭に句読点がある場合、「(」の直後に句点がある場合、句読点が連続している場合などのルールを誤りのパターンとして用字用語審査のプログラムに記述しておくことによって、これらの誤りを検出することも可能になる。 In addition, for example, when the sentence ends with a noun other than “ko” and “when” and there is a punctuation mark after that, when there is a punctuation mark at the beginning of the sentence, when there is a punctuation mark immediately after “(”, It is possible to detect these errors by describing the rules for cases such as consecutive cases as error patterns in the script terminology examination program.
図13は、ここまでに説明した、形態素解析によって作成された分ち書き文の用字用語を審査するフローを示したフローチャートである。図12のフローによって作成された分ち書き文を対象に、順に一の形態素を選択する(S08)。選択した形態素について、用字用語辞書を参照して(S09)、誤り表記として登録された語と一致しないか確認し(S10)、一致する場合には、所定の警告メッセージを作成する(S11)。さらに、次の形態素を選択して(S12)、分ち書き文の文末までこの処理を繰り返す。 FIG. 13 is a flowchart showing a flow for examining the script terminology of the divided text created by the morphological analysis described so far. One morpheme is selected in order with respect to the divided text created by the flow of FIG. 12 (S08). For the selected morpheme, referring to the script term dictionary (S09), it is checked whether it matches the word registered as an error notation (S10), and if it matches, a predetermined warning message is created (S11). . Further, the next morpheme is selected (S12), and this process is repeated until the end of the divided text.
続いて、分ち書き文を構成する形態素のうち、品詞が法令名(例規名の場合も同じ)となっている形態素を選択する(S13)。選択した各々の法令名について、法令データベースを参照して(S14)、法令名が存在しているか、法令番号が正しいか等の照合を行い、不一致となるものがある場合には(S15)、所定の警告メッセージを作成する(S16)。尚、法令名等を審査するS13〜S16の工程については、用字用語の誤り表記を審査するS08〜S12の工程において併せて行なうこととしてもよい。 Subsequently, a morpheme whose part-of-speech is a law name (the same applies to the case of the name of a rule) is selected from the morphemes constituting the divided text (S13). For each selected law name, reference is made to the law database (S14) to check whether the law name exists, the law number is correct, etc., and if there is a discrepancy (S15), A predetermined warning message is created (S16). In addition, about the process of S13-S16 which examines a law name etc., it is good also as performing in the process of S08-S12 which examines the error notation of a script term.
以上の工程で作成した警告メッセージを含む審査結果をユーザ端末に送信して(S17)、用字用語審査の処理を終了する。 The examination result including the warning message created in the above steps is transmitted to the user terminal (S17), and the script term examination process is terminated.
10 例規立案・審査支援システム
11 例規立案部
12 例規審査部
13 辞書更新部
14 情報入力部
15 法令データベース
16 例規データベース
17 形態素解析辞書データベース
18 用字用語辞書データベース
19 入出力装置
20 ユーザ端末
30 住民公開用Webサーバ
10 Example Regulation Planning / Examination Support System 11 Example Regulation Planning Unit 12 Example Examination Unit 13 Dictionary Update Unit 14 Information Input Unit 15 Law Database 16 Example Database 17 Morphological Analysis Dictionary Database 18 Script Term Dictionary Database 19 Input / Output Device 20 User Terminal 30 Public Release Web server
Claims (14)
法令又は例規の条文に用いられる形態素を記憶する形態素解析辞書記憶手段と、
前記形態素解析辞書記憶手段に記憶された形態素の少なくとも一部について、誤り表記とすべき用字用語に対応する形態素を記憶する用字用語辞書記憶手段と、
法令又は例規について作成された条文を記述した条文データを受け付ける条文受付手段と、
前記条文受付手段が受け付けた条文データを前記形態素解析辞書記憶手段と対照させて、最長一致となる形態素を順に選択し、前記条文データを形態素に分解した分ち書き文を作成する分ち書き文作成手段と、
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素を前記用字用語辞書記憶手段と対照させて、誤り表記と一致する形態素を特定する誤り表記特定手段と、
前記誤り表記特定手段が特定した形態素について所定の警告メッセージを作成し、用字用語の審査結果として出力する審査結果出力手段と、
を備えていて、
前記形態素記憶手段には、前記法令又は例規を制定する国又は地方自治体に関連する法令の法令名又は例規の例規名が、品詞分解可能な語であっても一の形態素として記憶されていて、
前記分ち書き文作成手段は、前記法令名又は例規の例規名を一の形態素とした分ち書き文を作成すること
を特徴とする用字用語審査装置。 A device for reviewing script terminology of articles prepared for laws and regulations,
A morpheme analysis dictionary storage means for storing a morpheme used in a law or regulation text;
A script term dictionary storage means for storing a morpheme corresponding to a script term to be an error notation for at least a part of the morpheme stored in the morpheme analysis dictionary storage means;
Article accepting means for accepting article data describing the articles prepared for laws or regulations,
The sentence data received by the article reception means is compared with the morpheme analysis dictionary storage means, the morpheme having the longest match is selected in order, and the sentence sentence is generated by dividing the article data into morphemes. Creating means;
An error notation specification that identifies a morpheme that matches an error notation, by comparing a morpheme that constitutes the split sentence with the script term dictionary storage means, for a sentence written by the sentence writing unit Means,
An examination result output means for creating a predetermined warning message for the morpheme identified by the error notation identification means and outputting as a examination result of the script term;
With
In the morpheme storage means, the name of the law or the name of the example of the law related to the country or local government that enacts the law or example is stored as a morpheme even if it is a part of speech decomposable word,
The script terminology examination apparatus, wherein the segmented sentence creating means creates a segmented sentence with the statute name or the rule name of the rule as one morpheme.
を特徴とする請求項1記載の用字用語審査装置。 Access at least one storage device of the first storage device storing the latest law name related to the national law and the second storage device storing the latest rule name related to the local government at a predetermined timing. 2. The script term examination device according to claim 1, further comprising a law example name update unit for performing a differential update of a law name or a rule name stored as a morpheme in the morpheme analysis dictionary storage means.
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名を前記法令例規情報記憶手段と対照させて、一致する法令名又は例規名が存在しない法令名又は例規名を特定する誤り法令例規名特定手段と、
を備えていて、
前記審査結果出力手段は、前記誤り法令例規名特定手段が特定した法令名又は例規名が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として出力すること
を特徴とする請求項1又は2記載の用字用語審査装置。 Legal regulations information storage means for storing information on legal regulations including the latest legal names and regulations related to the country or local government enacting the laws or regulations;
For the segmented text created by the segmented text creating means, the law name or example name constituting the segmented sentence is compared with the law ordinance information storing means, and there is a matching law name or example name. An error law / regulation name identification means for identifying a law name / regulation name
With
The examination result output means creates a warning message indicating that the law name or example name specified by the error law example name specifying means is incorrect, and outputs the warning message as the examination result of the script term. Item 1 or 2 script terminology examination device.
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名の直後の形態素が「(」+「元号」である場合に、「)」までの間の全ての形態素を一の法令番号又は例規番号と特定し、前記法令例規番号記憶手段と対照させて、前記法令名又は例規名に対応する法令番号又は例規番号と一致しない場合には、特定した法令番号又は例規番号を誤りと判定する法令例規番号審査手段と、
を備えていて、
前記審査結果出力手段は、前記法令例規番号審査手段が誤りと判定し法令名又は例規名について、前記法令番号又は例規番号誤りであることを示す警告メッセージを作成し、用字用語の審査結果として出力すること
を特徴とする請求項1乃至3いずれかに記載の用字用語審査装置。 Legal code number storage means for storing information on the legal code including the latest legal code and the legal code number related to the country or local government enacting the law or regulation;
With respect to the segmented text created by the segmented text creating means, when the morpheme immediately after the name of the law or the example name constituting the segmented text is “(” + “era name”, “)”. When all the morphemes up to are identified as one law number or example number and compared with the law example number storage means, if the law name or example number does not match the law name or example number Legal code number examination means for judging the specified legal code number or rule number as an error,
With
The examination result output means prepares a warning message indicating that the law number or rule number is incorrect for the law name or rule name, as determined by the law rule number review means, and as a review result of the script term 4. The script terminology examination apparatus according to claim 1, wherein the terminology examination apparatus outputs the terminology.
前記法令又は例規を制定する国又は地方自治体に関連する最新の法令の条文及び例規の条文を含む法令例規の条文に関する情報を記憶する法令例規条文記憶手段と、
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素のうち、法令名又は例規名と、前記法令名又は例規名の直後にある条項号から法令又は例規の条項号を特定し、前記法令例規条文記憶手段と対照させて、前記法令又は例規の条項号が存在しない場合には、前記法令又は例規の条項号を誤りと判定する法令例規条項号審査手段と、
を備えていて、
前記審査結果出力手段は、前記法令例規条項号審査手段が誤りと判定した法令又は例規の条項号について、前記法令又は例規の条項号が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として出力すること
を特徴とする請求項1乃至4いずれかに記載の用字用語審査装置。 In the morpheme storage means, a legal or example clause is stored as a morpheme,
Legal example regulations text storage means for storing information on the latest legal regulations related to the country or local government that enacts the laws or regulations, and the provisions of legal regulations including the provisions of the regulations;
With respect to the segmented text created by the segmented text creating means, among the morphemes constituting the segmented text, the law name or example name, and the law or the law from the clause number immediately after the law name or example name Identify the provisions of the regulations and compare them with the legal provisions storage means, and if the provisions of the regulations or regulations do not exist, determine the provisions of the regulations and regulations Means,
With
The examination result output means prepares a warning message indicating that the law or regulation clause number is incorrect for the law or regulation clause number determined by the law regulation provision clause examination means as an error. 5. The script terminology examination apparatus according to claim 1, wherein the terminology examination apparatus outputs the result as an examination result.
前記端末装置は、
法令又は例規について作成された条文を記述した条文データを送信する条文送信手段と、
前記用字用語審査装置による審査結果を受信する審査結果受信手段と、
を備えていて、
前記用字用語審査装置は、
法令又は例規の条文に用いられる形態素を記憶する形態素解析辞書記憶手段と、
前記形態素解析辞書記憶手段に記憶された形態素の少なくとも一部について、誤り表記とすべき用字用語に対応する形態素を記憶する用字用語辞書記憶手段と、
前記端末装置から送信された前記条文データを受信する条文受信手段と、
前記条文受信手段が受信した条文データを前記形態素解析辞書記憶手段と対照させて、最長一致となる形態素を順に選択し、前記条文データを形態素に分解した分ち書き文を作成する分ち書き文作成手段と、
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素を前記用字用語辞書記憶手段と対照させて、誤り表記と一致する形態素を特定する誤り表記特定手段と、
前記誤り表記特定手段が特定した形態素について所定の警告メッセージを作成し、用字用語の審査結果として前記端末装置に送信する審査結果送信手段と、
を備えていて、
前記形態素記憶手段には、前記法令又は例規を制定する国又は地方自治体に関連する法令の法令名又は例規の例規名が、品詞分解可能な語であっても一の形態素として記憶されていて、
前記分ち書き文作成手段は、前記法令名又は例規の例規名を一の形態素とした分ち書き文を作成すること
を特徴とする用字用語審査システム。 Installed in a national or local government that establishes the above-mentioned laws or regulations connected to the script terminology examination device connected to the script terminology examination device through a network A terminology examination system consisting of a terminal device,
The terminal device
Article sending means for sending article data describing the article created for laws and regulations,
Examination result receiving means for receiving examination results by the script term examination device;
With
The script terminology examination device
A morpheme analysis dictionary storage means for storing a morpheme used in a law or regulation text;
A script term dictionary storage means for storing a morpheme corresponding to a script term to be an error notation for at least a part of the morpheme stored in the morpheme analysis dictionary storage means;
Article receiving means for receiving the article data transmitted from the terminal device;
Contrasting the text data received by the text receiving means with the morphological analysis dictionary storage means, selecting the longest matching morpheme in order, and creating a text that breaks the text data into morphemes Creating means;
An error notation specification that identifies a morpheme that matches an error notation, by comparing a morpheme that constitutes the split sentence with the script term dictionary storage means, for a sentence written by the sentence writing unit Means,
Creating a predetermined warning message for the morpheme identified by the error notation identifying unit, and transmitting to the terminal device as a review result of script terms;
With
In the morpheme storage means, the name of the law or the name of the example of the law related to the country or local government that enacts the law or example is stored as a morpheme even if it is a part of speech decomposable word,
The script terminology examination system, wherein the segmented sentence creating means creates a segmented sentence with the statute name or the rule name of the rule as one morpheme.
国の法令に関する最新の法令名が記憶された第1の記憶装置、地方自治体の例規に関する最新の例規名が記憶された第2の記憶装置の少なくとも一つの記憶装置に所定のタイミングでアクセスして、前記形態素解析辞書記憶手段に形態素として記憶された法令名又は例規名の差分更新を行う法令例規名更新手段を備えること
を特徴とする請求項6記載の用字用語審査システム。 The script terminology examination device
Access at least one storage device of the first storage device storing the latest law name related to the national law and the second storage device storing the latest rule name related to the local government at a predetermined timing. 7. The script term review system according to claim 6, further comprising a law example name update unit that updates a difference between a law name or a rule name stored as a morpheme in the morpheme analysis dictionary storage means.
前記法令又は例規を制定する国又は地方自治体に関連する最新の法令名及び例規名を含む法令例規に関する情報を記憶する法令例規情報記憶手段と、
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名を前記法令例規情報記憶手段と対照させて、一致する法令名又は例規名が存在しない法令名又は例規名を特定する誤り法令例規名特定手段と、
を備えていて、
前記審査結果送信手段は、前記誤り法令例規名特定手段が特定した法令名又は例規名が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として送信すること
を特徴とする請求項6又は7記載の用字用語審査システム。 The script terminology examination device
Legal regulations information storage means for storing information on legal regulations including the latest legal names and regulations related to the country or local government enacting the laws or regulations;
For the segmented text created by the segmented text creating means, the law name or example name constituting the segmented sentence is compared with the law ordinance information storing means, and there is a matching law name or example name. An error law / regulation name identification means for identifying a law name / regulation name
With
The examination result transmitting means creates a warning message indicating that the law name or example name specified by the erroneous law example name specifying means is incorrect, and transmits the warning message as the examination result of the script term. Item 6 or 7 script terminology examination system.
前記法令又は例規を制定する国又は地方自治体に関連する最新の法令の法令番号及び例規の例規番号を含む法令例規に関する情報を記憶する法令例規番号記憶手段と、
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する法令名又は例規名の直後の形態素が「(」+「元号」である場合に、「)」までの間の全ての形態素を一の法令番号又は例規番号と特定し、前記法令例規番号記憶手段と対照させて、前記法令名又は例規名に対応する法令番号又は例規番号と一致しない場合には、特定した法令番号又は例規番号を誤りと判定する法令例規番号審査手段と、
を備えていて、
前記審査結果送信手段は、前記法令例規番号審査手段が誤りと判定し法令名又は例規名について、前記法令番号又は例規番号誤りであることを示す警告メッセージを作成し、用字用語の審査結果として送信すること
を特徴とする請求項6乃至8いずれかに記載の用字用語審査システム。 The script terminology examination device
Legal code number storage means for storing information on the legal code including the latest legal code and the legal code number related to the country or local government enacting the law or regulation;
With respect to the segmented text created by the segmented text creating means, when the morpheme immediately after the name of the law or the example name constituting the segmented text is “(” + “era name”, “)”. When all the morphemes up to are identified as one law number or example number and compared with the law example number storage means, if the law name or example number does not match the law name or example number Legal code number examination means for judging the specified legal code number or rule number as an error,
With
The examination result transmitting means creates a warning message indicating that the law or rule number is incorrect for the law name or rule name, as determined by the law or regulation number review means, The script term examination system according to any one of claims 6 to 8, wherein the system is transmitted.
前記形態素記憶手段に、法令又は例規の条項号が形態素として記憶されていて、
前記法令又は例規を制定する国又は地方自治体に関連する最新の法令の条文及び例規の条文を含む法令例規の条文に関する情報を記憶する法令例規条文記憶手段と、
前記分ち書き文作成手段が作成した分ち書き文について、前記分ち書き文を構成する形態素のうち、法令名又は例規名と、前記法令名又は例規名の直後にある条項号から法令又は例規の条項号を特定し、前記法令例規条文記憶手段と対照させて、前記法令又は例規の条項号が存在しない場合には、前記法令又は例規の条項号を誤りと判定する法令例規条項号審査手段と、
を備えていて、
前記審査結果送信手段は、前記法令例規条項号審査手段が誤りと判定した法令又は例規の条項号について、前記法令又は例規の条項号が誤りであることを示す警告メッセージを作成し、用字用語の審査結果として送信すること
を特徴とする請求項6乃至9いずれかに記載の用字用語審査システム。 The script terminology examination device
In the morpheme storage means, a legal or example clause is stored as a morpheme,
Legal example regulations text storage means for storing information on the latest legal regulations related to the country or local government that enacts the laws or regulations, and the provisions of legal regulations including the provisions of the regulations;
With respect to the segmented text created by the segmented text creating means, among the morphemes constituting the segmented text, the law name or example name, and the law or the law from the clause number immediately after the law name or example name Identify the provisions of the regulations and compare them with the legal provisions storage means, and if the provisions of the regulations or regulations do not exist, determine the provisions of the regulations and regulations Means,
With
The examination result transmission means prepares a warning message indicating that the law or regulation clause number is incorrect for the law or regulation clause number determined by the law regulation provision clause examination means as an error. 10. The script term examination system according to claim 6, which is transmitted as the examination result.
前記コンピュータには、法令又は例規の条文に用いられる形態素を記憶する形態素解析辞書記憶部と、前記形態素解析辞書記憶部に記憶された形態素の少なくとも一部について、誤り表記とすべき用字用語に対応する形態素を記憶する用字用語辞書記憶部と、が備えられていて、
前記コンピュータが、法令又は例規について作成された条文を記述した条文データを受け付ける条文受付ステップと、
前記コンピュータが、前記条文受付ステップで受け付けた条文データを前記形態素解析辞書記憶部と対照させて、最長一致となる形態素を順に選択し、前記条文データを形態素に分解した分ち書き文を作成する分ち書き文作成ステップと、
前記コンピュータが、前記分ち書き文作成ステップで作成した分ち書き文について、前記分ち書き文を構成する形態素を前記用字用語辞書記憶部と対照させて、誤り表記と一致する形態素を特定する誤り表記特定ステップと、
前記コンピュータが、前記誤り表記特定ステップで特定した形態素について所定の警告メッセージを作成し、用字用語の審査結果として出力する審査結果出力ステップと、
を有していて、
前記形態素記憶部には、前記法令又は例規を制定する国又は地方自治体に関連する法令の法令名又は例規の例規名が、品詞分解可能な語であっても一の形態素として記憶されており、
前記分ち書き文作成ステップでは、前記法令名又は例規の例規名を一の形態素とした分ち書き文を作成すること
を特徴とする用字用語の審査方法。 A screening method of script terms that is executed by a computer that performs a script term review of articles prepared for laws and regulations,
In the computer, a morpheme analysis dictionary storage unit that stores morphemes used in laws or regulations, and at least part of the morphemes stored in the morpheme analysis dictionary storage unit are used as error terms. A script term dictionary storage unit for storing corresponding morphemes,
A clause accepting step for accepting clause data in which the computer describes a clause created for laws or regulations;
The computer contrasts the text data received in the text receiving step with the morpheme analysis dictionary storage unit, sequentially selects the longest matching morpheme, and creates a segmented text that decomposes the text data into morphemes A step of creating a sentence,
For the segmented text created by the computer in the segmented text creating step, the morpheme constituting the segmented text is compared with the script term dictionary storage unit to identify the morpheme that matches the error notation Error notation identifying step to
The computer creates a predetermined warning message for the morpheme specified in the error notation specifying step, and outputs a review result output step as a script term review result; and
Have
In the morpheme storage unit, the name of a law or example of a law related to a country or local government enacting the law or a rule is stored as a morpheme even if it is a word that can be decomposed as part of speech.
In the segmented sentence creation step, a segmented sentence having a morpheme of the law name or the rule name of the rule is created.
を特徴とする請求項11記載の用字用語の審査方法。 The computer has a predetermined timing in at least one storage device of the first storage device storing the latest law name related to the national law and the second storage device storing the latest rule name related to the local government regulations. 12. The method for examining script terminology according to claim 11, further comprising a step of updating a legal name / rule name that is accessed in order to update a difference between the legal name or the rule name stored as a morpheme in the morpheme analysis dictionary storage unit. .
前記第1のコンピュータには、法令又は例規の条文に用いられる形態素を記憶する形態素解析辞書記憶部と、前記形態素解析辞書記憶部に記憶された形態素の少なくとも一部について、誤り表記とすべき用字用語に対応する形態素を記憶する用字用語辞書記憶部と、が備えられていて、
前記第2のコンピュータが、法令又は例規について作成された条文を記述した条文データを第1のコンピュータに送信する条文送信ステップと、
前記第1のコンピュータが、前記第2のコンピュータから送信された条文データを受信する条文受信ステップと、
前記第1のコンピュータが、前記条文受信ステップで受信した条文データを前記形態素解析辞書記憶部と対照させて、最長一致となる形態素を順に選択し、前記条文データを形態素に分解した分ち書き文を作成する分ち書き文作成ステップと、
前記第1のコンピュータが、前記分ち書き文作成ステップで作成した分ち書き文について、前記分ち書き文を構成する形態素を前記用字用語辞書記憶部と対照させて、誤り表記と一致する形態素を特定する誤り表記特定ステップと、
前記第1のコンピュータが、前記誤り表記特定ステップで特定した形態素について所定の警告メッセージを作成し、用字用語の審査結果として前記第2のコンピュータに送信する審査結果送信ステップと、
前記第2のコンピュータが、前記第1のコンピュータから送信された審査結果を受信する審査結果受信ステップと、
を有していて、
前記形態素記憶部には、前記法令又は例規を制定する国又は地方自治体に関連する法令の法令名又は例規の例規名が、品詞分解可能な語であっても一の形態素として記憶されており、
前記分ち書き文作成ステップでは、前記法令名又は例規の例規名を一の形態素とした分ち書き文を作成すること
を特徴とする用字用語の審査方法。 The first computer installed in the country or local government that enacts the laws and regulations connected to the first computer via the network, and a first computer that examines the terminology of the articles prepared for laws and regulations. A screening method of script terms executed by two computers,
The first computer includes a morpheme analysis dictionary storage unit that stores morphemes used in laws and regulations, and at least a part of the morpheme stored in the morpheme analysis dictionary storage unit should be used as an error notation. A terminology dictionary storage unit for storing morphemes corresponding to letter terms,
A text sending step in which the second computer sends text data describing a text created for laws or regulations to the first computer;
A text receiving step in which the first computer receives text data transmitted from the second computer;
The first computer contrasts the text data received in the text receiving step with the morpheme analysis dictionary storage unit, sequentially selects the longest matching morpheme, and splits the text data into morphemes. A split sentence creation step to create
The first computer matches the error notation of the segmented text created in the segmented text creation step by comparing the morpheme constituting the segmented text with the script term dictionary storage unit. An error notation identifying step for identifying a morpheme;
The first computer creates a predetermined warning message for the morpheme specified in the error notation specifying step, and transmits it to the second computer as a result of the script term review,
An examination result receiving step in which the second computer receives an examination result transmitted from the first computer;
Have
In the morpheme storage unit, the name of a law or example of a law related to a country or local government enacting the law or a rule is stored as a morpheme even if it is a word that can be decomposed as part of speech.
In the segmented sentence creation step, a segmented sentence having a morpheme of the law name or the rule name of the rule is created.
を特徴とする請求項13記載の用字用語の審査方法。 The first computer is stored in at least one storage device of a first storage device storing a latest law name related to national laws and a second storage device storing a latest rule name related to local government regulations. The script terminology name update step according to claim 13, further comprising a law example rule name update step of performing a difference update of a law name or a rule name stored as a morpheme in the morpheme analysis dictionary storage unit at a predetermined timing. Screening method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007160628A JP5000390B2 (en) | 2007-06-18 | 2007-06-18 | Legal example rules text script term screening device, script term screening system, and script term screening method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007160628A JP5000390B2 (en) | 2007-06-18 | 2007-06-18 | Legal example rules text script term screening device, script term screening system, and script term screening method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008310771A JP2008310771A (en) | 2008-12-25 |
JP5000390B2 true JP5000390B2 (en) | 2012-08-15 |
Family
ID=40238286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007160628A Active JP5000390B2 (en) | 2007-06-18 | 2007-06-18 | Legal example rules text script term screening device, script term screening system, and script term screening method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5000390B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4854752B2 (en) * | 2009-02-18 | 2012-01-18 | 中国電力株式会社 | Ordinance revision information storage device and ordinance revision notification system |
CN110046241B (en) * | 2019-04-18 | 2022-12-16 | 武汉大学 | Method and system for assisting error detection of legal documents based on automatic article similarity comparison |
JPWO2022137338A1 (en) * | 2020-12-22 | 2022-06-30 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3020803B2 (en) * | 1994-06-08 | 2000-03-15 | 株式会社日立製作所 | Legal document search and revision system |
JPH07334575A (en) * | 1994-06-08 | 1995-12-22 | Hitachi Ltd | Supporting system for preparing revised statute |
JP2005292913A (en) * | 2004-03-31 | 2005-10-20 | Railway Technical Res Inst | System for expression examination of statute and regulation or the like |
-
2007
- 2007-06-18 JP JP2007160628A patent/JP5000390B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008310771A (en) | 2008-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10535042B2 (en) | Methods of offering guidance on common language usage utilizing a hashing function consisting of a hash triplet | |
Carley et al. | AutoMap User's Guide 2013 | |
Maynard et al. | Architectural elements of language engineering robustness | |
US9880997B2 (en) | Inferring type classifications from natural language text | |
US8849653B2 (en) | Updating dictionary during application installation | |
JP6022239B2 (en) | System and method for processing data | |
US20090192787A1 (en) | Grammer checker | |
US20030210249A1 (en) | System and method of automatic data checking and correction | |
JP2009500754A (en) | Handle collocation errors in documents | |
Schmidt | An analysis of the validity of retraction annotation in PubMed and the Web of Science | |
US20080147656A1 (en) | Computer aided validation of patent disclosures | |
Müller et al. | Annotating anaphoric and bridging relations with MMAX | |
WO2021089129A1 (en) | Analysis and comparison of character-coded digital data, in particular for job matching | |
US6125377A (en) | Method and apparatus for proofreading a document using a computer system which detects inconsistencies in style | |
Gálvez et al. | The unification of institutional addresses applying parametrized finite-state graphs (P-FSG) | |
JP5000390B2 (en) | Legal example rules text script term screening device, script term screening system, and script term screening method | |
Bhatti et al. | Phonetic-based sindhi spellchecker system using a hybrid model | |
JP2009501974A (en) | User interface for legal case history | |
JP4760043B2 (en) | Language analysis method and program | |
JP2017228307A (en) | Subject-verb match error detection device and program for match error detection | |
Sannier et al. | Legal markup generation in the large: An experience report | |
US10755047B2 (en) | Automatic application of reviewer feedback in data files | |
CN107577760B (en) | text classification method and device based on constraint specification | |
Ferrari et al. | QuOD: an NLP tool to improve the quality of business process descriptions | |
Jain et al. | SANAYOJAN: a framework for traceability link recovery between use-cases in software requirement specification and regulatory documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100506 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120516 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5000390 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150525 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |