JP2015201024A - Term standardization system, term standardization program, and term standardization method - Google Patents

Term standardization system, term standardization program, and term standardization method Download PDF

Info

Publication number
JP2015201024A
JP2015201024A JP2014079125A JP2014079125A JP2015201024A JP 2015201024 A JP2015201024 A JP 2015201024A JP 2014079125 A JP2014079125 A JP 2014079125A JP 2014079125 A JP2014079125 A JP 2014079125A JP 2015201024 A JP2015201024 A JP 2015201024A
Authority
JP
Japan
Prior art keywords
conversion
term
conversion rule
document
company
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014079125A
Other languages
Japanese (ja)
Other versions
JP5696280B1 (en
Inventor
幸治 松村
Koji Matsumura
幸治 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2014079125A priority Critical patent/JP5696280B1/en
Application granted granted Critical
Priority to PCT/JP2015/061034 priority patent/WO2015156336A1/en
Publication of JP5696280B1 publication Critical patent/JP5696280B1/en
Publication of JP2015201024A publication Critical patent/JP2015201024A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a term standardization system configured to standardize terms by company and by attribute of a document, while preventing influence on correspondence between a term to be converted and a standard term.SOLUTION: A term standardization system 100 includes a reference DB 116 which stores, for each company, conversion rule tables 400 with one or more conversion rules including a term to be converted, a standard term for standardization obtained by conversion, a category of a document, a type and class, and priority for conversion. The system receives a company ID of a company which treats a document, the document, category, type and class, and searches a conversion table 400 corresponding to the received company ID for a conversion rule corresponding to the category, type and class, to convert a term to be converted in the document to a standard term, according to the priority, on the basis of the conversion rule.

Description

本発明は、文書における同一内容で異なる表記の用語を統一させるシステム及びプログラム、並びに方法に係り、特に、企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システム及び用語統一プログラム、並びに用語統一方法に関する。   The present invention relates to a system, a program, and a method for unifying terms of the same content in a document and different methods, and in particular, it is possible to unify terms for each company and for each attribute of the document, and to unify the terms to be converted. The present invention relates to a term unification system, a term unification program, and a term unification method that are not easily affected by the correspondence between terms.

企業が製品に添付するマニュアル等の文書を複数の執筆者が分担して作成する場合に、執筆者によっては、表記にバラツキが生じることがある。例えば、同一内容の用語につき「モニター」「画面」「モニタ」とか、「ユーザー」「ユーザ」「利用者」「使用者」というように異なる表記がなされてしまい、ルールを決めてもなかなか徹底するのが難しい。   When a company creates a document such as a manual attached to a product by sharing it with a plurality of authors, the writing may vary depending on the author. For example, different terms such as “monitor”, “screen”, “monitor”, “user”, “user”, “user”, and “user” are used for the same content, and it is quite difficult to decide the rules. It is difficult.

従来、文書における同一内容で異なる表記の用語を統一させる技術としては、例えば、特許文献1、2記載の技術が広く知られている。   Conventionally, for example, techniques disclosed in Patent Documents 1 and 2 are widely known as techniques for unifying terms having different notation with the same content in a document.

特許文献1記載の技術は、不統一に使用されやすい用字・用語に対応させて、予め統一すべき用字・用語とした「用字・用語リスト」を作成し、文書中の用語が「用字・用語リスト」にあるかどうかをチェックし、変換が必要であれば、該当の用語を「統一用字・用語」に変換する(特許文献1〔0007〕、〔0008〕)。   The technique described in Patent Document 1 creates a “script / term list” that is used in advance to correspond to scripts and terms that are easily used inconsistently, and the terms in the document are “ It is checked whether it is in the “script / term list”, and if conversion is necessary, the corresponding term is converted to “unified script / term” (Patent Documents 1 [0007], [0008]).

特許文献2記載の技術は、標準表記の用語と、これに対応する複数の異表記の用語とを登録して構成され、予め作成された文書内の用語が、用語辞書内の標準表記の用語及びこれに対応する複数の異表記の用語と一致するか否かを検索し、異表記の用語と一致する文書内の用語を標準表記の用語に置換する(特許文献2〔0016〕)。   The technology described in Patent Document 2 is configured by registering a standard notation term and a plurality of different notation terms corresponding thereto, and the term in the document created in advance is the standard notation term in the term dictionary. Then, a search is made as to whether or not it matches a plurality of different notation terms, and a term in the document that matches the different notation term is replaced with a standard notation term (Patent Document 2 [0016]).

特開平7−146867号公報JP-A-7-146867 特開平9−259125号公報JP 9-259125 A

しかしながら、特許文献1、2記載の技術にあっては、次の3つの技術的課題があった。   However, the techniques described in Patent Documents 1 and 2 have the following three technical problems.

第1に、複数の企業の文書を作成する場合は、同一内容の用語であっても、企業によって統一すべき用語が異なることがある。例えば、「ユーザ」という用語について、企業Aからは「利用者」と統一するように要請されるのに対し、企業Bからは「使用者」と統一するように要請されることがある。特許文献1、2記載の技術にあっては、これに対応することができない。   First, when creating documents for a plurality of companies, even if the terms have the same contents, the terms to be unified may differ depending on the company. For example, the term “user” may be requested by company A to be unified with “user”, whereas company B may be requested to be unified with “user”. The techniques described in Patent Documents 1 and 2 cannot cope with this.

第2に、同一企業の文書を作成する場合、同一内容の用語であっても、文書の属性によって統一すべき用語が異なることがある。例えば、「テクノロジー」という用語について、機械系の文書では「技術」に統一するように要請されるのに対し、電子系の文書では「テクノロジ」に統一するように要請されることがある。特許文献1、2記載の技術にあっては、これに対応することができない。   Second, when documents of the same company are created, the terms to be unified may differ depending on the document attributes even if the terms have the same contents. For example, the term “technology” may be required to be unified with “technology” in mechanical documents, whereas it may be required to be unified with “technology” in electronic documents. The techniques described in Patent Documents 1 and 2 cannot cope with this.

第3に、特許文献1、2記載の技術のように、変換対象用語と統一用語を対応づけて予め辞書等に登録する構成にあっては、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じることがある。例えば、変換対象用語「テクノロジー」と統一用語「技術」を対応づけ、変換対象用語「技術」と統一用語「テクニック」を対応づけて辞書等に登録した場合、文書「当社のテクノロジーは、技術者の高い技術によって実現されています。」は、「当社の技術は、技術者の高いテクニックによって実現されています。」が所望の変換結果であるところ、変換対象用語「テクノロジー」を統一用語「技術」に変換し、その後、変換対象用語「技術」を統一用語「テクニック」に変換すると、「当社のテクニックは、技術者の高いテクニックによって実現されています。」が変換結果として得られてしまう。   Thirdly, as in the techniques described in Patent Documents 1 and 2, in the configuration in which the conversion target term and the unified term are associated with each other in advance and registered in a dictionary or the like, the unified term in a certain correspondence relationship and other correspondence Inappropriate conversion may occur when the terms to be converted in the relationship are the same. For example, if the conversion target term “technology” is associated with the unified term “technology” and the conversion target term “technology” is associated with the unified term “technique” and registered in a dictionary, etc., the document “ "The technology of our company is realized by the high technique of the engineer" is the desired conversion result, the conversion term "technology" is the unified term "technology , And then the conversion target term “technology” is converted to the unified term “technique”, the result of the conversion is “Our technique is realized by a high technique of engineers”.

そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システム及び用語統一プログラム、並びに用語統一方法を提供することを目的としている。   Therefore, the present invention has been made paying attention to such an unsolved problem of the conventional technology, and can be used to unify terms for each company and for each attribute of a document. It is an object to provide a term unification system and term unification program, and a term unification method that are not easily affected by the correspondence relationship between and a uniform term.

〔発明1〕 上記目的を達成するために、発明1の用語統一システムは、文書における同一内容で異なる表記の用語を統一させる用語統一システムであって、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記文書の属性に関する属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段と、前記企業を特定するための企業情報を取得する企業情報取得手段と、前記文書を取得する文書取得手段と、前記属性情報を取得する属性情報取得手段と、前記企業情報取得手段で取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得手段で取得した属性情報に対応する変換ルールを検索する変換ルール検索手段と、前記変換ルール検索手段で索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得手段で取得した文書における前記変換対象用語を前記統一用語に変換する用語変換手段とを備える。   [Invention 1] In order to achieve the above object, the term unification system of the invention 1 is a term unification system that unifies terms having the same contents and different notations in a document, and includes conversion target terms and conversions to be converted. A storage unit that stores, for each company, a conversion rule table in which one or more conversion rules including one or a plurality of conversion rules including priority information to be converted, attribute information related to the attributes of the document, and priority for conversion are specified; Company information acquisition means for acquiring company information, document acquisition means for acquiring the document, attribute information acquisition means for acquiring the attribute information, and conversion rules corresponding to the company information acquired by the company information acquisition means A conversion rule search means for searching for a conversion rule corresponding to the attribute information acquired by the attribute information acquisition means from the table; and Based on the conversion rule out, the priority in descending order, and a word conversion means for converting the conversion target term in a document acquired by the document obtaining means to the unified terms.

このような構成であれば、企業情報取得手段により企業情報が、文書取得手段により文書が、属性情報取得手段により属性情報がそれぞれ取得されると、変換ルール検索手段により、取得された企業情報に対応する変換ルールテーブルから、取得された属性情報に対応する変換ルールが検索される。そして、用語変換手段により、索出された変換ルールに基づいて、優先度が高い順に、取得された文書における変換対象用語が統一用語に変換される。   In such a configuration, when the company information is acquired by the company information acquisition unit, the document is acquired by the document acquisition unit, and the attribute information is acquired by the attribute information acquisition unit, the conversion rule search unit converts the acquired company information into the acquired company information. A conversion rule corresponding to the acquired attribute information is searched from the corresponding conversion rule table. Then, the term conversion means converts the conversion target terms in the acquired document into unified terms in descending order of priority based on the found conversion rules.

ここで、企業とは、経済活動を継続して営む主体をいい、法人及び個人事業者が含まれる。以下、発明3の用語統一プログラム、及び発明4の用語統一方法において同じである。   Here, a company refers to an entity that continues to carry out economic activities, and includes corporations and individual businesses. The same applies to the term unification program of invention 3 and the term unification method of invention 4.

また、企業情報取得手段は、例えば、入力装置等から企業情報を入力してもよいし、外部の端末等から企業情報を獲得又は受信してもよいし、記憶装置や記憶媒体等から企業情報を読み出してもよいし、情報処理等により企業情報を生成し又は算出してもよい。したがって、取得には、少なくとも入力、獲得、受信、読出(検索を含む。)、生成及び算出が含まれる。文書取得手段における取得及び属性情報取得手段における取得についても同様であるが、企業情報取得手段、文書取得手段及び属性情報取得手段の取得方法が同一であることを要しない。以下、取得の概念については同じである。   Further, the company information acquisition means may input the company information from an input device or the like, may acquire or receive the company information from an external terminal or the like, or may receive the company information from a storage device or a storage medium. May be read out, or company information may be generated or calculated by information processing or the like. Therefore, acquisition includes at least input, acquisition, reception, reading (including search), generation, and calculation. The same applies to the acquisition in the document acquisition unit and the acquisition in the attribute information acquisition unit, but the acquisition methods of the company information acquisition unit, the document acquisition unit, and the attribute information acquisition unit do not have to be the same. Hereinafter, the concept of acquisition is the same.

また、記憶手段において複数の情報を対応づけて記憶することとしては、(1)例えば、情報A及び情報Bを同一のレコードに登録するなど、直接対応づけて記憶すること、(2)例えば、情報A及び中間情報を対応づけて登録するテーブルと、情報B及び中間情報を対応づけて登録するテーブルを設けるなど、中間に1又は複数の情報を介して記憶することが含まれる。すなわち、情報Aから情報Bを辿ることができる態様であれば、あらゆるデータ構造を採用することができる。以下、情報を対応づけて記憶する概念については同じである。   In addition, as for storing a plurality of information in the storage means in association with each other, (1) for example, registering information A and information B directly in the same record, for example, (2) for example, For example, a table for registering information A and intermediate information in association with each other and a table for registering information B and intermediate information in association with each other may be stored in the middle via one or more pieces of information. That is, any data structure can be adopted as long as the information B can be traced from the information A. Hereinafter, the concept of associating and storing information is the same.

また、記憶手段は、変換ルールテーブルをあらゆる手段で且つあらゆる時期に記憶するものであり、変換ルールテーブルを予め記憶してあるものであってもよいし、変換ルールテーブルを予め記憶することなく、本システムの動作時に外部からの入力等によって変換ルールテーブルを記憶するようになっていてもよい。   Further, the storage means stores the conversion rule table at any time and at any time, and may store the conversion rule table in advance, or without storing the conversion rule table in advance, The conversion rule table may be stored by external input or the like during operation of the system.

また、本システムは、単一の装置、端末その他の機器として実現するようにしてもよいし、複数の装置、端末その他の機器を通信可能に接続したネットワークシステムとして実現するようにしてもよい。後者の場合、各構成要素は、それぞれ通信可能に接続されていれば、複数の機器等のうちいずれに属していてもよい。   Further, the present system may be realized as a single device, terminal, or other device, or may be realized as a network system in which a plurality of devices, terminals, or other devices are communicably connected. In the latter case, each component may belong to any one of a plurality of devices and the like as long as they are connected so as to communicate with each other.

〔発明2〕 さらに、発明2の用語統一システムは、発明1の用語統一システムにおいて、前記記憶手段は、前記変換ルールテーブルを企業ごとに記憶する更新用記憶手段と、前記更新用記憶手段と同一の記憶内容を保持するための参照用記憶手段とを有し、前記変換ルールの更新要求に応じて前記更新用記憶手段の変換ルールを更新する変換ルール更新手段と、前記変換ルールの参照要求に応じて前記参照用記憶手段の変換ルールを参照する変換ルール参照手段と、前記変換ルール更新手段による更新後の前記更新用記憶手段の記憶内容を前記参照用記憶手段に反映する記憶内容反映手段とを備える。   [Invention 2] Furthermore, the term unification system of Invention 2 is the term unification system of Invention 1, wherein the storage means is the same as the update storage means for storing the conversion rule table for each company, and the update storage means. A storage unit for reference for holding the stored content of the conversion rule, a conversion rule update unit for updating the conversion rule of the storage unit for update in response to the update request for the conversion rule, and a reference request for the conversion rule. In response, conversion rule reference means for referring to the conversion rule of the reference storage means, and storage content reflection means for reflecting the storage contents of the update storage means after the update by the conversion rule update means to the reference storage means Is provided.

このような構成であれば、変換ルール更新手段により、変換ルールの更新要求に応じて更新用記憶手段の変換ルールが更新される。更新用記憶手段の更新中は、変換ルール参照手段により、変換ルールの参照要求に応じて参照用記憶手段の変換ルールが参照される。そして、更新用記憶手段の更新完了後は、記憶内容反映手段により、更新後の更新用記憶手段の記憶内容が参照用記憶手段に反映される。   If it is such a structure, the conversion rule of an update memory | storage means will be updated by the conversion rule update means according to the update request | requirement of a conversion rule. During the updating of the update storage means, the conversion rule reference means refers to the conversion rule of the reference storage means in response to the conversion rule reference request. Then, after the update of the update storage means is completed, the storage content reflection means reflects the updated storage contents of the update storage means to the reference storage means.

〔発明3〕 一方、上記目的を達成するために、発明3の用語統一プログラムは、文書における同一内容で異なる表記の用語を統一させる用語統一プログラムであって、企業を特定するための企業情報を取得する企業情報取得ステップと、前記文書を取得する文書取得ステップと、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む処理をコンピュータに実行させるためのプログラムである。   [Invention 3] On the other hand, in order to achieve the above object, the term unification program of the invention 3 is a term unification program for unifying terms of the same contents and different notations in a document, and includes company information for specifying a company. The company information acquisition step to be acquired, the document acquisition step to acquire the document, the attribute information acquisition step to acquire attribute information related to the attribute of the document, the conversion target term to be converted, and the conversion should be unified Company information acquired in the company information acquisition step in the conversion rule table of the storage means for storing for each company a conversion rule table in which one or more conversion rules including a unified term, the attribute information, and conversion priority are registered A conversion rule corresponding to the attribute information acquired in the attribute information acquisition step is searched from the conversion rule table corresponding to Based on the conversion rule searched in the conversion rule search step and the conversion rule search step, the term conversion that converts the conversion target terms in the document acquired in the document acquisition step into the unified terms in descending order of priority. A program for causing a computer to execute processing including steps.

このような構成であれば、コンピュータによってプログラムが読み取られ、読み取られたプログラムに従ってコンピュータが処理を実行すると、発明1の用語統一システムと同等の作用が得られる。   With such a configuration, when the program is read by the computer and the computer executes processing in accordance with the read program, an operation equivalent to that of the term unification system of aspect 1 is obtained.

〔発明4〕 一方、上記目的を達成するために、発明4の用語統一方法は、文書における同一内容で異なる表記の用語を統一させる用語統一方法であって、企業情報取得手段が、企業を特定するための企業情報を取得する企業情報取得ステップと、文書取得手段が、前記文書を取得する文書取得ステップと、属性情報取得手段が、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、変換ルール検索手段が、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、用語変換手段が、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む。   [Invention 4] On the other hand, in order to achieve the above-mentioned object, the term unification method of Invention 4 is a term unification method for unifying terms of the same contents and different notations in a document, and the company information acquisition means specifies the company A company information acquisition step for acquiring company information to perform, a document acquisition unit for acquiring the document, a document acquisition step for acquiring the document, and an attribute information acquisition unit for acquiring attribute information relating to the attribute of the document; A conversion rule table in which the conversion rule search means registers one or more conversion rules including conversion target terms to be converted, unified terms to be converted and unified, the attribute information, and conversion priority. From the conversion rule table corresponding to the company information acquired in the company information acquisition step in the conversion rule table of the storage means for storing for each company, A conversion rule search step for searching for a conversion rule corresponding to the attribute information acquired in the sex information acquisition step, and the term conversion means based on the conversion rule searched out in the conversion rule search step, in order from the highest priority, A term conversion step of converting the conversion target term in the document acquired in the document acquisition step into the unified term.

以上説明したように、発明1の用語統一システム、発明3の用語統一プログラム、又は発明4の用語統一方法によれば、企業情報に対応する変換ルールに基づいて変換が行われるので、企業ごとに統一すべき用語が異なる場合でも、企業ごとの統一用語に変換することができる。また、属性情報に対応する変換ルールに基づいて変換が行われるので、文書の属性ごとに統一すべき用語が異なる場合でも、文書の属性ごとの統一用語に変換することができる。特に、企業及び属性が多数に及んでも、変換ルールテーブルに変換ルールをまとめて登録する構成を採用しているので、データ構造を簡素化することができる。さらに、優先度が高い順に変換が行われるので、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じる可能性を低減することができる。   As described above, according to the term unification system of the invention 1, the term unification program of the invention 3, or the term unification method of the invention 4, the conversion is performed based on the conversion rule corresponding to the company information. Even if the terms to be unified are different, they can be converted into unified terms for each company. Further, since the conversion is performed based on the conversion rule corresponding to the attribute information, even if the term to be unified is different for each attribute of the document, it can be converted into the unified term for each attribute of the document. In particular, even when there are a large number of companies and attributes, a configuration is adopted in which conversion rules are registered together in the conversion rule table, so that the data structure can be simplified. Furthermore, since the conversion is performed in the order of higher priority, the possibility that inappropriate conversion occurs when the unified terms in a certain correspondence relationship and the conversion target terms in another correspondence relationship are the same may be reduced. it can.

さらに、発明2の用語統一システムによれば、変換ルールの更新中に変換ルールの参照要求があった場合は、参照用記憶手段の変換ルールテーブルが参照されるので、処理負荷が大きい更新要求があっても、参照処理に与える影響を低減することができる。   Furthermore, according to the term unification system of the invention 2, when there is a conversion rule reference request during the conversion rule update, the conversion rule table of the reference storage means is referred to, so an update request with a large processing load is issued. Even if it exists, the influence which it has on a reference process can be reduced.

ネットワークシステムの構成を示すブロック図である。It is a block diagram which shows the structure of a network system. 更新用データベース(以下、データベースのことを単にDBと略記する。)156に記憶されている変換ルールテーブル400のデータ構造を示す図である。6 is a diagram showing a data structure of a conversion rule table 400 stored in an update database (hereinafter, the database is simply abbreviated as DB) 156. FIG. 用語変換処理時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。It is a sequence flow which shows operation | movement of the term unification system 100 and the user terminal 200 at the time of term conversion processing. 用語変換処理部154で実行する用語変換処理を示すフローチャートである。10 is a flowchart illustrating term conversion processing executed by a term conversion processing unit 154. データベースの更新及び参照時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。It is a sequence flow which shows operation | movement of the term unification system 100 and the user terminal 200 at the time of a database update and reference.

以下、本発明の実施の形態を説明する。図1乃至図5は、本実施の形態を示す図である。   Embodiments of the present invention will be described below. 1 to 5 are diagrams showing this embodiment.

まず、本発明を適用するネットワークシステムの構成を説明する。
図1は、ネットワークシステムの構成を示すブロック図である。
First, the configuration of a network system to which the present invention is applied will be described.
FIG. 1 is a block diagram showing a configuration of a network system.

インターネット等のネットワーク199には、図1に示すように、用語統一システム100と、複数のユーザ端末200とが接続されている。   As shown in FIG. 1, a term unification system 100 and a plurality of user terminals 200 are connected to a network 199 such as the Internet.

用語統一システム100は、ウェブサーバ110と、内部サーバ150とを有して構成されている。ウェブサーバ110はネットワーク199に、内部サーバ150はウェブサーバ110にそれぞれ接続されている。   The term unification system 100 includes a web server 110 and an internal server 150. The web server 110 is connected to the network 199, and the internal server 150 is connected to the web server 110.

ウェブサーバ110は、ユーザ端末200とのインターフェースとなるインターフェース部112を有して構成されている。インターフェース部112は、ユーザ端末200に対して文書の入出力を媒介するための用語変換画面を表示する用語変換画面表示部114と、更新用DB156と同一の記憶内容を保持するための参照用DB116とを有して構成されている。   The web server 110 includes an interface unit 112 that serves as an interface with the user terminal 200. The interface unit 112 displays a term conversion screen display unit 114 that displays a term conversion screen for mediating input / output of a document to the user terminal 200, and a reference DB 116 that holds the same storage content as the update DB 156. And is configured.

インターフェース部112は、変換対象又は変換後の文書をXML(eXtensible Markup Language)で構造化し、XMLファイル170として保持する。また、ユーザ端末200からの要求に応じて、変換後の文書をPDF(Portable Document Format)ファイル172としても出力する。   The interface unit 112 structures the document to be converted or the document after conversion using XML (eXtensible Markup Language), and holds it as an XML file 170. Also, in response to a request from the user terminal 200, the converted document is also output as a PDF (Portable Document Format) file 172.

内部サーバ150は、文書中の用語を変換する用語変換処理部154と、企業ごとに変換ルールテーブルを記憶する更新用DB156とを有して構成されている。   The internal server 150 includes a term conversion processing unit 154 that converts terms in a document and an update DB 156 that stores a conversion rule table for each company.

ユーザ端末200は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)及びI/F等をバス接続した一般的なコンピュータと同一機能を有して構成されている。I/Fには、HDD(Hard Disk Drive)等の記憶装置、ディスプレイ等の表示装置、ネットワークアダプタその他の装置が接続されている。ウェブサーバ110及び内部サーバ150のハードウェア構成も同様である。   The user terminal 200 is configured to have the same functions as, for example, a general computer in which a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), an I / F, and the like are connected by a bus. Yes. A storage device such as an HDD (Hard Disk Drive), a display device such as a display, a network adapter, and other devices are connected to the I / F. The hardware configurations of the web server 110 and the internal server 150 are the same.

次に、更新用DB156のデータ構造を説明する。なお、参照用DB116のデータ構造については、更新用DB156と同様であるので説明を省略する。   Next, the data structure of the update DB 156 will be described. Since the data structure of the reference DB 116 is the same as that of the update DB 156, the description thereof is omitted.

図2は、更新用DB156に記憶されている変換ルールテーブル400のデータ構造を示す図である。   FIG. 2 is a diagram illustrating a data structure of the conversion rule table 400 stored in the update DB 156.

更新用DB156は、図2に示すように、企業ごとに変換ルールテーブル400を記憶している。各変換ルールテーブル400は、企業IDにより特定することができる。   As shown in FIG. 2, the update DB 156 stores a conversion rule table 400 for each company. Each conversion rule table 400 can be specified by a company ID.

変換ルールテーブル400には、変換ルールごとに1つのレコードが登録されている。すなわち、1つのレコードが1つの変換ルールを構成する。各レコードは、変換ルールに対して一意に割り当てられたIDを登録するフィールド402と、変換の対象となる変換対象用語を登録するフィールド404と、変換を行って統一すべき統一用語を登録するフィールド406と、文書のカテゴリを登録するフィールド408と、文書の種別を登録するフィールド410と、文書における項目の分類を登録するフィールド412と、変換を行う優先度を登録するフィールド414とを含んで構成されている。   In the conversion rule table 400, one record is registered for each conversion rule. That is, one record constitutes one conversion rule. Each record has a field 402 for registering an ID uniquely assigned to a conversion rule, a field 404 for registering a conversion target term to be converted, and a field for registering a unified term to be converted and unified. 406, a field 408 for registering a document category, a field 410 for registering a document type, a field 412 for registering a classification of items in the document, and a field 414 for registering the priority for conversion. Has been.

優先度は、優先度が高く設定されている変換対象用語ほど他の変換対象用語よりも先に変換が行われることを制御するための指標であって、値が小さいほど優先度は高いと定義する。優先度の設定は、例えば、次の基準により行う。   The priority is an index for controlling that the conversion target term with higher priority is controlled before the other conversion target terms. The lower the value, the higher the priority. To do. The priority is set according to the following criteria, for example.

第1に、図2の例では、ID「1」のレコードに含まれる統一用語「技術」と、ID「6」のレコードに含まれる変換対象用語「技術」が同一であるので、ID「6」の変換対象用語「技術」は、ID「6」の変換対象用語「テクノロジー」よりも先に変換を行う必要がある。変換順序が逆になった場合は、変換対象用語「テクノロジー」が統一用語「テクニック」に変換されてしまうという不適切な変換が生じるからである。そこで、ID「6」のレコードの優先度をID「1」のレコードの優先度よりも高く設定する。   First, in the example of FIG. 2, the unified term “technology” included in the record with ID “1” and the conversion target term “technology” included in the record with ID “6” are the same. The conversion target term “technology” of “” needs to be converted before the conversion target term “technology” of ID “6”. This is because when the conversion order is reversed, inappropriate conversion occurs that the conversion target term “technology” is converted into the unified term “technique”. Therefore, the priority of the record with ID “6” is set higher than the priority of the record with ID “1”.

第2に、図2の例では、ID「3」〜「5」のレコードのように、変換対象用語が複合語で構成されている場合は、変換対象用語のバイト数や文字列の長さが大きいものほど先に変換を行う必要がある。そこで、変換対象用語のバイト数や文字列の長さが大きいものほど優先度を高く設定する。   Second, in the example of FIG. 2, when the conversion target term is composed of compound words like the records of ID “3” to “5”, the number of bytes of the conversion target term and the length of the character string The larger the is, the more it is necessary to convert it first. Therefore, the priority is set higher as the number of bytes of the conversion target term and the length of the character string are larger.

次に、本実施の形態の動作を説明する。
まず、用語変換処理時の動作を説明する。
図3は、用語変換処理時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
Next, the operation of the present embodiment will be described.
First, the operation during the term conversion process will be described.
FIG. 3 is a sequence flow showing operations of the term unification system 100 and the user terminal 200 during term conversion processing.

ユーザ端末200が用語変換処理の実行をリクエストすると(ステップS100)、ウェブサーバ110では、用語変換画面表示部114がリクエストを受け内部処理を開始する(ステップS102)。内部サーバ150では、内部処理が開始されると、用語変換処理部154が、文書のロックを用語統一システム100から取得し(ステップS104)、文書のファイルであるXMLファイル170に対して用語変換処理を開始する(ステップS106)。   When the user terminal 200 requests execution of the term conversion process (step S100), in the web server 110, the term conversion screen display unit 114 receives the request and starts an internal process (step S102). In the internal server 150, when the internal processing is started, the term conversion processing unit 154 acquires the document lock from the term unification system 100 (step S104), and performs the term conversion processing on the XML file 170 that is the document file. Is started (step S106).

ウェブサーバ110では、用語変換処理を開始した時点でユーザ端末200にレスポンスを返す(ステップS108)。ユーザ端末200では、このレスポンスを受けることにより、レスポンス待ちでブラウザが停止することが防止される(ステップS110)。用語変換処理が実行されている間は、文書がロックされているので、ユーザ端末200では、文書を編集することはできない(ステップS112)。   The web server 110 returns a response to the user terminal 200 when the term conversion process is started (step S108). By receiving this response, the user terminal 200 prevents the browser from being stopped waiting for a response (step S110). Since the document is locked while the term conversion process is being executed, the user terminal 200 cannot edit the document (step S112).

内部サーバ150では、用語変換処理が完了すると(ステップS114)、用語変換処理部154が文書のロックを用語統一システム100から解放する(ステップS116)。ロックが解放されると、ユーザ端末200では、文書を編集することができるようになる(ステップS118)。   In the internal server 150, when the term conversion processing is completed (step S114), the term conversion processing unit 154 releases the document lock from the term unification system 100 (step S116). When the lock is released, the user terminal 200 can edit the document (step S118).

用語変換処理部154では、具体的に、図4のフローチャートに示す用語変換処理が実行される。   Specifically, the term conversion processing unit 154 executes the term conversion processing shown in the flowchart of FIG.

図4は、用語変換処理部154で実行する用語変換処理を示すフローチャートである。
用語変換処理は、文書における同一内容で異なる表記の用語を統一させる処理であって、用語変換処理部154において実行されると、図4に示すように、まず、ステップS200に移行する。
FIG. 4 is a flowchart showing term conversion processing executed by the term conversion processing unit 154.
The term conversion process is a process for unifying different notation terms with the same content in the document. When the term conversion process unit 154 executes the term conversion process, the process first proceeds to step S200 as shown in FIG.

ステップS200では、文書の取り扱い先となる企業の企業IDを入力し、ステップS202に移行する。企業IDは、ユーザ端末200から入力してもよいし、データベース(不図示)やセッション情報等から入力してもよい。   In step S200, the company ID of the company that handles the document is input, and the process proceeds to step S202. The company ID may be input from the user terminal 200, or may be input from a database (not shown), session information, or the like.

ステップS202では、XMLファイル170から文書(内容)を入力し、ステップS204に移行して、XMLファイル170から文書のカテゴリを入力し、ステップS206に移行して、XMLファイル170から文書の種別を入力し、ステップS208に移行し、XMLファイル170から文書における対象項目の分類を入力し、ステップS210に移行する。   In step S202, the document (contents) is input from the XML file 170, the process proceeds to step S204, the document category is input from the XML file 170, the process proceeds to step S206, and the document type is input from the XML file 170. Then, the process proceeds to step S208, where the classification of the target item in the document is input from the XML file 170, and the process proceeds to step S210.

ステップS210では、ステップS200で入力した企業IDに対応する変換ルールテーブル400から、ステップS204〜S208で入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、ステップS212に移行する。   In step S210, the conversion rule corresponding to the category, type, and classification input in steps S204 to S208 is searched from the conversion rule table 400 corresponding to the company ID input in step S200, and the process proceeds to step S212.

ステップS212では、索出した変換ルールのうち優先度が最も高く設定されている変換ルールを選択し、選択した変換ルールに含まれる変換対象用語と同一の用語を文書中から検索し、ステップS214に移行する。   In step S212, the conversion rule with the highest priority is selected from the searched conversion rules, and the same term as the conversion target term included in the selected conversion rule is searched from the document, and the process goes to step S214. Transition.

ステップS214では、該当の変換対象用語を索出したか否かを判定し、該当の変換対象用語を索出したと判定した場合(YES)は、ステップS216に移行して、索出した変換対象用語を、選択した変換ルールに含まれる統一用語に変換し、ステップS218に移行する。   In step S214, it is determined whether or not the corresponding conversion target term has been searched. If it is determined that the corresponding conversion target term has been searched (YES), the process proceeds to step S216 and the searched conversion target term is searched. Is converted into a unified term included in the selected conversion rule, and the process proceeds to step S218.

ステップS218では、ステップS210で索出したすべての変換ルールについて処理が終了したか否かを判定し、すべての変換ルールについて処理が終了したと判定した場合(YES)は、ステップS220に移行する。   In step S218, it is determined whether or not the processing has been completed for all the conversion rules retrieved in step S210. If it is determined that the processing has been completed for all the conversion rules (YES), the process proceeds to step S220.

ステップS220では、文書におけるすべての項目について処理が終了したか否かを判定し、すべての項目について処理が終了したと判定した場合(YES)は、一連の処理を終了して元の処理に復帰させる。   In step S220, it is determined whether or not processing has been completed for all items in the document. If it is determined that processing has been completed for all items (YES), the series of processing is terminated and the original processing is restored. Let

一方、ステップS220で、すべての項目について処理が終了していないと判定した場合(NO)は、ステップS208に移行する。   On the other hand, if it is determined in step S220 that processing has not been completed for all items (NO), the process proceeds to step S208.

一方、ステップS218で、すべての変換ルールについて処理が終了していないと判定した場合(NO)は、ステップS222に移行して、ステップS210で索出した変換ルールのうち優先度が次に高く設定されている変換ルールを選択し、選択した変換ルールに含まれる変換対象用語と同一の用語を文書中から検索し、ステップS214に移行する。   On the other hand, if it is determined in step S218 that the processing has not been completed for all the conversion rules (NO), the process proceeds to step S222, and the next highest priority is set among the conversion rules retrieved in step S210. The selected conversion rule is selected, the same term as the conversion target term included in the selected conversion rule is searched from the document, and the process proceeds to step S214.

一方、ステップS214で、該当の変換対象用語を索出しないと判定した場合(NO)は、ステップS218に移行する。   On the other hand, if it is determined in step S214 that the corresponding conversion target term is not searched (NO), the process proceeds to step S218.

例えば、文書の属性としてカテゴリ「機械A」及び種別「取扱説明書」が設定され、著作権情報に「A社」を、本文に「当社のテクノロジーは、最先端のIT技術であり、技術者の高い技術によって実現されています。」を含む文書が与えられた場合、図2の変換ルールテーブル400によれば、ID「1」「3」「5」「6」のレコードが検索され、優先度が高いID「5」「6」「1」「3」の順に変換が行われる。その結果、著作権情報「株式会社A」及び本文「当社の技術は、最先端のITテクノロジーであり、技術者の高いテクニックによって実現されています。」が得られる。   For example, the category “Machine A” and the type “Instruction Manual” are set as document attributes, “Company A” is included in the copyright information, and “Our technology is state-of-the-art IT technology. When a document including “is realized by the high-level technology”, records with IDs “1”, “3”, “5”, and “6” are searched according to the conversion rule table 400 of FIG. Conversion is performed in the order of IDs “5”, “6”, “1”, and “3” in descending order. As a result, the copyright information “A Co., Ltd.” and the text “Our technology is state-of-the-art IT technology and is realized by the high technique of engineers” are obtained.

次に、データベースの更新及び参照時の動作を説明する。
図5は、データベースの更新及び参照時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
Next, operations during database update and reference will be described.
FIG. 5 is a sequence flow showing operations of the term unification system 100 and the user terminal 200 at the time of updating and referring to the database.

ユーザ端末200が変換ルールの更新要求を行うと(ステップS300)、ウェブサーバ110では、用語変換画面表示部114が更新用DB156に対する更新要求を行う(ステップS302)。内部サーバ150では、更新要求を受けると、更新用DB156に対して、変換ルールの内容を更新すべく書き込みを行う。   When the user terminal 200 makes a conversion rule update request (step S300), in the web server 110, the term conversion screen display unit 114 makes an update request to the update DB 156 (step S302). When the internal server 150 receives the update request, the internal server 150 writes to the update DB 156 to update the contents of the conversion rule.

更新用DB156の更新中に、他のユーザ端末200が変換ルールの参照要求を行うと(ステップS304)、ウェブサーバ110では、用語変換画面表示部114が、参照用DB116に対する参照要求を行い(ステップS306)、参照用DB116から変換ルールを検索し(ステップS308)、検索結果をユーザ端末200に返す(ステップS310)。   If another user terminal 200 makes a conversion rule reference request while updating the update DB 156 (step S304), the term conversion screen display unit 114 makes a reference request to the reference DB 116 in the web server 110 (step S304). In step S306, the conversion rule is searched from the reference DB 116 (step S308), and the search result is returned to the user terminal 200 (step S310).

更新用DB156の更新が完了すると(ステップS312)、ウェブサーバ110では、ユーザ端末200にレスポンスを返す(ステップS314)。また、内部サーバ150では、更新後の更新用DB156の記憶内容を参照用DB116に非同期で反映する(ステップS316)。   When the update of the update DB 156 is completed (step S312), the web server 110 returns a response to the user terminal 200 (step S314). Further, the internal server 150 asynchronously reflects the stored contents of the updated DB 156 in the reference DB 116 (step S316).

このようにして、本実施の形態では、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、文書のカテゴリ、種別及び分類、並びに変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブル400を企業ごとに記憶する参照用DB116を備え、文書の取り扱い先となる企業の企業ID、文書、カテゴリ、種別及び分類をそれぞれ入力し、入力した企業IDに対応する変換ルールテーブル400から、入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、索出した変換ルールに基づいて、優先度が高い順に、文書における変換対象用語を統一用語に変換する。   In this way, in the present embodiment, a conversion rule including a conversion target term to be converted, a unified term to be converted and unified, a document category, a type and a classification, and a priority for conversion is set to 1. Alternatively, a reference DB 116 for storing a plurality of registered conversion rule tables 400 for each company is provided, and a company ID, a document, a category, a type, and a classification of a company that is a document handling destination are input and correspond to the input company ID. A conversion rule corresponding to the input category, type, and classification is searched from the conversion rule table 400, and conversion target terms in the document are converted into unified terms in descending order of priority based on the searched conversion rule.

これにより、企業IDに対応する変換ルールに基づいて変換が行われるので、企業ごとに統一すべき用語が異なる場合でも、企業ごとの統一用語に変換することができる。また、カテゴリ、種別及び分類に対応する変換ルールに基づいて変換が行われるので、文書のカテゴリ、種別及び分類ごとに統一すべき用語が異なる場合でも、文書のカテゴリ、種別及び分類ごとの統一用語に変換することができる。特に、企業並びにカテゴリ、種別及び分類が多数に及んでも、変換ルールテーブル400に変換ルールをまとめて登録する構成を採用しているので、データ構造を簡素化することができる。さらに、優先度が高い順に変換が行われるので、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じる可能性を低減することができる。   Thereby, since conversion is performed based on the conversion rule corresponding to company ID, even if the term which should be unified for every company differs, it can convert into the unified term for every company. In addition, since conversion is performed based on conversion rules corresponding to categories, types, and classifications, uniform terms for each category, type, and classification of documents, even if the terms that should be unified for each category, type, and classification of documents are different. Can be converted to In particular, even when there are a large number of companies and categories, types, and classifications, the configuration in which conversion rules are registered together in the conversion rule table 400 is adopted, so that the data structure can be simplified. Furthermore, since the conversion is performed in the order of higher priority, the possibility that inappropriate conversion occurs when the unified terms in a certain correspondence relationship and the conversion target terms in another correspondence relationship are the same may be reduced. it can.

さらに、本実施の形態では、変換ルールの更新要求に応じて更新用DB156の変換ルールを更新し、更新用DB156の更新中は、変換ルールの参照要求に応じて参照用DB116の変換ルールを参照し、更新用DB156の更新完了後は、更新後の更新用DB156の記憶内容を参照用DB116に反映する。   Further, in the present embodiment, the conversion rule of the update DB 156 is updated in response to the conversion rule update request, and the conversion rule of the reference DB 116 is referred to in response to the conversion rule reference request while the update DB 156 is being updated. Then, after the update of the update DB 156 is completed, the storage content of the updated DB 156 is reflected in the reference DB 116.

これにより、変換ルールの更新中に変換ルールの参照要求があった場合は、参照用DB116の変換ルールテーブル400が参照されるので、処理負荷が大きい更新要求があっても、参照処理に与える影響を低減することができる。   As a result, if there is a conversion rule reference request during the update of the conversion rule, the conversion rule table 400 of the reference DB 116 is referred to, so even if there is an update request with a large processing load, the influence on the reference processing Can be reduced.

本実施の形態において、企業IDは、発明1、3又は4の企業情報に対応し、カテゴリ、種別及び分類は、発明1、3又は4の属性情報に対応し、ウェブサーバ110は、発明2の変換ルール参照手段に対応し、参照用DB116は、発明1乃至4の記憶手段、又は発明2の参照用記憶手段に対応している。また、内部サーバ150は、発明2の変換ルール更新手段、又は発明2の記憶内容反映手段に対応し、更新用DB156は、発明2の更新用記憶手段に対応し、ステップS200は、発明1若しくは4の企業情報取得手段、又は発明3若しくは4の企業情報取得ステップに対応している。   In the present embodiment, the company ID corresponds to the company information of the invention 1, 3, or 4, the category, type, and classification correspond to the attribute information of the invention 1, 3, or 4, and the web server 110 uses the invention 2 The reference DB 116 corresponds to the storage means of the inventions 1 to 4 or the reference storage means of the invention 2. The internal server 150 corresponds to the conversion rule update unit of the second aspect or the storage content reflection unit of the second aspect. The update DB 156 corresponds to the update storage unit of the second aspect. This corresponds to the company information acquisition means of No. 4 or the company information acquisition step of Invention 3 or 4.

また、本実施の形態において、ステップS202は、発明1若しくは4の文書取得手段、又は発明3若しくは4の文書取得ステップに対応し、ステップS204〜S208は、発明1若しくは4の属性情報取得手段、又は発明3若しくは4の属性情報取得ステップに対応している。また、ステップS210、S222は、発明1若しくは4の変換ルール検索手段、又は発明3若しくは4の変換ルール検索ステップに対応し、ステップS212〜S216は、発明1若しくは4の用語変換手段、又は発明3若しくは4の用語変換ステップに対応している。   In the present embodiment, step S202 corresponds to the document acquisition means of invention 1 or 4 or the document acquisition step of invention 3 or 4, and steps S204 to S208 include attribute information acquisition means of invention 1 or 4. Or it corresponds to the attribute information acquisition step of invention 3 or 4. Steps S210 and S222 correspond to the conversion rule search means of the invention 1 or 4, or the conversion rule search step of the invention 3 or 4, and steps S212 to S216 correspond to the term conversion means of the invention 1 or 4, or the invention 3 Or it corresponds to the four term conversion steps.

〔その他の変形例〕
なお、上記実施の形態において、優先度は、値が小さいほど高いと定義したが、値が大きいほど高いと定義することもできる。また、非優先度を設定して変換順序を制御することもできるが、これは、優先度を設定して変換順序を制御することと技術的に同義であり、本発明の技術的思想に包摂されるものである。
[Other variations]
In the above embodiment, the priority is defined to be higher as the value is smaller. However, it can be defined as higher as the value is larger. Although the non-priority can be set to control the conversion order, this is technically synonymous with setting the priority and controlling the conversion order, and is included in the technical idea of the present invention. It is what is done.

また、上記実施の形態及びその変形例においては、企業ごとに変換ルールテーブル400を記憶しているので、例えば、次のような応用も考えられる。   Moreover, in the said embodiment and its modification, since the conversion rule table 400 is memorize | stored for every company, the following application is also considered, for example.

第1に、企業Aについて、企業Aの変換ルールテーブル400と、1又は複数の他社の変換ルールテーブル400を比較し、変換対象用語が同一で表記が異なる統一用語を抽出し、抽出結果をファイル等に出力する。これにより、企業Aは、企業Aが採用している統一用語のうち、同一内容につき他社で採用している統一用語とは異なるものを把握することができるので、他社との関係で統一用語の見直しを検討することができる。   First, for the company A, the conversion rule table 400 of the company A is compared with the conversion rule table 400 of one or more other companies, unified terms having the same conversion target terms and different notations are extracted, and the extraction results are filed Etc. As a result, Company A can understand the unified terms adopted by Company A that are different from the unified terms adopted by other companies for the same content. Review can be considered.

第2に、企業Aについて、企業Aの変換ルールテーブル400と、1又は複数の他社の変換ルールテーブル400を比較し、統一用語が同一で他社の変換ルールテーブル400にのみ登録されている変換対象用語を抽出し、抽出結果をファイル等に出力する。これにより、企業A又は企業Aの文書の執筆者は、ある統一用語につき登録していない変換対象用語を把握することができるので、これを企業Aの変換ルールテーブル400に登録することにより、その統一用語について表記のバラツキを低減することができる。   Secondly, for the company A, the conversion rule table 400 of the company A is compared with the conversion rule table 400 of one or more other companies, and the conversion target is registered only in the conversion rule table 400 of the other company with the same unified term. Extract terms and output the extraction results to a file. As a result, the writer of the company A or the document of the company A can grasp the conversion target terms that are not registered for a certain unified term. By registering this in the conversion rule table 400 of the company A, It is possible to reduce variations in notation for unified terms.

第3に、上記第1及び第2の構成は、異なる企業間について適用したが、異なるカテゴリ間についても同様に適用することもできる。   Third, the first and second configurations described above are applied between different companies, but can be applied similarly between different categories.

第4に、上記第1及び第2の構成は、異なる企業間について適用したが、異なる種別間についても同様に適用することもできる。   Fourthly, the first and second configurations are applied between different companies, but may be applied similarly between different types.

第5に、上記第1及び第2の構成は、異なる企業間について適用したが、異なる分類間についても同様に適用することもできる。   Fifth, the first and second configurations described above are applied to different companies, but can be applied to different categories as well.

100…用語統一システム、 110…ウェブサーバ、 112…インターフェース部、 114…用語変換画面表示部、 116…参照用DB、 150…内部サーバ、 154…用語変換処理部、 156…更新用DB、 170…XMLファイル、 172…PDFファイル、 199…ネットワーク、 200…ユーザ端末、 400…変換ルールテーブル DESCRIPTION OF SYMBOLS 100 ... Term unification system, 110 ... Web server, 112 ... Interface part, 114 ... Term conversion screen display part, 116 ... Reference DB, 150 ... Internal server, 154 ... Term conversion processing part, 156 ... Update DB, 170 ... XML file, 172 ... PDF file, 199 ... network, 200 ... user terminal, 400 ... conversion rule table

Claims (4)

文書における同一内容で異なる表記の用語を統一させる用語統一システムであって、
変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記文書の属性に関する属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段と、
前記企業を特定するための企業情報を取得する企業情報取得手段と、
前記文書を取得する文書取得手段と、
前記属性情報を取得する属性情報取得手段と、
前記企業情報取得手段で取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得手段で取得した属性情報に対応する変換ルールを検索する変換ルール検索手段と、
前記変換ルール検索手段で索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得手段で取得した文書における前記変換対象用語を前記統一用語に変換する用語変換手段とを備えることを特徴とする用語統一システム。
A term unification system that unifies terms with the same content and different notation in a document,
A conversion rule table in which one or a plurality of conversion rules including conversion target terms to be converted, unified terms to be converted and unified, attribute information on the attribute of the document, and conversion priority are registered for each company Storage means for storing;
Company information acquisition means for acquiring company information for identifying the company;
Document acquisition means for acquiring the document;
Attribute information acquisition means for acquiring the attribute information;
A conversion rule search means for searching a conversion rule corresponding to the attribute information acquired by the attribute information acquisition means from a conversion rule table corresponding to the company information acquired by the company information acquisition means;
Term conversion means for converting the conversion target terms in the document acquired by the document acquisition means into the unified terms in descending order of priority based on the conversion rules searched by the conversion rule search means. A unique terminology system.
請求項1において、
前記記憶手段は、前記変換ルールテーブルを企業ごとに記憶する更新用記憶手段と、前記更新用記憶手段と同一の記憶内容を保持するための参照用記憶手段とを有し、
前記変換ルールの更新要求に応じて前記更新用記憶手段の変換ルールを更新する変換ルール更新手段と、
前記変換ルールの参照要求に応じて前記参照用記憶手段の変換ルールを参照する変換ルール参照手段と、
前記変換ルール更新手段による更新後の前記更新用記憶手段の記憶内容を前記参照用記憶手段に反映する記憶内容反映手段とを備えることを特徴とする用語統一システム。
In claim 1,
The storage means includes an update storage means for storing the conversion rule table for each company, and a reference storage means for holding the same storage contents as the update storage means,
Conversion rule update means for updating the conversion rule of the storage means for update in response to the update request for the conversion rule;
A conversion rule reference means for referring to the conversion rule of the reference storage means in response to the conversion rule reference request;
A term unification system comprising: a storage content reflection unit that reflects the storage content of the update storage unit after the update by the conversion rule update unit to the reference storage unit.
文書における同一内容で異なる表記の用語を統一させる用語統一プログラムであって、
企業を特定するための企業情報を取得する企業情報取得ステップと、
前記文書を取得する文書取得ステップと、
前記文書の属性に関する属性情報を取得する属性情報取得ステップと、
変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、
前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む処理をコンピュータに実行させるためのプログラムであることを特徴とする用語統一プログラム。
A term unification program that unifies terms with the same content and different notation in a document,
A company information acquisition step for acquiring company information for identifying the company;
A document acquisition step of acquiring the document;
An attribute information acquisition step of acquiring attribute information related to the attribute of the document;
Storage means for storing for each company a conversion rule table in which one or a plurality of conversion rules including conversion target terms to be converted, unified terms to be converted and unified, the attribute information, and conversion priority are registered A conversion rule search step for searching a conversion rule corresponding to the attribute information acquired in the attribute information acquisition step from a conversion rule table corresponding to the company information acquired in the company information acquisition step in the conversion rule table;
A process including a term conversion step of converting the conversion target terms in the document acquired in the document acquisition step into the unified terms in descending order of priority based on the conversion rule searched in the conversion rule search step. A term unification program characterized by being a program to be executed by a computer.
文書における同一内容で異なる表記の用語を統一させる用語統一方法であって、
企業情報取得手段が、企業を特定するための企業情報を取得する企業情報取得ステップと、
文書取得手段が、前記文書を取得する文書取得ステップと、
属性情報取得手段が、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、
変換ルール検索手段が、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、
用語変換手段が、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含むことを特徴とする用語統一方法。
A term unification method that unifies terms with the same content and different notation in a document,
A company information acquisition step in which the company information acquisition means acquires company information for identifying the company;
A document acquisition means for acquiring the document;
An attribute information acquisition step in which attribute information acquisition means acquires attribute information related to the attribute of the document;
The conversion rule search means stores a conversion rule table in which one or more conversion rules including conversion target terms to be converted, unified terms to be converted and unified, the attribute information, and conversion priority are registered. A conversion rule for retrieving a conversion rule corresponding to the attribute information acquired in the attribute information acquisition step from a conversion rule table corresponding to the company information acquired in the company information acquisition step in the conversion rule table of the storage means stored for each A search step;
Term conversion step in which the term conversion means converts the conversion target term in the document acquired in the document acquisition step into the unified term in descending order of the priority based on the conversion rule searched in the conversion rule search step. The term unification method characterized by including.
JP2014079125A 2014-04-08 2014-04-08 Term unification system, term unification program, and term unification method Active JP5696280B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014079125A JP5696280B1 (en) 2014-04-08 2014-04-08 Term unification system, term unification program, and term unification method
PCT/JP2015/061034 WO2015156336A1 (en) 2014-04-08 2015-04-08 Term unification system, term unification program, and term unification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014079125A JP5696280B1 (en) 2014-04-08 2014-04-08 Term unification system, term unification program, and term unification method

Publications (2)

Publication Number Publication Date
JP5696280B1 JP5696280B1 (en) 2015-04-08
JP2015201024A true JP2015201024A (en) 2015-11-12

Family

ID=52836993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014079125A Active JP5696280B1 (en) 2014-04-08 2014-04-08 Term unification system, term unification program, and term unification method

Country Status (2)

Country Link
JP (1) JP5696280B1 (en)
WO (1) WO2015156336A1 (en)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176018A (en) * 1992-12-07 1994-06-24 Fuji Xerox Co Ltd Proofreading supporting device
JPH0785040A (en) * 1993-09-13 1995-03-31 Hitachi Ltd Inscription nonuniformity detecting method and kana/ kanji converting method
JPH07129577A (en) * 1993-10-29 1995-05-19 Fuji Xerox Co Ltd Document proofreading supporting device
JPH07325826A (en) * 1994-05-31 1995-12-12 Meidensha Corp Japanese language processing system
JP2987099B2 (en) * 1996-03-27 1999-12-06 株式会社日立国際ビジネス Document creation support system and term dictionary
JP2002157241A (en) * 2000-09-06 2002-05-31 Fujitsu Ltd Dictionary preparing device
JP2003141108A (en) * 2001-11-08 2003-05-16 Canon Inc Different notation conversion method, different notation converter and recording medium
JP5243103B2 (en) * 2008-05-19 2013-07-24 株式会社野村総合研究所 Database system and delayed automatic recovery method for differential copy in database system
JP5526900B2 (en) * 2010-03-19 2014-06-18 富士通株式会社 Management device, correction candidate output method, and correction candidate output program
JP2012256197A (en) * 2011-06-08 2012-12-27 Toshiba Corp Orthographical variant detection device and orthographical variant detection program

Also Published As

Publication number Publication date
JP5696280B1 (en) 2015-04-08
WO2015156336A1 (en) 2015-10-15

Similar Documents

Publication Publication Date Title
US11354493B2 (en) Table cell editing in a spreadsheet constrained to unbounded and searchable lists of values from web service
JP5710851B2 (en) System and method for impact analysis
US8392465B2 (en) Dependency graphs for multiple domains
JP4879580B2 (en) System and method for providing an automatic search menu to a user interface
US8260815B2 (en) System and method for accessing non-compatible content repositories
US8392472B1 (en) Auto-classification of PDF forms by dynamically defining a taxonomy and vocabulary from PDF form fields
KR101976220B1 (en) Recommending data enrichments
US20090043778A1 (en) Generating etl packages from template
KR101083563B1 (en) Method and System for Managing Database
KR101355273B1 (en) A computing system, a method for controlling thereof, and a computer-readable recording medium having a computer program for controlling thereof
US11030242B1 (en) Indexing and querying semi-structured documents using a key-value store
US7792857B1 (en) Migration of content when accessed using federated search
JP2014149564A (en) Information processing apparatus, information processing method and program
US9734178B2 (en) Searching entity-key associations using in-memory objects
US7562286B2 (en) Apparatus, system, method and computer program product for document management
US8521762B2 (en) Automated business process modeling
US8433729B2 (en) Method and system for automatically generating a communication interface
US9489459B2 (en) Single point metadata driven search configuration, indexing and execution
US8156509B2 (en) Exchanging data using data transformation
US11157506B2 (en) Multiform persistence abstraction
JP5696280B1 (en) Term unification system, term unification program, and term unification method
US20130218928A1 (en) Information processing device
EP3035212B1 (en) Transparent database table replacement
JP7381290B2 (en) Computer system and data management method
US20050160101A1 (en) Method and apparatus using dynamic SQL for item create, retrieve, update delete operations in a content management application

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20141217

R150 Certificate of patent or registration of utility model

Ref document number: 5696280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250