WO2015156336A1 - 用語統一システム及び用語統一プログラム、並びに用語統一方法 - Google Patents

用語統一システム及び用語統一プログラム、並びに用語統一方法 Download PDF

Info

Publication number
WO2015156336A1
WO2015156336A1 PCT/JP2015/061034 JP2015061034W WO2015156336A1 WO 2015156336 A1 WO2015156336 A1 WO 2015156336A1 JP 2015061034 W JP2015061034 W JP 2015061034W WO 2015156336 A1 WO2015156336 A1 WO 2015156336A1
Authority
WO
WIPO (PCT)
Prior art keywords
conversion
term
company
conversion rule
document
Prior art date
Application number
PCT/JP2015/061034
Other languages
English (en)
French (fr)
Inventor
幸治 松村
Original Assignee
幸治 松村
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 幸治 松村 filed Critical 幸治 松村
Publication of WO2015156336A1 publication Critical patent/WO2015156336A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Definitions

  • the present invention relates to a system, a program, and a method for unifying terms of the same content in a document and different methods, and in particular, it is possible to unify terms for each company and for each attribute of the document, and to unify the terms to be converted.
  • the present invention relates to a term unification system, a term unification program, and a term unification method that are not easily affected by the correspondence between terms.
  • Patent Documents 1 and 2 are widely known as techniques for unifying terms having different notation with the same content in a document.
  • Patent Document 1 creates a “script / term list” that is used in advance to correspond to scripts and terms that are easily used inconsistently, and the terms in the document are “ It is checked whether it is in the “script / term list”, and if conversion is necessary, the corresponding term is converted to “unified script / term” (Patent Documents 1 [0007], [0008]).
  • Patent Document 2 The technology described in Patent Document 2 is configured by registering a standard notation term and a plurality of different notation terms corresponding thereto, and the term in the document created in advance is the standard notation term in the term dictionary. Then, a search is made as to whether or not it matches a plurality of different notation terms, and a term in the document that matches the different notation term is replaced with a standard notation term (Patent Document 2 [0016]).
  • Patent Documents 1 and 2 have the following three technical problems.
  • the terms to be unified may differ depending on the attributes of the documents even if the terms have the same content.
  • the term “technology” may be required to be unified with “technology” in mechanical documents, whereas it may be required to be unified with “technology” in electronic documents.
  • the techniques described in Patent Documents 1 and 2 cannot cope with this.
  • the conversion target term “technology” is associated with the unified term “technology” and the conversion target term “technology” is associated with the unified term “technique” and registered in a dictionary, etc.
  • the document “ “The technology of our company is realized by the high technique of the engineer” is the desired conversion result
  • the conversion term “technology” is the unified term “technology ”
  • the conversion target term “technology” is converted to the unified term “technique”
  • the result of the conversion is “Our technique is realized by a high technique of engineers”.
  • the present invention has been made paying attention to such an unsolved problem of the conventional technology, and can be used to unify terms for each company and for each attribute of a document. It is an object to provide a term unification system and term unification program, and a term unification method that are not easily affected by the correspondence relationship between and a uniform term.
  • the term unification system of Invention 1 is a term unification system that unifies terms with the same contents and different notations in a document.
  • a storage unit that stores, for each company, a conversion rule table in which one or more conversion rules including one or a plurality of conversion rules including priority information to be converted, attribute information related to the attributes of the document, and priority for conversion are specified;
  • Company information acquisition means for acquiring company information, document acquisition means for acquiring the document, attribute information acquisition means for acquiring the attribute information, and conversion rules corresponding to the company information acquired by the company information acquisition means
  • Conversion rule search means for searching for a conversion rule corresponding to the attribute information acquired by the attribute information acquisition means from the table, and the conversion rule search means Based on the conversion rule retrieved, the priority in descending order, and a word conversion means for converting the conversion target term in a document acquired by the document obtaining means to the unified terms.
  • the conversion rule search unit converts the acquired company information into the acquired company information.
  • a conversion rule corresponding to the acquired attribute information is searched from the corresponding conversion rule table.
  • the term conversion means converts the conversion target terms in the acquired document into unified terms in descending order of priority based on the found conversion rules.
  • the company information acquisition means may input the company information from an input device or the like, may acquire or receive the company information from an external terminal or the like, or may receive the company information from a storage device or a storage medium. May be read out, or company information may be generated or calculated by information processing or the like. Therefore, acquisition includes at least input, acquisition, reception, reading (including search), generation, and calculation. The same applies to the acquisition in the document acquisition unit and the acquisition in the attribute information acquisition unit, but the acquisition methods of the company information acquisition unit, the document acquisition unit, and the attribute information acquisition unit do not have to be the same. Hereinafter, the concept of acquisition is the same.
  • a table for registering information A and intermediate information in association with each other and a table for registering information B and intermediate information in association with each other may be stored in the middle via one or more pieces of information. That is, any data structure can be adopted as long as the information B can be traced from the information A.
  • the concept of associating and storing information is the same.
  • the storage means stores the conversion rule table at any time and at any time, and may store the conversion rule table in advance, or without storing the conversion rule table in advance,
  • the conversion rule table may be stored by external input or the like during operation of the system.
  • the present system may be realized as a single device, terminal or other device, or may be realized as a network system in which a plurality of devices, terminals or other devices are communicably connected.
  • each component may belong to any one of a plurality of devices and the like as long as they are connected so as to communicate with each other.
  • the term unification system of Invention 2 is the term unification system of Invention 1, wherein the storage means is the same as the update storage means for storing the conversion rule table for each company, and the update storage means.
  • a storage unit for reference for holding the stored content of the conversion rule
  • a conversion rule update unit for updating the conversion rule of the storage unit for update in response to the update request for the conversion rule, and a reference request for the conversion rule.
  • conversion rule reference means for referring to the conversion rule of the reference storage means
  • storage content reflection means for reflecting the storage contents of the update storage means after the update by the conversion rule update means to the reference storage means Is provided.
  • the conversion rule update unit updates the conversion rule of the update storage unit in response to the conversion rule update request.
  • the conversion rule reference means refers to the conversion rule of the reference storage means in response to the conversion rule reference request.
  • the storage content reflection means reflects the updated storage contents of the update storage means to the reference storage means.
  • the term unification program of Invention 3 is a term unification program that unifies terms with the same contents and different notations in a document, and includes company information for identifying a company.
  • the company information acquisition step to be acquired, the document acquisition step to acquire the document, the attribute information acquisition step to acquire attribute information related to the attribute of the document, the conversion target term to be converted, and the conversion should be unified Company information acquired in the company information acquisition step in the conversion rule table of the storage means for storing for each company a conversion rule table in which one or more conversion rules including a unified term, the attribute information, and conversion priority are registered
  • a conversion rule corresponding to the attribute information acquired in the attribute information acquisition step is searched from the conversion rule table corresponding to A conversion rule search step, and a term that converts the conversion target term in the document acquired in the document acquisition step into the unified term in descending order of priority based on the conversion rule searched in the conversion rule search step
  • the term unification method of Invention 4 is a term unification method for unifying terms with the same contents and different notations
  • the company information acquisition means specifies the company.
  • a conversion rule search step for searching for a conversion rule corresponding to the attribute information acquired in the attribute information acquisition step, and a term conversion means, based on the conversion rule searched out in the conversion rule search step, in order from the highest priority, A term conversion step of converting the conversion target term in the document acquired in the document acquisition step into the unified term.
  • the conversion is performed based on the conversion rule corresponding to the company information. Even if the terms to be unified are different, they can be converted into unified terms for each company. Further, since the conversion is performed based on the conversion rule corresponding to the attribute information, even if the term to be unified is different for each attribute of the document, it can be converted into the unified term for each attribute of the document. In particular, even when there are a large number of companies and attributes, a configuration is adopted in which conversion rules are registered together in the conversion rule table, so that the data structure can be simplified. Furthermore, since the conversion is performed in the order of higher priority, the possibility that inappropriate conversion occurs when the unified terms in a certain correspondence relationship and the conversion target terms in another correspondence relationship are the same may be reduced. it can.
  • the conversion rule table of the reference storage means when there is a conversion rule reference request during the conversion rule update, the conversion rule table of the reference storage means is referred to, so an update request with a large processing load is issued. Even if it exists, the influence which it has on a reference process can be reduced.
  • FIG. 6 is a diagram showing a data structure of a conversion rule table 400 stored in an update database (hereinafter, the database is simply abbreviated as DB) 156.
  • FIG. It is a sequence flow which shows operation
  • 10 is a flowchart illustrating term conversion processing executed by a term conversion processing unit 154. It is a sequence flow which shows operation
  • 1 to 5 are diagrams showing this embodiment.
  • FIG. 1 is a block diagram showing a configuration of a network system.
  • a term unification system 100 and a plurality of user terminals 200 are connected to a network 199 such as the Internet.
  • the term unification system 100 includes a web server 110 and an internal server 150.
  • the web server 110 is connected to the network 199, and the internal server 150 is connected to the web server 110.
  • the web server 110 includes an interface unit 112 that serves as an interface with the user terminal 200.
  • the interface unit 112 displays a term conversion screen display unit 114 that displays a term conversion screen for mediating input / output of a document to the user terminal 200, and a reference DB 116 that holds the same storage content as the update DB 156. And is configured.
  • the interface unit 112 structures the document to be converted or the document after conversion with XML (eXtensible Markup Language) and holds it as an XML file 170. Further, in response to a request from the user terminal 200, the converted document is also output as a PDF (Portable Document Format) file 172.
  • XML eXtensible Markup Language
  • the internal server 150 includes a term conversion processing unit 154 that converts terms in a document and an update DB 156 that stores a conversion rule table for each company.
  • the user terminal 200 is configured to have the same functions as, for example, a general computer in which a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), an I / F, and the like are connected by a bus. Yes.
  • a storage device such as a HDD (Hard Disk Disk Drive), a display device such as a display, a network adapter, and other devices are connected to the I / F.
  • the hardware configurations of the web server 110 and the internal server 150 are the same.
  • FIG. 2 is a diagram showing a data structure of the conversion rule table 400 stored in the update DB 156. As shown in FIG.
  • the update DB 156 stores a conversion rule table 400 for each company as shown in FIG. Each conversion rule table 400 can be specified by a company ID.
  • each record is registered for each conversion rule. That is, one record constitutes one conversion rule.
  • Each record has a field 402 for registering an ID uniquely assigned to a conversion rule, a field 404 for registering a conversion target term to be converted, and a field for registering a unified term to be converted and unified. 406, a field 408 for registering a document category, a field 410 for registering a document type, a field 412 for registering a classification of items in the document, and a field 414 for registering the priority for conversion. Has been.
  • the priority is an index for controlling that the conversion target term with higher priority is controlled before the other conversion target terms.
  • the priority is set according to the following criteria, for example.
  • the unified term “technology” included in the record with ID “1” and the conversion target term “technology” included in the record with ID “6” are the same.
  • the conversion target term “technology” of “” needs to be converted before the conversion target term “technology” of ID “6”. This is because when the conversion order is reversed, inappropriate conversion occurs that the conversion target term “technology” is converted into the unified term “technique”. Therefore, the priority of the record with ID “6” is set higher than the priority of the record with ID “1”.
  • FIG. 3 is a sequence flow showing operations of the term unification system 100 and the user terminal 200 during term conversion processing.
  • the term conversion screen display unit 114 receives the request and starts internal processing (step S102).
  • the term conversion processing unit 154 acquires the document lock from the term unification system 100 (step S104), and performs the term conversion processing on the XML file 170 that is the document file. Is started (step S106).
  • the web server 110 returns a response to the user terminal 200 when the term conversion process is started (step S108). By receiving this response, the user terminal 200 prevents the browser from being stopped waiting for a response (step S110). Since the document is locked while the term conversion process is being executed, the user terminal 200 cannot edit the document (step S112).
  • step S114 when the term conversion processing is completed (step S114), the term conversion processing unit 154 releases the document lock from the term unification system 100 (step S116). When the lock is released, the user terminal 200 can edit the document (step S118).
  • the term conversion processing unit 154 specifically executes the term conversion processing shown in the flowchart of FIG.
  • FIG. 4 is a flowchart showing term conversion processing executed by the term conversion processing unit 154.
  • the term conversion process is a process for unifying different notation terms with the same content in the document.
  • the process first proceeds to step S200 as shown in FIG.
  • step S200 the company ID of the company that handles the document is input, and the process proceeds to step S202.
  • the company ID may be input from the user terminal 200, or may be input from a database (not shown), session information, or the like.
  • step S202 the document (contents) is input from the XML file 170
  • the process proceeds to step S204, the document category is input from the XML file 170, the process proceeds to step S206, and the document type is input from the XML file 170.
  • the process proceeds to step S208, where the classification of the target item in the document is input from the XML file 170, and the process proceeds to step S210.
  • step S210 the conversion rule table 400 corresponding to the company ID input in step S200 is searched for the conversion rule corresponding to the category, type, and classification input in steps S204 to S208, and the process proceeds to step S212.
  • step S212 the conversion rule with the highest priority is selected from the searched conversion rules, and the same term as the conversion target term included in the selected conversion rule is searched from the document, and the process goes to step S214. Transition.
  • step S214 it is determined whether or not the corresponding conversion target term has been searched. If it is determined that the corresponding conversion target term has been searched (YES), the process proceeds to step S216 and the searched conversion target term is searched. Is converted into a unified term included in the selected conversion rule, and the process proceeds to step S218.
  • step S2128 it is determined whether or not the processing has been completed for all the conversion rules retrieved in step S210. If it is determined that the processing has been completed for all the conversion rules (YES), the process proceeds to step S220.
  • step S220 it is determined whether or not processing has been completed for all items in the document. If it is determined that processing has been completed for all items (YES), the series of processing is terminated and the original processing is restored.
  • step S220 determines whether the processing has been completed for all items (NO). If it is determined in step S220 that the processing has not been completed for all items (NO), the process proceeds to step S208.
  • step S218 determines whether the processing has been completed for all the conversion rules (NO)
  • the process proceeds to step S222, and the next highest priority is set among the conversion rules retrieved in step S210.
  • the selected conversion rule is selected, the same term as the conversion target term included in the selected conversion rule is searched from the document, and the process proceeds to step S214.
  • step S214 when it is determined in step S214 that the corresponding conversion target term is not searched (NO), the process proceeds to step S218.
  • the category “Machine A” and the type “Instruction Manual” are set as document attributes, “Company A” is included in the copyright information, and “Our technology is state-of-the-art IT technology.
  • a document including “is realized by the high-level technology” records with IDs “1”, “3”, “5”, and “6” are searched according to the conversion rule table 400 of FIG. Conversion is performed in the order of IDs “5”, “6”, “1”, and “3” in descending order.
  • the copyright information “A Co., Ltd.” and the text “Our technology is state-of-the-art IT technology and is realized by the high technique of engineers” are obtained.
  • FIG. 5 is a sequence flow showing operations of the term unification system 100 and the user terminal 200 at the time of updating and referring to the database.
  • step S300 When the user terminal 200 makes a conversion rule update request (step S300), in the web server 110, the term conversion screen display unit 114 makes an update request to the update DB 156 (step S302).
  • step S302 When the internal server 150 receives the update request, the internal server 150 writes to the update DB 156 to update the contents of the conversion rule.
  • step S304 If another user terminal 200 makes a conversion rule reference request while updating the update DB 156 (step S304), the term conversion screen display unit 114 makes a reference request to the reference DB 116 in the web server 110 (step S304). In step S306, the conversion rule is searched from the reference DB 116 (step S308), and the search result is returned to the user terminal 200 (step S310).
  • the web server 110 When the update of the update DB 156 is completed (step S312), the web server 110 returns a response to the user terminal 200 (step S314). Further, the internal server 150 asynchronously reflects the stored contents of the updated DB 156 in the reference DB 116 (step S316).
  • a conversion rule including a conversion target term to be converted, a unified term to be converted and unified, a document category, a type and a classification, and a priority for conversion is set to 1.
  • a reference DB 116 for storing a plurality of registered conversion rule tables 400 for each company is provided, and a company ID, a document, a category, a type, and a classification of a company that is a document handling destination are input and correspond to the input company ID.
  • a conversion rule corresponding to the input category, type, and classification is searched from the conversion rule table 400, and conversion target terms in the document are converted into unified terms in descending order of priority based on the searched conversion rule.
  • conversion since conversion is performed based on the conversion rule corresponding to the company ID, even if the term to be unified for each company is different, it can be converted into the unified term for each company.
  • conversion since conversion is performed based on conversion rules corresponding to categories, types, and classifications, uniform terms for each category, type, and classification of documents, even if the terms that should be unified for each category, type, and classification of documents are different. Can be converted to In particular, even when there are a large number of companies and categories, types, and classifications, the configuration in which conversion rules are registered together in the conversion rule table 400 is adopted, so that the data structure can be simplified.
  • the conversion since the conversion is performed in the order of higher priority, the possibility that inappropriate conversion occurs when the unified terms in a certain correspondence relationship and the conversion target terms in another correspondence relationship are the same may be reduced. it can.
  • the conversion rule of the update DB 156 is updated in response to the conversion rule update request, and the conversion rule of the reference DB 116 is referred to in response to the conversion rule reference request while the update DB 156 is being updated. Then, after the update of the update DB 156 is completed, the storage content of the updated DB 156 is reflected in the reference DB 116.
  • the conversion rule table 400 of the reference DB 116 is referred to, so even if there is an update request with a large processing load, the influence on the reference processing Can be reduced.
  • the company ID corresponds to the company information of the invention 1, 3, or 4
  • the category, type, and classification correspond to the attribute information of the invention 1, 3, or 4
  • the web server 110 uses the invention 2
  • the reference DB 116 corresponds to the storage means of the inventions 1 to 4 or the reference storage means of the invention 2.
  • the internal server 150 corresponds to the conversion rule update unit of the second aspect or the storage content reflection unit of the second aspect.
  • the update DB 156 corresponds to the update storage unit of the second aspect. This corresponds to the company information acquisition means of No. 4 or the company information acquisition step of Invention 3 or 4.
  • step S202 corresponds to the document acquisition unit of invention 1 or 4 or the document acquisition step of invention 3 or 4
  • steps S204 to S208 include the attribute information acquisition unit of invention 1 or 4. Or it corresponds to the attribute information acquisition step of invention 3 or 4.
  • steps S210 and S222 correspond to the conversion rule search means of the invention 1 or 4, or the conversion rule search step of the invention 3 or 4
  • steps S212 to S216 correspond to the term conversion means of the invention 1 or 4, or the invention 3 Or it corresponds to the four term conversion steps.
  • the priority is defined to be higher as the value is smaller. However, it can be defined as higher as the value is larger.
  • the non-priority can be set to control the conversion order, this is technically synonymous with setting the priority and controlling the conversion order, and is included in the technical idea of the present invention. It is what is done.
  • the conversion rule table 400 is stored for each company.
  • the following applications are also conceivable.
  • the conversion rule table 400 of the company A is compared with the conversion rule table 400 of one or more other companies, unified terms having the same conversion target terms and different notations are extracted, and the extraction results are filed Etc.
  • Company A can understand the unified terms adopted by Company A that are different from the unified terms adopted by other companies for the same content. Review can be considered.
  • the conversion rule table 400 of the company A is compared with the conversion rule table 400 of one or more other companies, and the conversion target is registered only in the conversion rule table 400 of the other company with the same unified term. Extract terms and output the extraction results to a file.
  • the writer of the company A or the document of the company A can grasp the conversion target terms that are not registered for a certain unified term. By registering this in the conversion rule table 400 of the company A, It is possible to reduce variations in notation for unified terms.
  • the first and second configurations described above are applied to different companies, but can be applied to different categories in the same manner.
  • the first and second configurations described above are applied to different companies, but can be applied to different types as well.

Abstract

 企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システムを提供する。 用語統一システム100は、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、文書のカテゴリ、種別及び分類、並びに変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブル400を企業ごとに記憶する参照用DB116を備える。そして、文書の取り扱い先となる企業の企業ID、文書、カテゴリ、種別及び分類をそれぞれ入力し、入力した企業IDに対応する変換ルールテーブル400から、入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、索出した変換ルールに基づいて、優先度が高い順に、文書における変換対象用語を統一用語に変換する。

Description

用語統一システム及び用語統一プログラム、並びに用語統一方法
 本発明は、文書における同一内容で異なる表記の用語を統一させるシステム及びプログラム、並びに方法に係り、特に、企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システム及び用語統一プログラム、並びに用語統一方法に関する。
 企業が製品に添付するマニュアル等の文書を複数の執筆者が分担して作成する場合に、執筆者によっては、表記にバラツキが生じることがある。例えば、同一内容の用語につき「モニター」「画面」「モニタ」とか、「ユーザー」「ユーザ」「利用者」「使用者」というように異なる表記がなされてしまい、ルールを決めてもなかなか徹底するのが難しい。
 従来、文書における同一内容で異なる表記の用語を統一させる技術としては、例えば、特許文献1、2記載の技術が広く知られている。
 特許文献1記載の技術は、不統一に使用されやすい用字・用語に対応させて、予め統一すべき用字・用語とした「用字・用語リスト」を作成し、文書中の用語が「用字・用語リスト」にあるかどうかをチェックし、変換が必要であれば、該当の用語を「統一用字・用語」に変換する(特許文献1〔0007〕、〔0008〕)。
 特許文献2記載の技術は、標準表記の用語と、これに対応する複数の異表記の用語とを登録して構成され、予め作成された文書内の用語が、用語辞書内の標準表記の用語及びこれに対応する複数の異表記の用語と一致するか否かを検索し、異表記の用語と一致する文書内の用語を標準表記の用語に置換する(特許文献2〔0016〕)。
特開平7-146867号公報 特開平9-259125号公報
 しかしながら、特許文献1、2記載の技術にあっては、次の3つの技術的課題があった。
 第1に、複数の企業の文書を作成する場合は、同一内容の用語であっても、企業によって統一すべき用語が異なることがある。例えば、「ユーザ」という用語について、企業Aからは「利用者」と統一するように要請されるのに対し、企業Bからは「使用者」と統一するように要請されることがある。特許文献1、2記載の技術にあっては、これに対応することができない。
 第2に、同一企業の文書を作成する場合、同一内容の用語であっても、文書の属性によって統一すべき用語が異なることがある。例えば、「テクノロジー」という用語について、機械系の文書では「技術」に統一するように要請されるのに対し、電子系の文書では「テクノロジ」に統一するように要請されることがある。特許文献1、2記載の技術にあっては、これに対応することができない。
 第3に、特許文献1、2記載の技術のように、変換対象用語と統一用語を対応づけて予め辞書等に登録する構成にあっては、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じることがある。例えば、変換対象用語「テクノロジー」と統一用語「技術」を対応づけ、変換対象用語「技術」と統一用語「テクニック」を対応づけて辞書等に登録した場合、文書「当社のテクノロジーは、技術者の高い技術によって実現されています。」は、「当社の技術は、技術者の高いテクニックによって実現されています。」が所望の変換結果であるところ、変換対象用語「テクノロジー」を統一用語「技術」に変換し、その後、変換対象用語「技術」を統一用語「テクニック」に変換すると、「当社のテクニックは、技術者の高いテクニックによって実現されています。」が変換結果として得られてしまう。
 そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、企業ごと及び文書の属性ごとに用語を統一させることができ、しかも、変換対象用語と統一用語の対応関係に影響を受けにくい用語統一システム及び用語統一プログラム、並びに用語統一方法を提供することを目的としている。
 〔発明1〕 上記目的を達成するために、発明1の用語統一システムは、文書における同一内容で異なる表記の用語を統一させる用語統一システムであって、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記文書の属性に関する属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段と、前記企業を特定するための企業情報を取得する企業情報取得手段と、前記文書を取得する文書取得手段と、前記属性情報を取得する属性情報取得手段と、前記企業情報取得手段で取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得手段で取得した属性情報に対応する変換ルールを検索する変換ルール検索手段と、前記変換ルール検索手段で索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得手段で取得した文書における前記変換対象用語を前記統一用語に変換する用語変換手段とを備える。
 このような構成であれば、企業情報取得手段により企業情報が、文書取得手段により文書が、属性情報取得手段により属性情報がそれぞれ取得されると、変換ルール検索手段により、取得された企業情報に対応する変換ルールテーブルから、取得された属性情報に対応する変換ルールが検索される。そして、用語変換手段により、索出された変換ルールに基づいて、優先度が高い順に、取得された文書における変換対象用語が統一用語に変換される。
 ここで、企業とは、経済活動を継続して営む主体をいい、法人及び個人事業者が含まれる。以下、発明3の用語統一プログラム、及び発明4の用語統一方法において同じである。
 また、企業情報取得手段は、例えば、入力装置等から企業情報を入力してもよいし、外部の端末等から企業情報を獲得又は受信してもよいし、記憶装置や記憶媒体等から企業情報を読み出してもよいし、情報処理等により企業情報を生成し又は算出してもよい。したがって、取得には、少なくとも入力、獲得、受信、読出(検索を含む。)、生成及び算出が含まれる。文書取得手段における取得及び属性情報取得手段における取得についても同様であるが、企業情報取得手段、文書取得手段及び属性情報取得手段の取得方法が同一であることを要しない。以下、取得の概念については同じである。
 また、記憶手段において複数の情報を対応づけて記憶することとしては、(1)例えば、情報A及び情報Bを同一のレコードに登録するなど、直接対応づけて記憶すること、(2)例えば、情報A及び中間情報を対応づけて登録するテーブルと、情報B及び中間情報を対応づけて登録するテーブルを設けるなど、中間に1又は複数の情報を介して記憶することが含まれる。すなわち、情報Aから情報Bを辿ることができる態様であれば、あらゆるデータ構造を採用することができる。以下、情報を対応づけて記憶する概念については同じである。
 また、記憶手段は、変換ルールテーブルをあらゆる手段で且つあらゆる時期に記憶するものであり、変換ルールテーブルを予め記憶してあるものであってもよいし、変換ルールテーブルを予め記憶することなく、本システムの動作時に外部からの入力等によって変換ルールテーブルを記憶するようになっていてもよい。
 また、本システムは、単一の装置、端末その他の機器として実現するようにしてもよいし、複数の装置、端末その他の機器を通信可能に接続したネットワークシステムとして実現するようにしてもよい。後者の場合、各構成要素は、それぞれ通信可能に接続されていれば、複数の機器等のうちいずれに属していてもよい。
 〔発明2〕 さらに、発明2の用語統一システムは、発明1の用語統一システムにおいて、前記記憶手段は、前記変換ルールテーブルを企業ごとに記憶する更新用記憶手段と、前記更新用記憶手段と同一の記憶内容を保持するための参照用記憶手段とを有し、前記変換ルールの更新要求に応じて前記更新用記憶手段の変換ルールを更新する変換ルール更新手段と、前記変換ルールの参照要求に応じて前記参照用記憶手段の変換ルールを参照する変換ルール参照手段と、前記変換ルール更新手段による更新後の前記更新用記憶手段の記憶内容を前記参照用記憶手段に反映する記憶内容反映手段とを備える。
 このような構成であれば、変換ルール更新手段により、変換ルールの更新要求に応じて更新用記憶手段の変換ルールが更新される。更新用記憶手段の更新中は、変換ルール参照手段により、変換ルールの参照要求に応じて参照用記憶手段の変換ルールが参照される。そして、更新用記憶手段の更新完了後は、記憶内容反映手段により、更新後の更新用記憶手段の記憶内容が参照用記憶手段に反映される。
 〔発明3〕 一方、上記目的を達成するために、発明3の用語統一プログラムは、文書における同一内容で異なる表記の用語を統一させる用語統一プログラムであって、企業を特定するための企業情報を取得する企業情報取得ステップと、前記文書を取得する文書取得ステップと、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む処理をコンピュータに実行させるためのプログラムである。
 このような構成であれば、コンピュータによってプログラムが読み取られ、読み取られたプログラムに従ってコンピュータが処理を実行すると、発明1の用語統一システムと同等の作用が得られる。
 〔発明4〕 一方、上記目的を達成するために、発明4の用語統一方法は、文書における同一内容で異なる表記の用語を統一させる用語統一方法であって、企業情報取得手段が、企業を特定するための企業情報を取得する企業情報取得ステップと、文書取得手段が、前記文書を取得する文書取得ステップと、属性情報取得手段が、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、変換ルール検索手段が、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、用語変換手段が、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む。
 以上説明したように、発明1の用語統一システム、発明3の用語統一プログラム、又は発明4の用語統一方法によれば、企業情報に対応する変換ルールに基づいて変換が行われるので、企業ごとに統一すべき用語が異なる場合でも、企業ごとの統一用語に変換することができる。また、属性情報に対応する変換ルールに基づいて変換が行われるので、文書の属性ごとに統一すべき用語が異なる場合でも、文書の属性ごとの統一用語に変換することができる。特に、企業及び属性が多数に及んでも、変換ルールテーブルに変換ルールをまとめて登録する構成を採用しているので、データ構造を簡素化することができる。さらに、優先度が高い順に変換が行われるので、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じる可能性を低減することができる。
 さらに、発明2の用語統一システムによれば、変換ルールの更新中に変換ルールの参照要求があった場合は、参照用記憶手段の変換ルールテーブルが参照されるので、処理負荷が大きい更新要求があっても、参照処理に与える影響を低減することができる。
ネットワークシステムの構成を示すブロック図である。 更新用データベース(以下、データベースのことを単にDBと略記する。)156に記憶されている変換ルールテーブル400のデータ構造を示す図である。 用語変換処理時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。 用語変換処理部154で実行する用語変換処理を示すフローチャートである。 データベースの更新及び参照時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
 以下、本発明の実施の形態を説明する。図1乃至図5は、本実施の形態を示す図である。
 まず、本発明を適用するネットワークシステムの構成を説明する。
 図1は、ネットワークシステムの構成を示すブロック図である。
 インターネット等のネットワーク199には、図1に示すように、用語統一システム100と、複数のユーザ端末200とが接続されている。
 用語統一システム100は、ウェブサーバ110と、内部サーバ150とを有して構成されている。ウェブサーバ110はネットワーク199に、内部サーバ150はウェブサーバ110にそれぞれ接続されている。
 ウェブサーバ110は、ユーザ端末200とのインターフェースとなるインターフェース部112を有して構成されている。インターフェース部112は、ユーザ端末200に対して文書の入出力を媒介するための用語変換画面を表示する用語変換画面表示部114と、更新用DB156と同一の記憶内容を保持するための参照用DB116とを有して構成されている。
 インターフェース部112は、変換対象又は変換後の文書をXML(eXtensible Markup Language)で構造化し、XMLファイル170として保持する。また、ユーザ端末200からの要求に応じて、変換後の文書をPDF(Portable Document Format)ファイル172としても出力する。
 内部サーバ150は、文書中の用語を変換する用語変換処理部154と、企業ごとに変換ルールテーブルを記憶する更新用DB156とを有して構成されている。
 ユーザ端末200は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)及びI/F等をバス接続した一般的なコンピュータと同一機能を有して構成されている。I/Fには、HDD(Hard Disk Drive)等の記憶装置、ディスプレイ等の表示装置、ネットワークアダプタその他の装置が接続されている。ウェブサーバ110及び内部サーバ150のハードウェア構成も同様である。
 次に、更新用DB156のデータ構造を説明する。なお、参照用DB116のデータ構造については、更新用DB156と同様であるので説明を省略する。
 図2は、更新用DB156に記憶されている変換ルールテーブル400のデータ構造を示す図である。
 更新用DB156は、図2に示すように、企業ごとに変換ルールテーブル400を記憶している。各変換ルールテーブル400は、企業IDにより特定することができる。
 変換ルールテーブル400には、変換ルールごとに1つのレコードが登録されている。すなわち、1つのレコードが1つの変換ルールを構成する。各レコードは、変換ルールに対して一意に割り当てられたIDを登録するフィールド402と、変換の対象となる変換対象用語を登録するフィールド404と、変換を行って統一すべき統一用語を登録するフィールド406と、文書のカテゴリを登録するフィールド408と、文書の種別を登録するフィールド410と、文書における項目の分類を登録するフィールド412と、変換を行う優先度を登録するフィールド414とを含んで構成されている。
 優先度は、優先度が高く設定されている変換対象用語ほど他の変換対象用語よりも先に変換が行われることを制御するための指標であって、値が小さいほど優先度は高いと定義する。優先度の設定は、例えば、次の基準により行う。
 第1に、図2の例では、ID「1」のレコードに含まれる統一用語「技術」と、ID「6」のレコードに含まれる変換対象用語「技術」が同一であるので、ID「6」の変換対象用語「技術」は、ID「6」の変換対象用語「テクノロジー」よりも先に変換を行う必要がある。変換順序が逆になった場合は、変換対象用語「テクノロジー」が統一用語「テクニック」に変換されてしまうという不適切な変換が生じるからである。そこで、ID「6」のレコードの優先度をID「1」のレコードの優先度よりも高く設定する。
 第2に、図2の例では、ID「3」~「5」のレコードのように、変換対象用語が複合語で構成されている場合は、変換対象用語のバイト数や文字列の長さが大きいものほど先に変換を行う必要がある。そこで、変換対象用語のバイト数や文字列の長さが大きいものほど優先度を高く設定する。
 次に、本実施の形態の動作を説明する。
 まず、用語変換処理時の動作を説明する。
 図3は、用語変換処理時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
 ユーザ端末200が用語変換処理の実行をリクエストすると(ステップS100)、ウェブサーバ110では、用語変換画面表示部114がリクエストを受け内部処理を開始する(ステップS102)。内部サーバ150では、内部処理が開始されると、用語変換処理部154が、文書のロックを用語統一システム100から取得し(ステップS104)、文書のファイルであるXMLファイル170に対して用語変換処理を開始する(ステップS106)。
 ウェブサーバ110では、用語変換処理を開始した時点でユーザ端末200にレスポンスを返す(ステップS108)。ユーザ端末200では、このレスポンスを受けることにより、レスポンス待ちでブラウザが停止することが防止される(ステップS110)。用語変換処理が実行されている間は、文書がロックされているので、ユーザ端末200では、文書を編集することはできない(ステップS112)。
 内部サーバ150では、用語変換処理が完了すると(ステップS114)、用語変換処理部154が文書のロックを用語統一システム100から解放する(ステップS116)。ロックが解放されると、ユーザ端末200では、文書を編集することができるようになる(ステップS118)。
 用語変換処理部154では、具体的に、図4のフローチャートに示す用語変換処理が実行される。
 図4は、用語変換処理部154で実行する用語変換処理を示すフローチャートである。
 用語変換処理は、文書における同一内容で異なる表記の用語を統一させる処理であって、用語変換処理部154において実行されると、図4に示すように、まず、ステップS200に移行する。
 ステップS200では、文書の取り扱い先となる企業の企業IDを入力し、ステップS202に移行する。企業IDは、ユーザ端末200から入力してもよいし、データベース(不図示)やセッション情報等から入力してもよい。
 ステップS202では、XMLファイル170から文書(内容)を入力し、ステップS204に移行して、XMLファイル170から文書のカテゴリを入力し、ステップS206に移行して、XMLファイル170から文書の種別を入力し、ステップS208に移行し、XMLファイル170から文書における対象項目の分類を入力し、ステップS210に移行する。
 ステップS210では、ステップS200で入力した企業IDに対応する変換ルールテーブル400から、ステップS204~S208で入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、ステップS212に移行する。
 ステップS212では、索出した変換ルールのうち優先度が最も高く設定されている変換ルールを選択し、選択した変換ルールに含まれる変換対象用語と同一の用語を文書中から検索し、ステップS214に移行する。
 ステップS214では、該当の変換対象用語を索出したか否かを判定し、該当の変換対象用語を索出したと判定した場合(YES)は、ステップS216に移行して、索出した変換対象用語を、選択した変換ルールに含まれる統一用語に変換し、ステップS218に移行する。
 ステップS218では、ステップS210で索出したすべての変換ルールについて処理が終了したか否かを判定し、すべての変換ルールについて処理が終了したと判定した場合(YES)は、ステップS220に移行する。
 ステップS220では、文書におけるすべての項目について処理が終了したか否かを判定し、すべての項目について処理が終了したと判定した場合(YES)は、一連の処理を終了して元の処理に復帰させる。
 一方、ステップS220で、すべての項目について処理が終了していないと判定した場合(NO)は、ステップS208に移行する。
 一方、ステップS218で、すべての変換ルールについて処理が終了していないと判定した場合(NO)は、ステップS222に移行して、ステップS210で索出した変換ルールのうち優先度が次に高く設定されている変換ルールを選択し、選択した変換ルールに含まれる変換対象用語と同一の用語を文書中から検索し、ステップS214に移行する。
 一方、ステップS214で、該当の変換対象用語を索出しないと判定した場合(NO)は、ステップS218に移行する。
 例えば、文書の属性としてカテゴリ「機械A」及び種別「取扱説明書」が設定され、著作権情報に「A社」を、本文に「当社のテクノロジーは、最先端のIT技術であり、技術者の高い技術によって実現されています。」を含む文書が与えられた場合、図2の変換ルールテーブル400によれば、ID「1」「3」「5」「6」のレコードが検索され、優先度が高いID「5」「6」「1」「3」の順に変換が行われる。その結果、著作権情報「株式会社A」及び本文「当社の技術は、最先端のITテクノロジーであり、技術者の高いテクニックによって実現されています。」が得られる。
 次に、データベースの更新及び参照時の動作を説明する。
 図5は、データベースの更新及び参照時の用語統一システム100及びユーザ端末200の動作を示すシーケンスフローである。
 ユーザ端末200が変換ルールの更新要求を行うと(ステップS300)、ウェブサーバ110では、用語変換画面表示部114が更新用DB156に対する更新要求を行う(ステップS302)。内部サーバ150では、更新要求を受けると、更新用DB156に対して、変換ルールの内容を更新すべく書き込みを行う。
 更新用DB156の更新中に、他のユーザ端末200が変換ルールの参照要求を行うと(ステップS304)、ウェブサーバ110では、用語変換画面表示部114が、参照用DB116に対する参照要求を行い(ステップS306)、参照用DB116から変換ルールを検索し(ステップS308)、検索結果をユーザ端末200に返す(ステップS310)。
 更新用DB156の更新が完了すると(ステップS312)、ウェブサーバ110では、ユーザ端末200にレスポンスを返す(ステップS314)。また、内部サーバ150では、更新後の更新用DB156の記憶内容を参照用DB116に非同期で反映する(ステップS316)。
 このようにして、本実施の形態では、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、文書のカテゴリ、種別及び分類、並びに変換を行う優先度を含む変換ルールを1又は複数登録した変換ルールテーブル400を企業ごとに記憶する参照用DB116を備え、文書の取り扱い先となる企業の企業ID、文書、カテゴリ、種別及び分類をそれぞれ入力し、入力した企業IDに対応する変換ルールテーブル400から、入力したカテゴリ、種別及び分類に対応する変換ルールを検索し、索出した変換ルールに基づいて、優先度が高い順に、文書における変換対象用語を統一用語に変換する。
 これにより、企業IDに対応する変換ルールに基づいて変換が行われるので、企業ごとに統一すべき用語が異なる場合でも、企業ごとの統一用語に変換することができる。また、カテゴリ、種別及び分類に対応する変換ルールに基づいて変換が行われるので、文書のカテゴリ、種別及び分類ごとに統一すべき用語が異なる場合でも、文書のカテゴリ、種別及び分類ごとの統一用語に変換することができる。特に、企業並びにカテゴリ、種別及び分類が多数に及んでも、変換ルールテーブル400に変換ルールをまとめて登録する構成を採用しているので、データ構造を簡素化することができる。さらに、優先度が高い順に変換が行われるので、ある対応関係にある統一用語と、他の対応関係における変換対象用語が同一である場合に、不適切な変換が生じる可能性を低減することができる。
 さらに、本実施の形態では、変換ルールの更新要求に応じて更新用DB156の変換ルールを更新し、更新用DB156の更新中は、変換ルールの参照要求に応じて参照用DB116の変換ルールを参照し、更新用DB156の更新完了後は、更新後の更新用DB156の記憶内容を参照用DB116に反映する。
 これにより、変換ルールの更新中に変換ルールの参照要求があった場合は、参照用DB116の変換ルールテーブル400が参照されるので、処理負荷が大きい更新要求があっても、参照処理に与える影響を低減することができる。
 本実施の形態において、企業IDは、発明1、3又は4の企業情報に対応し、カテゴリ、種別及び分類は、発明1、3又は4の属性情報に対応し、ウェブサーバ110は、発明2の変換ルール参照手段に対応し、参照用DB116は、発明1乃至4の記憶手段、又は発明2の参照用記憶手段に対応している。また、内部サーバ150は、発明2の変換ルール更新手段、又は発明2の記憶内容反映手段に対応し、更新用DB156は、発明2の更新用記憶手段に対応し、ステップS200は、発明1若しくは4の企業情報取得手段、又は発明3若しくは4の企業情報取得ステップに対応している。
 また、本実施の形態において、ステップS202は、発明1若しくは4の文書取得手段、又は発明3若しくは4の文書取得ステップに対応し、ステップS204~S208は、発明1若しくは4の属性情報取得手段、又は発明3若しくは4の属性情報取得ステップに対応している。また、ステップS210、S222は、発明1若しくは4の変換ルール検索手段、又は発明3若しくは4の変換ルール検索ステップに対応し、ステップS212~S216は、発明1若しくは4の用語変換手段、又は発明3若しくは4の用語変換ステップに対応している。
〔その他の変形例〕
 なお、上記実施の形態において、優先度は、値が小さいほど高いと定義したが、値が大きいほど高いと定義することもできる。また、非優先度を設定して変換順序を制御することもできるが、これは、優先度を設定して変換順序を制御することと技術的に同義であり、本発明の技術的思想に包摂されるものである。
 また、上記実施の形態及びその変形例においては、企業ごとに変換ルールテーブル400を記憶しているので、例えば、次のような応用も考えられる。
 第1に、企業Aについて、企業Aの変換ルールテーブル400と、1又は複数の他社の変換ルールテーブル400を比較し、変換対象用語が同一で表記が異なる統一用語を抽出し、抽出結果をファイル等に出力する。これにより、企業Aは、企業Aが採用している統一用語のうち、同一内容につき他社で採用している統一用語とは異なるものを把握することができるので、他社との関係で統一用語の見直しを検討することができる。
 第2に、企業Aについて、企業Aの変換ルールテーブル400と、1又は複数の他社の変換ルールテーブル400を比較し、統一用語が同一で他社の変換ルールテーブル400にのみ登録されている変換対象用語を抽出し、抽出結果をファイル等に出力する。これにより、企業A又は企業Aの文書の執筆者は、ある統一用語につき登録していない変換対象用語を把握することができるので、これを企業Aの変換ルールテーブル400に登録することにより、その統一用語について表記のバラツキを低減することができる。
 第3に、上記第1及び第2の構成は、異なる企業間について適用したが、異なるカテゴリ間についても同様に適用することもできる。
 第4に、上記第1及び第2の構成は、異なる企業間について適用したが、異なる種別間についても同様に適用することもできる。
 第5に、上記第1及び第2の構成は、異なる企業間について適用したが、異なる分類間についても同様に適用することもできる。
100…用語統一システム、 110…ウェブサーバ、 112…インターフェース部、 114…用語変換画面表示部、 116…参照用DB、 150…内部サーバ、 154…用語変換処理部、 156…更新用DB、 170…XMLファイル、 172…PDFファイル、 199…ネットワーク、 200…ユーザ端末、 400…変換ルールテーブル

Claims (6)

  1.  文書における同一内容で異なる表記の用語を統一させる用語統一システムであって、
     変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記文書の属性に関する属性情報、及び当該変換対象用語が複合語で構成されている場合は当該変換対象用語のバイト数又は文字列の長さが大きいほど高く設定された優先度を含む変換ルールを複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段と、
     前記企業を特定するための企業情報を取得する企業情報取得手段と、
     前記文書を取得する文書取得手段と、
     前記属性情報を取得する属性情報取得手段と、
     前記企業情報取得手段で取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得手段で取得した属性情報に対応する変換ルールを検索する変換ルール検索手段と、
     前記変換ルール検索手段で索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得手段で取得した文書における前記変換対象用語を前記統一用語に変換する用語変換手段とを備えることを特徴とする用語統一システム。
  2.  請求項1において、
     前記記憶手段は、前記変換ルールテーブルを企業ごとに記憶する更新用記憶手段と、前記更新用記憶手段と同一の記憶内容を保持するための参照用記憶手段とを有し、
     前記変換ルールの更新要求に応じて前記更新用記憶手段の変換ルールを更新する変換ルール更新手段と、
     前記変換ルールの参照要求に応じて前記参照用記憶手段の変換ルールを参照する変換ルール参照手段と、
     前記変換ルール更新手段による更新後の前記更新用記憶手段の記憶内容を前記参照用記憶手段に反映する記憶内容反映手段とを備えることを特徴とする用語統一システム。
  3.  請求項1及び2のいずれか1項において、
     対象の前記企業について、当該企業に係る前記変換ルールテーブルと、当該企業以外の他の前記企業に係る前記変換ルールテーブルを比較し、前記変換対象用語が同一で表記が異なる前記統一用語を抽出する統一用語抽出手段を備えることを特徴とする用語統一システム。
  4.  請求項1乃至3のいずれか1項において、
     対象の前記企業について、当該企業に係る前記変換ルールテーブルと、当該企業以外の他の前記企業に係る前記変換ルールテーブルを比較し、前記統一用語が同一で当該他の企業に係る変換ルールテーブルにのみ登録されている前記変換対象用語を抽出する変換対象用語抽出手段を備えることを特徴とする用語統一システム。
  5.  文書における同一内容で異なる表記の用語を統一させる用語統一プログラムであって、
     企業を特定するための企業情報を取得する企業情報取得ステップと、
     前記文書を取得する文書取得ステップと、
     前記文書の属性に関する属性情報を取得する属性情報取得ステップと、
     変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び当該変換対象用語が複合語で構成されている場合は当該変換対象用語のバイト数又は文字列の長さが大きいほど高く設定された優先度を含む変換ルールを複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、
     前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含む処理をコンピュータに実行させるためのプログラムであることを特徴とする用語統一プログラム。
  6.  文書における同一内容で異なる表記の用語を統一させる用語統一方法であって、
     企業情報取得手段が、企業を特定するための企業情報を取得する企業情報取得ステップと、
     文書取得手段が、前記文書を取得する文書取得ステップと、
     属性情報取得手段が、前記文書の属性に関する属性情報を取得する属性情報取得ステップと、
     変換ルール検索手段が、変換の対象となる変換対象用語、変換を行って統一すべき統一用語、前記属性情報、及び当該変換対象用語が複合語で構成されている場合は当該変換対象用語のバイト数又は文字列の長さが大きいほど高く設定された優先度を含む変換ルールを複数登録した変換ルールテーブルを企業ごとに記憶する記憶手段の変換ルールテーブルのうち前記企業情報取得ステップで取得した企業情報に対応する変換ルールテーブルから、前記属性情報取得ステップで取得した属性情報に対応する変換ルールを検索する変換ルール検索ステップと、
     用語変換手段が、前記変換ルール検索ステップで索出した変換ルールに基づいて、前記優先度が高い順に、前記文書取得ステップで取得した文書における前記変換対象用語を前記統一用語に変換する用語変換ステップとを含むことを特徴とする用語統一方法。
PCT/JP2015/061034 2014-04-08 2015-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法 WO2015156336A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014079125A JP5696280B1 (ja) 2014-04-08 2014-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法
JP2014-079125 2014-04-08

Publications (1)

Publication Number Publication Date
WO2015156336A1 true WO2015156336A1 (ja) 2015-10-15

Family

ID=52836993

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/061034 WO2015156336A1 (ja) 2014-04-08 2015-04-08 用語統一システム及び用語統一プログラム、並びに用語統一方法

Country Status (2)

Country Link
JP (1) JP5696280B1 (ja)
WO (1) WO2015156336A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129577A (ja) * 1993-10-29 1995-05-19 Fuji Xerox Co Ltd 文書校正支援装置
JPH09259125A (ja) * 1996-03-27 1997-10-03 Hitachi Kokusai Business:Kk 文書作成支援システム及び用語辞書
JP2011198077A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd 管理装置、修正候補出力方法および修正候補出力プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06176018A (ja) * 1992-12-07 1994-06-24 Fuji Xerox Co Ltd 校正支援装置
JPH0785040A (ja) * 1993-09-13 1995-03-31 Hitachi Ltd 表記不統一検出方法およびかな漢字変換方法
JPH07325826A (ja) * 1994-05-31 1995-12-12 Meidensha Corp 日本語処理システム
JP2002157241A (ja) * 2000-09-06 2002-05-31 Fujitsu Ltd 辞書作成装置
JP2003141108A (ja) * 2001-11-08 2003-05-16 Canon Inc 異表記変換方法、異表記変換装置及び記録媒体
JP5243103B2 (ja) * 2008-05-19 2013-07-24 株式会社野村総合研究所 データベースシステム及びデータベースシステムにおける差分コピーの遅延自動復旧方法
JP2012256197A (ja) * 2011-06-08 2012-12-27 Toshiba Corp 表記ゆれ検出装置及び表記ゆれ検出プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07129577A (ja) * 1993-10-29 1995-05-19 Fuji Xerox Co Ltd 文書校正支援装置
JPH09259125A (ja) * 1996-03-27 1997-10-03 Hitachi Kokusai Business:Kk 文書作成支援システム及び用語辞書
JP2011198077A (ja) * 2010-03-19 2011-10-06 Fujitsu Ltd 管理装置、修正候補出力方法および修正候補出力プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Top Page > Yoku aru Shitsumon > Toitsu Yogoshu · Sanko Jisho·Sanko Taiyakusho · Mushi Tangocho", 14 May 2010 (2010-05-14), Retrieved from the Internet <URL:https://web.archive.org/web/20100514212611/http://www.tratool.com/freelance/faq06.html> [retrieved on 20140516] *

Also Published As

Publication number Publication date
JP2015201024A (ja) 2015-11-12
JP5696280B1 (ja) 2015-04-08

Similar Documents

Publication Publication Date Title
US8392465B2 (en) Dependency graphs for multiple domains
JP4879580B2 (ja) ユーザ・インタフェースに自動探索メニューを与えるシステムおよび方法
US8392472B1 (en) Auto-classification of PDF forms by dynamically defining a taxonomy and vocabulary from PDF form fields
US20090043778A1 (en) Generating etl packages from template
US9740698B2 (en) Document merge based on knowledge of document schema
US20090319499A1 (en) Query processing with specialized query operators
JP6070936B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2006012146A (ja) 影響分析のためのシステムおよび方法
KR101355273B1 (ko) 컴퓨팅 시스템 및 그 실행 제어 방법과, 그 실행 제어 프로그램을 기록한 기록 매체
US20220035847A1 (en) Information retrieval
US20100251227A1 (en) Binary resource format and compiler
US9734178B2 (en) Searching entity-key associations using in-memory objects
US9053450B2 (en) Automated business process modeling
US9489459B2 (en) Single point metadata driven search configuration, indexing and execution
US8433729B2 (en) Method and system for automatically generating a communication interface
US7475090B2 (en) Method and apparatus for moving data from an extensible markup language format to normalized format
CN111190905A (zh) 数据库表格处理方法、装置及电子设备
US8862609B2 (en) Expanding high level queries
CN110704432A (zh) 数据索引的建立方法和装置、可读存储介质、电子设备
US20220121665A1 (en) Computerized Methods and Systems for Selecting a View of Query Results
US8776098B2 (en) Exchanging data using data transformation
US9037542B2 (en) Reducing programming complexity in client applications when interfacing with database servers operating with different programming interfaces
US8938715B2 (en) Using the z/OS load module system status index to distinguish product tag files
US11157506B2 (en) Multiform persistence abstraction
JP5696280B1 (ja) 用語統一システム及び用語統一プログラム、並びに用語統一方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15776166

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15776166

Country of ref document: EP

Kind code of ref document: A1