JP2023149188A - Correction support method, correction support program, and information processing apparatus - Google Patents

Correction support method, correction support program, and information processing apparatus Download PDF

Info

Publication number
JP2023149188A
JP2023149188A JP2022057621A JP2022057621A JP2023149188A JP 2023149188 A JP2023149188 A JP 2023149188A JP 2022057621 A JP2022057621 A JP 2022057621A JP 2022057621 A JP2022057621 A JP 2022057621A JP 2023149188 A JP2023149188 A JP 2023149188A
Authority
JP
Japan
Prior art keywords
modification
correction
candidate
data
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022057621A
Other languages
Japanese (ja)
Inventor
康貴 森脇
Yasutaka Moriwaki
唯 野間
Yui Noma
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2022057621A priority Critical patent/JP2023149188A/en
Publication of JP2023149188A publication Critical patent/JP2023149188A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

To present a correction candidate on the basis of contents of editing performed in the past by a worker.SOLUTION: An information processing apparatus 100 accepts a data table including a plurality of records. The information processing apparatus 100 specifies a plurality of pieces of correction candidate data being candidates to be corrected, out of a plurality of pieces of data included in the plurality of records on the basis of an analysis result of the accepted data table. The information processing apparatus 100 selects one piece of correction candidate data from the plurality of pieces of specified correction candidate data on the basis of records subjected to data editing in the past out of the plurality of records. The information processing apparatus 100 outputs the selected piece of correction candidate data.SELECTED DRAWING: Figure 2

Description

本発明は、修正支援方法等に関する。 The present invention relates to a modification support method and the like.

各種の分野において、使用される用語が統一されていない場合がある。たとえば、「氏名」および「名前」は同じ意味を表しているが表記が異なるため、システム上では、全く別のデータとして処理され、正確にデータを連携することができない原因になる。 Terminology used in various fields may not be standardized. For example, "name" and "name" have the same meaning but are written differently, so they are treated as completely different data on the system, making it impossible to accurately link the data.

同義語や上位語、下位語を定義した統制語彙データを作成し、利用することで、用語の曖昧性を吸収し、上記のような問題を解消できる。統制語彙データは、用語の曖昧さや同形異義、異形同義によって生じる検索の漏れ等を防ぐために、複数の用語間の意味的関係性をまとめた辞書であり、人手によって作成される。 By creating and using controlled vocabulary data that defines synonyms, hypernyms, and hyponyms, ambiguity in terms can be absorbed and problems such as those described above can be resolved. Controlled vocabulary data is a dictionary that summarizes the semantic relationships between multiple terms, and is created manually to prevent omissions in searches caused by ambiguity, homographs, and synonyms of terms.

図15は、統制語彙データのデータ構造の一例について説明する図である。一例として、統制語彙データのデータ構造を表形式のフォーマットで説明する。図15に示すように、統制語彙データ10は、用語名列10a、代表語列10b、言語列10c、代表語のURI列10d、上位語のURI列10eを有する。 FIG. 15 is a diagram illustrating an example of the data structure of controlled vocabulary data. As an example, the data structure of controlled vocabulary data will be explained in a tabular format. As shown in FIG. 15, the controlled vocabulary data 10 includes a term name column 10a, a representative word column 10b, a language column 10c, a representative word URI column 10d, and a hypernym URI column 10e.

用語名列10aには、特定の分野で利用される用語集の用語名が設定される。代表語列10bには、代表語が設定される。代表語は、複数種類の用語名を代表する名称(標目)である。たとえば、図15に示す例では、用語名「3Dプリンタ」、「3Dプリンター」の代表語として「3Dプリンタ」が設定されている。 The term name column 10a is set with term names from a glossary used in a specific field. Representative words are set in the representative word string 10b. A representative word is a name (heading) that represents multiple types of term names. For example, in the example shown in FIG. 15, "3D printer" is set as the representative word for the term "3D printer" and "3D printer."

言語列10cには、作業者が、統制語彙データを入力する場合に用いた言語が設定される。たとえば、「ja」は日本語を示し、「en」は英語を示す。図15に示す例では、統制語彙データ10の1、2行目の言語が「ja」となっているため、作業者は、統制語彙データ10の1、2行目のデータを、日本語で入力したことを示す。統制語彙データ10の3行目の言語が「en」となっているため、作業者は、統制語彙データ10の3行目のデータを、英語で入力したことを示す。 The language column 10c is set with the language used by the operator when inputting the controlled vocabulary data. For example, "ja" indicates Japanese, and "en" indicates English. In the example shown in FIG. 15, the language in the first and second lines of the controlled vocabulary data 10 is "ja", so the operator can write the data in the first and second lines of the controlled vocabulary data 10 in Japanese. Indicates input. Since the language in the third line of the controlled vocabulary data 10 is "en," this indicates that the operator has input the data in the third line of the controlled vocabulary data 10 in English.

代表語のURI列10dには、代表語のURI(Uniform Resource Identifier)が設定される。上位語のURI列10eには、上位語のURIが設定される。 The URI (Uniform Resource Identifier) of the representative word is set in the representative word URI column 10d. The URI of a broader term is set in the URI column 10e of a broader term.

以下の説明では、用語名列10aの値(用語)および代表語列の値(代表語)が同義関係である用語をまとめたものを、「同義サブグループ」と表記する。図15に示す例では、1行目~2行目の情報(レコード)が、同義サブグループ10-sub1に属する。3行目の情報が、同義サブグループ10-sub2に属する。各同義サブグループは内部で、ユニークな代表語、代表語のURI、上位語のURIを持つものとする。 In the following description, a group of terms whose values (terms) in the term name column 10a and values (representative terms) in the representative word string have a synonymous relationship will be referred to as a "synonymous subgroup." In the example shown in FIG. 15, the information (records) in the first and second lines belong to the synonymous subgroup 10-sub1. The information on the third line belongs to the synonymous subgroup 10-sub2. It is assumed that each synonymous subgroup has a unique representative word, URI of the representative word, and URI of a broader term.

たとえば、同義サブグループ10-sub1には、ユニークな代表語「3Dプリンタ」、ユニークな代表語のURI「http://myVocab/1」、ユニークな上位語のURI「http://myVocab/24」が設定されている。 For example, synonymous subgroup 10-sub1 includes the unique representative word "3D printer," the unique representative word URI "http://myVocab/1," and the unique hypernym URI "http://myVocab/24." " is set.

また、言語が異なる各同義グループは、同じ代表語のURIを持つことを許容する。同じ代表語のURIを持つ。同じ代表語のURIを持つ各同義サブグループをまとめて、同義グループと表記する。図15に示す例では、1行目~3行目の情報(レコード)が、同義グループ10-1に属する。同義グループの内部では、ユニークな上位語のURIを持つとする。たとえば、同義グループ10-1には、ユニークな上位語のURI「http://myVocab/24」が設定されている。 Further, each synonym group having a different language is allowed to have a URI of the same representative word. They have the same representative word URI. Synonymous subgroups having the same representative word URI are collectively referred to as a synonymous group. In the example shown in FIG. 15, the information (records) in the first to third lines belong to the synonymous group 10-1. It is assumed that a synonym group has a unique URI of a broader term. For example, a unique hypernym URI "http://myVocab/24" is set for the synonym group 10-1.

続いて、同義サブグループおよび同義グループに関する「不整合」について定義する。図16および図17は、不整合を説明するための図である。一例として、図16において、不整合A,B,C,Dについて説明し、図17において、不整合E,Fについて説明する。 Next, "inconsistency" regarding synonymous subgroups and synonymous groups will be defined. FIGS. 16 and 17 are diagrams for explaining mismatch. As an example, mismatches A, B, C, and D will be described in FIG. 16, and mismatches E and F will be described in FIG. 17.

図16について説明する。統制語彙データ11aを用いて、「不整合A」について説明する。不整合Aは、同一の同義サブグループ内において、代表語が2種類以上存在するものである。たとえば、統制語彙データ11aにおいて、同一の同義サブグループ11a-sub1には、2種類の代表語「3Dプリンター」、「3Dプリンタ」が設定されており、不整合Aに該当する。 FIG. 16 will be explained. “Inconsistency A” will be explained using the controlled vocabulary data 11a. Inconsistency A is when two or more types of representative words exist within the same synonymous subgroup. For example, in the controlled vocabulary data 11a, two types of representative words "3D printer" and "3D printer" are set in the same synonymous subgroup 11a-sub1, which corresponds to inconsistency A.

統制語彙データ11bを用いて、「不整合B」について説明する。不整合Bは、同一の同義サブグループにおいて、代表語のURIが2種類存在するものである。たとえば、統制語彙データ11bにおいて、同一の同義サブグループ11b-sub1では、2種類の代表語のURI「http://myVocab/1」、「http://myVocab/2」が設定されており、不整合Bに該当する。 “Inconsistency B” will be explained using the controlled vocabulary data 11b. Inconsistency B is when there are two types of URIs for representative words in the same synonymous subgroup. For example, in the controlled vocabulary data 11b, two types of representative word URIs "http://myVocab/1" and "http://myVocab/2" are set for the same synonymous subgroup 11b-sub1, This corresponds to inconsistency B.

統制語彙データ11cを用いて、「不整合C」について説明する。不整合Cは、ある同義サブグループに設定された上位語のURIが2種類以上存在するものである。たとえば、統制語彙データ11cにおいて、同一の同義サブグループ11c-sub1では、2種類の上位語のURI「http://myVocab/25」、「http://myVocab/24」が設定されており、不整合Cに該当する。 “Inconsistency C” will be explained using the controlled vocabulary data 11c. Inconsistency C is one in which there are two or more types of URI of a hypernym set in a certain synonymous subgroup. For example, in the controlled vocabulary data 11c, two types of hypernym URIs "http://myVocab/25" and "http://myVocab/24" are set for the same synonymous subgroup 11c-sub1, This corresponds to Inconsistency C.

統制語彙データ11dを用いて、「不整合D」について説明する。不整合Dは、言語が同じ異なる同義サブグループ間において代表語のURIが同一となるものである。たとえば、統制語彙データ11dにおいて、同義サブグループ11c-sub1,11c-sub2の言語は「ja」で同一の言語であり、代表語のURIが「http://myVocab/1」で同一であり、不整合Dに該当する。仮に、同義サブグループ11c-sub1、同義サブグループ11c-sub2のどちらか一方の言語が「en」であれば、不整合Dに該当しない。 “Inconsistency D” will be explained using the controlled vocabulary data 11d. Inconsistency D is one in which the URI of the representative word is the same between different synonymous subgroups that use the same language. For example, in the controlled vocabulary data 11d, the languages of the synonymous subgroups 11c-sub1 and 11c-sub2 are "ja", which is the same language, and the URIs of the representative words are "http://myVocab/1", which are the same, This corresponds to inconsistency D. If the language of either the synonymous subgroup 11c-sub1 or the synonymous subgroup 11c-sub2 is "en", the mismatch D does not apply.

図17の説明に移行する。統制語彙データ11eを用いて、「不整合E」について説明する。不整合Eは、同一の同義グループ内において上位語のURIが2種類以上となるものである。たとえば、統制語彙データ11eにおいて、同義グループ11e-1では、2種類の上位語のURI「http://myVocab/24」、「http://myVocab/25」が設定されており、不整合Eに該当する。 Moving on to the description of FIG. 17. “Inconsistency E” will be explained using the controlled vocabulary data 11e. Inconsistency E is one in which there are two or more types of URIs for a broader term within the same synonymous group. For example, in the controlled vocabulary data 11e, two types of hypernym URIs "http://myVocab/24" and "http://myVocab/25" are set in the synonym group 11e-1, and an inconsistent E Applies to.

統制語彙データ11fを用いて、「不整合F」について説明する。不整合Fは、異なる同義グループ間において、代表語のURIと、上位語のURIとの上下関係が循環するというものである。統制語彙データ11fには、同義グループ11f-1,11f-2,11f-3が含まれる。たとえば、同義グループ11f-3において、代表語のURIは「http://myVocab/24」となり、上位語のURIは「http://myVcoab/2」となる。同義グループ11f-2において、代表語のURIは「http://myVocab/2」となり、上位語のURIは「http://myVcoab/1」となる。同義グループ11f-1において、代表語のURIは「http://myVocab/1」となり、上位語のURIは「http://myVcoab/24」となる。すなわち、同義グループ11f-1,11f-2,11f-3において、上位語のURIとの上下関係が循環しており、不整合Fに該当する。 “Inconsistency F” will be explained using the controlled vocabulary data 11f. Inconsistency F is that the hierarchical relationship between the URI of a representative word and the URI of a broader term circulates between different synonymous groups. The controlled vocabulary data 11f includes synonymous groups 11f-1, 11f-2, and 11f-3. For example, in the synonym group 11f-3, the URI of the representative word is "http://myVocab/24" and the URI of the broader term is "http://myVcoab/2." In the synonym group 11f-2, the URI of the representative word is "http://myVocab/2" and the URI of the broader term is "http://myVcoab/1." In the synonym group 11f-1, the URI of the representative word is "http://myVocab/1" and the URI of the broader term is "http://myVcoab/24." That is, in the synonymous groups 11f-1, 11f-2, and 11f-3, the hierarchical relationship between the hypernym and the URI is circular, and this corresponds to mismatch F.

上述した不整合を修正するために、統制語彙データの各セルの値を人手で修正する手数のことを、「修正コスト」と表記する。図18は、修正コストを説明するための図である。 In order to correct the above-mentioned inconsistency, the amount of effort required to manually correct the value of each cell of the controlled vocabulary data is referred to as "correction cost." FIG. 18 is a diagram for explaining modification costs.

統制語彙データ11aでは、同一の同義サブグループ11a-sub1において、代表語が2種類以上存在しており、不整合Aとなる。作業者が、統制語彙データ11aの代表語「3Dプリンター」を、「3Dプリンタ」に修正することで、不整合Aが解消し、統制語彙データ12aとなる。この場合、修正コストは「1」となる。 In the controlled vocabulary data 11a, there are two or more types of representative words in the same synonymous subgroup 11a-sub1, resulting in an inconsistency A. When the operator corrects the representative word "3D printer" in the controlled vocabulary data 11a to "3D printer," the inconsistency A is resolved and the data becomes controlled vocabulary data 12a. In this case, the modification cost is "1".

統制語彙データ11eでは、同一の同義グループ11e-1において、上位語のURIが2種類存在しており、不整合Eとなる。作業者が、統制語彙データ11eの上位語のURI「http://myVocab/24」を「http://myVocab/25」に修正する(2箇所修正する)ことで、不整合Eが解消し、統制語彙データ12eとなる。この場合、修正コストは「2」となる。 In the controlled vocabulary data 11e, there are two types of URIs of hypernyms in the same synonym group 11e-1, resulting in a mismatch E. Inconsistency E is resolved by the worker correcting the URI "http://myVocab/24" of the hypernym in the controlled vocabulary data 11e to "http://myVocab/25" (correcting in two places). , the controlled vocabulary data 12e. In this case, the modification cost is "2".

特開2020-52690号公報JP2020-52690A

図18で説明したように、人手によって統制語彙データを修正する際、入力ミスや見落としが発生する場合がある。また、修正作業に時間を要し、統制語彙データの質が低下する場合がある。 As described with reference to FIG. 18, when manually correcting controlled vocabulary data, input errors or oversights may occur. Furthermore, correction work takes time, and the quality of the controlled vocabulary data may deteriorate.

このため、統制語彙データに不整合が含まれる場合、修正候補を提示することが求められている。また、作業者が過去に行った編集内容に基づいて、修正候補を提示することが好ましい。たとえば、作業員が、統制語彙データを日本語で編集している場合、修正候補に対する修正を日本語で行うことができれば、作業者が修正する際の負担を軽減できる。 Therefore, when controlled vocabulary data contains inconsistencies, it is required to present correction candidates. Further, it is preferable that correction candidates be presented based on the contents of edits made in the past by the operator. For example, when a worker is editing controlled vocabulary data in Japanese, if the worker can make corrections to correction candidates in Japanese, the burden on the worker when making corrections can be reduced.

1つの側面では、本発明は、作業者が過去に行った編集内容に基づいて修正候補を提示することができる修正支援方法、修正支援プログラムおよび情報処理装置を提供することを目的とする。 In one aspect, an object of the present invention is to provide a modification support method, a modification support program, and an information processing device that can present modification candidates based on editing contents that have been edited by an operator in the past.

第1の案では、コンピュータが次の処理を実行する。コンピュータは、複数のレコードを含むデータテーブルを受け付ける。コンピュータは、受け付けたデータテーブルの分析結果に基づき、複数のレコードに含まれる複数のデータのうち、修正の対象候補である複数の修正候補データを特定する。コンピュータは、複数のレコードのうち、過去にデータへの編集が行われたレコードに基づき、特定した複数の修正候補データからいずれかの修正候補データを選定する。コンピュータは、選定した修正候補データを出力する。 In the first proposal, the computer performs the following processing. A computer accepts a data table containing multiple records. Based on the analysis result of the received data table, the computer identifies a plurality of correction candidate data that are correction target candidates from among the plurality of data included in the plurality of records. The computer selects any correction candidate data from the specified plurality of correction candidate data based on records in which data has been edited in the past among the plurality of records. The computer outputs the selected correction candidate data.

作業者が過去に行った編集内容に基づいて修正候補を提示することができる。 It is possible to present correction candidates based on the contents of edits made by the operator in the past.

図1は、参考技術を説明するための図である。FIG. 1 is a diagram for explaining reference technology. 図2は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。FIG. 2 is a functional block diagram showing the configuration of the information processing apparatus according to this embodiment. 図3は、統制語彙データのデータ構造の一例を示す図である。FIG. 3 is a diagram showing an example of the data structure of controlled vocabulary data. 図4は、特定部の処理を説明するための図である。FIG. 4 is a diagram for explaining the processing of the specifying section. 図5は、修正候補Aで修正した場合の統制語彙データの一例を示す図である。FIG. 5 is a diagram showing an example of controlled vocabulary data when corrected using correction candidate A. 図6は、修正候補Bで修正した場合の統制語彙データの一例を示す図である。FIG. 6 is a diagram showing an example of controlled vocabulary data when corrected using correction candidate B. 図7は、修正候補Cで修正した場合の統制語彙データの一例を示す図である。FIG. 7 is a diagram showing an example of controlled vocabulary data when corrected using correction candidate C. 図8は、修正候補Dで修正した場合の統制語彙データの一例を示す図である。FIG. 8 is a diagram showing an example of controlled vocabulary data when modified using modification candidate D. 図9は、修正候補X1~X8を示す図である。FIG. 9 is a diagram showing correction candidates X1 to X8. 図10は、第1選定処理を説明するための図である。FIG. 10 is a diagram for explaining the first selection process. 図11は、第2選定処理を説明するための図である。FIG. 11 is a diagram for explaining the second selection process. 図12は、表示制御部が生成する表示画面の一例を示す図である。FIG. 12 is a diagram illustrating an example of a display screen generated by the display control unit. 図13は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。FIG. 13 is a flowchart showing the processing procedure of the information processing apparatus according to this embodiment. 図14は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。FIG. 14 is a diagram illustrating an example of the hardware configuration of a computer that implements the same functions as the information processing device of the embodiment. 図15は、統制語彙データのデータ構造の一例について説明する図である。FIG. 15 is a diagram illustrating an example of the data structure of controlled vocabulary data. 図16は、不整合を説明するための図(1)である。FIG. 16 is a diagram (1) for explaining mismatch. 図17は、不整合を説明するための図(2)である。FIG. 17 is a diagram (2) for explaining mismatch. 図18は、修正コストを説明するための図である。FIG. 18 is a diagram for explaining modification costs.

以下に、本願の開示する修正支援方法、修正支援プログラムおよび情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。 DESCRIPTION OF THE PREFERRED EMBODIMENTS Examples of a modification support method, a modification support program, and an information processing apparatus disclosed in the present application will be described in detail below with reference to the drawings. Note that the present invention is not limited to this example.

本実施例に係る情報処理装置の説明を行う前に、統制語彙データに不整合が含まれる場合に修正候補を提示する参考技術について説明する。かかる参考技術は、従来技術でない。図1は、参考技術を説明するための図である。参考技術では、統制語彙データ内の不整合を検出し、不整合に対する修正候補を抽出する。参考技術では、各修正候補の修正コストを算出し、修正コストが最小となる修正候補を優先的に表示する。 Before explaining the information processing apparatus according to the present embodiment, a reference technique for presenting correction candidates when controlled vocabulary data includes an inconsistency will be explained. Such reference technology is not prior art. FIG. 1 is a diagram for explaining reference technology. The reference technique detects inconsistencies in controlled vocabulary data and extracts correction candidates for the inconsistencies. In the reference technique, the modification cost of each modification candidate is calculated, and the modification candidate with the minimum modification cost is displayed preferentially.

たとえば、統制語彙データ13において、1行目~3行目のレコードが、同義グループである。かかる同義グループには、2種類の上位語のURI「http://myVocab/24」、「http://myVocab/25」が存在するため、不整合となっている。 For example, in the controlled vocabulary data 13, the records in the first to third lines are synonymous groups. In this synonymous group, there are two types of hypernym URIs "http://myVocab/24" and "http://myVocab/25", so there is an inconsistency.

統制語彙データ13の不整合に対する修正候補は、次の修正候補(1)、修正候補(2)となる。 Correction candidates for inconsistencies in the controlled vocabulary data 13 are the following correction candidates (1) and (2).

修正候補(1)は、用語名が「3D printer」となるレコード(3行目のレコード)について、上位語のURI「http://myVocab/24」を「http://myVocab/25」に修正するものである。修正候補(1)の修正コストは「1」となる。 Correction candidate (1) changes the hypernym URI “http://myVocab/24” to “http://myVocab/25” for the record whose term name is “3D printer” (record on the third line). It is something to be corrected. The modification cost of modification candidate (1) is "1".

修正候補(2)は、用語名が「3Dプリンタ」、「3Dプリンター」となるレコード(1、2行目のレコード)について、上位語のURI「http://myVocab/25」をそれぞれ「http://myVocab/24」に修正するものである。修正候補(2)の修正コストは「2」となる。 Correction candidate (2) changes the URI of the broader term "http://myVocab/25" to "http://myVocab/25" for the records whose term names are "3D printer" and "3D printer" (records in the 1st and 2nd lines). ://myVocab/24”. The modification cost of modification candidate (2) is "2".

参考技術では、修正候補(2)の修正コストよりも、修正候補(1)の修正コストの方が少ないので、修正候補(1)を修正候補(2)よりも優先的に提示する。 In the reference technique, since the cost of modifying the modification candidate (1) is lower than the cost of modifying the modification candidate (2), the modification candidate (1) is presented with priority over the modification candidate (2).

続いて、参考技術の問題点について説明する。各用語には言語情報があり、作業者が一時的にある特定の言語の用語の情報のみを編集するといった状況が考えられる。しかし、参考技術では、作業者がどの言語の用語について編集しているか、といった観点を考慮せずに、単純に修正コストの低い修正候補から順に提示しているため、作業者の編集内容に基づいた修正候補を順番に提示できていない。 Next, problems with the reference technology will be explained. Each term has language information, and a situation may arise in which an operator temporarily edits only the information for a term in a specific language. However, the reference technology simply presents correction candidates in order of the lowest correction cost, without taking into account the perspective of which language the worker is editing the terms, and therefore Cannot present correction candidates in order.

たとえば、図1で説明したように、参考技術では、統制語彙データ13に対する修正候補を提示する場合、修正候補(2)の修正コストよりも、修正候補(1)の修正コストの方が少ないので、修正候補(1)を修正候補(2)よりも優先的に提示する。 For example, as explained in FIG. 1, in the reference technology, when presenting correction candidates for the controlled vocabulary data 13, the correction cost of correction candidate (1) is less than the correction cost of correction candidate (2). , the modification candidate (1) is presented preferentially over the modification candidate (2).

ここで、統制語彙データ13に対して実際に修正を行う作業者が言語「ja」の用語について編集していた場合、作業者の編集内容に基づいた最優先の修正候補は、言語が「ja」となる、1行目、2行目のレコードを修正する修正候補(2)である。一方、参考技術では、修正候補(1)を修正候補(2)よりも優先的に提示しており、作業者の編集内容に基づいた修正候補を順番に提示できていない。 Here, if the operator who actually makes corrections to the controlled vocabulary data 13 edits terms for the language "ja", the highest priority correction candidate based on the operator's editing content is the language "ja". ” is a modification candidate (2) that modifies the records in the first and second lines. On the other hand, in the reference technique, modification candidate (1) is presented preferentially over modification candidate (2), and modification candidates cannot be sequentially presented based on the contents edited by the operator.

続いて、本実施例に係る情報処理装置について説明する。本実施例に係る情報処理装置は、作業者がどの言語の用語について編集しているかという情報を基にして、作業者の編集内容に基づいた修正候補を提示する。 Next, an information processing apparatus according to this embodiment will be explained. The information processing apparatus according to the present embodiment presents correction candidates based on the operator's edited content, based on information about which language the operator is editing terms.

図2は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図2に示すように、この情報処理装置100は、通信部110と、入力部120と、表示部130と、記憶部140と、制御部150とを有する。 FIG. 2 is a functional block diagram showing the configuration of the information processing apparatus according to this embodiment. As shown in FIG. 2, the information processing device 100 includes a communication section 110, an input section 120, a display section 130, a storage section 140, and a control section 150.

通信部110は、ネットワークを介して外部装置から各種のデータを受信する。通信部110は、通信装置の一例である。たとえば、通信部110は、後述する統制語彙データ141を、外部装置から受信してもよい。 The communication unit 110 receives various data from an external device via a network. Communication unit 110 is an example of a communication device. For example, the communication unit 110 may receive controlled vocabulary data 141, which will be described later, from an external device.

入力部120は、情報処理装置100の制御部150に各種の情報を入力する入力装置である。入力部120は、キーボードやマウス、タッチパネル等に対応する。作業者は、入力部120を操作して、統制語彙データ141に関するデータを入力してもよい。 The input unit 120 is an input device that inputs various information to the control unit 150 of the information processing device 100. The input unit 120 corresponds to a keyboard, a mouse, a touch panel, etc. The operator may input data regarding the controlled vocabulary data 141 by operating the input unit 120.

表示部130は、制御部150から出力される情報を表示する表示装置である。たとえば、表示部130は、統制語彙データ141や、修正候補の情報等を表示する。 The display unit 130 is a display device that displays information output from the control unit 150. For example, the display unit 130 displays controlled vocabulary data 141, information on correction candidates, and the like.

記憶部140は、統制語彙データ141を有する。記憶部140は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子や、HDD(Hard Disk Drive)などの記憶装置に対応する。 The storage unit 140 has controlled vocabulary data 141. The storage unit 140 corresponds to a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory, or a storage device such as an HDD (Hard Disk Drive).

統制語彙データ141は、用語の曖昧さや同形異義、異形同義によって生じる検索の漏れ等を防ぐために、複数の用語間の意味的関係性をまとめた辞書のデータである。 The controlled vocabulary data 141 is dictionary data that summarizes the semantic relationships between a plurality of terms in order to prevent omissions in searches caused by ambiguity, homographs, and synonyms of terms.

図3は、統制語彙データのデータ構造の一例を示す図である。図3に示すように、この統制語彙データ141は、用語名列10a、代表語列10b、言語列10c、代表語のURI列10d、上位語のURI列10eを有する。用語名列10a、代表語列10b、言語列10c、代表語のURI列10d、上位語のURI列10eに関する説明は、図15で行った説明と同様である。 FIG. 3 is a diagram showing an example of the data structure of controlled vocabulary data. As shown in FIG. 3, the controlled vocabulary data 141 includes a term name column 10a, a representative word column 10b, a language column 10c, a representative word URI column 10d, and a hypernym URI column 10e. The explanation regarding the term name string 10a, representative word string 10b, language string 10c, representative word URI string 10d, and hypernym URI string 10e is the same as that given in FIG. 15.

制御部150は、受付部151、特定部152、選定部153、表示制御部154を有する。制御部150は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジック等によって実現される。 The control unit 150 includes a reception unit 151, a specification unit 152, a selection unit 153, and a display control unit 154. The control unit 150 is realized by hardwired logic such as a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), an ASIC (Application Specific Integrated Circuit), and an FPGA (Field Programmable Gate Array).

受付部151は、入力部120等から、統制語彙データ141を受け付ける。受付部151は、統制語彙データ141を、記憶部140に格納する。受付部151は、通信部110を介して、外部装置から、統制語彙データ141を受け付けてもよい。 The reception unit 151 receives controlled vocabulary data 141 from the input unit 120 or the like. The reception unit 151 stores the controlled vocabulary data 141 in the storage unit 140. The reception unit 151 may receive the controlled vocabulary data 141 from an external device via the communication unit 110.

特定部152は、統制語彙データ141を基にして、複数の修正候補を特定する。以下において、特定部152の各処理について説明する。図4は、特定部の処理を説明するための図である。 The specifying unit 152 specifies a plurality of correction candidates based on the controlled vocabulary data 141. Each process of the specifying unit 152 will be explained below. FIG. 4 is a diagram for explaining the processing of the specifying section.

図4について説明する。まず、特定部152は、統制語彙データ141を基にして、作業者が編集している言語を推定する。たとえば、特定部152は、言語列10cの値を走査し、頻度が最大となる言語を、作業者が編集している言語として推定する。図4に示す例では、最も頻度の高い言語が「ja」であるため、特定部152は、作業者が編集している言語を「ja」と推定する。以下の説明では、特定部152が推定した言語であって、作業者が編集している言語を「編集言語」と表記する。 FIG. 4 will be explained. First, the specifying unit 152 estimates the language in which the operator is editing based on the controlled vocabulary data 141. For example, the specifying unit 152 scans the values of the language string 10c and estimates the language with the highest frequency as the language being edited by the operator. In the example shown in FIG. 4, since the most frequently used language is "ja", the identification unit 152 estimates that the language being edited by the operator is "ja". In the following description, the language estimated by the specifying unit 152 and edited by the operator will be referred to as an "editing language."

続いて、特定部152は、統制語彙データ141の用語名列10aの用語名と、代表語列10bの代表語とを基にして、統制語彙データ141のレコードを、複数の同義サブグループに分類する。 Next, the specifying unit 152 classifies the records of the controlled vocabulary data 141 into a plurality of synonymous subgroups based on the term names in the term name column 10a and the representative words in the representative word column 10b of the controlled vocabulary data 141. do.

たとえば、特定部152は、統制語彙データ141の2行目において用語名「3次元プリンタ」と、代表語「3Dプリンタ」との連結成分を検出する。これにより、特定部152は、用語名または代表語に、「3次元プリンタ」、「3Dプリンタ」が設定された1行目~3行目のレコードを、同一の同義サブグループ50aに設定する。 For example, the specifying unit 152 detects a connected component between the term name "3D printer" and the representative word "3D printer" in the second line of the controlled vocabulary data 141. As a result, the specifying unit 152 sets the records in the first to third lines in which "3D printer" and "3D printer" are set as term names or representative words to the same synonymous subgroup 50a.

特定部152は、統制語彙データ141の4行目~6行目のレコードに含まれる用語名、代表語には、他のレコードの用語名、または、代表語と共通しないため、各レコードを異なる同義サブグループに設定する。たとえば、特定部152は、統制語彙データ141の4行目のレコードを、同義サブグループ50bに設定する。特定部152は、統制語彙データ141の5行目のレコードを、同義サブグループ50cに設定する。特定部152は、統制語彙データ141の6行目のレコードを、同義サブグループ50dに設定する。 The identification unit 152 identifies each record as different because the term names and representative words included in the records in the 4th to 6th lines of the controlled vocabulary data 141 are not common to the term names or representative words of other records. Set to synonymous subgroup. For example, the specifying unit 152 sets the record in the fourth line of the controlled vocabulary data 141 to the synonymous subgroup 50b. The specifying unit 152 sets the record in the fifth line of the controlled vocabulary data 141 to the synonymous subgroup 50c. The specifying unit 152 sets the record in the sixth line of the controlled vocabulary data 141 to the synonymous subgroup 50d.

続いて、特定部152は、同義サブグループ毎に、修正候補と修正コストとを特定する。たとえば、特定部152は、同義サブグループ50aのレコードを基にして、修正候補(a)および修正候補(b)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs for each synonymous subgroup. For example, the specifying unit 152 specifies a correction candidate (a) and a correction candidate (b) based on the records of the synonymous subgroup 50a.

修正候補(a)は、同義サブグループ50aの代表語を「3Dプリンタ」に統一する修正である。修正候補(a)の修正コストは「2」となる。 Candidate modification (a) is a modification that unifies the representative words of the synonymous subgroup 50a to "3D printer." The modification cost of modification candidate (a) is "2".

修正候補(b)は、同義サブグループ50aの代表語を「3Dプリンタ」に統一する修正である。修正候補(b)の修正コストは「1」となる。 Correction candidate (b) is a correction that unifies the representative words of the synonymous subgroup 50a to "3D printer." The modification cost of modification candidate (b) is "1".

続いて、特定部152は、異なる同義サブグループ間の修正候補と修正コストとを特定する。たとえば、特定部152は、同義サブグループ50a,50b,50c,50dをそれぞれ比較すると、同義サブグループ50aと、同義サブグループ50cとの間で、修正候補(c)および修正候補(d)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs between different synonymous subgroups. For example, when comparing the synonymous subgroups 50a, 50b, 50c, and 50d, the identification unit 152 identifies a modification candidate (c) and a modification candidate (d) between the synonymous subgroup 50a and the synonymous subgroup 50c. do.

修正候補(c)は、同義サブグループ50aの代表語のURIを「http://myVocab/1」以外の値に統一する修正である。修正候補(c)の修正コストは「3」となる。 Correction candidate (c) is a correction that unifies the URI of the representative word of the synonymous subgroup 50a to a value other than "http://myVocab/1". The modification cost of modification candidate (c) is "3".

修正候補(d)は、同義サブグループ50cの代表語のURIを「http://myVocab/1」以外の値に統一する修正である。修正候補(d)の修正コストは「1」となる。 Correction candidate (d) is a correction that unifies the URI of the representative word of the synonymous subgroup 50c to a value other than "http://myVocab/1". The modification cost of modification candidate (d) is "1".

以上より、特定部152によって特定される、各同義サブグループ内、同義サブグループ間の修正候補は、以下の修正候補A、修正候補B、修正候補C、修正候補Dとなる。 From the above, the modification candidates within each synonymous subgroup and between the synonymous subgroups identified by the specifying unit 152 are the following modification candidate A, modification candidate B, modification candidate C, and modification candidate D.

修正候補Aは、修正候補(a)と修正候補(c)とを行う修正である。修正候補Aの修正コストは、修正候補(a)の修正コスト「2」と、修正候補(c)の修正コスト「3」とを合計した修正コスト「5」となる。 Modification candidate A is a modification that performs modification candidate (a) and modification candidate (c). The modification cost of modification candidate A is "5", which is the sum of the modification cost "2" of modification candidate (a) and the modification cost "3" of modification candidate (c).

修正候補Bは、修正候補(a)と修正候補(d)とを行う修正である。修正候補Bの修正コストは、修正候補(a)の修正コスト「2」と、修正候補(d)の修正コスト「1」とを合計した修正コスト「3」となる。 Modification candidate B is a modification that performs modification candidate (a) and modification candidate (d). The modification cost of modification candidate B is "3", which is the sum of the modification cost "2" of modification candidate (a) and the modification cost "1" of modification candidate (d).

修正候補Cは、修正候補(b)と修正候補(c)とを行う修正である。修正候補Cの修正コストは、修正候補(b)の修正コスト「1」と、修正候補(c)の修正コスト「3」とを合計した修正コスト「4」となる。 Modification candidate C is a modification that performs modification candidate (b) and modification candidate (c). The modification cost of modification candidate C is "4", which is the sum of the modification cost "1" of modification candidate (b) and the modification cost "3" of modification candidate (c).

修正候補Dは、修正候補(b)と修正候補(d)とを行う修正である。修正候補Dの修正コストは、修正候補(b)の修正コスト「1」と、修正候補(d)の修正コスト「1」とを合計した修正コスト「2」となる。 Modification candidate D is a modification that performs modification candidate (b) and modification candidate (d). The modification cost of the modification candidate D is "2", which is the sum of the modification cost "1" of the modification candidate (b) and the modification cost "1" of the modification candidate (d).

以降の説明では、修正候補A、B、C、Dでそれぞれ修正した場合の統制語彙データについて説明する。 In the following explanation, the controlled vocabulary data will be explained when each of the correction candidates A, B, C, and D is corrected.

図5は、修正候補Aで修正した場合の統制語彙データの一例を示す図である。図5に示す統制語彙データ141Aは、図4に示した統制語彙データ141に対して、修正候補Aで修正した結果である。 FIG. 5 is a diagram showing an example of controlled vocabulary data when corrected using correction candidate A. Controlled vocabulary data 141A shown in FIG. 5 is the result of correcting the controlled vocabulary data 141 shown in FIG. 4 using correction candidate A.

特定部152は、統制語彙データ141Aの代表語のURIを基にして、同じ代表語のURIを持つ各同義サブグループをまとめることで、複数の同義グループ51a,51b,51cに分類する。 The specifying unit 152 classifies synonymous subgroups having the same representative word URI into a plurality of synonymous groups 51a, 51b, and 51c based on the URI of the representative word in the controlled vocabulary data 141A.

続いて、特定部152は、同義グループ毎に、修正候補と修正コストとを特定する。たとえば、特定部152は、同義グループ51bのレコードを基にして、修正候補(a1)および修正候補(b1)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs for each synonymous group. For example, the identifying unit 152 identifies the modification candidate (a1) and the modification candidate (b1) based on the records of the synonymous group 51b.

修正候補(a1)は、同義グループ51bの上位語のURIを「http://myVocab/24」に統一する修正である。修正候補(a1)の修正コストは「1」となる。修正候補(a1)は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 The modification candidate (a1) is a modification that unifies the URI of the hypernym of the synonym group 51b to "http://myVocab/24". The modification cost of the modification candidate (a1) is "1". The modification candidate (a1) is a modification candidate that includes a record of the editing language "ja" as a modification target.

修正候補(b1)は、同義グループ51bの上位語のURIを「http://myVocab/10」に統一する修正である。修正候補(b1)の修正コストは「1」となる。 The modification candidate (b1) is a modification that unifies the URI of the hypernym of the synonym group 51b to "http://myVocab/10". The modification cost of the modification candidate (b1) is "1".

続いて、特定部152は、異なる同義グループ間の修正候補と修正コストとを特定する。たとえば、特定部152は、上記の修正候補(b1)の修正を行うと、同義グループ51bと、同義グループ51cとの間に不整合が発生するため、修正候補(c1)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs between different synonymous groups. For example, the identifying unit 152 specifies the modification candidate (c1) because if the modification candidate (b1) is modified, a mismatch will occur between the synonymous group 51b and the synonymous group 51c.

修正候補(c1)は、同義グループ51cの上位語のURIを「http://myVocab/1」以外の値に統一する修正である。修正候補(c1)の修正コストは「1」となる。 The modification candidate (c1) is a modification that unifies the URI of the hypernym of the synonym group 51c to a value other than "http://myVocab/1". The modification cost of the modification candidate (c1) is "1".

以上により、特定部152が修正候補Aで修正した場合の、各同義グループ内、同義グループ間の修正候補は、以下の修正候補A-1、修正候補A-2となる。 As described above, when the specifying unit 152 makes a correction using the correction candidate A, the correction candidates within each synonymous group and between synonymous groups are the following correction candidates A-1 and A-2.

修正候補A-1は、修正候補(a1)を行う修正である。修正候補A-1の修正コストは「1」となる。修正候補A-1は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 Modification candidate A-1 is a modification that performs modification candidate (a1). The modification cost of modification candidate A-1 is "1". Correction candidate A-1 is a correction candidate that includes a record of the editing language "ja" as a correction target.

修正候補A-2は、修正候補(b1)と修正候補(c1)とを行う修正である。修正候補A-2の修正コストは、修正候補(b1)の修正コスト「1」と、修正候補(c1)の修正コスト「1」とを合計した修正コスト「2」となる。 Modification candidate A-2 is a modification that performs modification candidate (b1) and modification candidate (c1). The modification cost of modification candidate A-2 is "2", which is the sum of the modification cost "1" of modification candidate (b1) and the modification cost "1" of modification candidate (c1).

図6は、修正候補Bで修正した場合の統制語彙データの一例を示す図である。図6に示す統制語彙データ141Bは、図4に示した統制語彙データ141に対して、修正候補Bで修正した結果である。 FIG. 6 is a diagram showing an example of controlled vocabulary data when corrected using correction candidate B. Controlled vocabulary data 141B shown in FIG. 6 is the result of correcting the controlled vocabulary data 141 shown in FIG. 4 using correction candidate B.

特定部152は、統制語彙データ141Bの代表語のURIを基にして、同じ代表語のURIを持つ各同義サブグループをまとめることで、複数の同義グループ52a,52b,52cに分類する。 The specifying unit 152 classifies synonymous subgroups having the same representative word URI into a plurality of synonymous groups 52a, 52b, and 52c based on the URI of the representative word in the controlled vocabulary data 141B.

続いて、特定部152は、同義グループ毎に、修正候補と修正コストとを特定する。たとえば、特定部152は、同義グループ52aのレコードを基にして、修正候補(a2)および修正候補(b2)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs for each synonymous group. For example, the identifying unit 152 identifies a modification candidate (a2) and a modification candidate (b2) based on the records of the synonymous group 52a.

修正候補(a2)は、同義グループ52aの上位語のURIを「http://myVocab/25」に統一する修正である。修正候補(a2)の修正コストは「1」となる。 The modification candidate (a2) is a modification that unifies the URI of the hypernym of the synonym group 52a to "http://myVocab/25". The modification cost of the modification candidate (a2) is "1".

修正候補(b2)は、同義グループ52aの上位語のURIを「http://myVocab/24」に統一する修正である。修正候補(b2)の修正コストは「3」となる。修正候補(b2)は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 The modification candidate (b2) is a modification that unifies the URI of the hypernym of the synonym group 52a to "http://myVocab/24". The modification cost of the modification candidate (b2) is "3". The modification candidate (b2) is a modification candidate that includes a record of the editing language "ja" as a modification target.

続いて、特定部152は、異なる同義グループ間の修正候補と修正コストとを特定する。なお、同義グループ間で、不整合は存在しないため、特定部152は、係る処理をスキップする。 Subsequently, the identification unit 152 identifies modification candidates and modification costs between different synonymous groups. Note that since there is no inconsistency between the synonymous groups, the identifying unit 152 skips this process.

以上により、特定部152が修正候補Bで修正した場合の、各同義グループ内、同義グループ間の修正候補は、以下の修正候補B-1、修正候補B-2となる。 As described above, when the specifying unit 152 makes a correction using the correction candidate B, the correction candidates within each synonymous group and between synonymous groups are the following correction candidate B-1 and correction candidate B-2.

修正候補B-1は、修正候補(a2)を行う修正である。修正候補B-1の修正コストは「1」となる。 Modification candidate B-1 is a modification that performs modification candidate (a2). The modification cost of modification candidate B-1 is "1".

修正候補B-2は、修正候補(b2)を行う修正である。修正候補B-2の修正コストは「3」となる。修正候補B-2は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 Modification candidate B-2 is a modification that performs modification candidate (b2). The modification cost of modification candidate B-2 is "3". Correction candidate B-2 is a correction candidate that includes a record of the editing language "ja" as a correction target.

図7は、修正候補Cで修正した場合の統制語彙データの一例を示す図である。図7に示す統制語彙データ141Cは、図4に示した統制語彙データ141に対して、修正候補Cで修正した結果である。 FIG. 7 is a diagram showing an example of controlled vocabulary data when corrected using correction candidate C. Controlled vocabulary data 141C shown in FIG. 7 is the result of correcting the controlled vocabulary data 141 shown in FIG. 4 using correction candidate C.

特定部152は、統制語彙データ141Cの代表語のURIを基にして、同じ代表語のURIを持つ各同義サブグループをまとめることで、複数の同義グループ53a,53b,53cに分類する。 The specifying unit 152 classifies synonymous subgroups having the same representative word URI into a plurality of synonymous groups 53a, 53b, and 53c based on the URI of the representative word in the controlled vocabulary data 141C.

続いて、特定部152は、同義グループ毎に、修正候補と修正コストとを特定する。たとえば、特定部152は、同義グループ53bのレコードを基にして、修正候補(a3)および修正候補(b3)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs for each synonymous group. For example, the identifying unit 152 identifies a modification candidate (a3) and a modification candidate (b3) based on the records of the synonymous group 53b.

修正候補(a3)は、同義グループ53bの上位語のURIを「http://myVocab/24」に統一する修正である。修正候補(a3)の修正コストは「1」となる。修正候補(a3)は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 The modification candidate (a3) is a modification that unifies the URI of the hypernym of the synonym group 53b to "http://myVocab/24". The modification cost of the modification candidate (a3) is "1". The modification candidate (a3) is a modification candidate that includes a record of the editing language "ja" as a modification target.

修正候補(b3)は、同義グループ53bの上位語のURIを「http://myVocab/10」に統一する修正である。修正候補(b3)の修正コストは「1」となる。 The modification candidate (b3) is a modification that unifies the URI of the hypernym of the synonym group 53b to "http://myVocab/10". The modification cost of the modification candidate (b3) is "1".

続いて、特定部152は、異なる同義グループ間の修正候補と修正コストとを特定する。たとえば、特定部152は、上記の修正候補(b3)の修正を行うと、同義グループ53bと、同義グループ53cとの間に不整合が発生するため、修正候補(c3)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs between different synonymous groups. For example, the specifying unit 152 specifies the correction candidate (c3) because if the above correction candidate (b3) is corrected, a mismatch will occur between the synonymous group 53b and the synonymous group 53c.

修正候補(c3)は、同義グループ53cの上位語のURIを「http://myVocab/1」以外の値に統一する修正である。修正候補(c3)の修正コストは「1」となる。 The modification candidate (c3) is a modification that unifies the URI of the hypernym of the synonym group 53c to a value other than "http://myVocab/1". The modification cost of the modification candidate (c3) is "1".

以上により、特定部152が修正候補Cで修正した場合の、各同義グループ内、同義グループ間の修正候補は、以下の修正候補C-1、修正候補C-2となる。 As described above, when the specifying unit 152 makes a correction using the correction candidate C, the correction candidates within each synonymous group and between synonymous groups are the following correction candidates C-1 and C-2.

修正候補C-1は、修正候補(a3)を行う修正である。修正候補C-1の修正コストは「1」となる。修正候補C-1は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 Correction candidate C-1 is a correction that performs correction candidate (a3). The modification cost of modification candidate C-1 is "1". Correction candidate C-1 is a correction candidate that includes a record of the editing language "ja" as a correction target.

修正候補C-2は、修正候補(b3)と修正候補(c3)とを行う修正である。修正候補C-2の修正コストは、修正候補(bC)の修正コスト「1」と、修正候補(c3)の修正コスト「1」とを合計した修正コスト「2」となる。 Modification candidate C-2 is a modification that performs modification candidate (b3) and modification candidate (c3). The modification cost of modification candidate C-2 is "2", which is the sum of the modification cost "1" of modification candidate (bC) and the modification cost "1" of modification candidate (c3).

図8は、修正候補Dで修正した場合の統制語彙データの一例を示す図である。図8に示す統制語彙データ141Bは、図4に示した統制語彙データ141に対して、修正候補Dで修正した結果である。 FIG. 8 is a diagram showing an example of controlled vocabulary data when modified using modification candidate D. Controlled vocabulary data 141B shown in FIG. 8 is the result of correcting the controlled vocabulary data 141 shown in FIG. 4 using correction candidate D.

特定部152は、統制語彙データ141Dの代表語のURIを基にして、同じ代表語のURIを持つ各同義サブグループをまとめることで、複数の同義グループ54a,54b,54cに分類する。 The specifying unit 152 classifies synonymous subgroups having the same representative word URI into a plurality of synonymous groups 54a, 54b, and 54c based on the URI of the representative word in the controlled vocabulary data 141D.

続いて、特定部152は、同義グループ毎に、修正候補と修正コストとを特定する。たとえば、特定部152は、同義グループ53aのレコードを基にして、修正候補(a4)および修正候補(b4)を特定する。 Subsequently, the identification unit 152 identifies modification candidates and modification costs for each synonymous group. For example, the identifying unit 152 identifies a modification candidate (a4) and a modification candidate (b4) based on the records of the synonymous group 53a.

修正候補(a4)は、同義グループ54aの上位語のURIを「http://myVocab/25」に統一する修正である。修正候補(a4)の修正コストは「1」となる。 The modification candidate (a4) is a modification that unifies the URI of the hypernym of the synonym group 54a to "http://myVocab/25". The modification cost of the modification candidate (a4) is "1".

修正候補(b4)は、同義グループ54aの上位語のURIを「http://myVocab/24」に統一する修正である。修正候補(b4)の修正コストは「3」となる。修正候補(b4)は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 The modification candidate (b4) is a modification that unifies the URI of the hypernym of the synonym group 54a to "http://myVocab/24". The modification cost of the modification candidate (b4) is "3". The modification candidate (b4) is a modification candidate that includes a record of the editing language "ja" as a modification target.

続いて、特定部152は、異なる同義グループ間の修正候補と修正コストとを特定する。なお、同義グループ間で、不整合は存在しないため、特定部152は、係る処理をスキップする。 Subsequently, the identification unit 152 identifies modification candidates and modification costs between different synonymous groups. Note that since there is no inconsistency between the synonymous groups, the identifying unit 152 skips this process.

以上により、特定部152が修正候補Dで修正した場合の、各同義グループ内、同義グループ間の修正候補は、以下の修正候補D-1、修正候補D-2となる。 As described above, when the specifying unit 152 makes a correction using the correction candidate D, the correction candidates within each synonymous group and between synonymous groups are the following correction candidates D-1 and D-2.

修正候補D-1は、修正候補(a4)を行う修正である。修正候補D-1の修正コストは「1」となる。 Modification candidate D-1 is a modification that performs modification candidate (a4). The modification cost of modification candidate D-1 is "1".

修正候補D-2は、修正候補(b4)を行う修正である。修正候補D-2の修正コストは「3」となる。修正候補D-2は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 Modification candidate D-2 is a modification that performs modification candidate (b4). The modification cost of modification candidate D-2 is "3". Correction candidate D-2 is a correction candidate that includes a record of the editing language "ja" as a correction target.

特定部152は、図4~図8で説明した処理を実行することで、全修正候補と、修正コストとを特定する。たとえば、全修正候補には、次に説明する修正候補X1,X2,X3,X4,X5,X6,X7,X8が含まれる。図9は、修正候補X1~X8を示す図である。 The specifying unit 152 specifies all correction candidates and correction costs by executing the processes described in FIGS. 4 to 8. For example, all correction candidates include correction candidates X1, X2, X3, X4, X5, X6, X7, and X8, which will be described next. FIG. 9 is a diagram showing correction candidates X1 to X8.

図9に示すように、修正候補X1は、修正候補Aと、修正候補A-1とを行う修正である。修正候補Aの修正コストは「5」、修正候補A-1の修正コストは「1」であり、修正候補X1の修正コストは「6」となる。修正候補A-1は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 As shown in FIG. 9, modification candidate X1 is a modification that performs modification candidate A and modification candidate A-1. The modification cost of modification candidate A is "5", the modification cost of modification candidate A-1 is "1", and the modification cost of modification candidate X1 is "6". Correction candidate A-1 is a correction candidate that includes a record of the editing language "ja" as a correction target.

修正候補X2は、修正候補Aと、修正候補A-2とを行う修正である。修正候補Aの修正コストは「5」、修正候補A-2の修正コストは「2」であり、修正候補X2の修正コストは「7」となる。 Modification candidate X2 is a modification that performs modification candidate A and modification candidate A-2. The modification cost of modification candidate A is "5", the modification cost of modification candidate A-2 is "2", and the modification cost of modification candidate X2 is "7".

修正候補X3は、修正候補Bと、修正候補B-1とを行う修正である。修正候補Bの修正コストは「3」、修正候補B-1の修正コストは「1」であり、修正候補X3の修正コストは「4」となる。 Modification candidate X3 is a modification that performs modification candidate B and modification candidate B-1. The modification cost of modification candidate B is "3", the modification cost of modification candidate B-1 is "1", and the modification cost of modification candidate X3 is "4".

修正候補X4は、修正候補Bと、修正候補B-2とを行う修正である。修正候補Bの修正コストは「3」、修正候補B-2の修正コストは「3」であり、修正候補X4の修正コストは「6」となる。修正候補B-2は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 Modification candidate X4 is a modification that performs modification candidate B and modification candidate B-2. The modification cost of modification candidate B is "3", the modification cost of modification candidate B-2 is "3", and the modification cost of modification candidate X4 is "6". Correction candidate B-2 is a correction candidate that includes a record of the editing language "ja" as a correction target.

修正候補X5は、修正候補Cと、修正候補C-1とを行う修正である。修正候補Cの修正コストは「3」、修正候補C-1の修正コストは「1」であり、修正候補X5の修正コストは「4」となる。修正候補C-1は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 Modification candidate X5 is a modification that performs modification candidate C and modification candidate C-1. The modification cost of modification candidate C is "3", the modification cost of modification candidate C-1 is "1", and the modification cost of modification candidate X5 is "4". Correction candidate C-1 is a correction candidate that includes a record of the editing language "ja" as a correction target.

修正候補X6は、修正候補Cと、修正候補C-2とを行う修正である。修正候補Cの修正コストは「3」、修正候補C-2の修正コストは「2」であり、修正候補X6の修正コストは「5」となる。 Modification candidate X6 is a modification that performs modification candidate C and modification candidate C-2. The modification cost of modification candidate C is "3", the modification cost of modification candidate C-2 is "2", and the modification cost of modification candidate X6 is "5".

修正候補X7は、修正候補Dと、修正候補D-1とを行う修正である。修正候補Dの修正コストは「2」、修正候補D-1の修正コストは「1」であり、修正候補X7の修正コストは「3」となる。 Modification candidate X7 is a modification that performs modification candidate D and modification candidate D-1. The modification cost of modification candidate D is "2", the modification cost of modification candidate D-1 is "1", and the modification cost of modification candidate X7 is "3".

修正候補X8は、修正候補Dと、修正候補D-2とを行う修正である。修正候補Dの修正コストは「2」、修正候補D-2の修正コストは「3」であり、修正候補X8の修正コストは「5」となる。修正候補D-2は、修正対象に、編集言語「ja」のレコードを含む修正候補である。 Modification candidate X8 is a modification that performs modification candidate D and modification candidate D-2. The modification cost of modification candidate D is "2", the modification cost of modification candidate D-2 is "3", and the modification cost of modification candidate X8 is "5". Correction candidate D-2 is a correction candidate that includes a record of the editing language "ja" as a correction target.

特定部152は、図9で説明した修正候補X1~X8の情報を、選定部153に出力する。以下の説明では、修正候補X1~X8の情報をまとめて「修正候補情報」と表記する。修正候補情報には、修正候補毎に、修正内容と、修正コストと、修正対象に、編集言語「ja」のレコードを含む修正候補であるか否かの情報とが設定されているものとする。 The specifying unit 152 outputs information about the correction candidates X1 to X8 described in FIG. 9 to the selecting unit 153. In the following description, the information on the correction candidates X1 to X8 will be collectively referred to as "correction candidate information." It is assumed that the modification candidate information includes, for each modification candidate, the modification content, modification cost, and information as to whether or not the modification target includes a record of the editing language "ja". .

選定部153は、修正候補情報を基にして、修正候補X1~X8から、表示対象とする修正候補を選定する。たとえば、選定部153は、第1選定処理、または、第2選定処理のうち、いずれか一方の選定処理を実行する。いずれの選定処理を実行するかは、予め設定されているものとする。 The selection unit 153 selects a modification candidate to be displayed from among the modification candidates X1 to X8 based on the modification candidate information. For example, the selection unit 153 executes either the first selection process or the second selection process. It is assumed that which selection process is to be executed is set in advance.

まず、第1選定処理について説明する。図10は、第1選定処理を説明するための図である。選定部153は、修正候補情報を参照し、修正候補X1~X8のうち、編集言語「ja」のレコードを修正対象とする修正候補を有する修正候補のグループG1と、編集言語「ja」のレコードを修正対象とする修正候補を有さない修正候補のグループG2とに分類する。 First, the first selection process will be explained. FIG. 10 is a diagram for explaining the first selection process. The selection unit 153 refers to the correction candidate information and selects among the correction candidates X1 to X8, a correction candidate group G1 having correction candidates that target records with the editing language "ja" and records with the editing language "ja". is classified into a group G2 of correction candidates that does not have any correction candidates to be corrected.

図10に示すように、グループG1には、修正候補X1,X4,X5,X8が含まれる。選定部153は、グループG1の修正候補X1,X4,X5,X8を、修正コストの小さい順にソートする。修正コストが同一の修正候補については、どちらを先にしてもよい。たとえば、ソートされた結果、グループG1の修正候補X1,X4,X5,X8の並び順は、先頭から、修正候補X5,X8,X1,X4となる。選定部153は、修正コストの小さい修正候補を優先的に選定する。選定部153は、先頭からN個の修正候補を選定してもよい。Nは予め設定される自然数である。 As shown in FIG. 10, group G1 includes correction candidates X1, X4, X5, and X8. The selection unit 153 sorts the modification candidates X1, X4, X5, and X8 of the group G1 in descending order of modification cost. As for correction candidates with the same correction cost, either one may be selected first. For example, as a result of the sorting, the modification candidates X1, X4, X5, and X8 of the group G1 are arranged in order from the top to the modification candidates X5, X8, X1, and X4. The selection unit 153 preferentially selects correction candidates with low correction costs. The selection unit 153 may select N correction candidates from the beginning. N is a preset natural number.

グループG2には、修正候補X2,X3,X6,X7が含まれる。選定部153は、グループG2の修正候補X2,X3,X6,X7を、修正コストの小さい順にソートする。修正コストが同一の修正候補については、どちらを先にしてもよい。たとえば、ソートされた結果、グループG2の修正候補X2,X3,X6,X7の並び順は、先頭から、修正候補X7,X3,X6,X2となる。選定部153は、修正コストの小さい修正候補を優先的に選定する。選定部153は、先頭からN個の修正候補を選定してもよい。 Group G2 includes correction candidates X2, X3, X6, and X7. The selection unit 153 sorts the modification candidates X2, X3, X6, and X7 of the group G2 in descending order of modification cost. As for correction candidates with the same correction cost, either one may be selected first. For example, as a result of the sorting, the modification candidates X2, X3, X6, and X7 of the group G2 are arranged in the order of modification candidates X7, X3, X6, and X2 from the top. The selection unit 153 preferentially selects correction candidates with low correction costs. The selection unit 153 may select N correction candidates from the beginning.

選定部153は、選定した修正候補の情報を、表示制御部154に出力する。選定した修正候補の情報には、修正内容と、修正コストと、ソートした際の順番とが含まれる。 The selection unit 153 outputs information on the selected correction candidates to the display control unit 154. The information on the selected modification candidates includes the modification details, modification cost, and sorting order.

続いて、第2選定処理について説明する。図11は、第2選定処理を説明するための図である。選定部153は、修正候補情報を参照し、修正候補X1~X8のうち、編集言語「ja」のレコードを修正対象とする修正候補を有する修正候補の修正コストを、所定の重みによって修正する。本実施例では、所定の重みを「0.6」とする。たとえば、所定の重みは、0より大きく、1未満となるように、予め設定されているものとする。 Next, the second selection process will be explained. FIG. 11 is a diagram for explaining the second selection process. The selection unit 153 refers to the modification candidate information and modifies the modification cost of a modification candidate among the modification candidates X1 to X8 that has a modification candidate that targets a record with the editing language "ja", using a predetermined weight. In this embodiment, the predetermined weight is "0.6". For example, it is assumed that the predetermined weight is set in advance to be greater than 0 and less than 1.

図9で説明したように、修正候補X1~X8のうち、編集言語「ja」のレコードを修正対象とする修正候補を有する修正候補は、修正候補X1,X4,X5,X8となる。このため、図11に示すように、選定部153は、修正候補X1の修正コスト「6」に重み「0.6」を乗算した値「3.6」を、修正候補X1の新たな修正コストに設定する。選定部153は、修正候補X4の修正コスト「6」に重み「0.6」を乗算した値「3.6」を、修正候補X4の新たな修正コストに設定する。 As explained with reference to FIG. 9, among the modification candidates X1 to X8, the modification candidates X1, X4, X5, and X8 have modification candidates that target records in the editing language "ja". Therefore, as shown in FIG. 11, the selection unit 153 uses the value "3.6" obtained by multiplying the modification cost "6" of the modification candidate X1 by the weight "0.6" as the new modification cost of the modification candidate X1. Set to . The selection unit 153 sets the value "3.6" obtained by multiplying the modification cost "6" of the modification candidate X4 by the weight "0.6" as the new modification cost of the modification candidate X4.

選定部153は、修正候補X5の修正コスト「4」に重み「0.6」を乗算した値「2.4」を、修正候補X5の新たな修正コストに設定する。選定部153は、修正候補X8の修正コスト「5」に重み「0.6」を乗算した値「3」を、修正候補X8の新たな修正コストに設定する。 The selection unit 153 sets the value "2.4" obtained by multiplying the modification cost "4" of the modification candidate X5 by the weight "0.6" as the new modification cost of the modification candidate X5. The selection unit 153 sets the value "3" obtained by multiplying the modification cost "5" of the modification candidate X8 by the weight "0.6" as the new modification cost of the modification candidate X8.

選定部153は、修正後の修正コストを考慮して、修正候補X1~X8を、修正コストの小さい順にソートする。たとえば、ソートされた結果、修正候補X1~X8の並び順は、修正候補X5,X7,X8,X1,X4,X3,X3,X6,X,2となる。選定部153は、修正コストの小さい修正候補を優先的に選定する。選定部153は、先頭からN個の修正候補を選定してもよい。 The selection unit 153 sorts the modification candidates X1 to X8 in descending order of modification cost, taking into account the modification cost after modification. For example, as a result of sorting, the modification candidates X1 to X8 are arranged in the following order: modification candidates X5, X7, X8, X1, X4, X3, X3, X6, X, 2. The selection unit 153 preferentially selects correction candidates with low correction costs. The selection unit 153 may select N correction candidates from the beginning.

選定部153は、選定した修正候補の情報を、表示制御部154に出力する。選定した修正候補の情報には、修正内容と、修正コストと、ソートした際の順番とが含まれる。 The selection unit 153 outputs information on the selected correction candidates to the display control unit 154. The information on the selected modification candidates includes the modification details, modification cost, and sorting order.

図2の説明に戻る。表示制御部154は、選定部153によって選定された修正候補の情報を基にして、表示画面を生成し、生成した表示画面を、表示部130に出力して表示させる。たとえば、表示制御部154は、修正候補の修正内容と、修正コストとを対応付けたテキスト情報を表示画面に配置する。表示制御部154は、修正候補のうち、順番(選定部153にソートされた際の順番)の低いものが表示画面の上方に来るように、設定する。 Returning to the explanation of FIG. 2. The display control unit 154 generates a display screen based on the information on the correction candidates selected by the selection unit 153, and outputs the generated display screen to the display unit 130 for display. For example, the display control unit 154 arranges on the display screen text information that associates the modification content of the modification candidate with the modification cost. The display control unit 154 sets the correction candidates so that the one with the lowest order (the order when sorted by the selection unit 153) is placed at the top of the display screen.

図12は、表示制御部が生成する表示画面の一例を示す図である。図12に示す例では、表示画面60に、修正候補(1)、修正候補(2)が設定されており、修正候補(1)および修正候補(2)の修正内容、修正コストが設定されている。 FIG. 12 is a diagram illustrating an example of a display screen generated by the display control unit. In the example shown in FIG. 12, a modification candidate (1) and a modification candidate (2) are set on the display screen 60, and the modification content and modification cost of the modification candidate (1) and modification candidate (2) are set. There is.

次に、本実施例に係る情報処理装置の処理手順の一例について説明する。図13は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。図13に示すように、情報処理装置100の受付部151は、統制語彙データ141を受け付ける(ステップS101)。情報処理装置100の特定部152は、統制語彙データ141を基にして、作業者が編集している言語を推定する(ステップS102)。 Next, an example of a processing procedure of the information processing apparatus according to this embodiment will be described. FIG. 13 is a flowchart showing the processing procedure of the information processing apparatus according to this embodiment. As shown in FIG. 13, the reception unit 151 of the information processing device 100 receives controlled vocabulary data 141 (step S101). The identification unit 152 of the information processing device 100 estimates the language in which the operator is editing based on the controlled vocabulary data 141 (step S102).

特定部152は、統制語彙データ141を基にして、同義サブグループ内の修正候補および修正コストを特定する(ステップS103)。特定部152は、統制語彙データ141を基にして、異なる同義サブグループ間の修正候補および修正コストを特定する(ステップS104)。 The specifying unit 152 specifies correction candidates and correction costs in the synonymous subgroup based on the controlled vocabulary data 141 (step S103). The specifying unit 152 specifies correction candidates and correction costs between different synonymous subgroups based on the controlled vocabulary data 141 (step S104).

特定部152は、同義サブグループ内の修正候補と、同義サブグループ間の修正候補とに対する修正を、統制語彙データ141に対して実行する(ステップS105)。特定部152は、修正後の統制語彙データ141に対して、同義グループ内の修正候補および修正コストを特定する(ステップS106)。 The specifying unit 152 executes corrections to the correction candidates within the synonymous subgroup and the correction candidates between the synonymous subgroups to the controlled vocabulary data 141 (step S105). The specifying unit 152 specifies correction candidates and correction costs within the synonymous group for the corrected controlled vocabulary data 141 (step S106).

特定部152は、修正後の統制語彙データ141に対して、異なる同義グループ間の修正候補および修正コストを特定する(ステップS107)。特定部152は、修正候補情報を生成する(ステップS108)。 The specifying unit 152 specifies correction candidates and correction costs between different synonymous groups for the corrected controlled vocabulary data 141 (step S107). The specifying unit 152 generates correction candidate information (step S108).

情報処理装置100の選定部153は、作成者が編集している言語と、修正候補情報とを基にして、表示対象となる修正候補を選定する(ステップS109)。情報処理装置100の表示制御部154は、選定された修正候補を基にして、表示画面を生成する(ステップS110)。表示制御部154は、表示画面を表示部130に出力する(ステップS111)。 The selection unit 153 of the information processing device 100 selects correction candidates to be displayed based on the language edited by the creator and the correction candidate information (step S109). The display control unit 154 of the information processing device 100 generates a display screen based on the selected correction candidates (step S110). The display control unit 154 outputs the display screen to the display unit 130 (step S111).

次に、本実施例に係る情報処理装置100の効果について説明する。情報処理装置100は、統制語彙データ141を基にして、複数の修正候補を特定し、複数の修正候補から、作業員の編集内容に応じた修正候補を選定して表示する処理を実行する。これによって、作業者の編集内容に基づいた修正候補を提示することができ、作業者の負担を軽減させることができる。 Next, the effects of the information processing device 100 according to this embodiment will be explained. The information processing device 100 specifies a plurality of correction candidates based on the controlled vocabulary data 141, and performs a process of selecting and displaying a correction candidate according to the content edited by the worker from among the plurality of correction candidates. As a result, correction candidates can be presented based on the contents edited by the operator, and the burden on the operator can be reduced.

情報処理装置100は、統制語彙データ141の言語列に設定された言語を基にして、出現頻度が他の言語の種別よりも大きい言語の種別を、作業者が編集している言語の種別として推定する。これによって、作業者が編集している言語の種別を特定することができる。 Based on the languages set in the language string of the controlled vocabulary data 141, the information processing device 100 selects a language type whose appearance frequency is higher than other language types as the language type being edited by the operator. presume. This allows the operator to specify the type of language being edited.

情報処理装置100は、各修正候補について修正コストを算出し、修正コストの小さい修正候補を優先して選定する。ここで、情報処理装置100は、修正対象となるレコードが、作業者が編集している言語の種別に対応するレコードの場合には、係るレコードを修正対象とする修正候補の修正コストに重み(0<重みの値<1)をかけて修正する。これによって、作業者が編集している言語の種別に対応するレコードに関連する修正候補を優先して選定し易くすることができる。 The information processing apparatus 100 calculates a modification cost for each modification candidate, and selects a modification candidate with a lower modification cost with priority. Here, if the record to be modified is a record corresponding to the language type edited by the operator, the information processing device 100 adds a weight ( Correct by multiplying by 0<weight value<1). This makes it easier for the operator to preferentially select correction candidates related to the record corresponding to the language type being edited.

なお、情報処理装置100は、作業者が編集している言語の種別を特定する場合に、統制語彙データ141の言語列10cに設定された言語の出現頻度を利用していたが、これに限定されるものではない。情報処理装置100の特定部152は、統制語彙データ141のレコード毎に設定した編集時刻を走査し、編集時刻が最新のレコードに設定された言語の種別を、作業者が編集している言語の種別として特定してもよい。 Note that the information processing device 100 used the appearance frequency of the language set in the language string 10c of the controlled vocabulary data 141 when identifying the type of language that the operator is editing, but this is not limited to this. It is not something that will be done. The identification unit 152 of the information processing device 100 scans the editing time set for each record of the controlled vocabulary data 141, and identifies the language type set in the record with the latest editing time as the language being edited by the operator. It may also be specified as a type.

次に、上記実施例に示した情報処理装置100と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図14は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。 Next, an example of the hardware configuration of a computer that implements the same functions as the information processing apparatus 100 shown in the above embodiment will be described. FIG. 14 is a diagram illustrating an example of the hardware configuration of a computer that implements the same functions as the information processing device of the embodiment.

図14に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザからのデータの入力を受け付ける入力装置202と、ディスプレイ203とを有する。また、コンピュータ200は、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行う通信装置204と、インタフェース装置205とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM206と、ハードディスク装置207とを有する。そして、各装置201~207は、バス208に接続される。 As shown in FIG. 14, the computer 200 includes a CPU 201 that executes various calculation processes, an input device 202 that receives data input from a user, and a display 203. The computer 200 also includes a communication device 204 and an interface device 205 that exchange data with an external device or the like via a wired or wireless network. The computer 200 also includes a RAM 206 that temporarily stores various information and a hard disk device 207. Each device 201-207 is then connected to a bus 208.

ハードディスク装置207は、受付プログラム207a、特定プログラム207b、選定プログラム207c、表示制御プログラム207dを有する。また、CPU201は、各プログラム207a~207dを読み出してRAM206に展開する。 The hard disk device 207 has a reception program 207a, a specific program 207b, a selection program 207c, and a display control program 207d. Further, the CPU 201 reads each program 207a to 207d and expands it into the RAM 206.

受付プログラム207aは、受付プロセス206aとして機能する。特定プログラム207bは、特定プロセス206bとして機能する。選定プログラム207cは、選定プロセス206cとして機能する。表示制御プログラム207dは、表示制御プロセス206dとして機能する。 The reception program 207a functions as a reception process 206a. The specific program 207b functions as a specific process 206b. The selection program 207c functions as a selection process 206c. The display control program 207d functions as a display control process 206d.

受付プロセス206aの処理は、受付部151の処理に対応する。特定プロセス206bの処理は、特定部152の処理に対応する。選定プロセス206cの処理は、選定部153の処理に対応する。表示制御プロセス206dの処理は、表示制御部154の処理に対応する。 The processing of the reception process 206a corresponds to the processing of the reception unit 151. The processing of the identification process 206b corresponds to the processing of the identification unit 152. The processing of the selection process 206c corresponds to the processing of the selection unit 153. The processing of the display control process 206d corresponds to the processing of the display control unit 154.

なお、各プログラム207a~207dについては、必ずしも最初からハードディスク装置207に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD-ROM、DVD、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200が各プログラム207a~207dを読み出して実行するようにしてもよい。 Note that each of the programs 207a to 207d does not necessarily need to be stored in the hard disk device 207 from the beginning. For example, each program is stored in a "portable physical medium" such as a flexible disk (FD), CD-ROM, DVD, magneto-optical disk, or IC card that is inserted into the computer 200. Then, the computer 200 may read and execute each program 207a to 207d.

以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。 Regarding the embodiments including each of the above examples, the following additional notes are further disclosed.

(付記1)複数のレコードを含むデータテーブルを受け付け、
受け付けた前記データテーブルの分析結果に基づき、前記複数のレコードに含まれる複数のデータのうち、修正の対象候補である複数の修正候補データを特定し、
前記複数のレコードのうち、過去にデータへの編集が行われたレコードに基づき、特定した前記複数の修正候補データからいずれかの修正候補データを選定し、
選定した前記修正候補データを出力する、
処理をコンピュータが実行することを特徴とする修正支援方法。
(Additional note 1) Accepts a data table containing multiple records,
Based on the analysis result of the received data table, identifying a plurality of correction candidate data that are correction target candidates among the plurality of data included in the plurality of records;
Selecting any correction candidate data from the identified plurality of correction candidate data based on records in which data has been edited in the past among the plurality of records;
outputting the selected correction candidate data;
A correction support method characterized in that processing is executed by a computer.

(付記2)前記複数のレコードには、前記データを編集する場合に用いられた言語の種別が設定され、前記特定する処理は、前記複数のレコードに設定された言語の種別のうち、優先する言語の種別を更に特定し、前記選定する処理は、前記優先する言語の種別を基にして、特定した前記複数の修正候補データからいずれかの修正候補データを選定することを特徴とする付記1に記載の修正支援方法。 (Additional Note 2) The language types used when editing the data are set in the plurality of records, and the identifying process prioritizes the language types set in the plurality of records. Supplementary Note 1, wherein the process of further specifying and selecting a language type selects any correction candidate data from the identified plurality of correction candidate data based on the prioritized language type. Correction support method described in.

(付記3)前記特定する処理は、修正候補データに示される前記データテーブルに対する修正回数に基づいた修正コストを更に特定し、前記選定する処理は、前記優先する言語の種別に関するレコードを修正する修正候補データに対する修正コストを、小さくする修正を行い、修正コストの小さい修正候補データを優先して選定することを特徴とする付記2に記載の修正支援方法。 (Additional Note 3) The identifying process further specifies a modification cost based on the number of modifications to the data table indicated in the modification candidate data, and the selecting process includes modifications to modify records related to the preferred language type. The modification support method according to appendix 2, characterized in that modification is performed to reduce the modification cost to the candidate data, and priority is given to selecting modification candidate data with a small modification cost.

(付記4)前記特定する処理は、前記複数のレコードに設定された言語の種別のうち、出現頻度が他の言語の種別よりも大きい言語の種別を、前記優先する言語の種別として特定することを特徴とする付記2に記載の修正支援方法。 (Additional note 4) The identifying process is to identify a language type whose appearance frequency is higher than other language types among the language types set in the plurality of records as the priority language type. The correction support method according to appendix 2, characterized by:

(付記5)複数のレコードを含むデータテーブルを受け付け、
受け付けた前記データテーブルの分析結果に基づき、前記複数のレコードに含まれる複数のデータのうち、修正の対象候補である複数の修正候補データを特定し、
前記複数のレコードのうち、過去にデータへの編集が行われたレコードに基づき、特定した前記複数の修正候補データからいずれかの修正候補データを選定し、
選定した前記修正候補データを出力する、
処理をコンピュータに実行させることを特徴とする修正支援プログラム。
(Appendix 5) Accepts a data table containing multiple records,
Based on the analysis result of the received data table, identifying a plurality of correction candidate data that are correction target candidates among the plurality of data included in the plurality of records;
Selecting any correction candidate data from the identified plurality of correction candidate data based on records in which data has been edited in the past among the plurality of records;
outputting the selected correction candidate data;
A modification support program that causes a computer to perform processing.

(付記6)前記複数のレコードには、前記データを編集する場合に用いられた言語の種別が設定され、前記特定する処理は、前記複数のレコードに設定された言語の種別のうち、優先する言語の種別を更に特定し、前記選定する処理は、前記優先する言語の種別を基にして、特定した前記複数の修正候補データからいずれかの修正候補データを選定することを特徴とする付記5に記載の修正支援プログラム。 (Additional note 6) The language types used when editing the data are set in the plurality of records, and the identifying process prioritizes the language types set in the plurality of records. Supplementary note 5, wherein the process of further specifying and selecting a language type selects any correction candidate data from the identified plurality of correction candidate data based on the prioritized language type. Modification support program as described in .

(付記7)前記特定する処理は、修正候補データに示される前記データテーブルに対する修正回数に基づいた修正コストを更に特定し、前記選定する処理は、前記優先する言語の種別に関するレコードを修正する修正候補データに対する修正コストを、小さくする修正を行い、修正コストの小さい修正候補データを優先して選定することを特徴とする付記6に記載の修正支援プログラム。 (Additional Note 7) The identifying process further specifies a modification cost based on the number of modifications to the data table indicated in the modification candidate data, and the selecting process includes modifications to modify records related to the preferred language type. The correction support program according to appendix 6, characterized in that the correction support program performs correction to reduce the correction cost to the candidate data, and selects correction candidate data with a lower correction cost with priority.

(付記8)前記特定する処理は、前記複数のレコードに設定された言語の種別のうち、出現頻度が他の言語の種別よりも大きい言語の種別を、前記優先する言語の種別として特定することを特徴とする付記6に記載の修正支援プログラム。 (Additional note 8) The identifying process is to identify, among the language types set in the plurality of records, a language type whose appearance frequency is higher than other language types as the priority language type. The correction support program described in appendix 6, characterized by:

(付記9)複数のレコードを含むデータテーブルを受け付け、
受け付けた前記データテーブルの分析結果に基づき、前記複数のレコードに含まれる複数のデータのうち、修正の対象候補である複数の修正候補データを特定し、
前記複数のレコードのうち、過去にデータへの編集が行われたレコードに基づき、特定した前記複数の修正候補データからいずれかの修正候補データを選定し、
選定した前記修正候補データを出力する、
処理を実行する制御部を有する情報処理装置。
(Appendix 9) Accepts a data table containing multiple records,
Based on the analysis result of the received data table, identifying a plurality of correction candidate data that are correction target candidates among the plurality of data included in the plurality of records;
Selecting any correction candidate data from the identified plurality of correction candidate data based on records in which data has been edited in the past among the plurality of records;
outputting the selected correction candidate data;
An information processing device that has a control unit that executes processing.

(付記10)前記複数のレコードには、前記データを編集する場合に用いられた言語の種別が設定され、前記制御部は、前記複数のレコードに設定された言語の種別のうち、優先する言語の種別を更に特定し、前記優先する言語の種別を基にして、特定した前記複数の修正候補データからいずれかの修正候補データを選定することを特徴とする付記9に記載の情報処理装置。 (Additional Note 10) The plurality of records are set with language types used when editing the data, and the control unit selects a language that is prioritized among the language types set in the plurality of records. The information processing device according to appendix 9, further comprising: further specifying a type of the preferred language, and selecting one of the specified correction candidate data from among the specified plurality of correction candidate data.

(付記11)前記制御部は、修正候補データに示される前記データテーブルに対する修正回数に基づいた修正コストを更に特定し、前記選定する処理は、前記優先する言語の種別に関するレコードを修正する修正候補データに対する修正コストを、小さくする修正を行い、修正コストの小さい修正候補データを優先して選定することを特徴とする付記9に記載の情報処理装置。 (Supplementary Note 11) The control unit further specifies a modification cost based on the number of modifications to the data table indicated in the modification candidate data, and the selecting process includes modification candidates for modifying records related to the prioritized language type. The information processing apparatus according to appendix 9, wherein correction is performed to reduce the correction cost to the data, and correction candidate data with a small correction cost is selected with priority.

(付記12)前記制御部は、前記複数のレコードに設定された言語の種別のうち、出現頻度が他の言語の種別よりも大きい言語の種別を、前記優先する言語の種別として特定することを特徴とする付記10に記載の情報処理装置。 (Additional Note 12) The control unit may specify, among the language types set in the plurality of records, a language type whose appearance frequency is higher than other language types as the priority language type. The information processing device according to feature Supplementary Note 10.

100 情報処理装置
110 通信部
120 入力部
130 表示部
140 記憶部
141 統制語彙データ
150 制御部
151 受付部
152 特定部
153 選定部
154 表示制御部
100 Information processing device 110 Communication unit 120 Input unit 130 Display unit 140 Storage unit 141 Controlled vocabulary data 150 Control unit 151 Reception unit 152 Specification unit 153 Selection unit 154 Display control unit

Claims (6)

複数のレコードを含むデータテーブルを受け付け、
受け付けた前記データテーブルの分析結果に基づき、前記複数のレコードに含まれる複数のデータのうち、修正の対象候補である複数の修正候補データを特定し、
前記複数のレコードのうち、過去にデータへの編集が行われたレコードに基づき、特定した前記複数の修正候補データからいずれかの修正候補データを選定し、
選定した前記修正候補データを出力する、
処理をコンピュータが実行することを特徴とする修正支援方法。
Accepts a data table containing multiple records,
Based on the analysis result of the received data table, identifying a plurality of correction candidate data that are correction target candidates among the plurality of data included in the plurality of records;
Selecting any correction candidate data from the identified plurality of correction candidate data based on records in which data has been edited in the past among the plurality of records;
outputting the selected correction candidate data;
A correction support method characterized in that processing is executed by a computer.
前記複数のレコードには、前記データを編集する場合に用いられた言語の種別が設定され、前記特定する処理は、前記複数のレコードに設定された言語の種別のうち、優先する言語の種別を更に特定し、前記選定する処理は、前記優先する言語の種別を基にして、特定した前記複数の修正候補データからいずれかの修正候補データを選定することを特徴とする請求項1に記載の修正支援方法。 Language types used when editing the data are set in the plurality of records, and the identifying process selects a preferred language type among the language types set in the plurality of records. 2. The process of further specifying and selecting selects any correction candidate data from the identified plurality of correction candidate data based on the type of the prioritized language. Correction support method. 前記特定する処理は、修正候補データに示される前記データテーブルに対する修正回数に基づいた修正コストを更に特定し、前記選定する処理は、前記優先する言語の種別に関するレコードを修正する修正候補データに対する修正コストを、小さくする修正を行い、修正コストの小さい修正候補データを優先して選定することを特徴とする請求項2に記載の修正支援方法。 The identifying process further specifies a modification cost based on the number of modifications to the data table indicated in the modification candidate data, and the selecting process includes a modification to the modification candidate data that modifies a record related to the preferred language type. 3. The modification support method according to claim 2, wherein modification is performed to reduce the cost, and priority is given to selecting modification candidate data with a small modification cost. 前記特定する処理は、前記複数のレコードに設定された言語の種別のうち、出現頻度が他の言語の種別よりも大きい言語の種別を、前記優先する言語の種別として特定することを特徴とする請求項2に記載の修正支援方法。 The identifying process is characterized in that, among the language types set in the plurality of records, a language type whose appearance frequency is higher than other language types is specified as the priority language type. The correction support method according to claim 2. 複数のレコードを含むデータテーブルを受け付け、
受け付けた前記データテーブルの分析結果に基づき、前記複数のレコードに含まれる複数のデータのうち、修正の対象候補である複数の修正候補データを特定し、
前記複数のレコードのうち、過去にデータへの編集が行われたレコードに基づき、特定した前記複数の修正候補データからいずれかの修正候補データを選定し、
選定した前記修正候補データを出力する、
処理をコンピュータに実行させることを特徴とする修正支援プログラム。
Accepts a data table containing multiple records,
Based on the analysis result of the received data table, identifying a plurality of correction candidate data that are correction target candidates among the plurality of data included in the plurality of records;
Selecting any correction candidate data from the identified plurality of correction candidate data based on records in which data has been edited in the past among the plurality of records;
outputting the selected correction candidate data;
A modification support program that causes a computer to perform processing.
複数のレコードを含むデータテーブルを受け付け、
受け付けた前記データテーブルの分析結果に基づき、前記複数のレコードに含まれる複数のデータのうち、修正の対象候補である複数の修正候補データを特定し、
前記複数のレコードのうち、過去にデータへの編集が行われたレコードに基づき、特定した前記複数の修正候補データからいずれかの修正候補データを選定し、
選定した前記修正候補データを出力する、
処理を実行する制御部を有する情報処理装置。
Accepts a data table containing multiple records,
Based on the analysis result of the received data table, identifying a plurality of correction candidate data that are correction target candidates among the plurality of data included in the plurality of records;
Selecting any correction candidate data from the identified plurality of correction candidate data based on records in which data has been edited in the past among the plurality of records;
outputting the selected correction candidate data;
An information processing device that has a control unit that executes processing.
JP2022057621A 2022-03-30 2022-03-30 Correction support method, correction support program, and information processing apparatus Pending JP2023149188A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022057621A JP2023149188A (en) 2022-03-30 2022-03-30 Correction support method, correction support program, and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022057621A JP2023149188A (en) 2022-03-30 2022-03-30 Correction support method, correction support program, and information processing apparatus

Publications (1)

Publication Number Publication Date
JP2023149188A true JP2023149188A (en) 2023-10-13

Family

ID=88288094

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022057621A Pending JP2023149188A (en) 2022-03-30 2022-03-30 Correction support method, correction support program, and information processing apparatus

Country Status (1)

Country Link
JP (1) JP2023149188A (en)

Similar Documents

Publication Publication Date Title
US7207004B1 (en) Correction of misspelled words
EP1783629A1 (en) Representing a computer system state to a user
JP5969697B2 (en) Completing the application interface using search query keywords
US20130290836A1 (en) Methods and apparatus for copying text format pattern
JP6290230B2 (en) Transliteration work support device, transliteration work support method, and program
JP5651050B2 (en) Data generation apparatus and data generation program
JP2012190203A (en) Tabular format software specification preparation support method and device
JP2023149188A (en) Correction support method, correction support program, and information processing apparatus
CN116385230A (en) Child reading ability evaluation method and system
CN112434537A (en) Translation text consistency checking method, computing device and storage medium
JP2001013862A (en) Optimum template pattern deciding method, deciding device, evaluating method using optimum template pattern, evaluating device and recording medium
CN117112730B (en) Target text searching method based on macro expansion text, electronic equipment and medium
JP4387324B2 (en) Property conversion device
JP2008210229A (en) Device, method and program for retrieving intellectual property information
JPH10301933A (en) Document processor, its method and recording medium
Calderini et al. GRD for R: An intuitive tool for generating random data in R
JP2005251127A (en) Pattern system construction device and pattern application device
US20210382889A1 (en) Information processing apparatus
JP4721344B2 (en) Word search device, word search method and program
JP2010134766A (en) Document data processing apparatus and program thereof
JPH0744560A (en) Logical structure recognition processing system in document processor
US20130091423A1 (en) Method and Apparatus for Checking a Structure Conformity for a Piece Of Development Documentation with at Least One Development Document
JP2023036511A (en) Distributed representation generation system, distributed representation generation method and distributed representation generation program
CN115203144A (en) Method and device for evaluating practice exercises, computer equipment and storage medium
CN113609821A (en) Regular expression conversion method, device, equipment and storage medium