JP6790328B2 - Word addition device, word addition method and word addition program - Google Patents

Word addition device, word addition method and word addition program Download PDF

Info

Publication number
JP6790328B2
JP6790328B2 JP2016073871A JP2016073871A JP6790328B2 JP 6790328 B2 JP6790328 B2 JP 6790328B2 JP 2016073871 A JP2016073871 A JP 2016073871A JP 2016073871 A JP2016073871 A JP 2016073871A JP 6790328 B2 JP6790328 B2 JP 6790328B2
Authority
JP
Japan
Prior art keywords
keyword
combination
priority
annotation
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016073871A
Other languages
Japanese (ja)
Other versions
JP2017187823A (en
Inventor
祐二 新井
祐二 新井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maeda Corp
Original Assignee
Maeda Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maeda Corp filed Critical Maeda Corp
Priority to JP2016073871A priority Critical patent/JP6790328B2/en
Publication of JP2017187823A publication Critical patent/JP2017187823A/en
Application granted granted Critical
Publication of JP6790328B2 publication Critical patent/JP6790328B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文言追記装置、文言追記方法及び文言追記プログラムに関する。 The present invention relates to a word addition device, a word addition method, and a word addition program.

従来、文書から対象となる単語を抽出し、注釈を付加するという技術が提案されている(例えば、特許文献1及び特許文献2)。 Conventionally, a technique of extracting a target word from a document and adding an annotation has been proposed (for example, Patent Document 1 and Patent Document 2).

特開平8−153091号公報Japanese Unexamined Patent Publication No. 8-153091 特開平9−44486号公報Japanese Unexamined Patent Publication No. 9-44486

従来、文中の単語に注釈を付加する技術は提案されているが、キーワード検索を行うだけでは、複雑な条件に基づいて注釈を付加する対象を抽出することができない。例えば、報告書から進捗状況を判断したり、ある対象に所定の動作を行う旨の記載を抽出したりして注釈を追記するような、意味的な判断は難しい。また、相反する意味の語句を含む文に対して、内容を判断することも容易ではない。 Conventionally, a technique for adding annotations to words in a sentence has been proposed, but it is not possible to extract a target to be annotated based on complicated conditions only by performing a keyword search. For example, it is difficult to make a semantic judgment such as judging the progress status from a report or extracting a description that a predetermined action is performed on a certain object and adding an annotation. In addition, it is not easy to judge the content of a sentence containing words and phrases with contradictory meanings.

一方、意味解析のような自然言語処理によって条件を判断する場合、キーワード検索と比較して処理負荷が大きくなるだけでなく、条件を定義するために熟練を要することになる。 On the other hand, when a condition is judged by natural language processing such as semantic analysis, not only the processing load becomes larger than that of a keyword search, but also skill is required to define the condition.

そこで、本発明は、文書に追記する文言の妥当性を簡易な方法で向上させることを目的とする。 Therefore, an object of the present invention is to improve the validity of the wording to be added to the document by a simple method.

本発明に係る文言追記装置は、文書ファイルを読み出し、内容に文言を追記する装置であって、第1のキーワード及び第2のキーワードの組み合わせに対応付けて、追記する文言及び当該組み合わせを適用する優先順位を記憶する記憶部と、文書ファイルが、第1のキーワード及び第2のキーワードを含む場合、記憶部において当該第1のキーワード及び第2のキーワードの組み合わせに対応付けられている文言を追記する文言追記部とを有し、文言追記部は、優先順位に従って組み合わせに含まれるキーワードが文書ファイルに存在するか判断し、存在する場合、見つかった組合せに対応付けて記憶部に記憶されている文言を追記する。 The wording addition device according to the present invention is a device that reads a document file and adds words to the contents, and applies the words to be added and the combination in association with the combination of the first keyword and the second keyword. When the storage unit for storing the priority and the document file include the first keyword and the second keyword, the wording associated with the combination of the first keyword and the second keyword is added in the storage unit. The wording addition part has a wording addition part, which determines whether the keyword included in the combination exists in the document file according to the priority, and if it exists, it is stored in the storage unit in association with the found combination. Add the wording.

このようにすれば、第1のキーワード及び第2のキーワードを優先順位に従って検索し、見つかった組み合わせに対応付けられた文言を追記することができる。単語の組み合わせに応じて追記する文言を変えるだけでなく、第1のキーワード又は第2のキーワードの組み合わせに優先度を定めておくことで、追記する文言を適切に選択できるようになる。すなわち、文書に追記する文言の妥当性を簡易な方法で向上させることができる。 In this way, the first keyword and the second keyword can be searched in order of priority, and the wording associated with the found combination can be added. Not only changing the word to be added according to the combination of words, but also setting the priority for the combination of the first keyword or the second keyword makes it possible to appropriately select the word to be added. That is, the validity of the wording added to the document can be improved by a simple method.

また、記憶部は、第1のキーワード又は第2のキーワードと上位概念、下位概念、又は同一概念の関係にある単語を対応付けてさらに記憶し、文言追記部は、第1のキーワード及び第2のキーワードの各々について、上位概念、下位概念、又は同一概念の関係にある単語に置き換えた組み合わせが存在する場合、記憶部において当該第1のキーワード及び
第2のキーワードの組み合わせに対応付けられている文言を追記するようにしてもよい。このようにすれば、文書ファイル中に表記の揺れがあった場合でも、適切な注釈を付加することができる。
Further, the storage unit further stores the first keyword or the second keyword in association with the superordinate concept, the subordinate concept, or a word having the same concept, and the word addition unit stores the first keyword and the second keyword. When there is a combination in which each of the keywords of is replaced with a superordinate concept, a subordinate concept, or a word having the same concept, the first keyword and the second keyword combination are associated with each other in the storage unit. You may add the wording. In this way, even if there is a fluctuation in the notation in the document file, an appropriate annotation can be added.

また、第1のキーワード又は第2のキーワードは、上限及び下限の少なくともいずれかが定められた数値の範囲によって定義され、文言追記部は、数値の範囲によって定義されたキーワードについて、当該範囲に含まれる数値が文書ファイルに存在するか判断するようにしてもよい。このようにすれば、文中に含まれる数値が、所定の範囲に属するか否かを判断することで、文書に含まれる語句の規模を推定し、適切な文言を追記することができる。 Further, the first keyword or the second keyword is defined by a numerical range in which at least one of the upper limit and the lower limit is defined, and the wording addition section includes the keyword defined by the numerical range in the range. You may want to determine if the number is present in the document file. In this way, it is possible to estimate the scale of words and phrases contained in the document and add appropriate words by determining whether or not the numerical values contained in the sentence belong to a predetermined range.

また、第1のキーワードは、行為の対象として文書ファイル中に出現が期待される語句であり、第2のキーワードは、行為として出現が期待される語句であってもよい。このようにすれば、処理対象の文書データの内容に応じて、出現が期待される単語を定義しておくことができ、追記する文言の妥当性をより向上させることができる。 Further, the first keyword may be a phrase that is expected to appear in the document file as an act, and the second keyword may be a phrase that is expected to appear as an act. In this way, words that are expected to appear can be defined according to the content of the document data to be processed, and the validity of the word to be added can be further improved.

また、文言追記部は、文書ファイルの内容である文章に対し、文、段落又はページごとに組み合わせに含まれるキーワードが存在するか判断し、当該組み合わせに含まれるキーワードが存在すると判断された文、段落又はページに対し、文言を追記するようにしてもよい。このようにすれば、文書の形式に応じて、適切な単位で文言を追記することができるようになる。 In addition, the wording addition section determines whether or not there is a keyword included in the combination for each sentence, paragraph or page for the sentence that is the content of the document file, and the sentence that is determined to have the keyword included in the combination. The wording may be added to the paragraph or page. In this way, it becomes possible to add words in appropriate units according to the format of the document.

また、記憶部に記憶される組み合わせは、第3のキーワードをさらに含むようにしてもよい。3以上のキーワードの組み合わせを検索することで、文言を追記すべきか否かの判断の精度をさらに向上させることができる。 Further, the combination stored in the storage unit may further include a third keyword. By searching for a combination of three or more keywords, the accuracy of determining whether or not to add a wording can be further improved.

なお、課題を解決するための手段に記載の内容は、本発明の課題や技術的思想を逸脱しない範囲で可能な限り組み合わせることができる。また、課題を解決するための手段の内容は、コンピュータ等の装置若しくは複数の装置を含むシステム、コンピュータが実行する方法、又はコンピュータに実行させるプログラムとして提供することができる。なお、プログラムを保持する記録媒体を提供するようにしてもよい。 The contents described in the means for solving the problems can be combined as much as possible without departing from the problems and technical ideas of the present invention. Further, the content of the means for solving the problem can be provided as a device such as a computer or a system including a plurality of devices, a method executed by the computer, or a program executed by the computer. A recording medium for holding the program may be provided.

本発明によれば、文書に追記する文言の妥当性を簡易な方法で向上させることができる。 According to the present invention, the validity of the wording added to the document can be improved by a simple method.

注釈追記装置の一例を示す機能ブロック図である。It is a functional block diagram which shows an example of the annotation addition device. コンピュータの一例を示す装置構成図である。It is a device block diagram which shows an example of a computer. 追記処理の一例を示す図である。It is a figure which shows an example of the addition processing. 概念辞書の内容の一例を示す図である。It is a figure which shows an example of the contents of a concept dictionary. 概念辞書の内容の一例を示す図である。It is a figure which shows an example of the contents of a concept dictionary. キーワードの組合せと対応付けて記憶される注釈の一例を示す図である。It is a figure which shows an example of the annotation which is stored in association with the combination of keywords. 追記処理の後半部分の一例を示す図である。It is a figure which shows an example of the latter half part of a postscript process. 補集合に対するキーワード検索処理を説明するための図である。It is a figure for demonstrating the keyword search process for a complement. 変形例に係る注釈の一例を示す図である。It is a figure which shows an example of the annotation which concerns on the modification. 変形例に係る概念辞書の内容の一例を示す図である。It is a figure which shows an example of the contents of the concept dictionary which concerns on a modification.

以下、本発明の実施形態について、図面を用いて説明する。なお、以下の実施形態は例
示であり、本発明は下記の構成には限定されない。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. The following embodiments are examples, and the present invention is not limited to the following configurations.

<機能構成>
図1は、本実施形態に係る注釈追記装置の一例を示す機能ブロック図である。注釈追記装置1は、コンピュータによって構成され、記憶部11と、キーワード読出部12と、文書読出部13と、注釈追記部14とを有する。
<Functional configuration>
FIG. 1 is a functional block diagram showing an example of an annotation addition device according to the present embodiment. The annotation addition device 1 is composed of a computer and includes a storage unit 11, a keyword reading unit 12, a document reading unit 13, and an annotation addition unit 14.

記憶部11は、本実施形態において処理の対象となる文書ファイル、文書ファイルから抽出するキーワードの組合せ及び抽出されたキーワードの組合せに対して追記する注釈の内容、その他中間的に生成されるデータや注釈を追記した後の文書ファイル等を記憶する。文書ファイルは、例えば、ワープロソフトにて用いられる規格やPDF(Portable Document Format)等の規格に基づいて作成された電子データである。なお、表計算ソフトやプレゼンテーションソフト、その他の文字列を含む様々な電子データを処理対象としてもよい。また、記憶部11に予め記憶され、ユーザがキーワード等を設定しておくファイルを「概念辞書」と呼ぶものとする。概念辞書には、各キーワードに対して同義語及び下位概念に当たる語をさらに登録しておき、検索キーワードを拡張するようにしてもよい。また、概念辞書においてキーワードには優先順位が定められ、注釈を追記する処理においては優先順位に基づいてキーワードの組合せを決定する。 The storage unit 11 includes a document file to be processed in the present embodiment, a combination of keywords extracted from the document file, an annotation content to be added to the combination of the extracted keywords, and other data generated in the middle. Store the document file, etc. after adding the annotation. The document file is, for example, electronic data created based on a standard used in word processing software or a standard such as PDF (Portable Document Format). Note that various electronic data including spreadsheet software, presentation software, and other character strings may be processed. Further, a file stored in advance in the storage unit 11 and in which a user sets keywords and the like is called a "concept dictionary". In the concept dictionary, synonyms and words corresponding to subordinate concepts may be further registered for each keyword to expand the search keyword. In addition, priorities are set for keywords in the concept dictionary, and in the process of adding annotations, the combination of keywords is determined based on the priorities.

キーワード読出部12は、記憶部11からキーワードの組合せを読み出す。本実施形態に係るキーワードには予め優先順位が定められており、キーワード読出部12は、優先順位に基づいて検索するキーワードの組合せを読み出すものとする。また、キーワードに対して同義語や上位概念、下位概念の関係にある語が定義されている場合、キーワード読出部12は、キーワードの同義語や下位概念に当たる語をさらに用いて、文書ファイルからキーワードの組合せを抽出するようにしてもよい。 The keyword reading unit 12 reads a combination of keywords from the storage unit 11. The keywords according to the present embodiment have a predetermined priority, and the keyword reading unit 12 reads out a combination of keywords to be searched based on the priority. Further, when a synonym, a superordinate concept, or a subordinate concept is defined for the keyword, the keyword reading unit 12 further uses a word corresponding to the synonym or subordinate concept of the keyword to obtain a keyword from the document file. You may try to extract the combination of.

文書読出部13は、例えばユーザの操作に基づいて処理の対象とする文書ファイルの指定を受け付け、当該文書ファイルを所定の箇所ごとに区切って読み出す。具体的には、文書読出部13は、文書ファイルに含まれる文字列を、一文ごと、段落ごと、ページごと等といった所定の単位で読み出す。 The document reading unit 13 accepts the designation of the document file to be processed based on, for example, the user's operation, and reads the document file by dividing it into predetermined places. Specifically, the document reading unit 13 reads a character string included in the document file in a predetermined unit such as sentence by sentence, paragraph by paragraph, page by page, or the like.

注釈追記部14は、文書読出部13が読み出した文書ファイルの箇所から、キーワード読出部12が読み出したキーワードの組合せを抽出し、キーワードの組合せが抽出された箇所に対して所定の注釈を追記する。注釈とは、主として文書ファイルの内容に対する補足や説明、解説等であるが、任意の文字列であってもよい。また、注釈は、文書ファイルの規格において提供される機能を利用して追記するようにしてもよいし、本文中に例えば文字サイズや文字色に差をつけた文字列として追記するようにしてもよい。 The annotation addition unit 14 extracts the keyword combination read by the keyword reading unit 12 from the part of the document file read by the document reading unit 13, and adds a predetermined annotation to the part where the keyword combination is extracted. .. Annotations are mainly supplements, explanations, explanations, etc. for the contents of a document file, but may be any character string. In addition, annotations may be added by using the function provided in the document file standard, or may be added as a character string with a difference in character size or character color in the text. Good.

<装置構成>
図2は、コンピュータの一例を示す装置構成図である。注釈追記装置1は、例えば図2に示すようなコンピュータである。図2に示すコンピュータ1000は、CPU(Central Processing Unit)1001、主記憶装置1002、補助記憶装置(外部記憶装置)1
003、通信IF(Interface)1004、入出力IF(Interface)1005、ドライブ装置1006、通信バス1007を備えている。CPU1001は、プログラムを実行することにより本実施の形態に係る処理等を行う。主記憶装置1002は、CPU1001が読み出したプログラムやデータをキャッシュしたり、CPUの作業領域を確保したりする。主記憶装置は、具体的には、RAM(Random Access Memory)やROM(Read Only Memory)等である。補助記憶装置1003は、CPU1001により実行されるプログラムや、本実施の形態で用いる設定情報などを記憶する。補助記憶装置1003は、具体的には、HDD(Hard-disk Drive)やSSD(Solid State Drive)、eMMC(embedded
Multi-Media Card)、フラッシュメモリ等である。主記憶装置1002や補助記憶装置
1003は、記憶部11等として働く。通信IF1004は、他のコンピュータとの間でデータを送受信する。通信IF1004は、具体的には、有線又は無線のネットワークカード等である。入出力IF1005は、入出力装置と接続され、ユーザから入力を受け付けたり、ユーザへ情報を出力したりする。入出力装置は、具体的には、キーボード、マウス、ディスプレイ、タッチパネル等である。ドライブ装置1006は、磁気ディスク、光磁気ディスク、光ディスク等の記憶媒体に記録されたデータを読み出したり、記憶媒体にデータを書き込んだりする。そして、以上のような構成要素が、通信バス1007で接続されている。なお、これらの構成要素はそれぞれ複数設けられていてもよいし、一部の構成要素(例えば通信IF1004やドライブ装置1006)が設けられなくてもよい。また、入出力装置がコンピュータと一体に構成されていてもよい。また、ドライブ装置1006で読み取り可能な可搬性の記憶媒体や、フラッシュメモリのような可搬性の補助記憶装置1003、通信IF1004などを介して、本実施の形態で実行されるプログラムが提供されるようにしてもよい。そして、CPU1001がプログラムを実行することにより、上記のようなコンピュータを注釈追記装置1として働かせる。
<Device configuration>
FIG. 2 is a device configuration diagram showing an example of a computer. The annotation addition device 1 is, for example, a computer as shown in FIG. The computer 1000 shown in FIG. 2 includes a CPU (Central Processing Unit) 1001, a main storage device 1002, and an auxiliary storage device (external storage device) 1.
It includes 003, a communication IF (Interface) 1004, an input / output IF (Interface) 1005, a drive device 1006, and a communication bus 1007. The CPU 1001 performs processing and the like according to the present embodiment by executing a program. The main storage device 1002 caches programs and data read by the CPU 1001 and secures a work area of the CPU. Specifically, the main storage device is a RAM (Random Access Memory), a ROM (Read Only Memory), or the like. The auxiliary storage device 1003 stores a program executed by the CPU 1001 and setting information used in the present embodiment. Specifically, the auxiliary storage device 1003 includes an HDD (Hard-disk Drive), an SSD (Solid State Drive), and an eMMC (embedded).
Multi-Media Card), flash memory, etc. The main storage device 1002 and the auxiliary storage device 1003 work as a storage unit 11 and the like. The communication IF1004 transmits / receives data to / from another computer. Specifically, the communication IF1004 is a wired or wireless network card or the like. The input / output IF1005 is connected to an input / output device, receives input from the user, and outputs information to the user. Specifically, the input / output device is a keyboard, a mouse, a display, a touch panel, or the like. The drive device 1006 reads data recorded on a storage medium such as a magnetic disk, a magneto-optical disk, or an optical disk, or writes data to the storage medium. Then, the above-mentioned components are connected by the communication bus 1007. It should be noted that a plurality of these components may be provided, or some components (for example, communication IF 1004 and drive device 1006) may not be provided. Further, the input / output device may be integrally configured with the computer. Further, a program executed in the present embodiment is provided via a portable storage medium that can be read by the drive device 1006, a portable auxiliary storage device 1003 such as a flash memory, a communication IF 1004, and the like. It may be. Then, the CPU 1001 executes the program to operate the computer as described above as the annotation addition device 1.

<追記処理>
図3は、本実施形態に係る追記処理の一例を示す図である。本実施形態では、営業報告書に対し、ある案件が、営業活動の開始から受注又は失注に至るどのような進捗段階にあるのかを示すステータスを追記する。具体的には、優先順位に従って選択される第1のキーワードと第2のキーワードとの組合せを営業報告書から検索し、見つかった組合せに対応付けて予め定められている文言を追記する。
<Additional processing>
FIG. 3 is a diagram showing an example of additional processing according to the present embodiment. In the present embodiment, a status indicating the progress stage from the start of sales activities to the order or loss of orders is added to the sales report. Specifically, the combination of the first keyword and the second keyword selected according to the priority is searched from the sales report, and a predetermined wording is added in association with the found combination.

まず、注釈追記装置1のキーワード読出部12は、記憶部11から優先順位に基づいてキーワードの組合せを読み出す(S1)。本実施形態では、優先順位の定義された第1のキーワードと、同じく優先順位の定義された第2のキーワードが予め記憶部11に記憶されているものとする。 First, the keyword reading unit 12 of the annotation adding device 1 reads a combination of keywords from the storage unit 11 based on the priority (S1). In the present embodiment, it is assumed that the first keyword for which the priority is defined and the second keyword for which the priority is also defined are stored in the storage unit 11 in advance.

図4A及び図4Bは、本実施形態において予め記憶部11に記憶されている概念辞書の一例を模式的に示す図である。概念辞書には、例えば、優先順位の高い「契約」と優先順位の低い「提案」とを含む第1のキーワードと、優先順位の高い「失敗」と優先順位の低い「成功」とを含む第2のキーワードとが記憶されている。また、図4Aは、第1のキーワード及びその下位概念に相当する複数の語を示している。図4Bは、第2のキーワード及びその下位概念に相当する複数の語を示している。便宜上、図4Aに示すキーワードの集合を第1の集合と呼び、図4Bに示すキーワードの集合を第2の集合と呼ぶものとする。換言すれば、第1の集合は、上位概念及び下位概念を親子関係で示すツリー構造で表されたキーワード群を2つ含んでいる。具体的には、第1の集合は、「契約」を上位概念とし、「本契約」、「コントラクト」、「仮契約」等を下位概念とする第1のキーワード群と、「提案」を上位概念とし、「プレゼン」、「プロポーザル」、「オファー」等を下位概念とする第2のキーワード群とを含む。図4Aにおいては、上位概念に相当する第1のキーワードを二重山括弧で囲っている。図4Bにおいては、上位概念に相当する第2のキーワードを二重山括弧で囲っている。また、第1のキーワードに定義された優先順位と同様に、第2のキーワード群よりも第1のキーワード群の方が優先順位が高いものとする。同様に、第2のキーワード群は、「失敗」を上位概念とし、「着けず」、「至らない」、「ペンディング」、「難しい」、「無理」、「失注」等を下位概念とする第1のキーワード群と、「成功」を上位概念とし、「行う」、「結ぶ」、「達成」、「サクセス」、「実施」等を下位概念とする第2のキーワード群とを含む。また、第2の集合内においても、第1のキーワード群の方が、第2のキーワード群よりも優先順位が高いものとする。また、第1のキーワード(第1の集合)と第2のキーワード(第2の集合)との間にも優先順位が定義されており、例えば第1のキーワードの方が第2のキーワードよりも優先順位が
高いものとする。すなわち、第1のキーワードにおいて優先順位の低い「提案」と第2のキーワードにおいて優先順位の高い「失敗」との組合せよりも、第1のキーワードにおいて優先順位の高い「契約」と第2のキーワードにおいて優先順位の低い「成功」との組合せの方が優先されるものとする。なお、各キーワード群において、同一概念を示す語(「同義語」又は「類義語」とも呼ぶ)がさらに定義されていてもよい。図4A及び図4Bに示すような辞書は、例えばツリー構造のようなグラフを表現できる様々なデータ構造により記憶部11に格納されるものとする。
4A and 4B are diagrams schematically showing an example of a concept dictionary stored in the storage unit 11 in advance in the present embodiment. The conceptual dictionary contains, for example, a first keyword containing a high priority "contract" and a low priority "suggestion", and a first keyword containing a high priority "failure" and a low priority "success". Two keywords are memorized. Further, FIG. 4A shows a plurality of words corresponding to the first keyword and its subordinate concepts. FIG. 4B shows a plurality of words corresponding to the second keyword and its subordinate concepts. For convenience, the set of keywords shown in FIG. 4A is referred to as a first set, and the set of keywords shown in FIG. 4B is referred to as a second set. In other words, the first set contains two keyword groups represented by a tree structure showing the superordinate concept and the subordinate concept in a parent-child relationship. Specifically, in the first set, the first keyword group with "contract" as the superordinate concept and "main contract", "contract", "provisional contract", etc. as the subordinate concept, and "proposal" as the superordinate concept. The concept includes a second keyword group having "presentation", "proposal", "offer" and the like as subordinate concepts. In FIG. 4A, the first keyword corresponding to the superordinate concept is enclosed in double angle brackets. In FIG. 4B, the second keyword corresponding to the superordinate concept is enclosed in double angle brackets. Further, as with the priority defined for the first keyword, it is assumed that the first keyword group has a higher priority than the second keyword group. Similarly, in the second keyword group, "failure" is a superordinate concept, and "not wearing", "not reaching", "pending", "difficult", "impossible", "loss of order", etc. are subordinate concepts. It includes a first keyword group and a second keyword group in which "success" is a superordinate concept and "do", "connect", "achievement", "success", "implementation", etc. are subordinate concepts. Further, even within the second set, the first keyword group has a higher priority than the second keyword group. In addition, priorities are also defined between the first keyword (first set) and the second keyword (second set). For example, the first keyword is more than the second keyword. It shall have a high priority. That is, rather than the combination of the low-priority "proposal" in the first keyword and the high-priority "failure" in the second keyword, the high-priority "contract" and the second keyword in the first keyword. In the above, the combination with "success", which has a lower priority, shall be given priority. In each keyword group, words indicating the same concept (also referred to as "synonyms" or "synonyms") may be further defined. The dictionaries as shown in FIGS. 4A and 4B are stored in the storage unit 11 by various data structures capable of expressing a graph such as a tree structure.

S1においては、優先順位の高いキーワードの組合せとして、「契約」及び「失敗」が読み出される。 In S1, "contract" and "failure" are read out as a combination of keywords having a high priority.

次に、キーワード読出部12は、記憶部11に記憶されている概念辞書を参照し、S1で読み出されたキーワードの同義語及び下位概念に当たる語を読み出す(S2)。 Next, the keyword reading unit 12 refers to the concept dictionary stored in the storage unit 11 and reads out the synonyms of the keywords read in S1 and the words corresponding to the subordinate concepts (S2).

S2においては、S1で読み出された第1のキーワードの下位概念に当たる「本契約」、「コントラクト」、「仮契約」等と、第2のキーワードの下位概念に当たる「着けず」、「至らない」、「ペンディング」、「難しい」、「無理」、「失注」等が読み出される。 In S2, "this contract", "contract", "provisional contract", etc., which correspond to the subordinate concepts of the first keyword read in S1, and "not attached", "not reached", which correspond to the subordinate concepts of the second keyword. , "Pending", "Difficult", "Impossible", "Loss of order", etc. are read out.

なお、記憶部11には、第1のキーワードと第2のキーワードとの組み合わせに対して、文書ファイルに追記するための注釈も記憶されている。図5は、キーワードの組合せと対応付けて記憶されている注釈の一例を示す図である。キーワードの組合せは、注釈を付す条件を表している。なお、図5においても、図4A及び図4Bと同様に第1のキーワード及び第2のキーワードを二重山括弧で囲っている。すなわち、図5においてツリー構造で示したキーワードの一部は、図4A及び図4Bの概念辞書に登録された上位概念及び下位概念の関係にあるキーワード群に対応している。例えば、「契約」を含むキーワード群と「失敗」を含むキーワード群との組み合わせに対応づけて、「失注状況」という注釈(1)が記憶されている。また、「契約」を含むキーワード群と「成功」を含むキーワード群との組み合わせに対応付けて、「契約状況」という注釈(2)が記憶されている。なお、注釈(2)は、文書中において注釈(1)が追記されなかった部分に対して追記される。また、「提案」を含むキーワード群と「失敗」を含むキーワード群との組み合わせに対応付けて、「再提案状況」という注釈(3)が記憶されている。なお、注釈(3)は、文書中において注釈(1)及び(2)のいずれも追記されなかった部分に対して追記される。また、「提案」を含むキーワード群と「成功」を含むキーワード群との組み合わせに対応付けて、「提案状況」という注釈(4)が記憶されている。なお、注釈(4)は、文書中において注釈(1)〜(3)のいずれも追記されなかった部分に対して追記される。そして、本実施形態では、注釈(1)〜(4)のいずれも追記されなかった部分に対して追記される注釈(5)として、「開発状況」が記憶されているものとする。なお、図5に示す優先順位は、第1のキーワード内において定義された優先順位、第2のキーワード内において定義された優先順位、及び第1のキーワードと第2のキーワードとの間に定義された優先順位に応じて適用される、条件判断の順序を示している。また、図5に概念的に例示した注釈及びこれを付す条件は、記憶部11において、任意の形式のデータベースやファイル等に記憶させることができる。また、二重山括弧で囲われた第1のキーワード及び第2のキーワードにそれぞれぶら下がるキーワード群は、概念辞書を参照することで補完される情報である。 Note that the storage unit 11 also stores annotations for adding to the document file for the combination of the first keyword and the second keyword. FIG. 5 is a diagram showing an example of annotations stored in association with a combination of keywords. The combination of keywords represents the condition for annotating. Also in FIG. 5, the first keyword and the second keyword are enclosed in double angle brackets as in FIGS. 4A and 4B. That is, some of the keywords shown in the tree structure in FIG. 5 correspond to the keyword group having a relationship between the superordinate concept and the subordinate concept registered in the concept dictionaries of FIGS. 4A and 4B. For example, the annotation (1) of "loss of order" is stored in association with the combination of the keyword group including "contract" and the keyword group including "failure". In addition, the annotation (2) of "contract status" is stored in association with the combination of the keyword group including "contract" and the keyword group including "success". Note that the annotation (2) is added to the portion of the document to which the annotation (1) is not added. Further, the annotation (3) of "re-proposal status" is stored in association with the combination of the keyword group including "suggestion" and the keyword group including "failure". Note that the annotation (3) is added to the portion of the document in which neither the annotation (1) nor the annotation (2) is added. In addition, the annotation (4) of "proposal status" is stored in association with the combination of the keyword group including "suggestion" and the keyword group including "success". Note that the annotation (4) is added to the portion of the document in which none of the annotations (1) to (3) is added. Then, in the present embodiment, it is assumed that the "development status" is stored as the annotation (5) to be added to the portion where none of the annotations (1) to (4) is added. The priority shown in FIG. 5 is defined between the priority defined in the first keyword, the priority defined in the second keyword, and the first keyword and the second keyword. It shows the order of condition judgment applied according to the priority. Further, the annotation conceptually illustrated in FIG. 5 and the conditions to which the annotation is attached can be stored in the storage unit 11 in a database, a file, or the like in any format. In addition, the keyword group hanging from the first keyword and the second keyword enclosed in double angle brackets is information that is complemented by referring to the concept dictionary.

その後、注釈追記装置1の文書読出部13は、記憶部11に記憶されている文書ファイルを読み出す(S3)。本ステップでは、文書ファイルに含まれる文字列を、一文ごと、段落ごと、ページごと等といった所定の単位(「部分」とも呼ぶ)に区切って読み出す。例えば、以下のような段落1〜4を含む営業報告書が、段落ごとに読み出されたものとす
る。
段落1「・・・○○様に、併設するホテル△△の駐車場の運営を外部委託したい旨のお話を頂く。次回以降にプレゼンを実施・・・」
段落2「・・・○○様にホテルの駐車場の活用事例をプレゼン。上司に相談してみる旨を言われた・・・」
段落3「・・・提案は成功。契約を年明けに行う。・・・」
段落4「・・・駐車場として使用予定の土地が遊休地となっている・・・」
After that, the document reading unit 13 of the annotation adding device 1 reads the document file stored in the storage unit 11 (S3). In this step, the character string included in the document file is read out by dividing it into predetermined units (also called "parts") such as sentence by sentence, paragraph by paragraph, and page by page. For example, it is assumed that a business report including the following paragraphs 1 to 4 is read out for each paragraph.
Paragraph 1 "... Mr. ○○ wants to outsource the operation of the parking lot of the hotel △△ to be attached. The presentation will be held from the next time onward ..."
Paragraph 2 "... Mr. XX presented an example of using a hotel parking lot. He was told to consult with his boss ..."
Paragraph 3 "... the proposal was successful. The contract will be made at the beginning of the year ...."
Paragraph 4 "... the land to be used as a parking lot is idle ..."

そして、注釈追記装置1の注釈追記部14は、読み出した部分ごとに、キーワードの組合せが存在するか判断する(S4)。本ステップでは、S1で読み出した第1のキーワード並びにS2で読み出した第1のキーワードの同義語及び下位概念に当たる語のいずれかと、S1で読み出した第2のキーワード並びにS2で読み出した第2のキーワードの同義語及び下位概念に当たる語のいずれかとの組合せが、S3で読み出した各段落に存在するか判断する。上述の例では、「契約」及びその下位概念と、「失敗」及びその下位概念との組合せが読み出されているが、S4では段落1〜4の各々において当該キーワードの組合せは抽出されない。 Then, the annotation addition unit 14 of the annotation addition device 1 determines whether or not a combination of keywords exists for each read portion (S4). In this step, one of the synonyms and subordinate concepts of the first keyword read in S1 and the first keyword read in S2, the second keyword read in S1, and the second keyword read in S2 It is determined whether or not a combination with either a synonym of the word or a word corresponding to the subordinate concept exists in each paragraph read in S3. In the above example, the combination of "contract" and its subordinate concept and "failure" and its subordinate concept is read, but in S4, the combination of the keywords is not extracted in each of paragraphs 1 to 4.

キーワードの組合せが存在すると判断された場合(S4:YES)、注釈追記部14は、キーワードの組合せに対応付けて記憶部11に記憶されている注釈を、読み出した部分ごとに追記する(S5)。仮に上述した段落のいずれかにキーワードの組合せが見つかった場合、キーワードの組合せを含む段落に「失注状況」という図5の注釈(1)が追記される。なお、注釈は、例えばワープロソフト等が提供するコメントの挿入機能等によって追記するようにしてもよいし、文書ファイルの本文中に、本文とは文字サイズや文字色、背景色等に差をつけた文字列として追記するようにしてもよい。 When it is determined that the keyword combination exists (S4: YES), the annotation addition unit 14 adds the annotation stored in the storage unit 11 in association with the keyword combination for each read portion (S5). .. If a keyword combination is found in any of the paragraphs described above, the note (1) of FIG. 5 "loss of order status" is added to the paragraph containing the keyword combination. Note that annotations may be added by, for example, a comment insertion function provided by word processing software or the like, or the text size, text color, background color, etc. may be different from the text in the text of the document file. It may be added as a character string.

S4においてキーワードの組合せが存在しないと判断された場合(S4:NO)、又はS5の後、端子Aを介して図6の処理に遷移する。図6は、本実施形態に係る追記処理の後半部分を示す図である。 When it is determined in S4 that the combination of keywords does not exist (S4: NO), or after S5, the process proceeds to the process of FIG. 6 via the terminal A. FIG. 6 is a diagram showing a latter half of the additional processing according to the present embodiment.

キーワード読出部12は、記憶部11に記憶されているキーワードの組合せにおいて、優先順位が下位の組合せが存在するか判断する(S6)。本ステップでは、キーワード読出部12は、S1又は後述するS7においてすでに抽出されたキーワードの組合せよりも優先度の低いキーワードの組合せが存在するか判断する。上述の例では、優先度の高い順に、「契約」及び「成功」の組合せ、「提案」及び「失敗」の組合せ、「提案」及び「成功」の組合せが存在するため、S6においては優先順位が下位の組合せが存在すると判断される。 The keyword reading unit 12 determines whether or not there is a combination with a lower priority among the combinations of keywords stored in the storage unit 11 (S6). In this step, the keyword reading unit 12 determines whether or not there is a combination of keywords having a lower priority than the combination of keywords already extracted in S1 or S7 described later. In the above example, since there are combinations of "contract" and "success", combinations of "proposal" and "failure", and combinations of "proposal" and "success" in descending order of priority, the order of priority in S6. Is judged to exist in the lower combination.

優先順位が下位の組合せが存在すると判断された場合(S6:YES)、キーワード読出部12は、優先順位が次に高いキーワードの組合せを記憶部11から読み出す(S7)。上述の例では、「契約」及び「成功」の組合せが読み出される。 When it is determined that a combination having a lower priority exists (S6: YES), the keyword reading unit 12 reads the combination of the keywords having the next highest priority from the storage unit 11 (S7). In the above example, the combination of "contract" and "success" is read.

そして、キーワード読出部12は、記憶部11に記憶されている概念辞書を参照し、S1で読み出されたキーワードの同義語及び下位概念に当たる語を読み出す(S8)。本ステップの処理は、S2と同様である。上述の例では、「契約」及び「成功」のそれぞれについて、同義語及び下位概念に当たる語が読み出される。なお、S2において、第1のキーワードの各々及び第2のキーワードの各々について同義語及び下位概念に当たる語を予めメモリ上に展開しておき、S8の処理を省略するようにしてもよい。 Then, the keyword reading unit 12 refers to the concept dictionary stored in the storage unit 11 and reads out the synonyms of the keywords read in S1 and the words corresponding to the subordinate concepts (S8). The processing in this step is the same as in S2. In the above example, synonyms and subordinate terms are read for each of "contract" and "success". In S2, synonyms and words corresponding to subordinate concepts for each of the first keyword and each of the second keywords may be expanded in the memory in advance, and the processing of S8 may be omitted.

その後、注釈追記部14は、S3において読み出した文書ファイルの部分(例えば段落)のうち、優先順位が上位のキーワードの組合せを含まない部分の中に、S7で読み出し
た第1のキーワード並びにS8で読み出した第1のキーワードの同義語及び下位概念に当たる語のいずれかと、S7で読み出した第2のキーワード並びにS8で読み出した第2のキーワードの同義語及び下位概念に当たる語のいずれかとの組合せが存在するか判断する(S9)。本ステップの判断は、S4と概ね同様であるが、優先順位が上位のキーワードの組合せが存在するとすでに判断された部分(換言すれば、すでに注釈が追記された部分)については本ステップにおいてキーワードの組合せが存在するか判断しない。
After that, the comment addition unit 14 includes the first keyword read in S7 and S8 in the part of the document file read in S3 (for example, a paragraph) that does not include a combination of keywords having a higher priority. There is a combination of any of the words corresponding to the synonyms and sub-concepts of the first keyword read out and any of the words corresponding to the synonyms and sub-concepts of the second keyword read out in S7 and the second keyword read out in S8. Determine if to do (S9). The judgment in this step is almost the same as in S4, but the part where it is already judged that there is a combination of keywords with higher priority (in other words, the part where the annotation has already been added) is the keyword in this step. Do not determine if a combination exists.

図7は、文書ファイルの部分のうち、S9においてキーワードの組合せが存在するか判断する対象を説明するための図である。図7において、角丸長方形は、文書ファイルに含まれる部分(例えば段落)全体の集合を表す。また、円は、内部に記載された各語句を含む部分の集合を表す。図3のS4においては、優先順位が最も高い「契約」及び「失敗」のキーワードの組合せを含む部分(図7の細線のハッチングを付した集合)が存在するか判断し、S5において注釈を追記した。図6のS9においては、図7において細線のハッチングが付された集合の補集合を対象として、優先順位が2番目に高い「契約」及び「成功」のキーワードの組合せを含む部分(図7の太線のハッチングを付した集合)が存在するか判断する。上述の例では、段落3に「契約」並びに「成功」及び「行う」(「成功」の下位概念)の組合せが存在すると判断される。 FIG. 7 is a diagram for explaining a target for determining whether or not a combination of keywords exists in S9 in the part of the document file. In FIG. 7, the rounded rectangle represents the entire set of parts (eg, paragraphs) contained in the document file. In addition, the circle represents a set of parts including each word and phrase described inside. In S4 of FIG. 3, it is determined whether there is a part (a set with hatched thin lines in FIG. 7) containing the combination of the keywords "contract" and "failure" having the highest priority, and an annotation is added in S5. did. In S9 of FIG. 6, the complement of the set hatched with thin lines in FIG. 7 is targeted, and the portion including the combination of the keywords “contract” and “success” having the second highest priority (FIG. 7). Determine if there is a set with thick line hatches). In the above example, it is determined that paragraph 3 has a combination of "contract" and "success" and "do" (subordinate concept of "success").

キーワードの組合せが存在すると判断された場合(S9:YES)、注釈追記部14は、キーワードの組合せに対応付けて記憶部11に記憶されている注釈を、読み出した部分ごとに追記する(S10)。本ステップの処理は、図3のS5と同様である。上述の例では、段落3に「契約状況」という図5の注釈(2)が追記される。 When it is determined that the keyword combination exists (S9: YES), the annotation addition unit 14 adds the annotation stored in the storage unit 11 in association with the keyword combination for each read portion (S10). .. The processing in this step is the same as in S5 of FIG. In the above example, the note (2) of FIG. 5 "contract status" is added to paragraph 3.

S9においてキーワードの組合せが存在しないと判断された場合(S9:NO)、又はS10の後、S6の処理に戻る。そして、優先順位が下位のキーワードの組合せが存在しなくなるまで、S6〜S10の処理を繰り返す。上述の例では、「提案」及び「失敗」の組合せ、「提案」及び「成功」の組合せが存在するか、順に文書ファイルを検索する。そして、段落1に「プレゼン」(「提案」の下位概念)及び「実施」(「成功」の下位概念)の組合せが存在するため、段落1に「提案状況」という図5の注釈(4)が追記される。なお、段落3には「提案」並びに「成功」及び「行う」の組合せも存在するが、優先順位がより上位の「契約」並びに「成功」及び「行う」の組合せが存在するため、「提案状況」という注釈は追記されない。 When it is determined in S9 that the keyword combination does not exist (S9: NO), or after S10, the process returns to S6. Then, the processes of S6 to S10 are repeated until there is no combination of keywords having a lower priority. In the above example, the document file is searched in order for the combination of "suggestion" and "failure" and the combination of "suggestion" and "success". Since there is a combination of "presentation" (sub-concept of "proposal") and "implementation" (sub-concept of "success") in paragraph 1, the note (4) in FIG. Is added. In paragraph 3, there are combinations of "proposal" and "success" and "do", but since there are combinations of "contract" and "success" and "do" with higher priority, "proposal". The comment "Situation" is not added.

また、S6において優先順位が下位のキーワードの組合せが存在しないと判断された場合(S6:NO)、注釈追記部14は、文書ファイルのうちキーワードの組合せが存在しない部分に注釈を追記するか判断する(S11)。本ステップでは、記憶部11に予め記憶された条件に基づき、キーワードの組合せが存在しないと判断された部分に追記すべき注釈が設定されているか判断する。上述の例では、キーワード並びにその同義語及び下位概念に当たる語のいずれも存在しない段落に対し、「開発状況」という図5の注釈(5)を追記すると判断される。 Further, when it is determined in S6 that there is no combination of keywords having a lower priority (S6: NO), the annotation addition unit 14 determines whether to add an annotation to the part of the document file in which the combination of keywords does not exist. (S11). In this step, based on the conditions stored in advance in the storage unit 11, it is determined whether or not an annotation to be added is set in the portion where it is determined that the combination of keywords does not exist. In the above example, it is determined that the annotation (5) of FIG. 5 "development status" is added to the paragraph in which neither the keyword nor the synonym thereof or the word corresponding to the subordinate concept exists.

キーワードの組合せが存在しない部分に対して注釈を追記すると判断された場合(S11:YES)、記憶部11に予め記憶されている注釈を、文書ファイルの該当する部分に追記する(S12)。上述の例では、段落4にいずれのキーワードも見つからないため、「開発状況」という注釈が追記される。また、S11においてキーワードの組合せが存在しない部分に対して注釈を追記しないと判断された場合(S11:NO)、又はS12の後、追記処理を終了する。 When it is determined that the annotation is added to the portion where the keyword combination does not exist (S11: YES), the annotation stored in advance in the storage unit 11 is added to the corresponding portion of the document file (S12). In the above example, since neither keyword is found in paragraph 4, the annotation "development status" is added. Further, when it is determined in S11 that the annotation is not added to the portion where the keyword combination does not exist (S11: NO), or after S12, the addition process ends.

本実施形態に係る追記処理では、進捗の段階を示す語句と、その結果を示す語句との組み合わせを検索することにより、適切な注釈を追記することができる。すなわち、文書に
追記する文言の妥当性を簡易な方法で向上させることができる。また、キーワードの同義語や上位概念・下位概念を検索対象とすることで、自由に作成された文章中からキーワードの抽出が漏れるのを抑制できる。すなわち、文書に追記する文言の妥当性を、キーワードの優先順位を伴う組合せという簡易な方法で向上させることができる。
In the addition process according to the present embodiment, an appropriate annotation can be added by searching for a combination of a phrase indicating the stage of progress and a phrase indicating the result. That is, the validity of the wording added to the document can be improved by a simple method. In addition, by searching for synonyms of keywords and superordinate concepts / subordinate concepts, it is possible to prevent the extraction of keywords from being omitted from freely created sentences. That is, the validity of the wording to be added to the document can be improved by a simple method of combining keywords with priority.

また、本実施形態では語句の概念的な上下関係又は同義関係を例えばツリー構造の辞書で定義することができる。このような定義に基づいて、注釈を付す条件として設定されたキーワードについて同義語及び下位概念に当たる語を漏れなく抽出し、優先順位の定義されたキーワードの組合せのバリエーションとして展開することができる。仮にこのようなバリエーションを個別に設定する場合、手間がかかると共にミスが起こる可能性も高くなる。本実施形態に係る辞書は、注釈を付す条件とは独立して、ユーザにとって理解し易い形式で定義することができるため、ユーザは簡便な方法で必要な設定を行うことができる。 Further, in the present embodiment, the conceptual hierarchical relationship or synonymous relationship of words and phrases can be defined by, for example, a tree-structured dictionary. Based on such a definition, synonyms and words corresponding to subordinate concepts can be extracted without omission from the keywords set as conditions for annotation, and can be developed as variations of combinations of keywords with defined priorities. If such variations are set individually, it takes time and effort and the possibility of mistakes increases. Since the dictionary according to the present embodiment can be defined in a format that is easy for the user to understand, independent of the conditions for annotating, the user can make necessary settings by a simple method.

<変形例>
次に、本実施形態に係る追記処理の他の例を説明する。本変形例では、例えば建設工事の施工計画書に対して、例えば労働基準監督署等への届出が必要な事項に関する注釈や、クレーンの運転に必要な免許に関する注釈を追記するものとする。本変形例でも、図3及び図6に示したフローに従って処理を行うが、上述の実施形態とはキーワードの数や登録される語句の性質が異なっている。
<Modification example>
Next, another example of the additional processing according to the present embodiment will be described. In this modification, for example, a comment on matters that need to be notified to the Labor Standards Inspection Office, etc., and a comment on the license required to operate the crane shall be added to the construction plan for construction work. In this modified example as well, the processing is performed according to the flow shown in FIGS. 3 and 6, but the number of keywords and the properties of the registered words and phrases are different from those in the above-described embodiment.

本変形例では、記憶部11に、図8に示すような注釈が予め記憶されているものとする。図8に例示する注釈は、クレーン等安全規則において規定されている、クレーンの設置や撤去の届出に関する注釈や、クレーンの運転に必要な免許に関する注釈を追記するための情報である。図5の例と同様に、優先順位は各注釈を追記するか判断する順序を示す。また、本変形例では、3つのキーワードの組合せに基づいて判断を行う。 In this modification, it is assumed that the annotation as shown in FIG. 8 is stored in advance in the storage unit 11. The annotations exemplified in FIG. 8 are information for adding the annotations regarding the notification of the installation and removal of the crane and the annotations regarding the license required for operating the crane, which are stipulated in the safety regulations for cranes and the like. Similar to the example of FIG. 5, the priority indicates the order of determining whether to add each annotation. Further, in this modification, the judgment is made based on the combination of the three keywords.

例えば、記憶部11には、第1のキーワードとして、文中において行為の対象を表す目的語として出現することが期待される語句が登録される。具体的には、設置や撤去といった作業(行為)の対象となる装置(クレーン)の名称が登録される。また、第2のキーワードとして、設置や撤去といった作業の内容を示す語句が登録される。換言すれば、術語として出現することが期待される語句が登録される。また、第3のキーワードとして、数値の範囲を示す情報が登録される。具体的には、上述した作業の対象となる装置の規模を示す数値の範囲が登録される。なお、数値の範囲は、上限及び下限の少なくともいずれかが定義されるものとする。例えば労働基準監督署等への届出が必要な事項に関する注釈や、クレーンの運転に必要な免許に関する注釈を追記する場合、扱う装置や設備の規模によって届出の要否や必要な免許が異なることがある。本実施形態では、所定の優先順に従って文中からキーワードの有無を判断するだけでなく、文中に含まれる数値が所定の範囲に属するか否かを判断することで、扱う装置や設備の規模によって届出の要否や必要な免許が異なるような場合にも適切な注釈を追記することができる。なお、第1〜第3のキーワードの各々には、必ずしも同じ性質の語句や数値範囲が登録されていなくてもよい。 For example, in the storage unit 11, as a first keyword, a phrase that is expected to appear as an object representing an action target in a sentence is registered. Specifically, the name of the device (crane) that is the target of work (act) such as installation or removal is registered. In addition, as the second keyword, words and phrases indicating the contents of work such as installation and removal are registered. In other words, words and phrases that are expected to appear as terminology are registered. Further, as a third keyword, information indicating a numerical range is registered. Specifically, a range of numerical values indicating the scale of the device to be the target of the above-mentioned work is registered. The range of numerical values shall be defined as at least one of the upper limit and the lower limit. For example, when adding a comment on matters that need to be notified to the Labor Standards Inspection Office, etc., or a comment on a license required to operate a crane, the necessity of notification and the required license may differ depending on the scale of the equipment and facilities handled. .. In the present embodiment, not only the presence or absence of a keyword in a sentence is determined according to a predetermined priority order, but also whether or not the numerical value included in the sentence belongs to a predetermined range is determined, so that a notification is made according to the scale of the device or equipment to be handled. Appropriate annotations can be added even if the necessity or required license is different. It should be noted that words and numerical ranges having the same properties do not necessarily have to be registered in each of the first to third keywords.

また、図9は、変形例に係る概念辞書の一例を示す図である。図9に示すように、概念辞書に登録される語句は、上位概念、中位概念及び下位概念の3段階以上で表されていてもよい。このような場合、各キーワードよりも下位の概念に相当する語句をすべて用いて検索を行うようにする。 Further, FIG. 9 is a diagram showing an example of a concept dictionary related to a modified example. As shown in FIG. 9, the words and phrases registered in the concept dictionary may be represented in three or more stages of a superordinate concept, a intermediate concept, and a subordinate concept. In such a case, the search should be performed using all the words and phrases corresponding to the concepts lower than each keyword.

3つのキーワードが設定されている場合、図3のS4や図6のS9では、図3のS3で読み出した文書の各部分において3つのキーワードの組合せが見つかるか判断する。また、キーワードに数値範囲が設定されている場合、図3のS4や図6のS9では、図3のS
3で読み出した文書の各部分から抽出された数値がキーワードに設定されている数値範囲に属するか否か判断する。
When three keywords are set, in S4 of FIG. 3 and S9 of FIG. 6, it is determined whether or not a combination of the three keywords can be found in each part of the document read in S3 of FIG. Further, when a numerical range is set for the keyword, in S4 of FIG. 3 and S9 of FIG. 6, S of FIG. 3 is set.
It is determined whether or not the numerical values extracted from each part of the document read in 3 belong to the numerical range set in the keyword.

本変形例に係る追記処理では、後の工程で用いられる装置等や、注釈を必要とする重要な装置等、届出を忘れがちな作業を優先すると共に、装置等の大きさと数値範囲を示す基準値(境界値)との大小関係を判断することにより、適切な注釈を追記することができる。すなわち、文書に追記する文言の妥当性を簡易な方法で向上させることができる。 In the additional processing related to this modification, priority is given to work that tends to forget notification, such as equipment used in a later process and important equipment that requires annotation, and a standard indicating the size and numerical range of the equipment. Appropriate annotations can be added by determining the magnitude relationship with the value (boundary value). That is, the validity of the wording added to the document can be improved by a simple method.

<その他>
注釈追記処理は、営業報告書や、建設の施工計画書以外に適用することもできる。実施形態及び変形例に示すように、文書の性質に応じて出現が期待されるキーワードを予め設定しておき、優先順位づけされたキーワードの組み合わせに基づいて簡易的に文書の内容を判断すれば、その内容に応じて適切な文言を追記できるようになる。
<Others>
Annotation addition processing can also be applied to other than business reports and construction plans for construction. As shown in the embodiments and modifications, keywords that are expected to appear according to the nature of the document are set in advance, and the content of the document can be simply determined based on the combination of prioritized keywords. , You will be able to add appropriate wording according to the content.

また、キーワードの数や、キーワードの内容はどのように組み合わせてもよい。例えばクレーンの種別のように何らかの対象物を表すキーワード、及びその規模を表す数値範囲という2種類のキーワードの組み合わせに基づいて注釈を追記するようにしてもよい。また、4種類以上のキーワードの組み合わせに基づいて注釈を追記するようにしてもよい。また、同一概念や下位概念に当たる語句に検索キーワードを必ずしも拡張しなくてもよい。 In addition, the number of keywords and the contents of the keywords may be combined in any way. For example, an annotation may be added based on a combination of two types of keywords, a keyword representing some object such as the type of crane and a numerical range representing the scale thereof. In addition, annotations may be added based on a combination of four or more types of keywords. In addition, the search keyword does not necessarily have to be extended to words that correspond to the same concept or subordinate concepts.

また、追記する文言についても実施形態や変形例で例示したものには限定されない。例えば、営業報告書や施工計画書に対して、他の情報を追記するようにしてもよい。具体的には、施工計画書において、工事現場の所番地に基づき、届け出先や報告先である自治体の情報を追記したり、地域によって定められている水質基準を満たすため所定の測定機器を導入する旨の注釈を追記するようにしてもよい。 Further, the wording to be added is not limited to the one illustrated in the embodiment or the modified example. For example, other information may be added to the business report or the construction plan. Specifically, in the construction plan, based on the address of the construction site, add information on the notification destination and the local government that is the reporting destination, and introduce prescribed measuring equipment to meet the water quality standards set by the area. You may add a note to that effect.

また、上述の実施形態及び変形例では、文書ファイルの段落ごとにキーワードの検索を行っているが、検索を行う単位は段落ごとには限られない。例えば、一文単位やページ単位等で、その中にキーワードの組み合わせが含まれているか判断するようにしてもよい。このようにすれば、文書の形式に応じて、適切な単位で注釈を追記することができるようになる。 Further, in the above-described embodiment and modification, the keyword is searched for each paragraph of the document file, but the unit for searching is not limited to each paragraph. For example, it may be determined whether or not a combination of keywords is included in the sentence unit or the page unit. In this way, annotations can be added in appropriate units according to the format of the document.

また、本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において変更することができる。また、上記の実施形態及び変形例は、可能な限り組み合わせて実施することができる。 Further, the present invention is not limited to the above-described embodiment, and can be modified without departing from the gist of the present invention. In addition, the above embodiments and modifications can be combined as much as possible.

例えば、注釈追記装置1は、インターネット等のネットワークを介して接続される1又は複数のサーバによって構成される態様であってもよい。この場合、注釈追記装置1は、ユーザが操作するコンピュータに格納されている文書ファイルを、ネットワークを介して読み出し、実施形態又は変形例に係る処理を行う。 For example, the annotation addition device 1 may be configured by one or a plurality of servers connected via a network such as the Internet. In this case, the annotation addition device 1 reads out the document file stored in the computer operated by the user via the network, and performs the processing according to the embodiment or the modification.

また、実施の形態に示した処理フローは、結果が変わらない限りにおいて処理の順序を変更してもよい。記憶部11に保持されるデータのデータ構造は特に限定されない。 Further, in the processing flow shown in the embodiment, the processing order may be changed as long as the result does not change. The data structure of the data stored in the storage unit 11 is not particularly limited.

また、本発明は、上述した処理を実行するコンピュータプログラムや、当該プログラムを記録した、コンピュータ読み取り可能な記録媒体を含む。当該プログラムが記録された記録媒体は、プログラムをコンピュータに実行させることにより、上述の処理が可能となる。 The present invention also includes a computer program that executes the above-described processing and a computer-readable recording medium that records the program. The recording medium on which the program is recorded can perform the above-mentioned processing by causing the computer to execute the program.

ここで、コンピュータ読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータから読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータから取り外し可能なものとしては、フレキシブルディスク、光磁気ディスク、光ディスク、磁気テープ、メモリカード等がある。また、コンピュータに固定された記録媒体としては、ハードディスクドライブやROM等がある。 Here, the computer-readable recording medium means a recording medium in which information such as data and programs is stored by electrical, magnetic, optical, mechanical, or chemical action and can be read from a computer. Among such recording media, those that can be removed from a computer include flexible disks, magneto-optical disks, optical disks, magnetic tapes, memory cards, and the like. Further, examples of the recording medium fixed to the computer include a hard disk drive and a ROM.

1 :注釈追記装置
11:記憶部
12:キーワード読出部
13:文書読出部
14:注釈追記部
1: Annotation addition device 11: Storage unit 12: Keyword reading unit 13: Document reading unit 14: Annotation addition unit

Claims (6)

文書ファイルを読み出し、内容に注釈を追記する装置であって、
行為の対象として前記文書ファイル中に出現が期待される複数の第1のキーワードと、前記行為として出現が期待される複数の第2のキーワードと、前記第1のキーワード及び
前記第2のキーワードの組み合わせの各々に対応付けて設定される注釈と、前記複数の第1のキーワードの間で定義された第1の優先順位と、前記複数の第2のキーワードの間で定義された第2の優先順位と、前記第1のキーワード及び前記第2のキーワードの間に定義される第3の優先順位を記憶する記憶部と、
前記文書ファイルが、前記第1のキーワード及び第2のキーワードを含む場合、前記記憶部において当該第1のキーワード及び第2のキーワードの組み合わせに対応付けられている注釈を追記する文言追記部と、
を有し、
前記文言追記部は、前記文書ファイルの内容である文章に対し、文、段落又はページごとに、前記第1のキーワード及び前記第2のキーワードの組み合わせが前記文書ファイル
に存在するか判断し、前記第1のキーワード及び前記第2のキーワードの組み合わせが
複数存在する場合、前記第1の優先順位、前記第2の優先順位、及び前記第3の優先順位によって定まる注釈の優先順位に基づいて当該注釈の優先順位が上位の前記組み合わせが存在せず、前記注釈の優先順位が下位の前記組み合わせが存在する場合に、前記組み合わせが存在すると判断された文、段落又はページに対して前記注釈の優先順位が下位の組み合わせに対応付けられた前記注釈を追記する
文言追記装置。
A device that reads a document file and adds annotations to the contents.
A plurality of first keywords expected to appear in the document file as targets of the act, a plurality of second keywords expected to appear as the act , the first keyword, and the like.
An annotation set in association with each of the second keyword combinations , a first priority defined among the plurality of first keywords, and a definition between the plurality of second keywords. A storage unit that stores the second priority and the third priority defined between the first keyword and the second keyword .
When the document file contains the first keyword and the second keyword, a wording addition unit for adding an annotation associated with the combination of the first keyword and the second keyword in the storage unit, and
Have,
The wording appending section, compared text is the content of the document file, text, paragraph by paragraph, or page, to determine whether the combination of the first keyword and the second keyword is present in the document file, The combination of the first keyword and the second keyword
When a plurality of annotations exist, the combination having a higher priority of the annotation does not exist based on the priority of the annotation determined by the first priority, the second priority, and the third priority. , if the priority of the annotation exists the combination of lower, statement said combination is determined to exist, the priority of the annotation with respect to paragraph or page the annotation associated with the sub-combination Wording addition device to add.
前記記憶部は、前記第1のキーワード又は前記第2のキーワードと上位概念、下位概念、又は同一概念の関係にある単語を対応付けてさらに記憶し、
前記文言追記部は、前記第1のキーワード及び第2のキーワードの各々について、上位概念、下位概念、又は同一概念の関係にある単語に置き換えた組み合わせが存在する場合、前記記憶部において当該第1のキーワード及び第2のキーワードの組み合わせに対応付けられている文言を追記する
請求項1に記載の文言追記装置。
The storage unit further stores the first keyword or the second keyword in association with a superordinate concept, a subordinate concept, or a word having the same concept.
When there is a combination in which each of the first keyword and the second keyword is replaced with a superordinate concept, a subordinate concept, or a word having the same concept, the wording addition unit has the first keyword in the storage unit. The wording addition device according to claim 1, wherein the wording associated with the combination of the keyword and the second keyword is added.
前記第1のキーワード又は前記第2のキーワードは、上限及び下限の少なくともいずれ
かが定められた数値の範囲によって定義され、
前記文言追記部は、前記数値の範囲によって定義されたキーワードについて、当該範囲に含まれる数値が前記文書ファイルに存在するか判断する
請求項1又は2に記載の文言追記装置。
The first keyword or the second keyword is defined by a range of numerical values in which at least one of an upper limit and a lower limit is defined.
The wording addition device according to claim 1 or 2, wherein the wording addition unit determines whether or not a numerical value included in the range of the keyword defined by the range of the numerical value exists in the document file.
前記記憶部に記憶される前記組み合わせは、第3のキーワードをさらに含む
請求項1からのいずれか一項に記載の文言追記装置。
The wording addition device according to any one of claims 1 to 3 , wherein the combination stored in the storage unit further includes a third keyword.
文書ファイルを読み出し、内容に注釈を追記する方法であって、
記憶装置に記憶されている、行為の対象として前記文書ファイル中に出現が期待される複数の第1のキーワードと、前記行為として出現が期待される複数の第2のキーワードと、前記第1のキーワード及び前記第2のキーワードの組み合わせの各々に対応付けて設定
される注釈とを用いて、前記文書ファイルにおいて前記第1のキーワード及び第2のキーワードの組み合わせを検索する検索ステップと、
前記文書ファイルが前記第1のキーワード及び第2のキーワードを含む場合、当該第1のキーワード及び第2のキーワードの組み合わせに対応付けられて前記記憶装置に記憶されている注釈を追記する文言追記ステップと
をコンピュータが実行し、
前記記憶装置は、前記複数の第1のキーワードの間で定義された第1の優先順位と、前記複数の第2のキーワードの間で定義された第2の優先順位と、前記第1のキーワード及び前記第2のキーワードの間に定義される第3の優先順位とを記憶し、
前記検索ステップにおいて、前記文書ファイルの文、段落又はページごとに、前記第1
のキーワード及び前記第2のキーワードの組み合わせが存在するかを判断し、前記第1の
キーワード及び前記第2のキーワードの組み合わせが複数存在する場合、前記第1の優先順位、前記第2の優先順位、及び前記第3の優先順位によって定まる注釈の優先順位に基づいて、当該注釈の優先順位が上位の前記組み合わせが存在せず、前記注釈の優先順位が下位の前記組み合わせが存在する場合に、前記組み合わせが存在すると判断された文、段落又はページに対して前記注釈の優先順位が下位の組み合わせに対応付けられた前記注釈を追記する
文言追記方法。
It is a method of reading a document file and adding annotations to the contents.
A plurality of first keywords stored in a storage device that are expected to appear in the document file as an action target, a plurality of second keywords that are expected to appear as the action, and the first keyword . Set in association with each of the keyword and the combination of the second keyword
A search step for searching for a combination of the first keyword and the second keyword in the document file using the annotations to be made .
When the document file contains the first keyword and the second keyword, a wording addition step of adding an annotation stored in the storage device in association with the combination of the first keyword and the second keyword. And the computer runs
The storage device has a first priority defined among the plurality of first keywords, a second priority defined among the plurality of second keywords, and the first keyword. And the third priority defined between the second keyword ,
In the search step, sentence before Symbol document files, each paragraph or page, the first
It is determined whether or not the combination of the keyword and the second keyword exists, and the first
When there are a plurality of combinations of the keyword and the second keyword, the priority of the comment is based on the priority of the comment determined by the first priority, the second priority, and the third priority. ranking absent the combination of upper, when the priority of the annotation exists the combination of lower, statement said combination is determined to exist, the priority of the annotation with respect to paragraphs or pages subordinate A word addition method for adding the annotation associated with the combination of .
コンピュータに、文書ファイルを読み出させ、内容に注釈を追記させるプログラムであって、記憶装置に記憶されている、行為の対象として前記文書ファイル中に出現が期待される複数の第1のキーワードと、前記行為として出現が期待される複数の第2のキーワードと、前記第1のキーワード及び前記第2のキーワードの組み合わせの各々に対応付けて
設定される注釈とを用いて、前記文書ファイルにおいて前記第1のキーワード及び第2のキーワードの組み合わせを検索する検索ステップと、
前記文書ファイルが前記第1のキーワード及び第2のキーワードを含む場合、当該第1のキーワード及び第2のキーワードの組み合わせに対応付けられて前記記憶装置に記憶されている注釈を追記する文言追記ステップと
をコンピュータに実行させ、
前記記憶装置は、前記複数の第1のキーワードの間で定義された第1の優先順位と、前記複数の第2のキーワードの間で定義された第2の優先順位と、前記第1のキーワード及び前記第2のキーワードの間に定義される第3の優先順位とを記憶し、
前記検索ステップにおいて、前記文書ファイルの文、段落又はページごとに、前記第1
のキーワード及び前記第2のキーワードの組み合わせが存在するかを判断し、前記第1の
キーワード及び前記第2のキーワードの組み合わせが複数存在する場合、前記第1の優先順位、前記第2の優先順位、及び前記第3の優先順位によって定まる注釈の優先順位に基づいて、当該注釈の優先順位が上位の前記組み合わせが存在せず、前記注釈の優先順位が下位の前記組み合わせが存在する場合に、前記組み合わせが存在すると判断された文、段
落又はページに対して前記注釈の優先順位が下位の組み合わせに対応付けられた前記注釈を追記する
文言追記プログラム。
A program that causes a computer to read a document file and add annotations to the contents, and is stored in a storage device as a plurality of first keywords that are expected to appear in the document file as an action target. , Corresponding to each of the plurality of second keywords expected to appear as the act and the combination of the first keyword and the second keyword.
A search step for searching the combination of the first keyword and the second keyword in the document file using the set annotation, and
When the document file contains the first keyword and the second keyword, a wording addition step of adding an annotation stored in the storage device in association with the combination of the first keyword and the second keyword. To the computer to execute
The storage device has a first priority defined among the plurality of first keywords, a second priority defined among the plurality of second keywords, and the first keyword. And the third priority defined between the second keyword ,
In the search step, sentence before Symbol document files, each paragraph or page, the first
It is determined whether or not the combination of the keyword and the second keyword exists, and the first
When there are a plurality of combinations of the keyword and the second keyword, the priority of the comment is based on the priority of the comment determined by the first priority, the second priority, and the third priority. ranking absent the combination of upper, when the priority of the annotation exists the combination of lower, statement said combination is determined to exist, the priority of the annotation with respect to paragraphs or pages subordinate A word addition program that adds the annotations associated with the combination of .
JP2016073871A 2016-04-01 2016-04-01 Word addition device, word addition method and word addition program Active JP6790328B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016073871A JP6790328B2 (en) 2016-04-01 2016-04-01 Word addition device, word addition method and word addition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016073871A JP6790328B2 (en) 2016-04-01 2016-04-01 Word addition device, word addition method and word addition program

Publications (2)

Publication Number Publication Date
JP2017187823A JP2017187823A (en) 2017-10-12
JP6790328B2 true JP6790328B2 (en) 2020-11-25

Family

ID=60044273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016073871A Active JP6790328B2 (en) 2016-04-01 2016-04-01 Word addition device, word addition method and word addition program

Country Status (1)

Country Link
JP (1) JP6790328B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083823B (en) * 2019-03-07 2024-03-29 平安科技(深圳)有限公司 Dictionary table establishing method and device, computer device and storage medium

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262200A (en) * 1994-03-18 1995-10-13 Fujitsu Ltd Statement sorter
JPH1115835A (en) * 1997-06-20 1999-01-22 Fuji Xerox Co Ltd Sorting information presenting device and medium recording sorting information presenting program
JP4726683B2 (en) * 2006-04-06 2011-07-20 日本電信電話株式会社 EXPERIENCE INFORMATION EXTRACTION METHOD AND DEVICE, PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM
JP2008217157A (en) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> Automatic information organization device, method and program using operation history
US8719692B2 (en) * 2011-03-11 2014-05-06 Microsoft Corporation Validation, rejection, and modification of automatically generated document annotations
JP2014021916A (en) * 2012-07-23 2014-02-03 Hitachi Solutions Ltd Information display program and information display device

Also Published As

Publication number Publication date
JP2017187823A (en) 2017-10-12

Similar Documents

Publication Publication Date Title
CA2823396C (en) Storage of a document using multiple representations
US20100325539A1 (en) Web based spell check
JP2020126493A (en) Paginal translation processing method and paginal translation processing program
US11023654B2 (en) Analyzing document content and generating an appendix
KR101782802B1 (en) Method and computer program for sharing memo between electronic documents
JPWO2019224891A1 (en) Classification device, classification method, generation method, classification program and generation program
AU2017201629B2 (en) Identifying trends associated with topics from natural language text
US9256585B2 (en) Non-transitory computer readable medium storing document creation support program, document creation support device, and document creation support method
JP2013246644A (en) Software object correction support device, software object correction support method and program
JP5687312B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
US20140244676A1 (en) Discovering Title Information for Structured Data in a Document
JP5020352B2 (en) Named element marking device, named element marking method and computer-readable medium thereof
JP6790328B2 (en) Word addition device, word addition method and word addition program
JP5979650B2 (en) Method for dividing terms with appropriate granularity, computer for dividing terms with appropriate granularity, and computer program thereof
US20140229816A1 (en) Methods and devices for tagging a document
Alam et al. Comparing named entity recognition on transcriptions and written texts
KR102196547B1 (en) Method and apparatus for blind processing of specific information in document
CN112417819A (en) Word document information extraction method and device, electronic equipment and medium
WO2016200359A1 (en) Term scores
Cummings et al. The Holinshed Project: Comparing and linking two editions of Holinshed's Chronicle
JP2020064383A (en) Risk identification device, risk identification method, and program
JP7244767B2 (en) Information processing device, control method, and program
KR101100848B1 (en) Vocabulary database generating method and vocabulary database storable computer readable medium
JP6615310B2 (en) Text analysis apparatus and text analysis method
Bondalietov et al. Notation System for Comparing and Synthesis of Intelligent Key Phrase Extraction Methods for Ontological Models in Information Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200609

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201013

R150 Certificate of patent or registration of utility model

Ref document number: 6790328

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150