JP2022103710A - Document processing device and classification assignment support system - Google Patents

Document processing device and classification assignment support system Download PDF

Info

Publication number
JP2022103710A
JP2022103710A JP2020218505A JP2020218505A JP2022103710A JP 2022103710 A JP2022103710 A JP 2022103710A JP 2020218505 A JP2020218505 A JP 2020218505A JP 2020218505 A JP2020218505 A JP 2020218505A JP 2022103710 A JP2022103710 A JP 2022103710A
Authority
JP
Japan
Prior art keywords
term
document
spectrum
group
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020218505A
Other languages
Japanese (ja)
Inventor
尚純 上田
Naozumi Ueda
俊春 保坂
Toshiharu Hosaka
亨 蕗田
Toru Fukita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INDUSTRIAL PROPERTY COOPERATION CENTER
Original Assignee
INDUSTRIAL PROPERTY COOPERATION CENTER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INDUSTRIAL PROPERTY COOPERATION CENTER filed Critical INDUSTRIAL PROPERTY COOPERATION CENTER
Priority to JP2020218505A priority Critical patent/JP2022103710A/en
Publication of JP2022103710A publication Critical patent/JP2022103710A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To provide a document processing device which displays, so as to be viewable in a list, a plurality of term groups or a plurality of documents on a display screen, and is capable of easily grasping relevance between the term groups and documents, and a classification assignment support system.SOLUTION: A document processing device includes: document display means which displays a document on a document display screen; and term spectral display means which displays a multi-spectral screen on the basis of a term group comprising one or a plurality of terms. When the document contains a term in the term group, a term group box in which a term spectral bar array instructing an in-document position with a spectral bar of a color set to the term is juxtaposed is displayed in the multispectral screen for each of the plurality of term groups. When a user selects a term group box displayed in the multispectral screen, terms in the document corresponding to the spectral bar contained in the selected term group box are highlighted and displayed.SELECTED DRAWING: Figure 3

Description

本発明は、文書処理装置及び分類付与支援システムに関する。 The present invention relates to a document processing device and a classification grant support system.

コンピュータの画面上に複数の文書データを表示させ、これらの文書の内容を対比することは普通に行われている。このような文書の対比作業では、対比すべき複数の文書の内容のどこが一致しているかを目視で確認したり、ソフトウエアを利用して異なっている箇所を強調表示したりすることが行われている。 It is common practice to display multiple document data on a computer screen and compare the contents of these documents. In such document comparison work, it is possible to visually check where the contents of a plurality of documents to be compared match, and to highlight different parts using software. ing.

従来、文書データの閲覧性を高めるとともに、複数の文書データの対比のための把握作業時間を短縮するインターフェースを持つ文書管理システムが提案されている(特許文献1参照)。特許文献1の文書管理システムでは、表示装置に2つの特許文献を同時に表示させ、一方の特許文献の記述内容に類似する内容が記述された他方の特許文献の領域を表示装置上で強調表示させることにより、特許文献間の関連度を視覚的に把握できるようにしている。 Conventionally, a document management system having an interface for improving the readability of document data and shortening the grasping work time for comparing a plurality of document data has been proposed (see Patent Document 1). In the document management system of Patent Document 1, two patent documents are displayed on the display device at the same time, and the area of the other patent document in which the contents similar to the description contents of one patent document are described is highlighted on the display device. This makes it possible to visually grasp the degree of relevance between patent documents.

また、複数の文書データを対比する業務の一例として、分類を付与する文書と分類が記載された文書を対比して分類付与を行う分類付与業務が知られており、このような分類付与業務を支援あるいは自動化する装置が提案されている(特許文献2、特許文献3参照)。特許文献2の分類付与支援装置では、分類を付与する文書とFタームのような分類が記載された文書を入力し、入力されたいずれか一方の文書の単語を抽出し、抽出した単語により他方の文書を検索し、他方の文書にその単語が存在していた場合には、両方の文書においてその単語を強調表示している。また、特許文献3の文献解析装置では、検索条件を、文献を意味表現として区切りがつく所定の範囲を単位として区切った各範囲で基本要素を含む文意式により記述した推定用辞書データを用い、この推定用辞書データと文献用語データとの類似度をスコアで表して、検索条件の満たし具合の程度を認識するようにしている。 Further, as an example of the work of comparing a plurality of document data, there is known a classification giving work in which a document to be classified and a document in which the classification is described are compared and given a classification, and such a classification giving work is performed. A device for assisting or automating has been proposed (see Patent Document 2 and Patent Document 3). In the classification granting support device of Patent Document 2, a document to be classified and a document in which a classification such as F-term is described are input, a word of one of the input documents is extracted, and the extracted word is used as the other. If the word is found in the other document, the word is highlighted in both documents. Further, the document analysis device of Patent Document 3 uses estimation dictionary data in which the search condition is described by a literary expression including a basic element in each range divided by a predetermined range in which the document is separated as a semantic expression. , The degree of similarity between the estimation dictionary data and the bibliographic term data is expressed by a score so that the degree of satisfaction of the search conditions can be recognized.

特開2010-267062号公報Japanese Unexamined Patent Publication No. 2010-267062 特開2008-171164号公報Japanese Unexamined Patent Publication No. 2008-171164 特開2017-102976号公報Japanese Unexamined Patent Publication No. 2017-102976

分類を付与する文書と分類が記載された文書を対比して分類付与を行う場合、従来技術のように、文書同志の分割領域単位の対比あるいは特許文献とFターム表との全体としての対比だけではなく、各分類に対応づけられた複数の用語群が特許文献とどの程度関連しているのかを分かりやすく対比したいといったニーズが存在する。さらに、特許分類表と特許文献とを対比する場合、従来技術のように、両者を並べて表示するだけではなく、分類に対応づけられた用語群又は特許文献を、画面上に複数並べて表示して対比できるようなユーザインターフェースが求められている。 When the classification is given by comparing the document to which the classification is given and the document in which the classification is described, only the comparison between the divided area units of the documents or the comparison between the patent document and the F-term table as a whole is performed as in the prior art. Instead, there is a need to make an easy-to-understand comparison of how many terms associated with each classification are related to patent documents. Further, when comparing the patent classification table and the patent document, not only the two are displayed side by side as in the prior art, but also a plurality of term groups or patent documents associated with the classification are displayed side by side on the screen. There is a need for a user interface that can be compared.

また、コンピュータによる分類自動付与技術を用いて精度の高い分類付与を行おうとすると、特許分類と関連する技術用語とを対応付けた分類付与辞書を充実させることが必要になる。しかし、特許分類で定義された分類の中には、付与される特許文献数が少ない分類が多数を占めており、機械学習を利用しようとしても分類付与辞書の学習が困難なため、コンピュータによる分類自動付与だけでは、人並みの付与精度を実現できない状況にある。このため、高品質な特許分類付与を行うために、計算機による自動付与を補助的に利用しながら、最終的には、人手により特許文献に分類記号を付与することが必要となる。このように人手により分類記号の付与を行う場合、特許文献中において、特許分類表に定義された分類に関係する記載箇所(分類付与根拠箇所)を迅速に発見できるような支援システムが求められている。 In addition, in order to perform highly accurate classification assignment using computer-based automatic classification assignment technology, it is necessary to enhance the classification assignment dictionary that associates patent classification with related technical terms. However, among the classifications defined in the patent classification, most of the classifications have a small number of patent documents granted, and it is difficult to learn the classification grant dictionary even if machine learning is used, so classification by computer is used. It is in a situation where it is not possible to achieve the same level of accuracy as people with automatic granting alone. Therefore, in order to grant a high-quality patent classification, it is necessary to manually assign a classification symbol to the patent document while using the automatic grant by a computer as an auxiliary. When the classification symbol is manually assigned in this way, there is a need for a support system that can quickly find the description part (classification grant basis part) related to the classification defined in the patent classification table in the patent document. There is.

本発明は上記事情を鑑みて成されたものであって、複数の用語群あるいは複数の文書を表示画面上で一覧可能に表示し、これら用語群と文書との関連性を容易に把握できる文書処理装置を提供することを目的とする。さらに、本発明は、当該文書処理装置を用いて高品質な分類付与を支援する分類付与支援システムを提供することを更なる目的とする。 The present invention has been made in view of the above circumstances, and is a document in which a plurality of term groups or a plurality of documents can be displayed in a list on a display screen, and the relationship between these term groups and a document can be easily grasped. It is an object of the present invention to provide a processing apparatus. Furthermore, it is a further object of the present invention to provide a classification granting support system that supports high quality classification granting using the document processing apparatus.

本発明の第1態様の文書処理装置は、複数の文書を選択的に表示する文書表示手段と、1又は複数の用語からなる用語群を複数含む用語群データセットに基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語群の用語が前記文書に含まれる場合に、当該用語に設定された色のスペクトルバーで当該用語の前記文書内位置を指示する前記用語スペクトルバー列を配置した用語群ボックスを、複数の用語群毎に並べて表示する、用語スペクトル表示手段と、を備え、ユーザが特定の用語群ボックスを選択した場合には、前記文書表示手段は、前記選択された用語群ボックスの用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されていることを特徴とする。 The document processing apparatus of the first aspect of the present invention is a term spectrum that displays a spectrum based on a document display means for selectively displaying a plurality of documents and a term group data set including a plurality of term groups consisting of one or a plurality of terms. A term that is a display means and in which, when a term of the term group is included in the document, the term spectrum bar string indicating the position of the term in the document by a spectrum bar of the color set for the term is arranged. The term spectrum display means for displaying the group box side by side for each of a plurality of term groups is provided, and when the user selects a specific term group box, the document display means is the selected term group box. The term in the document corresponding to the spectrum bar included in the term spectrum bar column is configured to be highlighted in the color set for the term.

本発明の第2態様の分類付与支援システムは、第1態様の文書処理装置と、前記文書に分類を付与する分類付与手段と、を備え、前記複数の用語群は、複数の分類に対応づけられていることを特徴とする。 The classification granting support system of the second aspect of the present invention includes the document processing apparatus of the first aspect and the classification granting means for assigning a classification to the document, and the plurality of term groups correspond to a plurality of classifications. It is characterized by being.

本発明の第3態様の文書処理装置又は分類付与支援システムは、前記用語群に含まれる用語は、種用語と共起用語からなる文意式を構成するものであり、前記用語スペクトル表示手段は、前記用語群ボックスの前記用語スペクトルバー列において、前記文意式に対応する種用語と共起用語の組み合わせが存在する前記文書内位置に限ってスペクトルバーを表示することを特徴とする。 In the document processing apparatus or classification granting support system of the third aspect of the present invention, the terms included in the term group constitute a literary expression consisting of a seed term and a co-occurrence term, and the term spectrum display means is used. , The term spectrum bar column of the term group box is characterized in that the spectrum bar is displayed only at the position in the document where the combination of the species term and the co-occurrence term corresponding to the literary expression exists.

本発明の第4態様の文書処理装置は、複数の文書を選択的に表示する文書表示手段と、ユーザが設定した1又は複数の用語に基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語が前記文書に含まれる場合に、当該用語とともに設定された色のスペクトルバーで当該用語の前記文書内位置を指示する用語スペクトルバー列を配置した文書ボックスを、前記複数の文書毎に並べて表示する、用語スペクトル表示手段と、を備え、ユーザが特定の文書ボックスを選択した場合には、前記文書表示手段は、前記選択された文書ボックスに対応する文書を表示し、用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されていることを特徴とする。 The document processing apparatus according to the fourth aspect of the present invention is a document display means for selectively displaying a plurality of documents and a term spectrum display means for displaying a spectrum based on one or a plurality of terms set by a user. When a term is included in the document, a document box in which a term spectrum bar string indicating a position in the document of the term is arranged by a spectrum bar of a color set together with the term is displayed side by side for each of the plurality of documents. If the user selects a particular document box, the document display means displays the document corresponding to the selected document box and is included in the term spectrum bar column. It is characterized in that the term in the document corresponding to the spectrum bar is highlighted in the color set for the term.

本発明によれば、複数の用語群あるいは複数の文書を表示画面上で一覧可能に表示したことから、複数の用語群と文書との関連性を容易に把握できる文書処理装置を提供することができる。さらに、本発明によれば、複数の用語群を複数の分類に対応づけられたものとすることで、文書全体の内容把握と分類付与根拠箇所の発見を迅速に行うことが可能となり、当該文書処理装置を用いて高品質な分類付与を支援する分類付与支援システムを提供することができる。 According to the present invention, since a plurality of term groups or a plurality of documents are displayed in a listable manner on a display screen, it is possible to provide a document processing apparatus capable of easily grasping the relationship between a plurality of term groups and a document. can. Further, according to the present invention, by associating a plurality of term groups with a plurality of classifications, it is possible to quickly grasp the contents of the entire document and find the grounds for assigning the classification. It is possible to provide a classification assignment support system that supports high-quality classification assignment using a processing device.

図1は、第1実施形態の文書処理装置の一構成例を概略的に示すブロック図である。FIG. 1 is a block diagram schematically showing a configuration example of a document processing apparatus according to the first embodiment. 図2は、第1実施形態の文書処理装置により表示された文書表示画面の一例を示す図である。FIG. 2 is a diagram showing an example of a document display screen displayed by the document processing apparatus of the first embodiment. 図3は、第1実施形態の文書処理装置により表示されたマルチスペクトル画面の一例を示す図である。FIG. 3 is a diagram showing an example of a multispectral screen displayed by the document processing apparatus of the first embodiment. 図4は、第1実施形態の文書処理装置のマルチ用語パネルの一例を示す図である。FIG. 4 is a diagram showing an example of a multi-term panel of the document processing apparatus of the first embodiment. 図5は、第1実施形態の文書処理装置の用語群作成手順を示す図である。FIG. 5 is a diagram showing a procedure for creating a term group of the document processing apparatus of the first embodiment. 図6は、第1実施形態の文書処理装置の用語群作成手順を示す図である。FIG. 6 is a diagram showing a procedure for creating a term group of the document processing apparatus of the first embodiment. 図7は、第1実施形態の文書処理装置の動作の一例を説明するためのフローチャートである。FIG. 7 is a flowchart for explaining an example of the operation of the document processing apparatus of the first embodiment. 図8は、第3実施形態の文書処理装置又は分類付与支援システムの用語群作成手順を示す図である。FIG. 8 is a diagram showing a term group creation procedure of the document processing device or the classification assignment support system of the third embodiment. 図9は、第4実施形態の文書処理装置により表示された文書マルチスペクトル画面の一例を示す図である。FIG. 9 is a diagram showing an example of a document multispectral screen displayed by the document processing apparatus of the fourth embodiment.

以下、本発明の複数の実施形態について、図面を参照して詳細に説明する。なお、以下の説明において、既に説明済みである構成と同一又は類似した構成及び要素については、同一の符号を付して説明を省略する。 Hereinafter, a plurality of embodiments of the present invention will be described in detail with reference to the drawings. In the following description, the same or similar configurations and elements as those already described will be designated by the same reference numerals and description thereof will be omitted.

<第1実施形態>
第1実施形態の文書処理装置10の一例について、図面を参照して以下に説明する。
<First Embodiment>
An example of the document processing apparatus 10 of the first embodiment will be described below with reference to the drawings.

図1は、第1実施形態の文書処理装置10の一構成例を概略的に示すブロック図である。第1実施形態の文書処理装置10は、文書表示手段11、用語スペクトル表示手段12、用語群表示手段13及び用語群作成手段14を含んでおり、入力装置20、表示装置30、文書データベース40及び用語群データベース50に接続されている。なお、分類付与手段15は、後述する第2実施形態にて詳細に説明する。 FIG. 1 is a block diagram schematically showing a configuration example of the document processing apparatus 10 of the first embodiment. The document processing device 10 of the first embodiment includes a document display means 11, a term spectrum display means 12, a term group display means 13, and a term group creation means 14, and includes an input device 20, a display device 30, a document database 40, and a document database 40. It is connected to the term database 50. The classification giving means 15 will be described in detail in the second embodiment described later.

文書処理装置10に含まれる文書表示手段11、用語スペクトル表示手段12、用語群表示手段13及び用語群作成手段14は、これら手段の機能を実現するプログラムを実行するプロセッサ、プログラムを格納したメモリあるいは外部記憶装置等により実現される。プロセッサは、典型的にはCPU(Central Processing Unit)及び/又はGPU(Graphics Processing Unit)であるが、マイコン、FPGA(Field Programmable Gate Array)、又はDSP(Digital Signal Processor)、などであってもよい。プログラムを格納したメモリは、プロセッサによって実行されるプログラム及び当該プロセッサによって使用されるデータなどを一時的に格納する。外部記憶装置は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)などの不揮発性記憶媒体を含み得る。 The document display means 11, term spectrum display means 12, term group display means 13, and term group creation means 14 included in the document processing device 10 are a processor that executes a program that realizes the functions of these means, a memory that stores the program, or a memory. It is realized by an external storage device or the like. The processor is typically a CPU (Central Processing Unit) and / or a GPU (Graphics Processing Unit), but may be a microcomputer, an FPGA (Field Programmable Gate Array), a DSP (Digital Signal Processor), or the like. .. The memory in which the program is stored temporarily stores the program executed by the processor and the data used by the processor. The external storage device may include, for example, a non-volatile storage medium such as an HDD (Hard Disk Drive) and an SSD (Solid State Drive).

入力装置20は、例えばユーザが操作することにより、文書処理装置10に対する種々の動作指令を入力するための装置であって、例えば、マウス、キーボード、タッチパネル、マイクなどの装置を含み得る。 The input device 20 is a device for inputting various operation commands to the document processing device 10 by, for example, being operated by a user, and may include, for example, a device such as a mouse, a keyboard, a touch panel, and a microphone.

表示装置30は、例えば文書処理装置10から出力される文書表示画面100、マルチスペクトル画面200及びマルチ用語パネル300をユーザに提示するための装置であって、例えば、液晶表示装置、有機EL表示装置などの平面表示装置が含まれる。 The display device 30 is a device for presenting, for example, a document display screen 100, a multi-spectral screen 200, and a multi-term panel 300 output from the document processing device 10 to a user, and is, for example, a liquid crystal display device or an organic EL display device. Such as a liquid crystal display device is included.

文書データベース40は、電子的形態の文書を複数格納するデータベースである。文書データベース40に格納された文書は、用語群と対比される文書である。 The document database 40 is a database that stores a plurality of documents in electronic form. The document stored in the document database 40 is a document to be compared with the term group.

用語群データベース50は、用語群データセットを複数格納するデータベースである。1つの用語群データセットは、1又は複数の用語からなる用語群を複数含んでおり、各用語群はそれぞれ何らかの意味に対応づけられている。なお、文書データベース40あるいは用語群データベース50は、文書処理装置10に外付けされる外部記憶装置により構成されてもよいが、ネットワーク経由で接続されたファイルサーバにより構成されてもよい。 The term group database 50 is a database that stores a plurality of term group data sets. One term group data set contains a plurality of term groups consisting of one or a plurality of terms, and each term group is associated with some meaning. The document database 40 or the term database 50 may be configured by an external storage device externally attached to the document processing device 10, or may be configured by a file server connected via a network.

文書表示手段11は、文書表示画面100上に文書を表示する機能を有する。文書表示手段11は、ユーザから文書の文献番号を取得すると、文書データベース40にアクセスして、指示された文献番号に相当する文書を取得し、その文書の内容を文書表示画面100上に所定のレイアウトで表示する。 The document display means 11 has a function of displaying a document on the document display screen 100. When the document display means 11 acquires the document number of the document from the user, the document display means 11 accesses the document database 40, acquires the document corresponding to the instructed document number, and displays the content of the document on the document display screen 100. Display in layout.

また、文書表示手段11は、ユーザにより検索キーワードが入力されると、入力された検索キ-ワードが文書内に含まれるか否かを判定し、文書内に含まれる場合には、該当する用語を文書内で強調表示するとともに、この用語が出現する文書内位置を指示するスペクトルバーを表示する。 Further, the document display means 11 determines whether or not the input search keyword is included in the document when the search keyword is input by the user, and if it is included in the document, the corresponding term. Is highlighted in the document and a spectrum bar indicating the position in the document where this term appears is displayed.

用語スペクトル表示手段12は、用語群データベース50から1つの用語群データセットを取得し、これに基づきマルチスペクトル画面200を生成し、文書を表示している文書表示画面100上の一部に表示する機能を有する。マルチスペクトル画面200には、用語群データセットに含まれる複数の用語群ごとに用語群ボックス210が設けられ、各用語群ボックス210には、各用語群の用語リスト211と、当該用語群に含まれる用語の文書内位置をスペクトルバーで指示する用語スペクトルバー列212が表示される。 The term spectrum display means 12 acquires one term group data set from the term group database 50, generates a multi-spectrum screen 200 based on the data set, and displays the document on a part of the document display screen 100 displaying the document. Has a function. The multispectral screen 200 is provided with a term group box 210 for each of a plurality of term groups included in the term group data set, and each term group box 210 includes a term list 211 of each term group and the term group. A term spectrum bar column 212 is displayed that indicates the position of the term in the document with the spectrum bar.

文書表示手段11は、マルチスペクトル画面200に対するユーザ操作に応答して、文書のうちの着目したいテキストを強調表示する機能も有している。例えば、文書表示手段11は、マルチスペクトル画面200に表示された用語群ボックス210に対する所定のユーザ操作を検出して、文書の該当する用語を所定の色で強調表示する。 The document display means 11 also has a function of highlighting the text of interest in the document in response to a user operation on the multispectral screen 200. For example, the document display means 11 detects a predetermined user operation on the term group box 210 displayed on the multispectral screen 200, and highlights the corresponding term of the document in a predetermined color.

用語群表示手段13は、マルチ用語パネル300を表示し、用語群を新たに作成したり、編集したりする機能を提供する。用語群表示手段13は、用語群に含まれる用語を、各用語の色の設定とともに、複数の用語群ごとに表示し、用語の追加、削除、編集及び色の設定を行う。また、用語群表示手段13は、用語群データベース50とのファイル入出力や用語スペクトル表示手段12へのエクスポート機能を有している。 The term group display means 13 displays the multi-term panel 300, and provides a function of newly creating or editing a term group. The term group display means 13 displays the terms included in the term group for each of a plurality of term groups together with setting the color of each term, and adds, deletes, edits, and sets the color of the term. Further, the term group display means 13 has a file input / output function with the term group database 50 and an export function to the term spectrum display means 12.

用語群作成手段14は、用語群データセットを構成する用語群を新たに作成するために必要な用語を機械的に生成する。 The term group creating means 14 mechanically generates terms necessary for creating a new term group constituting the term group data set.

図2は、第1実施形態の文書処理装置10により表示された文書表示画面100の一例を示す図である。ここでは、文書表示手段11によって表示された文書表示画面100の一例を概略的に示している。 FIG. 2 is a diagram showing an example of a document display screen 100 displayed by the document processing apparatus 10 of the first embodiment. Here, an example of the document display screen 100 displayed by the document display means 11 is shown schematically.

図2に示された文書表示画面100には、文書の一例として、特許文献が表示されている。文書表示画面100は、「文献番号一覧」欄(A)、「用語パネル」欄(B)、「段落構成」欄(C)、「明細書テキスト」欄(D)、「スペクトルバー」欄(E)、「符号一覧」欄(F)、「図面」欄(G)を含んだレイアウトを有している。なお、このようなレイアウトに限ることなく、他のレイアウトを採用してもよい。 A patent document is displayed on the document display screen 100 shown in FIG. 2 as an example of a document. The document display screen 100 has a "reference number list" column (A), a "term panel" column (B), a "paragraph structure" column (C), a "specification text" column (D), and a "spectrum bar" column ( It has a layout including E), a "code list" column (F), and a "drawing" column (G). In addition, the layout is not limited to such a layout, and other layouts may be adopted.

「文献番号一覧」欄(A)は、ユーザにより入力された特許文献番号を表示する欄である。文書表示手段11は、ここに表示される文献番号がクリックなどにより選択されたことを検出すると、その文献番号を反転表示するとともに、その文献番号に対応する特許文献を文書データベース40より取得し、所定のレイアウトにて文書表示画面100に表示する。 The "reference number list" column (A) is a column for displaying the patent document number input by the user. When the document display means 11 detects that the document number displayed here is selected by clicking or the like, the document display means highlights the document number and acquires the patent document corresponding to the document number from the document database 40. It is displayed on the document display screen 100 in a predetermined layout.

「用語パネル」欄(B)は、表示中の特許文献を検索するための検索キーワードを色情報とともに表示する欄である。図2の例では、「衣、服・・・前掛け」が赤色の背景色で表示され、「手、首・・・すね」が灰色の背景色で表示され、「作業衣、水上・・・釣」が青色の背景色で表示されている。 The "term panel" column (B) is a column for displaying search keywords for searching the displayed patent document together with color information. In the example of FIG. 2, "clothes, clothes ... apron" is displayed with a red background color, "hands, neck ... shin" is displayed with a gray background color, and "work clothes, water ..." "Fishing" is displayed with a blue background color.

ユーザは、「用語パネル」欄(B)に表示された色付実行、色付解除、全用語クリア、全色クリアのコマンドボタン、及び、色1~色32の色テーブルを使用して、検索キ-ワード単位あるいは検索キ-ワード群に対して文字色や背景色などの色情報を設定することができる。設定すべき検索キ-ワードあるいは色情報は、ユーザがマニュアル入力してもよいが、後述するように、マルチ用語パネル300からインポートしてもよい。 The user searches using the color execution, uncoloring, clearing all terms, clearing all colors command buttons, and the color table of colors 1 to 32 displayed in the "term panel" column (B). Color information such as text color and background color can be set for each keyword or search keyword group. The search keyword or color information to be set may be manually input by the user, or may be imported from the multi-term panel 300 as described later.

「段落構成」欄(C)は、選択中の文書に含まれる段落見出し、段落記号等を表示する欄である。特許文献の場合、「段落構成」欄(C)には、[書誌的事項]、[要約]、[特許請求の範囲]、[発明の詳細な説明]などの大見出しと、[請求項]、[技術分野]、[背景技術]などの小見出しが表示される。 The "paragraph structure" column (C) is a column for displaying paragraph headings, paragraph marks, etc. included in the selected document. In the case of patent documents, in the "paragraph structure" column (C), major headings such as [biological matters], [summary], [claims], [detailed description of the invention], and [claims] , [Technical field], [Background technology], and other subheadings are displayed.

「明細書テキスト」欄(D)は、特許文献に記載された特許請求の範囲や明細書の内容をテキスト表示するための欄である。明細書テキストが「明細書テキスト」欄(D)に収まらない場合には、スクロール表示が行われる。表示中の明細書テキストには、「用語パネル」欄(B)に設定された検索キ-ワードに対応する用語が、設定された色情報で強調表示される。図2の例では、例えば、「衣」が赤色の背景色、「手」が灰色の背景色で表示されている。なお、「用語パネル」欄(B)に設定された検索キーワードから、同義語辞書を参照し、設定された検索キーワードの同義語も同じ検索キーワードとして強調表示するようにしてもよい。この場合、同義語辞書は、事前に文書処理装置10内に格納されているとする。 The "specification text" column (D) is a column for displaying the scope of claims and the contents of the specification described in the patent document as text. If the specification text does not fit in the "specification text" column (D), scroll display is performed. In the specification text being displayed, the term corresponding to the search keyword set in the "term panel" column (B) is highlighted with the set color information. In the example of FIG. 2, for example, "clothes" are displayed with a red background color, and "hands" are displayed with a gray background color. The synonym dictionary may be referred to from the search keyword set in the "term panel" column (B), and the synonym of the set search keyword may be highlighted as the same search keyword. In this case, it is assumed that the synonym dictionary is stored in the document processing apparatus 10 in advance.

「スペクトルバー」欄(E)は、検索キーワードに対応する用語の明細書テキスト内位置を指示するスペクトルバーを一覧表示する欄である。図2の例では、スペクトルバーの列が6本表示されており、例えば、1つ目のスペクトルバー列には、検索キーワード「衣、服・・・前掛け」に対応する用語が明細書テキスト内で出現した位置が赤色のバーで表示され、2つ目のスペクトルバー列には、検索キーワード「手、首・・・すね」に対応する用語の明細書テキスト内位置が灰色のバーで表示されている。 The “spectrum bar” column (E) is a column for displaying a list of spectrum bars indicating positions in the specification text of terms corresponding to the search keyword. In the example of FIG. 2, six columns of spectrum bars are displayed. For example, in the first spectrum bar column, the term corresponding to the search keyword "clothes, clothes ... apron" is contained in the specification text. The position that appears in is displayed as a red bar, and the position in the specification text of the term corresponding to the search keyword "hand, neck ... shin" is displayed as a gray bar in the second spectrum bar column. ing.

スペクトルバーは、対応する検索キーワードの背景色で表示されているが、複数の検索キーワードに同じ背景色が設定されている場合、これら複数の検索キーワードを一つのグループとして扱い、同じ色のスペクトルバー列として表示される。なお、文書内に出現しない検索キ-ワードのグループについては、スペクトルバー列を非表示としてもよい。 The spectrum bar is displayed with the background color of the corresponding search keyword, but if the same background color is set for multiple search keywords, these multiple search keywords are treated as one group and the spectrum bar of the same color is displayed. Displayed as a column. The spectrum bar column may be hidden for a group of search keywords that do not appear in the document.

ユーザは、スペクトルバーを見ながら明細書テキストをスクロールすることにより、検索キ-ワードが存在している明細書テキスト中の位置まで容易に表示内容を移動させることができる。また、スペクトルバーのうちの1つをクリックすることにより、明細書テキストの対応する位置まで表示内容をジャンプさせることができる。 By scrolling the specification text while looking at the spectrum bar, the user can easily move the display content to the position in the specification text where the search keyword exists. Also, by clicking on one of the spectrum bars, the display content can be jumped to the corresponding position in the specification text.

「符号一覧」欄(F)は、図に付された参照符号とその説明を表示する欄である。また、「図」欄(G)は、特許文献に含まれている図面を縮小して配列し、表示する欄である。 The "code list" column (F) is a column for displaying the reference reference numerals attached to the figures and their explanations. Further, the “figure” column (G) is a column for reducing, arranging, and displaying the drawings included in the patent document.

図3は、第1実施形態の文書処理装置10により表示されたマルチスペクトル画面200の一例を示す図である。 FIG. 3 is a diagram showing an example of a multispectral screen 200 displayed by the document processing apparatus 10 of the first embodiment.

用語スペクトル表示手段12は、ユーザによるマルチスペクトル画面200の表示指示を検出し、用語群データセットを特定する情報を受信すると、指示された用語群データセットを用語群データベース50から取得し、それに基づいてマルチスペクトル画面200を生成する。そして、生成したマルチスペクトル画面200を文書表示画面100上の一部に重畳表示する。マルチスペクトル画面200内には、用語群データセットの各用語群に対応する用語群ボックス210が複数設けられており、各用語群ボックス210内には、その用語群の名称(図3では、「AA00」、「AA10」など)とともに用語リスト211と用語スペクトルバー列212が予め設定された色情報にしたがって表示される。 When the term spectrum display means 12 detects the display instruction of the multi-spectrum screen 200 by the user and receives the information specifying the term group data set, the term spectrum display means 12 acquires the instructed term group data set from the term group database 50 and is based on the instructed term group data set. To generate a multispectral screen 200. Then, the generated multispectral screen 200 is superimposed and displayed on a part of the document display screen 100. In the multispectral screen 200, a plurality of term group boxes 210 corresponding to each term group of the term group data set are provided, and in each term group box 210, the name of the term group (in FIG. 3, " Along with "AA00", "AA10", etc.), the term list 211 and the term spectrum bar column 212 are displayed according to preset color information.

1つの用語群データセットは、それぞれ何らかの意味に対応づけられる複数の用語群からなり、用語群に含まれる各用語には、その用語を表示するときの色情報が設定されている。色情報としては、文字色及び文字の背景色を設定することができ、さらにその用語がスペクトル表示された時のスペクトルバーの色の選択(文字色または文字背景色のいずれか)及び用語スペクトルバー列の背景色の選択(黒または白のいずれか)も可能である。なお、各用語には、色情報のほかに、フォント、サイズ、文字飾りなどの文字属性などが関連付けられてもよい。 One term group data set is composed of a plurality of term groups, each of which is associated with some meaning, and each term included in the term group is set with color information for displaying the term. As the color information, the text color and the background color of the text can be set, and the color selection (either the text color or the text background color) of the spectrum bar when the term is displayed in the spectrum and the term spectrum bar. You can also choose the background color of the column (either black or white). In addition to the color information, each term may be associated with character attributes such as font, size, and character decoration.

図3には、用語群データセットの一例として、Fタームのテーマ3B011(職業用、工業用又はスポーツ用保護衣)の各分類に対応づけられた複数の用語群が例示されている。用語スペクトル表示手段12は、ユーザから用語群データセットを特定する情報としてテーマ記号「3B011」を受信すると、用語群データベース50よりテーマ記号「3B011」に対応する用語群データセットを取得し、この用語群データセットに含まれる複数の分類に対応づけられた用語群ごとの用語群ボックス210を、マルチスペクトル画面200内に表示する。例えば、分類AA00に対応づけられた用語群ボックス210では、用語リスト211において、「衣、服・・・前掛け」の用語のグループが赤色の背景色で表示され、「手、首・・・すね」の用語のグループ(図示せず)が灰色の背景色で表示される。なお、用語群に含まれる用語の同義語を、自動的に同じ背景色の用語グループに含めるようにしてもよい。また、用語群に含まれる用語のうち、文書内に存在しない用語は、用語群リスト211において非表示としてもよい。 As an example of the term group data set, FIG. 3 illustrates a plurality of term groups associated with each classification of the F-term theme 3B011 (professional, industrial, or sports protective clothing). When the term spectrum display means 12 receives the theme symbol "3B011" as information for identifying the term group data set from the user, the term group data set corresponding to the theme symbol "3B011" is acquired from the term group database 50, and this term is used. A term group box 210 for each term group associated with a plurality of classifications included in the group data set is displayed in the multispectral screen 200. For example, in the term group box 210 associated with the classification AA00, in the term list 211, the group of terms "clothes, clothes ... apron" is displayed with a red background color, and "hands, necks ... shins". A group of terms (not shown) is displayed with a gray background. Note that synonyms of terms included in the term group may be automatically included in the term group having the same background color. Further, among the terms included in the term group, the terms that do not exist in the document may be hidden in the term group list 211.

次に、用語スペクトル表示手段12は、各用語群ボックス210内に用語スペクトルバー列212を表示する。1つの用語群ボックス210内に複数の用語スペクトルバー列212を表示でき、1つの用語スペクトルバー列212は、用語リスト211中の同じ背景色の用語グループに対応している。用語スペクトルバー列212の長手方向の長さは、文書全体の長さに対応しており、用語スペクトルバー列212中の1つのスペクトルバーは、対応する用語の文書内位置を指示している。 Next, the term spectrum display means 12 displays the term spectrum bar column 212 in each term group box 210. A plurality of term spectrum bar rows 212 can be displayed in one term group box 210, and one term spectrum bar row 212 corresponds to a term group having the same background color in the term list 211. The longitudinal length of the term spectrum bar sequence 212 corresponds to the length of the entire document, and one spectrum bar in the term spectrum bar row 212 indicates the position in the document of the corresponding term.

用語スペクトルバー列212の背景及びスペクトルバーの色は、色情報の設定に基づいて色付けされる。図3の例では、スペクトルバーの色として文字背景色が選択され、用語スペクトルバー列の背景色として黒が選択されているため、分類AA00に対応づけられた用語群ボックス210において、赤色の文字背景色を有する「衣、服・・・前掛け」に対応して、1列目の用語スペクトルが黒の背景色と赤色のスペクトルバーで表示され、灰色の文字背景色を有する「手、首・・・すね」に対応して、2列目の用語スペクトルが黒の背景色と灰色のスペクトルバーで表示されている。ある背景色の用語のグループが文書内に存在しない場合には、用語スペクトルバー列を黒色あるいは非表示としてもよい。 The background of the term spectrum bar sequence 212 and the color of the spectrum bar are colored based on the color information setting. In the example of FIG. 3, since the character background color is selected as the color of the spectrum bar and black is selected as the background color of the term spectrum bar column, the red character is selected in the term group box 210 associated with the classification AA00. Corresponding to "clothes, clothes ... apron" with a background color, the term spectrum of the first column is displayed with a black background color and a red spectrum bar, and "hands, necks, and necks" with a gray character background color. The term spectrum in the second column is displayed with a black background color and a gray spectrum bar corresponding to ".. Shin". If a group of terms with a background color does not exist in the document, the term spectrum bar sequence may be black or hidden.

このように、用語群に対応させて用語リスト211と用語スペクトルバー列212を一体化して関連付け、用語リスト211に含まれる用語が文書内でヒットすると、対応する用語スペクトルバー列212を色付けして表示するように構成したことから、マルチスペクトル画面を俯瞰しながら、複数の用語群と文書との関連性を容易に把握することができる。 In this way, the term list 211 and the term spectrum bar column 212 are integrally associated with each other corresponding to the term group, and when the term included in the term list 211 is hit in the document, the corresponding term spectrum bar column 212 is colored. Since it is configured to be displayed, it is possible to easily grasp the relationship between a plurality of term groups and a document while looking down at the multispectral screen.

例えば、ユーザは、マルチスペクトル画面200にマトリックス配置された用語群ボックス210内の用語スペクトルバー列212を俯瞰し、図3のAA00のようにスペクトルバーが多く表示されている分類は、文書の内容との関連性が高いと判定することができる。また、AA10、AA14、AA15も関連性があることが分かる。一方、AA11~AA13、AB02~AB03のように、スペクトルバーが表示されていない分類については、文書の内容との関連性は低いと判定することができる。 For example, the user has a bird's-eye view of the term spectrum bar column 212 in the term group box 210 matrix-arranged on the multi-spectral screen 200, and the classification in which many spectrum bars are displayed as in AA00 of FIG. 3 is the content of the document. It can be determined that the relationship with is high. It can also be seen that AA10, AA14, and AA15 are also related. On the other hand, it can be determined that the classifications in which the spectrum bar is not displayed, such as AA11 to AA13 and AB02 to AB03, have low relevance to the contents of the document.

ユーザは、用語スペクトル表示手段12が表示したマルチスペクトル画面200を俯瞰したとき、用語群ボックス210中の特定の用語や用語スペクトルが、文書内でどのように記載されているのかを表示させたい場合がある。そこで、文書処理装置10は、マルチスペクトル画面200に対する所定のユーザ操作を検出すると、文書内の対応する用語を簡便に表示する機能を提供する。 When the user wants to display how a specific term or term spectrum in the term group box 210 is described in a document when the multi-spectrum screen 200 displayed by the term spectrum display means 12 is viewed from a bird's-eye view. There is. Therefore, the document processing apparatus 10 provides a function of simply displaying the corresponding term in the document when a predetermined user operation on the multispectral screen 200 is detected.

例えば、文書表示手段11は、ユーザがマウス操作により、マルチスペクトル画面200中の1つの用語群ボックス210をクリックしたことを検出すると、クリックされた用語群ボックス210を強調表示する。図3では、一例として、クリックされた名称「AA00」の用語群ボックス210を破線枠で強調表示している。そして、「用語パネル」欄(B)中の検索キ-ワードを選択された用語群ボックス210に対応する用語リスト211に置き換えて、検索キーワードに対応する文書内の用語を強調表示する。このときに、「用語パネル」欄(B)が置き換わることで、「スペクトルバー」欄(E)には、選択された用語群ボックス210の名称「AA00」とスペクトルバー列212が表示されるため、ユーザは、「スペクトルバー」欄(E)を見ながら明細書テキストをスクロールすることができる。また、ユーザが、用語群ボックス210の中のスペクトルバーの1つをクリックした場合には、上の動作に加え、「スペクトルバー」欄(E)のスペクトルバーをクリックした場合と同様に、「明細書テキスト」欄(D)の表示内容を対応する位置までジャンプさせる。さらに、ユーザは、複数の用語群ボックス210を同時に選択することもできる。例えば、分類AA12と分類AA13が、上位概念と下位概念の関係にあるときに、両方の用語群ボックスを同時に選択し、対応する用語を強調表示することができる。 For example, when the document display means 11 detects that the user has clicked one term group box 210 in the multispectral screen 200 by operating the mouse, the clicked term group box 210 is highlighted. In FIG. 3, as an example, the term group box 210 with the clicked name “AA00” is highlighted with a broken line frame. Then, the search keyword in the "term panel" column (B) is replaced with the term list 211 corresponding to the selected term group box 210, and the term in the document corresponding to the search keyword is highlighted. At this time, the "term panel" column (B) is replaced, so that the name "AA00" of the selected term group box 210 and the spectrum bar column 212 are displayed in the "spectrum bar" column (E). , The user can scroll through the specification text while looking at the "spectrum bar" column (E). Further, when the user clicks one of the spectrum bars in the term group box 210, in addition to the above operation, the same as when the user clicks the spectrum bar in the "spectrum bar" column (E), " The display content in the "statement text" column (D) is jumped to the corresponding position. Further, the user can select a plurality of term group boxes 210 at the same time. For example, when classification AA12 and classification AA13 are in a superordinate concept and subordinate concept relationship, both term group boxes can be selected at the same time and the corresponding term can be highlighted.

なお、ユーザがマウス操作により特定の用語群ボックス210をクリックしたことを検出することに代えて、特定の用語群ボックス210をドラッグして「用語パネル」欄(B)の上でドロップしたことを検出するようにしてもよい。また、用語群内に表示された用語リスト211内の特定の用語の選択、または特定の用語スペクトルバー列212の選択を検出し、対応する文書内の用語を強調表示するようにしてもよい。 Instead of detecting that the user clicked the specific term group box 210 by operating the mouse, the specific term group box 210 was dragged and dropped on the "term panel" column (B). It may be detected. It may also detect the selection of a particular term in the term list 211 displayed within the term group, or the selection of the particular term spectrum bar column 212, and highlight the term in the corresponding document.

以上のように、ユーザは、マルチスペクトル画面200を表示させた後、マルチスペクトル画面200に対して所定の操作を行うことにより、文書の該当するテキストを表示させることができる。このため、何らかの意味に対応づけられた複数の用語群と文書との対比において、文書の具体的な記載内容を分析したいような場合でも、簡単な操作により、文書の該当箇所を表示させることができる。 As described above, the user can display the corresponding text of the document by performing a predetermined operation on the multispectral screen 200 after displaying the multispectral screen 200. For this reason, even if you want to analyze the specific content of a document by comparing multiple term groups associated with some meaning with the document, you can display the relevant part of the document with a simple operation. can.

なお、用語スペクトルバー列212は、用語群ボックス210内に収まるように表示されるが、用語群ボックス210あるいは用語スペクトルバー列212の視認性を高めるため、用語スペクトルバー列212を表示するモードと非表示にするモードを設けてもよい。このモードは、ユーザが任意に設定することもできる。また、文書内における用語の出現頻度に応じて自動的に設定してもよい。例えば、ある用語スペクトルバー列に対応する用語の出現頻度が所定の第1閾値以上の場合、あるいは、所定の第2閾値以下の場合には、その用語スペクトルバー列は文書の内容と関連する用語スペクトルバー列ではないと判定し、非表示モードに設定してもよい。 The term spectrum bar row 212 is displayed so as to fit in the term group box 210, but in order to improve the visibility of the term group box 210 or the term spectrum bar row 212, a mode for displaying the term spectrum bar row 212 is used. A mode for hiding may be provided. This mode can also be set arbitrarily by the user. In addition, it may be set automatically according to the frequency of appearance of terms in the document. For example, if the frequency of appearance of a term corresponding to a certain term spectrum bar string is equal to or higher than a predetermined first threshold value, or is equal to or lower than a predetermined second threshold value, the term spectrum bar string is a term related to the content of the document. It may be determined that it is not a spectrum bar string and set to the non-display mode.

用語スペクトルバー列212の色付けのために、用語に設定された色情報を利用する例を説明したが、他の色付け方法を採用することもできる。一例として、文書内でヒットした用語の数を用語スペクトルバー列の色の濃淡に反映させてもよい。例えば、赤色の背景色を有する「衣、・・・前掛け」のグループについて用語スペクトルバー列を表示する場合、ヒットする用語数が少ない場合には薄い赤色、多い場合には濃い赤色のように、用語数に基づいて色の濃さを変化させることができる。 Although an example of using the color information set in the term for coloring the term spectrum bar column 212 has been described, other coloring methods can also be adopted. As an example, the number of terms hit in the document may be reflected in the shade of color in the term spectrum bar column. For example, when displaying a term spectrum bar column for a group of "clothes, ... apron" with a red background color, light red when the number of hit terms is small, dark red when the number of hits is large, etc. The color intensity can be changed based on the number of terms.

図3では、文書表示画面100上にマルチスペクトル画面200を重畳表示したものとして説明したが、このような表示態様に限ることなく、例えば、マルチスペクトル画面200を別ウインドウとして表示してもよい。また、ユーザの指示に応じて用語群ボックス210を縮小表示したり、マルチスペクトル画面200を縦方向あるいは横方向にスクロール表示するためのスクロールバーを表示したりしてもよい。 In FIG. 3, the multispectral screen 200 is superimposed and displayed on the document display screen 100, but the display mode is not limited to this, and the multispectral screen 200 may be displayed as a separate window, for example. Further, the term group box 210 may be reduced and displayed according to a user's instruction, or a scroll bar for scrolling and displaying the multispectral screen 200 in the vertical direction or the horizontal direction may be displayed.

用語群ボックス210の表示については、用語群ボックス210ごとに表示/非表示モードの設定を可能にし、上で述べたような用語の出現頻度に基づく判定によって、意味を有しないような用語群ボックス210を非表示にしてもよい。 Regarding the display of the term group box 210, it is possible to set the display / non-display mode for each term group box 210, and the term group box has no meaning by the judgment based on the frequency of appearance of the terms as described above. 210 may be hidden.

また、用語群ボックス210に階層構造を持たせ、通常時には上位の階層の用語群ボックス210のみを表示させ、上位の階層の用語群ボックス210への操作(例えば、マウスによるダブルクリック)により、その下位の階層の用語群ボックス210を表示させるようにしてもよい。例えば、上位階層の分類AA00に対応づけられた用語群ボックスと、その下の階層の分類AA01~AA10に対応づけられた各用語群ボックスがある場合に、通常時は上位階層の分類AA00に対応づけられた用語群ボックスのみを、下位階層の用語及び用語スペクトルバー列も統合した形で表示させ、当該用語群ボックスへの操作によって、下位階層の用語群ボックスを展開して表示させるようにしてもよい。 Further, the term group box 210 has a hierarchical structure, and normally only the term group box 210 in the upper hierarchy is displayed, and the operation (for example, double-clicking with the mouse) to the term group box 210 in the upper hierarchy causes the display. The term group box 210 in the lower hierarchy may be displayed. For example, if there is a term group box associated with the upper hierarchy classification AA00 and each term group box associated with the lower hierarchy classifications AA01 to AA10, it usually corresponds to the upper hierarchy classification AA00. Only the attached term group box is displayed in a form that integrates the terms and the term spectrum bar column of the lower hierarchy, and the term group box of the lower hierarchy is expanded and displayed by operating the term group box. May be good.

各用語群ボックス210には、用語群の名称とともに用語群に対応づけられた意味の説明をあわせて表示するようにしてもよい。例えば、用語群がFタームの分類に対応づけられている場合には、Fタームの表形式で用語群ボックスを配列させ、各用語群ボックスにおいて、分類の記号とともに分類の定義の説明を表示するようにしてもよい。また、各用語群ボックス210においては、用語リスト211を非表示としてもよい。 In each term group box 210, the name of the term group and the explanation of the meaning associated with the term group may be displayed together. For example, when a term group is associated with an F-term classification, the term group boxes are arranged in a table format of the F-term, and in each term group box, a description of the classification definition is displayed together with a classification symbol. You may do so. Further, the term list 211 may be hidden in each term group box 210.

図3では、ユーザが1つの用語群データセット(3B011)を特定し、この1つの用語群データセットに対応するマルチスペクトル画面200を表示する例を示したが、ユーザが複数の用語群データセットを特定し、複数の用語群データセットに対応するマルチスペクトル画面を表示するようにしてもよい。この場合、複数の用語群データセットに対応するマルチスペクトル画面200を並べて表示するようにしてもよいし、タブなどで切り替えて表示するようにしてもよい。 FIG. 3 shows an example in which a user identifies one term group data set (3B011) and displays a multispectral screen 200 corresponding to this one term group data set, but the user has a plurality of term group data sets. May be specified and a multispectral screen corresponding to a plurality of term group data sets may be displayed. In this case, the multi-spectral screens 200 corresponding to a plurality of term group data sets may be displayed side by side, or may be switched and displayed by a tab or the like.

図4は、第1実施形態の文書処理装置10のマルチ用語パネル300の一例を示す図である。マルチ用語パネル300は、用語群データセットに含まれる用語群ごとに、用語リストや色情報を配列したものである。 FIG. 4 is a diagram showing an example of the multi-term panel 300 of the document processing apparatus 10 of the first embodiment. The multi-term panel 300 arranges a term list and color information for each term group included in the term group data set.

用語群表示手段13は、ユーザによる「ファイル入力」コマンドに応答して、用語群データベース50から指定された用語群データセットを取得する。そして、用語群データセットから、用語群の名称、スペクトル背景色、スペクトルマーク、用語、用語の色情報を抽出してマルチ用語パネル300を生成し、表示装置30に表示する。 The term group display means 13 acquires a designated term group data set from the term group database 50 in response to a "file input" command by the user. Then, the name of the term group, the spectrum background color, the spectrum mark, the term, and the color information of the term are extracted from the term group data set to generate the multi-term term panel 300, which is displayed on the display device 30.

図4には、一例として、パネル1からパネル8までのパネルが表示されている。各パネルは、パネル番号、用語群の名称、スペクトル背景色、スペクトルマーク、用語を含んでいる。また、マルチ用語パネル300に隣接して、色番号、文字色、文字背景色の組合せを表示した「用語と色パネル」欄が表示されている。また、マルチ用語パネル300上部には、「エクスポート」、「ファイル出力」、「ファイル入力」、「色一括設定」、「色全クリア」のコマンドボタンが設けられている。 In FIG. 4, the panels from the panel 1 to the panel 8 are displayed as an example. Each panel contains a panel number, a term group name, a spectral background color, a spectral mark, and a term. Further, adjacent to the multi-term panel 300, a "term and color panel" column displaying a combination of a color number, a character color, and a character background color is displayed. Further, at the upper part of the multi-term panel 300, command buttons of "export", "file output", "file input", "color batch setting", and "clear all colors" are provided.

図4のマルチ用語パネル300は、一例として、Fタームのテーマ3B011の分類に対応づけられた用語群を表示している。「スペクトル背景色」欄には、用語スペクトルバー列の背景色の設定が表示され、パネル1では黒色が選択されている。「スペクトルマーク」欄には、用語スペクトル中のスペクトルバーの色が指定されており、パネル1では、スペクトルバーが用語の文字背景色により表示されることが設定されている。 As an example, the multi-term panel 300 of FIG. 4 displays a group of terms associated with the classification of the theme 3B011 of the F-term. In the "spectral background color" column, the setting of the background color of the term spectrum bar column is displayed, and black is selected in the panel 1. In the "spectrum mark" column, the color of the spectrum bar in the term spectrum is specified, and in the panel 1, the spectrum bar is set to be displayed by the character background color of the term.

「用語」欄には、用語群の用語と、その用語の文字色及び文字背景色の組み合わせを示す色番号が設定されている。例えば、パネル1には、「衣、服・・・前掛け」が白の文字色及び赤の文字背景色、「手、首・・・すね」が黒の文字色及び灰色の文字背景色で表示されるように設定されている。 In the "term" column, a color number indicating a combination of a term of the term group and a character color and a character background color of the term is set. For example, on the panel 1, "clothes, clothes ... apron" is displayed in white text color and red text background color, and "hand, neck ... shin" is displayed in black text color and gray text background color. Is set to be done.

マルチ用語パネル300の用語群や各種色の設定は、ユーザが自由に編集可能である。マルチ用語パネル300を新規に作成する場合は、全ての項目をユーザがマニュアルにより入力してもよいが、「用語」欄に設定する用語群については、用語群作成手段14により、機械的に抽出されたものをユーザが編集して作成することができる。例えば、図4のように、各用語群がFタームの分類に対応づけられる場合、用語群作成手段14は、用語群の新規作成指示に対応し、指示されたFタームのテーマ記号に対応する既存のFターム表をメモリから取得し、各分類の定義説明の文言から用語を抽出して、その同義語や類義語とともにユーザに提示するようにしてもよい。ここで、既存のすべてのFターム表及び同義語・類義語の辞書は、事前に文書処理装置10内に格納されているとする。 The term group and various color settings of the multi-term panel 300 can be freely edited by the user. When newly creating the multi-term panel 300, the user may manually input all the items, but the term group set in the "term" field is mechanically extracted by the term group creating means 14. The user can edit and create what has been done. For example, as shown in FIG. 4, when each term group is associated with the classification of the F-term, the term group creating means 14 corresponds to the instruction for creating a new term group and corresponds to the designated F-term theme symbol. An existing F-term table may be acquired from the memory, a term may be extracted from the wording of the definition explanation of each classification, and the term may be presented to the user together with the synonym or synonym. Here, it is assumed that all the existing F-term tables and dictionaries of synonyms / synonyms are stored in the document processing apparatus 10 in advance.

用語群作成手段14による用語群の抽出手法としては、その用語群でヒットする文献(正例文献)の集合とヒットしない文献(負例文献)の集合に基づき、用語群の種となる用語を機械的に抽出するようにしてもよい。 As a method for extracting a term group by the term group creating means 14, a term that is a seed of a term group is selected based on a set of documents that are hit by the term group (positive example documents) and a set of documents that are not hit (negative example documents). It may be extracted mechanically.

図5は、Fタームのあるテーマに対応づけられた特許文献集合から、分類ごとに正例文献集合と負例文献集合を作成するステップの一例を説明する図である。 FIG. 5 is a diagram illustrating an example of a step of creating a positive example document set and a negative example document set for each classification from a patent document set associated with a certain theme with an F-term.

正例文献集合と負例文献集合は、Fタームの分類ごとに作成される。例えば、AA01の分類について正例文献集合と負例文献集合を作成する場合、対象となっているテーマに対応づけられた全特許文献について付与されている分類記号を分析し、AA01が付与されている文献を正例文献の集合に含め、AA01が付与されていない文献を負例文献の集合に含める。 A set of positive and negative literature is created for each F-term classification. For example, when creating a positive example document set and a negative example document set for the classification of AA01, the classification symbols assigned to all the patent documents associated with the target theme are analyzed, and AA01 is assigned. The documents that are present are included in the set of positive examples, and the documents that are not given AA01 are included in the set of negative examples.

図6は、種用語の抽出ステップの一例を概略的に示している。 FIG. 6 schematically shows an example of a seed term extraction step.

正例文献集合と負例文献集合から、正例文献での出現率が負例文献での出現率よりも顕著に高い用語を生成する。例えば、AA01が付与された正例文献集合に含まれる各用語について、正例文献集合内での出現率、すなわち、その用語が出現する正例文献数を全正例文献数で割った値を算出する。同様に、AA01が付与されていない負例文献集合に含まれる各用語について、負例文献集合内での出現率、すなわち、その用語が出現する負例文献数を全負例文献数で割った値を算出する。 From the positive and negative bibliographic sets, we generate terms that have a significantly higher appearance rate in the positive bibliography than in the negative bibliography. For example, for each term included in the set of regular documents to which AA01 is given, the appearance rate in the set of regular documents, that is, the value obtained by dividing the number of regular documents in which the term appears by the total number of regular documents. calculate. Similarly, for each term included in the negative example literature set to which AA01 is not assigned, the appearance rate in the negative example document set, that is, the number of negative example documents in which the term appears is divided by the total number of negative example documents. Calculate the value.

そして、正例文献での出現率が、負例文献での出現率よりも顕著に高い用語を、用語群AA01の種用語として抽出する。抽出の基準となる出現率の閾値については、抽出する種用語の精度あるいは抽出すべき種用語数などに応じて設定することができる。また、種用語を抽出する際に、種用語の同義語や類義語をあわせて抽出するようにしてもよい。この場合、同義語・類義語の辞書は、事前に文書処理装置10内に格納されているとする。抽出された種用語は、そのまま用語群の用語として利用することもできるが、抽出された種用語を表示画面に表示し、ユーザからの入力に基づいて最終的に利用する用語を選択するようにしてもよい。なお、種用語の出現率の算出にあたり、どのような文献にも出現する一般的な用語あるいは出現数が統計的に意味をもたないほど少ない用語については、除外してもよい。 Then, a term whose appearance rate in the positive example document is significantly higher than that in the negative example document is extracted as a seed term of the term group AA01. The threshold value of the appearance rate, which is the reference for extraction, can be set according to the accuracy of the seed terms to be extracted, the number of seed terms to be extracted, and the like. Further, when extracting the seed term, synonyms and synonyms of the seed term may be extracted together. In this case, it is assumed that the synonym / synonym dictionary is stored in the document processing apparatus 10 in advance. The extracted seed term can be used as it is as a term of the term group, but the extracted seed term is displayed on the display screen and the term to be finally used is selected based on the input from the user. May be. In calculating the appearance rate of seed terms, general terms appearing in any document or terms whose number of appearances is so small that they do not have statistical meaning may be excluded.

このように、用語群作成手段14を設けたことにより、既に分類が付与された複数の正例文献及び負例文献に基づいて、各分類の意味に対応づけられた用語群を抽出することができることから、各分類を特徴づける用語群を客観的かつ網羅的に設定することができる。 In this way, by providing the term group creating means 14, it is possible to extract a term group associated with the meaning of each classification based on a plurality of positive and negative examples already given classification. Since it is possible, it is possible to objectively and comprehensively set the term group that characterizes each classification.

用語群表示手段13により新規作成あるいは編集されたマルチ用語パネル300の内容は、「ファイル出力」の指示があった場合、用語群データセットに変換されて用語群データベース50に新規保存あるいは上書き保存される。また、「エクスポート」の指示があった場合、用語群データセットが用語スペクトル表示手段12にエクスポートされ、マルチスペクトル画面200に表示される。 The contents of the multi-term panel 300 newly created or edited by the term group display means 13 are converted into a term group data set and newly saved or overwritten in the term group database 50 when instructed to "output a file". To. Further, when the instruction of "export" is given, the term group data set is exported to the term spectrum display means 12 and displayed on the multi-spectrum screen 200.

以上のように、マルチ用語パネル300を使用することにより、ユーザは用語群の内容を随時編集、改良したり、あるいは、マルチ用語パネル300を新規作成したりできるため、用語群の内容を充実させることができる。 As described above, by using the multi-term panel 300, the user can edit and improve the content of the term group at any time, or create a new multi-term panel 300, so that the content of the term group is enhanced. be able to.

<動作>
次に、上述の第1実施形態の文書処理装置10の動作の一例について説明する。
図7は、第1実施形態の文書処理装置10の動作の一例を説明するためのフローチャートである。文書処理装置10が起動されると、図7のステップS1、S8、S10のメインルーチンを実行する。ステップS2,S3、S5~S7は文書表示手段11の機能に対応しており、ステップS4は用語スペクトル表示手段12の機能、ステップS9は用語群表示手段13の機能に対応している。本フローチャートにおいて略述されたステップは例示的であり、あるステップを除外、追加、又は修正する組み合わせを含む、ステップの任意の組み合わせで実施可能である。図7では、各ステップを逐次処理した場合を例示しているが、マルチプログラミング処理など並列プログラミングの手法を採用してもよい。
<Operation>
Next, an example of the operation of the document processing apparatus 10 of the first embodiment described above will be described.
FIG. 7 is a flowchart for explaining an example of the operation of the document processing apparatus 10 of the first embodiment. When the document processing device 10 is started, the main routines of steps S1, S8, and S10 in FIG. 7 are executed. Steps S2, S3, and S5 to S7 correspond to the function of the document display means 11, step S4 corresponds to the function of the term spectrum display means 12, and step S9 corresponds to the function of the term group display means 13. The steps outlined in this flowchart are exemplary and can be performed in any combination of steps, including combinations that exclude, add, or modify certain steps. Although FIG. 7 illustrates the case where each step is sequentially processed, a parallel programming method such as multi-programming processing may be adopted.

文書表示手段11は、文書表示画面100の表示指示を検出すると(ステップS1)、文書を文書表示画面100上に表示する(ステップS2)。文書表示画面100を新たに生成する場合には、ユーザから文書を特定する情報(例えば、特許文献の公開番号など)を取得し、文書データベース40より該当する文書を取得する。そして、取得した文書から段落構成、明細書テキスト、符号一覧、図を抽出して文書表示画面100上に表示する。文書表示手段11は、必要に応じて、文書表示画面100にスクロールバーを表示する。一方、文書表示画面100が既に生成されているが非アクティブになっている場合には、文書表示画面100をアクティブにする。 When the document display means 11 detects the display instruction on the document display screen 100 (step S1), the document display means 11 displays the document on the document display screen 100 (step S2). When the document display screen 100 is newly generated, the information for specifying the document (for example, the publication number of the patent document) is acquired from the user, and the corresponding document is acquired from the document database 40. Then, the paragraph structure, the specification text, the code list, and the figure are extracted from the acquired document and displayed on the document display screen 100. The document display means 11 displays a scroll bar on the document display screen 100 as needed. On the other hand, when the document display screen 100 has already been generated but is inactive, the document display screen 100 is activated.

検索キーワードが予め設定されている場合、または新たに入力された場合には、文書表示手段11は、検索キーワードを「用語パネル」欄(B)に表示する。そして、文書内に該当検索キーワードに対応する用語が存在する場合には、その用語の文字色あるいは背景色を変えることにより強調表示を行う。 When the search keyword is preset or newly input, the document display means 11 displays the search keyword in the "term panel" column (B). Then, when a term corresponding to the corresponding search keyword exists in the document, highlighting is performed by changing the character color or the background color of the term.

文書表示手段11は、「スペクトルバー」欄(E)に、検索キーワードに対応する用語が文書内のどの位置に出現しているかを示すスペクトルバーを当該検索キーワードの背景色と同じ色により表示する。 The document display means 11 displays in the “spectrum bar” column (E) a spectrum bar indicating at which position in the document the term corresponding to the search keyword appears in the same color as the background color of the search keyword. ..

図7において、ユーザによるマルチスペクトル画面200の表示指示を検出すると(ステップS3)、用語スペクトル表示手段12は、ユーザから用語群データセットを特定する情報(例えば、Fタームのテーマ記号)を取得し、用語群データベース50から該当する用語群データセット(例えば、Fタームの複数の分類に対応づけられた用語群)を取得する。そして、マルチスペクトル画面200上に複数の用語群ボックス210を配置し、各用語群ボックス210内に、用語群のそれぞれに関連付けられた用語リスト211と用語スペクトルバー列212を予め設定された色情報に基づいて表示する(ステップS4)。 In FIG. 7, when the display instruction of the multi-spectral screen 200 by the user is detected (step S3), the term spectrum display means 12 acquires information for specifying the term group data set (for example, an F-term theme symbol) from the user. , The corresponding term group data set (for example, the term group associated with a plurality of classifications of F-term) is acquired from the term group database 50. Then, a plurality of term group boxes 210 are arranged on the multi-spectral screen 200, and the term list 211 and the term spectrum bar string 212 associated with each of the term groups are preset in each term group box 210. Is displayed based on (step S4).

用語スペクトル表示手段12は、用語群ボックス210中に用語スペクトルバー列を表示するために、用語リスト211から一つの用語を選択し、当該用語が文書内に出現する位置を算出する。例えば、文書の最初の行から当該用語が出現する行までの行数を計算し、文書全体の行数で割ることにより、文書内の相対的な出現位置を算出し、その出現位置を一つのスペクトルバーとして用語スペクトルバー列中に表示する。このとき、スペクトルバーは、当該用語に設定された色情報に基づいて色付けされる。同様に、文書内で当該用語が出現するすべての位置を算出し、これら用語に対応した複数のスペクトルバーを含む用語スペクトルバー列212を用語に設定された色により表示する。 The term spectrum display means 12 selects one term from the term list 211 in order to display the term spectrum bar sequence in the term group box 210, and calculates the position where the term appears in the document. For example, by calculating the number of lines from the first line of the document to the line where the term appears and dividing by the number of lines of the entire document, the relative appearance position in the document is calculated, and the appearance position is one. Displayed as a spectrum bar in the term spectrum bar column. At this time, the spectrum bar is colored based on the color information set in the term. Similarly, all positions where the term appears in the document are calculated and the term spectrum bar sequence 212 containing the plurality of spectrum bars corresponding to these terms is displayed in the color set for the term.

用語群に含まれる他の用語についても、同様に、それぞれの用語に対応する用語スペクトルバー列212を生成する。なお、スペクトルバーの表示を行った場合、スペクトルバーごとに、対応する用語とその用語の文書内位置を関連付けてメモリに記憶しておく。 Similarly, for other terms included in the term group, a term spectrum bar string 212 corresponding to each term is generated. When the spectrum bar is displayed, the corresponding term and the position in the document of the term are associated with each spectrum bar and stored in the memory.

図7において、文書表示画面100あるいはマルチスペクトル画面200へのユーザ操作を検出すると(ステップS5)、文書表示手段11は、文書表示画面100あるいはマルチスペクトル画面200に対するユーザ操作に応答して、文書の表示内容を制御する(ステップS6)。例えば、ある用語群ボックス210が選択されたことを検出した場合、選択された用語群ボックス210を強調表示するとともに、その用語群ボックス210内の用語リスト211を「用語パネル」欄(B)に表示し、「明細書テキスト」欄(D)の文書の強調表示と、「スペクトルバー」欄(E)のスペクトル表示を行う。 In FIG. 7, when a user operation on the document display screen 100 or the multispectral screen 200 is detected (step S5), the document display means 11 responds to the user operation on the document display screen 100 or the multispectral screen 200 to display the document. The display content is controlled (step S6). For example, when it is detected that a certain term group box 210 is selected, the selected term group box 210 is highlighted and the term list 211 in the term group box 210 is displayed in the “term panel” column (B). It is displayed, the document is highlighted in the "specification text" column (D), and the spectrum is displayed in the "spectrum bar" column (E).

文書の表示内容の制御が終了すると、文書表示手段11は、文書表示画面100が選択中あるいは作業中であるか否か、すなわち、アクティブか否かを判定する(ステップS7)。文書表示画面100がアクティブの場合には、ステップS3~S6を繰り返し、文書表示画面100が閉じられたり、縮小されたりして非アクティブになった場合にはメインフローに戻る。 When the control of the display contents of the document is completed, the document display means 11 determines whether or not the document display screen 100 is being selected or is being worked on, that is, whether or not the document display screen 100 is active (step S7). When the document display screen 100 is active, steps S3 to S6 are repeated, and when the document display screen 100 is closed or reduced to become inactive, the process returns to the main flow.

図7において、マルチ用語パネル300の表示指示が検出されると(ステップS8)、用語群表示手段13は、マルチ用語パネル300を表示する。マルチ用語パネル300を新たに生成する場合には、ユーザから表示対象となる用語群データセットを特定する情報及び新規/編集コマンドの入力を待機する。これらの情報が入力されると、用語群表示手段13は、マルチ用語パネル300を表示する。一方、マルチ用語パネル300が既に生成されているが非アクティブの場合には、アクティブにして表示する。そして、用語群の新規作成処理あるいは編集処理を実行する(ステップS9)。用語群表示手段13は、ユーザによる「エクスポート」コマンドを検出した場合、マルチ用語パネル300の内容を用語群データセットに変換し、文書表示手段11に対して「エクスポート」コマンドが指示された旨の通知とともに変換された用語群データセットをデータ引き渡し用メモリ(図示せず)に出力する。用語群表示手段13による処理が終了するか、あるいは、マルチ用語パネル300が非アクティブになると、処理フローはメインフローに戻る。 In FIG. 7, when the display instruction of the multi-term panel 300 is detected (step S8), the term group display means 13 displays the multi-term panel 300. When the multi-term panel 300 is newly generated, the user waits for the input of the information specifying the term group data set to be displayed and the new / edit command. When such information is input, the term group display means 13 displays the multi-term panel 300. On the other hand, if the multi-term panel 300 has already been generated but is inactive, it is activated and displayed. Then, a new creation process or an editing process of the term group is executed (step S9). When the term group display means 13 detects the "export" command by the user, the term group display means 13 converts the contents of the multi-term panel 300 into a term group data set, and the document display means 11 is instructed to perform the "export" command. The term group data set converted with the notification is output to the data delivery memory (not shown). When the processing by the term group display means 13 is completed or the multi-term panel 300 becomes inactive, the processing flow returns to the main flow.

図7において、文書処理装置10を終了するコマンドが入力されたかを検出し(ステップS10)、終了コマンドが入力されない場合には、ステップS1に戻る。一方、文書処理装置10の終了コマンドが入力されると、表示されている画面を閉じて、文書処理装置10の一連の処理を終了する。 In FIG. 7, it is detected whether a command for terminating the document processing device 10 has been input (step S10), and if no end command has been input, the process returns to step S1. On the other hand, when the end command of the document processing apparatus 10 is input, the displayed screen is closed and the series of processing of the document processing apparatus 10 is terminated.

以上、第1実施形態によれば、用語群データセットを構成する何らかの意味に対応づけられた複数の用語群と文書との関連性を容易に把握できるような文書処理装置を提供することができる。なお、第1実施形態では、複数の用語群としてFタームの分類に対応づけられた用語群を例にとって説明したが、Fタームの分類以外の何らかの意味に対応づけられた複数の用語群についても、本発明を適用することができる。例えば、分類に関する統計基準として用いられる日本標準産業分類、日本標準職業分類、疾病、傷害及び死因分類のほか、日本標準商品分類などは、いずれも大分類、中分類、小分類及びこれらの分類を説明する項目を有しており、何らかの意味に対応づけられた複数の用語群を有する文書ということができる。 As described above, according to the first embodiment, it is possible to provide a document processing device that can easily grasp the relationship between a document and a plurality of term groups associated with some meanings constituting the term group data set. .. In the first embodiment, a term group associated with the F-term classification as a plurality of term groups has been described as an example, but a plurality of term groups associated with some meaning other than the F-term classification may also be described. , The present invention can be applied. For example, in addition to the Japan Standard Industrial Classification, Japanese Standard Occupational Classification, Disease, Injury, and Death Cause Classification, which are used as statistical standards for classification, the Japan Standard Industrial Classification, etc., all have major classification, middle classification, minor classification, and these classifications. It can be said that the document has items to be explained and has a plurality of term groups associated with some meaning.

<第2実施形態>
第2実施形態における分類付与支援システムについて説明する。第2実施形態は、第1実施形態の文書処理装置を備え、用語群データセットを構成する複数の用語群を複数の分類に対応づけられたものとし、複数の分類の中から相応しい分類を選択して分類付与対象の文献に付与するための支援を行う分類付与支援システムに関する。ここで、分類の付与は、分類付与対象の文献の内容が、分類の定義に合致する場合に、当該文献に分類記号を付すことによって行われる。例えば、Fタームにおける「AA00」、「AA01」などが、付与される分類記号である。
<Second Embodiment>
The classification assignment support system in the second embodiment will be described. The second embodiment is provided with the document processing apparatus of the first embodiment, and a plurality of term groups constituting the term group data set are associated with a plurality of classifications, and a suitable classification is selected from the plurality of classifications. The present invention relates to a classification granting support system that provides support for granting classification to a document to be classified. Here, the classification is given by attaching a classification symbol to the document when the content of the document to be classified matches the definition of the classification. For example, "AA00", "AA01", etc. in the F-term are assigned classification symbols.

第2実施形態では、図1に示すように、文書表示手段11によって表示される文書に分類を付与するための分類付与手段15をさらに備えている。ユーザは、用語スペクトル表示手段12により表示される各用語群ボックス210を参照し、特にスペクトルバーが多く表示されていて文書の内容との関連性が高いと判定される用語群ボックス210を選択して、その用語群ボックス210内の用語リスト211を「用語パネル」欄(B)に表示し、「明細書テキスト」欄(D)の文書の強調表示と、「スペクトルバー」欄(E)のスペクトル表示を行う。そして、ユーザは、強調表示された箇所を中心に文書の内容を確認し、選択した用語群ボックス210に対応づけられた分類の定義がその文献の内容に合致すると判断される場合には、分類付与手段15により分類を付与する。なお、分類付与手段15による分類の付与方法は、ユーザが分類記号入力欄に分類記号をマニュアル入力するようにしてもよいし、分類記号のリストの中から該当する分類記号をユーザが選択するようにしてもよい。また、用語スペクトル表示手段12により表示される各用語群ボックス210への操作(例えば、マウスによる右クリック)により、それに対応づけられた分類を選択して付与できるようにしてもよい。分類付与手段15は、ユーザにより付与された分類記号を取得すると、表示中文書と関連付けて、例えば、文書データベース40に格納する。 In the second embodiment, as shown in FIG. 1, a classification giving means 15 for giving a classification to a document displayed by the document displaying means 11 is further provided. The user refers to each term group box 210 displayed by the term spectrum display means 12, and particularly selects the term group box 210 which has many spectrum bars and is determined to be highly relevant to the contents of the document. Then, the term list 211 in the term group box 210 is displayed in the "term panel" column (B), the document is highlighted in the "specification text" column (D), and the "spectrum bar" column (E) is displayed. Display the spectrum. Then, the user checks the content of the document centering on the highlighted part, and if it is determined that the definition of the classification associated with the selected term group box 210 matches the content of the document, the classification is performed. Classification is given by the giving means 15. In the method of assigning a classification by the classification assigning means 15, the user may manually input the classification symbol in the classification symbol input field, or the user selects the corresponding classification symbol from the list of classification symbols. You may do it. Further, the classification associated with the term group box 210 may be selected and assigned by operating the term group box 210 displayed by the term spectrum display means 12 (for example, right-clicking with a mouse). When the classification assigning means 15 acquires the classification symbol assigned by the user, it associates it with the displayed document and stores it in, for example, the document database 40.

ところで、Fタームの分類を特許文献に付与するような分類付与業務においては、複数のユーザ(分類付与者)が、用語群データベース50に格納された用語群を参照したり、編集(登録、変更、削除等)したりすることが多い。このような環境において、分類付与支援システムは、用語群データベース50に格納された用語群を複数のユーザで共有し、用語の編集を可能とする構成を備えてもよい。 By the way, in the classification granting business such as granting the classification of F-term to the patent document, a plurality of users (classification grantors) can refer to or edit (register, change) the term group stored in the term group database 50. , Deleted, etc.) In such an environment, the classification assignment support system may have a configuration in which the term group stored in the term group database 50 is shared by a plurality of users and the term can be edited.

一例として、文書処理装置10に、複数ユーザによる用語群データベース50へのアクセス要求の内容に応じて用語群へのアクセスを制御する手段(図示せず)を設けることにより、用語群の共有化を実現することができる。例えば、複数のユーザによる用語群データベース50中の所定の用語群に対するアクセス要求を検出した場合、用語群の参照要求であるとか、用語群の編集要求であっても編集対象の用語群が異なるなど、アクセス要求に競合が生じない場合には、複数ユーザによる用語群へのアクセス要求を許可する。一方、同一用語群に対する編集要求など、アクセス要求に競合が生じた場合には、先着順、アクセス権のレベルあるいは編集の優先度などに基づいて、1人のユーザからのアクセス要求を許可する。なお、競合が生じた場合、該当するユーザに対して編集内容が競合している旨の通知を行い、ユーザからの指示を待つように構成してもよい。 As an example, the document processing apparatus 10 is provided with a means (not shown) for controlling access to the term group according to the content of an access request to the term group database 50 by a plurality of users, thereby sharing the term group. It can be realized. For example, when an access request for a predetermined term group in the term group database 50 by a plurality of users is detected, the term group to be edited is different even if the term group is a reference request or the term group is edited. , Allow multiple users to request access to the term group if there is no conflict in the access request. On the other hand, when a conflict occurs in the access request such as an edit request for the same term group, the access request from one user is permitted based on the first-come-first-served basis, the access right level, the edit priority, and the like. In addition, when a conflict occurs, it may be configured to notify the corresponding user that the edited content is in conflict and wait for an instruction from the user.

このように、分類の付与を行う複数のユーザ間で用語群データベース50に格納された用語群を共有化する構成を採用することにより、用語群の内容を充実させることができる。 In this way, the content of the term group can be enhanced by adopting a configuration in which the term group stored in the term group database 50 is shared among a plurality of users who assign the classification.

第2実施形態の分類付与支援システムによれば、文書処理装置10で扱う複数の用語群を複数の分類に対応づけられたものとすることで、文書全体の内容把握と分類付与根拠箇所の発見を迅速に行うことが可能となり、当該文書処理装置10を用いて高品質な分類付与を支援する分類付与支援システムを提供することができる。 According to the classification granting support system of the second embodiment, by assuming that a plurality of term groups handled by the document processing apparatus 10 are associated with a plurality of classifications, the contents of the entire document can be grasped and the classification granting grounds can be found. It becomes possible to quickly perform the classification, and it is possible to provide a classification assignment support system that supports high-quality classification assignment using the document processing apparatus 10.

<第3実施形態>
第3実施形態における文書処理装置10または分類付与支援システムについて説明する。第1実施形態の例では、用語群作成手段14が、既に分類が付与された複数の正例文献及び負例文献に基づいて、各分類の意味に対応する種用語を抽出して用語群を作成したが、第3実施形態では、用語群作成手段14が、抽出された用語の類似関係を自動的に分析することにより各分類に対応づけられた文意式を生成することで、分類ごとの用語群を作成する。
<Third Embodiment>
The document processing apparatus 10 or the classification assignment support system according to the third embodiment will be described. In the example of the first embodiment, the term group creating means 14 extracts a term group corresponding to the meaning of each classification based on a plurality of positive and negative example documents to which classification has already been given, and obtains a term group. Although it was created, in the third embodiment, the term group creating means 14 automatically analyzes the similarity relationship of the extracted terms to generate a literary expression associated with each classification, so that each classification can be created. Create a group of terms.

ここで、文意式とは、単独の用語又は共起関係を示す複数の用語の組み合わせ(タプル)をブール代数式で記述したものである。たとえば、「位置」、「GPS」、「測定」という3つの用語が句、文章、段落内において同時に出現するケースが多い場合、すなわち、「位置」、「GPS」、「測定」が共起関係を有する場合、文意式は以下のように設定される。
・句内で共起関係を有する場合の文意式(句タプル):<位置,GPS,測定>
・文章内で共起関係を有する場合の文意式(文タプル):{位置,GPS,測定}
・段落内で共起関係を有する場合の文意式(段落タプル):[位置,GPS,測定]
Here, the sentence meaning expression is a single term or a combination (tuple) of a plurality of terms indicating a co-occurrence relationship described by a Boolean algebraic expression. For example, when the three terms "position", "GPS", and "measurement" often appear at the same time in a phrase, sentence, or paragraph, that is, "position", "GPS", and "measurement" are co-occurrence relationships. If, the sentence expression is set as follows.
・ Sentence expression (phrase tuple) when there is a co-occurrence relationship in the phrase: <position, GPS, measurement>
・ Sentence expression (sentence tuple) when there is a co-occurrence relationship in the sentence: {position, GPS, measurement}
-Sentence expression (paragraph tuple) when there is a co-occurrence relationship in a paragraph: [Position, GPS, measurement]

このような文意式を構成する用語を用語群として用いて文書と対比する場合、句、文章あるいは段落の各範囲内にこれらの用語の組み合わせが出現した場合に限って検索がヒットするように構成することにより、単独の用語により検索した場合に比べて分類付与精度が格段に向上する。 When the terms that make up such a sentence expression are used as a group of terms and compared with a document, the search will be hit only when a combination of these terms appears within each range of a phrase, sentence, or paragraph. By constructing the classification, the accuracy of classification is significantly improved as compared with the case of searching by a single term.

なお、文意式としては、上に挙げた句タプル、文タプル及び段落タプルの他に、近傍式(複数の用語と、用語間の最大文字数及び用語の順序によって記述される式)を用いることも考えられる。 In addition to the phrase tuples, sentence tuples, and paragraph tuples listed above, neighborhood expressions (expressions described by multiple terms, the maximum number of characters between terms, and the order of terms) should be used as the sentence meaning expression. Is also possible.

次に、第3実施形態の文書処理装置10または分類付与支援システムの用語群作成手順について説明する。この用語群作成手順は、用語群作成手段14により実行され、正例文献集合と負例文献集合から種用語を抽出するステップと、その後さらに共起用語を抽出し、文意式を生成するステップとからなる。このうち、正例文献集合と負例文献集合から種用語を抽出するステップについては、第1実施形態において図5及び図6を用いて説明したとおりである。 Next, a procedure for creating a term group of the document processing device 10 or the classification assignment support system of the third embodiment will be described. This term group creation procedure is executed by the term group creation means 14, and a step of extracting a seed term from a set of positive examples and a set of negative examples, and then a step of further extracting co-occurrence terms to generate a sentence expression. It consists of. Of these, the steps for extracting seed terms from the positive example document set and the negative example document set are as described with reference to FIGS. 5 and 6 in the first embodiment.

図8は、共起用語及び文意式(2語タプル)の生成ステップの一例を示す図である。共起用語とは、種用語と同じ句、文章あるいは段落中に出現する頻度が高い用語である。 FIG. 8 is a diagram showing an example of a step of generating a co-occurrence term and a sentence meaning expression (two-word tuple). Co-occurrence terms are terms that frequently appear in the same phrases, sentences, or paragraphs as seed terms.

分類AA01の段落タプルを生成する場合、AA01の正例文献の用語群から、種用語群とその他の用語群を抽出する。まず、種用語群から一つの種用語を選択し、種用語1とする。その他の用語群のうち、種用語1と同じ段落に出現する用語を共起用語として抽出する。種用語1と同じ段落に出現する共起用語により、[種用語1、共起用語1]、[種用語1、共起用語2]・・・[種用語1、共起用語n]といった2語タプルを作成する。次いで、種用語2、種用語3などの種用語群に含まれる種用語について、同様に、共起用語を組み合わせた2語タプルを作成する。 When generating a paragraph tuple of classification AA01, a species term group and other term groups are extracted from the term group of the regular document of AA01. First, one seed term is selected from the seed term group and is designated as seed term 1. Among other term groups, terms appearing in the same paragraph as species term 1 are extracted as co-occurrence terms. 2 such as [species term 1, co-occurrence term 1], [species term 1, co-occurrence term 2] ... [species term 1, co-occurrence term n], depending on the co-occurrence terms that appear in the same paragraph as species term 1. Create a word taple. Next, for the seed terms included in the seed term group such as seed term 2 and seed term 3, a two-word tuple in which co-occurrence terms are combined is similarly created.

次に、2語タプル群に含まれる2語タプルの有効性を評価し、最終的に、AA01の意味内容を代表するような精度の高い2語タプルを選抜する。2語タプルの精度評価には、正例文献群と負例文献群を利用する。正例文献集合中で種用語1と共起用語i(i=1~n)の2語タプルが出現する段落数あるいは出現頻度と、負例文献集合中で種用語1と共起用語i(i=1~n)の2語タプルが出現する段落数あるいは出現頻度を比較する。 Next, the effectiveness of the two-word tuple included in the two-word tuple group is evaluated, and finally, a highly accurate two-word tuple that represents the meaning and content of AA01 is selected. For the accuracy evaluation of the two-word tuple, the positive example literature group and the negative example literature group are used. The number of paragraphs or frequency of occurrence of the two-word tapple of the seed term 1 and the co-occurrence term i (i = 1 to n) in the positive example literature set, and the seed term 1 and the co-occurrence term i (in the negative example literature set). Compare the number of paragraphs or the frequency of appearance of the two-word taples of i = 1 to n).

出現する段落数を比較する場合、例えば、ある2語タプルが正例文献のみで出現し、負例文献には出現しないような場合には、精度は100%となる。また、2語タプルの出現頻度は、例えば、種用語1と共起用語i(i=1~n)の2語タプルが出現する段落数をAA01の正例文献に含まれるすべての段落数で割った値により算出してもよい。なお、2語タプルの評価にあたり、ユーザによる指示入力を受け付けて評価結果を追加、訂正できるようにしてもよい。 When comparing the number of paragraphs that appear, for example, if a certain two-word tuple appears only in the positive example document and does not appear in the negative example document, the accuracy is 100%. The frequency of appearance of the two-word taple is, for example, the number of paragraphs in which the two-word taple of the seed term 1 and the co-occurrence term i (i = 1 to n) appears in all the paragraphs included in the regular document of AA01. It may be calculated by dividing the value. In the evaluation of the two-word tuple, the evaluation result may be added or corrected by accepting the instruction input by the user.

このように選抜した2語タプルに、さらに同じ段落に出現する共起用語を追加し、3語段落タプルを作成することもできる。3語段落タプルを使用することにより、2語タプルよりも精度の優れた分類付与が可能となる。同様に、4語段落タプル、5語段落タプルなどを作成してもよい。 It is also possible to create a three-word paragraph tuple by adding co-occurrence terms that appear in the same paragraph to the two-word tuple selected in this way. By using a three-word paragraph tuple, it is possible to assign a classification with higher accuracy than a two-word tuple. Similarly, a 4-word paragraph tuple, a 5-word paragraph tuple, and the like may be created.

用語群作成手段14は、分類ごとに、種用語と共起用語の組み合わせを生成し、このように作成された2語タプル、3語タプルなどを構成する用語を、用語群データベース50に格納される用語群の用語として登録することができる。なお、種用語または共起用語の生成工程において、生成した用語の同義語をあわせて生成し、用語群の用語として登録するようにしてもよい。また、このように生成された用語群を、用語群表示手段13によりマルチ用語パネル300に表示して、ユーザが編集するようにしてもよい。 The term group creating means 14 generates a combination of a species term and a co-occurrence term for each classification, and stores the terms constituting the two-word taple and the three-word taple thus created in the term group database 50. Can be registered as a term in a group of terms. In addition, in the process of generating a seed term or a co-occurrence term, synonyms of the generated term may be generated together and registered as a term of a term group. Further, the term group generated in this way may be displayed on the multi-term panel 300 by the term group display means 13 and edited by the user.

このように、文意式を用語群として用い、文書表示手段11により文書を表示する場合に、句、文章あるいは段落の各範囲内にこれらの文意式の用語の組み合わせが出現した場合に限って用語の強調表示を行うように構成することにより、文書と用語群との関連性をより精度よく把握することができる。なお、第3実施形態では、用語群として分類に対応づけられた文意式を例にとって説明したが、分類以外の何らかの意味に対応づけられた文意式についても、本発明を適用することができる。 In this way, when the text expression is used as a term group and the document is displayed by the document display means 11, only when a combination of these terms of the sentence expression appears within each range of a phrase, a sentence, or a paragraph. By configuring the term to be highlighted, the relationship between the document and the term group can be grasped more accurately. In the third embodiment, the sentence meaning expression associated with the classification as a term group has been described as an example, but the present invention may be applied to the sentence meaning expression associated with some meaning other than the classification. can.

<第4実施形態>
第4実施形態における文書処理装置10について説明する。第1実施形態における文書処理装置10は、各用語群に対応する用語群ボックス210を複数備えたマルチスペクトル画面200を表示するものであったが、第4実施形態における文書処理装置10では、用語スペクトル表示手段12は、マルチスペクトル画面200を表示する機能に代えて、若しくは加えて、1つの文書に対応する文書ボックス410を複数備えた文書マルチスペクトル画面400を表示する機能を有する。
<Fourth Embodiment>
The document processing apparatus 10 according to the fourth embodiment will be described. The document processing apparatus 10 in the first embodiment displays a multi-spectral screen 200 including a plurality of term group boxes 210 corresponding to each term group, whereas the document processing apparatus 10 in the fourth embodiment displays terms. The spectrum display means 12 has a function of displaying a document multispectral screen 400 including a plurality of document boxes 410 corresponding to one document in place of or in addition to the function of displaying the multispectral screen 200.

図9は、第4実施形態の文書処理装置10により表示された文書マルチスペクトル画面400の一例を示す図である。 FIG. 9 is a diagram showing an example of a document multispectral screen 400 displayed by the document processing apparatus 10 of the fourth embodiment.

文書マルチスペクトル画面400内には、「文献番号一覧」欄(A)に表示される文献No.1~No.Xのそれぞれに対応し、文書ボックス410が左上から順に複数配置されており、各文書ボックス410内には、文献番号とともに用語スペクトルバー列411が表示される。この用語スペクトルバー列411は、「用語パネル」欄(B)で設定される用語及び色情報に基づいて、対応する文献内の用語の位置を指示するスペクトルバーを一覧表示するものである。なお、文書ボックス410ごとに表示/非表示モードの設定を可能にし、例えば文献内の用語の出現頻度に基づく判定によって、設定された用語との関連性の低い文献の文書ボックス410を非表示にしてもよい。 In the document multispectral screen 400, the document No. displayed in the "reference number list" column (A). 1 to No. A plurality of document boxes 410 are arranged in order from the upper left corresponding to each of X, and a term spectrum bar column 411 is displayed in each document box 410 together with a document number. The term spectrum bar column 411 displays a list of spectrum bars indicating the positions of terms in the corresponding document based on the term and color information set in the "term panel" column (B). The display / non-display mode can be set for each document box 410. For example, the document box 410 of a document having a low relevance to the set term is hidden by a judgment based on the frequency of appearance of the term in the document. You may.

ユーザは、文書マルチスペクトル画面400を俯瞰したとき、文書ボックス410中の特定の文献の内容をテキスト表示させたい場合がある。そこで、文書処理装置10は、文書マルチスペクトル画面400に対する所定のユーザ操作を検出すると、対応する文献を簡便に表示する機能を提供する。 When the user has a bird's-eye view of the document multispectral screen 400, the user may want to display the contents of a specific document in the document box 410 as text. Therefore, the document processing apparatus 10 provides a function of simply displaying the corresponding document when a predetermined user operation on the document multispectral screen 400 is detected.

例えば、文書表示手段11は、ユーザがマウス操作により、文書マルチスペクトル画面400中の1つの文書ボックス410をクリックしたことを検出すると、クリックされた文書ボックス410が強調表示される。図9では、一例として、文献番号15に対応する文書ボックス410を破線枠で強調表示している。そして、「明細書テキスト」欄(D)中の明細書テキストを選択された文書ボックス410に対応する文献に置き換えて、検索キーワードに対応する文献内の用語を強調表示する。このときに、「明細書テキスト」欄(D)が置き換わることで、「スペクトルバー」欄(E)の表示も変更されるため、ユーザは、スペクトルバーを見ながら明細書テキストをスクロールすることができる。また、ユーザが、文書ボックス410の中のスペクトルバーの1つをクリックした場合には、上の動作に加え、「スペクトルバー」欄(E)のスペクトルバーをクリックした場合と同様に、「明細書テキスト」欄(D)の表示内容を対応する位置までジャンプさせる。 For example, when the document display means 11 detects that the user has clicked one document box 410 in the document multispectral screen 400 by operating the mouse, the clicked document box 410 is highlighted. In FIG. 9, as an example, the document box 410 corresponding to the document number 15 is highlighted with a broken line frame. Then, the specification text in the "specification text" column (D) is replaced with the document corresponding to the selected document box 410, and the term in the document corresponding to the search keyword is highlighted. At this time, by replacing the "specification text" column (D), the display of the "spectrum bar" column (E) is also changed, so that the user can scroll the specification text while looking at the spectrum bar. can. Further, when the user clicks one of the spectrum bars in the document box 410, in addition to the above operation, the "details" are the same as when the user clicks the spectrum bar in the "spectrum bar" column (E). Jump the display content in the "book text" column (D) to the corresponding position.

なお、図9では、「用語パネル」欄(B)で設定される用語群に基づいてスペクトル表示を行う例を示したが、スペクトル表示を行うための用語群を予め複数用意しておき、用意した用語群を選択的に切り替えてスペクトル表示を行うようにしてもよい。例えば、第1実施形態で示したように、Fタームなどの分類に対応づけられた複数の用語群を予め用意しておき、これらのうちの1つを選択することで「用語パネル」欄(B)に用語群を設定し、スペクトル表示を行うようにしてもよい。この場合、文書マルチスペクトル画面400と、用語群のマルチスペクトル画面200を切り替えて表示できるようにし、用語群の選択の際には、用語群のマルチスペクトル画面200を表示させるようにすればよい。また、マルチスペクトル画面の2次元配列の縦軸方向に複数の文献を、横軸方向に複数の用語群をそれぞれ並べ、複数の文献ごと、及び複数の用語群ごとのスペクトル表示を同時に行えるようにしてもよい。 In addition, although FIG. 9 shows an example of performing spectrum display based on the term group set in the “term panel” column (B), a plurality of term groups for performing spectrum display are prepared in advance and prepared. The term group may be selectively switched to display the spectrum. For example, as shown in the first embodiment, a plurality of term groups associated with classifications such as F-terms are prepared in advance, and by selecting one of these, a "term panel" column ("term panel" column ( A term group may be set in B) to display a spectrum. In this case, the document multispectral screen 400 and the term group multispectral screen 200 may be switched and displayed, and the term group multispectral screen 200 may be displayed when the term group is selected. In addition, a plurality of documents are arranged in the vertical axis direction and a plurality of term groups are arranged in the horizontal axis direction of the two-dimensional arrangement of the multi-spectral screen so that the spectra can be displayed simultaneously for each of the plurality of documents and for each of the plurality of term groups. May be.

以上のように、複数の文書のそれぞれに対応させて用語スペクトルバー列411をそれぞれ表示し、「用語パネル」欄(B)で設定される用語がいずれかの文書内でヒットすると、対応する用語スペクトルバー列411を色付けして表示するように構成したことから、文書マルチスペクトル画面400を俯瞰しながら、設定された用語との関連性が深い文献を容易に探すことができる。また、文書マルチスペクトル画面400に対して所定の操作を行うことにより、該当する文献のテキストを表示させることができるため、複数の文献の用語スペクトルバー列411を俯瞰した後、特定の文献の具体的な記載内容を分析したいような場合でも、簡単な操作により、該当する文献を表示させることができる。 As described above, when the term spectrum bar column 411 is displayed corresponding to each of a plurality of documents and the term set in the "term panel" column (B) is hit in any of the documents, the corresponding term is displayed. Since the spectrum bar column 411 is configured to be colored and displayed, it is possible to easily search for a document closely related to the set term while looking down at the document multispectral screen 400. Further, since the text of the corresponding document can be displayed by performing a predetermined operation on the document multi-spectral screen 400, after a bird's-eye view of the term spectrum bar column 411 of a plurality of documents, the specific document is specified. Even if you want to analyze the contents of a specific description, you can display the relevant document with a simple operation.

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 It should be noted that the present invention is not limited to the above embodiment as it is, and at the implementation stage, the components can be modified and embodied within a range that does not deviate from the gist thereof. In addition, various inventions can be formed by an appropriate combination of the plurality of components disclosed in the above-described embodiment. For example, some components may be removed from all the components shown in the embodiments. In addition, components across different embodiments may be combined as appropriate.

10…文書処理装置、11…文書表示手段、12…用語スペクトル表示手段、13…用語群表示手段、14…用語群作成手段、15…分類付与手段、20…入力装置、30…表示装置、40…文書データベース、50…用語群データベース、100…文書表示画面、200…マルチスペクトル画面、210…用語群ボックス、211…用語リスト、212…用語スペクトルバー列、300…マルチ用語パネル、400…文書マルチスペクトル画面、410…文書ボックス、411…用語スペクトルバー列。 10 ... document processing device, 11 ... document display means, 12 ... term spectrum display means, 13 ... term group display means, 14 ... term group creation means, 15 ... classification assigning means, 20 ... input device, 30 ... display device, 40. ... document database, 50 ... term group database, 100 ... document display screen, 200 ... multi-spectral screen, 210 ... term group box, 211 ... term list, 212 ... term spectrum bar string, 300 ... multi term panel, 400 ... document multi Spectrum screen, 410 ... Document box, 411 ... Term spectrum bar sequence.

Claims (6)

複数の文書を選択的に表示する文書表示手段と、
1又は複数の用語からなる用語群を複数含む用語群データセットに基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語群の用語が前記文書に含まれる場合に、当該用語に設定された色のスペクトルバーで当該用語の前記文書内位置を指示する用語スペクトルバー列を配置した用語群ボックスを、複数の用語群毎に並べて表示する、用語スペクトル表示手段と、を備え、
ユーザが特定の用語群ボックスを選択した場合には、前記文書表示手段は、前記選択された用語群ボックスの用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されている、
文書処理装置。
Document display means for selectively displaying multiple documents, and
It is a term spectrum display means for displaying a spectrum based on a term group data set including a plurality of term groups consisting of one or a plurality of terms, and is set to the term when the term of the term group is included in the document. A term spectrum display means for displaying a term group box in which a term spectrum bar string indicating the position of the term in the document by a color spectrum bar is arranged side by side for each of a plurality of term groups is provided.
When the user selects a specific term group box, the document display means uses the term in the document corresponding to the spectrum bar included in the term spectrum bar column of the selected term group box as the term. It is configured to be highlighted in the set color,
Document processing device.
前記用語群に含まれる用語を、各用語の色の設定とともに、複数の用語群ごとに表示し、用語の追加、削除、編集及び色の設定を可能とする用語群表示手段をさらに備える、
請求項1に記載の文書処理装置。
The terms included in the term group are displayed for each of a plurality of term groups together with the color setting of each term, and the term group display means capable of adding, deleting, editing, and setting the color is further provided.
The document processing apparatus according to claim 1.
前記用語群に含まれる用語は、種用語と共起用語からなる文意式を構成するものであり、
前記用語スペクトル表示手段は、前記用語群ボックスの前記用語スペクトルバー列において、前記文意式に対応する種用語と共起用語の組み合わせが存在する前記文書内位置に限ってスペクトルバーを表示する、
請求項1又は2に記載の文書処理装置。
The terms included in the term group constitute a literary expression consisting of seed terms and co-occurrence terms.
The term spectrum display means displays a spectrum bar only at a position in the document where a combination of a species term and a co-occurrence term corresponding to the meaning expression exists in the term spectrum bar column of the term group box.
The document processing apparatus according to claim 1 or 2.
請求項1ないし3のいずれか一項に記載された文書処理装置と、
前記文書に分類を付与する分類付与手段と、
を備え、
前記複数の用語群は、複数の分類に対応づけられている、
分類付与支援システム。
The document processing apparatus according to any one of claims 1 to 3.
Classification assigning means for assigning classification to the document and
Equipped with
The plurality of term groups are associated with a plurality of classifications.
Classification grant support system.
既に分類記号が付与された複数の正例及び負例の文書に基づいて、各分類の意味に対応する用語群を抽出する用語群作成手段をさらに備える、
請求項4に記載された分類付与支援システム。
Further provided with a term group creation means for extracting a term group corresponding to the meaning of each classification based on a plurality of positive and negative example documents already given a classification symbol.
The classification grant support system according to claim 4.
複数の文書を選択的に表示する文書表示手段と、
ユーザが設定した1又は複数の用語に基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語が前記文書に含まれる場合に、当該用語とともに設定された色のスペクトルバーで当該用語の前記文書内位置を指示する用語スペクトルバー列を配置した文書ボックスを、前記複数の文書毎に並べて表示する、用語スペクトル表示手段と、を備え、
ユーザが特定の文書ボックスを選択した場合には、前記文書表示手段は、前記選択された文書ボックスに対応する文書を表示し、用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されている、
文書処理装置。

Document display means for selectively displaying multiple documents, and
A term spectrum display means for displaying a spectrum based on one or more terms set by a user, and when the term is included in the document, the document of the term is a spectrum bar of a color set together with the term. It is provided with a term spectrum display means for displaying a document box in which a term spectrum bar string indicating an internal position is arranged side by side for each of the plurality of documents.
When the user selects a particular document box, the document display means displays the document corresponding to the selected document box and the term in the document corresponding to the spectrum bar contained in the term spectrum bar column. Is configured to be highlighted in the color set for the term,
Document processing device.

JP2020218505A 2020-12-28 2020-12-28 Document processing device and classification assignment support system Pending JP2022103710A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020218505A JP2022103710A (en) 2020-12-28 2020-12-28 Document processing device and classification assignment support system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020218505A JP2022103710A (en) 2020-12-28 2020-12-28 Document processing device and classification assignment support system

Publications (1)

Publication Number Publication Date
JP2022103710A true JP2022103710A (en) 2022-07-08

Family

ID=82284907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020218505A Pending JP2022103710A (en) 2020-12-28 2020-12-28 Document processing device and classification assignment support system

Country Status (1)

Country Link
JP (1) JP2022103710A (en)

Similar Documents

Publication Publication Date Title
US11714839B2 (en) Apparatus and method for automated and assisted patent claim mapping and expense planning
US7890533B2 (en) Method and system for information extraction and modeling
US7207004B1 (en) Correction of misspelled words
KR102345001B1 (en) Patent document creation apparatus, method, computer program, computer-readable recording medium, server and system
US8312067B2 (en) Method and computer program product for analyzing documents
JP6254629B2 (en) Scoring assistance system
US20050131931A1 (en) Abstract generation method and program product
US20130211819A1 (en) Displaying examples from texts in dictionaries
JP2009059140A (en) Electronic dictionary, retrieval method for electronic dictionary, and retrieval program for electronic dictionary
JP2022103710A (en) Document processing device and classification assignment support system
JP5269399B2 (en) Structured document retrieval apparatus, method and program
JP7110644B2 (en) Information display device, information display method and information display program
JPH08320881A (en) Document retrieval system
JP2008171164A (en) Classification support apparatus and method, and program
JP4713098B2 (en) Selection item display device, selection item display method, and selection item display program
Barlow MonoconcEsy: An Introduction to Concordancing
US20240095283A1 (en) Systems and methods for conceptual highlighting of document search results
JP6167591B2 (en) Word display control device, word display control method, and word display control program
JP6627679B2 (en) Kana-kanji conversion device and kana-kanji conversion program
Zilka et al. DISPLAYING INFORMATION RELATING TO SELECTED TEXT
JPH01185724A (en) Retriever
Yu et al. RadicalLocator: A software tool for identifying the radicals in Chinese characters
JP2016207036A (en) Support device, support method, and support program
JP2022023430A (en) Display device and program
JP2020123197A (en) Contract document check device, contract document check method, and program

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230113