JP2022103710A - Document processing device and classification assignment support system - Google Patents
Document processing device and classification assignment support system Download PDFInfo
- Publication number
- JP2022103710A JP2022103710A JP2020218505A JP2020218505A JP2022103710A JP 2022103710 A JP2022103710 A JP 2022103710A JP 2020218505 A JP2020218505 A JP 2020218505A JP 2020218505 A JP2020218505 A JP 2020218505A JP 2022103710 A JP2022103710 A JP 2022103710A
- Authority
- JP
- Japan
- Prior art keywords
- term
- document
- spectrum
- group
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、文書処理装置及び分類付与支援システムに関する。 The present invention relates to a document processing device and a classification grant support system.
コンピュータの画面上に複数の文書データを表示させ、これらの文書の内容を対比することは普通に行われている。このような文書の対比作業では、対比すべき複数の文書の内容のどこが一致しているかを目視で確認したり、ソフトウエアを利用して異なっている箇所を強調表示したりすることが行われている。 It is common practice to display multiple document data on a computer screen and compare the contents of these documents. In such document comparison work, it is possible to visually check where the contents of a plurality of documents to be compared match, and to highlight different parts using software. ing.
従来、文書データの閲覧性を高めるとともに、複数の文書データの対比のための把握作業時間を短縮するインターフェースを持つ文書管理システムが提案されている(特許文献1参照)。特許文献1の文書管理システムでは、表示装置に2つの特許文献を同時に表示させ、一方の特許文献の記述内容に類似する内容が記述された他方の特許文献の領域を表示装置上で強調表示させることにより、特許文献間の関連度を視覚的に把握できるようにしている。
Conventionally, a document management system having an interface for improving the readability of document data and shortening the grasping work time for comparing a plurality of document data has been proposed (see Patent Document 1). In the document management system of
また、複数の文書データを対比する業務の一例として、分類を付与する文書と分類が記載された文書を対比して分類付与を行う分類付与業務が知られており、このような分類付与業務を支援あるいは自動化する装置が提案されている(特許文献2、特許文献3参照)。特許文献2の分類付与支援装置では、分類を付与する文書とFタームのような分類が記載された文書を入力し、入力されたいずれか一方の文書の単語を抽出し、抽出した単語により他方の文書を検索し、他方の文書にその単語が存在していた場合には、両方の文書においてその単語を強調表示している。また、特許文献3の文献解析装置では、検索条件を、文献を意味表現として区切りがつく所定の範囲を単位として区切った各範囲で基本要素を含む文意式により記述した推定用辞書データを用い、この推定用辞書データと文献用語データとの類似度をスコアで表して、検索条件の満たし具合の程度を認識するようにしている。
Further, as an example of the work of comparing a plurality of document data, there is known a classification giving work in which a document to be classified and a document in which the classification is described are compared and given a classification, and such a classification giving work is performed. A device for assisting or automating has been proposed (see
分類を付与する文書と分類が記載された文書を対比して分類付与を行う場合、従来技術のように、文書同志の分割領域単位の対比あるいは特許文献とFターム表との全体としての対比だけではなく、各分類に対応づけられた複数の用語群が特許文献とどの程度関連しているのかを分かりやすく対比したいといったニーズが存在する。さらに、特許分類表と特許文献とを対比する場合、従来技術のように、両者を並べて表示するだけではなく、分類に対応づけられた用語群又は特許文献を、画面上に複数並べて表示して対比できるようなユーザインターフェースが求められている。 When the classification is given by comparing the document to which the classification is given and the document in which the classification is described, only the comparison between the divided area units of the documents or the comparison between the patent document and the F-term table as a whole is performed as in the prior art. Instead, there is a need to make an easy-to-understand comparison of how many terms associated with each classification are related to patent documents. Further, when comparing the patent classification table and the patent document, not only the two are displayed side by side as in the prior art, but also a plurality of term groups or patent documents associated with the classification are displayed side by side on the screen. There is a need for a user interface that can be compared.
また、コンピュータによる分類自動付与技術を用いて精度の高い分類付与を行おうとすると、特許分類と関連する技術用語とを対応付けた分類付与辞書を充実させることが必要になる。しかし、特許分類で定義された分類の中には、付与される特許文献数が少ない分類が多数を占めており、機械学習を利用しようとしても分類付与辞書の学習が困難なため、コンピュータによる分類自動付与だけでは、人並みの付与精度を実現できない状況にある。このため、高品質な特許分類付与を行うために、計算機による自動付与を補助的に利用しながら、最終的には、人手により特許文献に分類記号を付与することが必要となる。このように人手により分類記号の付与を行う場合、特許文献中において、特許分類表に定義された分類に関係する記載箇所(分類付与根拠箇所)を迅速に発見できるような支援システムが求められている。 In addition, in order to perform highly accurate classification assignment using computer-based automatic classification assignment technology, it is necessary to enhance the classification assignment dictionary that associates patent classification with related technical terms. However, among the classifications defined in the patent classification, most of the classifications have a small number of patent documents granted, and it is difficult to learn the classification grant dictionary even if machine learning is used, so classification by computer is used. It is in a situation where it is not possible to achieve the same level of accuracy as people with automatic granting alone. Therefore, in order to grant a high-quality patent classification, it is necessary to manually assign a classification symbol to the patent document while using the automatic grant by a computer as an auxiliary. When the classification symbol is manually assigned in this way, there is a need for a support system that can quickly find the description part (classification grant basis part) related to the classification defined in the patent classification table in the patent document. There is.
本発明は上記事情を鑑みて成されたものであって、複数の用語群あるいは複数の文書を表示画面上で一覧可能に表示し、これら用語群と文書との関連性を容易に把握できる文書処理装置を提供することを目的とする。さらに、本発明は、当該文書処理装置を用いて高品質な分類付与を支援する分類付与支援システムを提供することを更なる目的とする。 The present invention has been made in view of the above circumstances, and is a document in which a plurality of term groups or a plurality of documents can be displayed in a list on a display screen, and the relationship between these term groups and a document can be easily grasped. It is an object of the present invention to provide a processing apparatus. Furthermore, it is a further object of the present invention to provide a classification granting support system that supports high quality classification granting using the document processing apparatus.
本発明の第1態様の文書処理装置は、複数の文書を選択的に表示する文書表示手段と、1又は複数の用語からなる用語群を複数含む用語群データセットに基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語群の用語が前記文書に含まれる場合に、当該用語に設定された色のスペクトルバーで当該用語の前記文書内位置を指示する前記用語スペクトルバー列を配置した用語群ボックスを、複数の用語群毎に並べて表示する、用語スペクトル表示手段と、を備え、ユーザが特定の用語群ボックスを選択した場合には、前記文書表示手段は、前記選択された用語群ボックスの用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されていることを特徴とする。 The document processing apparatus of the first aspect of the present invention is a term spectrum that displays a spectrum based on a document display means for selectively displaying a plurality of documents and a term group data set including a plurality of term groups consisting of one or a plurality of terms. A term that is a display means and in which, when a term of the term group is included in the document, the term spectrum bar string indicating the position of the term in the document by a spectrum bar of the color set for the term is arranged. The term spectrum display means for displaying the group box side by side for each of a plurality of term groups is provided, and when the user selects a specific term group box, the document display means is the selected term group box. The term in the document corresponding to the spectrum bar included in the term spectrum bar column is configured to be highlighted in the color set for the term.
本発明の第2態様の分類付与支援システムは、第1態様の文書処理装置と、前記文書に分類を付与する分類付与手段と、を備え、前記複数の用語群は、複数の分類に対応づけられていることを特徴とする。 The classification granting support system of the second aspect of the present invention includes the document processing apparatus of the first aspect and the classification granting means for assigning a classification to the document, and the plurality of term groups correspond to a plurality of classifications. It is characterized by being.
本発明の第3態様の文書処理装置又は分類付与支援システムは、前記用語群に含まれる用語は、種用語と共起用語からなる文意式を構成するものであり、前記用語スペクトル表示手段は、前記用語群ボックスの前記用語スペクトルバー列において、前記文意式に対応する種用語と共起用語の組み合わせが存在する前記文書内位置に限ってスペクトルバーを表示することを特徴とする。 In the document processing apparatus or classification granting support system of the third aspect of the present invention, the terms included in the term group constitute a literary expression consisting of a seed term and a co-occurrence term, and the term spectrum display means is used. , The term spectrum bar column of the term group box is characterized in that the spectrum bar is displayed only at the position in the document where the combination of the species term and the co-occurrence term corresponding to the literary expression exists.
本発明の第4態様の文書処理装置は、複数の文書を選択的に表示する文書表示手段と、ユーザが設定した1又は複数の用語に基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語が前記文書に含まれる場合に、当該用語とともに設定された色のスペクトルバーで当該用語の前記文書内位置を指示する用語スペクトルバー列を配置した文書ボックスを、前記複数の文書毎に並べて表示する、用語スペクトル表示手段と、を備え、ユーザが特定の文書ボックスを選択した場合には、前記文書表示手段は、前記選択された文書ボックスに対応する文書を表示し、用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されていることを特徴とする。 The document processing apparatus according to the fourth aspect of the present invention is a document display means for selectively displaying a plurality of documents and a term spectrum display means for displaying a spectrum based on one or a plurality of terms set by a user. When a term is included in the document, a document box in which a term spectrum bar string indicating a position in the document of the term is arranged by a spectrum bar of a color set together with the term is displayed side by side for each of the plurality of documents. If the user selects a particular document box, the document display means displays the document corresponding to the selected document box and is included in the term spectrum bar column. It is characterized in that the term in the document corresponding to the spectrum bar is highlighted in the color set for the term.
本発明によれば、複数の用語群あるいは複数の文書を表示画面上で一覧可能に表示したことから、複数の用語群と文書との関連性を容易に把握できる文書処理装置を提供することができる。さらに、本発明によれば、複数の用語群を複数の分類に対応づけられたものとすることで、文書全体の内容把握と分類付与根拠箇所の発見を迅速に行うことが可能となり、当該文書処理装置を用いて高品質な分類付与を支援する分類付与支援システムを提供することができる。 According to the present invention, since a plurality of term groups or a plurality of documents are displayed in a listable manner on a display screen, it is possible to provide a document processing apparatus capable of easily grasping the relationship between a plurality of term groups and a document. can. Further, according to the present invention, by associating a plurality of term groups with a plurality of classifications, it is possible to quickly grasp the contents of the entire document and find the grounds for assigning the classification. It is possible to provide a classification assignment support system that supports high-quality classification assignment using a processing device.
以下、本発明の複数の実施形態について、図面を参照して詳細に説明する。なお、以下の説明において、既に説明済みである構成と同一又は類似した構成及び要素については、同一の符号を付して説明を省略する。 Hereinafter, a plurality of embodiments of the present invention will be described in detail with reference to the drawings. In the following description, the same or similar configurations and elements as those already described will be designated by the same reference numerals and description thereof will be omitted.
<第1実施形態>
第1実施形態の文書処理装置10の一例について、図面を参照して以下に説明する。
<First Embodiment>
An example of the
図1は、第1実施形態の文書処理装置10の一構成例を概略的に示すブロック図である。第1実施形態の文書処理装置10は、文書表示手段11、用語スペクトル表示手段12、用語群表示手段13及び用語群作成手段14を含んでおり、入力装置20、表示装置30、文書データベース40及び用語群データベース50に接続されている。なお、分類付与手段15は、後述する第2実施形態にて詳細に説明する。
FIG. 1 is a block diagram schematically showing a configuration example of the
文書処理装置10に含まれる文書表示手段11、用語スペクトル表示手段12、用語群表示手段13及び用語群作成手段14は、これら手段の機能を実現するプログラムを実行するプロセッサ、プログラムを格納したメモリあるいは外部記憶装置等により実現される。プロセッサは、典型的にはCPU(Central Processing Unit)及び/又はGPU(Graphics Processing Unit)であるが、マイコン、FPGA(Field Programmable Gate Array)、又はDSP(Digital Signal Processor)、などであってもよい。プログラムを格納したメモリは、プロセッサによって実行されるプログラム及び当該プロセッサによって使用されるデータなどを一時的に格納する。外部記憶装置は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)などの不揮発性記憶媒体を含み得る。
The document display means 11, term spectrum display means 12, term group display means 13, and term group creation means 14 included in the
入力装置20は、例えばユーザが操作することにより、文書処理装置10に対する種々の動作指令を入力するための装置であって、例えば、マウス、キーボード、タッチパネル、マイクなどの装置を含み得る。
The
表示装置30は、例えば文書処理装置10から出力される文書表示画面100、マルチスペクトル画面200及びマルチ用語パネル300をユーザに提示するための装置であって、例えば、液晶表示装置、有機EL表示装置などの平面表示装置が含まれる。
The
文書データベース40は、電子的形態の文書を複数格納するデータベースである。文書データベース40に格納された文書は、用語群と対比される文書である。
The
用語群データベース50は、用語群データセットを複数格納するデータベースである。1つの用語群データセットは、1又は複数の用語からなる用語群を複数含んでおり、各用語群はそれぞれ何らかの意味に対応づけられている。なお、文書データベース40あるいは用語群データベース50は、文書処理装置10に外付けされる外部記憶装置により構成されてもよいが、ネットワーク経由で接続されたファイルサーバにより構成されてもよい。
The
文書表示手段11は、文書表示画面100上に文書を表示する機能を有する。文書表示手段11は、ユーザから文書の文献番号を取得すると、文書データベース40にアクセスして、指示された文献番号に相当する文書を取得し、その文書の内容を文書表示画面100上に所定のレイアウトで表示する。
The document display means 11 has a function of displaying a document on the
また、文書表示手段11は、ユーザにより検索キーワードが入力されると、入力された検索キ-ワードが文書内に含まれるか否かを判定し、文書内に含まれる場合には、該当する用語を文書内で強調表示するとともに、この用語が出現する文書内位置を指示するスペクトルバーを表示する。 Further, the document display means 11 determines whether or not the input search keyword is included in the document when the search keyword is input by the user, and if it is included in the document, the corresponding term. Is highlighted in the document and a spectrum bar indicating the position in the document where this term appears is displayed.
用語スペクトル表示手段12は、用語群データベース50から1つの用語群データセットを取得し、これに基づきマルチスペクトル画面200を生成し、文書を表示している文書表示画面100上の一部に表示する機能を有する。マルチスペクトル画面200には、用語群データセットに含まれる複数の用語群ごとに用語群ボックス210が設けられ、各用語群ボックス210には、各用語群の用語リスト211と、当該用語群に含まれる用語の文書内位置をスペクトルバーで指示する用語スペクトルバー列212が表示される。
The term spectrum display means 12 acquires one term group data set from the
文書表示手段11は、マルチスペクトル画面200に対するユーザ操作に応答して、文書のうちの着目したいテキストを強調表示する機能も有している。例えば、文書表示手段11は、マルチスペクトル画面200に表示された用語群ボックス210に対する所定のユーザ操作を検出して、文書の該当する用語を所定の色で強調表示する。
The document display means 11 also has a function of highlighting the text of interest in the document in response to a user operation on the
用語群表示手段13は、マルチ用語パネル300を表示し、用語群を新たに作成したり、編集したりする機能を提供する。用語群表示手段13は、用語群に含まれる用語を、各用語の色の設定とともに、複数の用語群ごとに表示し、用語の追加、削除、編集及び色の設定を行う。また、用語群表示手段13は、用語群データベース50とのファイル入出力や用語スペクトル表示手段12へのエクスポート機能を有している。
The term group display means 13 displays the
用語群作成手段14は、用語群データセットを構成する用語群を新たに作成するために必要な用語を機械的に生成する。 The term group creating means 14 mechanically generates terms necessary for creating a new term group constituting the term group data set.
図2は、第1実施形態の文書処理装置10により表示された文書表示画面100の一例を示す図である。ここでは、文書表示手段11によって表示された文書表示画面100の一例を概略的に示している。
FIG. 2 is a diagram showing an example of a
図2に示された文書表示画面100には、文書の一例として、特許文献が表示されている。文書表示画面100は、「文献番号一覧」欄(A)、「用語パネル」欄(B)、「段落構成」欄(C)、「明細書テキスト」欄(D)、「スペクトルバー」欄(E)、「符号一覧」欄(F)、「図面」欄(G)を含んだレイアウトを有している。なお、このようなレイアウトに限ることなく、他のレイアウトを採用してもよい。
A patent document is displayed on the
「文献番号一覧」欄(A)は、ユーザにより入力された特許文献番号を表示する欄である。文書表示手段11は、ここに表示される文献番号がクリックなどにより選択されたことを検出すると、その文献番号を反転表示するとともに、その文献番号に対応する特許文献を文書データベース40より取得し、所定のレイアウトにて文書表示画面100に表示する。
The "reference number list" column (A) is a column for displaying the patent document number input by the user. When the document display means 11 detects that the document number displayed here is selected by clicking or the like, the document display means highlights the document number and acquires the patent document corresponding to the document number from the
「用語パネル」欄(B)は、表示中の特許文献を検索するための検索キーワードを色情報とともに表示する欄である。図2の例では、「衣、服・・・前掛け」が赤色の背景色で表示され、「手、首・・・すね」が灰色の背景色で表示され、「作業衣、水上・・・釣」が青色の背景色で表示されている。 The "term panel" column (B) is a column for displaying search keywords for searching the displayed patent document together with color information. In the example of FIG. 2, "clothes, clothes ... apron" is displayed with a red background color, "hands, neck ... shin" is displayed with a gray background color, and "work clothes, water ..." "Fishing" is displayed with a blue background color.
ユーザは、「用語パネル」欄(B)に表示された色付実行、色付解除、全用語クリア、全色クリアのコマンドボタン、及び、色1~色32の色テーブルを使用して、検索キ-ワード単位あるいは検索キ-ワード群に対して文字色や背景色などの色情報を設定することができる。設定すべき検索キ-ワードあるいは色情報は、ユーザがマニュアル入力してもよいが、後述するように、マルチ用語パネル300からインポートしてもよい。
The user searches using the color execution, uncoloring, clearing all terms, clearing all colors command buttons, and the color table of
「段落構成」欄(C)は、選択中の文書に含まれる段落見出し、段落記号等を表示する欄である。特許文献の場合、「段落構成」欄(C)には、[書誌的事項]、[要約]、[特許請求の範囲]、[発明の詳細な説明]などの大見出しと、[請求項]、[技術分野]、[背景技術]などの小見出しが表示される。 The "paragraph structure" column (C) is a column for displaying paragraph headings, paragraph marks, etc. included in the selected document. In the case of patent documents, in the "paragraph structure" column (C), major headings such as [biological matters], [summary], [claims], [detailed description of the invention], and [claims] , [Technical field], [Background technology], and other subheadings are displayed.
「明細書テキスト」欄(D)は、特許文献に記載された特許請求の範囲や明細書の内容をテキスト表示するための欄である。明細書テキストが「明細書テキスト」欄(D)に収まらない場合には、スクロール表示が行われる。表示中の明細書テキストには、「用語パネル」欄(B)に設定された検索キ-ワードに対応する用語が、設定された色情報で強調表示される。図2の例では、例えば、「衣」が赤色の背景色、「手」が灰色の背景色で表示されている。なお、「用語パネル」欄(B)に設定された検索キーワードから、同義語辞書を参照し、設定された検索キーワードの同義語も同じ検索キーワードとして強調表示するようにしてもよい。この場合、同義語辞書は、事前に文書処理装置10内に格納されているとする。
The "specification text" column (D) is a column for displaying the scope of claims and the contents of the specification described in the patent document as text. If the specification text does not fit in the "specification text" column (D), scroll display is performed. In the specification text being displayed, the term corresponding to the search keyword set in the "term panel" column (B) is highlighted with the set color information. In the example of FIG. 2, for example, "clothes" are displayed with a red background color, and "hands" are displayed with a gray background color. The synonym dictionary may be referred to from the search keyword set in the "term panel" column (B), and the synonym of the set search keyword may be highlighted as the same search keyword. In this case, it is assumed that the synonym dictionary is stored in the
「スペクトルバー」欄(E)は、検索キーワードに対応する用語の明細書テキスト内位置を指示するスペクトルバーを一覧表示する欄である。図2の例では、スペクトルバーの列が6本表示されており、例えば、1つ目のスペクトルバー列には、検索キーワード「衣、服・・・前掛け」に対応する用語が明細書テキスト内で出現した位置が赤色のバーで表示され、2つ目のスペクトルバー列には、検索キーワード「手、首・・・すね」に対応する用語の明細書テキスト内位置が灰色のバーで表示されている。 The “spectrum bar” column (E) is a column for displaying a list of spectrum bars indicating positions in the specification text of terms corresponding to the search keyword. In the example of FIG. 2, six columns of spectrum bars are displayed. For example, in the first spectrum bar column, the term corresponding to the search keyword "clothes, clothes ... apron" is contained in the specification text. The position that appears in is displayed as a red bar, and the position in the specification text of the term corresponding to the search keyword "hand, neck ... shin" is displayed as a gray bar in the second spectrum bar column. ing.
スペクトルバーは、対応する検索キーワードの背景色で表示されているが、複数の検索キーワードに同じ背景色が設定されている場合、これら複数の検索キーワードを一つのグループとして扱い、同じ色のスペクトルバー列として表示される。なお、文書内に出現しない検索キ-ワードのグループについては、スペクトルバー列を非表示としてもよい。 The spectrum bar is displayed with the background color of the corresponding search keyword, but if the same background color is set for multiple search keywords, these multiple search keywords are treated as one group and the spectrum bar of the same color is displayed. Displayed as a column. The spectrum bar column may be hidden for a group of search keywords that do not appear in the document.
ユーザは、スペクトルバーを見ながら明細書テキストをスクロールすることにより、検索キ-ワードが存在している明細書テキスト中の位置まで容易に表示内容を移動させることができる。また、スペクトルバーのうちの1つをクリックすることにより、明細書テキストの対応する位置まで表示内容をジャンプさせることができる。 By scrolling the specification text while looking at the spectrum bar, the user can easily move the display content to the position in the specification text where the search keyword exists. Also, by clicking on one of the spectrum bars, the display content can be jumped to the corresponding position in the specification text.
「符号一覧」欄(F)は、図に付された参照符号とその説明を表示する欄である。また、「図」欄(G)は、特許文献に含まれている図面を縮小して配列し、表示する欄である。 The "code list" column (F) is a column for displaying the reference reference numerals attached to the figures and their explanations. Further, the “figure” column (G) is a column for reducing, arranging, and displaying the drawings included in the patent document.
図3は、第1実施形態の文書処理装置10により表示されたマルチスペクトル画面200の一例を示す図である。
FIG. 3 is a diagram showing an example of a
用語スペクトル表示手段12は、ユーザによるマルチスペクトル画面200の表示指示を検出し、用語群データセットを特定する情報を受信すると、指示された用語群データセットを用語群データベース50から取得し、それに基づいてマルチスペクトル画面200を生成する。そして、生成したマルチスペクトル画面200を文書表示画面100上の一部に重畳表示する。マルチスペクトル画面200内には、用語群データセットの各用語群に対応する用語群ボックス210が複数設けられており、各用語群ボックス210内には、その用語群の名称(図3では、「AA00」、「AA10」など)とともに用語リスト211と用語スペクトルバー列212が予め設定された色情報にしたがって表示される。
When the term spectrum display means 12 detects the display instruction of the
1つの用語群データセットは、それぞれ何らかの意味に対応づけられる複数の用語群からなり、用語群に含まれる各用語には、その用語を表示するときの色情報が設定されている。色情報としては、文字色及び文字の背景色を設定することができ、さらにその用語がスペクトル表示された時のスペクトルバーの色の選択(文字色または文字背景色のいずれか)及び用語スペクトルバー列の背景色の選択(黒または白のいずれか)も可能である。なお、各用語には、色情報のほかに、フォント、サイズ、文字飾りなどの文字属性などが関連付けられてもよい。 One term group data set is composed of a plurality of term groups, each of which is associated with some meaning, and each term included in the term group is set with color information for displaying the term. As the color information, the text color and the background color of the text can be set, and the color selection (either the text color or the text background color) of the spectrum bar when the term is displayed in the spectrum and the term spectrum bar. You can also choose the background color of the column (either black or white). In addition to the color information, each term may be associated with character attributes such as font, size, and character decoration.
図3には、用語群データセットの一例として、Fタームのテーマ3B011(職業用、工業用又はスポーツ用保護衣)の各分類に対応づけられた複数の用語群が例示されている。用語スペクトル表示手段12は、ユーザから用語群データセットを特定する情報としてテーマ記号「3B011」を受信すると、用語群データベース50よりテーマ記号「3B011」に対応する用語群データセットを取得し、この用語群データセットに含まれる複数の分類に対応づけられた用語群ごとの用語群ボックス210を、マルチスペクトル画面200内に表示する。例えば、分類AA00に対応づけられた用語群ボックス210では、用語リスト211において、「衣、服・・・前掛け」の用語のグループが赤色の背景色で表示され、「手、首・・・すね」の用語のグループ(図示せず)が灰色の背景色で表示される。なお、用語群に含まれる用語の同義語を、自動的に同じ背景色の用語グループに含めるようにしてもよい。また、用語群に含まれる用語のうち、文書内に存在しない用語は、用語群リスト211において非表示としてもよい。
As an example of the term group data set, FIG. 3 illustrates a plurality of term groups associated with each classification of the F-term theme 3B011 (professional, industrial, or sports protective clothing). When the term spectrum display means 12 receives the theme symbol "3B011" as information for identifying the term group data set from the user, the term group data set corresponding to the theme symbol "3B011" is acquired from the
次に、用語スペクトル表示手段12は、各用語群ボックス210内に用語スペクトルバー列212を表示する。1つの用語群ボックス210内に複数の用語スペクトルバー列212を表示でき、1つの用語スペクトルバー列212は、用語リスト211中の同じ背景色の用語グループに対応している。用語スペクトルバー列212の長手方向の長さは、文書全体の長さに対応しており、用語スペクトルバー列212中の1つのスペクトルバーは、対応する用語の文書内位置を指示している。
Next, the term spectrum display means 12 displays the term
用語スペクトルバー列212の背景及びスペクトルバーの色は、色情報の設定に基づいて色付けされる。図3の例では、スペクトルバーの色として文字背景色が選択され、用語スペクトルバー列の背景色として黒が選択されているため、分類AA00に対応づけられた用語群ボックス210において、赤色の文字背景色を有する「衣、服・・・前掛け」に対応して、1列目の用語スペクトルが黒の背景色と赤色のスペクトルバーで表示され、灰色の文字背景色を有する「手、首・・・すね」に対応して、2列目の用語スペクトルが黒の背景色と灰色のスペクトルバーで表示されている。ある背景色の用語のグループが文書内に存在しない場合には、用語スペクトルバー列を黒色あるいは非表示としてもよい。
The background of the term
このように、用語群に対応させて用語リスト211と用語スペクトルバー列212を一体化して関連付け、用語リスト211に含まれる用語が文書内でヒットすると、対応する用語スペクトルバー列212を色付けして表示するように構成したことから、マルチスペクトル画面を俯瞰しながら、複数の用語群と文書との関連性を容易に把握することができる。
In this way, the
例えば、ユーザは、マルチスペクトル画面200にマトリックス配置された用語群ボックス210内の用語スペクトルバー列212を俯瞰し、図3のAA00のようにスペクトルバーが多く表示されている分類は、文書の内容との関連性が高いと判定することができる。また、AA10、AA14、AA15も関連性があることが分かる。一方、AA11~AA13、AB02~AB03のように、スペクトルバーが表示されていない分類については、文書の内容との関連性は低いと判定することができる。
For example, the user has a bird's-eye view of the term
ユーザは、用語スペクトル表示手段12が表示したマルチスペクトル画面200を俯瞰したとき、用語群ボックス210中の特定の用語や用語スペクトルが、文書内でどのように記載されているのかを表示させたい場合がある。そこで、文書処理装置10は、マルチスペクトル画面200に対する所定のユーザ操作を検出すると、文書内の対応する用語を簡便に表示する機能を提供する。
When the user wants to display how a specific term or term spectrum in the
例えば、文書表示手段11は、ユーザがマウス操作により、マルチスペクトル画面200中の1つの用語群ボックス210をクリックしたことを検出すると、クリックされた用語群ボックス210を強調表示する。図3では、一例として、クリックされた名称「AA00」の用語群ボックス210を破線枠で強調表示している。そして、「用語パネル」欄(B)中の検索キ-ワードを選択された用語群ボックス210に対応する用語リスト211に置き換えて、検索キーワードに対応する文書内の用語を強調表示する。このときに、「用語パネル」欄(B)が置き換わることで、「スペクトルバー」欄(E)には、選択された用語群ボックス210の名称「AA00」とスペクトルバー列212が表示されるため、ユーザは、「スペクトルバー」欄(E)を見ながら明細書テキストをスクロールすることができる。また、ユーザが、用語群ボックス210の中のスペクトルバーの1つをクリックした場合には、上の動作に加え、「スペクトルバー」欄(E)のスペクトルバーをクリックした場合と同様に、「明細書テキスト」欄(D)の表示内容を対応する位置までジャンプさせる。さらに、ユーザは、複数の用語群ボックス210を同時に選択することもできる。例えば、分類AA12と分類AA13が、上位概念と下位概念の関係にあるときに、両方の用語群ボックスを同時に選択し、対応する用語を強調表示することができる。
For example, when the document display means 11 detects that the user has clicked one
なお、ユーザがマウス操作により特定の用語群ボックス210をクリックしたことを検出することに代えて、特定の用語群ボックス210をドラッグして「用語パネル」欄(B)の上でドロップしたことを検出するようにしてもよい。また、用語群内に表示された用語リスト211内の特定の用語の選択、または特定の用語スペクトルバー列212の選択を検出し、対応する文書内の用語を強調表示するようにしてもよい。
Instead of detecting that the user clicked the specific
以上のように、ユーザは、マルチスペクトル画面200を表示させた後、マルチスペクトル画面200に対して所定の操作を行うことにより、文書の該当するテキストを表示させることができる。このため、何らかの意味に対応づけられた複数の用語群と文書との対比において、文書の具体的な記載内容を分析したいような場合でも、簡単な操作により、文書の該当箇所を表示させることができる。
As described above, the user can display the corresponding text of the document by performing a predetermined operation on the
なお、用語スペクトルバー列212は、用語群ボックス210内に収まるように表示されるが、用語群ボックス210あるいは用語スペクトルバー列212の視認性を高めるため、用語スペクトルバー列212を表示するモードと非表示にするモードを設けてもよい。このモードは、ユーザが任意に設定することもできる。また、文書内における用語の出現頻度に応じて自動的に設定してもよい。例えば、ある用語スペクトルバー列に対応する用語の出現頻度が所定の第1閾値以上の場合、あるいは、所定の第2閾値以下の場合には、その用語スペクトルバー列は文書の内容と関連する用語スペクトルバー列ではないと判定し、非表示モードに設定してもよい。
The term
用語スペクトルバー列212の色付けのために、用語に設定された色情報を利用する例を説明したが、他の色付け方法を採用することもできる。一例として、文書内でヒットした用語の数を用語スペクトルバー列の色の濃淡に反映させてもよい。例えば、赤色の背景色を有する「衣、・・・前掛け」のグループについて用語スペクトルバー列を表示する場合、ヒットする用語数が少ない場合には薄い赤色、多い場合には濃い赤色のように、用語数に基づいて色の濃さを変化させることができる。
Although an example of using the color information set in the term for coloring the term
図3では、文書表示画面100上にマルチスペクトル画面200を重畳表示したものとして説明したが、このような表示態様に限ることなく、例えば、マルチスペクトル画面200を別ウインドウとして表示してもよい。また、ユーザの指示に応じて用語群ボックス210を縮小表示したり、マルチスペクトル画面200を縦方向あるいは横方向にスクロール表示するためのスクロールバーを表示したりしてもよい。
In FIG. 3, the
用語群ボックス210の表示については、用語群ボックス210ごとに表示/非表示モードの設定を可能にし、上で述べたような用語の出現頻度に基づく判定によって、意味を有しないような用語群ボックス210を非表示にしてもよい。
Regarding the display of the
また、用語群ボックス210に階層構造を持たせ、通常時には上位の階層の用語群ボックス210のみを表示させ、上位の階層の用語群ボックス210への操作(例えば、マウスによるダブルクリック)により、その下位の階層の用語群ボックス210を表示させるようにしてもよい。例えば、上位階層の分類AA00に対応づけられた用語群ボックスと、その下の階層の分類AA01~AA10に対応づけられた各用語群ボックスがある場合に、通常時は上位階層の分類AA00に対応づけられた用語群ボックスのみを、下位階層の用語及び用語スペクトルバー列も統合した形で表示させ、当該用語群ボックスへの操作によって、下位階層の用語群ボックスを展開して表示させるようにしてもよい。
Further, the
各用語群ボックス210には、用語群の名称とともに用語群に対応づけられた意味の説明をあわせて表示するようにしてもよい。例えば、用語群がFタームの分類に対応づけられている場合には、Fタームの表形式で用語群ボックスを配列させ、各用語群ボックスにおいて、分類の記号とともに分類の定義の説明を表示するようにしてもよい。また、各用語群ボックス210においては、用語リスト211を非表示としてもよい。
In each
図3では、ユーザが1つの用語群データセット(3B011)を特定し、この1つの用語群データセットに対応するマルチスペクトル画面200を表示する例を示したが、ユーザが複数の用語群データセットを特定し、複数の用語群データセットに対応するマルチスペクトル画面を表示するようにしてもよい。この場合、複数の用語群データセットに対応するマルチスペクトル画面200を並べて表示するようにしてもよいし、タブなどで切り替えて表示するようにしてもよい。
FIG. 3 shows an example in which a user identifies one term group data set (3B011) and displays a
図4は、第1実施形態の文書処理装置10のマルチ用語パネル300の一例を示す図である。マルチ用語パネル300は、用語群データセットに含まれる用語群ごとに、用語リストや色情報を配列したものである。
FIG. 4 is a diagram showing an example of the
用語群表示手段13は、ユーザによる「ファイル入力」コマンドに応答して、用語群データベース50から指定された用語群データセットを取得する。そして、用語群データセットから、用語群の名称、スペクトル背景色、スペクトルマーク、用語、用語の色情報を抽出してマルチ用語パネル300を生成し、表示装置30に表示する。
The term group display means 13 acquires a designated term group data set from the
図4には、一例として、パネル1からパネル8までのパネルが表示されている。各パネルは、パネル番号、用語群の名称、スペクトル背景色、スペクトルマーク、用語を含んでいる。また、マルチ用語パネル300に隣接して、色番号、文字色、文字背景色の組合せを表示した「用語と色パネル」欄が表示されている。また、マルチ用語パネル300上部には、「エクスポート」、「ファイル出力」、「ファイル入力」、「色一括設定」、「色全クリア」のコマンドボタンが設けられている。
In FIG. 4, the panels from the
図4のマルチ用語パネル300は、一例として、Fタームのテーマ3B011の分類に対応づけられた用語群を表示している。「スペクトル背景色」欄には、用語スペクトルバー列の背景色の設定が表示され、パネル1では黒色が選択されている。「スペクトルマーク」欄には、用語スペクトル中のスペクトルバーの色が指定されており、パネル1では、スペクトルバーが用語の文字背景色により表示されることが設定されている。
As an example, the
「用語」欄には、用語群の用語と、その用語の文字色及び文字背景色の組み合わせを示す色番号が設定されている。例えば、パネル1には、「衣、服・・・前掛け」が白の文字色及び赤の文字背景色、「手、首・・・すね」が黒の文字色及び灰色の文字背景色で表示されるように設定されている。
In the "term" column, a color number indicating a combination of a term of the term group and a character color and a character background color of the term is set. For example, on the
マルチ用語パネル300の用語群や各種色の設定は、ユーザが自由に編集可能である。マルチ用語パネル300を新規に作成する場合は、全ての項目をユーザがマニュアルにより入力してもよいが、「用語」欄に設定する用語群については、用語群作成手段14により、機械的に抽出されたものをユーザが編集して作成することができる。例えば、図4のように、各用語群がFタームの分類に対応づけられる場合、用語群作成手段14は、用語群の新規作成指示に対応し、指示されたFタームのテーマ記号に対応する既存のFターム表をメモリから取得し、各分類の定義説明の文言から用語を抽出して、その同義語や類義語とともにユーザに提示するようにしてもよい。ここで、既存のすべてのFターム表及び同義語・類義語の辞書は、事前に文書処理装置10内に格納されているとする。
The term group and various color settings of the
用語群作成手段14による用語群の抽出手法としては、その用語群でヒットする文献(正例文献)の集合とヒットしない文献(負例文献)の集合に基づき、用語群の種となる用語を機械的に抽出するようにしてもよい。 As a method for extracting a term group by the term group creating means 14, a term that is a seed of a term group is selected based on a set of documents that are hit by the term group (positive example documents) and a set of documents that are not hit (negative example documents). It may be extracted mechanically.
図5は、Fタームのあるテーマに対応づけられた特許文献集合から、分類ごとに正例文献集合と負例文献集合を作成するステップの一例を説明する図である。 FIG. 5 is a diagram illustrating an example of a step of creating a positive example document set and a negative example document set for each classification from a patent document set associated with a certain theme with an F-term.
正例文献集合と負例文献集合は、Fタームの分類ごとに作成される。例えば、AA01の分類について正例文献集合と負例文献集合を作成する場合、対象となっているテーマに対応づけられた全特許文献について付与されている分類記号を分析し、AA01が付与されている文献を正例文献の集合に含め、AA01が付与されていない文献を負例文献の集合に含める。 A set of positive and negative literature is created for each F-term classification. For example, when creating a positive example document set and a negative example document set for the classification of AA01, the classification symbols assigned to all the patent documents associated with the target theme are analyzed, and AA01 is assigned. The documents that are present are included in the set of positive examples, and the documents that are not given AA01 are included in the set of negative examples.
図6は、種用語の抽出ステップの一例を概略的に示している。 FIG. 6 schematically shows an example of a seed term extraction step.
正例文献集合と負例文献集合から、正例文献での出現率が負例文献での出現率よりも顕著に高い用語を生成する。例えば、AA01が付与された正例文献集合に含まれる各用語について、正例文献集合内での出現率、すなわち、その用語が出現する正例文献数を全正例文献数で割った値を算出する。同様に、AA01が付与されていない負例文献集合に含まれる各用語について、負例文献集合内での出現率、すなわち、その用語が出現する負例文献数を全負例文献数で割った値を算出する。 From the positive and negative bibliographic sets, we generate terms that have a significantly higher appearance rate in the positive bibliography than in the negative bibliography. For example, for each term included in the set of regular documents to which AA01 is given, the appearance rate in the set of regular documents, that is, the value obtained by dividing the number of regular documents in which the term appears by the total number of regular documents. calculate. Similarly, for each term included in the negative example literature set to which AA01 is not assigned, the appearance rate in the negative example document set, that is, the number of negative example documents in which the term appears is divided by the total number of negative example documents. Calculate the value.
そして、正例文献での出現率が、負例文献での出現率よりも顕著に高い用語を、用語群AA01の種用語として抽出する。抽出の基準となる出現率の閾値については、抽出する種用語の精度あるいは抽出すべき種用語数などに応じて設定することができる。また、種用語を抽出する際に、種用語の同義語や類義語をあわせて抽出するようにしてもよい。この場合、同義語・類義語の辞書は、事前に文書処理装置10内に格納されているとする。抽出された種用語は、そのまま用語群の用語として利用することもできるが、抽出された種用語を表示画面に表示し、ユーザからの入力に基づいて最終的に利用する用語を選択するようにしてもよい。なお、種用語の出現率の算出にあたり、どのような文献にも出現する一般的な用語あるいは出現数が統計的に意味をもたないほど少ない用語については、除外してもよい。
Then, a term whose appearance rate in the positive example document is significantly higher than that in the negative example document is extracted as a seed term of the term group AA01. The threshold value of the appearance rate, which is the reference for extraction, can be set according to the accuracy of the seed terms to be extracted, the number of seed terms to be extracted, and the like. Further, when extracting the seed term, synonyms and synonyms of the seed term may be extracted together. In this case, it is assumed that the synonym / synonym dictionary is stored in the
このように、用語群作成手段14を設けたことにより、既に分類が付与された複数の正例文献及び負例文献に基づいて、各分類の意味に対応づけられた用語群を抽出することができることから、各分類を特徴づける用語群を客観的かつ網羅的に設定することができる。 In this way, by providing the term group creating means 14, it is possible to extract a term group associated with the meaning of each classification based on a plurality of positive and negative examples already given classification. Since it is possible, it is possible to objectively and comprehensively set the term group that characterizes each classification.
用語群表示手段13により新規作成あるいは編集されたマルチ用語パネル300の内容は、「ファイル出力」の指示があった場合、用語群データセットに変換されて用語群データベース50に新規保存あるいは上書き保存される。また、「エクスポート」の指示があった場合、用語群データセットが用語スペクトル表示手段12にエクスポートされ、マルチスペクトル画面200に表示される。
The contents of the
以上のように、マルチ用語パネル300を使用することにより、ユーザは用語群の内容を随時編集、改良したり、あるいは、マルチ用語パネル300を新規作成したりできるため、用語群の内容を充実させることができる。
As described above, by using the
<動作>
次に、上述の第1実施形態の文書処理装置10の動作の一例について説明する。
図7は、第1実施形態の文書処理装置10の動作の一例を説明するためのフローチャートである。文書処理装置10が起動されると、図7のステップS1、S8、S10のメインルーチンを実行する。ステップS2,S3、S5~S7は文書表示手段11の機能に対応しており、ステップS4は用語スペクトル表示手段12の機能、ステップS9は用語群表示手段13の機能に対応している。本フローチャートにおいて略述されたステップは例示的であり、あるステップを除外、追加、又は修正する組み合わせを含む、ステップの任意の組み合わせで実施可能である。図7では、各ステップを逐次処理した場合を例示しているが、マルチプログラミング処理など並列プログラミングの手法を採用してもよい。
<Operation>
Next, an example of the operation of the
FIG. 7 is a flowchart for explaining an example of the operation of the
文書表示手段11は、文書表示画面100の表示指示を検出すると(ステップS1)、文書を文書表示画面100上に表示する(ステップS2)。文書表示画面100を新たに生成する場合には、ユーザから文書を特定する情報(例えば、特許文献の公開番号など)を取得し、文書データベース40より該当する文書を取得する。そして、取得した文書から段落構成、明細書テキスト、符号一覧、図を抽出して文書表示画面100上に表示する。文書表示手段11は、必要に応じて、文書表示画面100にスクロールバーを表示する。一方、文書表示画面100が既に生成されているが非アクティブになっている場合には、文書表示画面100をアクティブにする。
When the document display means 11 detects the display instruction on the document display screen 100 (step S1), the document display means 11 displays the document on the document display screen 100 (step S2). When the
検索キーワードが予め設定されている場合、または新たに入力された場合には、文書表示手段11は、検索キーワードを「用語パネル」欄(B)に表示する。そして、文書内に該当検索キーワードに対応する用語が存在する場合には、その用語の文字色あるいは背景色を変えることにより強調表示を行う。 When the search keyword is preset or newly input, the document display means 11 displays the search keyword in the "term panel" column (B). Then, when a term corresponding to the corresponding search keyword exists in the document, highlighting is performed by changing the character color or the background color of the term.
文書表示手段11は、「スペクトルバー」欄(E)に、検索キーワードに対応する用語が文書内のどの位置に出現しているかを示すスペクトルバーを当該検索キーワードの背景色と同じ色により表示する。 The document display means 11 displays in the “spectrum bar” column (E) a spectrum bar indicating at which position in the document the term corresponding to the search keyword appears in the same color as the background color of the search keyword. ..
図7において、ユーザによるマルチスペクトル画面200の表示指示を検出すると(ステップS3)、用語スペクトル表示手段12は、ユーザから用語群データセットを特定する情報(例えば、Fタームのテーマ記号)を取得し、用語群データベース50から該当する用語群データセット(例えば、Fタームの複数の分類に対応づけられた用語群)を取得する。そして、マルチスペクトル画面200上に複数の用語群ボックス210を配置し、各用語群ボックス210内に、用語群のそれぞれに関連付けられた用語リスト211と用語スペクトルバー列212を予め設定された色情報に基づいて表示する(ステップS4)。
In FIG. 7, when the display instruction of the
用語スペクトル表示手段12は、用語群ボックス210中に用語スペクトルバー列を表示するために、用語リスト211から一つの用語を選択し、当該用語が文書内に出現する位置を算出する。例えば、文書の最初の行から当該用語が出現する行までの行数を計算し、文書全体の行数で割ることにより、文書内の相対的な出現位置を算出し、その出現位置を一つのスペクトルバーとして用語スペクトルバー列中に表示する。このとき、スペクトルバーは、当該用語に設定された色情報に基づいて色付けされる。同様に、文書内で当該用語が出現するすべての位置を算出し、これら用語に対応した複数のスペクトルバーを含む用語スペクトルバー列212を用語に設定された色により表示する。
The term spectrum display means 12 selects one term from the
用語群に含まれる他の用語についても、同様に、それぞれの用語に対応する用語スペクトルバー列212を生成する。なお、スペクトルバーの表示を行った場合、スペクトルバーごとに、対応する用語とその用語の文書内位置を関連付けてメモリに記憶しておく。
Similarly, for other terms included in the term group, a term
図7において、文書表示画面100あるいはマルチスペクトル画面200へのユーザ操作を検出すると(ステップS5)、文書表示手段11は、文書表示画面100あるいはマルチスペクトル画面200に対するユーザ操作に応答して、文書の表示内容を制御する(ステップS6)。例えば、ある用語群ボックス210が選択されたことを検出した場合、選択された用語群ボックス210を強調表示するとともに、その用語群ボックス210内の用語リスト211を「用語パネル」欄(B)に表示し、「明細書テキスト」欄(D)の文書の強調表示と、「スペクトルバー」欄(E)のスペクトル表示を行う。
In FIG. 7, when a user operation on the
文書の表示内容の制御が終了すると、文書表示手段11は、文書表示画面100が選択中あるいは作業中であるか否か、すなわち、アクティブか否かを判定する(ステップS7)。文書表示画面100がアクティブの場合には、ステップS3~S6を繰り返し、文書表示画面100が閉じられたり、縮小されたりして非アクティブになった場合にはメインフローに戻る。
When the control of the display contents of the document is completed, the document display means 11 determines whether or not the
図7において、マルチ用語パネル300の表示指示が検出されると(ステップS8)、用語群表示手段13は、マルチ用語パネル300を表示する。マルチ用語パネル300を新たに生成する場合には、ユーザから表示対象となる用語群データセットを特定する情報及び新規/編集コマンドの入力を待機する。これらの情報が入力されると、用語群表示手段13は、マルチ用語パネル300を表示する。一方、マルチ用語パネル300が既に生成されているが非アクティブの場合には、アクティブにして表示する。そして、用語群の新規作成処理あるいは編集処理を実行する(ステップS9)。用語群表示手段13は、ユーザによる「エクスポート」コマンドを検出した場合、マルチ用語パネル300の内容を用語群データセットに変換し、文書表示手段11に対して「エクスポート」コマンドが指示された旨の通知とともに変換された用語群データセットをデータ引き渡し用メモリ(図示せず)に出力する。用語群表示手段13による処理が終了するか、あるいは、マルチ用語パネル300が非アクティブになると、処理フローはメインフローに戻る。
In FIG. 7, when the display instruction of the
図7において、文書処理装置10を終了するコマンドが入力されたかを検出し(ステップS10)、終了コマンドが入力されない場合には、ステップS1に戻る。一方、文書処理装置10の終了コマンドが入力されると、表示されている画面を閉じて、文書処理装置10の一連の処理を終了する。
In FIG. 7, it is detected whether a command for terminating the
以上、第1実施形態によれば、用語群データセットを構成する何らかの意味に対応づけられた複数の用語群と文書との関連性を容易に把握できるような文書処理装置を提供することができる。なお、第1実施形態では、複数の用語群としてFタームの分類に対応づけられた用語群を例にとって説明したが、Fタームの分類以外の何らかの意味に対応づけられた複数の用語群についても、本発明を適用することができる。例えば、分類に関する統計基準として用いられる日本標準産業分類、日本標準職業分類、疾病、傷害及び死因分類のほか、日本標準商品分類などは、いずれも大分類、中分類、小分類及びこれらの分類を説明する項目を有しており、何らかの意味に対応づけられた複数の用語群を有する文書ということができる。 As described above, according to the first embodiment, it is possible to provide a document processing device that can easily grasp the relationship between a document and a plurality of term groups associated with some meanings constituting the term group data set. .. In the first embodiment, a term group associated with the F-term classification as a plurality of term groups has been described as an example, but a plurality of term groups associated with some meaning other than the F-term classification may also be described. , The present invention can be applied. For example, in addition to the Japan Standard Industrial Classification, Japanese Standard Occupational Classification, Disease, Injury, and Death Cause Classification, which are used as statistical standards for classification, the Japan Standard Industrial Classification, etc., all have major classification, middle classification, minor classification, and these classifications. It can be said that the document has items to be explained and has a plurality of term groups associated with some meaning.
<第2実施形態>
第2実施形態における分類付与支援システムについて説明する。第2実施形態は、第1実施形態の文書処理装置を備え、用語群データセットを構成する複数の用語群を複数の分類に対応づけられたものとし、複数の分類の中から相応しい分類を選択して分類付与対象の文献に付与するための支援を行う分類付与支援システムに関する。ここで、分類の付与は、分類付与対象の文献の内容が、分類の定義に合致する場合に、当該文献に分類記号を付すことによって行われる。例えば、Fタームにおける「AA00」、「AA01」などが、付与される分類記号である。
<Second Embodiment>
The classification assignment support system in the second embodiment will be described. The second embodiment is provided with the document processing apparatus of the first embodiment, and a plurality of term groups constituting the term group data set are associated with a plurality of classifications, and a suitable classification is selected from the plurality of classifications. The present invention relates to a classification granting support system that provides support for granting classification to a document to be classified. Here, the classification is given by attaching a classification symbol to the document when the content of the document to be classified matches the definition of the classification. For example, "AA00", "AA01", etc. in the F-term are assigned classification symbols.
第2実施形態では、図1に示すように、文書表示手段11によって表示される文書に分類を付与するための分類付与手段15をさらに備えている。ユーザは、用語スペクトル表示手段12により表示される各用語群ボックス210を参照し、特にスペクトルバーが多く表示されていて文書の内容との関連性が高いと判定される用語群ボックス210を選択して、その用語群ボックス210内の用語リスト211を「用語パネル」欄(B)に表示し、「明細書テキスト」欄(D)の文書の強調表示と、「スペクトルバー」欄(E)のスペクトル表示を行う。そして、ユーザは、強調表示された箇所を中心に文書の内容を確認し、選択した用語群ボックス210に対応づけられた分類の定義がその文献の内容に合致すると判断される場合には、分類付与手段15により分類を付与する。なお、分類付与手段15による分類の付与方法は、ユーザが分類記号入力欄に分類記号をマニュアル入力するようにしてもよいし、分類記号のリストの中から該当する分類記号をユーザが選択するようにしてもよい。また、用語スペクトル表示手段12により表示される各用語群ボックス210への操作(例えば、マウスによる右クリック)により、それに対応づけられた分類を選択して付与できるようにしてもよい。分類付与手段15は、ユーザにより付与された分類記号を取得すると、表示中文書と関連付けて、例えば、文書データベース40に格納する。
In the second embodiment, as shown in FIG. 1, a classification giving means 15 for giving a classification to a document displayed by the
ところで、Fタームの分類を特許文献に付与するような分類付与業務においては、複数のユーザ(分類付与者)が、用語群データベース50に格納された用語群を参照したり、編集(登録、変更、削除等)したりすることが多い。このような環境において、分類付与支援システムは、用語群データベース50に格納された用語群を複数のユーザで共有し、用語の編集を可能とする構成を備えてもよい。
By the way, in the classification granting business such as granting the classification of F-term to the patent document, a plurality of users (classification grantors) can refer to or edit (register, change) the term group stored in the
一例として、文書処理装置10に、複数ユーザによる用語群データベース50へのアクセス要求の内容に応じて用語群へのアクセスを制御する手段(図示せず)を設けることにより、用語群の共有化を実現することができる。例えば、複数のユーザによる用語群データベース50中の所定の用語群に対するアクセス要求を検出した場合、用語群の参照要求であるとか、用語群の編集要求であっても編集対象の用語群が異なるなど、アクセス要求に競合が生じない場合には、複数ユーザによる用語群へのアクセス要求を許可する。一方、同一用語群に対する編集要求など、アクセス要求に競合が生じた場合には、先着順、アクセス権のレベルあるいは編集の優先度などに基づいて、1人のユーザからのアクセス要求を許可する。なお、競合が生じた場合、該当するユーザに対して編集内容が競合している旨の通知を行い、ユーザからの指示を待つように構成してもよい。
As an example, the
このように、分類の付与を行う複数のユーザ間で用語群データベース50に格納された用語群を共有化する構成を採用することにより、用語群の内容を充実させることができる。
In this way, the content of the term group can be enhanced by adopting a configuration in which the term group stored in the
第2実施形態の分類付与支援システムによれば、文書処理装置10で扱う複数の用語群を複数の分類に対応づけられたものとすることで、文書全体の内容把握と分類付与根拠箇所の発見を迅速に行うことが可能となり、当該文書処理装置10を用いて高品質な分類付与を支援する分類付与支援システムを提供することができる。
According to the classification granting support system of the second embodiment, by assuming that a plurality of term groups handled by the
<第3実施形態>
第3実施形態における文書処理装置10または分類付与支援システムについて説明する。第1実施形態の例では、用語群作成手段14が、既に分類が付与された複数の正例文献及び負例文献に基づいて、各分類の意味に対応する種用語を抽出して用語群を作成したが、第3実施形態では、用語群作成手段14が、抽出された用語の類似関係を自動的に分析することにより各分類に対応づけられた文意式を生成することで、分類ごとの用語群を作成する。
<Third Embodiment>
The
ここで、文意式とは、単独の用語又は共起関係を示す複数の用語の組み合わせ(タプル)をブール代数式で記述したものである。たとえば、「位置」、「GPS」、「測定」という3つの用語が句、文章、段落内において同時に出現するケースが多い場合、すなわち、「位置」、「GPS」、「測定」が共起関係を有する場合、文意式は以下のように設定される。
・句内で共起関係を有する場合の文意式(句タプル):<位置,GPS,測定>
・文章内で共起関係を有する場合の文意式(文タプル):{位置,GPS,測定}
・段落内で共起関係を有する場合の文意式(段落タプル):[位置,GPS,測定]
Here, the sentence meaning expression is a single term or a combination (tuple) of a plurality of terms indicating a co-occurrence relationship described by a Boolean algebraic expression. For example, when the three terms "position", "GPS", and "measurement" often appear at the same time in a phrase, sentence, or paragraph, that is, "position", "GPS", and "measurement" are co-occurrence relationships. If, the sentence expression is set as follows.
・ Sentence expression (phrase tuple) when there is a co-occurrence relationship in the phrase: <position, GPS, measurement>
・ Sentence expression (sentence tuple) when there is a co-occurrence relationship in the sentence: {position, GPS, measurement}
-Sentence expression (paragraph tuple) when there is a co-occurrence relationship in a paragraph: [Position, GPS, measurement]
このような文意式を構成する用語を用語群として用いて文書と対比する場合、句、文章あるいは段落の各範囲内にこれらの用語の組み合わせが出現した場合に限って検索がヒットするように構成することにより、単独の用語により検索した場合に比べて分類付与精度が格段に向上する。 When the terms that make up such a sentence expression are used as a group of terms and compared with a document, the search will be hit only when a combination of these terms appears within each range of a phrase, sentence, or paragraph. By constructing the classification, the accuracy of classification is significantly improved as compared with the case of searching by a single term.
なお、文意式としては、上に挙げた句タプル、文タプル及び段落タプルの他に、近傍式(複数の用語と、用語間の最大文字数及び用語の順序によって記述される式)を用いることも考えられる。 In addition to the phrase tuples, sentence tuples, and paragraph tuples listed above, neighborhood expressions (expressions described by multiple terms, the maximum number of characters between terms, and the order of terms) should be used as the sentence meaning expression. Is also possible.
次に、第3実施形態の文書処理装置10または分類付与支援システムの用語群作成手順について説明する。この用語群作成手順は、用語群作成手段14により実行され、正例文献集合と負例文献集合から種用語を抽出するステップと、その後さらに共起用語を抽出し、文意式を生成するステップとからなる。このうち、正例文献集合と負例文献集合から種用語を抽出するステップについては、第1実施形態において図5及び図6を用いて説明したとおりである。
Next, a procedure for creating a term group of the
図8は、共起用語及び文意式(2語タプル)の生成ステップの一例を示す図である。共起用語とは、種用語と同じ句、文章あるいは段落中に出現する頻度が高い用語である。 FIG. 8 is a diagram showing an example of a step of generating a co-occurrence term and a sentence meaning expression (two-word tuple). Co-occurrence terms are terms that frequently appear in the same phrases, sentences, or paragraphs as seed terms.
分類AA01の段落タプルを生成する場合、AA01の正例文献の用語群から、種用語群とその他の用語群を抽出する。まず、種用語群から一つの種用語を選択し、種用語1とする。その他の用語群のうち、種用語1と同じ段落に出現する用語を共起用語として抽出する。種用語1と同じ段落に出現する共起用語により、[種用語1、共起用語1]、[種用語1、共起用語2]・・・[種用語1、共起用語n]といった2語タプルを作成する。次いで、種用語2、種用語3などの種用語群に含まれる種用語について、同様に、共起用語を組み合わせた2語タプルを作成する。
When generating a paragraph tuple of classification AA01, a species term group and other term groups are extracted from the term group of the regular document of AA01. First, one seed term is selected from the seed term group and is designated as
次に、2語タプル群に含まれる2語タプルの有効性を評価し、最終的に、AA01の意味内容を代表するような精度の高い2語タプルを選抜する。2語タプルの精度評価には、正例文献群と負例文献群を利用する。正例文献集合中で種用語1と共起用語i(i=1~n)の2語タプルが出現する段落数あるいは出現頻度と、負例文献集合中で種用語1と共起用語i(i=1~n)の2語タプルが出現する段落数あるいは出現頻度を比較する。
Next, the effectiveness of the two-word tuple included in the two-word tuple group is evaluated, and finally, a highly accurate two-word tuple that represents the meaning and content of AA01 is selected. For the accuracy evaluation of the two-word tuple, the positive example literature group and the negative example literature group are used. The number of paragraphs or frequency of occurrence of the two-word tapple of the
出現する段落数を比較する場合、例えば、ある2語タプルが正例文献のみで出現し、負例文献には出現しないような場合には、精度は100%となる。また、2語タプルの出現頻度は、例えば、種用語1と共起用語i(i=1~n)の2語タプルが出現する段落数をAA01の正例文献に含まれるすべての段落数で割った値により算出してもよい。なお、2語タプルの評価にあたり、ユーザによる指示入力を受け付けて評価結果を追加、訂正できるようにしてもよい。
When comparing the number of paragraphs that appear, for example, if a certain two-word tuple appears only in the positive example document and does not appear in the negative example document, the accuracy is 100%. The frequency of appearance of the two-word taple is, for example, the number of paragraphs in which the two-word taple of the
このように選抜した2語タプルに、さらに同じ段落に出現する共起用語を追加し、3語段落タプルを作成することもできる。3語段落タプルを使用することにより、2語タプルよりも精度の優れた分類付与が可能となる。同様に、4語段落タプル、5語段落タプルなどを作成してもよい。 It is also possible to create a three-word paragraph tuple by adding co-occurrence terms that appear in the same paragraph to the two-word tuple selected in this way. By using a three-word paragraph tuple, it is possible to assign a classification with higher accuracy than a two-word tuple. Similarly, a 4-word paragraph tuple, a 5-word paragraph tuple, and the like may be created.
用語群作成手段14は、分類ごとに、種用語と共起用語の組み合わせを生成し、このように作成された2語タプル、3語タプルなどを構成する用語を、用語群データベース50に格納される用語群の用語として登録することができる。なお、種用語または共起用語の生成工程において、生成した用語の同義語をあわせて生成し、用語群の用語として登録するようにしてもよい。また、このように生成された用語群を、用語群表示手段13によりマルチ用語パネル300に表示して、ユーザが編集するようにしてもよい。
The term group creating means 14 generates a combination of a species term and a co-occurrence term for each classification, and stores the terms constituting the two-word taple and the three-word taple thus created in the
このように、文意式を用語群として用い、文書表示手段11により文書を表示する場合に、句、文章あるいは段落の各範囲内にこれらの文意式の用語の組み合わせが出現した場合に限って用語の強調表示を行うように構成することにより、文書と用語群との関連性をより精度よく把握することができる。なお、第3実施形態では、用語群として分類に対応づけられた文意式を例にとって説明したが、分類以外の何らかの意味に対応づけられた文意式についても、本発明を適用することができる。 In this way, when the text expression is used as a term group and the document is displayed by the document display means 11, only when a combination of these terms of the sentence expression appears within each range of a phrase, a sentence, or a paragraph. By configuring the term to be highlighted, the relationship between the document and the term group can be grasped more accurately. In the third embodiment, the sentence meaning expression associated with the classification as a term group has been described as an example, but the present invention may be applied to the sentence meaning expression associated with some meaning other than the classification. can.
<第4実施形態>
第4実施形態における文書処理装置10について説明する。第1実施形態における文書処理装置10は、各用語群に対応する用語群ボックス210を複数備えたマルチスペクトル画面200を表示するものであったが、第4実施形態における文書処理装置10では、用語スペクトル表示手段12は、マルチスペクトル画面200を表示する機能に代えて、若しくは加えて、1つの文書に対応する文書ボックス410を複数備えた文書マルチスペクトル画面400を表示する機能を有する。
<Fourth Embodiment>
The
図9は、第4実施形態の文書処理装置10により表示された文書マルチスペクトル画面400の一例を示す図である。
FIG. 9 is a diagram showing an example of a document
文書マルチスペクトル画面400内には、「文献番号一覧」欄(A)に表示される文献No.1~No.Xのそれぞれに対応し、文書ボックス410が左上から順に複数配置されており、各文書ボックス410内には、文献番号とともに用語スペクトルバー列411が表示される。この用語スペクトルバー列411は、「用語パネル」欄(B)で設定される用語及び色情報に基づいて、対応する文献内の用語の位置を指示するスペクトルバーを一覧表示するものである。なお、文書ボックス410ごとに表示/非表示モードの設定を可能にし、例えば文献内の用語の出現頻度に基づく判定によって、設定された用語との関連性の低い文献の文書ボックス410を非表示にしてもよい。
In the document
ユーザは、文書マルチスペクトル画面400を俯瞰したとき、文書ボックス410中の特定の文献の内容をテキスト表示させたい場合がある。そこで、文書処理装置10は、文書マルチスペクトル画面400に対する所定のユーザ操作を検出すると、対応する文献を簡便に表示する機能を提供する。
When the user has a bird's-eye view of the document
例えば、文書表示手段11は、ユーザがマウス操作により、文書マルチスペクトル画面400中の1つの文書ボックス410をクリックしたことを検出すると、クリックされた文書ボックス410が強調表示される。図9では、一例として、文献番号15に対応する文書ボックス410を破線枠で強調表示している。そして、「明細書テキスト」欄(D)中の明細書テキストを選択された文書ボックス410に対応する文献に置き換えて、検索キーワードに対応する文献内の用語を強調表示する。このときに、「明細書テキスト」欄(D)が置き換わることで、「スペクトルバー」欄(E)の表示も変更されるため、ユーザは、スペクトルバーを見ながら明細書テキストをスクロールすることができる。また、ユーザが、文書ボックス410の中のスペクトルバーの1つをクリックした場合には、上の動作に加え、「スペクトルバー」欄(E)のスペクトルバーをクリックした場合と同様に、「明細書テキスト」欄(D)の表示内容を対応する位置までジャンプさせる。
For example, when the document display means 11 detects that the user has clicked one
なお、図9では、「用語パネル」欄(B)で設定される用語群に基づいてスペクトル表示を行う例を示したが、スペクトル表示を行うための用語群を予め複数用意しておき、用意した用語群を選択的に切り替えてスペクトル表示を行うようにしてもよい。例えば、第1実施形態で示したように、Fタームなどの分類に対応づけられた複数の用語群を予め用意しておき、これらのうちの1つを選択することで「用語パネル」欄(B)に用語群を設定し、スペクトル表示を行うようにしてもよい。この場合、文書マルチスペクトル画面400と、用語群のマルチスペクトル画面200を切り替えて表示できるようにし、用語群の選択の際には、用語群のマルチスペクトル画面200を表示させるようにすればよい。また、マルチスペクトル画面の2次元配列の縦軸方向に複数の文献を、横軸方向に複数の用語群をそれぞれ並べ、複数の文献ごと、及び複数の用語群ごとのスペクトル表示を同時に行えるようにしてもよい。
In addition, although FIG. 9 shows an example of performing spectrum display based on the term group set in the “term panel” column (B), a plurality of term groups for performing spectrum display are prepared in advance and prepared. The term group may be selectively switched to display the spectrum. For example, as shown in the first embodiment, a plurality of term groups associated with classifications such as F-terms are prepared in advance, and by selecting one of these, a "term panel" column ("term panel" column ( A term group may be set in B) to display a spectrum. In this case, the document
以上のように、複数の文書のそれぞれに対応させて用語スペクトルバー列411をそれぞれ表示し、「用語パネル」欄(B)で設定される用語がいずれかの文書内でヒットすると、対応する用語スペクトルバー列411を色付けして表示するように構成したことから、文書マルチスペクトル画面400を俯瞰しながら、設定された用語との関連性が深い文献を容易に探すことができる。また、文書マルチスペクトル画面400に対して所定の操作を行うことにより、該当する文献のテキストを表示させることができるため、複数の文献の用語スペクトルバー列411を俯瞰した後、特定の文献の具体的な記載内容を分析したいような場合でも、簡単な操作により、該当する文献を表示させることができる。
As described above, when the term
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 It should be noted that the present invention is not limited to the above embodiment as it is, and at the implementation stage, the components can be modified and embodied within a range that does not deviate from the gist thereof. In addition, various inventions can be formed by an appropriate combination of the plurality of components disclosed in the above-described embodiment. For example, some components may be removed from all the components shown in the embodiments. In addition, components across different embodiments may be combined as appropriate.
10…文書処理装置、11…文書表示手段、12…用語スペクトル表示手段、13…用語群表示手段、14…用語群作成手段、15…分類付与手段、20…入力装置、30…表示装置、40…文書データベース、50…用語群データベース、100…文書表示画面、200…マルチスペクトル画面、210…用語群ボックス、211…用語リスト、212…用語スペクトルバー列、300…マルチ用語パネル、400…文書マルチスペクトル画面、410…文書ボックス、411…用語スペクトルバー列。 10 ... document processing device, 11 ... document display means, 12 ... term spectrum display means, 13 ... term group display means, 14 ... term group creation means, 15 ... classification assigning means, 20 ... input device, 30 ... display device, 40. ... document database, 50 ... term group database, 100 ... document display screen, 200 ... multi-spectral screen, 210 ... term group box, 211 ... term list, 212 ... term spectrum bar string, 300 ... multi term panel, 400 ... document multi Spectrum screen, 410 ... Document box, 411 ... Term spectrum bar sequence.
Claims (6)
1又は複数の用語からなる用語群を複数含む用語群データセットに基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語群の用語が前記文書に含まれる場合に、当該用語に設定された色のスペクトルバーで当該用語の前記文書内位置を指示する用語スペクトルバー列を配置した用語群ボックスを、複数の用語群毎に並べて表示する、用語スペクトル表示手段と、を備え、
ユーザが特定の用語群ボックスを選択した場合には、前記文書表示手段は、前記選択された用語群ボックスの用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されている、
文書処理装置。 Document display means for selectively displaying multiple documents, and
It is a term spectrum display means for displaying a spectrum based on a term group data set including a plurality of term groups consisting of one or a plurality of terms, and is set to the term when the term of the term group is included in the document. A term spectrum display means for displaying a term group box in which a term spectrum bar string indicating the position of the term in the document by a color spectrum bar is arranged side by side for each of a plurality of term groups is provided.
When the user selects a specific term group box, the document display means uses the term in the document corresponding to the spectrum bar included in the term spectrum bar column of the selected term group box as the term. It is configured to be highlighted in the set color,
Document processing device.
請求項1に記載の文書処理装置。 The terms included in the term group are displayed for each of a plurality of term groups together with the color setting of each term, and the term group display means capable of adding, deleting, editing, and setting the color is further provided.
The document processing apparatus according to claim 1.
前記用語スペクトル表示手段は、前記用語群ボックスの前記用語スペクトルバー列において、前記文意式に対応する種用語と共起用語の組み合わせが存在する前記文書内位置に限ってスペクトルバーを表示する、
請求項1又は2に記載の文書処理装置。 The terms included in the term group constitute a literary expression consisting of seed terms and co-occurrence terms.
The term spectrum display means displays a spectrum bar only at a position in the document where a combination of a species term and a co-occurrence term corresponding to the meaning expression exists in the term spectrum bar column of the term group box.
The document processing apparatus according to claim 1 or 2.
前記文書に分類を付与する分類付与手段と、
を備え、
前記複数の用語群は、複数の分類に対応づけられている、
分類付与支援システム。 The document processing apparatus according to any one of claims 1 to 3.
Classification assigning means for assigning classification to the document and
Equipped with
The plurality of term groups are associated with a plurality of classifications.
Classification grant support system.
請求項4に記載された分類付与支援システム。 Further provided with a term group creation means for extracting a term group corresponding to the meaning of each classification based on a plurality of positive and negative example documents already given a classification symbol.
The classification grant support system according to claim 4.
ユーザが設定した1又は複数の用語に基づきスペクトル表示を行う用語スペクトル表示手段であって、前記用語が前記文書に含まれる場合に、当該用語とともに設定された色のスペクトルバーで当該用語の前記文書内位置を指示する用語スペクトルバー列を配置した文書ボックスを、前記複数の文書毎に並べて表示する、用語スペクトル表示手段と、を備え、
ユーザが特定の文書ボックスを選択した場合には、前記文書表示手段は、前記選択された文書ボックスに対応する文書を表示し、用語スペクトルバー列に含まれるスペクトルバーに対応する前記文書内の用語を、当該用語に設定された色で強調表示するように構成されている、
文書処理装置。
Document display means for selectively displaying multiple documents, and
A term spectrum display means for displaying a spectrum based on one or more terms set by a user, and when the term is included in the document, the document of the term is a spectrum bar of a color set together with the term. It is provided with a term spectrum display means for displaying a document box in which a term spectrum bar string indicating an internal position is arranged side by side for each of the plurality of documents.
When the user selects a particular document box, the document display means displays the document corresponding to the selected document box and the term in the document corresponding to the spectrum bar contained in the term spectrum bar column. Is configured to be highlighted in the color set for the term,
Document processing device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218505A JP2022103710A (en) | 2020-12-28 | 2020-12-28 | Document processing device and classification assignment support system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218505A JP2022103710A (en) | 2020-12-28 | 2020-12-28 | Document processing device and classification assignment support system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022103710A true JP2022103710A (en) | 2022-07-08 |
Family
ID=82284907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020218505A Pending JP2022103710A (en) | 2020-12-28 | 2020-12-28 | Document processing device and classification assignment support system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022103710A (en) |
-
2020
- 2020-12-28 JP JP2020218505A patent/JP2022103710A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11714839B2 (en) | Apparatus and method for automated and assisted patent claim mapping and expense planning | |
US7890533B2 (en) | Method and system for information extraction and modeling | |
US7207004B1 (en) | Correction of misspelled words | |
KR102345001B1 (en) | Patent document creation apparatus, method, computer program, computer-readable recording medium, server and system | |
US8312067B2 (en) | Method and computer program product for analyzing documents | |
JP6254629B2 (en) | Scoring assistance system | |
US20050131931A1 (en) | Abstract generation method and program product | |
US20130211819A1 (en) | Displaying examples from texts in dictionaries | |
JP2009059140A (en) | Electronic dictionary, retrieval method for electronic dictionary, and retrieval program for electronic dictionary | |
JP2022103710A (en) | Document processing device and classification assignment support system | |
JP5269399B2 (en) | Structured document retrieval apparatus, method and program | |
JP7110644B2 (en) | Information display device, information display method and information display program | |
JPH08320881A (en) | Document retrieval system | |
JP2008171164A (en) | Classification support apparatus and method, and program | |
JP4713098B2 (en) | Selection item display device, selection item display method, and selection item display program | |
Barlow | MonoconcEsy: An Introduction to Concordancing | |
US20240095283A1 (en) | Systems and methods for conceptual highlighting of document search results | |
JP6167591B2 (en) | Word display control device, word display control method, and word display control program | |
JP6627679B2 (en) | Kana-kanji conversion device and kana-kanji conversion program | |
Zilka et al. | DISPLAYING INFORMATION RELATING TO SELECTED TEXT | |
JPH01185724A (en) | Retriever | |
Yu et al. | RadicalLocator: A software tool for identifying the radicals in Chinese characters | |
JP2016207036A (en) | Support device, support method, and support program | |
JP2022023430A (en) | Display device and program | |
JP2020123197A (en) | Contract document check device, contract document check method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20230113 |