JP2012203868A - Skim reading support system, skim reading support method and program - Google Patents
Skim reading support system, skim reading support method and program Download PDFInfo
- Publication number
- JP2012203868A JP2012203868A JP2011070926A JP2011070926A JP2012203868A JP 2012203868 A JP2012203868 A JP 2012203868A JP 2011070926 A JP2011070926 A JP 2011070926A JP 2011070926 A JP2011070926 A JP 2011070926A JP 2012203868 A JP2012203868 A JP 2012203868A
- Authority
- JP
- Japan
- Prior art keywords
- document
- word
- classification
- unit
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明の実施形態は、多数の文書の拾い読みを支援するための拾い読み支援システム、方法及びプログラムに関する。 Embodiments described herein relate generally to a browsing support system, method, and program for supporting browsing of a large number of documents.
コンピュータが広く浸透し、通信速度・処理速度などの高速化、ハードディスク・メモリの大容量化などハードウェアの進化とともに、文書の電子化が進み、日常的に大量の情報を扱うことが多くなった。一般ユーザにとっては、情報検索など様々なソフトウェアの技術革新とともに、大量の情報から知りたい情報を利用するための支援を受けられるようになってきた。 With the widespread use of computers, with the advancement of hardware such as higher communication speed and processing speed, and increased capacity of hard disks and memories, the digitization of documents has progressed and a large amount of information has been handled on a daily basis. . For general users, along with technological innovations of various software such as information retrieval, it has become possible to receive support for using information that they want to know from a large amount of information.
しかし、例えば特許調査・文献調査・市場調査のように漏れなく網羅的に内容を調査しなければならないビジネスシーンなどでは、大量文書にユーザ自身が目を通す必要があり、検索や分類などの機械的処理で高精度に読むべき文書を少量に減らすことは難しい。また、時間的な制約があることが一般的で、通常は人手で或いは無意識的に、精読すべき箇所を選別するなどの拾い読みを行っている。あるいは、多数の文書を複数人で分担できるように、精読する前処理として、各人の専門分野などを元に拾い読みによって割り振りを行うなどを行っている。 However, in business scenes where content must be thoroughly investigated, such as patent research, literature research, and market research, for example, users need to read a large number of documents. It is difficult to reduce the number of documents to be read with high accuracy to a small amount. In addition, there are generally time restrictions, and browsing is usually performed such as selecting a portion to be read carefully, manually or unconsciously. Alternatively, as a pre-processing for detailed reading so that a large number of documents can be shared by a plurality of people, allocation is performed by browsing based on each person's specialized field.
多数の文書の拾い読みを支援する技術は知られていなかった。 No technology has been known to assist in browsing a large number of documents.
本実施形態は、多数の文書の拾い読みを支援することの可能な拾い読み支援システム、拾い読み支援方法及びプログラムを提供することを目的とする。 An object of the present embodiment is to provide a browsing support system, a browsing support method, and a program that can support browsing of a large number of documents.
実施形態によれば、文書記憶部と、表示部と、入力部と、分類情報記憶部と、抽出部と、特定部とを備える。文書記憶部は、識別情報が対応付けられた複数の文書を記憶する。表示部は、前記複数の文書のうちの全部又は一部を、単語又はフレーズのハイライト表示を伴って又はハイライト表示を伴わずに表示する。入力部は、表示された前記文書のうちの特定の文書の指示及び予め定められた複数種類の分類タイプのうちから当該特定の文書に付与する特定の分類タイプの指示をユーザから入力する。分類情報記憶部は、前記識別情報と前記特定の分類タイプとを対応付けた分類情報を記憶する。抽出部は、同一の分類タイプが対応付けられている1又は複数の前記文書から、当該分類タイプについてハイライト表示すべき1又は複数の単語又はフレーズを抽出する。特定部は、前記文書の全部又は一部の各々について、前記抽出部により抽出された各々の単語又はフレーズが当該文書中に存在する場合に当該文書中でハイライト表示すべき箇所を特定する。 According to the embodiment, a document storage unit, a display unit, an input unit, a classification information storage unit, an extraction unit, and a specifying unit are provided. The document storage unit stores a plurality of documents associated with identification information. The display unit displays all or a part of the plurality of documents with or without highlight display of words or phrases. The input unit inputs, from the user, an instruction of a specific document among the displayed documents and an instruction of a specific classification type to be given to the specific document among a plurality of predetermined classification types. The classification information storage unit stores classification information in which the identification information is associated with the specific classification type. The extraction unit extracts one or a plurality of words or phrases to be highlighted from the one or a plurality of the documents associated with the same classification type. The specifying unit specifies a portion to be highlighted in the document when each word or phrase extracted by the extracting unit is present in the document for each of all or a part of the document.
以下、図面を参照しながら本発明の実施形態に係る拾い読み支援システムについて詳細に説明する。なお、以下の実施形態では、同一の番号を付した部分については同様の動作を行うものとして、重ねての説明を省略する。 Hereinafter, a browsing support system according to an embodiment of the present invention will be described in detail with reference to the drawings. Note that, in the following embodiments, the same numbered portions are assumed to perform the same operation, and repeated description is omitted.
(第1の実施形態)
従来、例えば特許調査・文献調査・市場調査をはじめとする文書調査などのように多数の文書を閲覧する際に、検索や分類などの機械的処理だけで高精度に読むべき文書を少量に減らすことは難しく、ユーザ自身が目で単語を走査し、拾い読みを行っていた。
(First embodiment)
Conventionally, when browsing a large number of documents, such as patent research, literature research, market research and other document research, etc., the number of documents to be read with high accuracy is reduced to a small amount only by mechanical processing such as search and classification. It was difficult, and the user himself scanned the word with his eyes and browsed it.
第1の実施形態では、(例えば表示された文書をユーザが任意に閲覧してその分類タイプを判断した上で)ユーザが入力した幾つかの文書に対する分類を示す情報(分類タイプ)に基づいて、自動的に拾い読みのキーワード抽出を行い、ユーザが未分類の文書中のキーワードのハイライト表示を行うことによって、ユーザの拾い読みを支援する場合を例にとって説明する。 In the first embodiment, based on information (classification type) indicating classifications for some documents input by the user (for example, after the user arbitrarily browses the displayed document and determines the classification type). An example in which browsing keyword extraction is automatically performed and the user supports browsing by highlighting keywords in an uncategorized document will be described as an example.
以下では、ユーザが文書に付与する分類タイプとして、当該文書が必要な文書であるか否かによって、少なくとも以下の2種類の文書タイプが設けられる具体例を中心に説明する。
(a)ユーザが必要であるとした文書を示す分類タイプ(以下、必要文書タイプ)、
(b)ユーザが不要であるとした文書を示す分類タイプ(以下、不要文書タイプ)。
Hereinafter, a specific example in which at least the following two types of document types are provided as the classification type to be given to a document by the user depending on whether the document is a necessary document will be mainly described.
(A) a classification type (hereinafter referred to as a required document type) indicating a document that the user considers necessary;
(B) A classification type (hereinafter referred to as “unnecessary document type”) indicating a document that the user does not need.
この例の場合には、ユーザは、所望の文書に対して、分類タイプとして、「必要文書タイプ」又は「不要文書タイプ」のいずれかを入力できる。 In the case of this example, the user can input either “required document type” or “unnecessary document type” as a classification type for a desired document.
上記は一例であり、他にも様々な分類方法を使用することが可能である。 The above is an example, and various other classification methods can be used.
例えば、当該文書がいずれの担当者に関連するかによって分類する方法が可能である。例えば、A〜Eの5人の担当者が設定される場合に、少なくとも以下の5種類の文書タイプが設けられる。
・担当者Aに関連する文書を示す分類タイプ(担当者A文書タイプ)、
・担当者Bに関連する文書を示す分類タイプ(担当者B文書タイプ)、
・担当者Cに関連する文書を示す分類タイプ(担当者C文書タイプ)、
・担当者Dに関連する文書を示す分類タイプ(担当者D文書タイプ)、
・担当者Eに関連する文書を示す分類タイプ(担当者E文書タイプ)。
For example, it is possible to classify according to which person in charge the document is related to. For example, when five persons A to E are set, at least the following five document types are provided.
A classification type (person A document type) indicating a document related to person A
A classification type (person B document type) indicating a document related to person B
A classification type (person C document type) indicating a document related to the person C
A classification type (person in charge D document type) indicating a document related to person in charge D;
A classification type indicating a document related to the person in charge E (person in charge E document type).
この例の場合には、ユーザは、所望の文書に対して、分類タイプとして、「担当者A文書タイプ」〜「担当者E文書タイプ」のいずれかを入力できる。 In the case of this example, the user can input any one of “person A document type” to “person E document type” as a classification type for a desired document.
また、上記二つの例を併せて、例えば少なくとも以下の6種類の文書タイプを設けることも可能である。
・担当者Aに関連する文書を示す分類タイプ(担当者A文書タイプ)、
・担当者Bに関連する文書を示す分類タイプ(担当者B文書タイプ)、
・担当者Cに関連する文書を示す分類タイプ(担当者C文書タイプ)、
・担当者Dに関連する文書を示す分類タイプ(担当者D文書タイプ)、
・担当者Eに関連する文書を示す分類タイプ(担当者E文書タイプ)、
・ユーザが不要であるとした文書を示す分類タイプ(不要文書タイプ)。
In addition, for example, at least the following six document types can be provided in combination with the above two examples.
A classification type (person A document type) indicating a document related to person A
A classification type (person B document type) indicating a document related to person B
A classification type (person C document type) indicating a document related to the person C
A classification type (person in charge D document type) indicating a document related to person in charge D;
-Classification type (person E document type) indicating the document related to person E
A classification type (unnecessary document type) indicating a document that the user does not need.
なお、分類タイプの一つとして、更に、ユーザが未だ分類タイプを入力していない文書であることを示すタイプ(ここでは、未読文書タイプと呼ぶ)を設けることも可能である。例えば、上記具体例において、更に未読文書タイプを使用する場合には、ユーザが幾つかの文書に対して必要文書タイプを入力し、他の幾つかの文書に対して不要文書タイプを入力した場合に、残りの文書には、自動的に、「未読文書タイプ」が付与されることになる。 As one of the classification types, a type (herein referred to as an unread document type) indicating that the user has not yet input a classification type can be provided. For example, in the above specific example, when the unread document type is used further, the user inputs the required document type for some documents and the unnecessary document type for some other documents. In addition, the “unread document type” is automatically assigned to the remaining documents.
図1に、第1の実施形態の拾い読み支援システムの機能構成例を示す。 FIG. 1 shows a functional configuration example of the browsing support system according to the first embodiment.
図1に示されるように本実施形態の拾い読み支援システムは、拾い読み支援システムの構成は、拾い読み単語抽出部101、ハイライト箇所特定部102、テキスト表示部103、ユーザ入力部104、文書データ記憶部105、分類情報記憶部106を備えている。
As shown in FIG. 1, the browsing support system according to the present embodiment includes a browsing support system including a browsing
文書データ記憶部105は、複数の文書のデータを記憶する。
The document
文書は、どのようなものであっても良い。例えば、文書は、何らかのドキュメント本文であっても良いし、そのドキュメント本文に対する要約文であっても良い。例えば、ドキュメント本文が特許明細書であり、文書データ記憶部105に記憶される各文書が、各特許明細書に対応する要約文である場合に、ユーザは、各要約文に対応する各特許文書を実際に読むかどうかを判断するために、各要約文を拾い読みすることがある。本実施形態では、文書の例として、特許明細書の要約文を例にとりつつ説明する。
The document may be anything. For example, the document may be any document body or a summary sentence for the document body. For example, when the document text is a patent specification and each document stored in the document
図2に、文書データ記憶部105に記憶される文書データの一例を示す。図2の例では、各文書データに、文書識別子(以下、文書ID)(図中、0001〜0006)が付与されている。なお、文書データの記憶フォーマットは、図2に制限されない。
FIG. 2 shows an example of document data stored in the document
なお、文書データ記憶部105に記憶される文書データは、記録媒体から入力されたものであっても良いし、インターネットなどのネットワークを介してダウンロードされたものであっても良いし、キー入力された文書を含んでも良いし、他のどのような方法で得られたものであっても良い。
The document data stored in the document
また、文書データ記憶部105に記憶される文書データは、例えば、文書ID又は他の何らかの基準によってソートされていても良いし、特にソートされていなくても良い。
Further, the document data stored in the document
テキスト表示部103は、文書データ記憶部105に記憶されている複数の文書(その文書数をNとする)について、一度に所望の文書数dの文書を表示する。なお、ここでは、2≦d≦Nとして説明するが、d=1の表示状態があっても構わない。
The
その際、表示の仕方に制限はなく、例えば、表示対象となった各々の文書について、その文書全体を表示する方法も可能であり、また、例えば、その文書の一部を表示する(例えば、その文書を、予め定められた上限となる文字数の部分まで表示し、残りの部分はユーザが所定の操作を行うことによって表示されるようになる)方法も可能である。また、一つの画面に同時に表示する文書数nをユーザが指示できるようにしても良いし、一つの文書について表示する上限文字数をユーザが指示できるようにしても良いし、その他にも様々な表示方法が可能である。 At this time, there is no limitation on the display method. For example, for each document to be displayed, a method of displaying the entire document is also possible. For example, a part of the document is displayed (for example, A method is also possible in which the document is displayed up to a predetermined upper limit number of characters, and the remaining portion is displayed by the user performing a predetermined operation. Further, the user may be able to specify the number n of documents to be displayed simultaneously on one screen, the user may be able to specify the upper limit number of characters to be displayed for one document, and various other displays. A method is possible.
また、複数の文書のうちの一部の文書を表示する場合に、表示する文書の選択方法に制限はない。例えば、表示する文書を、文書ID又は他の何らかの基準によって選択しても良いし、ユーザが表示する文書を指示しても良い。 In addition, when displaying a part of a plurality of documents, there is no limitation on a method for selecting a document to be displayed. For example, the document to be displayed may be selected based on the document ID or some other criterion, or the user may indicate the document to be displayed.
ユーザ入力部104は、ユーザが指定する文書の指示とその文書に対するユーザが指定する分類タイプの指示を入力する。例えば、ユーザは、テキスト表示部103に表示された文書のうちから、所定の方法で所望の文書を選択するとともに、その文書に対する所望の分類タイプを所定の方法で選択しても良い。なお、文書選択方法や分類タイプ選択方法に特に制限はない。
The
分類タイプは、分類方法が予め1種類に定められていても良いし(例えば、「必要文書タイプ」「不要文書タイプ」のいずれか)、分類方法が予め複数種類に定められていて、それらのうちからユーザが選択するようにしても良いし(例えば、「必要文書タイプ」「不要文書タイプ」のいずれか、又は、「担当者A文書タイプ」)〜「担当者E文書タイプ」のいずれか)、いつでもユーザが自由な分類タイプを任意に設定可能であっても良いし、それらの組み合わせであっても良い。 As for the classification type, the classification method may be determined in advance as one type (for example, “necessary document type” or “unnecessary document type”), and the classification methods are determined in advance as a plurality of types. The user may select from among them (for example, “necessary document type”, “unnecessary document type”, or “person A document type”) to “person E document type”. ), The user can arbitrarily set a free classification type at any time, or a combination thereof.
分類情報記憶部106は、各々の文書IDと、当該文書IDに対する分類タイプとの対応を示す文書分類情報を記憶する。
The classification
図3(a)に、分類情報記憶部106に記憶される文書分類情報の例を示す。図3(a)の例は、分類タイプが何も入力されていない初期的な状態を示す。以下、一例として、文書分類情報において、「不要文書タイプ」については値「A」が記憶され、「必要文書タイプ」については値「B」が記憶されるものとして説明する。
FIG. 3A shows an example of document classification information stored in the classification
なお、前述の「未読文書タイプ」を使用しない場合には、図3(a)の例を使用すれば良い。また、「未読文書タイプ」を使用する場合には、図3(b)のように文書分類情報の初期状態として全文書について、ユーザが入力する分類タイプ以外の値(例えば値「C」)を記憶しておき、値「C」が記憶されている文書は、「未読文書タイプ」として扱うようにしても良いし、または、図3(a)の例を使用して、値が何も記憶されていない(あるいは、値が「null」である)文書は、「未読文書タイプ」として扱うようにしても良い。 If the above-mentioned “unread document type” is not used, the example of FIG. 3A may be used. When “unread document type” is used, values other than the classification type input by the user (for example, value “C”) are set for all documents as the initial state of the document classification information as shown in FIG. A document that is stored and the value “C” is stored may be handled as “unread document type”, or any value is stored using the example of FIG. A document that is not (or has a value of “null”) may be handled as an “unread document type”.
いずれの場合においても、文書データ記憶部105に記憶されている文書の文書数がNである場合に、文書分類情報においてユーザにより入力された分類タイプに対応する値が記憶される数cは、0≦c≦Nである。
In any case, when the number of documents stored in the document
以下では、c=0の場合には、ハイライト表示を行わないものとし、また、c=Nに達した場合には、すべての文書についてユーザによる分類がなされたことを意味するので、それ以上の拾い読み単語抽出部101及びハイライト箇所特定部102の処理は、行わないものとする。ただし、「未読文書タイプ」を使用する場合に、c=0のときに、ハイライト表示を行うことも可能である。
In the following, when c = 0, no highlight display is performed, and when c = N is reached, it means that all documents have been classified by the user. The processing of the browsing
また、以下では、まだユーザにより分類タイプが付与されていない(N−c)個の文書のみを、ハイライト表示の対象とするものとして説明する。ただし、N個のすべての文書を、ハイライト表示の対象とすることも可能である。 In the following description, it is assumed that only (Nc) documents that have not yet been assigned a classification type by the user are to be highlighted. However, all N documents can be highlighted.
拾い読み単語抽出部101は、文書分類情報において、少なくとも一つの文書について、ユーザにより入力された分類タイプが記憶されている場合に(すなわち、c≧1である場合に)、文書分類情報中に対応する値が存在する分類タイプごとに、当該分類タイプに対応する文書から、当該分類タイプに特徴的な単語のリストを作成する。その際、各単語について、当該分類タイプに特徴的である程度を表すスコアを計算する。
The browsing
図4に、拾い読み単語抽出部101がその処理において作成するスコア付けされた単語リスト(スコア付単語リスト)の例を示す。本具体例のように「必要文書タイプ」及び「不要文書タイプ」を使用する場合には、文書タイプごとにスコア付単語リストが作成される。図4(a)及び(b)の例は、それぞれ、「不要文書タイプ」用のスコア付単語リスト及び「必要文書タイプ」用のスコア付単語リストの初期的な状態を示す。なお、「未読文書タイプ」を使用する場合には、更に、「未読文書タイプ」用のスコア付単語リストも設けられる。
FIG. 4 shows an example of a scored word list (scored word list) created by the browsing
各々の分類タイプごとに、そのスコア付単語リスト中の単語が、ハイライト表示されるものとして選択される。なお、例えば、スコア付単語リスト中の単語が予め定められた個数kを超えた場合には、スコア付単語リスト中でスコアが上位のk個を選択する方法、スコアが予め定められた閾値以上の単語のみ使用する方法など、あるいは、それらを組み合わせた方法なども可能であり、また、他の様々な方法が可能である。 For each classification type, the words in the scored word list are selected as highlighted. In addition, for example, when the number of words in the scored word list exceeds a predetermined number k, a method of selecting the top k scores in the scored word list, the score is equal to or higher than a predetermined threshold A method using only these words or a combination of them is also possible, and various other methods are possible.
なお、文書分類情報中に対応する値が存在しない分類タイプについては、その間、スコア付単語リストは作成されない。例えば、上記具体例において、文書分類情報中に、図3(a)については値「B」のみ存在する場合に、図3(b)については、「B」及び「C」のみ存在する場合に、値「A」に対応する「不要文書タイプ」については、スコア付単語リストは作成されない。 Note that a word list with scores is not created for a classification type for which there is no corresponding value in the document classification information. For example, in the above specific example, in the document classification information, only the value “B” exists for FIG. 3A, and only “B” and “C” exist for FIG. 3B. For the “unnecessary document type” corresponding to the value “A”, a scored word list is not created.
以下、各々の分類タイプごとに、ハイライト表示されるものとして選択された単語(又は又は用語又はフレーズ)を、「拾い読み単語候補」と呼ぶものとする。 Hereinafter, the word (or term or phrase) selected to be highlighted for each classification type will be referred to as a “browsing word candidate”.
ハイライト箇所特定部102は、ユーザが分類タイプを入力していない各々の文書について、当該文書中で各々の「拾い読み単語候補」が出現する箇所を探し(なお、「拾い読み単語候補」の全部又は一部が存在しないこともある)、当該文書中において出現する各々の「拾い読み単語候補」からハイライトすべき箇所を選択する。例えば、一つの文書において、同一の「拾い読み単語候補」について1箇所のみハイライト表示するものとした場合に、ある文書中にある「拾い読み単語候補」が複数存在するときに、いずれの箇所をハイライト表示するかを選択する。
For each document for which the user has not entered a classification type, the highlighted
ユーザが少なくとも一つの文書に対して分類タイプを入力した後は、テキスト表示部103は、ユーザが分類タイプを入力していない文書について、その文書中の単語のうち、拾い読み単語抽出部101により分類タイプごとに抽出された単語であって且つハイライト箇所特定部102により特定された箇所の単語をハイライト表示する。
After the user inputs the classification type for at least one document, the
その際、「拾い読み単語候補」をハイライト表示するにあたって、その分類タイプに対応するハイライト形態でハイライト表示するようにしても良い。例えば、フォントを変えることによって拾い読み単語候補を示す場合に、分類タイプごとに、文字の色等のフォントを変えても良いし、拾い読み単語候補を枠で囲んで示す場合に、分類タイプごとに、枠の形状、線種、色、枠内のハッチングの有無、ハッチングの種類等を変えても良いし、それらを組み合わせても良いし、また、他にも様々なハイライト形態が可能である。 At this time, when the “browsing word candidate” is highlighted, it may be highlighted in a highlight form corresponding to the classification type. For example, when the browsing word candidate is shown by changing the font, the font such as the character color may be changed for each classification type, or when the browsing word candidate is surrounded by a frame and shown for each classification type, The shape, line type, color, presence / absence of hatching in the frame, the type of hatching, etc. may be changed, or combinations thereof, and various other highlight forms are possible.
また、例えば、必要文書タイプを一番に目立つハイライト形態、不要文書タイプを次に目立つハイライト形態、未読文書タイプをその次に目立つハイライト形態にするような方法も可能である。 Further, for example, a method is possible in which the necessary document type is the most noticeable highlight form, the unnecessary document type is the next most noticeable highlight form, and the unread document type is the next most noticeable highlight form.
ユーザ入力部104でユーザからの入力が起こると、分類情報記憶部106が更新され、拾い読み単語抽出部101、ハイライト箇所特定部102、テキスト表示部103の一連の処理が行われる。
When an input from the user occurs in the
なお、上記一連の処理は、ユーザ入力部104から一つの文書に係る文書分類情報を入力するごとに、これを契機として実行することとしても良いし、あるいは、ユーザ入力部104から文書分類情報が入力されただけでは、上記一連の処理を実行せず、(例えばユーザ入力部104から)上記一連の処理を実行するための所定の指示が入力されたときに、これを契機として上記一連の処理を実行することとしても良い。
The series of processes may be executed every time document classification information related to one document is input from the
ここで、図5のシステム画面例を参照しながら、本実施形態の全体的な動作例の概要について説明する。図5では、各文書が特許明細書に対応する要約文である場合を例にとって説明する。 Here, an outline of an overall operation example of the present embodiment will be described with reference to the system screen example of FIG. In FIG. 5, a case where each document is a summary corresponding to a patent specification will be described as an example.
なお、以下では、必要文書タイプを「○」、不要文書タイプを「×」でも表すものとする。 In the following, the necessary document type is also represented by “◯” and the unnecessary document type is represented by “×”.
まず、テキスト表示部103が、図5のシステム画面(121)の内側に、各文書(図中、122参照)を表示する。なお、初期的な状態では、ユーザによる分類タイプの入力がなされておらず、実際には図5と異なり、「○」「×」は表示されておらず、ハイライト表示も行われていない。
First, the
図5の具体例は、システム画面(121)の内側に、各文書を5行2列に表示するものである。 The specific example of FIG. 5 displays each document in five rows and two columns inside the system screen (121).
次に、ユーザは、図5のシステム画面(121)中に表示された文書を任意に読む。 Next, the user arbitrarily reads the document displayed on the system screen (121) of FIG.
なお、図5の5行2列に表示する例において、11以上の文書が存在する場合には、ユーザは、例えばスクロール又はページ更新をするなどして他の文書を表示させても良い。もちろん、文書の表示は、5行2列の表示に制限されない。 In the example of displaying in 5 rows and 2 columns in FIG. 5, when there are 11 or more documents, the user may display other documents by scrolling or page updating, for example. Of course, the display of the document is not limited to the display of 5 rows and 2 columns.
そして、ユーザは、分類タイプを入力すると判断した文書を選択するとともに、その文書についてユーザが判断した分類タイプを選択することによって、文書分類情報{文書,分類タイプ}を入力する。すなわち、システム側は、ユーザ入力部104において、ユーザが選択する{文書,分類タイプ}の入力を受け付ける。
Then, the user inputs the document classification information {document, classification type} by selecting the document determined to input the classification type and selecting the classification type determined by the user for the document. That is, the system side accepts input of {document, classification type} selected by the user in the
例えば、ユーザが124で示される文書を読んで、この文書を不要と判断した場合(例えば、この要約文に対応する特許明細書の全文は読まなくて良いと判断した場合)、この文書データ(124)に対して不要文書タイプ記号「×」をユーザが選択する。 For example, when the user reads the document indicated by 124 and determines that this document is unnecessary (for example, when it is determined that it is not necessary to read the full text of the patent specification corresponding to this summary sentence), the document data ( 124), the user selects the unnecessary document type symbol “x”.
同様の、ユーザが125で示される文書を読んで、この文書を必要と判断した場合(例えば、この要約文に対応する特許明細書の全文は読む必要があると判断した場合)、この文書データ(124)に対して必要文書タイプ記号「○」をユーザが選択する。 Similarly, when the user reads the document indicated by 125 and determines that this document is necessary (for example, when it is determined that the full text of the patent specification corresponding to this summary sentence needs to be read), this document data For (124), the user selects the required document type symbol “◯”.
なお、ユーザは、それら以外の文書には分類を付与していないとする。 It is assumed that the user has not assigned a classification to other documents.
この場合に、図5に示されるように、分類が付与された文書124,125についてそれぞれ付与された分類タイプを示す「×」「○」が表示されても良い。もちろん、他の付与された分類タイプを識別可能にしても良い。
In this case, as shown in FIG. 5, “x” and “◯” may be displayed indicating the classification type assigned to each of the
さて、文書データ124,125に対して分類タイプが付与されたときに、システム内では、文書データ124の文書ID及び付与された分類タイプを示す文書分類情報と、文書データ125の文書ID及び付与された分類タイプを示す文書分類情報を受け取る。
Now, when a classification type is assigned to the
そして、上記二つの文書分類情報をもとに、拾い読み単語抽出部101の処理、ハイライト箇所特定部102の処理、テキスト表示部103の処理からなる一連の処理を行って、図5に例示されるように、文書データ124,125以外の文書に対して、拾い読み単語をハイライト表示する。
Then, based on the above two document classification information, a series of processes including the process of the browsing
なお、拾い読み単語抽出部101では、分類タイプごとにスコアを計算する。
The browsing
例えば、図5中のタイプ分け凡例(123)のように、必要文書タイプ・不要文書タイプ・未読文書タイプの3分類でそれぞれスコアの高い語を用意することで、タイプごとに単語のハイライト方法を変えることができる。 For example, as shown in the type classification legend (123) in FIG. 5, a word highlighting method is prepared for each type by preparing words with high scores for each of the required document type, unnecessary document type, and unread document type. Can be changed.
異なるハイライト方法を適用する例として、例えば、前述のようにハイライト色を変更しても良い。例えば、必要文書タイプをピンク、不要文書タイプを黄色、未読文書タイプを緑で各タイプの拾い読み単語をハイライトしても良い。 As an example of applying different highlight methods, for example, the highlight color may be changed as described above. For example, each type of browsing word may be highlighted with the required document type pink, the unnecessary document type yellow, and the unread document type green.
図5では、タイプごとに単語のハイライト方法を変える様子を例示するために、必要文書タイプでハイライトする単語の部分についてはクロスハッチング枠で、不要文書タイプについては斜線ハッチング枠で、未読文書タイプについてはハッチングなしの枠で、それぞれハイライトを行う例を示した。 In FIG. 5, in order to exemplify how the word highlighting method is changed for each type, an unread document is displayed in a cross-hatching frame for a portion of a word to be highlighted in a necessary document type and in a hatched hatch frame for an unnecessary document type. An example of highlighting each type with a frame without hatching is shown.
図5に例示するような表示状態において、ユーザは、単語にハイライトが付加された文書群を閲覧しながら、ハイライトされた単語を中心に拾い読みすることができ、更に、未分類の文書へ分類を付与していくことができる。その際、例えば、必要に応じてハイライトされた単語の周辺単語も合わせて読むこともできる。 In the display state illustrated in FIG. 5, the user can browse the highlighted word while browsing the document group with the highlighted word, and further to the unclassified document. Classification can be given. At that time, for example, if necessary, peripheral words of the highlighted word can be read together.
図6に、本実施形態の拾い読み支援システムの処理手順の一例を示す。 FIG. 6 shows an example of the processing procedure of the browsing support system of this embodiment.
ステップS1において、テキスト表示部103は、初期的に文書を表示する。
In step S1, the
図7に、図2に例示した文書を表示した例を示す。 FIG. 7 shows an example in which the document illustrated in FIG. 2 is displayed.
なお、この初期の段階では、分類情報記憶部106に記憶される文書分類情報は、図3(a)又は図3(b)に例示したようになる。また、スコア付単語リストは、図4に例示したようになる。
In this initial stage, the document classification information stored in the classification
ステップS2において、ユーザ入力部104は、ユーザから文書分類情報{文書ID,分類タイプ}の入力を受け付ける。
In step S2, the
ステップS3において、入力された上記の文書分類情報{文書ID,分類タイプ}を、分類情報記憶部106に記録する。
In step S 3, the input document classification information {document ID, classification type} is recorded in the classification
ここでは、図2の文書ID=0001〜0003の各文書に対して、それぞれ、「不要文書タイプ」「不要文書タイプ」「必要文書タイプ」がユーザにより入力されているものとすると、分類情報記憶部106に記憶された文書分類情報例は、図3(a)については図8(a)に例示するようになり、図3(b)については図8(b)に例示するようになる。
Here, it is assumed that “unnecessary document type”, “unnecessary document type”, and “necessary document type” are input by the user for each document ID = 0001 to 0003 in FIG. Examples of document classification information stored in the
なお、ステップS4において、終了条件が成立したならば、処理を終了し、終了条件が成立していないならば、次のステップS5に進む。 In step S4, if the end condition is satisfied, the process is ended. If the end condition is not satisfied, the process proceeds to the next step S5.
終了条件には、種々のものが考えられる。例えば、文書データ記憶部105に記憶されている文書の文書数がNである場合に、N個の文書すべてについて上記の文書分類情報{文書ID,分類タイプ}がユーザにより入力されたことを終了条件としても良いし、あるいは、上記の文書分類情報{文書ID,分類タイプ}がユーザにより入力された文書の数をcとして、(N−c)の値(すなわち、まだユーザにより分類タイプが付与されていない文書の数)が、予め定められた閾値を下回ったことを終了条件としても良い。もちろん、これらに制限されない。
Various termination conditions can be considered. For example, when the number of documents stored in the document
さて、ステップS4において、終了条件が成立していないならば、以下の一連の処理が行われる。 In step S4, if the end condition is not satisfied, the following series of processing is performed.
ステップS5において、拾い読み単語抽出部101の処理を行って、スコア付単語リストを作成する。
In step S5, the browsing
例えば、「不要文書タイプ」用のスコア付単語リストが図9(a)に例示するようになり、「必要文書タイプ」用のスコア付単語リストが図9(b)に例示するようになる。なお、a1,a2,b1,b2はそれぞれのスコア値を示している。また、各スコア付単語リストは、スコア順にソートされても良い。 For example, a scored word list for “unnecessary document type” is illustrated in FIG. 9A, and a scored word list for “necessary document type” is illustrated in FIG. 9B. Here, a1, a2, b1, and b2 indicate the respective score values. Each scored word list may be sorted in the order of score.
ステップS6において、ハイライト箇所特定部102の処理を行って、各文書中のハイライト箇所を特定する。
In step S6, the highlight
ステップS7において、テキスト表示部103の処理を行って、テキスト表示(のハイライト状態)を更新する(例えば後で説明する図13参照)。
In step S7, the
以下、拾い読み単語抽出部101、ハイライト箇所特定部102、テキスト表示部103の各処理について順番に詳しく説明する。
Hereafter, each process of the browsing
まず、拾い読み単語抽出部101について説明する。
First, the browsing
拾い読み単語抽出部101は、文書データと既知の分類とから、拾い読みに適した単語を抽出するモジュールである。
The browsing
図10に、拾い読み単語抽出部101の処理手順の一例を示す。
FIG. 10 shows an example of the processing procedure of the browsing
ステップS11において、拾い読み単語抽出部101は、文書データ記憶部105及び分類情報記憶部106から、文書データとそれに対してユーザにより付与された分類を読み込む。
In step S <b> 11, the browsing
ステップS12において、各文書の分類及び各文書の単語から、拾い読み単語としてのスコアを計算する。 In step S12, a score as a browsing word is calculated from the classification of each document and the word of each document.
ステップS13において、スコア順に単語をソートし、上位の単語を拾い読み単語候補とし、ステップS14において、拾い読み単語候補とそのスコアを出力する。 In step S13, the words are sorted in the order of the scores, and the upper word is used as a reading word candidate. In step S14, the reading word candidate and its score are output.
拾い読み単語のスコア計算として、例えば、次のような式で計算を行っても良い。ここでは、『ある文書D内に出現する単語tを見た場合、この文書Dが文書タイプCであるとすぐに判断できるかどうか』、というスコアとして速判度(t,C)を導入する。
速判度(t,C)=読みコスト(t)×判別度(t,C) …(1)
ここで、読みコストとは、人が単語を認識するのにかかるコストを指し、文字長や文字の複雑さなどに依存する。例えば、文字数の逆数(例:1/(文字数))などとする。また、ひらがな・カタカナなどの文字種は、漢字に比べて画数が少なく目につきやすいことを考慮して、スコアを上げるなどの工夫が考えられる(例:k/(文字数))。
As the score calculation of the browsing word, for example, the calculation may be performed by the following formula. Here, the quickness (t, C) is introduced as a score “whether it is possible to immediately determine that the document D is the document type C when the word t appearing in the document D is seen”. .
Speed (t, C) = reading cost (t) × discrimination (t, C) (1)
Here, the reading cost refers to the cost required for a person to recognize a word, and depends on the character length and the complexity of the character. For example, the reciprocal of the number of characters (eg, 1 / (number of characters)) is used. Considering that the character types such as hiragana and katakana have fewer strokes than the kanji and are easily noticeable, it is possible to increase the score (eg, k / (number of characters)).
判別度とは、ある文書タイプCの判別に使える単語であるかの度合いを指す。ある単語が、文書タイプCらしい単語あるいは文書タイプCらしくない単語であれば、判別度は高く、逆に、文書タイプCなのかがわかりにくい単語であれば、判別度は低い。例えば、tf(t)*log(df(t|C)/df(t))*score_pos(t)といった式で計算する。ここで、tf(t)は、単語tの文書D内での単語頻度、df(t|C)は、文書タイプCに分類された文書での、単語tの出る文書数、df(t)は、単語tの出る文書数、score_pos(t)は、単語tの品詞のスコアで例えば単語tが名詞のときの名詞スコアを指す。このとき、名詞のスコアを高く設定するなどして、特定の品詞の単語のスコアが高くなるようにもできる。 The degree of discrimination indicates the degree of whether a word can be used for discrimination of a certain document type C. If a certain word is a word that seems to be a document type C or a word that does not seem to be a document type C, the degree of discrimination is high. For example, the calculation is performed using an expression such as tf (t) * log (df (t | C) / df (t)) * score_pos (t). Here, tf (t) is the word frequency of the word t in the document D, df (t | C) is the number of documents in which the word t appears in documents classified into the document type C, and df (t) Is the number of documents in which the word t appears, and score_pos (t) is the score of the part of speech of the word t, for example, the noun score when the word t is a noun. At this time, the score of a word having a specific part of speech can be increased by setting the score of the noun high.
次に、ハイライト箇所特定部102について説明する。
Next, the highlight
ハイライト箇所特定部102は、各々の文書について、当該文書中で拾い読み単語抽出部101により選択された拾い読み単語候補が出現する箇所を探し、当該文書中でハイライトすべき箇所を選択するモジュールである。
The highlight
図11に、ハイライト箇所特定部104の処理手順の一例を示す。
FIG. 11 shows an example of the processing procedure of the highlight
ここで、Lはハイライト語数の上限、Nは文書数、Mはハイライト単語候補の総数、Xは文書i中のハイライト単語として記憶している単語数である。 Here, L is the upper limit of the number of highlight words, N is the number of documents, M is the total number of highlight word candidates, and X is the number of words stored as highlight words in document i.
まず、ハイライトする箇所が多いと拾い読みにならないため、ハイライト語数の上限Lを設定する。 First, since there is no browsing when there are many highlights, an upper limit L of the number of highlighted words is set.
ステップS21において、ハイライト箇所特定部104は、文書データ記憶部105から文書データを読み込むとともに、拾い読み単語抽出部101の出力する単語リストとスコアを読み込む。
In step S <b> 21, the highlight
ステップS22において、iに1を代入する。 In step S22, 1 is substituted for i.
ステップS23〜S25では、各文書について、各拾い読み単語候補が出現しているかを確認する。 In steps S23 to S25, it is confirmed whether each browsing word candidate appears for each document.
ただし、文書データ記憶部105の総文書数をN、拾い読み単語候補の総数をMとする。
However, the total number of documents in the document
文書iで、単語jがp回出現した場合、ステップS27において、ハイライトする単語位置を、p個の単語jの中から選択する。例えば、初出の箇所を選択する、近傍単語重要度で選択する、複合語に含まれない単語を選択するなどである。ここで、近傍単語重要度とは、単語tの近傍に出現する語の重要度を指す。ハイライト箇所には目が行くため、その近傍にも重要語がある方をよりスコアを高くするものである。なお、重要語の計算には、一般的にキーワード抽出として知られる計算式などを使って計算できる。例えば、近傍単語重要度(ti)を、その周辺の語tjの重要度とtiまでの距離を使いスコア付けし、Σj {tf(tj)*log(N/df(tj))*(1/|j−i|)}といった式で表す。ここで、Nは、全文書数を表し、j−iは単語tiとtjの距離を表す。また、複合語を構成する1単語となっている場合には、1単語だけでは意味をなさない可能性があるため、スコアを低くするなどでもよい。 If the word j appears p times in the document i, the word position to be highlighted is selected from the p words j in step S27. For example, selecting a first appearance, selecting by neighborhood word importance, selecting a word not included in the compound word, and the like. Here, the neighborhood word importance refers to the importance of a word that appears in the vicinity of the word t. Since the highlights are eye-catching, those who have important words in the vicinity also have a higher score. The important words can be calculated using a calculation formula generally known as keyword extraction. For example, the neighboring word importance (ti) is scored using the importance of the neighboring word tj and the distance to ti, and Σj {tf (tj) * log (N / df (tj)) * (1 / | J−i |)}. Here, N represents the total number of documents, and j−i represents the distance between the words ti and tj. In addition, when a single word is included in a compound word, the score may be lowered because only one word may not make sense.
ステップS28では、文書iに対しハイライトする単語とその出現位置を記憶し、ハイライト単語数Xがハイライト語数の上限L以下である間同様の操作を繰り返す。 In step S28, the word to be highlighted with respect to the document i and its appearance position are stored, and the same operation is repeated while the number of highlighted words X is not more than the upper limit L of the number of highlighted words.
ステップS25において条件一致がNoになった場合、ステップS23へ戻り、次の文書i+1に進み、ステップS24〜S28について同様の作業を繰り返す。 If the condition match is No in step S25, the process returns to step S23, proceeds to the next document i + 1, and repeats the same operation for steps S24 to S28.
ステップS21で読み込んだ文書すべてにハイライト箇所特定が終わったならば、ステップS29で各文書のハイライト単語とその位置を出力する。 When the highlight location has been specified for all the documents read in step S21, the highlighted word and its position of each document are output in step S29.
次に、テキスト表示部103について説明する。
Next, the
テキスト表示部103は、文書データ記憶部105の各文書データに対し、ハイライト箇所特定部102で特定したハイライト単語位置をハイライトして表示するモジュールである。
The
図12に、テキスト表示部103の処理手順の一例を示す。
FIG. 12 shows an example of the processing procedure of the
ステップS31において、テキスト表示部103は、文書データ記憶部105の文書データを読み込むとともに、ハイライト箇所特定部102で出力するハイライトの単語とその位置を読み込む。
In step S <b> 31, the
ステップS32において、文書データ中のハイライト箇所にハイライトを施して、各文書データを出力する。 In step S32, the highlighted portion in the document data is highlighted and each document data is output.
図5は、各文書データのハイライトの一例である。 FIG. 5 is an example of highlighting of each document data.
また、図13に、各文書データの他のハイライト例を示す。図13は、図7に例示された文書群のうち、最初の3文書に分類が付与された際の他の文書の表示例である。また、図5と同様、必要文書タイプはクロスハッチング枠で、不要文書タイプは斜線ハッチング枠で、未読文書タイプはハッチングなしの枠でそれぞれハイライトする例を示した。 FIG. 13 shows another highlight example of each document data. FIG. 13 is a display example of another document when a classification is assigned to the first three documents in the document group illustrated in FIG. Further, as in FIG. 5, an example is shown in which the required document type is highlighted with a cross hatched frame, the unnecessary document type is highlighted with a hatched hatched frame, and the unread document type is highlighted with a frame without hatching.
さて、上記のようなハイライト表示された後に、ユーザは更に未分類の文書に対して、分類を付与することができる。 Now, after the highlight display as described above, the user can further assign a classification to an unclassified document.
ユーザ入力部104は、テキスト表示部103で表示した各文書に対し、ユーザが付与する分類を受け付けるモジュールである。図5の各文書に対し、ユーザは分類を付与する(例:「○」「×」)。このとき、ユーザ入力部104がこの分類情報を受け取る。ユーザ入力部104がユーザの付与した分類を受け取ると、続けて101〜103の処理を行い、ハイライト単語の更新を行う。
The
次に、処理の具体的な例を示す。 Next, a specific example of processing will be shown.
図13のような6つの文書1201〜1206が存在した場合で、最初の3つの文書1201〜1203に分類が付与された場合で考える。分類情報記憶部106には、文書1201に「×」、文書1202に「×」、文書1203に「○」が与えられている。
Consider a case in which there are six
この3文書と分類を元に、拾い読み単語抽出部101で、単語抽出を行う。式(1)のscore_posにおいて、名詞について1、それ以外について0である場合に、格文書から名詞を抽出する。文書1201から、「文書」「音声」「指示」「入力」「頻度」「状況」「合成」「売上げ」「スタイル」「出力」「装置」といった名詞を抽出する。同様に、文書1202、文書1203からも名詞を抽出する。そして、抽出された各々の名詞について、式(1)の計算をする。この例では文書数が少なく単語間でスコアがほとんど変わらないため、各名詞が出現する文書の分類に対応する拾い読み単語候補となる。文書1204で上記3文書に出てきた名詞は、「操作」「音声」「出力」である。このうち、「出力」は文書1201中で複合語でしか出てこないため、スコアを下げ、「操作」と「音声」をハイライトするとする。
Based on the three documents and the classification, the browsing
続いて、ハイライト箇所特定部で、文書1204中でハイライトする単語を選ぶ。「操作」は一回しか出現しないため、そのまま選択する。また、「音声」は、「音声出力処理方式」と「音声出力」の2箇所に出現する。この際には、例えば、いずれも複合語なので、より短い「音声出力」の方の「音声」をハイライトすることにし、2回目の「音声」をハイライト箇所とする。
Subsequently, a highlighted word in the
なお、上記では、具体例として日本語を用いて説明したが、本実施形態は他の言語の場合にも同様に適用可能である。 In the above description, Japanese has been described as a specific example. However, the present embodiment can be similarly applied to other languages.
本実施形態によれば、例えば特許調査・文献調査・市場調査などのように多数の文書を漏れなく網羅的に内容を調査したいようなケースにおいて、ユーザが多数の文書(例えばドキュメント本文又はその要約文)のうちの幾つかの文書を読みながら、例えば読んで確認すべき或いは精読すべき文書とそうでない文書等の分類や、分担して読む担当を分けるための分類などを付与し、ユーザによる分類が付与された文書をもとに、例えば未分類の文書から分類判断のための拾い読みに適した単語や、未分類の文書を弁別する根拠となりそうなキーワードなどを抽出し、適切な箇所にハイライト表示やマーカ付与を行って提示することによって、ユーザ自身が行っている拾い読みを効率的に行えるように支援することができる。 According to the present embodiment, in a case where it is desired to comprehensively investigate the contents of a large number of documents without omissions, such as patent research, literature research, market research, etc., the user has a large number of documents (for example, the document text or its summary). While reading some of the documents, for example, the classification of the documents that should be read and confirmed or the documents that should not be read and the documents that are not, and the classification to divide the person in charge to share and give, etc. Based on a document with classification, for example, it extracts words suitable for browsing for classification judgment from unclassified documents and keywords that are likely to serve as a basis for discriminating unclassified documents. By presenting with highlight display or marker addition, it is possible to assist the user in efficiently performing browsing performed by the user himself / herself.
(第2の実施形態)
第2の実施形態では、第1の言語で既に分類が付与されているときに、その分類を利用して、第1の言語とは異なる第2の言語の文書で拾い読み用のキーワードをハイライトする例を示す。
(Second Embodiment)
In the second embodiment, when a classification is already given in the first language, a keyword for browsing is highlighted in a document in a second language different from the first language using the classification. An example is shown.
例えば、第1の言語をユーザの母国語とし、第2の言語を外国語としても良いし、逆に、第2の言語をユーザの母国語とし、第1の言語を外国語としても良い。 For example, the first language may be the user's native language, the second language may be the foreign language, and conversely, the second language may be the user's native language and the first language may be the foreign language.
ここでは、第1の言語を英語、第2の言語を日本語とする場合を例に取りつつ説明する。 Here, the case where the first language is English and the second language is Japanese will be described as an example.
図14に、第2の実施形態に係る支援システムの機能構成例を示す。 FIG. 14 shows a functional configuration example of the support system according to the second embodiment.
図14に示されるように、拾い読み支援システムの構成は、拾い読み単語抽出部101、置換部201、二言語間辞書202、ハイライト箇所特定部102、テキスト表示部103、ユーザ入力部104、第1言語文書データ記憶部203、第1言語分類情報記憶部204、第2言語文書データ記憶部205、第2言語分類情報記憶部206を備える。
As shown in FIG. 14, the browsing support system includes a browsing
第1言語文書データ記憶部203には、第1言語での文書データが保存されている。また、各文書に対応した分類がすでに付与されており、その分類情報が第1言語分類情報記憶部204に保存されている。
The first language document
拾い読み単語抽出部101は、基本的には第1の実施形態と同様にして、第1言語文書データ記憶部203及び第1言語分類情報記憶部204の情報を読み込み、拾い読み単語抽出を行う。第1言語分類情報記憶部204の内容は変化しないので、ここでの抽出は、1回のみ行えば良い。
The browsing
一方、第2言語文書データ記憶部205は、第1の実施形態の文書データ記憶部105に対応し、第2言語分類情報記憶部206は、第1の実施形態の分類情報記憶部106に対応する。拾い読み単語抽出部101は、第2言語文書データ記憶部205及び第2言語分類情報記憶部206について、第1の実施形態と同様の処理を繰り返し行うことになる。
On the other hand, the second language document
拾い読み単語抽出部101で出力された拾い読み単語候補とスコアは、置換部201に入力される。
The browsing word candidate and the score output by the browsing
置換部201は、第1言語文書データ記憶部203及び第1言語分類情報記憶部204を対象として拾い読み単語抽出部101により抽出された第1言語による単語を、(文書データ上の第2言語の単語との対応を付けるために)第2言語の単語に置き換えるためのモジュールである。
The
置換部201では、第1言語で記載された拾い読み単語候補から、二言語間辞書202を用いて第2言語への翻訳単語を検索し、第2言語の翻訳語を作成する。このとき、第2言語の翻訳語が複数ある単語の場合や、第2言語の翻訳語になる第1言語の単語が他にもある場合には、第1言語から第2言語へ翻訳すると曖昧性が生じている可能性があるため、このような場合にはこの単語の拾い読み単語スコアを下げるなどして、あいまい性のない他の単語を優先する。
The
ハイライト箇所特定部102、テキスト表示部103、ユーザ入力部104の一連の処理は、基本的には第1の実施形態と同様である。ただし、ハイライト箇所特定部102とテキスト表示部103が読み込む文書データは、第2言語文書データ記憶部205、ユーザ入力部104で付与された分類情報を記憶するのは第2言語分類情報記憶部206である。
A series of processes of the highlight
第2の実施形態では、ユーザが分類したい文書データである第2言語の文書データに分類がまだ付与されていない状況でも、ユーザが既に分類を付与した第1言語のデータ、すなわち第1言語文書データ記憶部203と第1言語分類情報記憶部204から、拾い読み単語抽出部101の処理を行うことができる。
In the second embodiment, even in a situation where the classification is not yet given to the second language document data that is the document data that the user wants to classify, the first language data that the user has already given the classification, that is, the first language document The browsing
また、第2言語分類情報記憶部206にデータが追加された後は、第2言語文書データ記憶部205と第2言語分類情報記憶部206のデータから拾い読み単語抽出部101の処理を行うこともできる。
In addition, after the data is added to the second language classification
後者の場合には、置換部201が不要となる(図1の構成に切り替わる)。
In the latter case, the
図15に、拾い読み単語抽出部101の処理手順の一例を示す。
FIG. 15 shows an example of the processing procedure of the browsing
まだ、ユーザにより文書に対して分類が付与されていない初期の状態において処理を行う場合には(ステップS41でYes)、拾い読み単語抽出部101は、第1言語文書データ記憶部203及び第1言語分類情報記憶部204の情報を用いて、第1言語のスコア付単語リストを作成する(ステップS42)。図16に、そのスコア付単語リストの一例を示す。なお、図16(a)のスコア付単語リストは、置換部201及び二言語間辞書202により、単語が第1言語から第2言語へ置換される。図16(b)に、その一例を示す。なお、s1はスコア値を示している。
When processing is performed in an initial state in which no classification is assigned to the document by the user (Yes in step S41), the browsing
ユーザにより少なくとも一つの文書に対して分類が付与された後に処理を行う場合には(ステップS41でNo)、拾い読み単語抽出部101は、第2言語文書データ記憶部205及び第2言語分類情報記憶部206の情報を用いて、第2言語のスコア付単語リストを作成する(ステップS43)。本具体例では、例えば、図9のようになる。そして、ステップS42で既に作成されている第1言語のスコア付単語リスト(単語を置換したもの)と、このステップS43で作成された第2言語のスコア付単語リストとを、マージする。
When processing is performed after classification is given to at least one document by the user (No in step S41), the browsing
なお、予め定められた条件が成立した場合には、ステップS43を行わずに、第2言語のスコア付単語リストのみを使用するようにしても良い。 When a predetermined condition is satisfied, only the second word scored word list may be used without performing step S43.
予め定められた条件は、例えば、第2言語の全文書数をN、第2言語の文書に対してユーザにより分類タイプが付与された文書数をcとして、c/Nが予め定められた値を上回った場合、若しくは、cが予め定められた値を上回った場合、又は、最初に第2言語の文書に対してユーザにより分類タイプが付与されてから、所定の時間が経過した場合など、様々なものが可能である。 The predetermined condition is, for example, a value in which c / N is predetermined, where N is the total number of documents in the second language, and c is the number of documents to which the classification type is assigned by the user to the documents in the second language. When c exceeds a predetermined value, or when a predetermined time has elapsed since the classification type was first assigned to the second language document by the user, etc. Various things are possible.
(第2の実施形態の変形例1)
なお、上記において第1の言語を第2の言語と同じにすることも可能である。この場合には、置換部201及び二言語間辞書202が不要になる。
(
In the above description, the first language can be the same as the second language. In this case, the
(第2の実施形態の変形例2)
第2の実施形態の変形例2では、第2の実施形態で第2言語の文書中の単語をハイライト表示する代わりに、第1言語で単語を翻訳して表示する例を示す。
(
In the second modification of the second embodiment, an example is shown in which a word is translated and displayed in the first language instead of highlighting the word in the document in the second language in the second embodiment.
第2の実施形態の変形例の機能構成例は、図14と同様で構わない。 A functional configuration example of the modification of the second embodiment may be the same as that of FIG.
ただし、置換部201からの出力は、拾い読み単語抽出部101から出力された第1言語の単語の第2言語への翻訳だけでなく、第1言語と第2言語への翻訳のセットにし、ハイライト箇所特定部102へと渡される。
However, the output from the
ハイライト箇所特定部102の処理は、第2の実施例と同様の処理を行うが、その際の出力は、第1言語と第2言語への翻訳のセットにしてテキスト表示部103へ渡される。
The processing of the highlight
テキスト表示部103の処理は、第2の実施形態と異なる。
The processing of the
図17に、テキスト表示部103の処理手順の一例を示す。
FIG. 17 shows an example of the processing procedure of the
ステップS51において、テキスト表示部103は、第2言語文書データと、ハイライト箇所特定部102の出力であるハイライト単語・その単語の第1言語への翻訳語・ハイライト単語位置を入力する。
In step S <b> 51, the
ステップS52において、第2言語文書データを表示するとともに、ハイライト箇所の単語を第1言語への翻訳単語に変換して文中に表示する。 In step S52, the second language document data is displayed, and the highlighted word is converted into a translated word into the first language and displayed in the sentence.
図18に、第2の実施形態の変形例2のスコア付単語リストの例を示す。 FIG. 18 illustrates an example of a word list with scores according to the second modification of the second embodiment.
拾い読み単語抽出部101により生成される第1の言語のスコア付単語リストの例を、(a)に示す。第1の言語の単語を第2の言語に置換し、これを更にスコア付単語リストに追加した例を、(b)に示す。なお、e1はスコア値を示している。
An example of a scored word list in the first language generated by the browsing
拾い読み単語抽出部101により生成される第2の言語のスコア付単語リストの例を、(c)に示す。第2の言語の単語を第1の言語に置換し、これを更にスコア付単語リストに追加した例を、(d)に示す。なお、j1はスコア値を示している。
An example of the second language scored word list generated by the browsing
図19に、第2言語(日本語)の文書を表示する際に、各分類タイプについて抽出された単語について、第1言語(英語)でハイライトする例を示す。また、図19では、更に、必要文書タイプは枠で、不要文書タイプは斜線ハッチング枠で、更なるハイライトを行い、未読文書タイプは第1言語(英語)でのハイライトのみとした例を示している。 FIG. 19 shows an example in which words extracted for each classification type are highlighted in the first language (English) when a document in the second language (Japanese) is displayed. Further, in FIG. 19, the necessary document type is a frame, the unnecessary document type is a hatched hatched frame, and further highlighting is performed, and the unread document type is only highlighted in the first language (English). Show.
(第3の実施形態)
第3の実施形態では、拾い読みに使う単語をユーザ自身が選択する例を示す。
(Third embodiment)
In the third embodiment, an example in which the user himself selects a word used for browsing is shown.
図20に、第3の実施形態に係る支援システムの機能構成例を示す。 FIG. 20 shows a functional configuration example of the support system according to the third embodiment.
図20は、最初にユーザが拾い読みに使う単語を幾つか入力し、それを元に初期動作を始める場合の例である。 FIG. 20 shows an example in which the user first inputs some words used for browsing and starts an initial operation based on the words.
単語入力部301は、ユーザが拾い読みに使う単語の入力を受け付ける。この場合、ユーザによって入力された単語をそのまま拾い読み単語候補とし、この候補語を元にハイライト箇所特定部102でハイライト箇所を特定する。その他の処理は、第1の実施形態と同様である。なお、ユーザ入力部104でユーザ入力後、分類情報記憶部106の更新にともない拾い読み単語抽出部101、ハイライト箇所特定部102、テキスト表示部103の一連の処理が行われる際にも、単語入力部301から新たに単語入力をしても良い。
The
(第4の実施形態)
第4の実施形態では、拾い読みに使う単語をユーザ自身が選択する例を示す。
(Fourth embodiment)
In the fourth embodiment, an example in which the user himself selects a word used for browsing is shown.
図21に、第2の実施形態に係る支援システムの機能構成例を示す。 FIG. 21 shows a functional configuration example of the support system according to the second embodiment.
図21は、拾い読み単語抽出部101で計算された拾い読み単語候補中から、ユーザが拾い読みに使いたい単語を選択する場合の例である。
FIG. 21 shows an example in which the user selects a word that he / she wants to use for browsing from the browsing word candidates calculated by the browsing
拾い読み単語抽出部101、ハイライト箇所特定部102、テキスト表示部103、ユーザ入力部104の処理は、第1の実施形態と同様である。
The processes of the browsing
拾い読み単語選択部401では、拾い読み単語抽出部101で抽出された拾い読み単語候補をユーザに提示する。ユーザは、使いたい拾い読み単語あるいは使いたくない拾い読み単語を選択し、その選択を拾い読み単語選択部401が受け付ける。選択の結果、ユーザに拾い読み単語として使いたい単語の優先度を高くし、ハイライト箇所特定部102へスコア付の単語リストとして入力する。
The browsing
なお、これまでに説明してきた各実施形態や変形例は、任意に組み合わせて実施することが可能である。 It should be noted that the embodiments and modifications described so far can be implemented in any combination.
また、本実施形態(これまで説明してきた各実施形態や変形例又はそれらを任意に組み合わせたもののいずれによっても)、多数の文書の拾い読みを支援することができる。 In addition, the present embodiment (any of the embodiments and modifications described so far, or any combination thereof) can assist in browsing a large number of documents.
また、上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した実施形態の拾い読み支援システムによる効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RWなど)、半導体メモリ、またはこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の拾い読み支援システムと同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合または読み込む場合はネットワークを通じて取得または読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
The instructions shown in the processing procedure shown in the above embodiment can be executed based on a program that is software. A general-purpose computer system stores this program in advance and reads this program, so that the same effect as that obtained by the browsing support system of the above-described embodiment can be obtained. The instructions described in the above-described embodiments are, as programs that can be executed by a computer, magnetic disks (flexible disks, hard disks, etc.), optical disks (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD). ± R, DVD ± RW, etc.), semiconductor memory, or a similar recording medium. As long as the recording medium is readable by the computer or the embedded system, the storage format may be any form. If the computer reads the program from the recording medium and causes the CPU to execute instructions described in the program based on the program, the same operation as the browsing support system of the above-described embodiment can be realized. Of course, when the computer acquires or reads the program, it may be acquired or read through a network.
In addition, the OS (operating system), database management software, MW (middleware) such as a network, etc. running on the computer based on the instructions of the program installed in the computer or embedded system from the recording medium implement this embodiment. A part of each process for performing may be executed.
Furthermore, the recording medium in the present embodiment is not limited to a medium independent of a computer or an embedded system, but also includes a recording medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.
Further, the number of recording media is not limited to one, and when the processing in this embodiment is executed from a plurality of media, it is included in the recording medium in this embodiment, and the configuration of the media may be any configuration.
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
The computer or the embedded system in the present embodiment is for executing each process in the present embodiment based on a program stored in a recording medium. The computer or the embedded system includes a single device such as a personal computer or a microcomputer. The system may be any configuration such as a system connected to the network.
In addition, the computer in this embodiment is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device, and is a generic term for devices and devices that can realize the functions in this embodiment by a program. ing.
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.
101…拾い読み単語抽出部、102…ハイライト箇所特定部、103…テキスト表示部、104…ユーザ入力部、105…文書データ記憶部、106…分類情報記憶部、201…置換部、202…二言語間辞書、203…第1言語文書データ記憶部、204…第1言語分類情報記憶部、205…第2言語文書データ記憶部、206…第2言語分類情報記憶部、301…単語入力部、401…拾い読み単語選択部。
DESCRIPTION OF
Claims (16)
前記複数の文書のうちの全部又は一部を、単語又はフレーズのハイライト表示を伴って又はハイライト表示を伴わずに表示するための表示部と、
表示された前記文書のうちの特定の文書の指示及び予め定められた複数種類の分類タイプのうちから当該特定の文書に付与する特定の分類タイプの指示をユーザから入力するための入力部と、
前記識別情報と前記特定の分類タイプとを対応付けた分類情報を記憶する分類情報記憶部と、
同一の分類タイプが対応付けられている1又は複数の前記文書から、当該分類タイプについてハイライト表示すべき1又は複数の単語又はフレーズを抽出する抽出部と、
前記文書の全部又は一部の各々について、前記抽出部により抽出された各々の単語又はフレーズが当該文書中に存在する場合に当該文書中でハイライト表示すべき箇所を特定する特定部とを備えたことを特徴とする拾い読み支援システム。 A document storage unit for storing a plurality of documents associated with identification information;
A display unit for displaying all or a part of the plurality of documents with or without highlighting of words or phrases;
An input unit for inputting from a user an instruction of a specific document of the displayed document and an instruction of a specific classification type to be given to the specific document among a plurality of predetermined classification types;
A classification information storage unit that stores classification information in which the identification information is associated with the specific classification type;
An extraction unit that extracts one or more words or phrases that should be highlighted for the classification type from one or more of the documents associated with the same classification type;
A specifying unit that specifies a portion to be highlighted in the document when each word or phrase extracted by the extraction unit exists in the document for each of all or a part of the document A browsing support system characterized by that.
前記拾い読み支援システムは、
識別情報が対応付けられた前記特定の言語とは異なる言語で記述された複数の文書を記憶するための異言語文書記憶部と、
前記異言語文書記憶部に記憶された全文書について前記識別情報と予めユーザにより付与された前記分類タイプとを対応付けた分類情報を記憶する異言語分類情報記憶部とを更に備え、
前記抽出部は、前記異言語文書記憶部に記憶された前記文書及び前記異言語分類情報記憶部に記憶された前記分類情報に基づく、前記ハイライト表示すべき1又は複数の前記特定の言語とは異なる言語による単語又はフレーズの抽出をも行い、
前記拾い読み支援システムは、
前記特定の言語とは異なる言語による単語又はフレーズを、前記特定の言語に置き換える置換部を更に備えたことを特徴とする請求項1に記載の拾い読み支援システム。 The document stored in the document storage unit is described in a specific language,
The browsing support system is
A different language document storage unit for storing a plurality of documents described in a language different from the specific language associated with the identification information;
A different language classification information storage unit that stores classification information in which the identification information is associated with the classification type given in advance by the user for all documents stored in the different language document storage unit;
The extraction unit includes the one or more specific languages to be highlighted based on the document stored in the different language document storage unit and the classification information stored in the different language classification information storage unit. Also extracts words or phrases in different languages,
The browsing support system is
The browsing support system according to claim 1, further comprising a replacement unit that replaces words or phrases in a language different from the specific language with the specific language.
前記抽出部は、前記二言語間辞書において前記特定の言語と前記特定の言語とは異なる言語との対応が1対1対応である単語又はフレーズを優先的に抽出することを特徴とする請求項8に記載の拾い読み支援システム。 The replacement unit refers to a bilingual dictionary in which correspondence between the specific language and a language different from the specific language is registered for a plurality of words or phrases, and performs the replacement.
The extraction unit preferentially extracts words or phrases in which correspondence between the specific language and a language different from the specific language is one-to-one correspondence in the bilingual dictionary. 8. A browsing support system according to 8.
前記単語入力部を介して入力された前記単語又はフレーズを、前記抽出部により抽出された前記単語又はフレーズに加えて又はその代わりに利用することを特徴とする請求項1に記載の拾い読み支援システム。 A word input unit for inputting a word or phrase from a user;
The browsing support system according to claim 1, wherein the word or phrase input via the word input unit is used in addition to or instead of the word or phrase extracted by the extraction unit. .
前記拾い読み支援システムは、前記単語又はフレーズの候補を表示するとともに、該表示した候補のうち、前記単語又はフレーズの選択をユーザから入力するための単語選択部を更に備え、
前記抽出部は、前記単語又はフレーズの候補の一部を選択するにあたって、前記単語選択部を介して選択された前記単語又はフレーズをより選択され易くすることを特徴とする請求項1に記載の拾い読み支援システム。 The extraction unit extracts candidates for the word or phrase,
The browsing support system further includes a word selection unit for displaying the word or phrase candidates and inputting a selection of the word or phrase from the user among the displayed candidates.
The said extraction part makes it easier to select the said word or phrase selected via the said word selection part, when selecting the candidate of the said word or phrase. Browsing support system.
前記複数の文書のうちの全部又は一部を、単語又はフレーズのハイライト表示を伴って又はハイライト表示を伴わずに表示し、
表示された前記文書のうちの特定の文書の指示及び予め定められた複数種類の分類タイプのうちから当該特定の文書に付与する特定の分類タイプの指示をユーザから入力し、
前記識別情報と前記特定の分類タイプとを対応付けた分類情報を記憶し、
同一の分類タイプが対応付けられている1又は複数の前記文書から、当該分類タイプについてハイライト表示すべき1又は複数の単語又はフレーズを抽出し、
前記文書の全部又は一部の各々について、前記抽出部により抽出された各々の単語又はフレーズが当該文書中に存在する場合に当該文書中でハイライト表示すべき箇所を特定することを特徴とする拾い読み支援方法。 A browsing support method of a browsing support system including a document storage unit for storing a plurality of documents associated with identification information,
Displaying all or part of the plurality of documents with or without highlighting of words or phrases;
An instruction from a specific document among the displayed documents and a specific classification type instruction to be given to the specific document among a plurality of predetermined classification types are input from the user,
Storing classification information in which the identification information is associated with the specific classification type;
Extracting one or more words or phrases to be highlighted for the classification type from one or more of the documents associated with the same classification type;
For each of all or a part of the document, when each word or phrase extracted by the extraction unit is present in the document, the location to be highlighted in the document is specified. Browsing support method.
識別情報が対応付けられた複数の文書を記憶するための文書記憶部と、
前記複数の文書のうちの全部又は一部を、単語又はフレーズのハイライト表示を伴って又はハイライト表示を伴わずに表示するための表示部と、
表示された前記文書のうちの特定の文書の指示及び予め定められた複数種類の分類タイプのうちから当該特定の文書に付与する特定の分類タイプの指示をユーザから入力するための入力部と、
前記識別情報と前記特定の分類タイプとを対応付けた分類情報を記憶する分類情報記憶部と、
同一の分類タイプが対応付けられている1又は複数の前記文書から、当該分類タイプについてハイライト表示すべき1又は複数の単語又はフレーズを抽出する抽出部と、
前記文書の全部又は一部の各々について、前記抽出部により抽出された各々の単語又はフレーズが当該文書中に存在する場合に当該文書中でハイライト表示すべき箇所を特定する特定部としてコンピュータを機能させるためのプログラム。 A program for causing a computer to function as a browsing support system including a document storage unit for storing a plurality of documents associated with identification information,
A document storage unit for storing a plurality of documents associated with identification information;
A display unit for displaying all or a part of the plurality of documents with or without highlighting of words or phrases;
An input unit for inputting from a user an instruction of a specific document of the displayed document and an instruction of a specific classification type to be given to the specific document among a plurality of predetermined classification types;
A classification information storage unit that stores classification information in which the identification information is associated with the specific classification type;
An extraction unit that extracts one or more words or phrases that should be highlighted for the classification type from one or more of the documents associated with the same classification type;
For each of all or part of the document, when each word or phrase extracted by the extraction unit exists in the document, a computer is used as a specifying unit that specifies a place to be highlighted in the document. A program to make it work.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011070926A JP5259764B2 (en) | 2011-03-28 | 2011-03-28 | Browsing support system, browsing support method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011070926A JP5259764B2 (en) | 2011-03-28 | 2011-03-28 | Browsing support system, browsing support method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012203868A true JP2012203868A (en) | 2012-10-22 |
JP5259764B2 JP5259764B2 (en) | 2013-08-07 |
Family
ID=47184754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011070926A Expired - Fee Related JP5259764B2 (en) | 2011-03-28 | 2011-03-28 | Browsing support system, browsing support method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5259764B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020024559A (en) * | 2018-08-07 | 2020-02-13 | Zホールディングス株式会社 | Information processing program, information processing apparatus, and information processing method |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06348755A (en) * | 1993-06-07 | 1994-12-22 | Hitachi Ltd | Method and system for classifying document |
JP2003122850A (en) * | 2001-10-16 | 2003-04-25 | Yokogawa Electric Corp | View creation system |
JP2006190298A (en) * | 2005-01-07 | 2006-07-20 | Palo Alto Research Center Inc | Method for applying automatically conceptual highlighting to electronic text |
JP2008171164A (en) * | 2007-01-11 | 2008-07-24 | National Institute Of Information & Communication Technology | Classification support apparatus and method, and program |
-
2011
- 2011-03-28 JP JP2011070926A patent/JP5259764B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06348755A (en) * | 1993-06-07 | 1994-12-22 | Hitachi Ltd | Method and system for classifying document |
JP2003122850A (en) * | 2001-10-16 | 2003-04-25 | Yokogawa Electric Corp | View creation system |
JP2006190298A (en) * | 2005-01-07 | 2006-07-20 | Palo Alto Research Center Inc | Method for applying automatically conceptual highlighting to electronic text |
JP2008171164A (en) * | 2007-01-11 | 2008-07-24 | National Institute Of Information & Communication Technology | Classification support apparatus and method, and program |
Non-Patent Citations (2)
Title |
---|
CSNG200400235012; 福田隼人、外2名: 'ユーザ個人の閲覧履歴からのキーワード抽出によるブラウジング支援' 電子情報通信学会技術研究報告(PRMU2001-244〜271) 第101巻,第712号, 20020307, p.85-92, 社団法人電子情報通信学会 * |
JPN6013015547; 福田隼人、外2名: 'ユーザ個人の閲覧履歴からのキーワード抽出によるブラウジング支援' 電子情報通信学会技術研究報告(PRMU2001-244〜271) 第101巻,第712号, 20020307, p.85-92, 社団法人電子情報通信学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020024559A (en) * | 2018-08-07 | 2020-02-13 | Zホールディングス株式会社 | Information processing program, information processing apparatus, and information processing method |
JP7231354B2 (en) | 2018-08-07 | 2023-03-01 | ヤフー株式会社 | Information processing program, information processing apparatus, and information processing method |
Also Published As
Publication number | Publication date |
---|---|
JP5259764B2 (en) | 2013-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4076520B2 (en) | Translation support program and word mapping program | |
CN103430172B (en) | Retrieve device, search method and program | |
JP5501581B2 (en) | Information processing apparatus and information processing method | |
US20090083230A1 (en) | Apparatus and method for supporting information searches | |
JP2005128873A (en) | Question/answer type document retrieval system and question/answer type document retrieval program | |
JP5737079B2 (en) | Text search device, text search program, and text search method | |
JP5338835B2 (en) | Synonym list generation method and generation apparatus, search method and search apparatus using the synonym list, and computer program | |
JP5259764B2 (en) | Browsing support system, browsing support method and program | |
JP5269399B2 (en) | Structured document retrieval apparatus, method and program | |
JP2011103027A (en) | Document display device, document display method, and document display program | |
JP5085584B2 (en) | Article feature word extraction device, article feature word extraction method, and program | |
JP4783563B2 (en) | Index generation program, search program, index generation method, search method, index generation device, and search device | |
JP2005346486A (en) | Document retrieval device | |
JP5511161B2 (en) | Information processing apparatus and information processing method | |
JPS61248160A (en) | Document information registering system | |
JP2005234772A (en) | Documentation management system and method | |
JP5897711B2 (en) | Input support device, input support method, and input support program | |
JP4646078B2 (en) | Apparatus and method for extracting sets of interrelated specific expressions | |
JP2010033156A (en) | Information processor and information processing method | |
JP6884565B2 (en) | Sentence search device, sentence search method and sentence search program | |
JP3498635B2 (en) | Information retrieval method and apparatus, and computer-readable recording medium | |
JPH1011424A (en) | Document preparation support device | |
JP2022085269A (en) | Search device, program, and method for search | |
JP2000148747A (en) | Conversion candidate display method, record medium for program for japanese syllabary-to-chinese character conversion by same method, and japanese syllbary-to- chinese character conversion device | |
JP6551066B2 (en) | Electronic dictionary |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130424 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |