JP2015035223A - Control program and computer - Google Patents

Control program and computer Download PDF

Info

Publication number
JP2015035223A
JP2015035223A JP2014210325A JP2014210325A JP2015035223A JP 2015035223 A JP2015035223 A JP 2015035223A JP 2014210325 A JP2014210325 A JP 2014210325A JP 2014210325 A JP2014210325 A JP 2014210325A JP 2015035223 A JP2015035223 A JP 2015035223A
Authority
JP
Japan
Prior art keywords
proper noun
document
data
proper
document data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014210325A
Other languages
Japanese (ja)
Inventor
杉山 岳文
Takefumi Sugiyama
岳文 杉山
徹史 小林
Tetsushi Kobayashi
徹史 小林
晶子 岩橋
Akiko Iwahashi
晶子 岩橋
義文 難波
Yoshibumi Nanba
義文 難波
絢子 須藤
Ayako Sudo
絢子 須藤
飯伏 勝俊
Katsutoshi Iifushi
勝俊 飯伏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014210325A priority Critical patent/JP2015035223A/en
Publication of JP2015035223A publication Critical patent/JP2015035223A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To extract and present a proper noun in a document so as to assist in user's new awareness.SOLUTION: A client terminal 1 extracts text data included in document data in parallel to a display process upon acquiring and displaying the document data from a document presentation server 3A, and transmits the text data to a proper noun extraction server 2. A proper noun extraction unit 26 of the proper noun extraction server 2 extracts a proper noun included in the text data from a proper noun DB 21. An additional information acquisition unit 27 extracts additional information for identifying a location of the document data related to the document data, and provides the related location of the document data for use in link destination setting, in a constituent element displayed along with the document data without overlapping a display area with a display area of the document data to the client terminal 1. The client terminal 1 receives the extracted proper noun and the additional information from the proper noun extraction server 2 and displays the extracted proper noun and the additional information.

Description

本発明は,コンピュータに組み込まれたプログラムにより実行される,文書データ表示処理技術に関する。本発明は,特に,コンピュータによって表示された文書データから固有名詞を抽出し,固有名詞または固有名詞に付加された情報を文書データとともに表示させるようにする制御プログラムおよびコンピュータに関する。   The present invention relates to a document data display processing technique executed by a program installed in a computer. The present invention particularly relates to a control program and a computer that extract proper nouns from document data displayed by a computer and display proper nouns or information added to proper nouns together with document data.

ここで,固有名詞とは,人名,地名,商品名などの事物または事象に唯一的に与えられた名称を表すものだけでなく,所定の辞書データベースに定義されている名詞を含むものとする。   Here, proper nouns include not only names that are uniquely given to things or events such as names of people, places, and product names, but also nouns defined in a predetermined dictionary database.

コンピュータで文書が表示されている場合に,文書中の固有名詞を抽出し,固有名詞に紐づけられた別の文書へのハイパーリンクを設定したり,その固有名詞を用いた検索処理を提案したりするなどして,文書閲覧中のユーザの新たな気付きを支援する仕組みが提案されている。   When a document is displayed on a computer, a proper noun in the document is extracted, a hyperlink to another document linked to the proper noun is set, and a search process using the proper noun is proposed. For example, a mechanism for supporting a new awareness of a user who is browsing a document has been proposed.

従来の第1の手法では,文書の提供者は,ユーザから文書閲覧が要求される前に,文書中に含まれる固有名詞を抽出し,必要なリンク情報を設定していた。例えば,百科事典のように,見出し語の意味内容を説明した文書を提供するWebサイトでは,表示された説明文中に含まれた固有名詞に,予めハイパーリンクを設定しておき,ユーザの選択によって,その固有名詞を見出し語とする別の説明文のWebページを参照できるようにしている(非特許文献1参照)。   In the first conventional method, the document provider extracts proper nouns contained in the document and sets necessary link information before the user requests to view the document. For example, in a web site that provides a document explaining the meaning content of a headword, such as an encyclopedia, a hyperlink is set in advance for a proper noun included in the displayed explanatory text, and the user selects it. , The Web page of another explanatory text having the proper noun as a headword can be referred to (see Non-Patent Document 1).

また,従来の第2の手法として,文書中に抽出するべき固有名詞が増加する傾向に対処するため,ユーザが文書を閲覧要求した時点で,対象文書から固有名詞を抽出する手法が提案されていた。
Wikipedia,http://ja.wikipedia.org/wiki/,2007年1月23日
As a second conventional technique, a technique has been proposed in which proper nouns are extracted from a target document when a user requests to browse the document in order to cope with the tendency of increasing proper nouns to be extracted in a document. It was.
Wikipedia, http://en.wikipedia.org/wiki/, January 23, 2007

しかし,従来の第1の手法では,文書の提供側は,ユーザが閲覧する可能性のあるすべての文書に対して予め固有名詞抽出処理を行っておく必要があった。固有名詞は,常にその語彙が増加し続けているため,過去に固有名詞抽出処理を実施した文書データに対しても,語彙の増加にあわせて固有名詞抽出処理をやり直す必要が生じていた。そのため,予め固有名詞抽出処理を実行しておく手法では,処理コストに無駄が大きいという問題があった。   However, in the first conventional method, the document provider side needs to perform proper noun extraction processing in advance for all documents that the user may view. Since the vocabulary of proper nouns is constantly increasing, it has become necessary to redo the proper noun extraction process in response to the increase in vocabulary even for document data that has been subjected to proper noun extraction processing in the past. For this reason, the technique of performing proper noun extraction processing in advance has a problem that the processing cost is wasteful.

また,従来の第2の手法では,増加する固有名詞への対処として,文書データがユーザの閲覧要求時点で固有名詞抽出処理を行うが,文書データ送信前に固有名詞抽出処理を行う必要があった。しかし,ユーザの第一目的は文書閲覧であり,固有名詞を抽出してユーザに気付きを与えるというサービスは,補助的なものにすぎない。第2の手法では,ユーザが文書を閲覧する前に固有名詞抽出の処理時間が発生し,ユーザの閲覧要求に対するレスポンスタイムが悪化するという問題があった。   In the second conventional method, the proper noun extraction process is performed when the document data is requested by the user to deal with the increasing number of proper nouns. However, it is necessary to perform the proper noun extraction process before sending the document data. It was. However, the user's primary purpose is document browsing, and the service of extracting proper nouns to give the user awareness is only an auxiliary. In the second method, there is a problem that the processing time for proper noun extraction occurs before the user browses the document, and the response time for the user's browsing request deteriorates.

また,上記の2つの従来の手法においては,文書を提供するシステムごとに,固有名詞抽出処理機能を持つ必要があった。このため,固有名詞抽出処理で用いる語彙データベースのメンテナンスを文書提供システムごとに行う必要があり,トータルのメンテナンスコストがかかるという問題点があった。   Moreover, in the above two conventional methods, each system that provides a document needs to have a proper noun extraction processing function. For this reason, it is necessary to maintain the vocabulary database used in the proper noun extraction processing for each document providing system, and there is a problem that the total maintenance cost is required.

本発明の目的は,文書閲覧というユーザの主目的に対する応答性能を犠牲にすることなく,文書中の固有名詞を抽出し,固有名詞または固有名詞に付加された付加情報をユーザに提示することによって,ユーザの新たな気付きを支援するデータ処理技術を提供することである。   An object of the present invention is to extract proper nouns in a document and present the user with additional information added to proper nouns without sacrificing the user's main performance of browsing the document. It is to provide a data processing technology that supports new awareness of users.

本発明は,コンピュータに以下の処理を実行させるためのプログラムである。   The present invention is a program for causing a computer to execute the following processing.

本発明に係る制御プログラムを実施するコンピュータは,例えば,文書データを蓄積する文書データ提供装置と固有名詞抽出処理装置との間にクライアントとして介在する。そして,コンピュータに,他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出し,抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定し,前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する。   For example, a computer that executes the control program according to the present invention is interposed as a client between a document data providing apparatus that stores document data and a proper noun extraction processing apparatus. Then, the computer extracts the phrase included in the document information from the document information to be displayed on another computer, and determines the location of the related document information related to the document information based on the extracted phrase. The location of the related document information used for setting the link destination of the component that is specified and is displayed together with the document information without covering the display area of the document information is provided to the other computer.

これにより,ユーザが文書データを閲覧するたびに,固有名詞抽出処理が実行されるため,予め全ての文書データに固有名詞抽出処理を実施したり,固有名詞抽出処理をやり直したりする必要がなくなり,処理コストを軽減することができる。   As a result, the proper noun extraction process is executed every time the user browses the document data, so there is no need to execute the proper noun extraction process on all the document data in advance, or to repeat the proper noun extraction process. Processing costs can be reduced.

また,ユーザが文書データを閲覧しているのと並行して固有名詞抽出処理が行われるので,ユーザに対する文書データ表示のレスポンスタイムを悪化させることがない。   Moreover, since the proper noun extraction process is performed in parallel with the user browsing the document data, the response time of the document data display for the user is not deteriorated.

さらに,本発明が実行されるコンピュータが,クライアントとして,文書提供装置と固有名詞抽出処理装置とを介する構成の場合に,複数の文書提供装置から提供される文書データに対する固有名詞抽出処理を,一つの固有名詞抽出処理装置によって処理することができる。このため,固有名詞抽出処理に用いる辞書データベースの語彙のメンテナンスを一箇所で行えばよいため,文書提供者ごとに固有名詞抽出処理機能を保持および維持するコストをなくすことができる。   Further, when the computer in which the present invention is executed is configured as a client via a document providing device and a proper noun extraction processing device, a proper noun extraction process for document data provided from a plurality of document providing devices is performed. It can be processed by two proper noun extraction processing devices. For this reason, the maintenance of the vocabulary of the dictionary database used for the proper noun extraction processing has only to be performed in one place, so that the cost of maintaining and maintaining the proper noun extraction processing function for each document provider can be eliminated.

また,本発明は,前記固有名詞抽出処理において,テキストデータから抽出した固有名詞を,テキストデータに付与されている文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存する。また,前記固有名詞抽出処理に先だって,受信したテキストデータの文書識別情報と一致する文書識別情報が固有名詞抽出履歴記憶部に保存されているかを判定し,一致する文書識別情報がある場合に,文書識別情報に対応付けられた固有名詞を,固有名詞抽出処理で抽出した固有名詞とすることができる。   Further, according to the present invention, in the proper noun extraction process, the proper noun extracted from the text data is stored in the proper noun extraction history storage unit in association with the document identification information given to the text data. Further, prior to the proper noun extraction process, it is determined whether document identification information that matches the document identification information of the received text data is stored in the proper noun extraction history storage unit, and if there is matching document identification information, The proper noun associated with the document identification information can be the proper noun extracted by the proper noun extraction process.

これにより,文書データの一意性を確認して,固有名詞抽出処理結果のキャッシュ処理を実現する。同一の文書データに対して重複して固有名詞抽出処理を行う必要がなくなり,処理コストをより一層削減することができる。   Thereby, the uniqueness of the document data is confirmed, and the cache processing of the proper noun extraction processing result is realized. It is no longer necessary to perform proper noun extraction processing for the same document data, and the processing cost can be further reduced.

また,本発明は,固有名詞抽出履歴保存処理において,受信したテキストデータに文書識別情報が付与されていない場合に,テキストデータの特徴値を算出し,算出した特徴値にもとづく文書識別情報を付与し,固有名詞抽出処理で抽出した固有名詞をこの文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存することができる。   Further, according to the present invention, in the proper noun extraction history saving process, when the document identification information is not added to the received text data, the feature value of the text data is calculated, and the document identification information based on the calculated feature value is added. The proper noun extracted by the proper noun extraction process can be stored in the proper noun extraction history storage unit in association with the document identification information.

例えば,文書データのサイズ,ハッシュ関数によるハッシュ値などの算出処理,チェックサムの算出処理など複数の手法を組み合わせて,文書データの特徴値を算出し,この特徴値を用いて,固有名詞抽出処理装置側で文書識別情報を割り当て,固有名詞抽出処理の処理結果のキャッシュ処理を実現する。   For example, a feature value of document data is calculated by combining a plurality of methods such as document data size, hash value calculation processing using a hash function, and checksum calculation processing, and proper noun extraction processing is performed using this feature value. Document identification information is assigned on the device side, and cache processing of the processing result of proper noun extraction processing is realized.

これにより,文書提供者が文書データごとに文書識別情報を管理する管理コストを削減することができる。また,文書データに文書識別情報を付け忘れた場合でも文書データの識別が可能となり,重複して固有名詞抽出処理を行う必要がなくなり,処理コストを削減することができる。   Thereby, the management cost for managing document identification information for each document data by the document provider can be reduced. Further, even when the document identification information is forgotten to be added to the document data, the document data can be identified, so that it is not necessary to perform the proper noun extraction process, and the processing cost can be reduced.

また,本発明は,固有名詞表示処理において,抽出された固有名詞を,ユーザ操作を誘導するような所定の態様(誘導態様)による表示となるような構成に変換し,変換した固有名詞を表示することができる。   In the proper noun display processing, the present invention converts the extracted proper noun into a configuration that displays in a predetermined form (guidance form) that guides the user operation, and displays the converted proper noun. can do.

これにより,抽出された固有名詞を,ユーザに新たな気付きを提示するような状態で表示することができる。例えば,抽出された固有名詞を,ハイパーリンクが設定された構成に変換した場合に,ユーザに対し,固有名詞に設定されたリンク情報のクリックを促し,よって固有名詞の詳細情報などを確認させることができる。   Thereby, the extracted proper noun can be displayed in a state in which a new awareness is presented to the user. For example, when the extracted proper noun is converted to a configuration with hyperlinks, the user is prompted to click on the link information set for the proper noun, and thus the detailed information on the proper noun is confirmed. Can do.

また,抽出された固有名詞を,検索キーとする検索処理の実行が設定された構成に変換した場合に,ユーザに対し,固有名詞を検索キーとして直ちに検索処理が実行できる機会を与えて,固有名詞の関連情報を確認させることができる。   In addition, when the extracted proper noun is converted into a configuration in which search processing using the search key is set, the user is given an opportunity to immediately execute the search processing using the proper noun as the search key. You can check related information of nouns.

さらに,本発明は,前記固有名詞抽出処理において,固有名詞が見出し語として定義された当該固有名詞の付加情報を記憶する前記辞書データベースを用いて,テキストデータから見出し語として存在する固有名詞およびその付加情報を抽出する処理が実行される場合に,前記固有名詞表示処理において,抽出された固有名詞および付加情報を受信し,固有名詞と付加情報,または付加情報をもとに構成した情報を,表示装置に表示することができる。   Furthermore, the present invention relates to a proper noun existing as a headword from text data using the dictionary database storing additional information of the proper noun in which the proper noun is defined as a headword in the proper noun extraction process, When processing for extracting additional information is executed, in the proper noun display processing, the extracted proper noun and additional information are received, and the proper noun and additional information, or information configured based on the additional information, It can be displayed on a display device.

単に固有名詞を表示するだけでなく,固有名詞に紐づけられた付加情報を提示することによって,より多くの情報をユーザに提示することができるようになる。   In addition to simply displaying proper nouns, more information can be presented to the user by presenting additional information associated with proper nouns.

例えば,固有名詞の付加情報として,その分類情報(企業名・人名・商品名)などを紐づけることによって,ユーザに有益な情報を知らせることができる。例えば,固有名詞が企業名である場合に,その株価,企業ロゴマーク,企業所在地を示す地図情報などを表示することができ,ユーザに有益な情報を提供することができる。   For example, useful information can be notified to the user by associating the classification information (company name / person name / product name) as additional information of the proper noun. For example, when the proper noun is a company name, its stock price, company logo mark, map information indicating the company location, etc. can be displayed, and useful information can be provided to the user.

また,本発明は,文書データを蓄積する文書提供サーバと,所定の固有名詞を記憶する辞書データベースを備える固有名詞抽出処理サーバと,表示装置を備えるクライアント端末とで構成される文書データ表示処理システムである。   The present invention also provides a document data display processing system comprising a document providing server for storing document data, a proper noun extraction processing server having a dictionary database for storing predetermined proper nouns, and a client terminal having a display device. It is.

クライアント端末では,文書提供サーバから,表示対象の文書データを取得し,文書データを表示装置に表示し,文書データに含まれる全てまたは一部のテキストデータを抽出し,テキストデータを固有名詞抽出処理サーバへ送信する。そして,固有名詞抽出処理サーバから受信した,テキストデータから抽出された固有名詞を,前記文書データと並べて表示装置に表示する。また,固有名詞抽出処理サーバでは,テキストデータから,辞書データベースに存在する固有名詞を抽出し,抽出した固有名詞を前記クライアント端末に送信する。   The client terminal obtains the document data to be displayed from the document providing server, displays the document data on the display device, extracts all or part of the text data contained in the document data, and extracts the proper nouns from the text data. Send to server. The proper noun extracted from the text data received from the proper noun extraction processing server is displayed on the display device along with the document data. The proper noun extraction processing server extracts proper nouns existing in the dictionary database from the text data, and transmits the extracted proper nouns to the client terminal.

なお,本発明にかかるプログラムは,コンピュータが読み取り可能な可搬媒体メモリ,半導体メモリ,ハードディスクなどの適当な記録媒体に格納することができ,これらの記録媒体に記録して提供され,または,通信インタフェースを介して種々の通信網を利用した送受信により提供される。   The program according to the present invention can be stored in an appropriate recording medium such as a portable medium memory, a semiconductor memory, or a hard disk that can be read by a computer. It is provided by transmission and reception using various communication networks via the interface.

本発明によれば,ユーザが文書データを閲覧するたびに,文書データから固有名詞が抽出されるため,予め全文書データから固有名詞を抽出しておく必要がなく,処理コストを軽減することができる。   According to the present invention, since proper nouns are extracted from document data every time a user views the document data, it is not necessary to extract proper nouns from all document data in advance, thereby reducing processing costs. it can.

また,文書データの表示処理と並行して,固有名詞抽出処理が行われるので,表示処理でのレスポンスタイムを悪化させずに,表示の都度,固有名詞を抽出することができる。   Further, since the proper noun extraction process is performed in parallel with the display process of the document data, it is possible to extract the proper noun each time it is displayed without deteriorating the response time in the display process.

さらに,複数の文書提供装置で提供される文書データに対し,一つの固有名詞抽出処理装置で処理することができるため,辞書データベースのメンテナンスコストを軽減することができる。   Furthermore, since document data provided by a plurality of document providing devices can be processed by a single proper noun extraction processing device, the maintenance cost of the dictionary database can be reduced.

よって,文書データの表示処理の応答を損なわずに,閲覧要求ごとの固有名詞抽出処理を実現し,有意な情報によるユーザの気付きを支援することができる。   Therefore, the proper noun extraction processing for each browsing request can be realized without impairing the response of the display processing of the document data, and the user's awareness with significant information can be supported.

本発明の実施の形態における構成例を示す図である。It is a figure which shows the structural example in embodiment of this invention. 本発明の処理の流れを示す図である。It is a figure which shows the flow of a process of this invention. 文書IDによる文書データの管理の例を示す図である。It is a figure which shows the example of management of the document data by document ID. 見出し一覧画面の例を示す図である。It is a figure which shows the example of a heading list screen. 見出しと本文の表示画面の例を示す図である。It is a figure which shows the example of the display screen of a heading and a text. 固有名詞抽出履歴データベースのデータ構成例を示す図である。It is a figure which shows the data structural example of a proper noun extraction log | history database. 固有名詞データベースのデータ構成例を示す図である。It is a figure which shows the example of a data structure of a proper noun database. 文書データに組み込まれた固有名詞と付加情報の表示例を示す図である。It is a figure which shows the example of a display of the proper noun and additional information integrated in document data. 文書管理データベースのデータ構成例を示す図である。It is a figure which shows the data structural example of a document management database. 文書データがブログページの場合の文書データと固有名詞およびその付加情報の表示例を示す図である。It is a figure which shows the example of a display of document data, a proper noun, and its additional information in case document data is a blog page. 文書データがニュースサイトの場合の文書データと固有名詞およびその付加情報の表示例を示す図である。It is a figure which shows the example of a display of document data, proper noun, and its additional information in case document data is a news site.

図1は,本発明の実施の形態における構成例を示す図である。   FIG. 1 is a diagram showing a configuration example in the embodiment of the present invention.

文書データ表示処理システムは,それぞれネットワークNを介してデータを送受信する,クライアント端末1,固有名詞抽出サーバ2,一または複数の文書提供サーバ3(3A,3B,3C)で構成される。   The document data display processing system includes a client terminal 1, a proper noun extraction server 2, and one or a plurality of document providing servers 3 (3A, 3B, 3C) that transmit and receive data via the network N, respectively.

クライアント端末1は,CPUおよびメモリからなるコンピュータであり,ソフトウェアプログラムなどによって構成される,文書表示処理部11,テキスト抽出部12,固有名詞取得部13,および固有名詞表示処理部14を備える。   The client terminal 1 is a computer including a CPU and a memory, and includes a document display processing unit 11, a text extraction unit 12, a proper noun acquisition unit 13, and a proper noun display processing unit 14 configured by software programs and the like.

文書表示処理部11は,文書提供サーバ3から表示対象の文書データを取得し,文書データを表示装置(図示しない)に表示する。   The document display processing unit 11 acquires document data to be displayed from the document providing server 3 and displays the document data on a display device (not shown).

テキスト抽出部12は,文書データに含まれる,全てまたは一部のテキストデータを抽出し,このテキストデータを固有名詞抽出サーバ2へ送信する。なお,文書提供サーバ3から取得した文書データに文書識別情報(文書ID)が付与されている場合に,文書IDとテキストデータとを固有名詞抽出サーバ2へ送信する。   The text extraction unit 12 extracts all or part of the text data included in the document data, and transmits this text data to the proper noun extraction server 2. When document identification information (document ID) is added to the document data acquired from the document providing server 3, the document ID and text data are transmitted to the proper noun extraction server 2.

固有名詞取得部13は,固有名詞抽出サーバ2から,文書データから抽出された固有名詞,または,固有名詞とその付加情報とを受信する。   The proper noun acquisition unit 13 receives the proper noun extracted from the document data, or the proper noun and its additional information from the proper noun extraction server 2.

固有名詞表示処理部14は,固有名詞抽出サーバ2から受信した固有名詞を文書データと並べて表示装置に表示する。   The proper noun display processing unit 14 displays the proper noun received from the proper noun extraction server 2 along with the document data on the display device.

また,固有名詞表示処理部14は,固有名詞を,ユーザが操作を誘導されるような所定の誘導態様の表示の構成に変換し,変換した固有名詞を表示装置に表示する。例えば,固有名詞を,所定の参照先へのリンク情報を設定した構成要素に変換し,固有名詞にリンクが設定されていることを示す誘導態様で表示する。または,固有名詞を,この固有名詞を検索条件とする検索処理と関連付けた構成要素に変換し,固有名詞により検索できることを示す誘導態様で表示する。   In addition, the proper noun display processing unit 14 converts the proper noun into a display configuration of a predetermined guidance mode that allows the user to guide the operation, and displays the converted proper noun on the display device. For example, the proper noun is converted into a component in which link information to a predetermined reference destination is set, and is displayed in a guidance mode indicating that a link is set for the proper noun. Alternatively, the proper noun is converted into a component associated with a search process using the proper noun as a search condition, and is displayed in a guidance form indicating that the proper noun can be searched.

さらに,固有名詞表示処理部14は,固有名詞の付加情報,または,付加情報をもとに所定の手順によって構成した情報を表示装置に表示する。   Further, the proper noun display processing unit 14 displays additional information of the proper noun or information configured by a predetermined procedure based on the additional information on the display device.

固有名詞抽出サーバ2は,CPUおよびメモリからなるコンピュータであり,ソフトウェアプログラムなどによって構成される,固有名詞データベース21,文書管理データベース22,固有名詞抽出履歴データベース23,処理要否判定部24,文書ID生成部25,固有名詞抽出部26,および付加情報取得部27を備える。   The proper noun extraction server 2 is a computer including a CPU and a memory, and includes a proper noun database 21, a document management database 22, a proper noun extraction history database 23, a processing necessity determination unit 24, a document ID, and the like configured by software programs. A generation unit 25, a proper noun extraction unit 26, and an additional information acquisition unit 27 are provided.

固有名詞データベース21は,所定の固有名詞を記憶するデータベースである。   The proper noun database 21 is a database that stores predetermined proper nouns.

または,固有名詞データベース21は,固有名詞が見出し語として定義され,その固有名詞の付加情報を記憶するデータベースである。   Alternatively, the proper noun database 21 is a database in which proper nouns are defined as headwords and additional information on the proper nouns is stored.

文書管理データベース22は,文書ID生成部25で算出された,受信したテキストデータの特徴値と,この特徴値にもとづいて付与された仮の文書IDを登録するデータベースである。   The document management database 22 is a database for registering the feature value of the received text data calculated by the document ID generation unit 25 and the provisional document ID assigned based on the feature value.

固有名詞抽出履歴データベース23は,テキストデータから抽出された固有名詞とその文書IDと対応付けて保存するデータベースである。   The proper noun extraction history database 23 is a database stored in association with proper nouns extracted from text data and their document IDs.

処理要否判定部24は,受信したテキストデータに付与された文書ID,または,文書ID生成部によって発行された仮の文書IDと一致する文書ID/仮文書IDが固有名詞抽出履歴データベース23に保存されているかを判定し,一致する文書ID/仮文書IDがある場合に,対応付けられた固有名詞を,固有名詞抽出処理で抽出した固有名詞とする。   The processing necessity determination unit 24 stores in the proper noun extraction history database 23 a document ID / temporary document ID that matches the document ID assigned to the received text data or the temporary document ID issued by the document ID generation unit. It is determined whether it is stored, and if there is a matching document ID / provisional document ID, the associated proper noun is determined as the proper noun extracted by the proper noun extraction processing.

文書ID生成部25は,受信したテキストデータに文書IDが付与されていない場合に,テキストデータの特徴値を算出し,算出した特徴値にもとづいて仮文書IDを発行し,文書管理データベース22に,算出した特徴値と仮文書IDとを登録する。   The document ID generation unit 25 calculates a feature value of the text data when a document ID is not assigned to the received text data, issues a temporary document ID based on the calculated feature value, and stores it in the document management database 22. , The calculated feature value and temporary document ID are registered.

また,文書ID生成部25は,受信したテキストデータの特徴値を算出し,文書管理データベース22に,算出した特徴値に対応する仮文書IDが登録されていれば,仮文書IDを処理要否判定部24へ通知する。   Further, the document ID generation unit 25 calculates the feature value of the received text data, and if the temporary document ID corresponding to the calculated feature value is registered in the document management database 22, the temporary document ID needs to be processed. The determination unit 24 is notified.

固有名詞抽出部26は,テキストデータに所定の言語解析処理を施して語単位に分析し,分析した語のうち,固有名詞データベース21に存在する語を固有名詞として抽出し,この固有名詞をクライアント端末1に送信する。   The proper noun extraction unit 26 performs a predetermined linguistic analysis process on the text data, analyzes the word data, extracts words that exist in the proper noun database 21 as proper nouns from the analyzed words, and extracts the proper nouns from the client. Transmit to terminal 1.

また,固有名詞抽出部26は,テキストデータの語から抽出した固有名詞と文書IDとを対応付けて,固有名詞抽出履歴データベース23に保存する。   Further, the proper noun extraction unit 26 associates the proper noun extracted from the words of the text data with the document ID and stores them in the proper noun extraction history database 23.

付加情報取得部27は,固有名詞抽出部26によって,テキストデータから抽出された固有名詞について,固有名詞を見出し語として付加情報を記憶する固有名詞データベース21から,該当する付加情報を抽出し,抽出した固有名詞およびその付加情報をクライアント端末1に送信する。   The additional information acquisition unit 27 extracts and extracts the corresponding additional information from the proper noun database 21 that stores additional information using the proper noun as a headword for the proper noun extracted from the text data by the proper noun extraction unit 26. The proper noun and its additional information are transmitted to the client terminal 1.

文書提供サーバ3(3A,3B,3C)は,CPUおよびメモリからなるコンピュータであり,蓄積した文書データを,クライアント端末1からの閲覧要求に応じて提供する。   The document providing server 3 (3A, 3B, 3C) is a computer composed of a CPU and a memory, and provides stored document data in response to a browsing request from the client terminal 1.

図2は,本発明の処理の流れを示す図である。   FIG. 2 is a diagram showing a processing flow of the present invention.

文書提供サーバ3Aは,文書データとして,見出しデータおよび本文データからなる新聞記事を蓄積している。文書提供サーバ3Aは,図3に示すように,見出しおよび本文データに文書IDを付与して文書を管理している。   The document providing server 3A stores newspaper articles composed of heading data and text data as document data. As shown in FIG. 3, the document providing server 3A manages documents by assigning document IDs to headings and body data.

ステップS1: 文書提供サーバ3Aは,閲覧要求を発したクライアント端末1に,該当する文書データ(見出し)を送信する。図4に示す見出し一覧画面がクライアント端末1の文書表示処理部11で表示され,見出しh1が選択される。   Step S1: The document providing server 3A transmits the corresponding document data (heading) to the client terminal 1 that has issued the browsing request. The heading list screen shown in FIG. 4 is displayed by the document display processing unit 11 of the client terminal 1, and the heading h1 is selected.

ステップS2: 文書提供サーバ3Aは,見出しh1に対応する本文データb1および文書ID(000001)を出力する。   Step S2: The document providing server 3A outputs the text data b1 and the document ID (000001) corresponding to the heading h1.

ステップS3: 文書表示処理部11では,図5に示すように,見出しh1と本文b1を表示する。   Step S3: The document display processing unit 11 displays the heading h1 and the text b1 as shown in FIG.

ステップS4: ステップS2の表示処理と並行して,テキスト抽出部12は,本文b1からテキストデータ(この場合は,本文データ全て)を取得し,テキストデータと文書IDを,固有名詞抽出サーバ2へ送信する。   Step S4: In parallel with the display process in step S2, the text extraction unit 12 acquires text data (in this case, all body data) from the body b1, and sends the text data and document ID to the proper noun extraction server 2. Send.

ステップS5: 固有名詞抽出サーバ2は,文書IDとテキストデータを受信する。   Step S5: The proper noun extraction server 2 receives the document ID and text data.

ステップS6: 固有名詞抽出サーバ2の処理要否判定部24は,固有名詞抽出履歴データベース23を参照して,文書IDが一致する固有名詞が保存されているかを調べる。   Step S6: The processing necessity determination unit 24 of the proper noun extraction server 2 refers to the proper noun extraction history database 23 to check whether proper nouns having matching document IDs are stored.

図6に,固有名詞抽出履歴データベース23のデータ構成例を示す。固有名詞抽出履歴データベース23には,既に固有名詞抽出処理を行った文書データの文書ID,処理実行日時(抽出日時),抽出された固有名詞(抽出固有名詞)が保存される。なお,文書IDの代わりに,文書データの格納情報(URL)を用いてもよい。   FIG. 6 shows a data configuration example of the proper noun extraction history database 23. The proper noun extraction history database 23 stores the document ID of the document data that has already undergone the proper noun extraction process, the process execution date and time (extraction date and time), and the extracted proper noun (extracted proper noun). Note that storage information (URL) of document data may be used instead of the document ID.

ステップS7: ステップS6の判定処理で,文書IDが一致する固有名詞が保存されていなければ(NO),固有名詞抽出部26は,言語解析処理によりテキストデータから語を抽出し,抽出した語が固有名詞データベース21に存在すれば,その語を固有名詞とする。   Step S7: If the proper noun with the same document ID is not stored in the determination process in step S6 (NO), the proper noun extraction unit 26 extracts a word from the text data by the language analysis process, and the extracted word is If it exists in the proper noun database 21, the word is regarded as a proper noun.

ステップS8: ステップS6の判定処理で,文書IDが一致する固有名詞が保存されていれば(YES),固有名詞抽出履歴データベース23から文書IDが一致する固有名詞を取り出す。さらに,付加情報取得部27は,この固有名詞をもとに,固有名詞データベース21から該当する付加情報を取得する。そして,抽出した固有名詞およびその付加情報を出力する。   Step S8: If the proper noun with the matching document ID is stored in the determination process at step S6 (YES), the proper noun with the matching document ID is extracted from the proper noun extraction history database 23. Further, the additional information acquisition unit 27 acquires corresponding additional information from the proper noun database 21 based on the proper noun. Then, the extracted proper noun and its additional information are output.

ステップS9: 付加情報取得部27は,その固有名詞に対応する付加情報を固有名詞データベース21から取得する。そして,固有名詞と付加情報とを出力する。   Step S9: The additional information acquisition unit 27 acquires additional information corresponding to the proper noun from the proper noun database 21. Then, the proper noun and additional information are output.

図7に,固有名詞データベース21のデータ構成例を示す。   FIG. 7 shows a data configuration example of the proper noun database 21.

固有名詞データベース21には,抽出対象となる固有名詞,その品詞,付加情報が定義されている。例えば,固有名詞pn1は,品詞=人名であり,付加情報として,その人物の別名,プロフィール,生年月日,出身地などの情報が登録されている。また,固有名詞pn2は,品詞=企業名であり,付加情報として,所在地,資本金,経営者名,企業ホームページURLなどの情報が登録されている。   The proper noun database 21 defines proper nouns to be extracted, their parts of speech, and additional information. For example, the proper noun pn1 is a part of speech = person name, and as additional information, information such as the alias, profile, date of birth, and birth place of the person is registered. The proper noun pn2 is part of speech = company name, and information such as location, capital, manager name, company website URL, etc. is registered as additional information.

ステップS10: クライアント端末1の固有名詞取得部13は,固有名詞抽出サーバ2から,固有名詞(pn1,pn2)とその付加情報とを取得する。固有名詞表示処理部14は,図8に示すように,文書表示処理部11によって表示された文書データに,固有名詞と付加情報とを組み込んで表示する。   Step S10: The proper noun acquisition unit 13 of the client terminal 1 acquires the proper nouns (pn1, pn2) and their additional information from the proper noun extraction server 2. As shown in FIG. 8, the proper noun display processing unit 14 incorporates proper nouns and additional information into the document data displayed by the document display processing unit 11 and displays the result.

なお,ステップS4の処理において,テキストデータのみが固有名詞抽出サーバ2へ送信された場合,文書ID生成部25は,テキストデータのサイズ,ハッシュ関数により算出されたハッシュ値,チェックサムから,テキストデータ独自の特徴値を算出する。そして,この特徴値をもとに,仮文書IDを生成し,文書管理データベース22に,特徴値と仮文書IDとを登録する。   When only text data is transmitted to the proper noun extraction server 2 in the process of step S4, the document ID generation unit 25 calculates the text data from the size of the text data, the hash value calculated by the hash function, and the checksum. Calculate unique feature values. Then, a temporary document ID is generated based on the feature value, and the feature value and the temporary document ID are registered in the document management database 22.

また,ステップS1の代わりに,ステップS1’として,クライアント端末1のローカルな領域に保存された文書データから,表示対象の文書データが選択されてもよい。   Further, instead of step S1, as step S1 ', document data to be displayed may be selected from document data stored in a local area of the client terminal 1.

図9に,文書管理データベース22のデータ構成例を示す。文書管理データベース22には,生成した仮文書IDとともに,特徴値算出に用いた各値,データサイズ,ハッシュ値,チェックサムが保存される。   FIG. 9 shows a data configuration example of the document management database 22. The document management database 22 stores each value, data size, hash value, and checksum used for calculating the feature value together with the generated temporary document ID.

図10および図11に,文書データと固有名詞およびその付加情報の表示画面例を示す。   10 and 11 show examples of display screens for document data, proper nouns, and their additional information.

図10は,文書データがブログページの場合の表示画面例である。ブログページが本文を表示するメインページと関連情報やリンクを表示するサイドバーで構成されている場合に,メインページに表示された本文データ(テキストデータ)が固有名詞抽出サーバ2へ送信される。そして,本文データに含まれる固有名詞,例えば,人名(□□□),企業名(■■■),地名(▽▽県○○市)などが抽出される。さらに,固有名詞の付加情報として,人名「□□□」の役職名,企業「■■■」の業種,株価,ホームページのURL,地名「▽▽県○○市」の地図情報などが取得される。これらの固有名詞とその付加情報は,サイドバーの表示に組み込まれて表示される。   FIG. 10 is an example of a display screen when the document data is a blog page. When the blog page is composed of a main page that displays the text and a sidebar that displays related information and links, the text data (text data) displayed on the main page is transmitted to the proper noun extraction server 2. Then, proper nouns included in the text data, such as personal names (□□□), company names (■■■), place names (▽▽ prefecture ○○ city), and the like are extracted. In addition, as additional information of proper nouns, the title of the person name “□□□”, the business type of the company “■■■”, the stock price, the URL of the homepage, the map information of the place name “▽▽ Prefecture ○○ City”, etc. are acquired. The These proper nouns and their additional information are displayed in the sidebar display.

図11は,文書データがニュースサイトの場合の記事表示画面例である。ニュースサイトの記事ページに表示された記事データ(テキストデータ)が固有名詞抽出サーバ2へ送信され,記事データに含まれる固有名詞が抽出される。これらの固有名詞とその付加情報は,記事データのページ上に生成されたポップアップ枠で表示される。   FIG. 11 is an example of an article display screen when the document data is a news site. Article data (text data) displayed on the article page of the news site is transmitted to the proper noun extraction server 2, and proper nouns included in the article data are extracted. These proper nouns and their additional information are displayed in a pop-up frame generated on the article data page.

以上,本発明をその実施の形態により説明したが,本発明はその主旨の範囲において種々の変形が可能であることは当然である。   Although the present invention has been described above with reference to the embodiments, it is obvious that the present invention can be variously modified within the scope of the gist thereof.

本発明の形態および実施例の特徴を列記すると以下のとおりである。   The features of the embodiments and examples of the present invention are listed as follows.

(付記1) 表示装置を備えるコンピュータに,
表示対象の文書データを取得する文書データ取得処理と,
前記文書データを表示装置に表示する文書データ表示処理と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理によって,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理とを,
実行させるための文書データ表示処理プログラム。
(Supplementary note 1) In a computer equipped with a display device,
Document data acquisition processing for acquiring document data to be displayed;
Document data display processing for displaying the document data on a display device;
Text data transmission processing for extracting all or part of text data included in the document data and transmitting the text data to a predetermined proper noun extraction processing device;
In the proper noun extraction processing apparatus, the proper noun extracted from the text data by the proper noun extraction processing for extracting the proper noun existing in the dictionary database from the text data using the dictionary database storing the predetermined proper noun A proper noun display process for receiving a noun and displaying the extracted proper noun alongside the document data;
Document data display processing program for execution.

(付記2) 前記固有名詞抽出処理において,
前記テキストデータから抽出した固有名詞を,前記受信したテキストデータに付与されている文書識別情報と対応付けて固有名詞抽出履歴記憶部に保存する固有名詞抽出履歴保存処理と,
前記固有名詞抽出処理に先だって,前記受信したテキストデータの文書識別情報と一致する文書識別情報が前記固有名詞抽出履歴記憶部に保存されているかを判定し,一致する文書識別情報がある場合に,当該文書識別情報に対応付けられた固有名詞を,前記固有名詞抽出処理で抽出した固有名詞とする処理要否判定処理とを,
実行させることを特徴とする前記付記1に記載の文書データ表示処理プログラム。
(Supplementary Note 2) In the proper noun extraction process,
A proper noun extraction history storage process for storing the proper noun extracted from the text data in association with the document identification information given to the received text data in the proper noun extraction history storage unit;
Prior to the proper noun extraction processing, it is determined whether document identification information that matches the document identification information of the received text data is stored in the proper noun extraction history storage unit, and if there is matching document identification information, A process necessity determination process in which the proper noun associated with the document identification information is the proper noun extracted in the proper noun extraction process;
The document data display processing program according to appendix 1, wherein the document data display processing program is executed.

(付記3) 前記固有名詞抽出履歴保存処理において,前記受信したテキストデータに文書識別情報が付与されていない場合に,前記テキストデータの特徴値を算出し,算出した特徴値にもとづく文書識別情報を付与し,前記固有名詞抽出処理で抽出した固有名詞を当該文書識別情報と対応付けて前記固有名詞抽出履歴記憶部に保存する処理を,
実行させることを特徴とする前記付記2に記載の文書データ表示処理プログラム。
(Supplementary Note 3) In the proper noun extraction history saving process, when document identification information is not given to the received text data, a feature value of the text data is calculated, and document identification information based on the calculated feature value is obtained. A process of assigning and storing the proper noun extracted in the proper noun extraction process in the proper noun extraction history storage unit in association with the document identification information,
The document data display processing program according to appendix 2, which is executed.

(付記4)
固有名詞表示処理において,前記抽出された固有名詞を,ユーザ操作を誘導する所定の態様で表示される構成に変換して表示する処理を,
実行させることを特徴とする前記付記1〜3のいずれか一項に記載の文書データ表示処理プログラム。
(Appendix 4)
In the proper noun display process, a process of converting the extracted proper noun into a configuration that is displayed in a predetermined mode for guiding a user operation, and displaying it.
The document data display processing program according to any one of appendices 1 to 3, wherein the program is executed.

(付記5) 前記固有名詞抽出処理において,前記固有名詞が見出し語として定義された当該固有名詞の付加情報を記憶する前記辞書データベースを用いて,前記テキストデータから前記見出し語として存在する固有名詞および当該固有名詞の付加情報を抽出する処理が実行される場合に,前記固有名詞表示処理において,前記固有名詞抽出処理装置から,前記テキストデータから抽出された固有名詞および付加情報を受信し,前記付加情報または当該付加情報をもとに構成した情報を前記表示装置に表示する処理を,
実行させることを特徴とする前記付記1〜4のいずれか一項に記載の文書データ表示処理プログラム。
(Additional remark 5) In the said proper noun extraction process, the proper noun which exists as the said headword from the said text data using the said dictionary database which memorize | stores the additional information of the said proper noun in which the said proper noun was defined as a headword, and When the process of extracting additional information of the proper noun is executed, the proper noun display processing receives the proper noun and additional information extracted from the text data from the proper noun extraction processing device in the proper noun display processing. A process of displaying information or information configured based on the additional information on the display device;
The document data display processing program according to any one of Supplementary notes 1 to 4, wherein the program is executed.

(付記6) 表示装置を備えるコンピュータに,
表示対象の文書データを取得する文書データ取得処理過程と,
前記文書データを表示装置に表示する文書データ表示処理過程と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理過程と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程と,
前記固有名詞抽出処理装置から,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を,前記文書データと並べて表示する固有名詞表示処理過程とを,
実行させる文書データ表示処理方法。
(Appendix 6) To a computer equipped with a display device,
A document data acquisition process for acquiring the document data to be displayed;
A document data display process for displaying the document data on a display device;
A text data transmission process for extracting all or part of text data included in the document data and transmitting the text data to a predetermined proper noun extraction processing device;
In the proper noun extraction processing device, a proper noun extraction process for extracting proper nouns existing in the dictionary database from the text data using a dictionary database storing predetermined proper nouns;
A proper noun display processing step of receiving a proper noun extracted from the text data from the proper noun extraction processing device and displaying the extracted proper noun side by side with the document data;
Document data display processing method to be executed.

(付記7) 表示対象の文書データを取得する文書データ取得処理部と,
前記文書データを表示装置に表示する文書データ表示処理部と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを所定の固有名詞抽出処理装置へ送信するテキストデータ送信処理部と,
前記固有名詞抽出処理装置において,所定の固有名詞を記憶する辞書データベースを用いて,前記テキストデータから前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理過程によって,前記テキストデータから抽出された固有名詞を受信し,当該抽出された固有名詞を前記文書データと並べて表示する固有名詞表示処理部とを,
備える文書データ表示処理装置。
(Supplementary Note 7) A document data acquisition processing unit that acquires document data to be displayed;
A document data display processing unit for displaying the document data on a display device;
A text data transmission processing unit for extracting all or part of text data included in the document data and transmitting the text data to a predetermined proper noun extraction processing device;
In the proper noun extraction processing device, using a dictionary database storing predetermined proper nouns, the proper noun extraction process for extracting proper nouns existing in the dictionary database from the text data is extracted from the text data A proper noun display processing unit that receives the proper noun and displays the extracted proper noun alongside the document data;
A document data display processing device.

(付記8) 所定の固有名詞を記憶する辞書データベースと,
クライアント端末で表示された文書データに含まれるテキストデータの全部または一部を受信するテキストデータ取得処理部と,
前記テキストデータから,前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と,
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする固有名詞抽出処理装置。
(Supplementary note 8) A dictionary database for storing predetermined proper nouns;
A text data acquisition processing unit for receiving all or part of text data included in the document data displayed on the client terminal;
A proper noun extraction processing unit for extracting proper nouns existing in the dictionary database from the text data;
A proper noun extraction processing device comprising: a processing result transmission processing unit that transmits the extracted proper noun to the client terminal.

(付記9) 文書データを蓄積する文書提供サーバと,所定の固有名詞を記憶する辞書データベースを備える固有名詞抽出処理サーバと,表示装置を備えるクライアント端末とで構成される文書データ表示処理システムであって,
前記クライアント端末に,
前記文書提供サーバから,表示対象の文書データを取得する文書データ取得処理部と,
前記文書データを表示装置に表示する文書データ表示処理部と,
前記文書データに含まれる全てまたは一部のテキストデータを抽出し,当該テキストデータを前記固有名詞抽出処理サーバへ送信するテキストデータ送信処理部と,
前記固有名詞抽出処理サーバから受信した,前記テキストデータから抽出された固有名詞を,前記文書データと並べて表示する固有名詞表示処理部とを備え,
前記固有名詞抽出処理サーバに,
前記テキストデータから,前記辞書データベースに存在する固有名詞を抽出する固有名詞抽出処理部と,
前記抽出した固有名詞を前記クライアント端末に送信する処理結果送信処理部とを備える
ことを特徴とする文書データ表示処理システム。
(Supplementary note 9) A document data display processing system comprising a document providing server for storing document data, a proper noun extraction processing server having a dictionary database for storing predetermined proper nouns, and a client terminal having a display device. And
In the client terminal,
A document data acquisition processing unit for acquiring display target document data from the document providing server;
A document data display processing unit for displaying the document data on a display device;
A text data transmission processing unit for extracting all or part of text data included in the document data and transmitting the text data to the proper noun extraction processing server;
A proper noun display processing unit that displays the proper noun extracted from the text data received from the proper noun extraction processing server alongside the document data;
In the proper noun extraction processing server,
A proper noun extraction processing unit for extracting proper nouns existing in the dictionary database from the text data;
A document data display processing system comprising: a processing result transmission processing unit configured to transmit the extracted proper noun to the client terminal.

1 クライアント端末
11 文書表示処理部
12 テキスト抽出部
13 固有名詞取得部
14 固有名詞表示処理部
2 固有名詞抽出サーバ
21 固有名詞データベース
22 文書管理データベース
23 固有名詞抽出履歴データベース
24 処理要否判定部
25 文書ID生成部
26 固有名詞抽出部
27 付加情報取得部
3(3A,3B,3C) 文書提供サーバ
N ネットワーク
DESCRIPTION OF SYMBOLS 1 Client terminal 11 Document display process part 12 Text extraction part 13 Proper noun acquisition part 14 Proper noun display process part 2 Proper noun extraction server 21 Proper noun database 22 Document management database 23 Proper noun extraction history database 24 Processing necessity judgment part 25 Document ID generation unit 26 proper noun extraction unit 27 additional information acquisition unit 3 (3A, 3B, 3C) document providing server N network

Claims (3)

コンピュータに,
他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出し,
抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定し,
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する,
処理を実行させることを特徴とする制御プログラム。
Computer
Extracting words / phrases contained in the document information from the document information to be displayed on other computers,
Based on the extracted words and phrases, the location of related document information related to the document information is specified,
Providing the other computer with the location of the related document information used for setting a link destination of a component displayed together with the document information without covering the document information display area;
A control program characterized by causing a process to be executed.
コンピュータが,
他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出し,
抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定し,
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する,
処理を実行することを特徴とする制御プログラム。
Computer
Extracting words / phrases contained in the document information from the document information to be displayed on other computers,
Based on the extracted words and phrases, the location of related document information related to the document information is specified,
Providing the other computer with the location of the related document information used for setting a link destination of a component displayed together with the document information without covering the document information display area;
A control program characterized by executing processing.
他のコンピュータでの表示対象となる文書情報から,該文書情報に含まれる語句を抽出する抽出部と,
抽出された前記語句に基づいて,前記文書情報と関連する関連文書情報の所在を特定する特定部と,
前記文書情報の表示領域に被らずに前記文書情報とあわせて表示される構成要素の,リンク先の設定に供される前記関連文書情報の所在を前記他のコンピュータに提供する提供部と,
を備えることを特徴とするコンピュータ。
An extraction unit for extracting words / phrases included in the document information from the document information to be displayed on another computer;
A specifying unit for specifying a location of related document information related to the document information based on the extracted words;
A providing unit for providing the other computer with the location of the related document information used for setting a link destination of a component displayed together with the document information without covering the display area of the document information;
A computer comprising:
JP2014210325A 2014-10-14 2014-10-14 Control program and computer Pending JP2015035223A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014210325A JP2015035223A (en) 2014-10-14 2014-10-14 Control program and computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014210325A JP2015035223A (en) 2014-10-14 2014-10-14 Control program and computer

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007104464A Division JP5657851B2 (en) 2007-04-12 2007-04-12 Document data display processing program, proper noun extraction processing program, document data display processing method, document data display processing device, document data display processing system, display control program, and display control method

Publications (1)

Publication Number Publication Date
JP2015035223A true JP2015035223A (en) 2015-02-19

Family

ID=52543654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014210325A Pending JP2015035223A (en) 2014-10-14 2014-10-14 Control program and computer

Country Status (1)

Country Link
JP (1) JP2015035223A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175299A (en) * 2000-09-29 2002-06-21 Ricoh Co Ltd Information providing method, information providing device, and storage medium for storing information providing program
JP2006302024A (en) * 2005-04-21 2006-11-02 Nippon Telegr & Teleph Corp <Ntt> Relevant document display method and program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175299A (en) * 2000-09-29 2002-06-21 Ricoh Co Ltd Information providing method, information providing device, and storage medium for storing information providing program
JP2006302024A (en) * 2005-04-21 2006-11-02 Nippon Telegr & Teleph Corp <Ntt> Relevant document display method and program

Similar Documents

Publication Publication Date Title
US8869019B1 (en) Method and apparatus for automatic website optimization
US8745067B2 (en) Presenting comments from various sources
US9245008B2 (en) Detecting and executing data re-ingestion to improve accuracy in a NLP system
US20140280295A1 (en) Multi-language information retrieval and advertising
JP5013065B2 (en) Rustic monitoring system, ruling monitoring method and program
US11403271B2 (en) Native application content verification
US9378272B1 (en) Determining correction of queries with potentially inaccurate terms
JP2008186452A (en) Retrieval system and retrieval method
JP5830581B1 (en) Input support server, input support method, and input support program
US20180285444A1 (en) Rewriting contextual queries
JP5657851B2 (en) Document data display processing program, proper noun extraction processing program, document data display processing method, document data display processing device, document data display processing system, display control program, and display control method
KR20100117335A (en) Search relay server requesting search result to search site based on text comprising search word
JP5321777B2 (en) Product search device and product search method having function of presenting reference keyword
US9208232B1 (en) Generating synthetic descriptive text
US9208233B1 (en) Using synthetic descriptive text to rank search results
JP4869311B2 (en) Advertising bid term suggestion device, advertising bid term suggestion system, and advertising bid term suggestion method
US20110072038A1 (en) Web site with content based on referring link information
JP2015035223A (en) Control program and computer
US9607087B1 (en) Providing answer boxes based on query results
JP2014146257A (en) Information processing apparatus, information processing method, and information processing program
US9569530B2 (en) Extracting and mining of quote data across multiple languages
KR101402339B1 (en) System and method of managing document
KR101308821B1 (en) Keyword extraction system for search engines and extracting method thereof
JP4550939B1 (en) Information propagation path identification device, information propagation path identification method, information propagation path identification program
JP2015005050A (en) Retrieval support device and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160216