JP2010092323A - Document display system - Google Patents
Document display system Download PDFInfo
- Publication number
- JP2010092323A JP2010092323A JP2008262507A JP2008262507A JP2010092323A JP 2010092323 A JP2010092323 A JP 2010092323A JP 2008262507 A JP2008262507 A JP 2008262507A JP 2008262507 A JP2008262507 A JP 2008262507A JP 2010092323 A JP2010092323 A JP 2010092323A
- Authority
- JP
- Japan
- Prior art keywords
- document
- documents
- feature information
- degree
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は文書を表示する文書表示システムに関する。 The present invention relates to a document display system for displaying a document.
近年、手軽に持ち運び、画面を通じて文書を閲覧出来る携帯端末が実用化されている。この携帯端末を通じて文書を閲覧する場合は、例えば文書が保存されているサーバにアクセスして携帯端末に文書データをダウンロードし、その上で携帯端末の画面で文書を閲覧する。 In recent years, portable terminals that can be easily carried and browsed through a screen have been put into practical use. When browsing a document through this portable terminal, for example, the server in which the document is stored is accessed, the document data is downloaded to the portable terminal, and the document is browsed on the screen of the portable terminal.
また、文書サーバには多数の文書が保存されており、この文書サーバ内をキーワード等により検索し、検索結果をもとにユーザーが指定した文書データを携帯端末にダウンロードするような場合もある。文書を検索する技術としては例えば特許文献1や特許文献2に記載された技術があり、当該技術を応用することにより、検索結果をもとにユーザーが指定した文書データを携帯端末にダウンロードすることが出来る。
ところで、文書サーバ内の所定の文書群に含まれる各々の文書の違いをユーザーが簡易に認識した上で、所定の文書をユーザーが指定して携帯端末で閲覧したいというニーズもある。しかし、特許文献1や特許文献2のような検索技術では、検索した各々の文書の違いを簡易な形態で示すことは出来ない。
Incidentally, there is a need for the user to specify a predetermined document and view it on a portable terminal after the user easily recognizes the difference between the documents included in the predetermined document group in the document server. However, the retrieval techniques such as
そこで、本発明の目的は、所定の文書群における各文書の関係を表示し、所望の文書を閲覧出来る文書表示システムを提供することになる。 Accordingly, an object of the present invention is to provide a document display system that displays the relationship between documents in a predetermined document group and can browse a desired document.
上記目的を達成するため、本発明に係る文書表示システムは、
文書を保存する保存部と、
当該保存部に保存されている文書から構成された所定の文書群において、当該文書群に含まれた各文書の特徴情報を抽出する抽出部と、
当該抽出部により抽出された前記特徴情報に対し、前記文書群に含まれた全文書における共通度合を判断する判断部と、
前記文書群に含まれた各文書を前記特徴情報を用いて表示し、且つ前記共通度合により前記特徴情報の表示方法を変化させる表示部と、
を有することを特徴とするものである。
In order to achieve the above object, a document display system according to the present invention provides:
A storage unit for storing the document;
An extraction unit that extracts feature information of each document included in the document group in a predetermined document group composed of documents stored in the storage unit;
A determination unit that determines the degree of commonality among all documents included in the document group with respect to the feature information extracted by the extraction unit;
A display unit that displays each document included in the document group using the feature information and changes a display method of the feature information according to the degree of commonality;
It is characterized by having.
また、本発明に係る文書表示システムは、
文書を保存する保存部と、
当該保存部に保存されている文書から構成された所定の文書群において、当該文書群に含まれた各文書の特徴情報を抽出する抽出部と、
前記文書群に含まれた基準文書の特徴情報と、前記文書群に含まれた前記基準文書以外の文書の特徴情報と、を比較し、前記基準文書以外の文書の特徴情報に対し、前記基準文書との共通度合を判断する判断部と、
前記文書群に含まれた各文書を前記特徴情報を用いて表示し、且つ前記共通度合により前記特徴情報の表示方法を変化させる表示部と、
を有することを特徴とするものである。
Further, the document display system according to the present invention includes:
A storage unit for storing the document;
An extraction unit that extracts feature information of each document included in the document group in a predetermined document group composed of documents stored in the storage unit;
The feature information of the reference document included in the document group is compared with the feature information of the document other than the reference document included in the document group, and the feature information of the document other than the reference document is compared with the reference information. A determination unit for determining the degree of commonality with a document;
A display unit that displays each document included in the document group using the feature information and changes a display method of the feature information according to the degree of commonality;
It is characterized by having.
本発明に係る文書表示システムによれば、所定の文書群における各文書の関係を表示し、所望の文書を閲覧することが出来る。 According to the document display system of the present invention, it is possible to display the relationship between each document in a predetermined document group and browse a desired document.
[文書表示システムの概要]図1は本発明に係る文書表示システムの概略図である。 [Outline of Document Display System] FIG. 1 is a schematic view of a document display system according to the present invention.
文書表示システムは文書サーバAと携帯端末Bから構成されている。図1に示す文書表示システムにおいて文書サーバAと携帯端末Bは別体であるが、一体化されたものであっても良い。 The document display system includes a document server A and a portable terminal B. In the document display system shown in FIG. 1, the document server A and the portable terminal B are separate bodies, but may be integrated.
文書サーバAは大容量のデータを保存可能であり、文書サーバA内に複数の文書データ(書籍データ等)が保存されている。文書サーバAはオフィス等に設置され、必要に応じて携帯端末Bと通信可能である。 The document server A can store a large amount of data, and a plurality of document data (such as book data) is stored in the document server A. The document server A is installed in an office or the like, and can communicate with the portable terminal B as necessary.
携帯端末Bは、ユーザーが手軽に持ち運び可能な端末(電子ペーパーやモバイルパソコン等)である。携帯端末Bは内部に複数の文書を保存可能であり、携帯端末Bの表示部204において保存された文書が表示される。携帯端末Bに保存された文書のうち表示部204に表示させる文書は、選択部205を通じてユーザーが選択する。
The mobile terminal B is a terminal (such as electronic paper or a mobile personal computer) that can be easily carried by the user. The mobile terminal B can store a plurality of documents therein, and the stored document is displayed on the
また、携帯端末Bは文書サーバAと通信可能であり、文書サーバAに保存されている文書を必要に応じてダウンロードする。ダウンロードした文書は携帯端末B内に保存され、必要な場合にユーザーの選択により表示される。 The mobile terminal B can communicate with the document server A, and downloads a document stored in the document server A as necessary. The downloaded document is stored in the portable terminal B, and is displayed by the user's selection when necessary.
なお、携帯端末BをUSBやIEEE1394で文書サーバAに直に接続し、文書サーバAに保存されている文書を文書サーバAから携帯端末Bに転送させるようにしてもよい。また、無線LANやBluetoothを通じて文書を文書サーバAから携帯端末Bに転送させても良い。 Note that the portable terminal B may be directly connected to the document server A by USB or IEEE 1394, and the document stored in the document server A may be transferred from the document server A to the portable terminal B. Further, the document may be transferred from the document server A to the portable terminal B through a wireless LAN or Bluetooth.
図2は図1に示す文書表示システムのブロック図であり、代表的な構成を示している。 FIG. 2 is a block diagram of the document display system shown in FIG. 1, and shows a typical configuration.
まず、文書サーバAの代表的な構成について説明する。 First, a typical configuration of the document server A will be described.
制御部101は文書サーバAにおける各部の動作を制御するものであり、具体的にはCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等から構成される。
The
通信部102は、携帯端末Bとの間でデータを送信又は受信する。具体的には保存部103に保存された文書のデータを携帯端末Bに送信したり、携帯端末Bにおいて文書サーバAからダウンロードしたい文書の情報を受信したりする。
The
保存部103は、複数の文書を保存しており、ハードディスク等、データを保存出来るものであれば良い。
The
抽出部104は、保存部103に保存されている各文書の特徴を示す特徴情報を抽出するものである。特徴情報を抽出する方法については後述する。
The
判断部105は、抽出部104により抽出された特徴情報が、所定の文書群に含まれた全文書において、どれだけ共通の情報となっているかを示す共通度合を判断するものである。特徴情報を抽出する方法と同様に、共通度合を判断する方法についても後述する。
The
制御部201は携帯端末Bにおける各部の動作を制御するものであり、具体的には文書サーバAの制御部101と同様にCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等から構成される。
The
通信部202は、文書サーバAとの間でデータを送信又は受信する。
The
保存部203は、文書サーバAからダウンロードした文書等を保存するものであり、ハードディスク等、情報を保存出来るものであれば良い。
The
表示部204は、文書サーバAからダウンロードした文書を表示する。表示部204はタッチパネル形式となっており、表示部204に表示された文書に対して書き込み等を行うことが出来る。表示部204は液晶、有機EL、プラズマ等、公知の表示手段である。
The
選択部205は、表示部204に表示させる文書を選択したり、携帯端末Bにおいて実行させる動作を選択したりする。
The
[特徴情報・共通度合を用いた文書表示]文書サーバAに保存されている文書を携帯端末Bにダウンロードし、その文書を携帯端末Bで閲覧する場合、ユーザーが指定した文書群(複数の文書から構成されたもの)に含まれる各々の文書の違いをユーザーが簡易に認識した上で、所定の文書をユーザーが指定して携帯端末Bで閲覧したいというニーズがある。そこで、本発明に係る文書表示システムでは、ユーザーが指定した文書群に含まれた各文書の特徴を示す特徴情報を抽出し、各々の文書の違いをユーザーが簡易に携帯端末上で認識出来るように各文書を表示する。以下、この点について詳しく説明する。 [Document Display Using Feature Information / Common Level] When a document stored in the document server A is downloaded to the portable terminal B and the document is viewed on the portable terminal B, a document group specified by the user (a plurality of documents There is a need for the user to easily recognize the difference between the documents included in the document) and to view the specified document on the portable terminal B by the user. Therefore, in the document display system according to the present invention, feature information indicating the characteristics of each document included in the document group designated by the user is extracted so that the user can easily recognize the difference between the documents on the portable terminal. To display each document. Hereinafter, this point will be described in detail.
図3は、文書の特徴情報と、その特徴情報の共通度合に基づき、文書群に含まれた各文書を携帯端末Bで表示するための文書サーバAにおける動作を示すフローチャート図である。なお、図3における判断ステップ(ステップS1、S5、S7)は、文書サーバAにおける制御部101により実行される。
FIG. 3 is a flowchart showing an operation in the document server A for displaying each document included in the document group on the portable terminal B based on the document feature information and the degree of commonality of the feature information. 3 is executed by the
まず、携帯端末Bにおいて、文書サーバAの保存部103に保存されている複数の文書から所定の文書群がユーザーによって指定される。所定の文書群を指定する方法としては、例えば文書群が含まれたフォルダを指定する方法、書誌情報により文書群を絞り込んで指定する方法、キーワード検索により指定する方法等がある。
First, in the portable terminal B, a predetermined document group is designated by the user from a plurality of documents stored in the
携帯端末Bにおいて所定の文書群がユーザーによって指定されると、文書サーバAでは携帯端末Bから指定された情報を受信し、所定の文書群が指定されたか否か判断する(ステップS1)。例えば、図4に示すように文書サーバAの保存部103には複数の文書が保存されており、その中で破線Xに示すように所定の範囲に含まれる文書群が携帯端末Bのユーザーによって指定される。
When a predetermined document group is designated by the user in the portable terminal B, the document server A receives the information designated from the portable terminal B, and determines whether or not the predetermined document group is designated (step S1). For example, as shown in FIG. 4, a plurality of documents are stored in the
ステップS1において所定の文書群が指定されたと判断した場合(ステップS1;Yes)、次に文書群に含まれた各文書の特徴情報を抽出する(ステップS2)。 If it is determined in step S1 that a predetermined document group has been designated (step S1; Yes), then feature information of each document included in the document group is extracted (step S2).
文書群に含まれた各文書の特徴情報は、例えば文書中に出現する特徴語である。特徴語とは、その文書の内容を示すものに成り得る語として認識されたものであり、助詞等はその文書の内容を示すものに成り得ないため、特徴語として認識されない。 The feature information of each document included in the document group is, for example, a feature word that appears in the document. A feature word is recognized as a word that can indicate the content of the document, and a particle or the like cannot be recognized as a feature word because it cannot indicate the content of the document.
文書中に出現する特徴語は、文書の内容に対して所定のプログラムにより形態素解析を実行し、また所定のプログラムにより文書に出現する語の品詞を解析することにより抽出される。文書に出現する語の品詞を解析することにより、助詞等は特徴語として認識されない。 The characteristic words appearing in the document are extracted by executing morphological analysis on the contents of the document by a predetermined program and analyzing the part of speech of the word appearing in the document by the predetermined program. By analyzing the part of speech of words appearing in a document, particles and the like are not recognized as feature words.
例えば、ユーザーによって指定された所定の文書群に含まれる文書が以下に示す文書A〜文書Dの4つであったとする。
文書A:
「文書間の類似度を算出し、これにその他の関連情報を加味して関連度を求め、結果を表形式で出力する」
文書B:
「文書間の関連度を、あらかじめ類似度やその他の関連情報を組み合わせて計算しておき、サーバに保持する」
文書C:
「文書間の関連度をもとに、多数の文書に対して自動的にクラスタリングを行い、見やすくグラフで表示する」
文書D:
「文書間の類似度を、語の出現頻度を用いて計算しておく」
このような文書について形態素解析及び品詞解析を実行し、各文書の特徴語を抽出すると、以下のようになる。
文書Aの特徴語:
「文書間」「類似度」「関連情報」「関連度」「表形式」
文書Bの特徴語:
「文書間」「類似度」「関連情報」「関連度」「サーバ」
文書Cの特徴語:
「文書間」「関連度」「自動的」「クラスタリング」「グラフ」
文書Dの特徴語:
「文書間」「類似度」「出現頻度」
以上のように各文書の特徴語を抽出すると、次に各々の特徴語に対して文書群に含まれた全文書における共通度合を判断する(ステップS3)。共通度合とは、例えば文書群に含まれた全文書における特徴語の出現文書数に基づいた度合である。例えば、文書群に含まれる全文書が上記文書A〜文書Dの4つである場合、共通度合は、4つの文書における特徴語の出現文書数に基づいた度合となる。
For example, it is assumed that the documents included in the predetermined document group designated by the user are the following four documents A to D.
Document A:
“Calculate the similarity between documents, add other related information to this to determine the degree of association, and output the results in tabular form”
Document B:
“Calculate the degree of association between documents in advance by combining similarity and other relevant information and store it on the server.”
Document C:
“Based on the degree of association between documents, clustering is automatically performed on a large number of documents and displayed in an easy-to-read graph”
Document D:
“Calculate the similarity between documents using the frequency of words”
When morphological analysis and part-of-speech analysis are performed on such a document and feature words of each document are extracted, the following results are obtained.
Feature words of document A:
"Between documents""Similarity""Relatedinformation""Relevance""Tableformat"
Feature words of document B:
“Between documents” “Similarity” “Related information” “Relevance” “Server”
Feature words of document C:
"Inter-document""Relevance""Automatic""Clustering""Graph"
Feature words of document D:
"Inter-document""Similarity""Appearancefrequency"
When the feature words of each document are extracted as described above, the degree of commonality among all documents included in the document group is determined for each feature word (step S3). The common degree is, for example, a degree based on the number of feature word appearance documents in all documents included in the document group. For example, when all the documents included in the document group are four documents A to D, the common degree is a degree based on the number of appearance documents of feature words in the four documents.
図5(a)は、文書A〜文書Dにおける特徴語と、その特徴語の出現文書数を示す説明図である。特徴語として抽出された「文書間」という語は、文書A〜文書Dの全てにおいて出現しているため出現文書数は「4」となり、特徴語として抽出された「類似度」いう語は、文書A、文書B、文書Dにおいて出現しているため、出現文書数は「3」となる。「表形式」、「サーバ」の特徴語の出現文書数は各々「1」である。 FIG. 5A is an explanatory diagram showing the feature words in the documents A to D and the number of appearance documents of the feature words. Since the word “between documents” extracted as the feature word appears in all of the documents A to D, the number of appearing documents is “4”, and the word “similarity” extracted as the feature word is Since it appears in the document A, the document B, and the document D, the number of appearing documents is “3”. The number of appearance documents of feature words “table format” and “server” is “1”, respectively.
共通度合は、以下の式により算出することが出来る。
共通度合=f(t)/N
f(t):tという特徴語の出現文書数
N:全文書数
「文書間」という特徴語の共通度合は「1(=4/4)」であり、「類似度」という特徴語の共通度合は「0.75(=3/4)」である。図5(b)に文書A〜文書Dにおける特徴語と、その特徴語の共通度合を示す。「表形式」、「サーバ」の特徴語の出現文書数は「0.25(=1/4)」である。
The degree of commonality can be calculated by the following formula.
Common degree = f (t) / N
f (t): Number of appearance documents of feature word t: Number of all documents The common degree of the feature word “between documents” is “1 (= 4/4)”, and the common common feature word “similarity” The degree is “0.75 (= 3/4)”. FIG. 5B shows the feature words in the documents A to D and the common degree of the feature words. The number of appearance documents of feature words “table format” and “server” is “0.25 (= 1/4)”.
共通度合は、各文書の履歴情報を考慮して決定されてもよい。多くの閲覧者が見ている文書はより重要な文書であると判断でき、あまり多くの閲覧者が見ていない文書は重要ではない文書であると判断できる。従って、多くの閲覧者が見ている文書に対しては全体的に共通度合を低めに決定し、他の文書と共通しない独自性のある文書であるようにする。また、あまり多くの閲覧者が見ていない文書に対しては全体的に共通度合を高めに決定し、他の文書と共通する傾向の文書であるようにする。 The degree of commonality may be determined in consideration of history information of each document. A document viewed by many viewers can be determined to be a more important document, and a document that is not viewed by many viewers can be determined to be an unimportant document. Accordingly, the document viewed by many viewers is determined to have a low degree of commonality so that the document is unique and not shared with other documents. In addition, a document that is not viewed by too many viewers is determined to have a high degree of commonality so that the document has a tendency common to other documents.
ステップS3において共通度合を判断すると、文書サーバAから携帯端末Bへ特徴情報(特徴語)と共通度合が送信される(ステップS4)。そして携帯端末Bの表示部204では受信した特徴情報を用いて各文書が表示される。
When the common degree is determined in step S3, the feature information (feature word) and the common degree are transmitted from the document server A to the portable terminal B (step S4). Then, each document is displayed on the
図6は、特徴語を用いて各文書を表示した表示部204の説明図である。図6では上述した文書A〜文書Dが特徴語を用いて携帯端末Bの表示部204に表示されている。
FIG. 6 is an explanatory diagram of the
図6で示すように携帯端末Bの表示部204では文書サーバAから受信した共通度合により特徴語の表示方法を変化させている。即ち、共通度合の数値毎に特徴語の表示色を異ならせている。共通度合の数値が「1」のものは特徴語をRed(赤)で表示し、共通度合の数値が「0.25」のものは特徴語をBlue(青)で表示する。その他の数値のものは特徴語をBlack(黒)で表示する。このように共通度合により特徴語の表示方法を異ならせることにより、各々の文書の違いをユーザーが簡易に携帯端末上で認識出来る。
As shown in FIG. 6, the
なお、特徴語の表示色を変化させるだけでなく、共通度合が高い特徴語の表示サイズを小さくし、共通度合が低い特徴語の表示サイズを大きくするなど、特徴情報の表示サイズを変化させても良い。 In addition to changing the display color of feature words, changing the display size of feature information, such as reducing the display size of feature words with a high degree of commonality and increasing the display size of feature words with a low degree of commonality Also good.
図6に示すような表示に基づき、ユーザーは選択部205を通じてダウンロードしたい文書を選択する。タッチペンにより表示部204に表示されている文書を選択してもよい。
Based on the display as shown in FIG. 6, the user selects a document to be downloaded through the
図3におけるステップS4において特徴情報及び共通度合を送信した後、携帯端末Bでは図6に示すような形態で各文書が表示部204に表示され、文書サーバAでは携帯端末Bより何れかの文書が選択されたという選択情報を通信部102が受信したか否か判断する(ステップS5)。ステップS5において文書の選択情報を受信したと判断すると、文書を携帯端末Bに対して送信する(ステップS6)。
After transmitting the feature information and the common degree in step S4 in FIG. 3, each document is displayed on the
ステップS4において特徴情報及び共通度合を送信した後、所定時間経過しても文書が選択されたという選択情報を受信しなければ動作を終了する。 After transmitting the feature information and the degree of commonness in step S4, the operation is terminated if selection information indicating that a document has been selected is not received even after a predetermined time has elapsed.
以上説明したように、本発明によれば特徴情報と共通度合により各々の文書の違いを表示することにより、所定の文書群における各文書の関係を認識した上で、必要な場合に所望の文書を携帯端末上で閲覧することが出来る。 As described above, according to the present invention, the difference between each document is displayed according to the feature information and the degree of commonality, so that the relationship between the documents in a predetermined document group is recognized, and the desired document is obtained when necessary. Can be viewed on a mobile device.
[基準文書との関係を示した文書表示]携帯端末Bのユーザーが指定した基準文書に対して、所定の文書群に含まれる他の文書がどれだけ共通する特徴情報を有するかを携帯端末Bに表示することも出来る。以下、この点について詳しく説明する。 [Document Display Showing Relationship with Reference Document] For the reference document designated by the user of mobile terminal B, the mobile terminal B shows how much common information other documents included in the predetermined document group have. Can also be displayed. Hereinafter, this point will be described in detail.
図7は、基準文書が指定された場合に、文書群に含まれた各文書を携帯端末Bで表示するための文書サーバAにおける動作を示すフローチャート図である。なお、図7における判断ステップ(ステップS11、S13、S16、S18)は、文書サーバAにおける制御部101により実行される。
FIG. 7 is a flowchart showing an operation in the document server A for displaying each document included in the document group on the portable terminal B when the reference document is designated. Note that the determination steps (steps S11, S13, S16, and S18) in FIG. 7 are executed by the
まず、携帯端末Bにおいて、文書サーバAの保存部103に保存されている複数の文書から所定の文書群がユーザーによって指定される。所定の文書群を指定する方法としては、例えば文書群が含まれたフォルダを指定する方法、書誌情報により文書群を絞り込んで指定する方法、キーワード検索により指定する方法等がある。
First, in the portable terminal B, a predetermined document group is designated by the user from a plurality of documents stored in the
携帯端末Bにおいて所定の文書群がユーザーによって指定されると、文書サーバAでは携帯端末Bから指定された情報を受信し、所定の文書群が指定されたか否か判断する(ステップS11)。 When a predetermined document group is designated by the user in the portable terminal B, the document server A receives information designated from the portable terminal B and determines whether or not the predetermined document group is designated (step S11).
ステップS11において所定の文書群が指定されたと判断した場合(ステップS11;Yes)、次に文書群に含まれた各文書の特徴情報を抽出する(ステップS2)。 If it is determined in step S11 that a predetermined document group has been designated (step S11; Yes), then feature information of each document included in the document group is extracted (step S2).
文書群に含まれた各文書の特徴情報は、前述したように、例えば文書中に出現する特徴語である。 As described above, the feature information of each document included in the document group is, for example, a feature word that appears in the document.
例えば、ユーザーによって指定された所定の文書群に含まれる文書が以下に示す文書A〜文書Cの3つであったとする。
文書A:
「文書間の類似度を算出し、これにその他の関連情報を加味して関連度を求め、結果を表形式で出力する」
文書B:
「文書間の関連度を、あらかじめ類似度やその他の関連情報を組み合わせて計算しておき、サーバに保持する」
文書C:
「文書間の関連度をもとに、多数の文書に対して自動的にクラスタリングを行い、見やすくグラフで表示する」
このような文書について形態素解析及び品詞解析を実行し、各文書の特徴語を抽出すると、以下のようになる。
文書Aの特徴語:
「文書間」「類似度」「関連情報」「関連度」「表形式」
文書Bの特徴語:
「文書間」「類似度」「関連情報」「関連度」「サーバ」
文書Cの特徴語:
「文書間」「関連度」「自動的」「クラスタリング」「グラフ」
ステップS12において所定の文書群に含まれた各文書の特徴情報(特徴語)を抽出すると、次に携帯端末Bから文書サーバAに送信される情報により、基準文書が指定されたか否か判断する(ステップS13)。ここでは文書Aが基準文書として指定されたものとする。
For example, it is assumed that the documents included in a predetermined document group designated by the user are the following three documents A to C.
Document A:
“Calculate the similarity between documents, add other related information to this to determine the degree of association, and output the results in tabular form”
Document B:
“Calculate the degree of association between documents in advance by combining similarity and other relevant information and store it on the server.”
Document C:
“Based on the degree of association between documents, clustering is automatically performed on a large number of documents and displayed in an easy-to-read graph”
When morphological analysis and part-of-speech analysis are performed on such a document and feature words of each document are extracted, the following results are obtained.
Feature words of document A:
"Between documents""Similarity""Relatedinformation""Relevance""Tableformat"
Feature words of document B:
“Between documents” “Similarity” “Related information” “Relevance” “Server”
Feature words of document C:
"Inter-document""Relevance""Automatic""Clustering""Graph"
When the feature information (feature word) of each document included in the predetermined document group is extracted in step S12, it is determined whether or not the reference document is designated by the information transmitted from the portable terminal B to the document server A next. (Step S13). Here, it is assumed that document A is designated as the reference document.
次に基準文書(文書A)の特徴情報と、所定の文書群に含まれた基準文書以外の文書(文書B及び文書C)の特徴情報と、を比較し、基準文書以外の文書の特徴情報に対し、基準文書との共通度合を判断する(ステップS14)。ステップS14における共通度合とは、基準文書以外の文書の特徴語が基準文書の特徴語となっているかどうかの結果である。 Next, the feature information of the reference document (document A) is compared with the feature information of the documents (document B and document C) other than the reference document included in the predetermined document group, and the feature information of the documents other than the reference document is compared. On the other hand, the degree of commonality with the reference document is determined (step S14). The degree of commonality in step S14 is a result of whether or not a feature word of a document other than the reference document is a feature word of the reference document.
ステップS14において共通度合を判断すると、文書サーバAから携帯端末Bへ特徴情報(特徴語)と共通度合が送信される(ステップS15)。そして携帯端末Bの表示部204では受信した特徴情報を用いて基準文書以外の文書が表示される。
When the common degree is determined in step S14, the feature information (feature word) and the common degree are transmitted from the document server A to the portable terminal B (step S15). Then, the
図8は、特徴語を用いて各文書を表示した表示部204の説明図である。図6では上述した基準文書(文書A)以外の文書である文書B、文書Cが特徴語を用いて携帯端末Bの表示部204に表示されている。
FIG. 8 is an explanatory diagram of the
図8で示すように携帯端末Bの表示部204では文書サーバAから受信した共通度合により特徴語の表示方法を変化させている。即ち、基準文書である文書Aの特徴語にもなっている特徴語をRed(赤)で表示し、基準文書である文書Aの特徴語にはなっていない特徴語はBlue(青)で表示する。このように基準文書との共通度合により特徴語の表示方法を異ならせることにより、基準文書と共通するかどうかをユーザーが簡易に携帯端末上で認識出来る。なお、特徴語の表示色を変化させるだけでなく、特徴語の表示サイズを変化させても良い。
As shown in FIG. 8, the
図8に示すような表示に基づき、ユーザーは選択部205を通じてダウンロードしたい文書を選択する。タッチペンにより表示部204に表示されている文書を選択してもよい。
Based on the display as shown in FIG. 8, the user selects a document to be downloaded through the
図7におけるステップS15において特徴情報及び共通度合を送信した後、携帯端末Bでは図8に示すような形態で各文書が表示部204に表示され、文書サーバAでは携帯端末Bより何れかの文書が選択されたという選択情報を通信部102が受信したか否か判断する(ステップS16)。ステップS16において文書の選択情報を受信したと判断すると、文書を携帯端末Bに対して送信する(ステップS17)。
After transmitting the feature information and the common degree in step S15 in FIG. 7, each document is displayed on the
ステップS16において特徴情報及び共通度合を送信した後、所定時間経過しても文書が選択されたという選択情報を受信しなければ動作を終了する。 After transmitting the feature information and the degree of commonality in step S16, the operation is terminated if selection information indicating that a document has been selected is not received even after a predetermined time has elapsed.
なお、本発明は当該実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲における変更や追加があっても本発明に含まれる。 In addition, this invention is not limited to the said embodiment, Even if there exists a change and addition in the range which does not deviate from the summary of this invention, it is contained in this invention.
本実施の形態では、特徴情報として文書中に出現する特徴語を用いているが、必ずしもこれに限らず、例えば、文書の作成者、作成日時、作成者が定めた文書のカテゴリといった書誌的事項、文書中に使用されている図・表・グラフなどのオブジェクト、これらのオブジェクトの工数や文書のサイズに対する割合、文書のフォーマット(箇条書きなのか論文形式なのかプレゼン用使用なのか等)と特徴情報としてもよい。 In the present embodiment, feature words appearing in the document are used as the feature information. However, the present invention is not limited to this. For example, bibliographic items such as the document creator, the creation date and time, and the document category defined by the creator. , Objects such as diagrams, tables, and graphs used in the document, the man-hours of these objects and the ratio to the size of the document, the format of the document (whether it is bulleted, paper-based or used for presentations) and features It may be information.
A 文書サーバ
B 携帯端末
101、201 制御部
102、202 通信部
103、203 保存部
104 抽出部
105 判断部
204 表示部
205 選択部
A Document server
Claims (7)
当該保存部に保存されている文書から構成された所定の文書群において、当該文書群に含まれた各文書の特徴情報を抽出する抽出部と、
当該抽出部により抽出された前記特徴情報に対し、前記文書群に含まれた全文書における共通度合を判断する判断部と、
前記文書群に含まれた各文書を前記特徴情報を用いて表示し、且つ前記共通度合により前記特徴情報の表示方法を変化させる表示部と、
を有することを特徴とする文書表示システム。 A storage unit for storing the document;
An extraction unit that extracts feature information of each document included in the document group in a predetermined document group composed of documents stored in the storage unit;
A determination unit that determines the degree of commonality among all documents included in the document group with respect to the feature information extracted by the extraction unit;
A display unit that displays each document included in the document group using the feature information and changes a display method of the feature information according to the degree of commonality;
A document display system comprising:
前記共通度合は、前記文書群に含まれた全文書における前記特徴語の出現文書数に基づいた度合である請求項1に記載の文書表示システム。 The feature information is a feature word that appears in each document,
The document display system according to claim 1, wherein the common degree is a degree based on the number of appearance documents of the feature word in all documents included in the document group.
当該保存部に保存されている文書から構成された所定の文書群において、当該文書群に含まれた各文書の特徴情報を抽出する抽出部と、
前記文書群に含まれた基準文書の特徴情報と、前記文書群に含まれた前記基準文書以外の文書の特徴情報と、を比較し、前記基準文書以外の文書の特徴情報に対し、前記基準文書との共通度合を判断する判断部と、
前記文書群に含まれた各文書を前記特徴情報を用いて表示し、且つ前記共通度合により前記特徴情報の表示方法を変化させる表示部と、
を有することを特徴とする文書表示システム。 A storage unit for storing the document;
An extraction unit that extracts feature information of each document included in the document group in a predetermined document group composed of documents stored in the storage unit;
The feature information of the reference document included in the document group is compared with the feature information of the document other than the reference document included in the document group, and the feature information of the document other than the reference document is compared with the reference information. A determination unit for determining the degree of commonality with a document;
A display unit that displays each document included in the document group using the feature information and changes a display method of the feature information according to the degree of commonality;
A document display system comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008262507A JP2010092323A (en) | 2008-10-09 | 2008-10-09 | Document display system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008262507A JP2010092323A (en) | 2008-10-09 | 2008-10-09 | Document display system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010092323A true JP2010092323A (en) | 2010-04-22 |
Family
ID=42254963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008262507A Pending JP2010092323A (en) | 2008-10-09 | 2008-10-09 | Document display system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010092323A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012221316A (en) * | 2011-04-11 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | Document topic extraction device, method, and program |
-
2008
- 2008-10-09 JP JP2008262507A patent/JP2010092323A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012221316A (en) * | 2011-04-11 | 2012-11-12 | Nippon Telegr & Teleph Corp <Ntt> | Document topic extraction device, method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112084268B (en) | Method and device for displaying search results and computer storage medium | |
US9990346B1 (en) | Device and method for image search using one or more selected words | |
US7769771B2 (en) | Searching a document using relevance feedback | |
CN107122400B (en) | Method, computing system and storage medium for refining query results using visual cues | |
US20150248429A1 (en) | Generation of visual representations for electronic content items | |
US9342233B1 (en) | Dynamic dictionary based on context | |
US10909202B2 (en) | Information providing text reader | |
US20140379719A1 (en) | System and method for tagging and searching documents | |
US20080104040A1 (en) | Visually intuitive search method | |
WO2014206151A1 (en) | System and method for tagging and searching documents | |
JP2004326216A (en) | Document search system, method and program, and recording medium | |
CN107451139A (en) | File resource methods of exhibiting, device and corresponding smart machine | |
JP2011076566A (en) | Information processor, terminal device, server device, communication system, display control method, program and computer readable recording medium | |
US10055456B2 (en) | Information processing apparatus and non-transitory computer readable medium for displaying an information object | |
US9607105B1 (en) | Content searching techniques | |
JP2015094978A (en) | Electronic device and method | |
US20180089150A1 (en) | Providing location-based font recommendations | |
US20180018389A1 (en) | Method and apparatus for keyword-based text retrieval | |
US9633083B2 (en) | Organizing search results using smart tag inferences | |
US10241988B2 (en) | Prioritizing smart tag creation | |
JP6157965B2 (en) | Electronic device, method, and program | |
JP2010092323A (en) | Document display system | |
JP2007233752A (en) | Retrieval device, computer program and recording medium | |
TWI408564B (en) | Method and human-to-machine interface apparatus for searching files | |
EP3411808A1 (en) | Content item and source detection system |