JP2010198058A - 文書処理システム及び方法 - Google Patents
文書処理システム及び方法 Download PDFInfo
- Publication number
- JP2010198058A JP2010198058A JP2009038797A JP2009038797A JP2010198058A JP 2010198058 A JP2010198058 A JP 2010198058A JP 2009038797 A JP2009038797 A JP 2009038797A JP 2009038797 A JP2009038797 A JP 2009038797A JP 2010198058 A JP2010198058 A JP 2010198058A
- Authority
- JP
- Japan
- Prior art keywords
- node
- document
- graph structure
- structure data
- peripheral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】多種多様の多くの情報のなかから、有用となり得る情報へ容易にアクセスすることができる文書処理システムを提供する。
【解決手段】他の文書へのリンク情報を含む文書に対応する中心ノードと、該文書にリンクされている他の文書に対応する周辺ノードとを含むグラフ構造データであって、各周辺ノードは、当該周辺ノードに対応する他の文書を中心ノードとする他のグラフ構造データにリンクし、当該他のグラフ構造データへの遷移頻度を示す属性情報を有するグラフ構造データを生成し、このグラフ構造データ中の各周辺ノードの属性情報を、記憶手段に記憶されている当該グラフ構造データ中の中心ノードから当該周辺ノードへの遷移回数に基づき更新した後、当該グラフ構造データ中の各周辺ノードが、その属性情報に対応する表示形態で表示される表示文書に変換する。表示文書が表示されている端末で、周辺ノードが選択されると、当該中心ノードから当該周辺ノードへの前記遷移回数を更新する。
【選択図】 図1
【解決手段】他の文書へのリンク情報を含む文書に対応する中心ノードと、該文書にリンクされている他の文書に対応する周辺ノードとを含むグラフ構造データであって、各周辺ノードは、当該周辺ノードに対応する他の文書を中心ノードとする他のグラフ構造データにリンクし、当該他のグラフ構造データへの遷移頻度を示す属性情報を有するグラフ構造データを生成し、このグラフ構造データ中の各周辺ノードの属性情報を、記憶手段に記憶されている当該グラフ構造データ中の中心ノードから当該周辺ノードへの遷移回数に基づき更新した後、当該グラフ構造データ中の各周辺ノードが、その属性情報に対応する表示形態で表示される表示文書に変換する。表示文書が表示されている端末で、周辺ノードが選択されると、当該中心ノードから当該周辺ノードへの前記遷移回数を更新する。
【選択図】 図1
Description
本発明は、文書間の参照関係を表すグラフ構造を生成及び表示するための文書処理システムに関する。
近年、World Wide Web(WWW)、Wikipedia(登録商標)やWeblogのように、互いに参照関係を持つ電子化された文書データは増える一方である。
文書間の参照関係をユーザにわかりやすく表示する方法として、各文書をノード、文書間の参照関係をグラフ表現により図示する方法が知られている。例えば、特許文献1では、ユーザにクリッカブルなノードから構成されるグラフ構造を提示し、ユーザが着目しクリックしたノード(「フォーカス」エンティティ)をグラフの中央に再配置し、そのノードの詳細情報を画面上に展開する技術が開示されている。また、非特許文献1では、インターネットのユーザであれば誰もが書き込める百科辞典であるWikipediaの機能を拡張し、例えば「ロンドンという文書と、イングランドという文書間の関係は、"is capital of"という関係で結ばれる」という知識を、イングランドという文書中に執筆者に明示的に記述させる枠組みが提案されており、これに基づくグラフ表示の例が図示されている。
参照情報をもつ文書を少ない計算量でグラフ表示する方法としては、単一の文書を解析して、この文書を中心ノード(「フォーカス」エンティティ)とする単一のグラフ構造を生成し、これをユーザに提示することが考えられる。すなわち、全文書数(ノード数)をNとしたとき、全ノードの組み合わせ(N(N-1)/2通り)について参照関係の有無を調べ、全ノードを含む巨大なグラフ構造を構築するのではなく、あくまでN回ばらばらに文書を解析して、N個のばらばらなグラフ構造を用意することである。この用途としては、例えば、「女優E」というキーワードで検索を行ったユーザに対して、「女優E」に関するWikipedia情報などを解析することにより得られたグラフ構造を提示することが考えられる。例えば、女優Eに関する文書データ中に、「男性タレントG」への参照があった場合、「女優E」がこのグラフ構造の中心ノードとなり、「男性タレントG」が周辺ノードとなり、中心ノードから周辺ノードへの参照関係を表す矢印が表示されることになる。
ここで、もしユーザが次に「男性タレントG」のノードをクリックすれば、今度は「男性タレントG」に関するWikipedia情報などを解析することにより得られた「男性タレントG」を中心ノードとする新たなグラフ構造を提示することができる。
Volkel, et al.: Semantic Wikipedia, Proceedings of ACM WWW 2006, Edinburgh, Scotland, 2006
前述のクリッカブルなグラフ構造提示インタフェースにおいて、中心ノードに対応する文書が、他の多くの文書と参照関係をもつほど、表示すべき周辺ノードの数は多くなる。この場合、ユーザにとって有用であり、次にクリックされる可能性が高い周辺ノードを表示画面上で目立つように、もしくは優先的に提示できることが望ましい。なぜなら、このような機能がなければ、多くの有用でない周辺ノードの中に、有用な周辺ノードが紛れてしまい、ユーザが有用な周辺ノードを見つけることが難しくなるためである。
本発明はかかる事情を考慮してなされたものであり、複数の周辺ノードのなかからノード選択の手がかりとして、各ユーザに、当該ユーザが過去に何回も選択した周辺ノードや、不特定の多くのユーザが選択した周辺ノードなどの遷移頻度の高い周辺ノードを特に目立つように、または優先的に表示することにより、多種多様の多くの情報のなかから、有用となり得る情報へ容易にアクセスすることができ、これにより所望の情報を容易に収集することができる文書処理システムを提供することを目的とする。
文書処理システムは、他の文書へのリンク情報を含む複数の文書を記憶する第1の記憶手段と;前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書にリンクされている他の文書に対応する周辺ノードとを含むグラフ構造データであって、各周辺ノードは、当該周辺ノードに対応する前記他の文書を中心ノードとする他のグラフ構造データにリンクし、当該他のグラフ構造データへの遷移頻度を示す属性情報を有するグラフ構造データを生成する生成手段と;前記複数の文書のそれぞれに対応する複数のグラフ構造データを記憶する第2の記憶手段と;各グラフ構造データの前記中心ノードから前記周辺ノードへの遷移回数を記憶する第3の記憶手段と;前記第2の記憶手段に記憶されている前記グラフ構造データ中の各周辺ノードの前記属性情報を、当該グラフ構造データ中の中心ノードから当該周辺ノードへの前記遷移回数に基づき更新する更新手段と;前記属性情報の更新されたグラフ構造データを、当該グラフ構造データ中の各周辺ノードが、その属性情報に対応する表示形態で表示される表示文書に変換する変換手段と;前記表示文書が表示されている端末で、該表示文書中の前記周辺ノードが選択されたとき、当該表示文書の中心ノードから当該周辺ノードへの前記遷移回数を更新する集計手段と;を含む。
多種多様の多くの情報のなかから、有用となり得る情報へ容易にアクセスすることができる。
以下、図面を参照しながら本発明の実施形態に係る文書処理システムおよび方法について詳細に説明する。
図1は本実施形態に係る文書処理システム100の概略構成を示すブロック図である。文書処理システム100は、文書収集部1、グラフ構造生成部2、表示文書生成部3、入力部4、ノード履歴集計部5、及び更新部6を含む。文書処理システム100は、ネットワークを介して複数のユーザ端末200と通信可能なように接続される。図1では、文書処理システム100をネットワークに接続された1つのサーバ装置として構成した場合を示しているが、この場合に限らず、複数のサーバ装置で構成されていてもよい。
文書収集部1は、例えば検索エンジンに用いられているクローラあるいはロボットと呼ばれる技術を用いて構成され、World Wide Web (WWW)上の文書やWikipedia(登録商標)の文書のように、他の文書が参照できるように設定されたリンク情報(URI(Uniform Resource Identifier)やURL(Uniform resource Locator)などの情報資源を特定するための情報)が埋め込まれ、当該他の文書がリンクされている文書(参照情報付き文書)をネットワークから収集し、第1の記憶部11に記憶する。あるいは、文書収集部1は、ネットワーク上のある特定のサイトから、参照情報付きの文書を定期的にまたは随時配信してもらい、これを受信して、第1の記憶部11に記憶するようにしてもよい。
第1の記憶部11は、収集された複数の文書が、当該文書を一意に特定するための識別情報(例えば、URIやURLなど)とともに記憶されている。
グラフ構造生成部2は、文書収集部1で収集され、第1の記憶部11に記憶された各文書を解析して、当該文書に対応するグラフ構造を表すグラフ構造データを生成する。そして、当該グラフ構造データを一意に特定するためのグラフ構造識別情報(例えば、URI、URLなど)や、第1の記憶部11に記憶されている複数の文書のうち当該グラフ構造データ(の中心ノード)に対応する文書の識別情報とともに、第2の記憶部12に記憶される。
第1の記憶部11に記憶されている各文書に対し1つのグラフ構造データが生成され、各グラフ構造データは、当該文書を表す1つの中心ノードと、当該文書にリンクされている他の文書を表す周辺ノードとを含む。例えば、各グラフ構造データは、当該文書を表す中心ノード、当該文書にリンクされている他の文書を表す周辺ノードを含むグラフ構造が、例えばXML(Extensible Markup Language)などの構造化文書記述言語を用いて記述されている。各周辺ノードには、ラベルや当該中心ノードから当該周辺ノードへの遷移頻度を示す属性情報(例えばここではエッジ属性情報と呼ぶ)、当該周辺ノードを中心ノードとするグラフ構造データへのリンク情報(例えばここではグラフ構造識別情報)が含まれている。エッジ属性情報は、遷移頻度に応じた表示形態で当該周辺ノードを表示するために用いられる。第1の記憶部11に記憶されている文書について、グラフ構造生成部2で初めてグラフ構造データを生成する場合、例えば、当該エッジ属性情報として予め定められた初期値が与えられる。この属性情報については後述する。
ユーザ端末200からの要求に応じたグラフ構造データをユーザ端末200で表示する際、あるいは、予め定められた時間経過毎に、更新部6は、第2の記憶部12に記憶されている当該グラフ構造データ中の各ノードのエッジ属性情報を、第3の記憶部13に記憶されている遷移履歴情報を基に更新する。更新後のグラフ構造データは、第2の記憶部12に記憶され、また表示文書生成部3へ渡される。
エッジ属性情報が更新されると、当該周辺ノードの表示形態が変化することとなる。表示文書生成部3は、ユーザ端末200からの要求に応じたグラフ構造データをユーザ端末200に表示するために、更新部6でエッジ属性情報の更新されたグラフ構造データを、予め(例えば内部のメモリに)記憶されているスタイルシートなどを適用することで表示用文書(例えば、HTML文書など)に変換する。この表示用文書がユーザ端末200へ送信されると、当該ユーザ端末200のディスプレイにグラフ構造データ中の中心ノードや周辺ノードが所定の表示形態で表示される。
グラフ構造データの表示例を以下に示す。例えば、図2に示す表示例では、中心ノードA1を中心に配し、各エッジ属性情報に応じて該中心ノードA1からの距離が異なる位置に各周辺ノードB1〜B3が表示される。
図3に示す表示例では、各ノードのノード名を宇宙空間内の星に見立てて表示される。すなわち中心ノードA1からの距離が異なる同心円状の複数の軌道C1〜C3のうちの1つの軌道上の星として、各周辺ノードB1〜B3を表示する。このとき、複数の軌道のうち、各エッジ属性情報に応じて、例えば各周辺ノードの軌道が定まる。
図4に示す表示例では、中心ノードA1と周辺ノードB1〜B3とを長さや太さなどが異なる矢印で結び表示される。このとき中心ノードA1と各周辺ノードとを結ぶ矢印の長さや太さなどは、エッジ属性情報に応じて異なる。
グラフ構造データ中の中心ノード及び周辺ノードが、図2〜図4などに示したような表示形態のうちどの表示形態で表示されるかは、表示文書生成部3で適用されるスタイルシートによって決まる。
表示文書生成部3は、更新部6でエッジ属性情報の更新されたグラフ構造データを表示用文書に変換した後、ユーザ端末200へ配信し、ユーザ端末200が備えるディスプレイ等の表示部に、例えば、図2〜図4等に示したように表示させる。ユーザ端末200のディスプレイに表示された、図2〜図4に示すようなグラフ構造中の中心ノードや周辺ノードが、当該ユーザ端末200のユーザにより、マウス等のポインティングデバイスやキーボード等の入力手段を用いて選択されると、当該ユーザ端末200またはそのユーザの識別情報(以下、ユーザ識別情報と呼ぶ)と、選択されたときの日時と、遷移元のノードと遷移先の選択されたノードとに関する情報とを含むノード遷移情報と、当該選択されたノードを中心ノードとするグラフ構造データの識別情報(グラフ構造識別情報)とが、ネットワークを介して入力部4に入力される。
例えば、図3に示したようにグラフ構造が表示されている場合に、ユーザが「女優Y」という周辺ノードB1をマウスクリックしたとき、当該ユーザ識別情報、選択されたときの日時、遷移元の「女優E」という中心ノードA1と、遷移先の「女優Y」という周辺ノードB1とについての情報を含むノード遷移情報と、「女優Y」を中心ノードとするグラフ構造データ識別情報とが、ネットワークを介して入力部4に入力される。
このノード遷移情報は、ノード履歴集計部5に送られ、グラフ構造識別情報は更新部6に送られる。ノード遷移情報がネットワークを介して入力部4に入力される度に、ノード履歴集計部5は、このノード遷移情報から、どのユーザ(ユーザ識別情報)が、どのノードからどのノードに、いつ、何回遷移したかを第3の記憶部13に記録する。そして、図5に示すように、ユーザ識別情報別に、遷移元のノードと遷移先のノード(ノード遷移)、及びこのような遷移の回数を含むユーザ別の遷移履歴を記憶する。
例えば、ユーザ識別情報「abc」、遷移元「女優E」及び遷移先「女優Y」を含むノード遷移情報がノード履歴集計部5に入力されると、第3の記憶部13に記憶されているユーザ識別情報「abc」の「女優E」から「女優Y」へのノード遷移の回数が1つインクリメントされる。
また、ノード履歴集計部5は、全ユーザの間で、どのノードからどのノードに、何回遷移したかを示すノード遷移別の集計を行い、この集計結果を第3の記憶部13に記憶してもよい。例えば、図5に示したようなユーザ別の遷移履歴を全ユーザにわたり集計することで、例えば図6に示すような、ノード遷移別の遷移の回数を求めることができる。
図5のようなユーザ識別情報別の遷移履歴、図6のようなノード遷移別の遷移履歴は、各遷移について、それが実施された日時(ノード遷移情報に含まれる日時)とともに、第3の記憶部13に記憶するようにしてもよい。また、ユーザ端末200から送信されたノード遷移情報をユーザ識別情報別に第3の記憶部13に記憶するようにしてもよい。
更新部6は、例えば入力部14から送られたグラフ構造識別情報を受け取ると、これを用いて第2の記憶部12から、「女優Y」が中心ノードであるグラフ構造データを読み出す。そして、前述同様、当該グラフ構造データ中の各ノードのエッジ属性情報を、第3の記憶部13に記憶されている遷移履歴を基に更新する。更新後のグラフ構造データは、第2の記憶部12に記憶され、また表示文書生成部3へ渡される。
表示文書生成部3は、更新部6でエッジ属性情報の更新されたグラフ構造データを、例えば図3に示すような「宇宙」の表示形態のスタイルシートを適用することで表示用文書(例えば、HTML文書など)に変換する。この表示用文書がユーザ端末200へ送信され、当該ユーザ端末200のディスプレイに、今度は、「女優Y」が中心ノードである「宇宙」が表示される。この「女優Y」が中心ノードであるグラフ構造から、再びある周辺ノードを選択した場合には、上記同様に、当該選択された周辺ノードを中心ノードとする別のグラフ構造の「宇宙」がユーザ端末200に表示される。
次に、図1のグラフ構造生成部2での処理について図7を参照して説明する。グラフ構造生成部2は、文書収集部1が収集した各文書に対して個別に、以下の処理を行う。グラフ構造生成部2は、第1の記憶部11から参照情報付き文書を1つずつ取り出し、第1の記憶部11に記憶されている処理対象の全ての文書について以下の処理を行う。
まず、グラフ構造生成部2は、変数iを「1」に初期化する(ステップS1)。次に、グラフ構造生成部2は、第1の記憶部11に記憶されている処理対象の複数の文書のうちのi(=1)番目の文書を取り出し、i番目の文書から、中心ノードのノード名として用いる文字列を抽出する(ステップS2)。中心ノードのノード名は、例えば、該i番目の文書のタイトルや見出し、表題などである。次に、グラフ構造生成部2は、i番目の文書から、該文書にリンクされている他の文書を検出する(ステップS3)。i番目の文書にリンクされている他の文書を検出した場合には、i番目の文書から、当該他の文書へのリンクが埋め込まれている文字列や画像を、当該他の文書を表す周辺ノードのノード名として抽出する(ステップS4)。さらに、i番目の文書から、上記周辺ノードに付加するラベルとして用いる文字列を抽出する(ステップS5)。例えば、i番目の文書中の上記他の文書へのリンクが埋め込まれている箇所を中心に一定の範囲内の文字列などの文脈情報(例えば、i番目の文書中の上記他の文書へのリンクが埋め込まれている文字列及びその前後にある文字列)を、当該他の文書に対応する周辺ノードに付加するラベルとして抽出する。あるいは、i番目の文書中で上記他の文書へのリンクが埋め込まれている文字列や画像を含む章や節のタイトルをラベルとして抽出する。なお、ステップS5のラベル情報の抽出は必須ではない。従って、ステップS5は省略してもよい。
そして、グラフ構造生成部2は、以上のようにして得られた、i番目の文書を表す中心ノードのノード名、i番目の文書にリンクされている他の文書を表す周辺ノードのノード名、当該周辺ノードのラベル、エッジ属性情報、当該周辺ノードを中心ノードとする他のグラフ構造データへのリンク情報(ここでは例えばグラフ構造識別情報)を含む、i番目の文書に対応するグラフ構造データを生成する。このグラフ構造データは、i番目の文書を表すノード名を有する中心ノードと、i番目の文書にリンクされている他の文書を表すノード名を有する周辺ノードと、そのラベルを含むグラフ構造を、例えば、XML(Extensible Markup Language)などの構造化文書記述言語を用いて記述したものである。エッジ属性情報として予め定められた初期値が与えられている。グラフ構造生成部2は、生成されたグラフ構造データを当該グラフ構造データを一意に特定できる識別情報(ここではグラフ構造識別情報)とともに、第2の記憶部12に記憶し(ステップS7)、変数iを1つインクリメントする(ステップS8)。
以上のステップS2〜ステップS8の処理を、変数iの値が、第1の記憶部11に記憶されている処理対象の文書の総数よりも大きくなるまで繰り返す(ステップS9)。
図8は、図7のグラフ構造生成処理における処理対象の文書(第1の記憶部11に記憶されている文書)の一例を示したもので、「女優E」に関する情報を記述した参照情報付き文書である。図8に示した文書には、「女優Y」をはじめ、「男優S」「男性タレントG」などの文字列に、他の文書がそれぞれリンクされている。なお、図8では、他の文書がリンクされている文字列は、“[[” と “]]” で囲まれている。実際、Wikipedia(登録商標)ではこの形式でリンク情報が埋め込まれている文字列を示している。リンク情報が埋め込まれている文字列や画像は、図8に示したように、例えば“[[” と “]]” のようなタグや記号で囲まれているので、文書全体から、周辺ノードに相当する文書、及びそのノード名として用いる文字列を検出することは容易である。
図8に示した文書から、当該文書のタイトルや見出し、表題に相当する「女優E」が、中心ノードのノード名として抽出され、「女優Y」「男優S」「男性タレントG」が、それぞれ周辺ノードのノード名として抽出される。また、当該文書中の「女優Y」を含む文字列が、「女優Y」という周辺ノードのラベルとして抽出され、当該文書中の「男優S」を含む文字列が「男優S」という周辺ノードのラベルとして抽出され、当該文書中の「男性タレントG」を含む文字列が「男性タレントG」という周辺ノードのラベルとして抽出される。
この結果、図8の文書からは、図9に示すような、「女優E」という中心ノードをもつグラフ構造が得られる。図9はグラフ構造を模式的に示したものである。図9では、「女優E」が中心ノードとなっており、ここから当該文書にリンクされている「女優Y」、「男優S」、および「男性タレントG」が周辺ノードとして表されている。また、各周辺ノードには、「女優E」の文書中から切り出された文脈情報(リンク情報が埋め込まれている箇所周辺の文字列など)、あるいは章・節のタイトルがラベルとして付加されている。
図10は、図9のグラフ構造に対応するグラフ構造データの記述例を示している。図10のグラフ構造データは、XMLで記述されており、「女優E」を中心ノードとする。図10のグラフ構造データは、中心ノードの記述部分C1と、複数の(例えば、ここでは2つの)周辺ノードの記述部分C2、C3を含む。中心ノードの記述部分C1には、<entryname> というタグ名で中心ノードのノード名が記述されている。周辺ノードの記述部分C1及びC2には、<entryname> というタグ名で当該周辺ノードのノード名が記述されている。また、当該周辺ノードに、当該周辺ノードを中心ノードとするグラフ構造データをリンクするために、<link>というタグ名で、当該周辺ノードを中心ノードとするグラフ構造データへのリンク情報(例えばここではグラフ構造識別情報)が記述されている。さらに、中心ノードから当該周辺ノードのラベルが<labeltext>というタグ名で記述され、このラベルが文脈情報と、章・節のタイトルのうちのどちらのタイプであるかを示す情報が、<labeltype>というタグ名で記述されている。例えば、ラベルが文脈情報であれば、「TITLE」という値が記述され、ラベルが章・節のタイトルであれば「CONTEXT」という値が記述されている。さらに、<edge−attribute>というタグ名で、当該周辺ノードのエッジ属性情報が記述されている。なお、ここでは、エッジ属性情報の初期値として、例えば、当該文書(当該中心ノードに対応する文書)中に当該周辺ノードが出現した順番を表す「1」が記述されている。
図10に示したグラフ構造データを、「宇宙」のテンプレートを用いて表示文書に変換した場合の表示例が図3である。図3に示したユーザ端末200の表示画面上で、ユーザにより、1つの周辺ノードが選択されたとき(クリックされたとき)には、図10のグラフ構造データ中の当該選択された周辺ノードの記述部分の<link>要素に含まれているグラフ構造識別情報が、上記ノード遷移情報とともに、当該ユーザ端末200から送信される。このユーザ端末200から送信されたグラフ構造識別情報が入力部4から更新部6に送られて、更新部6では、当該グラフ構造識別情報を基に、第2の記憶部12から、当該グラフ構造識別情報により特定されるグラフ構造データを得る。得られたグラフ構造データは、表示文書生成部3でテンプレートを用いて表示文書に変換された後、ユーザ端末200のディスプレイに表示される。
図11は、ノード履歴集計部5の処理動作を説明するためのフローチャートである。ユーザ端末200で表示されているグラフ構造上の周辺ノードがクリックされると、前述したように、<現在時刻>、<ユーザ識別情報>、<現在の中心ノード名(遷移元のノード名)>、<クリックされた周辺ノード名(遷移先のノード名)>を含むノード遷移情報と、クリックされた周辺ノードの記述部分に埋め込まれているグラフ構造識別情報などが、当該ユーザ端末200から送信され、入力部4に入力される。入力部4からは少なくとも上記ノード遷移情報がノード履歴集計部5に入力される(ステップS11)。ノード履歴集計部5は、入力部4からノード遷移情報を受け取ると、これを第3の記憶部13に記憶する(ステップS12)。例えば、ユーザ識別情報「abc」により、図3に示すような表示画面から、周辺ノード「女優Y」がクリックされた場合には、<現在の中心ノード名>として「女優E」から<クリックされた周辺ノード名>として「女優Y」というノード遷移が発生したので、これらの情報を含むノード遷移情報が第3の記憶部13に記憶される。
また、ユーザ識別情報は、例えばCookie IDでもよい。このCookie IDは、当該ユーザ端末200が、文書処理システム100としてのサーバ装置へ初めてアクセスしたときに、当該ユーザ端末200のブラウザに送信されるもので、これは当該ユーザ端末200で保存され、2回目以降のアクセス時には、当該ユーザ端末200のブラウザからサーバ装置へ送信されて、当該ユーザ端末200のユーザが特定される。ユーザ識別情報は、ユーザのアカウント名であってもよい。
次にステップS13へ進み、ノード履歴集計部5は、第3の記憶部13に記憶された、例えば、<現在の中心ノード名>として「女優E」、<クリックされた周辺ノード名>として「女優Y」を含むノード遷移情報から、第3の記憶部13に記憶されているユーザ識別情報「abc」の「女優E」から「女優Y」へのノード遷移の回数を1つインクリメントする。そして、ユーザ識別情報毎に、<現在の中心ノード名>から<クリックされた周辺ノード名>にユーザが遷移した総回数や、一定時間内における遷移の回数などを集計する。この集計は、送られてきたユーザ識別情報に対して行ってもよいし、複数ユーザにわたって行ってもよい。すなわち、例えば当該ユーザが「女優E」から「女優Y」に遷移した回数を集計してもよいし、全てのユーザもしくは一定条件(例えば、世代(年齢)、性別等)を満たすユーザのグループが、「女優E」から「女優Y」に遷移した回数を集計してもよい。以上の処理結果は、第3の記憶部13に記憶される。
また、ノード履歴集計部5は、全ユーザの間で、どのノードからどのノードに、何回遷移されたかを示すノード遷移別の集計を行ってもよい。さらに、入力部4から入力されたノード遷移情報中のユーザ識別情報「abc」の場合、このユーザ以外のユーザ間で、どのノードからどのノードに、何回遷移されたかを示すノード遷移別の集計を行ってもよい。この集計結果を第3の記憶部13に記憶してもよい。
図12は、更新部6及び表示文書生成部3の処理動作の一例を示すフローチャートである。更新部6はまず、入力されたグラフ構造識別情報に対応するグラフ構造データを第2の記憶部12から読み込む(ステップS21)。そして、ステップS22〜ステップS24において、当該グラフ構造データ中の各周辺ノードについて、そのエッジ属性情報の更新を行う。すなわち、ステップS23において、i番目の周辺ノードについて、中心ノードから当該周辺ノードへの遷移に関する集計結果を取得し、これに基づいてこの周辺ノードのエッジ属性情報を更新する。例えば、ユーザ識別情報別に集計された、当該中心ノードから当該周辺ノードへの遷移の回数や、全ユーザにわたって集計された、当該中心ノードから当該周辺ノードへの遷移の回数そのもの、またはその大小が識別できるような相対的な値を新たなエッジ属性情報として用いても良い。
ステップS23の処理を、当該グラフ構造データ中の全ての周辺ノードについて行った後(ステップS25)、エッジ属性情報更新後の当該グラフ構造データを表示文書生成部3へ出力し、ステップS26へ進む。また、「宇宙」の表示形態のスタイルシートを適用する場合、次に示すような処理を行っても良い。当該中心ノードから各周辺ノードへの遷移回数の集計値に基づいて、当該グラフ構造データ中の各周辺ノードを、その集計値の降順にソートし、上位l(lは予め定められた自然数)個を中心ノードに最も近い第1軌道に表示するために、エッジ属性情報を「1」に更新する。次のm(mは予め定められた自然数)個を次の第2軌道に表示するために、エッジ属性情報を「2」に更新する。同様に、次のn(nは予め定められた自然数)個をさらに次の第3軌道に表示するために、エッジ属性情報を「3」に更新する。
ステップS26では、表示文書生成部3は、入力されたグラフ構造データに、例えば「宇宙」の表示形態のスタイルシートを適用することで、表示用文書(例えば、HTML文書など)に変換する。この表示用文書がユーザ端末200へ送信され、当該ユーザ端末200のディスプレイに、例えば、図3に示すように表示される。
図3では、「女優E」から「女優Y」への遷移回数が100回、「女優E」から「男優S」への遷移回数が50回、「女優E」から「男性タレントG」への遷移回数が10回という集計結果が得られているものとする。図3は、周辺ノード(のノード名)が、遷移回数の多かったものほど中心ノードに近い軌道上の星として表示される表示文書の表示例である。
エッジ属性情報として、上記のように軌道の位置(1,2,3…)とともに、遷移回数が記述されていてもよい。また、例えば、図17に示すように、エッジ属性情報が「1」の複数の周辺ノードを第1軌道の星として表示するとともに、各周辺ノードの遷移回数に応じて、各周辺ノードを表すノード名やシンボルマークなどの大きさ、色、形状、文字の大きさなどが異なるように表示する表示文書に変換することもできる。図17は、複数の周辺ノードB1〜B6のノード名を、遷移回数の多い周辺ノードほど中心ノードA1に近い方の軌道上の星として表し、同じ軌道上の周辺ノードのノード名は遷移回数が多いほど大きい文字で表している。
このように、特定のユーザが過去に遷移した回数や、多くのユーザが過去に遷移した回数に基づいて、周辺ノードを表す文字列やシンボルなどの表示位置、大きさ、色、明るさ、形状、文字の大きさのうちの少なくとも1つを変化させることができる。特に、遷移回数の多い周辺ノードほどより目立つ表示形態となることが望ましい。
図13は他の表示文書の表示例を示したもので、ノード集計結果に応じて周辺ノードを表すシンボルやマークの形状や大きさを変化させている。例えば、この例のように、遷移回数の多かったものほど(すなわち、エッジ属性情報の値が大きいほど)当該周辺ノードのシンボルの大きさを大きくしたり、強調表示したりなどして、目立つように表示される。
図14は、さらに他の表示文書の表示例を示したものである。ここでは、ノード集計結果に応じて中心ノードと周辺ノードを結ぶ線の形状や太さを変化させている。例えば、この例のように、遷移回数の多かったものほど(すなわち、エッジ属性情報の値が大きいほど)当該周辺ノードと中心ノードとを結ぶ線を太くしたり、目立つ色で表示したりするなどして、目立つように表示される。さらに、各線の横に実際に集計した遷移回数(エッジ属性情報)を表示している。
さらに、1つのグラフ構造データ中の複数の周辺ノードを複数のページに分けて表示するようにしてもよい。例えば、遷移回数の多いものから順に上位n個の周辺ノードを1ページ目に、遷移回数の多いものほど中心ノードに近い位置に、図2に示すように表示し、次の上位n個の周辺ノードを2ページ目に図15に示すように、遷移回数の多いものほど中心ノードに近い位置に表示する。3ページ目以降についても上記同様に、残りの周辺ノードを遷移回数の多いものほど中心ノードに近い位置に表示する。
なお、図2、図15の例では、「女優E」から「女優Y」「男優S」および「男性タレントG」への遷移回数のほうが「女優E」から「男優X」「男性タレントY」「男性タレントZ」への遷移回数より多かったものと仮定している。
以上のように、ノード集計結果を用いて各周辺ノードの表示形態を決定することができる。さらに、周辺ノードの色や明るさなどを変化させることも可能である。
1つの文書に多くの文書がリンクされている場合、1つの中心ノードとともに表示される周辺ノードの数が多くなる。この多数の周辺ノードのなかで、ノード選択の手がかりとして、各ユーザに、当該ユーザが過去に何回も選択した周辺ノードや、不特定の多くのユーザが選択した周辺ノードなどの遷移頻度の高い周辺ノードを特に目立つように、または優先的に表示するインタフェースを提供することにより、現在話題となっている情報や、意外な繋がりのある情報など、ユーザにとって有用な情報に容易にアクセスすることができ、所望の情報を容易に収集することができる。また、このようなインタフェースによれば、気になる周辺ノードをたどることで、各ユーザがクリックするノードの数も増加することが期待でき、これによりユーザは、膨大な情報に埋もれることなく、幅広い分野から情報を収集することもできる。
なお、上記説明では、1つの周辺ノード(中心ノードから当該周辺ノードへの遷移)に1つのエッジ属性情報を含み、このエッジ属性情報をユーザ識別情報別のノード間の遷移回数に応じて、また、全ユーザにわたる当該ノード間の遷移回数などに応じて更新する場合を示しているが、この場合に限らず、1つの周辺ノードに複数のエッジ属性情報が含まれていてもよい。
この場合、例えば、1つの周辺ノード(中心ノードから当該周辺ノードへの遷移)に属する複数のエッジ属性情報(例えば、edge-attribute-1〜edge-attribute-m)のうちの1つ(例えばedge-attribute-1)を、要求元のユーザ識別情報を含む全ユーザにわたって集計した結果である当該中心ノードから当該周辺ノードへの遷移回数に応じた値に更新する。また、他の1つのエッジ属性情報(例えばedge-attribute-2)を、当該ユーザ識別情報について集計された当該中心ノードから当該周辺ノードへの遷移回数に応じた値に更新する。
そして、このようにして更新されたエッジ属性情報を含むグラフ構造データに対し、表示文書生成部3で、例えば、「宇宙」の表示形態のスタイルシートを適用する場合を考える。この場合、「宇宙」のスタイルシートには、edge-attribute-1の値を軌道の位置に反映し、edge-attribute-2の値を周辺ノードを表すノード名や星に見立てたシンボルマークの大きさ(太さや色)などに反映するように記述されている。そして、各周辺ノードに対応する星は、edge-attribute-1の値が大きいほど中心ノードに近い軌道に配置され、edge-attribute-2の値が大きいほど、当該星(周辺ノードのノード名など)の大きさを大きく設定されたり、目立つ色に設定されたりする。
従って、このスタイルシートを用いて当該グラフ構造データを変換した結果得られる表示文書によれば、図16に示すように、例えば軌道の位置から「一般には女優Eから女優Yに遷移するユーザが多いが、閲覧中のユーザに限っては、女優Eから男性タレントGに遷移することが多い」といった情報を一度に表現することができる。ユーザは、他のユーザと同じような検索の道のりを辿りたければ、女優Yをクリックすればよい。また、自分のこれまでの傾向に合った検索の道のりを辿りたければ男性タレントGをクリックすればよい。
このように、1つの周辺ノード(中心ノードから当該周辺ノードへのエッジ)に対し複数のエッジ属性情報が含まれる場合には、自分の過去のノード遷移の傾向や、他の多くの人の一般的なノード遷移傾向などの種々の遷移傾向が1つの画面に表示されるため、ユーザにとって、ノード遷移の選択肢が増えることとなる。すなわち、目的のノードの他にも他のノードにもクリックしてみたいという衝動にかられ、次々とノードクリックを行うことにより、クリックする周辺ノードの数が増大することも期待される。これにより各ユーザの興味、趣味、知識の範囲内に限らず、幅広い分野から有用な情報を収集することができる。このようないわゆる「ながら検索」により、各ユーザがクリックする周辺ノードの数が増大すれば、1ユーザ当たりの画面閲覧時間がのび、閲覧画面に表示されている広告やその他の情報を目にする頻度も高くなるとも云える。
なお、以上の説明では、各文書が特定の人名に対応している場合について説明したが、この場合に限らず、人名の変わりに任意の文書のタイトルを用いることができる。
本発明の実施の形態に記載した本発明の手法は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)、半導体メモリなどの記録媒体に格納して頒布することもできる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1…文書収集部、2…グラフ構造生成部、3…表示文書生成部、4…入力部、5…ノード履歴集計部、6…更新部、11…第1の記憶部、12…第2の記憶部、13…第3の記憶部
Claims (11)
- 他の文書へのリンク情報を含む複数の文書を記憶する第1の記憶手段と; 前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと; 該文書にリンクされている他の文書に対応する周辺ノードとを含むグラフ構造データであって、各周辺ノードは、当該周辺ノードに対応する前記他の文書を中心ノードとする他のグラフ構造データにリンクし、ユーザ操作により当該他のグラフ構造データへ遷移する遷移頻度を示す属性情報を有するグラフ構造データを生成する生成手段と; 前記複数の文書のそれぞれに対応する複数のグラフ構造データを記憶する第2の記憶手段と; 各グラフ構造データの前記中心ノードから前記周辺ノードへの遷移回数を記憶する第3の記憶手段と; 前記第2の記憶手段に記憶されている前記グラフ構造データ中の各周辺ノードの前記属性情報を、当該グラフ構造データ中の中心ノードから当該周辺ノードへの前記遷移回数に基づき更新する更新手段と; 前記属性情報の更新されたグラフ構造データを、当該グラフ構造データ中の各周辺ノードが、その属性情報に対応する表示形態で表示される表示文書に変換する変換手段と; 前記表示文書が表示されている端末で、該表示文書中の前記周辺ノードが選択されたとき、当該表示文書の中心ノードから当該周辺ノードへの前記遷移回数を更新する集計手段と; を含む文書処理システム。
- 前記第3の記憶手段は、ユーザ識別情報毎に、各グラフ構造データの前記中心ノードから前記周辺ノードへの遷移回数を記憶する請求項1記載の文書処理システム。
- 前記更新手段は、前記グラフ構造データ中の各周辺ノードの前記属性情報を、前記端末のユーザ識別情報に対応する前記遷移回数に基づき更新する請求項2記載の文書処理システム。
- 前記更新手段は、前記グラフ構造データ中の各周辺ノードの前記属性情報を、前記端末のユーザ識別情報以外のユーザ識別情報に対応する前記遷移回数の集計値に基づき更新する請求項2記載の文書処理システム。
- 各グラフ構造データ中の各周辺ノードは、複数の前記属性情報を有し、
前記更新手段は、前記周辺ノードの前記複数の属性情報のうちの1つの第1の属性情報を、前記端末のユーザ識別情報に対応する前記遷移回数に基づき更新し、他の1つの第2の属性情報を、前記端末のユーザ識別情報以外のユーザ識別情報に対応する前記遷移回数の集計値に基づき更新し、
前記変換手段は、前記複数の属性情報の更新されたグラフ構造データを、当該グラフ構造データ中の各周辺ノードが、前記第1の属性情報及び前記第2の属性情報のそれぞれに対応する異なる表示形態で表示される表示文書に変換する請求項2記載の文書処理システム。 - 前記変換手段は、
各周辺ノードの位置、色、明るさ、大きさ、及び形状のうちの少なくとも1つの表示形態が、当該周辺ノードの属性情報に応じて定められている表示文書に変換する請求項1記載の文書処理システム。 - 前記変換手段は、
前記グラフ構造中の前記中心ノードと前記周辺ノードとを結ぶ線の色、明るさ、太さ、及び形状のうちの少なくとも1つの表示形態が、当該周辺ノードの属性情報に応じて定められている表示文書に変換する請求項1記載の文書処理システム。 - 前記変換手段は、各周辺ノードが、前記中心ノードを中心とした同心円状の複数の軌道のうち、当該周辺ノードの前記属性情報が示す遷移頻度が高いほど前記中心ノードに近い軌道上の星として表示される表示文書に変換する請求項1記載の文書処理システム。
- 前記変換手段は、各周辺ノードが、前記中心ノードを中心とした同心円状の複数の軌道のうち、当該周辺ノードの前記第1の属性情報が示す遷移頻度が高いほど前記中心ノードに近い軌道上の星として表示され、当該周辺ノードに対応する星の色、明るさ、大きさ、及び形状のうちの少なくとも1つの表示形態が、当該周辺ノードの前記第2の属性情報に応じて定められている表示文書に変換する請求項5記載の文書処理システム。
- 他の文書へのリンク情報を含む複数の文書を第1の記憶手段に記憶するステップと; 前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書にリンクされている他の文書に対応する周辺ノードとを含むグラフ構造データであって、各周辺ノードは、当該周辺ノードに対応する前記他の文書を中心ノードとする他のグラフ構造データにリンクし、ユーザ操作により当該他のグラフ構造データへ遷移する遷移頻度を示す属性情報を有するグラフ構造データを生成するステップと; 前記複数の文書のそれぞれに対応する複数のグラフ構造データを第2の記憶手段に記憶するステップと; 前記第2の記憶手段に記憶されている前記グラフ構造データ中の各周辺ノードの前記属性情報を、第3の記憶手段に記憶されている当該グラフ構造データ中の中心ノードから当該周辺ノードへの遷移回数に基づき更新するステップと; 前記属性情報の更新されたグラフ構造データを、当該グラフ構造データ中の各周辺ノードが、その属性情報に対応する表示形態で表示される表示文書に変換するステップと; 前記表示文書が表示されている端末で、該表示文書中の前記周辺ノードが選択されたとき、当該表示文書の中心ノードから当該周辺ノードへの前記遷移回数を更新するステップと; を含む文書処理方法。
- コンピュータを、
他の文書へのリンク情報を含む複数の文書を記憶する第1の記憶手段; 前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書にリンクされている他の文書に対応する周辺ノードとを含むグラフ構造データであって、各周辺ノードは、当該周辺ノードに対応する前記他の文書を中心ノードとする他のグラフ構造データにリンクし、ユーザ操作により当該他のグラフ構造データへ遷移する遷移頻度を示す属性情報を有するグラフ構造データを生成する生成手段; 前記複数の文書のそれぞれに対応する複数のグラフ構造データを記憶する第2の記憶手段; 各グラフ構造データの前記中心ノードから前記周辺ノードへの遷移回数を記憶する第3の記憶手段; 前記第2の記憶手段に記憶されている前記グラフ構造データ中の各周辺ノードの前記属性情報を、当該グラフ構造データ中の中心ノードから当該周辺ノードへの前記遷移回数に基づき更新する更新手段; 前記属性情報の更新されたグラフ構造データを、当該グラフ構造データ中の各周辺ノードが、その属性情報に対応する表示形態で表示される表示文書に変換する変換手段; 前記表示文書が表示されている端末で、該表示文書中の前記周辺ノードが選択されたとき、当該表示文書の中心ノードから当該周辺ノードへの前記遷移回数を更新する集計手段; として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009038797A JP2010198058A (ja) | 2009-02-23 | 2009-02-23 | 文書処理システム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009038797A JP2010198058A (ja) | 2009-02-23 | 2009-02-23 | 文書処理システム及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010198058A true JP2010198058A (ja) | 2010-09-09 |
Family
ID=42822759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009038797A Pending JP2010198058A (ja) | 2009-02-23 | 2009-02-23 | 文書処理システム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010198058A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013125507A (ja) * | 2011-12-16 | 2013-06-24 | Kyocera Corp | 携帯端末装置、プログラムおよび画面更新方法 |
JP2013171334A (ja) * | 2012-02-17 | 2013-09-02 | Ntt Communications Kk | 関連情報表示システム、関連情報表示制御装置、端末装置、プログラム、及び関連情報表示方法 |
JP2014229148A (ja) * | 2013-05-23 | 2014-12-08 | 富士通株式会社 | 表示制御方法、表示制御プログラムおよび表示制御装置 |
JP2020024698A (ja) * | 2018-08-08 | 2020-02-13 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | ナレッジグラフの生成方法、装置、機器およびコンピュータ読み取り可能な記憶媒体 |
JP2020027649A (ja) * | 2018-08-15 | 2020-02-20 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 |
JP2023021972A (ja) * | 2019-10-28 | 2023-02-14 | ハイラブル株式会社 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0981581A (ja) * | 1995-09-12 | 1997-03-28 | Nippon Steel Corp | データベースの作成方法 |
JPH09198408A (ja) * | 1996-01-16 | 1997-07-31 | Nec Corp | ブラウジング装置 |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
-
2009
- 2009-02-23 JP JP2009038797A patent/JP2010198058A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0981581A (ja) * | 1995-09-12 | 1997-03-28 | Nippon Steel Corp | データベースの作成方法 |
JPH09198408A (ja) * | 1996-01-16 | 1997-07-31 | Nec Corp | ブラウジング装置 |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013125507A (ja) * | 2011-12-16 | 2013-06-24 | Kyocera Corp | 携帯端末装置、プログラムおよび画面更新方法 |
JP2013171334A (ja) * | 2012-02-17 | 2013-09-02 | Ntt Communications Kk | 関連情報表示システム、関連情報表示制御装置、端末装置、プログラム、及び関連情報表示方法 |
JP2014229148A (ja) * | 2013-05-23 | 2014-12-08 | 富士通株式会社 | 表示制御方法、表示制御プログラムおよび表示制御装置 |
JP2020024698A (ja) * | 2018-08-08 | 2020-02-13 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | ナレッジグラフの生成方法、装置、機器およびコンピュータ読み取り可能な記憶媒体 |
KR20200017347A (ko) * | 2018-08-08 | 2020-02-18 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 지식 그래프를 생성하기 위한 방법, 장치, 기기 및 컴퓨터 판독 가능 저장 매체 |
KR102291674B1 (ko) * | 2018-08-08 | 2021-08-19 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 지식 그래프를 생성하기 위한 방법, 장치, 기기 및 컴퓨터 판독 가능 저장 매체 |
JP2020027649A (ja) * | 2018-08-15 | 2020-02-20 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 |
KR20200019824A (ko) * | 2018-08-15 | 2020-02-25 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 엔티티 관계 데이터 생성 방법, 장치, 기기 및 저장 매체 |
KR102237702B1 (ko) | 2018-08-15 | 2021-04-08 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 엔티티 관계 데이터 생성 방법, 장치, 기기 및 저장 매체 |
US11321421B2 (en) | 2018-08-15 | 2022-05-03 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus and device for generating entity relationship data, and storage medium |
JP2023021972A (ja) * | 2019-10-28 | 2023-02-14 | ハイラブル株式会社 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
JP7427274B2 (ja) | 2019-10-28 | 2024-02-05 | ハイラブル株式会社 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ferrara et al. | Web data extraction, applications and techniques: A survey | |
US11348294B2 (en) | Systems and methods for updating a third party visualization in response to a query | |
JP6906419B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
CN104903886B (zh) | 基于社交图谱信息的结构化搜索查询 | |
Akpınar et al. | Vision based page segmentation algorithm: Extended and perceived success | |
Foley et al. | Learning to extract local events from the web | |
CN105074700A (zh) | 产生含有到应用程序的状态链接的搜索结果 | |
TW201250492A (en) | Method and system of extracting web page information | |
CN103778200B (zh) | 一种报文信息源抽取方法及其系统 | |
JP2003330948A (ja) | ウェブページを評価する装置および方法 | |
JP2010198058A (ja) | 文書処理システム及び方法 | |
CN102483830A (zh) | 广告显示更新与用户再访率的同步 | |
US10002117B1 (en) | Translating annotation tags into suggested markup | |
JP2011108085A (ja) | 知識構築装置およびプログラム | |
US11625448B2 (en) | System for superimposed communication by object oriented resource manipulation on a data network | |
US11392589B2 (en) | Multi-vertical entity-based search system | |
US10055486B1 (en) | System and method for real world event summarization with microblog data | |
JP2009075777A (ja) | 文書処理システム及び方法 | |
Garcia et al. | Concept Drift Adaptation in Text Stream Mining Settings: A Comprehensive Review | |
JP5380874B2 (ja) | 情報検索方法、プログラム及び装置 | |
KR20180110498A (ko) | 범용화된 정보 추출 방법 및 이를 적용한 디바이스 | |
JP2002278983A (ja) | 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム | |
JP2004133742A (ja) | 作業支援方法、作業支援プログラムおよび作業支援システム | |
JP2016181069A (ja) | 情報抽出装置、情報抽出方法、及び、表示制御システム | |
JP4119413B2 (ja) | 知識情報収集システム、知識検索システム及び知識情報収集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110913 |