JP2007317070A - トポロジーグラフ表示システムおよびコンピュータプログラム - Google Patents

トポロジーグラフ表示システムおよびコンピュータプログラム Download PDF

Info

Publication number
JP2007317070A
JP2007317070A JP2006147989A JP2006147989A JP2007317070A JP 2007317070 A JP2007317070 A JP 2007317070A JP 2006147989 A JP2006147989 A JP 2006147989A JP 2006147989 A JP2006147989 A JP 2006147989A JP 2007317070 A JP2007317070 A JP 2007317070A
Authority
JP
Japan
Prior art keywords
data
concept
node
nodes
topology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006147989A
Other languages
English (en)
Inventor
Takuma Tsukamoto
琢磨 塚本
Michitoshi Sakagami
道年 坂上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Itochu Techno Solutions Corp
Original Assignee
Itochu Techno Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Itochu Techno Solutions Corp filed Critical Itochu Techno Solutions Corp
Priority to JP2006147989A priority Critical patent/JP2007317070A/ja
Publication of JP2007317070A publication Critical patent/JP2007317070A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract


【課題】 複数のトポロジーグラフの結合体である概念知図が個人の思考パターンの視覚的表示となることを実現するためのトポロジーグラフ表示技術を提供する。
【解決手段】 二つのトポロジーグラフの構成要素である複数のノードから結合ノードとして一組のノードを選択する結合ノード選択手段と、選択された一組の結合ノード間に配置される結合リンクの長さを決定する結合リンク長決定手段と、複数のデータのそれぞれがいずれの概念に属するかを判別可能な概念対応データを格納する記憶手段とを備え、結合ノード選択手段は、記憶手段から概念対応データを読み込んで複数のデータのそれぞれがいずれの概念に属するかを判別し、志向性データベースおよび結合志向性データベースの少なくとも一方に格納されるデータを用いて結合対象とすべき概念の組合せを演算することで結合ノードを選択するトポロジーグラフ表示システム。
【選択図】 図32

Description

本発明は、データ群の関連性を視覚化するトポロジーグラフ表示に関する技術であり、詳しくは、複数のトポロジーグラフを個人の志向性を反映して結合させることで形成される結合トポロジーグラフを表示装置に表示する技術である。
情報通信技術の発達により、インターネットなどから多種多様なデータを大量に入手することが可能となってきている。これらのデータの中から必要な情報を得るための技術として検索技術があり、早く、かつ的確に所望のデータ群を収集するための技術開発が盛んに行われている。
また、収集されたデータ群、特にテキストデータ群を解析し、特徴や傾向を把握したり、未知の情報を発見したりする技術としてテキストマイニングの技術があり、文書分類方法、重要語の抽出方法、抽出した単語の分類方法、および抽出した単語間の関連の表示方法などが提案されている。
このうち、テキストデータ群の可視化技術として、テキストデータの関連性をネットワーク状に表示する方法が提案されている。この表示(以降「トポロジーグラフ」と称する。)は、複数のテキストデータのそれぞれに対応する複数のアイコン状のノードと、テキストデータ同士の関連性を定量化した値に基づく長さを有しそれらのテキストデータにかかるノード間に配置されるリンクとから構成されている。
このような表示形式によって、一つのテキストデータ群の関連性を視覚的に認識させることは可能である。また、テキストデータ群以外のデータ群、たとえば画像データや数値データについても、個々のデータの特性を視覚的に認識可能に表現したノードとして対応付けることでも同様のトポロジーグラフを作ることが可能である。
このトポロジーグラフに関する発展的な課題として、複数のデータ群の関連性をどの様に表現するかが挙げられる。
この課題に応える技術の一つに、概念構造を構成する概念素間の関係をバネ質点系モデルでシミュレーションする技術がある(たとえば特許文献1)。ここで、概念構造とはトポロジーグラフに対応するものである。そのノード(概念素)を質点、リンクをバネとした場合に導かれる力学系のパラメータを、概念の関連性を規定するパラメータに置き換えることで、概念の関連性を表現したりシミュレーションしたりする技術が特許文献1に開示されている。
このシミュレーションの例の一つとして、二つのトポロジーグラフ(概念構造)をそれらの共通ノード(概念素)で結合することが示されている。力学系のパラメータに模されて設定される統一的な概念間の相互関係ルールに基づいて、結合されたトポロジーグラフ(概念構造)の安定構造が計算され、この安定な概念構造がいわば「すりあわせ」の結果に対応するとされている。
特開平11−120162号公報
複数のトポロジーグラフを結合させてあらたなトポロジーグラフを作成することは、思考パターンや連想ルールの可視化の観点から有意義なプロセスである。
様々なテーマに関するトポロジーグラフの結合のプロセスを繰り返すことで巨大なトポロジーグラフを形成することができる。この巨大なトポロジーグラフは「概念知図」とでも呼ぶべきものであり、概念知図を解析することで思考パターンを把握することが可能であり、また、連想ルールを定量的に表現することも可能である。
たとえば、任意の二つのデータについてそれぞれに対応するノードを概念知図上の位置づけを確認してこれらをつなぐ最短の経路を求めると、これがコンセプトパス(Concept path、 思考経路)となる。
このコンセプトパスは、一方のデータにかかる事象から他方のデータにかかる事象に想到するまでの連想の経路を示すものである。したがって、このコンセプトパスは一般論として個人の経験や考え方の相違を反映して個人単位で異なるべきものである。それゆえ、コンセプトパスを視覚的に表現しうる概念知図もその作成者個人の単位で変化するべきものである。
そこで、概念知図の変化をもたらす要因を検討すると、構成要素たる個々のトポロジーグラフをどの様に結合したかを主要因の一つとして挙げることができる。上記特許文献1で開示される技術では、このトポロジーグラフの結合すべき点として共通概念のノードを選択することとしている。
しかしながら、現実には複数のトポロジーグラフの結合すべき点が常に共通概念とは限らない。むしろ、一見すると異なる概念にかかるデータを示すノードを結合させる方がより適切である場合も多い。また、共通概念にかかるデータを示すでありながら結合させない方が適切な場合もある。
こうした結合点の多様性に基づいて概念知図の多様性が実現されているのである。
本願発明が解決しようとする課題は、上記事情を鑑み、トポロジーグラフの結合プロセスに関する技術を提供して、複数のトポロジーグラフの結合体である概念知図が個人の思考パターンの視覚的表示となることを実現することにある。
(請求項1)
請求項1に記載の発明は、複数のデータを含むデータ群の関連性を視認できるように、複数のデータのそれぞれに対応する複数のアイコン状のノードと、データ群に含まれるデータ同士の関連性に応じた長さでそれらのデータにかかるノード間に配置されるリンクとから構成されるトポロジーグラフを表示装置に表示するトポロジーグラフ表示システムであって、二つのトポロジーグラフを表示装置に表示するための表示用データを作成するトポロジーグラフ表示手段と、二つのトポロジーグラフの構成要素である複数のノードから結合ノードとして一組のノードを選択する結合ノード選択手段と、選択された一組の結合ノード間に配置される結合リンクの長さを決定する結合リンク長決定手段と、二つのトポロジーグラフが一組の結合ノードにおいて結合リンクを介して結合されてなる結合トポロジーグラフを表示装置に表示するための表示用データを作成する結合トポロジーグラフ表示手段と、複数のデータのそれぞれがいずれの概念に属するかを判別可能な概念対応データを格納する記憶手段とを備え、さらに、複数のデータが属する概念に対する個人の志向性を定量化した志向性データを概念単位で格納する志向性データベースと、結合ノードにかかる概念の組合せが結合対象として選択された履歴を含む結合志向性データを格納する結合志向性データベースとの少なくとも一方を有し、結合ノード選択手段は、記憶手段から概念対応データを読み込んで複数のデータのそれぞれがいずれの概念に属するかを判別し、志向性データベースおよび結合志向性データベースの少なくとも一方に格納されるデータを用いて結合対象とすべき概念の組合せを演算することで結合ノードを選択するトポロジーグラフ表示システムに係る。
「トポロジーグラフ」とは、上記のごとく、複数のデータを含むデータ群の関連性を視認できるように、前記複数のデータのそれぞれに対応する複数のアイコン状のノードと、データ群に含まれるデータ同士の関連性に応じた長さでそれらのデータにかかるノード間に配置されるリンクとから構成される表示装置への表示体である。
このデータとは、テキストデータであってもよいし、画像データであってもよい。さらには、数値データやバイナリデータであってもよい。いずれにしても、ユーザが必要に応じて参照するにたる有意なデータであって、他のデータと区別可能なものであればよい。
また、ノードは、そのデータに対応付けられたデータを他のデータと識別できるように表示されているのであれば、いかなる形態であってもかまわない。たとえば、代表的な単語が中央に記載された図形でもよいし、その図形または表示文字の一部または全部が着色されていてもよい。さらに、ノードの形状が経時的に変動することで何らかの情報を表示してもよい。
トポロジーグラフの表示形式は、地図のような二次元的な表示、三次元CADのような仮想的な三次元表示、ホログラムなどの三次元表示手段を用いた三次元的な表示のいずれであってもよい。
「トポロジーグラフ表示手段」は、二つのデータ群を入力として、こうした形式での表示を実現するための表示データを作成して液晶ディスプレイなどの画像表示手段へと出力する処理、または表示データを作成する旨のコマンド(表示作成コマンド)をグラフィックボードなどの画像処理装置へと出力する処理を行うものである。なお、これら表示データおよび表示作成コマンドを総称して「表示用データ」と定義する。
「志向性データベース」とは複数の概念に対するユーザの志向性情報を概念単位で蓄積するものである。各概念に対するユーザの主観的な志向性が定量化されたものを格納してもよいし、トポロジーグラフに対して何らかの操作をユーザが行った場合にその操作の履歴を用いて導かれる定量値を客観的な志向性として格納してもよい。
この操作としては、トポロジーグラフを構成するいずれかのノードに対応するデータをユーザが参照したことや、いずれかのノードに関連する情報を検索したことなどが挙げられる。こうした操作を行ったときに、そのノードに対応するデータが属する概念を判別し、その概念ごとに履歴情報を格納すればよい。
「記憶手段」とは、こうした処理を行うために、トポロジーグラフの各ノードに対応するデータがいずれの概念に属するかを判別するためのデータと概念との対応関係を「概念対応データ」として格納するものである。ノードと検索データとの対応付けはあらかじめなされているので、この概念対応データを参照することで、各ノードがどの概念に関連付けられているかを判別することが実現される。
なお、「志向性情報」としては、ある目的をもって気持ちを向けるという意味、すなわち顕在的なユーザの好みを表す「志向」にかかる情報のみならず、「嗜好」に近い単に好みに合うという情報も含まれる。このような、潜在的なユーザの考えの傾向をも掘り起こして視覚化することも本願の発明の目指すものだからである。
「結合志向性データベース」とは以下のようにして得られる結合志向性データを格納するものである。トポロジーグラフの結合処理が行われたときに、まず結合ノードのそれぞれのノードに関連付けられたデータが属する概念を求めることで、その結合処理で対象となった概念の組合せを決定する。そして、それらの概念の組合せについて履歴情報を含むデータを作成して結合志向性データとする。たとえば、概念の組合せが結合対象として選択された時間を蓄積し、さらに、累積回数の時間依存性や単位時間あたりの平均選択回数などを算出して、結合志向性を定量的に表現するデータとして蓄積してもよい。
「結合ノード選択手段」とは、二つのトポロジーグラフのそれぞれを構成するノードから結合ノードとして一組のノードを選択する処理を行うものであって、ユーザからの結合指示を入力として、結合ノードの選択結果を出力する。
この結合ノードの選択にあたっては、まず、記憶手段から概念対応データを読み込んで各ノードに関連付けられたデータのそれぞれがいずれの概念に属するかを判別する。次に、志向性データベースおよび結合志向性データベースの少なくとも一方に格納されるデータを用いて、結合対象とすべき概念の組合せを求める演算を行う。続いて、それぞれの概念に対応するデータを求めることで結合ノードを選択する。
「結合リンク長決定手段」とは、結合ノードを特定するデータを入力として、これらを結合するリンク長を決定する処理を行うものであって、決定された結合リンク長を出力する。
結合リンク長は、結合ノードに対応するデータが属する概念同士の関連性を定量化した概念距離に基づいて決定してもよい。また、志向性データベースや結合志向性データベースを参照して、結合にかかる概念の志向性や概念の組合せの志向性についての定量値を反映させて決定してもよい。なお、結合ノードに関連付けられたデータが全く同一の場合には結合リンク長は0になり、二つの結合ノードの表示座標は同一となる。このとき、一方のノードは表示されず、見かけ上はノードを介して二つのトポロジーグラフが結合した態様の結合トポロジーグラフが表示されることとなる。
「結合トポロジーグラフ表示手段」とは、上記の各手段が行う処理によって得られた結合ノードおよび結合リンク長にかかるデータを入力として、二つのトポロジーグラフが結合されてなる結合トポロジーグラフの表示用データを作成して画像表示手段へと出力する処理、または表示用データを作成する旨のコマンドを画像処理装置へと出力する処理を行うものである。
請求項1に記載の発明によれば、トポロジーグラフの結合プロセスに際して、志向性データベースまたは結合志向性データベースに蓄積される個人の志向性に関する情報を参照しつつ、結合すべきノードの選択が行われる。このため、その志向性に関する情報の提供者が結合プロセスを行うユーザである場合には、単なる共通概念にかかるノードを結合すべきノードとして選択する場合に比べて、結合処理を指示するユーザの意志が反映されやすい。したがって、かかるシステムに基づいて形成される概念知図はその結合点においてユーザの意志が反映されているため、個人の思考パターンをより的確に表現した表示となる。
なお、志向性に関する情報の提供者は結合処理を行うユーザ以外の他人であってもよい。この場合にはその他人の考え方を取り込んだ概念地図を得ることが実現される。
また、参照可能なデータベースを複数有し、いずれのデータベースを用いるかを判定するデータベース選択手段を有していてもよい。ここで、複数の志向性データベースを有していてもよいし、複数の結合志向性データベースを有していてもよい。さらには、志向性データベースと結合志向性データベースとを有していてもよい。
ここで、データベース選択手段がいずれのデータベースを使用するかを選択する処理(選択処理)については次のようにしてもよい。すなわち、どのデータベースを使用するかをユーザに決定するよう促す表示を出力し、マウスやキーボードなどの入力手段からの入力信号が選択処理を開始するために必要なデータを含んでいることを条件として、その入力信号にかかるデータに基づいて適切なデータベースを選択する。
あるいは、複数のデータベースを用いて複数の結合ノード候補を算出し、それらの結合ノード候補に対して統計学的な演算を行って適切なデータベースを選択する。
(請求項2)
請求項2に記載の発明は、請求項1に記載のトポロジーグラフ表示システムを限定したものである。
すなわち、結合ノード選択手段は、二つのトポロジーグラフのそれぞれを構成するノード同士の組合せの中に共通する概念が対応付けられている組合せが複数あるか否かを判定する共通概念数判定手段と、その共通概念数判定手段によって共通概念が対応付けられたノードの組合せは複数あると判定されたことを条件として、その共通概念についての志向性データを志向性データベースから読み込む共通概念志向性データ読込手段と、その共通概念志向性データ読込手段によって読み込まれた志向性データに基づいて、共通概念の中で志向性が最大である志向性最大共通概念がいずれであるかを判定する志向性最大共通概念判定手段と、その志向性最大共通概念との関連性が最も大きいノードを二つのトポロジーグラフのそれぞれについて選択し、当該選択された一組のノードを結合ノードと判定する共通概念結合ノード判定手段とを有するトポロジーグラフ表示システムに係る。
「共通概念数判定手段」は、まず、記憶手段に格納される概念対応データを参照しつつ、各トポロジーグラフを構成するノードに関連付けられているデータが属する概念をトポロジーグラフごとにリストアップする。次にそれぞれのトポロジーグラフを構成するノード同士からなる組合せを作成し、それらのノードの組合せに対応する概念の組合せを順次比較して、共通する概念が対応付けられているか否かを判定する。そして、全ての組合せの比較が終了したら、共通概念が対応付けられているノードの組合せが複数あるか否かを判定し、複数ある場合にはその旨の信号を出力する。
「共通概念志向性データ読込手段」は、共通概念数判定手段からの入力信号が該当する組合せが複数ある旨の信号であると判定したら、それらのノードの組合せにかかる共通概念をリストアップする。そして、志向性データベースにアクセスして、リストアップされた共通概念に対応する志向性データを読み込む。
「志向性最大共通概念判定手段」は、読み込まれた志向性データの中で志向性を定量化した値が最大のものがいずれであるかを判定し、その志向性データに対応する共通概念を志向性最大共通概念として識別可能な信号を出力する。
「共通概念結合ノード判定手段」は、志向性最大共通概念判定手段からの入力信号に基づいて志向性最大共通概念がどの概念であるかを特定する。次に、記憶手段に格納された概念対応データを参照しつつ、ノードに関連付けられたデータ群の中で志向性最大共通概念との関連性が最大のものがいずれであるかを、トポロジーグラフ単位で判定する。そして、これらの関連性が最大のデータに対応する一組のノードを結合ノードとして判定し、そのノードの組合せを識別可能な信号を出力する。
なお、関連性の定量化は、概念対応データに基づいて各データが属する概念を求め、その概念と志向性最大概念との比較によって行われる。各概念が概念空間におけるベクトルとして定義されている場合には、概念空間ベクトル同士の内積を求めることで定量的比較が実現される。
請求項2記載の発明によれば、二つのトポロジーグラフのそれぞれを構成するノード同士の組合せの中に共通する概念が対応付けられている組合せが複数ある場合には、その全てを結合対象とするのではなく、その共通概念に対する志向性が最大のものを結合対象として選択することとしている。このため、志向性情報を提供する志向性データベースに応じて異なる結合トポロジーグラフが形成されることとなる。結合作業を行うユーザ自らの志向性データベースを用いれば、そのユーザの志向性を反映した結合トポロジーグラフが形成される。あるいは、インターネットなどを経由して他人の志向性データベースを入手してその志向性データベースから思考性情報を参照すれば、その他人の志向性を反映した結合トポロジーグラフが形成されるといった具合である。したがって、特定の志向性データベースを用いてこの結合プロセスを繰り返すことで、志向性データベースを提供した人間の思考パターンを反映した概念知図を得ることが実現される。
(請求項3)
請求項3に記載の発明は、請求項1に記載のトポロジーグラフ表示システムを請求項2記載の発明とは異なる態様で限定したものである。
すなわち、二つのトポロジーグラフのそれぞれを構成するノードに対応する概念についての志向性データを志向性データベースから読み込む志向性データ読込手段と、トポロジーグラフを構成するノードに対応する概念の中で志向性が最大の志向性最大概念がいずれであるかを二つのトポロジーグラフのそれぞれについて判定する志向性最大概念判定手段と、その志向性最大概念との関連性が最も大きいノードを二つのトポロジーグラフのそれぞれについて選択し、その選択された一組のノードを結合ノードと判定する志向性結合ノード判定手段とを有するトポロジーグラフ表示システムに係る。
「志向性データ読込手段」は、まず、記憶手段に格納される概念対応データを参照しつつ、トポロジーグラフを構成するノードに関連付けられているデータが属する概念を、トポロジーグラフ単位でリストアップする。そして、志向性データベースにアクセスして、リストアップされた概念に対応する志向性データを読み込む。
「志向性最大概念判定手段」は、読み込まれた志向性データの中で定量化した値が最大のものがいずれであるかを、トポロジーグラフ単位で判定し、それらの志向性データに対応する概念を識別可能な信号を出力する。
「志向性結合ノード判定手段」は、志向性最大概念判定手段からの入力信号に基づいて志向性最大概念がいずれであるかを特定する。次に、記憶手段に格納された概念対応データを参照しつつ、ノードに関連付けられたデータ群の中で志向性最大概念との関連性が最大のものがいずれであるかを、トポロジーグラフ単位で判定する。そして、これらの関連性が最大のデータに対応する一組のノードを結合ノードとして判定し、そのノードの組合せを識別可能な信号を出力する。
請求項3記載の発明によれば、二つのトポロジーグラフのそれぞれを構成するノードにかかる概念の共通性に着目するのではなく、結合候補となりうる全てのノードに関連付けられたデータが属する概念に対応する志向性に着目して、結合ノードを選択する。このため、異なる概念にかかるノードの組合せであっても結合ノードと選定される場合があり得る。それらのノードに関連付けられたデータは、一般論としては全く異なる概念に属するものであっても、志向性データベースを提供した人間においては「好きなもの」という共通のカテゴリーに属する。それゆえ、その人間にとっては容易に連想できる関係にある。こうしたノードを結合点とすることで、志向性データベースを提供した人間の思考パターンが色濃く反映された結合トポロジーグラフが形成される。したがって、特定の志向性データベースを用いてこの結合プロセスを繰り返すことで、志向性データベースを提供した人間の思考パターンを反映した概念知図を得ることが実現される。
なお、請求項3記載の発明にかかる結合プロセスは、結果として共通概念にかかるノードを結合ノードとして選択する可能性もある。
また、共通概念による結合を優先する場合には、請求項2記載の発明を優先的に行い、共通概念にかかるノードの組合せが存在しないことを条件として請求項3記載の発明にかかる結合プロセスを実行するようにしてもよい。
(請求項4)
請求項4に記載の発明は、請求項1に記載のトポロジーグラフ表示システムを請求項2および3記載の発明とは異なる態様で限定したものである。
すなわち、結合志向性データベースは、各概念の組合せが結合対象として選択された回数を用いて算出される結合志向性の定量値を結合志向性データとして格納し、結合ノード選択手段は、二つのトポロジーグラフのそれぞれを構成するノード同士の組合せに対応する概念の組合せについて、結合志向性データベースから結合志向性の定量値を読み込む結合志向性読込手段と、結合志向性の定量値が最大である概念の組合せに対応するノードの組合せを結合ノードと判定する結合志向性結合ノード判定手段とを有するトポロジーグラフ表示システムに係る。
「結合志向性読込手段」は、まず、各トポロジーグラフを構成するノードからなる組合せをリストアップする。次に、それらのノードの組合せに対応する概念の組合せを、記憶手段に格納される概念対応データを参照しつつリストアップする。そして、結合志向性データベースにアクセスして、リストアップされた概念の組合せに対応する結合志向性の定量値を読み込む。
「志向性最大概念判定手段」は、読み込まれた結合志向性の定量値の中で最大のものを選び出し、それに対応する概念の組合せがいずれであるかを判別する。次に、結合志向性読込手段で作成したリストに基づいて、その概念の組合せに対応するノードの組合せがいずれであるかを判定する。対応するノードの組合せが一つである場合にはその組合せを結合ノードとして判定し、そのノードの組合せを識別可能な信号を出力する。対応するノードの組合せが複数ある場合には、概念対応データを参照しつつ、それらのノードの組合せに関連付けられたデータの中でその概念の組合せの各概念に対する関連性が最大のものがいずれであるかを判定し、それらのデータに関連付けられた一組のノードを結合ノードとして判定する。
請求項4記載の発明によれば、二つのトポロジーグラフのそれぞれを構成するノードにかかる概念の共通性に着目して結合ノードを選択するのではなく、過去の結合履歴を参照してもっとも高頻度で結合された概念の組合せにかかるノードの組合せを結合対象として選択する。このため、結合志向性データベースを提供した人間の好みや判断基準に倣って結合トポロジーグラフが形成される。したがって、特定の志向性データベースを用いて多数のトポロジーグラフに対してこの結合プロセスを実行することで、志向性データベースを提供した人間の思考パターンを反映した概念知図を得ることが実現される。
ここで、結合しようとするトポロジーグラフに関連付けられたデータ自体は新規なものであっても、そのデータの言語解析を行っていずれの概念に属するかを判別し、判別された概念レベルで結合履歴の参照を行う。このため、このようなデータであっても、結合志向性データベース提供者の志向は結合プロセスに適切に反映される。
(請求項5)
請求項5に記載の発明は、請求項1に記載のトポロジーグラフ表示システムを請求項2から4に記載の発明とは異なる態様で限定したものである。
すなわち、二つのトポロジーグラフのそれぞれを構成するノードのうち、どのノードを結合ノード選択手段での演算対象とするかを規定する結合対象ノード規定手段を有するトポロジーグラフ表示システムに係る。
「結合対象ノード規定手段」は、結合ノード選択手段が結合ノードを選択する処理を行う前に、いずれのノードが結合対象となりうるかを規定しておくものである。
規定対象となるトポロジーグラフは、結合にかかる双方であってもよいし、一方だけでもよい。
また、選択対象を規定する処理(規定処理)を実行するにあたっては、あらかじめユーザの意志がデータとしてシステム内のいずれかの記憶領域に格納されている場合には、その記憶領域にアクセスしてそのデータを読み込んで、規定処理を実行すればよい。あらかじめデータとして格納されていない場合には、どの様に規定するかをユーザに決定するよう促す表示を出力し、マウスやキーボードなどの入力手段からの入力信号が規定処理を開始するために必要なデータを含んでいることを条件として、その入力信号にかかるデータに基づいて規定処理を実行すればよい。
請求項5記載の発明によれば、結合ノード選択手段が所定の処理を行う前に、ユーザは結合対象となるノードを規定しておくことが実現される。もちろん全てのノードを対象としてもよいし、センターキーワードにかかるノードを除外してもよい。または、下位側にリンクを有さない末端ノードのみを対象としてもよいし、ノードに対応する概念の種類や志向性情報に基づいて規定してもよい。
結合プロセスは、志向性データベースまたは結合志向性データベース提供者の思考パターンを反映させる作業である。このため、結合対象ノードを規定するとは、データベース提供者の思考パターンを反映させる程度を規定することである。したがって、個人単位での概念知図の多様性の程度を制御することが実現される。
(請求項6)
請求項6に記載の発明は、トポロジーグラフの表示を実行するためのコンピュータプログラムに係る。
そのプログラムは、二つのトポロジーグラフを表示装置に表示するためのデータを作成するトポロジーグラフ表示手順と、二つのトポロジーグラフの構成要素である複数のノードから結合ノードとして一組のノードを選択する結合ノード選択手順と、選択された一組の結合ノード間に配置される結合リンクの長さを決定する結合リンク長決定手順と、二つのトポロジーグラフが一組の結合ノードにおいて結合リンクを介して結合されてなる結合トポロジーグラフを表示装置に表示するためのデータを作成する結合トポロジーグラフ表示手順とを備え、上記結合ノード選択手順は、複数のデータのそれぞれがいずれの概念に属するかを判別可能な概念対応データを格納する記憶手段にアクセスして二つのトポロジーグラフを構成するノードのそれぞれがいずれの概念に対応するかを判別する手順と、複数のデータが属する概念に対する個人の志向性を定量化した志向性データを格納する志向性データベース、および複数のデータが属する概念に対する個人の志向性を定量化した志向性データを格納する志向性データベースとの少なくとも一方から読み込んだデータを用いて演算することによって結合ノードの選択を行う手順とを有するコンピュータプログラムである。
請求項6に係るコンピュータプログラムを、記録媒体へ記憶させて提供することもできる。ここで、「記録媒体」とは、それ自身では空間を占有し得ないプログラムを担持することができる媒体であり、たとえば、フレキシブルディスク、ハードディスク、CD−R、MO(光磁気ディスク)、DVD−Rなどである。
また、これらの発明に係るプログラムを格納したコンピュータから、通信回線を通じて他のコンピュータへ伝送することも可能である。
なお、汎用的なコンピュータに対して、上記のような各手段を達成可能であるようなプログラムをプリインストール、あるいはダウンロードすることで、請求項1等に係る機能を備えた推論検索システムを形成することも可能である。
(第一のプロセス発明)
請求項6に対応させたプロセス発明を提供することも可能である。
すなわち、二つのトポロジーグラフを表示装置に表示するためのデータを作成するトポロジーグラフ表示手順と、二つのトポロジーグラフの構成要素である複数のノードから結合ノードとして一組のノードを選択する結合ノード選択手順と、選択された一組の結合ノード間に配置される結合リンクの長さを決定する結合リンク長決定手順と、二つのトポロジーグラフが一組の結合ノードにおいて結合リンクを介して結合されてなる結合トポロジーグラフを表示装置に表示するための表示用データを作成する結合トポロジーグラフ表示手順とを備え、上記結合ノード選択手順は、複数のデータのそれぞれがいずれの概念に属するかを判別可能な概念対応データを格納する記憶手段にアクセスして二つのトポロジーグラフを構成するノードのそれぞれがいずれの概念に対応するかを判別する手順と、複数のデータが属する概念に対する個人の志向性を定量化した志向性データを格納する志向性データベース、および複数のデータが属する概念に対する個人の志向性を定量化した志向性データを格納する志向性データベースとの少なくとも一方から読み込んだデータを用いて演算することによって結合ノードの選択を行う手順とを有するトポロジーグラフ表示方法である。
本願では、このほか、検索作業にかかる個人の考え方が反映されたトポロジーグラフを提供することをも目的として、以下のような発明も開示する。
この目的にかかる第一の発明は、検索条件データおよび検索結果データを含む検索データ群の関連性を視認できるように、検索データ群の要素である検索データに対応する複数のアイコン状のノードと、検索データデータ同士の関連性に応じた長さでそれらのデータにかかるノード間に配置されるリンクとから構成されるトポロジーグラフを用いて検索情報を表示装置に表示する検索システムであって、 検索データが属する概念に対する個人の志向性を定量化した志向性データを概念単位で格納する志向性データベースと、 検索データがいずれの概念に属するかを判別可能な概念対応データを格納する記憶手段と、 ユーザの指示が入力される入力手段と、 入力手段からの入力信号が検索データのいずれかを表示する旨のコマンドを含むことを条件として、表示にかかる検索データが属する概念がいずれであるかを概念対応データに基づいて判定し、志向性データベースの当該概念に対応する記憶領域に、入力手段からの信号入力時間とともにデータ表示がなされた旨をイベントデータとして書き込むデータ表示履歴書込手段と、 入力手段からの入力信号が検索データのいずれかに関する検索コマンドを含むことを条件として、検索データが属する概念がいずれであるかを概念対応データに基づいて判定し、志向性データベースの当該概念に対応する記憶領域に、入力手段からの信号入力時間とともに検索が行われた旨をイベントデータとして書き込むデータ検索履歴書込手段と、 検索コマンドを含む信号が入力手段から出力されたことを契機として実行された検索処理により得られた検索結果データに対応する演算対象ノードの上位階層側リンクの長さを演算するリンク長演算手段とを有し、 このリンク長演算手段は、 演算対象ノードに関連づけられた検索結果データおよび演算対象ノードの上位階層ノードに関連づけられた検索データの意味的な関連性を定量化した概念距離を、演算対象ノードに対応する概念の志向性データによって変更する演算を行うことを特徴とする検索システムである。
「トポロジーグラフ」、「志向性データベース」、および「記憶手段」は前述の請求項1から6にかかる発明で用いられたものと本質的には同じものであり、本発明では検索にかかる情報である検索データ群を対象としている点が相違する。この検索データ群を構成するデータには、検索条件のデータもあれば、検索結果のデータもある。このため、双方を含む意味で検索データ群の要素となるデータを「検索データ」と称する。
「入力手段」とは、キーボードやマウス、リモコン、ゲームコントローラなどユーザの意志を本発明にかかるシステムに伝えるための機器である。
「データ表示履歴書込手段」とは以下の処理を行うものである。まず、入力手段から出力される信号を入力とし、その入力信号が検索データのいずれかを表示する旨のコマンド(表示コマンド)を含むか否かを判定する。
そして、表示コマンドを含む信号であると判定したことを条件として、記憶手段に格納される概念対応データを適宜参照しつつ、表示にかかる検索データが属する概念がいずれであるかを特定する。
続いて志向性データベースにアクセスして、この特定された概念に対応する記憶領域に、入力手段からの信号が入力された時間とデータ表示がなされた旨とをイベントデータとして書き込む。
「データ検索履歴書込手段」は上記データ表示履歴書込手段とほぼ同等の処理を行うものである。入力手段からの入力信号が検索データのいずれかに関する検索コマンドを含むことを条件として、その検索データが属する概念を特定する。
そして、志向性データベースの対応する記憶領域に、入力手段からの信号入力時間とともに検索が行われた旨をイベントデータとして書き込む。ここで、データ検索履歴書込手段とデータ表示履歴書込手段とは同一の手段であり、イベントデータとして書き込むデータが、入力手段からの入力信号に応じて変化するようにしてもよい。入力信号かかるコマンドが表示コマンドである場合には識別番号「1」と時間データとからなるデータセットをイベントデータとし、検索コマンドである場合には、このデータセットが識別番号「2」と時間データからなるといった具合である。
「リンク長演算手段」とは、検索コマンドを含む信号が入力手段から出力されたことを契機として実行される検索処理により得られた検索結果データにかかる信号が入力されたことを契機として処理を開始するリンク長の演算手段である。
まず、その検索結果データに対応する演算対象ノードを特定し、その演算対象ノードに対応づけられた各種データ(検索結果データ、主概念、副概念など)を参照可能とする。その中に演算対象ノードの上位側ノードとの概念距離が含まれている場合にはそのデータを参照し、含まれていない場合には概念辞書を使って概念距離を算出する。
次に、志向性データベースにアクセスして、演算対象ノードに対応づけられた概念にかかる志向性データを読み込む。そして、この概念距離と志向性データとを用いてリンク長を演算する。
このように、通常は概念距離にのみ基づいてリンク長を算出する場合が多いが、本発明では、概念距離を志向性データによって変更してリンク長を算出することとしている。このため、志向性データを提供する人間に応じて、異なるリンク長が設定されることとなり、その結果として得られるトポロジーグラフの形状も個人の志向性を反映したものとなる。
上記目的にかかり提供される第二の発明は、第一の発明を限定したものである。
すなわち、志向性データベースは、ユーザの主観的志向性の定量値を志向性データとして格納する主観的志向性記憶領域を概念単位で有し、 入力手段からの入力信号がいずれかの概念の主観的志向性の定量値を変更する旨のコマンドを含むもことを条件として、入力手段からの入力信号に基づいて判定された主観的志向性定量値を、志向性データベースのその概念に対応する主観的志向性記憶領域に書き込む主観的志向性書込手段を有する検索システムである。
「主観的志向性書込手段」とは、入力手段からの入力信号がいずれかの概念の主観的志向性の定量値を変更する旨のコマンド(主観的志向性変更コマンド)であるか否かを判定し、主観的志向性変更コマンドを含むと判定したことを条件として以下の処理を行うものである。
まず、入力手段からの入力信号がいずれの概念に関する主観的志向性の定量値を変更するのかについて判定する。ここで、変更にかかる概念を直接指定している場合もあるが、ノードを指定している場合や検索データを指定している場合もある。それらの場合には、ノードや検索データに対応する概念がいずれであるかを概念対応データに基づいて判定することとなる。
こうしていずれの概念が対象であるかを判定したら、次に、対象となる概念の主観的志向性定量値を入力信号に基づいて判定する。なお、ノード単位や検索データ単位で指定されている場合には複数の概念が対象となっていることもある。このときはノードや検索データにおける各概念の関連性の強さを用いて、概念ごとに定量値を演算する。
そして、志向性データベースにアクセスして、その概念に対応する主観的志向性記憶領域に演算された定量値を書き込む。
このようにして書き込まれた主観的志向性定量値は、リンク長演算手段によって参照されて、リンク長の算出の基礎データとして用いられる。
上記目的にかかり提供される第三の発明は、第一の発明についての別の態様での限定であって、志向性データベースは、ユーザの操作履歴に基づく客観的志向性の定量値を志向性データとして格納する客観的志向性記憶領域を概念単位で有し、データ表示履歴書込手段とデータ検索履歴書込手段との少なくとも一方によってイベントデータが志向性データベースに書き込まれたことを条件として、そのイベントデータのデータセットを志向性データベースから読み込み、そのデータに基づいて算出される単位時間あたりの平均イベント発生回数を用いて客観的志向性の定量値を求める演算を行い、客観的志向性記憶領域にその定量値を書き込む客観的志向性書込手段を有する検索システムである。
「客観的志向性書込手段」とは、入力手段からの直接的な志向性変更のコマンドの入力を契機とするのではなく、ユーザが入力手段を介してトポロジーグラフにアクセスしたことを契機として、そのアクセス内容に基づいて客観的志向性の変更処理を行う手段である。
まず、データ表示履歴書込手段とデータ検索履歴書込手段との少なくとも一方によって志向性データベースにイベントデータが書き込まれたか否かを判定する。イベントデータが書き込まれたと判定したことを条件として、そのイベントデータのデータセットを志向性データベースから読み込む。
次に、そのデータセットに含まれるデータに基づいて単位時間あたりの平均イベント発生回数を算出する。続いて、その平均イベント回数を用いて客観的志向性の定量値を求める演算を行う。
そして、読み込んだイベントデータに対応する概念に係る志向性データベースの客観的志向性記憶領域に、算出した客観的志向性の定量値を書き込む。複数の概念についてイベントデータが書き込まれた場合には、それぞれの概念について上記処理を行って客観的志向性の定量値を書き込む。
このようにして書き込まれた客観志向性定量値も、リンク長演算手段によって参照されて、リンク長の算出の基礎データとして用いられる。
請求項1および請求項6記載の発明によって、志向性データベースまたは結合志向性データベースの提供者の思考パターンが適切に反映された概念知図を提供することができた。
請求項2に記載の発明によって、単に共通概念で結合されたのでなく、志向性データベースの提供者の思考パターンも反映された概念知図を提供することができた。
請求項3に記載の発明によって、志向性データベースの提供者の思考パターンが強く反映された概念知図を提供することができた。
請求項4に記載の発明によって、結合志向性データベースの提供者の思考パターンが強く反映された概念知図を提供することができた。
請求項5記載の発明によって、志向性データベースまたは結合志向性データベースの提供者の思考パターンを概念知図に反映させる程度を調整することができた。
以下、図面を用いつつ、本願発明にかかるトポロジーグラフを用いた検索システムの実施形態の一つについて説明する。ここで説明されるトポロジーグラフを結合されることによっても結合トポロジーグラフが形成される。なお、この説明において使用される図面は、図1から図17である。
(図1)
図1は、トポロジーグラフを用いた検索システムの一例として、検索を実行するサーバと、そのサーバをインターネットなどのネットワーク経由で利用するクライアントPCとの関係を図示したものである。
ここで、「クライアントPC」とは、ユーザが直接または間接的に情報を入力可能なコンピュータであって、インターネットやイントラネットなどのネットワークを介して接続するサーバに対してユーザの指示に基づく情報を送信する処理を行ったり、サーバから受信した情報を適宜加工しディスプレイなどの表示手段に表示させる処理を行ったりするものである。その形態はデスクトップ型でもノートブック型でもかまわなく、さらには、所定の情報処理を行うことができるのであれば、PDA(携帯情報端末)でも携帯電話でもかまわない。
サーバからクライアントPCに対して、フォーマット提供手段が検索用のフォーマットを提供し、クライアントPCの受信手段にて受信する。このフォーマットについては後述するが、センターキーワードを中心にパラメータが放射状に連結してなるトポロジーグラフを形成するためのフォーマットである。
提供されたフォーマットに対してユーザが入力手段を用いて入力したトポロジーグラフに相当するデータを、クライアントPCは検索用データとしてサーバに送信する。
送信された検索用データは検索用データ受信手段が受信する。そして、一次検索手段が受信した検索用データにおける一次パラメータに関して所定のデータ群からセンターキーワードとのアンド条件にて一次検索を実行する。このとき、単なるアンド条件で検索条件を作るのではなく、類義語を含んで検索しても良い。たとえば、センターキーワードが「ハワイ旅行」であり、一次パラメータが「ホテル」である場合には、「ハワイ旅行に用いるホテル」だけでなく、「ハワイ旅行に用いるコンドミニアム」や「ハワイ旅行に用いるペンション」も検索条件として含まれることになる。
なお、一次検索の対象は、インターネット上から探してくるのでも良いが、インターネット上のデータから構築されたデータベース(図中、「既作成DB」と表記)を用いることが多い。検索スピードが速いからである。
一次検索手段が検索した結果を用いて、二次パラメータ作成手段が一次検索結果に対して前記制限事項を用いたフィルタリング処理することで二次パラメータを作成する。そして、センターキーワードおよび各一次パラメータとで形成される概念と、各二次パラメータによる概念との概念距離を概念距離算出手段が算出する。トポロジーグラフ化手段は、その概念距離に基づいて、二次パラメータを一次パラメータとの関係を多次元表記する。その多次元表記結果であるトポロジーグラフは、返信手段がクライアントPCに対して返信する。受信したクライアントPCは二次パラメータが接続されて送信時より成長したトポロジーグラフを出力する。ユーザはそのトポロジーグラフをクライアントPCの画面上で見たり、プリントアウトしたりするなどして活用する。あるいは、次なる検索のたたき台として用いる。
(図2)
図2は、サーバがクライアントPCに提供するフォーマットと、クライアントPCに入力された検索用データとを図示した概略図である。
フォーマット提供手段は、検索センターキーワードひとつと、その検索センターキーワードに対するコンセプトパラメータを数個と、階層総数の制限とをフォーマットとしてクライアントPCに提供する。クライアントPCのユーザは、センターキーワードとして「ハワイ旅行」と入力し、そのハワイ旅行に関連するコンセプトパラメータとして「旅行代理店」、「観光スポット」、「ホテル」、「格安航空券」、「オアフ島」を入力する。そして、各コンセプトパラメータの階層となる総数を「20」と入力する。5つのコンセプトパラメータに対して4つずつの検索結果を得るというイメージからである。
提供されたフォーマットには、テキストデータにて入力されたデータをトポロジーグラフ化するプログラムが含まれており、図2下側に示すような、ハワイ旅行を中心とした放射状の検索データであるトポロジーグラフに変換して、クライアントPCの出力画面に表示する。そして、それをクライアントPCが確認したらサーバに対して送信する。
なお、上記トポロジーグラフ化プログラムはあらかじめクライアントPCにインストールされていてもよい。または、クライアントPCがフォーマットデータをサーバに送信し、サーバ内に設けられたトポロジーグラフ化プログラムでフォーマットデータをトポロジーグラフ化してクライアントPCへとサーバが送信してもよい。
(図3)
図3もまた、サーバがクライアントPCに提供するフォーマットと、クライアントPCに入力された検索用データとを図示した概略図である。図2との違いは、予めトポロジーグラフデータによるフォーマットをクライアントPCの出力画面に表示している点であり、余白部分に「検索シートの書き方」として注意点などを表示している。
(図4)
図4もまた、サーバがクライアントPCに提供するトポロジーグラフデータによるフォーマットと、クライアントPCに入力された検索用データ、すなわちトポロジーグラフとを図示した概略図である。図3との違いは、余白部分には、検索シートのサンプルを表示している点である。もちろん、検索シートの書き方を併せて表示しても良い。
(図5)
図5もまた、サーバがクライアントPCに提供するトポロジーグラフデータによるフォーマットと、クライアントPCに入力された検索用データ、すなわちトポロジーグラフとを図示した概略図である。図2、図3、図4との違いは、検索テーマに対する自由記載方式を採用し、階層総数の制限以外は、文章で表現している点である。検索シートのサンプルを表示したり、検索シートの書き方を併せて表示したりしても良い。
自由記載されたテキストデータは、システムから送信されたフォーマットとともに送り込まれたプログラムがトポロジーグラフ化する。このプログラムは、文脈を解析してセンターキーワードを抽出する手順と、そのセンターキーワードに対して一次パラメータを抽出して多次元的に配置するという手順とを、ユーザに係るコンピュータで実現するコンピュータプログラムである。
このプログラムも、クライアントPCがあらかじめ有していてもよいし、サーバが有していてクライアントPCとサーバとの間でデータのやりとりをすることとしてもよい。
(図6)
図6では、二次以降の高次パラメータ作成手段の機能を図示している。検索フォーマットの一部として、「ホテル、オアフ島」の部分を抽出して説明する。
一次検索手段が、既作成データベースに対して「ハワイのホテルであってオアフ島に関連するもの」という検索を実行し、Aホテル、Bホテル、Cホテル、ホテルDなどを抽出してきたとする。続いて、フィルタリング処理によって、「コンサート」といった宿泊に無関係な情報を削除する。更に、高次パラメータ作成手段が、「格安航空券」という別の一次パラメータから経済的なホテルの方がユーザの希望に見合うという推論の下、Aホテル、Bホテル、ホテルD、・・をソートする。その結果、「ホテル」という二次パラメータに対して、階層総数15というユーザによる指定(制限条件)との関係も加味して、「Aホテル」、「Bホテル」、「ホテルD」という3つを「オアフ島」という二次パラメータの下に三次パラメータとして接続させる。
ここで、予めクライアントPCのユーザの興味や志向が本発明に係るシステムにデータとして蓄積されている場合には、そのデータに基づいて推論を行っても良い。たとえば、ユーザは激安ホテルを選択する場合が多いことがデータとして蓄積されている場合には、そのデータに基づいて宿泊費が安いホテルを優先して選択することになる。或いは、「お得感」を常に求めるユーザである場合には、通常条件に対する割引率が高いホテルから優先的に選択することになる。
(図7)
図7では、概念距離算出手段の機能を図示している。図6に図示したように、「ホテル」という一次パラメータに接続されている「オアフ島」という二次パラメータに、「Aホテル」、「Bホテル」、「ホテルD」という3つの三次パラメータが接続することが決定されている。このとき、経済的なホテルという概念を重視する場合には、最も安い「Bホテル」がそのコンセプトに見合っており、3つの中では最も高い「ホテルD」はそのコンセプトに最も見合わない。そこで、オアフ島というパラメータからの距離として、「Bホテル」を最も近づけ、「ホテルD」を最も遠ざけるといった演算を行うのが概念距離算出手段である。
この概念距離設定の一例として、以下のように規格化しても良い。
強く惹かれると推測される: 0.2
惹かれると推測される: 0.5
特に興味なしと推測される: 1.0
どちらかといえば嫌いと推測される:1.5
嫌いであると推測される: 2.0
さて、ユーザのコンピュータに送信したトポロジーグラフは、それを構成している三次パラメータにつきクライアントPCを操作することによって概念距離の変更操作が可能とされている。そこで、ユーザはポインタ操作などによってその三次パラメータを操作する。
たとえば、「Aホテルが良かった」あるいは「Bホテルは良くなかった」という情報を知っていたユーザは、「Aホテル」をオアフ島に近づけたり、「Bホテル」を遠ざけたりするという操作を行う。全く候補から外す場合には、削除することもできる。この様にしてユーザの興味や志向を概念距離として反映させることができる。
この概念距離は、任意に設定可能であるが、たとえば次のように規格化しても良い。
強く惹かれる: 0.2
惹かれる: 0.5
特に興味なし: 1.0
どちらかといえば嫌い:1.5
嫌いだが削除はしない:2.0
関わりたくない:∞(パラメータ削除)
このように自らの関心度合いを概念距離に反映させることで、関心がある分野ほど中心のセンターキーワードに近接することになり、自らの興味や志向を視覚的に把握しやすくなる。
なお、このようなユーザの概念距離の操作、またはその操作の意味するところ(興味や志向の方向性)が記述されたデータはシステムの一部としてサーバまたはクライアントPCに蓄積され、その後の操作におけるユーザの興味や志向の推論に用いられる。
(図8)
図8は、サーバから出力されたトポロジーグラフを「予備検索」と位置づけ、新たな検索を行う場合について図示したものである。
図7を用いて説明したような、概念距離の変更操作後のトポロジーグラフを、検索用新データとして送信する。
送信された検索用新データに基づいて新たな検索条件が作成されて、一次検索が実行される。一次検索条件の設定段階でユーザにより変更された概念距離や、予め蓄積されたユーザの興味や志向が反映されて推論が行われるようにしてもよい。このように一次検索条件設定の段階でも推論を行うことで、一次検索結果の総数が少なくなり、さらには次ステップの四次パラメータ作成手段の負荷が緩和されて、システム負荷の緩和およびユーザにおける待ち時間等のストレスが緩和される。
なお、一次検索は、既作成データベースではなく、インターネット上にて検索するイメージを図示しているが、既作成データベースで済む場合にはそれでもよい。
続いて、高次パラメータ作成手段が制限事項を用いたフィルタリング処理をこの検索結果に対して実行することによって、四次パラメータが作成される。
このとき、ユーザにより変更された二次-三次パラメータ間の概念距離として表現された興味や志向の程度に応じてフィルタリングのレベルが変更される。このため、概念距離が短い三次パラメータには多数の要素が四次パラメータとして選択されるが、概念距離が長い三次パラメータには少数の要素しか四次パラメータとして選択されない。このようにして、ユーザの興味や志向に応じて情報量が変動することになる。その結果として、ユーザが着目する分野の情報量が増加し、視覚的にもユーザの興味や志向が把握されやすいトポロジーグラフが構築されることになる。
続いて、センターキーワードと各次のパラメータとを論理積したものに基づいて形成される概念と、これに連結されるべき新たな各三次パラメータによる概念との概念距離を概念距離算出手段が算出する。この段階での概念距離にもユーザの興味や志向が反映されることで、よりユーザの意思を反映したトポロジーグラフが構築される。
このように概念算出手段によって算出された概念距離を、トポロジーグラフ化手段が所定範囲のトポロジーグラフデータに表現可能なトポロジーグラフとし、返信手段がユーザに返信する。
また、検索用新データを用いて作成された新たなトポロジーグラフは、最初のトポロジーグラフとともにクライアントPCに返信される。すると、クライアントPCのユーザは、最初のトポロジーグラフとの比較を簡単に行うことが実現される。
(図9)
図9は、図8に示した出力のバリエーションを示したものである。
システム内部には、出力結果として使えるサンプルトポロジーグラフを蓄積したサンプルDBを備えており、そのサンプルDBは、テーマ毎に分類されている。概念距離算出手段に含まれるトポロジーグラフ比較手段は、検索用データ受信手段が受信した検索用データについて、センターキーワードおよびパラメータを用いて、サンプルDBに格納されるサンプルトポロジーグラフとの比較演算をして最も類似しているサンプルトポロジーグラフを抽出する。抽出された類似するサンプルトポロジーグラフを、返信手段がクライアントPCに返信する。
ここで、類似するサンプルトポロジーグラフの検索手法の一例について説明する。
第一のステップとして、当該トポロジーグラフにおけるセンターキーワードに類似する言葉を検索対象センターキーワードとして設定する。たとえば、センターキーワードが「ハワイ旅行」である場合に、「グアム旅行」を類似するセンターキーワードとして設定する段階である。
この類似するセンターキーワードの設定においてもいくつかの手法がある。
まずシステムで取り扱う単語をその意味に応じて予めいくつかの区分に分類し、さらに区分内に属する単語を概念的に階層化しておく。たとえば、「海外ビーチリゾート」の下位に「太平洋」、「大西洋」、「インド洋」、「カリブ海」、「地中海」、「アジア」が属し、「太平洋」の下位には「北太平洋」、「南太平洋」が属し、「北太平洋」の下位に「ハワイ」、「グアム」、「フィリピン」、「サイパン」など具体的なリゾートエリアが属しているとする。
このとき、「ハワイ旅行」の類似語を探すために、その主要単語である「ハワイ」に着目する。そして、概念階層において「ハワイ」の直上の単語である「北太平洋」に属する全単語、即ち「グアム」、「フィリピン」、「サイパン」などを類似の範囲として規定する。
または、その主要単語である「ハワイ」が属する概念階層の最上の単語である「海外ビーチリゾート」に属する全単語を、類似の範囲として規定する。したがって、「グアム」、「フィリピン」、「サイパン」だけでなく、「インド洋」に属する「セイシェル」なども類似範囲として含まれることになる。
なお、ここでは自動的に類似範囲を規定する手法を示したが、ユーザに類似範囲を規定させても良い。たとえば、「ハワイ旅行」に類似するものとして、ユーザが「ミッドウェー島旅行」を規定しても良い。
この情報を記述したデータは、今後の検索に反映されるように、クライアントPC内の記憶手段に格納される。
続いて、第二のステップとして、類似範囲として規定された単語を含む言葉をセンターキーワードとするトポロジーグラフをサンプルデータベースから抽出して、「ハワイ旅行」のトポロジーグラフとの類似度を評価する。
この類似度を評価するためには、以下のようにして予めトポロジーグラフの定量化を行う。
まず、トポロジーグラフの構造上の特徴を示す構造点数について説明する。
第一に各次のパラメータについて自らの下位に属するパラメータ総数を算出する。一般的には、センターキーワードに近い低次パラメータほど下位パラメータ総数が大きく、ユーザが当該パラメータに関心があり関連項目が深耕りされると下位パラメータ総数は増加する。
次に、各パラメータについて、センターキーワードからの概念総距離を算出する。前述の例に基づくと削除されていない限り各パラメータ間の距離は0.2から2.0の範囲に属する。深い階層までを検索して得られたパラメータは階層が深い分、センターキーワードからの概念総距離が大きくなる。
続いて、各パラメータについて個別の構造点数=(下位パラメータ総数)/(概念総距離の二乗)を算出する。この個別点数の総和がトポロジーグラフの構造点数となる。構造点数が大きいということは、低次パラメータにおいて分岐数が大きく、広がりのある構造を有していることを示している。
もう一つのトポロジーグラフの定量化として、センターキーワードの概念階層上の位置づけ(階層)である概念点数を算出する。概念点数が小さいということは、センターキーワードが概念的に上位に属する単語を中心に構成されていることを意味する。
この構造点数と概念点数とを2次元上にプロットすると、そのトポロジーグラフの特徴を把握することができる。
一般論として、概念点数が小さい場合、すなわちセンターキーワードが比較的上位概念である場合には、構造点数は大きくなる。上位概念の単語ほど多数の下位概念の単語を従えているからである。このため、一般的なトポロジーグラフについては、構造点数と概念点数とのプロットは負の相関を示すことになる。
ところが、概念点数と構造点数とがともに大きくなる場合もある。センターキーワードを構成する単語としては下位概念側に属しながら、ユーザがその概念に属する多くの事象に興味を示して多面的な検索を行い、その結果として多数の分岐を有している場合である。
逆に、概念点数と構造点数とがともに小さくなる場合もある。センターキーワードを構成する単語としては上位概念でありながら、ユーザがその概念に属する事象の中で特定のものにのみ関心を示し、分岐の広がりが少ない場合である。
このように、センターキーワードについての構造点数および概念点数のみを用いることで、少ない演算負荷でトポロジーグラフの定量化を行うことが実現されるが、下位の階層の構造点数・概念点数を用いると、更に詳細にトポロジーグラフの特性を定量的に把握することもできる。
たとえば、センターキーワードに接続する各パラメータの構造点数をトポロジーグラフの構造点数で除して各パラメータの構造比率を算出し、上位数個(たとえば3個)を選び出す。
これらについて概念点数と構造点数との二次元プロットを行う。なお、一般的には上位にランクされるのはセンターキーワードに直接的に接続する一次パラメータである。
こうして得られた3個の点が作る三角形の面積や重心の位置、さらには重心と各点との距離の最大値によってもトポロジーグラフの特徴を把握することができる。
以上のような定量化の結果を用いて、複数のトポロジーグラフの類否判定を行う。具体的には、上記のセンターキーワードについての二次元プロットにおける配置座標が離れている場合や、下位階層のパラメータをも用いた特性評価の結果として二次元プロットに描かれる三角形同士に重なり合いがない場合には、具体的な言語レベルでの比較を行うまでもなく、類似している可能性は低いと判定される。
上記プロセスで類似性ありと判定されたトポロジーグラフについては、構造点数が高いパラメータについて言語レベルでの比較を行い、類否判定を行う。同義語或いは類義語であると判定されたパラメータの個数によってトポロジーグラフとしての類似度をレベル分けしても良い。
なお、上記の類否判定に用いられるようなパラメータの複数に概念上の関連性が強い、たとえば同一の概念区分内にすべてのパラメータが属する場合には、ユーザの興味がその区分に集中しており、これらのパラメータのうち概念階層が最も低い位置にある単語はユーザの興味を象徴する単語である可能性が高い。したがって、このような場合には、この単語をパラメータとして含むトポロジーグラフであれば、他のパラメータが類似していなくても類否判定上は類似度大と判定しても良い。
以上のプロセスで、「ハワイ旅行」のトポロジーグラフに類似する「グアム旅行」や「サイパン旅行」のトポロジーグラフをサンプルDBから選択することが実現される。
もちろん、このプロセスによれば「ハワイ旅行」であって構造上類似するトポロジーグラフも選択可能である。
運用上は、センターキーワードが「ハワイ旅行」であって類似するトポロジーグラフと、センターキーワードが「ハワイ旅行」ではない類似するトポロジーグラフとをクライアントPCに返信し、後者はセカンドオピニオンとして提示することが望ましい。
こうした類似データの選択プロセスを応用すると、既存のトポロジーグラフに新たな条件を付与する検索も容易に実現される。具体的には、既存のハワイ旅行に関するトポロジーグラフに対して、「このハワイ旅行よりも安価に同様の楽しみを得られるツアーを探す」といった検索を実現することができる。
このトポロジーグラフが一種のツアーパッケージとなっており、各トポロジーグラフにツアー価格が規定されている場合には、類否判定の段階における判定基準を緩和して候補トポロジーグラフ数を増やすとよい。そして、ツアー価格が低い順番にソートすることで所望のトポロジーグラフを得ることができる。たとえば、前述のパラメータ構造比率を用いた類否判定を行うときに、判定の対象とするパラメータ数を増やすと(たとえば、3つ→6つ)、パラメータが二次元プロット上に作る図形は一般的に大きくなる。このため、比較する二つのトポロジーグラフは互いに重なりやすくなり、類似していると判定されやすくなる。
これに対してツアー価格が不明な場合には、同様に類否判定の判定基準を緩和して候補トポロジーグラフ数を増やすものの、次に、ツアー価格を安くする要因となり得る単語(たとえば「安い」、「激安」、「お得」)をパラメータまたはパラメータのメタデータに含むトポロジーグラフを候補内で検索して、該当するトポロジーグラフを優先的に抽出するようにすれば良い。
あるいは、類似の可能性ありと判定されたトポロジーグラフについて、それらの作成者の興味や志向が記憶されたデータベースを参照して、安いツアーを求める傾向があるものを優先的に抽出するようにしても良い。
(図10)
図10は、上記の説明にかかるトポロジーグラフを用いた検索システムに対するインプットと最終的なアウトプットとを概念的に示したものである。アウトプットはトポロジーグラフとして表記されている。
詳しい図示は省略するが、各項目にはリンクを張ってあるので、更に詳しく知りたい情報については、クリックするだけでよい。
またアウトプットは、トポロジーグラフ化手段によって、横長の長方形に収めるように調整されている。ユーザは、必要の応じて拡大縮小の命令を操作し、部分的に拡大したりすることができる。
(図11)
図1から図10までは、「ハワイ旅行」を検索のメインテーマ(センターキーワード)とした例を説明してきたが、検索のセンターキーワードは、旅行に限られない。たとえば、不動産を検索する場合にも用いることができる。
たとえば、東京へ転勤が決まったユーザとしては、引っ越し先を探さなければならない。そのような場合には、勤務先の住所、通勤手段、教育機関、医療機関、買い物や食事といったコンセプトパラメータを入力するとともに、階層総数を指定して検索用データを作成する。
提供されたフォーマットには、テキストデータにて入力されたユーザによるデータをトポロジーグラフ化するプログラムが含まれており、「東京の賃貸不動産」を中心とした放射状の検索データに変換して、ユーザのクライアントPCの出力画面に表示する。そして、それをユーザが確認したらサーバに対して送信する。
このプログラムも、クライアントPCがあらかじめ有していてもよいし、サーバが有していてクライアントPCとサーバとの間でデータのやりとりをすることとしてもよい。
(図12)
図12は、図10のように、ユーザがインプットする検索用データと、サーバによってアウトプットされるトポロジーグラフとを概念的に示したものである。
ここで一次検索に用いる既作成データベースには、予めタイアップ企業の情報が優先的に出力されるように格納されている。そのため、勤務先の住所に対しては、タイアップ企業となっている不動産会社である「S不動産」や金融機関である「L銀行」が表示される。クリックすれば、その住所地に最も近くの支店名、住所、連絡先などが表示される。
同様に、「通勤手段」に対しては、タイアップ企業である「M電鉄」や「P引越サービス」が放射状に表示される。「教育機関」に対しては「N学習塾」が、「医療機関」に対しては「Q総合病院」がそれぞれ表示される。「買い物、食事」については、「Mデパート」、「Rショッピングセンター」が表示され、更にMデパート内に支店がある「Tイタリアン」やRショッピングセンター内で開店した「Jフレンチ」といったレストランも更なる階層下に表示される。
上記の検索システムに基づいて、以下のようなサービス(コンシェルジュサービス)を提供することも実現される。
コンシェルジュサービスは、大きくは、テンプレートトポロジーグラフの準備、およびテンプレートトポロジーグラフの成長の2ステップから構成される。
サービスを受けるユーザが自分の最小限の要望を表現したトポロジーグラフをサーバに送信すると、その要望に適合するテンプレートトポロジーグラフがテンプレートDBから選択されてユーザの下に送信される。ユーザはそのテンプレートトポロジーグラフを確認後、自らの追加要望とともにサーバにこのテンプレートトポロジーグラフ送信する。テンプレートトポロジーグラフを受信したサーバはインターネットまたはこれと同等の情報を有するDBにアクセスして、トポロジーグラフに接続すべき関連情報を推論しつつ検索する。得られた検索結果はトポロジーグラフに対して適宜接続され、こうして成長したトポロジーグラフはサーバの返信手段によってユーザが使用するクライアントPCへと送信される。
以下に上記プロセスを詳説する。
まずテンプレートトポロジーグラフの準備について説明する。
図13はテンプレートトポロジーグラフの作成プロセスを概念的に示した概略図である。
ユーザは、自らの要望を簡単な文章で入力する。たとえば「急に東京に転勤が決まった。勤務地は新宿で、通勤時間は30分以内、家賃の予算は12万円、2DKは欲しい。」と言った具合である。この文章をサーバへと送信すると、サーバが有するクエリトポロジーグラフ作成手段はこの文章を構文解析し、「東京の賃貸不動産」を核として、「家賃12万円以内」、「新宿から30分以内」、「2DK以上」を第一次パラメータとするクエリトポロジーグラフを作成する。
送信手段を介してクライアントPCの表示画面上に表示されたクエリトポロジーグラフに対して、ユーザは概念距離を適宜調整することで、複数の一次パラメータにおける自らの優先順位を表明する。概念距離の調整については説明済みなのでここでは省略する。
概念距離が調整されたクエリトポロジーグラフをサーバの受信手段が受信すると、テンプレート選択手段は、このクエリトポロジーグラフを入力として、テンプレートDBに蓄積されるテンプレートトポロジーグラフを検索する。そして、ふさわしいと判定されるテンプレートトポロジーグラフを選択して、送信手段を介してクライアントPCに送信する。
テンプレートDBには多数のテンプレートトポロジーグラフが目的によって分類されて蓄積されている。その区分とは、たとえば「引越」、「旅行」、「就職」、「資格」、「趣味」と行った具合である。「引越」の区分におけるテンプレートトポロジーグラフの一例としては、「メゾン経堂」という物件名を核とし、一次パラメータとして「物件情報」、「周辺情報」、「費用」を有し、「物件情報」には「マンション」、「二階角部屋/三階建て」、「2DK」、「南向き」、「平成2年築」が接続しており、「周辺情報」には「経堂駅徒歩10分」、「コンビニ至近」、「公園近い」が接続しており、「費用」には「家賃11万8千円」、「敷金2ヶ月」、「礼金1.5ヶ月(0.5ヶ月分ディスカウント)」「引越代金2割引」が接続しているものを挙げることができる。
このテンプレートDBに蓄積されるテンプレートトポロジーグラフは、本サービスのタイアップ企業や教育機関が提供する情報に基づいて構築される。したがって、テンプレートトポロジーグラフにはタイアップしている企業等の特典情報が含まれている。たとえば、上述の例では、「礼金1.5ヶ月(0.5ヶ月分ディスカウント)」や「引越代金2割引」が特典情報に該当する。
テンプレート選択手段が実行する検索プロセスの基本構成は従来技術に基づくことで構築可能である。しかし、この検索においては、ユーザによって概念距離として表明された重要度によって検索条件の重み付けを行う。たとえば、先の引越の例を用い、クエリトポロジーグラフにおいて「家賃12万円以内」の概念距離が特に短く、「2DK以上」の概念距離が他より長いとする。
この場合には、検索において「家賃12万円かつ通勤30分以内かつ2DK以上」の条件を満たす物件が見出せない場合には、まず「2DK以上」の条件を緩和して「2K」や「1DK」の条件として他の条件を満たす物件を探す。それでも見出せない場合には、「2K」や「1DK」の条件にしたまま、「通勤30分以内」をたとえば5分刻みで緩和しながら「家賃12万円」を満たす物件を探す。この様に概念距離を反映した検索を行うことで、テンプレートの段階でもユーザの要望に適することが実現される。
こうしてテンプレート選択手段は、複数の、たとえば5つのテンプレートトポロジーグラフをテンプレートDBから選び出し、クライアントPCへと送信できるようにする。
こうしてテンプレートトポロジーグラフの準備が完了する。
続いて、テンプレートトポロジーグラフの成長について説明する。
テンプレートDBから選択されたテンプレートトポロジーグラフはいわば万人向けの情報であり、ユーザの特別な要望事項や志向が反映されたものではない。そこで、インターネット上に公開されている情報からユーザの要望や志向を反映した情報を探索して、これらの情報をテンプレートトポロジーグラフに接続させて、トポロジーグラフをカスタマイズする。
このプロセスは以下のように進められる。
まず、サーバが有する成長フォーマット表示制御手段が、トポロジーグラフ成長用入力フォーマットをクライアントPC上に表示させる制御を行う。この入力フォーマットはテンプレートトポロジーグラフの区分に応じて予め複数種類作成されており、サーバが有する記憶手段に記憶されている。成長フォーマット表示制御手段は、クライアントPCへと送信されたテンプレートトポロジーグラフの区分を判定し、その区分に応じた入力フォーマットを選択し、記憶手段からそのデータを取り出して送信手段を介してクライアントPCへ送信する一連の作業を制御する。
「引越」を例にすると、以下のような入力フォーマットが表示される。
1.引越希望日、入居希望日
2.現在の住所、引越荷物送付住所
3.居住予定人数、構成(性別、年齢)
4.他の勤務先、通学先
5.医療関連情報
6.趣味
7.好物
8.その他(フリースペース)
これらの情報が記載された入力フォーマットを受信したサーバにおいて、検索条件作成手段が入力フォーマットに基づいて検索条件を作成する。この段階で、人工知能を用いたユーザの要望の推論がなされることが望ましい。
たとえば、引越希望日と入居希望日とに数日のずれがある場合には、この間の宿泊が必要と判定し、勤務先である新宿の近傍の宿泊施設についての情報を検索するための検索条件を作成する。
また、子供がいる場合には、その年齢から転校手続の必要性を判定し、必要と判定したときには当該物件を学区内に含む学校を検索する検索条件を作成すると共に、手続情報を検索するための検索条件を作成する。
さらに、医療関連情報や趣味、好物の欄に記載があれば、近接する医療機関(たとえばカイロプラクティック)、趣味を実現するために必要な施設(たとえばテニススクール)、好物を提供する飲食店(たとえば本格手打ち蕎麦屋)の情報を検索するための検索条件を作成する。
フリースペースに記載がある場合には、これを構文解析・意味解析し、その結果に基づいて検索条件を設定する。
さらには、ユーザごとの本サービスの利用履歴を蓄積する記憶手段にアクセスして、当該ユーザの利用履歴情報からユーザの好みに係る情報を取り出し、その情報に基づいて検索条件を作成しても良い。
たとえば、かつて当該ユーザが本サービスを使って現在の居住地近傍のワイン専門店を探して高級ワインを複数購入したことがあり、この情報が利用履歴として蓄積されている場合には、近傍のワイン専門店を探すための検索条件を追加してもよいし、ワイン保管サービスを行っている業者を検索する検索条件を追加してもよい。
なお、こうして作成された各検索条件について、条件を象徴的に示す言葉が一次パラメータとして決定される。
こうして各テンプレートトポロジーグラフについて複数の検索条件が作成されると、これらの条件を入力として、検索手段がインターネットまたはこれと同等の情報を有するデータベースを検索し、一次検索結果を作成する。
これらの検索結果を入力として、高次パラメータ作成手段がユーザの興味や志向を反映させながらトポロジーグラフに接続すべきパラメータを決定し、概念距離算出手段がこれらのパラメータを入力として各パラメータの概念距離を算出する。これらの各手段が行う処理の詳細については説明済みであるから省略する。
以上のプロセスによって、新たな一次パラメータ、高次(二次)パラメータ、およびパラメータ間の概念距離が決定されるので、これらを入力として、トポロジーグラフ化手段は新たなトポロジーグラフを作成する。具体的には、入力されたテンプレートトポロジーグラフに適宜一次パラメータ、二次パラメータを適切な距離で接続させる。
作成されたトポロジーグラフは、返信手段を介してクライアントPCに送信される。
トポロジーグラフを受信したユーザは追加されたパラメータを見つつ、適宜概念距離を調整し、調整後のトポロジーグラフを再度サーバに送信する。サーバは受信した調整後のトポロジーグラフをベースにして新たに検索条件を作成し、トポロジーグラフを成長させる。この段階のプロセスの詳細は説明済みなので省略する。
このようにして、ユーザは複数のテンプレートトポロジーグラフを成長させながら自ら要望を最も具備するトポロジーグラフを選択して、引越先を決定することになる。
(図14)
ところで、センターキーワードが特殊であり、検索対象データの数が限られている場合や、期間を限定するなどによって、センターキーワードの他に二次パラメータまでを設定せずに、本発明に係る検索システムを利用することが可能な場合がある。
たとえば、「最近一週間の三大紙による社説でどんなことが話題になったのか?」といった検索をしたい場合には、図14に示すような検索を実行させる。すなわち、センターキーワードとして「社説」を、一次パラメータとして「朝日新聞、毎日新聞、讀賣新聞」を、限定条件として「最近一週間」を、それぞれ指定する。
検索結果としては、一次パラメータを中心としたニュースのキーワードを散りばめたトポロジーグラフが表示されることとなる。
もし、これまでの検索手法によって、「最近一週間の三大紙による社説でどんなことが話題になったのか?」といった漠然とした課題に対するアウトプットを得ようとしたら、一週間分の各新聞の社説を収集し、検索者自らが読みこなしてキーワードを抽出するか、社説のタイトルを機械的にピックアップする。そして、ソフトウェアのディレクトリ機能などを用いてアウトプットを作成しなければならないであろう。
(図15)
図15は、図14で得てアウトプットを用いて、センターキーワードを入れ替えて、トポロジーグラフを再構築させた場合を示している。
この図示例では、「朝日新聞」の直下の階層である「中国」をセンターキーワードに入れ替える命令をしたものである。ユーザは、自らのクライアントPCの出力画面において、ポインタ操作によって「中国」という言葉をドラッグして「社説」というセンターキーワードと入れ替える。するとサーバは、「中国」を中心に、一週間分の各新聞の社説がどのようなキーワードを用いて書かれていたか、というトポロジーグラフを再構築する。
この場合、サーバが再構築の対象とするデータは、「一週間分の各新聞の社説」に限定している。そして、「構文解析、意味解析」の結果として、「中国」に関わるキーワードを抽出し、トポロジーグラフに組み直すのである。このように、いったん得たアウトプットをユーザが再加工の指示をして活用することもできる。
図14および図15のような例を通じ、ユーザは自らが感じていた「漠然と欲していた情報」が「中国についての最近の新聞による見解」が知りたかったという検索目的の明確化を得る。同時に、その検索目的に応じての「キーワードによる整理されたトポロジーグラフ」というアウトプットも得ることができる。
(図16)
図16は、図10に示した実施形態におけるアウトプットを三次元的にしたバリエーションを示したものである。
ユーザが入力したインプットにおいて、旅行の予算については制限条件があったものの、旅行の時期についての制限条件がなかったような場合には、季節によって異なる旅行代金を反映して、異なるプランを複数のシートによるアウトプットしている。図示例では3つのアウトプットを出力したイメージを表しているが、更に細かく出発日を一日単位で出力したとすれば、時間軸について連続性が出てくるので、アウトプットが三次元により近づくこととなる。
(図17)
図17は、図12に示した実施形態におけるアウトプットを三次元的にしたバリエーションを示したものである。
ユーザが入力したインプットにおいて、契約日についての制限条件が無かった、あるいは緩かった場合として、契約日によって異なるプランを複数のシートによるアウトプットしている。この図示例でも3つのアウトプットを出力したイメージを表しているが、更に細かく契約日を一日単位で出力したとすれば、時間軸について連続性が出てくるので、アウトプットが三次元により近づくこととなる。
(三次元的なアウトプットのバリエーション)
複数のシートによるアウトプットではなく、時間に伴う変化が連続的なアウトプットの場合、アニメーションのように所定時間の中で動画的に表示させてもよい。シート状の出力の場合には、複数のシートを比較検討するのに適しているが、時間に伴う変化の推移にアウトプットの本質がある場合には、アニメーション表示が優れている。
以降、概念検索による情報をトポロジーグラフとして表示するシステムに係るクライアントPCおよびサーバの動作を、ユーザやネットワークとの関係で示したフローチャート(図18から図25、および図26および図29)を用いて説明する。
(図18)
図18は、ユーザからの要望データ入力からサーバがクライアントPCからのデータを受信するまでの動作がフローチャートとして示されている。
まず、ユーザはクライアントPCにプリセットデータを入力する(S01001)。プリセットデータとはクライアントPCとサーバとが協働して検索を行うに当たっての前提情報であり、以下のようなものが含まれる。各データの意味についての説明はフローチャートで関連する動作(ステップ)の説明とともに行う。
・一階層下の概念ノードの表示数(最大値)
・一階層下のURLノードの表示数(最大値)
・一階層下のノード表示数とリンク長との関係
・一回の検索で抽出する文セグメントの最大値
ユーザによって入力されたプリセットデータはクライアントPCに入力され、クライアントPCはこのデータに基づいて、クライアントPC内部で保持すべきデータやサーバに送信すべきデータを作成する(S01101)。
ユーザから要望データがテキストデータとして入力される(S01002)と、入力されたテキストデータに対して、形態素解析(S01102)および係り受け解析(S01103)をクライアントPCは行う。こうしてテキストデータの意味解析が可能な状態になり、クライアントPCは推論を含む解析を行ってクエリを作成する(S01104)。
続いて、クライアントPC内で作成されたサーバに送信すべきプリセットデータおよびクエリを、ネットワークに送信可能な状態にデータ変換する(S01105)。この変換処理は、データの暗号化や圧縮、パケット化を含んでもよい。また、この変換処理の詳細な設定情報がプリセットデータに含まれていてもよい。
クライアントPCは、ネットワークを介して接続されるサーバへとこの変換データを送信する。なお、この送信データはサーバへと直接送信されなくてもよい。たとえば、いったんクライアントPC内のメモリなどの記憶装置に格納されてもよいし、ネットワークを介して接続される別のコンピュータの記憶装置に記憶されてもよい。
データ送信が終了したら、クライアントPCは、サーバからの検索結果データを受信可能な状態とする処理を行う(S01107)。その後、作成したクエリに関して志向性処理を行う(S01108)。この志向性処理については後述する。
一方、クライアントPCからデータを受信したサーバは(S01201)、その受信データをその後の処理が可能なようにメモリ内に展開したり、バックアップとして適切な記憶装置に格納したりする(S01202)。
(図19)
引き続いての処理は図19を用いて説明する。
サーバは検索を行うための前段階として以下の処理を行っている。
まず、ネットワーク201(ここでは一例としてインターネットとして説明を行う。)上の複数のURL202にアクセスして、各URLが保有するテキストデータを収集する指示を行う(S02301)。
次に、この指示に基づいて収集されるデータに対して、その長さや形式を整えるクレンジングを行う(S02302)。収集されたテキストデータはこのクレンジング処理によって複数の文ブロックに変換される。
一例として、以下の文をクレンジング処理する。
(入力文)
「東京都心で初雪、平年より22日も早く強い寒気の影響で、東京都心では11日夜、初雪を観測した。気象庁によると、都心の初雪は平年より22日、昨年より18日早い。12日も冷え込むと見られるが、積雪はない見込み。冬型の気圧配置はこれからも続き、同庁によると、今後約1週間は寒い日が続くという。」
この入力文に対するクレンジング結果は以下のとおりである。
(文ブロック1)
「東京都心で初雪、平年より22日も早く」
(文ブロック2)
「強い寒気の影響で、東京都心では11日夜、初雪を観測した。」
(文ブロック3)
「気象庁によると、都心の初雪は平年より22日、昨年より18日早い。12日も冷え込むと見られるが、積雪はない見込み。」
(文ブロック4)
「冬型の気圧配置はこれからも続き、同庁によると、今後約1週間は寒い日が続くという。」
この文ブロック群はそれぞれ元となるURLの情報を関連付けられて格納されており、各文ブロックは対応するURLの目次(インデックス)の役割をすることができるようになっている。
サーバ内またはサーバに接続されたコンピュータ内の記憶装置に設けられたデータベース(インデックスDB)203に、クレンジング処理により生成した文ブロック204をURLの情報を保持した状態で格納する。
以上のようにインデックスDB203を整備した状態で、以下の検索処理をサーバは行う。
まず、サーバ内のメモリからクエリデータを読み込み(S02201)、インデックスDB203内の文ブロック204を検索対象として概念検索を行う。
「概念検索」とは、キーワード同士の意味的な関連性を考慮した検索技術である。通常の検索のようにキーワードと一致する語句を検索するのではなく、キーワードの内容(Concept)で探すことを指す。検索対象となる文ブロック204の内容を判定した上で、検索キーワードと概念的にどの程度類似するかを定量的に算出して類似度とし、類似度が高いものを抽出対象と判定する。
まず、インデックスDB203に格納されている各文ブロック204について構文解析を行う。構文解析では、言語辞書データベース205に適宜アクセスして、おのおのについて多数次元で表現される概念空間におけるベクトル(以降、「概念空間ベクトル」と称する。)を算出する。この概念空間ベクトルは、ベクトル和のスカラー量が1になるように規格化しておくことで、その後の処理が容易になる。
クエリについても同様に概念空間ベクトルを求め、これとあらかじめ用意してある各文ブロックの概念空間ベクトルとのスカラー積を演算し、類似度を算出する。
次に、この類似度によってインデックスDB203に格納されている文ブロック204のソートを行い、類似度の高い文ブロックを抽出する(S02203)。抽出対象は上位n個(たとえば1000個)というように予め決定しておくことが、その後のデータ分類処理およびこれに引き続くデータ表示処理の関係で望ましい。本実施例では、この抽出最大数をプリセットデータとしてサーバが受信することとしている。サーバはメモリからこの最大値を読み込み、この数値に基づいて抽出数を決定する。
続いて、抽出された文ブロック群を概念的に類似する複数のグループに分類する(S02204)。各文ブロックは概念空間ベクトルとして表現されているため、概念空間における分布から近接する複数の文ブロックを一つのグループとしてまとめることが可能である。
このグルーピングの数は、プリセットデータとして入力される一階層下の概念ノードの表示数に基づいて決定される。この表示数の2倍から3倍の数のグループを作ることが望ましい。
そして、各グループに属する文ブロック群の代表的な概念を選択する(S02205)。この選択方法は、たとえば、各文ブロックの概念空間ベクトルの総和を演算してその要素が最大値となった概念を選択してもよい。または、各文ブロックにかかる概念ベクトルの要素のうちで最大の値を有する要素を抽出し、これらの要素でもっとも多頻出の概念を選択してもよい。
こうして各グループの代表として概念が選択されたら、クエリデータにかかる概念とその概念との概念距離を算出する(S02206)。ここで、概念距離は二つの概念の連想のしやすさを定量化したものであり、たとえば、言語としての概念の近さだけでなく、各グループに属する文ブロック数なども考慮して算出してもよい。または、時事情報を含むデータベースに基づいて各概念から連想される単語群を設定し、比較する二つの概念に属する単語群の関係を定量化して概念距離の演算に用いてもよい。その他、公知の手法を用いて算出してもよい。
以上の処理によって、概念ごとに、概念距離とその概念に属する文ブロック群とが決定される。また、各文ブロックには、概念ベクトルおよびクエリとの類似度ならびに由来となるURLを識別可能な情報が付随している。
これらの情報の一部をテーブル状データとして概念的に示したのが図28である。ここで、概念距離は0から1の範囲で設定されており、0に近いほど概念的に近接していることを示している。
サーバは、ネットワークを介して送信可能な情報にこのデータを変換して、クライアントPCへと送信する(S02207)。その処理内容は図18のステップS01105からステップS01107までの処理(以降、「送信処理」と称する。)と同様である。
クライアントPCはこのデータを受信すると(S02101)、そのデータに基づいてトポロジーグラフを表示手段に表示するためのデータを作成して、表示手段に出力する(S02102)。なお、ステップS02101の処理は、図18のステップS01201からステップS01202の処理と同様である(以降、「受信処理」と称する。)。
トポロジーグラフの一例を図29に示した。クエリの中心的概念がセンターキーワードとして表示されたノードの周囲に、3つのノードが第一階層ノードとして配置されている。この第一階層ノードのそれぞれには、概念検索の結果として得られた概念距離がもっとも短い(すなわち概念近似度がもっとも大きい)3つの概念がそれぞれ表示されている。センターキーワードのノードとこの3つのノードとはリンクによって連結されており、このリンクの長さ(「リンク長」)はサーバから受信したデータに基づく概念距離に基づいて設定される。詳細は後述する。
図29に示されるように、第一階層の各概念ノードの下位には4つのURLノードと3つの概念ノードが所定のリンク長で接続されて第二階層ノードを構成している。
これら第二階層ノードのうち、URLノードについては次のように決定する。各第一階層ノードの概念に帰属する文セグメントのうち、類似度が高い上位5個の文セグメントを選択し、これらの文セグメントを含むURLを表示対象ノードとして決定する。なお、第一階層のノードとURLノードとの距離は、該当する文セグメントの類似度を反映して設定される。
一方、第二階層をなす概念ノードについては次のように決定する。各第一階層ノードに分類された文セグメントを対象として概念のグルーピングを再度行い、概念距離が最も短いい概念を3つ選択して表示対象ノードと決定する。第一階層ノードと第二階層の概念ノードとの距離は概念距離に基づいて設定する。この概念のグルーピングおよび概念距離の設定はクライアントPCが行ってもよいし、あらかじめサーバが行っていてもよい。サーバが行う場合には、ステップS02206の後に、第一階層の概念ノードごとに関連付けられた文セグメント群を対象としてステップS02204からステップS02206の処理を行うことになる。
なお、第一階層のノード数である3、ならびに第二階層の概念ノード数(3個)およびURLノード数(4個)は、プリセットデータに基づいて決定されている。
こうして表示処理が終了したら、ユーザからの入力待ち状態にするための処理を行う(S02103)。
(図37、図38)
図37に各ノードと関連付けて記憶領域に格納されるデータの一例を、図38に各リンクと関連付けて記憶領域に格納されるデータの一例を示した。
ノードに関連付けられたデータについて、分類ごとに説明する。
「Key」の分類には、ノードの識別番号(ID)データが属する。いずれのトポロジーグラフに含まれるか、また、サーバのバッファデータを蓄積するデータベースにおけるデータとの関連などを把握可能に識別番号は設定される。
「種別」の分類には、センターフラグとノード分類フラグとが属する。センターフラグはセンターキーワードに関するノードであるか否かを識別するためのものである。また、ノード分類フラグは、概念を示すノードであるかURLを示すノードであるかを識別するためのものである。図29では、このノード分類フラグに応じてノードの表示を変更している。
「概念情報」の分類には、主概念コードおよび主概念名、ならびに副概念コードおよび副概念名が属する。主概念とは、概念空間ベクトルを構成する要素の中でもっとも大きな値を有する要素にかかる概念である。副概念は概念空間ベクトルにおける主概念要素以外の要素にかかる概念である。ノードが概念ノードの場合には副概念は存在しないが、URLノードの場合には単一の概念で構築されることはまれであり、副概念が多数存在する。
「階層情報」の分類には、主階層番号、分岐階層番号、階層分岐番号が属し、これらの番号によってトポロジーグラフ上の位置づけを判別することができる。
「位置情報」の分類には、上位ノードID、上位概念距離、上位リンク長、下位ノードID、下位概念距離、下位リンク長、中心距離、中心リンク長、座標fx、座標fyが属する。これらのデータによって、ノードの正確な配置を規定することができる。
ここで「概念距離」と「リンク長」との関係について詳説する。以降の説明では、「概念距離」は概念検索の結果得られる概念の関連性を定量化したもの(不変値)であって、たとえば図34におけるステップS02206の処理の出力結果であると定義する。
一方、「リンク長」とは、この概念距離のデータに基づいてトポロジーグラフ表示用データを算出したときに、ノード間のリンクの長さとして決定されるもの(可変値)である。
このリンク長は概念距離によって一義的に決定されるのではなく、後述するように上位側のノードについての志向性情報を反映して演算されるものである。また、結合を行うユーザが操作を行うたびに、その操作量をも反映することが可能である。概念距離は常識的または没個性的な情報に基づく概念の関連性を示すものであって、リンク長は個性が反映された概念の関連性を示しているものであるともいえる。
「文書情報」の分類には、主キーワード、副キーワード、要約テキスト、URL、タイムスタンプ、ファイル種別が属する。これらの情報はノードがURLノードである場合に使用するものである。
続いて、リンクに関連付けられたデータについて説明する。
「Key」の分類には識別番号(ID)データが属する。
「位置情報」の分類には、始点ノードID、終点ノードID、方向、概念距離、リンク長が属する。方向とは、ノード間の情報の向きを示すもので、一般的には検索は下流側に進むため「2」となる。しかし、後述するトポロジーグラフの結合部分は結合部分のノードが対等なので「3」となる。また、推論を用いてあるべきセンターキーワードを作成するような場合には検索は上流に向かって行うことになるので「1」となる。
(図20)
図20は、図29におけるトポロジーグラフのURLノードのいずれかに対して、そのノードに付随して蓄積されている文書情報を表示する場合の動作についてのフローチャートである。
ユーザが行った表示URLの指定(S03001)に係る信号が入力されると、クライアントPCはその指定にかかるノードを判別する処理を行う(S03101)。そして、所定のノードと関連付けられている文書情報データをメモリまたは記憶装置から読込み(S03102)、そのノードにオーバラップするように文書情報を表示するための処理を行う(S03103)。
表示そのものは以上のプロセスで完了する。しかし、本実施例においては、このURLの文書情報を確認したことを志向性の情報として蓄積する志向性処理を行う。この志向性処理に必要な志向性データベースについての説明をまず行い、引き続いて志向性処理(ステップS03104以降)について詳説する。
志向性データベース301とは、概念空間ベクトルを構成する要素概念のそれぞれに対して主観的および客観的な重み付けを設定し、その情報をデータベース化したものである。
主観的な重み付けを「ステータス」と称し、「好き」、「嫌い」、「どちらでもない」の3水準を最低有する。
本実施例では以下の7水準としている。
・「オフ」:概念志向から完全に除外され、無条件にその概念の情報を排除する。
・「最低」:その分野に対して強いマイナスイメージを持っており、その概念の情報は基本的には見たくない。
・「低」:その分野に対してマイナスイメージを持っており、その概念の情報はあまり見たくない。
・「標準」:概念志向は中立であり、興味や関心を持っていない。初期設定値である。
・「高」:その分野に対してプラスイメージを持っており、その概念の情報に興味や関心がある。
・「最高」:その分野に対して強いプラスイメージを持っており、その概念の情報に特に興味や関心がある。
・「必須」:概念志向に必ず反映される。無条件にその分野の情報を出力対象とする。
これに対し、客観的な重み付けを「スコア」と称する。「スコア」の算出に当たっては次の仮定を設定している。
(1)検索作業やその後のブラウズ作業などを通じてユーザが取得した文書はユーザの志向を反映している。
(2)検索作業においてユーザが入力した文もユーザの志向を反映している。
(3)トポロジーグラフにおいてユーザがさらなる検索を求めたノードにかかる概念もユーザの志向を反映している。
この仮定の上に、削除などのネガティブな行為でない限り、ユーザが入力または選択した概念または文書情報にかかる概念をその時間とともに蓄積し、その累積データに基づいて概念ごとに定量値を算出する。
たとえば、バラの育成が趣味で、最近自家用車の調子が悪く買い替えを考えているユーザについて、「園芸」の概念のスコアと「自動車」の概念のスコアとを比較する。
バラの育成は趣味であるから、定期的に「園芸」に関連する検索式を入力し、検索の結果について丹念に内容確認を行う。このため、「園芸」についての累積度数の時間推移は強い正の相関を有する。この累積度数の時間推移グラフを概念的に示したのが図26(A)である。このとき、そのグラフについて直線回帰をとり、その傾きをスコアとする。
一方、「自動車」は調子が悪いときには修理の費用の調査や買い替えを念頭において熱心に情報収集を行う。しかし、修理が終わったり買い換えてしまったりすると、その後この概念にかかる情報の収集はほとんど行われなくなる。このため、累積度数の時間推移は図26(B)に示すように飽和状態を呈する。このため、直線回帰を取ると、その傾きは飽和状態にならない場合(図中点線)に比べて低くなる。
このように累積度数推移グラフの傾きをスコアとすることで、継続的な「趣味」と一時的な興味とを定量的に区別することが実現される。
なお、上記のスコアの計算方法は一例であり、他の方法を行ってもかまわない。
このようなステータスとスコアとを概念ごとに一覧としたデータの一例を図27に示した。図27では、食べ物に関連する概念の一部について記載したものであり、各概念に関連する言葉がキーワードとして列記されている。構文解析の結果、文章の中心的単語がこれらのキーワードであると判定されると、そのキーワードにかかる概念に属するものと判定される。
続いて、図20のS03104以降について説明する。
まず、表示URLに基づいてなる文セグメントを特定し、これらの概念情報、具体的には概念空間ベクトルのデータをメモリまたは記憶装置から読込む(S03104)。表示URLが複数の文セグメントを生成している場合には、それらのベクトル和を求め、そのスカラー量が1になるように均等に補正係数をかけたものを、そのURLの概念空間ベクトルとしてもよい。
URLの概念空間ベクトルの各要素とURLの指定がなされた時間とからなる志向性データを作成し(S03105)、これを志向性DB301に書き込む(S03106)。なお、図27にはスコアデータのみが表示されているが、そのスコアデータを算出するための累積度数の時間推移データが概念ごとに志向性DB301に格納されており、該当する概念それぞれの累積度数の時間推移データに、URL指定イベントを時間とともにデータセットとして追加する(S03107)。
続いて、データが追加された累積度数の時間推移データを読込んで、各概念のスコアの計算を行い(S03108)、新たなスコアデータを志向性DB301の所定の領域に書き込む(S03109)。
その後、入力待ちの処理を実行して(S03110)待機する。
(図21)
図21は、図29におけるトポロジーグラフの概念ノードおよびURLノードのいずれかに対して追加の検索を行う旨の指示をユーザが行った場合の動作についてのフローチャートである。
ユーザからの検索対象のノードの指定(S04001)に応じて、クライアントPCは指定に係るノードを判別し、検索対象となるノードの特定を行う(S04101)。そして、そのノードに関連付けられて格納されている文書データを読込み(S04102)、これを概念検索の入力条件となる文書データとする。
ここで、読み込む文書データとは、ノードがURLの場合にはURLの要約文書であり、ノードが概念の場合には概念名である。概念ノードの場合には、上位のノードについても参照し、上位ノードの要約文書や概念名も読み込み文書データに含めてもよい。このように上位ノードの情報も含めることで、実質的に絞り込み検索を行うことが可能となる。上位何階層のノードまで参照するかによって絞り込みの強さが決定されることになり、この情報はプリセットデータに含めておくか、検索ノードを指定するときに入力可能としておくことが望ましい。
続いて、確定された検索条件となる文書データをサーバに送信する処理を行い(S04103)、そのノードについて図20で示した志向性処理(S03104からS03109)を行ってこのユーザの指示履歴を志向性DB301に蓄積する(S04104)。
クライアントPCからの文書情報データを受信した(S04201)サーバは、そのデータについて概念検索を行う(S04202)。この処理は図19のS02201からS02206までの処理と同様の処理(検索処理)であるから説明は省略する。そして、検索結果をクライアントPCへと送信する(S04203)。
サーバからの検索結果データを受信した(S04105)クライアントPCは、そのデータを表示する処理を行う。ただし、ここでは、サーバでの検索結果をそのまま表示するのではなく、クライアントPCが参照可能な志向性DBの情報に基づいて一部のノードを表示しなかったり、ノード間のリンク長を変化させて表示させたりする志向反映表示処理を行う(S04106)。この志向反映表示処理については図22を用いて説明する。表示のための処理が終了したら、次のユーザの指示を入力可能な状態にする処理を行い(S04107)、待機状態に入る。
(図22)
図22は図21のステップS04106に示した志向反映表示処理の内容を示したフローチャートである。
まず、クライアントPCは、ユーザからの指示に基づいて志向性を反映させるための情報源となる志向性データベース(以降、「志向性DB」と称する。)の特定を行う(S05101)。このユーザからの指示は、プリセットデータに含まれていてもよいし、図21のステップS04001におけるユーザの指示の段階で入力されていてもよい。あるいは、この志向性DBを特定する処理の一つとしてユーザに志向性DBの確認処理を行ってよい。
志向性DBは図20の説明において述べたように、ユーザによる志向性の表明結果やトポロジーグラフに対する指示を記録蓄積するものであり、ユーザごとに固有のものである。この志向性DBをたとえばネットワークを通じて第三者に参照可能とすると、自らの好みや考え方を第三者に開示することが可能となる。逆に、ネットワークなどを通じて他人(第三者)の志向性DBを入手することで、その他人の好みや考え方を取り込むことが可能となる。一例としては、自らの志向性を反映したトポロジーグラフと他人の志向性を反映したトポロジーグラフとを比べることが実現される。他人を知るということは自らと他人との差異を把握することであるから、このような比較を通じてその他人を深く知ることができる。また、その他人がある分野のオピニオンリーダである場合には、その他人による文書を読むよりも明確に考え方を知ることが実現され、その分野の最先端の情報をより正確に得ることが可能となる。
図22においては、ユーザ本人の志向性DB301Aに加えて、2つの他人の志向性DB301B,301Cがネットワークを通じてクライアントPC内に格納されている態様を例示的に示した。この態様は一例であり、さらに多くの他人の志向性DBがクライアントPC内に蓄積されていてもよい。または、クライアントPC内には他人の志向性DBは蓄積されておらず、ネットワークを通じて他のクライアントPC内の志向性DBと接続されており、本クライアントPCの処理の過程でこの他の志向性DBを適宜参照可能とされていてもよい。
参照すべき志向性DBを特定したら、その志向性DBからステータスデータおよびスコアデータをクライアントPC内の作業用メモリに読み込む(S05102)。
続いて、ステータスデータに基づいて、検索結果として受信した概念のそれぞれについてフィルタ処理を行う(S05103)。フィルタ処理とは、表示対象とするか否かを判定する処理であり、受信した概念のステータスデータが「オフ」となっている場合には表示不要と判定する。
また、表示不要と判定されなかった概念に属するとしてグルーピングされている文セグメント群についてもフィルタ処理を行う。「オフ」となっている概念を“1”,それ以外を“0”としてなる概念空間ベクトルを作成し、この概念空間ベクトルと各文セグメントの概念空間ベクトルとの内積を計算する。内積が0とならない場合には、その文セグメントは「オフ」とされる概念の要素を含むものであるから、表示対象から除外する。
このフィルタ処理によって、サーバからの検索結果データの段階では表示対象とされていた概念が表示不要となる場合がある。そこで、あらためて概念距離に基づく序列を作成し、表示対象となる概念を決定する(S05104)。プリセットデータによって表示概念数が3個と規定されている場合には、あらためて上位3個の概念を表示対象とする。
また、各表示対象となる概念に属する文セグメント群についても同様の序列の再構築を行い、その結果に基づいて表示すべきURLの決定を行う(S05105)。なお、処理時間の短縮の観点から、ステップS05103において行った文セグメント群のフィルタ処理を、ステップS05104で表示すべき概念を決定した後のステップとして行い、表示対象概念に属する文セグメント群のみを処理対象としてもよい。
こうして表示すべき概念ノードおよびURLノードが確定したら、各表示ノードのリンク長を計算する(S05106)。このリンク長は、当該ノードの概念距離に加えて、そのノードにかかる概念のステータスおよびスコアを加味して算出される。
たとえば、概念距離に基づく成分をL(dic)、ステータスに基づく成分をL(st)、スコアに基づく成分をL(sc)とすると、リンク長Lは、
L = a*{L(dic)−b*L(sc)}/L(st)
のようにしてもよい。ただしaおよびbは定数である。
このように定義すると、ステータスという主観的な志向情報は概念距離やスコアのような客観的な情報よりも強い影響をリンク長に与えるようにすることができる。
上記の計算式以外の計算式に基づいて概念距離を設定してもかまわない。ステータスとして興味がある旨のデータが入っている場合にはリンク長が短くなり、逆に興味がない旨のデータが入っている場合にはリンク長が長くなるような設定とすればよい。また、スコアについても、スコアが大きいほどリンク長が短くなり、スコアが小さいほどリンク長が長くなる設定とすればよい。
以上のようにリンク長を決定したら、クライアントPCの表示装置にトポロジーグラフを表示させるための処理を行う(S05107)。そして、さらなるユーザの指示を受入可能な状態にして待機する(S05108)。
(図23)
図23は、ユーザが一つのノードを指定して、そのノードにかかる概念についてステータスを変更する場合の動作について示したフローチャートである。
ユーザからステータス変更の指示が入力されると(S06001)、クライアントPCはその指示にかかるノードの判別を行う(S06101)。
また、ステータスをどの様に変更するかについての指示についても判別する(S06102)。具体的には、先に示した7つのステータス(「オフ」、「最低」、「低」、「標準」、「高」、「最高」、「必須」)のいずれに設定するかを判別する。
続いて、志向性データベース601にアクセスして、変更にかかる概念のステータスを書き換える処理を行う(S06103)。
そして、志向性データベース601に改めてアクセスして、変更にかかる概念のステータスデータおよびスコアデータを読込み(S06104)、そのデータに応じて指定ノードの再計算を行い(S06105)、そのリンク長に基づいて表示を変更する処理を行う(S06106)。最後に、さらなるユーザの指示を受入可能な状態にして待機する(S06107)。
(図24)
図24は、図21と同様、ユーザからの指示に応じて志向性を反映した検索表示を行う動作を示すフローチャートである。図21と異なるのは、ユーザから検索の指示を受けたときに、クライアントPCは志向性データベース701からの最新の情報をサーバに送信し、サーバはそのデータを考慮した概念検索をおこなう点である。以下に詳しく説明する。
ユーザからの検索対象のノードの指定(S07001)に応じて、クライアントPCは指定に係るノードを判別し、検索対象となるノードの特定を行う(S07101)。そして、そのノードに関連付けられて格納されている文書データを読込み(S07102)、これを概念検索の入力条件となる文書データとする。
ここで、読み込む文書データとして、URLの要約文書または概念名が挙げられる点は図21で示したフローチャートと同様である。
次に、図20のステップS03104からステップS03109で示される志向性処理を行い(S07103)、ステップS07001で示されるユーザの指示を志向性情報として蓄積する。
続いて、志向性データベース701のいずれの志向性データベースを用いて概念検索を行うかの判別を行う(S07104)。判別のための情報は、プリセットデータを参照して得てもよいし、ユーザに入力を求める処理を行って得てもよい。
そして、上記判別に基づき特定された志向性データベース701AからCのいずれかにアクセスし、検索入力となる文書データにかかる概念のステータスデータおよびスコアデータを読込む(S07105)。引き続き、これらの志向性データベースからのデータを、検索入力となる文書データとともにサーバに送信する(S07106)。
クライアントPCからのデータを受信した(S07201)サーバは、志向性データベースからのデータも考慮した概念検索を行う(S07202)。この処理は後述する。この志向性検索処理の検索結果をクライアントPCへと送信する(S07203)。
サーバからの検索結果データを受信した(S07107)クライアントPCは、そのデータを志向性データベースからのデータを参照しつつ表示する志向反映表示処理を行う(S04108)。この処理は図22を用いて説明済みなので省略する。こうして表示のための処理が終了したら、次のユーザの指示を入力可能な状態にする処理を行い(S04107)、待機状態に入る。
ここで、サーバでの検索に用いた志向性データベースとは異なる志向性データベースを用いて志向反映表示処理を行うと、それぞれのデータベースにかかる個人の志向性の論理積に該当する検索結果がトポロジーグラフとして得られる。したがって、このような手法により共通の趣味の抽出などを行うことが実現される。
(図25)
図25は、図24のステップS07202として示した志向性検索処理の動作を示すフローチャートである。
その処理の多くは、図19に示したフローチャートにおけるサーバの動作と同様であるから、変更点を中心に説明する。
サーバが検索を行うための前段階としてクロール指示を行い(S02301)、インデックスデータベース302を整備している点は同じである。
また、クエリデータを読込み(S08201)、概念検索を行って(S08202)所定数の文ブロックを抽出し(S08203)、さらに文ブロックのグルーピングを行って(S08204)代表となる概念を選択して(S08205)これらの概念の概念距離を計算する(S08206)までの動作も同じである。
この一連の動作の段階ではクライアントPCからの志向性データを取り込むことなく処理を行うことで、概念検索結果のストックが可能になる。たとえば、あるユーザが行った概念検索結果をサーバに接続されるデータバッファに取り込んでおいて、検索入力データが同一の場合にはこのデータバッファから取り出すことが可能になる。このような処理を行うことで、検索処理や概念分類処理を省略することができ、サーバの処理負荷を緩和することが実現される。
こうして一般的な概念検索結果を得たら、サーバのメモリなどの記憶装置からステータスデータおよびスコアデータをクライアントPC内の作業用メモリに読み込む(S08207)。
続いて、ステータスデータに基づいて、検索結果である概念および文ブロックのそれぞれについてフィルタ処理を行う(S08208)。そして、このフィルタ処理で削除されなかった概念および文ブロックに対して、序列の決定および表示対象となる概念データの決定を行う(S08209)。
以上の処理によって、ユーザの志向を反映してトポロジーグラフの形状を変更することが実現される。このトポロジーグラフによって、ユーザの考え方や好みを一見して認識することが可能となる。
たとえば、10日間の主要新聞の社説を検索対象として検索を行うとする。ユーザが検索を行いながら読んで興味を持った記事がセンターキーワードの近傍に配置され、興味を持たなかった記事が外側に配置され、ユーザが嫌いな分野の記事はトポロジーグラフには表示されなくなる。この作業を複数のユーザに対して行うと、そのユーザの志向を比較することができる。また、著名なコメンテータにこの作業を行わせると、その結果得られるトポロジーグラフは「コメンテータのスクラップブック」となる。これを一般ユーザの求めに応じて提供すれば、一般ユーザはコメンテータの興味をそのまま体験することが実現される。
あるいは、所定期間内(月間、四半期、半期、年間など)にリリースされた楽曲を検索対象として音楽評論家に検索を行わせると、その音楽評論家の一押しの楽曲(リコメンデーション)にかかるノードがセンターキーワード近傍に配置されるようなトポロジーグラフが得られる。ここれを一般ユーザの求めに応じて提供すれば、一般ユーザは音楽評論家の選曲センスを視覚的に把握することが実現される。
以降、複数のトポロジーグラフを結合するシステムに係るクライアントPCの動作を、ユーザとの関係で示した図表(図30から図31、および図36)およびフローチャート(図32から図35、および図39から図40)を用いて説明する。
(図30)
図30は、クライアントPCにより制御される表示装置内の一つのウインドウに表示された二つのトポロジーグラフ1001,1002が結合している状態を示した図である。
第一のトポロジーグラフ(以降、「TP1」と略記する。)1001の末端をなすノード(以降、「末端ノード」と称する。)の一つ1003と、第二のトポロジーグラフ(以降、「TP2」と略記する。)1002の末端ノードの一つ1004とがリンク1005を介して結合し、新たな一つのトポロジーグラフとなっている。この新たなトポロジーグラフを「結合トポロジーグラフ」と称する。
なお、本図の結合トポロジーグラフでは末端ノード同士が結合対象となっているが、トポロジーグラフを構成する他のノードが結合対象となっていてもよい。
このようなトポロジーグラフの結合を多数のトポロジーグラフに対して行うと、図31に示されるような巨大な結合トポロジーグラフを得ることができる。この巨大結合トポロジーグラフは「概念知図」とでも呼ぶべきものであり、結合ルールを提供した人間(ルール提供者)の考え方を表現したものといえる。この概念知図を解析することで、そのルール提供者の思考パターンや連想のルールなどを知ることができる。
たとえば、そのそのルール提供者がある概念Aから他の概念Bを連想したとする。一般的には思いもよらない発想のジャンプであるとしても、概念知図上では二つの概念Aと概念Bとが直接的に結合していれば、そのルール提供者にとってはごく普通の連想であることを見いだすことができる。
このようにコンセプトパス(Concept Path)を定量的に把握することができると、ある概念と他の概念とを組み合わせるという発想の困難さを定量化することも可能となる。
また、ルール提供者の判断基準を容易に判断できることとなり、高度な判断を要するような知的作業の引き継ぎを円滑に行うことも可能となる。
(図32)
図32は、ウインドウ内に表示される二つのトポロジーグラフ(TP1、TP2)を志向性DBの情報に基づいて自動的に結合させる場合の動作を示すフローチャートである。
ユーザからの自動結合の指示(S11001)の入力に応じて、クライアントPCは、TP1およびTP2のそれぞれの末端ノードをリストアップして作業用メモリに展開し、その後の比較作業を行うための準備とする(S11101)。このとき、志向性データベース1101から各ノードにかかる概念のステータス情報やスコア情報も読込み、メモリ上に展開して随時参照可能とする。
この志向性データベース1101は、結合指示を行ったユーザの志向性を蓄積したものであってもよいし、第三者の志向性を蓄積したものであってもよい。どの志向性データベースを使用するかは、プリセットデータとしてあらかじめ入力されているものを参照してもよいし、この段階でユーザに指定させるための処理を行ってもよい。
次に、メモリ上に展開したそれぞれのトポロジーグラフの末端ノード同士の組合せ全てについて概念の比較を行う(S11102)。図30のトポロジーグラフを例にすると、TP1および2にはそれぞれ21個の末端ノードがあるため、組合せは21*20/2=210通りとなる。それぞれの組合せに対して、それらのノードにかかる概念の比較を行う。
そして、共通する概念を有するノードの組合せがあるか否かの判定を行う(S11103)。
その結果、共通する概念を有するノードの組合せがある場合には、それらを一群としてリスト化し、その組合せの中でノードにかかる概念のスコアが最大のものを選択する(S11104)。そして、この最大スコアを有する組合せのノードを結合ノードとして確定する(S11105)。
一方、共通する概念を有するノードの組合せがない場合には、双方のトポロジーグラフにおける末端ノードのそれぞれについてスコアを確認し、それぞれのトポロジーグラフについて最大スコアとなる末端ノードを選択する(S11109)。この最大スコアを有するノードを結合ノードとして確定し、各ノードにかかる概念同士の概念距離を算出する(S11110)。
以上のようにして結合ノードを確定したら、それぞれのノードを概念距離や志向性情報に基づいて算出されるリンク長で結合させる(S11106)。なお、同一のデータにかかるノードの組合せに基づく場合には、概念距離は0となることから、リンク長も0となる。したがって、二つのノードは重なり合うことになり、見かけ上はそのノードを連結点として二つのトポロジーグラフが結合された表示データを作成する。
ここで、結合するノードに依存して、一方または双方のトポロジーグラフがセンターキーワードのノードを中心として回転して結合するような表示のデータを作成する場合もある。また、センターキーワードのウインドウ内の座標が移動したような表示のデータを作成する場合もある。このような結合に伴う各トポロジーグラフの表示態様の最適化を通じて、概念知図としての全体的な形状が作り込まれていくことになる。
こうしたトポロジーグラフの結合はユーザの志向を量るための重要な情報である。そこで、概念の組合せごとに結合の履歴を蓄積する結合志向性データベースにこの結合の情報を格納する結合志向性処理を行う(S11107)。この処理については図33を用いて後述する。
結合情報の格納が終了したら、さらなるユーザの指示を入力可能な状態にして待機する(S11108)。
(図33)
図33は、図32のステップS11107に示した結合志向性処理の動作を示すフローチャートである。
まず、結合ノードにかかる概念データを作業用メモリから読み出して確認する(S12101)。
次に、ユーザによって結合の指示がなされた時間の情報を取得し、概念データとともにまとめてデータセットを作成する(S12102)。
続いて、結合志向性データベース1201にアクセスして、適切な概念の組合せかかる記憶領域にそのデータセットを書き込む(S12103)。
結合志向性データベース1201の構造を概念的に示したのが図36である。Cijとは、概念コードがiの概念とjの概念との組合せに対応する記憶領域を意味している。概念コードがn個ある場合には、全部でn*(n+1)/2個の組合せがあるため、同数の記憶領域が設定される。このそれぞれの記憶領域に結合の指示がなされた時間とイベント値とが累積的に格納される。
たとえば、時間t1において結合の指示がなされ、その結果、概念コード4の概念のみを有するノードと3の概念のみを有するノードとが結合した場合には、C34に(t1、1)のデータが格納されるといった具合である。
また、時間t2において結合の指示がなされ、その結果、概念コード4と概念コード2とを同じ程度含むURLにかかるノード1、および概念コード4と概念コード3とを4:1で含むURLにかかるノード2が結合対象として選択されたとする。このとき、ノード1の概念空間ベクトルは(0,0.5,0,0.5,・・・,0,0)であり、ノード2の概念空間ベクトルは(0,0,0.2,0.8,・・・,0,0)となる。このため、各組合せの記憶領域に格納されるデータは以下のようになる。
C23 = (t2,0.125)
C24 = (t2,0.375)
C34 = (t2,0.125)
C44 = (t2,0.375)
すなわち、結合ノードに対応するデータが複数の概念に属する場合には、その概念の強さに応じて組合せのイベント値が変動する。このようにイベント値を設定することで、結合にかかる概念の情報を正確に蓄積することが実現される。
このように時間とイベント値とを累積的に格納することで、累積イベント値の時間変動を得ることができる。この変動を直線回帰した場合の傾きを各組合せの「結合スコア」と定義すると、ノード単位の志向性評価と場合と同じように、各組合せについての志向性が定量化される。
(図34)
図34は、ユーザが結合すべきノードを指定した場合に、その指示に基づいてトポロジーグラフの結合させる動作についてのフローチャートである。
図32に示されるような自動結合の場合には、ノードにかかる概念についての志向性データが結合ノードの選択に強い影響を及ぼす。このため、結合ノードの組合せ情報に基づく結合志向性も、ノードにかかる概念の志向性の影響を受けることになる。すなわち、検索作業を示すトポロジーグラフにおいて追加の検索を頻繁に行う概念を含むノードが優先的に結合ノードとして選定されるようになる。このことは、志向性について一貫性を持たせるという意味で有意であるが、トポロジーグラフの結合に対して直接的にユーザの志向を反映させたいという場合に応えることができない。そこで、図34に示されるような、ユーザが結合ノードを直接指定する処理もシステムの一オプションとして取り込んでおくことが望ましい。
ユーザからの指定結合の指示(S13001)の入力に応じて、クライアントPCは、TP1およびTP2のいずれの末端ノードを結合対象とすべきかの問い合わせ画面を表示させ、入力待ち状態とする(S13101)。
ユーザがその画面表示に応えて結合ノードの指定を行うと(S13002)、クライアントPCの記憶領域から指定されたノードに関するデータを読込むとともに、志向性データベースから各ノードにかかる概念のステータス情報やスコア情報も読込み、メモリ上に展開して随時参照可能とする(S13102)。
次に、それぞれのノードを概念距離に基づいて算出されるリンク長で結合させる(S11103)。なお、指定ノードが同一の内容を有するノードである場合には、概念距離は0となるためリンク長も0となる。したがって、二つのノードは重なり合うことになり、見かけ上はそのノードを連結点として二つのトポロジーグラフが結合された表示を作成する。
続いて、この結合情報を結合志向データベースに蓄積するための結合志向性処理を行い(S13104)、さらなるユーザの指示を入力可能な状態にして待機する(S13105)。
なお、ユーザが自らの意思で結合させた情報は、ノードの志向性情報におけるステータス情報のようにスコア情報とは異なる形式でデータベースに蓄積するようにしてもよい。この場合には、図36のようなデータセットをもう一つ用意し、そこにステータス情報を蓄積すればよい。
(図35)
図35は、組合せの履歴を蓄積している結合志向性データベースの情報に基づいて結合ノードを選択する場合の動作についてのフローチャートである。
この処理は、たとえば次のような場合に用いられる。あるユーザAが行った検索結果のトポロジーグラフを他のユーザBの結合志向性データベースに基づいて結合して概念知図を作成し、ユーザAの志向に基づいて作成した概念知図と比較する。この比較によって、ユーザAとユーザBとの発想の相違の顕著な部分を抽出したり、逆に発想が類似している部分を抽出したりすることができる。こうした解析によって、二人のユーザA,Bによる議論の論点を明確化したり、双方の妥協点を短期間で探したりすることが実現される。
ユーザからの志向反映結合の指示(S14001)の入力に応じて、クライアントPCは、TP1およびTP2のそれぞれの末端ノードをリストアップして作業用メモリに展開し、その後の比較作業を行うための準備とする(S14101)。そして、結合志向性データベース1401から各ノードの組合せのスコア情報も読込み、メモリ上に展開して随時参照可能とする(S14102)。
次に、メモリ上に展開したそれぞれのトポロジーグラフの末端ノード同士の組合せ全てについて結合スコアの比較を行い(S14103)、結合スコアが最大の組合せを判別する(S14104)。
そして、この組合せにかかるノードを結合ノードとして確定し(S14105)、それぞれのノードを概念距離に基づいて算出されるリンク長で結合させる(S11106)。
続いて、この結合情報を結合志向データベースに蓄積するための結合志向性処理を行い(S14107)、さらなるユーザの指示を入力可能な状態にして待機する(S14108)。
なお、結合志向性データベース1401はユーザ自身の結合志向性にかかる情報を格納するデータベースではなく、第三者のデータベースを用いてもよい。この場合には、その第三者の志向や判断基準を取り込むことが可能となる。
(図39)
結合の履歴データが存在しない場合の対応として、その結合スコアを0とする態様がある。このとき、結合の履歴がない組合せはユーザの指示によって結合される以外には結合されることはない。このため、結合の履歴がすでに存在する組合せのみがさらに履歴データを蓄積することになってしまい、結合履歴データに偏りが生じる。この偏りがまさしくユーザの志向ではあるものの、新しい情報であってユーザの志向に適合するものが結合ノードとして拾い上げられにくくなってしまう。。
そこで、履歴データがない組合せについても、他のデータから予測結合スコアを算出し、結合の機会を増やすようにしてもよい。以下に、一例として、予測結合スコアの算出方法として重回帰分析を用いた場合について図39を用いて説明する。
図39は重回帰分析によって算出される予測結合スコアをも用いて結合すべきノードを決定する場合の動作を示すフローチャートである。
まず、ユーザから重回帰分析を用いて結合ノードを予測する旨の指示が入力される(S15001)と、クライアントPCはTP1およびTP2のそれぞれの末端ノードをリストアップして作業用メモリに展開し(S15101)、その後の比較作業を行うための準備とする。
次に、結合志向性データベース1501から各ノードの組合せのスコア情報も読込み、メモリ上に展開して随時参照可能とする(S15102)。また、重回帰分析における独立変数として用いるために、志向性DBに格納される概念すべてのステータスデータとスコアデータとを読込み、メモリ上に展開してこれらも参照可能とする(S15103)。
なお、他人の志向や判断基準を取り込むという意味で、上記処理において読み込む結合志向性データベースや志向性データベースを、ユーザ自身のデータベースではなく他人の志向性データベースとしてもよい。
続いて、結合履歴データが蓄積されている全ての概念の組合せを用いて、以下のような式に基づいて重回帰分析を行う。
Sp(ij) = b0 + b1*Sc(i) + b2*St(i)
+ b3*Sc(j) + b4*St(j)
ここで、iは一方のノードにかかる概念の識別番号、jは他方のノードにかかる識別番号であって、Sp(ij)は概念の識別番号がiとjとのノードの組合せにおける結合スコアの予測値である。また、Sc(i)、St(i)は、それぞれ、識別番号iの概念のスコアおよびステータスである。なお、bk(k=0から4)は偏回帰係数である。
こうして偏回帰係数を求めておくことで、結合履歴データが蓄積されていない概念の組合せのスコアについても、志向性DBに格納される各概念のステータスおよびスコアに基づいて予測結合スコアを算出することが可能である。そこで、ステップS15101でリストアップされたノードにかかる概念の組合せの中で結合スコアが存在しないものについて、上記の手法によって予測結合スコアを算出する(S15104)。
引き続き、それぞれのトポロジーグラフにおける末端ノード同士の組合せ全てについて結合スコアまたは予測結合スコアのいずれか一方を比較対象としてリストアップし(S14105)、比較を行って(S14106)、結合スコアが最大の組合せを判別する(S14106)。
そして、図35におけるステップS14105からステップS14108までの処理である志向反映結合処理2を実行する。
なお、こうして得られた予測結合スコアに基づいてノードの結合がなされ、その結果として現実の結合履歴データが蓄積されて有意な結合スコアが得られたときには、ステップS15105の比較対象を予測値から実際結合スコアに適宜置き換えることが望ましい。
この置き換えをすべきか否かの判定は、統計学的な考察に基づいて行えばよい。たとえば、実際の結合スコアから予測結合スコアを引いた残差の絶対値が予測結合スコアの所定割合以下になった場合としてもよい。
あるいは、実際の結合スコアが結合志向性データベースに格納されている場合であっても、統計学的な判断基準に基づくなどして予測結合スコアをステップS15105においてリストアップして比較対象としてもよい。極端な例として、全てのノードについて予測結合スコアを採用して、ステップS15106において比較してもよい。この予測結合スコアの比較対象への組込の程度はシステムのプリセットとしてあらかじめ入力するようにしてもよいし、リストアップ処理(S14105)の過程でユーザに入力するよう求める処理を行ってもよい。
(図40)
以上のように、二つのトポロジーグラフの末端ノードを結合させる手法として4つの態様について説明を行った。
すなわち、ノードにかかる概念のスコアに基づいて結合させる処理(図32)、ユーザの指示に応じて結合させる処理(図34)、結合志向性データベースに蓄積される結合スコアに基づいて結合させる処理(図35)、および各概念のスコアデータやステータスデータを用いて算出される予測結合スコアをも用いて結合させる処理(図39)である。
これらの処理のうちいずれを採用するかの判断を全面的にユーザに委ねてもよいが、これらの処理を統合して制御する処理を設定してもよい。
図40はこうした統合処理の一例であって、ユーザに「マニュアル」、「セミオート」、「フルオート」の3モードの判断レベルを提示し、ユーザからの選択結果の入力に応じて4つの処理を使い分ける処理の動作を示すフローチャートである。
まず、ユーザからいずれかの結合モードが選択されてその指示が入力されると(S16001)、クライアントPCはその指示が「マニュアル」モードであるか否かを判定する(S16101)。
ユーザからの指示が「マニュアル」モードである場合には、図34におけるステップS13101からS13105からなるマニュアル結合処理を実行して(S16101)、終了する。
一方、ユーザからの指示が「マニュアル」モードでない場合には、図35におけるステップS14101からS13104からなる志向反映結合処理1を実行する(S16103)。次に、実際の結合スコアのうちで最大値をなす組合せについて予測結合スコアを算出し、双方のスコアを比較してその結合スコアが有意であるか否かを判定する(S16104)。
この予測結合スコアの算出方法は公知の技術に基づいて設定すればよい。たとえば図39にかかる説明で例示したような重回帰分析に基づく予測値でもよい。また、比較における有意か否かの判定基準も公知の技術に基づいて設定すればよい。たとえば図39にかかる説明で例示したような予測結合スコアとの残差に基づく基準でもよい。
ステップS16104において、最大スコアの組合せが有意であると判定された場合には、図35におけるステップS14105からステップS14108までの処理である志向反映結合処理2を実行して(S16105)、終了する。
一方、ステップS16104において、最大スコアの組合せが有意でないと判定された場合には、図32におけるステップS11101からステップS14104までの処理である自動結合処理(S16106)を行い、志向性データベースに格納されるスコアに基づく結合すべきノードの組合せのデータを作業用メモリの所定領域に書き込む。
次に、図39におけるステップS15101からステップS15107までの処理である予測結合処理を実行し(S16107)、予測結合スコアをも用いて得られる結合すべきノードの組合せのデータも作業用メモリの別の所定領域に書き込む。
こうして2通りの結合すべきノードの組合せを用意した段階で、ユーザから入力された結合モードの指示が「セミオート」であるか否かを判定する(S16108)。
ステップS16108において、結合モードが「セミオート」であると判定された場合には、双方のノードの組合せをユーザが認識できるように表示し、いずれの組合せを採用するかの指示を求める表示を行う処理を行う(S16109)。このとき、各ノードの組合せの表示は、トポロジーグラフが結合された状態を2通り表示するようにしてもよいし、結合候補となるノードをリストアップするだけの簡易表示でもよい。
ステップS16109にかかる表示に対する応答としてユーザから組合せの指定情報が入力されたら(S16002)、指定された組合せのデータを作業用メモリから読込み(S16110)、志向反映結合処理2を実行して(S16105)、処理を終了する。
一方、ステップS16108において、結合モードが「セミオート」でない、すなわち「フルオート」であると判定された場合には、適切な統計学的手法に基づいていずれかの組合せを結合すべき組合せとして決定する。この決定方法としては、たとえば予測結合スコアとの比較に基づいて決定する。この場合には予測結合処理基づく組合せが採用される傾向が高いものの、予測結合処理における予測結合スコアの比較対象への組込程度が低い場合には、自動結合処理が優先的に採用されることもありうる。
こうして採用すべき組合せを決定したら、その組合せのデータを作業用メモリから読込み(S16112)、志向反映結合処理2を実行して(S16105)、処理を終了する。
なお、志向反映結合処理(S16103)、自動結合処理(S16106)、および予測結合処理(S16107)における参照データベースはユーザ自身の志向性や結合志向性を格納するデータベースを用いてもよいが、第三者のデータベースを用いてもよい。あるいは、ユーザ自身のデータベースに基づく結果と第三者のデータベースに基づく結果とを比較可能に表示してユーザにいずれの結果を採用するか求めてもよい。
なお、上記の説明では、結合点となるノードは末端ノードとしたが、末端以外のノードであってもかまわない。ここで、末端以外のノードを結合点として許容する場合には、トポロジーグラフのノードの階層ごとに結合のしやすさについての重み付けをしてもよい。
また、上記の説明では、概念検索にかかるデータ群についてのトポロジーグラフ同士を結合する場合を例としているが、他のデータ群についてのトポロジーグラフであってもかまわない。たとえば、一般的なキーワード検索にかかるトポロジーグラフであってもよいし、所定期間の新聞の社説にかかるトポロジーグラフであってもよい。あるいは、学術論文や特許公開公報など一つのドキュメントにかかるトポロジーグラフであってもよい。
以上の処理によって、ユーザの志向を反映しつつ複数のトポロジーグラフを結合させることが実現される。この結合トポロジーグラフによって、ユーザの考え方や好みを一見して認識することが可能となる。
たとえば、ある医師が保有する患者のカルテをデータベースとしてある病気の症状についてのトポロジーグラフを得たとする。この病気に使用される薬のトポロジーグラフとこのトポロジーグラフとをその医師の処方データに基づいて結合させる。その結果、症状と処方薬との関連性の情報が結合志向性データベースに蓄積される。このような結合志向性データベースがあれば、その病気に対しての知見の乏しい医師であっても、そのデータベースを用いて結合トポロジーグラフを作成することで症状ごとに最適な処方を行うことが可能となる。
ここで留意すべきことは、知見の乏しい医師が知見豊富な医師の志向(病状ごとの処方の傾向)をそのまま引き継いでいる点、および知見豊富な医師の結合志向性データベースは知見豊富な医師によって常にメンテナンスされている点である。同じような判断支援システムであるエキスパートシステムでは、人工知能による判断結果が提供されるため厳密なフェールセーフが必要となり、システム規模が大きくなる傾向がある。また、判断の基礎情報を定期的にアップデートする必要があり、維持管理の負荷が大きくなる傾向がある。この点、本願発明に基づくシステムでは現実の人間の判断基準を引き継ぐためフェールセーフシステムの規模を小さくしてもよい。また、常に判断の基礎情報は最新のものを使うことができる点で維持管理の負荷が少ない。
本願発明は、事業としてインターネットサイトや特定のネットワークを運営する場合において、検索サービスを提供する際に利用できる。
たとえば、マーケティングなどの分野で顧客の探索ツールとして応用することも可能である。
また、検索結果として得られるトポロジーグラフを検索ユーザの志向の表現とすることができる。このようなユーザの「考え方」が可視化された情報表示体を、思想や思考パターンの表現ツールとしたり第三者の志向の読み取り手段としたりすることで、新たなビジネスを創出することができる。
さらに、こうしたトポロジーグラフを複数結合させることによってもユーザの志向を表現することができる。このつなぎ合わせにユーザ以外の志向性を用いることで第三者の判断基準の引き継ぎ手段として用いることも可能である。
さらにまた、トポロジーグラフを多数つなぎ合わせて得られる「概念知図」は、ある意味ユーザの人格の可視化であり、新たな自己表現の手段として活用することが可能である。たとえば、こうした個人の概念知図を多数累積することで「常識」の可視化・定量化が実現され、マーケティングの分野での活用が可能である。
サーバと、そのサーバを利用するクライアントPCとの関係を図示したものである。 サーバがクライアントPCに提供するフォーマットと、クライアントPCに入力された検索用データとを図示した概略図である。 サーバがクライアントPCに提供するフォーマットと、クライアントPCに入力された検索用データとを図示した概略図である。 サーバがクライアントPCに提供するフォーマットと、クライアントPCに入力された検索用データとを図示した概略図である。 サーバがクライアントPCに提供するフォーマットと、クライアントPCに入力された検索用データとを図示した概略図である。 二次パラメータ作成手段の機能を図示した概略図である。 概念距離算出手段の機能を図示した概略図である。 検索用新データを用いて新たな検索を行う場合について図示した概念図である。 サンプルデータの出力例を示す概念図である。 サーバに対してインプットと最終的なアウトプットとを示した概念図である。 センターキーワードを「東京の賃貸不動産」とした場合における検索用データの概念図である。 インプットされる検索用データとサーバによってアウトプットされるトポロジーグラフとを示す概念図である。 テンプレートトポロジーグラフの作成プロセスを概念的に示した概略図である。 検索フォーマットからのインプットとサーバによるアウトプットの一例を示す概念図である。 サーバのアウトプットをユーザが操作して再びアウトプットを得る一例を示す概念図である。 旅行の検索におけるアウトプットを三次元的にした実施形態を示す概念図である。 不動産の検索におけるアウトプットを三次元的にした実施形態を示す概念図である。 本願発明に係るクライアントPCおよびサーバの動作をユーザやネットワークとの関係で示したフローチャートの一部(ユーザからの要望データ入力からサーバがクライアントPCからのデータを受信するまで)である。 本願発明に係るクライアントPCおよびサーバの動作をユーザやネットワークとの関係で示したフローチャートの一部(サーバによる検索処理からクライアントPCによる表示処理まで)である。 本願発明に係るクライアントPCおよびサーバの動作をユーザやネットワークとの関係で示したフローチャートの一部であって、トポロジーグラフの要素である概念ノードまたはURLノードの情報の表示をユーザが求めた場合の動作の前半を示すフローチャートである。 本願発明に係るクライアントPCおよびサーバの動作をユーザやネットワークとの関係で示したフローチャートの一部であって、トポロジーグラフの要素である概念ノードまたはURLノードの情報の表示をユーザが求めた場合の動作の後半を示すフローチャートである。 図21における志向反映表示処理の動作を示したフローチャートである。 本願発明に係るクライアントPCおよびサーバの動作をユーザやネットワークとの関係で示したフローチャートの一部(トポロジーグラフ上に示されたURLノードまたは概念ノードにかかる概念のステータスの変動をユーザが求めた場合の動作の一態様)である。 本願発明に係るクライアントPCおよびサーバの動作をユーザやネットワークとの関係で示したフローチャートの一部(トポロジーグラフ上に示されたURLノードまたは概念ノードにかかる検索をユーザが求めた場合の動作の他の態様)である。 図24における志向性検索処理の動作を示したフローチャートである。 図20における志向性DBに格納される概念ごとのステータスおよびスコアの一例である。 図20におけるスコア計算ステップ(S03108)におけるスコアの計算方法を概念的に示したものであり、(A)は当該概念にかかるノードが継続的にクリックされた場合で、(B)は当該概念にかかるノードが継続的にはクリックされなかった場合である。 図19における送信処理(S02207)によってクライアントPCへと送信されるデータの一部を例示的に示す表である。 図19における表示処理(S02102)によってクライアントPCの画面に表示されるトポロジーグラフの一例である。 クライアントPCにより制御される表示装置内の一つのウインドウに表示された二つのトポロジーグラフが結合している状態を示した図である。 複数のトポロジーグラフが結合して概念知図を形成している状態を示した図である。 ウインドウ内に表示される二つのトポロジーグラフを志向性データベースの情報に基づいて自動的に結合させる場合の動作を示すフローチャートである。 図32のステップS11107に示した結合志向性処理の動作を示すフローチャートである。 ユーザが結合すべきノードを指定した場合に、その指示に基づいてトポロジーグラフの結合させる動作についてのフローチャートである。 組合せの履歴を蓄積してなる結合志向性データベースの情報に基づいて結合ノードを選択する場合の動作を示すフローチャートである。 結合志向性データベースの構造を概念的に示した図である。 各ノードと関連付けて記憶領域に格納されるデータの一例を示した図である。 各リンクと関連付けて記憶領域に格納されるデータの一例を示した図である。 志向性データベースの情報に基づいて算出される予測結合スコアを考慮して、ウインドウ内に表示される二つのトポロジーグラフを結合させる場合の動作を示すフローチャートである。 複数の結合処理のいずれを採用するかを決定する処理の動作を示すフローチャートである。

Claims (6)

  1. 複数のデータを含むデータ群の関連性を視認できるように、前記複数のデータのそれぞれに対応する複数のアイコン状のノードと、前記データ群に含まれるデータ同士の関連性に応じた長さでそれらのデータにかかるノード間に配置されるリンクとから構成されるトポロジーグラフを表示装置に表示するトポロジーグラフ表示システムであって、
    前記二つのトポロジーグラフを表示装置に表示するための表示用データを作成するトポロジーグラフ表示手段と、
    前記二つのトポロジーグラフの構成要素である複数のノードから結合ノードとして一組のノードを選択する結合ノード選択手段と、
    選択された前記一組の結合ノード間に配置される結合リンクの長さを決定する結合リンク長決定手段と、
    前記二つのトポロジーグラフが前記一組の結合ノードにおいて前記結合リンクを介して結合されてなる結合トポロジーグラフを表示装置に表示するための表示用データを作成する結合トポロジーグラフ表示手段と、
    前記複数のデータのそれぞれがいずれの概念に属するかを判別可能な概念対応データを格納する記憶手段とを備え、さらに、
    前記複数のデータが属する概念に対する個人の志向性を定量化した志向性データを概念単位で格納する志向性データベースと、
    前記結合ノードにかかる概念の組合せが結合対象として選択された履歴を含む結合志向性データを格納する結合志向性データベースとの少なくとも一方を有し、
    前記結合ノード選択手段は、
    前記記憶手段から前記概念対応データを読み込んで前記複数のデータのそれぞれがいずれの概念に属するかを判別し、
    前記志向性データベースおよび前記結合志向性データベースの少なくとも一方に格納されるデータを用いて結合対象とすべき概念の組合せを演算することで前記結合ノードを選択する
    ことを特徴とするトポロジーグラフ表示システム。
  2. 前記結合ノード選択手段は、
    前記二つのトポロジーグラフのそれぞれを構成するノード同士の組合せの中に共通する概念が対応付けられている組合せが複数あるか否かを判定する共通概念数判定手段と、
    当該共通概念数判定手段によって共通概念が対応付けられたノードの組合せは複数あると判定されたことを条件として、当該共通概念についての志向性データを前記志向性データベースから読み込む共通概念志向性データ読込手段と、
    当該共通概念志向性データ読込手段によって読み込まれた志向性データに基づいて、前記共通概念の中で志向性が最大である志向性最大共通概念がいずれであるかを判定する志向性最大共通概念判定手段と、
    当該志向性最大共通概念との関連性が最も大きいノードを前記二つのトポロジーグラフのそれぞれについて選択し、当該選択された一組のノードを前記結合ノードと判定する共通概念結合ノード判定手段と
    を有する請求項1記載のトポロジーグラフ表示システム。
  3. 前記結合ノード選択手段は、
    前記二つのトポロジーグラフのそれぞれを構成するノードに対応する概念についての志向性データを前記志向性データベースから読み込む志向性データ読込手段と、
    ポロジーグラフを構成するノードに対応する概念の中で志向性が最大である志向性最大概念がいずれであるかを、前記二つのトポロジーグラフのそれぞれについてト判定する志向性最大概念判定手段と、
    当該志向性最大概念との関連性が最も大きいノードを前記二つのトポロジーグラフのそれぞれについて選択し、当該選択された一組のノードを前記結合ノードと判定する志向性結合ノード判定手段と
    を有する請求項1記載のトポロジーグラフ表示システム。
  4. 前記結合志向性データベースは、各概念の組合せが結合対象として選択された回数を用いて算出される結合志向性の定量値を前記結合志向性データとして格納し、
    前記結合ノード選択手段は、
    前記二つのトポロジーグラフのそれぞれを構成するノード同士の組合せに対応する概念の組合せについて、前記結合志向性データベースから前記結合志向性の定量値を読み込む結合志向性読込手段と、
    前記結合志向性の定量値が最大である概念の組合せに対応するノードの組合せを前記結合ノードと判定する結合志向性結合ノード判定手段と
    を有する請求項1記載のトポロジーグラフ表示システム。
  5. 前記二つのトポロジーグラフのそれぞれを構成するノードのうち、どのノードを前記結合ノード選択手段での演算対象とするかを規定する結合対象ノード規定手段を有する請求項1記載のトポロジーグラフ表示システム。
  6. 複数のデータからなるデータ群の関連性を視覚化するために、前記複数のデータのそれぞれを意味するアイコン状のノードと、前記データ同士の関連性の定量値に応じた長さを有しそれらのデータにかかるノード間に配置されるリンクとから構成されるトポロジーグラフを表示装置に表示する処理を実行するためのコンピュータプログラムであって、
    前記二つのトポロジーグラフを表示装置に表示するための表示用データを作成するトポロジーグラフ表示手順と、
    前記二つのトポロジーグラフの構成要素である複数のノードから結合ノードとして一組のノードを選択する結合ノード選択手順と、
    選択された前記一組の結合ノード間に配置される結合リンクの長さを決定する結合リンク長決定手順と、
    前記二つのトポロジーグラフが前記一組の結合ノードにおいて前記結合リンクを介して結合されてなる結合トポロジーグラフを表示装置に表示するためのデータを作成する結合トポロジーグラフ表示手順とを備え、
    前記結合ノード選択手順は、
    前記複数のデータのそれぞれがいずれの概念に属するかを判別可能な概念対応データを格納する記憶手段にアクセスして前記二つのトポロジーグラフを構成するノードのそれぞれがいずれの概念に対応するかを判別する手順と、
    前記複数のデータが属する概念に対する個人の志向性を定量化した志向性データを格納する志向性データベース、および前記複数のデータが属する概念に対する個人の志向性を定量化した志向性データを格納する志向性データベースとの少なくとも一方から読み込んだデータを用いて演算することによって結合ノードの選択を行う手順とを有する
    ことを特徴とするコンピュータプログラム。
JP2006147989A 2006-05-29 2006-05-29 トポロジーグラフ表示システムおよびコンピュータプログラム Withdrawn JP2007317070A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006147989A JP2007317070A (ja) 2006-05-29 2006-05-29 トポロジーグラフ表示システムおよびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006147989A JP2007317070A (ja) 2006-05-29 2006-05-29 トポロジーグラフ表示システムおよびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2007317070A true JP2007317070A (ja) 2007-12-06

Family

ID=38850856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006147989A Withdrawn JP2007317070A (ja) 2006-05-29 2006-05-29 トポロジーグラフ表示システムおよびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2007317070A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140136446A (ko) * 2012-03-15 2014-11-28 마이크로소프트 코포레이션 링크의 곡률의 대화형 제어 기법
JP2016131048A (ja) * 2008-08-29 2016-07-21 プライマル フュージョン インコーポレイテッド 既存の領域定義を活用した意味概念定義および意味概念関係の統合のためのシステムおよび方法
US9805307B2 (en) 2012-04-24 2017-10-31 International Business Machines Corporation Determining soft graph correspondence between node sets based on feature representations
CN109634580A (zh) * 2018-10-31 2019-04-16 平安科技(深圳)有限公司 监控方法、装置、终端及计算机可读存储介质
CN110399208A (zh) * 2019-07-15 2019-11-01 阿里巴巴集团控股有限公司 分布式任务调度拓扑图的展示方法、装置及设备
JP2021015562A (ja) * 2019-07-16 2021-02-12 Kpmgコンサルティング株式会社 情報処理装置、サーバ装置、ユーザ端末、方法及びプログラム
CN113051446A (zh) * 2019-12-26 2021-06-29 百度国际科技(深圳)有限公司 拓扑关系查询方法、装置、电子设备和介质
US11126795B2 (en) 2017-11-01 2021-09-21 monogoto, Inc. Systems and methods for analyzing human thought
CN114448784A (zh) * 2021-12-27 2022-05-06 卡斯柯信号有限公司 一种信号监测系统的网络拓扑图逻辑状态显示方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016131048A (ja) * 2008-08-29 2016-07-21 プライマル フュージョン インコーポレイテッド 既存の領域定義を活用した意味概念定義および意味概念関係の統合のためのシステムおよび方法
KR102092979B1 (ko) 2012-03-15 2020-03-24 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 링크의 곡률의 대화형 제어 기법
KR20140136446A (ko) * 2012-03-15 2014-11-28 마이크로소프트 코포레이션 링크의 곡률의 대화형 제어 기법
US10635284B2 (en) 2012-03-15 2020-04-28 Microsoft Technology Licensing, Llc. Interactive control of the curvature of links
US9805307B2 (en) 2012-04-24 2017-10-31 International Business Machines Corporation Determining soft graph correspondence between node sets based on feature representations
US11126795B2 (en) 2017-11-01 2021-09-21 monogoto, Inc. Systems and methods for analyzing human thought
CN109634580A (zh) * 2018-10-31 2019-04-16 平安科技(深圳)有限公司 监控方法、装置、终端及计算机可读存储介质
CN109634580B (zh) * 2018-10-31 2024-05-03 平安科技(深圳)有限公司 监控方法、装置、终端及计算机可读存储介质
CN110399208A (zh) * 2019-07-15 2019-11-01 阿里巴巴集团控股有限公司 分布式任务调度拓扑图的展示方法、装置及设备
CN110399208B (zh) * 2019-07-15 2023-10-31 创新先进技术有限公司 分布式任务调度拓扑图的展示方法、装置及设备
JP2021015562A (ja) * 2019-07-16 2021-02-12 Kpmgコンサルティング株式会社 情報処理装置、サーバ装置、ユーザ端末、方法及びプログラム
CN113051446A (zh) * 2019-12-26 2021-06-29 百度国际科技(深圳)有限公司 拓扑关系查询方法、装置、电子设备和介质
CN114448784A (zh) * 2021-12-27 2022-05-06 卡斯柯信号有限公司 一种信号监测系统的网络拓扑图逻辑状态显示方法及装置

Similar Documents

Publication Publication Date Title
JP6246279B2 (ja) 消費者定義の情報アーキテクチャ用のシステム、方法およびコンピュータプログラム
EP2482204B1 (en) System and method for information retrieval from object collections with complex interrelationships
US8010570B2 (en) System, method and computer program for transforming an existing complex data structure to another complex data structure
US7606781B2 (en) System, method and computer program for facet analysis
US7844565B2 (en) System, method and computer program for using a multi-tiered knowledge representation model
JP2007317070A (ja) トポロジーグラフ表示システムおよびコンピュータプログラム
JP3717808B2 (ja) 情報検索システム
TWI570583B (zh) 於搜尋結果頁內提供已標定應用程式之系統與方法
JP5197959B2 (ja) スーパーユニットを用いた検索処理のためのシステム及び方法
US9514425B2 (en) Method and system for providing user-customized contents
CN101404015A (zh) 自动生成词条层次
JP5313295B2 (ja) 文書探索サービス提供方法及びシステム
JP2007012039A (ja) 検索システムおよびコンピュータプログラム
Shihab et al. Development of a visualization tool for XML documents
Kumar et al. Normalized category travel personality by considering explicit and implicit feedback (NCTP): approach for improving travel recommender systems search result
Rástočný et al. Web search results exploration via cluster-based views and zoom-based navigation
Nakasumi Decision making aid in mobile environment by behavioral characteristic
Petrovsky Reducing Dimensionality of Attribute Space
Martins Data extraction in e-commerce
WO2006034222A2 (en) System and method for document analysis, processing and information extraction
Fu et al. Collaborative query previews in digital libraries

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090804