JP4172388B2 - リンク診断装置、リンク診断方法およびリンク診断プログラム。 - Google Patents
リンク診断装置、リンク診断方法およびリンク診断プログラム。 Download PDFInfo
- Publication number
- JP4172388B2 JP4172388B2 JP2003408436A JP2003408436A JP4172388B2 JP 4172388 B2 JP4172388 B2 JP 4172388B2 JP 2003408436 A JP2003408436 A JP 2003408436A JP 2003408436 A JP2003408436 A JP 2003408436A JP 4172388 B2 JP4172388 B2 JP 4172388B2
- Authority
- JP
- Japan
- Prior art keywords
- link
- information
- determination
- inconsistency
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の第1の実施の形態を図面を参照して説明する。図1は、本発明によるリンク診断装置の構成の一例を示すブロック図である。図1に示すように、リンク診断装置は、キーボードやマウスなどの入力装置11と、ディスプレイ装置や印刷装置などの出力装置12と、プログラムに従って動作するデータ処理装置20と、各情報を記憶する記憶装置30とを含む。
=20・a_12−2・a_1・a_2+28・a_22 式4
=8・(a_12+2・a_1・a_2+a_22) 式5
=1.381・x_1+x_2+(a_0/a_2) 式8
次に、本発明の第2の実施の形態を図面を参照して説明する。図21は、リンク診断装置の他の構成例を示すブロック図である。図21に示すように、リンク診断装置のデータ処理装置40は、第1の実施の形態で示した構成に加えて、学習方式決定手段27を含む。本実施の形態では、リンク診断装置は、サイト管理者によって選択入力された複数の学習アルゴリズムのうち最適な1の学習アルゴリズムを選択し、選択した学習アルゴリズムとリンク特徴情報との最適な組み合わせを自動的に決定する。そして、リンク診断装置は、決定した学習アルゴリズムとリンク特徴情報との組合せにもとづいて、学習処理、判定処理および結果確認処理を実行する。
次に、本発明の第3の実施の形態を図面を参照して説明する。図24は、リンク診断装置の更に他の構成例を示すブロック図である。図24に示すように、本実施の形態では、データ処理装置50に実行させるためのリンク診断プログラム60が含まれる。
12 出力装置
20 データ処理装置
21 判定済みリンク情報アクセス手段
22 リンク特徴抽出手段
23 不整合学習手段
24 未判定リンク情報アクセス手段
25 不整合判定手段
26 結果反映手段
30 記憶装置
31 未判定リンク情報記憶部
32 判定済みリンク情報記憶部
33 リンク特徴記憶部
34 学習結果記憶部
Claims (28)
- 指定先の文書を指定元の文書に関連づけるハイパーテキストのリンクの属性を示すリンク情報のうち、リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクのリンク情報である未判定リンク情報を記憶する未判定リンク情報記憶手段と、
前記未判定リンク情報記憶手段から前記未判定リンク情報を読み込む未判定リンク情報読込手段と、
前記未判定リンク情報読込手段によって読み込まれた前記未判定リンク情報にもとづいて、少なくとも前記未判定リンク情報に含まれる情報、前記未判定リンク情報に含まれる情報の位置若しくは大きさ、前記未判定リンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記未判定リンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出するリンク特徴抽出手段と、
予め前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かの判定が既に行われているリンクのリンク特徴情報と前記不整合が生じているか否かの判定結果との関係を示す識別関数を記憶する識別関数記憶手段と、
前記リンク特徴抽出手段が前記未判定リンク情報にもとづいて抽出したリンク特徴情報を座標上にプロットした点と、前記識別関数記憶手段が記憶する前記識別関数とを比較して、前記未判定リンク情報に含まれる前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクに、前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かを判定する不整合判定手段とを備えた
ことを特徴とするリンク診断装置。 - 指定先の文書を指定元の文書に関連づけるハイパーテキストのリンクの属性を示すリンク情報のうち、リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクのリンク情報である未判定リンク情報を記憶する未判定リンク情報記憶手段と、
リンク情報のうち予め前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かの判定が既に行われているリンクのリンク情報である判定済みリンク情報と、前記不整合が生じているか否かの判定結果とを記憶する判定済みリンク情報記憶手段と、
前記未判定リンク情報記憶手段から前記未判定リンク情報を読み込む未判定リンク情報読込手段と、
前記判定済みリンク情報記憶手段から前記判定済みリンク情報および前記不整合が生じているか否かの判定結果を読み込む判定済みリンク情報読込手段と、
前記未判定リンク情報読込手段によって読み込まれた前記未判定リンク情報にもとづいて、少なくとも前記未判定リンク情報に含まれる情報、前記未判定リンク情報に含まれる情報の位置若しくは大きさ、前記未判定リンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記未判定リンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出し、前記判定済みリンク情報読込手段によって読み込まれた前記判定済みリンク情報にもとづいて、少なくとも前記判定済みリンク情報に含まれる情報、前記判定済みリンク情報に含まれる情報の位置若しくは大きさ、前記判定済みリンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記判定済みリンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出するリンク特徴抽出手段と、
前記リンク特徴抽出手段が前記判定済みリンク情報にもとづいて抽出したリンク特徴情報と、前記判定済みリンク情報読込手段が読み込んだ前記不整合が生じているか否かの判定結果とを用いて、当該リンク特徴情報とリンクが不整合であると判定された割合との関係と統計計算することによって、予め不整合が生じているか否かの判定が既に行われているリンクのリンク特徴情報と前記不整合が生じているか否かの判定結果との関係を示す識別関数を導出する識別関数導出手段と、
前記識別関数導出手段によって導出された前記識別関数を記憶する識別関数記憶手段と、
前記リンク特徴抽出手段が前記未判定リンク情報にもとづいて抽出したリンク特徴情報を座標上にプロットした点と、前記識別関数記憶手段が記憶する前記識別関数とを比較して、前記未判定リンク情報に含まれる前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクに不整合が生じているか否かを判定する不整合判定手段とを備えた
ことを特徴とするリンク診断装置。 - 不整合判定手段による未判定のリンクに対する不整合が生じているか否かの判定結果と、前記リンクのリンク情報とを判定済みリンク情報記憶手段に記憶させるフィードバック手段を備え、
前記フィードバック手段は、前記未判定のリンクに対する前記不整合が生じているか否かの判定結果を出力して、前記不整合が生じているか否かの判定結果が正しいか否かの確認をユーザに促し、ユーザの入力操作に従って前記不整合が生じているか否かの判定結果が正しいか否かの確認結果を入力し、前記確認結果にもとづいて、リンク情報および不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させ、
判定済みリンク情報読込手段は、前記フィードバック手段がリンク情報および前記不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させた後に、前記判定済みリンク情報記憶手段から判定済みリンク情報および前記不整合が生じているか否かの判定結果を再度読み込み、
リンク特徴抽出手段は、前記判定済みリンク情報読込手段によって再度読み込まれた判定済みリンク情報にもとづいてリンク特徴情報を再度抽出し、
識別関数導出手段は、前記リンク特徴抽出手段が前記判定済みリンク情報にもとづいて再度抽出したリンク特徴情報と、前記判定済みリンク情報読込手段が再度読み込んだ前記不整合が生じているか否かの判定結果とを用いて、識別関数を再度導出する
請求項2記載のリンク診断装置。 - 不整合判定手段による未判定リンクに対する不整合が生じているか否かの判定結果と、前記リンクのリンク情報とを判定済みリンク情報記憶手段に記憶させるフィードバック手段を備え、
前記フィードバック手段は、前記未判定のリンクに対する判定がなされる度に不整合が生じているか否かの判定結果を出力して、前記不整合が生じているか否かの判定結果が正しいか否かの確認をユーザに促し、ユーザの入力操作に従って前記不整合が生じているか否かの判定結果が正しいか否かの確認結果を入力し、前記確認結果にもとづいて、リンク情報および不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させ、
判定済みリンク情報読込手段は、前記フィードバック手段がリンク情報および不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させた後に、判定済みリンク情報記憶手段から判定済みリンク情報および前記不整合が生じているか否かの判定結果を再度読み込み、
リンク特徴抽出手段は、前記判定済みリンク情報読込手段によって再度読み込まれた前記判定済みリンク情報にもとづいてリンク特徴情報を再度抽出し、
識別関数導出手段は、前記リンク特徴抽出手段が前記判定済みリンク情報にもとづいて再度抽出したリンク特徴情報と、前記判定済みリンク情報読込手段が再度読み込んだ前記不整合が生じているか否かの判定結果とを用いて、識別関数を再度導出し、
未判定リンク情報読込手段は、未判定リンク情報記憶手段に新規の未判定リンク情報が追加される度に、前記新規の未判定リンク情報を読み込み、
前記リンク特徴抽出手段は、前記未判定リンク情報読込手段によって読み込まれた前記新規の未判定リンク情報にもとづいてリンク特徴情報を抽出し、
不整合判定手段は、前記リンク特徴抽出手段が前記新規の未判定リンク情報にもとづいて抽出したリンク特徴情報と、識別関数導出手段によって再度導出された識別関数とを用いて、未判定のリンクに不整合が生じているか否かを判定する
請求項2または請求項3記載のリンク診断装置。 - リンク特徴情報と不整合判定手段によってリンク特徴情報と比較される識別関数を導出するための識別関数導出アルゴリズムとの組合せのうち、リンク特徴情報とリンクに不整合が生じているか否かの判定結果の精度が最も高くなる識別関数導出アルゴリズムとの組合せを決定する最適組合せ決定手段を備え、
最適組合せ決定手段は、
判定済みリンク情報読込手段に、判定済みリンク情報記憶手段から判定済みリンク情報および不整合が生じているか否かの判定結果を読み込ませ、
リンク特徴抽出手段に、前記判定済みリンク情報にもとづいて複数種類のリンク特徴情報を抽出させ、
前記複数種類のリンク特徴情報のうちの一部または全部と、複数種類の識別関数導出アルゴリズムのうちの1種類とからなる組合せを複数定め、
識別関数導出手段に、個々の組合せごとに、組合せを構成する識別関数導出アルゴリズムに従って、組合せを構成するリンク特徴情報と、判定済みリンク情報読込手段によって読み込まれた不整合が生じているか否かの判定結果とを用いて識別関数を導出させ、
不整合判定手段に、前記個々の組合せごとに、既に不整合が生じているか否かの判定結果が得られているリンクに対して、組合せに応じて導出された前記識別関数を用いて再度判定を行わせ、
前記不整合判定手段に再度判定させた結果と既に得られている不整合が生じているか否かの判定結果との比較を前記個々の組合せごとに行うことによって、前記不整合判定手段に再度判定させた結果の精度を組合せごとに求め、精度が最も高くなっている組合せを特定する
請求項2から請求項4のうちのいずれか1項に記載のリンク診断装置。 - リンク特徴抽出手段は、リンク特徴情報として、不整合が生じているか否かの判定対象となるリンクから特定可能なリンク特徴情報、判定対象となるリンクと前記リンクのリンク先の文書の記述内容とから特定可能なリンク特徴情報、または所定の条件に従ってリンクをグループ化した場合に判定対象となるリンクが属するグループの大きさを示すリンク特徴情報のうちのいずれか1種類もしくは複数種類のリンク特徴情報を抽出する請求項1から請求項5のうちのいずれか1項に記載のリンク診断装置。
- リンク特徴抽出手段は、
判定対象となるリンクから特定可能なリンク特徴情報に該当する
リンク元表記に含まれるキーワード、
リンク先アドレスに含まれるドメイン名もしくはディレクトリ名、
リンク元アドレスに含まれるドメイン名もしくはディレクトリ名、
文書内におけるリンク元表記の出現位置もしくは表示面積、
または判定対象となるリンクと前記リンクのリンク先の文書の記述内容とから特定可能なリンク特徴情報に該当する
リンク元表記に含まれるキーワードがリンク先文書のタイトルに出現する回数、
リンク元表記に含まれるキーワードがリンク先文書の本文に出現する回数、
リンク元表記に含まれるキーワードがリンク先文書内で強調表示されている回数、
または所定の条件に従ってリンクをグループ化した場合に判定対象となるリンクが属するグループの大きさを示すリンク特徴情報に該当する
同一リンク元表記のグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク先アドレスを持つリンクの割合、
同一リンク先アドレスのグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク元表記を持つリンクの割合、
同一リンク元アドレスであって同一リンク元表記のグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク先アドレスを持つリンクの割合、
同一リンク元アドレスであって同一リンク先アドレスのグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク元表記を持つリンクの割合
のうちのいずれか1種類または複数種類の情報を抽出する
請求項6記載のリンク診断装置。 - 未判定リンク情報記憶手段が、指定先の文書を指定元の文書に関連づけるハイパーテキストのリンクの属性を示すリンク情報のうち、リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクのリンク情報である未判定リンク情報を記憶し、
未判定リンク情報読込手段が、前記未判定リンク情報記憶手段から前記未判定リンク情報を読み込み、
リンク特徴抽出手段が、前記未判定リンク情報読込手段によって読み込まれた前記未判定リンク情報にもとづいて、少なくとも前記未判定リンク情報に含まれる情報、前記未判定リンク情報に含まれる情報の位置若しくは大きさ、前記未判定リンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記未判定リンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出し、
識別関数記憶手段が、予め前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かの判定が既に行われているリンクのリンク特徴情報と前記不整合が生じているか否かの判定結果との関係を示す識別関数を記憶し、
不整合判定手段が、前記リンク特徴抽出手段が前記未判定リンク情報にもとづいて抽出したリンク特徴情報を座標上にプロットした点と、前記識別関数記憶手段が記憶する前記識別関数とを比較して、前記未判定リンク情報に含まれる前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクに、前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かを判定する
ことを特徴とするリンク診断方法。 - 未判定リンク情報記憶手段が、指定先の文書を指定元の文書に関連づけるハイパーテキストのリンクの属性を示すリンク情報のうち、リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクのリンク情報である未判定リンク情報を記憶し、
判定済みリンク情報記憶手段が、リンク情報のうち予め前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かの判定が既に行われているリンクのリンク情報である判定済みリンク情報と、前記不整合が生じているか否かの判定結果とを記憶し、
未判定リンク情報読込手段が、前記未判定リンク情報記憶手段から前記未判定リンク情報を読み込み、
判定済みリンク情報読込手段が、前記判定済みリンク情報記憶手段から前記判定済みリンク情報および不整合が生じているか否かの判定結果を読み込み、
リンク特徴抽出手段が、前記未判定リンク情報読込手段によって読み込まれた前記未判定リンク情報にもとづいて、少なくとも前記未判定リンク情報に含まれる情報、前記未判定リンク情報に含まれる情報の位置若しくは大きさ、前記未判定リンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記未判定リンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出し、前記判定済みリンク情報読込手段によって読み込まれた前記判定済みリンク情報にもとづいて、少なくとも前記判定済みリンク情報に含まれる情報、前記判定済みリンク情報に含まれる情報の位置若しくは大きさ、前記判定済みリンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記判定済みリンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出し、
識別関数導出手段が、前記リンク特徴抽出手段が前記判定済みリンク情報にもとづいて抽出したリンク特徴情報と、前記判定済みリンク情報読込手段が読み込んだ不整合が生じているか否かの判定結果とを用いて、当該リンク特徴情報とリンクが不整合であると判定された割合との関係と統計計算することによって、予め不整合が生じているか否かの判定が既に行われているリンクのリンク特徴情報と前記不整合が生じているか否かの判定結果との関係を示す識別関数を導出し、
識別関数記憶手段が、前記識別関数導出手段によって導出された前記識別関数を記憶し、
不整合判定手段が、前記リンク特徴抽出手段が前記未判定リンク情報にもとづいて抽出したリンク特徴情報を座標上にプロットした点と、前記識別関数記憶手段が記憶する前記識別関数とを比較して、前記未判定リンク情報に含まれる前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクに不整合が生じているか否かを判定する
ことを特徴とするリンク診断方法。 - フィードバック手段が、不整合判定手段による未判定のリンクに対する不整合が生じているか否かの判定結果を出力して、前記不整合が生じているか否かの判定結果が正しいか否かの確認をユーザに促し、ユーザの入力操作に従って前記不整合が生じているか否かの判定結果が正しいか否かの確認結果を入力し、
フィードバック手段が、前記未判定のリンクに対する不整合が生じているか否かの判定結果と、前記リンクのリンク情報とを、前記確認結果にもとづいて判定済みリンク情報記憶手段に記憶させ、
判定済みリンク情報読込手段が、前記フィードバック手段がリンク情報および前記不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させた後に、前記判定済みリンク情報記憶手段から判定済みリンク情報および不整合が生じているか否かの判定結果を再度読み込み、
リンク特徴抽出手段が、前記判定済みリンク情報読込手段によって再度読み込まれた判定済みリンク情報にもとづいてリンク特徴情報を再度抽出し、
識別関数導出手段が、前記リンク特徴抽出手段が前記判定済みリンク情報にもとづいて再度抽出したリンク特徴情報と、前記判定済みリンク情報読込手段が再度読み込んだ前記不整合が生じているか否かの判定結果とを用いて、識別関数を再度導出する
請求項9記載のリンク診断方法。 - フィードバック手段が、不整合判定手段による未判定のリンクに対する判定がなされる度に不整合が生じているか否かの判定結果を出力して、前記不整合が生じているか否かの判定結果が正しいか否かの確認をユーザに促し、ユーザの入力操作に従って前記不整合が生じているか否かの判定結果が正しいか否かの確認結果を入力し、
フィードバック手段が、前記未判定のリンクに対する不整合が生じているか否かの判定結果と、前記リンクのリンク情報とを、前記確認結果にもとづいて判定済みリンク情報記憶手段に記憶させ、
判定済みリンク情報読込手段が、前記フィードバック手段がリンク情報および不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させた後に、判定済みリンク情報記憶手段から判定済みリンク情報および不整合が生じているか否かの判定結果を再度読み込み、
リンク特徴抽出手段が、前記判定済みリンク情報読込手段によって再度読み込まれた判定済みリンク情報にもとづいてリンク特徴情報を再度抽出し、
識別関数導出手段が、前記リンク特徴抽出手段が前記判定済みリンク情報にもとづいて再度抽出したリンク特徴情報と、前記判定済みリンク情報読込手段が再度読み込んだ前記不整合が生じているか否かの判定結果とを用いて、識別関数を再度導出し、
未判定リンク情報読込手段が、未判定リンク情報記憶手段に新規の未判定リンク情報が追加される度に、前記新規の未判定リンク情報を読み込み、
前記リンク特徴抽出手段が、前記未判定リンク情報読込手段によって読み込まれた前記新規の未判定リンク情報にもとづいてリンク特徴情報を抽出し、
不整合判定手段が、前記リンク特徴抽出手段が前記新規の未判定リンク情報にもとづいて抽出したリンク特徴情報と、識別関数導出手段によって再度導出された識別関数とを用いて、未判定のリンクに不整合が生じているか否かを判定する
請求項9または請求項10記載のリンク診断方法。 - 最適組合せ決定手段が、
判定済みリンク情報読込手段に、判定済みリンク情報記憶手段から判定済みリンク情報および不整合が生じているか否かの判定結果を読み込ませ、
リンク特徴抽出手段に、前記判定済みリンク情報にもとづいて複数種類のリンク特徴情報を抽出させ、
前記複数種類のリンク特徴情報のうちの一部または全部と、複数種類の識別関数導出アルゴリズムのうちの1種類とからなる組合せを複数定め、
識別関数導出手段に、個々の組合せごとに、組合せを構成する識別関数導出アルゴリズムに従って、組合せを構成するリンク特徴情報と、判定済みリンク情報読込手段によって読み込まれた不整合が生じているか否かの判定結果とを用いて識別関数を導出させ、
不整合判定手段に、前記個々の組合せごとに、既に不整合が生じているか否かの判定結果が得られているリンクに対して、組合せに応じて導出された前記識別関数を用いて再度判定を行わせ、
前記不整合判定手段に再度判定させた結果と既に得られている不整合が生じているか否かの判定結果との比較を前記個々の組合せごとに行うことによって、前記不整合判定手段に再度判定させた結果の精度を組合せごとに求め、精度が最も高くなっている組合せを特定する
請求項9から請求項11のうちのいずれか1項に記載のリンク診断方法。 - 最適組合せ決定手段が、複数種類のリンク特徴情報のうちの一部または全部と、複数種類の識別関数導出アルゴリズムのうちの1種類とからなる各組合せと、前記各組合せにおける不整合判定手段に再度判定させた結果の精度とを一覧表示する請求項12記載のリンク診断方法。
- リンク特徴抽出手段が、リンク特徴情報として、不整合が生じているか否かの判定対象となるリンクから特定可能なリンク特徴情報、判定対象となるリンクと前記リンクのリンク先の文書の記述内容とから特定可能なリンク特徴情報、または所定の条件に従ってリンクをグループ化した場合に判定対象となるリンクが属するグループの大きさを示すリンク特徴情報のうちのいずれか1種類もしくは複数種類のリンク特徴情報を抽出する請求項8から請求項13のうちのいずれか1項に記載のリンク診断方法。
- リンク特徴抽出手段が、
判定対象となるリンクから特定可能なリンク特徴情報に該当する
リンク元表記に含まれるキーワード、
リンク先アドレスに含まれるドメイン名もしくはディレクトリ名、
リンク元アドレスに含まれるドメイン名もしくはディレクトリ名、
文書内におけるリンク元表記の出現位置もしくは表示面積、
または判定対象となるリンクと前記リンクのリンク先の文書の記述内容とから特定可能なリンク特徴情報に該当する
リンク元表記に含まれるキーワードがリンク先文書のタイトルに出現する回数、
リンク元表記に含まれるキーワードがリンク先文書の本文に出現する回数、
リンク元表記に含まれるキーワードがリンク先文書内で強調表示されている回数、
または所定の条件に従ってリンクをグループ化した場合に判定対象となるリンクが属するグループの大きさを示すリンク特徴情報に該当する
同一リンク元表記のグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク先アドレスを持つリンクの割合、
同一リンク先アドレスのグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク元表記を持つリンクの割合、
同一リンク元アドレスであって同一リンク元表記のグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク先アドレスを持つリンクの割合、
同一リンク元アドレスであって同一リンク先アドレスのグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク元表記を持つリンクの割合
のうちのいずれか1種類または複数種類の情報を抽出する
請求項14記載のリンク診断方法。 - 識別関数導出手段が、ユーザの入力操作に従ってリンク特徴情報の種類と、識別関数導出アルゴリズムの種類と、前記識別関数導出アルゴリズムに適用されるパラメータとを指定され、リンク特徴抽出手段に、ユーザの入力操作に従って指定された種類のリンク特徴情報を抽出させ、
識別関数導出手段が、ユーザの入力操作に従って指定され、かつ判定済みリンク情報にもとづいて抽出されたリンク特徴情報と、判定済みリンク情報読込手段が読み込んだ不整合が生じているか否かの判定結果とを用いて、ユーザの入力操作に従って指定された識別関数導出アルゴリズムおよびパラメータに従って、識別関数を導出し、
識別関数記憶手段が、識別関数導出手段によって導出された識別関数を記憶し、
不整合判定手段が、ユーザの入力操作に従って指定され、かつ未判定リンク情報にもとづいて抽出したリンク特徴情報と前記識別関数とを用いて、未判定のリンクに不整合が生じているか否かを判定する
請求項9から請求項15のうちのいずれか1項に記載のリンク診断方法。 - 不整合判定手段が、リンク特徴情報と識別関数とを用いて未判定のリンクに不整合が生じているか否かを判定するとともに、不整合が生じているか否かの判定結果の信頼性を示す確信度を算出し、判定を行った各リンクごとに、不整合が生じているか否かの判定結果および確信度を表示する請求項8から請求項16のうちのいずれか1項に記載のリンク診断方法。
- 不整合判定手段が、判定を行った各リンクのリンク情報を、確信度に応じて色分けして表示する請求項17記載のリンク診断方法。
- 不整合判定手段が、判定を行った各リンクのリンク情報を、確信度をソートキーとして並べ替えて表示する請求項17または請求項18記載のリンク診断方法。
- 不整合判定手段が、不整合が生じているか否かの判定対象となるリンクに対する不整合が生じているか否かの判定結果とともに、前記判定対象となるリンクとリンク元表記が共通するリンクのグループ、前記判定対象となるリンクとリンク先アドレスが共通するリンクのグループ、前記判定対象となるリンクとリンク元アドレスおよびリンク元表記が共通するリンクのグループ、前記判定対象となるリンクとリンク元アドレスおよびリンク先アドレスが共通するリンクのグループのうちのいずれか1つのグループまたはいずれか複数のグループを表示する請求項8から請求項16のうちのいずれか1項に記載のリンク診断方法。
- 不整合判定手段が、不整合が生じていると判定されたリンクのリンク元となる文書に含まれる各リンクによって構成されるグループを表示し、ユーザの入力操作に従って前記文書の指定を入力し、前記文書の指定を入力した場合、前記文書を表示するとともに不整合が生じているリンクの箇所を特定して表示する請求項8から請求項16のうちのいずれか1項に記載のリンク診断方法。
- 指定先の文書を指定元の文書に関連づけるハイパーテキストのリンクの属性を示すリンク情報のうち、リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクのリンク情報である未判定リンク情報を記憶する未判定リンク情報記憶手段と、予め前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かの判定が既に行われているリンクのリンク特徴情報と前記不整合が生じているか否かの判定結果との関係を示す識別関数を記憶する識別関数記憶手段とを備えたコンピュータに、
前記未判定リンク情報記憶手段から前記未判定リンク情報を読み込む処理、
読み込まれた前記未判定リンク情報にもとづいて、少なくとも前記未判定リンク情報に含まれる情報、前記未判定リンク情報に含まれる情報の位置若しくは大きさ、前記未判定リンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記未判定リンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出する処理、および
前記未判定リンク情報にもとづいて抽出されたリンク特徴情報を座標上にプロットした点と、前記識別関数記憶手段が記憶する前記識別関数とを比較して、前記未判定リンク情報に含まれる前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクに、前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かを判定する処理
を実行させるためのリンク診断プログラム。 - 指定先の文書を指定元の文書に関連づけるハイパーテキストのリンクの属性を示すリンク情報のうち、リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクのリンク情報である未判定リンク情報を記憶する未判定リンク情報記憶手段と、リンク情報のうち予め前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否かの判定が既に行われているリンクのリンク情報である判定済みリンク情報と、前記不整合が生じているか否かの判定結果とを記憶する判定済みリンク情報記憶手段と、予め不整合が生じているか否かの判定が既に行われているリンクのリンク特徴情報と前記不整合が生じているか否かの判定結果との関係を示す識別関数を記憶する識別関数記憶手段とを備えたコンピュータに、
前記未判定リンク情報記憶手段から前記未判定リンク情報を読み込む処理、
前記判定済みリンク情報記憶手段から前記判定済みリンク情報および不整合が生じているか否かの判定結果を読み込む処理、
読み込まれた前記未判定リンク情報にもとづいて、少なくとも前記未判定リンク情報に含まれる情報、前記未判定リンク情報に含まれる情報の位置若しくは大きさ、前記未判定リンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記未判定リンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出する処理、
読み込まれた前記判定済みリンク情報にもとづいて、少なくとも前記判定済みリンク情報に含まれる情報、前記判定済みリンク情報に含まれる情報の位置若しくは大きさ、前記判定済みリンク情報に含まれる情報が指定先の文書中に引用されている数、または所定の条件に従ってグループ化されたグループ内における前記判定済みリンク情報に含まれる情報をもつリンクの割合のいずれかを、リンク特徴情報として抽出する処理、
前記判定済みリンク情報にもとづいて抽出されたリンク特徴情報と、読み込まれた前記不整合が生じているか否かの判定結果とを用いて、当該リンク特徴情報とリンクが不整合であると判定された割合との関係と統計計算することによって、識別関数を導出する処理、および
前記未判定リンク情報にもとづいて抽出されたリンク特徴情報を座標上にプロットした点と、前記識別関数記憶手段が記憶する前記識別関数とを比較して、前記未判定リンク情報に含まれる前記リンク元表記から期待される指定先の文書の内容と実際の指定先の文書の内容とに不整合が生じているか否か未判定のリンクに不整合が生じているか否かを判定する処理
を実行させるためのリンク診断プログラム。 - コンピュータに、
未判定のリンクに対する不整合が生じているか否かの判定結果を出力して、前記不整合が生じているか否かの判定結果が正しいか否かの確認をユーザに促し、ユーザの入力操作に従って前記不整合が生じているか否かの判定結果が正しいか否かの確認結果を入力する処理、
前記未判定のリンクに対する不整合が生じているか否かの判定結果と、前記リンクのリンク情報とを、前記確認結果にもとづいて判定済みリンク情報記憶手段に記憶させる処理、
リンク情報および前記不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させた後に、前記判定済みリンク情報記憶手段から判定済みリンク情報および不整合が生じているか否かの判定結果を再度読み込む処理、
再度読み込まれた判定済みリンク情報にもとづいてリンク特徴情報を再度抽出する処理、および
判定済みリンク情報にもとづいて再度抽出されたリンク特徴情報と、再度読み込まれた不整合が生じているか否かの判定結果とを用いて、識別関数を再度導出する処理
を実行させる請求項23記載のリンク診断プログラム。 - コンピュータに、
未判定のリンクに対する判定がなされる度に不整合が生じているか否かの判定結果を出力して、前記不整合が生じているか否かの判定結果が正しいか否かの確認をユーザに促し、ユーザの入力操作に従って前記不整合が生じているか否かの判定結果が正しいか否かの確認結果を入力する処理、
前記未判定のリンクに対する不整合が生じているか否かの判定結果と、前記リンクのリンク情報とを、前記確認結果にもとづいて判定済みリンク情報記憶手段に記憶させる処理、
リンク情報および不整合が生じているか否かの判定結果を判定済みリンク情報記憶手段に記憶させた後に、判定済みリンク情報記憶手段から判定済みリンク情報および前記不整合が生じているか否かの判定結果を再度読み込む処理、
再度読み込まれた前記判定済みリンク情報にもとづいてリンク特徴情報を再度抽出する処理、
前記判定済みリンク情報にもとづいて再度抽出されたリンク特徴情報と、再度読み込まれた前記不整合が生じているか否かの判定結果とを用いて、識別関数を再度導出する処理、
未判定リンク情報記憶手段に新規の未判定リンク情報が追加される度に、前記新規の未判定リンク情報を読み込む処理、
読み込まれた前記新規の未判定リンク情報にもとづいてリンク特徴情報を抽出する処理、および
前記新規の未判定リンク情報にもとづいて抽出されたリンク特徴情報と再度導出された識別関数とを用いて、未判定のリンクに不整合が生じているか否かを判定する処理
を実行させる請求項23または請求項24記載のリンク診断プログラム。 - コンピュータに、
リンク特徴情報と不整合判定手段によってリンク特徴情報と比較される識別関数を導出するための識別関数導出アルゴリズムとの組合せのうち、リンク特徴情報とリンクに不整合が生じているか否かの判定結果の精度が最も高くなる識別関数導出アルゴリズムとの組合せを決定する最適組合せ決定処理を実行させ、
最適組合せ決定処理において、
判定済みリンク情報記憶手段から判定済みリンク情報および不整合が生じているか否かの判定結果を読み込ませる処理、
前記判定済みリンク情報にもとづいて複数種類のリンク特徴情報を抽出させる処理、
前記複数種類のリンク特徴情報のうちの一部または全部と、複数種類の識別関数導出アルゴリズムのうちの1種類とからなる組合せを複数定める処理、
個々の組合せごとに、組合せを構成する識別関数導出アルゴリズムに従って、組合せを構成するリンク特徴情報と、読み込まれた不整合が生じているか否かの判定結果とを用いて識別関数を導出させる処理、
前記個々の組合せごとに、既に不整合が生じているか否かの判定結果が得られているリンクに対して、組合せに応じて導出された前記識別関数を用いて再度判定を行わせる処理、および
再度判定させた結果と既に得られている不整合が生じているか否かの判定結果との比較を前記個々の組合せごとに行うことによって、再度判定させた結果の精度を組合せごとに求め、精度が最も高くなっている組合せを特定する処理
を実行させる請求項23から請求項25のうちのいずれか1項に記載のリンク診断プログラム。 - コンピュータに、
リンク特徴情報として、不整合が生じているか否かの判定対象となるリンクから特定可能なリンク特徴情報、判定対象となるリンクと前記リンクのリンク先の文書の記述内容とから特定可能なリンク特徴情報、または所定の条件に従ってリンクをグループ化した場合に判定対象となるリンクが属するグループの大きさを示すリンク特徴情報のうちのいずれか1種類もしくは複数種類のリンク特徴情報を抽出する処理
を実行させる請求項22から請求項26のうちのいずれか1項に記載のリンク診断プログラム。 - コンピュータに、
判定対象となるリンクから特定可能なリンク特徴情報に該当する
リンク元表記に含まれるキーワード、
リンク先アドレスに含まれるドメイン名もしくはディレクトリ名、
リンク元アドレスに含まれるドメイン名もしくはディレクトリ名、
文書内におけるリンク元表記の出現位置もしくは表示面積、
または判定対象となるリンクと前記リンクのリンク先の文書の記述内容とから特定可能なリンク特徴情報に該当する
リンク元表記に含まれるキーワードがリンク先文書のタイトルに出現する回数、
リンク元表記に含まれるキーワードがリンク先文書の本文に出現する回数、
リンク元表記に含まれるキーワードがリンク先文書内で強調表示されている回数、
または所定の条件に従ってリンクをグループ化した場合に判定対象となるリンクが属するグループの大きさを示すリンク特徴情報に該当する
同一リンク元表記のグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク先アドレスを持つリンクの割合、
同一リンク先アドレスのグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク元表記を持つリンクの割合、
同一リンク元アドレスであって同一リンク元表記のグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク先アドレスを持つリンクの割合、
同一リンク元アドレスであって同一リンク先アドレスのグループ内で、識別関数を導出するためのリンクまたは判定対象となるリンクと同じリンク元表記を持つリンクの割合
のうちのいずれか1種類または複数種類の情報を抽出する処理
を実行させる請求項27記載のリンク診断プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003408436A JP4172388B2 (ja) | 2003-12-08 | 2003-12-08 | リンク診断装置、リンク診断方法およびリンク診断プログラム。 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003408436A JP4172388B2 (ja) | 2003-12-08 | 2003-12-08 | リンク診断装置、リンク診断方法およびリンク診断プログラム。 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005173671A JP2005173671A (ja) | 2005-06-30 |
JP4172388B2 true JP4172388B2 (ja) | 2008-10-29 |
Family
ID=34730125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003408436A Expired - Fee Related JP4172388B2 (ja) | 2003-12-08 | 2003-12-08 | リンク診断装置、リンク診断方法およびリンク診断プログラム。 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4172388B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4767694B2 (ja) | 2006-01-13 | 2011-09-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 不正ハイパーリンク検出装置及びその方法 |
JP5187064B2 (ja) * | 2008-08-18 | 2013-04-24 | 富士通株式会社 | Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法 |
JP2010140409A (ja) * | 2008-12-15 | 2010-06-24 | Mitsubishi Electric Corp | 監視画面生成装置 |
JP2010176583A (ja) * | 2009-01-30 | 2010-08-12 | Dainippon Printing Co Ltd | 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム |
JP5671891B2 (ja) * | 2010-09-01 | 2015-02-18 | 日本電気株式会社 | タグ付け装置、タグ付け方法およびプログラム |
JP5974663B2 (ja) * | 2012-06-21 | 2016-08-23 | 富士通株式会社 | 分析装置、分析方法及び分析プログラム |
JP5408380B1 (ja) * | 2013-06-17 | 2014-02-05 | 富士ゼロックス株式会社 | 情報処理プログラム及び情報処理装置 |
US12099820B2 (en) | 2019-10-15 | 2024-09-24 | UiPath, Inc. | Training and using artificial intelligence (AI) / machine learning (ML) models to automatically supplement and/or complete code of robotic process automation workflows |
-
2003
- 2003-12-08 JP JP2003408436A patent/JP4172388B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005173671A (ja) | 2005-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11972203B1 (en) | Using anchors to generate extraction rules | |
US10783324B2 (en) | Wizard for configuring a field extraction rule | |
US7814111B2 (en) | Detection of patterns in data records | |
US11769003B2 (en) | Web element rediscovery system and method | |
EP2289007B1 (en) | Search results ranking using editing distance and document information | |
JP5040925B2 (ja) | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム | |
JP4997856B2 (ja) | データベース分析プログラム、データベース分析装置、データベース分析方法 | |
TWI556180B (zh) | 用以遞迴檢閱網際網路及其他來源以識別、收集、管理、判定及鑑定商業身分與相關資料之系統及方法 | |
US10127313B2 (en) | Method of retrieving attributes from at least two data sources | |
US20030023593A1 (en) | Real-time adaptive data mining system and method | |
JP5318190B2 (ja) | 情報処理装置及び情報処理方法及びプログラム | |
JP2004139304A (ja) | ハイパーテキスト検査装置および方法並びにプログラム | |
JP2007058514A (ja) | 情報処理装置及び情報処理方法及びプログラム | |
JP2008134705A (ja) | データ処理方法及びデータ分析装置 | |
JP4172388B2 (ja) | リンク診断装置、リンク診断方法およびリンク診断プログラム。 | |
JP6276126B2 (ja) | 問題構造抽出支援システム、問題構造抽出支援方法及びプログラム | |
CN113032548A (zh) | 信息处理装置、存储介质及信息处理方法 | |
CN110188207A (zh) | 知识图谱构建方法及装置、可读存储介质、电子设备 | |
JPH08314751A (ja) | 障害対策支援方法 | |
US11481304B1 (en) | User action generated process discovery | |
JP2000222215A (ja) | 手順ベース事例検索システム | |
CN111158973A (zh) | 一种web应用动态演化监测方法 | |
JP2009169573A (ja) | 解析結果出力装置、及び解析結果出力方法 | |
JP6901533B2 (ja) | 計算機システム及び業務の支援方法 | |
JP2005122509A (ja) | 階層構造データ分析方法、分析装置および分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051118 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20051118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080415 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080722 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080804 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110822 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110822 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120822 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130822 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |