JP4936295B2

JP4936295B2 - コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法

Info

Publication number: JP4936295B2
Application number: JP2009168195A
Authority: JP
Inventors: 大介佐藤; 真耶川中; 正明小林
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2009-07-16
Filing date: 2009-07-16
Publication date: 2012-05-23
Anticipated expiration: 2029-07-16
Also published as: US20110016359A1; US8543908B2; JP2011022864A

Description

本発明は、情報処理技術に関係し、より詳しくは、ウェブ・サイト中のアクセシビリティに関する欠陥を修正するメタデータを作成・拡張・検証する際にユーザを支援する方法に係る。

ウェブ・サイトは視覚障害者等にも容易に利用されるようにアクセシビリティに配慮されている必要があり、幾つかの国や国際機関において公的な基準が示されている。従来、アクセシビリティの低いウェブページのアクセシビリティを向上するためにはページそのものを修正する必要があったが、ブラウザ上で閲覧中のページのDOMを外部メタデータ（以降単にメタデータとする）によって動的に修正することで、アクセシビリティを向上するためのコストを大幅に削減できることが知られている。このメタデータは一般に、メタデータを適用するコンテンツのURLをあらわすパターンを正規表現を用いて表現することによって複数のページで利用可能にする。その結果、メタデータの適用範囲を拡張し、作成すべきメタデータの数を減らすことができる、あるいは新しいページが追加されたときに既に存在するメタデータが適用可能であればそれを用いて新たなメタデータを作成することなくアクセシビリティを向上させることができる。

一般に、ウェブ・サイトに対してメタデータを作成し、運用する場合、次の手順で行われる。（１）ウェブ・サイトをクロールする。（２）取得したページのDOMを分析する。（３）その結果を見てメタデータ作成者が任意のページにメタデータを作成する。（４）そのメタデータをツールの支援によって複数のページで適用可能になるように拡張する。（５）最終的にメタデータが適用された状態の各ページのアクセシビリティを検証する。（６）実際に視覚障害者にメタデータの配信を行う。このメタデータ作成・拡張を支援する先行技術を開示するものとして特許文献１，特許文献２がある。特許文献１はページのレイアウトを解析して類似したレイアウトのページに対応するURLの正規表現を生成することで、メタデータの適用範囲を自動的に生成することができる。また特許文献２は、どのページに作成されたどのメタデータが適用されるかを一覧できるＵＩを用いて、メタデータの適用範囲を確認・編集することを支援することが可能である。

特開２００３−８５０８７号公報特開２００４−１４５９４号公報

しかし、従来の技術では（３）、（４）、（５）のそれぞれのステップにおいて以下のような課題があった。すなわち、ステップ（３）において、メタデータ作成者は任意にメタデータを作成するページを選ぶが、複数人で同時にメタデータを作成する場合には、（４）において各メタデータの適用範囲が重なってしまい、サイト全体として重複するメタデータが作られてしまうなど、メタデータの作成が非効率になってしまうことがある。また、ステップ（４）において、特許文献１の技術によってレイアウトが似たページに対してメタデータを拡張することができ、特許文献２のユーザーインタフェースによって各メタデータがどのページに適用されているかを一覧することができた。しかし、これらの技術では拡張した個々のメタデータが意図したとおりに適用されるかまでは考慮しない。従って不適切なメタデータの適用の可能性が高いなどの情報がメタデータ作成者に分からない。さらに、ステップ（５）において、従来の技術では作成したメタデータを適用したページのアクセシビリティが実際に向上したかどうかの検証については考慮されていない。全てのページを検証することは現実的でないためいくつかのページを選んで検証を行うことになるが、検証者が任意のページを選択して検証した場合、検証していないメタデータが存在する、メタデータが誤って適用されている可能性が高いページの検証がされない場合があるなど、効率的にメタデータの有効性を検証することができない。

本発明は、このような技術的な課題を解決するためになされたものであり、その目的の一つは、ページ間の構造・スタイル（見た目）・アクセシビリティ上のエラー、それぞれの類似度に基づいて、メタデータを作成、検証するという観点におけるページ間の類似度を推定し、それを基にして効率良くメタデータをつけるために適切な代表となるページを推薦、あるいは効率よくメタデータを検証するために適切な対象となるページを推薦することができる方法を提供することにある。

本発明は、上記課題を解決するために、次のような構成を採用することができる。すなわち、より修正効果の高い欠陥を選択するために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムにより実行され、構造化文章に含まれる複数の欠陥の修正を支援する方法であり、前記複数の欠陥のそれぞれの欠陥度を演算するステップと、
前記複数の欠陥のそれぞれの類似度を演算するステップと、前記欠陥度と前記類似度とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度を演算するステップと、前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するステップと、を備える方法を採用することができる。

また、より適切な修正の拡張を行うために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムにより実行され、構造化文章に含まれる複数の欠陥の修正を支援する方法であり、ある欠陥に対する修正の入力を受け付けるステップと、前記ある欠陥と残りの欠陥との類似度を演算するステップと、前記類似度に基づいて、前記修正が残りの欠陥に対して適用可能か否かの程度を示す確信度を演算するステップと、前記確信度が閾値以上の欠陥について前記修正を修正候補として選択するステップとを備える方法を採用することもできる。

さらに、より検証効果の高い修正を選択するために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムにより実行され、構造化文章に含まれる複数の修正の検証を支援する方法であり、前記複数の修正のそれぞれ検証された程度を示す検証度を演算するステップと、前記複数の修正の類似度を演算するステップと、前記類似度に基づいて、ある修正の検証が残りの修正の検証に影響する程度を示す検証貢献度を演算するステップと、前記検証貢献度のより高い修正をより優先度の高い修正として選択するステップと、を備える方法を採用することができる。

以上、本発明の概要を、コンピュータ・システムにより実行される方法として説明したが、本発明は、コンピュータ・システム、プログラム、またはプログラム製品として把握することもできる。プログラム製品は、前述のプログラムを格納した記憶媒体を含め、あるいはプログラムを伝送する媒体を含めることができる。

例えば、本発明を、より修正効果の高い欠陥を選択するために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムであり、前記演算制御手段は、前記複数の欠陥のそれぞれの欠陥度を演算し、前記複数の欠陥のそれぞれの類似度を演算し、前記欠陥度と前記類似度とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度を演算し、前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するコンピュータ・システムとして把握することもできる。また、同様に、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムに、前記複数の欠陥のそれぞれの欠陥度を演算するステップと、前記複数の欠陥のそれぞれの類似度を演算するステップと、前記欠陥度と前記類似度とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度を演算するステップと、前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するステップとを実行させるコンピュータ・プログラムとして把握することもできる。

上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの構成要素のコンビネーションまたはサブコンビネーションもまた、発明となり得ることに留意すべきである。

ネットワークシステム（ソーシャル・アクセシビリティ・システム）の一実施態様及びそのシナリオを説明する概念図アクセシビリティ・サーバ１を実現するのに好適な情報処理装置（コンピュータ）のハードウェア構成の一例を示した図アクセシビリティ・サーバ１のソフトウェア機能の一部を説明する機能ブロック図アクセシビリティ・サーバ１が持つデータの一部を説明する図各ユーザ端末２Ａ乃至Ｃのソフトウェア機能の一部を説明する機能ブロック図メタデータを作成・拡張・検証するのをアクセシビリティ・サーバ１が支援する行程を説明する基本的なフローチャート修正ページを推薦する行程をより詳細に説明するフローチャートメタデータを拡張する行程をより詳細に説明するフローチャート検証ページを推薦する行程をより詳細に説明するフローチャート具体的なssim(s, s’)の演算例を示す図具体的なpsim(d, d’)の演算例を示す図図１２は、修正貢献度を計算し、修正候補を選ぶ例を示す図メタデータ拡張の検証・編集ツールの例を示す図メタデータ拡張の検証・編集ツールの他の例を示す図

以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて（特段の断りのない限り）同じ要素には同じ番号を付している。

図１は、本発明が適用されるコンピュータを含むネットワークシステム（ソーシャル・アクセシビリティ・システム）の一実施態様及びそのシナリオを説明する概念図である。
ソーシャル・アクセシビリティ・システムの構成を説明する。本システムは、アクセシビリティ・サーバ（コンピュータ・システム）１、メタデータ作成者Ｕ（Ａ）が使用するユーザ端末２Ａ、メタデータ検証者Ｕ（Ｂ）が使用するユーザ端末２Ｂ，メタデータ利用者（視覚障害者）Ｕ（Ｃ）が使用するユーザ端末２Ｃを備える。また、またその前提として通常のウェブ・サーバ３が存在する。これらはインターネットを介して互いに通信可能に接続されている。

図２は、アクセシビリティ・サーバ１を実現するのに好適な情報処理装置（コンピュータ）のハードウェア構成の一例を示した図である。情報処理装置は、バス４０に接続されたメインＣＰＵ（中央処理装置：演算処理手段）４１とメインメモリ（記憶手段）４２を含んでいる。ハードディスク装置（記憶手段）４４の他、図示しないがＣＤ−ＲＯＭ装置、フレキシブル・ディスク装置、ＭＯ装置、ＤＶＤ装置のようなリムーバブル・ストレージ（記録メディアを交換可能な外部記憶システム）がフロッピーディスクコントローラ、ＩＤＥコントローラ、ＳＣＳＩコントローラなどを経由してバス４０へ接続されている。

フレキシブル・ディスク、ＭＯ、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭのような記憶メディアが、リムーバブル・ストレージに挿入される。これらの記憶メディアやハードディスク装置４４、ＲＯＭ４３には、オペレーティング・システムと協働してＣＰＵ等に命令を与え、本発明を実施するためのコンピュータ・プログラムのコードを記録することができる。メインメモリ４２にロードされることによってコンピュータ・プログラムは実行される。コンピュータ・プログラムは圧縮し、また複数に分割して複数の媒体に記録することもできる。

情報処理装置は、キーボード／マウス・コントローラ４６を経由して、キーボード４９やマウス４７のような入力デバイス（入出力手段）からの入力を受ける。情報処理装置は、視覚データをユーザに提示するための表示装置（入出力手段）４８にＤＡＣ／ＬＣＤＣを経由して接続される。

情報処理装置は、ネットワーク・アダプタ（通信手段）４５（イーサネット（商標）・カードやトークンリング・カード）等を介してネットワークに接続し、他のコンピュータ等と通信を行うことが可能である。図示はされていないが、パラレルポートを介してプリンタと接続することや、シリアルポートを介してモデムを接続することも可能である。

図３は、アクセシビリティ・サーバ１のソフトウェア機能の一部を説明する機能ブロック図である。アクセシビリティ・サーバ１は、基本的な機能を提供するオペレーション・システム１０と、ウェブ・ブラウザ１１と、ウェブ・サーバ２の情報をクロールするクローラ１２と、アクセシビリティ・スコア計算モジュール１３と、効果予測類似度計算モジュール１４と、効果検証類似度計算モジュール１５と、修正ページレコメンダ１６と、メタデータ拡張レコメンダ１７と、検証ページレコメンダ１８とを備える。なお、これらの各コンポーネントの機能分担は任意であり、複数機能を単一コンポーネントに統一してもよいし、単一機能を複数コンポーネントに分割してもよい。また、図３の機能ブロック図に示す各要素は、図２を用いて説明したハードウェア構成を有する情報処理装置において、ハードディスク装置４４などに格納されたオペレーティング・システム、ミドルウェア、アプリケーション・プログラムなどのコンピュータ・プログラムをメインメモリ４２にロードした上でメインＣＰＵ４１に読み込ませ、ハードウェア資源とソフトウェアを協働させることによって実現することができる。

図４は、アクセシビリティ・サーバ１が持つデータの一部を説明するものである。アクセシビリティ・サーバ１は、ＤＯＭデータ・サーバ１９Ａ及びメタデータ・サーバ１９Ｂを備え、それぞれ例示するようなＤＯＭデータ及びメタデータ（修正）を記憶している。ここで、メタデータは、heading付加や代替テキスト付加などのアクセシビリティ上のエラー（欠陥）をどう修正するかの種類に加えて、どのＤＯＭに適用するのかを表すＵＲＩパターンと、そのＤＯＭ中のどの要素に適用するのかを表すポインタを持つ。ＵＲＩパターンはワイルドカードを含むＵＲＩもしくは正規表現などであらわされる、ポインタはＸＰａｔｈや画像を指し示すためのＵＲＩ(ワイルドカードもしくは正規表現も含む)などによってあらわされる。以下に、その例を示す。
例１種類： heading 付加
URI パターン： http://www.example.com/*
XPath： /HTML/BODY/DIV[2]/DIV[1]
例２種類：代替テキストを空に
URI パターン： http://www.example.net/*
画像URI： http://www.example.net/images/*.jpg

また、アクセシビリティ上のエラー（欠陥）とは、例えば、代替テキストが無い等、視覚障害者等が聴覚によってウェブ・コンテンツにアクセスする際に妨げとなるようなエラーであり、一般に、各ページに複数のエラーが検出される。各エラーには予め点数が決められており、エラーが検出されるとアクセシビリティ・スコア（欠陥度）から減点される。エラーにはDOM上の位置(XPath)が特定されるエラーと、特定されないエラーがあり、前者は1つのエラー項目に対してDOMに複数含まれる可能性があるが、後者はそれぞれのエラー項目について複数含まれることはない。また2つのエラーが同一であるとは、エラーの種類が一致し、DOM上の位置が特定できる場合にはそれも一致することである。

図５は、各ユーザ端末２Ａ乃至Ｃのソフトウェア機能の一部を説明する機能ブロック図である。各ユーザ端末２Ａ乃至Ｃは、基本的な機能を提供するオペレーション・システム２０Ａ乃至Ｃと、ウェブ・ブラウザ２１Ａ乃至Ｃとを共通に備えている。この他、メタデータ作成者Ｕ（Ａ）が使用するユーザ端末２Ａには、メタデータ編集ツール２２Ａとメタデータ拡張の検証・編集ツール２３Ａを備える。また、メタデータ検証者Ｕ（Ｂ）が使用するユーザ端末２Ｂには、メタデータ検証ツール２２Ｂを備える。さらに，メタデータ利用者Ｕ（Ｃ）が使用するユーザ端末２Ｃには、スクリーンリーダ２２Ｃを備える。なお、これらの各コンポーネントの機能分担は任意であり、複数機能を単一コンポーネントに統一してもよいし、単一機能を複数コンポーネントに分割してもよい。また、本実施形態では、ユーザ端末２はノート型パーソナル・コンピュータを想定して説明したが、ユーザ端末２は、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）、デスクトップ型パーソナル・コンピュータ、スマートフォンなど、様々なタイプの情報処理装置を採用することができる。一例として、ユーザ端末２がノート型あるいはデスクトップ型パーソナル・コンピュータの場合は、ＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓ（商標）のようなオペレーティング・システム、ＩｎｔｅｒｎｅｔＥｘｐｌｏｒｅｒ（商標）、Ｆｉｒｅｆｏｘ（商標）のような標準的なウェブ・ブラウザが導入され得る。

図６は、メタデータを作成・拡張・検証するのをアクセシビリティ・サーバ１が支援する行程を説明する基本的なフローチャートである。また、図７、図８、図９は、それぞれ修正ページを推薦する行程（Ｓ２１）、メタデータを拡張する行程（Ｓ２３）、検証ページを推薦する行程（Ｓ３２）をより詳細に説明するフローチャートである。以下、これらのチャートに従って、アクセシビリティ・サーバ１の各種支援機能を説明する。

ここで、関数の値域と名前、意味を定義しておく。ssim, psimに関しては、後述する。DOMの類似度には、既存技術である編集距離を使った類似度や、特許文献１の技術でレイアウトごとに分類するために計算しているレイアウト距離等の類似度を正規化した値を用いることができる。
DOM dとd’の類似度： 0≦dsim(d, d’)≦1
DOM dのアクセシビリティスコア： 0≦as(d)≦1
DOM dのエラースコア： es(d) = 1-as(d)
DOM dにおいてメタデータmが適用される要素集合： elems(d, m)
DOM dにおいてエラー（問題）pで特定される要素集合： elems(d, p)
要素集合Eに定義されたスタイル（見た目）とその回数： style(E)
スタイル（見た目）sとs’の類似度； 0≦ssim(s, s’)≦1
DOM dとd’における問題点の類似度： 0≦psim(d, d’)≦1

まず、対象となるウェブ・サイトを決定する（Ｓ１０）。例えば、メタデータ利用者Ｕ（Ｃ）からのリクエストを受けて、サイトを決定してもよい。次に、クローラ１２が対象のウェブ・サーバ３にアクセスし、そのＤＯＭ情報をＤＯＭデータ・サーバ１９Ａに保存する（Ｓ１１）。次に、アクセシビリティ・スコア計算モジュール１３が保存されたＤＯＭデータのコピーにメタデータ・サーバ１９Ｂに保存されているメタデータを適用し、そのサイトのアクセシビリティ・スコアを演算する（Ｓ１２）。そのスコアが予め設定された閾値に至らない場合には、修正ページレコメンダ１６が効果予測類似度を用いて、メタデータを作成すべきページ上位Ｎ個をメタデータ作成者Ｕ（Ａ）が使用するユーザ端末２Ａに提示し、推薦する（Ｓ２０）。メタデータ作成者Ｕ（Ａ）がメタデータを作成すると（Ｓ２２）、メタデータ拡張レコメンダ１７が自動的にメタデータをサイトワイドに拡張する（Ｓ２３）。次に、検証ページレコメンダ１８が効果検証類似度を用いてメタデータが適用されているページを類似度順に列挙する（Ｓ２４）。メタデータ作成者Ｕ（Ａ）がメタデータ拡張の検証・編集ツール２３Ａを用いてメタデータ拡張が適否を検証し（Ｓ２５）、適切なメタデータをメタデータ・サーバ１９Ｂに登録する（Ｓ２６）。

一方、アクセシビリティ・スコアが予め設定された閾値以上の場合には、さらに全てのページの検証度が閾値以上になるように（Ｓ３０）、検証ページレコメンダ１８が効果検証用類似度を用いて検証すべきページ上位Ｎ個をメタデータ検証者Ｕ（Ｂ）が使用するユーザ端末２Ｂに提示し、推薦する（Ｓ３２）。メタデータ検証者Ｕ（Ｂ）がメタデータ検証ツールを用いてメタデータを検証し（Ｓ３３）、その検証がＯＫの場合には、ページの検証度を更新し（Ｓ３５）、そうでない場合には、エラーと登録する（Ｓ３６）。

以下、各モジュールの機能を説明する。

アクセシビリティ・スコア計算モジュール１３が演算するスコアは 0 ~ 1 の実数値を取るものとし、1 を満点とする。メタデータが作成されている場合はそのメタデータが適用された状態のコンテンツに対してアクセシビリティ・スコアを計算する。スコアは検出されたエラーの点数を減点することで求める。エラーの点数はエラーの深刻さなどに応じて予め決定する。例えば、代替テキストが無いエラーは0.01点などのように決定しておくことができる。メタデータ・サーバー１９Ｂに新たにメタデータが蓄積される度に、アクセシビリティ・スコア計算モジュール１３は各コンテンツのアクセシビリティ・スコアを再計算することもできるし、計算量を減らすために、この計算は必要になるまで遅延してもよい。

効果予測類似度計算モジュール１４は、DOM d と d’ の間で、DOM d のエラーを修正した場合に d’ のエラーがどの程度修正されるかを表す値を計算する。dのエラー点を完全に修正したときに、dとd’のエラー点が一致していればd’のエラーも完全に修正されると考えられ、dとd’のエラー点が半分似ていればd’のエラーは半分修正されると考えられる。つまりDOMdとd’のエラー点の類似度psim(d, d’)を計算する。ここで、P(d)をDOM dのエラーの集合、s(p)をエラーpによるスコアの減点分とし、k(d,d’,p)をpのエラーが、DOM dとd’上でどれだけ似ているかを示す類似度とするとpsim(d, d’)は式（２）により計算することができる。これは、dとd’の全エラーに対して、エラーがどれだけ似ているかを示す数値であり、全て同じであれば1となり、全て異なれば0となる。分母は全エラーのスコアの合計で、分子はエラー同士の類似度を乗じた共通のエラーのスコアの合計である。

エラーの類似度k(d,d’,p)はエラーpの種類によって次の様に計算する。エラーpがDOM上の位置を特定する場合、例えば、代替テキストの欠如、不適切な代替テキスト、ページ内リンクが壊れている場合には、同じ位置に検出されたエラーの類似度を、スタイル（見た目）の類似度で推定する。すなわち、k(d,d’,p) = ssim(elems(d,p),elems(d’,p))とすることができる。一方、エラーpがDOM上の位置を特定しない場合、例えば、見出しがないなどの場合には、エラーの類似度をDOMの類似度をもって推定する。すなわち、k(d,d’,p) = dsim(d,d’)とすることができる。

ここでスタイル（見た目）の類似度ssim(s, s’)は式（４）に示した数式で定義される。s= style(E)は、要素集合Eにおけるスタイル（見た目）の属性pと値vの関数となっており、s(p, v)は属性pに対して値vが現れた回数を表す。スタイル（見た目）の情報にはCSSによるスタイルのほか、要素のサイズや、使われている画像のURLなどの情報を含むことができる。Wpは属性pのスタイルの類似度への影響度を示しており、例えばフォントサイズの重みを高くしたりしても良い。ssim(s, s’)は、スタイルsとs’に含まれる属性pがどれだけ似ているかを示す数値であり、全て同じであれば1となり、全て異なれば0となる。具体的なssim(s, s’)の演算例を図１０に、psim(d, d’)の演算例を図１１に示す。

効果検証類似度計算モジュール１５は、あるページ d に適用可能なメタデータ mを検証した場合に、その検証を以てその他のページ d’でどの程度検証できたとみなせるかを表す値conf(m,d, d’)を式（６）により計算する。この値はあるページdに対して作成されたメタデータmを自動的にサイトワイドに拡張した場合に、その他のページd’でどの程度の信頼度で流用できるかを示す値と見ることもできる。ここではあるDOMdでメタデータmが検証された場合に、dに類似したDOMおよび類似した見た目の要素においてメタデータmはある確信度で検証できるとみなしている。m が d’ に適用できない場合、conf(m, d, d’) = 0 である。式（６）は、メタデータが適用される要素のスタイル（見た目）の類似度とDOMの類似度の積で表される。

以下、修正ページの推薦（Ｓ２１）、メタデータの拡張（Ｓ２３）、検証ページの推薦（Ｓ３２）についてより詳細に説明する。

修正ページの推薦
修正ページレコメンダ１６は、効果予測類似度計算モジュール１４の出力結果に基づいて、最も効果的な修正が行えると推定されるDOMの候補を順番に列挙する。修正ページレコメンダ１５は、DOM d に関して、修正貢献度 cont(d) を式（１）により計算する。図７は、修正ページレコメンダ１６が修正候補をN個選択するフローである。まず修正候補のDOMの集合Sが空からはじめる（Ｓ２１０）。次に、各DOMについて修正貢献度を計算する（Ｓ２１１）。次に、修正貢献度が最も大きくなるようなDOMdmaxを修正候補Sに追加する（Ｓ２１２）。次に、dmaxが修正されたと仮定したときのそのほかの DOM dk のアクセシビリティスコア as(dk) にdmaxの修正によるdkの修正度合いを加算する（Ｓ２１３）。ここで、修正度合い＝psim(dmax, dk)*es(dk)として計算される。

ここで、アクセシビリティ・スコアas(d) （エラースコアes(d)=1-as(d)）、を更新したことにより、修正候補Sに追加したdmaxに類似したDOMはアクセシビリティ・スコアが高くなるため、次に選択されるDOMは最初に選択されたDOMとは類似していないDOMが選択されることになる。これを集合SのサイズがNになるまで繰り返す。繰り返しの途中に全てのエラースコアが一定よりも小さくなるか、全てのDOMがSに追加されたらその時点で終了する。なお、計算された修正候補のページは、メタデータ作成者がページのURLやタイトル、サムネイル等が含まれるリスト表示で閲覧することができる。

図１２は、修正貢献度を計算し、修正候補を選ぶ例を示すものである。ページa〜eの5ページがあり、その問題点の類似度psimがそれぞれ図示のように計算されたとする。なお、類似度は対象性を持つ。また、初期状態でのエラースコア及び修正貢献度condは図示のように計算される。ここで、ページaが修正候補Sに追加され、ページaの問題が全て修正されたと仮定して、エラースコア及び修正貢献度を更新すると図示のように計算される。その結果、ページcが次の修正候補Sに追加される。

メタデータの拡張
メタデータ拡張レコメンダ１７は、効果検証類似度計算モジュール１５が計算した値を基に、あるページに対して作成されたメタデータを他のページにも適用できるかどうかを計算し、メタデータが拡張できる場所（要素・ページ）を推測する。推測された要素やページはメタデータ編集のためのインタフェースを通してメタデータ作成者Ｕ（Ａ）が使用するユーザ端末２Ａに提示することができる。また、ここで推測された拡張をメタデータ作成者Ｕ（Ａ）に提示せずに自動的に拡張を適用し、検証ページレコメンダーを使ってメタデータ作成者Ｕ（Ａ）が後から拡張結果を検証することもできる。

図８は、メタデータ拡張レコメンダ１７がメタデータの拡張を行うフローであり、図８（ａ）はあるページ内におけるメタデータの拡張を、図８（ｂ）はページ間におけるメタデータの拡張をそれぞれ示している。すなわち、ページ内におけるメタデータの拡張は次のように行う。メタデータ作成者Ｕ（Ａ）がメタデータを作成したことに応答して（Ｓ２３０）、あるページ内で同じデータを持つメタデータを選択する（Ｓ２３１）。次に、複数のメタデータのXPathを一般化し類推される要素を選択する（Ｓ２３２）。更に、選択された要素について、効果検証類似度及び予め設定しておいた閾値を用いてさらに要素を絞り込む（Ｓ２３３）。また、ページ間におけるメタデータの拡張は次のように行う、メタデータ作成者Ｕ（Ａ）がメタデータを作成したことに応答して（Ｓ２３５）、あるメタデータのXPathについて他のページでも評価できるページを選択する（Ｓ２３６）。次に、選択されたページでメタデータが適用される要素を選択する（Ｓ２３７）。更に、選択された要素について効果検証類似度及び予め設定しておいた閾値を用いて要素を絞り込む（Ｓ２３８）。

図１３にメタデータの拡張をメタデータ作成者Ｕ（Ａ）に提示するメタデータ拡張の検証・編集ツール２３Ａの例を示す。ここではページ間の拡張を行っている。メタデータ作成者はまずページＡにメタデータ（ここでは例えば、「ｈ２」と表示される）を作成する。システムはそのメタデータから推測し、別のページＢにおいて候補（斜線部分の複数の「ｈ３」で示される）を表示する。メタデータ作成者Ｕ（Ａ）はその候補による拡張を有効化すること（斜線部分が白地部分となることで、候補が有効化されたことを示す）、Ａ、Ｂの他類似したページにメタデータが拡張される。

検証ページの推薦
検証ページレコメンダ１８は、効果検証類似度計算モジュール１５が計算した値を基に、拡張されたメタデータが正しいかどうかを検証すべきページを列挙してメタデータ検証者Ｕ（Ｂ）が使用するユーザ端末２Ｂに提示する。例えば図１４のように、効果検証類似度が低い順にDOMをソートして表示することで、メタデータ検証者Ｕ（Ｂ）は類似度が低い、つまり、メタデータが不適切に流用されている可能性が高いDOMを簡単に知ることができ、実際にページを表示させてチェックを行うことができる。ここでメタデータ検証者Ｕ（Ｂ）が、該当ページをメタデータの拡張に含めないという操作を行うと、システムはURLのワイルドカードを自動的に修正することができる。

また、あるDOMを検証した場合に、似たようなDOMの検証度を推定し、検証度が高いものは類推的に十分に検証されたとみなすことで、効率的な検証をできるようにする。この計算は検証貢献度を使って行い、修正貢献度と同様に、繰り返し計算を行うことで複数の検証すべきページを算出する。あるDOMdにおいてあるメタデータmがどの程度検証されたかを示す検証度をV(d,m)とし、初期状態では0にしておき、メタデータ検証者Ｕ（Ｂ）が過去に検証したページのメタデータの検証度は全て1である。また、まだ検証されていない度合い、つまり未検証度NV(d,m)は1-V(d,m)と定義する。またDOM d全体に関する検証度合いV(d)は以下のように定義する。V(d)=Sigma{V(d,m)}/N(M(d))。ここで、M(d)をdに適用可能なメタデータ、N(M(d))はM(d)に含まれるメタデータの数とする。またあるDOMdを検証したときの検証貢献度vcond(d)は式（７）のように定義される。

図９は、検証ページレコメンダ１８が検証候補をN個選択するフローである。まず修正候補のDOMの集合Sが空からはじめる（Ｓ３２０）。次に、各DOMについて検証貢献度を計算する（Ｓ３２１）。次に、検証貢献度が最も大きくなるようなDOMdmaxを修正候補Sに追加する（Ｓ３２２）。次に、dmaxに適用されるメタデータmlが検証されたと仮定したときのそのほかの DOM dk に適用されるメタデータの検証度V(dk,ml) にdmaxの修正によるdkのメタデータmｌの検証度合いを加算する（Ｓ３２４）。ここで、検証度合い＝conf(ml,dk,dmax)*NV(dk,ml)である。検証度V(d,m)およびV(d) （未検証度VN(d,m)=1-V(d,m), NV(d)=1-V(d)）、を更新したことにより、検証候補Sに追加したdmaxに類似したDOMは検証度が高くなるため、次に選択されるDOMは最初に選択されたDOMとは類似していないDOMが選択されることになる。これを集合SのサイズがNになるまで繰り返す。繰り返しの途中に全ての検証度が一定よりも大きくなるか、全てのDOMがSに追加されたらその時点で終了する。

以上、本発明を実施するための最良の形態を図面に基づいて詳細に説明した。まとめると、本発明は、ページ間の構造・スタイル（見た目）・アクセシビリティ上のエラー、それぞれの類似度に基づいて、メタデータを作成、検証するという観点におけるページ間の類似度を推定し、それを基にして効率良くメタデータをつけるために適切な代表となるページを推薦、あるいは効率よくメタデータを検証するために適切な対象となるページを推薦することができる方法である。ここで、ページ間の類似度は、メタデータを作成するために行うメタデータ効果予測用の類似度（効果予測類似度）と、メタデータを作成したあとに行う効果検証用（効果検証類似度）の２つに大きく分けられる。

効果予測類似度は、以下の手順で決定する。１．あらかじめサイトのクローリングを行い、ページのDOMを取得する。２．各ページに対してアクセシビリティ上のエラーを列挙し、アクセシビリティを示すスコアを計算する・３，２つのページで、アクセシビリティ上のエラーの類似度、およびページのDOMの構造の類似度を計算し、それを基に効果予測類似度を計算する。この効果予測類似度を基に、あるページに対して作られたメタデータの効果は類似度に応じて伝播すると仮定して、メタデータ作成の効果が高いと推定される上位Ｎページをメタデータ作成者に提示することができる。

一方、効果検証類似度は、以下の手順で決定する。１，作成されたメタデータが適用されるDOMをリストアップする・２，各DOM中でメタデータが適用される要素をリストアップし、スタイル情報を取り出す。３，２つのページで、取り出されたスタイルの類似度およびDOM 上の構造の類似度から、効果検証類似度を決定する。この効果検証類似度を基に、あるページに対して検証されたメタデータの検証度は類似度に応じて伝播すると仮定して、ページの検証の効果が高いと推定される上位Ｎページをページ検証者に提示することができる。また、あるメタデータが適用されているページを類似度順に列挙することで、メタデータが不適切に適用されていないかを検証することができる。

なお、本発明は、方法の他、ハードウェア、ソフトウェア、またはハードウェア及びソフトウェアの組み合わせとして実現可能である。ハードウェアとソフトウェアの組み合わせによる実行において、所定のプログラムを有するデータ処理システムにおける実行が典型的な例として挙げられる。かかる場合、該所定プログラムが該データ処理システムにロードされ実行されることにより、該プログラムは、データ処理システムを制御し、本発明にかかる処理を実行させる。このプログラムは、任意の言語・コード・表記によって表現可能な命令群から構成される。そのような命令群は、システムが特定の機能を直接、または１．他の言語・コード・表記への変換、２．他の媒体への複製、のいずれか一方もしくは双方が行われた後に、実行することを可能にするものである。

もちろん、本発明は、そのようなプログラム自体のみならず、プログラムを記録した媒体もその範囲に含むものである。本発明の機能を実行するためのプログラムは、フレキシブル・ディスク、ＭＯ、ＣＤ−ＲＯＭ、ＤＶＤ、ハードディスク装置、ＲＯＭ、ＭＲＡＭ、ＲＡＭ等の任意のコンピュータ読み取り可能な記録媒体に格納することができる。かかるプログラムは、記録媒体への格納のために、通信回線で接続する他のデータ処理システムからダウンロードしたり、他の記録媒体から複製したりすることができる。また、かかるプログラムは、圧縮し、または複数に分割して、単一または複数の記録媒体に格納することもできる。また、様々な形態で、本発明を実施するプログラム製品を提供することも勿論可能であることにも留意されたい。

１…アクセシビリティ・サーバ、
１１…ウェブ・ブラウザ
１２…クローラ
１３…アクセシビリティ・スコア計算モジュール
１４…効果予測類似度計算モジュール、
１５…効果検証類似度計算モジュール
１６…修正ページレコメンダ
１７…メタデータ拡張レコメンダ
１８…検証ページレコメンダ

Claims

ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、前記演算制御手段を使用して、
前記複数の欠陥のそれぞれの欠陥度es(d’)を演算するステップであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM d’で示されるページのアクセシビリティスコアas(d’))で求められ、当該アクセシビリティスコアas(d’)は0≦as(d’)≦1である、前記演算するステップと、
前記複数の欠陥のそれぞれの類似度psim(d,d’)を演算するステップであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式（２）により演算され、
（式２）

ここで、
P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
s(p)が、ある欠陥pによる欠陥度であり、
k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
前記欠陥度es(d’)を演算するステップと、
前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式（１）により演算するステップであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
（式１）

ここで、Dは、対象とする構造化文章のDOMの集合である、
前記貢献度cont(d)を演算するステップと、
前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するステップと、
前記より優先度の高い欠陥として選択された欠陥が修正されたと仮定し、残りの欠陥のそれぞれの欠陥度を再演算するステップと、
前記再演算された欠陥度と前記類似度とに基づいて、残りの欠陥の貢献度を再演算するステップ（以下、第１の再演算するステップ）と、
前記残りの欠陥のうち前記貢献度のより高い欠陥を次に優先度の高い欠陥として貢献度を再演算するステップ（以下、第２の再演算するステップ）と、
を実行することを含む、前記方法。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、前記演算制御手段を使用して、
前記DOMの欠陥度es(d’)を演算するステップであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM d’で示されるページのアクセシビリティスコアas(d’))で求められ、当該アクセシビリティスコアas(d’)は0≦as(d’)≦1である、前記演算するステップと、
前記複数の欠陥との類似度psim(d,d’)を演算するステップであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式（２）により演算され、
（式２）

ここで、
P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
s(p)が、ある欠陥pによる欠陥度であり、
k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
前記欠陥度es(d’)を演算するステップと、
前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式（１）により演算するステップであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
（式１）

ここで、Dは、対象とする構造化文章のDOMの集合である、
前記貢献度cont(d)を演算するステップと、
前記貢献度のより高いDOMをより優先度の高いDOMとして選択するステップと、
前記より優先度の高いDOMとして選択されたDOMに含まれる欠陥が修正されたと仮定し、残りのDOMのそれぞれの欠陥度を再演算するステップと、
前記再演算された欠陥度と前記類似度とに基づいて、残りのDOMの貢献度を再演算するステップ（以下、第１の再演算するステップ）と、
前記残りのDOMのうち前記貢献度のより高いDOMを次に優先度の高いDOMとして貢献度を再演算するステップ（以下、第２の再演算するステップ）と、
を実行することを含む、前記方法。
前記欠陥度を再演算するステップ、前記第１の再演算するステップ、前記第２の再演算するステップを繰り返すことで、前記複数の欠陥の修正順序を決定する、請求項１又は２に記載の方法。
前記欠陥pがDOM上の位置をXpathから特定可能な欠陥であることを条件に、前記類似度k(d,d’,p)が以下の式（３）により演算され、
（式３）

ここで、
elems(d,p)及びelems(d’,p)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて欠陥pで特定される要素集合であり、
s=s(elems(d,p)) 及びs’=s(elems(d’,p))はそれぞれ、前記要素集合elems(d,p)及びelems(d’,p)のスタイルであり、
ssim(s,s’)は、前記両スタイルの類似する程度を示すスタイル類似度である、
請求項１〜３のいずれか一項に記載の方法。
前記スタイル類似度ssim(s,s’)が以下の式（４）により演算され、
（式４）

ここで、
s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
請求項４に記載の方法。
前記欠陥pがDOM上の位置をXpathから特定不可能な欠陥であることを条件に、前記類似度k(d,d’,p)が以下の式（５）により演算され、
（式５）

ここで、
dsim(d,d’)は、DOMdとDOM d’との類似度である、
請求項１〜５のいずれか一項に記載の方法。
前記欠陥が構造化文章に含まれるページ毎の欠陥である、請求項１〜６のいずれか一項に記載の方法。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、前記演算制御手段を使用して、
ある欠陥に対する修正の入力を受け付けるステップと、
前記ある欠陥と残りの欠陥とのスタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算するステップであって、
スタイル類似度ssim(s,s’)は、要素集合elems(d,m)及び要素集合elems(d’,m)それぞれのスタイルs=s(elems(d,m))及びs’=s(elems(d’,m))の類似度であり、要素集合elems(d,m)及び要素集合elems(d’,m)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて修正mで特定される要素集合であり、
類似度dsim(d,d’)はDOM dで示されるページとDOM d’で示されるページとの類似度であり、
前記スタイル類似度ssim(s,s’)が以下の式（４）により演算され、
（式４）

ここで、
s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算するステップと、
前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)に基づいて、前記修正が残りの欠陥に対して適用可能か否かの程度を示す確信度conf (m,d,d’)を以下の式（６）により演算するステップであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
（式６）

前記確信度conf (m,d,d’)を演算するステップと、
前記確信度conf (m,d,d’)が閾値以上の欠陥について前記修正を修正候補として選択するステップと、
前記選択された修正候補を出力するステップと、
を実行することを含む、前記方法。
前記残りの欠陥が、前記構造化文章に含まれるあるページ内の欠陥、又は、前記構造化文章に含まれるページ群を跨ぐ欠陥である、請求項８に記載の方法。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の修正の検証を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、
前記複数の修正のそれぞれ検証された程度を示す検証度v(d’,m)を演算するステップであって、検証度v(d’,m)は、DOM d’で示されるページに含まれるある修正mが検証された程度を示す検証度であり、且つ初期状態を0とし、過去に検証した上記ページの検証度を1とする範囲にあり、前記検証度v(d’,m)を演算するステップと、
前記複数の修正の確信度conf (m,d,d’)を以下の式（６）により演算するステップであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
（式６）

前記確信度conf (m,d,d’)を演算するステップと、
前記確信度conf (m,d,d’)に基づいて、ある修正の検証が残りの修正の検証に影響する程度を示す検証貢献度vcont (d)を以下の式（７）により演算するステップであって、
（式７）

ここで、
conf (m, d’,d)は、DOMd’で示されるページに含まれるある修正mをDOM dで示されるページの欠陥に対しても適用可能か否かの程度を示す確信度であり、
Dは、対象とする構造化文章のDOMの集合である、
前記検証貢献度vcont (d)を演算するステップと、
前記検証貢献度のより高い修正をより優先度の高い修正として選択するステップと、
前記選択された修正が検証されたと仮定し、残りの修正のそれぞれの検証度v’(d, m)を以下の式（８）により再演算するステップであって、ここで、検証度v’(d, m)は、DOM d’で示されるページに含まれるある修正mが検証されたと仮定し、
（式８）

ここで、
v(d,m)は、DOM dで示されるページに含まれるある修正mが検証された程度を示す検証度である、
前記検証度v’(d, m)を再演算するステップと、
前記再演算された検証度と前記確信度とに基づいて、残りの修正の検証貢献度を再演算するステップと、
前記残りの修正のうち前記検証貢献度のより高い欠陥を次に優先度の高い修正として選択するステップと、
前記選択された修正候補を出力するステップと、
を実行することを含む、前記方法。
前記検証度を再演算するステップ、前記検証貢献度を再演算するステップ、前記検証貢献度のより高い欠陥を次に優先度の高い修正として選択するステップを繰り返すことで、前記複数の修正の検証順序を決定する、請求項１０に記載の方法。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
前記複数の欠陥のそれぞれの欠陥度es(d’)を演算することであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM dで示されるページのアクセシビリティスコアas(d))で求められ、当該アクセシビリティスコアas(d)は0≦as(d)≦1である、前記演算することと、
前記複数の欠陥のそれぞれの類似度psim(d,d’)を演算することであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式（２）により演算され、
（式２）

ここで、
P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
s(p)が、ある欠陥pによる欠陥度であり、
k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
前記欠陥度es(d’)を演算すること、
前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式（１）により演算することであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
（式１）

ここで、Dは、対象とする構造化文章のDOMの集合である、
前記貢献度cont(d)を演算すること、
前記貢献度のより高い欠陥をより優先度の高い欠陥として選択すること、
前記より優先度の高い欠陥として選択された欠陥が修正されたと仮定し、残りの欠陥のそれぞれの欠陥度を再演算すること、
前記再演算された欠陥度と前記類似度とに基づいて、残りの欠陥の貢献度を再演算すること、
前記残りの欠陥のうち前記貢献度のより高い欠陥を次に優先度の高い欠陥として貢献度を再演算すること
を実行する、前記コンピュータ・システム。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
前記DOMの欠陥度es(d’)を演算することであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM d’で示されるページのアクセシビリティスコアas(d’))で求められ、当該アクセシビリティスコアas(d’)は0≦as(d’)≦1である、前記演算することと、
前記複数の欠陥との類似度psim(d,d’)を演算することであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式（２）により演算され、
（式２）

ここで、
P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
s(p)が、ある欠陥pによる欠陥度であり、
k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
前記欠陥度es(d’)を演算することと、
前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式（１）により演算することであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
（式１）

ここで、Dは、対象とする構造化文章のDOMの集合である、
前記貢献度cont(d)を演算することと、
前記貢献度のより高いDOMをより優先度の高いDOMとして選択することと、
前記より優先度の高いDOMとして選択されたDOMに含まれる欠陥が修正されたと仮定し、残りのDOMのそれぞれの欠陥度を再演算することと、
前記再演算された欠陥度と前記類似度とに基づいて、残りのDOMの貢献度を再演算すること（以下、第１の再演算すること）と、
前記残りのDOMのうち前記貢献度のより高いDOMを次に優先度の高いDOMとして貢献度を再演算するステップ（以下、第２の再演算すること）と、
を実行する、前記コンピュータ・システム。
前記演算制御手段が、前記欠陥度を再演算すること、前記第１の再演算すること、前記第２の再演算することを繰り返すことで、前記複数の欠陥の修正順序を決定する、請求項１２又は１３に記載のコンピュータ・システム。
前記欠陥pがDOM上の位置をXpathから特定可能な欠陥であることを条件に、前記類似度k(d,d’,p)が以下の式（３）により演算され、
（式３）

ここで、
elems(d,p)及びelems(d’,p)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて欠陥pで特定される要素集合であり、
s=s(elems(d,p)) 及びs’=s(elems(d’,p))はそれぞれ、前記要素集合elems(d,p)及びelems(d’,p)のスタイルであり、
ssim(s,s’)は、前記両スタイルの類似する程度を示すスタイル類似度である、
請求項１２〜１４のいずれか一項に記載のコンピュータ・システム。
前記スタイル類似度ssim(s,s’)が以下の式（４）により演算され、
（式４）

ここで、
s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
請求項１５に記載のコンピュータ・システム。
前記欠陥pがDOM上の位置をXpathから特定不可能な欠陥であることを条件に、前記類似度k(d,d’,p)が以下の式（５）により演算され、
（式５）

ここで、
dsim(d,d’)は、DOM dとDOM d’との類似度である、
請求項１２〜１６のいずれか一項に記載のコンピュータ・システム。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
ある欠陥に対する修正の入力を受け付けること、
前記ある欠陥と残りの欠陥とのスタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算することであって、
スタイル類似度ssim(s,s’)は、要素集合elems(d,m)及び要素集合elems(d’,m)それぞれのスタイルs=s(elems(d,m))及びs’=s(elems(d’,m))の類似度であり、要素集合elems(d,m)及び要素集合elems(d’,m)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて修正mで特定される要素集合であり、
類似度dsim(d,d’)はDOM dで示されるページとDOM d’で示されるページとの類似度であり、
前記スタイル類似度ssim(s,s’)が以下の式（４）により演算され、
（式４）

ここで、
s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算すること、
前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)に基づいて、前記修正が残りの欠陥に対して適用可能か否かの程度を示す確信度conf (m,d,d’)を以下の式（６）により演算することであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
（式６）

前記確信度conf (m,d,d’)を演算すること、
前記確信度conf (m,d,d’)が閾値以上の欠陥について前記修正を修正候補として選択するステップこと、
前記選択された修正候補を出力すること
を実行する、前記コンピュータ・システム。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の修正の検証を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
前記複数の修正のそれぞれ検証された程度を示す検証度v(d,m)を演算することであって、検証度v(d’,m)は、DOM d’で示されるページに含まれるある修正mが検証された程度を示す検証度であり、且つ初期状態を0とし、過去に検証した上記ページの検証度を1とする範囲にあり、前記検証度v(d’,m)を演算することと、
前記複数の修正の確信度conf (m,d,d’)を以下の式（６）により演算するステップであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
（式６）

前記確信度conf (m,d,d’)を演算すること、
前記確信度conf (m,d,d’)に基づいて、ある修正の検証が残りの修正の検証に影響する程度を示す検証貢献度vcont (d)を以下の式（７）により演算することであって、
（式７）

ここで、
conf (m,d,d’)は、DOM dで示されるページに含まれるある修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度であり、
Dは、対象とする構造化文章のDOMの集合である、
前記検証貢献度vcont (d)を演算すること、
前記検証貢献度のより高い修正をより優先度の高い修正として選択することと、
前記選択された修正が検証されたと仮定し、残りの修正のそれぞれの検証度v’(d, m)を以下の式（８）により再演算することであって、ここで、検証度v’(d, m)は、DOM d’で示されるページに含まれるある修正mが検証されたと仮定し、
（式８）

ここで、
v(d,m)は、DOM dで示されるページに含まれるある修正mが検証された程度を示す検証度である、
前記検証度v’(d, m)を再演算することと、
前記再演算された検証度と前記確信度とに基づいて、残りの修正の検証貢献度を再演算することと、
前記残りの修正のうち前記検証貢献度のより高い欠陥を次に優先度の高い修正として選択することと、
前記選択された修正候補を出力すること
を実行する、前記コンピュータ・システム。
ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・プログラムであって、出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムに、請求項１〜１１のいずれか一項に記載の方法の各ステップを実行させる、前記コンピュータ・プログラム。