JP4936295B2 - コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法 - Google Patents

コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法 Download PDF

Info

Publication number
JP4936295B2
JP4936295B2 JP2009168195A JP2009168195A JP4936295B2 JP 4936295 B2 JP4936295 B2 JP 4936295B2 JP 2009168195 A JP2009168195 A JP 2009168195A JP 2009168195 A JP2009168195 A JP 2009168195A JP 4936295 B2 JP4936295 B2 JP 4936295B2
Authority
JP
Japan
Prior art keywords
dom
defect
degree
similarity
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009168195A
Other languages
English (en)
Other versions
JP2011022864A (ja
Inventor
大介 佐藤
真耶 川中
正明 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2009168195A priority Critical patent/JP4936295B2/ja
Priority to US12/825,317 priority patent/US8543908B2/en
Publication of JP2011022864A publication Critical patent/JP2011022864A/ja
Application granted granted Critical
Publication of JP4936295B2 publication Critical patent/JP4936295B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、情報処理技術に関係し、より詳しくは、ウェブ・サイト中のアクセシビリティに関する欠陥を修正するメタデータを作成・拡張・検証する際にユーザを支援する方法に係る。
ウェブ・サイトは視覚障害者等にも容易に利用されるようにアクセシビリティに配慮されている必要があり、幾つかの国や国際機関において公的な基準が示されている。従来、アクセシビリティの低いウェブページのアクセシビリティを向上するためにはページそのものを修正する必要があったが、ブラウザ上で閲覧中のページのDOMを外部メタデータ(以降単にメタデータとする)によって動的に修正することで、アクセシビリティを向上するためのコストを大幅に削減できることが知られている。このメタデータは一般に、メタデータを適用するコンテンツのURLをあらわすパターンを正規表現を用いて表現することによって複数のページで利用可能にする。その結果、メタデータの適用範囲を拡張し、作成すべきメタデータの数を減らすことができる、あるいは新しいページが追加されたときに既に存在するメタデータが適用可能であればそれを用いて新たなメタデータを作成することなくアクセシビリティを向上させることができる。
一般に、ウェブ・サイトに対してメタデータを作成し、運用する場合、次の手順で行われる。(1)ウェブ・サイトをクロールする。(2)取得したページのDOMを分析する。(3)その結果を見てメタデータ作成者が任意のページにメタデータを作成する。(4)そのメタデータをツールの支援によって複数のページで適用可能になるように拡張する。(5)最終的にメタデータが適用された状態の各ページのアクセシビリティを検証する。(6)実際に視覚障害者にメタデータの配信を行う。このメタデータ作成・拡張を支援する先行技術を開示するものとして特許文献1,特許文献2がある。特許文献1はページのレイアウトを解析して類似したレイアウトのページに対応するURLの正規表現を生成することで、メタデータの適用範囲を自動的に生成することができる。また特許文献2は、どのページに作成されたどのメタデータが適用されるかを一覧できるUIを用いて、メタデータの適用範囲を確認・編集することを支援することが可能である。
特開2003−85087号公報 特開2004−14594号公報
しかし、従来の技術では(3)、(4)、(5)のそれぞれのステップにおいて以下のような課題があった。すなわち、ステップ(3)において、メタデータ作成者は任意にメタデータを作成するページを選ぶが、複数人で同時にメタデータを作成する場合には、(4)において各メタデータの適用範囲が重なってしまい、サイト全体として重複するメタデータが作られてしまうなど、メタデータの作成が非効率になってしまうことがある。また、ステップ(4)において、特許文献1の技術によってレイアウトが似たページに対してメタデータを拡張することができ、特許文献2のユーザーインタフェースによって各メタデータがどのページに適用されているかを一覧することができた。しかし、これらの技術では拡張した個々のメタデータが意図したとおりに適用されるかまでは考慮しない。従って不適切なメタデータの適用の可能性が高いなどの情報がメタデータ作成者に分からない。さらに、ステップ(5)において、従来の技術では作成したメタデータを適用したページのアクセシビリティが実際に向上したかどうかの検証については考慮されていない。全てのページを検証することは現実的でないためいくつかのページを選んで検証を行うことになるが、検証者が任意のページを選択して検証した場合、検証していないメタデータが存在する、メタデータが誤って適用されている可能性が高いページの検証がされない場合があるなど、効率的にメタデータの有効性を検証することができない。
本発明は、このような技術的な課題を解決するためになされたものであり、その目的の一つは、ページ間の構造・スタイル(見た目)・アクセシビリティ上のエラー、それぞれの類似度に基づいて、メタデータを作成、検証するという観点におけるページ間の類似度を推定し、それを基にして効率良くメタデータをつけるために適切な代表となるページを推薦、あるいは効率よくメタデータを検証するために適切な対象となるページを推薦することができる方法を提供することにある。
本発明は、上記課題を解決するために、次のような構成を採用することができる。すなわち、より修正効果の高い欠陥を選択するために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムにより実行され、構造化文章に含まれる複数の欠陥の修正を支援する方法であり、前記複数の欠陥のそれぞれの欠陥度を演算するステップと、
前記複数の欠陥のそれぞれの類似度を演算するステップと、前記欠陥度と前記類似度とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度を演算するステップと、前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するステップと、を備える方法を採用することができる。
また、より適切な修正の拡張を行うために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムにより実行され、構造化文章に含まれる複数の欠陥の修正を支援する方法であり、ある欠陥に対する修正の入力を受け付けるステップと、前記ある欠陥と残りの欠陥との類似度を演算するステップと、前記類似度に基づいて、前記修正が残りの欠陥に対して適用可能か否かの程度を示す確信度を演算するステップと、前記確信度が閾値以上の欠陥について前記修正を修正候補として選択するステップとを備える方法を採用することもできる。
さらに、より検証効果の高い修正を選択するために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムにより実行され、構造化文章に含まれる複数の修正の検証を支援する方法であり、前記複数の修正のそれぞれ検証された程度を示す検証度を演算するステップと、前記複数の修正の類似度を演算するステップと、前記類似度に基づいて、ある修正の検証が残りの修正の検証に影響する程度を示す検証貢献度を演算するステップと、前記検証貢献度のより高い修正をより優先度の高い修正として選択するステップと、を備える方法を採用することができる。
以上、本発明の概要を、コンピュータ・システムにより実行される方法として説明したが、本発明は、コンピュータ・システム、プログラム、またはプログラム製品として把握することもできる。プログラム製品は、前述のプログラムを格納した記憶媒体を含め、あるいはプログラムを伝送する媒体を含めることができる。
例えば、本発明を、より修正効果の高い欠陥を選択するために、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムであり、前記演算制御手段は、前記複数の欠陥のそれぞれの欠陥度を演算し、前記複数の欠陥のそれぞれの類似度を演算し、前記欠陥度と前記類似度とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度を演算し、前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するコンピュータ・システムとして把握することもできる。また、同様に、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムに、前記複数の欠陥のそれぞれの欠陥度を演算するステップと、前記複数の欠陥のそれぞれの類似度を演算するステップと、前記欠陥度と前記類似度とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度を演算するステップと、前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するステップとを実行させるコンピュータ・プログラムとして把握することもできる。
上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの構成要素のコンビネーションまたはサブコンビネーションもまた、発明となり得ることに留意すべきである。
ネットワークシステム(ソーシャル・アクセシビリティ・システム)の一実施態様及びそのシナリオを説明する概念図 アクセシビリティ・サーバ1を実現するのに好適な情報処理装置(コンピュータ)のハードウェア構成の一例を示した図 アクセシビリティ・サーバ1のソフトウェア機能の一部を説明する機能ブロック図 アクセシビリティ・サーバ1が持つデータの一部を説明する図 各ユーザ端末2A乃至Cのソフトウェア機能の一部を説明する機能ブロック図 メタデータを作成・拡張・検証するのをアクセシビリティ・サーバ1が支援する行程を説明する基本的なフローチャート 修正ページを推薦する行程をより詳細に説明するフローチャート メタデータを拡張する行程をより詳細に説明するフローチャート 検証ページを推薦する行程をより詳細に説明するフローチャート 具体的なssim(s, s’)の演算例を示す図 具体的なpsim(d, d’)の演算例を示す図 図12は、修正貢献度を計算し、修正候補を選ぶ例を示す図 メタデータ拡張の検証・編集ツールの例を示す図 メタデータ拡張の検証・編集ツールの他の例を示す図
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
図1は、本発明が適用されるコンピュータを含むネットワークシステム(ソーシャル・アクセシビリティ・システム)の一実施態様及びそのシナリオを説明する概念図である。
ソーシャル・アクセシビリティ・システムの構成を説明する。本システムは、アクセシビリティ・サーバ(コンピュータ・システム)1、メタデータ作成者U(A)が使用するユーザ端末2A、メタデータ検証者U(B)が使用するユーザ端末2B,メタデータ利用者(視覚障害者)U(C)が使用するユーザ端末2Cを備える。また、またその前提として通常のウェブ・サーバ3が存在する。これらはインターネットを介して互いに通信可能に接続されている。
図2は、アクセシビリティ・サーバ1を実現するのに好適な情報処理装置(コンピュータ)のハードウェア構成の一例を示した図である。情報処理装置は、バス40に接続されたメインCPU(中央処理装置:演算処理手段)41とメインメモリ(記憶手段)42を含んでいる。ハードディスク装置(記憶手段)44の他、図示しないがCD−ROM装置、フレキシブル・ディスク装置、MO装置、DVD装置のようなリムーバブル・ストレージ(記録メディアを交換可能な外部記憶システム)がフロッピーディスクコントローラ、IDEコントローラ、SCSIコントローラなどを経由してバス40へ接続されている。
フレキシブル・ディスク、MO、CD−ROM、DVD−ROMのような記憶メディアが、リムーバブル・ストレージに挿入される。これらの記憶メディアやハードディスク装置44、ROM43には、オペレーティング・システムと協働してCPU等に命令を与え、本発明を実施するためのコンピュータ・プログラムのコードを記録することができる。メインメモリ42にロードされることによってコンピュータ・プログラムは実行される。コンピュータ・プログラムは圧縮し、また複数に分割して複数の媒体に記録することもできる。
情報処理装置は、キーボード/マウス・コントローラ46を経由して、キーボード49やマウス47のような入力デバイス(入出力手段)からの入力を受ける。情報処理装置は、視覚データをユーザに提示するための表示装置(入出力手段)48にDAC/LCDCを経由して接続される。
情報処理装置は、ネットワーク・アダプタ(通信手段)45(イーサネット(商標)・カードやトークンリング・カード)等を介してネットワークに接続し、他のコンピュータ等と通信を行うことが可能である。図示はされていないが、パラレルポートを介してプリンタと接続することや、シリアルポートを介してモデムを接続することも可能である。
図3は、アクセシビリティ・サーバ1のソフトウェア機能の一部を説明する機能ブロック図である。アクセシビリティ・サーバ1は、基本的な機能を提供するオペレーション・システム10と、ウェブ・ブラウザ11と、ウェブ・サーバ2の情報をクロールするクローラ12と、アクセシビリティ・スコア計算モジュール13と、効果予測類似度計算モジュール14と、効果検証類似度計算モジュール15と、修正ページレコメンダ16と、メタデータ拡張レコメンダ17と、検証ページレコメンダ18とを備える。なお、これらの各コンポーネントの機能分担は任意であり、複数機能を単一コンポーネントに統一してもよいし、単一機能を複数コンポーネントに分割してもよい。また、図3の機能ブロック図に示す各要素は、図2を用いて説明したハードウェア構成を有する情報処理装置において、ハードディスク装置44などに格納されたオペレーティング・システム、ミドルウェア、アプリケーション・プログラムなどのコンピュータ・プログラムをメインメモリ42にロードした上でメインCPU41に読み込ませ、ハードウェア資源とソフトウェアを協働させることによって実現することができる。
図4は、アクセシビリティ・サーバ1が持つデータの一部を説明するものである。アクセシビリティ・サーバ1は、DOMデータ・サーバ19A及びメタデータ・サーバ19Bを備え、それぞれ例示するようなDOMデータ及びメタデータ(修正)を記憶している。ここで、メタデータは、heading付加や代替テキスト付加などのアクセシビリティ上のエラー(欠陥)をどう修正するかの種類に加えて、どのDOMに適用するのかを表すURIパターンと、そのDOM中のどの要素に適用するのかを表すポインタを持つ。URIパターンはワイルドカードを含むURIもしくは正規表現などであらわされる、ポインタはXPathや画像を指し示すためのURI(ワイルドカードもしくは正規表現も含む)などによってあらわされる。以下に、その例を示す。
例1 種類: heading 付加
URI パターン: http://www.example.com/*
XPath: /HTML/BODY/DIV[2]/DIV[1]
例2 種類: 代替テキストを空に
URI パターン: http://www.example.net/*
画像URI: http://www.example.net/images/*.jpg
また、アクセシビリティ上のエラー(欠陥)とは、例えば、代替テキストが無い等、視覚障害者等が聴覚によってウェブ・コンテンツにアクセスする際に妨げとなるようなエラーであり、一般に、各ページに複数のエラーが検出される。各エラーには予め点数が決められており、エラーが検出されるとアクセシビリティ・スコア(欠陥度)から減点される。エラーにはDOM上の位置(XPath)が特定されるエラーと、特定されないエラーがあり、前者は1つのエラー項目に対してDOMに複数含まれる可能性があるが、後者はそれぞれのエラー項目について複数含まれることはない。また2つのエラーが同一であるとは、エラーの種類が一致し、DOM上の位置が特定できる場合にはそれも一致することである。
図5は、各ユーザ端末2A乃至Cのソフトウェア機能の一部を説明する機能ブロック図である。各ユーザ端末2A乃至Cは、基本的な機能を提供するオペレーション・システム20A乃至Cと、ウェブ・ブラウザ21A乃至Cとを共通に備えている。この他、メタデータ作成者U(A)が使用するユーザ端末2Aには、メタデータ編集ツール22Aとメタデータ拡張の検証・編集ツール23Aを備える。また、メタデータ検証者U(B)が使用するユーザ端末2Bには、メタデータ検証ツール22Bを備える。さらに,メタデータ利用者U(C)が使用するユーザ端末2Cには、スクリーンリーダ22Cを備える。なお、これらの各コンポーネントの機能分担は任意であり、複数機能を単一コンポーネントに統一してもよいし、単一機能を複数コンポーネントに分割してもよい。また、本実施形態では、ユーザ端末2はノート型パーソナル・コンピュータを想定して説明したが、ユーザ端末2は、PDA(Personal Digital Assistant)、デスクトップ型パーソナル・コンピュータ、スマートフォンなど、様々なタイプの情報処理装置を採用することができる。一例として、ユーザ端末2がノート型あるいはデスクトップ型パーソナル・コンピュータの場合は、Microsoft Windows(商標)のようなオペレーティング・システム、Internet Explorer(商標)、Firefox(商標)のような標準的なウェブ・ブラウザが導入され得る。
図6は、メタデータを作成・拡張・検証するのをアクセシビリティ・サーバ1が支援する行程を説明する基本的なフローチャートである。また、図7、図8、図9は、それぞれ修正ページを推薦する行程(S21)、メタデータを拡張する行程(S23)、検証ページを推薦する行程(S32)をより詳細に説明するフローチャートである。以下、これらのチャートに従って、アクセシビリティ・サーバ1の各種支援機能を説明する。
ここで、関数の値域と名前、意味を定義しておく。ssim, psimに関しては、後述する。DOMの類似度には、既存技術である編集距離を使った類似度や、特許文献1の技術でレイアウトごとに分類するために計算しているレイアウト距離等の類似度を正規化した値を用いることができる。
DOM dとd’の類似度: 0≦dsim(d, d’)≦1
DOM dのアクセシビリティスコア: 0≦as(d)≦1
DOM dのエラースコア: es(d) = 1-as(d)
DOM dにおいてメタデータmが適用される要素集合: elems(d, m)
DOM dにおいてエラー(問題)pで特定される要素集合: elems(d, p)
要素集合Eに定義されたスタイル(見た目)とその回数: style(E)
スタイル(見た目)sとs’の類似度; 0≦ssim(s, s’)≦1
DOM dとd’における問題点の類似度: 0≦psim(d, d’)≦1
まず、対象となるウェブ・サイトを決定する(S10)。例えば、メタデータ利用者U(C)からのリクエストを受けて、サイトを決定してもよい。次に、クローラ12が対象のウェブ・サーバ3にアクセスし、そのDOM情報をDOMデータ・サーバ19Aに保存する(S11)。次に、アクセシビリティ・スコア計算モジュール13が保存されたDOMデータのコピーにメタデータ・サーバ19Bに保存されているメタデータを適用し、そのサイトのアクセシビリティ・スコアを演算する(S12)。そのスコアが予め設定された閾値に至らない場合には、修正ページレコメンダ16が効果予測類似度を用いて、メタデータを作成すべきページ上位N個をメタデータ作成者U(A)が使用するユーザ端末2Aに提示し、推薦する(S20)。メタデータ作成者U(A)がメタデータを作成すると(S22)、メタデータ拡張レコメンダ17が自動的にメタデータをサイトワイドに拡張する(S23)。次に、検証ページレコメンダ18が効果検証類似度を用いてメタデータが適用されているページを類似度順に列挙する(S24)。メタデータ作成者U(A)がメタデータ拡張の検証・編集ツール23Aを用いてメタデータ拡張が適否を検証し(S25)、適切なメタデータをメタデータ・サーバ19Bに登録する(S26)。
一方、アクセシビリティ・スコアが予め設定された閾値以上の場合には、さらに全てのページの検証度が閾値以上になるように(S30)、検証ページレコメンダ18が効果検証用類似度を用いて検証すべきページ上位N個をメタデータ検証者U(B)が使用するユーザ端末2Bに提示し、推薦する(S32)。メタデータ検証者U(B)がメタデータ検証ツールを用いてメタデータを検証し(S33)、その検証がOKの場合には、ページの検証度を更新し(S35)、そうでない場合には、エラーと登録する(S36)。
以下、各モジュールの機能を説明する。
アクセシビリティ・スコア計算モジュール13が演算するスコアは 0 ~ 1 の実数値を取るものとし、1 を満点とする。メタデータが作成されている場合はそのメタデータが適用された状態のコンテンツに対してアクセシビリティ・スコアを計算する。スコアは検出されたエラーの点数を減点することで求める。エラーの点数はエラーの深刻さなどに応じて予め決定する。例えば、代替テキストが無いエラーは0.01点などのように決定しておくことができる。メタデータ・サーバー19Bに新たにメタデータが蓄積される度に、アクセシビリティ・スコア計算モジュール13は各コンテンツのアクセシビリティ・スコアを再計算することもできるし、計算量を減らすために、この計算は必要になるまで遅延してもよい。
効果予測類似度計算モジュール14は、DOM d と d’ の間で、DOM d のエラーを修正した場合に d’ のエラーがどの程度修正されるかを表す値を計算する。dのエラー点を完全に修正したときに、dとd’のエラー点が一致していればd’のエラーも完全に修正されると考えられ、dとd’のエラー点が半分似ていればd’のエラーは半分修正されると考えられる。つまりDOMdとd’のエラー点の類似度psim(d, d’)を計算する。ここで、P(d)をDOM dのエラーの集合、s(p)をエラーpによるスコアの減点分とし、k(d,d’,p)をpのエラーが、DOM dとd’上でどれだけ似ているかを示す類似度とするとpsim(d, d’)は式(2)により計算することができる。 これは、dとd’の全エラーに対して、エラーがどれだけ似ているかを示す数値であり、全て同じであれば1となり、全て異なれば0となる。分母は全エラーのスコアの合計で、分子はエラー同士の類似度を乗じた共通のエラーのスコアの合計である。
エラーの類似度k(d,d’,p)はエラーpの種類によって次の様に計算する。エラーpがDOM上の位置を特定する場合、例えば、代替テキストの欠如、不適切な代替テキスト、ページ内リンクが壊れている場合には、同じ位置に検出されたエラーの類似度を、スタイル(見た目)の類似度で推定する。すなわち、k(d,d’,p) = ssim(elems(d,p),elems(d’,p))とすることができる。一方、エラーpがDOM上の位置を特定しない場合、例えば、見出しがないなどの場合には、エラーの類似度をDOMの類似度をもって推定する。すなわち、k(d,d’,p) = dsim(d,d’)とすることができる。
ここでスタイル(見た目)の類似度ssim(s, s’)は式(4)に示した数式で定義される。s= style(E)は、要素集合Eにおけるスタイル(見た目)の属性pと値vの関数となっており、s(p, v)は属性pに対して値vが現れた回数を表す。スタイル(見た目)の情報にはCSSによるスタイルのほか、要素のサイズや、使われている画像のURLなどの情報を含むことができる。Wpは属性pのスタイルの類似度への影響度を示しており、例えばフォントサイズの重みを高くしたりしても良い。ssim(s, s’)は、スタイルsとs’に含まれる属性pがどれだけ似ているかを示す数値であり、全て同じであれば1となり、全て異なれば0となる。具体的なssim(s, s’)の演算例を図10に、psim(d, d’)の演算例を図11に示す。
効果検証類似度計算モジュール15は、あるページ d に適用可能なメタデータ mを検証した場合に、その検証を以てその他のページ d’でどの程度検証できたとみなせるかを表す値conf(m,d, d’)を式(6)により計算する。この値はあるページdに対して作成されたメタデータmを自動的にサイトワイドに拡張した場合に、その他のページd’でどの程度の信頼度で流用できるかを示す値と見ることもできる。ここではあるDOMdでメタデータmが検証された場合に、dに類似したDOMおよび類似した見た目の要素においてメタデータmはある確信度で検証できるとみなしている。m が d’ に適用できない場合、conf(m, d, d’) = 0 である。式(6)は、メタデータが適用される要素のスタイル(見た目)の類似度とDOMの類似度の積で表される。
以下、修正ページの推薦(S21)、メタデータの拡張(S23)、検証ページの推薦(S32)についてより詳細に説明する。
修正ページの推薦
修正ページレコメンダ16は、効果予測類似度計算モジュール14の出力結果に基づいて、最も効果的な修正が行えると推定されるDOMの候補を順番に列挙する。修正ページレコメンダ15は、DOM d に関して、修正貢献度 cont(d) を式(1)により計算する。図7は、修正ページレコメンダ16が修正候補をN個選択するフローである。まず修正候補のDOMの集合Sが空からはじめる(S210)。次に、各DOMについて修正貢献度を計算する(S211)。次に、修正貢献度が最も大きくなるようなDOMdmaxを修正候補Sに追加する(S212)。次に、dmaxが修正されたと仮定したときのそのほかの DOM dk のアクセシビリティスコア as(dk) にdmaxの修正によるdkの修正度合いを加算する(S213)。ここで、修正度合い=psim(dmax, dk)*es(dk)として計算される。
ここで、アクセシビリティ・スコアas(d) (エラースコアes(d)=1-as(d))、を更新したことにより、修正候補Sに追加したdmaxに類似したDOMはアクセシビリティ・スコアが高くなるため、次に選択されるDOMは最初に選択されたDOMとは類似していないDOMが選択されることになる。これを集合SのサイズがNになるまで繰り返す。繰り返しの途中に全てのエラースコアが一定よりも小さくなるか、全てのDOMがSに追加されたらその時点で終了する。なお、計算された修正候補のページは、メタデータ作成者がページのURLやタイトル、サムネイル等が含まれるリスト表示で閲覧することができる。
図12は、修正貢献度を計算し、修正候補を選ぶ例を示すものである。ページa〜eの5ページがあり、その問題点の類似度psimがそれぞれ図示のように計算されたとする。なお、類似度は対象性を持つ。また、初期状態でのエラースコア及び修正貢献度condは図示のように計算される。ここで、ページaが修正候補Sに追加され、ページaの問題が全て修正されたと仮定して、エラースコア及び修正貢献度を更新すると図示のように計算される。その結果、ページcが次の修正候補Sに追加される。
メタデータの拡張
メタデータ拡張レコメンダ17は、効果検証類似度計算モジュール15が計算した値を基に、あるページに対して作成されたメタデータを他のページにも適用できるかどうかを計算し、メタデータが拡張できる場所(要素・ページ)を推測する。推測された要素やページはメタデータ編集のためのインタフェースを通してメタデータ作成者U(A)が使用するユーザ端末2Aに提示することができる。また、ここで推測された拡張をメタデータ作成者U(A)に提示せずに自動的に拡張を適用し、検証ページレコメンダーを使ってメタデータ作成者U(A)が後から拡張結果を検証することもできる。
図8は、メタデータ拡張レコメンダ17がメタデータの拡張を行うフローであり、図8(a)はあるページ内におけるメタデータの拡張を、図8(b)はページ間におけるメタデータの拡張をそれぞれ示している。すなわち、ページ内におけるメタデータの拡張は次のように行う。メタデータ作成者U(A)がメタデータを作成したことに応答して(S230)、あるページ内で同じデータを持つメタデータを選択する(S231)。次に、複数のメタデータのXPathを一般化し類推される要素を選択する(S232)。更に、選択された要素について、効果検証類似度及び予め設定しておいた閾値を用いてさらに要素を絞り込む(S233)。また、ページ間におけるメタデータの拡張は次のように行う、メタデータ作成者U(A)がメタデータを作成したことに応答して(S235)、あるメタデータのXPathについて他のページでも評価できるページを選択する(S236)。次に、選択されたページでメタデータが適用される要素を選択する(S237)。更に、選択された要素について効果検証類似度及び予め設定しておいた閾値を用いて要素を絞り込む(S238)。
図13にメタデータの拡張をメタデータ作成者U(A)に提示するメタデータ拡張の検証・編集ツール23Aの例を示す。ここではページ間の拡張を行っている。メタデータ作成者はまずページAにメタデータ(ここでは例えば、「h2」と表示される)を作成する。システムはそのメタデータから推測し、別のページBにおいて候補(斜線部分の複数の「h3」で示される)を表示する。メタデータ作成者U(A)はその候補による拡張を有効化すること(斜線部分が白地部分となることで、候補が有効化されたことを示す)、A、Bの他類似したページにメタデータが拡張される。
検証ページの推薦
検証ページレコメンダ18は、効果検証類似度計算モジュール15が計算した値を基に、拡張されたメタデータが正しいかどうかを検証すべきページを列挙してメタデータ検証者U(B)が使用するユーザ端末2Bに提示する。例えば図14のように、効果検証類似度が低い順にDOMをソートして表示することで、メタデータ検証者U(B)は類似度が低い、つまり、メタデータが不適切に流用されている可能性が高いDOMを簡単に知ることができ、実際にページを表示させてチェックを行うことができる。ここでメタデータ検証者U(B)が、該当ページをメタデータの拡張に含めないという操作を行うと、システムはURLのワイルドカードを自動的に修正することができる。
また、あるDOMを検証した場合に、似たようなDOMの検証度を推定し、検証度が高いものは類推的に十分に検証されたとみなすことで、効率的な検証をできるようにする。この計算は検証貢献度を使って行い、修正貢献度と同様に、繰り返し計算を行うことで複数の検証すべきページを算出する。あるDOMdにおいてあるメタデータmがどの程度検証されたかを示す検証度をV(d,m)とし、初期状態では0にしておき、メタデータ検証者U(B)が過去に検証したページのメタデータの検証度は全て1である。また、まだ検証されていない度合い、つまり未検証度NV(d,m)は1-V(d,m)と定義する。またDOM d全体に関する検証度合いV(d)は以下のように定義する。V(d)=Sigma{V(d,m)}/N(M(d))。ここで、M(d)をdに適用可能なメタデータ、N(M(d))はM(d)に含まれるメタデータの数とする。またあるDOMdを検証したときの検証貢献度vcond(d)は式(7)のように定義される。
図9は、検証ページレコメンダ18が検証候補をN個選択するフローである。まず修正候補のDOMの集合Sが空からはじめる(S320)。次に、各DOMについて検証貢献度を計算する(S321)。次に、検証貢献度が最も大きくなるようなDOMdmaxを修正候補Sに追加する(S322)。次に、dmaxに適用されるメタデータmlが検証されたと仮定したときのそのほかの DOM dk に適用されるメタデータの検証度V(dk,ml) にdmaxの修正によるdkのメタデータmlの検証度合いを加算する(S324)。ここで、検証度合い=conf(ml,dk,dmax)*NV(dk,ml)である。検証度V(d,m)およびV(d) (未検証度VN(d,m)=1-V(d,m), NV(d)=1-V(d))、を更新したことにより、検証候補Sに追加したdmaxに類似したDOMは検証度が高くなるため、次に選択されるDOMは最初に選択されたDOMとは類似していないDOMが選択されることになる。これを集合SのサイズがNになるまで繰り返す。繰り返しの途中に全ての検証度が一定よりも大きくなるか、全てのDOMがSに追加されたらその時点で終了する。
以上、本発明を実施するための最良の形態を図面に基づいて詳細に説明した。まとめると、本発明は、ページ間の構造・スタイル(見た目)・アクセシビリティ上のエラー、それぞれの類似度に基づいて、メタデータを作成、検証するという観点におけるページ間の類似度を推定し、それを基にして効率良くメタデータをつけるために適切な代表となるページを推薦、あるいは効率よくメタデータを検証するために適切な対象となるページを推薦することができる方法である。ここで、ページ間の類似度は、メタデータを作成するために行うメタデータ効果予測用の類似度(効果予測類似度)と、メタデータを作成したあとに行う効果検証用(効果検証類似度)の2つに大きく分けられる。
効果予測類似度は、以下の手順で決定する。1.あらかじめサイトのクローリングを行い、ページのDOMを取得する。2.各ページに対してアクセシビリティ上のエラーを列挙し、アクセシビリティを示すスコアを計算する・3,2つのページで、アクセシビリティ上のエラーの類似度、およびページのDOMの構造の類似度を計算し、それを基に効果予測類似度を計算する。この効果予測類似度を基に、あるページに対して作られたメタデータの効果は類似度に応じて伝播すると仮定して、メタデータ作成の効果が高いと推定される上位Nページをメタデータ作成者に提示することができる。
一方、効果検証類似度は、以下の手順で決定する。1,作成されたメタデータが適用されるDOMをリストアップする・2,各DOM中でメタデータが適用される要素をリストアップし、スタイル情報を取り出す。3,2つのページで、取り出されたスタイルの類似度およびDOM 上の構造の類似度から、効果検証類似度を決定する。この効果検証類似度を基に、あるページに対して検証されたメタデータの検証度は類似度に応じて伝播すると仮定して、ページの検証の効果が高いと推定される上位Nページをページ検証者に提示することができる。また、あるメタデータが適用されているページを類似度順に列挙することで、メタデータが不適切に適用されていないかを検証することができる。
なお、本発明は、方法の他、ハードウェア、ソフトウェア、またはハードウェア及びソフトウェアの組み合わせとして実現可能である。ハードウェアとソフトウェアの組み合わせによる実行において、所定のプログラムを有するデータ処理システムにおける実行が典型的な例として挙げられる。かかる場合、該所定プログラムが該データ処理システムにロードされ実行されることにより、該プログラムは、データ処理システムを制御し、本発明にかかる処理を実行させる。このプログラムは、任意の言語・コード・表記によって表現可能な命令群から構成される。そのような命令群は、システムが特定の機能を直接、または1.他の言語・コード・表記への変換、2.他の媒体への複製、のいずれか一方もしくは双方が行われた後に、実行することを可能にするものである。
もちろん、本発明は、そのようなプログラム自体のみならず、プログラムを記録した媒体もその範囲に含むものである。本発明の機能を実行するためのプログラムは、フレキシブル・ディスク、MO、CD−ROM、DVD、ハードディスク装置、ROM、MRAM、RAM等の任意のコンピュータ読み取り可能な記録媒体に格納することができる。かかるプログラムは、記録媒体への格納のために、通信回線で接続する他のデータ処理システムからダウンロードしたり、他の記録媒体から複製したりすることができる。また、かかるプログラムは、圧縮し、または複数に分割して、単一または複数の記録媒体に格納することもできる。また、様々な形態で、本発明を実施するプログラム製品を提供することも勿論可能であることにも留意されたい。
1…アクセシビリティ・サーバ、
11…ウェブ・ブラウザ
12…クローラ
13…アクセシビリティ・スコア計算モジュール
14…効果予測類似度計算モジュール、
15…効果検証類似度計算モジュール
16…修正ページレコメンダ
17…メタデータ拡張レコメンダ
18…検証ページレコメンダ

Claims (20)

  1. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、前記演算制御手段を使用して、
    前記複数の欠陥のそれぞれの欠陥度es(d’)を演算するステップであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM d’で示されるページのアクセシビリティスコアas(d’))で求められ、当該アクセシビリティスコアas(d’)は0≦as(d’)≦1である、前記演算するステップと、
    前記複数の欠陥のそれぞれの類似度psim(d,d’)を演算するステップであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式(2)により演算され、
    (式2)
    Figure 0004936295
    ここで、
    P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
    s(p)が、ある欠陥pによる欠陥度であり、
    k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
    前記欠陥度es(d’)を演算するステップと、
    前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式(1)により演算するステップであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
    (式1)
    Figure 0004936295
    ここで、Dは、対象とする構造化文章のDOMの集合である、
    前記貢献度cont(d)を演算するステップと、
    前記貢献度のより高い欠陥をより優先度の高い欠陥として選択するステップと、
    前記より優先度の高い欠陥として選択された欠陥が修正されたと仮定し、残りの欠陥のそれぞれの欠陥度を再演算するステップと、
    前記再演算された欠陥度と前記類似度とに基づいて、残りの欠陥の貢献度を再演算するステップ(以下、第1の再演算するステップ)と、
    前記残りの欠陥のうち前記貢献度のより高い欠陥を次に優先度の高い欠陥として貢献度を再演算するステップ(以下、第2の再演算するステップ)と、
    実行することを含む、前記方法。
  2. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、前記演算制御手段を使用して、
    前記DOMの欠陥度es(d’)を演算するステップであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM d’で示されるページのアクセシビリティスコアas(d’))で求められ、当該アクセシビリティスコアas(d’)は0≦as(d’)≦1である、前記演算するステップと、
    前記複数の欠陥との類似度psim(d,d’)を演算するステップであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式(2)により演算され、
    (式2)
    Figure 0004936295
    ここで、
    P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
    s(p)が、ある欠陥pによる欠陥度であり、
    k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
    前記欠陥度es(d’)を演算するステップと、
    前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式(1)により演算するステップであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
    (式1)
    Figure 0004936295
    ここで、Dは、対象とする構造化文章のDOMの集合である、
    前記貢献度cont(d)を演算するステップと、
    前記貢献度のより高いDOMをより優先度の高いDOMとして選択するステップと、
    前記より優先度の高いDOMとして選択されたDOMに含まれる欠陥が修正されたと仮定し、残りのDOMのそれぞれの欠陥度を再演算するステップと、
    前記再演算された欠陥度と前記類似度とに基づいて、残りのDOMの貢献度を再演算するステップ(以下、第1の再演算するステップ)と、
    前記残りのDOMのうち前記貢献度のより高いDOMを次に優先度の高いDOMとして貢献度を再演算するステップ(以下、第2の再演算するステップ)と、
    実行することを含む、前記方法。
  3. 前記欠陥度を再演算するステップ、前記第1の再演算するステップ、前記第2の再演算するステップを繰り返すことで、前記複数の欠陥の修正順序を決定する、請求項1又は2に記載の方法。
  4. 前記欠陥pがDOM上の位置をXpathから特定可能な欠陥であることを条件に、前記類似度k(d,d’,p)以下の式(3)により演算され
    (式3)
    Figure 0004936295
    ここで、
    elems(d,p)及びelems(d’,p)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて欠陥pで特定される要素集合であり、
    s=s(elems(d,p)) 及びs’=s(elems(d’,p))はそれぞれ、前記要素集合elems(d,p)及びelems(d’,p)のスタイルであり、
    ssim(s,s’)は、前記両スタイルの類似する程度を示すスタイル類似度である、
    請求項1〜3のいずれか一項に記載の方法。
  5. 前記スタイル類似度ssim(s,s’)以下の式(4)により演算され
    (式4)
    Figure 0004936295
    ここで、
    s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
    Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
    請求項に記載の方法。
  6. 前記欠陥pがDOM上の位置をXpathから特定不可能な欠陥であることを条件に、前記類似度k(d,d’,p)以下の式(5)により演算され
    (式5)
    Figure 0004936295
    ここで、
    dsim(d,d’)は、DOMdとDOM d’との類似度である、
    請求項1〜5のいずれか一項に記載の方法。
  7. 前記欠陥構造化文章に含まれるページ毎の欠陥である、請求項1〜6のいずれか一項に記載の方法。
  8. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、前記演算制御手段を使用して、
    ある欠陥に対する修正の入力を受け付けるステップと、
    前記ある欠陥と残りの欠陥とのスタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算するステップであって、
    スタイル類似度ssim(s,s’)は、要素集合elems(d,m)及び要素集合elems(d’,m)それぞれのスタイルs=s(elems(d,m))及びs’=s(elems(d’,m))の類似度であり、要素集合elems(d,m)及び要素集合elems(d’,m)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて修正mで特定される要素集合であり、
    類似度dsim(d,d’)はDOM dで示されるページとDOM d’で示されるページとの類似度であり、
    前記スタイル類似度ssim(s,s’)が以下の式(4)により演算され、
    (式4)
    Figure 0004936295
    ここで、
    s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
    Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
    前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算するステップと、
    前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)に基づいて、前記修正が残りの欠陥に対して適用可能か否かの程度を示す確信度conf (m,d,d’)を以下の式(6)により演算するステップであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
    (式6)
    Figure 0004936295
    前記確信度conf (m,d,d’)を演算するステップと、
    前記確信度conf (m,d,d’)が閾値以上の欠陥について前記修正を修正候補として選択するステップと
    前記選択された修正候補を出力するステップと、
    実行することを含む、前記方法。
  9. 前記残りの欠陥が、前記構造化文章に含まれるあるページ内の欠陥、又は、前記構造化文章に含まれるページ群を跨ぐ欠陥である、請求項に記載の方法。
  10. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の修正の検証を支援する方法であって、入出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムが、
    前記複数の修正のそれぞれ検証された程度を示す検証度v(d’,m)を演算するステップであって、検証度v(d’,m)は、DOM d’で示されるページに含まれるある修正mが検証された程度を示す検証度であり、且つ初期状態を0とし、過去に検証した上記ページの検証度を1とする範囲にあり、前記検証度v(d’,m)を演算するステップと、
    前記複数の修正の確信度conf (m,d,d’)以下の式(6)により演算するステップであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
    (式6)
    Figure 0004936295
    前記確信度conf (m,d,d’)を演算するステップと、
    前記確信度conf (m,d,d’)に基づいて、ある修正の検証が残りの修正の検証に影響する程度を示す検証貢献度vcont (d)を以下の式(7)により演算するステップであって、
    (式7)
    Figure 0004936295
    ここで、
    conf (m, d’,d)は、DOMd’で示されるページに含まれるある修正mをDOM dで示されるページの欠陥に対しても適用可能か否かの程度を示す確信度であり、
    Dは、対象とする構造化文章のDOMの集合である、
    前記検証貢献度vcont (d)を演算するステップと
    前記検証貢献度のより高い修正をより優先度の高い修正として選択するステップと
    前記選択された修正が検証されたと仮定し、残りの修正のそれぞれの検証度v’(d, m)を以下の式(8)により再演算するステップであって、ここで、検証度v’(d, m)は、DOM d’で示されるページに含まれるある修正mが検証されたと仮定し、
    (式8)
    Figure 0004936295
    ここで、
    v(d,m)は、DOM dで示されるページに含まれるある修正mが検証された程度を示す検証度である、
    前記検証度v’(d, m)を再演算するステップと、
    前記再演算された検証度と前記確信度とに基づいて、残りの修正の検証貢献度を再演算するステップと、
    前記残りの修正のうち前記検証貢献度のより高い欠陥を次に優先度の高い修正として選択するステップと、
    前記選択された修正候補を出力するステップと、
    実行することを含む、前記方法。
  11. 前記検証度を再演算するステップ、前記検証貢献度を再演算するステップ、前記検証貢献度のより高い欠陥を次に優先度の高い修正として選択するステップを繰り返すことで、前記複数の修正の検証順序を決定する、請求項10に記載の方法。
  12. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
    前記複数の欠陥のそれぞれの欠陥度es(d’)を演算することであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM dで示されるページのアクセシビリティスコアas(d))で求められ、当該アクセシビリティスコアas(d)は0≦as(d)≦1である、前記演算することと、
    前記複数の欠陥のそれぞれの類似度psim(d,d’)を演算することであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式(2)により演算され、
    (式2)
    Figure 0004936295
    ここで、
    P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
    s(p)が、ある欠陥pによる欠陥度であり、
    k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
    前記欠陥度es(d’)を演算すること
    前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式(1)により演算することであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
    (式1)
    Figure 0004936295
    ここで、Dは、対象とする構造化文章のDOMの集合である、
    前記貢献度cont(d)を演算すること
    前記貢献度のより高い欠陥をより優先度の高い欠陥として選択すること、
    前記より優先度の高い欠陥として選択された欠陥が修正されたと仮定し、残りの欠陥のそれぞれの欠陥度を再演算すること、
    前記再演算された欠陥度と前記類似度とに基づいて、残りの欠陥の貢献度を再演算すること、
    前記残りの欠陥のうち前記貢献度のより高い欠陥を次に優先度の高い欠陥として貢献度を再演算すること
    を実行する、前記コンピュータ・システム。
  13. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
    前記DOMの欠陥度es(d’)を演算することであって、欠陥度es(d’)はDOM d’で示されるページの欠陥度であり、欠陥度es(d’)は1-(DOM d’で示されるページのアクセシビリティスコアas(d’))で求められ、当該アクセシビリティスコアas(d’)は0≦as(d’)≦1である、前記演算することと、
    前記複数の欠陥との類似度psim(d,d’)を演算することであって、類似度psim(d,d’)は、DOM dで示されるページに含まれる欠陥とDOM d’で示されるページに含まれる欠陥との類似度であり、前記類似度psim(d,d’)が以下の式(2)により演算され、
    (式2)
    Figure 0004936295
    ここで、
    P(d)及びP(d’)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページに含まれる欠陥の集合であり、
    s(p)が、ある欠陥pによる欠陥度であり、
    k(d,d’,p)が、ある欠陥pがDOM dで示されるページとDOMd’で示されるページとでどの程度似ているかを示す類似度である、
    前記欠陥度es(d’)を演算することと、
    前記欠陥度es(d’)と前記類似度psim(d,d’)とに基づいて、それぞれの欠陥の修正が残りの欠陥の修正に影響する程度を示す貢献度cont(d)を以下の式(1)により演算することであって、貢献度cont(d)は、DOM dで示されるページに含まれる欠陥を修正することで、DOM d’で示されるページの欠陥に影響する程度を示す貢献度であり、
    (式1)
    Figure 0004936295
    ここで、Dは、対象とする構造化文章のDOMの集合である、
    前記貢献度cont(d)を演算することと、
    前記貢献度のより高いDOMをより優先度の高いDOMとして選択することと、
    前記より優先度の高いDOMとして選択されたDOMに含まれる欠陥が修正されたと仮定し、残りのDOMのそれぞれの欠陥度を再演算することと、
    前記再演算された欠陥度と前記類似度とに基づいて、残りのDOMの貢献度を再演算すること(以下、第1の再演算すること)と、
    前記残りのDOMのうち前記貢献度のより高いDOMを次に優先度の高いDOMとして貢献度を再演算するステップ(以下、第2の再演算すること)と、
    実行する、前記コンピュータ・システム。
  14. 前記演算制御手段が、前記欠陥度を再演算すること、前記第1の再演算すること、前記第2の再演算することを繰り返すことで、前記複数の欠陥の修正順序を決定する、請求項12又は13に記載のコンピュータ・システム。
  15. 前記欠陥pがDOM上の位置をXpathから特定可能な欠陥であることを条件に、前記類似度k(d,d’,p)が以下の式(3)により演算され、
    (式3)
    Figure 0004936295
    ここで、
    elems(d,p)及びelems(d’,p)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて欠陥pで特定される要素集合であり、
    s=s(elems(d,p)) 及びs’=s(elems(d’,p))はそれぞれ、前記要素集合elems(d,p)及びelems(d’,p)のスタイルであり、
    ssim(s,s’)は、前記両スタイルの類似する程度を示すスタイル類似度である、
    請求項12〜14のいずれか一項に記載のコンピュータ・システム
  16. 前記スタイル類似度ssim(s,s’)が以下の式(4)により演算され、
    (式4)
    Figure 0004936295
    ここで、
    s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
    Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
    請求項15に記載のコンピュータ・システム
  17. 前記欠陥pがDOM上の位置をXpathから特定不可能な欠陥であることを条件に、前記類似度k(d,d’,p)が以下の式(5)により演算され、
    (式5)
    Figure 0004936295
    ここで、
    dsim(d,d’)は、DOM dとDOM d’との類似度である、
    請求項12〜16のいずれか一項に記載のコンピュータ・システム
  18. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
    ある欠陥に対する修正の入力を受け付けること、
    前記ある欠陥と残りの欠陥とのスタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算することであって、
    スタイル類似度ssim(s,s’)は、要素集合elems(d,m)及び要素集合elems(d’,m)それぞれのスタイルs=s(elems(d,m))及びs’=s(elems(d’,m))の類似度であり、要素集合elems(d,m)及び要素集合elems(d’,m)はそれぞれ、DOM dで示されるページ及びDOM d’で示されるページにおいて修正mで特定される要素集合であり、
    類似度dsim(d,d’)はDOM dで示されるページとDOM d’で示されるページとの類似度であり、
    前記スタイル類似度ssim(s,s’)が以下の式(4)により演算され、
    (式4)
    Figure 0004936295
    ここで、
    s(a,v)は、前記スタイルsをスタイルの属性aと値vとの関数であり、
    Waは、属性aのスタイル類似度ssim(s,s’)への影響の程度を示す重みである、
    前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)を演算すること、
    前記スタイル類似度ssim(s,s’)及び類似度dsim(d,d’)に基づいて、前記修正が残りの欠陥に対して適用可能か否かの程度を示す確信度conf (m,d,d’)を以下の式(6)により演算することであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
    (式6)
    Figure 0004936295
    前記確信度conf (m,d,d’)を演算すること、
    前記確信度conf (m,d,d’)が閾値以上の欠陥について前記修正を修正候補として選択するステップこと、
    前記選択された修正候補を出力すること
    実行する、前記コンピュータ・システム
  19. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の修正の検証を支援するコンピュータ・システムであって、前記コンピュータ・システムは入出力手段と演算制御手段と記憶手段とを備えており、前記演算制御手段が、
    前記複数の修正のそれぞれ検証された程度を示す検証度v(d,m)を演算することであって、検証度v(d’,m)は、DOM d’で示されるページに含まれるある修正mが検証された程度を示す検証度であり、且つ初期状態を0とし、過去に検証した上記ページの検証度を1とする範囲にあり、前記検証度v(d’,m)を演算することと、
    前記複数の修正の確信度conf (m,d,d’)を以下の式(6)により演算するステップであって、ここで、確信度conf (m,d,d’)は、DOM dで示されるページに含まれる欠陥に対する修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度である、
    (式6)
    Figure 0004936295
    前記確信度conf (m,d,d’)を演算すること、
    前記確信度conf (m,d,d’)に基づいて、ある修正の検証が残りの修正の検証に影響する程度を示す検証貢献度vcont (d)を以下の式(7)により演算することであって、
    (式7)
    Figure 0004936295
    ここで、
    conf (m,d,d’)は、DOM dで示されるページに含まれるある修正mをDOM d’で示されるページの欠陥に対しても適用可能か否かの程度を示す確信度であり、
    Dは、対象とする構造化文章のDOMの集合である、
    前記検証貢献度vcont (d)を演算すること
    前記検証貢献度のより高い修正をより優先度の高い修正として選択することと、
    前記選択された修正が検証されたと仮定し、残りの修正のそれぞれの検証度v’(d, m)を以下の式(8)により再演算することであって、ここで、検証度v’(d, m)は、DOM d’で示されるページに含まれるある修正mが検証されたと仮定し、
    (式8)
    Figure 0004936295
    ここで、
    v(d,m)は、DOM dで示されるページに含まれるある修正mが検証された程度を示す検証度である、
    前記検証度v’(d, m)を再演算することと、
    前記再演算された検証度と前記確信度とに基づいて、残りの修正の検証貢献度を再演算することと、
    前記残りの修正のうち前記検証貢献度のより高い欠陥を次に優先度の高い修正として選択することと、
    前記選択された修正候補を出力すること
    実行する、前記コンピュータ・システム。
  20. ドキュメント・オブジェクト・モデル(以下、DOMともいう)で定義される構造化文章に含まれる複数の欠陥の修正を支援するコンピュータ・プログラムであって、出力手段と演算制御手段と記憶手段とを備えるコンピュータ・システムに、請求項1〜11のいずれか一項に記載の方法の各ステップを実行させる、前記コンピュータ・プログラム。
JP2009168195A 2009-07-16 2009-07-16 コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法 Expired - Fee Related JP4936295B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009168195A JP4936295B2 (ja) 2009-07-16 2009-07-16 コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法
US12/825,317 US8543908B2 (en) 2009-07-16 2010-06-28 Aiding in creating, extending, and verifying accessibility metadata

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009168195A JP4936295B2 (ja) 2009-07-16 2009-07-16 コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法

Publications (2)

Publication Number Publication Date
JP2011022864A JP2011022864A (ja) 2011-02-03
JP4936295B2 true JP4936295B2 (ja) 2012-05-23

Family

ID=43466093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009168195A Expired - Fee Related JP4936295B2 (ja) 2009-07-16 2009-07-16 コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法

Country Status (2)

Country Link
US (1) US8543908B2 (ja)
JP (1) JP4936295B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8296722B2 (en) * 2008-10-06 2012-10-23 International Business Machines Corporation Crawling of object model using transformation graph
US20120254405A1 (en) * 2011-03-31 2012-10-04 Infosys Technologies Limited System and method for benchmarking web accessibility features in websites
US8635518B1 (en) 2011-07-21 2014-01-21 Google Inc. Methods and systems to copy web content selections
JP5756386B2 (ja) 2011-09-30 2015-07-29 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 動的なウェブ・アプリケーションの問題を修正するメタデータの生成・管理の支援方法、装置、およびプログラム
US20170357568A1 (en) * 2016-06-12 2017-12-14 Apple Inc. Device, Method, and Graphical User Interface for Debugging Accessibility Information of an Application
CN106713984A (zh) * 2016-12-20 2017-05-24 广州视源电子科技股份有限公司 频道的排序方法及装置
EP3679491A4 (en) * 2017-09-06 2020-07-15 Siteimprove A/S WEBSITE RATING SYSTEM
US10956658B2 (en) * 2018-06-21 2021-03-23 Adobe Inc. Digital content editing of a document object model (DOM) based on object model comparison

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6714963B1 (en) * 2000-09-29 2004-03-30 International Business Machines Corporation System and method for improving web site accessibility
US20040148568A1 (en) * 2001-06-13 2004-07-29 Springer Timothy Stephen Checker and fixer algorithms for accessibility standards
US20030018668A1 (en) * 2001-07-20 2003-01-23 International Business Machines Corporation Enhanced transcoding of structured documents through use of annotation techniques
JP4351405B2 (ja) 2001-08-29 2009-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション トランスコーディングシステム及びアノテーション管理装置
US8090800B2 (en) * 2002-05-14 2012-01-03 Oracle International Corporation Method and system for automated web page accessibility coding standards analysis
JP2004014594A (ja) 2002-06-04 2004-01-15 Fujitsu Ltd 半導体集積回路設計の自動配線方法及び装置並びに半導体集積回路装置
JP4014160B2 (ja) * 2003-05-30 2007-11-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、プログラム、及び記録媒体
US7657832B1 (en) * 2003-09-18 2010-02-02 Adobe Systems Incorporated Correcting validation errors in structured documents
US7448023B2 (en) * 2005-02-25 2008-11-04 Microsoft Corporation Method and system for verifying rule compliance of an application object
US7689873B1 (en) * 2005-09-19 2010-03-30 Google Inc. Systems and methods for prioritizing error notification
JP2008305356A (ja) * 2007-06-11 2008-12-18 Nippon Telegr & Teleph Corp <Ntt> 見本デザイン提示装置、見本デザイン提示方法及びプログラム
JP2009070079A (ja) * 2007-09-12 2009-04-02 Hitachi Ltd アクセシビリティチェックシミュレーション方法及びシミュレータ
JP5165998B2 (ja) * 2007-11-14 2013-03-21 日本電信電話株式会社 コンテンツ診断装置,コンテンツ診断プログラム
US8331739B1 (en) * 2009-01-21 2012-12-11 Google Inc. Efficient identification and correction of optical character recognition errors through learning in a multi-engine environment

Also Published As

Publication number Publication date
US20110016359A1 (en) 2011-01-20
US8543908B2 (en) 2013-09-24
JP2011022864A (ja) 2011-02-03

Similar Documents

Publication Publication Date Title
JP4936295B2 (ja) コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法
JP5821678B2 (ja) ウェブ・アプリケーションのブラウザに依存しない自動互換性チェックのためのウェブ・サービス
US20040205605A1 (en) Method and system for stylesheet rule creation, combination, and removal
US20130091419A1 (en) Contextual commenting on the web
JP5336748B2 (ja) コンテンツ中のアクセシビリティに関する問題箇所を他人へ効果的に伝達するためのコンピュータ、方法、プログラム
JP2011159284A (ja) ウェブサイトフォントのプレビュー
US20130332812A1 (en) Method and system to generate a process flow diagram
JP6053131B2 (ja) 情報処理装置、情報処理方法、およびプログラム
EP4014110A1 (en) Web element rediscovery system and method
US9880980B2 (en) Document transformation performance via incremental fragment transformations
US8676791B2 (en) Apparatus and methods for providing assistance in detecting mistranslation
WO2023278135A2 (en) Systems and methods for processing data using inference and analytics engines
US20110035433A1 (en) Webpage display method, computer system, and program
JP2020095716A (ja) 作成支援装置および作成支援方法
US20240134920A1 (en) Data shaping system
US20150339786A1 (en) Forensic system, forensic method, and forensic program
US11416526B2 (en) Editing and presenting structured data documents
US9940320B2 (en) Plugin tool for collecting user generated document segmentation feedback
CN115061688B (zh) 一种页面效果展示方法、计算设备及存储介质
JP2006243861A (ja) 履歴作成装置、活動履歴作成方法、及び活動履歴作成プログラム
CN113642739B (zh) 敏感词屏蔽质量评估模型的训练方法及相应的评估方法
US10373006B2 (en) Method and system for extracting alphanumeric content from noisy image data
WO2017199309A1 (ja) 評価プログラム、評価装置および評価方法
JP6402637B2 (ja) 分析プログラム、分析方法及び分析装置
JP6907703B2 (ja) 解析装置、解析方法、および解析プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110711

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110711

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20110711

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120124

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120214

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees