JP2017220179A - コンテンツ処理装置、コンテンツ処理方法及びプログラム - Google Patents
コンテンツ処理装置、コンテンツ処理方法及びプログラム Download PDFInfo
- Publication number
- JP2017220179A JP2017220179A JP2016116599A JP2016116599A JP2017220179A JP 2017220179 A JP2017220179 A JP 2017220179A JP 2016116599 A JP2016116599 A JP 2016116599A JP 2016116599 A JP2016116599 A JP 2016116599A JP 2017220179 A JP2017220179 A JP 2017220179A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character string
- related information
- alternative
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】ウェブページに配置される多様な画像に対応する代替文字列を的確に特定できるようにする。【解決手段】ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部と、代替文字列に関する記述が不備であると検出された要素に対応する画像をウェブページから取得する画像取得部と、複数の画像関連情報出力装置に対して、画像取得部により取得された画像を出力する画像出力部と、画像出力部により出力された画像の入力に応じて複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部と、複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて代替文字列を決定する代替文字列決定部とを備えてコンテンツ処理装置を構成する。【選択図】図5
Description
本発明は、コンテンツ処理装置、コンテンツ処理方法及びプログラムに関する。
インターネット利用のひとつとしてウェブサイトの閲覧が行われている。ウェブサイトを構成するウェブページは、例えばHTML(HyperText Markup Language)ファイルなどの構造化文書、画像などから成り、構造化文書の記述内容に則って再生され、ウェブブラウザ上で表示される。
ここで、ウェブサイトをインターネット上で公開するウェブサイト運用者には、「ウェブアクセシビシリティ」を考慮したウェブページの提供が求められている。「ウェブアクセシビシリティ」とは、「高齢者や障害者など心身の機能に制約のある人でも、年齢的、身体的条件に関わらず、ウェブで提供されている情報にアクセスし利用できること」をいう。
ウェブアクセシビリティが確保されたウェブページをどのように制作するのかについては、W3C(World Wide Web Consortium)やJIS(Japanese Industrial Standards)により、ガイドラインが策定されている。
上記のガイドラインによれば、例えば、高齢者や視覚障害者への配慮として、「すべての非テキストコンテンツには代替テキストを提供して、拡大印刷、点字、音声、シンボル、平易な言葉などのような、ユーザが必要とする形式に変換できるようにする」という指針が示されている。
上記の指針への対応のひとつとして、ウェブページの内容を音声読み上げソフトウェアを用いて読み上げるというものがある。この場合において、ウェブページに配置された画像がどのような内容であるのかについて音声読み上げができるようにするために、構造化文書において、画像を指し示すimgタグの属性altの属性値として、単語や短文等の簡潔な代替テキストを挿入することが行われる。このように構造化文書に代替テキストを挿入することで、挿入された代替テキストを音声読み上げすることによって、画像の内容を音声でユーザに伝えることができる。
ウェブアクセシビリティが確保されたウェブページをどのように制作するのかについては、W3C(World Wide Web Consortium)やJIS(Japanese Industrial Standards)により、ガイドラインが策定されている。
上記のガイドラインによれば、例えば、高齢者や視覚障害者への配慮として、「すべての非テキストコンテンツには代替テキストを提供して、拡大印刷、点字、音声、シンボル、平易な言葉などのような、ユーザが必要とする形式に変換できるようにする」という指針が示されている。
上記の指針への対応のひとつとして、ウェブページの内容を音声読み上げソフトウェアを用いて読み上げるというものがある。この場合において、ウェブページに配置された画像がどのような内容であるのかについて音声読み上げができるようにするために、構造化文書において、画像を指し示すimgタグの属性altの属性値として、単語や短文等の簡潔な代替テキストを挿入することが行われる。このように構造化文書に代替テキストを挿入することで、挿入された代替テキストを音声読み上げすることによって、画像の内容を音声でユーザに伝えることができる。
上記のように、ウェブページにて配置される画像に対応させて代替テキストを挿入するにあたっては、ウェブアクセシビリティの目的上、挿入される代替テキストが画像を的確に表す内容であることが求められる。
そこで、ウェブページにおける装飾目的の画像に対し適切な代替テキストを付加するため、以下のようなWebコンテンツ変換装置の構成が知られている。つまり、Webコンテンツ変換装置は、ウェブページに含まれる画像データの表示サイズ、データサイズを検出し、設定した閾値を超えている場合、装飾を目的とする画像であると判定して、代替テキストとして装飾画像に対応するalt属性を、例えば空(empty)にするというものである(例えば、特許文献1参照)。
そこで、ウェブページにおける装飾目的の画像に対し適切な代替テキストを付加するため、以下のようなWebコンテンツ変換装置の構成が知られている。つまり、Webコンテンツ変換装置は、ウェブページに含まれる画像データの表示サイズ、データサイズを検出し、設定した閾値を超えている場合、装飾を目的とする画像であると判定して、代替テキストとして装飾画像に対応するalt属性を、例えば空(empty)にするというものである(例えば、特許文献1参照)。
しかしながら、特許文献1に記載のWebコンテンツ変換装置が代替テキスト(代替文字列)付加の対象としているのは装飾目的の画像に限られており、alt属性を空(empty)にするという処理が行われる。このため、特許文献1の技術によっては、ウェブページに配置される多様な画像に関して代替文字列の適切な内容を特定することはできない。
本発明は、このような事情に鑑みてなされたもので、ウェブページに配置される多様な画像に対応する代替文字列を的確に特定できるようにすることを目的とする。
上述した課題を解決するために、本発明の一態様は、前記ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部と、前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部と、入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部と、前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部と、前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部とを備えるコンテンツ処理装置である。
本発明の一態様は、前記ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出ステップと、前記画像要素検出ステップによる検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得ステップと、入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得ステップにより取得された画像を出力する画像出力ステップと、前記画像出力ステップにより出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得ステップと、前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定ステップとを含むコンテンツ処理方法である。
本発明の一態様は、コンピュータを、前記ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部、前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部、入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部、前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部、前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部として機能させるためのプログラム。
本発明によれば、ウェブページに配置される多様な画像に対応する代替文字列を的確に特定できるようになるという効果が得られる。
<第1実施形態>
図1は、本実施形態におけるコンテンツ処理システムの構成例を示している。同図のコンテンツ処理システムは、ウェブアクセシビリティ解析サーバ100(コンテンツ処理装置の一例)、ウェブサーバ200、画像検索エンジン300−1、300−2、300−3(画像関連情報出力装置の一例)、及び機械学習エンジン400(画像関連情報出力装置の一例)、及びウェブサイト制作者端末500を備える。
なお以降の説明にあたり、画像検索エンジン300−1、300−2、300−3について特に区別しない場合には、画像検索エンジン300と記載する。
図1は、本実施形態におけるコンテンツ処理システムの構成例を示している。同図のコンテンツ処理システムは、ウェブアクセシビリティ解析サーバ100(コンテンツ処理装置の一例)、ウェブサーバ200、画像検索エンジン300−1、300−2、300−3(画像関連情報出力装置の一例)、及び機械学習エンジン400(画像関連情報出力装置の一例)、及びウェブサイト制作者端末500を備える。
なお以降の説明にあたり、画像検索エンジン300−1、300−2、300−3について特に区別しない場合には、画像検索エンジン300と記載する。
ウェブアクセシビリティ解析サーバ100、ウェブサーバ200、画像検索エンジン300、機械学習エンジン400、及びウェブサイト制作者端末500は、通信網600を介して通信可能に接続される。本実施形態において、通信網600はインターネットであるが、例えばLAN(Local Area Network)などであってもよい。
ウェブアクセシビリティ解析サーバ100は、ウェブページ(コンテンツの一例)を入力してアクセシビリティに関する解析を行う。ウェブアクセシビリティ解析サーバ100は、ウェブサーバ200がインターネット上で公開するウェブサイトを構成するウェブページのうちから、解析対象のウェブページを入力する。
ここでの解析対象のウェブページの入力としては、例えば以下のような態様を考えることができる。ウェブサイト制作者が、ウェブサイト制作者端末500を操作して、例えばウェブアクセシビリティ解析サーバ100における解析対象のウェブページ指定のためのウェブページにアクセスさせる。ウェブサイト制作者は、アクセスしたウェブページにおいて表示される入力フォームに、ウェブサーバ200が公開するウェブページのうちで解析対象とするウェブページのURL(Uniform Resource Locator)を入力する。これにより、解析対象のウェブページをウェブアクセシビリティ解析サーバ100に対して通知することが行われる。ウェブアクセシビリティ解析サーバ100は、入力されたURLにアクセスしてウェブページをダウンロードすることにより、解析対象のウェブページを入力する。
アクセシビリティに関する解析として、ウェブアクセシビリティ解析サーバ100は、入力されたウェブページに配置される画像のうちで、当該ウェブページのHTMLファイル(構造化文書の一例)における代替文字列についての記述が不備な要素に対応するものを検出する。「代替文字列についての記述が不備な要素」とは、画像を示す要素であるimgタグとして、alt属性の値が記述されていないもの、あるいは、alt属性そのものの記述がないものである。このように代替文字列についての記述が不備である要素に対応する画像は、アクセシビリティが確保されていない画像であることになる。
ここでの解析対象のウェブページの入力としては、例えば以下のような態様を考えることができる。ウェブサイト制作者が、ウェブサイト制作者端末500を操作して、例えばウェブアクセシビリティ解析サーバ100における解析対象のウェブページ指定のためのウェブページにアクセスさせる。ウェブサイト制作者は、アクセスしたウェブページにおいて表示される入力フォームに、ウェブサーバ200が公開するウェブページのうちで解析対象とするウェブページのURL(Uniform Resource Locator)を入力する。これにより、解析対象のウェブページをウェブアクセシビリティ解析サーバ100に対して通知することが行われる。ウェブアクセシビリティ解析サーバ100は、入力されたURLにアクセスしてウェブページをダウンロードすることにより、解析対象のウェブページを入力する。
アクセシビリティに関する解析として、ウェブアクセシビリティ解析サーバ100は、入力されたウェブページに配置される画像のうちで、当該ウェブページのHTMLファイル(構造化文書の一例)における代替文字列についての記述が不備な要素に対応するものを検出する。「代替文字列についての記述が不備な要素」とは、画像を示す要素であるimgタグとして、alt属性の値が記述されていないもの、あるいは、alt属性そのものの記述がないものである。このように代替文字列についての記述が不備である要素に対応する画像は、アクセシビリティが確保されていない画像であることになる。
ウェブアクセシビリティ解析サーバ100は、代替テキストについての記述が不備である要素に対応して最適とされる内容の代替文字列を決定する。ウェブアクセシビリティ解析サーバ100は、代替文字列の内容を決定するにあたり、対象となる画像についての画像検索エンジン300のそれぞれによる検索結果と、対象となる画像を説明する説明文として機械学習エンジン400が出力した文字列(テキスト)の情報を利用する。
そのうえで、本実施形態のウェブアクセシビリティ解析サーバ100は、決定した代替文字列を、解析対象のウェブページのHTMLファイルに挿入する。つまり、本実施形態のウェブアクセシビリティ解析サーバ100は、ウェブページにおいて代替テキストの記述が不備である要素について最適な内容の代替テキストを決定し、決定した代替テキストを挿入する。このようなコンテンツ処理によって、画像への代替文字列の対応付けに関してウェブアクセシビリティの確保が図られる。そして、ウェブサーバ200は、ウェブアクセシビリティが確保されたウェブページをインターネット上で公開できる。
そのうえで、本実施形態のウェブアクセシビリティ解析サーバ100は、決定した代替文字列を、解析対象のウェブページのHTMLファイルに挿入する。つまり、本実施形態のウェブアクセシビリティ解析サーバ100は、ウェブページにおいて代替テキストの記述が不備である要素について最適な内容の代替テキストを決定し、決定した代替テキストを挿入する。このようなコンテンツ処理によって、画像への代替文字列の対応付けに関してウェブアクセシビリティの確保が図られる。そして、ウェブサーバ200は、ウェブアクセシビリティが確保されたウェブページをインターネット上で公開できる。
ウェブサーバ200は、WWW(World Wide Web)に対応するシステムを実装し、1以上のウェブページにより構築されるウェブサーバをインターネット上で公開するサーバである。本実施形態においては、ウェブサーバ200が公開するウェブサイトを構成するウェブページが、ウェブアクセシビリティ解析サーバ100によるアクセシビリティ解析対象となる。
画像検索エンジン300は、入力された画像(入力画像)に類似する画像を検索し、検索した画像を出力する。画像検索エンジン300が検索対象とする画像は、例えば、インターネット上に存在する画像である。インターネット上に存在する画像は、例えばインターネット上で公開されるウェブページに含まれる画像である。
画像検索エンジン300−1、300−2、300−3の画像検索のアルゴリズムはそれぞれ異なっている。従って、画像検索エンジン300−1、300−2、300−3の同じ入力画像に対する検索結果は異なっていてかまわない。
機械学習エンジン400は、所定の機械学習のアルゴリズムに従った学習結果を用いて、入力画像についての説明文を生成する。例えば機械学習エンジン400は、入力された画像において示される物体を検出し、検出した物体について分類を行い、分類についてラベル付けを行うことで画像の説明文を生成する。
画像検索エンジン300−1、300−2、300−3の画像検索のアルゴリズムはそれぞれ異なっている。従って、画像検索エンジン300−1、300−2、300−3の同じ入力画像に対する検索結果は異なっていてかまわない。
機械学習エンジン400は、所定の機械学習のアルゴリズムに従った学習結果を用いて、入力画像についての説明文を生成する。例えば機械学習エンジン400は、入力された画像において示される物体を検出し、検出した物体について分類を行い、分類についてラベル付けを行うことで画像の説明文を生成する。
なお、ウェブサーバ200、画像検索エンジン300、及び機械学習エンジン400は、ウェブアクセシビリティ解析サーバ100の運用者とは異なる運用者により構築された外部のシステムを利用してもよい。
また、同図においては、それぞれ1つのウェブサーバ200、3つの画像検索エンジン300、1つの機械学習エンジン400が示されている。しかしながら、コンテンツ処理システムにおけるウェブサーバ200、画像検索エンジン300と機械学習エンジン400との数は、それぞれ1以上であればよく、特に限定されない。
また、同図においては、それぞれ1つのウェブサーバ200、3つの画像検索エンジン300、1つの機械学習エンジン400が示されている。しかしながら、コンテンツ処理システムにおけるウェブサーバ200、画像検索エンジン300と機械学習エンジン400との数は、それぞれ1以上であればよく、特に限定されない。
ウェブサイト制作者端末500は、ウェブサーバ200が公開するウェブサイトを制作する者(ウェブサイト制作者)が使用する端末である。ウェブサイト制作者は、ウェブサーバ200の運用者と同じであってもよいし、ウェブサーバ200の運用者から依頼されてウェブサーバ200のウェブサイトを制作する者であってもよい。
ウェブサイト制作者は、例えばウェブサイト制作者端末500を使用してウェブサイトを制作することができる。また、ウェブサイト制作者は、制作したウェブサイトのウェブページをウェブサイト制作者端末500から通信網600経由でウェブサーバ200にアップロードすることができる。
ウェブサイト制作者は、例えばウェブサイト制作者端末500を使用してウェブサイトを制作することができる。また、ウェブサイト制作者は、制作したウェブサイトのウェブページをウェブサイト制作者端末500から通信網600経由でウェブサーバ200にアップロードすることができる。
図2を参照して、本実施形態におけるウェブアクセシビリティ解析サーバ100の構成例について説明する。同図に示されるように、本実施形態のウェブアクセシビリティ解析サーバ100は、送受信部110、画像要素検出部120、画像取得部130、画像出力部140、文字列情報取得部150、代替文字列決定部160、情報挿入部170及び類義語データベースDB1を備える。
送受信部110は、通信網600を介した通信によって情報の送受信を行う。
例えば、送受信部110は、ウェブアクセシビリティ解析対象となるウェブページをウェブサーバ200から受信する。
ウェブアクセシビリティ解析対象のウェブページは、例えばウェブサイト制作者がウェブサイト制作者端末500を操作して指定することができる。具体的には、例えばウェブサイト制作者がウェブサイト制作者端末500をウェブアクセシビリティ解析サーバ100にアクセスさせることで、ウェブアクセシビリティ解析に関する操作が可能な操作画面をウェブサイト制作者端末500に表示させる。ウェブサイト制作者は操作画面に対する操作を行って、ウェブアクセシビリティの解析対象とするウェブページを指定する。ウェブアクセシビリティ解析サーバ100における送受信部は、ウェブアクセシビリティの解析対象として指定されたウェブページをウェブサーバ200に要求する。
なお、例えば、ウェブサイト制作者端末500にウェブサーバ200のウェブサイトと同じデータが記憶されている場合、アクセシビリティ解析対象のウェブページを、ウェブサイト制作者端末500からウェブアクセシビリティ解析サーバ100に送信(アップロード)するようにしてもよい。また、上記のようにウェブサイト制作者端末500からアクセシビリティ解析サーバ100に、アクセシビリティ解析対象のウェブページをアップロードさせる場合、アクセシビリティ解析対象のウェブページは、ウェブサーバ200に現在公開されているものと同じでなくともよい。例えば、アクセシビリティ解析対象のウェブページは、将来的にウェブサーバ200に公開する予定のあるものであって、ウェブサーバ200に現在公開されているものと異なるものであってもよい。
例えば、送受信部110は、ウェブアクセシビリティ解析対象となるウェブページをウェブサーバ200から受信する。
ウェブアクセシビリティ解析対象のウェブページは、例えばウェブサイト制作者がウェブサイト制作者端末500を操作して指定することができる。具体的には、例えばウェブサイト制作者がウェブサイト制作者端末500をウェブアクセシビリティ解析サーバ100にアクセスさせることで、ウェブアクセシビリティ解析に関する操作が可能な操作画面をウェブサイト制作者端末500に表示させる。ウェブサイト制作者は操作画面に対する操作を行って、ウェブアクセシビリティの解析対象とするウェブページを指定する。ウェブアクセシビリティ解析サーバ100における送受信部は、ウェブアクセシビリティの解析対象として指定されたウェブページをウェブサーバ200に要求する。
なお、例えば、ウェブサイト制作者端末500にウェブサーバ200のウェブサイトと同じデータが記憶されている場合、アクセシビリティ解析対象のウェブページを、ウェブサイト制作者端末500からウェブアクセシビリティ解析サーバ100に送信(アップロード)するようにしてもよい。また、上記のようにウェブサイト制作者端末500からアクセシビリティ解析サーバ100に、アクセシビリティ解析対象のウェブページをアップロードさせる場合、アクセシビリティ解析対象のウェブページは、ウェブサーバ200に現在公開されているものと同じでなくともよい。例えば、アクセシビリティ解析対象のウェブページは、将来的にウェブサーバ200に公開する予定のあるものであって、ウェブサーバ200に現在公開されているものと異なるものであってもよい。
また、送受信部110は、解析対象のウェブページに配置される画像のうちで代替文字列の挿入対象となった画像(代替文字列についての記述が不備な要素(「img」)に対応する画像)を、画像検索エンジン300、及び機械学習エンジン400に送信する。
また、送受信部110は、画像検索エンジン300のそれぞれにより検索された画像(画像関連情報の一例)を受信する。また、送受信部110は、代替文字列の挿入対象となった画像を入力した機械学習エンジン400が生成した画像についての説明文としての文字列(テキスト)の情報(画像関連情報の一例)を受信する。
また、送受信部110は、画像についての代替文字列を挿入したウェブページをウェブサーバ200に送信する。ウェブサーバ200は、解析対象とされたウェブページを、ウェブアクセシビリティ解析サーバ100から受信したウェブページで置き換える。このような処理によって、ウェブサーバ200が公開するウェブページについてアクセシビリティが確保されるように変更が行われる。
また、送受信部110は、画像検索エンジン300のそれぞれにより検索された画像(画像関連情報の一例)を受信する。また、送受信部110は、代替文字列の挿入対象となった画像を入力した機械学習エンジン400が生成した画像についての説明文としての文字列(テキスト)の情報(画像関連情報の一例)を受信する。
また、送受信部110は、画像についての代替文字列を挿入したウェブページをウェブサーバ200に送信する。ウェブサーバ200は、解析対象とされたウェブページを、ウェブアクセシビリティ解析サーバ100から受信したウェブページで置き換える。このような処理によって、ウェブサーバ200が公開するウェブページについてアクセシビリティが確保されるように変更が行われる。
画像要素検出部120は、ウェブページに配置される画像に対応する要素における代替文字列に関する記述についての検出(画像要素検出)を行う。
図3を参照して、画像要素検出部120が行う画像要素検出の具体例について説明する。同図においては、解析対象のウェブページのHTMLファイルにおける記述内容例が示されている。
HTMLファイルは、マークアップ言語であるHTMLにより記述された文書のファイルである。HTMLファイルは、テキストによる文書と、文書構造を定義した情報とで形成されるファイルである。HTMLファイルにおける文書構造の定義は、文書を形成する要素(ノード)をタグとして定義することによって行われる。HTMLファイルのように文書構造が定義された文書は構造化文書とも呼ばれる。
なお、ウェブページの構造化文書としては、HTMLファイルに限定されるものではなく、例えばXML(Extensible Markup Language)、SGML(Standard Generalized Markup Language)などのように、他のマークアップ言語により記述されたファイルなどであってもよい。
図3を参照して、画像要素検出部120が行う画像要素検出の具体例について説明する。同図においては、解析対象のウェブページのHTMLファイルにおける記述内容例が示されている。
HTMLファイルは、マークアップ言語であるHTMLにより記述された文書のファイルである。HTMLファイルは、テキストによる文書と、文書構造を定義した情報とで形成されるファイルである。HTMLファイルにおける文書構造の定義は、文書を形成する要素(ノード)をタグとして定義することによって行われる。HTMLファイルのように文書構造が定義された文書は構造化文書とも呼ばれる。
なお、ウェブページの構造化文書としては、HTMLファイルに限定されるものではなく、例えばXML(Extensible Markup Language)、SGML(Standard Generalized Markup Language)などのように、他のマークアップ言語により記述されたファイルなどであってもよい。
画像要素検出部120は、まず、解析対象として入力したウェブページのHTMLファイルを解析することで、画像としての要素を示すimgタグを検出する。imgタグは、属性srcを持つ。属性srcの属性値は、対応の要素の画像として表示される画像ファイルのファイル名や保存場所などを示す。
また、imgタグは、属性altを持つことができる。属性altの属性値は代替文字列を示す。代替文字列は、例えば音声読み上げが行われる。これにより、視覚に障害のあるユーザにウェブページに配置される画像の内容を伝えることができる。
図3(A)には、HTMLファイルにおいて1つのimgタグが記述された例が示されている。imgタグ内には、「alt="花"」との記述と、「src="flower.jpeg"」との記述が含まれている。この記述により、imgタグにより指定される画像は、「flower.jpeg」のファイル名の画像であり、代替文字列により「花」であることが説明されていることになる。このように代替文字列が記述されているということは、imgタグにより指定される画像に関してウェブアクセシビリティが確保されているということになる。
また、imgタグは、属性altを持つことができる。属性altの属性値は代替文字列を示す。代替文字列は、例えば音声読み上げが行われる。これにより、視覚に障害のあるユーザにウェブページに配置される画像の内容を伝えることができる。
図3(A)には、HTMLファイルにおいて1つのimgタグが記述された例が示されている。imgタグ内には、「alt="花"」との記述と、「src="flower.jpeg"」との記述が含まれている。この記述により、imgタグにより指定される画像は、「flower.jpeg」のファイル名の画像であり、代替文字列により「花」であることが説明されていることになる。このように代替文字列が記述されているということは、imgタグにより指定される画像に関してウェブアクセシビリティが確保されているということになる。
そこで、画像要素検出部120は、画像に対応するimgタグを検出すると、検出されたimgタグに含まれる記述において属性altを示す「alt」の記述があるか否かについて検出する。ここで、「alt」の記述が無いことを検出した場合には、代替文字列が示されていないことになる。そこで、この場合には、画像要素検出部120は、検出したimgタグは、代替文字列についての記述が不備であると判定する。
図3(B)は、図3(A)と同じウェブページのHTMLファイルにおいて、「alt」の記述が無い場合の例を示している。具体的に、同図においては、imgタグにおいて、「src="flower.jpeg"」との記述は含まれているが、「alt="(属性値)"」の記述はない。
図3(B)は、図3(A)と同じウェブページのHTMLファイルにおいて、「alt」の記述が無い場合の例を示している。具体的に、同図においては、imgタグにおいて、「src="flower.jpeg"」との記述は含まれているが、「alt="(属性値)"」の記述はない。
また、「alt」の記述が有ったとしても対応の属性値の記述がない場合がある。そこで、画像要素検出部120は、「alt」の記述が有った場合には、さらに、「alt」に対応する属性値の記述があるか否かについて検出する。ここで、「alt」に対応する属性値の記述がないことを検出した場合にも、画像要素検出部120は、検出したimgタグは、代替文字列についての記述が不備であると判定する。
図3(C)は、図3(A)と同じウェブページのHTMLファイルにおいて、「alt」の記述はあるが、対応の属性値の記述が無い場合の例を示している。具体的に、同図においては、imgタグにおいて、「src="flower.jpeg"」との記述が含まれている。また、imgタグにおいて「alt」の記述はあるものの、「alt=""」と記述されている。即ち、属性altに対応する有効な属性値の記述がない。
これに対して、例えば図3(A)に示されるように、「alt」に対応する属性値の記述が有った場合、画像要素検出部120は、検出したimgタグは、代替文字列についての記述に不備はないと判定する。このようにして画像要素検出部120による画像要素検出が行われる。
図3(C)は、図3(A)と同じウェブページのHTMLファイルにおいて、「alt」の記述はあるが、対応の属性値の記述が無い場合の例を示している。具体的に、同図においては、imgタグにおいて、「src="flower.jpeg"」との記述が含まれている。また、imgタグにおいて「alt」の記述はあるものの、「alt=""」と記述されている。即ち、属性altに対応する有効な属性値の記述がない。
これに対して、例えば図3(A)に示されるように、「alt」に対応する属性値の記述が有った場合、画像要素検出部120は、検出したimgタグは、代替文字列についての記述に不備はないと判定する。このようにして画像要素検出部120による画像要素検出が行われる。
説明を図2に戻す。画像取得部130は、画像要素検出部120による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像をウェブページから取得する。つまり、画像取得部130は、画像要素検出部120により代替文字列についての記述に不備があると判定されたimgタグが示す画像をウェブページから取得する。ウェブアクセシビリティ解析サーバ100が解析対象として入力したウェブページは、HTMLファイルの他にページ上に配置される画像ファイル等のオブジェクトを含んでいる。そこで、画像取得部130は、代替文字列についての記述に不備があると判定されたimgタグにおいて記述される属性srcの属性値が示す画像ファイルを、入力されたウェブページに含まれる画像ファイルから取得する。このようにして、画像取得部130は、代替文字列についての記述に不備があると判定されたimgタグが示す画像を取得する。
画像出力部140は、画像取得部130により取得された画像(画像ファイル)を、送受信部110により画像検索エンジン300(300−1、300−2、300−3)と、機械学習エンジン400とのそれぞれに送信(出力)する。このように送信された画像は、画像検索エンジン300、及び機械学習エンジン400にて受信される。
画像検索エンジン300は、それぞれ、受信された画像を入力とし、入力した画像に類似する画像を検索する。画像検索エンジン300は、それぞれ、検索した画像(検索結果)を画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。
また、機械学習エンジン400は、受信された画像を入力し、学習結果を利用して、入力された画像についての説明文を生成する。機械学習エンジン400は、生成した説明文としての文字列(テキスト)を、画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。
画像検索エンジン300は、それぞれ、受信された画像を入力とし、入力した画像に類似する画像を検索する。画像検索エンジン300は、それぞれ、検索した画像(検索結果)を画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。
また、機械学習エンジン400は、受信された画像を入力し、学習結果を利用して、入力された画像についての説明文を生成する。機械学習エンジン400は、生成した説明文としての文字列(テキスト)を、画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。
文字列情報取得部150は、画像検索エンジン300、及び機械学習エンジン400のそれぞれから出力される画像関連情報に基づいて、画像検索エンジン300、及び機械学習エンジン400ごとに対応する文字列情報を取得する。
具体的に、画像検索エンジン300、及び機械学習エンジン400のそれぞれから送信(出力)された画像関連情報は送受信部110により受信される。文字列情報取得部150は、受信された画像関連情報を入力する。
画像検索エンジン300のそれぞれから送信された画像関連情報は検索結果としての画像である。そこで、文字列情報取得部150は、画像検索エンジン300から送信された画像関連情報としての画像を入力すると、入力した画像が配置されるウェブページにアクセスする。文字列情報取得部150は、アクセスしたウェブページのHTMLファイルから、入力した画像に関連するテキスト(文字列)を取得する。
具体的には、文字列情報取得部150は、入力した画像に関連する文字列として、入力した画像を要素として指定するimgタグにおいて記述される属性altの属性値としての文字列を取得することができる。また、文字列情報取得部150は、入力した画像に関連する文字列として、ウェブページ上で配置される画像の周辺に配置されているテキストやリンクなどから文字列を取得することができる。この場合、文字列情報取得部150は、画像の周辺に配置されているテキストやリンクとしての文字列について、例えば自然言語処理による形態素解析を行い、形態素解析の結果得られた名詞、形容詞などの形態素としての文字列を抽出すればよい。
なお、文字列情報取得部150は、形態素解析に代えて、画像の周辺に配置されているテキストやリンクとしての文字列から、N−gram法を用いて、文字の出現頻度に応じたテキストによる文字列を抽出するようにしてもよい。また、文字列情報取得部150は、形態素解析とN−gram法とを併用して文字列を抽出してもよい。
このようにして文字列情報取得部150は、画像検索エンジン300のそれぞれから送信された画像関連情報としての画像ごとに対応する文字列情報を取得する。
具体的に、画像検索エンジン300、及び機械学習エンジン400のそれぞれから送信(出力)された画像関連情報は送受信部110により受信される。文字列情報取得部150は、受信された画像関連情報を入力する。
画像検索エンジン300のそれぞれから送信された画像関連情報は検索結果としての画像である。そこで、文字列情報取得部150は、画像検索エンジン300から送信された画像関連情報としての画像を入力すると、入力した画像が配置されるウェブページにアクセスする。文字列情報取得部150は、アクセスしたウェブページのHTMLファイルから、入力した画像に関連するテキスト(文字列)を取得する。
具体的には、文字列情報取得部150は、入力した画像に関連する文字列として、入力した画像を要素として指定するimgタグにおいて記述される属性altの属性値としての文字列を取得することができる。また、文字列情報取得部150は、入力した画像に関連する文字列として、ウェブページ上で配置される画像の周辺に配置されているテキストやリンクなどから文字列を取得することができる。この場合、文字列情報取得部150は、画像の周辺に配置されているテキストやリンクとしての文字列について、例えば自然言語処理による形態素解析を行い、形態素解析の結果得られた名詞、形容詞などの形態素としての文字列を抽出すればよい。
なお、文字列情報取得部150は、形態素解析に代えて、画像の周辺に配置されているテキストやリンクとしての文字列から、N−gram法を用いて、文字の出現頻度に応じたテキストによる文字列を抽出するようにしてもよい。また、文字列情報取得部150は、形態素解析とN−gram法とを併用して文字列を抽出してもよい。
このようにして文字列情報取得部150は、画像検索エンジン300のそれぞれから送信された画像関連情報としての画像ごとに対応する文字列情報を取得する。
一方、機械学習エンジン400から送信された画像関連情報は説明文であり、既に文字列の形式である。そこで、文字列情報取得部150は、機械学習エンジン400から送信された画像関連情報については、そのまま文字列情報として取得すればよい。
代替文字列決定部160は、画像検索エンジン300、及び機械学習エンジン400ごとに対応する文字列情報を照合した結果に基づいて代替文字列を決定する。
図4を参照して、代替文字列決定部160が行う処理の一例について説明する。同図においては、画像出力部140により画像検索エンジン300、及び機械学習エンジン400のそれぞれに送信された画像Pic1が示されている。同図の画像Pic1としては、赤い服を着た女性がヘッドマウントディスプレイを装着している状態が表されている。
同図において、文字列情報1は、画像検索エンジン300−1から送信された画像関連情報としての画像に基づいて文字列情報取得部150により取得された文字列情報である。
文字列情報1は、「ヘッドマウントディスプレイ」との1つの文字列を含む情報である。
文字列情報2は、画像検索エンジン300−2から送信された画像関連情報としての画像に基づいて文字列情報取得部150により取得された文字列情報である。文字列情報2は、「めがね」と「HMD」との2つの文字列を含む情報である。
文字列情報3は、画像検索エンジン300−3から送信された画像関連情報としての画像に基づいて文字列情報取得部150により取得された文字列情報である。文字列情報3は、「Glass」との1つの文字列を含む情報である。
代替文字列決定部160は、上記のように画像検索エンジン300−1、300−2、300−3のそれぞれにより得られた文字列情報1、2、3について統合する。統合に際して、代替文字列決定部160は、複数の文字列情報のうちで一致する文字列について1つにマージする(まとめる)処理を行う。
図4を参照して、代替文字列決定部160が行う処理の一例について説明する。同図においては、画像出力部140により画像検索エンジン300、及び機械学習エンジン400のそれぞれに送信された画像Pic1が示されている。同図の画像Pic1としては、赤い服を着た女性がヘッドマウントディスプレイを装着している状態が表されている。
同図において、文字列情報1は、画像検索エンジン300−1から送信された画像関連情報としての画像に基づいて文字列情報取得部150により取得された文字列情報である。
文字列情報1は、「ヘッドマウントディスプレイ」との1つの文字列を含む情報である。
文字列情報2は、画像検索エンジン300−2から送信された画像関連情報としての画像に基づいて文字列情報取得部150により取得された文字列情報である。文字列情報2は、「めがね」と「HMD」との2つの文字列を含む情報である。
文字列情報3は、画像検索エンジン300−3から送信された画像関連情報としての画像に基づいて文字列情報取得部150により取得された文字列情報である。文字列情報3は、「Glass」との1つの文字列を含む情報である。
代替文字列決定部160は、上記のように画像検索エンジン300−1、300−2、300−3のそれぞれにより得られた文字列情報1、2、3について統合する。統合に際して、代替文字列決定部160は、複数の文字列情報のうちで一致する文字列について1つにマージする(まとめる)処理を行う。
文字列情報4は、機械学習エンジン400から送信された画像関連情報としての説明文の文字列を、文字列情報取得部150が文字列情報として取得したものである。文字列情報4は、「赤い服の女性がHMDを覗いている」との1つの文字列を含む情報である。
代替文字列決定部160は、文字列情報1、2、3を統合して得られた統合文字列情報に含まれる文字列と、文字列情報4としての説明文とのそれぞれについて形態素解析を行うことで、名詞や形容詞などの形態素としての文字列を、代替文字列の候補(候補文字列)として取得する。
同図においては、上記の形態素解析の結果、「ヘッドマウントディスプレイ」、「めがね」、「HMD」、「Glass」、「赤い」、「服」、「女性」、「HMD」との8つの候補文字列が得られた場合が示されている。
なお、代替文字列決定部160は、この場合においても、統合文字列情報に含まれる文字列と、文字列情報4としての説明文とのそれぞれについて、N−gram法を用いて、文字の出現頻度に応じたテキストによる文字列を抽出するようにしてもよい。また、代替文字列決定部160は、形態素解析とN−gram法を併用して文字列を抽出するようにしてもよい。
同図においては、上記の形態素解析の結果、「ヘッドマウントディスプレイ」、「めがね」、「HMD」、「Glass」、「赤い」、「服」、「女性」、「HMD」との8つの候補文字列が得られた場合が示されている。
なお、代替文字列決定部160は、この場合においても、統合文字列情報に含まれる文字列と、文字列情報4としての説明文とのそれぞれについて、N−gram法を用いて、文字の出現頻度に応じたテキストによる文字列を抽出するようにしてもよい。また、代替文字列決定部160は、形態素解析とN−gram法を併用して文字列を抽出するようにしてもよい。
代替文字列決定部160は、上記のように得られた8つの候補文字列をそれぞれ照合基準として、他の7つの候補文字列のそれぞれを比較対象として照合させ、照合結果として、比較対象の候補文字列が「単純一致」、「言い換え一致」、「不一致」のいずれに該当するのかについて判定する。
「単純一致」は、照合基準の候補文字列と比較対象の候補文字列とが完全に一致することである。「言い換え一致」は、照合基準と比較対象の候補文字列とで一致はしていないが、比較対象の候補文字列の類義語(同意語も含む)に文字列を言い換えた(置換した)場合に照合基準の候補文字列と一致することである。つまり、「言い換え一致」は、比較対象の文字列が、照合基準と表現は異なるが同じ意味を有する場合に対応する。「不一致」は、照合基準と比較対象の候補文字列とで一致しておらず、かつ、比較対象の候補文字列の類義語のうちにも照合基準の候補文字列と一致するものがないことである。
代替文字列決定部160は、比較対象の候補文字列と類似または同義となる文字列を、類義語データベースDB1を参照することによって導出してもよい。
そして、代替文字列決定部160は、8つの候補文字列ごとに「単純一致」、「言い換え一致」の各判定数を求める。
代替文字列決定部160は、比較対象の候補文字列と類似または同義となる文字列を、類義語データベースDB1を参照することによって導出してもよい。
そして、代替文字列決定部160は、8つの候補文字列ごとに「単純一致」、「言い換え一致」の各判定数を求める。
具体的に、同図の場合、「ヘッドマウントディスプレイ」の候補文字列を照合基準として他の7つの候補文字列とを照合させた場合、「ヘッドマウントディスプレイ」との文字列と「単純一致」する他の候補文字列はない。このため、代替文字列決定部160は、「ヘッドマウントディスプレイ」の候補文字列についての「単純一致」の判定数を「0」とする。
また、比較対象の7つの候補文字列のうち、「HMD」の候補文字列については、類義語として照合基準と同じ「ヘッドマウントディスプレイ」との文字列が導出される。「HMD」の候補文字列は、2つ存在している。そこで、代替文字列決定部160は、「ヘッドマウントディスプレイ」の候補文字列についての「言い換え一致」の判定数を「2」とする。
また、残る比較対象の「めがね」、「Glass」、「赤い」、「服」、「女性」の各候補文字列については、照合基準としての「ヘッドマウントディスプレイ」の候補文字列に対していずれも不一致となる。
また、比較対象の7つの候補文字列のうち、「HMD」の候補文字列については、類義語として照合基準と同じ「ヘッドマウントディスプレイ」との文字列が導出される。「HMD」の候補文字列は、2つ存在している。そこで、代替文字列決定部160は、「ヘッドマウントディスプレイ」の候補文字列についての「言い換え一致」の判定数を「2」とする。
また、残る比較対象の「めがね」、「Glass」、「赤い」、「服」、「女性」の各候補文字列については、照合基準としての「ヘッドマウントディスプレイ」の候補文字列に対していずれも不一致となる。
また、「めがね」の候補文字列を照合基準として他の7つの候補文字列とを照合させた場合、「めがね」との文字列と「単純一致」する他の候補文字列はない。このため、代替文字列決定部160は、「めがね」の候補文字列についての「単純一致」の判定数を「0」とする。
また、この場合の比較対象の7つの候補文字列のうち、「Glass」の候補文字列については、類義語として照合基準と同じ「めがね」との文字列が導出される。「Glass」の候補文字列は、1つ存在している。そこで、代替文字列決定部160は、「Glass」の候補文字列についての「言い換え一致」の判定数を「1」とする。
また、残る比較対象の「ヘッドマウントディスプレイ」、「HMD」、「赤い」、「服」、「女性」、「HMD」の各候補文字列については、照合基準である「めがね」の候補文字列に対していずれも不一致となる。
また、この場合の比較対象の7つの候補文字列のうち、「Glass」の候補文字列については、類義語として照合基準と同じ「めがね」との文字列が導出される。「Glass」の候補文字列は、1つ存在している。そこで、代替文字列決定部160は、「Glass」の候補文字列についての「言い換え一致」の判定数を「1」とする。
また、残る比較対象の「ヘッドマウントディスプレイ」、「HMD」、「赤い」、「服」、「女性」、「HMD」の各候補文字列については、照合基準である「めがね」の候補文字列に対していずれも不一致となる。
また、「HMD」の候補文字列を照合基準として他の7つの候補文字列とを照合させた結果、代替文字列決定部160は、「HMD」との文字列と「単純一致」する他の候補文字列が1つ存在すると判定する。そこで、この場合の代替文字列決定部160は、「HMD」の候補文字列についての「単純一致」の判定数を「1」とする。
また、この場合の比較対象の7つの候補文字列のうち、「ヘッドマウントディスプレイ」の候補文字列については、類義語として照合基準と同じ「HMD」との文字列が導出される。「ヘッドマウントディスプレイ」の候補文字列は、1つ存在している。そこで、代替文字列決定部160は、「HMD」の候補文字列についての「言い換え一致」の判定数を「1」として集計する。
また、残る比較対象の「めがね」、「Glass」、「赤い」、「服」、「女性」の各候補文字列については、照合基準である「HMD」の候補文字列に対していずれも不一致となる。
また、この場合の比較対象の7つの候補文字列のうち、「ヘッドマウントディスプレイ」の候補文字列については、類義語として照合基準と同じ「HMD」との文字列が導出される。「ヘッドマウントディスプレイ」の候補文字列は、1つ存在している。そこで、代替文字列決定部160は、「HMD」の候補文字列についての「言い換え一致」の判定数を「1」として集計する。
また、残る比較対象の「めがね」、「Glass」、「赤い」、「服」、「女性」の各候補文字列については、照合基準である「HMD」の候補文字列に対していずれも不一致となる。
また、「Glass」の候補文字列を照合基準として他の7つの候補文字列とを照合させた場合、「Glass」との文字列と「単純一致」する他の候補文字列はない。このため、代替文字列決定部160は、「Glass」の候補文字列についての「単純一致」の判定数を「0」とする。
また、この場合の比較対象の7つの候補文字列のうち、「めがね」の候補文字列については、類義語として照合基準と同じ「Glass」との文字列が導出される。「めがね」の候補文字列は、2つ存在している。そこで、代替文字列決定部160は、「Glass」の候補文字列についての「言い換え一致」の判定数を「1」とする。
また、残る比較対象の「ヘッドマウントディスプレイ」、「HMD」、「赤い」、「服」、「女性」、「HMD」の各候補文字列については、照合基準である「Glass」の候補文字列に対していずれも不一致となる。
このようにして、代替文字列決定部160は、候補文字列ごとに「単純一致」と「言い換え一致」の各判定数を求める。
また、この場合の比較対象の7つの候補文字列のうち、「めがね」の候補文字列については、類義語として照合基準と同じ「Glass」との文字列が導出される。「めがね」の候補文字列は、2つ存在している。そこで、代替文字列決定部160は、「Glass」の候補文字列についての「言い換え一致」の判定数を「1」とする。
また、残る比較対象の「ヘッドマウントディスプレイ」、「HMD」、「赤い」、「服」、「女性」、「HMD」の各候補文字列については、照合基準である「Glass」の候補文字列に対していずれも不一致となる。
このようにして、代替文字列決定部160は、候補文字列ごとに「単純一致」と「言い換え一致」の各判定数を求める。
次に、代替文字列決定部160は、候補文字列ごとに求められた「単純一致」と「言い換え一致」との判定数に基づいて代替文字列を決定する。
具体的に、代替文字列決定部160は、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を、代替文字列として決定する。同図の場合には、「ヘッドマウントディスプレイ」の候補文字列の判定数の総計「2」、「HMD」の候補文字列の判定数の総計「2」が、8つの候補文字列のうちで最も大きい。
本実施形態において、上記の例のように、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列が複数得られた場合には、予め定めた所定の規則に従って複数のうちから1つの候補文字列を代替文字列として決定する。
具体的に、代替文字列決定部160は、例えば、「単純一致」の数が最も多い候補文字列を代替文字列として決定することができる。このように決定する場合、同図の例との対応では、代替文字列決定部160は、「HMD」を代替文字列として決定する。
また、同図の例の場合であれば、「ヘッドマウントディスプレイ」と「HMD」との候補文字列を比較すると、「ヘッドマウントディスプレイ」はカタカナによる日本語表記であり、「HMD」はアルファベットの文字列である。アルファベットの文字列は、略語である可能性が高く、一般ユーザになじみがない場合もある。そこで、このような場合には、アルファベットの文字列よりも日本語表記されたもの代替文字列として優先されるようにしてもよい。この場合、同図の例との対応では、代替文字列決定部160は、「ヘッドマウントディスプレイ」を代替文字列として決定する。
このように、代替文字列決定部160は、複数の文字列情報の間での形態素の一致に関する判定結果に基づいて、代替文字列を決定することができる。
具体的に、代替文字列決定部160は、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を、代替文字列として決定する。同図の場合には、「ヘッドマウントディスプレイ」の候補文字列の判定数の総計「2」、「HMD」の候補文字列の判定数の総計「2」が、8つの候補文字列のうちで最も大きい。
本実施形態において、上記の例のように、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列が複数得られた場合には、予め定めた所定の規則に従って複数のうちから1つの候補文字列を代替文字列として決定する。
具体的に、代替文字列決定部160は、例えば、「単純一致」の数が最も多い候補文字列を代替文字列として決定することができる。このように決定する場合、同図の例との対応では、代替文字列決定部160は、「HMD」を代替文字列として決定する。
また、同図の例の場合であれば、「ヘッドマウントディスプレイ」と「HMD」との候補文字列を比較すると、「ヘッドマウントディスプレイ」はカタカナによる日本語表記であり、「HMD」はアルファベットの文字列である。アルファベットの文字列は、略語である可能性が高く、一般ユーザになじみがない場合もある。そこで、このような場合には、アルファベットの文字列よりも日本語表記されたもの代替文字列として優先されるようにしてもよい。この場合、同図の例との対応では、代替文字列決定部160は、「ヘッドマウントディスプレイ」を代替文字列として決定する。
このように、代替文字列決定部160は、複数の文字列情報の間での形態素の一致に関する判定結果に基づいて、代替文字列を決定することができる。
なお、代替文字列決定部160は、形態素解析またはN−gram法によって得られた候補文字列のうちから、或る文字列と或る文字列とが同時に出現する関係である、共起関係の相関について計算した結果に基づいて、代替文字列を決定してもよい。
情報挿入部170は、代替文字列決定部160により決定された代替文字列を、画像取得部130により取得された画像に対応する要素に挿入する。つまり、情報挿入部170は、上記のように1つの代替文字列が決定されると、情報挿入部170は、解析対象として入力したウェブページのHTMLファイルにおいて対応の画像を示すimgタグ内に、決定された代替文字列を属性altの属性値として挿入する処理を行う。解析対象のウェブページを構成するデータは、例えば送受信部110にて記憶されている。情報挿入部170は、代替文字列を挿入する対象であるHTMLファイルを送受信部110から取得すればよい。
情報挿入部170は、代替文字列決定部160により決定された全ての代替文字列のHTMLファイルへの挿入を行うと、代替文字列挿入後のHTMLファイルをウェブサーバ200に送信し、HTMLファイルの更新を指示する。ウェブサーバ200は、HTMLファイルの更新の指示に応じて、受信されたHTMLファイルにより、事故が記憶している対応のHTMLファイルの更新を行う。これにより、ウェブサーバ200は、以降において、画像に対応して適切な代替文字列が挿入されたウェブページを公開することができる。
なお、例えば情報挿入部170は、代替文字列挿入後のHTMLファイルではなく、決定された代替文字列を、例えば代替文字列の挿入箇所を示す情報とともにウェブサーバ200に送信してもよい。
情報挿入部170は、代替文字列決定部160により決定された全ての代替文字列のHTMLファイルへの挿入を行うと、代替文字列挿入後のHTMLファイルをウェブサーバ200に送信し、HTMLファイルの更新を指示する。ウェブサーバ200は、HTMLファイルの更新の指示に応じて、受信されたHTMLファイルにより、事故が記憶している対応のHTMLファイルの更新を行う。これにより、ウェブサーバ200は、以降において、画像に対応して適切な代替文字列が挿入されたウェブページを公開することができる。
なお、例えば情報挿入部170は、代替文字列挿入後のHTMLファイルではなく、決定された代替文字列を、例えば代替文字列の挿入箇所を示す情報とともにウェブサーバ200に送信してもよい。
図5のフローチャートは、本実施形態におけるウェブアクセシビリティ解析サーバ100が実行する処理手順例を示している。
ウェブアクセシビリティ解析サーバ100において、送受信部110は、解析対象のウェブページを取得する(ステップS101)。例えば、送受信部110は、解析対象のウェブページをウェブサーバ200に要求し、要求に応答してウェブサーバ200から送信されたウェブページを受信する。送受信部110は、受信したウェブページのデータを記憶する。
ウェブアクセシビリティ解析サーバ100において、送受信部110は、解析対象のウェブページを取得する(ステップS101)。例えば、送受信部110は、解析対象のウェブページをウェブサーバ200に要求し、要求に応答してウェブサーバ200から送信されたウェブページを受信する。送受信部110は、受信したウェブページのデータを記憶する。
画像要素検出部120は、ステップS101により取得されたウェブページにおけるHTMLファイルを入力し、入力したHTMLファイルについて、例えば1行目から順次要素について検出していく(ステップS102)。
画像要素検出部120は、ステップS102により検出された要素が、画像を示すimgタグであるか否かについて判定する(ステップS103)。imgタグではない場合(ステップS103−NO)、画像要素検出部120は、後述のステップS112に移行する。
一方、ステップS103によりimgタグであることが判定された場合(ステップS103−YES)、画像要素検出部120は、検出されたimgタグにおける代替文字列についての記述が不備であるか否かについて判定する。
前述のように、「検出されたimgタグにおける代替文字列についての記述が不備である」状態とは、図3(B)に例示したように、属性altそのものに関する記述がない状態、あるいは、図3(C)に示したように、例えば「alt=""」のように記述され、「alt」の記述はあるが、有効な属性値についての記述がない状態である。
これに対して、「検出されたimgタグにおける代替文字列についての記述が不備でない(備わっている)状態とは、図3(A)に例示したように、imgタグにおいて、「alt="花"」のように、属性altの記述があり、かつ、有効な属性値が記述されている状態である。
画像要素検出部120は、ステップS102により検出された要素が、画像を示すimgタグであるか否かについて判定する(ステップS103)。imgタグではない場合(ステップS103−NO)、画像要素検出部120は、後述のステップS112に移行する。
一方、ステップS103によりimgタグであることが判定された場合(ステップS103−YES)、画像要素検出部120は、検出されたimgタグにおける代替文字列についての記述が不備であるか否かについて判定する。
前述のように、「検出されたimgタグにおける代替文字列についての記述が不備である」状態とは、図3(B)に例示したように、属性altそのものに関する記述がない状態、あるいは、図3(C)に示したように、例えば「alt=""」のように記述され、「alt」の記述はあるが、有効な属性値についての記述がない状態である。
これに対して、「検出されたimgタグにおける代替文字列についての記述が不備でない(備わっている)状態とは、図3(A)に例示したように、imgタグにおいて、「alt="花"」のように、属性altの記述があり、かつ、有効な属性値が記述されている状態である。
検出されたimgタグにおける代替文字列についての記述が備わっていた場合(ステップS104−NO)、代替文字列を挿入する必要性はない。そこで、この場合の画像要素検出部120は、後述のステップS112に移行する。
一方、検出されたimgタグにおける代替文字列についての記述が備わっていない場合(ステップS104−YES)、アクセシビリティ確保のために代替文字列を挿入すべきことになる。
そこで、この場合には、画像取得部130が、検出されたimgタグが示す画像を取得する(ステップS105)。この際、画像取得部130は、検出されたimgタグにおける属性srcが示す画像ファイルを、送受信部110が記憶するウェブページのデータから呼び出す。
画像取得部130は、取得した画像(画像ファイル)を画像検索エンジン300、及び機械学習エンジン400のそれぞれに対して送信する(ステップS106)。
画像検索エンジン300は、それぞれ受信された画像に類似する画像を検索し、検索結果として得られた画像(検索画像)を、画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。また、機械学習エンジン400は、前述のように受信された画像についての説明文を生成し、生成した説明文としての文字列を画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。
送受信部110は、上記のように画像検索エンジン300と機械学習エンジン400とから送信された画像関連情報を受信する。
そこで、この場合には、画像取得部130が、検出されたimgタグが示す画像を取得する(ステップS105)。この際、画像取得部130は、検出されたimgタグにおける属性srcが示す画像ファイルを、送受信部110が記憶するウェブページのデータから呼び出す。
画像取得部130は、取得した画像(画像ファイル)を画像検索エンジン300、及び機械学習エンジン400のそれぞれに対して送信する(ステップS106)。
画像検索エンジン300は、それぞれ受信された画像に類似する画像を検索し、検索結果として得られた画像(検索画像)を、画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。また、機械学習エンジン400は、前述のように受信された画像についての説明文を生成し、生成した説明文としての文字列を画像関連情報としてウェブアクセシビリティ解析サーバ100に送信する。
送受信部110は、上記のように画像検索エンジン300と機械学習エンジン400とから送信された画像関連情報を受信する。
文字列情報取得部150は、画像検索エンジン300から送信された画像関連情報としての検索画像が受信されたことに応じて、受信された検索画像を送受信部110から取得する(ステップS107)。
次に、文字列情報取得部150は、取得した検索画像に関連する文字列を、前述のようにテキストやリンクなどから抽出する(ステップS108)。即ち、文字列情報取得部150は、検索画像に対応する文字列情報を取得する。
なお、ステップS107とステップS108の処理は、画像検索エンジン300−1、300−2、300−3のそれぞれから送信された検索画像が受信されるごとに実行される。
次に、文字列情報取得部150は、取得した検索画像に関連する文字列を、前述のようにテキストやリンクなどから抽出する(ステップS108)。即ち、文字列情報取得部150は、検索画像に対応する文字列情報を取得する。
なお、ステップS107とステップS108の処理は、画像検索エンジン300−1、300−2、300−3のそれぞれから送信された検索画像が受信されるごとに実行される。
また、文字列情報取得部150は、機械学習エンジン400から送信された画像関連情報としての説明文の文字列が受信されたことに応じて、説明文の文字列を文字列情報として取得する(ステップS109)。
上記のように、ステップS107、S108により画像検索エンジン300から送信された検索画像ごとに対応する文字列情報が取得され、ステップS109により機械学習エンジン400から送信された説明文に対応する文字列情報が取得される。
代替文字列決定部160は、上記のように取得された複数の文字列情報を利用して、例えば図4による説明のように代替文字列を決定する(ステップS110)。
代替文字列決定部160は、上記のように取得された複数の文字列情報を利用して、例えば図4による説明のように代替文字列を決定する(ステップS110)。
情報挿入部170は、ステップS110により決定された代替文字列を、ステップS101により取得されたウェブページのHTMLファイルに挿入する処理を行う(ステップS111)。
代替文字列の挿入箇所は、ステップS103に対応して検出されたimgタグ内となる。ここで、図3(B)に例示したようにimgタグにおいて属性alt自体の記述がなかった場合には、属性altを新たに記述するとともに属性値として代替文字列を記述するように挿入を行う。また、図3(C)に例示したように、imgタグにおいて属性altの記述はあるが、有効な属性値が記述されてない場合には、属性altを新たに記述する必要はなく、属性値としての代替文字列を記述するように挿入を行う。
代替文字列の挿入箇所は、ステップS103に対応して検出されたimgタグ内となる。ここで、図3(B)に例示したようにimgタグにおいて属性alt自体の記述がなかった場合には、属性altを新たに記述するとともに属性値として代替文字列を記述するように挿入を行う。また、図3(C)に例示したように、imgタグにおいて属性altの記述はあるが、有効な属性値が記述されてない場合には、属性altを新たに記述する必要はなく、属性値としての代替文字列を記述するように挿入を行う。
ステップS111による代替文字列の挿入を行った後、あるいはステップS103にてimgタグではないことが判定された場合(ステップS103−NO)、あるいは、ステップS104にて代替文字列についての記述に不備がないと判定された場合(ステップS104−NO)、以下の処理が行われる。つまり、画像要素検出部120は、HTMLファイルにおける最終行まで要素の検出を終了したか否かについて判定する(ステップS112)。
HTMLファイルにおいてまだ要素の検出が終了していない場合(ステップS112−NO)、画像要素検出部120は、ステップS102に処理を戻すことで、さらに次の行を対象として要素の検出を行っていく。
そして、最終行まで要素の検出が終了されると(ステップS112−YES)、情報挿入部170は、以下の処理を実行する。つまり、最終行まで要素の検出が終了した段階では、ウェブページのHTMLファイルにおける代替文字列についての記述が不備であった箇所の全てに代替文字列が挿入されており、不備が解消された状態にある。
そこで、情報挿入部170は、前述のように、代替文字列挿入後のHTMLファイルをウェブサーバ200に送信することで、ウェブサーバ200にてHTMLファイルを更新させる(ステップS113)。
そして、最終行まで要素の検出が終了されると(ステップS112−YES)、情報挿入部170は、以下の処理を実行する。つまり、最終行まで要素の検出が終了した段階では、ウェブページのHTMLファイルにおける代替文字列についての記述が不備であった箇所の全てに代替文字列が挿入されており、不備が解消された状態にある。
そこで、情報挿入部170は、前述のように、代替文字列挿入後のHTMLファイルをウェブサーバ200に送信することで、ウェブサーバ200にてHTMLファイルを更新させる(ステップS113)。
以上説明したように、本実施形態におけるウェブアクセシビリティ解析サーバ100は、解析対象のウェブページに配置される画像についての代替文字列を決定することができる。代替文字列の決定にあたって、ウェブアクセシビリティ解析サーバ100は、画像検索エンジン300と機械学習エンジン400に代替文字列の挿入対象に対応する画像を送信し、画像検索エンジン300から送信された検索画像に関連する文字列情報と、機械学習エンジン400から送信された画像についての説明文による文字列情報とを照合するようにされている。このようにして代替文字列を決定することで、本実施形態においては、例えば装飾目的の画像に限定されることなく、多様な画像に対応して的確に代替文字列を決定することができる。例えば、本実施形態の場合であれば、文字列が含まれていない画像であっても的確に代替文字列を決定できる。
また、例えば画像と代替テキストとの対をデータベースに蓄積しておき、データベースを参照して画像に対応する代替テキストを提示するようにされた構成も知られている。しかしながら、このような構成では、十分な数の画像と代替テキストとの対をデータベースに蓄積させるにあたって人手による作業が必要になる。これに対して、本実施形態の場合であれば、画像検索エンジン300と機械学習エンジン400とを利用しているため、画像と代替テキストとの対をデータベースに蓄積させるための人的作業は不要である。
また、例えば画像と代替テキストとの対をデータベースに蓄積しておき、データベースを参照して画像に対応する代替テキストを提示するようにされた構成も知られている。しかしながら、このような構成では、十分な数の画像と代替テキストとの対をデータベースに蓄積させるにあたって人手による作業が必要になる。これに対して、本実施形態の場合であれば、画像検索エンジン300と機械学習エンジン400とを利用しているため、画像と代替テキストとの対をデータベースに蓄積させるための人的作業は不要である。
<第2実施形態>
続いて、第2実施形態について説明する。先の第1実施形態においては、ウェブアクセシビリティ解析サーバ100が、1つの代替文字列を決定し、決定した代替文字列を解析対象のウェブページのHTMLファイルに挿入するようにされていた。
これに対して、本実施形態におけるウェブアクセシビリティ解析サーバ100は、代替文字列の決定結果として、複数の文字列を出力してよい。ウェブアクセシビリティ解析サーバ100は、決定された代替文字列を代替文字列候補としてウェブサイト制作者端末500にて提示する。本実施形態において、ウェブアクセシビリティ解析サーバ100は、ウェブサイト制作者端末500にて、画面表示により代替文字列候補が提示されるようにする。
続いて、第2実施形態について説明する。先の第1実施形態においては、ウェブアクセシビリティ解析サーバ100が、1つの代替文字列を決定し、決定した代替文字列を解析対象のウェブページのHTMLファイルに挿入するようにされていた。
これに対して、本実施形態におけるウェブアクセシビリティ解析サーバ100は、代替文字列の決定結果として、複数の文字列を出力してよい。ウェブアクセシビリティ解析サーバ100は、決定された代替文字列を代替文字列候補としてウェブサイト制作者端末500にて提示する。本実施形態において、ウェブアクセシビリティ解析サーバ100は、ウェブサイト制作者端末500にて、画面表示により代替文字列候補が提示されるようにする。
図6は、ウェブサイト制作者端末500において代替文字列候補の提示のために表示される画面(代替文字列候補提示画面)の一例を示している。
同図の代替文字列候補提示画面においては、左上側に配置されるウェブページ描画領域AR1と、右上側に配置されるソースコード表示領域AR2と、代替文字列候補提示領域AR3とを含む。
同図の代替文字列候補提示画面においては、左上側に配置されるウェブページ描画領域AR1と、右上側に配置されるソースコード表示領域AR2と、代替文字列候補提示領域AR3とを含む。
ウェブページ描画領域AR1には、ウェブアクセシビリティ解析対象のウェブページをウェブブラウザで描画させた状態が表示される。ウェブページ描画領域AR1においては、代替文字列の挿入対象とされた対象画像Pobjが所定の態様で選択表示される。なお、ウェブページ描画領域AR1において代替文字列候補のある画像が複数存在する場合には、ウェブページ描画領域AR1において、これら複数の画像のそれぞれについて代替文字列候補のあることを示す所定の態様による表示が行われる。これにより、ウェブサイト制作者は、ウェブページに配置される画像のうちで、代替文字列候補のある画像と代替文字列候補の無い画像とを区別できる。
そのうえで、ウェブサイト制作者が、代替文字列候補のある画像のうちから、1つの画像を代替文字列の挿入対象として選択する操作をウェブページ描画領域AR1に対して行うことにより、選択された画像が対象画像Pobjとして選択表示される。
そのうえで、ウェブサイト制作者が、代替文字列候補のある画像のうちから、1つの画像を代替文字列の挿入対象として選択する操作をウェブページ描画領域AR1に対して行うことにより、選択された画像が対象画像Pobjとして選択表示される。
ソースコード表示領域AR2には、ウェブアクセシビリティ解析対象のウェブページにおけるHTMLファイルのソースコードが表示される。そのうえで、ソースコード表示領域AR2においては、ウェブページ描画領域AR1に対する操作によって選択された対象画像Pobjに対応するimgタグの行が強調表示される。同図のimgタグにおいては、代替文字列についての記述が不備な状態として、属性altに対応して有効な属性値が記述されていない状態が示されている。
なお、ソースコード表示領域AR2に対して、代替文字列についての記述が不備なimgタグの行を選択する操作を行うことで、代替文字列の挿入対象を選択できるようにしてもよい。この場合には、ソースコード表示領域AR2においてimgタグの行が選択されたことに応じて、ウェブページ描画領域AR1において対応の画像が対象画像Pobjとして選択表示される。
なお、ソースコード表示領域AR2に対して、代替文字列についての記述が不備なimgタグの行を選択する操作を行うことで、代替文字列の挿入対象を選択できるようにしてもよい。この場合には、ソースコード表示領域AR2においてimgタグの行が選択されたことに応じて、ウェブページ描画領域AR1において対応の画像が対象画像Pobjとして選択表示される。
代替文字列候補提示領域AR3には、代替文字列の挿入対象として選択された画像に対応して決定された代替文字列候補が表示される。同図においては、「文字列1」、「文字列2」、「文字列3」、「文字列4」との4つの代替文字列候補が提示された場合が示されている。「文字列1」、「文字列2」、「文字列3」、「文字列4」には、それぞれ具体的な文字列が表示される。
ウェブサイト制作者は、代替文字列候補提示領域AR3において提示されている複数の代替文字列候補のうちから、最も適切な代替文字列候補を1つ判断する。最も適切な代替文字列候補の判断にあたっては、ウェブサイト制作者は、対象画像Pobjの画像内容、ウェブページにおける対象画像Pobjに関するテキストの内容などを考慮すればよい。
ウェブサイト制作者は、最適であると判断した1つの代替文字列候補をHTMLファイルに挿入する代替文字列として指定するための所定操作を行う。
ウェブサイト制作者は、最適であると判断した1つの代替文字列候補をHTMLファイルに挿入する代替文字列として指定するための所定操作を行う。
ウェブサイト制作者は、上記のようにして、ウェブアクセシビリティ解析対象のウェブページにおいて代替文字列候補のある画像ごとに1つの代替文字列を指定する。そして、ウェブサイト制作者は、代替文字列候補のある画像の全てについて代替文字列の指定を完了させると、指定した代替文字列のHTMLファイルへの挿入を指示する所定の操作(挿入指示操作)を行う。
挿入指示操作に応じて、ウェブサイト制作者端末500は、ウェブアクセシビリティ解析サーバ100に対して、代替文字列の挿入を指示する挿入コマンドを送信する。挿入コマンドには、指定された代替文字列を示す情報と、指定された代替文字列ごとのHTMLファイルにおける挿入箇所とを示す情報とが含まれる。
挿入指示操作に応じて、ウェブサイト制作者端末500は、ウェブアクセシビリティ解析サーバ100に対して、代替文字列の挿入を指示する挿入コマンドを送信する。挿入コマンドには、指定された代替文字列を示す情報と、指定された代替文字列ごとのHTMLファイルにおける挿入箇所とを示す情報とが含まれる。
挿入コマンドの受信に応じて、ウェブアクセシビリティ解析サーバ100は、挿入コマンドにおいて示される代替文字列のそれぞれを、HTMLファイルに挿入する処理を実行する。ウェブアクセシビリティ解析サーバ100は、代替文字列挿入後のHTMLファイルをウェブサーバ200に送信し、ウェブサーバ200にてHTMLファイルを更新させる。
このように、本実施形態においては、HTMLファイルに挿入する代替文字列についての複数の候補をウェブサイト制作者に提示し、最終的にウェブサイト制作者の指定に応じて代替文字列の決定が行われるように構成される。このような構成によって、代替文字列の候補についてウェブサイト制作者が確認できるとともに、ウェブサイト制作者の制作意図を反映させたうえで、的確に代替文字列を決定することができる。
図7は、本実施形態におけるウェブアクセシビリティ解析サーバ100の構成例を示している。同図において、図2と同一部分には同一符号を付して説明を省略する。
同図に示されるように、本実施形態のウェブアクセシビリティ解析サーバ100は、情報提示部180をさらに備える。
同図に示されるように、本実施形態のウェブアクセシビリティ解析サーバ100は、情報提示部180をさらに備える。
情報提示部180は、代替文字列決定部160により決定された代替文字列を提示する。具体的に、情報提示部180は、代替文字列決定部160により決定された代替文字列を、代替文字列候補として提示するようにされた代替文字列候補提示画面(図6)を、ウェブサイト制作者端末500に表示させる。このために、情報提示部180は、解析対象のウェブページのデータと、代替文字列決定部160により決定された代替文字列とを利用して、代替文字列候補提示画面のデータを生成し、生成した代替文字列候補提示画面のデータをウェブサイト制作者端末500に送信する。
ウェブサイト制作者端末500は、受信された代替文字列候補提示画面のデータを利用して図6に示したように代替文字列候補提示画面を表示させる。なお、代替文字列候補提示画面のデータとしては、例えばウェブページ形式とすることができる。この場合、ウェブサイト制作者端末500は、ウェブブラウザ上でウェブページとして代替文字列候補提示画面を表示させればよい。
ウェブサイト制作者端末500は、受信された代替文字列候補提示画面のデータを利用して図6に示したように代替文字列候補提示画面を表示させる。なお、代替文字列候補提示画面のデータとしては、例えばウェブページ形式とすることができる。この場合、ウェブサイト制作者端末500は、ウェブブラウザ上でウェブページとして代替文字列候補提示画面を表示させればよい。
図8のフローチャートは、本実施形態におけるウェブアクセシビリティ解析サーバ100が実行する処理手順例を示している。
同図において、ステップS201〜S209の処理は、図5におけるステップS101〜S109と同様である。
同図において、ステップS201〜S209の処理は、図5におけるステップS101〜S109と同様である。
そして、本実施形態のウェブアクセシビリティ解析サーバ100において、代替文字列決定部160は、ステップS207、S208及びステップS209により取得した複数の文字列情報を利用して、例えば図4による説明のように代替文字列を決定する(ステップS210)。ここで、図5のステップS110においては、1つの代替文字列を決定するようにされていた。しかしながら、本実施形態のステップS210では、複数の代替文字列が決定結果とされてもよい。
一具体例として、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を代替文字列として決定するようにされている場合において、上記の総計が最も大きい候補文字列が複数である場合、代替文字列決定部160は、ステップS210にて、複数の候補文字列を代替文字列の決定結果としてよい。
そして、情報提示部180は、ステップS210により決定された1つの画像に対応して決定された代替文字列を記録する(ステップS211)。情報提示部180は、代替文字列を記録するにあたり、HTMLファイルにおける対応のimgタグの位置(挿入位置)を示す情報を対応付ける。
一具体例として、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を代替文字列として決定するようにされている場合において、上記の総計が最も大きい候補文字列が複数である場合、代替文字列決定部160は、ステップS210にて、複数の候補文字列を代替文字列の決定結果としてよい。
そして、情報提示部180は、ステップS210により決定された1つの画像に対応して決定された代替文字列を記録する(ステップS211)。情報提示部180は、代替文字列を記録するにあたり、HTMLファイルにおける対応のimgタグの位置(挿入位置)を示す情報を対応付ける。
ステップS211による代替文字列の記録を行った後、あるいはステップS203にてimgタグではないことが判定された場合(ステップS203−NO)、あるいは、ステップS204にて代替文字列についての記述に不備がないと判定された場合(ステップS204−NO)、以下の処理が行われる。つまり、画像要素検出部120は、HTMLファイルにおける最終行まで要素の検出を終了したか否かについて判定する(ステップS212)。
HTMLファイルにおいてまだ要素の検出が終了していない場合(ステップS212−NO)、画像要素検出部120は、ステップS202に処理を戻すことで、さらに次の行を対象として要素の検出を行っていく。
一方、最終行まで要素の検出が終了されると(ステップS212−YES)、情報提示部180が以下の処理を実行する。つまり、最終行まで要素の検出が終了した段階では、ウェブページのHTMLファイルにおける代替文字列についての記述が不備であった全ての要素ごとに対応して1以上の代替文字列が決定され、決定された代替文字列が記憶されている状態にある。また、記憶された代替文字列には、HTMLファイルにおける挿入位置を示す情報が対応付けられている。
そこで、情報提示部180は、記憶している代替文字列と挿入位置の情報と、解析対象のウェブページのデータとを利用して、例えば代替文字列候補提示画面のデータを生成する。前述のように、代替文字列候補提示画面のデータはウェブページ形式であればよい。情報提示部180は、生成した代替文字列候補提示画面のデータを、ウェブサイト制作者端末500に送信する(ステップS213)。
そこで、情報提示部180は、記憶している代替文字列と挿入位置の情報と、解析対象のウェブページのデータとを利用して、例えば代替文字列候補提示画面のデータを生成する。前述のように、代替文字列候補提示画面のデータはウェブページ形式であればよい。情報提示部180は、生成した代替文字列候補提示画面のデータを、ウェブサイト制作者端末500に送信する(ステップS213)。
前述のように、ウェブサイト制作者端末500は、受信された代替文字列候補提示画面のデータを利用して代替文字列候補提示画面を表示し、ウェブサイト制作者は、代替文字列候補提示画面に対する操作によって、代替文字列候補のある画像ごとに、代替文字列候補のうちから代替文字列を1つずつ指定したうえで、挿入指示操作を行う。挿入指示操作に応じて、ウェブサイト制作者端末500は、ウェブアクセシビリティ解析サーバ100に対して挿入コマンドを送信する。
ウェブアクセシビリティ解析サーバ100において、情報挿入部170は、受信された挿入コマンドが示す代替文字列をHTMLファイルに挿入する処理を行う(ステップS214)。
そして、情報挿入部170は、ステップS214により代替文字列が挿入されたHTMLファイルをウェブサーバ200に送信することで、ウェブサーバ200にてHTMLファイルを更新させる(ステップS215)。
ウェブアクセシビリティ解析サーバ100において、情報挿入部170は、受信された挿入コマンドが示す代替文字列をHTMLファイルに挿入する処理を行う(ステップS214)。
そして、情報挿入部170は、ステップS214により代替文字列が挿入されたHTMLファイルをウェブサーバ200に送信することで、ウェブサーバ200にてHTMLファイルを更新させる(ステップS215)。
<第3実施形態>
続いて、第3実施形態について説明する。図9は、本実施形態におけるウェブアクセシビリティ解析サーバ100の構成例を示している。同図において、図2と同一部分については同一符号を付して説明を省略する。
同図のウェブアクセシビリティ解析サーバ100は、図2の構成に対して、オントロジー辞書DIC1をさらに備える。オントロジー辞書DIC1は、例えば特定の概念に関連する語句をデータベース化して構築される辞書である。
本実施形態における代替文字列決定部160は、代替文字列を決定するにあたり、類義語データベースDB1とともに、オントロジー辞書DIC1を併用する。
具体的に、代替文字列決定部160は、まず、図4にて説明したように代替文字列を決定する。ここで、例えば、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を代替文字列として決定するようにされた場合において、決定結果として複数の代替文字列が得られた場合、代替文字列決定部160は、複数の代替文字列ごとに、オントロジー辞書DIC1と照合する。
一具体例として、以下のような事例を挙げる。図4の例のように候補文字列が得られた場合において、「ヘッドマウントディスプレイ」、「HMD」、「服」の3つの候補文字列が、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列であった。
そのうえで、ウェブアクセシビリティ解析サーバ100が解析対象とするウェブページは、情報技術(IT:Information Technology)に関連する記事であるため、オントロジー辞書DIC1は、情報技術の概念に該当する語句を含むよう構築されている。
この場合、代替文字列決定部160は、「ヘッドマウントディスプレイ」、「HMD」、「服」の3つの候補文字列をオントロジー辞書DIC1と照合させた結果、例えば「服」の候補文字列については情報技術の概念に該当しないことから、代替文字列の決定結果から除外する。このように、代替文字列決定部160は、代替文字列の候補文字列についてオントロジー辞書DIC1を用いてフィルタリングを行うことができる。このようにフィルタリングが行われることで、代替文字列決定部160により決定される代替文字列の的確さを向上させることが可能になる。
続いて、第3実施形態について説明する。図9は、本実施形態におけるウェブアクセシビリティ解析サーバ100の構成例を示している。同図において、図2と同一部分については同一符号を付して説明を省略する。
同図のウェブアクセシビリティ解析サーバ100は、図2の構成に対して、オントロジー辞書DIC1をさらに備える。オントロジー辞書DIC1は、例えば特定の概念に関連する語句をデータベース化して構築される辞書である。
本実施形態における代替文字列決定部160は、代替文字列を決定するにあたり、類義語データベースDB1とともに、オントロジー辞書DIC1を併用する。
具体的に、代替文字列決定部160は、まず、図4にて説明したように代替文字列を決定する。ここで、例えば、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を代替文字列として決定するようにされた場合において、決定結果として複数の代替文字列が得られた場合、代替文字列決定部160は、複数の代替文字列ごとに、オントロジー辞書DIC1と照合する。
一具体例として、以下のような事例を挙げる。図4の例のように候補文字列が得られた場合において、「ヘッドマウントディスプレイ」、「HMD」、「服」の3つの候補文字列が、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列であった。
そのうえで、ウェブアクセシビリティ解析サーバ100が解析対象とするウェブページは、情報技術(IT:Information Technology)に関連する記事であるため、オントロジー辞書DIC1は、情報技術の概念に該当する語句を含むよう構築されている。
この場合、代替文字列決定部160は、「ヘッドマウントディスプレイ」、「HMD」、「服」の3つの候補文字列をオントロジー辞書DIC1と照合させた結果、例えば「服」の候補文字列については情報技術の概念に該当しないことから、代替文字列の決定結果から除外する。このように、代替文字列決定部160は、代替文字列の候補文字列についてオントロジー辞書DIC1を用いてフィルタリングを行うことができる。このようにフィルタリングが行われることで、代替文字列決定部160により決定される代替文字列の的確さを向上させることが可能になる。
なお、本実施形態において、オントロジー辞書DIC1は、例えば概念が異なる複数のものが備えられていてもよい。代替文字列決定部160は、例えば解析対象のウェブページが該当するジャンルなどに応じて、複数のオントロジー辞書から適切なものを選んで使用することができる。
なお、上記各実施形態においては、画像検索エンジンによる画像検索結果と、機械学習エンジンによる画像解析結果(説明文)とを併用している。現状においては、画像検索エンジンによる画像検索結果と、機械学習エンジンによる画像解析結果とを併用することで、いずれか一方の結果を利用する場合よりも、代替文字列についての決定精度を高めることが期待できる。しかしながら、本実施形態においては、機械学習エンジンによる画像解析結果を用いずに複数の画像検索エンジンによる画像検索結果を用いて代替文字列を決定するようにしてもよい。あるいは逆に、本実施形態においては、画像検索エンジンによる画像検索結果を用いずに、複数の機械学習エンジンによる画像解析結果を用いて代替文字列を決定するようにしてもよい。
また、図2、図7、図9などに示したウェブアクセシビリティ解析サーバ100の機能部は、1つの装置に備えられてもよいし、複数の装置に分散されるようにして備えられてもよい。
なお、上述のウェブアクセシビリティ解析サーバ100としての機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより上述のウェブアクセシビリティ解析サーバ100としての処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD−ROM等の非一過性の記録媒体であってもよい。また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部または外部に設けられた記録媒体も含まれる。配信サーバの記録媒体に記憶されるプログラムのコードは、端末装置で実行可能な形式のプログラムのコードと異なるものでもよい。すなわち、配信サーバからダウンロードされて端末装置で実行可能な形でインストールができるものであれば、配信サーバで記憶される形式は問わない。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に端末装置で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
100 ウェブアクセシビリティ解析サーバ、110 送受信部、120 画像要素検出部、130 画像取得部、140 画像出力部、150 文字列情報取得部、160 代替文字列決定部、170 情報挿入部、180 情報提示部、200 ウェブサーバ、300 画像検索エンジン、300−1 画像検索エンジン、300−2 画像検索エンジン、300−3 画像検索エンジン、400 機械学習エンジン、500 ウェブサイト制作者端末、600 通信網
Claims (9)
- ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部と、
前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部と、
入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部と、
前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部と、
前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部と
を備えるコンテンツ処理装置。 - 前記代替文字列決定部により決定された代替文字列を、前記画像取得部により取得された画像に対応する要素に挿入する情報挿入部をさらに備える
請求項1に記載のコンテンツ処理装置。 - 前記代替文字列決定部により決定された代替文字列を提示する情報提示部をさらに備える請求項1または2に記載のコンテンツ処理装置。
- 前記文字列情報取得部は、
前記画像関連情報出力装置が画像としての前記画像関連情報を出力する場合には、出力された画像に関連する文字列を抽出し、抽出した文字列を前記文字列情報として取得し、
前記画像関連情報出力装置が文字列としての前記画像関連情報を出力する場合には、出力された文字列を前記文字列情報として取得する
請求項1から3のいずれか一項に記載のコンテンツ処理装置。 - 前記代替文字列決定部は、前記複数の文字列情報の間での形態素の一致に関する判定結果に基づいて、前記代替文字列を決定する
請求項1から4のいずれか一項に記載のコンテンツ処理装置。 - 前記複数の画像関連情報出力装置のうちの少なくとも1つは、所定のアルゴリズムに従って、入力された画像に関連する画像を検索し、検索した画像を前記画像関連情報として出力する
請求項1から5のいずれか一項に記載のコンテンツ処理装置。 - 前記複数の画像関連情報出力装置のうちの少なくとも1つは、所定のアルゴリズムに従って行う機械学習に基づいて、前記入力された画像を説明する文字列を前記画像関連情報として出力する
請求項1から6のいずれか一項に記載のコンテンツ処理装置。 - ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出ステップと、
前記画像要素検出ステップによる検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得ステップと、
入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得ステップにより取得された画像を出力する画像出力ステップと、
前記画像出力ステップにより出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得ステップと、
前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定ステップと
を含むコンテンツ処理方法。 - コンピュータを、
ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部、
前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部、
入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部、
前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部、
前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016116599A JP2017220179A (ja) | 2016-06-10 | 2016-06-10 | コンテンツ処理装置、コンテンツ処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016116599A JP2017220179A (ja) | 2016-06-10 | 2016-06-10 | コンテンツ処理装置、コンテンツ処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017220179A true JP2017220179A (ja) | 2017-12-14 |
Family
ID=60656219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016116599A Pending JP2017220179A (ja) | 2016-06-10 | 2016-06-10 | コンテンツ処理装置、コンテンツ処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017220179A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019150416A1 (ja) * | 2018-01-30 | 2019-08-08 | 株式会社オプティム | 電子データの変換システム、方法及びプログラム |
KR20210152355A (ko) * | 2020-06-08 | 2021-12-15 | (주)에스앤씨랩 | 웹 접근성 및 개방성 평가 방법 및 장치 |
KR102659218B1 (ko) * | 2023-12-22 | 2024-04-19 | 주식회사 인시퀀스 | 인공지능에 기반하여 이미지를 html로 변환하는 시스템 |
-
2016
- 2016-06-10 JP JP2016116599A patent/JP2017220179A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019150416A1 (ja) * | 2018-01-30 | 2019-08-08 | 株式会社オプティム | 電子データの変換システム、方法及びプログラム |
KR20210152355A (ko) * | 2020-06-08 | 2021-12-15 | (주)에스앤씨랩 | 웹 접근성 및 개방성 평가 방법 및 장치 |
KR102428985B1 (ko) * | 2020-06-08 | 2022-08-04 | (주)에스앤씨랩 | 웹 접근성 및 개방성 평가 방법 및 장치 |
KR102659218B1 (ko) * | 2023-12-22 | 2024-04-19 | 주식회사 인시퀀스 | 인공지능에 기반하여 이미지를 html로 변환하는 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20090300046A1 (en) | Method and system for document classification based on document structure and written style | |
Abbas | Quran'search for a concept'tool and website | |
JP2007334894A (ja) | ドキュメントの注釈をソースドキュメントのコンテキスト内で視覚化すること | |
JP2003114906A (ja) | ユーザ定義可能なパーソナリティを備えたメタ文書管理システム | |
EP2570937A1 (en) | Data search device, data search method and program | |
JP4865526B2 (ja) | データマイニングシステム、データマイニング方法及びデータ検索システム | |
CN111079043A (zh) | 一种关键内容定位方法 | |
JP2011100403A (ja) | 情報処理装置、情報抽出方法、プログラム及び情報処理システム | |
KR20090080822A (ko) | 감성 기반의 아이템 검색 서비스 제공 방법, 데이터베이스구축 방법 및 검색 서버 | |
JP4967037B2 (ja) | 情報検索装置、情報検索方法、端末装置、およびプログラム | |
KR20120064559A (ko) | 오픈 웹 질의응답을 위한 질문분석 장치 및 방법 | |
US9626439B2 (en) | Method for searching in a database | |
JP2017220179A (ja) | コンテンツ処理装置、コンテンツ処理方法及びプログラム | |
KR101505673B1 (ko) | 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템 | |
CN117251527A (zh) | 医学循证方法、系统、电子设备及存储介质 | |
KR101802051B1 (ko) | 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템 | |
WO2015162464A1 (en) | Method and system for generating a definition of a word from multiple sources | |
Fauzi et al. | Image understanding and the web: a state-of-the-art review | |
JP4499179B1 (ja) | 端末装置 | |
WO2020079752A1 (ja) | 文献検索方法および文献検索システム | |
JP6106489B2 (ja) | 語義解析装置、及びプログラム | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
JP2006227914A (ja) | 情報検索装置、情報検索方法、プログラム、記憶媒体 | |
JP5187187B2 (ja) | 体験情報検索システム | |
JP2008171164A (ja) | 分類付与支援装置及び方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160613 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181102 |