JP2017220179A

JP2017220179A - コンテンツ処理装置、コンテンツ処理方法及びプログラム

Info

Publication number: JP2017220179A
Application number: JP2016116599A
Authority: JP
Inventors: 良仁秋元; Yoshihito Akimoto; 直矢 ▲柳▼澤; Naoya Yanagisawa
Original assignee: Toppan Printing Co Ltd
Current assignee: Toppan Inc
Priority date: 2016-06-10
Filing date: 2016-06-10
Publication date: 2017-12-14

Abstract

【課題】ウェブページに配置される多様な画像に対応する代替文字列を的確に特定できるようにする。【解決手段】ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部と、代替文字列に関する記述が不備であると検出された要素に対応する画像をウェブページから取得する画像取得部と、複数の画像関連情報出力装置に対して、画像取得部により取得された画像を出力する画像出力部と、画像出力部により出力された画像の入力に応じて複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部と、複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて代替文字列を決定する代替文字列決定部とを備えてコンテンツ処理装置を構成する。【選択図】図５

Description

本発明は、コンテンツ処理装置、コンテンツ処理方法及びプログラムに関する。

インターネット利用のひとつとしてウェブサイトの閲覧が行われている。ウェブサイトを構成するウェブページは、例えばＨＴＭＬ（HyperText Markup Language）ファイルなどの構造化文書、画像などから成り、構造化文書の記述内容に則って再生され、ウェブブラウザ上で表示される。

ここで、ウェブサイトをインターネット上で公開するウェブサイト運用者には、「ウェブアクセシビシリティ」を考慮したウェブページの提供が求められている。「ウェブアクセシビシリティ」とは、「高齢者や障害者など心身の機能に制約のある人でも、年齢的、身体的条件に関わらず、ウェブで提供されている情報にアクセスし利用できること」をいう。
ウェブアクセシビリティが確保されたウェブページをどのように制作するのかについては、Ｗ３Ｃ（World Wide Web Consortium）やＪＩＳ（Japanese Industrial Standards）により、ガイドラインが策定されている。
上記のガイドラインによれば、例えば、高齢者や視覚障害者への配慮として、「すべての非テキストコンテンツには代替テキストを提供して、拡大印刷、点字、音声、シンボル、平易な言葉などのような、ユーザが必要とする形式に変換できるようにする」という指針が示されている。
上記の指針への対応のひとつとして、ウェブページの内容を音声読み上げソフトウェアを用いて読み上げるというものがある。この場合において、ウェブページに配置された画像がどのような内容であるのかについて音声読み上げができるようにするために、構造化文書において、画像を指し示すｉｍｇタグの属性ａｌｔの属性値として、単語や短文等の簡潔な代替テキストを挿入することが行われる。このように構造化文書に代替テキストを挿入することで、挿入された代替テキストを音声読み上げすることによって、画像の内容を音声でユーザに伝えることができる。

上記のように、ウェブページにて配置される画像に対応させて代替テキストを挿入するにあたっては、ウェブアクセシビリティの目的上、挿入される代替テキストが画像を的確に表す内容であることが求められる。
そこで、ウェブページにおける装飾目的の画像に対し適切な代替テキストを付加するため、以下のようなＷｅｂコンテンツ変換装置の構成が知られている。つまり、Ｗｅｂコンテンツ変換装置は、ウェブページに含まれる画像データの表示サイズ、データサイズを検出し、設定した閾値を超えている場合、装飾を目的とする画像であると判定して、代替テキストとして装飾画像に対応するａｌｔ属性を、例えば空（ｅｍｐｔｙ）にするというものである（例えば、特許文献１参照）。

国際公開第２０１１／１２５４１９号

しかしながら、特許文献１に記載のＷｅｂコンテンツ変換装置が代替テキスト（代替文字列）付加の対象としているのは装飾目的の画像に限られており、ａｌｔ属性を空（ｅｍｐｔｙ）にするという処理が行われる。このため、特許文献１の技術によっては、ウェブページに配置される多様な画像に関して代替文字列の適切な内容を特定することはできない。

本発明は、このような事情に鑑みてなされたもので、ウェブページに配置される多様な画像に対応する代替文字列を的確に特定できるようにすることを目的とする。

上述した課題を解決するために、本発明の一態様は、前記ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部と、前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部と、入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部と、前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部と、前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部とを備えるコンテンツ処理装置である。

本発明の一態様は、前記ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出ステップと、前記画像要素検出ステップによる検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得ステップと、入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得ステップにより取得された画像を出力する画像出力ステップと、前記画像出力ステップにより出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得ステップと、前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定ステップとを含むコンテンツ処理方法である。

本発明の一態様は、コンピュータを、前記ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部、前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部、入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部、前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部、前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部として機能させるためのプログラム。

本発明によれば、ウェブページに配置される多様な画像に対応する代替文字列を的確に特定できるようになるという効果が得られる。

第１実施形態におけるコンテンツ処理システムの構成例を示す図である。第１実施形態におけるウェブアクセシビリティ解析サーバの構成例を示す図である。第１実施形態における画像要素検出の具体例について説明する図である。第１実施形態における代替文字列決定部が行う処理の一例について説明する。第１実施形態におけるウェブアクセシビリティ解析サーバが実行する処理手順例を示すフローチャートである。第２実施形態における代替文字列候補提示画面の一例を示す図である。第２実施形態におけるウェブアクセシビリティ解析サーバの構成例を示す図である。第２実施形態におけるウェブアクセシビリティ解析サーバが実行する処理手順例を示すフローチャートである。第３実施形態におけるウェブアクセシビリティ解析サーバの構成例を示す図である。

＜第１実施形態＞
図１は、本実施形態におけるコンテンツ処理システムの構成例を示している。同図のコンテンツ処理システムは、ウェブアクセシビリティ解析サーバ１００（コンテンツ処理装置の一例）、ウェブサーバ２００、画像検索エンジン３００−１、３００−２、３００−３（画像関連情報出力装置の一例）、及び機械学習エンジン４００（画像関連情報出力装置の一例）、及びウェブサイト制作者端末５００を備える。
なお以降の説明にあたり、画像検索エンジン３００−１、３００−２、３００−３について特に区別しない場合には、画像検索エンジン３００と記載する。

ウェブアクセシビリティ解析サーバ１００、ウェブサーバ２００、画像検索エンジン３００、機械学習エンジン４００、及びウェブサイト制作者端末５００は、通信網６００を介して通信可能に接続される。本実施形態において、通信網６００はインターネットであるが、例えばＬＡＮ（Local Area Network）などであってもよい。

ウェブアクセシビリティ解析サーバ１００は、ウェブページ（コンテンツの一例）を入力してアクセシビリティに関する解析を行う。ウェブアクセシビリティ解析サーバ１００は、ウェブサーバ２００がインターネット上で公開するウェブサイトを構成するウェブページのうちから、解析対象のウェブページを入力する。
ここでの解析対象のウェブページの入力としては、例えば以下のような態様を考えることができる。ウェブサイト制作者が、ウェブサイト制作者端末５００を操作して、例えばウェブアクセシビリティ解析サーバ１００における解析対象のウェブページ指定のためのウェブページにアクセスさせる。ウェブサイト制作者は、アクセスしたウェブページにおいて表示される入力フォームに、ウェブサーバ２００が公開するウェブページのうちで解析対象とするウェブページのＵＲＬ（Uniform Resource Locator）を入力する。これにより、解析対象のウェブページをウェブアクセシビリティ解析サーバ１００に対して通知することが行われる。ウェブアクセシビリティ解析サーバ１００は、入力されたＵＲＬにアクセスしてウェブページをダウンロードすることにより、解析対象のウェブページを入力する。
アクセシビリティに関する解析として、ウェブアクセシビリティ解析サーバ１００は、入力されたウェブページに配置される画像のうちで、当該ウェブページのＨＴＭＬファイル（構造化文書の一例）における代替文字列についての記述が不備な要素に対応するものを検出する。「代替文字列についての記述が不備な要素」とは、画像を示す要素であるｉｍｇタグとして、ａｌｔ属性の値が記述されていないもの、あるいは、ａｌｔ属性そのものの記述がないものである。このように代替文字列についての記述が不備である要素に対応する画像は、アクセシビリティが確保されていない画像であることになる。

ウェブアクセシビリティ解析サーバ１００は、代替テキストについての記述が不備である要素に対応して最適とされる内容の代替文字列を決定する。ウェブアクセシビリティ解析サーバ１００は、代替文字列の内容を決定するにあたり、対象となる画像についての画像検索エンジン３００のそれぞれによる検索結果と、対象となる画像を説明する説明文として機械学習エンジン４００が出力した文字列（テキスト）の情報を利用する。
そのうえで、本実施形態のウェブアクセシビリティ解析サーバ１００は、決定した代替文字列を、解析対象のウェブページのＨＴＭＬファイルに挿入する。つまり、本実施形態のウェブアクセシビリティ解析サーバ１００は、ウェブページにおいて代替テキストの記述が不備である要素について最適な内容の代替テキストを決定し、決定した代替テキストを挿入する。このようなコンテンツ処理によって、画像への代替文字列の対応付けに関してウェブアクセシビリティの確保が図られる。そして、ウェブサーバ２００は、ウェブアクセシビリティが確保されたウェブページをインターネット上で公開できる。

ウェブサーバ２００は、ＷＷＷ（World Wide Web）に対応するシステムを実装し、１以上のウェブページにより構築されるウェブサーバをインターネット上で公開するサーバである。本実施形態においては、ウェブサーバ２００が公開するウェブサイトを構成するウェブページが、ウェブアクセシビリティ解析サーバ１００によるアクセシビリティ解析対象となる。

画像検索エンジン３００は、入力された画像（入力画像）に類似する画像を検索し、検索した画像を出力する。画像検索エンジン３００が検索対象とする画像は、例えば、インターネット上に存在する画像である。インターネット上に存在する画像は、例えばインターネット上で公開されるウェブページに含まれる画像である。
画像検索エンジン３００−１、３００−２、３００−３の画像検索のアルゴリズムはそれぞれ異なっている。従って、画像検索エンジン３００−１、３００−２、３００−３の同じ入力画像に対する検索結果は異なっていてかまわない。
機械学習エンジン４００は、所定の機械学習のアルゴリズムに従った学習結果を用いて、入力画像についての説明文を生成する。例えば機械学習エンジン４００は、入力された画像において示される物体を検出し、検出した物体について分類を行い、分類についてラベル付けを行うことで画像の説明文を生成する。

なお、ウェブサーバ２００、画像検索エンジン３００、及び機械学習エンジン４００は、ウェブアクセシビリティ解析サーバ１００の運用者とは異なる運用者により構築された外部のシステムを利用してもよい。
また、同図においては、それぞれ１つのウェブサーバ２００、３つの画像検索エンジン３００、１つの機械学習エンジン４００が示されている。しかしながら、コンテンツ処理システムにおけるウェブサーバ２００、画像検索エンジン３００と機械学習エンジン４００との数は、それぞれ１以上であればよく、特に限定されない。

ウェブサイト制作者端末５００は、ウェブサーバ２００が公開するウェブサイトを制作する者（ウェブサイト制作者）が使用する端末である。ウェブサイト制作者は、ウェブサーバ２００の運用者と同じであってもよいし、ウェブサーバ２００の運用者から依頼されてウェブサーバ２００のウェブサイトを制作する者であってもよい。
ウェブサイト制作者は、例えばウェブサイト制作者端末５００を使用してウェブサイトを制作することができる。また、ウェブサイト制作者は、制作したウェブサイトのウェブページをウェブサイト制作者端末５００から通信網６００経由でウェブサーバ２００にアップロードすることができる。

図２を参照して、本実施形態におけるウェブアクセシビリティ解析サーバ１００の構成例について説明する。同図に示されるように、本実施形態のウェブアクセシビリティ解析サーバ１００は、送受信部１１０、画像要素検出部１２０、画像取得部１３０、画像出力部１４０、文字列情報取得部１５０、代替文字列決定部１６０、情報挿入部１７０及び類義語データベースＤＢ１を備える。

送受信部１１０は、通信網６００を介した通信によって情報の送受信を行う。
例えば、送受信部１１０は、ウェブアクセシビリティ解析対象となるウェブページをウェブサーバ２００から受信する。
ウェブアクセシビリティ解析対象のウェブページは、例えばウェブサイト制作者がウェブサイト制作者端末５００を操作して指定することができる。具体的には、例えばウェブサイト制作者がウェブサイト制作者端末５００をウェブアクセシビリティ解析サーバ１００にアクセスさせることで、ウェブアクセシビリティ解析に関する操作が可能な操作画面をウェブサイト制作者端末５００に表示させる。ウェブサイト制作者は操作画面に対する操作を行って、ウェブアクセシビリティの解析対象とするウェブページを指定する。ウェブアクセシビリティ解析サーバ１００における送受信部は、ウェブアクセシビリティの解析対象として指定されたウェブページをウェブサーバ２００に要求する。
なお、例えば、ウェブサイト制作者端末５００にウェブサーバ２００のウェブサイトと同じデータが記憶されている場合、アクセシビリティ解析対象のウェブページを、ウェブサイト制作者端末５００からウェブアクセシビリティ解析サーバ１００に送信（アップロード）するようにしてもよい。また、上記のようにウェブサイト制作者端末５００からアクセシビリティ解析サーバ１００に、アクセシビリティ解析対象のウェブページをアップロードさせる場合、アクセシビリティ解析対象のウェブページは、ウェブサーバ２００に現在公開されているものと同じでなくともよい。例えば、アクセシビリティ解析対象のウェブページは、将来的にウェブサーバ２００に公開する予定のあるものであって、ウェブサーバ２００に現在公開されているものと異なるものであってもよい。

また、送受信部１１０は、解析対象のウェブページに配置される画像のうちで代替文字列の挿入対象となった画像（代替文字列についての記述が不備な要素（「ｉｍｇ」）に対応する画像）を、画像検索エンジン３００、及び機械学習エンジン４００に送信する。
また、送受信部１１０は、画像検索エンジン３００のそれぞれにより検索された画像（画像関連情報の一例）を受信する。また、送受信部１１０は、代替文字列の挿入対象となった画像を入力した機械学習エンジン４００が生成した画像についての説明文としての文字列（テキスト）の情報（画像関連情報の一例）を受信する。
また、送受信部１１０は、画像についての代替文字列を挿入したウェブページをウェブサーバ２００に送信する。ウェブサーバ２００は、解析対象とされたウェブページを、ウェブアクセシビリティ解析サーバ１００から受信したウェブページで置き換える。このような処理によって、ウェブサーバ２００が公開するウェブページについてアクセシビリティが確保されるように変更が行われる。

画像要素検出部１２０は、ウェブページに配置される画像に対応する要素における代替文字列に関する記述についての検出（画像要素検出）を行う。
図３を参照して、画像要素検出部１２０が行う画像要素検出の具体例について説明する。同図においては、解析対象のウェブページのＨＴＭＬファイルにおける記述内容例が示されている。
ＨＴＭＬファイルは、マークアップ言語であるＨＴＭＬにより記述された文書のファイルである。ＨＴＭＬファイルは、テキストによる文書と、文書構造を定義した情報とで形成されるファイルである。ＨＴＭＬファイルにおける文書構造の定義は、文書を形成する要素（ノード）をタグとして定義することによって行われる。ＨＴＭＬファイルのように文書構造が定義された文書は構造化文書とも呼ばれる。
なお、ウェブページの構造化文書としては、ＨＴＭＬファイルに限定されるものではなく、例えばＸＭＬ（Extensible Markup Language）、ＳＧＭＬ（Standard Generalized Markup Language）などのように、他のマークアップ言語により記述されたファイルなどであってもよい。

画像要素検出部１２０は、まず、解析対象として入力したウェブページのＨＴＭＬファイルを解析することで、画像としての要素を示すｉｍｇタグを検出する。ｉｍｇタグは、属性ｓｒｃを持つ。属性ｓｒｃの属性値は、対応の要素の画像として表示される画像ファイルのファイル名や保存場所などを示す。
また、ｉｍｇタグは、属性ａｌｔを持つことができる。属性ａｌｔの属性値は代替文字列を示す。代替文字列は、例えば音声読み上げが行われる。これにより、視覚に障害のあるユーザにウェブページに配置される画像の内容を伝えることができる。
図３（Ａ）には、ＨＴＭＬファイルにおいて１つのｉｍｇタグが記述された例が示されている。ｉｍｇタグ内には、「alt="花"」との記述と、「src="flower.jpeg"」との記述が含まれている。この記述により、ｉｍｇタグにより指定される画像は、「flower.jpeg」のファイル名の画像であり、代替文字列により「花」であることが説明されていることになる。このように代替文字列が記述されているということは、ｉｍｇタグにより指定される画像に関してウェブアクセシビリティが確保されているということになる。

そこで、画像要素検出部１２０は、画像に対応するｉｍｇタグを検出すると、検出されたｉｍｇタグに含まれる記述において属性ａｌｔを示す「ａｌｔ」の記述があるか否かについて検出する。ここで、「ａｌｔ」の記述が無いことを検出した場合には、代替文字列が示されていないことになる。そこで、この場合には、画像要素検出部１２０は、検出したｉｍｇタグは、代替文字列についての記述が不備であると判定する。
図３（Ｂ）は、図３（Ａ）と同じウェブページのＨＴＭＬファイルにおいて、「ａｌｔ」の記述が無い場合の例を示している。具体的に、同図においては、ｉｍｇタグにおいて、「src="flower.jpeg"」との記述は含まれているが、「alt="（属性値）"」の記述はない。

また、「ａｌｔ」の記述が有ったとしても対応の属性値の記述がない場合がある。そこで、画像要素検出部１２０は、「ａｌｔ」の記述が有った場合には、さらに、「ａｌｔ」に対応する属性値の記述があるか否かについて検出する。ここで、「ａｌｔ」に対応する属性値の記述がないことを検出した場合にも、画像要素検出部１２０は、検出したｉｍｇタグは、代替文字列についての記述が不備であると判定する。
図３（Ｃ）は、図３（Ａ）と同じウェブページのＨＴＭＬファイルにおいて、「ａｌｔ」の記述はあるが、対応の属性値の記述が無い場合の例を示している。具体的に、同図においては、ｉｍｇタグにおいて、「src="flower.jpeg"」との記述が含まれている。また、ｉｍｇタグにおいて「ａｌｔ」の記述はあるものの、「alt=""」と記述されている。即ち、属性ａｌｔに対応する有効な属性値の記述がない。
これに対して、例えば図３（Ａ）に示されるように、「ａｌｔ」に対応する属性値の記述が有った場合、画像要素検出部１２０は、検出したｉｍｇタグは、代替文字列についての記述に不備はないと判定する。このようにして画像要素検出部１２０による画像要素検出が行われる。

説明を図２に戻す。画像取得部１３０は、画像要素検出部１２０による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像をウェブページから取得する。つまり、画像取得部１３０は、画像要素検出部１２０により代替文字列についての記述に不備があると判定されたｉｍｇタグが示す画像をウェブページから取得する。ウェブアクセシビリティ解析サーバ１００が解析対象として入力したウェブページは、ＨＴＭＬファイルの他にページ上に配置される画像ファイル等のオブジェクトを含んでいる。そこで、画像取得部１３０は、代替文字列についての記述に不備があると判定されたｉｍｇタグにおいて記述される属性ｓｒｃの属性値が示す画像ファイルを、入力されたウェブページに含まれる画像ファイルから取得する。このようにして、画像取得部１３０は、代替文字列についての記述に不備があると判定されたｉｍｇタグが示す画像を取得する。

画像出力部１４０は、画像取得部１３０により取得された画像（画像ファイル）を、送受信部１１０により画像検索エンジン３００（３００−１、３００−２、３００−３）と、機械学習エンジン４００とのそれぞれに送信（出力）する。このように送信された画像は、画像検索エンジン３００、及び機械学習エンジン４００にて受信される。
画像検索エンジン３００は、それぞれ、受信された画像を入力とし、入力した画像に類似する画像を検索する。画像検索エンジン３００は、それぞれ、検索した画像（検索結果）を画像関連情報としてウェブアクセシビリティ解析サーバ１００に送信する。
また、機械学習エンジン４００は、受信された画像を入力し、学習結果を利用して、入力された画像についての説明文を生成する。機械学習エンジン４００は、生成した説明文としての文字列（テキスト）を、画像関連情報としてウェブアクセシビリティ解析サーバ１００に送信する。

文字列情報取得部１５０は、画像検索エンジン３００、及び機械学習エンジン４００のそれぞれから出力される画像関連情報に基づいて、画像検索エンジン３００、及び機械学習エンジン４００ごとに対応する文字列情報を取得する。
具体的に、画像検索エンジン３００、及び機械学習エンジン４００のそれぞれから送信（出力）された画像関連情報は送受信部１１０により受信される。文字列情報取得部１５０は、受信された画像関連情報を入力する。
画像検索エンジン３００のそれぞれから送信された画像関連情報は検索結果としての画像である。そこで、文字列情報取得部１５０は、画像検索エンジン３００から送信された画像関連情報としての画像を入力すると、入力した画像が配置されるウェブページにアクセスする。文字列情報取得部１５０は、アクセスしたウェブページのＨＴＭＬファイルから、入力した画像に関連するテキスト（文字列）を取得する。
具体的には、文字列情報取得部１５０は、入力した画像に関連する文字列として、入力した画像を要素として指定するｉｍｇタグにおいて記述される属性ａｌｔの属性値としての文字列を取得することができる。また、文字列情報取得部１５０は、入力した画像に関連する文字列として、ウェブページ上で配置される画像の周辺に配置されているテキストやリンクなどから文字列を取得することができる。この場合、文字列情報取得部１５０は、画像の周辺に配置されているテキストやリンクとしての文字列について、例えば自然言語処理による形態素解析を行い、形態素解析の結果得られた名詞、形容詞などの形態素としての文字列を抽出すればよい。
なお、文字列情報取得部１５０は、形態素解析に代えて、画像の周辺に配置されているテキストやリンクとしての文字列から、Ｎ−ｇｒａｍ法を用いて、文字の出現頻度に応じたテキストによる文字列を抽出するようにしてもよい。また、文字列情報取得部１５０は、形態素解析とＮ−ｇｒａｍ法とを併用して文字列を抽出してもよい。
このようにして文字列情報取得部１５０は、画像検索エンジン３００のそれぞれから送信された画像関連情報としての画像ごとに対応する文字列情報を取得する。

一方、機械学習エンジン４００から送信された画像関連情報は説明文であり、既に文字列の形式である。そこで、文字列情報取得部１５０は、機械学習エンジン４００から送信された画像関連情報については、そのまま文字列情報として取得すればよい。

代替文字列決定部１６０は、画像検索エンジン３００、及び機械学習エンジン４００ごとに対応する文字列情報を照合した結果に基づいて代替文字列を決定する。
図４を参照して、代替文字列決定部１６０が行う処理の一例について説明する。同図においては、画像出力部１４０により画像検索エンジン３００、及び機械学習エンジン４００のそれぞれに送信された画像Ｐｉｃ１が示されている。同図の画像Ｐｉｃ１としては、赤い服を着た女性がヘッドマウントディスプレイを装着している状態が表されている。
同図において、文字列情報１は、画像検索エンジン３００−１から送信された画像関連情報としての画像に基づいて文字列情報取得部１５０により取得された文字列情報である。
文字列情報１は、「ヘッドマウントディスプレイ」との１つの文字列を含む情報である。
文字列情報２は、画像検索エンジン３００−２から送信された画像関連情報としての画像に基づいて文字列情報取得部１５０により取得された文字列情報である。文字列情報２は、「めがね」と「ＨＭＤ」との２つの文字列を含む情報である。
文字列情報３は、画像検索エンジン３００−３から送信された画像関連情報としての画像に基づいて文字列情報取得部１５０により取得された文字列情報である。文字列情報３は、「Ｇｌａｓｓ」との１つの文字列を含む情報である。
代替文字列決定部１６０は、上記のように画像検索エンジン３００−１、３００−２、３００−３のそれぞれにより得られた文字列情報１、２、３について統合する。統合に際して、代替文字列決定部１６０は、複数の文字列情報のうちで一致する文字列について１つにマージする（まとめる）処理を行う。

文字列情報４は、機械学習エンジン４００から送信された画像関連情報としての説明文の文字列を、文字列情報取得部１５０が文字列情報として取得したものである。文字列情報４は、「赤い服の女性がＨＭＤを覗いている」との１つの文字列を含む情報である。

代替文字列決定部１６０は、文字列情報１、２、３を統合して得られた統合文字列情報に含まれる文字列と、文字列情報４としての説明文とのそれぞれについて形態素解析を行うことで、名詞や形容詞などの形態素としての文字列を、代替文字列の候補（候補文字列）として取得する。
同図においては、上記の形態素解析の結果、「ヘッドマウントディスプレイ」、「めがね」、「ＨＭＤ」、「Ｇｌａｓｓ」、「赤い」、「服」、「女性」、「ＨＭＤ」との８つの候補文字列が得られた場合が示されている。
なお、代替文字列決定部１６０は、この場合においても、統合文字列情報に含まれる文字列と、文字列情報４としての説明文とのそれぞれについて、Ｎ−ｇｒａｍ法を用いて、文字の出現頻度に応じたテキストによる文字列を抽出するようにしてもよい。また、代替文字列決定部１６０は、形態素解析とＮ−ｇｒａｍ法を併用して文字列を抽出するようにしてもよい。

代替文字列決定部１６０は、上記のように得られた８つの候補文字列をそれぞれ照合基準として、他の７つの候補文字列のそれぞれを比較対象として照合させ、照合結果として、比較対象の候補文字列が「単純一致」、「言い換え一致」、「不一致」のいずれに該当するのかについて判定する。

「単純一致」は、照合基準の候補文字列と比較対象の候補文字列とが完全に一致することである。「言い換え一致」は、照合基準と比較対象の候補文字列とで一致はしていないが、比較対象の候補文字列の類義語（同意語も含む）に文字列を言い換えた（置換した）場合に照合基準の候補文字列と一致することである。つまり、「言い換え一致」は、比較対象の文字列が、照合基準と表現は異なるが同じ意味を有する場合に対応する。「不一致」は、照合基準と比較対象の候補文字列とで一致しておらず、かつ、比較対象の候補文字列の類義語のうちにも照合基準の候補文字列と一致するものがないことである。
代替文字列決定部１６０は、比較対象の候補文字列と類似または同義となる文字列を、類義語データベースＤＢ１を参照することによって導出してもよい。
そして、代替文字列決定部１６０は、８つの候補文字列ごとに「単純一致」、「言い換え一致」の各判定数を求める。

具体的に、同図の場合、「ヘッドマウントディスプレイ」の候補文字列を照合基準として他の７つの候補文字列とを照合させた場合、「ヘッドマウントディスプレイ」との文字列と「単純一致」する他の候補文字列はない。このため、代替文字列決定部１６０は、「ヘッドマウントディスプレイ」の候補文字列についての「単純一致」の判定数を「０」とする。
また、比較対象の７つの候補文字列のうち、「ＨＭＤ」の候補文字列については、類義語として照合基準と同じ「ヘッドマウントディスプレイ」との文字列が導出される。「ＨＭＤ」の候補文字列は、２つ存在している。そこで、代替文字列決定部１６０は、「ヘッドマウントディスプレイ」の候補文字列についての「言い換え一致」の判定数を「２」とする。
また、残る比較対象の「めがね」、「Ｇｌａｓｓ」、「赤い」、「服」、「女性」の各候補文字列については、照合基準としての「ヘッドマウントディスプレイ」の候補文字列に対していずれも不一致となる。

また、「めがね」の候補文字列を照合基準として他の７つの候補文字列とを照合させた場合、「めがね」との文字列と「単純一致」する他の候補文字列はない。このため、代替文字列決定部１６０は、「めがね」の候補文字列についての「単純一致」の判定数を「０」とする。
また、この場合の比較対象の７つの候補文字列のうち、「Ｇｌａｓｓ」の候補文字列については、類義語として照合基準と同じ「めがね」との文字列が導出される。「Ｇｌａｓｓ」の候補文字列は、１つ存在している。そこで、代替文字列決定部１６０は、「Ｇｌａｓｓ」の候補文字列についての「言い換え一致」の判定数を「１」とする。
また、残る比較対象の「ヘッドマウントディスプレイ」、「ＨＭＤ」、「赤い」、「服」、「女性」、「ＨＭＤ」の各候補文字列については、照合基準である「めがね」の候補文字列に対していずれも不一致となる。

また、「ＨＭＤ」の候補文字列を照合基準として他の７つの候補文字列とを照合させた結果、代替文字列決定部１６０は、「ＨＭＤ」との文字列と「単純一致」する他の候補文字列が１つ存在すると判定する。そこで、この場合の代替文字列決定部１６０は、「ＨＭＤ」の候補文字列についての「単純一致」の判定数を「１」とする。
また、この場合の比較対象の７つの候補文字列のうち、「ヘッドマウントディスプレイ」の候補文字列については、類義語として照合基準と同じ「ＨＭＤ」との文字列が導出される。「ヘッドマウントディスプレイ」の候補文字列は、１つ存在している。そこで、代替文字列決定部１６０は、「ＨＭＤ」の候補文字列についての「言い換え一致」の判定数を「１」として集計する。
また、残る比較対象の「めがね」、「Ｇｌａｓｓ」、「赤い」、「服」、「女性」の各候補文字列については、照合基準である「ＨＭＤ」の候補文字列に対していずれも不一致となる。

また、「Ｇｌａｓｓ」の候補文字列を照合基準として他の７つの候補文字列とを照合させた場合、「Ｇｌａｓｓ」との文字列と「単純一致」する他の候補文字列はない。このため、代替文字列決定部１６０は、「Ｇｌａｓｓ」の候補文字列についての「単純一致」の判定数を「０」とする。
また、この場合の比較対象の７つの候補文字列のうち、「めがね」の候補文字列については、類義語として照合基準と同じ「Ｇｌａｓｓ」との文字列が導出される。「めがね」の候補文字列は、２つ存在している。そこで、代替文字列決定部１６０は、「Ｇｌａｓｓ」の候補文字列についての「言い換え一致」の判定数を「１」とする。
また、残る比較対象の「ヘッドマウントディスプレイ」、「ＨＭＤ」、「赤い」、「服」、「女性」、「ＨＭＤ」の各候補文字列については、照合基準である「Ｇｌａｓｓ」の候補文字列に対していずれも不一致となる。
このようにして、代替文字列決定部１６０は、候補文字列ごとに「単純一致」と「言い換え一致」の各判定数を求める。

次に、代替文字列決定部１６０は、候補文字列ごとに求められた「単純一致」と「言い換え一致」との判定数に基づいて代替文字列を決定する。
具体的に、代替文字列決定部１６０は、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を、代替文字列として決定する。同図の場合には、「ヘッドマウントディスプレイ」の候補文字列の判定数の総計「２」、「ＨＭＤ」の候補文字列の判定数の総計「２」が、８つの候補文字列のうちで最も大きい。
本実施形態において、上記の例のように、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列が複数得られた場合には、予め定めた所定の規則に従って複数のうちから１つの候補文字列を代替文字列として決定する。
具体的に、代替文字列決定部１６０は、例えば、「単純一致」の数が最も多い候補文字列を代替文字列として決定することができる。このように決定する場合、同図の例との対応では、代替文字列決定部１６０は、「ＨＭＤ」を代替文字列として決定する。
また、同図の例の場合であれば、「ヘッドマウントディスプレイ」と「ＨＭＤ」との候補文字列を比較すると、「ヘッドマウントディスプレイ」はカタカナによる日本語表記であり、「ＨＭＤ」はアルファベットの文字列である。アルファベットの文字列は、略語である可能性が高く、一般ユーザになじみがない場合もある。そこで、このような場合には、アルファベットの文字列よりも日本語表記されたもの代替文字列として優先されるようにしてもよい。この場合、同図の例との対応では、代替文字列決定部１６０は、「ヘッドマウントディスプレイ」を代替文字列として決定する。
このように、代替文字列決定部１６０は、複数の文字列情報の間での形態素の一致に関する判定結果に基づいて、代替文字列を決定することができる。

なお、代替文字列決定部１６０は、形態素解析またはＮ−ｇｒａｍ法によって得られた候補文字列のうちから、或る文字列と或る文字列とが同時に出現する関係である、共起関係の相関について計算した結果に基づいて、代替文字列を決定してもよい。

情報挿入部１７０は、代替文字列決定部１６０により決定された代替文字列を、画像取得部１３０により取得された画像に対応する要素に挿入する。つまり、情報挿入部１７０は、上記のように１つの代替文字列が決定されると、情報挿入部１７０は、解析対象として入力したウェブページのＨＴＭＬファイルにおいて対応の画像を示すｉｍｇタグ内に、決定された代替文字列を属性ａｌｔの属性値として挿入する処理を行う。解析対象のウェブページを構成するデータは、例えば送受信部１１０にて記憶されている。情報挿入部１７０は、代替文字列を挿入する対象であるＨＴＭＬファイルを送受信部１１０から取得すればよい。
情報挿入部１７０は、代替文字列決定部１６０により決定された全ての代替文字列のＨＴＭＬファイルへの挿入を行うと、代替文字列挿入後のＨＴＭＬファイルをウェブサーバ２００に送信し、ＨＴＭＬファイルの更新を指示する。ウェブサーバ２００は、ＨＴＭＬファイルの更新の指示に応じて、受信されたＨＴＭＬファイルにより、事故が記憶している対応のＨＴＭＬファイルの更新を行う。これにより、ウェブサーバ２００は、以降において、画像に対応して適切な代替文字列が挿入されたウェブページを公開することができる。
なお、例えば情報挿入部１７０は、代替文字列挿入後のＨＴＭＬファイルではなく、決定された代替文字列を、例えば代替文字列の挿入箇所を示す情報とともにウェブサーバ２００に送信してもよい。

図５のフローチャートは、本実施形態におけるウェブアクセシビリティ解析サーバ１００が実行する処理手順例を示している。
ウェブアクセシビリティ解析サーバ１００において、送受信部１１０は、解析対象のウェブページを取得する（ステップＳ１０１）。例えば、送受信部１１０は、解析対象のウェブページをウェブサーバ２００に要求し、要求に応答してウェブサーバ２００から送信されたウェブページを受信する。送受信部１１０は、受信したウェブページのデータを記憶する。

画像要素検出部１２０は、ステップＳ１０１により取得されたウェブページにおけるＨＴＭＬファイルを入力し、入力したＨＴＭＬファイルについて、例えば１行目から順次要素について検出していく（ステップＳ１０２）。
画像要素検出部１２０は、ステップＳ１０２により検出された要素が、画像を示すｉｍｇタグであるか否かについて判定する（ステップＳ１０３）。ｉｍｇタグではない場合（ステップＳ１０３−ＮＯ）、画像要素検出部１２０は、後述のステップＳ１１２に移行する。
一方、ステップＳ１０３によりｉｍｇタグであることが判定された場合（ステップＳ１０３−ＹＥＳ）、画像要素検出部１２０は、検出されたｉｍｇタグにおける代替文字列についての記述が不備であるか否かについて判定する。
前述のように、「検出されたｉｍｇタグにおける代替文字列についての記述が不備である」状態とは、図３（Ｂ）に例示したように、属性ａｌｔそのものに関する記述がない状態、あるいは、図３（Ｃ）に示したように、例えば「alt=""」のように記述され、「ａｌｔ」の記述はあるが、有効な属性値についての記述がない状態である。
これに対して、「検出されたｉｍｇタグにおける代替文字列についての記述が不備でない（備わっている）状態とは、図３（Ａ）に例示したように、ｉｍｇタグにおいて、「alt="花"」のように、属性ａｌｔの記述があり、かつ、有効な属性値が記述されている状態である。

検出されたｉｍｇタグにおける代替文字列についての記述が備わっていた場合（ステップＳ１０４−ＮＯ）、代替文字列を挿入する必要性はない。そこで、この場合の画像要素検出部１２０は、後述のステップＳ１１２に移行する。

一方、検出されたｉｍｇタグにおける代替文字列についての記述が備わっていない場合（ステップＳ１０４−ＹＥＳ）、アクセシビリティ確保のために代替文字列を挿入すべきことになる。
そこで、この場合には、画像取得部１３０が、検出されたｉｍｇタグが示す画像を取得する（ステップＳ１０５）。この際、画像取得部１３０は、検出されたｉｍｇタグにおける属性ｓｒｃが示す画像ファイルを、送受信部１１０が記憶するウェブページのデータから呼び出す。
画像取得部１３０は、取得した画像（画像ファイル）を画像検索エンジン３００、及び機械学習エンジン４００のそれぞれに対して送信する（ステップＳ１０６）。
画像検索エンジン３００は、それぞれ受信された画像に類似する画像を検索し、検索結果として得られた画像（検索画像）を、画像関連情報としてウェブアクセシビリティ解析サーバ１００に送信する。また、機械学習エンジン４００は、前述のように受信された画像についての説明文を生成し、生成した説明文としての文字列を画像関連情報としてウェブアクセシビリティ解析サーバ１００に送信する。
送受信部１１０は、上記のように画像検索エンジン３００と機械学習エンジン４００とから送信された画像関連情報を受信する。

文字列情報取得部１５０は、画像検索エンジン３００から送信された画像関連情報としての検索画像が受信されたことに応じて、受信された検索画像を送受信部１１０から取得する（ステップＳ１０７）。
次に、文字列情報取得部１５０は、取得した検索画像に関連する文字列を、前述のようにテキストやリンクなどから抽出する（ステップＳ１０８）。即ち、文字列情報取得部１５０は、検索画像に対応する文字列情報を取得する。
なお、ステップＳ１０７とステップＳ１０８の処理は、画像検索エンジン３００−１、３００−２、３００−３のそれぞれから送信された検索画像が受信されるごとに実行される。

また、文字列情報取得部１５０は、機械学習エンジン４００から送信された画像関連情報としての説明文の文字列が受信されたことに応じて、説明文の文字列を文字列情報として取得する（ステップＳ１０９）。

上記のように、ステップＳ１０７、Ｓ１０８により画像検索エンジン３００から送信された検索画像ごとに対応する文字列情報が取得され、ステップＳ１０９により機械学習エンジン４００から送信された説明文に対応する文字列情報が取得される。
代替文字列決定部１６０は、上記のように取得された複数の文字列情報を利用して、例えば図４による説明のように代替文字列を決定する（ステップＳ１１０）。

情報挿入部１７０は、ステップＳ１１０により決定された代替文字列を、ステップＳ１０１により取得されたウェブページのＨＴＭＬファイルに挿入する処理を行う（ステップＳ１１１）。
代替文字列の挿入箇所は、ステップＳ１０３に対応して検出されたｉｍｇタグ内となる。ここで、図３（Ｂ）に例示したようにｉｍｇタグにおいて属性ａｌｔ自体の記述がなかった場合には、属性ａｌｔを新たに記述するとともに属性値として代替文字列を記述するように挿入を行う。また、図３（Ｃ）に例示したように、ｉｍｇタグにおいて属性ａｌｔの記述はあるが、有効な属性値が記述されてない場合には、属性ａｌｔを新たに記述する必要はなく、属性値としての代替文字列を記述するように挿入を行う。

ステップＳ１１１による代替文字列の挿入を行った後、あるいはステップＳ１０３にてｉｍｇタグではないことが判定された場合（ステップＳ１０３−ＮＯ）、あるいは、ステップＳ１０４にて代替文字列についての記述に不備がないと判定された場合（ステップＳ１０４−ＮＯ）、以下の処理が行われる。つまり、画像要素検出部１２０は、ＨＴＭＬファイルにおける最終行まで要素の検出を終了したか否かについて判定する（ステップＳ１１２）。

ＨＴＭＬファイルにおいてまだ要素の検出が終了していない場合（ステップＳ１１２−ＮＯ）、画像要素検出部１２０は、ステップＳ１０２に処理を戻すことで、さらに次の行を対象として要素の検出を行っていく。
そして、最終行まで要素の検出が終了されると（ステップＳ１１２−ＹＥＳ）、情報挿入部１７０は、以下の処理を実行する。つまり、最終行まで要素の検出が終了した段階では、ウェブページのＨＴＭＬファイルにおける代替文字列についての記述が不備であった箇所の全てに代替文字列が挿入されており、不備が解消された状態にある。
そこで、情報挿入部１７０は、前述のように、代替文字列挿入後のＨＴＭＬファイルをウェブサーバ２００に送信することで、ウェブサーバ２００にてＨＴＭＬファイルを更新させる（ステップＳ１１３）。

以上説明したように、本実施形態におけるウェブアクセシビリティ解析サーバ１００は、解析対象のウェブページに配置される画像についての代替文字列を決定することができる。代替文字列の決定にあたって、ウェブアクセシビリティ解析サーバ１００は、画像検索エンジン３００と機械学習エンジン４００に代替文字列の挿入対象に対応する画像を送信し、画像検索エンジン３００から送信された検索画像に関連する文字列情報と、機械学習エンジン４００から送信された画像についての説明文による文字列情報とを照合するようにされている。このようにして代替文字列を決定することで、本実施形態においては、例えば装飾目的の画像に限定されることなく、多様な画像に対応して的確に代替文字列を決定することができる。例えば、本実施形態の場合であれば、文字列が含まれていない画像であっても的確に代替文字列を決定できる。
また、例えば画像と代替テキストとの対をデータベースに蓄積しておき、データベースを参照して画像に対応する代替テキストを提示するようにされた構成も知られている。しかしながら、このような構成では、十分な数の画像と代替テキストとの対をデータベースに蓄積させるにあたって人手による作業が必要になる。これに対して、本実施形態の場合であれば、画像検索エンジン３００と機械学習エンジン４００とを利用しているため、画像と代替テキストとの対をデータベースに蓄積させるための人的作業は不要である。

＜第２実施形態＞
続いて、第２実施形態について説明する。先の第１実施形態においては、ウェブアクセシビリティ解析サーバ１００が、１つの代替文字列を決定し、決定した代替文字列を解析対象のウェブページのＨＴＭＬファイルに挿入するようにされていた。
これに対して、本実施形態におけるウェブアクセシビリティ解析サーバ１００は、代替文字列の決定結果として、複数の文字列を出力してよい。ウェブアクセシビリティ解析サーバ１００は、決定された代替文字列を代替文字列候補としてウェブサイト制作者端末５００にて提示する。本実施形態において、ウェブアクセシビリティ解析サーバ１００は、ウェブサイト制作者端末５００にて、画面表示により代替文字列候補が提示されるようにする。

図６は、ウェブサイト制作者端末５００において代替文字列候補の提示のために表示される画面（代替文字列候補提示画面）の一例を示している。
同図の代替文字列候補提示画面においては、左上側に配置されるウェブページ描画領域ＡＲ１と、右上側に配置されるソースコード表示領域ＡＲ２と、代替文字列候補提示領域ＡＲ３とを含む。

ウェブページ描画領域ＡＲ１には、ウェブアクセシビリティ解析対象のウェブページをウェブブラウザで描画させた状態が表示される。ウェブページ描画領域ＡＲ１においては、代替文字列の挿入対象とされた対象画像Ｐｏｂｊが所定の態様で選択表示される。なお、ウェブページ描画領域ＡＲ１において代替文字列候補のある画像が複数存在する場合には、ウェブページ描画領域ＡＲ１において、これら複数の画像のそれぞれについて代替文字列候補のあることを示す所定の態様による表示が行われる。これにより、ウェブサイト制作者は、ウェブページに配置される画像のうちで、代替文字列候補のある画像と代替文字列候補の無い画像とを区別できる。
そのうえで、ウェブサイト制作者が、代替文字列候補のある画像のうちから、１つの画像を代替文字列の挿入対象として選択する操作をウェブページ描画領域ＡＲ１に対して行うことにより、選択された画像が対象画像Ｐｏｂｊとして選択表示される。

ソースコード表示領域ＡＲ２には、ウェブアクセシビリティ解析対象のウェブページにおけるＨＴＭＬファイルのソースコードが表示される。そのうえで、ソースコード表示領域ＡＲ２においては、ウェブページ描画領域ＡＲ１に対する操作によって選択された対象画像Ｐｏｂｊに対応するｉｍｇタグの行が強調表示される。同図のｉｍｇタグにおいては、代替文字列についての記述が不備な状態として、属性ａｌｔに対応して有効な属性値が記述されていない状態が示されている。
なお、ソースコード表示領域ＡＲ２に対して、代替文字列についての記述が不備なｉｍｇタグの行を選択する操作を行うことで、代替文字列の挿入対象を選択できるようにしてもよい。この場合には、ソースコード表示領域ＡＲ２においてｉｍｇタグの行が選択されたことに応じて、ウェブページ描画領域ＡＲ１において対応の画像が対象画像Ｐｏｂｊとして選択表示される。

代替文字列候補提示領域ＡＲ３には、代替文字列の挿入対象として選択された画像に対応して決定された代替文字列候補が表示される。同図においては、「文字列１」、「文字列２」、「文字列３」、「文字列４」との４つの代替文字列候補が提示された場合が示されている。「文字列１」、「文字列２」、「文字列３」、「文字列４」には、それぞれ具体的な文字列が表示される。

ウェブサイト制作者は、代替文字列候補提示領域ＡＲ３において提示されている複数の代替文字列候補のうちから、最も適切な代替文字列候補を１つ判断する。最も適切な代替文字列候補の判断にあたっては、ウェブサイト制作者は、対象画像Ｐｏｂｊの画像内容、ウェブページにおける対象画像Ｐｏｂｊに関するテキストの内容などを考慮すればよい。
ウェブサイト制作者は、最適であると判断した１つの代替文字列候補をＨＴＭＬファイルに挿入する代替文字列として指定するための所定操作を行う。

ウェブサイト制作者は、上記のようにして、ウェブアクセシビリティ解析対象のウェブページにおいて代替文字列候補のある画像ごとに１つの代替文字列を指定する。そして、ウェブサイト制作者は、代替文字列候補のある画像の全てについて代替文字列の指定を完了させると、指定した代替文字列のＨＴＭＬファイルへの挿入を指示する所定の操作（挿入指示操作）を行う。
挿入指示操作に応じて、ウェブサイト制作者端末５００は、ウェブアクセシビリティ解析サーバ１００に対して、代替文字列の挿入を指示する挿入コマンドを送信する。挿入コマンドには、指定された代替文字列を示す情報と、指定された代替文字列ごとのＨＴＭＬファイルにおける挿入箇所とを示す情報とが含まれる。

挿入コマンドの受信に応じて、ウェブアクセシビリティ解析サーバ１００は、挿入コマンドにおいて示される代替文字列のそれぞれを、ＨＴＭＬファイルに挿入する処理を実行する。ウェブアクセシビリティ解析サーバ１００は、代替文字列挿入後のＨＴＭＬファイルをウェブサーバ２００に送信し、ウェブサーバ２００にてＨＴＭＬファイルを更新させる。

このように、本実施形態においては、ＨＴＭＬファイルに挿入する代替文字列についての複数の候補をウェブサイト制作者に提示し、最終的にウェブサイト制作者の指定に応じて代替文字列の決定が行われるように構成される。このような構成によって、代替文字列の候補についてウェブサイト制作者が確認できるとともに、ウェブサイト制作者の制作意図を反映させたうえで、的確に代替文字列を決定することができる。

図７は、本実施形態におけるウェブアクセシビリティ解析サーバ１００の構成例を示している。同図において、図２と同一部分には同一符号を付して説明を省略する。
同図に示されるように、本実施形態のウェブアクセシビリティ解析サーバ１００は、情報提示部１８０をさらに備える。

情報提示部１８０は、代替文字列決定部１６０により決定された代替文字列を提示する。具体的に、情報提示部１８０は、代替文字列決定部１６０により決定された代替文字列を、代替文字列候補として提示するようにされた代替文字列候補提示画面（図６）を、ウェブサイト制作者端末５００に表示させる。このために、情報提示部１８０は、解析対象のウェブページのデータと、代替文字列決定部１６０により決定された代替文字列とを利用して、代替文字列候補提示画面のデータを生成し、生成した代替文字列候補提示画面のデータをウェブサイト制作者端末５００に送信する。
ウェブサイト制作者端末５００は、受信された代替文字列候補提示画面のデータを利用して図６に示したように代替文字列候補提示画面を表示させる。なお、代替文字列候補提示画面のデータとしては、例えばウェブページ形式とすることができる。この場合、ウェブサイト制作者端末５００は、ウェブブラウザ上でウェブページとして代替文字列候補提示画面を表示させればよい。

図８のフローチャートは、本実施形態におけるウェブアクセシビリティ解析サーバ１００が実行する処理手順例を示している。
同図において、ステップＳ２０１〜Ｓ２０９の処理は、図５におけるステップＳ１０１〜Ｓ１０９と同様である。

そして、本実施形態のウェブアクセシビリティ解析サーバ１００において、代替文字列決定部１６０は、ステップＳ２０７、Ｓ２０８及びステップＳ２０９により取得した複数の文字列情報を利用して、例えば図４による説明のように代替文字列を決定する（ステップＳ２１０）。ここで、図５のステップＳ１１０においては、１つの代替文字列を決定するようにされていた。しかしながら、本実施形態のステップＳ２１０では、複数の代替文字列が決定結果とされてもよい。
一具体例として、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を代替文字列として決定するようにされている場合において、上記の総計が最も大きい候補文字列が複数である場合、代替文字列決定部１６０は、ステップＳ２１０にて、複数の候補文字列を代替文字列の決定結果としてよい。
そして、情報提示部１８０は、ステップＳ２１０により決定された１つの画像に対応して決定された代替文字列を記録する（ステップＳ２１１）。情報提示部１８０は、代替文字列を記録するにあたり、ＨＴＭＬファイルにおける対応のｉｍｇタグの位置（挿入位置）を示す情報を対応付ける。

ステップＳ２１１による代替文字列の記録を行った後、あるいはステップＳ２０３にてｉｍｇタグではないことが判定された場合（ステップＳ２０３−ＮＯ）、あるいは、ステップＳ２０４にて代替文字列についての記述に不備がないと判定された場合（ステップＳ２０４−ＮＯ）、以下の処理が行われる。つまり、画像要素検出部１２０は、ＨＴＭＬファイルにおける最終行まで要素の検出を終了したか否かについて判定する（ステップＳ２１２）。

ＨＴＭＬファイルにおいてまだ要素の検出が終了していない場合（ステップＳ２１２−ＮＯ）、画像要素検出部１２０は、ステップＳ２０２に処理を戻すことで、さらに次の行を対象として要素の検出を行っていく。

一方、最終行まで要素の検出が終了されると（ステップＳ２１２−ＹＥＳ）、情報提示部１８０が以下の処理を実行する。つまり、最終行まで要素の検出が終了した段階では、ウェブページのＨＴＭＬファイルにおける代替文字列についての記述が不備であった全ての要素ごとに対応して１以上の代替文字列が決定され、決定された代替文字列が記憶されている状態にある。また、記憶された代替文字列には、ＨＴＭＬファイルにおける挿入位置を示す情報が対応付けられている。
そこで、情報提示部１８０は、記憶している代替文字列と挿入位置の情報と、解析対象のウェブページのデータとを利用して、例えば代替文字列候補提示画面のデータを生成する。前述のように、代替文字列候補提示画面のデータはウェブページ形式であればよい。情報提示部１８０は、生成した代替文字列候補提示画面のデータを、ウェブサイト制作者端末５００に送信する（ステップＳ２１３）。

前述のように、ウェブサイト制作者端末５００は、受信された代替文字列候補提示画面のデータを利用して代替文字列候補提示画面を表示し、ウェブサイト制作者は、代替文字列候補提示画面に対する操作によって、代替文字列候補のある画像ごとに、代替文字列候補のうちから代替文字列を１つずつ指定したうえで、挿入指示操作を行う。挿入指示操作に応じて、ウェブサイト制作者端末５００は、ウェブアクセシビリティ解析サーバ１００に対して挿入コマンドを送信する。
ウェブアクセシビリティ解析サーバ１００において、情報挿入部１７０は、受信された挿入コマンドが示す代替文字列をＨＴＭＬファイルに挿入する処理を行う（ステップＳ２１４）。
そして、情報挿入部１７０は、ステップＳ２１４により代替文字列が挿入されたＨＴＭＬファイルをウェブサーバ２００に送信することで、ウェブサーバ２００にてＨＴＭＬファイルを更新させる（ステップＳ２１５）。

＜第３実施形態＞
続いて、第３実施形態について説明する。図９は、本実施形態におけるウェブアクセシビリティ解析サーバ１００の構成例を示している。同図において、図２と同一部分については同一符号を付して説明を省略する。
同図のウェブアクセシビリティ解析サーバ１００は、図２の構成に対して、オントロジー辞書ＤＩＣ１をさらに備える。オントロジー辞書ＤＩＣ１は、例えば特定の概念に関連する語句をデータベース化して構築される辞書である。
本実施形態における代替文字列決定部１６０は、代替文字列を決定するにあたり、類義語データベースＤＢ１とともに、オントロジー辞書ＤＩＣ１を併用する。
具体的に、代替文字列決定部１６０は、まず、図４にて説明したように代替文字列を決定する。ここで、例えば、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列を代替文字列として決定するようにされた場合において、決定結果として複数の代替文字列が得られた場合、代替文字列決定部１６０は、複数の代替文字列ごとに、オントロジー辞書ＤＩＣ１と照合する。
一具体例として、以下のような事例を挙げる。図４の例のように候補文字列が得られた場合において、「ヘッドマウントディスプレイ」、「ＨＭＤ」、「服」の３つの候補文字列が、「単純一致」の判定数と「言い換え一致」の判定数との総計が最も大きい候補文字列であった。
そのうえで、ウェブアクセシビリティ解析サーバ１００が解析対象とするウェブページは、情報技術（ＩＴ：Information Technology）に関連する記事であるため、オントロジー辞書ＤＩＣ１は、情報技術の概念に該当する語句を含むよう構築されている。
この場合、代替文字列決定部１６０は、「ヘッドマウントディスプレイ」、「ＨＭＤ」、「服」の３つの候補文字列をオントロジー辞書ＤＩＣ１と照合させた結果、例えば「服」の候補文字列については情報技術の概念に該当しないことから、代替文字列の決定結果から除外する。このように、代替文字列決定部１６０は、代替文字列の候補文字列についてオントロジー辞書ＤＩＣ１を用いてフィルタリングを行うことができる。このようにフィルタリングが行われることで、代替文字列決定部１６０により決定される代替文字列の的確さを向上させることが可能になる。

なお、本実施形態において、オントロジー辞書ＤＩＣ１は、例えば概念が異なる複数のものが備えられていてもよい。代替文字列決定部１６０は、例えば解析対象のウェブページが該当するジャンルなどに応じて、複数のオントロジー辞書から適切なものを選んで使用することができる。

なお、上記各実施形態においては、画像検索エンジンによる画像検索結果と、機械学習エンジンによる画像解析結果（説明文）とを併用している。現状においては、画像検索エンジンによる画像検索結果と、機械学習エンジンによる画像解析結果とを併用することで、いずれか一方の結果を利用する場合よりも、代替文字列についての決定精度を高めることが期待できる。しかしながら、本実施形態においては、機械学習エンジンによる画像解析結果を用いずに複数の画像検索エンジンによる画像検索結果を用いて代替文字列を決定するようにしてもよい。あるいは逆に、本実施形態においては、画像検索エンジンによる画像検索結果を用いずに、複数の機械学習エンジンによる画像解析結果を用いて代替文字列を決定するようにしてもよい。

また、図２、図７、図９などに示したウェブアクセシビリティ解析サーバ１００の機能部は、１つの装置に備えられてもよいし、複数の装置に分散されるようにして備えられてもよい。

なお、上述のウェブアクセシビリティ解析サーバ１００としての機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより上述のウェブアクセシビリティ解析サーバ１００としての処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやＷＡＮ、ＬＡＮ、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、ＣＤ−ＲＯＭ等の非一過性の記録媒体であってもよい。また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部または外部に設けられた記録媒体も含まれる。配信サーバの記録媒体に記憶されるプログラムのコードは、端末装置で実行可能な形式のプログラムのコードと異なるものでもよい。すなわち、配信サーバからダウンロードされて端末装置で実行可能な形でインストールができるものであれば、配信サーバで記憶される形式は問わない。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に端末装置で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（ＲＡＭ）のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であってもよい。

１００ウェブアクセシビリティ解析サーバ、１１０送受信部、１２０画像要素検出部、１３０画像取得部、１４０画像出力部、１５０文字列情報取得部、１６０代替文字列決定部、１７０情報挿入部、１８０情報提示部、２００ウェブサーバ、３００画像検索エンジン、３００−１画像検索エンジン、３００−２画像検索エンジン、３００−３画像検索エンジン、４００機械学習エンジン、５００ウェブサイト制作者端末、６００通信網

Claims

ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部と、
前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部と、
入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部と、
前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部と、
前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部と
を備えるコンテンツ処理装置。
前記代替文字列決定部により決定された代替文字列を、前記画像取得部により取得された画像に対応する要素に挿入する情報挿入部をさらに備える
請求項１に記載のコンテンツ処理装置。
前記代替文字列決定部により決定された代替文字列を提示する情報提示部をさらに備える請求項１または２に記載のコンテンツ処理装置。
前記文字列情報取得部は、
前記画像関連情報出力装置が画像としての前記画像関連情報を出力する場合には、出力された画像に関連する文字列を抽出し、抽出した文字列を前記文字列情報として取得し、
前記画像関連情報出力装置が文字列としての前記画像関連情報を出力する場合には、出力された文字列を前記文字列情報として取得する
請求項１から３のいずれか一項に記載のコンテンツ処理装置。
前記代替文字列決定部は、前記複数の文字列情報の間での形態素の一致に関する判定結果に基づいて、前記代替文字列を決定する
請求項１から４のいずれか一項に記載のコンテンツ処理装置。
前記複数の画像関連情報出力装置のうちの少なくとも１つは、所定のアルゴリズムに従って、入力された画像に関連する画像を検索し、検索した画像を前記画像関連情報として出力する
請求項１から５のいずれか一項に記載のコンテンツ処理装置。
前記複数の画像関連情報出力装置のうちの少なくとも１つは、所定のアルゴリズムに従って行う機械学習に基づいて、前記入力された画像を説明する文字列を前記画像関連情報として出力する
請求項１から６のいずれか一項に記載のコンテンツ処理装置。
ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出ステップと、
前記画像要素検出ステップによる検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得ステップと、
入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得ステップにより取得された画像を出力する画像出力ステップと、
前記画像出力ステップにより出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得ステップと、
前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定ステップと
を含むコンテンツ処理方法。
コンピュータを、
ウェブページに配置される画像に対応する要素における代替文字列に関する記述について検出する画像要素検出部、
前記画像要素検出部による検出結果に基づいて、代替文字列に関する記述が不備な要素に対応する画像を前記ウェブページから取得する画像取得部、
入力された画像に関連する画像または文字列を画像関連情報として出力する複数の画像関連情報出力装置に対して、前記画像取得部により取得された画像を出力する画像出力部、
前記画像出力部により出力された画像の入力に応じて前記複数の画像関連情報出力装置のそれぞれから出力される画像関連情報に基づいて、前記複数の画像関連情報出力装置ごとに対応する文字列情報を取得する文字列情報取得部、
前記複数の画像関連情報出力装置ごとに対応する文字列情報を照合した結果に基づいて前記代替文字列を決定する代替文字列決定部
として機能させるためのプログラム。