WO2010084524A1

WO2010084524A1 - 情報処理システム及びプログラム

Info

Publication number: WO2010084524A1
Application number: PCT/JP2009/000188
Authority: WO
Inventors: 山本英美; 石岡亜紀子; 山口俊光
Original assignee: Yamamoto Emi; Ishioka Akiko; Yamaguchi Toshimitsu
Priority date: 2009-01-20
Filing date: 2009-01-20
Publication date: 2010-07-29

Abstract

　より利便性の高い読上げサービスを提供する。　ユーザ端末３０は、Ｗｅｂサーバ１０からＨＴＭＬファイルを受信すると、ＨＴＭＬファイルに含まれているスクリプト要求タグ５０２を用いて、読上げサーバ２０からスクリプトファイル６０を取得し、取得されたスクリプトファイル６０を起動させて、ＨＴＭＬファイルから読上げ部分を抽出し、抽出された読上げ部分をソートして読上げサーバ２０にアップロードする。読上げサーバ２０は、ユーザ端末３０から受信した読上げ部分を順に音声データに変換し、ユーザ端末３０にストリーミング配信する。

Description

情報処理システム及びプログラム

　本発明は、情報処理システムに関する。

　例えば、特許文献１には、音声プロキシサーバを用いて、ＷＷＷの情報に含まれるテキストなどを読み上げる方法が開示されている。
特開平１１－１１０１８６号公報

　本発明は、上述した背景からなされたものであり、より利便性の高い読上げサービスを提供することを目的とする。

　上記目的を達成するために、本発明にかかる情報処理システムは、音声ファイルを要求する要求端末と、音声ファイルを生成する音声ファイル生成装置とを含む情報処理システムであって、前記要求端末は、構造化文書の中から、被読上げデータを抽出する抽出手段と、前記抽出手段により抽出された被読上げデータを、被読上げデータそれぞれに関連付けられたタグに対応する順序で前記音声ファイル生成装置に送信する送信手段とを含み、前記音声ファイル生成装置は、前記送信手段から受信した順序で、受信した被読上げデータを音声データに変換する。

　好適には、前記要求端末は、前記抽出手段により抽出された被読上げデータのうち、ｒｕｂｙタグで囲まれた被読上げデータを、このタグに関連付けられたルビテキストの文字列で置換する置換手段をさらに有し、前記送信手段は、前記置換手段により少なくとも一部が置換された被読上げデータを前記音声ファイル生成装置に送信する。

　好適には、前記音声ファイル生成装置は、前記送信手段から受信した被読上げデータのうち、ｒｕｂｙタグで囲まれた被読上げデータを、このタグに関連付けられたルビテキストの文字列で置換する置換手段と、前記置換手段により少なくとも一部が置換された被読上げデータを、音声データに変換する変換手段と、前記置換手段により置換された被読上げデータ及びルビテキストの組の出現回数を、これらの組毎に計数する出現回数計数手段とを有する。

　好適には、プログラムファイルを要求するためのプログラム要求情報と、少なくとも読上げ範囲及び読上げ順序を指定するタグとが含まれた構造化文書を前記要求端末に提供する文書提供装置をさらに含み、前記要求端末は、構造化文書に含まれたプログラム要求情報を用いて、既定のプログラムファイルを取得し、前記抽出手段は、取得された前記プログラムファイルを実行することにより、構造化文書に含まれるタグに従って、被読上げデータを抽出し、前記送信手段は、取得された前記プログラムファイルを実行することにより、抽出された被読上げデータをタグに従って配列し、配列された被読上げデータを送信する。

　好適には、前記音声ファイル生成装置は、変換された音声データを、変換された順序でストリーミング配信する。

　好適には、前記文書提供装置は、音声データを配信するタイミングを指定するタイミング指定情報がさらに含まれた構造化文書を提供し、前記音声ファイル生成装置は、前記タイミング指定情報により指定されたタイミングで、各被読上げデータに対応する音声データを前記要求端末に配信する。

　また、本発明にかかるプログラムは、音声ファイルの要求操作を受け付けるステップと、前記要求操作に応じて、構造化文書に含まれるタグに従って、被読上げデータを抽出するステップと、抽出された被読上げデータを、被読上げデータに関連付けられたタグに対応する順序で送信するステップとをコンピュータに実行させる。

　本発明の情報処理システムによれば、読上げサービスの利便性が向上する。

実施形態における情報処理システム１の全体構成を例示する図である。Ｗｅｂサーバ１０から提供されるデータファイルを例示する図である。ユーザ端末３０で実行されるスクリプトファイル６０の機能構成を例示する図である。（Ａ）は、範囲順序指定情報５０４を例示し、（Ｂ）は、ブロックの並べ替えを例示する図である。情報処理システム１の全体動作（Ｓ１０）のシーケンス図である。ユーザ端末３０に表示されるブラウザ画面８００を例示する図である。ユーザ端末３０におけるブラウジング処理（Ｓ２０）を説明するフローチャートである。出力トリガ情報５０６が含まれたデータファイル５を例示する図である。変形例におけるブラウジング処理（Ｓ３０）を説明するフローチャートである。第２の変形例におけるスクリプトファイル６２の機能構成を例示する図である。（Ａ）は、ｒｕｂｙタグが含まれたブロック（ＨＴＭＬファイル）を例示し、（Ｂ）は、ルビ置換部６５０による置換処理後のブロックを例示する図である。読上げサーバ２０に含まれる機能構成を例示する図である。出現回数計数部２１０により作成される出現回数管理テーブル２１２を例示する図である。

符号の説明

　１・・・情報処理システム
　１０・・・Ｗｅｂサーバ
　２０・・・読上げサーバ
　３０・・・ユーザ端末
　５０・・・構造化文書ファイル
　６０，６２・・・スクリプトファイル

　図１は、本実施形態における情報処理システム１の全体構成を例示する図である。
　図１に例示するように、情報処理システム１は、インターネットなどのネットワークに接続されたＷｅｂサーバ１０と読上げサーバ２０を含む。
　Ｗｅｂサーバ１０は、文書提供装置の一例であり、ＨＴＭＬファイルなどの提供を行うコンピュータ装置である。
　読上げサーバ２０は、音声ファイル生成装置の一例であり、音声データの提供を行うコンピュータ装置である。
　ユーザ端末３０は、要求端末の一例であり、ユーザが操作するコンピュータ装置として、インターネットを介して、Ｗｅｂサーバ１０からＨＴＭＬファイルを取得してウェブブラウザ等で表示し、表示された文字列などを読上げサーバ２０に送信して、送信した文字列に対応する音声データを読上げサーバ２０から取得する。

　図２は、Ｗｅｂサーバ１０から提供されるデータファイルを例示する図である。
　図２（Ａ）に例示するように、Ｗｅｂサーバ１０は、ユーザ端末３０からの要求に応じて、構造化文書ファイル５０が含まれたデータファイル５をユーザ端末３０に送信する。構造化文書ファイル５０は、例えば、ＨＴＭＬ又はＸＭＬなどのマークアップ言語で記述されたデータファイルである。本例の構造化文書ファイル５０は、図２（Ｂ）に例示するように、複数の文字列群（記事）を表示するためのタグと、図２（Ａ）に例示するスクリプト要求タグ５０２及び範囲順序指定情報５０４を含む。
　スクリプト要求タグ５０２とは、図３に例示するスクリプトファイル６０を要求するための情報であり、スクリプトファイルの要求先特定情報（本例では、読上げサーバ２０のＵＲＬ）と、認証情報とが含まれている。
　範囲順序指定情報５０４とは、構造化文書ファイル５０に含まれる情報の読上げを制御する情報であり、例えば、読上げの対象となる範囲を指定する情報と、読上げの順序を指定する情報とが含まれている。
　ユーザ端末３０は、データファイル５をＷｅｂサーバ１０から受信すると、受信した構造化文書ファイル５０をウェブブラウザで表示する。本例では、「記事＃１」～「記事＃３」がユーザ端末３０に表示される。

　図３は、読上げサーバ２０（図１）により提供され、ユーザ端末３０で実行されるスクリプトファイル６０の機能構成を例示する図である。
　図３に例示するように、スクリプトファイル６０は、要求受付部６００、抽出部６１０、順序決定部６２０、通信部６３０、及び出力制御部６４０を有する。
　スクリプトファイル６０は、例えば、ユーザ端末３０のウェブブラウザ上で実行される。

　スクリプトファイル６０において、要求受付部６００は、ユーザの操作を監視して、読上げの要求を受け付けると、読上げ処理の開始を他の構成に指示する。
　本例の要求受付部６００は、ユーザ端末３０のウェブブラウザ上に、読上げボタン８２０（図６に例示）を表示して、この読上げボタン８２０がクリックされると、読上げ処理の開始を抽出部６１０に出力する。

　抽出部６１０は、構造化文書ファイル５０（図２）の中から、被読上げデータを抽出する。被読上げデータとは、読上げサーバ２０によって音声データに変換されるデータであり、例えば、テキストデータなどである。
　本例の抽出部６１０は、範囲順序指定情報５０４と、構造化文書ファイル５０に含まれているタグとに基づいて、抽出すべきテキストデータの範囲を特定し、特定された範囲内のテキストデータを１つのまとまり（ブロック）として抽出し、抽出されたブロックを通信部６３０に出力する。また、各ブロックのタグは、順序決定部６２０に出力される。

　順序決定部６２０は、抽出部６１０により抽出された被読上げデータの送信順序を、被読上げデータのタグに基づいて決定する。
　本例の順序決定部６２０は、範囲順序指定情報５０４と、抽出部６１０から入力された各ブロックのタグとに基づいて、各ブロックの送信順序を決定し、決定された送信順序を通信部６３０に通知する。

　通信部６３０は、Ａｊａｘ（Asynchronous Java（登録商標）Script + XML）などの通信機能を用いて読上げサーバ２０と通信を行い、被読上げデータの送信、及び、音声データの受信を行う。
　本例の通信部６３０は、抽出部６１０により抽出された被読上げデータ（ブロック）を、順序決定部６２０により決定された送信順序で読上げサーバ２０に送信する。
　また、通信部６３０は、読上げサーバ２０から受信した音声データを出力制御部６４０に出力する。

　出力制御部６４０は、ユーザ端末３０に設けられた音声出力モジュールを制御して、読上げサーバ２０から受信した音声データを音声にして出力させる。

　図４（Ａ）は、範囲順序指定情報５０４を例示し、図４（Ｂ）は、ブロックの並べ替えを例示する図である。
　図４（Ａ）に例示するように、本例の範囲順序指定情報５０４には、抽出すべき範囲のタグが送信順序に配列されている。すなわち、本例では、「タグ＃２」、「タグ＃１」、「タグ＃３」の順序で配列されているため、図２（Ｂ）の構造化文書ファイル５０の中から、「タグ＃２」で囲まれた「記事＃２」、「タグ＃１」で囲まれた「記事＃１」、「タグ＃３」で囲まれた「記事＃３」が抽出され、読上げサーバ２０に送信される。
　これにより、図４（Ｂ）に例示するように、各記事が並べ替えられた状態で送信される。この送信順序は、読上げの順序となる。

　図５は、情報処理システム１の全体動作（Ｓ１０）のシーケンス図である。なお、本シーケンスは、動作の一例であり、ユーザの操作などによって変更されうる。
　図５に例示するように、ステップ１００（Ｓ１００）において、Ｗｅｂサーバ１０は、ユーザ端末３０からのウェブアクセスに応じて、図２に例示するデータファイル５（ＨＴＭＬファイル）をユーザ端末３０に送信する。
　ステップ１０５（Ｓ１０５）において、ユーザ端末３０は、ウェブブラウザ上で、Ｗｅｂサーバ１０から受信したＨＴＭＬファイルを表示する。ブラウザ画面８００には、図６に例示するように、構造化文書ファイル５０に含まれている「記事＃１」～「記事＃３」が表示され、さらに、読上げボタン８２０が表示される。

　ステップ１１０（Ｓ１１０）において、ユーザ端末３０は、データファイル５（ＨＴＭＬファイル）に含まれているスクリプト要求タグ５０２を用いて、読上げサーバ２０に対してスクリプトファイル６０の要求を行う。ユーザ端末３０は、スクリプトファイル６０の要求を行う時に、スクリプト要求タグ５０２に含まれている認証情報を読上げサーバ２０に送信する。

　ステップ１１５（Ｓ１１５）において、読上げサーバ２０は、ユーザ端末３０からスクリプトファイル６０の要求を受信すると、認証情報に基づいて認証を行う。
　ステップ１２０（Ｓ１２０）において、読上げサーバ２０は、認証結果に応じて、スクリプトファイル６０をユーザ端末３０に送信する。ユーザ端末３０は、スクリプトファイル６０を受信して起動させると、読上げボタン８２０を操作可能にする。

　ステップ１２５（Ｓ１２５）において、ユーザ端末３０は、ユーザが読上げボタン８２０をクリックすると、以下の読上げ処理を開始する。
　ステップ１３０（Ｓ１３０）において、ユーザ端末３０は、範囲順序指定情報５０４と、構造化文書ファイル５０に含まれるタグとに基づいて、読上げ部分（ブロック）を構造化文書ファイル５０から抽出する。
　ステップ１３５（Ｓ１３５）において、ユーザ端末３０は、抽出された読上げ部分（ブロック）を範囲順序指定情報５０４に従って並び替える。
　ステップ１４０（Ｓ１４０）において、ユーザ端末３０は、並び替えられた読上げ部分（ブロック）を読上げサーバ２０に送信する。

　ステップ１４５（Ｓ１４５）において、読上げサーバ２０は、ユーザ端末３０から受信した読上げ部分（ブロック）を順に音声データに変換する。
　ステップ１５０（Ｓ１５０）において、読上げサーバ２０は、ユーザ端末３０までの帯域を判定し、判定された帯域と、認証結果とに応じて、音声データの送信ビットレートを決定する。
　ステップ１５５（Ｓ１５５）において、読上げサーバ２０は、決定された送信ビットレートで、音声データをユーザ端末３０にストリーミング配信する。

　ステップ１６０（Ｓ１６０）において、ユーザ端末３０は、読上げサーバ２０から配信された音声データを音声として出力する。これにより、図６の記事が読み上げられる。

　図７は、ユーザ端末３０におけるブラウジング処理（Ｓ２０）を説明するフローチャートである。
　図７に例示するように、ステップ２００（Ｓ２００）において、ユーザ端末３０は、ユーザの操作に応じて、ウェブブラウザを起動させてＷｅｂサーバ１０にアクセスして、ＨＴＭＬファイル（データファイル５）を受信する。
　ステップ２１０（Ｓ２１０）において、ユーザ端末３０は、図６に例示するように、ウェブブラウザで、受信したＨＴＭＬファイルを表示する。

　ステップ２２０（Ｓ２２０）において、ユーザ端末３０は、ＨＴＭＬファイルに含まれるスクリプト要求タグ５０２（図２）に従って、読上げサーバ２０にスクリプトファイル６０を要求する。
　ユーザ端末３０は、読上げサーバ２０からスクリプトファイル６０を受信すると、スクリプトファイル６０をウェブブラウザ上で起動させ、スクリプトファイル６０の要求受付部６００（図３）は、読上げボタン８２０（図６）を操作可能（アクティブ）にする。

　ステップ２３０（Ｓ２３０）において、ユーザ端末３０は、読上げボタン８２０（図６）がクリックされた場合には、Ｓ２４０の処理に移行し、読上げボタン８２０がクリックされなかった場合には、ＨＴＭＬファイルの表示のみで処理を終了する。

　ステップ２４０（Ｓ２４０）において、スクリプトファイル６０の要求受付部６００は、読上げボタン８２０のクリックを検知すると、抽出部６１０に対して読上げ処理の開始を指示する。
　抽出部６１０は、範囲順序指定情報５０４で指定されたタグを特定し、ＨＴＭＬファイルの中から、特定されたタグに囲まれたテキストデータをブロックとして抽出する。

　ステップ２５０（Ｓ２５０）において、順序決定部６２０は、範囲順序指定情報５０４に基づいて、送信順序を決定し、決定された送信順序を通信部６３０に出力する。
　通信部６３０は、順序決定部６２０により決定された送信順序で、抽出部６１０により抽出されたブロックを並べ替える。
　ステップ２６０（Ｓ２６０）において、通信部６３０は、並べ替えたブロックを順に読上げサーバ２０に送信する。

　ステップ２７０（Ｓ２７０）において、通信部６３０は、読上げサーバ２０から音声データを受信すると、受信した音声データを出力制御部６４０に出力する。
　ステップ２８０（Ｓ２８０）において、出力制御部６４０は、ユーザ端末３０の音声モジュールを制御して、通信部６３０から入力された音声データを音声として出力させる。

　以上説明したように、本実施形態の情報処理システム１は、文書ファイルの読上げサービスを提供することができる。

　［変形例１］
　次に、上記実施形態の第１の変形例を説明する。
　上記実施形態では、読上げボタンのクリックをトリガーとして、被読上げデータを音声データに変換する処理、及び、音声データの配信処理が行われたが、これに限定されるものではなく、例えば、音声データの配信処理を別のトリガーで行ってもよい。
　そこで、本変形例では、音声データの配信処理について別個のトリガーを設定する形態を説明する。

　図８は、出力トリガ情報５０６が含まれたデータファイル５を例示する図である。
　図８（Ａ）に例示するように、本変形例のデータファイル５には、図２のデータファイルに、出力トリガ情報５０６が追加されている。
　出力トリガ情報５０６は、図８（Ｂ）に例示するように、音声出力のタイミングを指定する情報をタグに対応付けている。音声出力のタイミングとは、例えば、読上げサーバ２０が音声データを配信するタイミングであり、例えば、ウェブブラウザの所定領域が操作されたタイミング（本例では、「領域Ａ」がポイントされたタイミング）、直前の音声配信が終了してから所定期間が経過したタイミング（本例では、タグ＃２で囲まれた領域が読み上げられた時から、５０秒経過したタイミング）などである。
　本変形例の通信部６３０は、図８（Ｂ）の出力トリガ情報５０６に示された順序で、これらのトリガーを検知すると、トリガーに対応付けられたタグに囲まれた被読上げデータの音声データを読上げサーバ２０に要求する。

　図９は、本変形例におけるブラウジング処理（Ｓ３０）を説明するフローチャートである。
　図９に例示するように、ステップ３００（Ｓ３００）において、ユーザ端末３０は、ユーザの操作に応じて、ウェブブラウザを起動させてＷｅｂサーバ１０にアクセスして、ＨＴＭＬファイル（図８のデータファイル５）を受信する。データファイル５には、スクリプト要求タグ５０２及び範囲順序指定情報５０４に加えて、出力トリガ情報５０６が含まれている。
　ステップ３１０（Ｓ３１０）において、ユーザ端末３０は、ウェブブラウザで、受信したＨＴＭＬファイルを表示する。

　ステップ３２０（Ｓ３２０）において、ユーザ端末３０は、ＨＴＭＬファイルに含まれるスクリプト要求タグ５０２（図８）に従って、読上げサーバ２０にスクリプトファイル６０を要求する。
　ステップ３３０（Ｓ３３０）において、ユーザ端末３０は、読上げサーバ２０からスクリプトファイル６０を受信すると、スクリプトファイル６０をウェブブラウザ上で起動させる。
　スクリプトファイル６０の要求受付部６００は、起動後すぐに、読上げ処理の開始を指示する。
　抽出部６１０は、範囲順序指定情報５０４で指定されたタグを特定し、ＨＴＭＬファイルの中から、特定されたタグに囲まれたテキストデータをブロックとして抽出する。

　ステップ３４０（Ｓ３４０）において、順序決定部６２０は、範囲順序指定情報５０４に基づいて、送信順序を決定し、決定された送信順序を通信部６３０に出力する。
　通信部６３０は、順序決定部６２０により決定された送信順序で、抽出部６１０により抽出されたブロックを並べ替える。
　ステップ３５０（Ｓ３５０）において、通信部６３０は、並べ替えたブロックを順に読上げサーバ２０に送信する。読上げサーバ２０では、通信部６３０から受信したブロックが順に音声データに変換される。

　ステップ３６０（Ｓ３６０）において、通信部６３０は、出力トリガ情報５０６に基づいて、音声出力のトリガーが検知されたか否かを判断する。なお、音声出力のトリガーは、出力トリガ情報５０６により指定されたものであるが、最初のトリガーについては、読上げボタン８２０のクリックであってもよい。
　スクリプトファイル６０は、トリガーが検知されるまで待機し、トリガーが検知されるとＳ３７０の処理に移行する。

　ステップ３７０（Ｓ３７０）において、通信部６３０は、検知されたトリガーに対応するタグを出力トリガ情報５０６で特定し、特定されたタグで囲まれた被読上げデータに対応する音声データを読上げサーバ２０に要求する。
　ステップ３８０（Ｓ３８０）において、通信部６３０は、読上げサーバ２０から音声データを受信すると、受信した音声データを出力制御部６４０に出力する。出力制御部６４０は、ユーザ端末３０の音声モジュールを制御して、通信部６３０から入力された音声データを音声として出力させる。

　ステップ３９０（Ｓ３９０）において、通信部６３０は、出力トリガ情報５０６により指定されたトリガーが全て検知されたか否かを判断し、全トリガーが検知された場合に、読上げ処理を終了し、検知されていないトリガーが存在する場合に、Ｓ３６０の処理に戻って、次のトリガーが検知されるまで待機する。

　このように、本変形例の情報処理システム１は、ブロック（被読上げデータのかたまり）それぞれについて音声出力のトリガーを設定することにより、各トリガーを検知したタイミングで音声出力を行うことができる。

　［変形例２］
　次に、第２の変形例を説明する。
　本変形例では、ｒｕｂｙタグが構造化文書に含まれている場合には、このタグで囲まれた被読上げデータを、このタグに関連付けられたルビテキスト（ｒｕｂｙ　ｔｅｘｔ）で置換して読み上げる。ここで、ｒｕｂｙタグとは、Ｗ３Ｃによって規定されたタグであり、ルビが振られる範囲を定義するものである。また、ルビテキストとは、ルビベース（ルビが振られるコンテンツ）に振られるルビのことである。

　図１０は、本変形例におけるスクリプトファイル６２の機能構成を例示する図である。なお、本図に示された各構成のうち、図３に示されたものと実質的に同一のものには同一の符号が付されている。また、本変形例の情報処理システム１の構成は、上記実施形態と実質的に同一であり、Ｗｅｂサーバ１０及び読上げサーバ２０の機能及び動作も、上記実施形態と実質的に同一である。
　図１０に例示するように、本変形例のスクリプトファイル６２は、図３のスクリプトファイル６０に、ルビ置換部６５０を追加した構成をとる。

　スクリプトファイル６２において、ルビ置換部６５０は、抽出部６１０により抽出されたブロック（被読上げデータ）のうち、ｒｕｂｙタグで囲まれた被読上げデータを、このタグに関連付けられたルビテキストの文字列で置換する。すなわち、ルビ置換部６５０は、ｒｕｂｙタグで囲まれたルビベース及びルビテキストを、ルビテキストで置換する。なお、ルビ置換部６５０は、ｒｕｂｙタグで囲まれた被読上げデータのみをルビテキストで置換してもよいし、ｒｕｂｙタグ及びこれに囲まれた被読上げデータをルビテキストで置換してもよい。
　これにより、通信部６３０は、ｒｕｂｙタグで囲まれた被読上げデータをルビテキストで置換されたブロックを読上げサーバ２０に送信し、読上げサーバ２０は、受信したブロックに基づいて、ｒｕｂｙタグで囲まれた被読上げデータを、ルビテキストに従って音声化する。

　図１１（Ａ）は、ｒｕｂｙタグが含まれたブロック（ＨＴＭＬファイル）を例示し、図１１（Ｂ）は、ルビ置換部６５０による置換処理後のブロックを例示する図である。
　図１１（Ａ）に例示するように、抽出部６１０は、ｒｕｂｙタグ（図中の＜ｒｕｂｙ＞及び＜／ｒｕｂｙ＞）が含まれたブロックを抽出する場合がある。このブロックのｒｕｂｙタグは、ルビベースである「ＷＷＷ」（図中の＜ｒｂ＞及び＜／ｒｂ＞に囲まれたコンテンツ）と、ルビテキストである「ワールド　ワイド　ウェブ」（図中の＜ｒｔ＞及び＜／ｒｔ＞に囲まれた文字列）とを囲んでいる。
　このような場合に、ルビ置換部６５０は、図１１（Ｂ）に例示するように、ｒｕｂｙタグに囲まれたルビベース「ＷＷＷ」及びルビテキスト「ワールド　ワイド　ウェブ」等を、ルビテキストの文字列「ワールド　ワイド　ウェブ」で置換する。
　なお、上記は一例であり、一部のタグが省略されることもある。

　このように、本変形例によれば、ウェブページ製作者の意図通りに、ウェブコンテンツを読み上げることができる。例えば、中国語で表記されたウェブページを他の言語（日本語や英語）で読み上げさせることもできる。

　［変形例３］
　次に、第３の変形例を説明する。上記第２の変形例では、ユーザ端末３０（すなわち、スクリプトファイル６２）がルビ部分の置換処理を行ったが、本変形例では、読上げサーバ２０がルビ部分の置換処理を行う。したがって、本変形例の情報処理システム１の各構成のうち、Ｗｅｂサーバ１０及びユーザ端末３０の機能及び動作は、上記実施形態と実質的に同一であり、読上げサーバ２０の機能及び動作が異なる。

　図１２は、読上げサーバ２０に含まれる機能構成を例示する図である。
　図１２に例示するように、読上げサーバ２０には、読上げプログラム２００がインストールされると共に、音声辞書データベース２２（音声辞書ＤＢ２２）が設けられている。
　音声辞書ＤＢ２２は、被読上げデータの各要素を音声データに変換するためのデータベースであり、例えば、所定の文字列に対して、これらの文字列を読み上げたときの音声データを対応付けて記録している。

　また、図１２に例示するように、読上げプログラム２００には、受信部２０２、ルビ置換部２０４、音声変換部２０６、音声配信部２０８、出現回数計数部２１０、及び、音声辞書更新部２１２が含まれている。
　受信部２０２は、ユーザ端末３０（通信部６３０）から、読上げ対象となるブロック（被読上げデータ）を順に受信し、受信した順序で、受信したブロックをルビ置換部２０４に出力する。
　ルビ置換部２０４は、図１０のルビ置換部６５０と実質的に同一であり、受信部２０２から入力されたブロックに対して、ルビ部分の置換処理を行い、このブロックを音声変換部２０６に出力する。さらに、ルビ置換部２０４は、置換処理の対象となったルビテキスト及びルビベースを出現回数計数部２１０に出力する。

　音声変換部２０６は、ルビ置換部２０４から入力されたブロック（被読上げデータ）を、音声辞書ＤＢ２２を参照して、音声データに変換し、生成された音声データを音声配信部２０８に出力する。
　音声配信部２０８は、音声変換部２０６から入力された音声データを、ユーザ端末３０に対してストリーミング配信する。

　出現回数計数部２１０は、ルビ置換部２０４により置換された被読上げデータ及びルビテキストの組の出現回数を、これらの組毎に計数する。本例の出現回数計数部２１０は、図１３に例示するように、ルビ置換部２０４から入力されるルビテキスト及びルビベースの組の出現回数を、これらの組及びドメイン毎に計数する。すなわち、本例の出現回数計数部２１０は、ドメイン毎に、ルビテキスト及びルビベースの各組合せの出現回数（置換回数）をカウントする。
　音声辞書更新部２１２は、出現回数計数部２１０による計数結果に基づいて、音声変換処理で用いられる音声辞書ＤＢ２２を更新する。本例の音声辞書ＤＢ２２は、ドメイン毎に音声辞書を有し、本例の音声辞書更新部２１２は、各ドメインにおけるルビベース及びルビテキストの組の出現回数に応じて、出現回数の多い組を優先的に採用して、ルビの付されていない文字列を音声データに変換する。

　図１３の例でいえば、ドメイン「ＡＢＣＤ．ＣＯＭ」において、被置換データ（すなわち、ルビベース）「ＷＷＷ」とルビテキスト「ワールド　ワイド　ウェブ」との組は、１３１回、置換処理の対象となっており、同じドメインにおいて、被置換データ「ＷＷＷ」とルビテキスト「ダブリュダブリュダブリュ」との組は、４回、置換処理の対象となっている。すなわち、本ドメインでは、「ＷＷＷ」を「ワールド　ワイド　ウェブ」と呼ばせる可能性が高いと判定できる。そこで、このような場合に、音声辞書更新部２１２は、「ＷＷＷ」という文字列に対して、「ワールド　ワイド　ウェブ」と読み上げる音声データが優先的に採用されるように音声辞書ＤＢ２２を更新する。
　なお、本変形例では、ドメイン毎に出現回数を計数する形態を例示したが、これに限定されるものではなく、例えば、全ウェブページを対象として計数してもよいし、ウェブページの言語毎に計数してもよい。

　このように、本変形例によれば、第２の変形例よりも読上げサーバ２０の処理負荷が重くなってしまうが、ルビに関する統計をとることができ、例えば、この統計（出現回数）に基づいて音声変換の辞書を更新することができる。

　インターネットを介して音声データを配信する情報処理システムに適用できる。

Claims

　音声ファイルを要求する要求端末と、音声ファイルを生成する音声ファイル生成装置とを含む情報処理システムであって、
　前記要求端末は、
　構造化文書の中から、被読上げデータを抽出する抽出手段と、
　前記抽出手段により抽出された被読上げデータを、被読上げデータそれぞれに関連付けられたタグに対応する順序で前記音声ファイル生成装置に送信する送信手段と
　を含み、
　前記音声ファイル生成装置は、前記送信手段から受信した順序で、受信した被読上げデータを音声データに変換する
　情報処理システム。
　前記要求端末は、
　前記抽出手段により抽出された被読上げデータのうち、ｒｕｂｙタグで囲まれた被読上げデータを、このタグに関連付けられたルビテキストの文字列で置換する置換手段
　をさらに有し、
　前記送信手段は、前記置換手段により少なくとも一部が置換された被読上げデータを前記音声ファイル生成装置に送信する
　請求項１に記載の情報処理システム。
　前記音声ファイル生成装置は、
　前記送信手段から受信した被読上げデータのうち、ｒｕｂｙタグで囲まれた被読上げデータを、このタグに関連付けられたルビテキストの文字列で置換する置換手段と、
　前記置換手段により少なくとも一部が置換された被読上げデータを、音声データに変換する変換手段と、
　前記置換手段により置換された被読上げデータ及びルビテキストの組の出現回数を、これらの組毎に計数する出現回数計数手段と
　を有する
　請求項１に記載の情報処理システム。
　プログラムファイルを要求するためのプログラム要求情報と、少なくとも読上げ範囲及び読上げ順序を指定するタグとが含まれた構造化文書を前記要求端末に提供する文書提供装置
　をさらに含み、
　前記要求端末は、構造化文書に含まれたプログラム要求情報を用いて、既定のプログラムファイルを取得し、
　前記抽出手段は、取得された前記プログラムファイルを実行することにより、構造化文書に含まれるタグに従って、被読上げデータを抽出し、
　前記送信手段は、取得された前記プログラムファイルを実行することにより、抽出された被読上げデータをタグに従って配列し、配列された被読上げデータを送信する
　請求項１に記載の情報処理システム。
　前記音声ファイル生成装置は、変換された音声データを、変換された順序でストリーミング配信する
　請求項１に記載の情報処理システム。
　前記文書提供装置は、音声データを配信するタイミングを指定するタイミング指定情報がさらに含まれた構造化文書を提供し、
　前記音声ファイル生成装置は、前記タイミング指定情報により指定されたタイミングで、各被読上げデータに対応する音声データを前記要求端末に配信する
　請求項４に記載の情報処理システム。
　音声ファイルの要求操作を受け付けるステップと、
　前記要求操作に応じて、構造化文書に含まれるタグに従って、被読上げデータを抽出するステップと、
　抽出された被読上げデータを、被読上げデータに関連付けられたタグに対応する順序で送信するステップと
　をコンピュータに実行させるプログラム。