JP4577885B2 - 音声ブラウザ装置、ウェブコンテンツ読み上げ方法およびプログラム - Google Patents

音声ブラウザ装置、ウェブコンテンツ読み上げ方法およびプログラム Download PDF

Info

Publication number
JP4577885B2
JP4577885B2 JP2004366137A JP2004366137A JP4577885B2 JP 4577885 B2 JP4577885 B2 JP 4577885B2 JP 2004366137 A JP2004366137 A JP 2004366137A JP 2004366137 A JP2004366137 A JP 2004366137A JP 4577885 B2 JP4577885 B2 JP 4577885B2
Authority
JP
Japan
Prior art keywords
link
voice
page
link destination
destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004366137A
Other languages
English (en)
Other versions
JP2006172294A (ja
Inventor
昌洋 渡辺
紋 岡野
陽子 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004366137A priority Critical patent/JP4577885B2/ja
Publication of JP2006172294A publication Critical patent/JP2006172294A/ja
Application granted granted Critical
Publication of JP4577885B2 publication Critical patent/JP4577885B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Description

本発明は、ウェブコンテンツを音声読み上げして提示する音声ブラウザにおいて、リンク先が、別ページであるか、同一ページであるか等を区別して、音声提示する音声ブラウザ装置とその方法とに関する。
インターネットの普及によって、テレビやラジオ等の放送以外でも、様々な情報を得ることができる。インターネットの利用方法のうちの1つが、ウェブサイトの閲覧である。ウェブサイトの特徴は、様々な写真や文章を、ウェブページ作者の思う通りに2次元上に配置し、ユーザに提供できる点である。マルチメディア情報の多くは、視覚的な情報であるので、視覚に障害があるユーザには、情報が提供されないという欠点がある。
このようなユーザを対象に、表示されているテキストを点字で表す点字ディスプレイや、表示されているテキストを音声で読み上げる音声ディスプレイが開発された。点字ディスプレイでは、ユーザが点字を理解していなければならないので、使えるユーザが限られるという欠点がある。一方、音声ディスプレイでは、情報が、音声としてユーザに提供されるので、特別な訓練等をしなくても、PCを扱うことができる(たとえば、特許文献1参照)。
音声ブラウザでは、ウェブページに書かれているテキスト情報を、合成音声等で読み上げることによって、ウェブページを閲覧することができる。音声ブラウザは、音声ディスプレイの一種であり、ウェブコンテンツ読み上げ専用に開発されたものである。この音声ブラウザが開発されたので、目で見る代わりに合成音声を聞くことによって、ウェブコンテンツから情報を得ることができる。しかし、音声という異なるメディアでの表示の試みは、始まったばかりであり、使い易さという観点からは工夫の余地がある。
特開平11−249867号公報
音声ブラウザでは、リンクが設定されている部分が読み上げられると、その部分の音声の属性、たとえば男声、女声の種類を変えて読み上げることが一般的である。HTMLソース中で、
<a href="http://www.goo.ne.jp/tenki.html">各地の天気</a>
等とすれば、「各地の天気」という文章に、"http://www.goo.ne.jp/tenki.html"というURLへのリンクが設定される。上記「各地の天気」の部分を、マウスでクリックすれば、"http://www.goo.ne.jp/tenki.html"を閲覧することができる。以下では、上記のようにリンクが設定されている部分を「リンク元」と呼び、リンク元のaタグの中で指定されているURLや文章内の所定の位置(リンク元をクリックしたときに閲覧されるURLや文章内の所定の位置)を、「リンク先」と呼ぶ。
つまり、文章Bへのリンクが、文章Aに設定されているときに、文章Aを、「リンク元」と呼び、文章Bを、「リンク先」と呼ぶ。文章Aには、リンクが設定され、文章Bへのリンクが指定されていると、説明する。また、リンク元の文章Aをクリック等して、リンク先の文章Bを閲覧することを、リンク元からリンク先への「リンクを辿る」と呼ぶ。
さて、音声ブラウザでは、リンクの設定されている部分を読み上げている瞬間に、Enterキーを押下すると、リンク先のページを提示するのが一般的である。
リンクをまとめて、ウェブページの上部に配置するデザインが一般的であるが、ウェブページのナビゲーション部分は、音声ブラウザのユーザが、本文まで素早く辿り着く妨げになる場合がある。
その際、ナビゲーション部分を読み飛ばすリンクを設定しておけば、ナビゲーション部分を読み飛ばすことができるので、有益である。「読み飛ばすリンク」は、ナビゲーション部分の前の文章にリンクを設定し、ナビゲーション後の部分の文章を、リンク先として指定すればよい。
音声ブラウザのユーザを意識すると、ナビゲーション部分を読み飛ばす仕組みは、今後ますます重要になると考えられる。
上記「ナビゲーション部分を読み飛ばす仕組み」は、ページ内リンクを設定するということである。リンク先として、現在閲覧しているページの他の部分に、リンク先が指定されているページ内リンクと、現在閲覧しているページ以外のページに、リンク先が指定されているページ外リンクとの2種類がある。
リンク先が、今まで閲覧していたページと同一ページであるのか、別ページであるのかを判別することは、リンク部分に「本文へジャンプ」等の言葉が使われていない限り、音声ブラウザユーザにとって、困難であるという問題がある。
また、同一ページへのリンクの場合、リンク先が、現在閲覧している部分の前の部分であるのか、後の部分であるのかが分からないので、どこを読み上げているかが分かり難いという問題がある。
本発明は、リンクを辿る前に、別ページへのリンクであるのか、同一ページへのリンクであるのかを、判別することができる音声ブラウザ装置、音声ブラウザ方法およびプログラムを提供することを目的とする。
また、本発明は、リンクを辿る前に、リンク元よりも前の部分へのリンクであるのか、後の部分へのリンクであるのかを判別することができる音声ブラウザ装置、音声ブラウザ方法およびプログラムを提供することを目的とする。
本発明は、ネットワークを介して受信したウェブコンテンツを音声変換し、読み上げる音声ブラウザ装置において、リンク先に移動する前に、リンク元のウェブコンテンツのURLとそのウェブコンテンツ中のリンクを示す部分に記載されているリンク先のウェブコンテンツのURLとを比較して、URLが同じであるのか異なるのかというURLの比較結果を求め、URLが同じであれば、さらに、リンク元の位置とリンク先の位置とを比較し、リンク先の位置がリンク元の位置の前にあるのか後にあるのかという位置の比較結果を求め、これら求めた前記URLの比較結果と前記位置の比較結果とを、記憶装置に記憶するリンク先比較結果解析手段と、リンク先の位置が他ページにある場合、ページ内のリンク元の前にある場合、ページ内のリンク元の後ろにある場合のそれぞれの場合に読み上げる互いに異なる読み上げ音声であって、前記URLの比較結果と前記位置の比較結果とに応じた読み上げ音声を構成し、記憶装置に記憶する音声構成手段と、リンク先に移動する前に、前記音声構成手段によって構成された前記読み上げ音声を提示する提示手段とを有することを特徴とする音声ブラウザ装置である。
本発明によれば、リンク部分のリンク先の種類(すなわち、別ページへのリンクであるのか、同一ページのリンクであるのか)に応じて、音声を変えて提示するので、リンクを辿る前に、別ページへのリンクであるのか、同一ページへのリンクであるのかを、判別することができるという効果を奏する。
また、本発明によれば、同一ページへのリンクである場合、リンク先が、リンク元よりも前であるのか、後であるのかに応じて、音声を変えて提示するので、リンクを辿る前に、リンク元よりも前の部分へのリンクであるのか、後の部分へのリンクであるのかを判別することができるという効果を奏する。
発明を実施するための最良の形態は、以下の実施例である。
図1は、本発明の実施例1である音声ブラウザ装置10を、ウェブサーバWSとネットワークNWとともに示すブロック図である。
音声ブラウザ装置10は、ネットワークNWを介して、ウェブサーバWSと通信し、ウェブコンテンツを受信し、表示する。
また、音声ブラウザ装置10は、ウェブコンテンツ全体を一旦、記録し、解析することによって、リンク先を分析する。この分析の結果、リンク先のページが、読み上げ中のウェブページであるかどうかに応じて、リンク部分の読み上げ方法を変える実施例である。また、リンク先のページが、読み上げ中のページと同一である場合、読み上げ位置(つまりリンク元とリンク先の位置と)を比較し、リンク先が、リンク元よりも前であるか、後であるかを提示する実施例である。
さらに、音声ブラウザ装置10は、パーソナルコンピュータ(PC)で実現する場合、情報入力部11と、制御部12と、送受信部13と、情報解析部14と、情報蓄積部15と、音声合成部16と、情報出力部17とを有する。
情報入力部11は、キーボードやマウス等の入力装置で構成されている。
情報解析部14は、ウェブコンテンツ中のリンクを示す部分におけるリンク先を解析し、記憶装置に記憶するリンク先解析手段の例である。
音声合成部16は、PC本体で構成され、上記解析されたリンク先に応じて、異なる読み上げ音声を構成し、記憶装置に記憶する音声構成手段の例である。
なお、上記音声構成手段は、リンク先の種類に応じて、音声の属性を変化させる手段である。また、上記音声構成手段は、リンク先の種類を音声で案内する手段である。さらに、リンク先の種類は、ページ内リンクか、他ページへのリンクかを区別する種類、または、ページ内リンク先が、リンク元の前にあるのか後にあるのかを区別する種類、または、リンク先がないことを示す種類である。
情報出力部17は、モニタやスピーカで構成され、読み上げ音声によってリンク先を提示する手段の例である。
次に、実施例1における音声ブラウザの動作について説明する。
図2は、実施例1における音声ブラウザの動作を示すフローチャートである。
S21で、キーボード等の情報入力部11からURLを入力する。S22で、制御部12が、ネットワークNWを介して入力したURLのウェブサーバWSとの間で送受信部13に通信させし、ウェブコンテンツを送受信部13が受信する。
S23で、受信したウェブコンテンツを情報蓄積部15に記録する。続いて、S24で、記録されたウェブコンテンツを情報解析部14が解析し、この解析の結果を、情報蓄積部15に記録する。
ウェブコンテンツ(すなわち、html要素)は、head要素とbody要素とによって構成されている。head要素の中には、title要素が含まれ、title要素に、タイトルが書かれているので、title要素の中身とbody要素の中身とが読み上げ対象である。
次に、body要素の中身の解析について説明する。
body要素の中身を解析する動作と同様に、head要素の中身を解析する。
全体的には、<body>タグから</body>タグの間が、body要素である。タグは、不等号で括られ、<body>等と書かれる。ウェブコンテンツは、タグと文章とによって構成されている。そこで、文章の先頭から解析し、何らかのタグが現われたら、次のタグまでの文章を分け、何番目かを示す番号とともに、情報蓄積部15のコンテンツ構造データベースに記録する。
次に、S25で、情報蓄積部15からデータを読み出し、各文章に付いているタグを解析し、その文章がリンク元であるか、リンク先であるか等のリンク情報を明らかにする。タグを解析すれば、リンク元の文章であるか、リンク先の文章であるか等が分かる。S26で、解析結果に応じた音ファイルを、音声合成部16が合成し、S27で、情報出力部17が出力し、終了する。
次に、S25におけるウェブコンテンツのリンク部分の解析と、記録との動作について説明する。
図3は、S25におけるウェブコンテンツのリンク部分の解析と、記録との動作を示すフローチャートである。
S31で、読み上げ単位を1つ、情報蓄積部15から情報解析部14へ読み出す(S31)。このときに、閲覧しているウェブページのURLも合わせて、情報解析部14へ送る。
図4は、読み出したデータについてのデータ形式を示す図である。
読み出したデータは、図4に示すようなデータ形式であるので、リンクが設定されているかどうかについて、タグの種類に基づいて、解析する。
S32で、その読み上げ単位について、リンクが設定されているどうか(すなわち、リンク元であるかどうか)を判断する。HTMLのタグを解析すれば、リンク元かどうかが分かる。たとえば、aタグを用いてリンクを設定する場合、以下のようにタグが付いている。
<a href="http://www.goo.ne.jp/tenki.html">各地の天気をご覧ください。</a>
このとき、hrefの値として、リンク先URLを書くことによって、どこにリンク先が指定されているかが分かる。この例は、別ページにリンク先が指定されている場合である。
一方、同一ページにリンク先が指定されていれば、位置名を書く。上記「位置名」は、リンク先を示すものである。
リンク元には、以下のようにリンク先が指定されている。
<a href="#kakuti">各地の天気をご覧ください。</a>
そして、リンク先には、以下のように記述する。
<a name="kakuti">各地の天気は、東京地方…</a>
これによって、リンク元を、「各地の天気をご覧ください。」とし、「各地の天気は、東京地方…」の部分を、リンク先に指定することができる。
また、他のページの特定の位置に、リンク先を指定する場合、
<a href="リンク先他ページ URL#位置名">各地の天気をご覧ください。</a>
等とする。
図5は、実施例1において、URL1のリンク元におけるリンク情報の種類の例を示す図である。
タグ解析の結果、リンク元のリンク情報の種類は、図5に示すように、6種類に分けられる。リンク元タグの欄は、URL1のウェブコンテンツ内に存在しているリンク元のタグを示しているとして説明する。
ケース1は、リンク先として、URL1が指定されている場合である。この場合、リンクを辿ると、URL1のウェブページが読み出され、URL1の最初から音声読み上げされる。このように、URL1の最初から音声読み上げされる場合のリンク情報を、「同一ページ先頭リンク」と呼ぶ。
ケース2は、リンク先として、位置名1が指定され、同じウェブページ内のリンク元タグよりも前に、位置名1が示すリンク先を表すタグが1つ存在する場合である。この場合、リンクを辿ると、位置名1の部分から音声読み上げされる。リンク元よりも前に位置名1が存在しているので、ウェブページの前方に戻る。このように、リンク元よりも前に位置名が存在している場合のリンク情報を、「同一ページ前リンク」と呼ぶ。
ケース3は、ケース2と同様であるが、位置名1がリンク元よりも後に存在している場合であり、リンクを辿ると、ウェブページの後方へ移動する。このように、リンク元よりも後に位置名が存在している場合のリンク情報を、「同一ページ後リンク」と呼ぶ。
ケース4は、リンク元には、位置名1がリンク先として指定されているにもかかわらず、同じウェブページ内に、位置名1の記述がない場合である。この場合、リンクを辿ることができないので、リンク情報は、「エラー」であるとする。
ケース5では、リンク元には、位置名1がリンク先として指定されているにもかかわらず、同じウェブページ内に、リンク先位置名1の記述が2ヶ所以上ある場合である。この場合、リンクを辿ることができないので、リンク情報は、「エラー」であるとする。または、一番前にあるリンク先位置名1の記述の部分に、リンク先を指定するようにしてもよい。この場合、一番前に存在している位置名1が、リンク元よりも前にあるか後にあるかによって、リンク情報は、上記「同一ページ前リンク」になるか、上記「同一ページ後リンク」になるかが決まる。
ケース6は、リンク先として、URL1と位置名1とが指定されている。リンク元のURLとリンク先のURLとが同じであるので、これも同一ページリンクの指定である。
ケース6、7、8、9は、それぞれ、ケース2、3、4、5と同じであり、リンク情報もそれぞれ同じである。
ケース10、11は、ともに、リンク先に別ページのURLであるURL2が指定されている。この場合、リンクを辿ると、URL2のウェブページが読み出され、音声読み上げされる。この場合のリンク情報を「別ページリンク」と呼ぶ。この2つ(ケース10,11)を分けて、リンク情報を付与するようにしてもよい。
さらに、ケース12のように、リンクが設定されていない場合は、「リンクなし」というリンク情報が付与される。このように、リンク元のリンク情報は、「同一ページ先頭リンク」、「同一ページ前リンク」、「同一ページ後リンク」、「別ページリンク」、「リンクなし」、「エラー」の6種類である。
さらに、リンク先のリンク情報として、リンク先が存在している位置を示す位置名を表すタグが存在しているときには、「被リンク」のリンク情報を付加するようにし、合計7種類のリンク情報を、読み上げ単位に付加する。この方法については、以下で説明する。
さて、図3に示すフローチャートにおいて、S32で、リンク元でなければ、S33で、リンク先であるかどうかを、判断する。その文章がリンク先かどうかは、上記のように、
<a name="kakuti">各地の天気は、東京地方…</a>
等というタグが付いているかどうかによって、判断することができる。リンク先であれば、S36で、リンク情報として「被リンク」をコンテンツ構造データベースに記録する。このリンク情報のデータは、図4に示すコンテンツ構造データベースに追記される。
図6は、追記されたデータの例を示す図である。
図7は、実施例1において、前後関係解析用のリンク先データベースの格納例を示す図である。
同時に、リンク先の情報(位置名)を、その読み上げ単位の番号(何番目の読み上げ単位かを表す番号)と合わせて、図7に示すようなデータ形式で、リンク先データベースに追記する。これら(リンク先の情報(位置名)、その読み上げ単位の番号(何番目の読み上げ単位かを表す番号))は、同一ページ内リンクで、リンク元とリンク先との前後関係を判断するときに使い、詳しくは後述する。
S33で、リンク先でないと判断された場合、S37で、リンク情報として「リンクなし」をコンテンツ構造データベースに記録する。このリンク情報のデータも同じく、図4に示すコンテンツ構造データベースに追記される。追記後の例は、図6に示す場合と同じであり、図5で説明したケースのうちのケース12に該当する。
さて、S32で、リンク元であると判断されると、S34で、そのリンク先が別ページかどうかを判断する。リンク先は、
<a href="リンク先他ページ URL#位置名">各地の天気をご覧ください。</a>
等で、URLが指定されているかどうかを確認する。
URLが指定されていると、S34で、読み込まれた閲覧中ウェブページのURLと、タグで指定されているURLとを比較する。この比較の結果、両URLが互いに異なる場合、リンク先が別ページであるので、S38で、リンク情報として「別ページリンク」を、コンテンツ構造データベースに記録する。
このリンク情報のデータも、同じく、図4に示すコンテンツ構造データベースに追記される。これは、図5で説明したケースのうちでケース10、11に該当する。実施例1では、別ページリンクの場合、位置名が指定されているときと、指定されていないときとを、同じように扱うが、互いに異なる扱いをするようにしてもよい。
S34で、タグで指定されたURLが、S31で読み込まれた閲覧中ウェブページのURLと同じである場合、リンク先が同一ページである。また、タグの中でURLが指定されず、位置名だけが指定されている場合も、リンク先が同一ページである。リンク先が同一ページである場合、S35で、リンク先が位置名で指定されているかどうかを判断する。リンク先が位置名で指定されているときに、S39で、リンク情報として「エラー」を図4に示すデータに追記する形で、コンテンツ構造データベースに記録する。
これは、次の段階で、リンク先が確定されたものは、「同一ページ前リンク」、「同一ページ後リンク」等と上書きするためで、リンク先が確定できなかったものには、「エラー」というリンク情報を与えるためである。
図8は、前後関係解析用のリンク元データベースの格納例を示す図である。
同時に、図8に示すような形式で、リンク元に書かれているリンク先の情報(位置名)を、その読み上げ単位の番号と合わせて、リンク元データベースに追記する。
S35で、リンク先が位置名で指定されていないと、S310で、リンク情報として「同一ページ先頭リンク」を、図4に示すデータに追記する形でコンテンツ構造データベースに記録する。
S311で、解析した読み上げ単位が最後の読み上げ単位であるかどうかを判断する。最後でなければ、S31に戻り、次の読み上げ単位を解析する。最後であれば、終了する。
S36の次に、S312で、読み上げ単位番号とリンク先位置名とをリンク先データベースに記録する。また、S39の次に、S313で、読み上げ単位番号とリンク先位置名とを、リンク元データベースに記録する。
図3のフローチャートに示す動作では、同一ページの別の位置に、リンクが設定されている場合、そのリンク先がリンク元よりも前であるのか、後であるのかを判断していない。したがって、図5に示すように、ケース2〜ケース9を区別していない。
図3のフローチャートに示す解析が終わると、同一ページへのリンク部分について、図7、図8に示す前後関係解析用データを記録することができる。このデータには、図7、図8に示すように、読み上げ単位番号とリンク位置とを示す位置名が同一ページのリンク先、リンク元について、それぞれ記録されている。
次に、実施例1において、同一ページの別の位置に、リンクが設定されている場合、そのリンク先がリンク元よりも前であるのか、後であるのかを解析する動作について説明する。
図9は、実施例1において、同一ページの別の位置に、リンクが設定されている場合、そのリンク先が、リンク元よりも、前であるのか、後であるのかを解析する動作を示すフローチャートである。
まず、S41で、図8に示すリンク元データの1行目を読み込む。S43で、読み上げ単位番号、位置名を読み出す。1行目のデータは、図8から、読み上げ単位番号=8、位置名=位置名1である。この「読み上げ単位番号=8、位置名=位置名1」は、読み上げ単位番号が8であるタグは、リンク元であり、位置名が位置名1で示されるリンク先へ、リンクが設定されていることを示す。続いてS44で、図7に示すリンク先データの1行目を読み込む。S46で、読み上げ単位番号、位置名を読み出す。上記1行目のデータは、図7から、読み上げ単位番号=6、位置名=位置名1で示されるリンク先へ、リンクが設定されていることを示している。S47で、リンク元として読み込んだ位置名とリンク先として読み込んだ位置名とを比較する。これらが等しければ、S48に進む。
図10は、位置名既出データベースの格納例を示す図である。
S48で、この位置名が既出しているかどうかを判定する。今は、1行目を読み出したばかりであるので、既出した位置名はまだない。今後、リンク先として既出した位置名を図10に示すような位置名既出データベースに追記するが、この段階では、データは空であるので、図10に示す形になっている。横棒は、データがないことを意味している。S48で、図10に示す位置名既出データベースを検索し、データベース中にないので、S49に進む。
S49で、リンク元とリンク先とにおける読み上げ単位番号を比較する。この例では、リンク元は8であり、リンク先は6であるので、リンク元の読み上げ番号が小さくないので、S412に進む。これはリンク元よりリンク先の方が前にあるということである。そこで、S412で、「同一ページ前リンク」というリンク情報を、図6のコンテンツ構造データベースの該当するリンク元のリンク情報に上書きする。図6に示す例では、読み上げ番号が8であるリンク情報は、「エラー」であったが、これを「同一ページ前リンク」に上書きする。
次に、S413で、このときの位置名である位置名1を、既出データとして、図10に示す位置名既出データベースに上書きする。S414で、図7に示すリンク先データの最終行であるかどうかを判断する。最終行でなければ、S45で、図7に示すリンク先データの次の行を読み込み、次の行の解析を行う。
S46で、読み上げ単位番号、位置名を読み込み、S47で、リンク元とリンク先とで位置名が同じでなければ、S414に進み、最終行でなければ、S45に進み、その次の行の解析を行う。こうして、図7に示すリンク先データの各行を最終行になるまで、解析する。
S48で、位置名が既出であれば(図10に示す位置名既出データベースの中に、S47で比較したリンク先の位置名があれば)、リンク先が少なくとも2つあることを意味する。リンク先が2つ以上あれば、実施例1の音声ブラウザは、エラーとしてリンクを辿ることができないとする。しかし、最初に出てきたリンク先へリンクを辿るようにするときには、位置名が2回目以降に出てきても、エラーにせず、最初に出てきたリンク先へリンクを設定するようにしてもよい。
実施例1では、S410に進み、「エラー」というリンク情報を、図6に示すコンテンツ構造データベースに該当するリンク元のリンク情報に上書きする。元々、リンク情報は「エラー」であるので、上書きしなくてもよいのではあるが、ここでは上書きするとして説明する。
S49で、リンク元とリンク先との読み上げ単位番号を比較し、リンク元の読み上げ番号の方が小さければ、S411に進む。これは、リンク元よりもリンク先の方が後にあることを意味する。そこで、S411で、「同一ページ後リンク」というリンク情報を、図6に示すコンテンツ構造データベースの該当するリンク元のリンク情報に上書きする。
図11は、実施例1における位置名既出データベースの格納例を示す図である。
次に、S413で、既出データベースに上書きする。このときのデータ形式は、図10に上書きし、たとえば、図11に示すようになる。続いて、S414で、最終行でなければ、S45で、図7に示すリンク先データの次の行を読み込み、次の行を解析する。
S414で、最終行であることを判断すると、S415で、図8に示すリンク元情報が最終行であるかどうかを判断する。最終行でなければ、S42で、次の行を、図8から読み込み、次の行を解析する。最終行であれば、終了する。
なお、S47の次に、S416で、位置名既出、データベースを検索する。
上記のようにして、図8に示す全てのリンク元について解析が終了すると、図6に示すデータのリンク情報のうちで、「エラー」が、「同一ページ前リンク」、「同一ページ後リンク」、「エラー」のうちのどれかに上書きされる。リンク先がないものについては、図6に示すように、元々書かれていたリンク情報「エラー」で確定する。
図12は、実施例1において、読み上げ対象ウェブコンテンツのコンテンツ構造データベースの格納例を示す図である。
解析後のコンテンツ構造データベースは、図12に示すようになり、対象テキストについて、それぞれリンク情報が付加されている。リンク情報は、「被リンク」、「リンクなし」、「別ページリンク」、「同一ページ先頭リンク」、「同一ページ前リンク」、「同一ページ後リンク」の6種類である。
図2に立ち返って説明すると、S25で、上記解析が行われる。これらのリンク部分について、読み上げ音声の属性を変えて読み上げる。この音ファイルを、S26で合成する。リンク情報と音声属性との対応は、情報蓄積部15の音声属性情報データベースに格納されている。
図13は、実施例1における音声属性情報データベースの格納例を示す図である。
データ構造は、図13に示すようになっている。「同一ページ先頭リンク」、「同一ページ前リンク」、「同一ページ後リンク」の音声属性がそれぞれ、女声(低音)、女声(中音)、女声(高音)であるが、これは、女声の高さの異なるものを用意し、それぞれ、低めの女声、中くらいの高さの女声、高めの女声を意味する。この音声属性に従って、音声合成部16が、音声を合成する。図2に示す最後の段階、S27で、合成された音声を情報出力部17が出力する。
実施例1では、読み上げ対象の文章に付加されている属性に従って、読み上げ対象の文書を、音声合成部16が音声ファイル化する。そして、S27で、情報出力部17が音声を出力する。実施例1では、受信したウェブコンテンツを一旦、情報蓄積部に記録し、それから解析する例である。一括して解析するので、解析後のレスポンスがよいという特徴を有する。
本発明の第2の実施例は、ウェブコンテンツを受信した後に、逐次解析することによって、リンク先を分析し、読み上げる実施例であり、この結果、リンク先のページが、読み上げ中のウェブページであるかどうかによって、リンク部分の読み上げ方を変える実施例である。
また、実施例2は、リンク先のページが、読み上げ中のページと同一であれば、読み上げ位置(リンク元とリンク先との位置を比較し、リンク元よりも前であるか、後であるか)を提示する実施例である。
図14は、実施例2において、body要素を解析する動作を示すフローチャートである。
head要素を解析する動作は、body要素を解析する動作と同様である。
S51で、ウェブコンテンツを送受信部13で受信し、S52で、閲覧中のウェブページのURLを、情報蓄積部15に記録する。上記のように、所定のタグの後から、次のタグの前までの文章を、「読み上げ単位」と呼ぶ。
S53で、この読み上げ単位を1つ、送受信部13から入力する。S54で、読み上げ単位に、リンクが設定されているか(リンク元であるか)どうかを判断する。S54でリンク元を示すタグ<a href=・・・が現われたら、S55に進む。そうでなければ、S56で、リンク先であるかどうかを判断する。
ページ内の特定の場所に、リンク先を設定するには、<a name=・・・というリンク先を表すタグを使用する。このタグが現われたら、リンク先であると判断し、S514で、情報蓄積部15の位置名既出データベースに、リンク先の位置名を、既出データとして、図10に示すような形式で、情報蓄積部15に記録し、「被リンク」として、音の属性を決定する。
図15は、実施例2における音声属性情報データベースの格納例を示す図である。
どのような属性にするかは、図15に示すようなデータ形式で、情報蓄積部15の音声属性情報データベースに予め記録する。「被リンク」の場合、男声であるので、S516で、音声合成部で属性に応じた音ファイルを合成する。S517で、合成した音声を情報出力部17から提示する。S518で、ウェブコンテンツの終わりであるかどうかを判断し、ウェブコンテンツが終わりであれば、終了し、終わりでなければ、S53に戻り、次の読み上げ単位を解析する。
S56で、リンク先でないと判断されると、リンク先でもリンク元でもないので、S515で、「リンクなし」として、図15に示すデータに従い、男声に決定され、S516で、音声ファイルが合成され、S517で、合成音声を出力する。S518で、ウェブコンテンツの終わりかどうかを判断し、ウェブコンテンツの終わりであれば、終了し、終わりでなければ、S53に戻り、次の読み上げ単位を解析する。
S54で、リンク元であると判断された後に、S55で、リンク先の指定にURLが含まれているかどうかを判断する。URLが含まれていなければ、リンク先が位置名のみで指定されている場合である。S59で、位置名既出データベースに、該当するリンク先(位置名)が記録されているかどうかをチェックする。S59で、該当するリンク先が未だ記録されていなければ、S510で、「同一ページリンク先未出」とし、図15に示すデータに従い、音声属性を決定し、S516で、該当の属性で音ファイルを合成し、S517で、合成音声を出力する。S518で、ファイルの終わりでなければ、S53に戻り、ファイルの終わりであれば、終了する。
S59で、該当するリンク先が既に記録されていれば、S511で、「同一ページリンク先既出」として、図15に示すデータに従い、音声属性を決定し、S516で、該当の属性で音ファイルを合成し、S517で、合成音声を出力する。S518で、ファイルの終わりでなければ、S53に戻り、ファイルの終わりであれば、終了する。
一方、S55で、リンク先にURLが含まれていれば、S57に進む。S57に進む場合は、リンク先のURLのみ指定されている場合と、リンク先のURLと位置名が指定されている場合とである。
また、リンク先URLとして、現在閲覧中のページを指定している場合が考えられる。リンク先URLとして、現在閲覧中のページを指定しているかどうかを、S57で判断する。リンク先に含まれているURLと、情報蓄積部15に記録され、現在閲覧中ページのURLとが同じであれば、S58で、リンク先がURLのみで表されているか、位置名も指定されているかを判断する。URLのみで表されている場合、ページの最初に戻る。そこで、S512で、「同一ページ先頭リンク」として、図15に示すデータに従い、音声属性を決定し、S516で、該当の属性で音ファイルを合成し、S517で、合成音声を出力する。S518で、ファイルの終わりでなければ、S53に戻り、ファイルの終わりであれば、終了する。一方、S58で、リンク先の位置名も指定されている場合、S59に進む。
さて、S57で、リンク先URLとして、現在閲覧中のページを指定していないと判断されると、S513で、「別ページリンク」として、図15に示すデータに従い、音声属性を決定し、S516で、該当の属性で音ファイルを合成し、S517で、合成音声を出力する。S518で、ファイルの終わりでなければ、S53に戻り、ファイルの終わりであれば、終了する。
実施例1のようにリンク先が複数あり、また、リンク先がないというエラーがなければ、「同一ページリンク先既出」は、リンク先がリンク元よりも前にあることを意味するで、「同一ページ前リンク」であり、「同一ページリンク先未出」は、リンク先がリンク元よりも後にあることを意味しているので、「同一ページ後リンク」になり、したがって、このようにして、図13に示すデータベースを使うようにしてもよい。エラーがない限り、同じ働きである。
図16は、実施例2において、音声情報データベースに格納されているリンク先情報と案内音声との関係例を示す図である。
また、リンク部分の音声の属性を変える以外にも、図16に示すような音声情報データベースを用意し、この音声情報データベースに基づいて、リンク先がどこにあるかを、音声で伝えてから、読み上げ単位の音声合成し、出力するようにしてもよい。
つまり、上記実施例は、ネットワークを介して、ウェブコンテンツを音声変換し、読み上げる音声ブラウザ方法において、ウェブコンテンツ中のリンクを示す部分におけるリンク先を解析し、記憶装置に記憶するリンク先解析工程と、上記解析されたリンク先に応じて、異なる読み上げ音声を構成し、記憶装置に記憶する音声構成工程とを有し、読み上げ音声によってリンク先を提示することを特徴とする音声ブラウザ方法の例である。
また、上記実施例をプログラムの発明として把握することができる。つまり上記実施例は、ネットワークを介して、ウェブコンテンツを音声変換し、読み上げるプログラムにおいて、ウェブコンテンツ中のリンクを示す部分におけるリンク先を解析し、記憶装置に記憶するリンク先解析手順と、上記解析されたリンク先に応じて、異なる読み上げ音声を構成し、記憶装置に記憶する音声構成手順と、読み上げ音声によってリンク先を提示する手順とを、コンピュータに実行させるプログラムの例である。換言すれば、上記実施例は、上記方法をコンピュータに実行させることを特徴とするプログラムの例である。
そして、上記プログラムを、記録媒体に記録するようにしてもよく、また、ネットワークを通して提供するようにしてもよい。
本発明の実施例1である音声ブラウザ装置10を、ウェブサーバWSとネットワークNWとともに示すブロック図である。 実施例1における音声ブラウザの動作を示すフローチャートである。 S25におけるウェブコンテンツのリンク部分の解析と、記録との動作を示すフローチャートである。 読み出したデータについてのデータ形式を示す図である。 実施例1において、URL1のリンク元におけるリンク情報の種類の例を示す図である。 追記されたデータの例を示す図である。 実施例1において、前後関係解析用のリンク先データベースの格納例を示す図である。 前後関係解析用のリンク元データベースの格納例を示す図である。 実施例1において、同一ページの別の位置に、リンクが設定されている場合、そのリンク先が、リンク元よりも、前であるのか、後であるのかを解析する動作を示すフローチャートである。 位置名既出データベースの格納例を示す図である。 実施例1における位置名既出データベースの格納例を示す図である。 実施例1において、読み上げ対象ウェブコンテンツのコンテンツ構造データベースの格納例を示す図である。 実施例1における音声属性情報データベースの格納例を示す図である。 実施例2において、body要素を解析する動作を示すフローチャートである。 実施例2における音声属性情報データベースの格納例を示す図である。 実施例2において、音声情報データベースに格納されているリンク先情報と案内音声との関係例を示す図である。
符号の説明
10…音声ブラウザ装置、
11…情報入力部、
12…制御部、
13…送受信部、
14…情報解析部、
15…情報蓄積部、
16…音声合成部、
17…情報出力部。

Claims (7)

  1. ネットワークを介して受信したウェブコンテンツを音声変換し、読み上げる音声ブラウザ装置において、
    リンク先に移動する前に、リンク元のウェブコンテンツのURLとそのウェブコンテンツ中のリンクを示す部分に記載されているリンク先のウェブコンテンツのURLとを比較して、URLが同じであるのか異なるのかというURLの比較結果を求め、URLが同じであれば、さらに、リンク元の位置とリンク先の位置とを比較し、リンク先の位置がリンク元の位置の前にあるのか後にあるのかという位置の比較結果を求め、これら求めた前記URLの比較結果と前記位置の比較結果とを、記憶装置に記憶するリンク先比較結果解析手段と;
    リンク先の位置が他ページにある場合、ページ内のリンク元の前にある場合、ページ内のリンク元の後ろにある場合のそれぞれの場合に読み上げる互いに異なる読み上げ音声であって、前記URLの比較結果と前記位置の比較結果とに応じた読み上げ音声を構成し、記憶装置に記憶する音声構成手段と;
    リンク先に移動する前に、前記音声構成手段によって構成された前記読み上げ音声を提示する提示手段と;
    を有することを特徴とする音声ブラウザ装置。
  2. 請求項1において、
    上記音声構成手段が構成する読み上げ音声は、リンク先の位置が、他ページにあるのか、ページ内のリンク元の前にあるのか、ページ内のリンク元の後ろにあるのかに応じて、音声の属性が変化されて読み上げる音声であることを特徴とする音声ブラウザ装置。
  3. 請求項1において、
    上記音声構成手段が構成する読み上げ音声は、リンク先の位置が他ページにあることを示す音声、ページ内のリンク元の前にあることを示す音声、または、ページ内のリンク元の後ろにあることを示す音声であることを特徴とする音声ブラウザ装置。
  4. ネットワークを介して受信したウェブコンテンツを音声変換し、読み上げる音声ブラウザ装置におけるウェブコンテンツ読み上げ方法において、
    リンク先に移動する前に、リンク元のウェブコンテンツのURLとそのウェブコンテンツ中のリンクを示す部分に記載されているリンク先のウェブコンテンツのURLとを比較して、URLが同じであるのか異なるのかというURLの比較結果を求め、URLが同じであれば、さらに、リンク元の位置とリンク先の位置とを比較し、リンク先の位置がリンク元の位置の前にあるのか後にあるのかという位置の比較結果を求め、これら求めた前記URLの比較結果と前記位置の比較結果とを、記憶装置に記憶するリンク先比較結果解析工程と;
    リンク先の位置が他ページにある場合、ページ内のリンク元の前にある場合、ページ内のリンク元の後ろにある場合のそれぞれの場合に読み上げる互いに異なる読み上げ音声であって、前記URLの比較結果と前記位置の比較結果とに応じた読み上げ音声を構成し、記憶装置に記憶する音声構成工程と;
    リンク先に移動する前に、前記音声構成工程で構成された前記読み上げ音声を提示する提示工程と;
    を有することを特徴とするウェブコンテンツ読み上げ方法。
  5. 請求項4において、
    上記音声構成工程で構成する読み上げ音声は、リンク先の位置が、他ページにあるのか、ページ内のリンク元の前にあるのか、ページ内のリンク元の後ろにあるのかに応じて、音声の属性が変化されて読み上げる音声であることを特徴とするウェブコンテンツ読み上げ方法。
  6. 請求項4において、
    上記音声構成工程で構成する読み上げ音声は、リンク先の位置が他ページにあることを示す音声、ページ内のリンク元の前にあることを示す音声、または、ページ内のリンク元の後ろにあることを示す音声であることを特徴とするウェブコンテンツ読み上げ方法。
  7. 請求項1〜3のいずれか1項に記載の音声ブラウザ装置を構成する各手段としてコンピュータを機能させるためのプログラム。
JP2004366137A 2004-12-17 2004-12-17 音声ブラウザ装置、ウェブコンテンツ読み上げ方法およびプログラム Expired - Fee Related JP4577885B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004366137A JP4577885B2 (ja) 2004-12-17 2004-12-17 音声ブラウザ装置、ウェブコンテンツ読み上げ方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004366137A JP4577885B2 (ja) 2004-12-17 2004-12-17 音声ブラウザ装置、ウェブコンテンツ読み上げ方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2006172294A JP2006172294A (ja) 2006-06-29
JP4577885B2 true JP4577885B2 (ja) 2010-11-10

Family

ID=36672961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004366137A Expired - Fee Related JP4577885B2 (ja) 2004-12-17 2004-12-17 音声ブラウザ装置、ウェブコンテンツ読み上げ方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4577885B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1078952A (ja) * 1996-07-29 1998-03-24 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置
JPH10207685A (ja) * 1996-12-04 1998-08-07 At & T Corp ハイパーリンク化された情報との音声化されたインターフェースのためのシステムおよび方法
JPH11187366A (ja) * 1997-10-14 1999-07-09 Mitsubishi Electric Corp データ多重信号処理装置および辞書更新方法
JP2001273216A (ja) * 2000-03-24 2001-10-05 Toshiba Corp 移動端末機によるネットサーフィン方法、移動端末機、サーバシステムおよび記録媒体
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2004139274A (ja) * 2002-10-16 2004-05-13 Mitsubishi Electric Engineering Co Ltd コンテンツ変換装置及び情報端末装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1078952A (ja) * 1996-07-29 1998-03-24 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置
JPH10207685A (ja) * 1996-12-04 1998-08-07 At & T Corp ハイパーリンク化された情報との音声化されたインターフェースのためのシステムおよび方法
JPH11187366A (ja) * 1997-10-14 1999-07-09 Mitsubishi Electric Corp データ多重信号処理装置および辞書更新方法
JP2001273216A (ja) * 2000-03-24 2001-10-05 Toshiba Corp 移動端末機によるネットサーフィン方法、移動端末機、サーバシステムおよび記録媒体
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2004139274A (ja) * 2002-10-16 2004-05-13 Mitsubishi Electric Engineering Co Ltd コンテンツ変換装置及び情報端末装置

Also Published As

Publication number Publication date
JP2006172294A (ja) 2006-06-29

Similar Documents

Publication Publication Date Title
US7197462B2 (en) System and method for information access
JP4702743B2 (ja) コンテンツ表示制御装置およびコンテンツ表示制御方法
KR100919738B1 (ko) 콘텐츠 작성 시스템, 콘텐츠 작성 방법, 이 콘텐츠 작성방법을 실행시키기 위한 컴퓨터 실행 가능한 프로그램, 이프로그램이 기록된 컴퓨터 판독 가능한 기억 매체,그래피컬 유저 인터페이스 시스템 및 표시 제어 방법
JP2007242013A (ja) コンテンツ管理指示を呼び出すための方法、システム、およびプログラム(コンテンツ管理指示の呼び出し)
JPWO2005029353A1 (ja) 注釈管理システム、注釈管理方法、文書変換サーバ、文書変換プログラム、電子文書付加プログラム
JPWO2006046523A1 (ja) 文書解析システム、及び文書適応システム
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
JP2004334409A (ja) データ閲覧支援装置、データ閲覧方法及びデータ閲覧プログラム
JP4577885B2 (ja) 音声ブラウザ装置、ウェブコンテンツ読み上げ方法およびプログラム
JP2007011893A (ja) Rss文書の閲覧方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP4194741B2 (ja) 画面読み上げソフトを使用する利用者に向けたWebページ案内サーバー及び方法
JP4120597B2 (ja) 部分コンテンツ作成方法及び装置及びプログラム
JP2007133763A (ja) 要素情報比較装置およびプログラム
JP4407650B2 (ja) ブログ作成用クライアント装置、ブログサーバ、及びそれらのプログラム
JP4014361B2 (ja) 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3237619B2 (ja) 文書表示装置および文書表示方法並びに文書表示プログラムを記録した記録媒体
KR102057706B1 (ko) 컨텐츠의 목차 입력 방법 및 재생 방법
JP2005115684A (ja) コンテンツ検索装置及びコンテンツ検索方法
JP2005010992A (ja) 合成音声によるウェブページの説明および広告の方法及びサーバ
JP4514144B2 (ja) 音声読み上げ装置およびプログラム
US20080256127A1 (en) System For Extracting Specific Portions of Contents
JP2005099741A (ja) 音声辞書作成装置、音声辞書作成方法、及びプログラム
JP4783164B2 (ja) 情報提供サーバ、視聴端末、情報提供プログラム、及び回答データ取得プログラム
JP2006277090A (ja) ウェブページ処理プログラム
JP2009223538A (ja) 情報提供方法、情報提供装置、情報提供システム及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100820

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100823

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees