JP2007264792A - 音声ブラウザプログラム - Google Patents

音声ブラウザプログラム Download PDF

Info

Publication number
JP2007264792A
JP2007264792A JP2006086124A JP2006086124A JP2007264792A JP 2007264792 A JP2007264792 A JP 2007264792A JP 2006086124 A JP2006086124 A JP 2006086124A JP 2006086124 A JP2006086124 A JP 2006086124A JP 2007264792 A JP2007264792 A JP 2007264792A
Authority
JP
Japan
Prior art keywords
reading
structured document
document data
read
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006086124A
Other languages
English (en)
Inventor
Kazuhiro Hara
和広 原
Itaru Osada
格 長田
Masahide Yamazoe
雅秀 山添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006086124A priority Critical patent/JP2007264792A/ja
Publication of JP2007264792A publication Critical patent/JP2007264792A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】テキストの途中に他のページにリンクしたリンク情報が埋め込まれているウェブコンテンツを音声出力する場合に、リンク先のページにジャンプして音声出力することを可能とする。
【解決手段】音声読み上げブラウザ処理装置10は、読み上げ対象ページのHTMLデータを取得すると、その先頭から順に文字コードを読み込む。そして、読み込んだ文字コードがテキストであればこれを音声変換し、アンカータグ以外のタグであれば無視し、アンカータグであれば当該HTMLデータからの文字コードの読み込みを中断し、そのアンカータグ内にリンク先として設定されているURLが示すリンク先HTMLデータを、新たな読み上げ対象ページのHTMLデータとする。読み上げ対象ページを末尾まで読み上げると、その読み上げ対象ページのリンク元HTMLデータにおける前記アンカータグ後の文字コードの読み込みを再開する。
【選択図】図3

Description

本発明は、
本発明は、HTML(HyperText Markup Language)データなどのマークアップ言語で記述されたテキストデータである構造化文書データを、音声に変換して出力する処理をコンピュータに実行させる音声ブラウザプログラムに関する。
インターネットの普及により、様々な情報がインターネットを通じて取得できたり、様々な取引や各種手続をインターネットを通じて行えるようになっているので、現在社会では、インターネットを常時利用できる環境が必需となっている。そのため、ユビキタスやITS(Intelligent Transfer System)分野等を中心に、どのような状況下であっても利用者がインターネットを利用できるようにするために、画面に表示された文字列を読まなくても利用者がインターネット上のコンテンツの内容を知覚できるようにする仕組みが、提案されている。
その一つが、インターネット上のウェブコンテンツの内容を、スピーカーから音声出力させようとするものである。例えば、下記特許文献1では、ウェブコンテンツを画面表示させるHTMLデータに関連付けて、そのウェブコンテンツの内容を予め朗読又は音声合成したものを録音した音声データをサーバにアップロードしておき、利用者の端末からサーバに対して音声出力要求があった場合には、この音声データを端末にダウンロードして、これを再生することによって音声出力させる技術が、提案されている。また、下記特許文献2では、端末側で実行されているブラウザにテキストを読み上げる機能を持たせて、HTMLデータに基づいた音声合成を行うことにより、そのHTMLデータの内容を音声出力する技術が、提案されている。
特開2005−128955号 特願2004−9562号
しかしながら、音声データを再生する方法では、音声データが予め用意されていなければならないので、ウェブコンテンツを提供する側の意識に依存せざるを得ず、よって、音声出力可能なウェブコンテンツの範囲には自ずから制限があった。
また、HTMLデータに基づいて音声合成する方法では、HTMLデータのテキスト部分を順番に音声に変換するだけであって、タグを無視してしまうので、タグの設定の仕方に込められた当該ウェブコンテンツの作成者又は提供者の意図を反映して、ウェブコンテンツを音声出力することができなかった。例えば、基準となるページを表示させるためのHTMLデータに下位階層のページにリンクしたアンカータグを組み込むことにより、ウェブコンテンツ全体を階層的な構造(例えば、基準となるページには記事のアブストラクトが表示され、そのアブスラクトに付されたアンカータグによってリンクされたページに、当該記事の全文が表示された構造)とすることが可能であるが、上記方法により音声出力させようとすると、基準となるページの内容のみが音声出力されるだけで、アンカータグが無視されてしまうので、下位階層のページの内容を音声出力させることは不可能であった。この場合には、基準となるページの全体について音声出力し終わった後に、改めて下位階層のページにアクセスして、そのページについて音声出力せざるを得なかった。
本発明は、以上の問題点に鑑みてなされたものであり、その課題は、コンピュータに対して、他のページにリンクしたリンク情報が埋め込まれている構造化文書データを読み上げさせる場合に、当該リンク情報が埋め込まれている箇所までテキストを音声変換させた後に、一旦当該リンク情報によりリンクされたページの構造化文書データ中のテキストを音声出力させてから、前記リンク情報が埋め込まれた構造化文書データにおける当該リンク情報が埋め込まれた箇所よりも後のテキストを音声変換させることができる音声ブラウザプログラムの提供である。
本発明による音声ブラウザプログラムは、テキストデータを音声変換して音声信号を出力する機能を有するコンピュータを、読上対象構造化文書データから、その読出開始点より順に文字コードを読み込み、読み込んだ文字コードがテキストであればこれを音声変換し、リンク情報であれば当該構造化文書データからの文字コードの読み込みを中断する読上処理を実行する読上手段,及び、最初に、基準となるページの構造化文書データを前記読上対象構造化文書データと指定し且つその先頭を前記読出開始点と指定して前記読上手段に読上処理を実行させ、前記読上手段がリンク情報を読み込んだ場合には、そのリンク情報がリンク先として示す構造化文書データを新たな読上対象構造化文書データと指定し且つその先頭を前記読出開始点と指定して前記読上手段に読上処理を実行させ、前記読上手段が読出対象構造化文書データに対する読上処理をその末尾まで完了した場合には、読出対象構造化文書データをリンク先として示すリンク情報を含む構造化文書データを新たな読上対象構造化文書データと指定し且つ当該リンク情報の直後を前記読出開始点と指定して前記読上手段に読上処理を実行させるリンク制御手段として機能させることを、特徴とする。
このように構成されると、リンク制御手段が、基準となるページの構造化文書データを読上対象構造化文書データと指定し且つその先頭を読出開始点と指定して読上手段に読上処理を実行させる。すると、読出手段が、指定された読上対象構造化文書データの読出開始点より順に文字コードを読み込み、読み込んだ文字コードがテキストであればこれを音声変換する。そして、読出手段がリンク情報を読み込んだ場合には、原則として、読出手段は読上処理を中断し、リンク制御手段は、そのリンク情報がリンク先として示す構造化文書データを新たな読上対象構造化文書データと指定し且つその先頭を前記読出開始点と指定して、読上手段に読上処理を実行させる。即ち、リンク先の構造化文書データにジャンプする。そして、読上手段がリンク先構造化文書データの末尾まで読上処理を完了した場合には、リンク制御手段は、当該リンク先構造化文書データをリンク先として示すリンク情報を含む構造化文書データを新たな読上対象構造化文書データと指定し且つ当該リンク情報の直後を前記読出開始点と指定して前記読上手段に読上処理を実行させる。即ち、リンク元構造化文書データのリンク情報の直後に戻り、読上処理を再開する。よって、本発明によれば、当該リンク情報が埋め込まれている箇所までテキストの音声変換がなされた後に、一旦当該リンク情報によりリンクされたページの構造化文書データのテキストを音声変換させてから、前記リンク情報が埋め込まれた構造化文書データにおける当該リンク情報が埋め込まれた箇所よりも後のテキストを音声変換することができる。
本発明において、構造化文書データは、マークアップ言語で記述されたテキストデータであるならば、HTMLデータであっても良いし、SGMLデータであっても良いし、XMLデータであっても良い。HTMLデータである場合には、リンク情報とは、これに組み込まれたアンカータグであり、そのアンカータグ組み込まれたURLが、リンク先の構造化文書データであるHTMLデータを示すことになる。なお、URLの代わりに、IPアドレスが記述されていても良い。また、HTMLデータが自コンピュータのローカルディスク内に記憶されている場合には、そのパスであっても良い。
以上のように構成された本発明によると、他のページにリンクしたリンク情報が埋め込まれている構造化文書データを読み上げさせる場合に、当該リンク情報が埋め込まれている箇所までテキストを音声変換させた後に、一旦当該リンク情報によりリンクされたページの構造化文書データ中のテキストを音声出力させてから、前記リンク情報が埋め込まれた構造化文書データにおける当該リンク情報が埋め込まれた箇所よりも後のテキストを音声変換させることができる。
以下、本発明の実施の形態を、図面を参照して説明する。
<システム構成>
図1は、本発明の実施の形態である音声ブラウザプログラムを実行する端末1のハードウェア及びソフトウェア構成を示すブロック図である。この図1に示されるように、この端末1は、インターネットNに接続されており、このインターネットN上に散在しているウェブコンテンツ(本明細書においては、全体として一纏まりの情報を表すHTMLデータ群を意味する)をダウンロードして、音声に変換して出力する機能を有する。端末1における当該機能が、音声読み上げブラウザ処理装置10としての機能である。
この音声読み上げブラウザ処理装置10としての機能は、具体的には、互いにバスBによって接続されているCPU11,RAM12,サウンドカード13及びディスク装置14からなるハードウェアと、ディスク装置に格納されているとともにCPU11によってRAM12上に読み込まれて適宜CPU11によって実行されるオペレーティングシステム(OS)14及び音声読み上げブラウザプログラム16を含むソフトウェアとによって、実現される。
このうち、CPU10は、プログラムを読み込んで実行することによって、所定の処理を実行する中央処理装置であり、請求項中のコンピュータそのものに相当する。RAM11は、CPU10が上記処理実行をするにあたり、ハードディスク14から読み出されたプログラムがキャッシュされて、その作業領域が展開される主記憶装置である。サウンドカード13は、CPU11によって生成された音声データをアナログ音声信号に変換する装置である。このサウンドカード13が出力したアナログ音声信号は、このサウンドカード13に接続されたスピーカー2に伝えられ、音声に変換される。
図1における「URLのリンク情報管理テーブル3」は、音声読み上げブラウザ処理装置10の外部に描かれているが、CPU11によって参照され得るのであれば、上記各プログラム15,16と同じディスク装置14に格納されていても良いし、それ以外のディスク装置に格納されていても良い。このURLへのリンク情報管理テーブル3は、既存のブックマークのリストを拡張したものであり、音声読み上げブラウザプログラム16の機能により、オペレータが気に入ったウェブコンテンツのURL(基準となるページを表示させるためのHTMLデータのURL)を、各種パラメータとともに登録しておくための表である。即ち、このURLへのリンク情報管理テーブル3は、各URLに対応した複数のレコードを有しており、それら各レコードは、夫々、URLが登録される「URL」フィールドの他、本実施形態において拡張された部分である「読上flag」,「表題」,「優先度」,「音質」,「読み上げ速度」及び「読み上げ階層指定」の各フィールドを有している。「読上flag」フィールドには、そのURLに相当するHTMLデータについて音声で読み上げるか(ON)否か(OFF)を示すフラグが設定される。また、「表題」フィールドには、そのURLに相当するHTMLデータの<title>タグによって設定される情報が登録される。また、「優先度」フィールドには、音声読み上げを開始したときの読み上げ順が設定される。また、「音質」フィールドには、そのURLに相当するウェブコンテンツを読み上げる際に変換される音声が男声であるか女声であるかが設定される。また、「読み上げ速度」フィールドには、そのURLに相当するHTMLデータを読み上げる際に出力される音声の再生速度が設定される。また、「読み上げ階層指定」には、そのURLに相当するウェブコンテンツが階層構造を有している場合に、読み上げ対象とされる階層の数が、設定される。
音声読み上げブラウザ処理装置10には、ディスプレイ16及び入力装置17が、バスBを介して接続されている。入力装置17は、CPU11に各種コマンドやデータを入力するキーボード及びマウスであるが、ソフトウェアキーボードを含むタッチパネルであっても良い。また、ディスプレイ16は、CPU11によって生成された画面データを、表示する。
なお、端末1には、インターネットNとの間の通信を仲介する通信アダプタが含まれているが、ウェブコンテンツは、端末内に格納されていることもあり得るので、音声読み上げブラウザ処理装置10の必須の構成ではない。よって、この音声読み上げブラウザ処理装置10の機能を実現するハードウェア構成には、通信アダプタが図示されていない。
<処理>
先ず、URLのリンク情報管理テーブル3に登録するための処理を説明する。この場合、オペレータは、入力装置17を通じて所定のコマンドを入力することにより、図4に示すリンクURL設定画面をディスプレイ16に選択させる。図4に示すように、このURL設定画面は、「URL」フィールドに設定されるべきURLが書き込まれるURLテキストボックス21,「表題」フィールドに設定されるべき表題が書き込まれる表題テキストボックス22,「読上flag」フィールドにフラグのセットが求められる場合にチェックされるチェックボックス23,「読み上げ速度」フィールドに設定される値が設定される読み上げ速度テキストボックス24,「音質」フィールドに設定される値が設定される音質テキストボックス25,「読み上げ階層指定」フィールドに設定される値が設定される読み上げ階層指定テキストボックス26,「優先度」フィールドに設定される値が設定される優先度テキストボックス27,「設定」ボタン28,「キャンセル」ボタン29,「削除」ボタン30を、含んでいる。そして、入力装置17を通じて、各テキストボックス21〜27に値が書き込まれた状態で設定ボタン28が操作されると、各テキストボックス21〜27に書き込まれた情報が記述されたレコードが、URLのリンク情報管理テーブル3に登録される。また、入力装置17を通じて、URLのリンク情報管理テーブル3に登録されている何れかのURLがURLテキストボックス21に書き込まれた状態で削除ボタン30が操作されると、当該URLが記述されたレコードが、URLのリンク情報管理テーブル3から削除される。なお、各テキストボックス21〜27に値が書き込まれているか否かに拘わらず、キャンセルボタン29が操作されると、このリンクURL設定画面が、ディスプレイ16上にて閉じ、この処理が終了する。
次に、このURLのリンク情報管理テーブル3に登録されているリンクURLに対応したHTMLデータを音声出力するための処理について、図3のフローチャートを参照して説明する。この処理は、入力装置17を通じて所定のコマンドが入力されることにより、スタートする。
スタート後最初のS01では、音声読み上げブラウザ処理装置10は、URLのリンク情報管理テーブル3にアクセスして、その内容を読み出す。次に、音声読み上げブラウザ処理装置10は、S01にて読み出したURLのリンク情報管理テーブル3中の読上フラグがセットされている各レコード毎に、そのレコードに登録されているリンクURLが示すHTMLデータを音声出力するために、S02乃至S15のループ処理を実行する。
ループ処理に入って最初のS02では、音声読み上げブラウザ処理装置10は、S01にて読み出したURLのリンク情報管理テーブル3から、「優先度」フィールドに登録された優先度の順に、読上フラグがセットされており且つ未処理のレコードを、一つ読み出すことを試みる。
次のS03では、音声読み上げブラウザ処理装置10は、S02の結果、未処理レコード(リンクURL)が読み出されたか否かをチェックする。そして、レコード(リンクURL)が読み出された場合には、音声読み上げブラウザ処理装置10は、S04において、読み出したレコード中の「URL」フィールドに設定されたURLを指定したHTTPリクエストメッセージをインターネットNに送信して、当該URLに対応したHTMLデータを取得する(基準となるページの構造化文書データを読上対象構造化文書データと指定し且つその先頭を読出開始点と指定して読上手段に読上処理を実行させるリンク制御手段に相当)。
次のS05では、音声読み上げブラウザ処理装置10は、音声読み上げ情報(即ち、S04にて読み出したレコード中の「音質」フィールドの値及び「読み上げ速度」フィールドの値)を、CPU11内のレジスタに設定する。また、「読み上げ階層指定」フィールドの値を階層指定定数Nとして設定する。また、Nと同じ値を、階層指定変数Mに設定する。
次の06では、音声読み上げブラウザ処理装置10は、S04(又はS15)にて取得したHTMLデータ(若しくは、S12にて処理対象として戻されたHTMLデータ)(読上対象構造化文書データに相当)中の文字コードを、読出開始点(最初にこのS06が実行される場合又はS15から戻された後に実行される場合には先頭,S09から戻された後に実行される場合に読込済みの部分の直後,S12から処理が戻された場合にはリンク元HTMLデータのアンカータグの直後)から読み込む。そして、次のタグの直前まで読み込むと、処理をS07へ進める。S07では、音声読み上げブラウザ処理装置10は、S06にて読み込んだデータに、EOF(データの末尾を示すタグ)が含まれているかどうかをチェックする。そして、EOFが含まれていなければ、音声読み上げブラウザ処理装置10は、S08において、S06にて読み込んだデータ中のテキスト部分をサウンドカード13に入力して、S05にてレジスタに設定された音質及び速度にて音声変換させて、スピーカー2から音声出力させる。読み込んだデータ中にテキスト部分が無ければ、S08をスキップする。
次のS09では、音声読み上げブラウザ処理装置10は、S06にて読み込んだタグがアンカータグ(リンク情報)であるかどうかをチェックする。そして、アンカータグでなければ、処理をS06に戻し、続くデータを読み込む。これに対して、アンカータグであれば、処理をS13へ進める。S06〜S09が、読上処理及び読上手段に相当する。
S13では、音声読み上げブラウザ処理装置10は、現在の階層指定変数Mの値が1より大きいかどうかをチェックする。そして、現在の階層指定変数Mの値が1であれば、読み上げるべき下位階層のページがないとして、処理をS06に戻す。これに対して、現在の階層指定変数Mの値が1より大きければ、処理をS14へ進める。
S14では、音声読み上げブラウザ処理装置10は、階層指定変数Mの値を一つデクリメントする。
次のS15では、音声読み上げブラウザ処理装置10は、S06にて読み込んだアンカータグ内でリンク先として指定されているURLを指定したHTTPリクエストメッセージをインターネットNに送信して、当該URLに対応したHTMLデータを取得して、当該HTMLデータを処理対象とする(リンク情報がリンク先として示す構造化文書データを新たな読上対象構造化文書データと指定し且つその先頭を読出開始点と指定して読上手段に読上処理を実行させるリンク制御手段に相当)。S15の完了後、音声読み上げブラウザ処理装置10は、処理をS06へ戻す。
一方、S07にてEOFが含まれると判断した場合には、音声読み上げブラウザ処理装置10は、S10において、現在の階層指定変数Mが階層指定定数Nと一致するか否かをチェックする。そして、前者が後者に一致していないと判断した場合には、基準となるページのHTMLデータに戻っていないと判断して、処理をS11へ進める。S11では、音声読み上げブラウザ処理装置10は、階層指定変数Mを一つインクリメントする。
次のS12では、音声読み上げブラウザ処理装置10は、現在処理対象(但し、音声変換済み)のHTMLデータよりも1階層上の階層のリンク元HTMLデータに処理を処理対象に戻した上で、処理をS06に戻し、アンカータグの後を読み込む(読上手段が読出対象構造化文書データに対する読上処理をその末尾まで完了した場合には、読出対象構造化文書データをリンク先として示すリンク情報を含む構造化文書データを新たな読上対象構造化文書データと指定し且つ当該リンク情報の直後を読出開始点と指定して読上手段に読上処理を実行させるリンク制御手段に相当)。
一方、現在の階層指定変数Mが階層指定定数Nと一致するとS10にて判定した場合には、基準となるHTMLデータの末尾まで音声変換を完了したと判断して、処理をS02に戻し、次の優先順位のURLを検索する。
以上に説明したS02乃至S15のループ処理を繰り返した結果、URLのリンク情報管理テーブル3に登録された全てのURLにつき読み上げを完了したために、未処理のレコードがもはや読み出せなかったとS03にて判断した場合には、音声読み上げブラウザ処理装置10は、処理を終了する。
(動作)
以上のように構成された本実施形態によると、オペレータが、URLのリンク情報管理テーブル3に1乃至複数のリンクURLが登録されている状態で、入力装置17を通じて所定のコマンドを入力すると、URLのリンク情報管理テーブル3から、その優先度の順に、各ウェブコンテンツの基本となるページのURLが読み出され(S01,S02)、このURLを指定したHTTPリクエストメッセージがインターネットNに送出され、これに応答して、当該URLに対応したコンテンツサーバから、当該URLに対応した基準となるページのHTMLデータが取得される(S04)。
そして、このHTMLデータが、先頭から、次のタグの直前までの単位で読み込まれて、読み上げられたデータに含まれるテキスト部分が音声変換される(S06〜S08)。このような読上処理が繰り返されている間に、読み込まれたデータにアンカータグが見つかると、当該URLについて指定されている読み上げ階層が1よりも大きいことを条件に、このアンカータグにリンク先として組み込まれているURLを指定したHTTPリクエストメッセージがインターネットNに送信され、これに応答して、当該URLに対応したコンテンツサーバから、当該URLに対応したリンク先ページのHTMLデータが取得される(S09,S13,S15)。
その後は、この1階層下のリンク先ページについてのHTMLデータに対する読上処理が行われる(S06〜S08)。そして、このHTMLデータからアンカータグが読み込まれた場合、現在読み上げているページの階層を示す階層指定変数Mの値が読み上げ階層の値(階層指定定数Nの値)に達していないことを条件に、更に、このアンカータグにリンク先として組み込まれているURLに対応したページのHTMLデータが取得される。このようにして、読み上げ階層の値(階層指定定数Nの値)に相当する階層まで、リンク先のページのHTMLデータが取得されて、読上処理がなされる。
そして、リンク先のページのHTMLデータの読上処理が完了すると、リンク元のページのHTMLデータを読上対象に戻し(S07,S10〜S12)、当該リンクを指定しているアンカータグの直後から、読上処理が再開される(S06〜S08)。読上処理が再開された後で再びアンカータグがあると、改めて、そのアンカータグにリンク先として組み込まれているURLに対応したページのHTMLデータが取得されて、読上処理がなされる。
このようにして、最終的に、基準となるページのHTMLデータが読上対処に戻され、そのHTMLデータの末尾まで読み上げられると、そのウェブコンテンツの読み上げは全て完了したことになるので(S06,S07,S10)、次のURLに対応したウェブコンテンツの読み上げがなされることになる。
本発明の実施の形態である音声ブラウザプログラムを実行する端末のハードウェア及びソフトウェア構成を示すブロック図 URLのリンク情報管理テーブルのデータ構造を示す表 音声読み上げブラウザプログラムをCPUが読み込むことによって実行される音声読み上げブラウザ処理装置の処理を示すフローチャート リンクURL設定画面を示す図
符号の説明
1 端末
2 スピーカー
3 URLのリンク情報管理テーブル
10 音声読み上げブラウザ処理装置
11 CPU
12 RAM
13 サウンドカード
14 ディスク装置
16 音声読み上げブラウザプログラム

Claims (4)

  1. テキストデータを音声変換して音声信号を出力する機能を有するコンピュータを、
    読上対象構造化文書データから、その読出開始点より順に文字コードを読み込み、読み込んだ文字コードがテキストであればこれを音声変換し、リンク情報であれば当該構造化文書データからの文字コードの読み込みを中断する読上処理を実行する読上手段,及び、
    最初に、基準となるページの構造化文書データを前記読上対象構造化文書データと指定し且つその先頭を前記読出開始点と指定して前記読上手段に読上処理を実行させ、前記読上手段がリンク情報を読み込んだ場合には、そのリンク情報がリンク先として示す構造化文書データを新たな読上対象構造化文書データと指定し且つその先頭を前記読出開始点と指定して前記読上手段に読上処理を実行させ、前記読上手段が読出対象構造化文書データに対する読上処理をその末尾まで完了した場合には、読出対象構造化文書データをリンク先として示すリンク情報を含む構造化文書データを新たな読上対象構造化文書データと指定し且つ当該リンク情報の直後を前記読出開始点と指定して前記読上手段に読上処理を実行させるリンク制御手段
    として機能させる音声ブラウザプログラム。
  2. 前記コンピュータは、基準となるページについて設定された読上階層数を記憶する記憶装置を有するとともに、
    前記読上手段は、前記記憶装置から前記基準となるページについて設定された読上階層数を読み出し、当該読上階層数に相当する階層の構造化文書データからリンク情報を読み込んだ場合には文字コードの読み込みを中断せず、
    前記リンク制御手段は、前記読上手段が前記読上階層数に相当する階層の構造化文書データからリンク情報を読み込んだ場合には、そのリンク情報に設定されているリンク情報がリンク先として示す構造化文書データを新たな読上対象構造化文書データと指定した読上処理を前記読上手段に実行させない
    ことを特徴とする請求項1記載の音声ブラウザプログラム。
  3. 前記コンピュータは、複数の、基準となるページの識別情報を記憶する記憶装置を有するとともに、
    前記リンク制御情報は、何れか一の基準となるページの識別情報を前記記憶装置から読み出すと、この識別情報が示す基準となるページの構造化文書データを指定して前記読上手段に読上処理を実行させ、前記読上手段が基準となるページの構造化文書データに対する読上処理をその末尾まで完了した場合には、次の基準となるページの識別情報を前記記憶装置から読み出す
    ことを特徴とする請求項1記載の音声ブラウザプログラム。
  4. 前記構造化文書データはHTMLデータであり、
    前記識別情報はURLであり、
    前記リンク情報はアンカータグである
    ことを特徴とする請求項3記載の音声ブラウザプログラム。
JP2006086124A 2006-03-27 2006-03-27 音声ブラウザプログラム Pending JP2007264792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006086124A JP2007264792A (ja) 2006-03-27 2006-03-27 音声ブラウザプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006086124A JP2007264792A (ja) 2006-03-27 2006-03-27 音声ブラウザプログラム

Publications (1)

Publication Number Publication Date
JP2007264792A true JP2007264792A (ja) 2007-10-11

Family

ID=38637754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006086124A Pending JP2007264792A (ja) 2006-03-27 2006-03-27 音声ブラウザプログラム

Country Status (1)

Country Link
JP (1) JP2007264792A (ja)

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015528918A (ja) * 2012-06-29 2015-10-01 アップル インコーポレイテッド 文書の音声作動式ナビゲーション及びブラウジングのための機器、方法、及びユーザインターフェース
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342206A (ja) * 2001-05-18 2002-11-29 Fujitsu Ltd 情報提供プログラム、情報提供方法、および記録媒体
JP2006011549A (ja) * 2004-06-22 2006-01-12 Mitsubishi Electric Corp 構造化文書変換装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342206A (ja) * 2001-05-18 2002-11-29 Fujitsu Ltd 情報提供プログラム、情報提供方法、および記録媒体
JP2006011549A (ja) * 2004-06-22 2006-01-12 Mitsubishi Electric Corp 構造化文書変換装置及びプログラム

Cited By (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
JP2015528918A (ja) * 2012-06-29 2015-10-01 アップル インコーポレイテッド 文書の音声作動式ナビゲーション及びブラウジングのための機器、方法、及びユーザインターフェース
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10789945B2 (en) 2017-05-12 2020-09-29 Apple Inc. Low-latency intelligent automated assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services

Similar Documents

Publication Publication Date Title
JP2007264792A (ja) 音声ブラウザプログラム
US9135339B2 (en) Invoking an audio hyperlink
US20070192673A1 (en) Annotating an audio file with an audio hyperlink
US8707183B2 (en) Detection of a user&#39;s visual impairment based on user inputs or device settings, and presentation of a website-related data for sighted or visually-impaired users based on those inputs or settings
JPH1097457A (ja) ウェブぺージにおいてオーディオファイル処理する方法およびコンピュータシステム
JP2011028747A (ja) サーチ・タームを生成するシステムと方法
JP4292789B2 (ja) ブラウザ機能拡張方法
KR20120016333A (ko) 웹 어플리케이션을 위한 사전 캐싱 방법 및 이를 적용한 단말 장치
JP4768375B2 (ja) ジャンプ処理抑止プログラム
JP2007510194A (ja) ブラウザを使用してsvgタイプのデジタルグラフィック文書を編集する方法及び装置
US20100023888A1 (en) Method and apparatus for controlling focus of application
US8095864B2 (en) Electronic apparatus, page display method, program, and storage medium
JP4634461B2 (ja) ドキュメント内テキスト読み上げ処理プログラムおよびドキュメント閲覧装置
JP5338298B2 (ja) ページ閲覧装置およびプログラム
JP5466593B2 (ja) 情報処理装置及び情報処理方法
JP2005115684A (ja) コンテンツ検索装置及びコンテンツ検索方法
JP2004062716A (ja) 構造化文書用インターフェース装置、構造化文書用処理方法、及びプログラム
US8601362B2 (en) Information processing apparatus, information processing method, and computer-readable recording medium storing an information processing program
JP2002251338A (ja) ブックマーク提示機能を有する文書表示装置
JP2000222326A (ja) 学習支援方法及びシステム及び学習支援プログラムを格納した記憶媒体
JP6896828B2 (ja) 出力制御プログラム、情報処理装置及び出力制御方法
JP5237875B2 (ja) 共有記事公開システム
KR100923942B1 (ko) 웹 페이지로부터 텍스트를 추출하고 이를 음성 데이터파일로 변환하여 제공하기 위한 방법, 시스템 및 컴퓨터판독 가능한 기록 매체
JP2006277090A (ja) ウェブページ処理プログラム
JP2008191879A (ja) 情報表示装置、情報表示装置の表示方法、情報表示プログラム、および情報表示プログラムを記録した記録媒体

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071116

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100319

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110118