JP2017116710A - 音声配信システムおよび文書配信システム - Google Patents
音声配信システムおよび文書配信システム Download PDFInfo
- Publication number
- JP2017116710A JP2017116710A JP2015251423A JP2015251423A JP2017116710A JP 2017116710 A JP2017116710 A JP 2017116710A JP 2015251423 A JP2015251423 A JP 2015251423A JP 2015251423 A JP2015251423 A JP 2015251423A JP 2017116710 A JP2017116710 A JP 2017116710A
- Authority
- JP
- Japan
- Prior art keywords
- data
- voice
- document
- user terminal
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims description 90
- 230000005540 biological transmission Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- 239000000470 constituent Substances 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 30
- 238000007726 management method Methods 0.000 description 84
- 230000006870 function Effects 0.000 description 29
- 230000004044 response Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 14
- 238000000034 method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 239000000284 extract Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000003825 pressing Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
【課題】 文書データに対して、音声再生条件に基づいた処理を行うことが可能な音声配信システムおよび文書配信システムを提供する。【解決手段】 利用者が利用する端末装置である利用者端末10と、文書データを管理するサーバである文書管理サーバ20と、文字データを音声データに変換するサーバである音声変換サーバ30と、が通信可能に接続された音声配信システムであって、文書管理サーバ20は、文書データを記憶した記憶手段と、利用者端末10により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、算出された文字数に対応する文字データを、文書データから抽出する手段と、抽出された文字データを、音声変換サーバ30に送信する手段と、音声変換サーバ30から取得した音声データを利用者端末10に送信する手段と、を有する。【選択図】 図1
Description
本発明は、音声再生条件に基づいて文書情報を処理するための技術に関する。
近年、コンピュータおよび通信技術の進展により、様々なデータを、ネットワークを介して配信することが行われている。ネットワークを介したデータの配信としては、音楽データの伸びが著しく、CDの購入に代えて音楽データをダウンロードする利用者が増えている。
音楽データをダウンロードする際、単に1件分をまとめてダウンロードするだけでなく、通信回線の速度や情報端末、ネットワークの混雑状況等の環境によるサービス低下を避けることが望まれる。そのため、利用者が試聴時間等を指定し、試聴時間分だけ配信する技術も提案されている(特許文献1参照)。
一方、文字データを主体とする文書データを音声変換して音声データを得る技術も開発され、実用化されている。しかしながら、上記従来の技術では、音楽など既に音のデータに変換されているものについては、対応しているが、文字データを主体とする文書データに対して、音声再生条件に基づいた処理を行うことは困難であった。
そこで、本発明は、文書データに対して、音声再生条件に基づいた処理を行うことが可能な音声配信システムおよび文書配信システムを提供することを課題とする。
上記課題を解決するため、本発明第1の態様では、
利用者が利用する端末装置である利用者端末と、文書データを管理するサーバである文書管理サーバと、文字データを音声データに変換するサーバである音声変換サーバと、が通信可能に接続されたシステムであって、
前記文書管理サーバは、
文書データを記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから取得した音声データを前記利用者端末に送信する手段と、
を有することを特徴とする音声配信システムを提供する。
利用者が利用する端末装置である利用者端末と、文書データを管理するサーバである文書管理サーバと、文字データを音声データに変換するサーバである音声変換サーバと、が通信可能に接続されたシステムであって、
前記文書管理サーバは、
文書データを記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから取得した音声データを前記利用者端末に送信する手段と、
を有することを特徴とする音声配信システムを提供する。
本発明第1の態様によれば、利用者端末と、文書管理サーバと、音声変換サーバと、が通信可能に接続された音声配信システムであって、文書管理サーバが、文書データを記憶した記憶手段と、利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、算出された文字数に対応する文字データを、文書データから抽出する手段と、抽出された文字データを、音声変換サーバに送信する手段と、音声変換サーバから取得した音声データを利用者端末に送信する手段と、を有するので、音声再生条件に基づいて、文書データから、所望の再生時間に対応した音声データを得ることが可能となる。
また、本発明第2の態様では、
利用者が利用する端末装置である利用者端末と、文字データを音声データに変換するサーバである音声変換サーバと、が通信可能に接続されたシステムであって、
前記利用者端末は、
文書データを記憶した記憶手段と、
指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから音声データを受信する手段と、
を有することを特徴とする音声配信システムを提供する。
利用者が利用する端末装置である利用者端末と、文字データを音声データに変換するサーバである音声変換サーバと、が通信可能に接続されたシステムであって、
前記利用者端末は、
文書データを記憶した記憶手段と、
指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから音声データを受信する手段と、
を有することを特徴とする音声配信システムを提供する。
本発明第2の態様によれば、利用者端末と、音声変換サーバと、が通信可能に接続された音声配信システムであって、利用者端末が、文書データを記憶した記憶手段と、利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、算出された文字数に対応する文字データを、文書データから抽出する手段と、抽出された文字データを、音声変換サーバに送信する手段と、音声変換サーバから音声データを受信する手段と、を有するので、音声再生条件に基づいて、文書データから、所望の再生時間に対応した音声データを得ることが可能となる。
また、本発明第3の態様では、前記音声変換サーバは、送信元から受信した文字データを音声データに変換する手段と、得られた音声データを送信元に送信する手段と、を有することを特徴とする。
また、本発明第4の態様では、
利用者が利用する端末装置である利用者端末、および文字データを音声データに変換するサーバである音声変換サーバ、と通信可能に接続されたサーバであって、
文書データを記憶した記憶手段と、
前記利用者端末により指定された、読み上げ倍率と時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する抽出手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから取得した音声データを前記利用者端末に送信する手段と、
を有することを特徴とする文書管理サーバを提供する。
利用者が利用する端末装置である利用者端末、および文字データを音声データに変換するサーバである音声変換サーバ、と通信可能に接続されたサーバであって、
文書データを記憶した記憶手段と、
前記利用者端末により指定された、読み上げ倍率と時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する抽出手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから取得した音声データを前記利用者端末に送信する手段と、
を有することを特徴とする文書管理サーバを提供する。
本発明第4の態様によれば、利用者端末、音声変換サーバ、と通信可能に接続された文書管理サーバが、文書データを記憶した記憶手段と、前記利用者端末により指定された、読み上げ倍率と時間を含む音声再生条件に基づいて、文字数を算出する手段と、前記算出された文字数に対応する文字データを、前記文書データから抽出する抽出手段と、前記抽出された文字データを、前記音声変換サーバに送信する手段と、前記音声変換サーバから取得した音声データを前記利用者端末に送信する手段と、を有するので、音声再生条件に基づいて、文書データから、所望の再生時間に対応した音声データを得ることが可能となる。
また、本発明第5の態様では、前記文書管理サーバにおいて、前記音声再生条件は更に開始位置の情報を含むものであり、前記抽出手段は、前記開始位置の情報に基づいて、前記文字データを、前記文書データから抽出するものであることを特徴とする。
本発明第5の態様によれば、文書管理サーバにおいて、音声再生条件が更に開始位置の情報を含むものであり、抽出手段は、開始位置の情報に基づいて、文字データを、文書データから抽出するようにしたので、所望の開始位置から、続きの音声データを取得することが可能となる。特に、再生途中で中断して、その続きからの音声データを取得するために好適である。
また、本発明第6の態様では、前記文書管理サーバにおいて、前記抽出手段は、抽出する文字データの末尾が文章構成単位の途中である場合は、末尾を当該文章構成単位の区切りとなる位置に変更するものであることを特徴とする。
本発明第6の態様によれば、文書管理サーバにおいて、抽出手段が、抽出する文字データの末尾が文章構成単位の途中である場合は、末尾をその文章構成単位の区切りとなる位置に変更するようにしたので、文章構成単位の途中で中断されることのない音声データを取得することが可能となる。
また、本発明第7の態様では、
利用者が利用する端末装置である利用者端末と、文書データを検索するサーバである文書管理サーバと、が通信可能に接続されたシステムであって、
前記文書管理サーバは、
文書データに対応する文字数を記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数を用いて前記記憶手段を参照し、対応する文書データを検索する手段と、
前記検索により特定された文書データの情報を、前記利用者端末に送信する手段と、
を有することを特徴とする文書配信システムを提供する。
利用者が利用する端末装置である利用者端末と、文書データを検索するサーバである文書管理サーバと、が通信可能に接続されたシステムであって、
前記文書管理サーバは、
文書データに対応する文字数を記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数を用いて前記記憶手段を参照し、対応する文書データを検索する手段と、
前記検索により特定された文書データの情報を、前記利用者端末に送信する手段と、
を有することを特徴とする文書配信システムを提供する。
本発明第7の態様によれば、利用者端末と、文書管理サーバと、が通信可能に接続されたシステムであって、文書管理サーバが、文書データに対応する文字数を記憶した記憶手段と、利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、算出された文字数を用いて記憶手段を参照し、対応する文書データを検索する手段と、検索により特定された文書データの情報を、利用者端末に送信する手段と、を有するので、指定された音声再生条件を満たす文書データを検索することが可能となる。
また、本発明第8の態様では、
利用者が利用する端末装置である利用者端末と通信可能に接続されたサーバであって、
文書データに対応する文字数を記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、取得する文字数を算出する手段と、
前記算出された文字数を用いて前記記憶手段を参照し、対応する文書データを検索する手段と、
前記検索により特定された文書データの情報を、前記利用者端末に送信する手段と、
を有することを特徴とする文書管理サーバを提供する。
利用者が利用する端末装置である利用者端末と通信可能に接続されたサーバであって、
文書データに対応する文字数を記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、取得する文字数を算出する手段と、
前記算出された文字数を用いて前記記憶手段を参照し、対応する文書データを検索する手段と、
前記検索により特定された文書データの情報を、前記利用者端末に送信する手段と、
を有することを特徴とする文書管理サーバを提供する。
本発明第8の態様によれば、利用者端末と通信可能に接続された文書管理サーバが、文書データに対応する文字数を記憶した記憶手段と、利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、取得する文字数を算出する手段と、算出された文字数を用いて記憶手段を参照し、対応する文書データを検索する手段と、検索により特定された文書データの情報を、利用者端末に送信する手段と、を有するので、指定された音声再生条件を満たす文書データを検索することが可能となる。
また、本発明第9の態様では、利用者端末、音声変換サーバ、と通信可能に接続された前記文書管理サーバとして、コンピュータを機能させるためのプログラムを提供する。
また、本発明第10の態様では、利用者端末と通信可能に接続された前記文書管理サーバとして、コンピュータを機能させるためのプログラムを提供する。
本発明によれば、文書データに対して、音声再生条件に基づいた処理を行うことが可能となるという効果を有する。
<1.音声配信システム>
<1.1.システム構成>
以下、本発明の好適な実施形態について図面を参照して詳細に説明する。図1は、本発明第1の実施形態に係る音声配信システムを示す図である。図1において、10は利用者端末、20は文書管理サーバ、30は音声変換サーバ、40はネットワークである。利用者端末10、文書管理サーバ20、音声変換サーバ30はインターネット等の公衆のネットワーク40に接続されており、通信可能、すなわちデータの送受信が可能となっている。図1では、一例として利用者端末10が3台示されているが、実際の接続数は、1台以上の任意の数を接続することが可能である。
<1.1.システム構成>
以下、本発明の好適な実施形態について図面を参照して詳細に説明する。図1は、本発明第1の実施形態に係る音声配信システムを示す図である。図1において、10は利用者端末、20は文書管理サーバ、30は音声変換サーバ、40はネットワークである。利用者端末10、文書管理サーバ20、音声変換サーバ30はインターネット等の公衆のネットワーク40に接続されており、通信可能、すなわちデータの送受信が可能となっている。図1では、一例として利用者端末10が3台示されているが、実際の接続数は、1台以上の任意の数を接続することが可能である。
利用者端末10は、情報処理機能、ネットワーク通信機能、表示機能を備えた端末装置であり、パーソナルコンピュータ等の据置型端末または、スマートフォン、タブレット端末等の携帯型端末により実現される。利用者端末10は、所定のプログラムが組み込まれることにより、文書管理サーバ20との通信を行い、文書データに対応する音声データを取得する。
文書管理サーバ20は、利用者端末10からの設定条件に基づき、文書データから文字データを抽出し、その文字データに対応する音声データを音声変換サーバ30から取得し、利用者端末10に送信する。音声変換サーバ30は、送信元である文書管理サーバ20から取得した文字データを音声データに変換し、文書管理サーバ20に送信する。
利用者端末10は、上述のように、パーソナルコンピュータ、スマートフォン、タブレット端末等により実現可能である。パーソナルコンピュータ、スマートフォン、タブレット端末等を用いる場合、Webブラウザを用いる手法や、専用のプログラムを用いる手法により実現することができる。本実施形態では、パーソナルコンピュータにWebブラウザを組み込んだ場合について説明する。また、文書管理サーバ20、音声変換サーバ30は、Webサーバソフトウェアを備え、Webブラウザからの要求に応える機能を備えている。
図2は、利用者端末10のハードウェア構成を示す図である。図2に示すように、利用者端末10は、CPU(Central Processing Unit)10aと、メインメモリであるRAM(Random Access Memory)10bと、CPU10aが実行するプログラムやデータを記憶するためのハードディスク、フラッシュメモリ等の大容量の記憶装置10cと、キーボードやタッチパネル等の指示入力部10dと、データ記憶媒体等の外部装置とデータ通信するためのデータ入出力I/F(インタフェース)10eと、液晶ディスプレイや有機ELディスプレイ等の表示デバイスである表示部10fと、ネットワークを介して他のコンピュータと通信を行うための通信部10gを備えており、互いにバスを介して接続されている。
図3は、文書管理サーバ20のハードウェア構成を示す図である。文書管理サーバ20は、汎用のコンピュータに、専用のプログラムを組み込むことにより実現される。図3に示すように、CPU(Central Processing Unit)20aと、メインメモリであるRAM(Random Access Memory)20bと、CPU20aが実行するプログラムやデータを記憶するためのハードディスク、フラッシュメモリ等の大容量の記憶装置20cと、キーボード等の指示入力部20dと、データ記憶媒体等の外部装置とデータ通信するためのデータ入出力I/F(インタフェース)20eと、ネットワークを介して他のコンピュータとネットワーク通信を行うための通信部20gを備えており、互いにバスを介して接続されている。
記憶装置20cには、CPU20aを動作させ、コンピュータを、文書管理サーバ20として機能させるための専用のプログラムが実装されている。この専用のプログラムをCPU20aが実行することにより、文書管理サーバ20は、利用者端末10により指定された、読み上げ速さ倍率と時間を含む音声再生条件に基づいて、文字数を算出する手段、算出された文字数に対応する文字データを、文書データから抽出する抽出手段、抽出された文字データを、音声変換サーバに送信する手段、音声変換サーバから取得した音声データを利用者端末に送信する手段としての機能、その他後述する様々な処理を実現することになる。また、記憶装置20cは、文字データを記憶した記憶手段としても機能する。さらに、記憶装置20cは、処理に必要な様々なデータを記憶する。
文書管理サーバ20内の記憶装置20cには、文書データを特定する識別情報である文書IDと対応付けて文書データが記憶されている。文書データとは、文字データを含んだ形式である。いわゆる電子書籍データも文書データに含まれる。文字データは、各文字を文字コードにより表現したデータである。文字コードとしては、公知の各種の形式のものを用いることができる。また、文書データは、ページ単位で記録されており、文字データは、ページ番号により管理されている。
音声変換サーバ30のハードウェア構成は、文書管理サーバ20と同様のハードウェア構成となっており、汎用のコンピュータに、専用のプログラムを組み込むことにより実現される。音声変換サーバ30が備える記憶装置30c(図示省略)には、音声変換サーバ30が備えるCPU30a(図示省略)を動作させ、コンピュータを、音声変換サーバ30として機能させるためのプログラムが実装されている。このプログラムをCPU30aが実行することにより、音声変換サーバ30は、後述する様々な処理を実現することになる。
<1.2.処理動作>
次に、本発明第1の実施形態に係る音声配信システムの処理動作について説明する。図4は、本発明第1の実施形態に係る音声配信システムの処理動作を示すフローチャートである。
次に、本発明第1の実施形態に係る音声配信システムの処理動作について説明する。図4は、本発明第1の実施形態に係る音声配信システムの処理動作を示すフローチャートである。
本実施形態では、文書データを利用者端末10のRAM10b(または記憶装置10c)に一時保存しておき、一時保存した文書データを音声データに変換し、音声として出力する態様となっている場合を想定して説明する。このようなシステムは、書籍の文書データを一定期間貸し出す、いわゆる電子図書館システムにも採用されているものである。利用者端末10に、音声変換プログラムを組み込んでおくことにより、一時保存した内容を音声データに変換して出力する。
文書データを音声データに変換することは、利用者端末10に、音声変換プログラムを組み込んでおくことにより実現できる。このような音声変換プログラムとしては、一般に「スクリーンリーダー」と呼ばれる公知のものを採用することができる。音声変換プログラムを利用して文書データの読み上げを行うことは、目の不自由な方にとっては、文書の内容を認識するために非常に有益なものとなっている。
音声変換プログラムを用いた音声再生を一時中断しようとした際、利用者は音声再生を中止する旨の指示を行う。具体的には、指示入力部10dであるキーボードにおいて事前に中止キーとして設定されたキーを押すことにより、利用者端末10は、音声再生を中止する。音声再生の中止と並行して、または音声再生の中止後、利用者端末10は、表示部10fに条件設定画面を表示する(ステップS1)。
図5は、表示部10fに表示される条件設定画面の一例を示す図である。図5に示すように、本実施形態では、「読み上げ速さ倍率」「再生時間」「開始位置」の3条件を設定可能となっている。「読み上げ速さ倍率」は、文書を音声として読み上げる場合の速さの倍率を示すものである。ここでは、標準の読み上げ速さを1倍速としている。本実施形態では、図5に示すように、「読上げる速さを選択してください。」というメッセージの下に続いてチェックボックスが用意され、1倍速、2倍速、3倍速、4倍速の4種類が設定可能となっている。
「再生時間」は、音声として再生する際の開始から終了までの時間を示すものである。単位としては、時間単位や秒単位で設定できるようにすることも可能である。本実施形態では、分単位で設定できるようになっている。本実施形態では、図5に示すように、「聴きたい分数を指定してください。」というメッセージの下に続いて数値入力欄が用意され、分数を数値で入力することが可能となっている。
「開始位置」は、文書データ中のどこを開始位置とするかを示すものである。本実施形態では、図5に示すように、「どこから聴きたいかを指定してください。」というメッセージの下に続いてチェックボックスが用意され、「今読んでいる場所から」と「最初から」の2箇所のいずれかが設定可能となっている。
利用者は、表示された条件設定画面を利用して、条件の設定を行う。図5の例では、「読み上げ速さ倍率」として「2倍速」、「再生時間」として「30分」、「開始位置」として「今読んでいる場所から」、が設定された状態を示している。
条件を設定した後、利用者が送信指示を行う。送信指示は、指示入力部10dであるキーボード上のキーのうち、事前に設定されたキーを押すことにより行われるように設定されていてもよいし、条件設定画面に送信ボタンを用意しておき、送信ボタンをクリックすることにより行われるように設定されていてもよい。
利用者により送信指示が行われると、利用者端末10は、文書管理サーバ20に対して、設定条件に対応する音声データの要求を行う(ステップS2)。具体的には、HTTP(Hypertext Transfer Protocol)要求(リクエスト)とともに、設定条件を文書管理サーバ20に送信する。音声データの要求の際、利用者端末10は、RAM10bに記憶されている情報の中から、文書IDを取得する。また、「開始位置」として「今読んでいる場所から」が設定された場合は、RAM10bに記憶されている情報の中から、今読んでいるページ番号を取得する。取得された文書IDとページ番号は、設定条件の一部として送信される。
文書管理サーバ20では、利用者端末10から音声データの要求を受信すると、音声データの要求とともに受信した設定条件に基づいて、抽出文字数を算出する(ステップS3)。具体的には、まず、文書管理サーバ20は、記憶装置20cの所定の領域に記憶されている「標準の読み上げ速さ」の情報を取得する。そして、利用者端末10から受信した設定条件に含まれる「読み上げ速さ倍率」、「再生時間」を取得する。
そして、文書管理サーバ20は、取得した「標準の読み上げ速さ」、「読み上げ速さ倍率」、「再生時間」を乗算して、文字数を算出する。例えば、「標準の読み上げ速さ」が「300文字/分」、「読み上げ速さ倍率」が「2倍速」、「再生時間」が「30分」である場合、300×2×30=18000(文字)として文字数が算出される。
文字数が算出されたら、文書管理サーバ20は、文書データ中から文字データを抽出する(ステップS4)。具体的には、まず、利用者端末10から受信した設定条件に含まれる「文書ID」、「開始位置」を取得する。そして、取得した「文書ID」で記憶装置20c内に記憶された文書データを特定し、取得した「開始位置」とステップS3において算出された文字数に基づいて、抽出する文字データを特定する。
文字データの特定は、文書データの「開始箇所」を先頭とし、そこから算出された文字数分進んだ位置を末尾として、その間の文字データを抽出対象とすることにより行う。この際、末尾が文章構成単位の途中である場合は、末尾をその文章構成単位の区切りとなる位置に変更する。文章構成単位とは、全体を読み易くいするために、所定の構成に分ける単位であり、例えば、章や節等を単位とすることができる。ここで、抽出する文字データの特定について、図6を用いて説明する。図6は、文書データ中の文字データの一例を示す図である。図6の例では、実質的な文書を示す文字データだけでなく、制御文字が含まれた形式となっている。図6において、<h1>は章を、<h2>は節を示す制御文字として用いられている。<h1>の対は、章の開始であり、次の<h1>の対が出現するまで、その章が続くことを示している。また、<h2>の対は、節の開始であり、次の<h2>の対が出現するまで、その章が続くことを示している。
図6に示した例において、「開始位置」が4行目の先頭であって、算出された文字数が45文字であったとする。制御文字は含めず、改行文字は含めてカウントするため、本来、「また、明日以降も秋雨前線の影響で、すっきりしない天気が続くでしょう。<h2>東海地方<h2>台風18号は本日遅」までで45文字となる(「<h2>東海地方<h2>」は、カウントしない。)。しかし、これでは、末尾が文の途中となるため、「また、明日以降も秋雨前線の影響で、すっきりしない天気が続くでしょう。<h2>東海地方<h2>台風18号は本日遅くに上陸する恐れがあるでしょう。」までを抽出対象の文字データとして特定する。
文字データが特定されたら、文書管理サーバ20は、文書データから特定された文字データを抽出する。そして、文書管理サーバ20は、音声変換サーバ30に対して、抽出した文字データの音声変換要求を行う(ステップS5)。具体的には、HTTP要求とともに、抽出した文字データを音声変換サーバ30に送信する。詳細には、ステップS4において取得された文字データと、設定条件に含まれる「標準の読み上げ速さ」、「読み上げ速さ倍率」の情報を音声変換サーバ30に送信する。
文書管理サーバ20から音声変換要求を受信したら、音声変換サーバ30は、音声変換要求とともに受信した文字データを音声データに変換する(ステップS6)。具体的には、公知の文字音声変換処理により、文字データを音声データに変換する。音声データの形式としては、公知の様々な形式のものを用いることができる。本実施形態では、多くの音楽プレーヤーや、音声再生ソフトウェアに対応しているMP3(MPEG-1 Audio Layer-3)を用いている。ステップS6においては、例えば、18000文字分の文字データを受信し、「標準の読み上げ速さ」が「300文字/分」、「読み上げ速さ倍率」が「2倍速」と設定されている場合、再生時間約30分に相当するMP3形式の音声データに変換する。
続いて、音声変換サーバ30は、文書管理サーバ20からの音声変換要求に応答して、変換された音声データを文書管理サーバ20に送信する(ステップS7)。具体的には、HTTP応答(レスポンス)とともに、音声データを文書管理サーバ20に送信する。さらに、文書管理サーバ20は、HTTP応答として音声変換サーバ30から音声データを受信したら、利用者端末10からの音声データの要求に応答して、音声変換サーバ30から受信した音声データを利用者端末10に送信する(ステップS8)。具体的には、HTTP応答とともに、音声データを利用者端末10に送信する。すなわち、音声変換サーバ30から受信した音声データを利用者端末10に転送する。利用者端末10では、HTTP応答とともに受信した音声データを記憶装置10c内の所定の記憶領域に格納する(ステップS9)。
上記のように、図4のフローチャートに従ってステップS1〜ステップS9に従った処理を実行することにより、設定条件に対応した音声データが利用者端末10で取得されることになる。利用者は、取得した音声データを、別途、携帯型の音楽プレーヤー、音声再生機能付きのスマートフォン等の音声再生機器に転送して格納することにより、持ち運ぶことが可能となる。条件設定画面において、「今読んでいる場所から」を選択した場合には、利用者が利用者端末10で読んでいた場所の続きからの音声データが所望の音声再生機器に記録される。そして、利用者は、外出先において、読んでいた続きから音声データを楽しむことが可能になる。
<1.3.第2の実施形態>
次に、本発明に係る音声配信システムの第2の実施形態について説明する。図7は、本発明に係る音声配信システムの第2の実施形態を示す図である。第2の実施形態が、第1の実施形態と異なる点は、文書管理サーバの機能を利用者端末が備えている点である。図7において、12は利用者端末、30は音声変換サーバ、40はネットワークである。利用者端末12、音声変換サーバ30はインターネット等の公衆のネットワーク40に接続されており、通信可能、すなわちデータの送受信が可能となっている。図7において、図7に示した第1の実施形態と同様の機能を有するものについては、同一符号を付して説明を省略する。図7では、一例として利用者端末12が3台示されているが、実際の接続数は、1台以上の任意の数を接続することが可能である。
次に、本発明に係る音声配信システムの第2の実施形態について説明する。図7は、本発明に係る音声配信システムの第2の実施形態を示す図である。第2の実施形態が、第1の実施形態と異なる点は、文書管理サーバの機能を利用者端末が備えている点である。図7において、12は利用者端末、30は音声変換サーバ、40はネットワークである。利用者端末12、音声変換サーバ30はインターネット等の公衆のネットワーク40に接続されており、通信可能、すなわちデータの送受信が可能となっている。図7において、図7に示した第1の実施形態と同様の機能を有するものについては、同一符号を付して説明を省略する。図7では、一例として利用者端末12が3台示されているが、実際の接続数は、1台以上の任意の数を接続することが可能である。
利用者端末12は、情報処理機能、ネットワーク通信機能、表示機能を備えた端末装置であり、パーソナルコンピュータ等の据置型端末または、スマートフォン、タブレット端末等の携帯型端末により実現される。利用者端末12は、所定のプログラムが組み込まれることにより、設定条件に基づき、文書データから文字データを抽出し、その文字データに対応する音声データを音声変換サーバ30に送信し、文字データに対応する音声データを音声変換サーバ30から取得する。音声変換サーバ30は、送信元である利用者端末12から取得した文字データを音声データに変換し、利用者端末12に送信する。
利用者端末12は、上述のように、パーソナルコンピュータ、スマートフォン、タブレット端末等により実現可能である。パーソナルコンピュータ、スマートフォン、タブレット端末等を用いる場合、専用のプログラムを用いる手法により実現することができる。本実施形態では、パーソナルコンピュータにWebブラウザと専用のプログラムを組み込んだ場合について説明する。また、音声変換サーバ30は、Webサーバソフトウェアを備え、Webブラウザからの要求に応える機能を備えている。
利用者端末12は、図2に示した第1の実施形態における利用者端末10と同等のハードウェア構成を備えている。すなわち、利用者端末12は、CPU12aと、RAM12bと、記憶装置12cと、指示入力部12dと、データ入出力I/F12eと、表示部12fと、通信部12gを備えており、互いにバスを介して接続されている(図示省略)。
記憶装置12cには、CPU12aを動作させ、コンピュータを利用者端末12として機能させるための専用のプログラムが実装されている。この専用のプログラムをCPU12aが実行することにより、利用者端末12は、指定された、読み上げ速さ倍率と時間を含む音声再生条件に基づいて、文字数を算出する手段、算出された文字数に対応する文字データを、文書データから抽出する抽出手段、抽出された文字データを、音声変換サーバに送信する手段、音声変換サーバから音声データを受信する手段としての機能、その他後述する様々な処理を実現することになる。また、記憶装置12cは、文字データを記憶した記憶手段としても機能する。さらに、記憶装置12cは、処理に必要な様々なデータを記憶する。利用者端末12内の記憶装置12cには、文書データを特定する識別情報である文書IDと対応付けて文書データが記憶されている。
次に、第2の実施形態に係る音声配信システムの処理動作について説明する。図8は、第2の実施形態に係る音声配信システムの処理動作を示すフローチャートである。
第2の実施形態では、文書データを利用者端末12のRAM12b(または記憶装置12c)に記憶しておき、文書データを音声データに変換し、音声として出力する態様となっている場合を想定して説明する。このようなシステムは、書籍の文書データを一定期間貸し出す、いわゆる電子図書館システムにも採用されているものである。利用者端末12に、音声変換プログラムを組み込んでおくことにより、記憶している文書データを音声データに変換して出力する。
文書データを音声データに変換することは、利用者端末12に、音声変換プログラムを組み込んでおくことにより実現できる。このような音声変換プログラムとしては、上述の「スクリーンリーダー」と呼ばれる公知のものを採用することができる。
音声変換プログラムを用いた音声再生を一時中断しようとした際、利用者は音声再生を中止する旨の指示を行う。具体的には、指示入力部12dであるキーボードにおいて事前に中止キーとして設定されたキーを押すことにより、利用者端末12は、音声再生を中止する。音声再生の中止と並行して、または音声再生の中止後、利用者端末12は、表示部12fに図5に示したような条件設定画面を表示する(ステップS31)。
図5に示したような条件設定画面対して、第1の実施形態と同様に条件を設定した後、利用者が音声データの要求指示を行う。要求指示は、指示入力部12dであるキーボード上のキーのうち、事前に設定されたキーを押すことにより行われるように設定されていてもよいし、条件設定画面に音声要求ボタンを用意しておき、音声要求ボタンをクリックすることにより行われるように設定されていてもよい。
利用者により音声データの要求指示が行われると、利用者端末12は、設定条件に対応する音声データの要求を行う(ステップS32)。具体的には、設定条件に従った処理の実行を開始する。音声データの要求の際、利用者端末12は、RAM12bに記憶されている情報の中から、文書IDを取得する。また、「開始位置」として「今読んでいる場所から」が設定された場合は、RAM12bに記憶されている情報の中から、今読んでいるページ番号を取得する。取得された文書IDとページ番号は、設定条件の一部として組み込まれる。
利用者端末12では、設定条件に基づいて、抽出文字数を算出する(ステップS33)。具体的には、まず、利用者端末12は、記憶装置12cの所定の領域に記憶されている「標準の読み上げ速さ」の情報を取得する。そして、設定条件に含まれる「読み上げ速さ倍率」、「再生時間」を取得する。そして、利用者端末12は、取得した「標準の読み上げ速さ」、「読み上げ速さ倍率」、「再生時間」を乗算して、文字数を算出する。
文字数が算出されたら、利用者端末12は、文書データ中から文字データを抽出する(ステップS34)。具体的には、第1の実施形態におけるステップS4と同様な処理が行われる。
そして、利用者端末12は、音声変換サーバ30に対して、抽出した文字データの音声変換要求を行う(ステップS35)。具体的には、第1の実施形態におけるステップS5と同様な処理が行われる。
利用者端末12から音声変換要求を受信したら、音声変換サーバ30は、音声変換要求とともに受信した文字データを音声データに変換する(ステップS36)。具体的には、第1の実施形態におけるステップS6と同様な処理が行われる。
続いて、音声変換サーバ30は、利用者端末12からの音声変換要求に応答して、変換された音声データを利用者端末12に送信する(ステップS37)。具体的には、第1の実施形態におけるステップS7と同様な処理が行われる。利用者端末12では、HTTP応答とともに受信した音声データを記憶装置12c内の所定の記憶領域に格納する(ステップS38)。
上記のように、図8のフローチャートに従ってステップS31〜ステップS38に従った処理を実行することにより、設定条件に対応した音声データが利用者端末12で取得されることになる。利用者は、取得した音声データを、別途、携帯型の音楽プレーヤー、音声再生機能付きのスマートフォン等の音声再生機器に転送して格納することにより、持ち運ぶことが可能となる。条件設定画面において、「今読んでいる場所から」を選択した場合には、利用者が利用者端末12で読んでいた場所の続きからの音声データが所望の音声再生機器に記録される。そして、利用者は、外出先において、読んでいた続きから音声データを楽しむことが可能になる。
<2.文書配信システム>
<2.1.システム構成>
次に、本発明の一実施形態に係る文書配信システムについて説明する。図9は、本発明の一実施形態に係る文書配信システムを示す図である。図9において、11は利用者端末、21は文書管理サーバ、30は音声変換サーバ、40はネットワークである。図9に示した文書配信システムにおいて、図1に示した音声配信システムと同様の構成については、同一符号を付して説明を省略する。利用者端末11、文書管理サーバ21、音声変換サーバ30はインターネット等の公衆のネットワーク40に接続されており、データの送受信が可能となっている。図9では、一例として利用者端末11が3台示されているが、実際の接続数は、1台以上の任意の数を接続することが可能である。
<2.1.システム構成>
次に、本発明の一実施形態に係る文書配信システムについて説明する。図9は、本発明の一実施形態に係る文書配信システムを示す図である。図9において、11は利用者端末、21は文書管理サーバ、30は音声変換サーバ、40はネットワークである。図9に示した文書配信システムにおいて、図1に示した音声配信システムと同様の構成については、同一符号を付して説明を省略する。利用者端末11、文書管理サーバ21、音声変換サーバ30はインターネット等の公衆のネットワーク40に接続されており、データの送受信が可能となっている。図9では、一例として利用者端末11が3台示されているが、実際の接続数は、1台以上の任意の数を接続することが可能である。
利用者端末11は、上記利用者端末10と同様、情報処理機能、ネットワーク通信機能、表示機能を備えた端末装置であり、パーソナルコンピュータ等の据置型端末または、スマートフォン、タブレット端末等の携帯型端末により実現される。利用者端末11は、所定のプログラムが組み込まれることにより、文書管理サーバ21との通信を行い、文書データの検索を行う。
文書管理サーバ21は、利用者端末11からの再生時間を含む検索条件に基づき、記憶手段内に記憶された文書情報を検索し、再生時間に対応する文字数の文書データの情報を検索結果として取得し、利用者端末11に送信する。音声変換サーバ30は、音声データへの変換要求があった場合に、文書管理サーバ21から受信した文字データを音声データに変換する。
利用者端末11は、上述のように、上記利用者端末10と同様、パーソナルコンピュータ、スマートフォン、タブレット端末等により実現可能である。パーソナルコンピュータ、スマートフォン、タブレット端末等を用いる場合、Webブラウザを用いる手法や、専用のプログラムを用いる手法により実現することができる。本実施形態では、パーソナルコンピュータにWebブラウザを組み込んだ場合について説明する。
利用者端末11のハードウェア構成は、図2に示した利用者端末10と同様であり、CPU11aと、RAM(Random Access Memory)11bと、記憶装置11cと、指示入力部11dと、データ入出力I/F11eと、表示部11fと、通信部11gを備えており、互いにバスを介して接続されている(図示省略)。
文書管理サーバ21のハードウェア構成は、図3に示した文書管理サーバ20と同様であり、CPU21aと、RAM21bと、記憶装置21cと、指示入力部21dと、データ入出力I/F21eと、通信部21gを備えており、互いにバスを介して接続されている(図示省略)。文書管理サーバ21は、このようなハードウェア構成の汎用のコンピュータに、専用のプログラムを組み込むことにより実現される。
記憶装置21cには、CPU21aを動作させ、コンピュータを、文書管理サーバ21として機能させるための専用のプログラムが実装されている。この専用のプログラムをCPU21aが実行することにより、文書管理サーバ21は、利用者端末11により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段、算出された文字数を用いて記憶手段を参照し、対応する文書データを検索する手段、検索により特定された文書データの情報を、利用者端末に送信する手段としての機能、その他後述する様々な処理を実現することになる。また、記憶装置21cは、文書データに対応する文字数を記憶した記憶手段としても機能する。さらに、記憶装置21cは、処理に必要な様々なデータを記憶する。
文書管理サーバ21内の記憶装置21cには、文書データを特定する識別情報である文書IDと対応付けて文書データに関する情報である文書情報が記憶されている。文書データとは、文字データを含んだ形式のデータである。いわゆる電子書籍データも文書データに含まれる。文字データは、各文字を文字コードにより表現したデータである。文字コードとしては、公知の各種の形式のものを用いることができる。
図10は、記憶手段である記憶装置21cに記憶された文書情報の一例を示す図である。図10に示すように、文書情報は、文書名、著者名、文字数を含むメタデータである。文字数は、文書データに含まれる文字数である。図示は省略しているが、各文書に対応付けて、文書データを特定する識別情報である文書IDが記録されている。また、文書情報としては、図10に図示したもの以外のものが記録されていてもよい。
<2.2.処理動作>
次に、本発明の一実施形態に係る文書配信システムの処理動作について説明する。図11は、本発明の一実施形態に係る文書配信システムの処理動作を示すフローチャートである。
次に、本発明の一実施形態に係る文書配信システムの処理動作について説明する。図11は、本発明の一実施形態に係る文書配信システムの処理動作を示すフローチャートである。
利用者は、利用者端末11から文書管理サーバ21にアクセスする。すると、文書管理サーバ21は、検索画面用データを作成して、アクセス元の利用者端末11に送信する。そして、利用者端末11は、受信した検索画面用データの表示処理を行うことにより、表示部11fに検索画面を表示する(ステップS11)。
図12は、表示部11fに表示される検索画面の一例を示す図である。図12に示すように、本実施形態では、「再生時間」「読み上げ速さ倍率」の2条件を設定可能となっている。「再生時間」は、文書の最初から最後までを音声として再生するために必要な時間を示すものである。単位としては、時間単位や秒単位で設定できるようにすることも可能であるが、ここでは、分単位で設定できるようになっている。本実施形態では、図12に示すように、「検索したいコンテンツの長さを指定してください。」というメッセージの下に続いて2つの数値入力欄が用意され、分数の下限と上限を数値で入力することが可能となっている。ここで、「コンテンツ」とは、文書データを意味している。
「読み上げ速さ倍率」は、音声として読み上げる場合の速さの倍率を示すものである。ここでは、標準の読み上げ速さを1倍速としている。本実施形態では、図12に示すように、「読上げる速さを選択してください。」というメッセージの下に続いてチェックボックスが用意され、1倍速、2倍速、3倍速、4倍速の4種類が設定可能となっている。
図12に示した検索画面の最下部には、「検索」と表記された検索ボタンが用意されている。この検索ボタンを指示操作することにより、設定された条件による検索処理が開始される。
利用者は、表示された検索画面を利用して、検索条件の設定を行う。図12の例では、「再生時間」として「10分」(下限)〜「15分」(上限)、「読み上げ速さ倍率」として「3倍速」、が設定された状態を示している。検索条件を設定した後、利用者が検索指示を行う。検索指示は、検索画面に用意された検索ボタンを、クリックすることにより行う。利用者により検索指示が行われると、利用者端末11は、文書管理サーバ21に対して、検索条件に従った検索要求を行う(ステップS12)。具体的には、HTTP要求とともに、検索条件を文書管理サーバ21に送信する。
文書管理サーバ21では、利用者端末11から検索要求を受信すると、検索要求とともに受信した検索条件に基づいて、検索条件を満たす文書の文字数を算出する(ステップS13)。具体的には、まず、文書管理サーバ21は、記憶装置21cの所定の領域に記憶されている「標準の読み上げ速さ」の情報を取得する。そして、利用者端末10から受信した設定条件に含まれる「読み上げ速さ倍率」、「再生時間」を取得する。
そして、文書管理サーバ21は、取得した「標準の読み上げ速さ」、「読み上げ速さ倍率」、「再生時間」を乗算して、文字数の下限と上限を算出する。例えば、「標準の読み上げ速さ」が「300文字/分」、「読み上げ速さ倍率」が「3倍速」、「再生時間」が「10分」である場合、300×3×10=9000(文字)として文字数が算出される。同様に、「標準の読み上げ速さ」が「300文字/分」、「読み上げ速さ倍率」が「3倍速」、「再生時間」が「15分」である場合、300×3×15=13500(文字)として文字数が算出される。したがって、図12に示した例の場合、下限が9000文字、上限が13500文字となる。
文字数が算出されたら、文書管理サーバ21は、文書の検索を行う(ステップS14)。具体的には、ステップS13において算出された文字数の下限と上限の範囲を満たす文字数の文書を検索する。この条件で図10に示した文書情報を検索した場合、文書名「○○門」の文書が条件に合致し、検索結果として得られる。
検索結果が得られたら、文書管理サーバ21は、利用者端末11に対して、検索要求の応答を行う(ステップS15)。具体的には、検索結果を組み込んだ所定のページデータを作成し、HTTP応答とともに、検索結果データとして利用者端末11に送信する。利用者端末11では、HTTP応答として文書管理サーバ21から検索結果データを受信したら、文書管理サーバ21から受信した検索結果データを表示部11fに表示する。
図13は、表示部11fに表示される検索結果の一例を示す図である。図13に示すように、検索結果としては、文書名、著者名、各倍速による再生時間が表示される。検索条件として設定した「3倍」に対応する再生時間は、他の倍速の再生時間と区別し易いように、所定の強調表示がなされている。
検索結果として得られた文書の音声データを取得することを希望する場合には、この状態で、音声データの要求指示を行う。要求指示は、キーボード上のキーのうち、事前に設定されたキーを押すことにより行われるように設定されていてもよいし、検索結果画面に要求ボタンを用意しておき、要求ボタンをクリックすることにより行われるように設定されていてもよい。
利用者により要求指示が行われると、利用者端末11は、文書管理サーバ21に対して音声データの要求を行う(ステップS16)。具体的には、HTTP要求とともに、音声データの要求指示を文書管理サーバ21に送信する。
利用者端末11から音声データの要求指示を受信したら、文書管理サーバ21は、文書データ中から文字データを抽出する(ステップS17)。具体的には、検索結果として取得された文書の文書データ中から文字データを抽出する。この際、まず、文書データ中の開始位置から終了位置までの文字データを特定する。
文字データが特定されたら、文書管理サーバ21は、文書データから特定された文字データを抽出する。そして、文書管理サーバ21は、音声変換サーバ30に対して、音声変換要求を行う(ステップS18)。具体的には、HTTP要求とともに、抽出した文字データを、音声変換サーバ30に送信する。詳細には、ステップS17において取得された文字データと、検索条件に含まれる「標準の読み上げ速さ」、「読み上げ速さ倍率」の情報を音声変換サーバ30に送信する。
文書管理サーバ21から音声変換要求を受信したら、音声変換サーバ30は、音声変換要求とともに受信した文字データを音声データに変換する(ステップS19)。具体的には、公知の文字音声変換処理により、文字データを音声データに変換する。音声データの形式としては、公知の様々な形式のものを用いることができる。本実施形態では、多くの音楽プレーヤーや、音声再生ソフトウェアに対応しているMP3(MPEG-1 Audio Layer-3)を用いている。
続いて、音声変換サーバ30は、文書管理サーバ21からの音声変換要求に応答して、変換された音声データを文書管理サーバ21に送信する(ステップS20)。具体的には、HTTP応答とともに、音声データを文書管理サーバ21に送信する。さらに、文書管理サーバ21は、HTTP応答として音声変換サーバ30から音声データを受信したら、利用者端末11からの音声データの要求に応答して、音声変換サーバ30から受信した音声データを利用者端末11に送信する(ステップS21)。具体的には、HTTP応答とともに、音声データを利用者端末11に送信する。すなわち、文書管理サーバ21は、音声変換サーバ30から受信した音声データを利用者端末11に転送する。利用者端末11では、HTTP応答とともに受信した音声データを記憶装置10c内の所定の記憶領域に格納する(ステップS22)。
上記のように、図11のフローチャートに従ってステップS11〜ステップS22に従った処理を実行することにより、検索条件に対応した音声データが利用者端末11で取得されることになる。利用者は、取得した音声データを、別途、携帯型の音楽プレーヤー、音声再生機能付きのスマートフォン等の音声再生機器に転送して格納することにより、持ち運ぶことが可能となる。
以上、本発明の好適な実施形態について説明したが、本発明は上記実施形態に限定されず、種々の変形が可能である。例えば、上記実施形態では、文書管理サーバと音声変換サーバの2つのサーバを備える構成としたが、文書管理サーバと音声変換サーバが備える機能を、1つのコンピュータが備える構成であってもよい。
10、11、12・・・利用者端末
10a、20a・・・CPU
10b、20b・・・RAM
10c、20c・・・記憶装置
10d、20d・・・指示入力部
10e、20e・・・データ入出力I/F
10f・・・表示部
10g、20g・・・通信部
20、21・・・文書管理サーバ
30・・・音声変換サーバ
40・・・ネットワーク
10a、20a・・・CPU
10b、20b・・・RAM
10c、20c・・・記憶装置
10d、20d・・・指示入力部
10e、20e・・・データ入出力I/F
10f・・・表示部
10g、20g・・・通信部
20、21・・・文書管理サーバ
30・・・音声変換サーバ
40・・・ネットワーク
Claims (10)
- 利用者が利用する端末装置である利用者端末と、文書データを管理するサーバである文書管理サーバと、文字データを音声データに変換するサーバである音声変換サーバと、が通信可能に接続されたシステムであって、
前記文書管理サーバは、
文書データを記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから取得した音声データを前記利用者端末に送信する手段と、
を有することを特徴とする音声配信システム。 - 利用者が利用する端末装置である利用者端末と、文字データを音声データに変換するサーバである音声変換サーバと、が通信可能に接続されたシステムであって、
前記利用者端末は、
文書データを記憶した記憶手段と、
指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから音声データを受信する手段と、
を有することを特徴とする音声配信システム。 - 前記音声変換サーバは、
送信元から受信した文字データを音声データに変換する手段と、
得られた音声データを送信元に送信する手段と、
を有することを特徴とする請求項1または請求項2に記載の音声配信システム。 - 利用者が利用する端末装置である利用者端末、および文字データを音声データに変換するサーバである音声変換サーバ、と通信可能に接続されたサーバであって、
文書データを記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数に対応する文字データを、前記文書データから抽出する抽出手段と、
前記抽出された文字データを、前記音声変換サーバに送信する手段と、
前記音声変換サーバから取得した音声データを前記利用者端末に送信する手段と、
を有することを特徴とする文書管理サーバ。 - 前記音声再生条件は更に開始位置の情報を含むものであり、
前記抽出手段は、前記開始位置の情報に基づいて、前記文字データを、前記文書データから抽出するものであることを特徴とする請求項4に記載の文書管理サーバ。 - 前記抽出手段は、抽出する文字データの末尾が文章構成単位の途中である場合は、末尾を当該文章構成単位の区切りとなる位置に変更するものであることを特徴とする請求項4または請求項5に記載の文書管理サーバ。
- 利用者が利用する端末装置である利用者端末と、文書データを管理するサーバである文書管理サーバと、が通信可能に接続されたシステムであって、
前記文書管理サーバは、
文書データに対応する文字数を記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、文字数を算出する手段と、
前記算出された文字数を用いて前記記憶手段を参照し、対応する文書データを検索する手段と、
前記検索により特定された文書データの情報を、前記利用者端末に送信する手段と、
を有することを特徴とする文書配信システム。 - 利用者が利用する端末装置である利用者端末と通信可能に接続されたサーバであって、
文書データに対応する文字数を記憶した記憶手段と、
前記利用者端末により指定された、読み上げ速さ倍率と再生時間を含む音声再生条件に基づいて、取得する文字数を算出する手段と、
前記算出された文字数を用いて前記記憶手段を参照し、対応する文書データを検索する手段と、
前記検索により特定された文書データの情報を、前記利用者端末に送信する手段と、
を有することを特徴とする文書管理サーバ。 - 請求項4から請求項6のいずれか一項に記載の文書管理サーバとして、コンピュータを機能させるためのプログラム。
- 請求項8に記載の文書管理サーバとして、コンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015251423A JP2017116710A (ja) | 2015-12-24 | 2015-12-24 | 音声配信システムおよび文書配信システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015251423A JP2017116710A (ja) | 2015-12-24 | 2015-12-24 | 音声配信システムおよび文書配信システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017116710A true JP2017116710A (ja) | 2017-06-29 |
Family
ID=59234028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015251423A Pending JP2017116710A (ja) | 2015-12-24 | 2015-12-24 | 音声配信システムおよび文書配信システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017116710A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112015731A (zh) * | 2020-07-08 | 2020-12-01 | 广州乐摇摇信息科技有限公司 | 基于多终端设备的信息分发方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001027996A (ja) * | 1999-07-13 | 2001-01-30 | Sony Corp | 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 |
JP2003302991A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JP2008096489A (ja) * | 2006-10-06 | 2008-04-24 | Pentax Corp | 音声化システム、音声化方法、音声化サーバ及び音声化プログラム |
JP2008129434A (ja) * | 2006-11-22 | 2008-06-05 | Oki Electric Ind Co Ltd | 音声合成サーバシステム |
JPWO2008001500A1 (ja) * | 2006-06-30 | 2009-11-26 | 日本電気株式会社 | 音声コンテンツ生成システム、情報交換システム、プログラム、音声コンテンツ生成方法及び情報交換方法 |
JP2011059412A (ja) * | 2009-09-10 | 2011-03-24 | Fujitsu Ltd | 合成音声テキスト入力装置及びプログラム |
-
2015
- 2015-12-24 JP JP2015251423A patent/JP2017116710A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001027996A (ja) * | 1999-07-13 | 2001-01-30 | Sony Corp | 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 |
JP2003302991A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JPWO2008001500A1 (ja) * | 2006-06-30 | 2009-11-26 | 日本電気株式会社 | 音声コンテンツ生成システム、情報交換システム、プログラム、音声コンテンツ生成方法及び情報交換方法 |
JP2008096489A (ja) * | 2006-10-06 | 2008-04-24 | Pentax Corp | 音声化システム、音声化方法、音声化サーバ及び音声化プログラム |
JP2008129434A (ja) * | 2006-11-22 | 2008-06-05 | Oki Electric Ind Co Ltd | 音声合成サーバシステム |
JP2011059412A (ja) * | 2009-09-10 | 2011-03-24 | Fujitsu Ltd | 合成音声テキスト入力装置及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112015731A (zh) * | 2020-07-08 | 2020-12-01 | 广州乐摇摇信息科技有限公司 | 基于多终端设备的信息分发方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10649621B2 (en) | Facilitating performing searches and accessing search results using different devices | |
US10353977B2 (en) | Computer-implemented method for automated operating-system-specific access to software functionality | |
US20110153330A1 (en) | System and method for rendering text synchronized audio | |
US9380410B2 (en) | Audio commenting and publishing system | |
US20170329857A1 (en) | Personalized Search Results | |
US9280595B2 (en) | Application query conversion | |
WO2011138830A1 (ja) | 電子書籍システムおよびコンテンツサーバ | |
TW201437832A (zh) | 訊息推薦方法及其裝置與訊息資源推薦系統 | |
WO2017033166A1 (en) | Action recommendation system for focused objects | |
CN110245298A (zh) | 用于推送信息的方法和装置 | |
US20150012533A1 (en) | Method and client device for accessing webpage | |
CN114023301A (zh) | 音频编辑方法、电子设备及存储介质 | |
JP6781233B2 (ja) | 統合インフォメーションの生成方法、統合インフォメーションのプッシュ方法及びその装置、端末、サーバ、媒体 | |
CN103092962A (zh) | 一种发布互联网信息的方法和系统 | |
JP5211266B1 (ja) | 閲覧システム、端末、画像サーバ、プログラム、プログラムを記録したコンピュータ読み取り可能な記録媒体、及び方法 | |
US20160188681A1 (en) | Viewing Search Results Using Multiple Different Devices | |
JP2018022386A (ja) | 配信装置、配信方法、配信プログラム及び情報表示プログラム | |
US20110113333A1 (en) | Creation and delivery of ringtones over a communications network | |
KR20080038655A (ko) | 웹상의 텍스트를 음악으로 재생하는 저작 시스템 및 방법 | |
JP2017116710A (ja) | 音声配信システムおよび文書配信システム | |
US20190258666A1 (en) | Resource accessibility services | |
WO2017165253A1 (en) | Modular communications | |
CN108984260B (zh) | 用于处理信息的方法和装置 | |
JP7229296B2 (ja) | 関連情報提供方法及びシステム | |
JP4407650B2 (ja) | ブログ作成用クライアント装置、ブログサーバ、及びそれらのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190910 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200303 |