JP6129977B2

JP6129977B2 - アノテーション共有方法、アノテーション共有装置及びアノテーション共有プログラム

Info

Publication number: JP6129977B2
Application number: JP2015537527A
Authority: JP
Inventors: 布目　光生; 光生布目; 眞弘森田; 由加黒田; 良彰水岡
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2013-09-20
Filing date: 2013-09-20
Publication date: 2017-05-17
Anticipated expiration: 2033-09-20
Also published as: WO2015040743A1; JPWO2015040743A1; US10606940B2; US20160196253A1

Description

本発明の実施形態は、アノテーション共有方法、アノテーション共有装置及びアノテーション共有プログラムに関する。

近年、小型端末の普及や性能向上などにより、従来は現実的ではなかった電子書籍の専用端末やコンテンツ配信といったサービスが広がりつつある。また、書籍の電子化に伴い、テキストの閲覧だけでなく、音声合成を連携させた読み上げ機能を備えた端末も提供されている。さらに、視覚障害者や学習障害者を考慮した各種の電子書籍フォーマット（例えばＤＡＩＳＹ：Digital Accessible Information System）の普及により、朗読音声データを埋め込んだコンテンツなども徐々に広まりつつある。

一般に、テキストが主体である電子書籍は、固定ページを持たないフロー形式のデータであり、電子書籍中のある場所を指し示すには、本文データを手掛かりとした指定が必要である。しかし、著作権保護やセキュリティ上の理由から、本文データに直接アクセスすることは困難であったり、許可されていない場合が多い。

特表２００５−５０６６０２号公報特開２００９−７０２７８号公報

つまり、従来は、電子書籍などの本文データに直接アクセスすることが困難であるために、電子書籍中のある位置を指し示してアノテーションを付与し、指し示された位置におけるアノテーションを共有可能にすることができないという問題があった。本発明が解決しようとする課題は、コンテンツ本体を用いることなく、コンテンツ中の指し示された位置におけるアノテーションを共有可能にすることができるアノテーション共有方法、アノテーション共有装置及びアノテーション共有プログラムを提供することである。

実施形態のアノテーション共有方法は、コンテンツ提示部、取得部、位置算出部及び格納部を備えたコンピュータが実行する方法であって、４つの工程を含む。まず、コンテンツ提示部がコンテンツを出力する。次に、コンテンツ提示部が出力したコンテンツに対して位置付けされたアノテーションを取得部が取得する。次に、取得部が取得したアノテーションのコンテンツ中の位置を算出可能になるまで、コンテンツに関連する情報の着目範囲を広げ、取得部が取得したアノテーションのコンテンツ中の位置を、コンテンツ本体を用いることなく、コンテンツにおけるアノテーションの位置特定に利用可能なコンテンツに関連する情報を用いて位置算出部が算出する。次に、位置算出部が算出したコンテンツ中の位置とアノテーションとを対応付けて読出し可能に格納部が格納する。

実施形態にかかるアノテーション共有装置の構成を例示するブロック図。第１提示部が読込む書籍データ例を示す図。第１提示部が読込む書籍データに関連付けられた文書メタデータ例を示す図。アノテーション情報の構成例を示す図表。実施形態にかかるアノテーション共有装置がアノテーション情報をＤＢに格納する処理を示すフローチャート。位置算出部がアノテーションの位置を算出する場合に行う処理を示すフローチャート。読上げ位置の論理要素を例示する図。読上げパラメータの論理要素を例示する図。格納部がＤＢに格納したデータの具体例を模式的に示す図。実施形態にかかるアノテーション共有装置がアノテーションを提示する場合に行う処理を示すフローチャート。

以下に添付図面を参照して、実施形態にかかるアノテーション共有装置について説明する。

（実施形態）
図１は、実施形態にかかるアノテーション共有装置１の構成を例示するブロック図である。図１に示すように、アノテーション共有装置１は、アノテーション付与部１０、アノテーション出力部１２、及びアノテーション格納部２０を有する。なお、アノテーション共有装置１は、例えば、汎用のコンピュータ又はクライアントサーバシステムなどによって実現される。即ち、アノテーション共有装置１は、ＣＰＵ、記憶装置、入出力装置及び通信インターフェイスなどを備えたコンピュータであってもよいし、サーバが記憶する資源を利用するクライアントなどであってもよいし、複数のサーバ及び複数のクライアントを含むものであってもよい。

例えば、アノテーション付与部１０及びアノテーション出力部１２は、それぞれ別のコンピュータに含まれてもよいし、１つのコンピュータに含まれてもよい。また、アノテーション格納部２０は、例えばサーバに含まれ、アノテーション付与部１０及びアノテーション出力部１２それぞれと通信を行うように構成されてもよい。つまり、アノテーション付与部１０、アノテーション出力部１２及びアノテーション格納部２０は、任意の組合せで組み合わせられて、アノテーション共有プログラムを実行するように構成されてもよい。

アノテーション付与部１０は、例えば第１提示部（コンテンツ提示部）１００、取得部１０２及び位置算出部１０４を有する。第１提示部１００は、電子書籍（例えばＤＡＩＳＹフォーマット）などのコンテンツデータを読込み、音声や書誌情報などのアクセス可能な情報を取得し、例えば表示及び音声によってコンテンツをユーザに提示する。例えば、第１提示部１００は、図示しない表示装置及びスピーカなどのハードウェアと、ＣＰＵが実行するソフトウェアなどによってコンテンツの再生（出力）を行う。

図２は、第１提示部１００が読込む書籍データ（コンテンツ本体：本文データ）例を示す図である。書籍データは、例えばテキスト及び音声の構造化のためにＸＨＴＭＬが使用されている。

図３は、第１提示部１００が読込む書籍データに関連付けられた文書メタデータ（書籍関連データ）例を示す図である。書籍関連データは、音声データとテキスト・画像等との同期にＳＭＩＬ（Synchronized Multimedia Integration Language）が使用されている。また、書籍関連データは、音声フォーマットにＭＰ３が採用されており、音声再生用の定義が記されたナビゲーションファイルとなっている。

ここで、図２に示した書籍データや、図３に示した書籍関連データのテキスト要素に含まれる本文データは、直接アクセスすることが困難なものであるとする。例えば、本文のテキストデータは暗号化され、図２に示したＸＭＬタグ構造は可読であるが、テキスト要素は非可読な（エンコードされた）文字列が挿入されているためにアクセスができないものであるとする。又は、図２に示した書籍データのファイル自体にアクセスができない、若しくは本文のテキストデータを引用して明示的な指定を行うことが許されていないものとする。

一方、図３に示したナビゲーションファイルは、本文データそのものが記載されていないメタデータであるため、アクセス可能な情報であるとする。さらに、ナビゲーションファイルは、書籍データにアクセス可能なＡＰＩなどにより、書籍データに対応する音声データと章節単位の対応付けとを取得可能にされているものとする。

取得部１０２（図１）は、ユーザによるアノテーション指示入力を取得する。ここで、アノテーション指示入力とは、音声を関連付けられてアノテーション共有装置１に表示されたテキスト（コンテンツ）に対して、例えば入力装置であるペンなどによってユーザが手書きで記号の付加、マーキング、又はペンジェスチャーを特定すること、若しくはアノテーション共有装置１（再生端末）上でコメント挿入のためのボタンを押し下げるなどのアクションを行うことによってアノテーションを特定する入力を指す。また、取得部１０２は、音声入力からアノテーション指示を取得してもよい。取得部１０２は、ハードウェアで構成されてもよいし、ソフトウェアで構成されてもよい。

また、アノテーション指示入力によってコンテンツに埋め込まれる（付加される）情報（アノテーション情報）は、例えばコンテンツ中のアノテーションの位置、属性及び値によって構成されるものとする。図４は、アノテーション情報の構成例を示す図表である。例えば、アノテーションは、コンテンツ中のアノテーションの位置を仮に「＊」で示すものとすると、後述する手順により、図４に示したアノテーション情報としてコンテンツに関連付けられる。

位置算出部１０４（図１）は、取得部１０２が取得したアノテーション指示入力を用いて、各アノテーションがコンテンツ中のどの位置に対して付与されたものであるかを算出して特定する。例えば、位置算出部１０４は、後述するようにアノテーションの指し示すコンテンツ中の位置を段階的に算定し、最も細かな粒度の情報を位置情報とする。位置算出部１０４は、ハードウェアで構成されてもよいし、ソフトウェアで構成されてもよい。

アノテーション格納部２０は、格納部２００及びデータベース（ＤＢ）２０２を有する。格納部２００は、コンテンツに対するアノテーションと、コンテンツに関連する情報を用いて位置算出部１０４が算出したコンテンツ中のアノテーションの位置と、を対応付けて読出し可能にＤＢ２０２へ格納する。格納部２００は、ハードウェアで構成されてもよいし、ソフトウェアで構成されてもよい。ＤＢ２０２は、例えば単一又は複数のＨＤＤ（Hard Disk Drive）などによって構成される。そして、格納部２００は、読出し可能に格納したコンテンツ中の位置とアノテーションとを読み出す機能を備えていてもよい。

アノテーション出力部１２は、第２提示部（アノテーション提示部）１２０を有する。第２提示部１２０は、図示しない表示装置及びスピーカなどのハードウェアと、ＣＰＵが実行するソフトウェアなどによってアノテーションの提示（出力）を行う。

具体的には、第２提示部１２０は、コンテンツの提示中（再生中）に、格納したコンテンツ中の位置においてアノテーションを例えば音声等によって提示する。つまり、第２提示部１２０は、コンテンツに対してアノテーションが付与（関連付け）されていれば、コンテンツ中の付与されている位置においてアノテーションが付与されていることを示したり、同時に値を提示することが可能にされている。よって、自・他ユーザは、付与されているアノテーションをコンテンツの再生と連動させて参照することが可能である。なお、コンテンツの再生は、アノテーション出力部１２が行ってもよいし、アノテーション共有装置１がコンテンツを再生するコンテンツ再生部を別途に備えて、コンテンツ再生部が行ってもよい。

なお、例えば書籍のコンテンツの本文テキストを直接アクセスすることによって利用可能である場合には、アノテーションが指し示す位置を、本文文字列を手がかりとして作成したインデックス情報により特定したり、ＸＰａｔｈ（ＸＭＬパス言語）によって直接指定できるため、本実施形態の対象外としてもよい。また、コンテンツに対して外部からは書誌情報や音声データも含めて全くアクセスできない場合には、単純にアノテーションをコンテンツ全体の粒度でしか対応付けることができないため、本実施形態の特別な例に該当する。

一方、フロー形式の電子書籍フォーマットでは、例えば外部から利用可能（アクセス可能）な情報としてタイトルや目次、著者名などの書誌情報や読み上げた音声データなどがある。ただし、電子書籍による音声合成朗読では、通常の映画や動画コンテンツと異なり、再生速度や読み上げ話者、ピッチやテンポなど音声に関するパラメータを変えて再生することが可能であるため、ユーザの再生状況ごとに経過秒数が異なる。つまり、単純にタイムスタンプを手がかりとして、アノテーションを付与することができない場合がある。このような場合にも、本実施形態によってコンテンツにアノテーションを付与し、アノテーションの共有を可能にすることができる。

次に、アノテーション共有装置１の動作について説明する。図５は、アノテーション共有装置１がアノテーション情報をＤＢ２０２に格納する処理（アノテーション付与）を示すフローチャートである。

ステップ１００（Ｓ１００）において、第１提示部１００は、例えば電子書籍のコンテンツデータを読み込む。

ステップ１０２（Ｓ１０２）において、第１提示部１００は、例えばコンテンツの音声を再生する。

ステップ１０４（Ｓ１０４）において、取得部１０２は、ユーザによるアノテーション情報が付与されたか否かを判定する。つまり、取得部１０２は、コンテンツの再生中にユーザがアノテーションを付与したか否かを判定する。取得部１０２は、ユーザによるアノテーション情報が付与されていないと判定した場合（Ｓ１０４：Ｎｏ）には、Ｓ１００の処理に進む。つまり、アノテーション情報が付与されていない場合、コンテンツの再生が継続されることとなる。また、取得部１０２は、ユーザによるアノテーション情報が付与されたと判定した場合（Ｓ１０４：Ｙｅｓ）には、Ｓ１０６の処理に進む。

ステップ１０６（Ｓ１０６）において、取得部１０２は、アノテーションの属性と値とを取得する。例えば、アノテーションの属性と値は、図４に示したような種類（属性）と付加情報（値）であり、アノテーション情報を構成する。例えば、ユーザによるアノテーション指示がペン入力である場合には、取得部１０２は、ペンのストローク情報を取得し、マーキング情報などとして解釈する。また、アノテーション指示は、ペン入力に限られるものではなく、音声再生中のボタン（図示せず）の押し下げや、画面上でメニューから選択して指示を与えるなど、一般的な選択及び確定の指示入力であってもよい。

ステップ１０８（Ｓ１０８）において、位置算出部１０４は、アノテーションの位置を算出する。なお、位置算出部１０４がアノテーションの位置を算出する具体的な処理については、図６等を用いて後述する。

ステップ１１０（Ｓ１１０）において、格納部２００は、アノテーション情報をＤＢ２０２に格納する。

ステップ１１２（Ｓ１１２）において、アノテーション共有装置１は、再生しているコンテンツの終端であるか否かを判定する。アノテーション共有装置１は、再生しているコンテンツの終端でないと判定した場合（Ｓ１１２：Ｎｏ）には、Ｓ１００の処理に進む。また、アノテーション共有装置１は、再生しているコンテンツの終端であると判定した場合（Ｓ１１２：Ｙｅｓ）には、処理を終了する。

図６は、位置算出部１０４がアノテーションの位置を算出する場合に行う処理を示すフローチャートである。

ステップ２００（Ｓ２００）において、位置算出部１０４は、コンテンツである書籍に対し、書籍関連データを読み込む。書籍関連データは、例えば音声とテキストコンテンツとが対応付けられたナビゲーションデータである。

ステップ２０２（Ｓ２０２）において、位置算出部１０４は、アノテーション共有装置１が現在再生しているコンテンツに対する位置情報で最も細かな論理要素（例えば後述する図９に示したＩＤ１〜４のいずれか）を特定する。ここでは、テキスト本文の情報を取得できないものとする。なお、論理要素とは、文書の構造のようにテキストで示されるデータを指すものとする。

ステップ２０４（Ｓ２０４）において、位置算出部１０４は、例えば章立て及び図表などの音声以外の近傍の論理要素を特定できるか否かを判定する。位置算出部１０４は、近傍の論理要素を特定できないと判定した場合（Ｓ２０４：Ｎｏ）には、Ｓ２０６の処理に進む。また、位置算出部１０４は、近傍の論理要素を特定できると判定した場合（Ｓ２０４：Ｙｅｓ）には、Ｓ２０８の処理に進む。

ステップ２０６（Ｓ２０６）において、位置算出部１０４は、着目する論理要素の範囲を広げ、その後にＳ２０２の処理に進む。

ステップ２０８（Ｓ２０８）において、位置算出部１０４は、近傍の論理要素を検出し、例えばコンテンツ及び論理要素に対するアノテーションの相対位置を保持する。

ステップ２１０（Ｓ２１０）において、位置算出部１０４は、音声パラメータの設定情報を取得できるか否かを判定する。なお、音声パラメータとは、音声データや、音声が停止したポーズの回数などのテキストで示されないデータを指すものとする。位置算出部１０４は、音声パラメータの設定情報を取得できないと判定した場合（Ｓ２１０：Ｎｏ）には、Ｓ２１２の処理に進む。また、位置算出部１０４は、音声パラメータの設定情報を取得できると判定した場合（Ｓ２１０：Ｙｅｓ）には、Ｓ２１４の処理に進む。

ステップ２１２（Ｓ２１２）において、位置算出部１０４は、着目する設定情報の範囲を広げ、その後にＳ２１０の処理に進む。

ステップ２１４（Ｓ２１４）において、位置算出部１０４は、近傍の音声パラメータ設定を取得する。

ステップ２１６（Ｓ２１６）において、位置算出部１０４は、音声パラメータで同じ値が継続する場合は累積継続長を算出し、データの終了まで処理を継続する。

次に、位置算出部１０４がアノテーションの相対位置を算出して保持（図６参照）するために行う処理を具体的に説明する。位置算出部１０４は、例えば読上げ位置の近傍の論理要素を手がかりにして、アノテーションの相対位置を算出する。図７は、読上げ位置の論理要素を例示する図である。具体的には、図７は、音声ファイルの開始秒数及び終了秒数と、テキスト領域との対応付けを示すメタデータのテキスト（論理要素）である。

図７に示した例において、現在、ｉｄ＝”ｘｑｍｓ＿０００４”の要素が読上げられていると仮定する。位置算出部１０４は、例えば章や節など取得可能な文書の論理要素のうち最も細かな単位でカウントした場合の冒頭や末端を検出し、そこからの相対位置を累積時間や論理要素の出現数によって保持する。

例えば、図７に示した例において、位置算出部１０４は、該当ＩＤを持つ要素が２．３５７秒から開始されているため、現在の最小の論理要素内（例えば節やパラグラフなど）では、先頭から２．３５７秒の経過があると判断する。また、位置算出部１０４は、後続する論理要素を終端とした場合には、要素が９．２２７秒で終わることから、終端から数えた場合には、相対的な位置の差が９．２２７秒−２．３５７秒となり、６．８７０秒の隔たりがあるとする。また、位置算出部１０４は、音声にしたコンテンツ中の特徴量が生じた時点からの経過時間又は特徴量が生じるまでの経過時間を用いて、アノテーションのコンテンツ中の位置を算出してもよい。

図８は、読上げパラメータの論理要素を例示する図である。図８において、左側には本文データ（原文）例が示され、右側には本文データ例に対応する書籍関連データ（メタデータ）例が示されている。書籍関連データは、ユーザが後から付与するものであってもよく、位置算出部１０４が位置算出に利用可能となっている。

ここでは、図８の左側に示したように、本文データの前半にあるパラグラフは女性話者（音声合成辞書名＝”Ｈａｎａｋｏ”）による読み上げが指定されており、後半のパラグラフは男性話者（音声合成辞書名＝”Ｋｅｎｊｉ”）による読み上げが指定されている。

また、現在の読み上げ位置は、本文データでは最後のパラグラフ「この本をもっと活用する・・・」であるとし、書籍関連データではｉｄ＝”ｘｑｍｓ＿０００７”が対応しているとする。

図８の右側に示した書籍関連データでは、各ｉｄに対して、話者の指定がある。例えば、話者は、ｉｄ＝”ｘｑｍｓ＿０００３”〜”ｘｑｍｓ＿０００４”までは「Ｈａｎａｋｏ」で定義され、それ以降の”ｘｑｍｓ＿０００５”〜”ｘｑｍｓ＿０００７”までは「Ｋｅｎｊｉ」で定義されているものとする。

ここでは、位置算出部１０４は、話者の変更位置を特定できるので、現在位置から話者の切り替わり地点までの相対位置及び累積時間を算出する。格納部２００は、位置算出部１０４が算出した相対位置及び累積時間をＤＢ２０２に格納することとなる。

上述したように、位置算出部１０４は、近傍の論理要素が特定できる場合には、近傍の論理要素を検出して、アノテーションの相対位置を保持する。また、位置算出部１０４は、近傍の論理要素によってアノテーションの位置を詳細に特定できない場合、着目する論理要素の範囲を広げることにより、現在の着目領域を含むより広範囲な論理要素を近似的に採用する。例えば、位置算出部１０４は、一般的な書籍の論理構造であれば、行→パラグラフ→節本文→章本文→書籍全体といった順に、相対位置を取得可能な論理要素に拡大していく。

また、位置算出部１０４は、音声パラメータ（話者以外にも、ピッチやテンポなどの設定値を含む）の設定情報を取得できる場合には、近傍の音声パラメータ設定を取得し、同じ値が継続する場合は累積の継続長を算出する。上述したように、位置算出部１０４は、音声パラメータについても、相対位置を取得可能になる範囲まで、着目する設定情報の範囲を広げる。

アノテーションの相対位置が算出されると、格納部２００は、コンテンツに対するアノテーションと、コンテンツ中のアノテーションの相対位置と、を対応付けて読出し可能にＤＢ２０２へ格納する。

図９は、格納部２００がＤＢ２０２に格納したデータの具体例を模式的に示す図である。図９に示すように、例えば電子書籍データ中のアノテーション付与先（対象）として、原文と、書籍関連データ＜ｔｅｘｔｓｒｃ＝”ａｂｃ＃００３” ｉｄ＝”ｘｘｘ＿０００３” ／＞とがあるものとする。また、ＤＢ２０２には、コンテンツデータに対し、アノテーションとして「コメント」（「怖いですねぇー」、「ゆとりですねー。」）や、「手書き」のストローク情報（赤で引かれた二重線）の値及び属性がそれぞれ格納されているものとする。

また、このような前提条件において、図９には、アノテーションの相対位置の記述例がいくつか図９中の表に示されている。この表の左端のカラムは、個々の相対位置情報を区別するためのＩＤ番号を示している。図９の左側から順に、ＩＤ番号の次のカラムには、起点とする参照先が示されている。起点とする参照先は、コンテンツの原文データにアクセスすることなく、外部からアクセス可能なポイントを示したものである。また、次のカラムは、起点とする参照先からの経過秒数である。続くカラムには、話速及び話者が順に定義されている。

図９において、ＩＤ＝０の場合は、アノテーション共有装置１が直接原文を参照（アクセス）できる場合を例示している。例えば、ＩＤ＝０は、現在の読み上げ位置が、＃ｘｘｘ＿０００３（直接文書要素に付与されているｉｄ番号）に相当する文書の論理要素であることを示している。

ＩＤ＝１は、アノテーション共有装置１が章節立て構造を参照できる場合を例示している。この場合、アノテーション共有装置１は、章と節の開始位置として、”第二章第三節”という単位でアクセスが可能である。例えば、現在の読み上げ位置は、章と節の開始位置から２３．４５秒経過した位置であることが示されている。さらにこの場合、定義されている話速の変更はなく（デフォルトの０とする）、話者はＫｅｎｊｉであるものとされている。

また、ＩＤ＝２は、アノテーション共有装置１が章立てと図表やその見出しを示す要素を参照できる場合の定義例である。この場合、アノテーション共有装置１は、起点として”第二章”の他、図表の論理要素、又はその見出しである”ｆｉｇ．２”の位置を利用可能である。例えば、現在の読み上げ位置は、章立てと図表やその見出しの開始位置から３．１３秒経過した位置であることが示されている。さらにこの場合、話速は”＋３”（速度として３段階早い）に補正されており、話者は”Ｋｅｎｊｉ”である。

また、ＩＤ＝３は、章立てと音声読み上げ情報を参照できる場合の定義例である。この場合、アノテーション共有装置１は、起点として”第二章”の他、話者の変更が行われた(”ｋｅｎｊｉ”から”Ｈａｎａｋｏ”に変更）位置を利用可能である。例えば、現在の読み上げ位置は、話者の変更が行われた位置から１０．３秒経過した位置であることが示されている。さらにこの場合、話速は”−２”（速度として２段階早い）に補正されており、話者は”Ｋｅｎｊｉ”である。つまり、この時の話速が”−２”（速度として２段階遅い）に補正されているほか、現在の話者は”Ｈａｎａｋｏ”である。

また、ＩＤ＝４の場合もＩＤ＝３の場合と同様に、章立てと音声読み上げ情報を参照できる場合の定義例である。この場合、アノテーション共有装置１は、起点とする参照先として、”第二章”という大まかな位置情報の他、それを詳細化するための補足情報として、音声上のポーズ（一定時間以上続く無音の空白区間）の出現回数が５回出現した位置から、５．２秒経過した位置を利用可能である。また、話速（の補正）は０（デフォルトの話速）であるとされ、話者は”Ｈａｎａｋｏ”である。

つまり、アノテーション共有装置１は、アノテーションの出現があるたびに、アノテーションが対応付けられた（相対）位置と、アノテーションの属性及び値とをＤＢ２０２に格納していく。

そして、アノテーション共有装置１は、コンテンツの再生中にアノテーションが出現するたびに格納を行い、コンテンツの終端であれば、処理を終了する。アノテーション共有装置１は、コンテンツがまだ続くようであれば、データを読み込み最初の処理に戻る。

次に、アノテーション共有装置１がアノテーションを提示する場合に行う処理について説明する。図１０は、アノテーション共有装置１がアノテーションを提示する場合に行う処理を示すフローチャートである。

ステップ３００（Ｓ３００）において、アノテーション共有装置１は、例えば格納部２００がＤＢ２０２に格納されたアノテーションを読み込む（アノテーションＤＢを読込む）。

ステップ３０２（Ｓ３０２）において、アノテーション共有装置１は、コンテンツデータを読込む。ここでは、例えばアノテーションが付与されたものとは別の書籍（同書籍でも同様）を読上げ対象とする。

ステップ３０４（Ｓ３０４）において、アノテーション共有装置１は、コンテンツの読上げ音声を出力（再生）する。

ステップ３０６（Ｓ３０６）において、第２提示部１２０は、コンテンツ中の現在再生している領域にアノテーションが存在するか（付与されているか）否かを判定する。第２提示部１２０は、アノテーションが存在しないと判定した場合（Ｓ３０６：Ｎｏ）には、Ｓ３０２の処理に進む。また、第２提示部１２０は、アノテーションが存在すると判定した場合（Ｓ３０６：Ｙｅｓ）には、Ｓ３０８の処理に進む。

ステップ３０８（Ｓ３０８）において、第２提示部１２０は、例えば「音声による提示」の指定があるか否かを判定する。第２提示部１２０は、「音声による提示」の指定がないと判定した場合（Ｓ３０８：Ｎｏ）には、Ｓ３１２の処理に進む。また、第２提示部１２０は、「音声による提示」の指定があると判定した場合（Ｓ３０８：Ｙｅｓ）には、Ｓ３１０の処理に進む。

ステップ３１０（Ｓ３１０）において、第２提示部１２０は、アノテーション情報を音声データに変換する。

ステップ３１２（Ｓ３１２）において、第２提示部１２０は、アノテーション情報（又はアノテーション）を出力する。

ステップ３１４（Ｓ３１４）において、アノテーション共有装置１は、コンテンツの終端であるか否かを判定する。アノテーション共有装置１は、再生しているコンテンツの終端でないと判定した場合（Ｓ３１４：Ｎｏ）には、Ｓ３０２の処理に進む。また、アノテーション共有装置１は、再生しているコンテンツの終端であると判定した場合（Ｓ３１４：Ｙｅｓ）には、処理を終了する。

なお、アノテーション共有装置１は、アノテーションを画面上に明示的に提示してもよいし、音声として本文の読上げ音声に割り込ませて提示してもよい。また、アノテーション共有装置１は、アノテーションの有無のみを提示してもよい。また、アノテーション共有装置１は、ユーザ指示や操作に応じて、さらに詳細な情報（コメントなどの値）を表示又は音声として出力するように構成されてもよい。

また、アノテーション共有装置１は、画面表示を必要としない例えばオーディオブックとしてコンテンツを再生する場合、「音声による提示」の指示に応じて、アノテーションを音声データに変換し、アノテーションに含まれるコメント文字列などを音声合成によって出力してもよい。この場合も、アノテーション共有装置１は、ユーザ指示に応じて、アノテーションの有無を示す効果音やシグナルのみを提示してもよい。

このように、実施形態にかかるアノテーション共有装置によれば、アノテーションのコンテンツ中の位置を、コンテンツに関連する情報を用いて算出するので、コンテンツ本体を用いることなく、コンテンツ中の指し示された位置におけるアノテーションを共有可能にすることができる。また、アノテーション共有装置は、コンテンツの表示だけではなく、朗読音声再生時に再生速度やテンポ、話者などの音声パラメータを変更しても、コンテンツ中の指し示された位置におけるアノテーションを共有可能にすることができる。

本実施形態のアノテーション共有装置で実行されるアノテーション共有プログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）等のコンピュータで読み取り可能な記録媒体に記録されて提供される。

また、本実施形態のアノテーション共有装置で実行されるアノテーション共有プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。

また、本発明のいくつかの実施形態を複数の組み合わせによって説明したが、これらの実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規の実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

Claims

コンテンツ提示部、取得部、位置算出部及び格納部を備えたコンピュータが実行するアノテーション共有方法であって、
前記コンテンツ提示部がコンテンツを出力する工程と、
前記コンテンツ提示部が出力した前記コンテンツに対して位置付けされたアノテーションを前記取得部が取得する工程と、
前記取得部が取得した前記アノテーションの前記コンテンツ中の位置を算出可能になるまで、前記コンテンツに関連する情報の着目範囲を広げ、前記取得部が取得した前記アノテーションの前記コンテンツ中の位置を、前記コンテンツ本体を用いることなく、前記コンテンツにおける前記アノテーションの位置特定に利用可能な前記コンテンツに関連する情報を用いて前記位置算出部が算出する工程と、
前記位置算出部が算出した前記コンテンツ中の位置と前記アノテーションとを対応付けて、読出し可能に前記格納部が格納する工程と、
を含むアノテーション共有方法。
前記位置算出部が算出した前記コンテンツ中の位置と前記アノテーションとを対応付けて、前記格納部がネットワークを介してサーバに格納する工程を含む請求項１に記載のアノテーション共有方法。
前記コンピュータは、アノテーション提示部をさらに備え、
前記コンテンツ提示部による前記コンテンツの出力中に、前記格納部が格納した前記コンテンツ中の位置において前記アノテーションを前記アノテーション提示部が出力する工程を含む請求項１に記載のアノテーション共有方法。
前記コンテンツに対する前記アノテーションを、前記取得部が手書き入力又は音声入力から取得する工程を含む請求項１に記載のアノテーション共有方法。
読出し可能に格納した前記アノテーションの前記コンテンツ中の位置及び前記アノテーションを前記格納部が読み出す工程と、
前記格納部が読出した前記コンテンツ中の位置において前記アノテーションを音声によって前記アノテーション提示部が出力する工程を含む請求項３に記載のアノテーション共有方法。
コンテンツを出力するコンテンツ提示部と、
前記コンテンツ提示部が出力した前記コンテンツに対して位置付けされたアノテーションを取得する取得部と、
前記取得部が取得した前記アノテーションの前記コンテンツ中の位置を算出可能になるまで、前記コンテンツに関連する情報の着目範囲を広げ、前記取得部が取得した前記アノテーションの前記コンテンツ中の位置を、前記コンテンツ本体を用いることなく、前記コンテンツにおける前記アノテーションの位置特定に利用可能な前記コンテンツに関連する情報を用いて算出する位置算出部と、
前記位置算出部が算出した前記コンテンツ中の位置と前記アノテーションとを対応付けて格納する格納部と、
を有するアノテーション共有装置。
コンテンツに対して位置付けされたアノテーションと、前記アノテーションの前記コンテンツ中の位置を算出可能になるまで、前記コンテンツに関連する情報の着目範囲が広げられ、前記コンテンツ本体を用いることなく、前記コンテンツにおける前記アノテーションの位置特定に利用可能な前記コンテンツに関連する情報を用いて算出された前記コンテンツ中の前記アノテーションの位置と、を対応付けて読出し可能に格納する格納部と、
前記コンテンツの出力中に、前記格納部が格納した前記コンテンツ中の位置において前記アノテーションを提示するアノテーション提示部と、
を有するアノテーション共有装置。
コンテンツを出力するコンテンツ提示部と、
前記コンテンツ提示部が出力した前記コンテンツに対して位置付けされたアノテーションを取得する取得部と、
前記取得部が取得した前記アノテーションの前記コンテンツ中の位置を算出可能になるまで、前記コンテンツに関連する情報の着目範囲を広げ、前記取得部が取得した前記アノテーションの前記コンテンツ中の位置を、前記コンテンツ本体を用いることなく、前記コンテンツにおける前記アノテーションの位置特定に利用可能な前記コンテンツに関連する情報を用いて算出する位置算出部と、
前記コンテンツに対する前記アノテーションと、算出された前記コンテンツ中の前記アノテーションの位置と、を対応付けて読出し可能にサーバへ格納する格納部と、
前記コンテンツの出力中に、前記格納部が前記サーバへ格納した前記コンテンツ中の位置において前記アノテーションを提示するアノテーション提示部と、
を有するアノテーション共有装置。
コンテンツを出力するステップと、
前記コンテンツに対して位置付けされたアノテーションを取得するステップと、
取得した前記アノテーションの前記コンテンツ中の位置を算出可能になるまで、前記コンテンツに関連する情報の着目範囲を広げるステップと、
前記アノテーションの前記コンテンツ中の位置を、前記コンテンツ本体を用いることなく、前記コンテンツにおける前記アノテーションの位置特定に利用可能な前記コンテンツに関連する情報を用いて算出するステップと、
算出した前記コンテンツ中の位置と前記アノテーションとを対応付けて読出し可能に格納するステップと、
をコンピュータに実行させるためのアノテーション共有プログラム。