JP2006243156A - Information processing apparatus, method and program - Google Patents
Information processing apparatus, method and programInfo
- Publication number
- JP2006243156A JP2006243156A JP2005056102A JP2005056102A JP2006243156A JP 2006243156 A JP2006243156 A JP 2006243156A JP 2005056102 A JP2005056102 A JP 2005056102A JP 2005056102 A JP2005056102 A JP 2005056102A JP 2006243156 A JP2006243156 A JP 2006243156A
- Authority
- JP
- Japan
- Prior art keywords
- information
- annotation
- reading
- document
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、情報処理装置および方法並びにプログラムに関し、特に、電子文書に基づいて、文書読み上げ用の情報を生成する情報処理装置および方法並びにプログラムに関する。 The present invention relates to an information processing apparatus, method, and program, and more particularly, to an information processing apparatus, method, and program for generating information for reading a document based on an electronic document.
近年、音声合成の技術の向上に伴い、ワードプロセッサ等で作成された電子文書を、その内容を読み上げるための情報に変換する技術が多く提供されている。 In recent years, with the improvement of speech synthesis technology, many technologies for converting an electronic document created by a word processor or the like into information for reading out the content are provided.
このような技術には、文章を解析するために入力された文書から解析する範囲を切り出すための表記を記載した区切り表記テ−ブル手段と、区切り表記テ−ブル手段の内容を編集する手段とを設けることにより、校正精度の向上を図るものや(例えば、特許文献1参照)、文書中の表をユーザに分かり易く読み上げるようにしたもの(例えば、特許文献2参照)、メニュー階層と必要入力項目の流れの定義のみから、対話処理を行なうプログラムソースコードを自動生成し、音声応答装置の対話処理を実現できるようにしたもの(例えば、特許文献3参照)、レイアウト情報により構造化された文書をテキスト音声合成で読み上げる際に、対象文書をその包含関係等に従って階層化して、聞き手が文書構造を認識することを助けるようにしたもの(例えば、特許文献4参照)、Webサイトから収集したWebページに対応したもの(例えば、特許文献5参照)、ユーザが自由かつ容易に表音テキストを編集することができるようにしたもの(例えば、特許文献6参照)等がある。
ところで、最近の電子文書には、アノテーションを付加することができるものがある。電子文書に付加されるアノテーションとしては、紙文書と同様の付箋の貼付やマーカー等による記述、スタンプ等の押印があり、電子文書に特有のアノテーションとして、他の文書等のオブジェクトへのリンクがある。 By the way, some recent electronic documents can add annotations. Annotations added to electronic documents include sticky notes, descriptions with markers, etc., as with paper documents, and stamps such as stamps. Annotations specific to electronic documents include links to objects such as other documents .
このようなアノテーションは、文書の本文ではないものの有用な情報であることも多いが、従来の文書読み上げ技術にはアノテーションに対応することができるものがなく、文書の読み上げ時にアノテーションに関する情報を割愛せざるを得なかった。 Such annotations are often useful information, although they are not the text of the document. However, there is no conventional document-reading technology that can handle annotations, and information related to annotations can be omitted when reading a document. I had to.
そこで、本発明は、電子文書に付されたアノテーションに関する情報を含む文書読み上げ用の情報を生成する情報処理装置および方法並びにプログラムを提供することを目的とする。 SUMMARY An advantage of some aspects of the invention is that it provides an information processing apparatus, method, and program for generating information for reading a document including information related to annotations attached to an electronic document.
上述した目的を達成するため、請求項1の発明は、音声合成技術を利用して文書の読み上げを行う文書読み上げ装置若しくは文書読み上げプログラムに対応する文書読み上げ情報を、電子文書に基づいて生成する情報処理装置において、対象となる電子文書から本文のテキスト情報を取得するテキスト情報取得手段と、前記電子文書からアノテーションに関するアノテーション情報を取得するアノテーション情報取得手段と、前記テキスト情報取得手段が取得したテキスト情報と、前記アノテーション情報取得手段が取得したアノテーション情報とのそれぞれに基づいて、読み上げ情報を生成する読み上げ情報生成手段とを具備することを特徴とする。 In order to achieve the above-described object, the invention of claim 1 is an information for generating document reading information corresponding to a document reading device or a document reading program for reading a document using a speech synthesis technology based on an electronic document. In the processing device, text information acquisition means for acquiring text information of the text from the target electronic document, annotation information acquisition means for acquiring annotation information related to annotation from the electronic document, and text information acquired by the text information acquisition means And reading information generation means for generating reading information based on each of the annotation information acquired by the annotation information acquisition means.
また、請求項2の発明は、請求項1の発明において、前記アノテーション情報取得手段は、少なくとも前記アノテーションの種別と該アノテーションが配置された前記電子文書中の位置とを前記アノテーション情報として取得し、前記読み上げ情報生成手段は、前記アノテーション情報取得手段が取得したアノテーションの種別と位置とを前記読み上げ情報に含めることを特徴とする。 The invention according to claim 2 is the invention according to claim 1, wherein the annotation information acquisition means acquires at least a type of the annotation and a position in the electronic document where the annotation is arranged as the annotation information, The reading information generation means includes the annotation type and position acquired by the annotation information acquisition means in the reading information.
また、請求項3の発明は、請求項2の発明において、前記読み上げ情報生成手段は、前記アノテーション情報取得手段が取得したアノテーションの種別と位置とに基づいて、該アノテーションが前記電子文書の本文に付されたものかページに付されたものを判断し、該判断結果に基づいて前記読み上げ情報を生成することを特徴とする。 According to a third aspect of the present invention, in the second aspect of the present invention, the reading information generating unit is configured to add the annotation to the body of the electronic document based on the type and position of the annotation acquired by the annotation information acquiring unit. It is characterized in that it is determined whether it is attached or attached to a page, and the reading information is generated based on the determination result.
また、請求項4の発明は、請求項2の発明において、辞書情報を記憶する辞書情報記憶手段をさらに具備し、前記読み上げ情報生成手段は、前記辞書情報記憶手段に記憶された辞書情報に基づいて、前記アノテーションが配置された位置を単語単位で補正することを特徴とする。 The invention of claim 4 further comprises dictionary information storage means for storing dictionary information in the invention of claim 2, wherein the reading information generation means is based on the dictionary information stored in the dictionary information storage means. The position where the annotation is arranged is corrected in units of words.
また、請求項5の発明は、請求項2の発明において、前記読み上げ情報生成手段は、前記アノテーションが不透過図形であった場合に、該アノテーションと重複するテキスト情報を前記読み上げ情報から除外することを特徴とする。 According to a fifth aspect of the present invention, in the second aspect of the present invention, when the annotation is an opaque figure, the reading information generating means excludes text information overlapping with the annotation from the reading information. It is characterized by.
また、請求項6の発明は、請求項1の発明において、前記読み上げ情報生成手段が生成した読み上げ情報のそれぞれをシンボルで表示する表示手段と、前記シンボルに対する操作を受け付け、該操作に基づいて前記読み上げ情報を編集する編集手段とをさらに具備することを特徴とする。 According to a sixth aspect of the present invention, in the first aspect of the present invention, in the first aspect, the reading information generated by the reading information generating means is displayed as a symbol, and an operation for the symbol is received. It further comprises editing means for editing the reading information.
また、請求項7の発明は、音声合成技術を利用して文書の読み上げを行う文書読み上げ装置若しくは文書読み上げプログラムに対応する文書読み上げ情報を、電子文書に基づいて生成する情報処理方法であって、情報取得手段が、対象となる電子文書から本文のテキスト情報を取得するとともにアノテーションに関するアノテーション情報を取得し、読み上げ情報生成手段が、前記テキスト情報と前記アノテーション情報とのそれぞれに基づいて、読み上げ情報を生成することを特徴とする。 The invention of claim 7 is an information processing method for generating, based on an electronic document, document reading information corresponding to a document reading device or a document reading program for reading a document using a speech synthesis technology, The information acquisition unit acquires text information of the body text from the target electronic document and acquires annotation information related to the annotation, and the reading information generation unit converts the reading information based on each of the text information and the annotation information. It is characterized by generating.
また、請求項8の発明は、請求項7の発明において、前記アノテーション情報は、少なくとも前記アノテーションの種別と該アノテーションが配置された前記電子文書中の位置とを含み、前記読み上げ情報生成手段は、前記アノテーションの種別と位置とを前記読み上げ情報に含めることを特徴とする。 The invention according to claim 8 is the invention according to claim 7, wherein the annotation information includes at least a type of the annotation and a position in the electronic document where the annotation is arranged, and the reading information generation unit includes: The annotation type and position are included in the reading information.
また、請求項9の発明は、請求項8の発明において、前記読み上げ情報生成手段は、前記アノテーション情報取得手段が取得したアノテーションの種別と位置とに基づいて、該アノテーションが前記電子文書の本文に付されたものかページに付されたものを判断し、該判断結果に基づいて前記読み上げ情報を生成することを特徴とする。 Further, the invention according to claim 9 is the invention according to claim 8, wherein the reading information generating unit is configured to add the annotation to the body of the electronic document based on the annotation type and position acquired by the annotation information acquiring unit. It is characterized in that it is determined whether it is attached or attached to a page, and the reading information is generated based on the determination result.
また、請求項10の発明は、請求項8の発明において、前記読み上げ情報生成手段は、辞書情報記憶手段に記憶された辞書情報に基づいて、前記アノテーションが配置された位置を単語単位で補正することを特徴とする。 According to a tenth aspect of the present invention, in the invention of the eighth aspect, the reading-out information generating means corrects the position where the annotation is arranged on a word basis based on dictionary information stored in the dictionary information storage means. It is characterized by that.
また、請求項11の発明は、請求項8の発明において、前記読み上げ情報生成手段は、前記アノテーションが不透過図形であった場合に、該アノテーションと重複するテキスト情報を前記読み上げ情報から除外することを特徴とする。 Further, in the invention of claim 11, in the invention of claim 8, when the annotation is an opaque figure, the reading information generating means excludes text information overlapping with the annotation from the reading information. It is characterized by.
また、請求項12の発明は、請求項7の発明において、表示手段が、前記読み上げ情報のそれぞれをシンボルで表示し、編集手段が、前記シンボルに対する操作を受け付け、該操作に基づいて前記読み上げ情報を編集することを特徴とする。 According to a twelfth aspect of the present invention, in the seventh aspect of the invention, the display means displays each of the reading information as a symbol, and the editing means receives an operation on the symbol, and the reading information is based on the operation. It is characterized by editing.
また、請求項13の発明は、音声合成技術を利用して文書の読み上げを行う文書読み上げ装置若しくは文書読み上げプログラムに対応する文書読み上げ情報を、電子文書に基づいて生成する情報処理プログラムであって、対象となる電子文書から本文のテキスト情報を取得するテキスト情報取得手段と、前記電子文書からアノテーションに関するアノテーション情報を取得するアノテーション情報取得手段と、前記テキスト情報取得手段が取得したテキスト情報と、前記アノテーション情報取得手段が取得したアノテーション情報とのそれぞれに基づいて、読み上げ情報を生成する読み上げ情報生成手段としてコンピュータを機能させることを特徴とする。
The invention according to
本発明によれば、読み上げ情報にアノテーションに関する情報を含めることができ、当該読み上げ情報に基づく読み上げが行われた際の聞き手は、アノテーションの説明をも受けることができ、文書全体を理解しやすくなる。 According to the present invention, information related to an annotation can be included in the read-out information, and a listener who has read out based on the read-out information can also receive an explanation of the annotation, which makes it easy to understand the entire document. .
以下、本発明に係る情報処理装置および方法並びにプログラムの一実施の形態について、添付図面を参照して詳細に説明する。 Hereinafter, an information processing apparatus and method according to an embodiment of the present invention and a program will be described in detail with reference to the accompanying drawings.
図1は、本発明を適用した情報処理装置の機能的な構成を示すブロック図である。同図に示すように、情報処理装置10は、文書入力部11と、アノテーション情報取得部12、テキスト情報取得部13、設定情報記憶部14、辞書情報記憶部15、読み上げ情報生成部16、読み上げ情報出力部17を具備して構成される。なお、情報処理装置10は、各機能部を実現させるプログラムに基づいてコンピュータを動作させることで構成することが可能である。
FIG. 1 is a block diagram showing a functional configuration of an information processing apparatus to which the present invention is applied. As shown in the figure, the information processing apparatus 10 includes a document input unit 11, an annotation
文書入力部11は、図示しない記憶部に記憶された電子文書を取得して保持する。アノテーション情報取得部12は、文書入力部11が保持する電子文書からアノテーションに関する情報を取得する。テキスト情報取得部13は、文書入力部11が保持する電子文書からテキスト情報を取得する。設定情報記憶部14は、読み上げ情報生成部16が読み上げ情報を生成する際に必要な各種設定を記憶する。辞書情報記憶部15は、日本語や英語等、処理対象となる電子文書を記述した言語に対応する辞書を記憶する。読み上げ情報生成部16は、テキスト情報取得部13が取得したテキスト情報やアノテーション情報取得部12が取得したアノテーション情報等に基づいて、読み上げ情報を生成する。読み上げ情報出力部17は、読み上げ情報生成部16が生成した読み上げ情報を、図示しない読み上げ装置や読み上げプログラム等へ出力する。
The document input unit 11 acquires and holds an electronic document stored in a storage unit (not shown). The annotation
次に、情報処理装置10の動作について説明する。図2は、情報処理装置2の動作の流れを示すフローチャートである。 Next, the operation of the information processing apparatus 10 will be described. FIG. 2 is a flowchart showing an operation flow of the information processing apparatus 2.
情報処理装置10は、読み上げ情報の生成処理を開始すると、まず、読み上げ情報生成部16が、設定情報記憶部15に記憶されている設定情報を確認する(ステップ101)。確認の結果、読み上げ情報の生成に際してインライン処理が指定されていれば(ステップ102でYES)、情報処理装置10は、後述するインライン処理を実行し(ステップ103)、インライン処理が指定されていなければ(ステップ102でNO)、情報処理装置10は、後述するまとめ処理を実行する(ステップ104)。
When the information processing apparatus 10 starts the reading information generation process, the reading
ここで、ステップ103のインライン処理について説明する。インライン処理とは、文書の読み上げを行う際に、アノテーション情報の読み上げを、本文中のアノテーションが出現した位置で行うように構成した読み上げ情報を生成する処理である。図3は、インライン処理の流れを示すフローチャートである。
Here, the inline processing in
インライン処理では、まず、テキスト情報取得部13が、文書入力部11が保持している文書を読み出し(ステップ131)、その過程でアノテーションが検出されたら(ステップ132でYES)、アノテーション情報取得部12が、検出されたアノテーションの情報を取得する(ステップ133)。続いて、読み上げ情報生成部16が、アノテーション情報に基づいて、アノテーション処理を行う(ステップ134)。このアノテーション処理については後述する。
In the inline processing, first, the text
アノテーション処理が終了すると、その処理結果に基づいて、テキスト情報取得部13が、テキスト情報を取得する(ステップ135)。取得するテキスト情報の範囲は、アノテーション処理の結果によって異なるが、例えば、ステップ131で文書の読み出しを開始した位置からアノテーションが付された位置までが範囲となる。
When the annotation process ends, the text
テキスト情報取得部13がテキスト情報を取得すると、読み上げ情報生成部16が、ステップ134で処理されたアノテーション情報とステップ135で取得されたテキスト情報に基づいて、読み上げ情報を生成する(ステップ136)。
When the text
これらの処理は、文書をその終了位置まで読み出す間、繰り返して行われ(ステップ137でNO)、その過程で生成された読み上げ情報は、その生成順に連結される。 These processes are repeated while the document is read to the end position (NO in step 137), and the read-out information generated in the process is connected in the generation order.
そして、文書の終了位置までの読み出しが終了すると(ステップ137でYES)、テキスト情報取得部13が、未取得のテキスト情報を取得し(ステップ138)、このテキスト情報に基づいて、読み上げ情報生成部16が読み上げ情報を生成するとともに生成した読み上げ情報を先に生成した読み上げ情報に連結し(ステップ139)、インライン処理を終了する。
When reading to the end position of the document ends (YES in step 137), the text
続いて、ステップ104のまとめ処理について説明する。まとめ処理とは、文書の読み上げを行う際に、アノテーション情報の読み上げを、本文の前若しくは後にまとめて行うように構成した読み上げ情報を生成する処理である。図4は、まとめ処理の流れを示すフローチャートである。
Next, the summarization process in
まとめ処理では、まず、テキスト情報取得部13が、文書入力部11が保持している文書を読み出し(ステップ141)、その過程でアノテーションが検出されたら(ステップ142でYES)、アノテーション情報取得部12が、検出されたアノテーションの情報を取得する(ステップ143)。そして、読み上げ情報生成部16が、アノテーション情報に基づいて、アノテーション処理を行う(ステップ144)。このアノテーション処理については後述する。これらの処理は、文書をその終了位置まで読み出す間、繰り返して行われる(ステップ145でNO)。
In the summary process, first, the text
そして、文書の終了位置までの読み出しが終了すると(ステップ145でYES)、テキスト情報取得部13が、テキスト情報を取得し(ステップ146)、このテキスト情報とステップ144のアノテーション処理の結果に基づいて、読み上げ情報生成部16が読み上げ情報を生成し(ステップ147)、まとめ処理を終了する。読み上げ情報生成部16が生成する読み上げ情報は、設定情報記憶部14に記憶されている設定情報に基づいて、アノテーション情報を本文に先立って読み上げる場合は、アノテーション情報のリストに続けて本文を読み上げるように構成され、アノテーション情報を本文の後に読み上げる場合は、本文に続けてアノテーション情報のリストを読み上げるように構成される。
When reading to the end position of the document ends (YES in step 145), the text
次に、上述のステップ134またはステップ144におけるアノテーション処理について説明する。アノテーション処理では、設定情報記憶部14に記憶されている設定情報に基づいて、アノテーションの種別毎に対応する処理を行う。図5は、アノテーション処理の流れを示すフローチャートである。
Next, the annotation process in
アノテーション処理では、読み上げ情報生成部16は、まず、アノテーション情報取得部12が取得したアノテーション情報から該当するアノテーションの種別を確認する(ステップ151)。
In the annotation process, the read-out
確認の結果、該当するアノテーションが付箋であった場合には(ステップ152でYES)、読み上げ情報生成部16は、設定情報記憶部14に記憶されている設定情報に基づいて、付箋に対する処理を実行する(ステップ153)。
As a result of the confirmation, if the corresponding annotation is a tag (YES in step 152), the reading-out
付箋に対する処理では、読み上げ情報生成部16は、該当する付箋を読み上げの対象とするか否かを判断する。この判断は、付箋の貼付位置に基づいて行い、例えば、図6(a)に示すように、付箋21がページ20からはみ出すことなく貼付されていた場合と、図6(b)に示すように、付箋21がページ21からはみ出すように貼付されていた場合のそれぞれについて、設定情報記憶部14に記憶されている設定情報に基づいて、読み上げの対象とするか否かを判断する。
In the processing for the tag, the reading
また、付箋に対する処理では、付箋の貼付位置の特定を行う。貼付位置の特定は、通常は、ページ上の貼付位置を取得することで行うが、図6(c)に示すように、付箋21がページ20のヘッダの近傍に貼付されていた場合には、ページ20に対して付箋21が貼付されていると判断する。もちろん、付箋21がページ20のヘッダ近傍に貼付されていたとしても、その位置を貼付位置として特定することもできるが、いずれを貼付位置として特定するかは、設定情報記憶部14に記憶されている設定情報に基づいて判断される。同様に、図6(d)に示すように付箋21がページ20に貼付されている場合には、その近傍の段落に対して付箋21が貼付されていると判断する。この場合も、実際に付箋21が貼付されている位置を貼付位置として特定してもよく、その判断は、設定情報記憶部14に記憶されている設定情報に基づくものとなる。
In addition, in the processing for the sticky note, the sticking position of the sticky note is specified. Normally, the pasting position is specified by acquiring the pasting position on the page. However, as shown in FIG. 6C, when the
また、読み上げ情報生成部16は、付箋21が、図6(e)に示すように貼付されていた場合、辞書情報記憶部15に記憶されている辞書情報を利用して、「許請求の範囲」に付箋21が貼付されているのではなく、「特許請求の範囲」に付箋21が貼付されていると判断する。辞書情報記憶部15に記憶されている辞書情報を利用するか否かは、設定情報記憶部14に記憶されている設定情報に基づいて判断される。
Further, the read-out
このような処理により、例えば、文書の本文を男声で読み上げ、アノテーション情報を女声で読み上げる読み上げ情報を生成するとすれば、「(男声)・・・特許請求の範囲(女声)ここに、黄色の付箋が貼付され、当該付箋に「重要」と記述されています。(男声)・・・」のような読み上げ情報を、読み上げ情報生成部16が生成する。
With this process, for example, if the text of a document is read out in a male voice and the reading information is read out in an annotation information in a female voice, “(male voice) ... claim (female voice) here, yellow sticky note Is affixed and “Important” is written on the tag. The reading
なお、前述のステップ135においてテキスト情報取得部13がテキスト情報を取得する際には、読み上げ情報生成部16が特定した付箋の貼付位置に基づいて、その貼付位置の直前までを取得することとなる。
When the text
一方、アノテーションの種別を確認した結果、該当するアノテーションがリンクであった場合には(ステップ154でYES)、読み上げ情報生成部16は、設定情報記憶部14に記憶されている設定情報に基づいて、リンクに対する処理を実行する(ステップ155)。
On the other hand, as a result of checking the annotation type, if the corresponding annotation is a link (YES in step 154), the reading
リンクに対する処理では、リンクが設定された位置の特定を行う。位置の特定は、原則としてページ上の位置であるが、前述の付箋と同様に、辞書情報記憶部15に記憶されている辞書情報を利用してリンクの設定位置を単語単位で修正することができる。辞書情報を利用するか否かは、設定情報記憶部14に記憶されている設定情報に基づいて判断される。リンクに基づく読み上げ情報は、リンク先を説明する内容で、例えば、「ここは、同じ文書の8ページにリンクされています。」のような内容となる。
In the processing for the link, the position where the link is set is specified. In principle, the position is determined on the page, but the link setting position can be corrected in units of words by using the dictionary information stored in the dictionary
また、アノテーションの種別を確認した結果、該当するアノテーションが図形であった場合には(ステップ156でYES)、読み上げ情報生成部16は、設定情報記憶部14に記憶されている設定情報に基づいて、図形に対する処理を実行する(ステップ157)。
Further, as a result of checking the annotation type, if the corresponding annotation is a graphic (YES in step 156), the reading
種別が図形のアノテーションとは、線若しくは面で表される図形であり、図形に対する処理では、リンク情報と同様に位置の特定を行い、図形の種別を読み上げ情報とする。ただし、図形が文字と重なるように配置されている場合には、図形に特有の処理を行う。例えば、図7(a)に示すように、透過図形22が文字と重なるように配置されている場合には、読み上げ情報は、「(男声)そこで、本発明は、電子(女声)ここに、赤色の透過図形が重ねられています(男声)文書に付されたアノテーションに・・・」のようになるが、図7(b)に示すように、不透過図形23が文字と重なるように配置されている場合には、読み上げ情報は、「(男声)そこで、本発明は、(女声)赤色の不透過図形により文字が隠されています(男声)文書に付されたアノテーションに・・・」のように、不透過図形により文字が隠されているものとして処理を行う。 An annotation with a type of figure is a figure represented by a line or a face. In the process for the figure, the position is specified in the same manner as the link information, and the type of the figure is used as read-out information. However, when the graphic is arranged so as to overlap the character, processing specific to the graphic is performed. For example, as shown in FIG. 7A, when the transparent figure 22 is arranged so as to overlap the character, the read-out information is “(male voice). Therefore, the present invention is electronic (female voice). The red transparent figure is superimposed (male voice), but the annotation attached to the document is like "...", but as shown in Fig. 7 (b), the opaque figure 23 is placed so as to overlap the character. If it is, the read-out information is “(male voice), where the present invention is (female voice) the text is hidden by a red opaque figure (male voice) in the annotation attached to the document. Thus, the processing is performed assuming that the characters are hidden by the opaque figure.
また、アノテーションの種別を確認した結果、該当するアノテーションがイメージであった場合には(ステップ158でYES)、読み上げ情報生成部16は、設定情報記憶部14に記憶されている設定情報に基づいて、イメージに対する処理を実行する(ステップ159)。
Further, as a result of checking the annotation type, if the corresponding annotation is an image (YES in step 158), the reading
種別がイメージのアノテーションは、日付印や「禁複写」等のスタンプを表すもので、通常は、文書若しくはページに付されるものである。したがって、イメージに対する処理では、貼付位置の特定は、ページを単位とし、「(女声)このページには、日付印が押されています」等の読み上げ情報を生成する。 An annotation of type image represents a stamp such as a date stamp or “no copy”, and is usually attached to a document or page. Therefore, in the processing for the image, the pasting position is specified in units of pages, and read-out information such as “(female voice) is date stamped on this page” is generated.
なお、アノテーションの種別は、他の種別、例えば、文字列等があり、その場合にも、読み上げ情報生成部16は、設定情報記憶部14に記憶されている設定情報に基づいて処理を行う。
Note that there are other types of annotation, for example, character strings, and the read-out
図8は、実施例2における情報処理装置の機能的な構成を示すブロック図である。同図に示すように、情報処理装置30は、文書入力部31と、アノテーション情報取得部32、テキスト情報取得部33、設定情報記憶部34、辞書情報記憶部35、読み上げ情報生成部36、読み上げ情報編集部37、読み上げ情報出力部38を具備して構成される。なお、情報処理装置10は、各機能部を実現させるプログラムに基づいてコンピュータを動作させることで構成することが可能である。
FIG. 8 is a block diagram illustrating a functional configuration of the information processing apparatus according to the second embodiment. As shown in the figure, the
文書入力部31は、図示しない記憶部に記憶された電子文書を取得して保持する。アノテーション情報取得部32は、文書入力部31が保持する電子文書からアノテーションに関する情報を取得する。テキスト情報取得部33は、文書入力部31が保持する電子文書からテキスト情報を取得する。設定情報記憶部34は、読み上げ情報生成部36が読み上げ情報を生成する際に必要な各種設定を記憶する。辞書情報記憶部35は、日本語や英語等、処理対象となる電子文書を記述した言語に対応する辞書を記憶する。読み上げ情報生成部36は、テキスト情報取得部33が取得したテキスト情報やアノテーション情報取得部32が取得したアノテーション情報等に基づいて、読み上げ情報を生成する。読み上げ情報編集部37は、読み上げ情報生成部16が生成した読み上げ情報に対する編集を行う。読み上げ情報出力部38は、読み上げ情報編集部17による編集された読み上げ情報を、図示しない読み上げ装置や読み上げプログラム等へ出力する。
The
この情報処理装置30では、文書入力部31、アノテーション情報取得部32、テキスト情報取得部33、設定情報記憶部34、辞書情報記憶部35、読み上げ情報生成部36は、それぞれ、実施例1における文書入力部11、アノテーション情報取得部12、テキスト情報取得部13、設定情報記憶部14、辞書情報記憶部15、読み上げ情報生成部16と同様の動作を行い、実施例1で説明したインライン処理による読み上げ情報を生成する。ただし、読み上げ情報生成部16は、読み上げ生成した読み上げ情報の連結は行わずに、読み上げ情報編集部37へ出力する。
In the
読み上げ情報編集部37は、インライン処理により生成された各読み上げ情報を、アイコン等のシンボルで表したGUI(Graphical User Interface)を、図示しない表示装置に提供し、ユーザに読み上げ情報の編集を行わせる。
The reading
図9は、読み上げ情報編集部37が提供するGUIの表示例を示した図である。同図に示すように、GUI40には、文書の本文(テキスト情報)に基づく読み上げ情報を示すシンボル41、43、45、リンク(アノテーション情報)に基づく読み上げ情報を示すシンボル42、付箋(アノテーション情報)に基づく読み上げ情報を示すシンボル44、イメージ(アノテーション情報)に基づく読み上げ情報を示すシンボル46が表示されている。
FIG. 9 is a diagram illustrating a display example of a GUI provided by the reading
これらの各シンボル(41〜46)は、例えば、マウス等のポインティングデバイスを利用したドラッグ操作を行うことで、任意に並び替えが可能であり、その並び替えに伴って読み上げ情報の並び順が変更される。 These symbols (41 to 46) can be rearranged arbitrarily by performing a drag operation using a pointing device such as a mouse, for example, and the arrangement order of the read-out information is changed along with the rearrangement. Is done.
また、各シンボル(41〜46)は、例えば、ポインティングデバイスを利用したダブルクリック操作を行うことで、対応する読み上げ情報の内容を確認することができ、内容の変更や読み上げ情報を任意の位置で分割することもできる。これにより、アノテーション情報に基づく読み上げ情報をテキスト情報に基づく読み上げ情報の任意の位置に挿入することも可能となる。 In addition, each symbol (41 to 46) can confirm the content of the corresponding read-out information by performing a double-click operation using a pointing device, for example, and can change the content or read the read-out information at an arbitrary position. It can also be divided. Thereby, it is possible to insert the reading information based on the annotation information at an arbitrary position of the reading information based on the text information.
さらに、各シンボル(41〜46)は、例えば、ポインティングデバイスを利用したクリック操作を行うことで、その属性の確認および変更を行うことが可能であり、対応する読み上げ情報を有効(読み上げる)とするか無効(読み上げない)とするか等の属性を変更することもできる。 Furthermore, each symbol (41 to 46) can be confirmed and changed in attribute by performing a click operation using a pointing device, for example, and the corresponding reading information is valid (reading out). It is also possible to change an attribute such as whether it is invalid or not (not read out).
10 情報処理装置
11 文書入力部
12 アノテーション情報取得部
13 テキスト情報取得部
14 設定情報記憶部
15 辞書情報記憶部
16 読み上げ情報生成部
17 読み上げ情報出力部
20 ページ
21 付箋
22 透過図形
23 不透過図形
30 情報処理装置
31 文書入力部
32 アノテーション情報取得部
33 テキスト情報取得部
34 設定情報記憶部
35 辞書情報記憶部
36 読み上げ情報生成部
37 読み上げ情報編集部
38 読み上げ情報出力部
40 GUI
41 シンボル
42 シンボル
43 シンボル
44 シンボル
45 シンボル
46 シンボル
DESCRIPTION OF SYMBOLS 10 Information processing apparatus 11
41
Claims (13)
対象となる電子文書から本文のテキスト情報を取得するテキスト情報取得手段と、
前記電子文書からアノテーションに関するアノテーション情報を取得するアノテーション情報取得手段と、
前記テキスト情報取得手段が取得したテキスト情報と、前記アノテーション情報取得手段が取得したアノテーション情報とのそれぞれに基づいて、読み上げ情報を生成する読み上げ情報生成手段と
を具備することを特徴とする情報処理装置。 In an information processing apparatus for generating document reading-out information corresponding to a document reading-out apparatus or a document reading-out program that reads out a document using a speech synthesis technology based on an electronic document,
Text information acquisition means for acquiring text information of the body text from the target electronic document;
Annotation information acquisition means for acquiring annotation information related to annotation from the electronic document;
An information processing apparatus comprising: read-out information generating means for generating read-out information based on each of text information acquired by the text information acquisition means and annotation information acquired by the annotation information acquisition means .
前記読み上げ情報生成手段は、前記アノテーション情報取得手段が取得したアノテーションの種別と位置とを前記読み上げ情報に含める
ことを特徴とする請求項1記載の情報処理装置。 The annotation information acquisition means acquires at least a type of the annotation and a position in the electronic document where the annotation is arranged as the annotation information,
The information processing apparatus according to claim 1, wherein the reading information generation unit includes the annotation type and position acquired by the annotation information acquisition unit in the reading information.
前記読み上げ情報生成手段は、前記辞書情報記憶手段に記憶された辞書情報に基づいて、前記アノテーションが配置された位置を単語単位で補正する
ことを特徴とする請求項2記載の情報処理装置。 It further comprises dictionary information storage means for storing dictionary information,
The information processing apparatus according to claim 2, wherein the reading information generation unit corrects a position where the annotation is arranged in units of words based on dictionary information stored in the dictionary information storage unit.
前記シンボルに対する操作を受け付け、該操作に基づいて前記読み上げ情報を編集する編集手段と
をさらに具備することを特徴とする請求項1記載の情報処理装置。 Display means for displaying each of the reading information generated by the reading information generating means as a symbol;
The information processing apparatus according to claim 1, further comprising: an editing unit that receives an operation on the symbol and edits the reading information based on the operation.
情報取得手段が、対象となる電子文書から本文のテキスト情報を取得するとともにアノテーションに関するアノテーション情報を取得し、
読み上げ情報生成手段が、前記テキスト情報と前記アノテーション情報とのそれぞれに基づいて、読み上げ情報を生成する
ことを特徴とする情報処理方法。 An information processing method for generating, based on an electronic document, document reading information corresponding to a document reading device or a document reading program that reads a document using a speech synthesis technology,
The information acquisition means acquires text information of the body text from the target electronic document and acquires annotation information related to the annotation,
An information processing method, wherein the reading information generation unit generates reading information based on each of the text information and the annotation information.
前記読み上げ情報生成手段は、前記アノテーションの種別と位置とを前記読み上げ情報に含める
ことを特徴とする請求項7記載の情報処理方法。 The annotation information includes at least a type of the annotation and a position in the electronic document where the annotation is arranged,
The information processing method according to claim 7, wherein the reading information generation unit includes the type and position of the annotation in the reading information.
編集手段が、前記シンボルに対する操作を受け付け、該操作に基づいて前記読み上げ情報を編集する
ことを特徴とする請求項7記載の情報処理方法。 A display means displays each of the reading information as a symbol,
The information processing method according to claim 7, wherein an editing unit receives an operation on the symbol and edits the reading information based on the operation.
対象となる電子文書から本文のテキスト情報を取得するテキスト情報取得手段と、
前記電子文書からアノテーションに関するアノテーション情報を取得するアノテーション情報取得手段と、
前記テキスト情報取得手段が取得したテキスト情報と、前記アノテーション情報取得手段が取得したアノテーション情報とのそれぞれに基づいて、読み上げ情報を生成する読み上げ情報生成手段
としてコンピュータを機能させることを特徴とする情報処理プログラム。 An information processing program for generating document read-out information corresponding to a document read-out device or a document read-out program that reads out a document using speech synthesis technology based on an electronic document,
Text information acquisition means for acquiring text information of the body text from the target electronic document;
Annotation information acquisition means for acquiring annotation information related to annotation from the electronic document;
Information processing characterized by causing a computer to function as reading information generation means for generating reading information based on each of text information acquired by the text information acquisition means and annotation information acquired by the annotation information acquisition means program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005056102A JP4734964B2 (en) | 2005-03-01 | 2005-03-01 | Information processing apparatus and method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005056102A JP4734964B2 (en) | 2005-03-01 | 2005-03-01 | Information processing apparatus and method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006243156A true JP2006243156A (en) | 2006-09-14 |
JP4734964B2 JP4734964B2 (en) | 2011-07-27 |
Family
ID=37049652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005056102A Expired - Fee Related JP4734964B2 (en) | 2005-03-01 | 2005-03-01 | Information processing apparatus and method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4734964B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05313684A (en) * | 1992-05-13 | 1993-11-26 | Sharp Corp | Voice reading device |
JPH08248971A (en) * | 1995-03-09 | 1996-09-27 | Hitachi Ltd | Text reading aloud and reading device |
JP2002091277A (en) * | 2000-09-19 | 2002-03-27 | Nobuo Kamosaki | Memory confirming and learning device, memory confirming and learning method and recording medium |
JP2004013416A (en) * | 2002-06-05 | 2004-01-15 | Fuji Xerox Co Ltd | Apparatus and method for document processing |
-
2005
- 2005-03-01 JP JP2005056102A patent/JP4734964B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05313684A (en) * | 1992-05-13 | 1993-11-26 | Sharp Corp | Voice reading device |
JPH08248971A (en) * | 1995-03-09 | 1996-09-27 | Hitachi Ltd | Text reading aloud and reading device |
JP2002091277A (en) * | 2000-09-19 | 2002-03-27 | Nobuo Kamosaki | Memory confirming and learning device, memory confirming and learning method and recording medium |
JP2004013416A (en) * | 2002-06-05 | 2004-01-15 | Fuji Xerox Co Ltd | Apparatus and method for document processing |
Also Published As
Publication number | Publication date |
---|---|
JP4734964B2 (en) | 2011-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4869630B2 (en) | Method and system for mapping content between a start template and a target template | |
US20190196675A1 (en) | Platform for educational and interactive ereaders and ebooks | |
US7143026B2 (en) | Generating rules to convert HTML tables to prose | |
JP2003114882A (en) | System and method for formatting contents for publication | |
Schmidt | The role of markup in the digital humanities | |
JP2007141123A (en) | Link of same character strings in different files | |
US20080172637A1 (en) | Method and system for using image globalization in dynamic text generation and manipulation | |
JP2007287134A (en) | Information extracting device and information extracting method | |
JP2007034813A (en) | Software manual generation system in two or more natural languages | |
JP2009140466A (en) | Method and system for providing conversation dictionary services based on user created dialog data | |
US20120054605A1 (en) | Electronic document conversion system | |
JP2009237885A (en) | Document editing device, method, and program | |
Blenkhorn et al. | Automated braille production from word-processed documents | |
da Rocha Costa et al. | Signwriting-based sign language processing | |
WO2006051974A1 (en) | Document processing device and document processing method | |
JP4734964B2 (en) | Information processing apparatus and method, and program | |
WO2006001393A1 (en) | Document processing method and device | |
JP4012047B2 (en) | Electronic document creation apparatus, electronic document creation method, and program causing computer to execute the method | |
Janssen | A corpus with wavesurfer and TEI: Speech and video in TEITOK | |
US7676746B1 (en) | System and method for in-context authoring of alternate content for non-textual objects | |
JP2000076226A (en) | Document data editing system | |
JP2004289357A (en) | Method and apparatus for adding additional information, and additional information adding program | |
JP2007249420A (en) | Automatic web page document detection device | |
Dumont | TEI Critical Apparatus Toolbox: Web-based tools for ongoing XML-TEI editions | |
Lepper et al. | Technical Topologies of Texts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110304 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110411 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |