JP2016012315A - テキストデータの分かち書き単位分割プログラム及び電子図書再生装置 - Google Patents

テキストデータの分かち書き単位分割プログラム及び電子図書再生装置 Download PDF

Info

Publication number
JP2016012315A
JP2016012315A JP2014134912A JP2014134912A JP2016012315A JP 2016012315 A JP2016012315 A JP 2016012315A JP 2014134912 A JP2014134912 A JP 2014134912A JP 2014134912 A JP2014134912 A JP 2014134912A JP 2016012315 A JP2016012315 A JP 2016012315A
Authority
JP
Japan
Prior art keywords
speech
unit
text data
separated
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014134912A
Other languages
English (en)
Inventor
龍 飛田
Tatsu Hida
龍 飛田
佑介 田代
Yusuke Tashiro
佑介 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shinano Kenshi Co Ltd
Original Assignee
Shinano Kenshi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shinano Kenshi Co Ltd filed Critical Shinano Kenshi Co Ltd
Priority to JP2014134912A priority Critical patent/JP2016012315A/ja
Publication of JP2016012315A publication Critical patent/JP2016012315A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】日本語のテキストデータを句読点で区切られた一文よりも短く且つ意味のある範囲で区切るプログラムを提供する。
【解決手段】日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とを実現する。
【選択図】図1

Description

本発明は、日本語のテキストデータを分かち書き単位に分割するプログラム及び電子図書を音声再生する電子図書音声再生装置に関する。
電子データとしてあらかじめ記憶されている電子図書を音声として再生する装置が従来から知られている(例えば、特許文献1参照)。この特許文献1に開示されている装置は、DAISY(Digital Accessible Information SYstem)規格によるデジタル録音図書を再生する装置であり、特に視覚に障害がある人たちが読書を楽しむことが出来るように、本に記載されている文章情報を音声として読み上げることができる装置である。
一方、音声再生できる装置に表示部を設け、表示部にはテキストを表示させる装置も従来から知られている(例えば、特許文献2参照)。この特許文献2に開示されている装置は、特に英会話の練習用に用いられる装置であって、表示部には英文のテキストデータが表示され、スピーカからは表示部に表示されている英文の音声データが再生される。
そして、特許文献2に開示されている装置では、再生する音声データと表示部に表示させているテキストデータとを同期させ、現在再生中の音声データに該当するテキスト位置を対応付けできるとしている。
特開2000−057752号公報 特開2004−170444号公報
上述した特許文献2のように、再生中の音声データと表示中のテキストデータを同期させ、表示中のテキスト部分をハイライト表示させるものについては、テキストデータが英文の場合には単語と単語の間にスペースが存在するため、現在再生中の単語位置の表示はさせやすい。
一方、テキストデータが日本語の場合、日本語は句読点以外の部分では区切りがないため、音声再生中のテキストデータをハイライト表示させると、句読点間の長い一文でしかハイライト表示がされない。このため、音声再生中のテキストデータをハイライト表示させるときに、句読点間の長い一文ではなく、さらに短く且つ意味のある範囲でハイライト表示をさせたいという要望があった。
しかし、日本語のテキストデータをどのようにして短く且つ意味のある範囲に区切るかについての手法が確立されておらず、その手法が求められているという課題があった。
そこで、本発明は上記課題を解決すべくなされ、その目的とするところは、日本語のテキストデータを句読点で区切られた一文よりも短く且つ意味のある範囲で区切ることができるプログラム及び電子図書再生装置を提供することにある。
本発明にかかるテキストデータの分かち書き単位分割プログラムによれば、コンピュータに読み込み可能なプログラムであって、日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とをコンピュータに実現させることを特徴としている。
このプログラムによれば、日本語のテキストデータを、自動的に、意味のある最小の範囲である分かち書き単位ごとに分割することができる。なおここでいうコンピュータとは、いわゆるパソコンに限定するものではなく、プログラムに基づいて動作する装置であれば、テキストデータを表示する装置や、テキストデータを音声再生する装置などプログラムによって動作する装置も含まれる。
また、前記あらかじめ設定された条件には、品詞の前又は後を区切るかどうかを判断する際に、当該品詞の前の品詞の種類に基づいて当該品詞の前を区切るか否かを判断し、当該品詞の後の品詞の種類に基づいて当該品詞の後を区切るか否かを判断する条件が含まれることを特徴としてもよい。
本発明にかかる電子図書再生装置によれば、図書の文章情報の音声データを記憶する音声データ記憶部と、該音声データ記憶部内の音声データを再生して出力可能とする音声データ出力制御部と、図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、前記表示部に表示されたテキストデータと、音声データ出力制御部から出力される音声データを同期させ、出力中の音声データに該当する箇所をハイライト表示させるハイライト表示手段と、前記表示部に表示されたテキストデータの形態要素を解析して分かち書き単位を作成する分かち書き単位作成手段と、該分かち書き単位作成手段によって作成された分かち書き単位ごとの発音時間を算出する発音時間算出手段とを具備し、前記分かち書き単位作成手段は、日本語のテキストデータの形態要素を解析して、品詞ごとに分割する分割手段と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有し、前記ハイライト表示手段は、前記音声データ出力制御部からの音声出力開始と同時に、前記表示部に表示されている最初の分かち書き単位をハイライト表示し、現在ハイライト表示中の各分かち書き単位の発音時間が経過すると、発音時間が経過した箇所の分かち書き単位のハイライト表示を通常の表示に戻し、次の分かち書き単位をハイライト表示することを特徴としている。
この構成によれば、電子図書の音声データとテキストデータとを読み出す装置において、表示部で表示中の日本語のテキストについて、現在音声出力中の分かち書きされた箇所をハイライト表示させることができる。
また、本発明にかかる電子図書再生装置によれば、図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、前記テキストデータ記憶部内のテキストデータを音声出力可能とするTTS制御部と、該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、前記表示部に表示されたテキストデータと、TTS制御部から出力される音声データとを同期させ、出力中の音声データに該当する箇所をハイライト表示させるハイライト表示手段と、前記表示部に表示されたテキストデータの形態要素を解析して分かち書き単位を作成する分かち書き単位作成手段と、該分かち書き単位作成手段によって作成された分かち書き単位ごとの発音時間を算出する発音時間算出手段とを具備し、前記分かち書き単位作成手段は、日本語のテキストデータの形態要素を解析して、品詞ごとに分割する分割手段と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有し、前記ハイライト表示手段は、前記TTS制御部からの音声出力開始と同時に、前記表示部に表示されている最初の分かち書き単位をハイライト表示し、現在ハイライト表示中の各分かち書き単位の発音時間が経過すると、発音時間が経過した箇所の分かち書き単位のハイライト表示を通常の表示に戻し、次の分かち書き単位をハイライト表示することを特徴としている。
この構成を採用することによって、テキストデータから音声出力とテキストの表示とを行う装置において、表示部で表示中の日本語のテキストについて、現在音声出力中の分かち書きされた語をハイライト表示させることができる。なお、本発明におけるTTS制御部とは、テキストデータを読み出し可能な公知のTTS(text to speech)システムを実行する制御部を指す。
本発明によれば、日本語のテキストデータを、自動的に、句読点で区切られた一文よりも短く且つ意味のある範囲で区切ることができる。
テキストデータの分かち書き単位分割プログラムのフローチャートである。 第1の実施形態の電子図書再生装置の構成を示すブロック図である。 分かち書きを行ってハイライト表示を行う動作の実施例を説明する説明図である。 第2の実施形態の電子図書再生装置の構成を示すブロック図である。
(分かち書き単位分割プログラム)
本発明にかかるテキストデータの分かち書き単位分割プログラムについて、図1に基づいて説明する。
テキストデータの分かち書き単位分割プログラムは、コンピュータに読み取られることにより、日本語のテキストデータを分かち書き単位に分割する機能をコンピュータに実現させる。なお、ここでいうコンピュータとは、いわゆるパソコンに限定するものではなく、プログラムに基づいて動作する装置であれば、テキストデータを表示する装置や、テキストデータを音声再生する装置などプログラムによって動作する装置も含まれる。また、具体的には、以下に説明する電子図書再生装置がテキストデータの分かち書き単位分割プログラムによって動作することを想定している。
テキストデータの分かち書き単位分割プログラムは、日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、分割された品詞を結合する機能とを実現することができる。
テキストデータを品詞ごとに分割する機能は、公知の形態要素解析ソフトを採用することができる。
また、分割された品詞を結合する機能は、分割された各品詞に対してあらかじめ設定された条件に基づいて行われる。
結合する機能は、あらかじめ設定した条件に基づき、品詞の前を区切り後も区切るか、品詞の前を区切り後は区切らないか、品詞の前を区切らず後を区切るか、又は品詞の前も後も区切らないかが判断され、複数の品詞を結合して分かち書き単位とするか、又は品詞単独で分かち書き単位とする。
次に、分割された品詞をどのようにして分かち書き単位とするか、その条件について説明する。
まず、本実施形態では、まず品詞の種類を連体詞、接頭詞、名詞、動詞、形容詞、副詞、接続詞、助詞、助動詞、感動詞、記号、フィラー、その他、未知語に分けている。
連体詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
接頭詞と認識された品詞に対しては、品詞の前を区切り、後は区切らない。ただし、後を区切らない方が優先である。
名詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。ただし、名詞の種類によっては、前も後も区切らない場合もある。さらに、当該品詞の前の品詞の種類によっても、前も後も区切らない場合もある。
動詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。ただし、動詞の種類によっては、品詞の前も後も区切らない場合もある。
形容詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。ただし、形容詞の種類によっては、品詞の前も後も区切らない場合もある。
副詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
接続詞は、品詞の前も後も区切る。
助詞と認識された助詞に対しては、品詞の後を区切る。品詞の前を区切るかどうかはその前の品詞の条件に基づく。ただし、当該品詞の後の品詞の種類によっては、前も後も区切らない場合もある。
助動詞は、品詞の前も後も区切らない。
感動詞は、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
記号と認識された記号に対しては、品詞の前を区切らず、後を区切る。ただし、当該品詞の後が同じ品詞の場合には前も後も区切らない。
フィラーは、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
その他は、間投詞などがあり、品詞の前も後も区切らない。
また、上述してきた品詞に該当しないものである未知語については、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
なお、上述してきたテキストデータの分かち書き単位分割プログラムは、後述する電子図書再生装置においてテキストデータを表示する際に、分かち書き単位でハイライト表示する場合に適用することが好ましいが、適用例としては電子図書再生装置に限定するものではない。
例えば、テキストデータの分かち書き単位分割プログラムを、テキストデータを表示させる表示装置において適用して、分かち書き単位ごとに分割表示させるようにしてもよい。
また、テキストデータの分かち書き単位分割プログラムを、テキストデータに基づいて音声再生する装置に適用して、分かち書き単位ごとに音声に無音部分を入れる、又はビープ音などを入れるなどの制御に用いることもできる。
本発明に係る電子図書再生装置全体の概略構成を図2に示す。
電子図書再生装置30は、スピーカ32及び表示部34を備えており、あらかじめ記憶された図書をスピーカ32から音声出力するとともに、図書の内容をテキストとして表示部34に表示させる装置である。また、図書の内容としてのテキストは日本語であるとする。
電子図書再生装置30は、図書の文章情報を音声データとして記憶している音声データ記憶部35を備えている。音声データ記憶部35としては、半導体メモリ、ハードディスクドライブなどを挙げることができる。ただし、音声データ記憶部35としては、電子図書を音声データとして記憶していればよく、リムーバブルディスクであるCD又はDVDであってもよいし、USBメモリなどであってもよい。
音声データ出力制御部36は、ユーザが操作可能な操作スイッチ38に接続されている。音声データ出力制御部36は、操作スイッチ38からの操作信号に基づいて、音声データ記憶部35から所望の音声データを抽出してスピーカ32で再生できるように制御する。
また、電子図書再生装置30は、記憶されている音声データのテキストデータを記憶するテキストデータ記憶部40を有している。テキストデータ記憶部40としては、半導体メモリ、ハードディスクドライブなどを挙げることができる。また、テキストデータ記憶部40としては、電子図書をテキストデータとして記憶していればよく、リムーバブルディスクであるCD又はDVDであってもよいし、USBメモリなどであってもよい。
なお、音声データ記憶部35とテキストデータ記憶部40とを同一の記憶部としてもよい。例えば、同一のリムーバブルディスクや同一のUSBメモリ内に音声データとテキストデータの両方が記憶されている場合などがある。
表示部34に表示されるテキストデータは、ハイライト表示手段42によって現在再生出力中の語がハイライト表示手段42によってハイライト表示される。
ハイライト表示とは、音声出力中の語の背景色を他の部分の背景色とは異なる色として表示させることである。例えば、背景色が白色で、文字が黒色の場合に、音声出力中の語の背景色を黄色にすることにより、音声出力中の語を目立たせることができる。
また、本実施形態では、テキストデータのハイライト表示させるために、分かち書き単位作成手段41によって日本語のテキストデータを分かち書きし、分かち書きした単位でハイライト表示させている。このようにすることで、現在再生出力中の箇所がわかりやすく表示される。
テキストデータ記憶部40に記憶されているテキストデータを分かち書きする分かち書き単位作成手段41について以下に説明する。
分かち書き単位作成手段41は、テキストデータを品詞ごとに分割する分割手段44と、分割した品詞を結合して分かち書き単位を作成する結合手段46とを有している。分かち書き単位作成手段41としては、テキストデータを品詞ごとに分割する機能を有するプログラムと、所定のアルゴリズムに基づいて品詞を結合させる機能を有するプログラムとが、CPUなどの処理装置に読み込まれることによって実現可能となる。
分割手段44の動作を説明する。分割手段44は、品詞記憶部45にあらかじめ記憶させておいた品詞に基づいて、テキストデータを品詞ごとに分割する。品詞記憶部45は、半導体メモリ、ハードディスクドライブなどを挙げることができる。
分割手段44によって分割された複数の品詞は、所定のアルゴリズムに基づいて動作する結合手段46によって結合される。結合手段46の動作アルゴリズムについては、上述した分かち書き単位分割プログラムと同様であり、ここでは説明を省略する。
発音時間算出手段48は、上述した結合手段46の動作によって生成された分かち書き単位ごとの発音時間を算出する。分かち書き単位ごとの発音時間の算出に当たり、前もって音声データの再生時間をテキストデータの文字数で除算して一文字あたりの再生時間を算出し、あらかじめ一文字あたりの発音時間はあらかじめ発音時間記憶部49に記憶させておく。
そして、発音時間算出手段48は、一文字あたりの発音時間に分かち書き単位の文字数を乗算することで分かち書き単位ごとの発音時間を算出する。また、電子図書の内容によって一文字あたりの発音時間が異なる場合もあるので、電子図書ごとに異なる発音時間を発音時間記憶部49に記憶させておくとよい。
発音時間算出手段48によって算出された各分かち書き単位の発音時間は、ハイライト表示手段42に入力される。
ハイライト表示手段42は、表示部34に表示されているテキストデータのうち、分かち書き単位ごとに、算出された発音時間の長さだけハイライト表示するように表示部34を制御する。
なお、音声データ出力制御部36は、音声データの再生開始信号をハイライト表示手段42に出力する。ハイライト表示手段42は、音声データの再生開始信号を受け、音声データの再生開始と同時に、再生する音声データに対応するテキストデータの最初の分かち書き単位をハイライト表示する。
そして、ハイライト表示手段42は、分かち書き単位ごとに算出された発音時間が経過すると、今までハイライト表示させていた分かち書き単位のハイライト表示を停止し、次の分かち書き単位をハイライト表示する。
ハイライト表示手段42のハイライト表示の切り替えは、あくまで発音時間算出手段48によって算出された発音時間にのみ基づいて行われる。したがって、音声データの再生とテキストデータのハイライト表示のタイミングにズレが生じる場合もある。
そこで、音声データに無音時間が存在していた場合には、この無音時間の終了時から次の音声出力開始タイミングとハイライト表示開始タイミングを合わせることで同期をとることによって、ズレをなくしてタイミングを合わせることができる。なお、一般的には、無音時間が生じるのは、分の区切りである句読点である可能性が高いが、必ずしも句読点において無音時間が存在しない場合もある。
ハイライト表示手段42は、音声データ出力制御部36から入力される音声データの無音部分を検出したとき、次に音声データの再生が開始されるまで発音時間のカウントを行わない。
そして、句読点の後に音声データの再生が開始されたときに合わせて、句読点の後の最初の分かち書き単位をハイライト表示させるとともに、発音時間算出手段48によって算出された発音時間のカウントを開始する。
なお、上述したハイライト表示手段42、分割手段44、結合手段46、発音時間算出手段48は、CPUなどの処理装置によって読み出されて上述した機能を発揮するプログラムとして実現できる。
次に、図6に基づいて、分かち書きを行ってハイライト表示を行う動作の具体的な実施例について説明する。図6には、ハイライト表示の際に、分かち書きを行い、発音時間を算出する場合の処理例を示している。
ここでは電子図書の内容が「全国的に冷たい空気に包まれています。」である場合の例を説明する。
なお、電子図書の規格としては、デジタル録音図書であるDAISY規格などが代表的である。
DAISY規格の電子図書データは、コンテンツを表現可能なsmilファイルと、見出し情報が記述されたnccファイル又はncxファイルと、表示部34に表示可能なテキストデータを記述したhtmlファイル又はxmlファイルを備えている。
まず、分割手段44が「全国的に冷たい空気に包まれています。」を品詞ごとに分割する。なお、分割手段44としては、形態要素解析ソフトを用いることができる。形態要素解析ソフトとしては公知のものを採用することができる。分割手段44は、品詞記憶部45に記憶されている品詞に基づいて、上記のテキストデータ「全国的に冷たい空気に包まれています。」を品詞ごとに分割する。
図3の例に示すように、テキストデータ「全国的に冷たい空気に包まれています。」は、分割手段44によって「全国」(名詞)、「的」(名詞)、「に」(助詞)、「冷たい」(形容詞)、「空気」(名詞)、「に」(助詞)、「包ま」(動詞)、「れ」(動詞)、「て」(助詞)、「い」(動詞)、「ます」(助動詞)、「。」(句点)に分割される。
続いて結合手段46は、所定のアルゴリズムによって各品詞を結合させて分かち書き単位を作成する。所定のアルゴリズムとは、上述した通りであるので、ここでは説明せず、具体例に基づいて説明する。
図3の例に示すように、結合手段46は、「全国」という品詞が名詞の一般であると認識し、その後の品詞「的」も名詞であることから「全国」の後は区切らず、「全国」と「的」を結合する。
結合手段46は、「的」という品詞が名詞の接尾であると認識して、その「的」の前も後も区切らない。
結合手段46は、「に」という品詞が助詞の副詞化であると認識して、その後の品詞「冷たい」が形容詞であることから、「に」の後で区切る。このため、「全国」、「的」、「に」が結合されて、「全国的に」という分かち書き単位が生成される。
結合手段46は、「冷たい」という品詞が形容詞の自立であると認識して、前を区切り、後は区切らない。
結合手段46は、「空気」という品詞が名詞の一般であると認識して、その後の品詞「に」は、助詞であることから、「空気」の前(冷たいの後)を区切り、後は区切らない。このため、「冷たい」という分かち書き単位が生成される。
結合手段46は、「に」の後の「包ま」という品詞が動詞の自立であると認識して、前を区切り、後は区切らない。このため、「包ま」の前に「空気に」という分かち書き単位が生成される。
結合手段46は、「れ」という品詞が動詞の接尾であると認識して、前も後も区切らない。
結合手段は46は、「て」という品詞が助詞の接続助詞であると認識して、その後の品詞が「い」という動詞であることから、品詞の前を区切らず、後を区切る。このようにして「包ま」、「れ」、「て」が結合され、「包まれて」という分かち書き単位が生成される。
結合手段46は、「い」という品詞が動詞の非自立であると認識して、品詞の前を区切り、後は区切らない。
結合手段46は、「ます」という品詞が助動詞であると認識して、品詞の前も後も区切らない。この段階で「い」、「ます」が結合されることになる。
結合手段46は、「。」という品詞が記号の句点であると認識して、品詞の前は区切らず、後ろを区切る。このようにして「います。」という分かち書き単位が生成される。
上述してきた動作は、具体的には、分割手段44及び結合手段46がhtmlファイル又はxmlファイルにおけるタグを分かち書き単位の前後に付与して、分かち書き単位ごとにタグによる制御が可能となる。
続いて、発音時間算出手段48は、結合手段46によって生成された各分かち書き単位の発音時間を算出する。
音声データ記憶部35に録音された音声データが記憶されており、音声データの再生時間をテキストデータの文字数で除算して1文字あたりの再生時間を算出している。具体的には、本実施形態では、1文字あたりの発音時間を0.12秒としてあらかじめ算出して設定し、発音時間記憶部49に記憶させている。
そして、発音時間算出手段48は、各分かち書き単位の文字数(読み仮名の文字数)を算出し、その算出された文字数に1文字あたりの発音時間を乗算し、分かち書き単位ごとの発音時間を算出する。
図3の例では、「全国的に」の読み仮名は7文字であるので、発音時間算出手段48は、0.12秒×7=0.84秒を「全国的に」の発音時間として算出する。
次に「冷たい」の読み仮名は4文字であるので、発音時間算出手段48は、0.12秒×4=0.48秒を「冷たい」の発音時間として算出する。
次に「空気に」の読み仮名は4文字であるので、発音時間算出手段48は、0.12秒×4=0.48秒を「空気に」の発音時間として算出する。
次に「包まれて」の読み仮名は5文字であるので、発音時間算出手段48は、0.12秒×5=0.60秒を「包まれて」の発音時間として算出する。
次に「います」の読み仮名は3文字であるので、発音時間算出手段48は、0.12秒×3=0.36秒を「います」の発音時間として算出する。
発音時間算出手段48で算出された各分かち書き単位の発音時間に基づいて、ハイライト表示手段42は、分かち書き単位におけるハイライト表示の切り替えを実行する。なおハイライト表示の切り替えの制御は、それぞれの分かち書き単位のタグにおいて背景色の指定を切り替えることで実行できる。
ハイライト表示手段42は、音声データの再生開始と同時に、最初の分かち書き単位である「全国的に」を0.84秒ハイライト表示する。ハイライト表示手段42は、「全国的に」を0.84秒間ハイライト表示したのち、「全国的に」のハイライト表示を解除し、次の「冷たい」を0.48秒ハイライト表示する。ハイライト表示手段42は、「冷たい」を0.48秒間ハイライト表示したのち、「冷たい」のハイライト表示を解除し、次の「空気に」を0.48秒ハイライト表示する。
ハイライト表示手段42は、「空気に」を0.48秒間ハイライト表示したのち、「空気に」のハイライト表示を解除し、次の「包まれて」を0.60秒ハイライト表示する。
ハイライト表示手段42は、「包まれて」を0.60秒間ハイライト表示したのち、「包まれて」のハイライト表示を解除し、次の「います」を0.36秒ハイライト表示する。
ハイライト表示手段42は、「います」を0.36秒ハイライト表示したのち、「います」のハイライト表示を解除し、次の音声データの再生開始が実行されるまでハイライト表示をいったん停止する。そして、次の音声データの再生が開始されると、その再生開始に同期させて次のテキストデータの分かち書き単位の発音時間に基づいてハイライト表示を実行する。
(第2の実施形態)
なお、上述してきた第1の実施形態は、録音された音声データを再生するものについて説明してきた。しかし、録音された音声データが無く、テキストデータを音声データに変換するTTS(text to speech)システムを採用することも可能である。
TTSシステムを採用した実施形態のブロック図を図4に示す。なお、上述した実施形態と同一の構成要素については同一の符号を付し、説明を省略する場合もある。
本実施形態においては、電子図書のデータとして音声データは記憶されておらず、テキストデータのみがテキストデータ記憶部40に記憶されている。
TSS制御部50は、TTSシステムを実現可能に設けられており、具体的には公知のソフトウェアが動作することで実行できる。TTS制御部50は、操作スイッチ38からの操作によって、テキストデータ記憶部40から所定のテキストデータを取り出して、音声出力する。
また、TTS制御部50によってテキストデータを音声データに変換する場合には、文字あたりの発音時間は、TTSのボイス条件及びピッチ条件に基づいてあらかじめ設定しておくとよい。設定された1文字あたりの発音時間は、発音時間記憶部49に記憶されている。
本実施形態においても、表示部34に表示されるテキストデータは、ハイライト表示手段42によって現在再生出力中の語がハイライト表示手段42によってハイライト表示される。
ハイライト表示させる語は、分割手段44及び結合手段46によって分かち書き単位に分割される。各分かち書き単位の発音時間は、発音時間算出手段48が、発音時間記憶部49に記憶されている1文字あたりの発音時間に各分かち書き単位における読み仮名数を乗算することで算出できる。これらの動作は第1の実施形態と同様である。
なお、上述した各実施形態においては、音声の再生をスピーカから出力する場合について説明した。
しかし、音声出力はスピーカではなく、ヘッドホン又はイヤホンから行ってもよい。そして、スピーカと並列してヘッドホンジャック又はイヤホンジャックを設け、スピーカからの視聴及びヘッドホン又はイヤホンからの視聴のいずれかを選択可能に設けてもよい。
以上本発明につき好適な実施形態を挙げて種々説明したが、本発明はこの実施形態に限定されるものではなく、発明の精神を逸脱しない範囲内で多くの改変を施し得るのはもちろんである。
30 電子図書再生装置
32 スピーカ
34 表示部
35 音声データ記憶部
36 音声データ出力制御部
38 操作スイッチ
40 テキストデータ記憶部
41 分かち書き単位作成手段
42 ハイライト表示手段
44 分割手段
45 品詞記憶部
46 結合手段
48 発音時間算出手段
49 発音時間記憶部
50 TTS制御部
本発明にかかるテキストデータの分かち書き単位分割プログラムによれば、コンピュータに読み込み可能なプログラムであって、日本語のテキストデータの形態要素を解析して、品詞の種類を連体詞、接頭詞、名詞、動詞、形容詞、副詞、接続詞、助詞、助動詞、感動詞、記号、フィラー、その他、未知語として品詞ごとに分割する機能と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とをコンピュータに実現させ、前記あらかじめ設定された条件には、品詞の前又は後を区切るかどうかを判断する際に、連体詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接頭詞と認識された品詞に対しては、品詞の前を区切り、後は区切らず、ただし後を区切らない方が優先であると判断し、名詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、形容詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、副詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接続詞と認識された品詞に対しては、品詞の前も後も区切り、助詞と認識された品詞に対しては、品詞の後を区切り、品詞の前を区切るかどうかはその前の品詞の条件に基づいて判断し、助動詞と認識された品詞に対しては、品詞の前も後も区切らず、感動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、記号と認識された品詞に対しては、品詞の前を区切らず、後を区切り、フィラーと認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、その他と認識された品詞に対しては、品詞の前も後も区切らず、上述してきた品詞に該当しないものである未知語については、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断することを特徴としている。
このプログラムによれば、日本語のテキストデータを、自動的に、意味のある最小の範囲である分かち書き単位ごとに分割することができる。なおここでいうコンピュータとは、いわゆるパソコンに限定するものではなく、プログラムに基づいて動作する装置であれば、テキストデータを表示する装置や、テキストデータを音声再生する装置などプログラムによって動作する装置も含まれる。
また、前記あらかじめ設定された条件には、品詞の前又は後を区切るかどうかを判断する際に、名詞と認識された品詞であっても名詞の種類によっては、前も後も区切らない場合があり、且つ名詞の種類によっては名詞の前の品詞の種類によっても前も後も区切らない場合があり、動詞と認識された品詞であっても動詞の種類によっては、品詞の前も後も区切らない場合があり、形容詞と認識された品詞であっても形容詞の種類によっては、品詞の前も後も区切らない場合があり、助詞と認識された品詞であっても品詞の種類によっては、助詞の後の品詞の種類によっては、前も後も区切らない場合があり、記号と認識された品詞であっても、記号の後の品詞が記号である場合には前も後も区切らない場合があることを含めて判断することを特徴としてもよい。
本発明にかかる電子図書再生装置によれば、図書の文章情報の音声データを記憶する音声データ記憶部と、該音声データ記憶部内の音声データを再生して出力可能とする音声データ出力制御部と、図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、前記表示部に表示されたテキストデータと、音声データ出力制御部から出力される音声データを同期させ、出力中の音声データに該当する箇所をハイライト表示させるハイライト表示手段と、前記表示部に表示されたテキストデータの形態要素を解析して分かち書き単位を作成する分かち書き単位作成手段と、該分かち書き単位作成手段によって作成された分かち書き単位ごとの発音時間を算出する発音時間算出手段とを具備し、前記分かち書き単位作成手段は、日本語のテキストデータの形態要素を解析して、品詞の種類を連体詞、接頭詞、名詞、動詞、形容詞、副詞、接続詞、助詞、助動詞、感動詞、記号、フィラー、その他、未知語として品詞ごとに分割する分割手段と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行する際に、連体詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接頭詞と認識された品詞に対しては、品詞の前を区切り、後は区切らず、ただし後を区切らない方が優先であると判断し、名詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、形容詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、副詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接続詞と認識された品詞に対しては、品詞の前も後も区切り、助詞と認識された品詞に対しては、品詞の後を区切り、品詞の前を区切るかどうかはその前の品詞の条件に基づいて判断し、助動詞と認識された品詞に対しては、品詞の前も後も区切らず、感動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、記号と認識された品詞に対しては、品詞の前を区切らず、後を区切り、フィラーと認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、その他と認識された品詞に対しては、品詞の前も後も区切らず、上述してきた品詞に該当しないものである未知語については、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断することによって、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有し、前記ハイライト表示手段は、前記音声データ出力制御部からの音声出力開始と同時に、前記表示部に表示されている最初の分かち書き単位をハイライト表示し、現在ハイライト表示中の各分かち書き単位の発音時間が経過すると、発音時間が経過した箇所の分かち書き単位のハイライト表示を通常の表示に戻し、次の分かち書き単位をハイライト表示することを特徴としている。
この構成によれば、電子図書の音声データとテキストデータとを読み出す装置において、表示部で表示中の日本語のテキストについて、現在音声出力中の分かち書きされた箇所をハイライト表示させることができる。
本発明にかかる電子図書再生装置によれば、図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、前記テキストデータ記憶部内のテキストデータを音声出力可能とするTTS制御部と、該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、前記表示部に表示されたテキストデータと、TTS制御部から出力される音声データとを同期させ、出力中の音声データに該当する箇所をハイライト表示させるハイライト表示手段と、前記表示部に表示されたテキストデータの形態要素を解析して分かち書き単位を作成する分かち書き単位作成手段と、該分かち書き単位作成手段によって作成された分かち書き単位ごとの発音時間を算出する発音時間算出手段とを具備し、前記分かち書き単位作成手段は、日本語のテキストデータの形態要素を解析して、品詞の種類を連体詞、接頭詞、名詞、動詞、形容詞、副詞、接続詞、助詞、助動詞、感動詞、記号、フィラー、その他、未知語として品詞ごとに分割する分割手段と、分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行する際に、連体詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接頭詞と認識された品詞に対しては、品詞の前を区切り、後は区切らず、ただし後を区切らない方が優先であると判断し、名詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、形容詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、副詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接続詞と認識された品詞に対しては、品詞の前も後も区切り、助詞と認識された品詞に対しては、品詞の後を区切り、品詞の前を区切るかどうかはその前の品詞の条件に基づいて判断し、助動詞と認識された品詞に対しては、品詞の前も後も区切らず、感動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、記号と認識された品詞に対しては、品詞の前を区切らず、後を区切り、フィラーと認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、その他と認識された品詞に対しては、品詞の前も後も区切らず、上述してきた品詞に該当しないものである未知語については、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断することによって、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有し、前記ハイライト表示手段は、前記TTS制御部からの音声出力開始と同時に、前記表示部に表示されている最初の分かち書き単位をハイライト表示し、現在ハイライト表示中の各分かち書き単位の発音時間が経過すると、発音時間が経過した箇所の分かち書き単位のハイライト表示を通常の表示に戻し、次の分かち書き単位をハイライト表示することを特徴としている。
この構成を採用することによって、テキストデータから音声出力とテキストの表示とを行う装置において、表示部で表示中の日本語のテキストについて、現在音声出力中の分かち書きされた語をハイライト表示させることができる。なお、本発明におけるTTS制御部とは、テキストデータを読み出し可能な公知のTTS(text to speech)システムを実行する制御部を指す。

Claims (6)

  1. コンピュータに読み込み可能なプログラムであって、
    日本語のテキストデータの形態要素を解析して、品詞ごとに分割する機能と、
    分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする機能とをコンピュータに実現させることを特徴とするテキストデータの分かち書き単位分割プログラム。
  2. 前記あらかじめ設定された条件には、
    品詞の前又は後を区切るかどうかを判断する際に、当該品詞の前の品詞の種類に基づいて当該品詞の前を区切るか否かを判断し、当該品詞の後の品詞の種類に基づいて当該品詞の後を区切るか否かを判断する条件が含まれることを特徴とする請求項1記載のテキストデータの分かち書き単位分割プログラム。
  3. 図書の文章情報の音声データを記憶する音声データ記憶部と、
    該音声データ記憶部内の音声データを再生して出力可能とする音声データ出力制御部と、
    図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、
    該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、
    前記表示部に表示されたテキストデータと、音声データ出力制御部から出力される音声データを同期させ、出力中の音声データに該当する箇所をハイライト表示させるハイライト表示手段と、
    前記表示部に表示されたテキストデータの形態要素を解析して分かち書き単位を作成する分かち書き単位作成手段と、
    該分かち書き単位作成手段によって作成された分かち書き単位ごとの発音時間を算出する発音時間算出手段とを具備し、
    前記分かち書き単位作成手段は、
    日本語のテキストデータの形態要素を解析して、品詞ごとに分割する分割手段と、
    分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有し、
    前記ハイライト表示手段は、前記音声データ出力制御部からの音声出力開始と同時に、前記表示部に表示されている最初の分かち書き単位をハイライト表示し、
    現在ハイライト表示中の各分かち書き単位の発音時間が経過すると、発音時間が経過した箇所の分かち書き単位のハイライト表示を通常の表示に戻し、次の分かち書き単位をハイライト表示することを特徴とする電子図書再生装置。
  4. 前記結合手段の前記あらかじめ設定された条件には、
    品詞の前又は後を区切るかどうかを判断する際に、当該品詞の前の品詞の種類に基づいて当該品詞の前を区切るか否かを判断し、当該品詞の後の品詞の種類に基づいて当該品詞の後を区切るか否かを判断する条件が含まれることを特徴とする請求項3記載の電子図書再生装置。
  5. 図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、
    前記テキストデータ記憶部内のテキストデータを音声出力可能とするTTS制御部と、
    該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、
    前記表示部に表示されたテキストデータと、TTS制御部から出力される音声データとを同期させ、出力中の音声データに該当する箇所をハイライト表示させるハイライト表示手段と、
    前記表示部に表示されたテキストデータの形態要素を解析して分かち書き単位を作成する分かち書き単位作成手段と、
    該分かち書き単位作成手段によって作成された分かち書き単位ごとの発音時間を算出する発音時間算出手段とを具備し、
    前記分かち書き単位作成手段は、
    日本語のテキストデータの形態要素を解析して、品詞ごとに分割する分割手段と、
    分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有し、
    前記ハイライト表示手段は、前記TTS制御部からの音声出力開始と同時に、前記表示部に表示されている最初の分かち書き単位をハイライト表示し、
    現在ハイライト表示中の各分かち書き単位の発音時間が経過すると、発音時間が経過した箇所の分かち書き単位のハイライト表示を通常の表示に戻し、次の分かち書き単位をハイライト表示することを特徴とする電子図書再生装置。
  6. 前記結合手段の前記あらかじめ設定された条件には、
    品詞の前又は後を区切るかどうかを判断する際に、当該品詞の前の品詞の種類に基づいて当該品詞の前を区切るか否かを判断し、当該品詞の後の品詞の種類に基づいて当該品詞の後を区切るか否かを判断する条件が含まれることを特徴とする請求項5記載の電子図書再生装置。
JP2014134912A 2014-06-30 2014-06-30 テキストデータの分かち書き単位分割プログラム及び電子図書再生装置 Pending JP2016012315A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014134912A JP2016012315A (ja) 2014-06-30 2014-06-30 テキストデータの分かち書き単位分割プログラム及び電子図書再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014134912A JP2016012315A (ja) 2014-06-30 2014-06-30 テキストデータの分かち書き単位分割プログラム及び電子図書再生装置

Publications (1)

Publication Number Publication Date
JP2016012315A true JP2016012315A (ja) 2016-01-21

Family

ID=55228975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014134912A Pending JP2016012315A (ja) 2014-06-30 2014-06-30 テキストデータの分かち書き単位分割プログラム及び電子図書再生装置

Country Status (1)

Country Link
JP (1) JP2016012315A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017169063A (ja) * 2016-03-16 2017-09-21 シナノケンシ株式会社 データ再生装置およびデータ再生方法
JP2019149101A (ja) * 2018-02-28 2019-09-05 シナノケンシ株式会社 電子図書閲覧プログラム及び電子図書閲覧装置
CN110335583A (zh) * 2019-04-15 2019-10-15 浙江工业大学 一种带隔断标识的复合文件生成及解析方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59127148A (ja) * 1982-12-29 1984-07-21 Fujitsu Ltd 文章読上げ装置
JPS6362032A (ja) * 1986-09-03 1988-03-18 Fujitsu Ltd 文章読み上げ装置
JPS6474666A (en) * 1987-09-16 1989-03-20 Fujitsu Ltd Sentence read-out/correction device
JPH04199421A (ja) * 1990-11-29 1992-07-20 Toshiba Corp 文書読上げ装置
JPH08129398A (ja) * 1994-11-01 1996-05-21 Oki Electric Ind Co Ltd テキスト解析装置
JP2004198959A (ja) * 2002-12-20 2004-07-15 Casio Comput Co Ltd 命令コード作成装置、および命令コード作成処理プログラム
JP2011059754A (ja) * 2009-09-07 2011-03-24 Dainippon Printing Co Ltd 複合名詞抽出装置
JP2012118723A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 形態素解析装置、音声合成装置、形態素解析方法、形態素解析プログラム及び対応辞書の作成方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59127148A (ja) * 1982-12-29 1984-07-21 Fujitsu Ltd 文章読上げ装置
JPS6362032A (ja) * 1986-09-03 1988-03-18 Fujitsu Ltd 文章読み上げ装置
JPS6474666A (en) * 1987-09-16 1989-03-20 Fujitsu Ltd Sentence read-out/correction device
JPH04199421A (ja) * 1990-11-29 1992-07-20 Toshiba Corp 文書読上げ装置
JPH08129398A (ja) * 1994-11-01 1996-05-21 Oki Electric Ind Co Ltd テキスト解析装置
JP2004198959A (ja) * 2002-12-20 2004-07-15 Casio Comput Co Ltd 命令コード作成装置、および命令コード作成処理プログラム
JP2011059754A (ja) * 2009-09-07 2011-03-24 Dainippon Printing Co Ltd 複合名詞抽出装置
JP2012118723A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 形態素解析装置、音声合成装置、形態素解析方法、形態素解析プログラム及び対応辞書の作成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6016006877; 村田 真樹 外5名: 事例で学ぶ テキストマイニング 初版 Text Mining : Learning through Case Studies 第1版, 20080115, p.5-6, 共立出版株式会社 *
JPN6016006879; サーチアーキテクチャ 初版 第1版, 20071010, p.106-107, ソフトバンククリエイティブ株式会社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017169063A (ja) * 2016-03-16 2017-09-21 シナノケンシ株式会社 データ再生装置およびデータ再生方法
JP2019149101A (ja) * 2018-02-28 2019-09-05 シナノケンシ株式会社 電子図書閲覧プログラム及び電子図書閲覧装置
CN110335583A (zh) * 2019-04-15 2019-10-15 浙江工业大学 一种带隔断标识的复合文件生成及解析方法

Similar Documents

Publication Publication Date Title
CA2833656C (en) System and method for enhancing comprehension and readability of text
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
JP5638479B2 (ja) 書き起こし支援システムおよび書き起こし支援方法
KR20070071675A (ko) 이동통신단말기에서 다중 언어 tts 처리 방법
JP6277958B2 (ja) 再生装置、設定装置、再生方法およびプログラム
US9460718B2 (en) Text generator, text generating method, and computer program product
JP2013025299A (ja) 書き起こし支援システムおよび書き起こし支援方法
JP2016012315A (ja) テキストデータの分かち書き単位分割プログラム及び電子図書再生装置
US9020821B2 (en) Apparatus and method for editing speech synthesis, and computer readable medium
JP3896760B2 (ja) 対話記録編集装置、方法及び記憶媒体
JP2016012098A (ja) 電子図書再生装置及び電子図書再生プログラム
JP4478647B2 (ja) 音声応答システム、音声応答方法、音声サーバ、音声ファイル処理方法、プログラム及び記録媒体
JP2017117149A (ja) 電子図書表示装置
JP2018146961A (ja) 音声再生装置及び音楽再生プログラム
JP2004325905A (ja) 外国語学習装置および外国語学習プログラム
JP2008009221A (ja) 音声再生制御装置及び音声再生制御プログラム
KR100383061B1 (ko) 디지털 오디오와 그의 캡션 데이터를 이용한 학습방법
JP6587459B2 (ja) カラオケイントロにおける曲紹介システム
JP2007248750A (ja) 音声再生装置
KR100879667B1 (ko) 멀티미디어 처리 장치의 어학 학습 방법
JP6387044B2 (ja) テキスト処理装置、テキスト処理方法およびテキスト処理プログラム
JP2010066675A (ja) 音声情報処理システム及び音声情報処理プログラム
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
TW201415884A (zh) 人聲訊號與其文字說明資料的同步之系統及其方法
JP2017194546A (ja) 電子機器、その制御方法および制御プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160223

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160823