JP2017117149A - 電子図書表示装置 - Google Patents

電子図書表示装置 Download PDF

Info

Publication number
JP2017117149A
JP2017117149A JP2015250985A JP2015250985A JP2017117149A JP 2017117149 A JP2017117149 A JP 2017117149A JP 2015250985 A JP2015250985 A JP 2015250985A JP 2015250985 A JP2015250985 A JP 2015250985A JP 2017117149 A JP2017117149 A JP 2017117149A
Authority
JP
Japan
Prior art keywords
speech
character
unit
recognized
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015250985A
Other languages
English (en)
Inventor
佑介 田代
Yusuke Tashiro
佑介 田代
西澤 達夫
Tatsuo Nishizawa
達夫 西澤
真史 神林
Masashi Kambayashi
真史 神林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shinano Kenshi Co Ltd
Original Assignee
Shinano Kenshi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shinano Kenshi Co Ltd filed Critical Shinano Kenshi Co Ltd
Priority to JP2015250985A priority Critical patent/JP2017117149A/ja
Publication of JP2017117149A publication Critical patent/JP2017117149A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】日本語のテキストデータの改行位置を意味のある範囲で確実に設定する電子図書表示装置を提供する。【解決手段】改行位置設定手段52は、最大表示許容文字数算出手段58によって算出された1行当たりの最大表示許容文字数に該当する文字が、分かち書き単位作成手段41によって作成された分かち書き単位の最後の文字であるか、又は分かち書き単位の最後の文字以外の文字であるかを判断し、最大表示許容文字数に該当する文字が分かち書き単位の最後の文字であると判断した場合には、この分かち書き単位の後を改行位置として設定し、最大表示許容文字数に該当する文字が分かち書き単位の最後の文字以外の文字であると判断した場合には、この分かち書き単位の前を改行位置として設定する。【選択図】図1

Description

本発明は、電子図書のテキストを表示する電子図書表示装置に関する。
電子データとしてあらかじめ記憶されている電子図書を音声として再生する装置が従来から知られている(例えば、特許文献1参照)。この特許文献1に開示されている装置は、DAISY(Digital Accessible Information SYstem)規格によるデジタル録音図書を再生する装置であり、特に視覚に障害がある人たちが読書を楽しむことが出来るように、本に記載されている文章情報を音声として読み上げることができる装置である。
一方、音声再生できる装置に表示部を設け、表示部にはテキストを表示させる装置も従来から知られている(例えば、特許文献2参照)。この特許文献2に開示されている装置は、特に英会話の練習用に用いられる装置であって、表示部には英文のテキストデータが表示され、スピーカからは表示部に表示されている英文の音声データが再生される。
特許文献2に開示されている装置では、再生する音声データと表示部に表示させているテキストデータとを同期させ、現在再生中の音声データに該当するテキスト位置を対応付けできる。
また、テキストを表示部に表示する場合、一般的にはJIS X 4051に規定された禁則処理にしたがって表示されるが、括弧、句点、読点等以外の通常の文字の部分で改行が行われる場合、文節の途中などで改行されると意味が分かりにくく、テキストが読みづらくなってしまう。
そこで、テキストを表示する際に、見やすく理解しやすいように表示する構成が提案されている(例えば、特許文献3参照)。
この特許文献3に開示されている構成では、文書内の文書について、形態要素毎、文節毎、節毎、文毎を改行の候補として言語処理を行っている。
特開2000−057752号公報 特開2004−170444号公報 特許第5715172号公報
上述した特許文献3のように、形態要素毎、文節毎、節毎、文毎を改行の候補する場合でもある程度読みやすいテキストにはなるかもしれない。
しかしながら、児童生徒のための学習用の電子図書を表示する場合にあっては、単に読みやすいだけではなく、児童生徒が確実に意味がある個所として読み取れる個所で改行を行わせる必要がある。そこで、確実な学習効果を上げることができるように改行位置を設定できる電子図書表示装置が望まれているという課題がある。
そこで、本発明は上記課題を解決すべくなされ、その目的とするところは、日本語のテキストデータの改行位置を意味のある範囲で確実に設定することができる電子図書表示装置を提供することにある。
本発明にかかる電子図書表示装置によれば、日本語の図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、該表示部に表示させるテキストデータの文字の大きさを設定するフォント設定手段と、前記表示部に表示させるテキストデータの改行位置を設定する改行位置設定手段と、前記テキストデータ記憶部内のテキストデータの形態要素を解析して、品詞ごとに分割する分割手段、及び分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有する分かち書き単位作成手段と、前記フォント設定手段によって設定された文字の大きさに基づいて1行当たりに表示可能な最大表示許容文字数を算出する最大表示許容文字数算出手段と、を具備し、前記改行位置設定手段は、前記最大表示許容文字数算出手段によって算出された1行当たりの最大表示許容文字数に該当する文字が、前記分かち書き単位作成手段によって作成された分かち書き単位の最後の文字であるか、又は分かち書き単位の最後の文字以外の文字であるかを判断し、最大表示許容文字数に該当する文字が分かち書き単位の最後の文字であると判断した場合には、この分かち書き単位の後を改行位置として設定し、最大表示許容文字数に該当する文字が分かち書き単位の最後の文字以外の文字であると判断した場合には、この分かち書き単位の前を改行位置として設定することを特徴としている。
この構成を採用することによって、日本語のテキストデータを、自動的に、意味のある範囲で改行することができる。
また、前記結合手段の前記あらかじめ設定された条件には、品詞の前又は後を区切るかどうかを判断する際に、当該品詞の前の品詞の種類に基づいて当該品詞の前を区切るか否かを判断し、当該品詞の後の品詞の種類に基づいて当該品詞の後を区切るか否かを判断する条件が含まれることを特徴としてもよい。
さらに、前記分割手段は、品詞の種類を連体詞、接頭詞、名詞、動詞、形容詞、副詞、接続詞、助詞、助動詞、感動詞、記号、フィラー、その他、未知語として品詞ごとに分割し、前記結合手段は、品詞の前又は後を区切るかどうかを判断する際に、連体詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接頭詞と認識された品詞に対しては、品詞の前を区切り、後は区切らず、ただし後を区切らない方が優先であると判断し、名詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、形容詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、副詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、接続詞と認識された品詞に対しては、品詞の前も後も区切り、助詞と認識された品詞に対しては、品詞の後を区切り、品詞の前を区切るかどうかはその前の品詞の条件に基づいて判断し、助動詞と認識された品詞に対しては、品詞の前も後も区切らず、感動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、記号と認識された品詞に対しては、品詞の前を区切らず、後を区切り、フィラーと認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、その他と認識された品詞に対しては、品詞の前も後も区切らず、上述してきた品詞に該当しないものである未知語については、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断することを特徴としてもよい。
この構成によれば、従来までは、短く且つ意味のある日本語の範囲を明確にできなかったものが、確実に短く且つ意味のある範囲で改行することができる。
本発明によれば、日本語のテキストデータの改行位置を意味のある範囲で確実に設定することができる。
電子図書表示装置の構成を示すブロック図である。 電子図書表示装置における改行設定動作を示すフローチャートである。 初期設定の状態で表示部にテキストを表示したところを示す説明図である。 文字の大きさを大きくした際に、本発明の改行設定を実施しない状態で表示部にテキストを表示させたところを示す説明図である。 文字の大きさを大きくした際に、本発明の改行設定を実施した状態で表示部にテキストを表示させたところを示す説明図である。
本実施形態の電子図書表示装置の概略構成を図1に示す。
本実施形態の電子図書表示装置は、児童生徒に対して電子図書のテキストデータを表示させ、且つ予め電子図書を読み上げた音声データを記憶させておき、表示されているテキストデータに該当する箇所の音声データを再生することができる装置である。
なお、電子図書の規格としては、デジタル録音図書であるDAISY規格などが代表的である。
DAISY規格の電子図書データは、コンテンツを表現可能なsmil(Synchronized Multimedia Integration Language)ファイルと、見出し情報が記述されたnccファイル又はncxファイルと、表示部34に表示可能なテキストデータを記述したhtmlファイル又はxmlファイルを備えている。
電子図書表示装置30は、スピーカ32及び表示部34を備えており、あらかじめ音声データ記憶部35に記憶された音声データをスピーカ32から音声出力するとともに、テキストデータ記憶部40に記憶されている図書の内容をテキストとして表示部34に表示させる。なお、図書の内容としてのテキストは日本語であるとする。
音声データ記憶部35及びテキストデータ記憶部40としては、半導体メモリ、ハードディスクドライブ等の装置に内蔵されるものであってもよいし、リムーバブルディスクであるCD又はDVDであってもよいし、USBメモリなどであってもよい。
なお、音声データ記憶部35とテキストデータ記憶部40とを同一の記憶部としてもよい。例えば、同一のリムーバブルディスクや同一のUSBメモリ内に音声データとテキストデータの両方が記憶されている場合などが想定される。
電子図書表示装置30には、音声データ出力制御部36及びテキストデータ表示制御部39が設けられている。音声データ出力制御部36及びテキストデータ表示制御部39には、ユーザが操作可能な再生ボタン、早送りボタン、巻き戻しボタン等(図示せず)が接続されている。
ユーザによって再生ボタンが操作されると、音声データ出力制御部36は、現在表示部34に表示されているテキストに該当する個所の音声データを音声データ記憶部35から抽出してスピーカ32で再生する。
また、テキストデータ表示制御部39は、現在再生出力中の語がハイライト表示されるように制御動作を実行する。
ハイライト表示とは、音声出力中の語の背景色を他の部分の背景色とは異なる色として表示させることである。例えば、背景色が白色で、文字が黒色の場合に、音声出力中の語の背景色を黄色にすることにより、音声出力中の語を目立たせることができる。
テキストデータ表示制御部39には、ユーザが操作可能な操作スイッチ50が接続されている。操作スイッチ50は、表示部34に表示させるテキストの文字の大きさやフォント等を変更するためにユーザによって操作されるものである。操作スイッチ50をユーザが操作することによって、表示部34に表示させる文字の大きさを変更し、設定することができる。操作スイッチ50とテキストデータ表示制御部39が特許請求の範囲でいうフォント設定手段に該当する。
また、電子図書表示装置30としては、表示部34がタッチパネルであって、ユーザが表示部34においてピンチイン又はピンチアウトすることにより、表示部34に表示できる文字の大きさを変更可能なものであってもよい。この場合、表示部34及びテキストデータ表示制御部39が特許請求の範囲でいうフォント設定手段に該当する。
例えば、通常の文字の大きさとして24ptが初期設定されていた場合、ユーザが小学校低学年であれば文字の大きさを、例えば40pt程度まで大きくすることが望まれる。
そこで、ユーザが操作スイッチ50を操作するか又はピンチアウトして文字の大きさの設定変更をすることで、表示部34に表示される文字の大きさを変更することができる。
表示部34に表示させるテキストデータは、JIS X 4051に規定された禁則処理にしたがって表示される。禁則処理にしたがって表示されるので、例えば句点、読点、閉じ括弧等が行の先頭に位置することは無い。
そこで、禁則処理にしたがう表示を前提に、改行位置を意味の通る位置に設定することができる改行位置設定手段52を備えている。
改行位置設定手段52は、テキストデータを品詞ごとに分割する分割手段54と、分割した品詞を結合して分かち書き単位を作成する結合手段56とを有する分かち書き単位作成手段41によって作成された分かち書き単位に基づいて改行位置を設定する。
また、分かち書き単位作成手段41にはあらかじめ品詞を記憶している品詞記憶部45が設けられている。
電子図書表示装置30には、操作スイッチ50及びテキストデータ表示制御部39によって設定された文字の大きさに基づいて1行当たりに表示可能な最大表示許容文字数を算出する最大表示許容文字数算出手段58が設けられている。
分かち書き単位作成手段41は、テキストデータを品詞ごとに分割する機能を有するプログラムと、所定のアルゴリズムに基づいて品詞を結合させる機能を有するプログラムと、設定された文字の大きさに基づいて1行当たりに表示可能な最大文字数を算出するプログラムとが、CPUなどの処理装置に読み込まれることによって実現可能となる。
改行位置設定手段52は、1行当たりの最大表示許容文字数の最後の文字に該当する文字が、分かち書き単位の最後の文字であるか、又は分かち書き単位の最後の文字以外の文字であるかを判断し、この分かち書き単位の前又は後のいずれかに改行位置を設定するプログラムがCPUなどの処理装置に読み込まれることによって実現可能となる。
続いて、改行位置設定手段の動作について、図2に基づいて説明する。
改行位置設定手段52の分割手段54は、公知の形態要素解析ソフトを採用することができ、テキストデータを品詞記憶部45に記憶された品詞ごとに分割する(ステップS100)。
また、分割された品詞を結合する機能は、分割された各品詞に対してあらかじめ設定された条件に基づいて行われる。結合する機能は、あらかじめ設定した条件に基づき、品詞の前を区切り後も区切るか、品詞の前を区切り後は区切らないか、品詞の前を区切らず後を区切るか、又は品詞の前も後も区切らないかが判断される(ステップS102)。
次に、複数の品詞を結合して分かち書き単位とするか、又は品詞単独で分かち書き単位とする(ステップS104)。
ここで、分割された品詞をどのようにして分かち書き単位とするか、その条件について説明する。
まず、本実施形態では、まず品詞の種類を連体詞、接頭詞、名詞、動詞、形容詞、副詞、接続詞、助詞、助動詞、感動詞、記号、フィラー、その他、未知語に分けている。
連体詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
接頭詞と認識された品詞に対しては、品詞の前を区切り、後は区切らない。ただし、後を区切らない方が優先である。
名詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。ただし、名詞の種類によっては、前も後も区切らない場合もある。さらに、当該品詞の前の品詞の種類によっても、前も後も区切らない場合もある。
動詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。ただし、動詞の種類によっては、品詞の前も後も区切らない場合もある。
形容詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。ただし、形容詞の種類によっては、品詞の前も後も区切らない場合もある。
副詞と認識された品詞に対しては、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
接続詞は、品詞の前も後も区切る。
助詞と認識された助詞に対しては、品詞の後を区切る。品詞の前を区切るかどうかはその前の品詞の条件に基づく。ただし、当該品詞の後の品詞の種類によっては、前も後も区切らない場合もある。
助動詞は、品詞の前も後も区切らない。
感動詞は、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
記号と認識された記号に対しては、品詞の前を区切らず、後を区切る。ただし、当該品詞の後が同じ品詞の場合には前も後も区切らない。
フィラーは、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
その他は、間投詞などがあり、品詞の前も後も区切らない。
また、上述してきた品詞に該当しないものである未知語については、品詞の前を区切る。品詞の後を区切るかどうかはその次の品詞の条件に基づく。
このような条件に基づいて結合手段56が機能し、分かち書き単位が形成される。
上記の条件に基づいて生成された分かち書き単位は、文字数としてきわめて短く且つ意味が分かる範囲である。
最大表示許容文字数算出手段58は、表示部34におけるテキストを表示させる範囲の1行当たりの長さを、設定された文字の大きさ(長さ)で除算し、1行当たり最大何文字表示できるかを算出する。表示部34におけるテキストを表示させる範囲の1行当たりの長さは、表示部34の大きさから算出されるものであり、予め設定して記憶させておく。
そして、改行位置設定手段52は、1行ごとに、1行当たり表示できる最大文字数を超えないよう、分かち書き単位作成手段41によって作成された分かち書き単位を配置していく。
このとき、改行位置設定手段52は、最大表示許容文字数算出手段58によって算出された1行当たりの最大表示許容文字数に該当する文字が、結合手段によって生成された分かち書き単位の最後の文字であるか、又は分かち書き単位の最後の文字以外の文字であるかを判断する(ステップS106)。
改行位置設定手段52は、最大表示許容文字数に該当する文字が分かち書き単位の最後の文字であると判断した場合には、この分かち書き単位の後を改行位置として設定する(ステップS107)。
改行位置設定手段52は、最大表示許容文字数に該当する文字が分かち書き単位の最後の文字以外の文字であると判断した場合には、この分かち書き単位の前を改行位置として設定する(ステップS108)。
次に、分割手段54及び結合手段56を有する分かち書き単位作成手段41による分かち書き単位の生成の具体例について説明する。
分かち書きに分割する対象を「全国的に冷たい空気に包まれています。」という一文である場合、まず分割手段54が「全国的に冷たい空気に包まれています。」を品詞ごとに分割する。なお、分割手段54としては、上述したように形態要素解析ソフトを用いることができる。形態要素解析ソフトとしては公知のものを採用することができる。分割手段54は、品詞記憶部45に記憶されている品詞に基づいて、上記のテキストデータ「全国的に冷たい空気に包まれています。」を品詞ごとに分割する。
テキストデータ「全国的に冷たい空気に包まれています。」は、分割手段54によって「全国」(名詞)、「的」(名詞)、「に」(助詞)、「冷たい」(形容詞)、「空気」(名詞)、「に」(助詞)、「包ま」(動詞)、「れ」(動詞)、「て」(助詞)、「い」(動詞)、「ます」(助動詞)、「。」(句点)に分割される。
続いて結合手段56は、所定のアルゴリズムによって各品詞を結合させて分かち書き単位を作成する。所定のアルゴリズムとは、上述した通りであるので、ここでは説明せず、具体例に基づいて説明する。
結合手段56は、「全国」という品詞が名詞の一般であると認識し、その後の品詞「的」も名詞であることから「全国」の後は区切らず、「全国」と「的」を結合する。
結合手段56は、「的」という品詞が名詞の接尾であると認識して、その「的」の前も後も区切らない。
結合手段56は、「に」という品詞が助詞の副詞化であると認識して、その後の品詞「冷たい」が形容詞であることから、「に」の後で区切る。このため、「全国」、「的」、「に」が結合されて、「全国的に」という分かち書き単位が生成される。
結合手段56は、「冷たい」という品詞が形容詞の自立であると認識して、前を区切り、後は区切らない。
結合手段56は、「空気」という品詞が名詞の一般であると認識して、その後の品詞「に」は、助詞であることから、「空気」の前(冷たいの後)を区切り、後は区切らない。このため、「冷たい」という分かち書き単位が生成される。
結合手段56は、「に」の後の「包ま」という品詞が動詞の自立であると認識して、前を区切り、後は区切らない。このため、「包ま」の前に「空気に」という分かち書き単位が生成される。
結合手段56は、「れ」という品詞が動詞の接尾であると認識して、前も後も区切らない。
結合手段56は、「て」という品詞が助詞の接続助詞であると認識して、その後の品詞が「い」という動詞であることから、品詞の前を区切らず、後を区切る。このようにして「包ま」、「れ」、「て」が結合され、「包まれて」という分かち書き単位が生成される。
結合手段56は、「い」という品詞が動詞の非自立であると認識して、品詞の前を区切り、後は区切らない。
結合手段56は、「ます」という品詞が助動詞であると認識して、品詞の前も後も区切らない。この段階で「い」、「ます」が結合されることになる。
結合手段56は、「。」という品詞が記号の句点であると認識して、品詞の前は区切らず、後ろを区切る。このようにして「います。」という分かち書き単位が生成される。
上述してきた動作は、具体的には、分割手段54及び結合手段56がhtmlファイル又はxmlファイルにおけるタグを分かち書き単位の前後に付与して、分かち書き単位ごとにタグによる制御が可能となる。
次に、電子図書表示装置における、改行動作の具体例について説明する。
図3は、電子図書表示装置30における表示部34にテキストを表示させたところを示している。図3では、文字の大きさは初期設定どおりの値であり、また改行位置は単に禁則処理によって処理されているだけである。
図4では、ユーザが操作スイッチ50を操作して文字の大きさが大きくなるように設定変更したところを示している。
このように、文字の大きさを変更することにより、改行位置がずれてしまい、文節が区切られて読みにくくなってしまう。
図5では、ユーザが操作スイッチ50を操作して文字の大きさが大きくなるように設定変更し、且つ改行位置設定手段52によって改行位置を適切に設定した例を示している。
まず、最大表示許容文字数算出手段58は、表示部34におけるテキストを表示させる範囲の1行当たりの長さを、設定された文字の大きさ(長さ)で除算し、1行当たり最大何文字表示できるかを算出する。
ここで示す例では、最大表示許容文字数算出手段58は1行当たりの最大表示許容文字数は8文字であると算出する。
次いで、分かち書き単位作成手段41の分割手段54がテキストデータの形態要素を解析して品詞ごとに分割する。
そして、結合手段56が所定のアルゴリズムによって各品詞を結合させて分かち書き単位を作成する。所定のアルゴリズムとは、上述した通りであるので、ここでは説明しない。
改行位置設定手段52は、所定の1行の中で最大表示許容文字数に当たる8文字目が、結合手段56によって作成された分かち書き単位の最後の文字に該当するか、又は分かち書き単位の最後の文字以外の文字であるかを判断する。
そして、改行位置設定手段52は、8文字目が分かち書き単位の最後の文字であると判断した場合、この分かち書き単位の後を改行位置として設定する。したがって、設定された改行位置の次の分かち書き単位は、次の行の先頭に位置するように配置される。
また改行位置設定手段52は、所定の1行の中で最大表示許容文字数に当たる8文字目が分かち書き単位の最後の文字以外の文字であると判断した場合、8文字目を含む分かち書き単位の前(すなわち、8文字目を含む分かち書き単位の前の分かち書き単位の後)に改行位置を設定する。したがって、設定された改行位置の次の分かち書き単位(すなわち、8文字目を含む分かち書き単位)は、次の行の先頭に位置するように配置する。
図4〜図5の1行目〜5行目の例によると、図4での1行目は、「小さい」という分かち書き単位のうち「さ」が1行目の8文字目に該当するため、「小さい」という分かち書き単位の前に改行位置が設定される。
「小さい」が2行目の先頭に位置した場合、「村の」という分かち書き単位のうち「村」が2行目の8文字目に該当するため、「村の」という分かち書き単位の前に改行位置が設定される。
「村の」が3行目の先頭に位置した場合、「おじいさん」という分かち書き単位のうち「お」が3行目の8文字目に該当するため、「おじいさん」という分かち書き単位の前に改行位置が設定される。
「おじいさん」が4行目の先頭に位置した場合、「きいた」という分かち書き単位のうち「き」が4行目の8文字目に該当するため、「きいた」という分かち書き単位の前に改行位置が設定される。
「きいた」が5行目の先頭に位置した場合、句点である「。」という分かち書き単位が5行目の8文字目に該当し、「。」は1文字で分かち書き単位を構成しており、分かち書き単位の最後の文字であるため、この「。」の後に改行位置を設定する。
なお、句点である「。」は、禁則処理によって行の先頭に位置することができないため、改行位置設定手段52は、禁則処理によっても「。」の後に改行位置を設定することもできる。
具体的には、改行位置設定手段52は、htmlファイル又はxmlファイルにおける改行を指示するタグを分かち書き単位の前後に付与することでして、改行位置を設定する。
上述したような実施形態によれば、文字の大きさを大きくした場合に、意味のある個所の途中で改行することがなく、テキストをきわめて読みやすい状態とすることができる。
また、改行位置設定手段52は、文字の大きさを大きくした場合だけでなく、小さくした場合であっても、改行位置を設定することで意味のある個所の途中で改行することがなく、テキストをきわめて読みやすい状態とすることができる。
さらに、改行位置設定手段52は、文字の大きさを変更する動作とは無関係に、テキストを表示部34に表示する際には常に動作することにより、テキストを常に読みやすい状態とすることができる。
なお、上述してきた実施形態は、テキストデータの表示とともに音声データを再生する電子図書再生装置について説明してきた。
しかし、本発明としては音声データを再生する形態に限定するものではなく、テキストデータの表示のみ実施して音声データを再生しない機器に採用してもよい。
以上本発明につき好適な実施形態を挙げて種々説明したが、本発明はこの実施形態に限定されるものではなく、発明の精神を逸脱しない範囲内で多くの改変を施し得るのはもちろんである。
20 再生ボタン
22 ボタン
24 ボタン
30 電子図書表示装置
32 スピーカ
34 表示部
35 音声データ記憶部
36 音声データ出力制御部
39 テキストデータ表示制御部
40 テキストデータ記憶部
41 分かち書き単位作成手段
45 品詞記憶部
50 操作スイッチ
52 改行位置設定手段
54 分割手段
56 結合手段
58 最大表示許容文字数算出手段

Claims (3)

  1. 日本語の図書の文字情報のテキストデータを記憶するテキストデータ記憶部と、
    該テキストデータ記憶部内のテキストデータのうちの全部又は一部を表示する表示部と、
    該表示部に表示させるテキストデータの文字の大きさを設定するフォント設定手段と、
    前記表示部に表示させるテキストデータの改行位置を設定する改行位置設定手段と、
    前記テキストデータ記憶部内のテキストデータの形態要素を解析して、品詞ごとに分割する分割手段、及び分割された各品詞に対してあらかじめ設定された条件に基づいて、品詞の前を区切り後も区切る、品詞の前を区切り後は区切らない、品詞の前を区切らず後を区切る、若しくは品詞の前も後も区切らないという動作を実行して、複数の品詞を結合又は品詞単独で分かち書き単位とする結合手段とを有する分かち書き単位作成手段と、
    前記フォント設定手段によって設定された文字の大きさに基づいて1行当たりに表示可能な最大表示許容文字数を算出する最大表示許容文字数算出手段と、を具備し、
    前記改行位置設定手段は、
    前記最大表示許容文字数算出手段によって算出された1行当たりの最大表示許容文字数に該当する文字が、前記分かち書き単位作成手段によって作成された分かち書き単位の最後の文字であるか、又は分かち書き単位の最後の文字以外の文字であるかを判断し、
    最大表示許容文字数に該当する文字が分かち書き単位の最後の文字であると判断した場合には、この分かち書き単位の後を改行位置として設定し、
    最大表示許容文字数に該当する文字が分かち書き単位の最後の文字以外の文字であると判断した場合には、この分かち書き単位の前を改行位置として設定することを特徴とする電子図書表示装置。
  2. 前記結合手段の前記あらかじめ設定された条件には、
    品詞の前又は後を区切るかどうかを判断する際に、当該品詞の前の品詞の種類に基づいて当該品詞の前を区切るか否かを判断し、当該品詞の後の品詞の種類に基づいて当該品詞の後を区切るか否かを判断する条件が含まれることを特徴とする請求項1記載の電子図書表示装置。
  3. 前記分割手段は、品詞の種類を連体詞、接頭詞、名詞、動詞、形容詞、副詞、接続詞、助詞、助動詞、感動詞、記号、フィラー、その他、未知語として品詞ごとに分割し、
    前記結合手段は、品詞の前又は後を区切るかどうかを判断する際に、
    連体詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、
    接頭詞と認識された品詞に対しては、品詞の前を区切り、後は区切らず、ただし後を区切らない方が優先であると判断し、
    名詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、
    動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、
    形容詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、
    副詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、
    接続詞と認識された品詞に対しては、品詞の前も後も区切り、
    助詞と認識された品詞に対しては、品詞の後を区切り、品詞の前を区切るかどうかはその前の品詞の条件に基づいて判断し、
    助動詞と認識された品詞に対しては、品詞の前も後も区切らず、
    感動詞と認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、
    記号と認識された品詞に対しては、品詞の前を区切らず、後を区切り、
    フィラーと認識された品詞に対しては、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断し、
    その他と認識された品詞に対しては、品詞の前も後も区切らず、
    上述してきた品詞に該当しないものである未知語については、品詞の前を区切り、品詞の後を区切るかどうかはその次の品詞の条件に基づいて判断することを特徴とする請求項2記載の電子図書表示装置。
JP2015250985A 2015-12-24 2015-12-24 電子図書表示装置 Pending JP2017117149A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015250985A JP2017117149A (ja) 2015-12-24 2015-12-24 電子図書表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015250985A JP2017117149A (ja) 2015-12-24 2015-12-24 電子図書表示装置

Publications (1)

Publication Number Publication Date
JP2017117149A true JP2017117149A (ja) 2017-06-29

Family

ID=59231829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015250985A Pending JP2017117149A (ja) 2015-12-24 2015-12-24 電子図書表示装置

Country Status (1)

Country Link
JP (1) JP2017117149A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002328A (zh) * 2020-08-10 2020-11-27 中央广播电视总台 一种字幕生成方法、装置及计算机存储介质、电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01128159A (ja) * 1987-11-13 1989-05-19 Nippon Telegr & Teleph Corp <Ntt> 日本語文書作成装置
JPH04167049A (ja) * 1990-10-31 1992-06-15 Fuji Xerox Co Ltd 文書処理装置
JPH05135025A (ja) * 1991-11-14 1993-06-01 Matsushita Electric Ind Co Ltd 文書編集装置
JPH0736913A (ja) * 1993-07-16 1995-02-07 Ricoh Co Ltd 言語解析システム
JPH103469A (ja) * 1996-06-14 1998-01-06 Niigata Nippon Denki Software Kk 禁則処理方法と文書処理装置
JPH10283353A (ja) * 1997-04-01 1998-10-23 Sanyo Electric Co Ltd 文書処理装置、文書処理方法及び記録媒体
JP2010224056A (ja) * 2009-03-19 2010-10-07 Daikatsuji:Kk 文章表示プログラムおよびシステム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01128159A (ja) * 1987-11-13 1989-05-19 Nippon Telegr & Teleph Corp <Ntt> 日本語文書作成装置
JPH04167049A (ja) * 1990-10-31 1992-06-15 Fuji Xerox Co Ltd 文書処理装置
JPH05135025A (ja) * 1991-11-14 1993-06-01 Matsushita Electric Ind Co Ltd 文書編集装置
JPH0736913A (ja) * 1993-07-16 1995-02-07 Ricoh Co Ltd 言語解析システム
JPH103469A (ja) * 1996-06-14 1998-01-06 Niigata Nippon Denki Software Kk 禁則処理方法と文書処理装置
JPH10283353A (ja) * 1997-04-01 1998-10-23 Sanyo Electric Co Ltd 文書処理装置、文書処理方法及び記録媒体
JP2010224056A (ja) * 2009-03-19 2010-10-07 Daikatsuji:Kk 文章表示プログラムおよびシステム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
サーチアーキテクチャ 初版, vol. 第1版, JPN6016006879, 10 October 2007 (2007-10-10), pages 106 - 107, ISSN: 0003672010 *
村田 真樹 外5名, 事例で学ぶ テキストマイニング 初版 TEXT MINING : LEARNING THROUGH CASE STUDIES, vol. 第1版, JPN6016006877, 15 January 2008 (2008-01-15), JP, pages 5 - 6, ISSN: 0003672009 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112002328A (zh) * 2020-08-10 2020-11-27 中央广播电视总台 一种字幕生成方法、装置及计算机存储介质、电子设备
CN112002328B (zh) * 2020-08-10 2024-04-16 中央广播电视总台 一种字幕生成方法、装置及计算机存储介质、电子设备

Similar Documents

Publication Publication Date Title
CA2833656C (en) System and method for enhancing comprehension and readability of text
CN104246750B (zh) 抄录语音
US20180143956A1 (en) Real-time caption correction by audience
KR100378898B1 (ko) 발음 설정 방법, 컴퓨터 판독가능 매체를 포함하는 제조 물품 및, 그래픽 사용자 인터페이스 시스템
US20130196292A1 (en) Method and system for multimedia-based language-learning, and computer program therefor
KR20160111275A (ko) 외국어 학습 시스템 및 외국어 학습 방법
US20090287469A1 (en) Information provision system, information provision method, information provision program, and information provision program recording medium
JP6277958B2 (ja) 再生装置、設定装置、再生方法およびプログラム
JP2013072957A (ja) 文書読み上げ支援装置、方法及びプログラム
JP2007199410A (ja) テキストに付与する発音情報の編集を支援するシステム
JP2016012315A (ja) テキストデータの分かち書き単位分割プログラム及び電子図書再生装置
JP2017117149A (ja) 電子図書表示装置
US20040102973A1 (en) Process, apparatus, and system for phonetic dictation and instruction
JP7229296B2 (ja) 関連情報提供方法及びシステム
JP2018146961A (ja) 音声再生装置及び音楽再生プログラム
JP2004325905A (ja) 外国語学習装置および外国語学習プログラム
CN113963681A (zh) 基于文本编辑器的语音合成方法、系统和存储介质
JP2016012098A (ja) 電子図書再生装置及び電子図書再生プログラム
JP2008009221A (ja) 音声再生制御装置及び音声再生制御プログラム
JP2020140374A (ja) 電子図書再生装置及び電子図書再生プログラム
KR102523746B1 (ko) 프레젠테이션 문서를 구성하는 슬라이드에 음성 데이터의 삽입을 가능하게 하는 전자 장치 및 그 동작 방법
JPH10312151A (ja) 英単語等の学習支援装置並びに英単語等の学習支援プログラムを記録した記録媒体
JP2007248750A (ja) 音声再生装置
JP2007219219A (ja) 語学学習用電子機器および学習用文章リスト作成方法
JP2005106844A (ja) 音声出力装置、サーバ及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180626