JP2020140374A - Electronic book reproducing device and digital book reproducing program - Google Patents

Electronic book reproducing device and digital book reproducing program Download PDF

Info

Publication number
JP2020140374A
JP2020140374A JP2019034618A JP2019034618A JP2020140374A JP 2020140374 A JP2020140374 A JP 2020140374A JP 2019034618 A JP2019034618 A JP 2019034618A JP 2019034618 A JP2019034618 A JP 2019034618A JP 2020140374 A JP2020140374 A JP 2020140374A
Authority
JP
Japan
Prior art keywords
ruby
text
electronic book
kanji
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019034618A
Other languages
Japanese (ja)
Inventor
友紀 小平
Tomonori Kodaira
友紀 小平
佑介 田代
Yusuke Tashiro
佑介 田代
龍 飛田
Tatsu Hida
龍 飛田
恭子 古澤
Kyoko Furusawa
恭子 古澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shinano Kenshi Co Ltd
Original Assignee
Shinano Kenshi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shinano Kenshi Co Ltd filed Critical Shinano Kenshi Co Ltd
Priority to JP2019034618A priority Critical patent/JP2020140374A/en
Publication of JP2020140374A publication Critical patent/JP2020140374A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

To execute accurate speech analysis by allowing correction of erroneous ruby characters into accurate ruby characters when the erroneous ruby characters are set.SOLUTION: A digital book reproducing device comprises: a display unit 31; a speech synthesis engine 40 for speech synthesis based on a text of a digital book or speech data; an output unit 38 which outputs speech obtained by the speech synthesis engine 40 or the speech data; an idiom storage unit 41; a KANJI storage unit 42; a storage unit 49 for alphabetic words or the like; a ruby character setting function 46 which sets ruby characters to KANJI, alphabetic words or the like in a text of a digital book displayed on the display unit 31 and displays the ruby characters set to the text; and an editing function 48 which, in response to operator's designating a part of the text which is displayed on the display unit 31 and to which the ruby characters are set, causes the display unit 31 to display a rubber character editing window so as to enable the operator to perform ruby character editing and text editing including deletion and/or correction of ruby characters set in a range of the designated part and sets ruby characters edited by the operator as ruby characters of the digital book.SELECTED DRAWING: Figure 2

Description

本発明は、デジタル図書や教科書コンテンツなどの電子図書を再生する装置におけるテキストやルビの編集を実行できる装置及びプログラムに関する。 The present invention relates to a device and a program capable of editing text and ruby in a device that reproduces electronic books such as digital books and textbook contents.

デジタル図書や教科書コンテンツなどの電子図書は、タブレット等の電子機器によってその画面上に文字が表示されるように構成される。また、このような電子図書は、文字の表示の他に、表示される文字を音声再生することも行われる。 Electronic books such as digital books and textbook contents are configured so that characters are displayed on the screen by an electronic device such as a tablet. Further, in such an electronic book, in addition to displaying characters, the displayed characters are also reproduced by voice.

例えば、特許文献1に示す端末機では、教科書データを画面に表示させたうえで教科書データのテキストを音声に変換し、音声出力することが開示されている。
また、特許文献2には、電子図書の音声再生の際に、予め言語を構成する単位の音声素片を含む音声合成用データベースを設けておき、音声合成エンジンではなく予め記憶された音声データを用いることが開示されている。
For example, in the terminal shown in Patent Document 1, it is disclosed that the textbook data is displayed on the screen, the text of the textbook data is converted into voice, and the text is output by voice.
Further, in Patent Document 2, a voice synthesis database including voice elements of units constituting a language is provided in advance at the time of voice reproduction of an electronic book, and voice data stored in advance is stored instead of a voice synthesis engine. It is disclosed to be used.

特開2013−109168号公報Japanese Unexamined Patent Publication No. 2013-109168 特開2005−321706号公報Japanese Unexamined Patent Publication No. 2005-321706

上記の特許文献1及び特許文献2ともに、教科書データ等の電子図書を画面に表示させたうえで、その内容を音声再生するものである。
予め音声が記憶されている電子図書については、記憶されている音声を再生すればよいが、音声が存在しない電子図書の場合はテキストを音声に変換する音声合成エンジンとして一般的にTTS(Text To Speech)が用いられる。
In both the above-mentioned Patent Document 1 and Patent Document 2, electronic books such as textbook data are displayed on a screen, and the contents are reproduced by voice.
For an electronic book in which voice is stored in advance, the stored voice may be reproduced, but in the case of an electronic book in which voice does not exist, TTS (Text To) is generally used as a voice synthesis engine for converting text into voice. Speech) is used.

TTSは、日本語テキストの場合、漢字にルビが設定されていればそのルビに基づいて音声合成する。しかし、漢字にルビが設定されていない場合や間違ったルビが設定されている場合には、正確な音声合成ができない。 In the case of Japanese text, if ruby is set for the kanji, TTS synthesizes voice based on the ruby. However, if ruby is not set for the kanji or if the wrong ruby is set, accurate speech synthesis cannot be performed.

そこで、本発明は上記課題を解決すべくなされ、その目的とするところは、電子図書を音声再生する場合に音声合成エンジンを用いる際に、正確な音声合成を実行できる装置及びプログラムを提供することにある。 Therefore, the present invention has been made to solve the above problems, and an object of the present invention is to provide a device and a program capable of performing accurate speech synthesis when using a speech synthesis engine when reproducing speech of an electronic book. It is in.

本発明にかかる電子図書再生装置によれば、電子図書のテキストを表示する表示部と、電子図書のテキストに基づいて音声合成する音声合成エンジン又は電子図書のテキストを読み上げた音声データと、前記音声合成エンジンによって生成された音声又は前記音声データを出力する出力部と、複数の漢字で構成された熟語の読みを、複数の熟語について記憶している熟語記憶部と、漢字1文字ごとの読みを、複数の漢字について記憶している漢字記憶部と、英単語、アルファベット、数字及び記号の読みを、複数の英単語、アルファベット、数字及び記号について記憶している英単語等記憶部と、前記表示部に表示されている電子図書のテキストにおける漢字に対して、前記熟語記憶部に記憶されている熟語の読み及び前記漢字記憶部に記憶されている漢字1文字の読みを検索して、該当する読みを当該熟語又は漢字1文字のルビとして設定し、前記表示部に表示されている英単語、アルファベット、数字又は記号に対して、前記英単語等記憶部に記憶されている英単語、アルファベット、数字又は記号の読みを検索して、該当する読みを英単語、アルファベット、数字又は記号のルビとして設定し、前記表示部に表示されるテキストに設定したルビを表示するルビ設定表示手段と、前記表示部に表示された、テキストの一部を作業者が指定した場合、指定した範囲における設定されたルビの削除及び/又は修正を含むルビの編集、又は指定した範囲におけるテキストの削除及び/又は修正を含むテキストの編集を作業者が可能となるように編集画面を前記表示部に表示させ、作業者によって編集されたルビ又はテキストを当該電子図書のルビ又はテキストとして設定する編集手段とを具備することを特徴としている。
この構成を採用することによって、テキストやテキストに設定されたルビが間違っている場合に、その間違ったテキストやルビを修正することができ、これにより音声合成エンジンの音声合成を正確なものとすることができ、また音声データが予め記憶されている場合には、再生される音声データに対して正しいテキストやルビを設定することができる。
According to the electronic book reproducing device according to the present invention, a display unit that displays the text of the electronic book, a voice synthesis engine that synthesizes voice based on the text of the electronic book, or voice data that reads out the text of the electronic book, and the voice. An output unit that outputs the voice generated by the synthesis engine or the voice data, a compound word storage unit that stores the reading of a compound word composed of a plurality of kanji characters, and a reading unit for each kanji character. , A kanji storage unit that stores a plurality of kanji characters, a storage unit that stores English words, alphabets, numbers and symbols, and a storage unit that stores a plurality of English words, alphabets, numbers and symbols, and the above display. For the kanji in the text of the electronic book displayed in the section, the reading of the compound word stored in the compound word storage unit and the reading of one kanji character stored in the kanji storage unit are searched and applicable. The reading is set as the ruby of the compound word or one kanji character, and for the English words, alphabets, numbers or symbols displayed on the display unit, the English words, alphabets, etc. stored in the storage unit such as the English words, etc. A ruby setting display means for searching for a reading of a number or a symbol, setting the corresponding reading as a ruby of an English word, an alphabet, a number or a symbol, and displaying the ruby set in the text displayed on the display unit, and the above. When a worker specifies a part of the text displayed on the display, the ruby is edited including the deletion and / or correction of the set ruby in the specified range, or the text is deleted and / or in the specified range. It is provided with an editing means for displaying an editing screen on the display unit so that the operator can edit the text including correction and setting the ruby or text edited by the operator as the ruby or text of the electronic book. It is characterized by doing.
By adopting this configuration, if the text or ruby set in the text is incorrect, the incorrect text or ruby can be corrected, which makes the speech synthesis of the speech synthesis engine accurate. In addition, when the voice data is stored in advance, the correct text or ruby can be set for the voice data to be reproduced.

また、前記編集手段は、音声マークアップ言語を設定し又は設定されている音声マークアップ言語を編集可能であることを特徴としてもよい。
この構成によれば、抑揚やアクセント等をつけた音声再生を実行するための音声マークアップ言語の編集も可能となるため、より聞きやすい音声とすることができる。
Further, the editing means may be characterized in that a voice markup language is set or the set voice markup language can be edited.
According to this configuration, it is possible to edit the voice markup language for executing voice reproduction with intonation and accent, so that the voice can be made easier to hear.

本発明にかかる電子図書再生プログラムによれば、電子図書のテキストを表示する表示部と、電子図書のテキストに基づいて音声合成する音声合成エンジン又は電子図書のテキストを読み上げた音声データと、前記音声合成エンジンによって生成された音声又は前記音声データを出力する出力部と、複数の漢字で構成された熟語の読みを、複数の熟語について記憶している熟語記憶部と、漢字1文字ごとの読みを、複数の漢字について記憶している漢字記憶部と、英単語、アルファベット、数字及び記号の読みを、複数の英単語、アルファベット、数字及び記号について記憶している英単語等記憶部と、を具備する電子図書再生装置に読み取り可能な電子図書再生プログラムであって、前記表示部に表示されている電子図書のテキストにおける漢字に対して、前記熟語記憶部に記憶されている熟語の読み及び前記漢字記憶部に記憶されている漢字1文字の読みを検索して、該当する読みを当該熟語又は漢字1文字のルビとして設定し、前記表示部に表示されている英単語、アルファベット、数字又は記号に対して、前記英単語等記憶部に記憶されている英単語、アルファベット、数字又は記号の読みを検索して、該当する読みを英単語、アルファベット、数字又は記号のルビとして設定し、前記表示部に表示されるテキストに設定したルビを表示するルビ設定表示機能と、前記表示部に表示された、テキストの一部を作業者が指定した場合、指定した範囲における設定されたルビの削除及び/又は修正を含むルビの編集、又は指定した範囲におけるテキストの削除及び/又は修正を含むテキストの編集を作業者が可能となるように編集画面を前記表示部に表示させ、作業者によって編集されたルビ又はテキストを当該電子図書のルビ又はテキストとして設定する編集機能とを電子図書再生装置に実現させることを特徴としている。
この構成を採用することによって、テキストやテキストに設定されたルビが間違っている場合に、その間違ったテキストやルビを修正することができ、これにより音声合成エンジンの音声合成を正確なものとすることができ、また音声データが予め記憶されている場合には、再生される音声データに対して正しいテキストやルビを設定することができる。
According to the electronic book reproduction program according to the present invention, a display unit that displays the text of the electronic book, a voice synthesis engine that synthesizes voice based on the text of the electronic book, voice data that reads out the text of the electronic book, and the voice. An output unit that outputs the voice generated by the synthesis engine or the voice data, a compound word storage unit that stores the reading of a compound word composed of a plurality of kanji for the plurality of compound words, and a reading for each kanji character. , A kanji storage unit that stores a plurality of kanji, and an English word storage unit that stores readings of English words, alphabets, numbers and symbols for a plurality of English words, alphabets, numbers and symbols. This is an electronic book reproduction program that can be read by the electronic book reproduction device, and is a reading of the compound words stored in the compound word storage unit and the kanji characters in the text of the electronic book displayed on the display unit. The reading of one kanji character stored in the storage unit is searched, the corresponding reading is set as the compound word or the ruby of one kanji character, and the English word, alphabet, number or symbol displayed in the display unit is set. On the other hand, the readings of English words, alphabets, numbers or symbols stored in the storage unit such as English words are searched, the corresponding readings are set as ruby of English words, alphabets, numbers or symbols, and the display unit is used. The ruby setting display function that displays the ruby set in the text displayed in, and when the operator specifies a part of the text displayed on the display unit, the set ruby is deleted in the specified range and / Alternatively, the editing screen is displayed on the display unit so that the operator can edit the ruby including the correction, or delete the text in the specified range and / or edit the text including the correction, and the text is edited by the operator. It is characterized in that the electronic book playback device is provided with an editing function for setting a ruby or a text as a ruby or a text of the electronic book.
By adopting this configuration, if the text or ruby set in the text is incorrect, the incorrect text or ruby can be corrected, which makes the speech synthesis of the speech synthesis engine accurate. In addition, when the voice data is stored in advance, the correct text or ruby can be set for the voice data to be reproduced.

また、前記編集機能は、音声マークアップ言語を設定し又は設定されている音声マークアップ言語を編集可能であることを特徴としてもよい。
この構成によれば、抑揚やアクセント等をつけた音声再生を実行するための音声マークアップ言語の編集も可能となるため、より聞きやすい音声とすることができる。
Further, the editing function may be characterized in that a voice markup language is set or the set voice markup language can be edited.
According to this configuration, it is possible to edit the voice markup language for executing voice reproduction with intonation and accent, so that the voice can be made easier to hear.

本発明の電子図書再生装置及び電子図書再生プログラムによれば、間違ったルビが設定されている場合でも正確なルビに修正することができ、正確な音声合成を実行することができる。 According to the electronic book reproduction device and the electronic book reproduction program of the present invention, even if an incorrect ruby is set, it can be corrected to an accurate ruby, and accurate speech synthesis can be performed.

電子図書再生装置としてのタブレットコンピュータの外観図である。It is an external view of a tablet computer as an electronic book reproduction device. 電子図書再生装置の内部構成を示すブロック図である。It is a block diagram which shows the internal structure of an electronic book reproduction apparatus. 表示部に電子図書のテキストを表示させたところを示す説明図である。It is explanatory drawing which shows the place where the text of an electronic book is displayed on the display part. ルビ設定機能を実行した際に表示部に表示される画面の説明図である。It is explanatory drawing of the screen displayed on the display part when the ruby setting function is executed. 図4においてルビ編集を実行すべき部分を選択したところを示す説明図である。It is explanatory drawing which shows the place where the part which should execute ruby editing is selected in FIG. 表示部に表示されるルビ編集画面の説明図である。It is explanatory drawing of the ruby editing screen displayed on the display part. 表示部に表示されるルビ編集後の画面を示す説明図である。It is explanatory drawing which shows the screen after ruby editing which is displayed on the display part.

(電子図書について)
まず、ルビの設定対象となる電子図書について説明する。
電子図書としては、タブレットコンピュータ等の携帯端末によって表示可能な教科書コンテンツ等が挙げられる。
本実施形態では、電子図書であればどのような形式であってもよいが、テキストデータとしてルビを設定できるデータ形式であることが必要である。
(About electronic books)
First, an electronic book for which ruby is set will be described.
Examples of electronic books include textbook contents that can be displayed by a mobile terminal such as a tablet computer.
In the present embodiment, any format may be used as long as it is an electronic book, but it is necessary that the data format is such that ruby can be set as text data.

(電子図書再生装置)
次に電子図書再生装置について、図1、図2に基づいて説明する。
電子図書再生装置30は、具体的には通常のタブレットコンピュータを採用することができる。タブレットコンピュータとは、タッチパネルで構成された表示部31を有し、通常のコンピュータ機能を有する携帯端末である。作業者による入力はタッチパネルにより行われる。
ただし、電子図書再生装置30としては、タブレットコンピュータに限定するものではなく、いわゆるデスクトップコンピュータやノートパソコン等であってもよく、また電子図書再生装置としての専用機であってもよい。
(Electronic book playback device)
Next, the electronic book reproduction device will be described with reference to FIGS. 1 and 2.
Specifically, as the electronic book reproducing device 30, a normal tablet computer can be adopted. The tablet computer is a mobile terminal having a display unit 31 composed of a touch panel and having a normal computer function. Input by the operator is performed by the touch panel.
However, the electronic book playback device 30 is not limited to the tablet computer, and may be a so-called desktop computer, a laptop computer, or the like, or may be a dedicated machine as the electronic book playback device.

電子図書再生装置30は、CPU、ROM及びRAM等のメモリを有する制御部32と、予めデータやプログラムを記憶しておくことができる記憶装置34と、タッチパネルにより入力部を兼ねた表示部31と、音声出力する出力部38とを備えている。出力部38は、具体的にはスピーカである。
記憶装置34には、電子図書が予め記憶されており、後述する電子図書再生プログラムP1が記憶装置34から電子図書を読み出してテキストを表示部31に表示させる。
The electronic book playback device 30 includes a control unit 32 having memories such as a CPU, ROM, and RAM, a storage device 34 that can store data and programs in advance, and a display unit 31 that also serves as an input unit by a touch panel. It is provided with an output unit 38 that outputs audio. Specifically, the output unit 38 is a speaker.
An electronic book is stored in the storage device 34 in advance, and the electronic book reproduction program P1 described later reads the electronic book from the storage device 34 and displays the text on the display unit 31.

記憶装置34には、テキストに基づいて音声合成する音声合成エンジン40が記憶されている。音声合成エンジンは、TTS(Text To Speech)とも呼ばれることもあるが、テキストを読み上げることができるソフトウェアのことであり、現在市場において一般的に公知となっているソフトウェアを採用することができる。 The storage device 34 stores a speech synthesis engine 40 that synthesizes speech based on text. The speech synthesis engine, which is also called TTS (Text To Speech), is software that can read aloud text, and software that is generally known in the market at present can be adopted.

記憶装置34には、複数の漢字で構成された熟語の読みを、複数の熟語について記憶している熟語記憶部41と、漢字1文字ごとの読みを、複数の漢字について記憶している漢字記憶部42と、英単語、アルファベット、数字及び記号の読みを、複数の英単語、アルファベット、数字及び記号について記憶している英単語等記憶部49とを備えている。
熟語記憶部41と漢字記憶部42と英単語等記憶部49とによって、ルビが設定されていないテキストに対して、後述する電子図書再生プログラムP1によって自動的にルビを設定することができる。
The storage device 34 has a compound word storage unit 41 that stores readings of compound words composed of a plurality of kanji for a plurality of compound words, and a kanji storage unit that stores readings for each kanji character for a plurality of kanji characters. A unit 42 and an English word storage unit 49 that stores readings of English words, alphabets, numbers, and symbols for a plurality of English words, alphabets, numbers, and symbols are provided.
The compound word storage unit 41, the kanji storage unit 42, and the English word storage unit 49 can automatically set ruby for text for which ruby is not set by the electronic book reproduction program P1 described later.

また、記憶装置34には、電子図書再生プログラムP1が記憶されている。
電子図書再生プログラムP1は、電子図書のテキストを表示部31に表示させるテキスト表示機能43、表示部31に表示されているテキストを音声合成エンジン40を使って音声再生する音声再生機能44、表示部31に表示されたテキストのページをめくるページめくり機能45、を備え、制御部32に電子図書再生プログラムP1が読み出されて制御部32がこれらの各機能を実行する。
ページめくり機能45は、音声再生が実行されている場合に、表示部31に表示されている箇所の音声再生終了とともに自動的に次ページに移行して音声再生もそのまま自動的に続行する機能や、視聴者の操作によって前ページに戻る、次ページへ進む、複数ページ戻る、複数ページ進むなどを行う機能を有している。
Further, the electronic book reproduction program P1 is stored in the storage device 34.
The electronic book reproduction program P1 has a text display function 43 for displaying the text of the electronic book on the display unit 31, a voice reproduction function 44 for reproducing the text displayed on the display unit 31 by using the voice synthesis engine 40, and a display unit. The page turning function 45 for turning the page of the text displayed on the 31 is provided, the electronic book reproduction program P1 is read by the control unit 32, and the control unit 32 executes each of these functions.
The page turning function 45 is a function that automatically shifts to the next page and automatically continues the audio reproduction as it is when the audio reproduction of the portion displayed on the display unit 31 is completed when the audio reproduction is executed. , It has a function to return to the previous page, advance to the next page, return to multiple pages, advance to multiple pages, etc. by the operation of the viewer.

電子図書再生プログラムP1は、ルビ設定機能46と、編集機能48を備えている。ただし、ルビ設定機能46は、電子図書再生プログラムP1から独立した別のプログラムによって動作するものであってもよい。
ルビ設定機能46は、ルビが設定されていない電子図書に対してルビを設定するものであり、例えば、以下のような動作を実行する。
制御部32が実行するルビ設定機能46は、電子図書のテキストデータ内の漢字を検索し、漢字と認識された文字については、当該漢字が熟語の場合には熟語記憶部41から熟語の読みを検索し、当該漢字が1文字の場合には漢字記憶部42から漢字の読みを検索する。
また、制御部32が実行するルビ設定機能46は、電子図書のテキストデータ内の英単語、アルファベット、数字及び記号を検索し、これらに該当すると認識された場合は、英単語等記憶部49からこれらの読みを検索する。
ただし、ルビ設定機能46は、英単語、アルファベット、数字、記号についてはルビの設定が不要である場合には、読みの検索を実行しなくてもよい。英単語等について読みを実行するか否かは視聴者がルビ設定機能46を操作して設定を可能とすることができる。
The electronic book reproduction program P1 includes a ruby setting function 46 and an editing function 48. However, the ruby setting function 46 may be operated by another program independent of the electronic book reproduction program P1.
The ruby setting function 46 sets ruby for an electronic book in which ruby is not set, and executes, for example, the following operations.
The ruby setting function 46 executed by the control unit 32 searches for a kanji in the text data of the electronic book, and if the kanji is a kanji, the kanji is read from the kanji storage unit 41. The search is performed, and if the kanji is one character, the reading of the kanji is searched from the kanji storage unit 42.
Further, the ruby setting function 46 executed by the control unit 32 searches for English words, alphabets, numbers and symbols in the text data of the electronic book, and when it is recognized that they correspond to these, the English word or the like storage unit 49 is used. Search for these readings.
However, the ruby setting function 46 does not have to execute the reading search when the ruby setting is not required for English words, alphabets, numbers, and symbols. The viewer can operate the ruby setting function 46 to set whether or not to read English words and the like.

制御部32は、ルビ設定機能46によって検索された漢字又は英単語等の読みに基づいて、電子図書の漢字又は英単語等にルビを設定する。設定されたルビは、電子図書のテキストとともに表示部31に表示される。
また、設定されたルビは電子図書とともに記憶装置34に記憶される。
The control unit 32 sets ruby in the kanji or English words of the electronic book based on the reading of the kanji or English words searched by the ruby setting function 46. The set ruby is displayed on the display unit 31 together with the text of the electronic book.
Further, the set ruby is stored in the storage device 34 together with the electronic book.

音声合成エンジン40は、表示部31に表示されたルビに基づいて音声合成を実行する。
したがって、ルビ設定機能46によって間違ったルビが設定されてしまうと、音声合成も正確に行われず、間違った音声が再生されてしまう。
そこで、視聴者が間違ったルビを見つけた場合には、間違ったルビを修正することができるようにする機能が編集機能48である。
The voice synthesis engine 40 executes voice synthesis based on the ruby displayed on the display unit 31.
Therefore, if the wrong ruby is set by the ruby setting function 46, the voice synthesis is not performed accurately and the wrong voice is reproduced.
Therefore, when the viewer finds the wrong ruby, the editing function 48 is a function that enables the wrong ruby to be corrected.

以下、編集機能48の動作を説明する。
図3は、電子図書再生装置30の表示部31に表示されている電子図書のテキストである。
電子図書再生装置30の表示部31には、電子図書再生プログラムP1の機能により再生ボタン50、巻き戻しボタン51、早送りボタン52、前ページボタン53、次ぺージボタン54が表示される。視聴者はこれらのボタンのうち再生ボタン50を操作することによって、音声再生を実行することができる。
また表示部31には編集ボタン56も表示される。視聴者がルビの設定を行いたい場合に編集ボタン56を操作する。すると、制御部32の編集機能48が、表示部31に図4に示すような編集画面を表示する。
The operation of the editing function 48 will be described below.
FIG. 3 is a text of an electronic book displayed on the display unit 31 of the electronic book reproducing device 30.
The display unit 31 of the electronic book reproduction device 30 displays a reproduction button 50, a rewind button 51, a fast forward button 52, a previous page button 53, and a next page button 54 by the function of the electronic book reproduction program P1. The viewer can execute audio reproduction by operating the play button 50 among these buttons.
The edit button 56 is also displayed on the display unit 31. When the viewer wants to set ruby, the edit button 56 is operated. Then, the editing function 48 of the control unit 32 displays the editing screen as shown in FIG. 4 on the display unit 31.

図4に示す編集画面では、テキストを句読点ごとに区切って四角形状の枠でテキストを囲んでいる。すなわち、制御部32の編集機能48が、テキストを句読点で区分し、区分した句読点で句切られた範囲毎に枠を表示するように動作する。
次に視聴者は、ルビ設定ボタン57を操作することによってルビ設定機能46を実行させる。ルビ設定ボタン57が操作されることによって、制御部32のルビ設定機能46は、ルビの設定を実行する。ルビ設定は上述してきた工程で実行される。
In the editing screen shown in FIG. 4, the text is divided by punctuation marks and the text is surrounded by a square frame. That is, the editing function 48 of the control unit 32 operates so as to divide the text by punctuation marks and display a frame for each range delimited by the divided punctuation marks.
Next, the viewer executes the ruby setting function 46 by operating the ruby setting button 57. By operating the ruby setting button 57, the ruby setting function 46 of the control unit 32 executes the ruby setting. The ruby setting is executed in the process described above.

図5の編集画面では、ルビの設定後の状態を示しているが、間違ったルビが設定されている箇所がある。この実施例でいうと本文1行目の「小供」に「しょうきょう」というルビが設定されており、本文4行目の「一人」に「いちにん」というルビが設定されている。
1行目の「小供」は原文通りの漢字表記であり、このような漢字の使い方は現在使用されていないためルビの設定に間違いが生じたものと考えられる。
なお、ここで視聴者は、ルビの編集だけでなくテキストの修正や削除も実行することができる。例えば上記のように、テキスト本文が、現代において用いられている漢字ではない場合などにおいてテキストの編集は有効である。
The edit screen of FIG. 5 shows the state after the ruby is set, but there is a place where the wrong ruby is set. In this embodiment, the ruby "Shokyo" is set in the "small offering" on the first line of the text, and the ruby "Ichinin" is set in the "one person" on the fourth line of the text.
The first line, "Kosuke," is the original kanji notation, and it is probable that there was an error in the ruby setting because such usage of kanji is not currently used.
Here, the viewer can not only edit the ruby but also modify or delete the text. For example, as described above, text editing is effective when the text text is not the kanji used in modern times.

このままの状態で音声再生を実行すると、音声合成エンジン40は間違った読みで再生を実行してしまう。
そこで、視聴者は、図5に示すように、修正したルビが含まれている区分を選択し、編集ボタン58を操作することにより、制御部32の編集機能48を実行させる。図5では視聴者が選択した個所はハイライト表示されている。
編集ボタン58が操作されると、制御部32は編集機能48を実行して、選択された区分を別画面である図6に示すようなルビ編集画面を表示部31に表示させる。
視聴者は、図6のルビ編集画面において間違っているルビを修正することができる。なお、この画面上ではルビの削除も可能である。ルビの修正は、視聴者が修正したいルビを指定し、その部分を日本語入力システムにより正しいルビを入力することで実行することができる。なお、視聴者は、ルビ編集画面に表示されているテキストの修正や削除を実行することもできる。
If the voice reproduction is executed in this state, the voice synthesis engine 40 executes the reproduction with an erroneous reading.
Therefore, as shown in FIG. 5, the viewer selects the section containing the modified ruby and operates the edit button 58 to execute the edit function 48 of the control unit 32. In FIG. 5, the part selected by the viewer is highlighted.
When the edit button 58 is operated, the control unit 32 executes the edit function 48 to display the selected division on the display unit 31 as a ruby edit screen as shown in FIG. 6, which is a separate screen.
The viewer can correct the wrong ruby on the ruby editing screen of FIG. It is also possible to delete ruby on this screen. The ruby can be modified by specifying the ruby that the viewer wants to modify and inputting the correct ruby using the Japanese input system. The viewer can also modify or delete the text displayed on the ruby editing screen.

図7に編集機能48の実行終了後のルビの状況を示す。ここでは図6に示したように「小供」のルビとして「こども」と正しく修正された結果が表示され、視聴者は修正結果を確認することができる。
制御部32の編集機能48は、修正した結果のルビを電子図書とともに記憶装置34に記憶する。
FIG. 7 shows the state of ruby after the execution of the editing function 48 is completed. Here, as shown in FIG. 6, the result correctly corrected as "child" is displayed as the ruby of "small offering", and the viewer can confirm the corrected result.
The editing function 48 of the control unit 32 stores the ruby as a result of the correction in the storage device 34 together with the electronic book.

編集機能48を操作してテキストやルビの編集を実行した視聴者は、図6の編集画面に設定されている再生ボタン60を操作することにより、音声合成エンジン40を実行させてテキスト通りに正しく音声出力されているか確認できる。視聴者は、確認後さらに間違った音声が出力されていると判断した場合には、そのままの画面でさらに編集を行うことができる。このように、本実施形態では、ルビやテキストの修正と音声再生とを、繰り返し交互に実行できるため、ルビやテキストを確実に修正して正確な音声再生を実行することができる。 The viewer who has operated the editing function 48 to edit the text or ruby can operate the play button 60 set on the editing screen of FIG. 6 to execute the voice synthesis engine 40 and correctly follow the text. You can check if the audio is output. If the viewer determines that the wrong sound is being output after confirmation, the viewer can make further edits on the screen as it is. As described above, in the present embodiment, the ruby or text correction and the voice reproduction can be repeatedly and alternately executed, so that the ruby or the text can be reliably corrected and the accurate voice reproduction can be executed.

なお、上述してきた実施形態では、ルビの修正を図6のように通常のテキスト文書で実行した。
しかしながら、ルビをテキスト文書ではなく音声マークアップ言語で編集可能としてもよい。音声マークアップ言語とは、SSML(Speech Synthesis Markup Language)とも呼ばれることがある。音声マークアップ言語は、テキストを音声合成エンジンによって音声合成する場合に、抑揚やアクセント等をつけるようにできるものである。音声マークアップ言語を編集した後に音声の再生をすることで、正しい抑揚やアクセント等になっているかを確認しながら編集することができる。
In the above-described embodiment, the ruby correction is performed in a normal text document as shown in FIG.
However, ruby may be editable in a voice markup language rather than a text document. Speech markup language may also be referred to as SSML (Speech Synthesis Markup Language). The speech markup language can add inflections, accents, etc. when synthesizing text by a speech synthesis engine. By playing back the voice after editing the voice markup language, it is possible to edit while checking whether the inflection and accent are correct.

また、上述してきた実施形態では、音声合成エンジンを備えた場合について説明してきた。
しかし、音声再生は、予め電子図書のテキストを読み上げた音声データを記憶装置34に記憶させておき、この音声データを再生してもよい。
音声データが予め記憶されている場合であっても、視聴者はルビやテキスト本文と音声が相違することが判断できるので、上述した編集機能48を用いてルビやテキストの編集を実行することができる。
Further, in the above-described embodiment, the case where the speech synthesis engine is provided has been described.
However, in the voice reproduction, the voice data obtained by reading the text of the electronic book in advance may be stored in the storage device 34, and the voice data may be reproduced.
Even if the audio data is stored in advance, the viewer can determine that the audio is different from the ruby or text text, so that the ruby or text can be edited using the above-mentioned editing function 48. it can.

また、上述してきた電子図書再生装置は、ルビ設定機能と編集機能を備えたことにより、ルビの設定装置としても用いることができる。
例えば、今は再生する必要はないがルビを正確に設定したいという電子図書が存在する場合には、当該電子図書を記憶装置に記憶させ、ルビ設定機能を実行して電子図書にルビを設定し、且つ編集機能を実行して間違ったルビを正しく修正し、正しく修正されたルビを電子図書とともに記憶装置に記憶させる。
ルビを正確に設定した電子図書は、必要に応じて記憶装置から読み出して再生してもよいし、他の機器へデータ移動させて他の機器で再生等を実行してもよい。
Further, the electronic book playback device described above can also be used as a ruby setting device because it has a ruby setting function and an editing function.
For example, if there is an electronic book that does not need to be played now but wants to set ruby accurately, store the electronic book in a storage device and execute the ruby setting function to set ruby in the electronic book. In addition, the editing function is executed to correct the wrong ruby correctly, and the correctly corrected ruby is stored in the storage device together with the electronic book.
An electronic book in which ruby is set accurately may be read from a storage device and played back as needed, or data may be moved to another device and played back on another device.

以上本発明につき好適な実施形態を挙げて種々説明したが、本発明はこの実施形態に限定されるものではなく、発明の精神を逸脱しない範囲内で多くの改変を施し得るのはもちろんである。 The present invention has been described in various ways with reference to suitable embodiments, but the present invention is not limited to this embodiment, and it goes without saying that many modifications can be made without departing from the spirit of the invention. ..

30 電子図書再生装置
31 表示部
32 制御部
34 記憶装置
38 出力部
40 音声合成エンジン
41 熟語記憶部
42 漢字記憶部
43 テキスト表示機能
44 音声再生機能
45 ページめくり機能
46 ルビ設定機能
48 編集機能
49 英単語等記憶部
50 再生ボタン
51 巻き戻しボタン
52 早送りボタン
53 前ページボタン
54 次ページボタン
56 編集ボタン
57 ルビ設定ボタン
58 編集ボタン
60 再生ボタン
P1 電子図書再生プログラム
30 Electronic book playback device 31 Display unit 32 Control unit 34 Storage device 38 Output unit 40 Voice synthesis engine 41 Jukugo storage unit 42 Kanji storage unit 43 Text display function 44 Voice playback function 45 Page turning function 46 Ruby setting function 48 Editing function 49 English Word storage unit 50 Play button 51 Rewind button 52 Fast forward button 53 Previous page button 54 Next page button 56 Edit button 57 Ruby setting button 58 Edit button 60 Play button P1 Electronic book playback program

Claims (4)

電子図書のテキストを表示する表示部と、
電子図書のテキストに基づいて音声合成する音声合成エンジン又は電子図書のテキストを読み上げた音声データと、
前記音声合成エンジンによって生成された音声又は前記音声データを出力する出力部と、
複数の漢字で構成された熟語の読みを、複数の熟語について記憶している熟語記憶部と、
漢字1文字ごとの読みを、複数の漢字について記憶している漢字記憶部と、
英単語、アルファベット、数字及び記号の読みを、複数の英単語、アルファベット、数字及び記号について記憶している英単語等記憶部と、
前記表示部に表示されている電子図書のテキストにおける漢字に対して、前記熟語記憶部に記憶されている熟語の読み及び前記漢字記憶部に記憶されている漢字1文字の読みを検索して、該当する読みを当該熟語又は漢字1文字のルビとして設定し、前記表示部に表示されている英単語、アルファベット、数字又は記号に対して、前記英単語等記憶部に記憶されている英単語、アルファベット、数字又は記号の読みを検索して、該当する読みを英単語、アルファベット、数字又は記号のルビとして設定し、前記表示部に表示されるテキストに設定したルビを表示するルビ設定表示手段と、
前記表示部に表示された、テキストの一部を作業者が指定した場合、指定した範囲における設定されたルビの削除及び/又は修正を含むルビの編集、又は指定した範囲におけるテキストの削除及び/又は修正を含むテキストの編集を作業者が可能となるように編集画面を前記表示部に表示させ、作業者によって編集されたルビ又はテキストを当該電子図書のルビ又はテキストとして設定する編集手段とを具備することを特徴とする電子図書再生装置。
A display unit that displays the text of electronic books,
A voice synthesis engine that synthesizes voice based on the text of an electronic book, or voice data that reads out the text of an electronic book,
An output unit that outputs the voice generated by the voice synthesis engine or the voice data,
An idiom memory unit that memorizes the reading of idioms composed of multiple kanji for multiple idioms,
A kanji memory unit that memorizes the reading of each kanji character for multiple kanji characters,
A memory unit such as English words that memorizes the readings of English words, alphabets, numbers and symbols for multiple English words, alphabets, numbers and symbols,
For the kanji in the text of the electronic book displayed on the display unit, the reading of the compound word stored in the compound word storage unit and the reading of one kanji character stored in the kanji storage unit are searched for. The corresponding reading is set as the ruby of the compound word or one kanji character, and for the English word, alphabet, number or symbol displayed on the display unit, the English word stored in the storage unit such as the English word, A ruby setting display means that searches for readings of alphabets, numbers, or symbols, sets the corresponding readings as ruby of English words, alphabets, numbers, or symbols, and displays the ruby set in the text displayed on the display unit. ,
When a worker specifies a part of the text displayed on the display unit, the ruby is edited including the deletion and / or correction of the set ruby in the specified range, or the text is deleted and / / in the specified range. Alternatively, an editing means for displaying an editing screen on the display unit so that the operator can edit the text including correction and setting the ruby or text edited by the operator as the ruby or text of the electronic book. An electronic book playback device characterized by being equipped.
前記編集手段は、音声マークアップ言語を設定し又は設定されている音声マークアップ言語を編集可能であることを特徴とする請求項1記載の電子図書再生装置。 The electronic book playback device according to claim 1, wherein the editing means sets a voice markup language or can edit the set voice markup language. 電子図書のテキストを表示する表示部と、電子図書のテキストに基づいて音声合成する音声合成エンジン又は電子図書のテキストを読み上げた音声データと、前記音声合成エンジンによって生成された音声又は前記音声データを出力する出力部と、複数の漢字で構成された熟語の読みを、複数の熟語について記憶している熟語記憶部と、漢字1文字ごとの読みを、複数の漢字について記憶している漢字記憶部と、英単語、アルファベット、数字及び記号の読みを、複数の英単語、アルファベット、数字及び記号について記憶している英単語等記憶部と、を具備する電子図書再生装置に読み取り可能な電子図書再生プログラムであって、
前記表示部に表示されている電子図書のテキストにおける漢字に対して、前記熟語記憶部に記憶されている熟語の読み及び前記漢字記憶部に記憶されている漢字1文字の読みを検索して、該当する読みを当該熟語又は漢字1文字のルビとして設定し、前記表示部に表示されている英単語、アルファベット、数字又は記号に対して、前記英単語等記憶部に記憶されている英単語、アルファベット、数字又は記号の読みを検索して、該当する読みを英単語、アルファベット、数字又は記号のルビとして設定し、前記表示部に表示されるテキストに設定したルビを表示するルビ設定表示機能と、
前記表示部に表示された、テキストの一部を作業者が指定した場合、指定した範囲における設定されたルビの削除及び/又は修正を含むルビの編集、又は指定した範囲におけるテキストの削除及び/又は修正を含むテキストの編集を作業者が可能となるように編集画面を前記表示部に表示させ、作業者によって編集されたルビ又はテキストを当該電子図書のルビ又はテキストとして設定する編集機能とを電子図書再生装置に実現させることを特徴とする電子図書再生プログラム。
A display unit that displays the text of the electronic book, a voice synthesis engine that synthesizes voice based on the text of the electronic book, voice data that reads out the text of the electronic book, and voice or voice data generated by the voice synthesis engine. An output unit that outputs, a compound word storage unit that stores readings of compound words composed of multiple kanji for multiple compound words, and a kanji storage unit that stores readings for each kanji character for multiple kanji characters. And electronic book reproduction that can be read by an electronic book reproduction device including an English word storage unit that stores readings of English words, alphabets, numbers and symbols for a plurality of English words, alphabets, numbers and symbols. It ’s a program
For the kanji in the text of the electronic book displayed on the display unit, the reading of the compound word stored in the compound word storage unit and the reading of one kanji character stored in the kanji storage unit are searched for. The corresponding reading is set as the ruby of the compound word or one kanji character, and for the English word, alphabet, number or symbol displayed on the display unit, the English word stored in the storage unit such as the English word, With a ruby setting display function that searches for readings of alphabets, numbers or symbols, sets the corresponding readings as ruby of English words, alphabets, numbers or symbols, and displays the ruby set in the text displayed on the display unit. ,
When a worker specifies a part of the text displayed on the display unit, the ruby is edited including the deletion and / or correction of the set ruby in the specified range, or the text is deleted and / / in the specified range. Alternatively, an editing function is provided such that an editing screen is displayed on the display unit so that the operator can edit the text including correction, and the ruby or text edited by the operator is set as the ruby or text of the electronic book. An electronic book playback program characterized by being realized in an electronic book playback device.
前記編集機能は、音声マークアップ言語を設定し又は設定されている音声マークアップ言語を編集可能であることを特徴とする請求項3記載の電子図書再生プログラム。 The electronic book reproduction program according to claim 3, wherein the editing function sets a voice markup language or can edit the set voice markup language.
JP2019034618A 2019-02-27 2019-02-27 Electronic book reproducing device and digital book reproducing program Pending JP2020140374A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019034618A JP2020140374A (en) 2019-02-27 2019-02-27 Electronic book reproducing device and digital book reproducing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019034618A JP2020140374A (en) 2019-02-27 2019-02-27 Electronic book reproducing device and digital book reproducing program

Publications (1)

Publication Number Publication Date
JP2020140374A true JP2020140374A (en) 2020-09-03

Family

ID=72280511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019034618A Pending JP2020140374A (en) 2019-02-27 2019-02-27 Electronic book reproducing device and digital book reproducing program

Country Status (1)

Country Link
JP (1) JP2020140374A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023043552A (en) * 2021-09-16 2023-03-29 三和書籍有限会社 Electronic book reading device and electronic book reading program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023043552A (en) * 2021-09-16 2023-03-29 三和書籍有限会社 Electronic book reading device and electronic book reading program

Similar Documents

Publication Publication Date Title
US8160881B2 (en) Human-assisted pronunciation generation
EP0216129B1 (en) Apparatus for making and editing dictionary entries in a text to speech conversion system
JP5106608B2 (en) Reading assistance apparatus, method, and program
JP2018180519A (en) Voice recognition error correction support device and program therefor
KR100931464B1 (en) Recording medium recording voice output device and voice output program
JP2007219218A (en) Electronic equipment for language learning and translation reproducing method
JP2020140374A (en) Electronic book reproducing device and digital book reproducing program
CN110782899B (en) Information processing apparatus, storage medium, and information processing method
JP5082971B2 (en) A speech synthesizer and a reading system using the same.
JP2018146961A (en) Voice reproduction device and voice reproduction program
JP7119857B2 (en) Editing program, editing method and editing device
JP6392445B2 (en) Transliteration support device, transliteration support method, and transliteration support program
JPS6184771A (en) Voice input device
JP5057764B2 (en) Speech synthesis apparatus and speech synthesis program
JP2019175245A (en) Speech synthesizer
JP2015055793A (en) Voice synthesizer, voice synthesizing method, and program
CN110955401B (en) Sound playback interval control method, computer-readable storage medium, and information processing apparatus
JP2007219219A (en) Electronic device for language learning and creation method of sentence list for learning
JPS628813B2 (en)
JP5147008B2 (en) Electronic device, display control method, and program
JP6446801B2 (en) Display control apparatus and program
JP2012073338A (en) Speech synthesizer and speech synthesis method
JP4830548B2 (en) Information display device and information display program
JPH10312377A (en) Text speech synthesizing device and computer-readable recording medium where text speech synthesizing process program is recorded
JP2021140084A (en) Voice recognition error correction support device, program and method, and voice recognition device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20211116