JP2014215415A - Voice output system - Google Patents

Voice output system Download PDF

Info

Publication number
JP2014215415A
JP2014215415A JP2013091850A JP2013091850A JP2014215415A JP 2014215415 A JP2014215415 A JP 2014215415A JP 2013091850 A JP2013091850 A JP 2013091850A JP 2013091850 A JP2013091850 A JP 2013091850A JP 2014215415 A JP2014215415 A JP 2014215415A
Authority
JP
Japan
Prior art keywords
phrase
language
voice
unit
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013091850A
Other languages
Japanese (ja)
Inventor
健 有坂
Takeshi Arisaka
健 有坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
A & F CORP CO Ltd
Original Assignee
A & F CORP CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by A & F CORP CO Ltd filed Critical A & F CORP CO Ltd
Priority to JP2013091850A priority Critical patent/JP2014215415A/en
Publication of JP2014215415A publication Critical patent/JP2014215415A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Abstract

PROBLEM TO BE SOLVED: To provide an inexpensive voice output system capable of easily reproducing a phrase written in a paper book in a selected language.SOLUTION: A voice output system (100) is configured to output voice data for a paper book (110) consisting of a phrase including second languages as the translation of one sentence or the like written in a first language and a track having a plurality of phrases. The voice output system includes: an input part (121); a voice output part (122a) for outputting the voice data; a transmission/reception part connected to the Internet for transmitting/receiving the voice data; and a storage part for storing the voice data. The input part includes: capturing means for capturing the voice data in the storage part: phrase selection means for selecting a phrase; and mode selection means for selecting a language to be output. The voice output part outputs a voice on the basis of the selected phrase and the selected mode.

Description

本発明は、紙書籍に記載のフレーズを選択された言語で音声出力する音声出力システムに関する。   The present invention relates to an audio output system that outputs a phrase described in a paper book in a selected language.

語学学習用の紙書籍では、音声データをCD(Compact Disk)に録音し、CDが紙書籍に添付されて販売されている。しかし、CDは、単一の階層のみを有しており、その階層に配置することができるトラック数が99までという制限がある。そのため、紙書籍に記載されたフレーズごとの再生又は言語ごとの再生等の再生方法の細かい設定を行う場合には、フレーズごとに1つのトラックが使用され紙書籍に記載のすべてのフレーズを1枚のCDに収めることが困難であるため、複数のCDに音声データを収めなければならなかった。   In a paper book for language learning, voice data is recorded on a CD (Compact Disk), and the CD is attached to the paper book and sold. However, a CD has only a single layer, and there is a limit of 99 tracks that can be arranged in that layer. Therefore, when performing detailed settings for playback methods such as playback for each phrase described in a paper book or playback for each language, one track is used for each phrase, and all the phrases described in the paper book are stored one sheet. Because it is difficult to fit in a CD, audio data had to be put in a plurality of CDs.

一方、例えば、特許文献1では、ドットコードを有するアイコンが複数記載されたシートのアイコンに、音声データを有する音声ペンを接触させることにより、所定のフレーズの音声出力をさせる旨が示されている。この方法によれば、所定のフレーズ及びその言語を容易に選択することができ、フレーズ数の制限等もなくなる。   On the other hand, for example, Patent Document 1 discloses that a voice of a predetermined phrase is output by bringing a voice pen having voice data into contact with an icon of a sheet on which a plurality of icons having dot codes are described. . According to this method, a predetermined phrase and its language can be easily selected, and the number of phrases is not limited.

実登第3179231号公報Noto 3179231

しかし、特許文献1では、紙書籍を購入しようとする者は音声ペンも購入しなければならず、購入者に金銭的な負担を強いていた。また、フレーズを連続して再生するなどできず、機能的な制限があった。
そこで、本発明は、携帯端末等を利用して、紙書籍に記載されたフレーズを選択された言語で容易に再生することができる音声出力システムを提供することを目的とする。
However, in Patent Document 1, a person who wants to purchase a paper book must also purchase a voice pen, which imposes a financial burden on the purchaser. In addition, the phrase cannot be played continuously, and there are functional limitations.
Accordingly, an object of the present invention is to provide an audio output system capable of easily reproducing a phrase described in a paper book in a selected language using a portable terminal or the like.

音声出力システムは、第1言語で記載された一単語、一文又は一段落に対して一単語、一文又は一段落の翻訳である第2言語を含むフレーズと、フレーズを複数有するトラックとからなり、トラックを複数記載した紙書籍用の音声データを出力する音声出力システムである。この音声出力システムは、ディスプレイを介して所定の情報を入力する入力部と、音声データを出力する音声出力部と、インターネットに接続され音声データを送受信する送受信部と、送受信部を介して受信した音声データを記憶する記憶部と、を備え、入力部が、紙書籍を特定し、紙書籍に対応する音声データを記憶部に取り込む取込手段と、紙書籍のトラック及びフレーズを選択するトラック・フレーズ選択手段と、第1言語のみ出力する第1モード、第2言語のみ出力する第2モード、又は第1言語及び第2言語を出力する第3モードを選択するモード選択手段と、を有し、フレーズ選択手段で選択されたフレーズとモード選択手段で選択されたモードとに基づいて、音声出力部が音声を出力する。   The audio output system includes a phrase including a second language that is a translation of one word, one sentence, or one paragraph for one word, one sentence, or one paragraph described in a first language, and a track that includes a plurality of phrases. An audio output system that outputs audio data for a plurality of paper books. This audio output system includes an input unit that inputs predetermined information via a display, an audio output unit that outputs audio data, a transmission / reception unit that is connected to the Internet and transmits / receives audio data, and is received via the transmission / reception unit. A storage unit that stores audio data, and an input unit that identifies a paper book and takes in audio data corresponding to the paper book into the storage unit, and a track that selects a track and phrase of the paper book Phrase selection means and mode selection means for selecting a first mode for outputting only the first language, a second mode for outputting only the second language, or a third mode for outputting the first language and the second language. Based on the phrase selected by the phrase selecting means and the mode selected by the mode selecting means, the sound output unit outputs sound.

また音声出力システムは、入力部では、さらに選択された言語の音声を出力する順番及び音声の再生速度の少なくとも一つが入力される。   In the voice output system, at the input unit, at least one of the order of outputting the voice of the selected language and the playback speed of the voice are input.

さらに音声出力システムは、入力部、音声出力部、送受信部、及び記憶部が1つの携帯端末に備えられる。
さらに音声出力システムは、トラック・フレーズ選択手段が、音声出力装置の入力部に紙書籍の目次を表示し、目次から所定のフレーズの音声データを選択する。
そして音声出力システムは、トラック・フレーズ選択手段が、紙書籍のページ番号を選択し、さらに選択されたページに記載のフレーズを選択する。
Furthermore, the audio output system includes an input unit, an audio output unit, a transmission / reception unit, and a storage unit in one portable terminal.
Further, in the audio output system, the track / phrase selecting means displays the table of contents of the paper book on the input unit of the audio output device, and selects audio data of a predetermined phrase from the table of contents.
In the audio output system, the track / phrase selection means selects the page number of the paper book, and further selects the phrase described on the selected page.

また音声出力システムは、音声が入力され、音声のフレーズが解読される音声検出部を有する。
さらに音声出力システムは、トラック・フレーズ選択手段で複数のフレーズが選択され、選ばれた複数のフレーズから任意に選ばれた1つのフレーズを第1言語で音声出力する音声出力し、第1言語の出力の後に音声検出部にフレーズの翻訳を第2言語で発音された音声を入力し、音声入力されたフレーズの翻訳が正しいかどうかを判断するテストモードを有する。
The voice output system includes a voice detection unit that receives voice and decodes a phrase of the voice.
Furthermore, the audio output system outputs a sound in which a plurality of phrases are selected by the track / phrase selecting means, and one phrase arbitrarily selected from the selected plurality of phrases is output in sound in the first language. After the output, the speech detection unit has a test mode in which a speech that is pronounced in the second language is input to the speech detection unit, and it is determined whether the translation of the phrase input by speech is correct.

本発明によれば、安価であり、紙書籍に記載されたフレーズを選択された言語で容易に再生することができる音声出力システムを提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, the audio | voice output system which is cheap and can reproduce | regenerate easily the phrase described in the paper book in the selected language can be provided.

音声出力システム100の概略の構成を示した図である。1 is a diagram showing a schematic configuration of an audio output system 100. FIG. (a)は、音声データ131の階層を示した図である。 (b)は、携帯端末120の構成図である。(A) is the figure which showed the hierarchy of the audio | voice data 131. FIG. FIG. 2B is a configuration diagram of the mobile terminal 120. 音声出力システム100の操作手順が示されたフローチャートである。3 is a flowchart illustrating an operation procedure of the audio output system 100. (a)は、入力部121に複数の紙書籍の名前が表示されている携帯端末120の平面図である。 (b)は、入力部121にトラック番号及びフレーズ番号の選択画面が表示された携帯端末120の平面図である。(A) is a top view of the portable terminal 120 in which the names of a plurality of paper books are displayed on the input unit 121. FIG. 5B is a plan view of the mobile terminal 120 in which a track number and phrase number selection screen is displayed on the input unit 121. 入力部121に再生言語選択画面が表示された携帯端末120の平面図である。4 is a plan view of the mobile terminal 120 on which a playback language selection screen is displayed on an input unit 121. FIG. (a)は、入力部121に再生速度調整画面が表示された携帯端末120の平面図である。 (b)は、入力部121に再生順番調整画面が表示された携帯端末120の平面図である。(A) is a top view of the portable terminal 120 with the playback speed adjustment screen displayed on the input unit 121. FIG. FIG. 6B is a plan view of the mobile terminal 120 in which a playback order adjustment screen is displayed on the input unit 121. (a)は、紙書籍210の目次のページが示された図である。 (b)は、入力部121に目次設定画面が表示された携帯端末120の平面図である。(A) is a diagram showing a table of contents page of the paper book 210. FIG. FIG. 6B is a plan view of the mobile terminal 120 in which a table of contents setting screen is displayed on the input unit 121. 入力部121に音声検出機能設定画面が表示された携帯端末120の平面図である。4 is a plan view of the mobile terminal 120 on which a voice detection function setting screen is displayed on an input unit 121. FIG. (a)は、テスト機能の実施手順が示されたフローチャートである。 (b)は、テスト機能設定画面が表示された携帯端末120の平面図である。(A) is the flowchart in which the execution procedure of the test function was shown. (B) is a top view of the portable terminal 120 on which the test function setting screen is displayed.

以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、本発明の範囲は以下の説明において特に本発明を限定する旨の記載がない限り、これらの形態に限られるものではない。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. It should be noted that the scope of the present invention is not limited to these forms unless otherwise specified in the following description.

(第1実施形態)
<音声出力システム100の構成>
図1は、音声出力システム100の概略の構成を示した図である。音声出力システム100は、例えば、語学学習用であり複数の言語で所定のフレーズが記載された紙書籍110のフレーズを、複数の言語により音声出力するシステムである。フレーズは、例えば一単語、一文又は一段落である。また、フレーズは、複数のフレーズにより構成されるトラックに含まれる。フレーズ及びトラックの例としては、例えば、トラックが一連の会話文であるとすると、フレーズはその会話文の中の一文の文章である。またこのとき、各フレーズは、日本語及び英語等の複数の言語により表されている。
(First embodiment)
<Configuration of Audio Output System 100>
FIG. 1 is a diagram showing a schematic configuration of an audio output system 100. The voice output system 100 is a system that, for example, is for language learning and outputs a phrase of a paper book 110 in which a predetermined phrase is written in a plurality of languages in a plurality of languages. The phrase is, for example, one word, one sentence, or one paragraph. The phrase is included in a track composed of a plurality of phrases. As an example of the phrase and the track, for example, if the track is a series of conversation sentences, the phrase is a sentence in the conversation sentence. At this time, each phrase is expressed in a plurality of languages such as Japanese and English.

音声出力システム100では、例えば、携帯端末120により音声が出力される。携帯端末120は、例えばスマートフォンである。以下、携帯端末120がスマートフォンとして説明する。携帯端末120は、一方の主面に、フラットパネルディスプレイにより形成される入力部121と、音声が出力される音声出力部122aと、音声が入力されると共にその音声を解読する音声検出部125(図2(b)参照)と、クラウド(クラウドコンピューティング)130等のネットワークに接続されて所定の音声データ131を受信する送受信部124(図2(b)参照)と、受信した音声データ131を記憶する記憶部126(図2(b)参照)と、を有している。音声データ131は、紙書籍110のフレーズ及びその翻訳である音声を含んでいる。例えば、紙書籍110においてフレーズが日本語で表されており、更にフレーズがその翻訳として英語によっても表されている場合、音声データ131は紙書籍110に記載のフレーズの日本語及び英語の音声を含む。音声検出部125は、外部から音声が入力されるマイクである音声入力部123を含んでいる。音声はスピーカーである音声出力部122aにより出力されても良いが、ヘッドフォンである音声出力部122bにより出力されても良い。また、フラットパネルディスプレイである入力部121は、例えば画面に触れることにより所定の情報を入力することができるタッチパネル等により形成される。フラットパネルディスプレイ以外にも曲面を有するフレキシブルディスプレイであってもよい。   In the audio output system 100, for example, audio is output from the mobile terminal 120. The mobile terminal 120 is a smartphone, for example. Hereinafter, the mobile terminal 120 will be described as a smartphone. The portable terminal 120 has, on one main surface, an input unit 121 formed by a flat panel display, an audio output unit 122a that outputs audio, and an audio detection unit 125 that receives audio and decodes the audio. 2 (b)), a transmission / reception unit 124 (see FIG. 2 (b)) connected to a network such as a cloud (cloud computing) 130 and receiving predetermined audio data 131, and the received audio data 131. And a storage unit 126 (see FIG. 2B) for storing. The voice data 131 includes a phrase of the paper book 110 and a voice that is a translation thereof. For example, when a phrase is expressed in Japanese in the paper book 110 and the phrase is also expressed in English as a translation thereof, the audio data 131 indicates the Japanese and English sounds of the phrase described in the paper book 110. Including. The voice detection unit 125 includes a voice input unit 123 that is a microphone into which voice is input from the outside. The sound may be output by the sound output unit 122a that is a speaker, or may be output by the sound output unit 122b that is a headphone. The input unit 121 that is a flat panel display is formed by a touch panel or the like that can input predetermined information by touching a screen, for example. In addition to a flat panel display, a flexible display having a curved surface may be used.

図2(a)は、ある紙書籍110の音声データ131の階層を示した図である。紙書籍110の音声データ131は、複数の階層から成り立つ階層構造により構成されている。例えば、図2(a)に示されるように、音声データ131は複数のトラックを有している。このトラックが第1階層として配置される。また、トラックが互いに異なる会話文(一文)により構成されている場合、各トラックは複数のフレーズを含む。このフレーズが第2階層となる。さらに、各フレーズは、日本語、中国語及び英語等の複数の言語で表現されている。この複数の言語が第3階層として配置される。図2(a)では、音声データ131がトラック1からトラック10の10のトラックにより構成され、トラック1がフレーズ1からフレーズ5の5つのフレーズから成り、フレーズ1が日本語及び英語で表されていることを示している。図2(a)では、トラック1及びフレーズ1の階層のみが示されているが、他のトラック及びフレーズも同様の階層構造を有している。   FIG. 2A is a diagram illustrating a hierarchy of audio data 131 of a certain paper book 110. The audio data 131 of the paper book 110 has a hierarchical structure composed of a plurality of hierarchies. For example, as shown in FIG. 2A, the audio data 131 has a plurality of tracks. This track is arranged as the first hierarchy. Moreover, when the track is composed of different conversation sentences (one sentence), each track includes a plurality of phrases. This phrase becomes the second hierarchy. Furthermore, each phrase is expressed in a plurality of languages such as Japanese, Chinese and English. The plurality of languages are arranged as the third hierarchy. In FIG. 2A, the audio data 131 is composed of 10 tracks from track 1 to track 10, track 1 is composed of five phrases 1 to 5, and phrase 1 is expressed in Japanese and English. It shows that. In FIG. 2A, only the hierarchy of track 1 and phrase 1 is shown, but the other tracks and phrases also have the same hierarchical structure.

図2(b)は、携帯端末120の構成図である。入力部121では、様々な情報を入力して携帯端末120に命令すると共に、様々な情報が表示される。携帯端末120は、入力部121に入力された命令により送受信部124がクラウド130から音声データ131をダウンロードし、記憶部126に記憶させる。記憶部126に記憶される音声データ131は、入力部121からの命令により音声出力部122a等から音声出力される。また、音声検出部125は、入力部121からの命令により音声入力部123を介して取り込んだ音声を解析し、音声を検出する。さらに音声検出部125は、取り込んだ音声のフレーズと紙書籍110のフレーズとが合致するか否かを判断する。   FIG. 2B is a configuration diagram of the mobile terminal 120. In the input unit 121, various information is input to instruct the portable terminal 120, and various information is displayed. In the portable terminal 120, the transmission / reception unit 124 downloads the audio data 131 from the cloud 130 according to the command input to the input unit 121, and stores it in the storage unit 126. The audio data 131 stored in the storage unit 126 is output as audio from the audio output unit 122 a or the like according to a command from the input unit 121. In addition, the voice detection unit 125 analyzes the voice taken in via the voice input unit 123 according to a command from the input unit 121 and detects the voice. Furthermore, the voice detection unit 125 determines whether or not the captured voice phrase matches the phrase of the paper book 110.

<音声出力システム100の操作手順>
図3は、音声出力システム100の操作手順が示されたフローチャートである。以下、図3のフローチャートを参照して音声出力システム100の操作手順を説明する。
<Operation Procedure of Audio Output System 100>
FIG. 3 is a flowchart showing an operation procedure of the audio output system 100. Hereinafter, the operation procedure of the audio output system 100 will be described with reference to the flowchart of FIG.

図3のステップS101では、操作者は、携帯端末120にインストールされているアプリケーションソフトウエアを起動する。携帯端末120には予め音声出力システム100用のアプリケーションソフトウエアをインストールさせておき、操作者は、音声出力システム100の使用を開始する場合にはこのアプリケーションソフトウエアを起動させる。   In step S <b> 101 of FIG. 3, the operator activates application software installed on the mobile terminal 120. Application software for the audio output system 100 is installed in the portable terminal 120 in advance, and the operator activates the application software when starting to use the audio output system 100.

ステップS102では、紙書籍110の音声データ131がダウンロードされているかどうかが判断される。音声データ131がダウンロードされていない場合にはステップS103に進み、音声データ131がダウンロードされている場合にはステップS105に進む。   In step S102, it is determined whether or not the audio data 131 of the paper book 110 has been downloaded. If the audio data 131 has not been downloaded, the process proceeds to step S103, and if the audio data 131 has been downloaded, the process proceeds to step S105.

ステップS103では、操作者は、携帯端末120の送受信部124(図2(b)参照)を介してクラウド130に接続し、クラウド130上で音声データ131をダウンロードするために紙書籍110を特定する。紙書籍110の特定は、例えばクラウド130上で紙書籍110の書籍名又はISBNコード等を検索することにより探し出することで、特定する。   In step S <b> 103, the operator connects to the cloud 130 via the transmission / reception unit 124 (see FIG. 2B) of the mobile terminal 120 and specifies the paper book 110 for downloading the audio data 131 on the cloud 130. . For example, the paper book 110 is specified by searching for the book name or ISBN code of the paper book 110 on the cloud 130.

ステップS104では、ステップS103で特定された紙書籍110の音声データ131をクラウド130から記憶部126にダウンロードする。ダウンロードされた音声データ131は、その音声データ131が再生できる状態に置かれる。ステップS104の後は、ステップS106に進む。   In step S104, the audio data 131 of the paper book 110 identified in step S103 is downloaded from the cloud 130 to the storage unit 126. The downloaded audio data 131 is placed in a state where the audio data 131 can be reproduced. After step S104, the process proceeds to step S106.

ステップS105では、操作者は、携帯端末120に保存されている紙書籍の音声データの中から使用する1つの紙書籍110を選択し、その紙書籍110の音声データ131を再生できる状態に置く。   In step S <b> 105, the operator selects one paper book 110 to be used from the sound data of the paper book stored in the mobile terminal 120, and puts the sound data 131 of the paper book 110 into a state where it can be reproduced.

図4(a)は、入力部121に複数の紙書籍の名前が表示されている携帯端末120の平面図である。入力部121には、記憶部126に音声データが記憶されている複数の紙書籍のタイトルが示されている。図3のステップS105では、操作者が、フラットパネルディスプレイに表示された中から、再生(使用)する書籍のタイトルを選択する。例として、図4(a)では、操作者が、書籍名「英語本1」のタイトルを選択した状態を示されている。   FIG. 4A is a plan view of the mobile terminal 120 in which names of a plurality of paper books are displayed on the input unit 121. The input unit 121 shows the titles of a plurality of paper books whose audio data is stored in the storage unit 126. In step S105 of FIG. 3, the operator selects a title of a book to be reproduced (used) from those displayed on the flat panel display. As an example, FIG. 4A shows a state where the operator has selected the title of the book name “English book 1”.

ステップS106では、ステップS103で特定された又はステップS105で選択された紙書籍110の使用するトラック番号及びフレーズ番号が選択される。図4(b)は、音声出力システム100のトラック・フレーズ選択手段を示している。   In step S106, the track number and phrase number used by the paper book 110 specified in step S103 or selected in step S105 are selected. FIG. 4B shows the track / phrase selection means of the audio output system 100.

図4(b)は、入力部121にトラック番号及びフレーズ番号の選択画面が表示された携帯端末120の平面図である。入力部121の上側に、トラック番号を示すトラック番号表示部141が示されている。トラック番号表示部141には三桁のダイヤルが表示されており、操作者の指など1桁をタッチして上下に動かすとダイヤルの数字が回転する。操作者は三桁のダイヤルを回転させることによってトラック番号を特定する。図4(b)は、トラック番号として「058」が選択されている状態を示している。また、入力部121には、トラック番号の下側にフレーズ番号を示すフレーズ番号表示部142が示されている。フレーズ番号表示部142には三桁のダイヤルが表示されており、操作者の指など1桁をタッチして上下に動かすとダイヤルの数字が回転する。操作者は三桁のダイヤルを回転させることによってトラック番号を特定する。図4(b)は、フレーズ番号として「002」が選択されている状態を示している。   FIG. 4B is a plan view of the mobile terminal 120 in which a track number / phrase number selection screen is displayed on the input unit 121. Above the input unit 121, a track number display unit 141 indicating a track number is shown. A three-digit dial is displayed on the track number display unit 141, and when a digit such as an operator's finger is touched and moved up and down, the number on the dial rotates. The operator specifies the track number by rotating the three-digit dial. FIG. 4B shows a state where “058” is selected as the track number. In addition, the input unit 121 includes a phrase number display unit 142 indicating a phrase number below the track number. A three-digit dial is displayed on the phrase number display unit 142. When a digit such as an operator's finger is touched and moved up and down, the number on the dial is rotated. The operator specifies the track number by rotating the three-digit dial. FIG. 4B shows a state where “002” is selected as the phrase number.

図4(b)に示されるように、入力部121でトラック番号及びフレーズ番号が選択されて、音声出力される音声データ131が特定される。一方、音声出力はトラックごとに行われても良く、この場合にはフレーズ番号が選択されなくても良い。このようなトラックごとの音声再生を考慮して、例えばフレーズ番号の入力に当たっては、「フレーズ番号」のアイコン143をクリックして一定時間点灯させ、フレーズ番号を入力することを示したのちにフレーズ番号を入力するようにしても良い。すなわち、「フレーズ番号」のアイコン143が点灯している場合には入力されたフレーズ番号が有効になり、一定時間点灯している間に入力されない場合にはトラック番号に含まれるすべてのフレーズが有効になる。特に図示しないが、番号なしのダイヤル”−”(横棒)を使ってトラック番号に含まれるすべてのフレーズを有効にしてもよい。   As shown in FIG. 4B, the track number and the phrase number are selected by the input unit 121, and the audio data 131 to be output as audio is specified. On the other hand, audio output may be performed for each track. In this case, the phrase number may not be selected. In consideration of such audio reproduction for each track, for example, when inputting a phrase number, click on the “phrase number” icon 143 to light it for a certain period of time, indicating that the phrase number is to be input, and then the phrase number May be input. In other words, when the “phrase number” icon 143 is lit, the entered phrase number is valid, and when it is not input for a certain period of time, all the phrases included in the track number are valid. become. Although not specifically shown, all phrases included in the track number may be validated using a dial “−” (horizontal bar) without a number.

ステップS107では、ステップS106で選択されたトラック又はフレーズを、どの言語で音声出力するかが選択される。また、ステップS107では、使用する言語を選択すると共に、その言語を再生する順番が選択される。   In step S107, the language in which the track or phrase selected in step S106 is output as audio is selected. In step S107, the language to be used is selected, and the order of reproducing the language is selected.

図5は、入力部121に再生言語選択画面が表示された携帯端末120の平面図である。再生言語選択画面では、音声データが再生される言語及びその順番が入力される。例えば、画面の左側には、言語再生順番144が表示されており、その右側には再生言語145が表示されている。言語再生順番144に表示されている番号が言語の再生順番を示しており、その右側の再生言語145に表示されている言語が再生される。再生言語145は、例えばドロップダウンリストの中から1つの言語を選択される。図5に示された例では、ステップS106で選択されたトラック又はフレーズについて、初めに日本語で再生され、次に英語で再生されことになる。また、例えば、日本語のみを出力するモードを第1モード、英語のみを出力するモードを第2モード、日本語及び英語を出力するモードを第3モードとすると、図5は第3モードの再生が行われることになる。つまり図5に示された画面は、使用する言語を選択するモード選択手段に該当する。一方、図5では、言語再生順番144の1番目のみに指定言語を設定して第1モード又は第2モードの再生が行われても良い。図示しないが、初めに日本語で再生され、次に英語で再生され、その次に中国語を再生する別のモードを備えても良い。音声データの再生は、図5に示される再生ボタン146を操作者が押すことにより行われる。   FIG. 5 is a plan view of the mobile terminal 120 on which a playback language selection screen is displayed on the input unit 121. On the reproduction language selection screen, the language in which the audio data is reproduced and the order thereof are input. For example, the language playback order 144 is displayed on the left side of the screen, and the playback language 145 is displayed on the right side thereof. The number displayed in the language playback order 144 indicates the language playback order, and the language displayed in the playback language 145 on the right side is played back. For the playback language 145, for example, one language is selected from a drop-down list. In the example shown in FIG. 5, the track or phrase selected in step S106 is first played back in Japanese and then played back in English. For example, if the mode for outputting only Japanese is the first mode, the mode for outputting only English is the second mode, and the mode for outputting Japanese and English is the third mode, FIG. 5 shows the reproduction of the third mode. Will be done. That is, the screen shown in FIG. 5 corresponds to mode selection means for selecting a language to be used. On the other hand, in FIG. 5, reproduction in the first mode or the second mode may be performed by setting the designated language only in the first language reproduction order 144. Although not shown, another mode may be provided in which playback is first performed in Japanese, then played back in English, and then played back in Chinese. The audio data is reproduced when the operator presses the reproduction button 146 shown in FIG.

以上に示されるように、音声出力システム100では、多くの人が所有していると思われる携帯端末120を使用して音声データを出力させることにより、需要者が音声ペン等の高価なものを購入する必要がない。そのため、本発明の音声出力システム100は、多くの人にとって利用しやすい。また、音声システム100では、CD(Compact Disk)等とは異なり、トラック数に制限がない。トラック数に制限がないことにより複数の階層を細かく形成するため、一文ごと、又は一単語ごと等の細かい再生を容易に行うことができる。さらに、音声データ131は、複数の階層で形成されるためフレーズの選択が複雑になるが、トラック・フレーズ選択手段及びモード選択手段を使って、音声出力を行うフレーズを容易にかつ素早く設定することができる。   As described above, in the voice output system 100, a consumer uses an expensive device such as a voice pen by causing the voice data to be output using the mobile terminal 120 that is believed to be owned by many people. There is no need to purchase. Therefore, the audio output system 100 of the present invention is easy to use for many people. Also, in the audio system 100, the number of tracks is not limited, unlike a CD (Compact Disk) or the like. Since there are no restrictions on the number of tracks, a plurality of hierarchies are formed in detail, so that detailed reproduction such as one sentence or one word can be easily performed. Furthermore, since the audio data 131 is formed in a plurality of layers, the phrase selection is complicated. However, the phrase for audio output can be set easily and quickly using the track / phrase selection means and the mode selection means. Can do.

上記の説明では、携帯端末120がスマートフォンの例で説明したが、携帯端末120として携帯音楽プレーヤー又はタブレット端末などが用いられても良い。また、使用される言語は、3つ以上でも良い。例えば、図5において、言語再生順番144の3番目で日本語の代わりに中国語が選択された場合、所定のフレーズが日本語、英語、中国語の順番で音声データが再生されることになる。   In the above description, the mobile terminal 120 is described as an example of a smartphone, but a mobile music player, a tablet terminal, or the like may be used as the mobile terminal 120. Further, three or more languages may be used. For example, in FIG. 5, when Chinese is selected in the third language playback order 144 instead of Japanese, audio data is played back in the order of Japanese, English, and Chinese for a predetermined phrase. .

(第2実施形態)
音声出力システム100は、第1実施形態で示された機能以外にも様々な機能を有する。以下に、第1実施形態で示された機能以外の様々な機能の例について説明する。また、以下の説明では、第1実施形態と同じ部分に関しては同じ符号を用いて表し、その説明を省略する。
(Second Embodiment)
The audio output system 100 has various functions in addition to the functions shown in the first embodiment. Examples of various functions other than the functions shown in the first embodiment will be described below. Moreover, in the following description, the same part as 1st Embodiment is represented using the same code | symbol, and the description is abbreviate | omitted.

<再生速度調整機能>
音声出力システム100では、例えば、言語の再生スピードが設定できるようにされても良い。これにより、得意な言語は再生速度を早くし、苦手な言語で音声データが再生される場合にはその言語の再生スピードを遅くして聞き取りやすくする。
<Playback speed adjustment function>
In the audio output system 100, for example, the language playback speed may be set. As a result, a good language increases the reproduction speed, and when audio data is reproduced in a language that is not good, the reproduction speed of the language is slowed down to make it easy to hear.

図6(a)は、入力部121に再生速度調整画面が表示された携帯端末120の平面図である。図6(a)の再生速度表示画面では、日本語、英語、及び中国語の各言語をそれぞれ個別に速度調整するようになっており、日本語が通常の速度の1.5倍速、英語が通常の速度の0.8倍速、中国語が通常の速度の0.5倍速に設定されている状態が示されている。これらの速度調整は、例えばタブ147を左右に動かすことにより行う。   FIG. 6A is a plan view of the mobile terminal 120 in which a playback speed adjustment screen is displayed on the input unit 121. In the playback speed display screen of FIG. 6 (a), the speeds of Japanese, English, and Chinese are individually adjusted. Japanese is 1.5 times the normal speed, and English is A state in which the normal speed is set to 0.8 times normal speed and Chinese is set to 0.5 times normal speed is shown. These speed adjustments are performed, for example, by moving the tab 147 left and right.

<再生順番設定機能>
音声出力システム100は、指定した複数のフレーズ及びトラックが連続して再生することもできる。初めに操作者が、再生したい複数のトラック及び複数のフレーズを設定すれば、毎回フレーズを設定し直す等の手間を省くことができる。
<Playback order setting function>
The audio output system 100 can also reproduce a plurality of designated phrases and tracks in succession. First, if the operator sets a plurality of tracks and a plurality of phrases to be reproduced, it is possible to save the trouble of resetting the phrases every time.

図6(b)は、入力部121に再生順番調整画面が表示された携帯端末120の平面図である。再生順番設定画面では、複数のトラック、複数のフレーズ及びその再生する順番が設定される。設定画面の左端には、トラック・フレーズ再生順番148が示されている。トラック・フレーズ再生順番148で示されている数字がトラック又はフレーズの再生順番となる。トラック番号及びフレーズ番号は、図4(b)で説明されたのと同様に、紙書籍110のトラック番号及びフレーズ番号を示している。また、言語の欄には、音声出力される言語が示されている。   FIG. 6B is a plan view of the mobile terminal 120 in which the playback order adjustment screen is displayed on the input unit 121. On the playback order setting screen, a plurality of tracks, a plurality of phrases, and a playback order thereof are set. A track / phrase playback order 148 is shown at the left end of the setting screen. The number indicated by the track / phrase playback order 148 is the playback order of the track or phrase. The track number and the phrase number indicate the track number and the phrase number of the paper book 110 as described in FIG. In the language column, the language in which audio is output is shown.

図6(b)の設定がされて再生ボタン146が押された場合に、図6(b)で設定された一連の再生を行う。再生は、初めに、トラック58の全体が日本語で再生される。さらに、2番目にトラック58のフレーズ1が英語で再生され、3番目にトラック58のフレーズ1が中国語で再生される。さらに、4番目にトラック61のフレーズ12が英語で再生され、5番目にトラック61のフレーズ14が英語で再生される。図6(b)に示されるような設定は、例えば、トラック・フレーズ再生順番148をクリックすることにより、図4(b)のトラック番号及びフレーズ番号の選択画面及び図5の再生言語選択画面に順番に切り替わり、各画面で条件を選択することにより設定する。   When the setting shown in FIG. 6B is made and the playback button 146 is pressed, a series of playbacks set in FIG. 6B is performed. In the reproduction, first, the entire track 58 is reproduced in Japanese. Secondly, phrase 1 of track 58 is reproduced in English, and phrase 1 of track 58 is reproduced in Chinese third. Furthermore, the phrase 12 of the track 61 is reproduced in English fourth, and the phrase 14 of the track 61 is reproduced in English fifth. The setting as shown in FIG. 6B is performed by clicking the track / phrase playback order 148, for example, on the track number / phrase number selection screen of FIG. 4B and the playback language selection screen of FIG. Set by selecting the condition on each screen.

<目次設定機能>
音声出力システムは、携帯端末120に紙書籍の目次を表示させ、目次から所定のトラック及びフレーズを選択しても良い。このような機能は、例えば、音声データ化を想定せずに発行された紙書籍に後から音声データを追加する場合などに用いることができる。
<Contents setting function>
The audio output system may display a table of contents of a paper book on the mobile terminal 120 and select a predetermined track and phrase from the table of contents. Such a function can be used, for example, when voice data is added later to a paper book issued without assuming voice data.

図7(a)は、紙書籍210の目次のページが示された図である。紙書籍210では、目次に大項目211と、大項目211の中に含まれる小項目212と、が記載されている。大項目211は例えば紙書籍110のトラックに相当し、小項目212は紙書籍110のフレーズに相当する。紙書籍210では、紙書籍110(図1参照)のようにトラック番号及びフレーズ番号が設定されていない。   FIG. 7A is a diagram showing a table of contents page of the paper book 210. In the paper book 210, a table of contents includes a large item 211 and a small item 212 included in the large item 211. The large item 211 corresponds to, for example, a track of the paper book 110, and the small item 212 corresponds to a phrase of the paper book 110. In the paper book 210, the track number and the phrase number are not set unlike the paper book 110 (see FIG. 1).

図7(b)は、入力部121に目次設定画面が表示された携帯端末120の平面図である。携帯端末120の入力部121には、紙書籍210の目次が表示されており、大項目211及び小項目212がそれぞれ表示されている。また、入力部121の右端に表示されているスクロールバー149を上下させることにより目的の大項目211又は小項目212を表示することができる。さらに目的の大項目211又は小項目212を選択し、さらに図5に示されるように使用言語を選択することで目的の音声データを再生することができる。   FIG. 7B is a plan view of the mobile terminal 120 in which the table of contents setting screen is displayed on the input unit 121. The table of contents of the paper book 210 is displayed on the input unit 121 of the portable terminal 120, and a large item 211 and a small item 212 are displayed. Further, by moving the scroll bar 149 displayed at the right end of the input unit 121 up and down, the target large item 211 or small item 212 can be displayed. Furthermore, the target audio data can be reproduced by selecting the target large item 211 or the small item 212 and further selecting the language used as shown in FIG.

上記の実施例では入力部121に目次を表示させ、目次から所定のフレーズを探したが、紙書籍のページ番号から所定のフレーズが探されても良い。この場合は、例えば、紙書籍のベージ番号を入力部121の所定の位置に入力してそのページの段落(フレーズ情報)を表示させ、その表示から所定のフレーズを探し出すようにする。   In the above embodiment, a table of contents is displayed on the input unit 121 and a predetermined phrase is searched from the table of contents. However, a predetermined phrase may be searched for from the page number of a paper book. In this case, for example, a page number of a paper book is input to a predetermined position of the input unit 121 to display a paragraph (phrase information) of the page, and a predetermined phrase is searched from the display.

<音声検出機能>
音声出力システムは、所定のフレーズを音声入力することにより、入力された音声のフレーズを解読する音声検出機能を有していても良い。例えば、音声出力システムは、英文フレーズを暗記しているか否かの確認にも使用することができる。
<Voice detection function>
The voice output system may have a voice detection function for decoding a phrase of the input voice by inputting the predetermined phrase by voice. For example, the voice output system can be used to check whether or not an English phrase is memorized.

図8は、入力部121に音声検出機能設定画面が表示された携帯端末120の平面図である。画面の最も左側の列には、トラック・フレーズ再生順番148が記載されている。図8に示された順番で再生を行う場合、まず初めにトラック58のフレーズ1の日本語が再生される。2番目には、トラック58のフレーズ1の英語の音声入力が行われる。これは、1番目の日本語と同じトラック58のフレーズ1の英語の翻訳を、操作者が音声入力部123に発音して音声として入力する。そして、音声検出部125(図2(b)参照)が発音された英語を解読し、その発音された英語のフレーズが正しいかどうかを判断する。判断した後には、例えば、正しい場合にはチャイム音、誤っている場合にはブザー音を鳴らすことにより、英語が正しいかどうかを知らせる。3番目には、トラック58のフレーズ1の英語が再生される。これで操作者は、トラック58のフレーズ1の正解の英訳を確認することができる。   FIG. 8 is a plan view of the mobile terminal 120 with the voice detection function setting screen displayed on the input unit 121. In the leftmost column of the screen, the track / phrase playback order 148 is described. When the reproduction is performed in the order shown in FIG. 8, first, the Japanese phrase 1 of the track 58 is reproduced. Second, the English voice input of phrase 1 of track 58 is performed. The operator translates the English translation of phrase 1 in the same track 58 as the first Japanese into the voice input unit 123 and inputs it as voice. Then, the voice detection unit 125 (see FIG. 2B) decodes the pronounced English, and determines whether the pronounced English phrase is correct. After the determination, for example, a chime sound is sounded if correct, and a buzzer sound is sounded if incorrect, thereby informing whether English is correct. Third, the English phrase 1 of track 58 is played. Thus, the operator can confirm the English translation of the correct phrase 1 of the track 58.

このような機能は、例えばフレーズを1つの単語とすることにより、英単語などを覚えるために用いることができる。また、紙書籍を参照して自由にフレーズを選択することができることにより、苦手な英単語等を集中的に覚えることに用いることができる。   Such a function can be used to memorize English words, for example, by making a phrase one word. In addition, since a phrase can be freely selected with reference to a paper book, it can be used to intensively memorize poor English words.

<集中テスト機能>
音声入力システム100は、所定のフレーズを他の言語で翻訳することができるかをテストする集中テスト機能を有していても良い。以下、図9(a)及び図9(b)を参照して集中テスト機能について説明する。
<Intensive test function>
The voice input system 100 may have a centralized test function that tests whether a predetermined phrase can be translated into another language. The intensive test function will be described below with reference to FIGS. 9 (a) and 9 (b).

図9(a)は、集中テスト機能の実施手順が示されたフローチャートである。また、図9(b)は、テスト機能設定画面が表示された携帯端末120の平面図である。   FIG. 9A is a flowchart showing an execution procedure of the intensive test function. FIG. 9B is a plan view of the mobile terminal 120 on which the test function setting screen is displayed.

図9(a)のステップS201では、テストする言語が選択される。図9(b)のテスト機能設定画面のテスト言語選択部150には、テストするための言語が選択される。例えば、図9(b)では、テストする言語として「英語」が選択されている。   In step S201 of FIG. 9A, the language to be tested is selected. A test language selection unit 150 on the test function setting screen in FIG. 9B selects a language for testing. For example, in FIG. 9B, “English” is selected as the language to be tested.

ステップS202では、複数のフレーズが選択される。図9(b)のテスト機能設定画面では、トラック・フレーズ再生順番148に沿ってトラック番号、フレーズ番号、及び音声データを再生する言語が入力される。図9(b)では、トラック・フレーズ再生順番148の1番目に、トラック58のフレーズ1の日本語が選択されている状態が示されている。このように、トラック・フレーズ再生順番148の2番目以降もトラック番号、フレーズ番号、及び音声データを再生する言語が入力される。テスト機能設定画面では、トラック・フレーズ再生順番148の番号は再生順番を示すものではなく、単なる識別番号となっている。   In step S202, a plurality of phrases are selected. In the test function setting screen of FIG. 9B, a track number, a phrase number, and a language for reproducing audio data are input along the track / phrase playback order 148. FIG. 9B shows a state in which the Japanese phrase 1 of the track 58 is selected as the first track / phrase playback order 148. In this way, the track number, phrase number, and language for reproducing the audio data are also input in the second and subsequent tracks / phrase playback order 148. On the test function setting screen, the number of the track / phrase playback order 148 does not indicate the playback order but is merely an identification number.

ステップS203では、トラック・フレーズ再生順番148の任意の1つの番号が自動的に選択され、選択されたトラック・フレーズ再生順番148で設定されたトラック番号及びフレーズ番号が、設定された音声データを再生する言語で再生される。例えば、図9(b)において、トラック・フレーズ再生順番148の3番目が自動的に選択された場合には、トラック58のフレーズ3が日本語で再生される。   In step S203, an arbitrary number in the track / phrase playback order 148 is automatically selected, and the track number and phrase number set in the selected track / phrase playback order 148 are played back. Will be played in the language you want. For example, in FIG. 9B, when the third track / phrase playback order 148 is automatically selected, phrase 3 on the track 58 is played back in Japanese.

ステップS204では、ステップS203で再生されたフレーズに対する翻訳を、テスト言語選択部150で選択された言語で、操作者が音声入力部123より音声入力する。図9(b)では、テスト言語として英語が選択されているため、操作者が英語で音声入力する。   In step S <b> 204, the operator inputs the speech for the phrase reproduced in step S <b> 203 from the voice input unit 123 in the language selected by the test language selection unit 150. In FIG. 9B, since English is selected as the test language, the operator inputs the voice in English.

ステップS205では、音声入力部123より入力された音声が、音声検出部125において翻訳として正しいかどうかが判断される。判断は、例えば、正しい場合にはチャイム音、誤っている場合にはブザー音を鳴らすことにより結果として示される。また、ステップS203からステップS205が複数回繰り返されて複数問のテストが行われても良い。   In step S <b> 205, it is determined whether or not the voice input from the voice input unit 123 is correct as a translation in the voice detection unit 125. The judgment is shown as a result by, for example, sounding a chime sound when correct and a buzzer sound when incorrect. In addition, a test of a plurality of questions may be performed by repeating steps S203 to S205 a plurality of times.

以上、本発明の最適な実施形態について詳細に説明したが、当業者に明らかなように、本発明はその技術的範囲内において実施形態に様々な変更及び変形を加えて実施することができる。上記説明では、語学学習者向けの紙書籍を想定して説明したが、野鳥図鑑又は動物図鑑などの紙書籍であってもよい。例えば野鳥図鑑で10ページには、ホトトギス、ウグイスの挿絵があったとする。複数の野鳥の鳴き声が、ページ毎(トラックに相当)に音声データとしてクラウドに保存されている。そして、音声入力システム100は、音声データ113をダウンロードする。音声データ113は、ホトトギス(フレーズに相当)、ウグイス(フレーズに相当)毎に、さえずり(日本語に相当)と地鳴き(英語に相当)を選択できるようにする。語学学習の紙書籍と同様に、野鳥図鑑にも本発明は適用できる。   The optimal embodiment of the present invention has been described above in detail, but as will be apparent to those skilled in the art, the present invention can be implemented with various modifications and variations within the technical scope thereof. In the above description, a paper book for language learners has been assumed. However, a paper book such as a wild bird book or an animal picture book may be used. For example, suppose that there are illustrations of photogis and warblers on page 10 of the Wild Bird Encyclopedia. A plurality of wild bird calls are stored in the cloud as audio data for each page (corresponding to a track). Then, the voice input system 100 downloads the voice data 113. The voice data 113 enables selection of twitter (corresponding to Japanese) and ground singing (corresponding to English) for each phototogis (corresponding to a phrase) and warbler (corresponding to a phrase). The present invention can be applied to a bird book as well as a paper book for language learning.

100 … 音声出力システム
110、210 … 紙書籍
120 … 音声出力装置
121 … 入力部
122a、122b … 音声出力部
123 … 音声入力部
124 … 送受信部
125 … 音声検出部
126 … 記憶部
130 … クラウド(クラウドコンピューティング)
131 … 音声データ
141 … トラック番号表示部
142 … フレーズ番号表示部
143 … 「フレーズ番号」のアイコン
144 … 言語再生順番
145 … 再生言語
146 … 再生ボタン
147 … タブ
148 … トラック・フレーズ再生順番
149 … スクロールバー
150 … テスト言語選択部
211 … 大項目
212 … 小項目
DESCRIPTION OF SYMBOLS 100 ... Audio | voice output system 110, 210 ... Paper book 120 ... Audio | voice output apparatus 121 ... Input part 122a, 122b ... Audio | voice output part 123 ... Audio | voice input part 124 ... Transmission / reception part 125 ... Audio | voice detection part 126 ... Memory | storage part 130 ... Cloud (cloud) Computing)
131 ... Audio data 141 ... Track number display section 142 ... Phrase number display section 143 ... "Phrase number" icon 144 ... Language playback order 145 ... Playback language 146 ... Playback button 147 ... Tab 148 ... Track / phrase playback order 149 ... Scroll Bar 150 ... Test language selection part 211 ... Major item 212 ... Small item

Claims (7)

第1言語で記載された一単語、一文又は一段落に対して前記一単語、一文又は一段落の翻訳である第2言語を含むフレーズと、前記フレーズを複数有するトラックとからなり、前記トラックを複数記載した紙書籍用の音声データを出力する音声出力システムであって、
フラットパネルディスプレイを介して所定の情報を入力する入力部と、
前記音声データを出力する音声出力部と、
インターネットに接続され前記音声データを送受信する送受信部と、
前記送受信部を介して受信した前記音声データを記憶する記憶部と、を備え、
前記入力部は、前記紙書籍を特定し、前記紙書籍に対応する前記音声データを前記記憶部に取り込む取込手段と、
前記紙書籍の前記トラック及び前記フレーズを選択するトラック・フレーズ選択手段と、
前記第1言語のみ出力する第1モード、前記第2言語のみ出力する第2モード、又は前記第1言語及び前記第2言語を出力する第3モードを選択するモード選択手段と、を有し、
前記フレーズ選択手段で選択されたフレーズと前記モード選択手段で選択されたモードとに基づいて、前記音声出力部が音声を出力する音声出力システム。
A phrase including a second language that is a translation of the one word, one sentence, or one paragraph with respect to one word, one sentence, or one paragraph described in the first language, and a track that includes a plurality of the phrases, and describes a plurality of the tracks An audio output system for outputting audio data for a paper book,
An input unit for inputting predetermined information via a flat panel display;
An audio output unit for outputting the audio data;
A transmitting / receiving unit connected to the Internet for transmitting and receiving the audio data;
A storage unit for storing the audio data received via the transmission / reception unit,
The input unit identifies the paper book, and capture means for capturing the audio data corresponding to the paper book into the storage unit;
Track / phrase selection means for selecting the track and the phrase of the paper book;
Mode selection means for selecting a first mode for outputting only the first language, a second mode for outputting only the second language, or a third mode for outputting the first language and the second language;
An audio output system in which the audio output unit outputs audio based on the phrase selected by the phrase selecting unit and the mode selected by the mode selecting unit.
前記入力部では、さらに選択された前記言語の音声を出力する順番及び音声の再生速度の少なくとも一つが入力される請求項1に記載の音声出力システム。   The audio output system according to claim 1, wherein at least one of an order of outputting audio of the selected language and an audio reproduction speed is further input to the input unit. 前記入力部、前記音声出力部、前記送受信部、及び前記記憶部は1つの携帯端末に備えられる請求項1又は請求項2に記載の音声出力システム。   The audio output system according to claim 1, wherein the input unit, the audio output unit, the transmission / reception unit, and the storage unit are provided in one mobile terminal. 前記トラック・フレーズ選択手段は、前記音声出力装置の前記入力部に前記紙書籍の目次が表示され、前記目次から所定の前記フレーズの前記音声データを選択する請求項1から請求項3のいずれか一項に記載の音声出力システム。   4. The track / phrase selection unit displays a table of contents of the paper book on the input unit of the sound output device, and selects the sound data of the predetermined phrase from the table of contents. 5. The audio output system according to one item. 前記トラック・フレーズ選択手段は、前記紙書籍のページ番号を選択し、さらに選択された前記ページに記載の前記フレーズを選択する請求項1から請求項3のいずれか一項に記載の音声出力システム。   4. The audio output system according to claim 1, wherein the track / phrase selection unit selects a page number of the paper book, and further selects the phrase according to the selected page. 5. . 音声が入力され、前記音声の前記フレーズを解読する音声検出部を有する請求項1から請求項5のいずれか一項に記載の音声出力システム。   The voice output system according to claim 1, further comprising a voice detection unit that receives voice and decodes the phrase of the voice. 前記トラック・フレーズ選択手段で複数の前記フレーズが選択され、
選択された前記複数のフレーズから任意に選ばれた1つの前記フレーズを前記第1言語で音声出力し、
前記第1言語の前記音声出力の後に、前記音声検出部に前記フレーズの翻訳が第2言語で発音された音声を音声入力し、
前記音声入力された前記フレーズの翻訳が正しいかどうかを判断するするテストモードを有する請求項6に記載の音声出力システム。
A plurality of the phrases are selected by the track / phrase selecting means,
Outputting one of the phrases arbitrarily selected from the selected phrases in the first language,
After the voice output of the first language, voice input of the phrase translated in the second language is input to the voice detection unit,
The voice output system according to claim 6, further comprising a test mode for judging whether the translation of the phrase inputted by voice is correct.
JP2013091850A 2013-04-25 2013-04-25 Voice output system Pending JP2014215415A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013091850A JP2014215415A (en) 2013-04-25 2013-04-25 Voice output system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013091850A JP2014215415A (en) 2013-04-25 2013-04-25 Voice output system

Publications (1)

Publication Number Publication Date
JP2014215415A true JP2014215415A (en) 2014-11-17

Family

ID=51941235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013091850A Pending JP2014215415A (en) 2013-04-25 2013-04-25 Voice output system

Country Status (1)

Country Link
JP (1) JP2014215415A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016081011A (en) * 2014-10-22 2016-05-16 ヤマハ株式会社 Keyboard device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016081011A (en) * 2014-10-22 2016-05-16 ヤマハ株式会社 Keyboard device

Similar Documents

Publication Publication Date Title
US6321196B1 (en) Phonetic spelling for speech recognition
US20110153330A1 (en) System and method for rendering text synchronized audio
US20150213727A1 (en) Custom Narration of Electronic Books
US20140222424A1 (en) Method and apparatus for contextual text to speech conversion
KR101164379B1 (en) Learning device available for user customized contents production and learning method thereof
JP6277958B2 (en) REPRODUCTION DEVICE, SETTING DEVICE, REPRODUCTION METHOD, AND PROGRAM
WO2010133072A1 (en) Pronunciation evaluating device and method
KR101789057B1 (en) Automatic audio book system for blind people and operation method thereof
KR20140006503A (en) Method and apparatus for recording and playing of user voice of mobile terminal
JP2014240901A (en) Learning support device, method, and program
KR101567449B1 (en) E-Book Apparatus Capable of Playing Animation on the Basis of Voice Recognition and Method thereof
KR20120044646A (en) Operation system for universal language learning and operation method thereof, and device supporting the same
JP2014215415A (en) Voice output system
KR20140062247A (en) Method for producing lecture text data mobile terminal and monbile terminal using the same
US20140281981A1 (en) Enabling music listener feedback
JP5476015B2 (en) Program, personal digital assistant, and English learning method
JP7229296B2 (en) Related information provision method and system
Diamond Dragon NaturallySpeaking for dummies
US20070154875A1 (en) Apparatus, system and method for displaying information
JP2005148727A (en) Learning support device
JP7013702B2 (en) Learning support device, learning support method, and program
Friedlander et al. iPad: Enhancing Learning and Communication for Students with Special Needs
KR100912483B1 (en) Language study system
JP6953825B2 (en) Data transmission method, data transmission device, and program
JP2017194546A (en) Electronic equipment, and control method and control program thereof