JP2022062983A - Two-dimensional code encoder and two-dimensional code reading device for education - Google Patents
Two-dimensional code encoder and two-dimensional code reading device for education Download PDFInfo
- Publication number
- JP2022062983A JP2022062983A JP2020171231A JP2020171231A JP2022062983A JP 2022062983 A JP2022062983 A JP 2022062983A JP 2020171231 A JP2020171231 A JP 2020171231A JP 2020171231 A JP2020171231 A JP 2020171231A JP 2022062983 A JP2022062983 A JP 2022062983A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- dimensional code
- data
- speaker
- text information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/04—Speaking
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/04—Electrically-operated educational appliances with audible presentation of the material to be studied
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Abstract
Description
本発明は、二次元コードエンコーダ及び教育用二次元コード読取装置に関する。 The present invention relates to a two-dimensional code encoder and a two-dimensional code reader for education.
近年、QRコード(登録商標)に関連する二次元コードが、様々な分野で利用されている。例えば、カメラ付き携帯電話などの情報処理装置を利用して、QRコードを撮像し、QRコードの情報を認識することができる。一般的には、QRコードの情報にはURLが記録されており、詳細な情報が表示可能なサイトへのアクセスを容易にする。 In recent years, two-dimensional codes related to QR codes (registered trademarks) have been used in various fields. For example, an information processing device such as a camera-equipped mobile phone can be used to image a QR code and recognize the information in the QR code. Generally, a URL is recorded in the QR code information, which facilitates access to a site where detailed information can be displayed.
また、QRコードに関し、情報処理装置にテキスト情報のデータやイメージデータを格納し、QRコードに関連付けられたテキスト情報を音声合成によって読み上げる装置も検討されている。例えば、特許文献1に記載された二次元コードの読取装置は、読取装置が二次元コードを解析し、二次元コードに関連付けられたテキスト情報を複数の言語で音声合成する旨が開示されている。 Further, regarding the QR code, a device that stores text information data and image data in an information processing device and reads out the text information associated with the QR code by voice synthesis is also being studied. For example, in the two-dimensional code reading device described in Patent Document 1, it is disclosed that the reading device analyzes the two-dimensional code and synthesizes the text information associated with the two-dimensional code by voice synthesis in a plurality of languages. ..
上述した特許文献1に開示されている二次元コードの読取装置は、予め関連付けられた複数の言語でテキスト情報を音声合成することができる。ここで、近年、音声合成による音質が改善・向上し、従来よりもデジタル合成音声の品質が高くなっている。そのため、複数人に対応する音声合成による音声を出力し、語学教育での活用に最適な音声合成読取装置が望まれるようになってきた。 The two-dimensional code reading device disclosed in Patent Document 1 described above can synthesize text information in a plurality of languages associated in advance. Here, in recent years, the sound quality by voice synthesis has been improved and improved, and the quality of digitally synthesized voice has become higher than before. Therefore, there has been a demand for a voice synthesis reader that outputs voice by voice synthesis corresponding to a plurality of people and is most suitable for use in language education.
本発明は、上記課題に鑑みてなされたものであり、複数人に対応する音声合成により、語学教育において効果的に学習することのできる二次元コードエンコーダ及び教育用二次元コード読取装置を提供することを目的としている。 The present invention has been made in view of the above problems, and provides a two-dimensional code encoder and a two-dimensional code reader for education capable of effectively learning in language education by speech synthesis corresponding to a plurality of people. The purpose is.
本発明の実施形態に係る二次元コードエンコーダは、複数人に対応する複数のテキスト情報を表示可能なディスプレイと、前記複数のテキスト情報が音声のデータに音声合成されるデータと、前記テキスト情報を音声のデータとして読み上げる際に選択させる話者及び言語とを、当該話者及び言語に関するタグにより関連付けるタグ付回路と、前記タグ付回路により関連付けられた前記音声合成されるデータ並びに前記話者及び前記言語に関するタグを二次元コードに符号化する二次元符号化回路と、を備えることを特徴とする。 The two-dimensional code encoder according to the embodiment of the present invention has a display capable of displaying a plurality of text information corresponding to a plurality of people, data in which the plurality of text information is voice-synthesized into voice data, and the text information. A tagged circuit that associates a speaker and a language to be selected when reading out as voice data by a tag related to the speaker and the language, the voice-synthesized data associated with the tagged circuit, and the speaker and the above. It is characterized by comprising a two-dimensional coding circuit that encodes a tag related to a language into a two-dimensional code.
本発明の実施形態に係る教育用二次元コード読取装置は、複数人に対応する複数のテキスト情報が音声のデータに音声合成されるデータと、前記テキスト情報を音声のデータとして読み上げる際に選択させる話者とが当該話者に関するタグにより関連付けられて符号化された二次元コードを撮像する撮像装置と、前記撮像装置で撮像した前記二次元コードに基づいて、前記音声合成されるデータ及び前記話者に関するタグにデコードするデコード回路と、前記デコード回路でデコードされた前記音声合成されるデータ及び前記話者に関するタグに基づいて、前記話者に関するタグに対応する声質を選択して、前記音声合成されるデータを、前記音声のデータに音声合成する音声合成回路と、前記音声合成回路で音声合成された音声を出力するスピーカと、を備えることを特徴とする。 The educational two-dimensional code reading device according to the embodiment of the present invention selects data in which a plurality of text information corresponding to a plurality of people is voice-synthesized into voice data and when the text information is read out as voice data. An image pickup device that captures a two-dimensional code encoded by a speaker associated with a tag related to the speaker, and the voice-synthesized data and the story based on the two-dimensional code captured by the image pickup device. Based on the decoding circuit that decodes the tag related to the speaker, the voice-synthesized data decoded by the decoding circuit, and the tag related to the speaker, the voice quality corresponding to the tag related to the speaker is selected and the voice synthesis is performed. It is characterized by including a voice synthesis circuit for synthesizing the data to be voiced with the voice data, and a speaker for outputting the voice synthesized by the voice synthesis circuit.
本発明によれば、複数人に対応する音声合成により、語学教育において効果的に学習することができる。 According to the present invention, it is possible to effectively learn in language education by speech synthesis corresponding to a plurality of people.
以下、本発明の実施形態について、図を用いて説明する。図1は、本発明の実施形態に係る二次元エンコーダ101と、教育用二次元コード読取装置102の構成を示した説明図である。図1(a)は、二次元エンコーダ101の構成を示し、図1(b)は、教育用二次元コード読取装置102の構成を示している。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is an explanatory diagram showing a configuration of a two-
図1(a)に示す二次元エンコーダ101と図1(b)に示す教育用二次元コード読取装置102は、それぞれ情報処理装置100の構成(機能)により実現することができる。また、教育用二次元コード読取装置102は、図1(a)に示す二次元エンコーダ101の構成を更に備えることもできる。なお、二次元エンコーダ101と教育用二次元コード読取装置102とにおいて、同一の構成要素については同一の符号を付し、説明を適宜、省略する。
The two-
図1(a)に示す二次元エンコーダ101は、ディスプレイ10、記憶回路12、タグ付回路14、入力回路16、二次元符号化回路18及び内部バス19を備えている。
The two-
ディスプレイ10は、液晶ディスプレイ(LCD:Liquid Crystal Display)によって構成され、タッチパネルが積層されて形成される。ディスプレイ10は、複数人に対応する複数のテキスト情報を表示する。また、ディスプレイ10は、表示される複数のテキスト情報に関連付けてイメージデータの画像を表示することもできる。また、ディスプレイ10は、入力回路16による入力機能も備えている。
The
記憶回路12は、ROM(Read Only Memory)、RAM(Random Access Memory)及びHDD(Hard Disk Drive)等を含む記憶装置により構成される。記憶回路12は、複数人に対応する複数のテキスト情報のデータを格納する。また、記憶回路12は、ディスプレイ10に表示可能なイメージデータを格納する。
The
入力回路16は、ディスプレイ10に積層されたタッチパネルに対するユーザの操作を検出し、ユーザの操作の内容を示す情報をタグ付回路14に入力する。即ち、ユーザの操作に従った入力信号は、入力回路16からタグ付回路14に送られる。
The
タグ付回路14は、複数のテキスト情報が音声のデータに音声合成されるデータと、テキスト情報を音声のデータとして読み上げる話者とを、その話者に関するタグにより関連付ける。ここで、話者に関するタグは、テキスト情報を読み上げる声質の種類を示すものである。そのため、音声合成されるデータに対し、話者に関するタグによって関連付けることにより、その音声合成されるデータに関連付けられた話者により音声合成することができる。なお、音声合成されるデータとは、音声合成されるテキスト情報のデータを意味し、また、音声合成されるテキスト情報のデータの所在と関連付けられるデータであってもよい。なお、テキスト情報のデータは、記憶回路12に格納されているものとする。
The tagged
二次元符号化回路18は、タグ付回路14により関連付けられた音声合成されるデータ及び話者に関するタグを二次元コードに符号化する。なお、内部バス19は、各構成要素に接続されている。
The two-
一方、図1(b)に示す教育用二次元コード読取装置102は、記憶回路12、撮像装置20、デコード回路22、ディスプレイ10、音声合成回路24、スピーカ26、画像生成回路28、入力回路16及び内部バス29を備えている。
On the other hand, the educational two-dimensional
撮像装置20は、CCD(Charge Coupled Device)イメージスキャナーにより形成され、二次元コードを撮像する。撮像された二次元コードは、複数人に対応する複数のテキスト情報が音声のデータに音声合成されるデータと、テキスト情報を音声のデータとして読み上げる話者とがその話者に関するタグにより関連付けられて符号化されている。
The
デコード回路22は、撮像装置20で撮像した二次元コードに基づいて、音声のデータに音声合成されるデータ及び話者に関するタグにデコード(復号化)する。
The
入力回路16は、ディスプレイ10に積層されたタッチパネルに対するユーザの操作を検出し、ユーザの操作の内容を示す情報を音声合成回路24に入力する。即ち、ユーザの操作に従った入力信号は、入力回路16から音声合成回路24に送られる。
The
音声合成回路24は、デコード回路22でデコードされた音声合成されるデータ及び話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータを、音声のデータに音声合成する。音声合成は、教育用二次元コード読取装置102の記憶回路12に記憶されているTTS(Text to Speech)プログラムにより行うことができる。
The
スピーカ26は、音声合成回路24で音声合成された音声を出力する。
The
画像生成回路28は、任意の構成要素であって、音声合成されるデータを音声合成回路24において音声合成している間、音声合成されているデータのテキスト情報や、表示可能なイメージデータの画像を生成し、ディスプレイ10に表示させることができる。
The
ディスプレイ10は、任意の構成要素であって、デコード回路22でデコードされた音声合成されるデータに対応する複数のテキスト情報を表示することができる。また、ディスプレイ10は、画像生成回路28で生成されたイメージデータの画像を表示することもできる。なお、内部バス29は、各構成要素に接続されている。
The
(二次元コード生成処理)
次に、本発明の実施形態に係る二次元エンコーダ101において、二次元コードを生成する二次元コード生成処理について、図2に示すフローチャートを用いて説明する。
(Two-dimensional code generation process)
Next, in the two-
まず、二次元エンコーダ101は、音声合成により自動的に読み上げるテキスト情報をディスプレイ10に表示する(ステップS001)。二次元エンコーダ101は、ワープロソフトを起動して、テキスト情報の入力を受け付ける。ユーザは、ディスプレイ10上でタッチパネルを操作し、入力回路16によりテキスト情報を入力する。二次元エンコーダ101のディスプレイ10上には、テキスト情報の内容である英語の文章が表示される。
First, the two-
次に、二次元エンコーダ101は、複数のテキスト情報が音声のデータに音声合成されるデータと、テキスト情報を音声のデータとして読み上げる話者とを、話者に関するタグにより関連付ける(ステップS003)。この場合、ユーザがディスプレイ10上でタッチパネルを操作して、テキスト情報ごとにそれぞれ話者に関するタグを付ける。以下に、テキスト情報ごとにタグを付ける操作方法について、図面を用いて説明する。
Next, the two-
図3は、二次元エンコーダ101のディスプレイ10上で、ワープロソフトを使用して、英会話教材として使用するテキストを作成して、そのテキストにおけるテキスト情報に、音声のデータとして読み上げる話者に関するタグを付す操作の一例を示している。なお、図3(a)は、二次元エンコーダ101のワープロソフトで作成された英会話教材のテキストTXT1を示している。図3(b)は、テキストTXT1の複数の英語の文章(テキスト情報)に音声のデータとして読み上げる話者のタグを付し、二次元コードを生成するまでのディスプレイ10上の操作画面を示している。
In FIG. 3, a text to be used as an English conversation teaching material is created on the
図3(a)に示す二次元エンコーダ101のディスプレイ10には、ワープロソフトのテキストTXT1と、二次元エンコーダ101の独自の機能であるエンコードダイアログボックスEDとが表示される。テキストTXT1が作成された段階で、図3(a)に示すエンコードダイアログボックスEDが押圧されると、図3(b)に示す話者のタグを付し二次元コードを生成するための操作画面に移行する。
On the
ここで、二次元エンコーダ101は、図3(a)に示すエンコードダイアログボックスEDが押圧されたとき、テキストTXT1の内容が図3(b)に示す会話エリアECにコピーされ、図3(b)の操作画面において、複数の英語の文章(テキスト情報SN1~SN5)と、その英語の文章(テキスト情報SN1~SN5)を読み上げる話者との関連付けを受け付ける。
Here, in the two-
この場合、二次元エンコーダ101は、まず英語の文章(テキスト情報SN1)を読み上げる話者E1を設定する。会話エリアECにおいて、話者の選択はプルダウンメニューで選択できるものとし、話者W1の欄において、話者E1,E2の中から話者E1を選択する。
In this case, the two-
二次元エンコーダ101は、英語の文章(テキスト情報SN1)を読み上げる話者として、話者W1の欄において話者E1に選択した後、ディスプレイ10の会話エリアECの右側にある話者設定ボタンTBがユーザにより押圧されると、英語の文章(テキスト情報SN1)と、話者E1とが関連付けられる。即ち、英語の文章(テキスト情報SN1)の音声合成されるデータと、英語の文章(テキスト情報SN1)を音声データとして読み上げる話者E1とが、タグにより関連付けられる。
In the two-
同様に、英語の文章(テキスト情報SN2)を読み上げる話者として、話者W2の欄において話者E2に選択した後、話者設定ボタンTBがユーザにより押圧されると、英語の文章(テキスト情報SN2)と、話者E2とが関連付けられる。この場合、英語の文章(テキスト情報SN2)の音声合成されるデータと、英語の文章(テキスト情報SN2)を音声のデータとして読み上げる話者E2とが、タグにより関連付けられる。 Similarly, when the speaker setting button TB is pressed by the user after selecting the speaker E2 in the speaker W2 column as the speaker who reads out the English sentence (text information SN2), the English sentence (text information) is read. SN2) and speaker E2 are associated with each other. In this case, the voice-synthesized data of the English sentence (text information SN2) and the speaker E2 who reads out the English sentence (text information SN2) as voice data are associated with each other by a tag.
このタグの関連付けを、英語の文章(テキスト情報SN1)から英語の文章(テキスト情報SN5)まで繰り返して、複数の英語の文章(テキスト情報SN1~SN5)に音声合成されるデータと、英語の文章(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者E1,E2とを、タグにより関連付ける。 The association of this tag is repeated from the English sentence (text information SN1) to the English sentence (text information SN5), and the data synthesized by voice into a plurality of English sentences (text information SN1 to SN5) and the English sentence. The speakers E1 and E2 that read out (text information SN1 to SN5) as voice data are associated with each other by a tag.
なお、会話エリアECの英語の文章(テキスト情報SN1~SN5)の修正や変更を行う場合には、英語の文章(テキスト情報SN1~SN5)をユーザが直接修正して、文章設定ボタンSBがユーザにより押圧されると、タグの関連付けを維持したまま、修正した内容が反映される。なお、この時同時に、テキストTXT1の対応する英語の文章も修正内容が反映されるものとする。また、話者の数は一例として2人の場合について説明しているが、この人数に限定されるものではなく、1人又は3人以上でも適用可能である。 When modifying or changing the English sentences (text information SN1 to SN5) in the conversation area EC, the user directly corrects the English sentences (text information SN1 to SN5), and the sentence setting button SB is the user. When pressed by, the modified content is reflected while maintaining the tag association. At the same time, the corrected content shall be reflected in the corresponding English sentence of the text TXT1. Further, although the case where the number of speakers is two is described as an example, the number of speakers is not limited to this number, and one or three or more speakers can be applied.
図2のフローチャートに戻り、二次元エンコーダ101は、ディスプレイ10の会話エリアECにおいて、複数の英語の文章(テキスト情報SN1~SN5)が音声のデータに音声合成されるデータと、英語の文章(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者E1,E2とがタグにより関連付けられると、二次元コードの生成を受け付ける(ステップS005)。
Returning to the flowchart of FIG. 2, the two-
二次元エンコーダ101のディスプレイ10は、図3(b)に示す二次元コードを生成するコード生成ボタンGNがユーザにより押圧されると、タグ付回路14により関連付けられた音声合成されるデータ及び話者に関するタグを二次元コードに符号化する(ステップS005)。
The
そして、二次元エンコーダ101は、符号化された二次元コードCEXを生成すると、図3(a)に示すテキストTXT1の下欄に相当する位置に、グレースケール画像による二次元コードCEXが貼付される。二次元エンコーダ101は、二次元コードCEXを、グレースケール画像として出力することができ、ワープロソフトや表計算ソフトで作成された表示可能なデータに視覚的に貼付することができる。本発明の実施形態の場合には、ディスプレイ10上で表示されるテキストTXT1の下欄に貼付する。
Then, when the two-
二次元エンコーダ101は、二次元符号化回路18で符号化した二次元コードCEXを記憶回路12に保存するとともに、二次元コードCEXが貼付されたテキストTXT1を上書きして記憶回路12に保存し(ステップS007)、二次元コード生成処理を終了する。
The two-
これにより、本発明の実施形態に係る二次元コードCEXは、テキストTXT1に貼付された状態で紙媒体に印刷されたり、情報処理装置100のディスプレイ10に表示されると、グレースケール画像として符号化された、音声合成されるデータ及び話者に関するタグの情報として提供される。
As a result, the two-dimensional code CEX according to the embodiment of the present invention is encoded as a gray scale image when printed on a paper medium in a state of being attached to the text TXT1 or displayed on the
(二次元コードデコード処理)
次に、本発明の実施形態に係る教育用二次元コード読取装置102が、符号化された二次元コードCEXを撮像して、その撮像した二次元コードCEXをデコードする二次元コードデコード処理について、図4に示すフローチャートを用いて説明する。
(Two-dimensional code decoding process)
Next, regarding the two-dimensional code decoding process in which the educational two-dimensional
まず、教育用二次元コード読取装置102は、二次元コードCEXが英会話教材のテキストTXT2に貼付され、紙媒体として印刷されたテキストTXT2の二次元コードCEXを撮像装置20により撮像して、二次元コードCEXを取得する(ステップS101)。教育用二次元コード読取装置102は、撮像によって、複数人に対応する複数の英語の文章(テキスト情報SN1~SN5)が音声合成されるデータと、英語の文章(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者E1,E2とが、話者に関するタグにより関連付けられて符号化された二次元コードを取得する。
First, in the two-dimensional
教育用二次元コード読取装置102は、取得した二次元コードCEXに基づいて、画像を切り出す画像切り出し処理を行う(ステップS103)。
The educational two-dimensional
教育用二次元コード読取装置102は、切り出した画像(撮像装置20で撮像した二次元コードCEXの一部)に基づいて、デコード回路22で音声のデータに音声合成されるデータ(テキスト情報SN~SN5のデータ)及び話者に関するタグにデコードする(ステップS105)。
The educational two-dimensional
教育用二次元コード読取装置102は、デコード回路22でデコードされた音声合成されるデータ(テキスト情報SN~SN5のデータ)及び話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータ(テキスト情報SN~SN5のデータ)を、音声のデータに音声合成する。そして、教育用二次元コード読取装置102は、音声合成回路24で音声合成された音声をスピーカ26から出力する(ステップS107)。
The educational two-dimensional
図5は、教育用二次元コード読取装置102が、紙媒体のテキストTXT2の二次元コードCEXを読み取って、音声合成の音声を出力する状態を示した説明図である。図5(a)は、二次元コードCEXが貼付された紙媒体の英会話教材のテキストTXT2を示したものであり、図5(b)は、教育用二次元コード読取装置102の音声合成の音声を出力中の状態を示している。この場合、教育用二次元コード読取装置102の会話エリアECでは、複数の英語の文章(テキスト情報SN1~SN5)が表示され、話者欄T1~T5に示す話者に従って、音声合成された音声が出力される。
FIG. 5 is an explanatory diagram showing a state in which the educational two-dimensional
教育用二次元コード読取装置102は、複数のテキスト情報SN1~SN5のデータの音声合成の音声の出力が終了すると、二次元コードデコード処理を終了する。
The educational two-dimensional
以上説明したように、本発明の実施形態に係る二次元エンコーダ101は、複数のテキスト情報が音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)と、テキスト情報(テキスト情報SN1~SN5)を音声のデータとして読み上げる話者とを、話者に関するタグにより関連付け、音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)及び話者に関するタグを二次元コードに符号化する。
As described above, the two-
一方、本発明の実施形態に係る教育用二次元コード読取装置102は、撮像装置20で撮像した二次元コードに基づいて、音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)及び話者に関するタグにデコードし、デコードされた音声合成されるデータ(テキスト情報SN1~SN5のデータ)及び話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータ(テキスト情報SN1~SN5のデータ)を、音声のデータに音声合成する。
On the other hand, the educational two-dimensional
このように、本発明の実施形態によれば、教育用二次元コード読取装置102は、複数人の話者E1,E2に対応する音声のデータに音声合成されるデータ(テキスト情報SN1~SN5のデータ)を音声合成して、その音声を出力することができるので、語学教育において効果的に学習することができる。
As described above, according to the embodiment of the present invention, the educational two-dimensional
また、本発明の実施形態では、話者に関するタグに基づいて、話者に関するタグに対応する声質で、音声合成されるデータ(テキスト情報SN1~SN5のデータ)を、音声のデータに音声合成するようになっていた。本実施形態では、さらに、デコード回路22でデコードされた複数のテキスト情報をディスプレイ10に表示することができる。
Further, in the embodiment of the present invention, based on the tag related to the speaker, the data to be voice-synthesized (data of the text information SN1 to SN5) with the voice quality corresponding to the tag related to the speaker is voice-synthesized into the voice data. It was like that. In the present embodiment, a plurality of text information decoded by the
図5(b)に示すように、教育用二次元コード読取装置102は、ディスプレイ10の会話エリアECに複数の英語の文章(テキスト情報SN1~SN5)と、画像エリアIMGに画像とを出力することができる。このため、教育用二次元コード読取装置102は、例えば、複数の英語の文章(テキスト情報SN1~SN5)を音声合成と同期させ、音声合成のタイミングに合わせたテロップ表示を行うことができる。これにより、より一層、語学を効率的に学習することができる。
As shown in FIG. 5B, the educational two-dimensional
また、本発明の実施形態に係る二次元エンコーダ101及び教育用二次元コード読取装置102は、テキストTXT1の英語の文章(テキスト情報SN1~SN5)の言語と、音声合成回路24により音声合成される言語は同一の言語である。ここで、テキストTXT1における文章(テキスト情報SN1~SN5)と、音声合成される音声の出力が同一の言語で対応していれば、英語以外の言語であっても適用することができる。即ち、音声合成回路24は、複数の言語に対応し、予め設定された言語により、音声合成されるデータ(テキスト情報SN1~SN5のデータ)を、音声のデータに音声合成することができる。
Further, the two-
図6は、本発明の実施形態に係る二次元エンコーダ101Aにおいて、複数の言語に対応し、複数の文章(テキスト情報SN1~SN5)に対応する言語で音声合成するための二次元コードの設定を示した説明図である。なお、二次元エンコーダ101Aの内部構成は、図1(a)の二次元エンコーダ101と同様とすることができる。
FIG. 6 shows the setting of a two-dimensional code for voice synthesis in a language corresponding to a plurality of languages and a plurality of sentences (text information SN1 to SN5) in the two-
図6に示すように、二次元エンコーダ101Aは、音声合成する言語を選択する言語選択LSをさらに備えるようになっている。二次元エンコーダ101Aは、言語選択LSにおいて、英語EN、仏語FR又は伊語IT等の複数の言語から何れかを選択することにより、タグ付回路14は、複数のテキスト情報SN1~SN5と、複数の話者と、複数の言語を示すタグとを対応させて、二次元符号化回路18により二次元コードCEXに符号化することができる。このように、音声合成されるデータを複数の言語でタグにより関連付けることができる。なお、話者を示すタグと言語を示すタグとは、一つのタグとして又は複数の組み合わせたタグとして付与することができる。
As shown in FIG. 6, the two-
教育用二次元コード読取装置102は、上述の二次元エンコーダ101Aによって符号化された二次元コードCEXを読み取る際に、音声合成されるデータ(テキスト情報SN1~SN5)毎にタグが示す話者及び言語を選択して、TTSプログラムを実行することができる。したがって、教育用二次元コード読取装置102は、二次元コードCEXを読み取ることで、複数のテキスト情報SN1~SN5(音声合成されるデータ)を、エンコードの際にタグ付けされた複数の異なる言語により音声合成することができる。
When the two-dimensional
例えば、二次元エンコーダ101Aが言語選択LSにおいて、仏語FRを選択した場合には、二次元コードCEXには仏語FRで音声合成する旨の設定が符号化され、教育用二次元コード読取装置102の音声合成回路24は、仏語FRにより音声合成する。同様に、二次元エンコーダ101Aが伊語ITを選択した場合には、二次元コードCEXには伊語ITで音声合成する旨の設定が符号化され、教育用二次元コード読取装置102の音声合成回路24は、伊語ITにより音声合成する。
For example, when the two-
また、複数のテキスト情報SN1~SN5を複数の言語で関連付けた二次元コードCEXは、図5(a)に示したような紙媒体の教材のテキストTXT2に印字や貼付により表示させておくことができる。これにより、二次元コードCEXを読み取った教育用二次元コード読取装置102から音声が出力されるので、あたかもテキストTXT2から発音されたように教材を利用でき、例えばテキストTXT2に描画された人物等の絵が発声するように構成することができる。
Further, the two-dimensional code CEX in which a plurality of text information SN1 to SN5 are associated with each other in a plurality of languages may be displayed by printing or pasting on the text TXT2 of the teaching material on a paper medium as shown in FIG. 5 (a). can. As a result, since the voice is output from the educational two-dimensional
このように、本発明の実施形態に係る二次元エンコーダ101A及び教育用二次元コード読取装置102は、テキスト情報の言語に対応する言語によって音声合成することができるので、語学教育において、より柔軟な語学の学習方法を提供することができる。さらに、教育用二次元コード読取装置102において自動翻訳機能を備え、例えば、英語ENから仏語FRへの自動翻訳読み上げや、仏語FRから伊語ITへの自動翻訳読み上げを行うようにしてもよい。
As described above, the two-
また、本発明の実施形態において、二次元エンコーダ101と教育用二次元コード読取装置102は、テキスト情報SN1~SN5のデータやイメージデータの画像を記憶回路12に格納するようになっていたが、本実施形態は、これに限定されるものではない。例えば、テキスト情報SN1~SN5のデータやイメージデータの画像は、二次元エンコーダ101又は教育用二次元コード読取装置102を構成する情報処理装置100の外部記憶回路として、USB(Universal Serial Bus)メモリにデータが格納されるようにしてもよく、また、ネットワークを介して、外部記憶装置にイメージデータが記憶されるようにしてもよい。
Further, in the embodiment of the present invention, the two-
なお、教育用二次元コード読取装置102は、スピーカ26から音声合成された音声を出力する際に、ディスプレイ10に現在位置を示す画像を拡張現実画像としてリアルタイムに表示させてもよい。現在位置を示す画像としては、GPS信号で取得した現在位置を含めた地図画像としたり、撮像装置20により撮像して取得した教育用二次元コード読取装置102の周辺の画像としてもよい。
The educational two-dimensional
また、教育用二次元コード読取装置102は、スピーカ26から音声合成された音声を出力する際に、ディスプレイ10にその音声に関連する仮想現実画像を表示させてもよい。教育用二次元コード読取装置102は、内像するジャイロセンサ等の姿勢検出器により教育用二次元コード読取装置102のディスプレイ10の向いている方角や傾きによって仮想現実画像の表示を変動させることができる。なお、ディスプレイ10に表示させる拡張現実画像や仮想現実画像にはスピーカ26から出力される音声のテキスト情報を重畳して表示させてもよい。また、拡張現実画像や仮想現実画像は、教育用二次元コード読取装置102の記憶回路12内に予め記憶しておくことができる。
Further, the educational two-dimensional
以上示した実施形態によると、教育用二次元コード読取装置102は、二次元コードを撮像してその二次元コードに含まれるテキスト情報を所望の話者による声質でスピーカから出力させることができる。今日における地球規模で展開するインターネット社会は、国際組織のような多言語社会であり、教育現場においてもこのような多言語社会に対応させることが望まれる。本実施形態の教育用二次元コード読取装置102を用いた語学教育システムは、このような多言語社会に対応して、語学教育における学習を効果的に行うことができる。
According to the embodiment shown above, the educational two-dimensional
また、以上説明した実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の趣旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これらの実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Moreover, the embodiment described above is presented as an example, and is not intended to limit the scope of the invention. These novel embodiments can be implemented in various other embodiments, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and variations thereof are included in the scope and gist of the invention, and are also included in the scope of the invention described in the claims and the equivalent scope thereof.
10 ディスプレイ 12 記憶回路
14 タグ付回路 16 入力回路
18 二次元符号化回路 19,29 内部バス
20 撮像装置 22 デコード回路
24 音声合成回路 26 スピーカ
28 画像生成回路
100 情報処理装置 101 二次元エンコーダ
102 教育用二次元コード読取装置
BT 設定画面ボタン SN1~SN5 文章(テキスト情報)
IMG 画像エリア IS 画像設定ボタン
SB 文章設定ボタン TB 話者設定ボタン
GN コード生成ボタン LS 言語選択項目
EN 英語 FR 仏語
IT 伊語 E1,E2 話者
10
IMG image area IS image setting button SB text setting button TB speaker setting button GN code generation button LS language selection item EN English FR French IT Italian E1, E2 speaker
Claims (4)
前記複数のテキスト情報が音声のデータに音声合成されるデータと、前記テキスト情報を音声のデータとして読み上げる際に選択させる話者及び言語とを、当該話者及び言語に関するタグにより関連付けるタグ付回路と、
前記タグ付回路により関連付けられた前記音声合成されるデータ並びに前記話者及び前記言語に関するタグを二次元コードに符号化する二次元符号化回路と、
を備えることを特徴とする二次元コードエンコーダ。 A display that can display multiple text information for multiple people,
A tagged circuit that associates the data in which the plurality of text information is voice-synthesized with the voice data and the speaker and language to be selected when the text information is read out as voice data by a tag related to the speaker and language. ,
A two-dimensional coding circuit that encodes the voice-synthesized data associated with the tagged circuit and tags related to the speaker and the language into a two-dimensional code.
A two-dimensional code encoder characterized by being equipped with.
前記撮像装置で撮像した前記二次元コードに基づいて、前記音声合成されるデータ及び前記話者に関するタグにデコードするデコード回路と、
前記デコード回路でデコードされた前記音声合成されるデータ及び前記話者に関するタグに基づいて、前記話者に関するタグに対応する声質を選択して、前記音声合成されるデータを、前記音声のデータに音声合成する音声合成回路と、
前記音声合成回路で音声合成された音声を出力するスピーカと、
を備えることを特徴とする教育用二次元コード読取装置。 The data in which a plurality of text information corresponding to a plurality of people is voice-synthesized into voice data and the speaker selected when reading the text information as voice data are associated with each other by a tag related to the speaker and encoded. An image pickup device that captures the resulting two-dimensional code, and
A decoding circuit that decodes the voice-synthesized data and a tag related to the speaker based on the two-dimensional code captured by the image pickup device.
Based on the voice-synthesized data decoded by the decoding circuit and the tag related to the speaker, the voice quality corresponding to the tag related to the speaker is selected, and the voice-synthesized data is converted into the voice data. A voice synthesis circuit that synthesizes voice and
A speaker that outputs voice synthesized by the voice synthesis circuit,
An educational two-dimensional code reader characterized by being equipped with.
ことを特徴とする請求項2に記載の教育用二次元コード読取装置。 The two-dimensional code reading device for education according to claim 2, further comprising a display for displaying the plurality of text information of the voice-synthesized data decoded by the decoding circuit.
前記音声合成回路は、前記複数のテキスト情報を複数の前記言語に関するタグに基づいて読み上げる言語を選択して、前記音声合成されるデータを前記音声のデータに音声合成する、
ことを特徴とする請求項2または3に記載の教育用二次元コード読取装置。 The textual information is associated with a language tag and
The voice synthesis circuit selects a language for reading out the plurality of text information based on a plurality of tags related to the language, and synthesizes the voice-synthesized data into the voice data.
The two-dimensional code reading device for education according to claim 2 or 3.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020171231A JP7121411B2 (en) | 2020-10-09 | 2020-10-09 | Two-dimensional code encoder and educational two-dimensional code reader |
PCT/JP2021/032493 WO2022074979A1 (en) | 2020-10-09 | 2021-09-03 | Two-dimensional code encoder and educational two-dimensional code reading device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020171231A JP7121411B2 (en) | 2020-10-09 | 2020-10-09 | Two-dimensional code encoder and educational two-dimensional code reader |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022062983A true JP2022062983A (en) | 2022-04-21 |
JP7121411B2 JP7121411B2 (en) | 2022-08-18 |
Family
ID=81125914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020171231A Active JP7121411B2 (en) | 2020-10-09 | 2020-10-09 | Two-dimensional code encoder and educational two-dimensional code reader |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7121411B2 (en) |
WO (1) | WO2022074979A1 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005321706A (en) * | 2004-05-11 | 2005-11-17 | Nippon Telegr & Teleph Corp <Ntt> | Method for reproducing digital book and apparatus for the same |
JP2010256821A (en) * | 2009-04-28 | 2010-11-11 | Sci-Tec:Kk | Learning support system |
JP2015114559A (en) * | 2013-12-13 | 2015-06-22 | 眞理子 溝口 | Method for recording two-dimensional code and two-dimensional code readout device |
CN108091182A (en) * | 2016-11-22 | 2018-05-29 | 罗敬业 | The english teaching device of smart machine |
JP2019061442A (en) * | 2017-09-26 | 2019-04-18 | カシオ計算機株式会社 | Information processing system, electronic device, information processing method, and program |
JP2020027132A (en) * | 2018-08-09 | 2020-02-20 | 富士ゼロックス株式会社 | Information processing device and program |
-
2020
- 2020-10-09 JP JP2020171231A patent/JP7121411B2/en active Active
-
2021
- 2021-09-03 WO PCT/JP2021/032493 patent/WO2022074979A1/en active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005321706A (en) * | 2004-05-11 | 2005-11-17 | Nippon Telegr & Teleph Corp <Ntt> | Method for reproducing digital book and apparatus for the same |
JP2010256821A (en) * | 2009-04-28 | 2010-11-11 | Sci-Tec:Kk | Learning support system |
JP2015114559A (en) * | 2013-12-13 | 2015-06-22 | 眞理子 溝口 | Method for recording two-dimensional code and two-dimensional code readout device |
CN108091182A (en) * | 2016-11-22 | 2018-05-29 | 罗敬业 | The english teaching device of smart machine |
JP2019061442A (en) * | 2017-09-26 | 2019-04-18 | カシオ計算機株式会社 | Information processing system, electronic device, information processing method, and program |
JP2020027132A (en) * | 2018-08-09 | 2020-02-20 | 富士ゼロックス株式会社 | Information processing device and program |
Also Published As
Publication number | Publication date |
---|---|
WO2022074979A1 (en) | 2022-04-14 |
JP7121411B2 (en) | 2022-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4356745B2 (en) | Machine translation system, machine translation method and program | |
US6377925B1 (en) | Electronic translator for assisting communications | |
US8645121B2 (en) | Language translation of visual and audio input | |
US10692494B2 (en) | Application-independent content translation | |
JP5634853B2 (en) | Electronic comic viewer device, electronic comic browsing system, viewer program, and electronic comic display method | |
JPH0510874B2 (en) | ||
CN103348338A (en) | File format, server, view device for digital comic, digital comic generation device | |
CN114390220A (en) | Animation video generation method and related device | |
JPH1155614A (en) | Speech recognition image processing unit | |
WO2022074979A1 (en) | Two-dimensional code encoder and educational two-dimensional code reading device | |
JP6832503B2 (en) | Information presentation method, information presentation program and information presentation system | |
KR101990019B1 (en) | Terminal for performing hybrid caption effect, and method thereby | |
US9087512B2 (en) | Speech synthesis method and apparatus for electronic system | |
JP2007010754A (en) | User interface device and method thereof | |
JP2018097250A (en) | Language learning device | |
CN111311713A (en) | Cartoon processing method, cartoon display device, cartoon terminal and cartoon storage medium | |
KR20140087956A (en) | Apparatus and method for learning phonics by using native speaker's pronunciation data and word and sentence and image data | |
KR20030079497A (en) | service method of language study | |
JP6422647B2 (en) | Two-dimensional code recording method and two-dimensional code reader | |
JP3222283B2 (en) | Guidance device | |
KR20110065276A (en) | Method and apparatus for pronunciation exercise using comparison video | |
KR20140073768A (en) | Apparatus and method for language education by using native speaker's pronunciation data and thoughtunit | |
JP2002297170A (en) | Two-dimensional code encoder, encoding method for two- dimensional code, two-dimensional code vocalizing device, two-dimensional code vocalizing method, text document vocalizing method, program, and computer-readable recording medium | |
KR20140087950A (en) | Apparatus and method for learning rhythm pattern by using native speaker's pronunciation data and language data. | |
KR200279383Y1 (en) | Language school system using barcode |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220728 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7121411 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |