JP2016212374A - 音声出力装置、音声出力方法、およびプログラム - Google Patents

音声出力装置、音声出力方法、およびプログラム Download PDF

Info

Publication number
JP2016212374A
JP2016212374A JP2015238293A JP2015238293A JP2016212374A JP 2016212374 A JP2016212374 A JP 2016212374A JP 2015238293 A JP2015238293 A JP 2015238293A JP 2015238293 A JP2015238293 A JP 2015238293A JP 2016212374 A JP2016212374 A JP 2016212374A
Authority
JP
Japan
Prior art keywords
word
words
voice
data
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015238293A
Other languages
English (en)
Other versions
JP2016212374A5 (ja
JP6365520B2 (ja
Inventor
建彦 紀井
Tatsuhiko Kii
建彦 紀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to CN201610171393.1A priority Critical patent/CN106168945B/zh
Publication of JP2016212374A publication Critical patent/JP2016212374A/ja
Publication of JP2016212374A5 publication Critical patent/JP2016212374A5/ja
Application granted granted Critical
Publication of JP6365520B2 publication Critical patent/JP6365520B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】音声出力装置であって、ユーザにより指定された範囲にある単語の音声をその単語数に応じた音声として出力する。
【解決手段】文書Gに表記されたテキストにスキャナ部17を接触させて移動させ当該テキストを含む画像を読み取ると、その画像データから文字認識されたテキストが1つの単語である場合、当該単語に対応する見出し語の音声データが辞書データから取得されて出力され、複数の単語であって複数単語辞書データの見出し語にある場合は当該見出し語(イディオム)の音声データ(リエゾン)が取得されて出力される。また複数の単語であって複数単語辞書の見出し語にない場合は、当該複数単語を含む例文あるいは会話文が例文データあるいは会話集データから検索され、該例文(あるいは会話文)に対応する音声データのうち前記複数単語に対応する部分の読上げ音声データ(リエゾン)が出力される。
【選択図】 図1

Description

本発明は、例えば紙や画像によって表記されている外国語のテキストを用いて行なう学習を支援するための音声出力装置、音声出力方法、およびその制御プログラムに関する。
従来、外国語を学習する装置として、電子辞書、電子単語帳が実用されている。
電子単語帳は、電子辞書に記憶された辞書の内容のうち、例えば辞書検索された単語の内容やユーザによって指定された単語の内容が予め定められた範囲の情報量で登録され、当該登録された各単語の内容を、紙の単語帳を捲るように表示させて見ることができる。
また、前記電子辞書や電子単語帳には、表示されている単語について、[音声]キーのキー操作に応じて当該単語の音声(発音)を出力する機能を有するものがある。
単語等の文字列の音声を出力する装置として、タッチパネル式の表示画面に表示されたテキストを指等でなぞると、当該なぞられた範囲のテキストの音声を出力するテキスト読み上げ装置が考えられている(例えば、特許文献1参照。)。
また、スキャナにより読み取った文字を認識して表示すると共に、当該認識された文字の音声を出力する簡易入出力装置が考えられている(例えば、特許文献2参照。)。
さらに、タッチパネル式の表示画面に表示された文字列をペンタッチすると、当該ペンタッチされた文字が含まれる単語を始点とする一連の文字列の音声を出力する辞書機能を備えた電子装置が考えられている(例えば、特許文献3参照。)。
特開平09−265299号公報 特開平09−244868号公報 特開2010−85727号公報
前記従来の装置では、ユーザによりタッチされたあるいはスキャナにより読み取った範囲の文字列に対応した音声を出力することができる。
しかしながら、前記ユーザにより指定された範囲の文字列に複数の単語が含まれていても、当該複数の単語の音声を順番に続けて出力するだけであり、連続する単語の組み合わせに応じて変化する連音(リエゾン)の音声として聞き取ることはできない。
本発明は、このような課題に鑑みなされたもので、ユーザにより指定された範囲にある単語の音声をその単語数に応じた適切な音声として出力することが可能になる音声出力装置、音声出力方法、およびその制御プログラムを提供することを目的とする。
本発明に係る音声出力装置は、複数の単語を含むテキストから少なくとも1つの単語を含む範囲をユーザに指定させる範囲指定手段と、前記範囲指定手段により1つの単語が指定された場合には、各単語の音声データを記憶している単語データベースから、前記指定された単語に対応する音声データを取得して音声出力をする第1の音声出力手段と、前記範囲指定手段により複数の単語が指定された場合には、文が読み上げられた音声データを記憶している文データベースから、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をする第2の音声出力手段とを備えたことを特徴としている。
本発明によれば、ユーザにより指定された範囲にある単語の音声をその単語数に応じた適切な音声として出力することが可能になる。
本発明の実施形態に係る音声出力装置10の外観構成を示す図。 前記音声出力装置10の電子回路の構成を示すブロック図。 前記音声出力装置10の辞書データベース12c、複数単語辞書データベース12d、例文データベース12e、会話集データベース12fの内容を示す図。 前記音声出力装置10の第1実施形態の音声出力処理を示すフローチャート。 前記音声出力装置10の第1実施形態の音声出力処理における再生速度決定処理を示すフローチャート。 音声出力装置10の第1実施形態の音声出力処理に従った文書G上での本体操作に応じた音声出力動作を示す図。 前記音声出力装置の第2実施形態の構成を示す外観図。 前記音声出力装置の第3実施形態を説明する図。 前記音声出力装置の第3実施形態の音声出力処理を示すフローチャート。
以下図面により本発明の実施の形態について説明する。
図1は、本発明の実施形態に係る音声出力装置10の外観構成を示す図である。
図2は、前記音声出力装置10の電子回路の構成を示すブロック図である。
前記音声出力装置10は、ペン型の電子機器として以下説明するが、例えば携帯機器として構成され、以下に示す処理プログラムを、テキストデータの取り込みあるいは表示機能を備えたタッチパネル式のPDA(personal digital assistants)、電子辞書、PC(personal computer)、携帯電話、電子ブック、携帯ゲーム機等にインストールすることで構成してもよい。
前記図1に示す音声出力装置10は、ユーザが片手で把持可能なペン型の本体ケースを有し、本体先端にはCCDイメージセンサを備えたスキャナ部17、本体中央にはタッチパネル付き表示部18、本体後部には音声出力部19が設けられる。
この音声出力装置10は、スキャナ部17により読み取った文書Gの部分画像に含まれるテキストを文字認識し、この文字認識されたテキストを辞書データから検索し意味や例文を表示する辞書機能や、この文字認識されたテキストに含まれる一つの単語あるいは複数の単語に応じた発音の音声データを音声出力部19から出力する機能を有する。また、詳細な説明は省略するが、内部データベースを用いた辞書検索機能や外国語学習機能を有している。
前記音声出力装置10の電子回路は、プログラムによって動作が制御されるコンピュータによって構成され、その電子回路には、CPU(central processing unit)11が備えられる。
前記CPU11は、記憶装置12内に予め記憶された装置制御プログラム12aに応じて、RAM16を作業用メモリとして回路各部の動作を制御する。なお、装置制御プログラム12aは、ROMカードなどの外部記録媒体13から記録媒体読み取り部14を介して前記記憶装置12に読み込ませるか、あるいはインターネットN上のWebサーバ(この場合はプログラムサーバ)20から通信部15を介して前記記憶装置12に読み込ませることができる。
前記記憶装置12に記憶された装置制御プログラム12aは、スキャナ部17、タッチパネル付き表示部18からのユーザ操作に応じた入力信号、あるいは通信部15を介して接続されるインターネットN上のWebサーバ20との通信信号に応じて起動される。
前記CPU11には、前記記憶装置12、記録媒体読み取り部14、通信部15、RAM16、スキャナ部17、タッチパネル付き表示部18、音声出力部19が接続される。
前記記憶装置12には、装置制御プログラム12aとして、当該装置10の全体の動作を司るシステムプログラム、通信部15を介してインターネットN上のWebサーバ20や図示しないユーザPC(Personal Computer)などとデータ通信するための通信プログラム等が記憶される。
また、前記装置制御プログラム12aには、前記スキャナ部17により読み取られた画像データに含まれるテキストがOCR(Optical Character Recognition)処理により文字認識され、得られ単語が1つである場合は当該単語に対応する見出し語の音声データを辞書データベース12cから取得して再生し、複数の単語であって当該複数の単語からなる見出し語がある場合は当該見出し語の音声データを複数単語辞書データベース12dから取得して再生し、複数の単語であって当該複数の単語からなる見出し語がない場合は当該複数の単語に対応する音声データを例文データベース12eあるいは会話集データベース12fから取得して再生するための音声出力プログラム(図4参照)が含まれる。
そして、前記記憶装置12には、更に、前記OCR処理のための文字認識プログラム12bが記憶される。その他に、辞書検索機能や外国語学習機能を実現するプログラムを記憶している。
図3は、前記音声出力装置10の辞書データベース12c、複数単語辞書データベース12d、例文データベース12e、会話集データベース12fの内容を示す図である。
前記辞書データベース12cは、図3(A)に示すように、複数の見出し語(単語)のそれぞれについて当該見出し語の発音データ(音声データ)と当該見出し語の語義を含む説明情報とを対応付けて記憶している。
前記複数単語辞書データベース12dは、図3(B)に示すように、熟語、慣用語、成句等(イディオム)、複数の単語からなる見出し語のそれぞれについて当該見出し語を母語話者が読み上げた連音(リエゾン)による発音データ(音声データ)と当該見出し語の語義を含む説明情報とを対応付けて記憶している。
前記例文データベース12eは、前記辞書データベース12cおよび複数単語辞書データベース12dに記憶された各見出し語(単語)(複数単語)を用いたそれぞれの例文と当該例文を母語話者が読み上げた連音(リエゾン)による読み上げデータ(音声データ)と当該例文の訳語とを対応付けて記憶している。
前記会話集データベース12fは、様々な場面に対応する会話文と当該会話文を母語話者が読み上げた連音(リエゾン)による読み上げデータ(音声データ)と当該会話文の訳語とを対応付けて記憶している。この会話集データベース12fは、外国語学習機能で利用することができる。
また、前記記憶装置12には、前記スキャナ部17により読み取られた画像データ12g、前記OCR処理によりテキストとして認識されたテキストデータ12hなどが記憶される。
前記RAM16には、表示データエリア16a、再生速度設定データエリア16bが備えられる。前記表示データエリア16aには、前記タッチパネル付き表示部18の表示サイズに対応したメモリ容量が確保され、当該表示部18に表示させるべき表示データが展開されて記憶される。前記再生速度設定データエリア16bには、前記スキャナ17による画像の読み取りに伴い検出された当該読み取りの移動速度に応じて決定される前記1つの単語または複数の単語に対応する音声データの再生速度(低/中/高)が記憶される。
このように構成された音声出力装置10は、前記CPU11が前記装置制御プログラム12a(音声出力処理等を実行するためのプログラムを含む)に記述された命令に従い回路各部の動作を制御し、ソフトウエアとハードウエアとが協働して動作することにより、以下の動作説明で述べる機能を実現する。
次に、前記構成の音声出力装置10の動作について説明する。
(第1実施形態)
図4は、前記音声出力装置10の第1実施形態の音声出力処理を示すフローチャートである。
図5は、前記音声出力装置10の第1実施形態の音声出力処理における再生速度決定処理を示すフローチャートである。
図6は、前記音声出力装置10の第1実施形態の音声出力処理に従った文書G上での本体操作に応じた音声出力動作を示す図である。
例えば、図6に示すように、文書G(英字新聞等)に表記されている英文(外国語)テキストに含まれる任意のテキスト部分(文字列)に対して、音声出力装置10のスキャナ部17を接触させて移動させると、当該移動に伴いスキャナ部17により読み取られたテキスト部分の画像データ12gが順次記憶される(ステップS1)と共に、前記画像の読み取り速度に基づき移動の速度が検出される(ステップS2)。
そして、前記検出された移動の速度に基づき前記テキスト部分の読み取りが停止したと判断されると(ステップS3(Yes))、当該読み取りに伴い記憶された前記画像データ12gに含まれるテキストがOCR処理により文字認識されテキストデータ12hとして記憶される(ステップS4)。
すると、前記文字認識されたテキストデータ12hは複数の単語のテキストであるか、または1つの単語のテキストであるかが判断される(ステップS5,S6)。
ここで、前記図6で示したように、文書G上に表記された1つの単語、例えば、“important”のテキスト部分が読み取られると、1つの単語であると判断され(ステップS6(Yes))、当該単語に対応する見出し語“important”が辞書データベース12c(図3(A)参照)から検索され(ステップS7)、同見出し語に対応した音声データ「インポータント」が取得される(ステップS8)。
すると、前記ステップS2において検出された前記テキスト部分の画像読み取りの移動速度に応じた再生速度が決定され(ステップSA)、前記見出し語“important”に対応した音声データ「インポータント」が当該決定された再生速度で音声出力部19から出力される(ステップS12)。
また、前記図6で示したように、文書G上に表記された2つの単語“What time”のテキスト部分が読み取られると、複数の単語であると判断され(ステップS5(Yes))、当該複数の単語“What time”に対応する見出し語が前記複数単語辞書データベース12dにあるか否かが判断される(ステップS9)。
ここで、前記複数の単語“What time”に対応する見出し語が前記複数単語辞書データベース12dにないと判断されると(ステップS9(No))、当該複数の単語“What time”を含む例文データあるいは会話文データが例文データベース12eあるいは会話集データベース12fから検索される(ステップS10)。そして、検索された例文データ(あるいは会話文データ)に対応する音声データのうち前記複数の単語“What time”に対応する部分の音声データが取得される(ステップS11)。この場合に、連音(リエゾン)で発声されていればその音声データが取得されるので、ここでは読み上げ音声データ「ファッタイム」が取得される(ステップS11)。
なお、前記読み取られた複数の単語“What time”を含むテキストデータが前記例文データベース12eと会話集データベース12fの両方から検索された場合は(ステップS10)、予め設定された各データベース12e,12fの優先順位に従いその何れかのデータベース12e(12f)から前記複数の単語“What time”に対応する部分の音声データが取得される(ステップS11)。
すると、前記1つの単語の場合と同様に、前記テキスト部分の画像読み取りの移動速度に応じた再生速度が決定され(ステップSA)、前記複数の単語“What time”に対応した連音(リエゾン)の音声データ「ファッタイム」が当該決定された再生速度で音声出力部19から出力される(ステップS12)。
また、前記文書G上に表記された2つの単語(例えば“set out”)のテキスト部分が読み取られた際に(ステップS5(Yes))、当該複数の単語“set out”(イディオム)に対応する見出し語が前記複数単語辞書データベース12dにあると判断された場合は(ステップS9(Yes))、当該複数単語辞書データベース12dから同見出し語“set out”(イディオム)に対応した連音(リエゾン)による音声データ「セッタウト」が検索されて取得される(ステップS8)。
するとまた、前記同様に、前記テキスト部分の画像読み取りの移動速度に応じた再生速度が決定され(ステップSA)、前記複数の単語“set out”(イディオム)に対応した連音(リエゾン)の音声データ「セッタウト」が当該決定された再生速度で音声出力部19から出力される(ステップS12)。
ここで、前記テキスト部分の画像読み取りの移動速度に応じた再生速度の決定処理(ステップSA)について図5のフローチャートを用いて説明する。
先ず、前記ステップS2において前記画像の読み取り開始から停止までに繰り返し検出された移動速度の平均値(平均移動速度V)が算出され(ステップA1)、この平均移動速度Vが、予め設定された低速値Vsおよび高速値Vfと比較される(ステップA2,A3)。
そして、前記平均移動速度Vが前記低速値Vsよりも小さいと判断された場合は(ステップA2(Yes))、前記再生速度設定データ16bが“低”に設定される(ステップA5)。また、前記平均移動速度Vが前記高速値Vfよりも大きいと判断された場合は(ステップA3(Yes))、前記再生速度設定データ16bが“高”に設定される(ステップA6)。
一方、前記平均移動速度Vが前記低速値Vsから高速値Vfまでの間にあると判断された場合は(ステップA2(No),A3(No))、前記再生速度設定データ16bが“中”に設定される(ステップA6)。
したがって、前記構成の音声出力装置10による第1実施形態の音声出力機能によれば、外国語の文書Gに表記された所望の部分のテキストにスキャナ部17を接触させて移動させ当該テキストを含む画像を読み取ると、その画像データから文字認識されたテキストが1つの単語であるか複数の単語であるかが判断される。そして、1つの単語である場合は当該単語に対応する見出し語の音声データが辞書データベース12cから取得されて出力され、複数の単語であって複数単語辞書データベース12dの見出し語にある場合は当該見出し語(イディオム)の音声データ(リエゾン)が取得されて出力される。また、前記複数の単語であって複数単語辞書データベース12dの見出し語にない場合は、当該複数の単語を含む例文あるいは会話文が例文データベース12eあるいは会話集データベース12fから検索され、その例文(あるいは会話文)に対応する音声データのうち前記複数の単語に対応する部分の読み上げ音声データ(リエゾン)が出力される。
これにより、前記文書G上でユーザにより指定された範囲にある単語の音声をその単語数に応じた適切な音声として出力することができる。
(第2実施形態)
図7は、前記音声出力装置の第2実施形態の構成を示す外観図である。
この第2実施形態の音声出力装置では、前記第1実施形態におけるスキャナ部17を、別体のペン型スキャナ17Dとして構成し、このペン型スキャナ17Dにより読み取った文書G上の画像データを、Bluetooth(登録商標)等の近距離無線信号BTによりPDA(スマートフォン等)10Aや電子辞書10Bに送信する。
前記PDA10Aや電子辞書10Bには、前記第1実施形態と同様に、移動速度検出機能、OCR機能、辞書機能、再生速度決定機能、1つの単語か複数の単語かに応じた音声出力機能を持たせる。
したがって、この第2実施形態の音声出力装置によれば、外国語の文書Gに表記された所望の部分のテキストを、ペン型スキャナ17Dを操作して読み取ると、PDA10Aあるいは電子辞書10Bにおいて、前記所望の部分のテキストが1つの単語である場合は当該単語に対応する見出し語の音声データが出力され、複数の単語である場合は当該複数の単語に対応する見出し語(イディオム)の音声データ(リエゾン)、または当該複数の単語を含む例文あるいは会話文に対応する音声データ(リエゾン)のうち同複数の単語に対応する部分の読み上げ音声データが出力される。
これにより、前記第1実施形態と同様に、前記文書G上でユーザにより指定された範囲にある単語の音声を、PDA10Aや電子辞書10Bの側でその単語数に応じた適切な音声として出力することができる。
(第3実施形態)
図8は、前記音声出力装置の第3実施形態を説明する図である。
この第3実施形態では、PDA(スマートフォン等)や電子辞書などの単体の携帯機器を音声出力装置として構成し、内蔵カメラにより撮像(読み取り)されOCR処理された文書GT、あるいは外部からダウンロードされるか予め記憶された複数のテキストデータの中からユーザによって選択された文書GTを表示させ、ユーザによって指定された所望の部分のテキスト(1単語または複数単語)に対応する音声データを出力する。
図9は、前記音声出力装置の第3実施形態の音声出力処理を示すフローチャートである。
この第3実施形態のフローチャートにおいて、ステップT10〜T17に対応する処理については、前記図4で示した第1実施形態のフローチャートにおけるステップS5〜S12に対応する処理と同じのためその詳細な説明は省略する。
内蔵カメラにより英字新聞等の外国語の書面を撮像した画像データを取り込み(ステップT1,T2)、OCR処理(ステップT3)により文字認識したテキストの文書GTを表示部18に表示させる(ステップT5)。
あるいは、複数のテキストデータの中からユーザによって選択された文書GTを表示部18に表示させる(ステップT4,T5)。
前記表示部18に表示された文書GTを対象に、所望の部分のテキストをペンPでドラッグdして指定すると(ステップT6(Yes))、当該ペンPの移動の停止が判断される(ステップT9(Yes))までの間、前記指定の範囲のテキストが取り込まれテキストデータ12hとして順次記憶されると共に(ステップT7)、前記ペンPのドラッグに伴う移動速度が逐次検出される(ステップT8)。
そして、前記ペンPの移動が停止したと判断されると(ステップT9(Yes))、前記第1実施形態と同様に、前記指定の範囲のテキストが1つの単語である場合には(ステップT11(Yes))、当該単語に対応する見出し語の音声データが辞書データベース12cから検索されて取得され(ステップT12,T13)、前記移動速度の平均に応じて決定された再生速度で出力される(ステップTA(A1〜A6),T17)。
また前記第1実施形態と同様に、前記指定の範囲のテキストが複数の単語であって当該複数の単語に対応する見出し語(イディオム)が複数単語辞書データベース12dにある場合は(ステップT14(Yes))、同複数の単語に対応する見出し語(イディオム)の音声データ(リエゾン)が前記複数単語辞書データベース12dから検索されて取得され(ステップT13)、前記移動速度の平均に応じて決定された再生速度で出力される(ステップTA(A1〜A6),T17)。
また前記第1実施形態と同様に、前記指定の範囲のテキストが複数の単語であって当該複数の単語に対応する見出し語(イディオム)が複数単語辞書データベース12dにない場合には(ステップT14(No))、当該複数の単語を含む例文あるいは会話文に対応する音声データのうち同複数の単語に対応する部分の音声データ(リエゾン)が例文データベース12eあるいは会話集データベース12fから検索されて取得され(ステップT15,T16)、前記移動速度の平均に応じて決定された再生速度で出力される(ステップTA,T17)。
したがって、この第3実施形態の音声出力装置によれば、カメラにより撮像してOCR処理したテキストや任意に選択したテキストの文書GTを表示させ、当該表示文書GT内の所望の部分のテキストを、ペンPによりドラッグして指定すると、前記所望の部分のテキストが1つの単語である場合は当該単語に対応する見出し語の音声データが出力され、複数の単語である場合は当該複数の単語に対応する見出し語の音声データが出力されるか、または同複数の単語を含む例文あるいは会話文に対応する音声データのうち同複数の単語に対応する部分の読み上げ音声データが出力される。
これにより、前記第1実施形態と同様に、前記文書GT上でユーザにより指定された範囲にある単語の音声を、その単語数に応じた適切な音声として出力することができる。
なお、前記各実施形態では、辞書データベース12c、複数単語辞書データベース12d、例文データベース12e、会話集データベース12fを、別々のデータベースとして構成したが、例えば前記辞書データベース12cに他のデータベース12d〜12fの内容を記憶させてもよい。この場合、辞書データベース12cには、元々ある単数の単語からなる見出し語に加えて、前記複数単語所データベース12dによる複数の単語からなる見出し語(イディオム)を記憶させ、当該各見出し語に対応付けて同見出し語を含む例文や会話文を記憶させることが考えられる。
前記各実施形態において記載した音声出力装置による各処理の手法、すなわち、図4のフローチャートに示す第1実施形態(第2実施形態)の音声出力処理、図5のフローチャートに示す前記音声出力処理に伴う再生速度決定処理、図9のフローチャートに示す第3実施形態の音声出力処理等の各手法は、何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード等)、磁気ディスク(フロッピ(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の外部記録装置の媒体(13)に格納して配布することができる。そして、スキャナ部(17)あるいはテキストデータの取り込み機能を備えた電子機器(10)のコンピュータ(CPU11)は、この外部記録装置の媒体(13)に記憶されたプログラムを記憶装置(12)に読み込み、この読み込んだプログラムによって動作が制御されることにより、前記各実施形態において説明したユーザ指定の範囲のテキストの単語に対応した音声出力機能を実現し、前述した手法による同様の処理を実行することができる。
また、前記各手法を実現するためのプログラムのデータは、プログラムコードの形態として通信ネットワーク(N)上を伝送させることができ、この通信ネットワーク(N)に接続されたコンピュータ装置(プログラムサーバ)から前記プログラムのデータを、前記スキャナ部(17)あるいはテキストデータの取り込み機能を備えた電子機器(10)に取り込んで記憶装置(12)に記憶させ、前述したユーザ指定の範囲のテキストの単語に対応した音声出力機能を実現することもできる。
本願発明は、前記各実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、前記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、各実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が異なる形態にして組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]
複数の単語を含むテキストから少なくとも1つの単語を含む範囲をユーザに指定させる範囲指定手段と、
前記範囲指定手段により1つの単語が指定された場合には、各単語の音声データを記憶している単語データベースから、前記指定された単語に対応する音声データを取得して音声出力をする第1の音声出力手段と、
前記範囲指定手段により複数の単語が指定された場合には、文が読み上げられた音声データを記憶している文データベースから、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をする第2の音声出力手段と
を備えたことを特徴とする音声出力装置。
[2]
見出し語と、当該見出し語の説明情報と、当該見出し語の音声データとを関連付けて記憶している辞書データ記憶手段と、
文が読み上げられた音声データを記憶している文データ記憶手段と、
前記範囲指定手段により指定された範囲に含まれる単語の数を判断する単語数判断手段とを備え、
前記第1の音声出力手段は、前記単語数判断手段により単語が単数であると判断された場合に、前記単語データベースとしての前記辞書データ記憶手段から、前記指定された単語に対応する見出し語の音声データを取得して音声出力をし、
前記第2の音声出力手段は、前記単語数判断手段により単語が複数であると判断された場合に、前記文データベースとしての前記文データ記憶手段から、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をすることを特徴とする[1]に記載の音声出力装置。
[3]
前記単語数判断手段により単語が複数であると判断された場合に、前記辞書データ記憶手段に該当する見出し語があるか判断する見出し語判断手段と、
前記見出し語判断手段により該当する見出し語があると判断された場合は、前記指定された複数の単語に対応する見出し語の音声データを前記辞書データ記憶手段から取得して音声出力をする第3の音声出力手段と
を備え、
前記第2の音声出力手段は、前記見出し語判断手段により該当する見出し語がないと判断された場合に、前記文データ記憶手段から前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をすることを特徴とする[2]に記載の音声出力装置。
[4]
前記辞書データ記憶手段は、単数の単語を見出し語とした第1の辞書データと、複数の単語からなるイディオムを見出し語とした第2の辞書データとを有する
ことを特徴とする[3]に記載の音声出力装置。
[5]
前記文データ記憶手段は、前記辞書データ記憶手段に記憶された見出し語を含む例文と当該例文が読み上げられた音声データとを記憶している例文データ記憶手段を有し、
前記第2の音声出力手段は、前記見出し語判断手段により前記指定された複数の単語に該当する見出し語が前記辞書データ記憶手段にないと判断された場合に、当該複数の単語を含む例文の同複数の単語に対応した部分の音声データを前記例文データ記憶手段から取得して音声出力をする、
ことを特徴とする[4]に記載の音声出力装置。
[6]
ユーザ操作に応じて移動した範囲の画像を読み取る画像読み取り手段と、
この画像読み取り手段により読み取られた画像に含まれるテキストを文字認識する文字認識手段とを備え、
前記範囲指定手段は、表記されているテキストを、ユーザ操作に従って、所望の開始位置から終了位置まで前記画像読み取り手段により読み取って指定する、
ことを特徴とする[1]ないし[5]の何れかに記載の音声出力装置。
[7]
タッチパネル付き表示部を備え、
前記範囲指定手段は、前記タッチパネル付き表示部に表示されているテキストを、ユーザのタッチ操作に従って、所望の開始位置から終了位置まで指定する、
ことを特徴とする[1]ないし[6]の何れかに記載の音声出力装置。
[8]
複数の単語を含むテキストから少なくとも1つの単語を含む範囲をユーザに指定させる範囲指定ステップと、
前記範囲指定ステップにより1つの単語が指定された場合には、各単語の音声データを記憶している単語データベースから、前記指定された単語に対応する音声データを取得して音声出力をする第1の音声出力ステップと、
前記範囲指定ステップにより複数の単語が指定された場合には、文が読み上げられた音声データを記憶している文データベースから、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をする第2の音声出力ステップと
を備えたことを特徴とする音声出力方法。
[9]
電子機器のコンピュータを制御するためのプログラムであって、
前記コンピュータを、
複数の単語を含むテキストから少なくとも1つの単語を含む範囲をユーザに指定させる範囲指定手段と、
前記範囲指定手段により1つの単語が指定された場合には、各単語の音声データを記憶している単語データベースから、前記指定された単語に対応する音声データを取得して音声出力をする第1の音声出力手段と、
前記範囲指定手段により複数の単語が指定された場合には、文が読み上げられた音声データを記憶している文データベースから、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をする第2の音声出力手段、
として機能させるためのコンピュータ読み込み可能なプログラム。
10 …音声出力装置
10A…PDA(スマートフォン等)
10B…電子辞書
11 …CPU
12 …記憶装置
12a…装置制御プログラム
12b…文字認識プログラム
12c…辞書データベース
12d…複数単語辞書データベース
12e…例文データベース
12f…会話集データベース
12g…画像データ
12h…テキストデータ
13 …外部記録媒体
14 …記録媒体読み取り部
15 …通信部
16 …RAM
16a…表示データエリア
16b…再生速度設定データエリア
17 …スキャナ部
17D…ペン型スキャナ
18 …タッチパネル付き表示部
19 …音声出力部
G,GT…文書
P …ペン
d …ドラッグ

Claims (9)

  1. 複数の単語を含むテキストから少なくとも1つの単語を含む範囲をユーザに指定させる範囲指定手段と、
    前記範囲指定手段により1つの単語が指定された場合には、各単語の音声データを記憶している単語データベースから、前記指定された単語に対応する音声データを取得して音声出力をする第1の音声出力手段と、
    前記範囲指定手段により複数の単語が指定された場合には、文が読み上げられた音声データを記憶している文データベースから、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をする第2の音声出力手段と
    を備えたことを特徴とする音声出力装置。
  2. 見出し語と、当該見出し語の説明情報と、当該見出し語の音声データとを関連付けて記憶している辞書データ記憶手段と、
    文が読み上げられた音声データを記憶している文データ記憶手段と、
    前記範囲指定手段により指定された範囲に含まれる単語の数を判断する単語数判断手段とを備え、
    前記第1の音声出力手段は、前記単語数判断手段により単語が単数であると判断された場合に、前記単語データベースとしての前記辞書データ記憶手段から、前記指定された単語に対応する見出し語の音声データを取得して音声出力をし、
    前記第2の音声出力手段は、前記単語数判断手段により単語が複数であると判断された場合に、前記文データベースとしての前記文データ記憶手段から、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をすることを特徴とする請求項1に記載の音声出力装置。
  3. 前記単語数判断手段により単語が複数であると判断された場合に、前記辞書データ記憶手段に該当する見出し語があるか判断する見出し語判断手段と、
    前記見出し語判断手段により該当する見出し語があると判断された場合は、前記指定された複数の単語に対応する見出し語の音声データを前記辞書データ記憶手段から取得して音声出力をする第3の音声出力手段と
    を備え、
    前記第2の音声出力手段は、前記見出し語判断手段により該当する見出し語がないと判断された場合に、前記文データ記憶手段から前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をすることを特徴とする請求項2に記載の音声出力装置。
  4. 前記辞書データ記憶手段は、単数の単語を見出し語とした第1の辞書データと、複数の単語からなるイディオムを見出し語とした第2の辞書データとを有する
    ことを特徴とする請求項3に記載の音声出力装置。
  5. 前記文データ記憶手段は、前記辞書データ記憶手段に記憶された見出し語を含む例文と当該例文が読み上げられた音声データとを記憶している例文データ記憶手段を有し、
    前記第2の音声出力手段は、前記見出し語判断手段により前記指定された複数の単語に該当する見出し語が前記辞書データ記憶手段にないと判断された場合に、当該複数の単語を含む例文の同複数の単語に対応した部分の音声データを前記例文データ記憶手段から取得して音声出力をする、
    ことを特徴とする請求項4に記載の音声出力装置。
  6. ユーザ操作に応じて移動した範囲の画像を読み取る画像読み取り手段と、
    この画像読み取り手段により読み取られた画像に含まれるテキストを文字認識する文字認識手段とを備え、
    前記範囲指定手段は、表記されているテキストを、ユーザ操作に従って、所望の開始位置から終了位置まで前記画像読み取り手段により読み取って指定する、
    ことを特徴とする請求項1ないし請求項5の何れか1項に記載の音声出力装置。
  7. タッチパネル付き表示部を備え、
    前記範囲指定手段は、前記タッチパネル付き表示部に表示されているテキストを、ユーザのタッチ操作に従って、所望の開始位置から終了位置まで指定する、
    ことを特徴とする請求項1ないし請求項6の何れか1項に記載の音声出力装置。
  8. 複数の単語を含むテキストから少なくとも1つの単語を含む範囲をユーザに指定させる範囲指定ステップと、
    前記範囲指定ステップにより1つの単語が指定された場合には、各単語の音声データを記憶している単語データベースから、前記指定された単語に対応する音声データを取得して音声出力をする第1の音声出力ステップと、
    前記範囲指定ステップにより複数の単語が指定された場合には、文が読み上げられた音声データを記憶している文データベースから、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をする第2の音声出力ステップと
    を備えたことを特徴とする音声出力方法。
  9. 電子機器のコンピュータを制御するためのプログラムであって、
    前記コンピュータを、
    複数の単語を含むテキストから少なくとも1つの単語を含む範囲をユーザに指定させる範囲指定手段と、
    前記範囲指定手段により1つの単語が指定された場合には、各単語の音声データを記憶している単語データベースから、前記指定された単語に対応する音声データを取得して音声出力をする第1の音声出力手段と、
    前記範囲指定手段により複数の単語が指定された場合には、文が読み上げられた音声データを記憶している文データベースから、前記指定された複数の単語に対応する部分の音声データを抽出して音声出力をする第2の音声出力手段、
    として機能させるためのコンピュータ読み込み可能なプログラム。
JP2015238293A 2015-05-13 2015-12-07 音声出力装置、音声出力方法、およびプログラム Active JP6365520B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610171393.1A CN106168945B (zh) 2015-05-13 2016-03-24 声音输出装置以及声音输出方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015097837 2015-05-13
JP2015097837 2015-05-13

Publications (3)

Publication Number Publication Date
JP2016212374A true JP2016212374A (ja) 2016-12-15
JP2016212374A5 JP2016212374A5 (ja) 2017-07-27
JP6365520B2 JP6365520B2 (ja) 2018-08-01

Family

ID=57551138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015238293A Active JP6365520B2 (ja) 2015-05-13 2015-12-07 音声出力装置、音声出力方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6365520B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210115696A (ko) * 2020-03-16 2021-09-27 박준성 스캔 및 리딩 장치
JP7379968B2 (ja) 2019-09-10 2023-11-15 カシオ計算機株式会社 学習支援装置、学習支援方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050125228A1 (en) * 2003-12-08 2005-06-09 Samuels Derrick D. Digital electronic correction pen with audio pronunciation and spell check capabilities, with built-in memory. Also calculation processing... thereof...
JP2008058678A (ja) * 2006-08-31 2008-03-13 Casio Comput Co Ltd 音声出力装置及び音声出力プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050125228A1 (en) * 2003-12-08 2005-06-09 Samuels Derrick D. Digital electronic correction pen with audio pronunciation and spell check capabilities, with built-in memory. Also calculation processing... thereof...
JP2008058678A (ja) * 2006-08-31 2008-03-13 Casio Comput Co Ltd 音声出力装置及び音声出力プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7379968B2 (ja) 2019-09-10 2023-11-15 カシオ計算機株式会社 学習支援装置、学習支援方法及びプログラム
KR20210115696A (ko) * 2020-03-16 2021-09-27 박준성 스캔 및 리딩 장치
KR102352301B1 (ko) * 2020-03-16 2022-01-14 박준성 스캔 및 리딩 장치

Also Published As

Publication number Publication date
JP6365520B2 (ja) 2018-08-01

Similar Documents

Publication Publication Date Title
WO2012086356A1 (ja) ファイルフォーマット、サーバ、電子コミックのビューワ装置および電子コミック生成装置
JP5634853B2 (ja) 電子コミックのビューワ装置、電子コミックの閲覧システム、ビューワプログラム、ならびに電子コミックの表示方法
JP6392374B2 (ja) ヘッドマウントディスプレイシステム及びヘッドマウントディスプレイ装置の操作方法
TWI554984B (zh) 電子裝置
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
JP6277958B2 (ja) 再生装置、設定装置、再生方法およびプログラム
JP5106608B2 (ja) 読み上げ支援装置、方法、およびプログラム
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
JP6365520B2 (ja) 音声出力装置、音声出力方法、およびプログラム
JP5083155B2 (ja) 辞書機能を備えた電子装置およびプログラム
CN110930969A (zh) 背景音乐的确定方法及相关设备
JP4675691B2 (ja) コンテンツ情報提供装置
JP6676093B2 (ja) 異言語間コミュニケーション支援装置及びシステム
JP7229296B2 (ja) 関連情報提供方法及びシステム
CN106168945B (zh) 声音输出装置以及声音输出方法
JP2006189799A (ja) 選択可能な音声パターンの音声入力方法及び装置
KR101987644B1 (ko) 낭독 효과 제공시스템
KR100707727B1 (ko) 휴대용 파일 재생기
KR102656262B1 (ko) 이미지를 이용한 중국어 연상학습 콘텐츠 제공 방법 및 장치
KR20200072575A (ko) 전자책 서비스 제공 장치 및 방법
JP6535999B2 (ja) 言語学習装置、言語学習方法及びプログラム
JP7297266B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム
JP2018072509A (ja) 音声読み上げ装置、音声読み上げシステム、音声読み上げ方法、およびプログラム
JP2021043306A (ja) 電子機器、音声再生方法、およびプログラム
CN116430999A (zh) 一种语音助手实现指尖视觉交互技术的方法和系统

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170613

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180618

R150 Certificate of patent or registration of utility model

Ref document number: 6365520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150