JP5414458B2 - 音声合成機能付き文字情報表示装置、およびその音声合成方法 - Google Patents

音声合成機能付き文字情報表示装置、およびその音声合成方法 Download PDF

Info

Publication number
JP5414458B2
JP5414458B2 JP2009247614A JP2009247614A JP5414458B2 JP 5414458 B2 JP5414458 B2 JP 5414458B2 JP 2009247614 A JP2009247614 A JP 2009247614A JP 2009247614 A JP2009247614 A JP 2009247614A JP 5414458 B2 JP5414458 B2 JP 5414458B2
Authority
JP
Japan
Prior art keywords
display
speech
unit
character string
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009247614A
Other languages
English (en)
Other versions
JP2011095382A (ja
Inventor
喬 池上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2009247614A priority Critical patent/JP5414458B2/ja
Publication of JP2011095382A publication Critical patent/JP2011095382A/ja
Application granted granted Critical
Publication of JP5414458B2 publication Critical patent/JP5414458B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephone Function (AREA)

Description

本発明は、表示中の項目を音声にて読み上げる機能を有する音声合成機能付き文字情報表示装置、およびその音声合成方法に関するものである。
近年、携帯端末装置としてキー操作に対応して、このキー操作により設定された機能名等をアナウンスするようにした携帯電話機が提案されている(たとえば特許文献1参照)。
この携帯電話機は、複数のキー操作部と、キー操作部の1あるいは複数のキー操作に従い電話機が備えた複数の機能のうち、キー操作に対応する機能に関して設定を行う制御部と、キー操作に連動して設定される機能名を音声出力する音声合成部とを有する。
また、音声出力機能を採用したシステムとして、電子メールによりテキストを送信する際に、送信者が受信側でのテキスト読み上げに使用される音質を選択することができる電子メールシステムが提案されている(たとえば特許文献2参照)。
さらに、ブラウザなどを用いて表示される文字列を読上げる装置についても提案されている(たとえば特許文献3、4参照)。
特開平11−252216号公報 特開2004−185055号公報 特開2006−201977号公報 特開2006−276800号公報
ところで、特許文献1および2に記載されるような、音声読み上げ機能を有する装置に関する技術は何れも、極力全ての表示される文字列について読上げることに注力されているものであり、その読上げる対象となる内容についてまでは大きくは考慮されていない。一方、特許文献3および4に記載される音声読上げ機能を有する装置に関する技術においては、読上げの対象となるべき文書内容について触れてはいるものの、読上げることを促進する技術であることには変わりがない。
ところが、昨今の文字情報表示装置においては、取り扱われる文書データがより一層多岐に亘るため、その内容の取り扱いについては必要に応じてセキュリティ性が要されることがある。
本発明の目的は、取り扱われる文書データについて充分なセキュリティ性を確保した音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラムを提供することにある。
上記目的を達成するため、本発明の第1の観点によれば、文字列を含む表示オブジェクトと、当該表示オブジェクトの表示方法を規定する表示規定とを記憶する記憶部と、前記記憶部に記憶される表示オブジェクトを表示する表示部と、音声を出力する音声出力部と、文字列を音声に変換し、前記音声出力部にて出力する音声合成部と、前記表示部に表示される表示オブジェクトに含まれる文字列を前記音声合成部にて音声に変換する際に、音声に変換される表示オブジェクトに対応する表示規定を参照し、所定の表示規定の場合には当該表示オブジェクトに含まれる第1の文字列を音声変換させず、前記所定の表示規定でない場合には前記第1の文字列を音声変換させる制御部と、を備えることを特徴とする。
好適には、外部サーバから前記表示オブジェクトと前記表示規定とを取得する通信部を備え、上記制御部は、パスワードに関する入力であることが規定される表示規定を前記所定の表示規定として判別することを特徴とする。
また好適には、前記通信部は、外部サーバから前記表示オブジェクトと前記表示規定とをHTML形式で取得し、上記制御部は、前記表示規定としてHTMLタグを参照し、パスワードに関する入力であることが規定されるHTMLタグを抽出すると、当該HTMLタグにて指定される領域に入力された文字列について、前記音声合成部に音声変換させないことを特徴とする。
さらに好適には、前記記憶部は、予め定められた第2の文字列を記憶しており、上記制御部は、前記第1の文字列が前記所定の表示規定に対応する場合には、当該第1の文字列を前記第2の文字列に置き換えて前記音声合成部にて音声合成させることを特徴とする。
また、本発明の第2の観点によれば、記憶部と、表示部と、文字列を音声に変換する音声合成部と、変換した音声を出力する音声出力部とを備える文字情報表示装置における音声合成方法であって、文字列を含む表示オブジェクトと、当該表示オブジェクトの表示方法を規定する表示規定とを前記記憶部に記憶する記憶ステップと、前記記憶部に記憶される表示オブジェクトを前記表示部に表示する表示ステップと、前記表示部に表示される表示オブジェクトに含まれる文字列を前記音声合成部にて音声に変換する際に、音声に変換される表示オブジェクトに対応する表示規定を参照する参照ステップと、前記表示オブジェクトに対応する表示規定が所定の表示規定である場合には、当該表示オブジェクトに含まれる第1の文字列を音声変換させず、前記所定の表示規定でない場合には前記第1の文字列を音声変換させる音声変換制御ステップと、を有することを特徴とする。
本発明によれば、取り扱われる文書データについて充分なセキュリティ性を確保しつつも、音声読上げによりユーザに必要な情報を容易に認識させることが可能となる。
携帯電話機のシステム構成の一例を図解したブロック図である。 携帯電話機の外観の一例を図解した図であり、(a)は正面の外観図を、(b)は背面の外観図を、(c)は正面の外観図を、(d)は背面の外観図を、それぞれ示す。 本実施形態に係るブラウザ起動時の情報の表示および音声読み上げ動作を説明するためのフローチャートである。 本実施形態に係る表示画面のイメージを示す図である。
以下、本発明の実施形態を図面に関連付けて説明する。
図1は、本発明の音声合成機能付き文字情報表示装置としての一例である携帯電話機10のシステム構成を示すブロック図である。図2は、携帯電話機1の外観の一例を示す図である。
携帯電話機10は、可動機構を有する、いわゆる折り畳み式携帯電話機であって、図2(a)は開かれた状態(開状態)での正面図を、(b)は閉じられた状態(閉状態)での正面図を、(c)は開状態での側面図を、(d)は閉状態での側面図を、それぞれ示している。
本実施形態に係る携帯電話機10は、無線通信ネットワーク20に接続されるサーバ30から取得したWeb情報(取得情報)を表示部に表示可能に構成されている。
また、本実施形態に係る携帯電話機10は、通常の携帯電話機の機能に加えて、音声読み上げ機能を有し、たとえばブラウザから描画要求として通知される文字列を読み上げの文字列情報として扱い、ブラウザに手を加えずに通常のブラウザと同等の表示が可能となるように構成されている。
さらに、本実施形態に係る携帯電話機10は、以下の処理機能を備えて構成されている。
携帯電話機10は、取得したWeb情報に基づいて、文字列や絵記号や画像などの表示すべき表示オブジェクトと、表示オブジェクトを提供するサーバ30上で運営されているコンテンツにて規定されるスタイル等の表示規定を抽出し、表示オブジェクトと表示規定を対応付けて記憶部に格納しておき、抽出したスタイル等の表示規定に準じて表示オブジェクトを表示する。なお、表示規定には、表示座標(X,Y)、ゴシック体などのフォントタイプやアンダーラインなどの付加的表示などを指示する表示形式(スタイル)、あるいは表示サイズ、さらには後述するパスワードボックス表示規定、不可視表示規定などを含んでいる。
そして、携帯電話機10は、取得情報したWeb情報の表示状態において、読み上げのために音声読み上げ機能(音声合成部)の起動が要求されると、記憶部に格納される表示方法を規定するスタイルなどの表示規定を参照して表示オブジェクトから抽出される文字列を音声合成部により音声に変換する機能を有する。
携帯電話機10は、表示部に表示中の文字情報・表示オブジェクトに含まれる文字列を音声に変換する際に、音声に変換する文字列の表示規定を参照し、所定の表示規定の場合には当該規定に対応する表示オブジェクトに含まれる文字列を音声変換せず、所定の表示規定ではない場合には当該規定に対応する表示オブジェクトに含まれる文字列を音声変換する機能を有する。さらに、他の表示規定によっては第1の音声と第2の音声とを使い分けて対応する文字列を音声変換する機能も有する。
そして、携帯電話機10は、リンク先の対応付けられた表示オブジェクトが操作部により選択指示または決定指示されると、この表示オブジェクトに含まれる文字列を第3の音声にて音声変換する機能も有する。
また、携帯電話機10は、リンク先の対応付けられた表示オブジェクトが操作部により決定指示されると、通信部によりリンク先へのアクセスがなされた後に、決定指示された表示オブジェクトに含まれる文字列を音声変換する機能をも有する。
また、携帯電話機10は、取得したWeb情報の表示状態において音声読み上げ機能(音声合成部)の起動が要求されると、記憶部に格納される表示オブジェクトをそれぞれの表示座標についてソートした上で各種バッファを経由して、音声に変換する機能を有する。
携帯電話機10は、複数の表示形式それぞれについて表示座標に対する補正値を格納しておき、表示オブジェクトのソートは、表示オブジェクトごとの表示形式に応じて補正値にて補正した上で行う機能を有する。
携帯電話機10は、複数の表示サイズそれぞれについて表示座標に対する補正値を格納しておき、表示オブジェクトのソートは、表示オブジェクトごとの表示サイズに応じて補正値にて補正した上で行う機能を有する。
携帯電話機10は、取得したWeb情報の表示状態において音声読み上げ機能(音声合成部)の起動が要求されると、記憶部に格納される複数の表示オブジェクトの中から所定の表示形式の対応付けられる表示オブジェクトを検索し、検索された結果に応じて表示オブジェクトをの有する文字列について、音声に変換する機能を有する。
以下、本実施形態に係る携帯電話機10の各部の構成、機能、並びに、音声読み上げ制御について順を追って説明する。
図1に示すように、携帯電話機10は、送受信アンテナ111を含む通信処理部11と、メモリ12と、キー操作部13と、ダイヤル入力部14と、サブ表示部15と、メイン表示部16と、スピーカ171およびマイクロフォン172を含む音声合成処理部17と、読み上げキー入力部18と、制御部(CPU)19とを有している。
また、図2(a)に示すように、携帯電話機10の本体ケース100は、第1の筐体としてのキー入力側本体ケース101と、第2の筐体としての表示側本体ケース102とが、図示しない可動機構により連結されて、開閉状態を形成するように構成される。
通信処理部11は、基地局を介した無線通信動作、たとえば、電話番号の発呼動作や電子メールなどの電子データの送受信動作などを行う。
通信処理部11は、送受信アンテナ111を含んで構成され、電波を利用した無線通信で行うために、制御部19で処理された音声情報、電子メール等を変調して送受信アンテナ111により図示しない基地局、通信ネットワーク20を介してサーバ30に送信する。
また、通信処理部11は、基地局から無線により送信され、送受信アンテナ111で受信した電子メールや音声情報等の各種情報を復調して制御部19に出力する。
さらに、通信処理部11は、無線通信ネットワーク20に接続されるサーバ30に基地局を介して接続可能であり、サーバ30から取得したWeb情報(取得情報)を制御部19に出力する。
なお、本実施形態においては、送受信アンテナ111は、キー入力側本体ケース101または表示側本体ケース102に内蔵されている。
メモリ(記憶部)12は、EEPROM等の不揮発性メモリを含んで構成され、通話や
メールの送受信のための制御プログラム、インターネットブラウザ、メッセージデータ、名前および電話番号が登録されたアドレス帳などを記憶する。
メモリ12は、後述する読み上げ機能に必要なテキスト列を含む音声読み上げデータベースを記憶する。このデータベースでは、読み上げのためのテキスト列について、前後の接続関係が文章として成立するように、体系的に整理されている。
メモリ12は、音声読み上げ機能の制御テーブル、重み付けテーブルを記憶する。
また、メモリ12は、後述する「固定文言」をも記憶する。
さらに、メモリ12には、制御部19においてWeb情報により抽出される表示オブジェクトと、表示オブジェクトを提供するサーバにて規定される、表示部16,15への表示方法を規定する表示規定と、が対応付けられた形態(ソースコード)で格納される。上述したように、この表示規定には、キー操作部13により選択指示される表示オブジェクトであることを示す選択位置表示規定、表示オブジェクトにリンク先が対応付けられていることを示すリンク先表示規定、文字入力可能なパスワードボックス表示規定、入力されたテキストを不可視表示する不可視表示規定などを含む。
また、メモリ12には、制御部19により複数の表示形式、表示サイズそれぞれについて表示座標に対する補正値が格納される。
さらに、メモリ12には、ブラウザなどのためにバッファ領域が設けられており、特に第1のバッファ領域121)と第2のバッファ領域122との2つのバッファ領域を有する。制御部19において、HTML(HyperText Markup Language)言語によって記述されたWeb情報を取得すると、表示オブジェクトのうちの特にテキストと、その表示規定とをまず第1のバッファ領域121に蓄積する。次に制御部19は、第1のバッファ領域121に格納したWeb情報のうち、表示部 の少なくとも1画面を埋めることのできる分量のWeb情報を第2のバッファ領域122にコピーする。この際、表示オブジェクトごとの表示サイズ、表示位置、表示形態に沿って表示位置や順番をソートする。なお、これらの表示規定とは、一例としてはHTMLタグである。もちろんHTMLタグでなくとも、表示形態を指示する規定であればスクリプトなど他の規定でも良い。
また、メモリ12には、フォーカス選択位置であることを示す選択位置表示規定、表示オブジェクトにリンク先が対応付けられていることを示すリンク先表示規定、パスワード入力可能なパスワードボックス表示を示すテキストボックス表示規定、パスワードボックスに入力された文字を隠す入力不可視規定などを含む。ここで、不可視指定とは、パスワードボックスに文字をユーザが入力した際に、第三者が覗き見しても入力したパスワードが判読できないように、入力1文字ごとに「*」や「○」などの記号に置き換える表示規定である。
キー操作部13は、終了(終話)/電源キー、開始(発呼)キー、数字等に対応した複数のテンキー等を有し、これらのキーがユーザにより操作されることにより、ユーザからの入力情報を制御部19に出力する。
また、キー操作部13の操作により、メモリ12に記憶される音声読み上げ機能の制御テーブルの各項目の読み上げするか否か(ON/OFF)を、制御部19を通して設定可能である。
キー操作部13の操作により、ユーザは表示部16,15に表示される文字情報に含まれる表示オブジェクトの選択指示と決定指示とを行うことが可能である。
また、表示中のWeb情報に、パスワードボックス表示規定により指定される、文字入力可能なパスワードボックス表示欄があれば、これをキー操作部13にて指定して選択すれば、このパスワードボックス表示欄にテンキーなどを用いて数字や文字を入力することが出来る。
ダイヤル入力部14は、図2(c)に示すように、ユーザが開状態の携帯電話機10を保持した時にユーザの親指により操作がしやすくなるように、表示側本体ケース102の側面に配設されるダイヤル式の入力部であり、上下2方向の操作が可能に構成される。
ダイヤル入力部14に対する操作により、ユーザは、音声の出力音量やサブ表示部15およびメイン表示部16に表示する文字サイズを変更することが可能となる。
また、図2(c)および(d)から明らかなように、閉状態と開状態のダイヤル入力部14を比較すると、上下2方向の操作方向が物理的に逆転することになるが、本実施形態においては、ユーザにとって違和感が生じないように、ユーザから見た操作方向と操作に対する作用(たとえば、上述した音量変更や表示フォントサイズ(表示する文字サイズ)の変更)が常に一致するように、制御部19により制御される。
サブ表示部15は、液晶表示装置(LCD)等の表示デバイスを有し、図2(c)に示すように、閉状態においてユーザに視認される。
メイン表示部16は、液晶表示装置(LCD)等の表示デバイスを有し、図2(a)に示すように、開状態においてユーザに視認される。
サブ表示部15およびメイン表示部16は、それぞれ閉状態および開状態において、制御部19の制御の下、受信した電子メールのテキストやメモリ12に格納された様々なテキストデータを表示する。
また、サブ表示部15およびメイン表示部16は、それぞれ閉状態および開状態において、制御部19の制御の下、取得したWeb情報をメモリ12に格納された表示規定(表示座標、表示形式、表示サイズまたは/および選択位置、リンク先の有無、パスワードボックスであるかどうか、入力したテキストについての不可視指定など)に従った形態で表示する。
音声合成処理部17は、音声処理回路を有し、通話機能のために音声出力を行うスピーカ171と音声入力を行うマイクロフォン172とが接続されている。
音声合成処理部17は、マイクロフォン172により収音した音声に対して所定の処理を行って制御部19に供給する。また、音声合成処理部17は、制御部19により供給された音声情報に対して所定の処理を行ってスピーカ171から出力させる。
また、図2(a),(b)に示すように、スピーカ171は、受話スピーカ171aおよびリンガスピーカ171bの2箇所の音声出力部を含み、読み上げ機能の処理結果である音声を出力する。
さらに、音声合成処理部17は、読み上げエンジンとして図示しない音声合成回路と音声合成用バッファ領域とを有する。音声合成処理部内17は、読み上げを行う際に、メモリ12の特に第2のバッファ領域から抽出されたテキストデータを音声合成用バッファ領域にコピーし、これを音声データに変換し、音声出力部である受話スピーカ171aまたはリンガスピーカ171bにより音声合成して音声出力させる。
音声合成処理部17は、制御部19の制御の下、音声変換する際に、たとえばパスワード入力用のパスワードボックスに入力された文字列、不可視指定される文字列については、第2のバッファ領域からコピーせず、音声合成用バッファ領域に積み上げない、あるいは予めメモリ12にパスワード用として格納される固定文言を、パスワード入力用のパスワードボックスに入力された文字列や不可視指定される文字列に代えて音声合成用バッファ領域に積み上げる。
読み上げキー操作部18は、図2(b)に示すように、表示側本体ケース102の中央に配設される押下式ボタン18aと、このボタンによるスイッチ入力に対する入力回路と、を含んで構成される。
本実施形態における携帯電話機10は、読み上げ機能を有し、押下式ボタン19aが押下(操作)されると、たとえば閉状態にリンガスピーカ171aにより音声出力し、開状態では受話スピーカ171より音声出力するように制御部19により制御される。
制御部19は、マイクロコンピュータを主体として構成され、携帯電話機1の全体の制御を行う。たとえば、制御部19は、通信処理部11における各種情報の無線による送受信の制御、音声処理部17に対する音声情報の処理、メイン表示部16への情報の表示制御、キー入力部13の入力情報に応じた処理、メモリ12に対するアクセス制御等を行う。
制御部19は、基本的にユーザによる押下式ボタン18aの操作がなされると、表示されるテキストの読み上げ機能を実行する。その際、読み上げ機能として、テキスト列を抽出/生成してそのテキストを読み上げるテキスト読み上げ方式を用いている。
制御部19は、後で詳述するように、ブラウザが起動し、取得したWeb情報から表示オブジェクトと、この表示オブジェクトを提供するサーバ30上のコンテンツごとに規定される表示規定を抽出し、表示オブジェクトと表示規定とを対応付けてメモリ12の第1のバッファ領域121に格納する。次に、制御部19は、抽出した表示規定に準じて、1画面を表示する分量の表示オブジェクトについて、それぞれ順序をソートして第2のバッファ領域122に格納し、この第2のバッファ領域122に格納した表示オブジェクトをメイン表示部16あるいはサブ表示部15に表示させる。
制御部19は、取得したWeb情報をメイン表示部16あるいはサブ表示部15に表示している表示状態において、たとえば読み上げキー操作部18の操作により音声合成処理部17の起動が要求されると、メモリ12(第2のバッファ領域122)に格納される表示規定を参照して表示オブジェクトから抽出される文字列を音声合成用バッファ領域にコピーして、この文字列についてを、音声合成処理部17により音声に変換させる。
制御部19は、表示部16,15に表示中の文字情報に含まれる文字列を音声に変換する際に、音声に変換する文字列の表示規定を参照し、所定の表示規定(パスワードボックス表示規定、あるいはパスワードボックスへの入力文字を不可視表示する不可視規定)が指定される文字列の場合には、メモリ12の第2のバッファ領域122から音声合成処理部17内の音声合成用バッファ領域に該当する文字列を積み上げない。あるいは、これら所定の表示規定が指定される文字列であれば、予め格納される固定文言「パスワードです」などの文字列を音声合成処理部17内の音声合成用バッファ領域に積み上げても良い。
このように、本実施形態の制御部19は、パスワードを意図するパスワードボックスに入力された文字列について、音声合成処理部17にて読み上げられないように制御する機能を有する。
なお、上述したように制御部19は、取得したWeb情報をメイン表示部16あるいはサブ表示部15に表示している表示状態において、たとえば読み上げキー操作部18の操作により音声合成処理部17の起動が要求されると、メモリ12に格納される表示オブジェクトをそれぞれの表示座標についてソートした上で音声合成処理部17に音声への変換を行わせる。
制御部19は、メモリ12に複数の表示形式それぞれについて表示座標に対する補正値を格納する。そして、制御部19は、表示オブジェクトのソートは、表示オブジェクトごとの表示形式に応じてメモリ12に格納した補正値にて補正した上で行う。制御部19は、メモリ12に、複数の表示サイズそれぞれについて表示座標に対する補正値を格納する。そして、制御部19は、表示オブジェクトのソートは、表示オブジェクトごとの表示サイズに応じて前記補正値にて補正した上で行う。
また、制御部19は、取得したWeb情報をメイン表示部16あるいはサブ表示部15に表示している表示状態において、たとえば読み上げキー操作部18の操作により音声合成処理部17の起動が要求されると、メモリ12に格納される複数の表示オブジェクトの中からフォーカス(カーソル)の位置する表示を行うための表示形式の対応付けられる表示オブジェクトを検索し、検索された表示オブジェクトの有する文字列について音声合成処理部17に音声に変換させる。
次に、上記構成による動作を、ブラウザ起動時の情報の表示および音声読み上げ動作を中心に、図3から図8に関連付けて説明する。
図3は、ブラウザ起動時の情報の表示および音声読み上げ動作を説明するためのフローチャートである。
図4は、表示画面のイメージを示す図である。
ブラウザが起動され(ST1)、キー操作部13により描画開始要求通知が出されると、描画すべき文字列、スタイル、座標がHTMLコードにより通知され、これを受信し(ST2)、第1のバッファ領域121に蓄積する。
次に、第1のバッファ領域121に格納される描画すべきWeb情報について解析する(ST3)。具体的には、取得した情報のうち、各表示オブジェクトについての表示座標および表示サイズ、表示形態を勘案した表示位置のソートを行なった上で、フォーカス(カーソル)選択中であるか否か、他のページへのリンクの有無などの判別を行う。
さらに、ソートした上で、パスワード入力に関する表示規定が存在するか判定する(ST4)。具体的には、Web情報中に、HTMLタグ「input type="password"」、あるいは「input type="hidden"」が含まれるかどうか判定する。ここで、これらのタグが含まれていると判定されれば、さらに「maxlength=""」にて指定される対象最大文字数についても抽出する。
次に、表示順序ごとにソートしたWeb情報について、パスワード入力に関する表示として指定される文字列以外については第2のバッファ領域122に格納し、パスワード入力に関する表示として指定される文字列については第2のバッファ領域122に格納しない(ST5)。
なお、HTMLタグ「input type="password"」、「input type="hidden"」にて指定される領域へ、既にユーザからの入力が有った場合「maxlength=""」にて指定される対象最大文字数、あるいは「value=""」にて指定された対象文字列を、入力された文字列とは異なる文字列に置換して第2のバッファ領域122に蓄積する。
具体的には、図4に示される例においては、「input type="password"」が指定される表示オブジェクト「パス」に続いて、ユーザにより4文字の入力が行われている。そして、特に図示しないが、この「パス」に引き続く入力領域には「input type="hidden"」にて不可視指定されているため、第2のバッファ領域122には、ユーザ入力文字列を「○○○○」という文字列に変換した上で蓄積している。
そして、メイン表示部16あるいはサブ表示部15のいずれか表示中の表示部における1画面分の描画データの蓄積が第2のバッファ領域122に行われると(ST6)、表示部の表示を新たに蓄積した描画データに更新するとともに、バッファリングした文字列を音声合成処理部17で読み上げる(ST7)。すなわち、第2のバッファ領域122に蓄積された1画面分の文字列を音声合成用バッファ領域173に取り込み、これらの文字列を音声に変換してスピーカ171にて出力する。これにより、パスワードとして扱われない表示オブジェクトや文字列については音声読み上げを行ない、パスワードとして扱われる文字列については入力文字を読み上げない、あるいは「まるまるまるまる」と読み上げられることとなり、ユーザの近くにいる第三者からもパスワード内容を把握できなくすることが出来る。そして、読み上げ完了後、文字列の音声合成用バッファ領域173をクリアする。
なお、図3の実施形態においてはブラウザが起動して描画データの描画が出来次第、即時音声合成を行う例を示したが、これに限らず、ユーザが音声合成開始の指示を行なった段階で音声合成を行うよう構成しても良い。この場合、制御部19は、ユーザのキー操作部13により音声合成指示が入力された段階で、第2のバッファ領域122から音声合成用バッファ領域173にソート済み文字列を取り込み、音声合成処理部17で音声合成を行なえばよい。
また、本実施形態においては、第2のバッファ領域122に蓄積した描画データ(表示オブジェクト、文字列)についてを、メイン表示部16あるいはサブ表示部15のいずれか使用中の表示部に表示させる例を用いて説明を行ったが、表示用には別途バッファを設けても良いことは言うまでも無い。
さらに、第2のバッファ領域122に蓄積された描画データ中の文字列についてを音声合成用バッファ領域173にそのまま取り込まず、不可視指定により置換された文字列(図4における「○○○○」)については、さらに異なる文言である「入力パスワード」という文言に置き換えて音声合成用バッファ領域173に取り込んでもよい。
また、音声合成処理部において読み上げる際に、フォーカス(カーソル)の当てられる文字列、ハイパーリンクなどの他のページへのリンクのある文字列については、他の文字列とは異なる音声(例えば女声に対して男声)にて読み上げても良い。これにより、ユーザが着目するべき表示オブジェクトの存在を画面を注視せずとも把握することが出来る。すなわち、パスワードボックスにカーソルが当てられているときに音声読み上げを行う際には、「入力パスワード」という音声が、カーソルが当たっていないときとは異なる声質で読み上げられるため、ユーザは画面を見ずとも自身がパスワード入力中にあることを知ることが出来る。
さらに、パスワード指定の表示規定の例として、HTMLタグの「input type="password"」および「input type="hidden"」を示したが、これに限られるものではない。他にも「location = password + ".html"」などでパスワードを直接ソースに記入する形態のものの他、Java(商標)スクリプトを起動した上で「function pswdCheck(){ }」などによりパスワード確認動作を規定している場合には、パスワード確認の対象となる箇所についてを特定した上で、該当箇所を第2のバッファ領域122や音声合成用バッファ領域173に蓄積しない、あるいは他の文字列を蓄積するように構成しても良い。またはパスワード確認動作にて指定される範囲内の表示オブジェクトや文字列全てを音声合成用バッファ領域173に蓄積しないよう構成しても良い。これらによっても入力したパスワードが読み上げられてしまうことを防止することが出来る。
なお、以上説明したような音声読み上げ処理は、端末装置(コンピュータ)で読み出し可能な記録媒体、半導体記憶装置(メモリ)、光ディスク、ハードディスク等に音声読み上げプログラムとして記録され、端末装置で読み出されて実行されるものであってもよい。
10…携帯電話機
100…本体ケース
101…キー入力側本体ケース
102…表示側本体ケース
11…通信処理部
111…送受信アンテナ
12…メモリ
121…第1のバッファ領域
122…第2のバッファ領域
13…キー操作部
14…ダイヤル入力部
15…サブ表示部
16…メイン表示部
17…音声合成処理部
171…スピーカ
172…マイクロフォン
173…音声合成用バッファ領域
18…読み上げキー操作部
19…制御部
20…無線通信ネットワーク
30…サーバ


Claims (4)

  1. 文字列を含む表示オブジェクトと、当該表示オブジェクトの表示方法を規定する表示規定とを記憶する記憶部と、
    前記記憶部に記憶される表示オブジェクトを表示する表示部と、
    音声を出力する音声出力部と、
    文字列を音声に変換し、前記音声出力部にて出力する音声合成部と、
    前記表示部に表示される表示オブジェクトに含まれる文字列を前記音声合成部にて音声に変換する際に、音声に変換される表示オブジェクトに対応する表示規定を参照し、所定の表示規定の場合には当該表示オブジェクトに含まれる文字列であって利用者によって入力された文字列を音声変換させない制御部と、を備える
    ことを特徴とする音声合成機能付き文字情報表示装置。
  2. 外部サーバから前記表示オブジェクトと前記表示規定とを取得する通信部を備え、
    上記制御部は、パスワードに関する入力であることが規定される表示規定を前記所定の表示規定として判別する
    ことを特徴とする請求項1に記載の音声合成機能付き文字情報表示装置。
  3. 前記通信部は、外部サーバから前記表示オブジェクトと前記表示規定とをHTML形式で取得し、
    上記制御部は、前記表示規定としてHTMLタグを参照し、パスワードに関する入力であることが規定されるHTMLタグを抽出すると、当該HTMLタグにて指定される領域に入力された文字列について、前記音声合成部に音声変換させない
    ことを特徴とする請求項2に記載の音声合成機能付き文字情報表示装置。
  4. 記憶部と、表示部と、文字列を音声に変換する音声合成部と、変換した音声を出力する音声出力部とを備える文字情報表示装置における音声合成方法であって、
    文字列を含む表示オブジェクトと、当該表示オブジェクトの表示方法を規定する表示規定とを前記記憶部に記憶する記憶ステップと、
    前記記憶部に記憶される表示オブジェクトを前記表示部に表示する表示ステップと、
    前記表示部に表示される表示オブジェクトに含まれる文字列を前記音声合成部にて音声に変換する際に、音声に変換される表示オブジェクトに対応する表示規定を参照する参照ステップと、
    前記表示オブジェクトに対応する表示規定が所定の表示規定である場合には、当該表示オブジェクトに含まれる文字列であって利用者によって入力された文字列を音声変換させない音声変換制御ステップと、を有する
    ことを特徴とする文字情報表示装置における音声合成方法。
JP2009247614A 2009-10-28 2009-10-28 音声合成機能付き文字情報表示装置、およびその音声合成方法 Expired - Fee Related JP5414458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009247614A JP5414458B2 (ja) 2009-10-28 2009-10-28 音声合成機能付き文字情報表示装置、およびその音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009247614A JP5414458B2 (ja) 2009-10-28 2009-10-28 音声合成機能付き文字情報表示装置、およびその音声合成方法

Publications (2)

Publication Number Publication Date
JP2011095382A JP2011095382A (ja) 2011-05-12
JP5414458B2 true JP5414458B2 (ja) 2014-02-12

Family

ID=44112388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009247614A Expired - Fee Related JP5414458B2 (ja) 2009-10-28 2009-10-28 音声合成機能付き文字情報表示装置、およびその音声合成方法

Country Status (1)

Country Link
JP (1) JP5414458B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019079417A (ja) * 2017-10-26 2019-05-23 キヤノン株式会社 周辺機器を設定等するシステム、制御方法、制御プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06216831A (ja) * 1993-01-18 1994-08-05 Oki Electric Ind Co Ltd 携帯型文字通信音声合成装置
JP3818423B2 (ja) * 2000-03-15 2006-09-06 オムロン株式会社 情報出力システム
JP2002312157A (ja) * 2001-04-13 2002-10-25 Yoshito Suzuki 音声ガイダンスモニタソフトウェア
JP2006243133A (ja) * 2005-03-01 2006-09-14 Canon Inc 音声読上げ方法および装置
JP5259050B2 (ja) * 2005-03-30 2013-08-07 京セラ株式会社 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム
JP2007086309A (ja) * 2005-09-21 2007-04-05 Mitsubishi Electric Corp 音声合成装置、音声合成方法および音声合成プログラム

Also Published As

Publication number Publication date
JP2011095382A (ja) 2011-05-12

Similar Documents

Publication Publication Date Title
JP5259050B2 (ja) 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム
JP4743686B2 (ja) 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム
US7107219B2 (en) Communication apparatus
US20060015812A1 (en) Using emoticons, such as for wireless devices
MXPA04010107A (es) Entrada multimodal secuencial.
US20090042602A1 (en) Mobile terminal
CN101009861B (zh) 移动通信终端之间数据库记录的发送
US20080123973A1 (en) Executing functions using image code
JP4816191B2 (ja) 携帯電話機、電子メール情報表示方法および電子メール情報表示プログラム
US6553103B1 (en) Communication macro composer
JP5414458B2 (ja) 音声合成機能付き文字情報表示装置、およびその音声合成方法
JP5248051B2 (ja) 電子機器
JP5220912B2 (ja) 音声合成機能付き文字情報表示装置およびその制御方法
JP5062670B2 (ja) 電子機器
JP2006017932A (ja) 学習装置、携帯電話機、学習装置の制御方法、学習装置の制御プログラムおよび記録媒体
JP5530881B2 (ja) 電子機器及び表示制御方法
US11574134B2 (en) Systems and methods of processing a document in an imaging device
US7664498B2 (en) Apparatus, method, and program for read out information registration, and portable terminal device
JP4893174B2 (ja) メール返信システム,携帯端末,メール返信方法およびプログラム
JP4403284B2 (ja) 電子メール処理装置および電子メール処理プログラム
JP4689488B2 (ja) 情報付加装置、情報付加方法、情報付加プログラム、情報付加システム、情報付加管理サーバ、情報付加管理方法、および、情報付加管理プログラム
JP2007065906A (ja) 携帯端末装置および文字列処理方法
JP5334196B2 (ja) 通信端末装置及びプログラム
JP2004005006A (ja) 移動通信端末装置の辞書追加方法
Thinyane et al. ICANSEE: A SIM based application for digital inclusion of the visually impaired community

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130408

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131112

R150 Certificate of patent or registration of utility model

Ref document number: 5414458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees