JP2000099624A - Device for reading text including image character - Google Patents

Device for reading text including image character

Info

Publication number
JP2000099624A
JP2000099624A JP10267589A JP26758998A JP2000099624A JP 2000099624 A JP2000099624 A JP 2000099624A JP 10267589 A JP10267589 A JP 10267589A JP 26758998 A JP26758998 A JP 26758998A JP 2000099624 A JP2000099624 A JP 2000099624A
Authority
JP
Japan
Prior art keywords
character
image
text
characters
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10267589A
Other languages
Japanese (ja)
Inventor
Tetsuya Sakayori
哲也 酒寄
Junichiro Fujimoto
潤一郎 藤本
Hiroo Kitagawa
博雄 北川
Takashi Ariyoshi
敬 有吉
Yuichi Kojima
裕一 小島
Yoshibumi Sakuramata
義文 櫻又
Junichi Takami
淳一 鷹見
Akira Ro
彬 呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10267589A priority Critical patent/JP2000099624A/en
Publication of JP2000099624A publication Critical patent/JP2000099624A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To improve the easiness of the understanding of character expression with an image by outputting a character expressed with an image as a synthetic voice. SOLUTION: Character codes and image codes in a text are separated by a character code/image separating means 1, and the separated image characters are recognized, and the recognized characters are replaced with the character codes by a character recognizing and character encoding means 2. Then, the character coded image characters and the original character codes are arranged according to the character array of the text by a reading-out order controlling part 3, and the order-controlled character codes are voice-outputted by a voice synthesizing means 4. Thus, even when the image characters are included in the text, the image characters can be character-encoded and read out.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、イメージ文字を含
むテキストの読み上げ装置、より詳細には、イメージに
よって表わされた文字(ビットマップやベクトルデータ
によって表わされたイメージ文字)を含むテキストを合
成音声にて読み上げ可能にしたイメージ文字を含むテキ
ストの読み上げ装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a text-to-speech apparatus for reading text including image characters, and more particularly to a text-to-speech device including characters represented by images (image characters represented by bitmaps and vector data). The present invention relates to a text-to-speech apparatus for reading text including image characters which can be read aloud by synthetic speech.

【0002】[0002]

【従来の技術】電子メールや電子掲示板などの電子化文
書によるコミュニケーションが広がりを見せるに従い、
外出先からの電話によるアクセスや視覚障害者の利用な
ど、電子化文書の内容を合成音声によって確認する場面
が見られるようになった。而して、ホームページなどで
は表現力を高めるために文字コードではなくイメージに
よって文字を表わすことも良く行われるが、これはその
ままでは音声化できない。
2. Description of the Related Art As electronic documents such as electronic mails and electronic bulletin boards have become more widely used for communication,
In some cases, the contents of digitized documents are confirmed by synthesized speech, such as access from outside by telephone or use by the visually impaired. Thus, on a homepage or the like, characters are often represented by images instead of character codes in order to enhance expressive power, but this cannot be converted into speech as it is.

【0003】[0003]

【発明が解決しようとする課題】上述のように、ホーム
ページ等においては、イメージによって文字を表わすこ
とが行われているが、イメージ文字のままでは音声化す
ることはできない。
As described above, characters are represented by images on homepages and the like, but cannot be converted into voices using image characters as they are.

【0004】本発明は、上述のごとき実情に鑑みてなさ
れたもので、イメージによって表わされた文字を合成音
声として出力可能とし、もって、イメージによる文字表
現の理解容易性を向上することを目的としてなされたも
のである。
SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and has as its object to make it possible to output a character represented by an image as synthesized speech, thereby improving the understandability of the character expression by the image. It was done as.

【0005】[0005]

【課題を解決するための手段】請求項1の発明は、テキ
スト中の文字コードとイメージ文字を分離する文字コー
ド/イメージ分離手段と、分離されたイメージ文字を認
識し、認識された文字を文字コードに置き換える文字認
識・文字コード化手段と、該文字コード化されたイメー
ジ文字と元の文字コードとをテキストの文字配列に応じ
て並べる読み上げ順序制御手段と、順序制御された文字
コードを音声合成する音声合成手段とを有し、イメージ
文字を文字コード化して読み上げることを特徴としたも
のである。
According to the first aspect of the present invention, there is provided a character code / image separating means for separating a character code and an image character in a text, a character code / image separating means for recognizing the separated image character, and converting the recognized character to a character. Character recognition / character encoding means for replacing with a code, reading order control means for arranging the character-encoded image characters and the original character code in accordance with the character arrangement of the text, and speech synthesis of the order-controlled character code Voice synthesizing means for converting image characters into character codes and reading them out.

【0006】請求項2の発明は、請求項1の発明におい
て、前記分離されたイメージ文字の視覚的注目度を判定
する視覚重要度判定手段を有し、該視覚重要度判定手段
の判定結果に応じて、前記読み上げ順序を制御するよう
にしたことを特徴としたものである。
According to a second aspect of the present invention, in the first aspect of the present invention, there is provided a visual importance determining means for determining a visual attention degree of the separated image characters, and The reading order is controlled accordingly.

【0007】請求項3の発明は、請求項1の発明におい
て、前記分離されたイメージ文字の視覚的注目度を判定
する視覚重要度判定手段を有し、該視覚重要度判定手段
の判定結果に応じて、前記音声合成部を制御して前記分
離されたイメージ文字部の聴覚属性を変えるようにした
ことを特徴としたものである。
In a third aspect of the present invention, in the first aspect of the present invention, there is provided a visual importance determining means for determining a visual attention degree of the separated image characters, and Accordingly, the speech synthesis unit is controlled to change the auditory attribute of the separated image character portion.

【0008】請求項4の発明は、請求項2又は3の発明
において、前記視覚的注目度として、イメージ文字の大
きさを測定することを特徴としたものである。
According to a fourth aspect of the present invention, in the second or third aspect, a size of an image character is measured as the visual attention degree.

【0009】請求項5の発明は、請求項2又は3の発明
において、前記視覚的注目度として、イメージ文字の色
と背景色とのコントラストを測定することを特徴とした
ものである。
The invention of claim 5 is characterized in that, in the invention of claim 2 or 3, the contrast between the color of the image character and the background color is measured as the degree of visual attention.

【0010】請求項6の発明は、請求項2又は3の発明
において、前記視覚的注目度として、文字の形状特性を
測定することを特徴としたものである。
A sixth aspect of the present invention is characterized in that, in the second or third aspect, a shape characteristic of a character is measured as the degree of visual attention.

【0011】請求項7の発明は、請求項1乃至6のいず
れかの発明において、単一のイメージであっても、これ
を分割する座標情報が設定されている場合は、対応する
複数の領域別に独立した文字情報として扱うことを特徴
としたものである。
According to a seventh aspect of the present invention, in any one of the first to sixth aspects, even if a single image is set, coordinate information for dividing the image is set to a plurality of corresponding areas. It is characterized in that it is handled separately as independent character information.

【0012】[0012]

【発明の実施の形態】本発明は、ホームページ等におい
て、イメージによって表現された文字を合成音声にて出
力するようにしたもので、具体的には、以下に示すよう
な形態で実施される。 1) イメージを文字認識することにより、文字コー
ドに置き換えて読み上げるテキスト音声変換システム。 1.1) 文字の視覚的注目度も判定して読み上げ順序や
聴覚属性に反映させる。 1.1.1)注目度として文字の大きさを用いる。 1.1.2)注目度として文字の色と背景色との関係を用い
る。 1.1.3)注目度として文字の形状特性を用いる。 1.2) 本来の文字コードによるテキスト部分とは異な
った聴覚属性によって音声出力する。 1.3) 単一のイメージであってもこれを分割する座標
情報が設定されている場合は、対応する複数の領域別に
独立した文字情報として扱う。
BEST MODE FOR CARRYING OUT THE INVENTION The present invention is to output characters represented by images on a homepage or the like as synthesized speech, and is specifically implemented in the following form. 1) A text-to-speech conversion system that reads out text by recognizing characters by replacing them with character codes. 1.1) The degree of visual attention of characters is also determined and reflected in the reading order and auditory attributes. 1.1.1) Character size is used as the degree of attention. 1.1.2) The relationship between the character color and the background color is used as the degree of attention. 1.1.3) Character shape characteristics are used as the degree of attention. 1.2) Speech is output with auditory attributes different from those of the original character code text. 1.3) If coordinate information for dividing a single image is set, it is treated as independent character information for a plurality of corresponding areas.

【0013】図1は、本発明によるテキスト読み上げ装
置の一例を説明するための要部構成図で、図中、1はテ
キスト中の文字コード(文字をコードで表わした部分)
とイメージ(文字をイメージで表した部分)を分離する
コード/イメージ分離部、2は分離されたイメージの文
字を認識し、認識された文字をコード化するイメージ文
字認識・文字コード化部、3はコード/イメージ分離部
1によって分離された文字コードと、イメージ文字認識
・文字コード化部2によってコード化された文字コード
とを、テキストに応じて並べる、読み上げ順序制御部、
4は読み上げ順序制御部3からの文字コードを合成して
音声出力する音声合成部である。
FIG. 1 is a block diagram of a main part for explaining an example of a text-to-speech apparatus according to the present invention. In the drawing, reference numeral 1 denotes a character code (a character representing a character) in a text.
A code / image separation unit 2 for separating characters from an image (a part where characters are represented by images); an image character recognition / character coding unit 3 for recognizing characters of the separated image and coding the recognized characters; A reading order control unit for arranging the character codes separated by the code / image separation unit 1 and the character codes coded by the image character recognition / character coding unit 2 according to the text,
Reference numeral 4 denotes a speech synthesis unit that synthesizes the character codes from the reading order control unit 3 and outputs the synthesized speech.

【0014】上述のように、本発明は、文字コードとイ
メージ文字が混在するテキストより、文字コードとイメ
ージ文字とを分離し、このイメージ文字を文字認識して
文字コード化し、これを元々テキスト中に存在した文字
コードと組み合わせて合成音声にて出力するようにした
ものであるが、更に、前述のようにして分離されたイメ
ージ文字の視覚的注目度も判定して読み上げ順序や聴覚
属性に反映させる。例えば、文字サイズ測定部5によっ
て、そのイメージ文字の大きさを測定し、文字色コント
ラスト測定部6によって、文字色と背景色とのコントラ
ストを測定し、更には、文字形状類似度測定部7によっ
て、線の太さや標準フォントとの非類似性等文字の形状
特性を測定し、重要度判定部8によって、これらのうち
の最も重要な視覚的注目度を判定して、読み上げ順序制
御部3を制御し、或いは、聴覚属性設定部9より、音声
合成部4により出力される音声を変えて本来の文字コー
ドによるテキスト部分とは異なる聴覚属性によって音声
出力する。
As described above, according to the present invention, a character code and an image character are separated from a text in which a character code and an image character are mixed, and the image character is recognized and converted into a character code. It is designed to be output as a synthesized voice in combination with the character code that existed in the above. Furthermore, the visual attention level of the image characters separated as described above is also determined and reflected in the reading order and auditory attributes Let it. For example, the character size measuring unit 5 measures the size of the image character, the character color contrast measuring unit 6 measures the contrast between the character color and the background color, and further, the character shape similarity measuring unit 7 , The character characteristics such as the line thickness and dissimilarity with the standard font are measured, and the importance determining unit 8 determines the most important visual attention among them, and the reading order control unit 3 Controlling or changing the sound output by the sound synthesis unit 4 from the hearing attribute setting unit 9 to output a sound with a hearing attribute different from the text part by the original character code.

【0015】図2は、単一のイメージであっても、これ
を分割する座標情報が設定されている場合に、対応する
複数の領域別に独立した文字情報として取り扱うように
した例を示す図である。換言すれば、イメージマップの
処理で、付随する座標情報によってイメージを分割処理
することで、独立したメニュー項目としての読み上げ、
独立したリンク先の設定を可能としたものである。
FIG. 2 is a diagram showing an example in which, even when a single image is set, coordinate information for dividing the image is handled as independent character information for a plurality of corresponding areas. is there. In other words, in the processing of the image map, the image is divided according to the accompanying coordinate information, thereby reading out as an independent menu item,
Independent link destinations can be set.

【0016】例えば、表1に示すような1つのイメージ
ファイルと数行のスクリプトからなるイメージマップを
読み上げる場合、〈AREA…〉の3行のスクリプトで示さ
れる3つの領域(図2中に点線で表示)内をそれぞれ独
立したイメージとして処理し、「前のページ」,「次の
ページ」,「目次に戻る」という別々の文字列を抽出す
る。
For example, when reading out an image map consisting of one image file and several lines of script as shown in Table 1, three regions indicated by three lines of <AREA...> (Dotted lines in FIG. 2) ) Are processed as independent images, and separate character strings of “previous page”, “next page”, and “return to table of contents” are extracted.

【0017】[0017]

【表1】 [Table 1]

【0018】[0018]

【発明の効果】上述のように、ホームページ等において
は、イメージによって文字を表わすことが行われている
が、イメージ文字のままでは音声化することはできな
い。本発明は、上述のごときイメージによって表わされ
た文字を合成音声として出力可能とし、イメージによる
文字表現の理解容易性を向上させたものである。
As described above, characters are represented by images on homepages and the like, but cannot be converted into voices using image characters as they are. The present invention makes it possible to output a character represented by an image as described above as a synthesized voice, thereby improving the understandability of the character expression by the image.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明によるイメージ文字を含むテキスト読
み上げ装置の一実施例を説明するための要部構成図であ
る。
FIG. 1 is a main part configuration diagram for explaining an embodiment of a text-to-speech apparatus including image characters according to the present invention.

【図2】 単一のイメージを分割し、対応する複数の領
域の独立した文字情報とする場合の例を説明する図であ
る。
FIG. 2 is a diagram illustrating an example in which a single image is divided into independent character information of a plurality of corresponding areas.

【符号の説明】[Explanation of symbols]

1…コード/イメージ分離部、2…イメージ文字認識・
文字コード化部、3…読み上げ順序制御部、4…音声合
成部、5…文字サイズ測定部、6…文字色コントラスト
測定部、7…文字形状類似度測定部、8…重要度判定
部、9…聴覚属性設定部。
1 code / image separation unit 2 image character recognition
Character encoding section, 3 ... reading order control section, 4 ... voice synthesis section, 5 ... character size measuring section, 6 ... character color contrast measuring section, 7 ... character shape similarity measuring section, 8 ... importance determining section, 9 ... Auditory attribute setting unit.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 北川 博雄 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 有吉 敬 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 小島 裕一 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 櫻又 義文 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 鷹見 淳一 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 呂 彬 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 Fターム(参考) 5B064 AA10 FA16  ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Hiroo Kitagawa 1-3-6 Nakamagome, Ota-ku, Tokyo Stock inside Ricoh Company (72) Inventor Takashi Ariyoshi 1-3-6 Nakamagome, Ota-ku, Tokyo Stock Inside Ricoh Company (72) Inventor Yuichi Kojima 1-3-6 Nakamagome, Ota-ku, Tokyo Stock Company Ricoh Company (72) Inventor Yoshifumi Sakuramata 1-3-6 Nakamagome, Ota-ku, Tokyo Stock Company Ricoh Company (72) Inventor Junichi Takami 1-3-6 Nakamagome, Ota-ku, Tokyo Inside Ricoh Co., Ltd. (72) Inventor Ryo Akira 1-3-6 Nakamagome, Ota-ku, Tokyo F-term in Ricoh Co., Ltd. 5B064 AA10 FA16

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 テキスト中の文字コードとイメージ文字
を分離する文字コード/イメージ分離手段と、分離され
たイメージ文字を認識し、認識された文字を文字コード
に置き換える文字認識・文字コード化手段と、該文字コ
ード化されたイメージ文字と元の文字コードとをテキス
トの文字配列に応じて並べる読み上げ順序制御手段と、
順序制御された文字コードを音声合成する音声合成手段
とを有し、イメージ文字を文字コード化して読み上げる
ことを特徴とするイメージ文字を含むテキストの読み上
げ装置。
1. A character code / image separating means for separating a character code and an image character in a text, and a character recognition / character coding means for recognizing the separated image character and replacing the recognized character with a character code. Reading order control means for arranging the character-coded image characters and the original character codes in accordance with the character arrangement of the text,
A text-to-speech apparatus, comprising: voice synthesis means for voice-synthesizing an order-controlled character code; and converting an image character into a character code and reading it out.
【請求項2】 前記分離されたイメージ文字の視覚的注
目度を判定する視覚重要度判定手段を有し、該視覚重要
度判定手段の判定結果に応じて、前記読み上げ順序を制
御するようにしたことを特徴とする請求項1に記載のイ
メージ文字を含むテキストの読み上げ装置。
2. The apparatus according to claim 1, further comprising: a visual importance determining unit configured to determine a visual attention level of the separated image characters, wherein the reading order is controlled according to a determination result of the visual importance determining unit. The text-to-speech apparatus according to claim 1, wherein the text includes image characters.
【請求項3】 前記分離されたイメージ文字の視覚的注
目度を判定する視覚重要度判定手段を有し、該視覚重要
度判定手段の判定結果に応じて、前記音声合成部を制御
して前記分離されたイメージ文字部の聴覚属性を変える
ようにしたことを特徴とする請求項1に記載のイメージ
文字を含むテキストの読み上げ装置。
3. A visual importance determining means for determining a visual attention level of the separated image character, and controlling the speech synthesis unit in accordance with a determination result of the visual importance determining means. 2. The text-to-speech apparatus according to claim 1, wherein the auditory attribute of the separated image character portion is changed.
【請求項4】 前記視覚的注目度として、イメージ文字
の大きさを測定することを特徴とする請求項2又は3に
記載のイメージ文字を含むテキストの読み上げ装置。
4. The text-to-speech apparatus according to claim 2, wherein a size of the image character is measured as the visual attention level.
【請求項5】 前記視覚的注目度として、イメージ文字
の色と背景色とのコントラストを測定することを特徴と
する請求項2又は3に記載のイメージ文字を含むテキス
トの読み上げ装置。
5. The text-to-speech apparatus according to claim 2, wherein a contrast between a color of an image character and a background color is measured as the degree of visual attention.
【請求項6】 前記視覚的注目度として、文字の形状特
性を測定することを特徴とする請求項2又は3に記載の
イメージ文字を含むテキストの読み上げ装置。
6. The text-to-speech apparatus according to claim 2, wherein a shape characteristic of a character is measured as the visual attention level.
【請求項7】 単一のイメージであっても、これを分割
する座標情報が設定されている場合は、対応する複数の
領域別に独立した文字情報として扱うことを特徴とする
請求項1乃至6のいずれかに記載のイメージ文字を含む
テキストの読み上げ装置。
7. A single image, if coordinate information for dividing the image is set, is treated as independent character information for a plurality of corresponding areas. A text-to-speech device that includes image characters according to any one of the above.
JP10267589A 1998-09-22 1998-09-22 Device for reading text including image character Pending JP2000099624A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10267589A JP2000099624A (en) 1998-09-22 1998-09-22 Device for reading text including image character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10267589A JP2000099624A (en) 1998-09-22 1998-09-22 Device for reading text including image character

Publications (1)

Publication Number Publication Date
JP2000099624A true JP2000099624A (en) 2000-04-07

Family

ID=17446866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10267589A Pending JP2000099624A (en) 1998-09-22 1998-09-22 Device for reading text including image character

Country Status (1)

Country Link
JP (1) JP2000099624A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006201977A (en) * 2005-01-19 2006-08-03 Kyocera Corp Portable terminal equipment, voice reading method and voice reading program
JP2009157696A (en) * 2007-12-27 2009-07-16 Brother Ind Ltd Printing system and control program thereof

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006201977A (en) * 2005-01-19 2006-08-03 Kyocera Corp Portable terminal equipment, voice reading method and voice reading program
US8515760B2 (en) 2005-01-19 2013-08-20 Kyocera Corporation Mobile terminal and text-to-speech method of same
JP2009157696A (en) * 2007-12-27 2009-07-16 Brother Ind Ltd Printing system and control program thereof
US8218181B2 (en) 2007-12-27 2012-07-10 Brother Kogyo Kabushiki Kaisha Printing system

Similar Documents

Publication Publication Date Title
US10741167B2 (en) Document mode processing for portable reading machine enabling document navigation
US6397183B1 (en) Document reading system, read control method, and recording medium
US6873687B2 (en) Method and apparatus for capturing and retrieving voice messages
US20100332224A1 (en) Method and apparatus for converting text to audio and tactile output
EP0378694A1 (en) Response control system
US7088859B1 (en) Apparatus for processing machine-readable code printed on print medium together with human-readable information
JPH07203400A (en) Multimedia rendering marker and its usage
JP2000099624A (en) Device for reading text including image character
JPH06337876A (en) Sentence reader
JPH0420998A (en) Voice synthesizing device
JPH077335B2 (en) Conversational text-to-speech device
JP6422647B2 (en) Two-dimensional code recording method and two-dimensional code reader
JP2017102939A (en) Authoring device, authoring method, and program
JPH07168913A (en) Character recognition system
JPH0991371A (en) Character display device
WO2022074979A1 (en) Two-dimensional code encoder and educational two-dimensional code reading device
JPH11175307A (en) Method and device for reading document aloud
JP2624972B2 (en) Speech synthesis system
JP2000075874A (en) Information processor and recording medium which records information processing computer program
JPH11175308A (en) Specifying method for tone of voice of document reading-aloud
JP2002297170A (en) Two-dimensional code encoder, encoding method for two- dimensional code, two-dimensional code vocalizing device, two-dimensional code vocalizing method, text document vocalizing method, program, and computer-readable recording medium
JPH06195499A (en) Document reader
JP2614912B2 (en) Text-to-speech device
JPH09265380A (en) Method and device for synthesizing voice
JPH0424885A (en) Reading processor