WO2001033549A1 - Dispositif et procede de lecture de messages electroniques, et support enregistre de conversion de texte - Google Patents

Dispositif et procede de lecture de messages electroniques, et support enregistre de conversion de texte Download PDF

Info

Publication number
WO2001033549A1
WO2001033549A1 PCT/JP2000/007652 JP0007652W WO0133549A1 WO 2001033549 A1 WO2001033549 A1 WO 2001033549A1 JP 0007652 W JP0007652 W JP 0007652W WO 0133549 A1 WO0133549 A1 WO 0133549A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
reading
speech
command
mail
Prior art date
Application number
PCT/JP2000/007652
Other languages
English (en)
French (fr)
Inventor
Katsuyoshi Yamagami
Takahiro Kamai
Yumiko Kato
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Publication of WO2001033549A1 publication Critical patent/WO2001033549A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/063Content adaptation, e.g. replacement of unsuitable content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Definitions

  • the present invention relates to an electronic mail reading device and method for reading digitized text such as electronic mail with synthesized voice, and a recording medium storing a text conversion rule table.
  • CTI Computer-telephony integration
  • CTI servers and text-to-speech software use text-to-speech technology that converts text into speech in order to read text in electronic mail.
  • the text format of e-mail can be broadly divided into two parts: a header part that stores various information related to the transmission and reception of e-mail, and a body part in which the sender actually describes the text.
  • the header portion contains various types of header information such as the sender address, destination address, and transmission date and time, and these character strings are often alphabetic strings that do not make sense when read out.
  • the e-mail body should be considered in order to read out one sentence unit so that the read-out voice makes sense, such as a line break in each line in the middle of a word or a punctuation in the middle of one line.
  • the start and end positions of reading a sentence in units of one sentence are appropriate, for example, by dividing a period, a question mark, or other symbols into text in units of one sentence as delimiters. Like that.
  • Japanese Patent Application Laid-Open No. 9-251713 discloses that a user who wants to send an e-mail sends a speech command (for example, ⁇ speech) to the beginning of a line in a part of an input sentence that he wants to synthesize. Insert a non-speechable command (for example, ⁇ mute) at the beginning of the line for the part where voice synthesis is not desired, and send the e-mail. There is disclosed an apparatus that recognizes an unacceptable command and selects whether or not to perform speech synthesis.
  • a speech command for example, ⁇ speech
  • a non-speechable command for example, ⁇ mute
  • Japanese Patent Application Laid-Open No. 9-1135264 discloses that a text conversion server equipped with reading and prosody provision rules and a voice specified by a user are provided on a mail communication network to which a plurality of user terminals are connected. It has an audio output server as an output device, and a user terminal is connected to an audio output setting file in which each user sets information for audio output, and if an incoming email matches the file setting conditions, Reads e-mail via a text conversion server, adds prosody information, and outputs a voice using a voice output server or a voice synthesis device connected to a specific user terminal by executing a mail reading command. Is disclosed. [Problems to be solved by the invention]
  • the conventional e-mail text-to-speech function has the following problems in reading out the text part of the e-mail text.
  • the reply mail from the other party or the mail exchanged by two or more people may include all or part of the contents of the mail exchanged in the past.
  • a quote (quotation mark) such as '>' is often inserted at the beginning of the quoted part, and conventional e-mail reading functions usually use this quotation mark.
  • the e-mail text may include a character string that does not make sense when read out, such as an e-mail address consisting of alphabets, numbers, and symbols, and a homepage address.
  • a character string that does not make sense when read out
  • these parts are read alphabetically or in Romaji, which makes it difficult to understand the reading voice.
  • the present invention has been made in view of the above problems, and its purpose is to convert expressions that are not suitable for reading into expressions that are suitable for reading, and to enable the listener to clearly recognize the converted part,
  • An important quotation is to provide an effective and efficient e-mail reading device and method that does not synthesize speech, and to provide a recording medium storing a text conversion rule table suitable for such speech synthesis.
  • the e-mail reading device converts input text in a format that is not suitable for reading including quotation marks into a format suitable for reading in units of one sentence, and quotation using quotation marks.
  • input text in a format that is not suitable for reading including quotation marks
  • quotation marks a format suitable for reading in units of one sentence
  • quotation using quotation marks Before / after text that is formatted in units of one sentence, enable / disable text-to-speech in the specified range, switch between reading voices, and adjust reading speed.
  • a text formatting unit that inserts and outputs commands that include changes and changes in speech synthesis parameters, and a text string replacement method and replacement portion for single-sentence text output by the text formatting unit
  • a text conversion unit that describes the above-mentioned command and replaces a character string and inserts a command in accordance with the text conversion rules registered in the text conversion rule table, and a command for reading out text in a specified range by the command.
  • a speech synthesis unit for converting the text of each sentence replaced by the text conversion unit into speech according to the content.
  • the quoted part of the quoted part of the e-mail is distinguished from the ordinary character string, so that even in the quoted part, the text can be read aloud in units of one sentence.
  • the text conversion rule includes a set of a text pattern before conversion, a text pattern after conversion, and a command for controlling reading of the converted text portion.
  • the read-out voice of the part converted by the text conversion rule is controlled by the command, so that the listener can clearly recognize the converted part. Also, by inserting only the command without performing the conversion operation according to the text conversion rules, functions such as calling attention to important parts of the e-mail text can be realized. Also, the text conversion rules are '99 ⁇ 1 2 ⁇ 1 9 ',' 1 2: 3 0 ', etc. This is a rule that converts expressions containing dates and times written in an abbreviated format into expressions suitable for speech conversion. As a result, the abbreviated date and time are also converted to read aloud and read, so that it is possible to obtain an understandable reading voice.
  • the text conversion rule is a rule that converts a character string containing an e-mail address and a homepage address that are not suitable for speech conversion into a character string containing the owner name of the e-mail address and the homepage address, respectively.
  • the text conversion rule is a rule that converts a character string containing an e-mail address and a homepage address that are not suitable for speech conversion into a character string containing the owner name of the e-mail address and the homepage address, respectively.
  • the text conversion rule is a rule that inserts a command that specifies the reading of numbers before and after the part that reads (does not read digits) including telephone numbers and postal codes.
  • a command that specifies the reading of numbers before and after the part that reads (does not read digits) including telephone numbers and postal codes.
  • Command is inserted before and after the word, and then, according to the text conversion rules registered in the text conversion rule table, expressions that are not suitable for reading are converted into expressions that are suitable for reading, and before and after the conversion part. Inserts a command and, according to the specification of the inserted command, controls the reading operation and the speech synthesis parameters, and reads out the converted text that has been formatted into one sentence with synthesized speech. .
  • the cited section can be read out correctly, and Functions such as skipping a portion can be realized.
  • a recording medium is a recording medium used for converting a character string in input text and synthesizing a voice, comprising: a character string conversion rule; A text conversion rule table in which a text conversion rule including a command specifying a combining operation is registered is stored.
  • the abbreviated date and time, the e-mail address and the home page address included in the text are suitable for reading, or can be read. It is possible to change the spoken voice so that it can be replaced with a non-obstructive expression, and the replaced part can be distinguished from other parts.
  • FIG. 1 is a block diagram showing a main configuration of an electronic mail reading device according to an embodiment of the present invention.
  • FIG. 2 is a diagram showing an example of a computer system for constructing an electronic mail reading device according to an embodiment of the present invention.
  • FIG. 3 is a flowchart for explaining the main operation of the electronic mail reading device according to one embodiment of the present invention.
  • FIG. 4 is a diagram showing an example of a text portion of an e-mail text input to the e-mail reading device according to the embodiment of the present invention.
  • FIG. 5 is a diagram showing an example of the contents of a text shaping process in the electronic mail reading device according to the embodiment of the present invention.
  • FIG. 6 shows an electronic mail reading device according to an embodiment of the present invention. It is a figure showing an example of the contents of a text conversion rule.
  • FIG. 7 is a diagram showing an example of the content of a text conversion process in the electronic mail reading device according to the embodiment of the present invention.
  • FIG. 1 is a block diagram showing a main configuration of an electronic mail reading device according to an embodiment of the present invention.
  • the e-mail reading device includes a text formatter 101, a text converter 105, a voice synthesizer 108, and a voice output unit 111.
  • the text formatting unit 101 separates the header part and the body part of the e-mail text and extracts the body text, and analyzes the format of the quoted part of the body text. It has a citation processing unit 103 and a sentence unit formatting unit 104 for formatting into one sentence per line.
  • the citation processing unit 103 recognizes the start and end of the citation indicated by the citation such as '>', and deletes the citation in the citation range. Also, before and after the quoted part, insert a line containing only the command string (command tag) that specifies how to read out the quoted part.
  • the sentence-based formatting unit 104 connects the lines of continuous text, except for the command tag lines, once to a single line, breaks the line at the delimiter of one sentence, and formats it into one sentence per line. I do. In this case, delete unnecessary white space characters inserted before and after each line of the text before formatting.
  • the quotation can be read correctly one sentence at a time. It is possible to realize an efficient reading function that does not read a quoted part that seems to be redundant, or an effective reading function such as reading at a higher speed.
  • the text conversion unit 105 includes, as functional blocks, a conversion unit 106 that inserts a command tag that specifies a character string replacement and a method of reading out the replacement part, and a text conversion rule that the conversion unit 106 refers to. And a text conversion rule table 107 to be registered.
  • the text conversion rule table 107 specifies character string replacement rules that replace expressions that do not make sense when spoken literally into meaningful expressions, and how to read the voice such as voice type and volume.
  • the combination of the command tag and the command tag is described as one text conversion rule.
  • Abbreviated dates, times, e-mail addresses and homepage addresses included in the text can be replaced with expressions that are suitable for reading or that are not annoying when read, and the replacement part is replaced by other parts It is possible to vary the reading voice so that it can be distinguished from the reading voice. Therefore, the contents of the e-mail can be heard in an easy-to-understand voice.
  • the speech synthesis unit 108 analyzes the input text, obtains the text reading, synthesizes the speech waveform, synthesizes the speech waveform, the text shaping unit 101, and the text conversion unit Receiving the command evening output from 105, the composition processing unit as specified by the command tag, such as whether or not to speak, designation of the speech method such as how to read numbers, designation of parameters related to synthesis processing such as volume, etc. And a synthesizing control unit 110 for controlling the operation of 109.
  • the audio output unit 111 outputs the audio signal generated by the audio synthesizing unit 108.
  • Such an e-mail reading device is, for example, built on a computer system as shown in FIG.
  • This computer system includes a main body 201, a keyboard 202, a display 203, an input device (mouse) 204, and a communication network 209 for sending and receiving e-mail. It is a system that can output audio.
  • the text conversion rule table 107 shown in Fig. 1 is stored in the CD-ROM 208 set in the main unit 201, in the disk (memory) 205 built in the main unit 201, or on a line.
  • the data is stored in the disk 206 of another system connected to the network 206.
  • Fig. 3 summarizes the characteristic operations of the e-mail reading device shown in Fig. 1.
  • the body text extraction unit 102 extracts the body part of the e-mail
  • the citation processing unit 103 analyzes the format of the citation part, deletes the quotation mark part, inserts a command tag
  • the unit formatting unit 104 formats and outputs the data in a format of one line and one sentence (step 301). This allows you to read the quotes correctly and control the reading of the quotes.
  • the conversion processing unit 106 replaces the part that matches the rules in the text and inserts the command tag at the same time (step 3 0 2). This It can be converted to expressions suitable for speech conversion, and effective speech can be made with changes in speech.
  • the synthesis control unit 110 synthesizes a set of speech synthesis parameters such as whether or not to read, how to read numbers, and the type of voice, volume, etc., according to the specification of the command tag.
  • the processing is performed on the processing unit 109, and the synthesizing processing unit 109 executes a text synthesizing process in units of one sentence in accordance with the designated mode “parameter” (step 303). As a result, it becomes possible to control the reading operation as specified by the command tag in step 301 and step 302.
  • FIG. 4 is a diagram showing an example of the main part of the e-mail text to be input to the text shaping section 101.
  • the body part 401 is abbreviated to date and time, such as the quoted part indicated by the quotation mark '>', '10 no 2 ',' (Sat) ', and '13: 00'. Includes notation, email addresses, URLs and other alphabetic characters, and phone numbers.
  • FIG. 5 is a diagram illustrating an example of the result of the text that has been subjected to the shaping process by the text shaping unit 101.
  • reference numerals 501 and 502 denote examples of the body part 401 of the e-mail shown in FIG. 4 after the shaping process.
  • the part of the line where the line breaks in 401 is reformed in units of one sentence per line. Lines that are blank at 401 are deleted at 501 and 502.
  • the command tag is used in the form of a pair consisting of ' ⁇ command>' and 'gu Z command>'. The reading operation specified by is enabled.
  • the first 'sound of the body Start reading with the type of voice specified by 'Voice 1', and can be distinguished from 'Voice 1' specified by 'Voice 2' between 'Gu voice 2>' and 'Gu / Voice 2>' It will be read aloud and after that, until the last line, it will be read aloud again with the type of voice specified by 'voice 1'.
  • 501 is the citation processing section 103, and the citation section of 401 is deleted from “regular meeting announcement” and “date and time 10 Z2 (Sat) 13 ⁇ 0 0” , At the position where the quoted part was in the text, a command tag to change the voice Tag voice 2>, ⁇ Z voice 2>, and the phrase “Omit the quotes” enclosed between the command tags This is the result of the shaping process in the case of the operation of inserting.
  • 502 is a citation processing unit 103, which removes the quotation mark '>' from the quotation part of 401, and places command tags ⁇ voice 2> and ⁇ Z voice 2 before and after the text of the quotation part. > And ⁇ speed speed>, ⁇ no speed speed>, and the sentence indicating the start and end of the citation.
  • the shaping process results when inserting the “start of citation” and “end of citation”. is there.
  • FIG. 6 is a diagram showing an example of a text conversion rule registered in the text conversion rule table 107.
  • the upper part of the broken line in each column separated by a solid line is the pre-conversion regular expression representing the pattern of the character string to be converted in the text
  • the lower part of the broken line is the collation with the pre-conversion regular expression. This is the converted character string representing the character string to be replaced with the part.
  • the symbols used in the pre-conversion regular expression include the string itself to be matched and the control characters that specify the matching action.
  • the type and operation of the control characters, that is, the grammar of the regular expression shall conform to the grammar of the regular expression defined by the text processing command a wk usable in OS such as UNIX.
  • E 1 * Repeat and match 0 or more times of E 1 6.
  • E 1 + Repeat and match E 1 one or more times
  • Rule 7 is used when the control character itself is to be matched.
  • the pre-conversion regular expression of 60 1 is a regular expression that matches a date expression such as '3/2 2'.
  • '([1 1 9] I 1 0 I 1 1 I 1 2), means to match any of the month numbers from 1 to 12,
  • ⁇ slow speed and ⁇ slow speed> are a pair of command tags
  • ⁇ ⁇ is a character string that supports line feed.
  • ' ⁇ 1' and ' ⁇ 2' are the positions of ' ⁇ 1' and ' ⁇ 2', respectively, that match the range enclosed by two '0' s that appear in the pre-conversion regular expression of 60 1 To be inserted into In other words, ' ⁇ 1, is the part matched with' ([1-9] I1 0 I11I12) ', and' ⁇ 2 'is' ([1-9] I [12] [0-9] Replaced with the part matched with I 3 0 I 3 D '.
  • 602 is the conversion of the day of the week
  • 603 is the conversion of the notation of the time
  • 604 is the conversion of the e-mail address
  • 606 is the text conversion that converts the telephone number. Rules.
  • FIG. 7 is a diagram showing an example in which the post-formatting text 501 of FIG. 5 is converted according to these text conversion rules.
  • command tags that control the reading speed make it possible to slowly read out parts that you want to hear reliably, such as the date, day of the week, and time.
  • the rule address part is replaced with 'E-mail address display' according to the conversion rule of 605, and command tags are inserted before and after.
  • the conversion rule of 604 converts the e-mail address of the person who often receives e-mails into an expression that includes the name of the owner, and who's e-mail address
  • the conversion rule of 605 intends to perform a conversion operation for an e-mail address not registered as a personal name, such as 604. In this way, it is possible to write a text conversion rule that switches the reading operation according to the user's preference of the electronic mail reading device, and a highly customizable reading function can be realized.
  • the telephone number portion of '0 3—1 2 3 4—5 6 7 8' in 5 0 1 of FIG. 5 is converted to 5 6 7 8 of 1 2 3 4 of 0 3 by the conversion rule 6 0 6.
  • the command tags of slow speed forward and backward> ⁇ slow Z speed> and numeric reading> ⁇ numeric reading> are inserted.
  • Numerical reading in command tags> and ⁇ // numeral reading> are not “digit reading” in which the reading of numbers between them is read with a number, but “numerical reading” (“stick reading”) in which they are read as a series of numbers. ”).
  • the sentence indicating the start and end of the quoted portion is inserted, but instead, a notification sound is output, or a pause is simply input for several seconds.
  • the processing may be performed as follows.
  • control of the reading operation by the command tag is combined with the control of the switching of the type of the voice, the control of the reading speed, and the control of the reading of the number is shown.
  • control of other reading methods may be combined.

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)

Description

明 細 電子メール読み上げ装置および方法およびテキス卜変換処理用記録媒体 技術分野
本発明は、 電子メールなどの電子化テキス卜を合成音声で読み上げる 電子メール読み上げ装置および方法、 およびテキスト変換規則テーブル を格納した記録媒体に関する。 背景技術
電子メールの普及に伴い, 電話から電子メールの内容を確認する機能 や、 視覚障害者向けに電子メールを読み上げる機能などが求められてい る. その要求に対応するために、 電子メールの内容を電話から確認する 機能を有する C T I ( Computer Telephony Integration) サーバや、 目の見えにくい高齢者や視覚障害者が電子メールの内容を音声で確認で きる電子メール読み上げソフ卜ウェアなどが実用化されている。
これら、 C T Iサーバ、 読み上げソフトウェアにおいては、 電子メ一 ルのテキストを読み上げるために、 テキス卜を音声に変換するテキスト 音声合成技術が用いられている。
電子メールのテキストフォ一マットは大きく分けて、 電子メールの送 受信に関する各種情報が格納されたヘッダ部分と、 実際に送信者がテキ ストを記述した本文部分の 2つに分けることができる。ヘッダ部分には、 発信者アドレス、 宛先アドレス、 送信日時などの各種ヘッダ情報が含ま れており、 通常これらの文字列は、 読み上げても意味をなさないアルフ アベッ 卜列であることが多い。
このように、 電子メールのテキストを読み上げる場合には、 読み上げ る必要がある部分と必要ではない部分を切り分ける処理が必要であるが、 ヘッダ部と本文部については、 明確に規格化がなされているため、 容易 に切り分けることが可能で、 従来の電子メール読み上げ機能でも、 本文 だけを読み上げることが可能である。
さらに、 電子メール本文についても、 各行の改行位置が単語の途中で あったり、 1行の途中に句点があるなど、 読み上げた音声が意味をなす ように 1文単位で読み上げるためには考慮すべき点がある。 従来の電子 メール読み上げ機能では、 句点、 疑問符、 その他の記号を区切り文字と して、 1文単位のテキストに分割するなどして、 1文単位での読み上げ の開始位置と終了位置が適切になるようにしている。
また、 特開平 9 - 2 5 1 3 7 3号公報には、 電子メールを送信しょう とするユーザが、 入力文のうち音声合成を希望する部分については行頭 に音声化コマンド (例えば、 ¥speech) を挿入したり、 音声合成を希望 しない部分については行頭に音声化不可コマンド (例えば、 ¥mute) を 挿入して電子メールを送信し、 受信側のコマンド認識処理部でその音声 化コマンドまたは音声化不可コマンドを認識して、 音声合成を行うか否 かを選択するものが開示されている。
また、 特開平 9 一 1 3 5 2 6 4号公報には、 複数のユーザ端末が接続 されたメール通信ネッ トワーク上に、 読み '韻律付与ルールを備えたテ キスト変換サーバ、 およびユーザ指定により音声出力デバイスとなる音 声出力サーバを備え、 ユーザ端末には、 ユーザ各個人が音声出力のため の情報を設定する音声出力設定ファイルが接続され、 到着した電子メー ルがファイルの設定条件に合致すると、 テキスト変換サーバを介して電 子メールに読み ·韻律情報を付与し、 メール読み上げコマンドの実行に より、 音声出力サーバまたは特定のユーザ端末に接続された音声合成装 置を用いて音声出力するものが開示されている。 【発明が解決しょうとする課題】
しかしながら、 従来の電子メール読み上げ機能では、 電子メールテキ ス卜の本文部分を読み上げる上で、 次のような問題を有している。
相手からの返信メールや、 複数人で交換したメールには、 過去にやり とりされたメールの内容の全部、 あるいは、 一部が引用された部分が含 まれる場合がある。 引用された部分の先頭には、 たとえば '〉' のよう な引用部分であることを示す記号 (引用記号) が挿入されていることが 多く、 従来の電子メール読み上げ機能では、 この引用記号を通常の電子 メール中のテキストと判断して、 正しく 1文単位にテキストを分割でき ないという問題がある。
また、 引用部分については、 冗長となるため読み飛ばすなどの動作が 望ましいが、 そのような読み上げに関する制御ができないなどの問題も ある。
引用部分を読み上げる場合には、 電子メールテキスト上では、 引用記 号によって引用部分が示され、 視覚的に構造化されているので、 引用部 分とそうでない部分は容易に区別できるが、 メールテキス卜の最初から 読み上げる場合、 引用部分とそうでない部分を同じ音声で読み上げると 両者を区別できないという問題がある。
また、 電子メールのテキストは、 目で見て読むことを前提として書か れているので、 文字通り読んでも意味がわかりにくい、 あるいは、 意味 をなさない表現が含まれていることがある。 たとえば、 日付をあらわす のに、 ' 4Ζ6 '、 ' 9 9Ζ 1 2ノ 1 9 ' という書き方をしたり、 時刻を表 すのに ' 1 2 : 00 '、 ' 1 3 : 45 ' などという書き方をすることがよ くある。その場合、従来の電子メール読み上げ機能では、 ' 4/ 6 'を 'ョ ンロク 、 ' 9 9Z 1 2Z 1 9 を キュージュ一十ユージュ一ニジュ一 キュー,、 ' 1 2 : 0 0 ' を 'ジユー二ゼロ'、 ' 1 3 : 4 5 ' を 'ジユー サンヨンジュ一ゴ' などと読み上げてしまうため、 読み上げ音声が理解 困難なものとなるという問題がある。
さらに、電子メールのヘッダ以外の部分においても、 アルフアベット、 数字、 記号からなる電子メールァドレスやホームページアドレスなど、 読み上げても意味をなさない文字列が電子メールテキス卜に含まれる場 合がある。 従来の電子メール読み上げ機能では、 こうした部分をアルフ ァベット読み、 あるいは、 ローマ字読みとしてしまうため、 読み上げ音 声が分かりづらくなるという問題を有している。
また、 数字に関しては、 金額や数量をあらわす数字は、 桁読みし、 電 話番号や郵便番号は、 桁読みしない (棒読みする) などの切り替えが必 要であるが、従来の電子メール読み上げ機能では、 切り替えがなされず、 数字の部分の読み上げ音声が紛らわしく分かりづらいという問題を有し ている。 発明の開示
本発明は、 上記の問題点に鑑みてなされたものであり、 その目的は、 読み上げに適さない表現を読み上げに適した表現に変換するとともに、 その変換部分を聞き手が明確に認識でき、 また冗長な引用部分は音声合 成しないという効果的および効率的な電子メール読み上げ装置および方 法を提供し、 またかかる音声合成に適したテキスト変換規則テーブルを 格納した記録媒体を提供することにある。
前記の目的を達成するため、本発明に係る電子メール読み上げ装置は、 引用記号を含む読み上げに適さない書式の入力テキストを読み上げに適 した書式へと 1文単位に整形するとともに、 引用記号による引用部分を 1文単位に整形したテキストの前後に、 指定範囲におけるテキストの読 み上げの有効 ·無効の制御、 読み上げ音声の切り替え、 読み上げ速度の 変更、 および音声合成パラメ一夕の変更を含むコマンドを挿入して出力 するテキスト整形部と、 テキスト整形手段の出力である 1文単位のテキ ス卜に対して、 文字列の置換方法および置換部分に対する前記コマンド を記述しテキスト変換規則テーブルに登録されたテキスト変換規則に従 つて、 文字列の置換およびコマンドの挿入を行うテキスト変換部と、 コ マンドによる指定範囲のテキス卜の読み上げに関して、 コマンドの内容 に従って、 テキスト変換部で置換された 1文単位のテキストを音声化す る音声合成部とを備えたことを特徴とする。
この構成によれば、 電子メールの引用された部分の引用記号部分を通 常の文字列と区別するので、 引用部分であっても正しく 1文単位でテキ ストを読み上げることができる。 また、 引用部分の読み上げに関して、 読み上げない、 引用以外の部分と異なる声の種類で読み上げる、 または 速度を速めて読むなどの制御が可能となり、 冗長な引用部分に関しての 柔軟な読み上げ機能を実現することができる。 さらに、 電子メールテキ ス卜に含まれる文字通りの読み上げに適さないような文字列を読み上げ に適した表現へと変換して読み上げることができる。
本発明に係る電子メール読み上げ装置において、テキスト変換規則は、 変換前のテキストパターンと、 変換後のテキストパターンと、 変換され たテキスト部分の読み上げを制御するコマンドとを 1組として成ること が好ましい。
この構成によれば、 テキスト変換規則によって変換された部分の読み 上げ音声をコマンドによって制御するので、 変換された部分であること を明確に聞き手に認識させることができる。 また、 テキスト変換規則で 変換動作は行わず、 コマンドだけを挿入することで、 電子メールテキス トの重要な部分への注意を促すなどの機能を実現することができる。 また、 テキス卜変換規則は、 ' 9 9 Ζ 1 2 Ζ 1 9 '、 ' 1 2 : 3 0 ' 等の 省略された形式で記述された日付および時刻を含む表現を、 その記述内 容を音声化に適した表現へと変換する規則である。 これにより、 略記さ れた日付や時刻も、 音読する読み方に変換して読むので、 理解可能な読 み上げ音声とすることができる。
または、 テキスト変換規則は、 音声化に適さない電子メールアドレス およびホームページアドレスを含む文字列を、 それぞれ、 電子メールァ ドレスおよびホームページァドレスの所有者名を含む文字列へと変換す る規則である。 これにより、 電子メールアドレスやホームページァドレ スを文字通り読み上げるのではなく、 所有名を含む表現に置き換えて読 み上げるので、 スムーズで理解しやすい電子メ一ルの読み上げが可能に なる。
または、 テキスト変換規則は、 電話番号および郵便番号を含む数字を 棒読みする (桁読みしない) 部分の前後に、 数字の棒読みを指定するコ マンドを挿入する規則である。 これにより、 棒読みすべき数字を含む文 字列のパターンをテキスト変換規則に記述することにより、 桁読みすベ き数字と、 棒読みすべき数字を区別して読み上げることが可能になる。 前記の目的を達成するため、本発明に係る電子メール読み上げ方法は、 入力された電子メールテキス卜の引用部分を解析し、 引用記号を削除し て 1文単位の書式に整形するとともに、 引用部分の前後にコマンドを挿 入し、 その後、 テキスト変換規則テ一ブルに登録されているテキスト変 換規則に従って、 読み上げに適さない表現を読み上げに適した表現へと 変換するとともに、 変換部分の前後にコマンドを挿入し、 挿入されたコ マンドの指定に従って、 読み上げ動作と音声合成パラメ一夕を制御しな がら、 1文へと整形された変換後のテキストを合成音声で読み上げるこ とを特徴とする。
この構成によれば、 引用部を正しく読み上げることができ、 かつ、 同 部分を読み飛ばしするなどの機能を実現することができる。 また、 理解 しづらい部分を理解しやすい表現に置き換えて、 読み上げ方や音声に変 化をつけて効果的に分かり易く読みげることができる。
前記の目的を達成するため、 本発明に係る記録媒体は、 入力されたテ キス卜における文字列を変換処理し音声合成するために用いられる記録 媒体であって、 文字列の変換規則と、 音声合成の動作を指定するコマン ドとを含むテキスト変換規則が登録されたテキスト変換規則テーブルが 格納されたことを特徴とする。
この構成によれば、 テキスト変換規則テーブルを参照することで、 略 記された日付、 時間や、 本文に含まれる電子メールアドレスやホームべ ージアドレスなどを、 読み上げに適した、 あるいは、 読み上げても耳障 りではない表現に置き換えることができ、 かつ、 置き換え部分が他の部 分と区別できるように、読み上げ音声に変化をつけることが可能になる。 図面の簡単な説明
図 1は、 本発明の一実施形態による電子メール読み上げ装置の主要構 成を示すブロック図である。
図 2は、 発明の一実施形態による電子メール読み上げ装置を構築する ためのコンピュータシステムの一例を示す図である。
図 3は、 本発明の一実施形態による電子メール読み上げ装置の主要動 作を説明するためのフローチャートである。
図 4は、 本発明の一実施形態による電子メール読み上げ装置に入力さ れる電子メールテキス卜の本文部分の一例を示す図。
図 5は、 本発明の一実施形態による電子メール読み上げ装置における テキスト整形処理内容の一例を示す図である。
図 6は、 本発明の一実施形態による電子メール読み上げ装置における テキスト変換規則内容の一例を示す図である。
図 7は、 本発明の一実施形態による電子メール読み上げ装置における テキスト変換処理内容の一例を示す図である。 発明を実施するための最良の形態
以下、 本発明の好適な実施形態について、 図面を参照して具体的に説 明する。
図 1は、 本発明の一実施形態による電子メール読み上げ装置の主要構 成を示すブロック図である。
図 1において、電子メール読み上げ装置は、 テキスト整形部 1 0 1と、 テキス卜変換部 1 0 5と、 音声合成部 1 0 8と、 音声出力部 1 1 1とか らなる。
テキスト整形部 1 0 1は、 機能ブロックとして、 電子メールテキス卜 のヘッダ部分と本文部分を切り離し、 本文テキストの取り出しを行う本 文テキスト抽出部 1 0 2と、 本文テキストの引用部分の書式を解析する 引用処理部 1 0 3と、 1行 1文の書式に整形する文単位整形部 1 0 4と を有する。
引用処理部 1 0 3では、 ' > 'などの引用記号によって示される引用部 分の開始部分と終了部分を認識し、 引用範囲の引用記号を削除する。 ま た、 引用部分の前後には、 引用部分の読み上げ方法を指定するコマンド の文字列 (コマンドタグ) だけの行を挿入する。
文単位整形部 1 0 4では、 コマンドタグの行以外を対象に連続するテ キストの行を一旦 1行に接続し、 1文の区切りとなる箇所で改行し、 1 文 1行の書式に整形する。 その際には、 整形前のテキストの各行の前後 に挿入されている不要な空白文字なども削除する。
これによつて、 引用部分については、 正しく 1文単位で読み上げるこ とが可能で、 かつ、冗長と思われる引用部分を読まないという効率的な、 あるいは、 速度を速めて読み上げるなどの効果的な読み上げ機能を実現 することができる。
テキスト変換部 1 0 5は、 機能ブロックとして、 文字列の置き換えと 置き換え部分の読み上げ方法を指定するコマンドタグの挿入を行う変換 部 1 0 6と、 変換部 1 0 6が参照するテキスト変換規則を登録しておく テキスト変換規則テーブル 1 0 7とを有する。
テキスト変換規則テーブル 1 0 7には、 文字通り読み上げると意味が 通じなくなる表現を、 意味が通じる表現へ置き換えるような文字列の置 換規則と、 読み上げ音声の声の種類や音量などの読み上げ方法を指定す るコマンドタグとを組み合わせたものを 1つのテキスト変換規則として 記述する。 略記された日付、 時間や、 本文に含まれる電子メールァドレ スゃホームページアドレスなどを、 読み上げに適した、 あるいは、 読み 上げても耳障りではない表現に置き換えることができ、 かつ、 置き換え 部分が他の部分と区別できるように、 読み上げ音声に変化をつけること が可能である。 よって、 電子メールの内容を分かりやすい音声で聞くこ とができる。
音声合成部 1 0 8は、 機能ブロックとして、 入力テキストを解析し、 テキストの読みを得て、 音声波形を合成する合成処理部 1 0 9と、 テキ スト整形部 1 0 1と、 テキスト変換部 1 0 5から出力されたコマンド夕 グを受け取り、 読み上げの有無、 数字の読み上げ方など読み上げ方法に 関する指定、 音量などの合成処理に関するパラメ一夕指定などコマンド タグでの指定通りに、 合成処理部 1 0 9の動作を制御する合成制御部 1 1 0とを有する。
コマンド文字列により、 音声合成部 1 0 8の読み上げモードを詳細に 制御することが可能なので、 テキスト整形部 1 0 1およびテキスト変換 部 1 0 5でのコマンドタグの出力を工夫することにより、 電子メールを 分かりやすく効果的に読み上げることが可能になる。
音声出力部 1 1 1は、 音声合成部 1 0 8で生成された音声信号を出力 する。
かかる構成において、 電子メールテキストの引用部分を正しく読み、 文字通りの読みでは理解できない部分を分かりやすい表現に変換し、 数 字の桁読み ·棒読みなど読み分けるべき箇所を読み分けて読み、 かつ、 読み上げ音声に変化をつけて効果的に読み上げることが可能になる。
このような電子メール読み上げ装置は、 例えば、 図 2に示すようなコ ンピュー夕システム上に構築されるものである。 このコンピュータシス テムは、 本体部 2 0 1と、 キーボード 2 0 2と、 ディスプレイ 2 0 3と、 入力装置 (マウス) 2 0 4と、 電子メールの送受信のための通信網 2 0 9とを含む音声出力可能なシステムである。 図 1のテキスト変換規則テ 一ブル 1 0 7は、 本体部 2 0 1にセットされる C D— R O M 2 0 8内、 本体部 2 0 1が内蔵するディスク (メモリ) 2 0 5内、 あるいは回線 2 0 7で接続された他のシステムのディスク 2 0 6内に格納される。
図 1に示す電子メール読み上げ装置の特徴的な動作をまとめると、 図 3のようになる。
すなわち、 本文テキスト抽出部 1 0 2で、 電子メールの本文部分を抜 き出し、 引用処理部 1 0 3で、 引用部分の書式の解析、 引用記号部分の 削除、 コマンドタグの挿入を行い、 文単位整形部 1 0 4で、 1行 1文単 位の書式へ整形して出力する (ステップ 3 0 1 )。 これにより、 引用部分 を正しく読み、 引用部分の読み上げが制御可能になる。
次に、 テキスト変換規則テーブル 1 0 7のテキス卜変換規則を参照し ながら、 変換処理部 1 0 6でテキスト中の規則に照合する部分を置換す ると同時に、 コマンドタグの挿入を行う (ステップ 3 0 2 )。 これにより 音声化に適した表現へ変換し、 音声に変化を持たせた効果的な読み上げ が可能になる。
次に、 合成制御部 1 1 0によって、 コマンドタグの指定に従って、 読 み上げの有無、 数字の読み上げ方などの読み上げモードのセット、 声の 種類、 音量などの音声合成パラメ一夕のセットを合成処理部 1 0 9に対 して行い、 合成処理部 1 0 9は、 指定されたモード 'パラメ一夕に従つ て 1文単位のテキス卜の合成処理を実行する (ステップ 3 0 3 )。 これに より、 ステツプ 3 0 1、 ステツプ 3 0 2でのコマンドタグの指定通りに、 読み上げ動作を制御することが可能になる。
以下、 テキスト変換規則の具体例と、 それを用いた電子メールテキス 卜の整形処理、 変換処理、 音声合成処理の具体例について、 図 4〜図 6 を用いて説明する。
図 4は、 テキスト整形部 1 0 1の入力となる電子メールテキス卜の本 文部分の一例を示す図である。 図 4において、 本文部分 4 0 1には、 引 用記号 '〉' で示された引用部分、 ' 1 0ノ 2 '、 '(土)'、 ' 1 3 : 0 0 ' などの日時に関する省略した表現、 Eメールアドレス、 U R Lなどの記 号を含むアルファベッ ト列、 電話番号の表記を含む。
図 5は、 テキスト整形部 1 0 1で整形処理したテキス卜の結果の一例 を示す図である。 図 5において、 5 0 1および 5 0 2は、 それぞれ、 図 4に示す電子メールの本文部分 4 0 1を整形処理後の例である。
引用部分以外では、 4 0 1において文の途中で改行されている部分が、 1行 1文単位に整形される。 4 0 1において空白である行は、 5 0 1お よび 5 0 2では削除されている。 また、 本実施形態においては、 コマン ドタグは、 ' <コマンド〉'、 'ぐ Zコマンド〉'からなる 1対の組の形式 で使用され、 1対のタグで囲まれた範囲で、 'コマンド'が指定する読み 上げ動作を有効にすることとする。 5 0 1の例では、 本文の最初の '音 声 1 ' で指定される種類の音声で読み始め、 'ぐ音声 2 > ' の行から 'ぐ /音声 2 > ' の間は、 '音声 2 ' で指定される '音声 1 ' と区別可能な音 声で読み上げ、 その後、 最後の行までは再び '音声 1 ' で指定される種 類の音声で読み上げることになる。
まず、 5 0 1は、 引用処理部 1 0 3で、 4 0 1の引用部分 「定例ミー ティングのお知らせ」、 「日時 1 0 Z 2 (土) 1 3 ·· 0 0より」 を削 除し、 本文中のその引用部分があった位置に、 音声を変更するコマンド タグぐ音声 2〉、 < Z音声 2 >、およびそのコマンドタグに囲まれた「引 用部分は省略します。」という文を挿入する動作とした場合の整形処理結 果である。
この整形処理によって、 既に過去に交換した電子メールで既知である 引用部分を読み上げ対象から外すことで、 必要な部分のみが読み上げら れるので、 引用部分を含む電子メールにおいても必要な部分の内容を効 率的に音声で聞くことができる。 さらに、 本文の読み上げと異なる音声 で、 「引用部分は省略します。」 という内容を読み上げるので、 受信した 電子メールには引用部分が有るが、 読み上げ対象から外れていることを ユーザに意識させることができる。
次に、 5 0 2は、 引用処理部 1 0 3で、 4 0 1の引用部分の引用記号 '〉' を取り去り、 引用部分のテキストの前後に、 コマンドタグ <音声 2〉、 <Z音声 2〉と <速度速〉、 <ノ速度速〉、 および引用の開始と 終了を示す文 「引用部分のはじまり。」、 「引用部分の終わり。」 を挿入す る動作とした場合の整形処理結果である。
5 0 2では、 引用部分の読み上げ動作としては、 '音声 2 ' で指定され る音声によって、 引用の開始を示す 「引用部分のはじまり。」 という文が 読み上げられ、 引用部分のテキストは '音声 2 ' で指定された音声で、 かつ、 コマンドタグぐ速度速 >、 ぐ Z速度速〉によって、 通常よりも速 い発声速度で読み上げた後、引用部分の終了を示す「引用部分の終わり。」 という文が '音声 2 ' で指定された音声で読み上げられる。
この整形処理によって、 引用部分を読み上げの対象とした場合でも、 引用部分の音声を変えること、 また、 引用部分の開始と終了を示す文を 読み上げることにより、 引用部分とそうでない部分とを明確に区別して 聞くことができる。 さらに、 引用部分を他の部分よりも速い速度で読み 上げることで、 引用部分を含む電子メールを効率的な音声で聞くことが できる。
図 6は、 テキスト変換規則テーブル 1 0 7に登録されるテキスト変換 規則の一例を示す図である。
図 6において、 実線で区切られた各欄の破線の上部が、 テキスト中の 変換対象となる文字列のパターンをあらわす変換前正規表現であり、 破 線の下部が、 変換前正規表現に照合した部分と置き換えるべき文字列を 表す変換後文字列である。
変換前正規表現に用いられている記号には、照合すべき文字列自身と、 照合の動作を指定する制御文字が含まれている。制御文字の種類と動作、 すなわち、 正規表現の文法は、 UN I Xなどの O Sで使用可能なテキス ト処理コマンド a wkなどで定義されている正規表現の文法に準ずるも のとする。
図 6で用いている正規表現に現れる制御文字の動作を以下で簡単に説 明する。
1 (S 1 I S 2 S 3) : S 1、 S 2、 S 3のいずれかの文字列と照合
2 [A-B] Aから Bの範囲にある文字と照合
3 [AB C] A、 B、 Cいずれかの文字と照合
44. . :任意の一文字と照合
5 E 1 * : E 1の 0回以上の繰り返しと照合 6. E 1 + : E 1の 1回以上の繰り返しと照合
7. ¥ A : Aの文字そのものの意味
なお、 7. の規則は、 制御文字そのものを照合の対象としたい場合に使 用される。
例えば、 6 0 1の変換前正規表現は、 ' 3/2 2 ' のような日付の表現 と照合する正規表現である。 '([ 1 一 9] I 1 0 I 1 1 I 1 2), の部分 は、 1から 1 2までの月の数字のいずれかと照合することを意味し、
'([ 1一 9] I [ 1 2 ] [ 0— 9 ] | 3 0 | 3 1 ), は、 1から 3 1まで の日の数字のいずれかと照合することを意味する。
変換後文字列には、 通常の文字とコマンドタグと、 さらに、 変換前正 規表現の中で '0' でくくられた正規表現の部分と照合した部分の文字 列を挿入することを指定する特殊なコマンド文字列を記述するものとす る。
次に、 6 0 1の変換後文字列を例に説明する。
6 0 1の変換後文字列の 'ぐ速度遅 >'、 '<Ζ速度遅 >' は、 一対の コマンドタグであり、 '¥ η ' は、 行の改行を支持する文字列である。 ' ¥ 1 '、 ' ¥ 2 ' は、 6 0 1の変換前正規表現に現れる 2箇所の ' 0 ' で囲まれた範囲と照合する部分をそれぞれ、 '¥ 1 '、 '¥ 2 'の位置に挿 入することを表す。 すなわち、 ' ¥ 1, は、 '([ 1一 9 ] I 1 0 I 1 1 I 1 2)' と照合した部分と、 '¥ 2 ' は、 '([ 1一 9 ] I [ 1 2] [ 0 - 9] I 3 0 I 3 D' と照合した部分と、 それぞれ置き換えられる。
6 0 1のテキスト変換規則によれば、 テキスト中の ' 3 Ζ 2 2 ' とい う日付の部分は、
ぐ速度遅 >
3月 2 2曰
< 速度遅 > という文字列とコマンドタグに置き換えられることになる。
同様に、 6 0 2は曜日の表記の変換、 6 0 3は時刻の表記の変換、 6 0 4、 6 0 5は電子メールアドレスの変換、 6 0 6は電話番号の変換を 行うテキス卜変換規則である。
図 7は、 これらのテキスト変換規則によって、 図 5の整形処理後テキ スト 5 0 1を変換した例を示す図である。
図 7において、 図 5の 5 0 1における ' 1 0Z2 ' という日付の部分 が、 6 0 1の変換規則によって、 ' 1 0月 2日 ' に変換されており、 前後 にコマンドタグが挿入されている。 '(土)' という曜日の部分が、 6 0 2 の変換規則によって、 '土曜日 ' に変換されている。 ' 1 2 : 0 0 ' とい う時刻の部分は、 6 0 3の変換規則によって、 ' 1 2時' に変換されてお り、 前後にコマンドタグが挿入されている。
このように、 文字通りに読み上げたのでは意味が通じない表現も、 耳 で聞いて理解可能な表現に変換して、 分かりやすい読み上げが可能にな る。 また、 読み上げの速度を制御するコマンドタグによって、 日付、 曜 日、 時刻など確実に聞き取りたい箇所をゆつく りと読み上げることが可 能になる。
また、 図 5の 5 0 1における 'hanako@provider.ne.jp' という電子 メールアドレスの部分は、 6 0 4の変換規則によって、 '花子さんのメ一 ルアドレス' という文字列に置き換えられており、 電子メールアドレス が文中に現れる場合も違和感無く読み上げることができる。
また、 図 5の 5 0 1における 'taro@subdomain.ne.jp' という電子メ
—ルァドレスの部分は、 6 0 5の変換規則により、 ' Eメールァドレス表 示' に置き換えられて、 前後にコマンドタグが挿入されている。
6 0 4の変換規則では、 よく電子メールを受け取る人の電子メールァ ドレスを、 その所有者の名前を含む表現に変換して、 誰のメールァドレ スかが分かるように読み上げることを意図しており、 6 0 5の変換規則 では、 6 0 4のように個人名として登録していない電子メールァドレス の場合の変換動作を意図している。 このように、 電子メール読み上げ装 置のユーザの好みによって、 読み上げ動作を切り替えるようなテキスト 変換規則を記述することも可能であり、 カスタマイズ性の高い読み上げ 機能を実現することができる。
さらに、 図 5の 5 0 1における ' 0 3— 1 2 3 4— 5 6 7 8 ' という 電話番号の部分は、変換規則 6 0 6によって、 ' 0 3の 1 2 3 4の 5 6 7 8 ' という文字列に変換され、 かつ、 前後にぐ速度遅 > < Z速度遅 >、 ぐ数字読み > < 数字読み〉というコマンドタグが挿入されている。 コマンドタグぐ数字読み〉、 < /数字読み〉は、 その間にある数字の 読み方を、 位をつけて読むという 「桁読み」 の読み方ではなく、 数字の 連続として読むという 「数字読み」 (「棒読み」) とすることを意味する。 よって、 電話番号の数字列などを、 日付などの桁読みする箇所と区別し て、 適切な読み方で読み上げることができる。 なお、 日付、 曜日、 時刻 の変換規則の効果と同様に、 読み上げる速度を遅くして確実に電話番号 を聞き取ることができるように読み上げることも可能になる。
以上説明したように、 本実施形態によれば、 引用記号などを含む引用 部分を正しく読み上げることができ、 かつ、 引用部分の読み上げ方法を 柔軟に指定することができる。 また、 文字通りの読み上げでは分かりに くい部分を、 理解可能な表現に置き換えて、 読み上げ方や音声に変化を 持たせて効果的に読み上げることができる。 さらに、数字列に関しては、 桁読みすべき箇所と数字読みすべき箇所とを区別して、 適切に読み分け ることができる。
すなわち、 テキストの整形処理、 テキストの変換処理、 コマンドタグ による音声合成の制御を組み合わせることにより、 従来の電子メール読 み上げ装置に比べ、 電子メールテキストを耳で聞いて分かりやすい音声 で読み上げることができる。
なお、 本実施形態におけるテキスト整形処理の例では、 引用部分の開 始と終了を示す文を挿入したが、 これに代えて、 何らかの報知音を出力 する、 あるいは、 単純に数秒間ポーズを入れるなどの処理とすることで もよい。
また、 本実施形態におけるテキスト変換処理の例では、 コマンドタグ による読み上げ動作の制御として、 音声の種類の切り替え制御、 読み上 げの速度の制御、 および数字の読み方の制御を組み合わせた例を示した が、 その他の読み上げ方法の制御を組み合わせてもよい。 例えば、 音量 の大小の制御や声の高さの制御を組み合わせることもできる。

Claims

請求の範囲
1 . 引用記号を含む読み上げに適さない書式の入力テキストを読み上 げに適した書式へと 1文単位に整形するとともに、 前記引用記号による 引用部分を 1文単位に整形したテキストの前後に、 指定範囲におけるテ キストの読み上げの有効 ·無効の制御、 読み上げ音声の切り替え、 読み 上げ速度の変更、 および音声合成パラメ一夕の変更を含むコマンドを揷 入して出力するテキスト整形部と、
前記テキスト整形手段の出力である 1文単位のテキストに対して、 文 字列の置換方法および置換部分に対する前記コマンドを記述しテキスト 変換規則テーブルに登録されたテキスト変換規則に従って、 文字列の置 換および前記コマンドの挿入を行うテキスト変換部と、
前記コマンドによる指定範囲のテキストの読み上げに関して、 前記コ マンドの内容に従って、 前記テキスト変換部で置換された 1文単位のテ キス卜を音声化する音声合成部とを備えたことを特徴とする電子メール 読み上げ装置。
2 . 前記テキスト変換規則は、 変換前のテキストパターンと、 変換後 のテキストパターンと、 変換されたテキスト部分の読み上げを制御する 前記コマンドとを 1組として成ることを特徴とする請求項 1記載の電子 メール読み上げ装置。
3 . 前記テキスト変換規則は、 省略された形式で記述された日付およ び時刻を含む表現を、 その記述内容を音声化するのに適した表現へと変 換する規則であることを特徴とする請求項 1または 2記載の電子メール 読み上げ装置。
4 . 前記テキスト変換規則は、 音声化に適さない電子メールアドレス およびホームページアドレスを含む文字列を、 それぞれ、 電子メールァ ドレスおよびホームページァドレスの所有者名を含む文字列へと変換す る規則であることを特徴とする請求項 1または 2記載の電子メール読み 上げ装置。
5 . 前記テキスト変換規則は、 電話番号および郵便番号を含む数字を 棒読みする (桁読みしない) 部分の前後に、 数字の棒読みを指定するコ マンドを挿入する規則であることを特徴とする請求項 1 または 2記載の 電子メール読み上げ装置。
6 . 入力された電子メールテキストの引用部分を解析し、 引用記号を 削除して 1文単位の書式に整形するとともに、 引用部分の前後にコマン ドを挿入し、 その後、 テキス ト変換規則テーブルに登録されているテキ ス卜変換規則に従って、 読み上げに適さない表現を読み上げに適した表 現へと変換するとともに、 変換部分の前後にコマンドを挿入し、 挿入さ れたコマンドの指定に従って、 読み上げ動作と音声合成パラメ一夕を制 御しながら、 1文へと整形された変換後のテキストを合成音声で読み上 げることを特徴とする電子メール読み上げ方法。
7 . 入力されたテキス卜における文字列を変換処理し音声合成するた めに用いられる記録媒体であって、 前記文字列の変換規則と、 音声合成 の動作を指定するコマンドとを含むテキスト変換規則が登録されたテキ スト変換規則テーブルが格納されたことを特徴とする記録媒体。
PCT/JP2000/007652 1999-11-01 2000-10-30 Dispositif et procede de lecture de messages electroniques, et support enregistre de conversion de texte WO2001033549A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11/310554 1999-11-01
JP31055499 1999-11-01

Publications (1)

Publication Number Publication Date
WO2001033549A1 true WO2001033549A1 (fr) 2001-05-10

Family

ID=18006646

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/007652 WO2001033549A1 (fr) 1999-11-01 2000-10-30 Dispositif et procede de lecture de messages electroniques, et support enregistre de conversion de texte

Country Status (1)

Country Link
WO (1) WO2001033549A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1109151A1 (en) * 1999-06-30 2001-06-20 Sony Corporation Electronic document processor
JP2002342236A (ja) * 2001-05-16 2002-11-29 Nec Access Technica Ltd 携帯情報端末
JP2003016008A (ja) * 2001-07-03 2003-01-17 Sony Corp 情報処理装置および情報処理方法、並びにプログラム
WO2006001488A1 (ja) * 2004-06-29 2006-01-05 Kyocera Corporation 携帯端末装置
JP2007334144A (ja) * 2006-06-16 2007-12-27 Oki Electric Ind Co Ltd 音声合成方法、音声合成装置及び音声合成プログラム
JP2008287538A (ja) * 2007-05-18 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> コンテンツ変換装置、コンテンツ変換方法およびコンテンツ変換プログラム
WO2010044220A1 (ja) * 2008-10-19 2010-04-22 Yoshino Takashi フェバリットソング選択型音楽付きメールシステム
WO2022249362A1 (ja) * 2021-05-26 2022-12-01 株式会社KPMG Ignition Tokyo テキストを合成音声に変換する音声合成

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223070A (ja) * 1992-11-18 1994-08-12 Canon Inf Syst Inc テキスト−スピーチコンバータ用テキストプロセッサ
JPH09179719A (ja) * 1995-12-26 1997-07-11 Nec Corp 音声合成装置
JPH10133853A (ja) * 1996-10-29 1998-05-22 Nippon Telegr & Teleph Corp <Ntt> 電子メール書換え方法及び装置
JPH11102198A (ja) * 1997-07-31 1999-04-13 Toyota Motor Corp メッセージ処理装置、メッセージ処理方法及びメッセージ処理プログラムを記録した媒体
JPH11272442A (ja) * 1998-03-24 1999-10-08 Canon Inc 音声合成装置およびプログラムを記憶した媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223070A (ja) * 1992-11-18 1994-08-12 Canon Inf Syst Inc テキスト−スピーチコンバータ用テキストプロセッサ
JPH09179719A (ja) * 1995-12-26 1997-07-11 Nec Corp 音声合成装置
JPH10133853A (ja) * 1996-10-29 1998-05-22 Nippon Telegr & Teleph Corp <Ntt> 電子メール書換え方法及び装置
JPH11102198A (ja) * 1997-07-31 1999-04-13 Toyota Motor Corp メッセージ処理装置、メッセージ処理方法及びメッセージ処理プログラムを記録した媒体
JPH11272442A (ja) * 1998-03-24 1999-10-08 Canon Inc 音声合成装置およびプログラムを記憶した媒体

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6985864B2 (en) 1999-06-30 2006-01-10 Sony Corporation Electronic document processing apparatus and method for forming summary text and speech read-out
EP1109151A4 (en) * 1999-06-30 2001-09-26 Sony Corp ELECTRONIC SORTER
EP1109151A1 (en) * 1999-06-30 2001-06-20 Sony Corporation Electronic document processor
US7191131B1 (en) 1999-06-30 2007-03-13 Sony Corporation Electronic document processing apparatus
JP2002342236A (ja) * 2001-05-16 2002-11-29 Nec Access Technica Ltd 携帯情報端末
JP2003016008A (ja) * 2001-07-03 2003-01-17 Sony Corp 情報処理装置および情報処理方法、並びにプログラム
US7676368B2 (en) 2001-07-03 2010-03-09 Sony Corporation Information processing apparatus and method, recording medium, and program for converting text data to audio data
WO2006001488A1 (ja) * 2004-06-29 2006-01-05 Kyocera Corporation 携帯端末装置
JP2007334144A (ja) * 2006-06-16 2007-12-27 Oki Electric Ind Co Ltd 音声合成方法、音声合成装置及び音声合成プログラム
JP2008287538A (ja) * 2007-05-18 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> コンテンツ変換装置、コンテンツ変換方法およびコンテンツ変換プログラム
JP4598800B2 (ja) * 2007-05-18 2010-12-15 日本電信電話株式会社 コンテンツ変換装置、コンテンツ変換方法およびコンテンツ変換プログラム
WO2010044220A1 (ja) * 2008-10-19 2010-04-22 Yoshino Takashi フェバリットソング選択型音楽付きメールシステム
WO2022249362A1 (ja) * 2021-05-26 2022-12-01 株式会社KPMG Ignition Tokyo テキストを合成音声に変換する音声合成

Similar Documents

Publication Publication Date Title
US6895257B2 (en) Personalized agent for portable devices and cellular phone
US6070138A (en) System and method of eliminating quotation codes from an electronic mail message before synthesis
JP3895766B2 (ja) 音声合成装置
US8705705B2 (en) Voice rendering of E-mail with tags for improved user experience
US6182041B1 (en) Text-to-speech based reminder system
JPH08194500A (ja) 後でテキストを生成するためのスピーチ記録装置および記録方法
WO2005093713A1 (ja) 音声合成装置
US20060224385A1 (en) Text-to-speech conversion in electronic device field
WO2001033549A1 (fr) Dispositif et procede de lecture de messages electroniques, et support enregistre de conversion de texte
US6553103B1 (en) Communication macro composer
CN101175272B (zh) 一种用声音读出文本短消息的方法
JPH04175049A (ja) 音声応答装置
JP3433868B2 (ja) 電子メール通信メディア変換システム
JP2002099485A (ja) 電子メール読み上げ装置及び記録媒体
JPH04167749A (ja) 音声応答装置
JP2002268664A (ja) 音声変換装置及びプログラム
JP2001228897A (ja) 音声入力装置及びその制御方法並びにプログラムコードを格納した記憶媒体
AU6116499A (en) Voice command navigation of electronic mail reader
JP2001325191A (ja) 電子メール端末装置
JP2006184921A (ja) 情報処理装置及び方法
JP2001195080A (ja) 音声合成方法
JP3147897B2 (ja) 音声応答システム
JP4364046B2 (ja) 情報通信端末、通信システム、情報通信端末プログラム、および記録媒体
JP4042580B2 (ja) 発音記述言語による音声合成をする端末装置
JPH0443297B2 (ja)

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA CN JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
122 Ep: pct application non-entry in european phase