WO2001073752A1 - Moyen de stockage, procede de distribution et dispositif de sortie vocale - Google Patents

Moyen de stockage, procede de distribution et dispositif de sortie vocale Download PDF

Info

Publication number
WO2001073752A1
WO2001073752A1 PCT/JP2000/006546 JP0006546W WO0173752A1 WO 2001073752 A1 WO2001073752 A1 WO 2001073752A1 JP 0006546 W JP0006546 W JP 0006546W WO 0173752 A1 WO0173752 A1 WO 0173752A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
information
font
intermediate language
character information
Prior art date
Application number
PCT/JP2000/006546
Other languages
English (en)
French (fr)
Inventor
Tooru Tanaki
Motoo Kawabata
Masami Akamine
Shigenobu Seto
Takehiko Kagoshima
Yoichi Akashi
Kunio Maikuma
Fumiko Takeuchi
Hiroshi Iwasaki
Yoshihiro Yamazaki
Original Assignee
Kabushiki Kaisha Toshiba
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kabushiki Kaisha Toshiba filed Critical Kabushiki Kaisha Toshiba
Publication of WO2001073752A1 publication Critical patent/WO2001073752A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Definitions

  • the present invention relates to a storage medium, a delivery method, and a sound output device, and in particular, to a storage medium and a delivery method that handle voice fonts related to the tone of a specific speaker's voice.
  • This book electronic device simply reads the type of characters displayed on the display of the electronic device, and the type of the type of the electronic device is the memory area or the like in the electronic device. It is stored in a recording medium supplied from the outside as text data in the form of type or image data of the type image .
  • an electronic package book in which the contents of a book read by a person are stored in a recording medium such as a cassette tape or a CD is used for reading the book.
  • a recording medium such as a cassette tape or a CD
  • the reading software is used for word-by-word access to character information, intonation, and even for a series of word groups. It contains information specializing in rhythms, intonations, etc., as well as multiple types of male and female voices and how to play. It has a function to adjust the speed, pitch, intonation, height, etc. to some extent, but it is more human-readable. He was far from listening to his natural voice. Disclosure of the invention
  • the present invention has been made in order to solve such problems of the prior art, and is not particularly dependent on the type of textual information, and is one of the most preferred ones.
  • the purpose is to provide a service based on voice synthesis technology that can reproduce and output a synthesized voice that approaches the voice of a person. .
  • the present invention also enables the user to select the preferred person's voice font to make it available, and to output the character information as an audio output.
  • the purpose is to provide voice font distribution technology that can provide one-point characteristics.
  • the invention of claim 1 provides a method for producing a specific voice in a storage medium with respect to a voice output by voice synthesis.
  • the feature is that only information on the elements to be given is stored.
  • the invention set forth in claim 2 is characterized in that the information is rewritable in the storage medium according to claim 1.
  • the invention of claim 3 in the scope of the claim shall not be applied to the audio output by the voice synthesis in the distribution method. It is characterized by the fact that information on elements that give a specific voice is distributed via an information network.
  • the invention of claim 4 is characterized in that in the delivery method described in claim 3, the information is encrypted and delivered. .
  • the invention of claim 5 is the distribution method according to claim 3, wherein the information relates to elements relating to a plurality of types of voices. This is the feature.
  • An invention according to claim 6 is the distribution method according to claim 3, wherein the distribution is performed via a communication carrier.
  • the invention according to claim 9 includes a character information storage means for storing predetermined character information in an audio output device; Intermediate linguistic information storage means for storing intermediate linguistic information including utterance speed rhythms given to the information, and information relating to this speaker when the speaker utters
  • a voice font storage means for storing a voice font, which is information on a specific voice, and character information stored in the character information storage means. Then, the intermediate language information stored in the intermediate language information storage means is applied to form an intermediate language, and the voice font storage is performed on the intermediate language.
  • the invention set forth in claim 10 is a sound output device according to claim 9, wherein the voice font storage means includes a plurality of types of voice storage devices.
  • the voice synthesis means wherein the voice synthesis means selects one of the plurality of voice fonts from among the plurality of voice fonts; Apply the selected voice font to ⁇ ⁇ c Intermediate language and add a voice corresponding to the selected voice font to synthesize and output the voice It is characterized by
  • the invention set forth in claim 11 is synchronized with the output of the sound by the sound synthesizing means in the sound output device described in claim 9.
  • the present invention is further characterized in that a display means for displaying the S character information is further provided.
  • the type of voice font can be changed according to the user's preference. For example, by using the information of famous actors, evening entrants, voice actors, casas, annaunsa, etc., it is possible to send character information to them. It is possible to output as a voice that resembles a specific timbre, and it is not a simple voice synthesis but a user's preference for synthesized voice. It can be provided with entertainability.
  • the voice font itself can be rewritten many times in the same way as character information, depending on the preference at that time.
  • -It can be commercialized as a short software.
  • Figure 1 shows the extraction of voice fonts from a specific speaker
  • FIG. 2 is a block diagram of the playback electronic device according to the present invention.
  • FIG. 3 is a block diagram showing the procedure for encrypting content and voice fonts.
  • FIG. 4 is a block diagram showing a procedure for decrypting content and voice fonts.
  • FIG. 5 is a diagram showing an example of a license relationship in the delivery of content and voice fonts.
  • FIG. 6 is a diagram showing an example of a data distribution system to which the present invention is applied.
  • FIG. 7 is a block diagram showing a charging system (relationship) in distributing content and voice fonts.
  • FIG. 8 is a diagram for explaining an example of a reproduction mode of the content data. Best mode for carrying out the invention
  • Fig. 1 the voice font and the intermediate language will be described based on Fig. 1. If you let a person read a sentence and analyze its natural sound, it is a factor that makes it possible to hear the speaking speed and voice as meaningful words. Accents and interest rhythms that are common to humans (in the following description, the standard language A language element that has a regularity (such as a dialect) that describes an accent (referred to as ⁇ Chinese language information ''). , And the elements that characterize a particular voice (human, animal, etc.) (specified voice parameters: referred to as “voice fonts”). be able to .
  • the intermediate language information is a representation of a phonetic character string, and specific examples are a power notation notation for reading, a control function for expressing an accent, and a It introduces a control function that expresses the tone and poses, and expresses a phonetic character string. And, even if you say the same sentence as the same sentence with the same middle language linguistics, the voice font is no longer the same. It expresses a voice that can identify the person who is being read by anyone. These voices are, for example, the voices of famous actors, evening entrants, social media, talent, casters, annaunsa, etc. If you can select and change the sound to your preference, you can read it yourself. The body becomes a commodity with distribution value.
  • the above-mentioned intermediate language information 20 is extracted from the parameters of speaking speed and rhythm and stored.
  • a parameter of voice quality is extracted, and the voice font information 30 of each person is stored.
  • sentence (original text) 40 the following processing is performed.
  • a sentence analysis is performed on the sentence information 40, and by applying the intermediate language information 20, the sentence analysis is performed on accents, intonations, and rhythms.
  • a voice is given by using the voice font information 30 of the specific speaker A, and a voice synthesis is performed to produce a synthesized voice 50. It is produced and output. As a result, the original sentence 40 can be finally read out by a synthesized voice 50 that resembles the voice of the recording speaker.
  • the information network which is made into a commercial product, is distributed on a storage medium storing the product, or includes the Internet Through the Internet, and can be downloaded and distributed to the storage device of the user terminal.
  • the recording medium storing the voice font may be distributed, or the voice font 30 may be used for the Internet font or the mobile communication network. It can be distributed via a public information network such as a network, and downloaded to the storage device of a user terminal for distribution. Wear . This distribution method will be described later.
  • the playback electronic device 200 as shown in Fig. 1 can be played and enjoyed.
  • This reproduction electronic device 200 will be described.
  • the playback electronic device 200 is intended for books and books, and the main body 210 has a portable shape, and is a card type or a stationary type.
  • a semiconductor media card 220 which is a recording medium of a disk type is configured to be detachably mounted.
  • the electronic circuit section in the main body 210 includes a decoding section 211, a voice synthesis processing / synthesized sound output section 21 2, and a speech force (or jar) 21.
  • the control unit 216 is composed of, for example, a mark-up / open-down sensor, and controls the reading out of the stored data of the semiconductor media card 220 and the above-mentioned control unit. It is responsible for controlling the entire equipment such as adjusting the timing between each element.
  • an operation button for outputting various instruction signals corresponding to a user's operation to the control circuit 216 and an associated button are provided.
  • a face circuit is also provided, and the driving of each of the above elements is performed by an internal battery.
  • the semiconductor media power supply 220 has a non-volatile memory and a Y # type card that supports the non-volatile memory. Or a stick-like substrate, and a storage area 22 1 ⁇ of the semiconductor media maker 22.
  • Data DS (ka) is stored in the storage area 22 1 B contains the encrypted voice font data generated by encrypting the preferred voice font data — E V which is obtained by the user. Is stored.
  • the semiconductor media card 220 is inserted into the device body 210, and the encrypted content data is inserted.
  • DS (ka) and encrypted voice font data V (ka) are taken into the device main body 210 and processed.
  • the semiconductor media card 222 is used to generate a B7C encrypted content container DS (ka ) Are decrypted by the decryption unit 211 to obtain the original book content D and the corresponding intermediate language data S.
  • the encrypted voice font V (ka) read from the semiconductor media force 220 is also decrypted by the decryption unit 211, and the voice voice is also decrypted. De V overnight is obtained.
  • the voice synthesizing unit 212 receives the decrypted book contents D and receives the decrypted book contents D, Interlanguage data Intermediate audio information with common accents, intensions, and rims for SM, and voice phonology
  • the sound synthesis is performed by V so that the sound becomes a colored sound of a certain person, and the speed force 2 13 is further driven.
  • the speaker 2 13
  • the decrypted book content D is supplied to the display drive section 214, and the display drive D is also supplied to the display drive section 214.
  • the moving part 214 drives the liquid crystal display 215 to display the type of the book content data D.
  • the liquid crystal display 215 is configured to display characters synchronized with the synthesized speech in units of a predetermined number of characters or in units of book pages.
  • the type display and the synthesizing of the synthesized sound on the display 2 15 are performed, for example, in page units, and when the reading of the page is completed, the next step is performed. The operation of displaying the page is repeated.
  • the storage area 22 A of the semiconductor media card 220 includes: The encrypted content data DS (ka) generated by encrypting the book content data D of the type and the intermediate language data S is stored.
  • an encrypted voice font V (ka) generated by encrypting the voice font data V is stored.
  • a plurality of slots are provided in the electronic device 200, and the semiconductor media card storing the encrypted content data DS (ka) and the encryption board are provided.
  • the semiconductor media card storing the font V (ka) and the slot may be mounted on the respective slots.
  • FIG. 3 shows an example of the encryption method.
  • the semiconductor media card 220 has a storage area 222 A for storing the encrypted content data DS (ka), and an encrypted voice font data area. Evening storage area for storing V (ka) 2 2 1 B In addition, a read-only area 222 for storing an identification number A (media unique ID: A) is provided.
  • the identification number A is read out from the read-only area 222 of the semiconductor media card 222, and the identification number A is assigned to the key or key. Partial keying is performed to
  • the original book content data D and the intermediate language data S are encrypted (see FIG. 3), the encrypted content data DS (ka) is generated, and the encrypted content data DS (ka) is transferred to a semiconductor media card. It is stored in the storage area 222 A of the node 220 (T 33 in FIG. 3). Similarly to the content data DS, the voice font data V is also stored in the storage area 221B in the same manner as the content data DS. The voice font data is distributed separately from the content data DS, so the voice font data is different from the voice font data V.
  • the encrypted content data DS (ka) stored in the semiconductor media card 220 and the voice font data are stored.
  • a method of reproducing V (ka) in the device main body 210 will be described below with reference to FIG.
  • FIG. 4 is a diagram showing an example of the decoding method.
  • control The section 2 16 reads the identification number A of the semiconductor media card 220 attached to the device main body 210, and reads this identification number A with the key or key.
  • the key is partially integrated to generate the symbol key (ka) (T41 in Fig. 4).
  • the decryption unit 211 reads from the storage area 222 A of the semiconductor media card 220 having the identification number A.
  • the decrypted encrypted content data DS (ka) is decrypted (T42, ⁇ 43 in FIG. 4), and thereby, the original book content is obtained. Extract the data D and the intermediate language data S. In the same manner, the voice font data V is restored and extracted.
  • the encrypted content data DS (ka) in the semiconductor media card having the identification number ⁇ is copied to the semiconductor media card having the identification number C. If so, it is assumed that illegal copying has taken place.
  • the semiconductor content card having the identification number C stores the encrypted content data DS (ka), and the semiconductor content card is stored in the semiconductor media card. Attach the media card to the device main body 210 and attempt to reproduce the encrypted content data DS (ka) in the semiconductor media card.
  • the encrypted content data DS (ka) is not decrypted using the encryption key (kc) in the device main body 210, it is reproduced. I can't do that.
  • the semiconductor media input with identification number C can be decrypted only if the content of the encrypted content is correctly encrypted. Even This is only when DS (kc) is stored.
  • a reproduction electronic device 200 uses a semiconductor media card, which is of a memory card type, as a recording medium for type data. Therefore, not only the recording medium itself must be small and lightweight, but also the device main body 210 is compact because it has no driving parts compared to the magnetic or optical disk system. It is lighter and more lightweight. Therefore, the user can visually follow the type displayed on the liquid crystal display 2 15 while listening to the synthesized voice with earphones or the like. Being able to understand and understand the contents of a book is easier and deeper than listening to the sound alone. In addition, it can be used for portable use only with synthesized voices, and it can be displayed completely like a book.
  • a literary book or other book is read aloud by voice font in the voice of a favorite person of the user. In this way, entertainability is improved.
  • the playback electronic device 200 omits the decryption unit 211 in the device body 210. It will be.
  • the booklet content when dealing with genres called comics, comics, and dramas in a book, the booklet content may be changed.
  • D is not print data but image data.
  • Intermediate language data S is comic / manga- It extracts the typeface written in the drama and adds an audio rule based on it.
  • the memory capacity required for the semiconductor media input device 220 is a black-and-white image capacity compared to the print data size. More than five times as much, but the comics, comics and genres in the books, which are called genres, will also become less powerful.
  • the playback electronic device 200 has been described. However, in the same content day, a semiconductor device storing a voice font is used. Multimedia-ready computer evenings with slots that can access the media force (desktop evenings, notty evenings) And even small PDAs) can perform the same function.
  • L2 purchases digital rights for literary works. Then, the text information of the copyrighted work (book content) is checked. Intermediate language data must be created and licensed to intermediate language manufacturer L3. Intermediate language maker L3 outsources this to external soft maker L4, or stores book content data D and intermediate Create content data DS that integrates language data with the language S.
  • Licenser L1 captures voice data from actors, talents, singers, and other people L5 and creates voice font data. Conclude a contract for the right to digitize. Licensing the voice font into L6.
  • the voice font manufacturer L6 creates a voice font data V by outsourcing in-house or to software manufacturer L4. .
  • the licenser L1 gives the intermediate language maker L3 the license of the intermediate language creation technology, and the intermediate language maker L3 May independently acquire digital rights to the book maker L2 and literary works. Licensing of voice font creation technology is also given to the voice font manufacturer L6, and the voice font manufacturer L6 is also given a license. L6 may independently contract with a specific person L5 to create a voice font.
  • the intermediate language maker L3 and the voice font maker L6 may be the same or different. Then, these manufacturers L3 and L6 serve as communication carriers or pronoiders described below on the Internet. Distribution or mail-order sales. Next, a description will be given of a method of distributing content data and voice information (including mail-order sales) with reference to FIG.
  • the content proso which supplies the content represented by the book, Ida 300, and the same or different Separate intermediate language creators (providers) 302 and the same or separate voice font creators (pronoiders) 310
  • an e-business sales shop or dash is placed on an information network 310, such as an overnight network. Expand the download site.
  • the download site can be expanded to provide a variety of encrypted content data DS (ka). , You will be required to carry out the prescribed purchase procedure from the user, and download and download the access that does not meet the conditions and qualifications. Save the data on a hard disk of a user terminal 320, a semiconductor media card, or the like.
  • the voice font provider 301 has also developed a download site on the information network 310.
  • a variety of encrypted font font data V (ka) is uploaded and downloaded from the user by a predetermined purchase procedure. Then, the data is stored on a hard disk of the user terminal 320, a semiconductor media card, or the like.
  • the pronoiders 301 and 302 have developed an e-shop on the information network 310.
  • Encrypted content data DS (ka) and encrypted voice font data V (ka) are semiconductor media cards, CD-ROM, FD Please prepare as a product stored in the media such as ⁇ .
  • the user makes an application for mail-order sales through the user terminal 320
  • the content or the voice phone with which the application has been made can be made.
  • deliver the recording media through a courier service.
  • the payment of the consideration is made in the same manner as a normal e-shop (internet-net or tele-shopping). Use jet, cash on delivery, postal transfer, etc.
  • copy guides are required.
  • the encrypted data is distributed or stored on a storage medium for sale. Therefore, the user needs to obtain a key to decrypt the encrypted data, but in order to do so, the application user is required to obtain the key.
  • a password is registered for each user, and the password is used for encryption at the time of encryption, and decryption is performed using the password. It is preferable to use a style that can be used.
  • a different encryption key is assigned to each electronic device for use, and a number that identifies that encryption key is used by the user when purchasing content voice fonts. You may let it be sent and use this number like the password described above.
  • the billing system for software distribution of the above content and voice font can be summarized as shown in FIG.
  • the licenser 400 licenses the billing consignment to the communication carrier 401 using the Internet.
  • the same license is applied to a communication carrier 402 that uses a wireless communication network. In this case, if the communication carriers 401 and 402 produce content by themselves or by outsourcing, the licenser 40 0 is unnecessary.
  • the communication carriers 410 and 402 are responsible for the content data and voice font data for the distribution application from the user. At the same time, the settlement method of the payment is also decided, and the payment is made by a payment company such as a credit company 403 or a billing company such as a wireless communication company 4 Accepted from 04. Then, the user 410 pays the payment to the clearing company 403 and the billing company 404.
  • a payment company such as a credit company 403 or a billing company such as a wireless communication company 4 Accepted from 04.
  • the user 410 pays the payment to the clearing company 403 and the billing company 404.
  • communication carriers 401, 40 are required. 2 means that the record media with the application is entrusted to the carrier 405 and delivered. In this case, if cash on delivery, the carrier 405 The payment will be received on behalf of the 410 carriers, and the payment will be settled for the communication carriers 401 and 402.
  • a computer having the functions shown in Fig. 1 or the reproduction electronic device 200 shown in Fig. 2 is used.
  • the reproduction mode is as shown in FIG. Well, new
  • Numeral 40 acquires content data 500 composed of book content and intermediate language data from communication carrier 401 or 402.
  • content data 500 composed of book content and intermediate language data from communication carrier 401 or 402.
  • voice fonts 501A, 501B, and 501C have been acquired (A), (B), and (C). Note that the actual encrypted power is omitted here.
  • the user 410 When playing back content 500, the user 410 must select the voice font (A) 501A and play it back. You will be able to hear the character information of the tent 500 being output in the voice of voice A. Then, if you select the voice font (B) 501 B, you can listen to the content 500 of the same content in the voice of voice B. If you select the voice font (C) 501 C, you will be able to listen in the voice of voice C
  • voice fonts is not limited to reading aloud the above-mentioned literary books and other textual information, but is broad as follows. It can be used for various purposes, and even if it is Braille, it can be used in the welfare field.
  • the message that the time has arrived can be sent to the user. It can be output as a synthesized voice of the voice of a favorite person.
  • a large number of voice font data are registered in a kiosk terminal, and the user is allowed to register himself / herself.
  • Providing a memory key for sharing the key It is also possible to adopt a method of selecting a preferred voice font database for a fee and inserting it into a terminal to download.
  • the storage medium, the distribution method, or the audio output device of the present invention it is possible to change the type of voice font to the preference of the user.
  • the character information can be obtained by recognizing famous actors, such as famous actors, evening entrants, social actors, casas, and announcers. It is possible to output the sound as a sound that resembles the voice characteristic of the speaker, so that the synthesized voice is not a simple voice synthesis but a user's voice. Reflects the taste, and can be added to the element.
  • various voice fonts will be used to distribute information via information networks, such as the Internet and mobile networks.
  • information networks such as the Internet and mobile networks.
  • the voice font itself can be rewritten many times in the same way as character information, depending on the preference at that time. ? 4 3 ⁇ 4 ⁇ u 3 ⁇ 4 mu-. ⁇ ⁇ ⁇ m,-1

Description

明 細
IS憶媒体、 配信方法及 び音 声 出 力 装置 技術分野
本発 明 は 、 記憶媒体 、 配信方法及 び音声 出 力 装 置 に 関 し 、 特 に 、 特定 の 話者 の 音 声 の 音色 に 係 る ボ イ ス フ ォ ン ト を 扱 う 記憶媒体 、 配信方法 及 び音 声 出 力 装置 に 関す る 背 景技術
従来 よ り 、 書籍文化 は紙 に 印刷 さ れ た活字 を 人 が 目 で 読む と い う ス 夕 ィ ルが長 い 間 続 け ら れて き た が 、 近年 、 電子機器 を 利 用 し て こ の 書籍文化 を 模倣す る も の と し て 例 え ば米 国 等で普及 し て い る e - B O O K ( 商 品 名 ) の よ う な 書籍電子機器が登場 し て き て い る 。
こ の書籍電子機器 は 、 単純 に 電子機器 の デ ィ ス プ レ イ 上 に 表 し た 活字 を 読む と い う も の で あ り 、 そ の 活字 は 、 電子機器 の 中 の メ モ リ 領域や外部か ら 供給 さ れ る 記録 媒 体 に 、 活字 の ま ま に テ キ ス ト デー タ と し て 、 あ る い は活 字 ィ メ 一 ジ の 画像 デー タ と し て 格納 さ れて い る 。
ま た 、 人 が朗読 し た 書籍 内 容 を カ セ ッ ト テ ー プや C D の よ う な 記録媒体 に 格納 し た 電子パ ッ ケ ー ジ書籍 を 、 書 籍朗 読す る た め の 電子機器 に か け て 聞 く よ う な 手法 も 、 既 に 実用 化 さ れて い る 。
ま た 、 コ ン ビ ュ — 夕 に 自 然発 声言語 を マ イ ク か ら 入 力 し 、 こ れ を 音声認識 ソ フ 卜 に よ っ て 文字情報 に 変換 し 、 記憶装置 に 記憶 し て い き 、 認識結果 を い わ ゆ る 読上 げ ソ フ 卜 に よ つ て 音声 合成 し 、 再 生 出 力 し て ユ ー ザ に 確認 さ せ る よ う に し た ァ プ リ ケ — シ ョ ン ソ フ ト も 知 ら れて い る そ し て こ の 読 上 げ ソ フ ト は単独で も 利 用 す る こ と がで き コ ン ビ ュ 一 夕 に 記憶 さ れ て い る 文字情報 を 音 声合成 し て 比較的 自 然 な ア ク セ ン ト 、 イ ン ト ネ ー シ ョ ン に し て 音 声 出 力 で き る よ う に な っ て い る 。
し カゝ し な が ら 、 従来技術 に は次 の よ う な 問 題 点が あ つ た 。
( 1 ) デ イ ス プ レ イ 上 に活字 を 表示 さ せ る 書籍電子機 器 を 用 い 、 τ ィ ス プ レ イ 上 で集 中 し て活 字 を 長 時 間読 み 【フ に は 、 現行 の デ ィ ス プ レ イ で は未 だ印 刷 さ れ た 活 字 に 比 し て 、 手軽 さ 、 鮮 明 度 、 目 に 対す る 負 担 の 度合 い 等 の 点で劣 っ て い る た め 、 ユ ー ザ一 に 多 く の 負 担 を 強 い る こ と に な る 。 解像度 を 上 げ る た め に 、 紙 の 上 の 活字 ィ メ ー ジ を 画像デ一 夕 と し て 直接取 り 込む方 法 も 行 わ れて レ る 、 こ の 場合 は 、 デ ィ ス プ レ イ の解像度 の 向 上 も 必 要で あ り 、 か つ メ モ リ 領域 も 多 く 必要 と し 、 紙 の 上 の 書 籍文化 の 手軽 さ か ら 懸 け 離れて く る た め に 現 実 的 で は な レ ^ 、 と い う 問 題 点 が あ つ た 。
( 2 ) 電子パ ッ ケ ー ン 書籍 を 利 用 す る 場合 で は 、 紙 の 上 の活字 を 読 む 書籍文化 と は別 の 文化 、 つ ま り ラ ジ オ ド ラ マ の よ う な 範疇 の も の と 考 え ら れ 、 し た 力 S つ て 、 紙 の 上 の 活字 を 読む書 籍文化 に 置 き 換わ る 、 あ る い は競合す る と レ、 つ た 分野で はな い 。 ま た 、 朗 読 し た書籍 を 記録媒 体 に 格納す る と 、 音楽デー 夕 と 同 様 に デー タ 量 が活字 デ 一 夕 よ り も 桁違 い に 膨大 な も の と な る 。 そ の た め 、 メ モ リ 等 の 記憶媒体 に 記憶可 能 な 時 間 が少 な く な り 、 か つ 人 がー定時 間 内 に 獲得す る 情報量が、 紙 の 上 の活 字 を 読 む 場合 に 比べて格段 に 少 な く な り 、 や は り 紙 の 上 の 書籍文 化 の 手軽 さ か ら 懸 け離れ現 実 的 で は な い 、 と い う 問題 点 があ っ た 。
( 3 ) さ ら に 、 読上 げ ソ フ ト は 、 文字情報 に 対 し て 単 語毎 の ァ ク セ ン ト 、 イ ン ト ネ ー シ ヨ ン 、 さ ら に は一連 の 語群 に 対す る リ ズム 、 イ ン ト ネ 一 シ ョ ン な ど を 特徵づ け る 情報 を 備 え て お り 、 ま た複数種 の 男 性 の 声や 女性 の 声 、 さ ら に は し や べ り 方 の速 さ 、 ピ ッ チ 、 イ ン ト ネ ー シ ョ ン 、 高 さ な ど を あ る 程度調 整す る 機能 を 備 え て い る が 、 な お 、 棒読 み的 で あ り 、 人 の 自 然 な 声 を 聞 い て い る も の と は ほ ど遠 い も の で あ っ た 。 発 明 の 開 示
本発 明 は、 こ の よ う な 従来技術 の 問 題点 を解決す る た め に な さ れた も の で 、 特 に 文字情報 の 種類 に よ ら ず、 ュ — ザ一 の 好 み の 人 の 声 色 に 近づ けた 合成音 声 に し て 再 生 出 力 す る こ と がで き る 音 声合成技術 を も と に し た サー ビ ス を 提 供す る こ と を 目 的 と す る 。
本発 明 は ま た 、 ユ ー ザー の好 み の 人 の ボ イ ス フ ォ ン ト を 選択 し て 入 手可能 に し 、 文字情報 の 音声 出 力 に ェ ン 夕 一テ ィ メ ン ト 性 を 付与 で き る ボ イ ス フ ォ ン 卜 配 信 技術 を 提供す る こ と を 目 的 と す る 。
上記 目 的 を 達成す る た め 、 請求 の 範囲 第 1 項 の 発 明 は 、 記憶媒体 に お い て 、 音 声合成 に よ り 出 力 さ れ る 音 声 に 対 し て 、 特定 の 声色 を 付与す る 要素 に 関す る 情報 に つ い て の み、 記憶 し た こ と を 特徴 と す る 。
請求 の 範 囲 第 2 項 の 発 明 は 、 請求 の範 囲第 1 項 に 記載 の 記憶媒体 に お い て 、 前記情報 は 、 書 き 換 え 可 能 と な つ て い る こ と を 特徴 と す る 。
ま た 、 上 記 目 的 を 達成す る た め 、 請求 の 範 囲 第 3 項 の 発 明 は 、 配信 方法 に お い て 、 音 声合 成 に よ り 出 力 さ れ る 音声 に対 し て 、 特定 の 声 色 を 付与す る 要素 に 関 す る 情報 に つ い て 、 情報 ネ ッ ト ワ ー ク を 通 じ て配信 を 行 な う こ と を 特徴 と す る 。
請求 の 範 囲 第 4 項 の 発 明 は 、 請求 の範 囲 第 3 項 に 記載 の配信方法 に お い て 、 前 記情報 は 、 暗号化 し て 配信 を 行 な う こ と を 特徴 と す る 。
請求 の 範 囲 第 5 項 の 発 明 は 、 請求 の 範 囲第 3 項 に 記載 の配信方法 に お い て 、 前記情報 は、 複数種 の 声色 に 係 る 要素 に 関 す る も の で あ る こ と を 特徴 と す る 。
請求の 範 囲第 6 項 の 発 明 は 、 請求 の範 囲第 3 項 に 記載 の 配信方法 に お い て 、 前記配信 は、 通信 キ ャ リ ア を 通 じ て行な う こ と を 特徴 と す る 。
請求 の 範 囲 第 7 項 の 発 明 は 、 請求 の範 囲 第 3 項 に 記 載 の 配信方 法 に お い て 、 前 記配信 は 、 有料で行な わ れ前記 情報 ネ ッ ト ワ ー ク を 通 じ た ク レ ジ ッ ト カ ー ド に よ る 決済 で料金が支払わ れ る こ と を 特徴 と す る 。
請求 の 範 囲第 8 項 の 発 明 は 、 請求 の 範 囲第 3 項 に 記載 の配 信方法 に お い て 、 前記 音 声 は 、 所定 の 文字 情報 に 基 づ く も の で あ り 、 こ の 文字情報 は文芸書 、 目 覚 ま し メ ッ セ ー ジ 、 手紙 、 ゲー ム 中 の 台詞 、 日 記 、 電子 メ ー ル 、 映 像 中 の 音 声 、 移動体電話又 は据置電話の 応答 メ ッ セ ー ジ 、 点字 の 読取 り 情報 の い ずれか で あ る こ と を 特徴 と す る 。
ま た 、 上記 目 的 を 達成す る た め 、 請求 の 範 囲 第 9 項 の 発 明 は 、 音声 出 力 装置 に お い て 、 所定 の 文字情報 を 記憶 す る 文字情報記憶手段 と 、 前記文字情報 に つ い て 付与 す る 発声速度ゃ リ ズム を 含 む 中 間 言語情報 を 記憶す る 中 間 言語情報記憶手段 と 、 話者 に 発 声 さ せ た と き に こ の 話者 に 係 る 特有 の 声色 に 関 す る 情報 で あ る ボ イ ス フ ォ ン ト を 記憶す る ボ イ ス フ ォ ン ト 記憶手 段 と 、 前記文字情報 記憶 手段 に 記憶 さ れて い る 文字情報 に 対 し て 、 前記 中 間 言語 情報記憶手段 に 記憶 さ れて い る 中 間言語情報 を 適用 し て 中 間 言語 を 形成 し 、 こ の 中 間言語 に対 し て 前記 ボ イ ス フ オ ン ト 記憶手段 に 記憶 さ れて い る ボ イ ス フ ォ ン ト を 適 用 し て特定 の 声色 が付加 さ れ た 音 声 を 合成 し て 出 力 す る 音 声合成手段 と 、 を 備 え る こ と を 特徴 と す る 。
請求 の 範 囲第 1 0 項 の 発 明 は 、 請求 の 範 囲第 9 項 に 記 載 の 音声 出 力 装置 に お い て 、 前記 ボ イ ス フ ォ ン ト 記憶手 段 は 、 複数種 の ボ イ ス フ ォ ン ト を 記憶 し 、 前記 音 声合成 手段 は 、 こ れ ら 複数種 の ボ イ ス フ ォ ン ト の 中 カゝ ら 選択 さ れた ボ イ ス フ ォ ン 卜 を 刖 §c 中 間 言語 に 適用 し て 選択 し た ボ イ ス フ ォ ン 卜 に 対応 し た 声色 を付加 し て 音声 を 合成 し て 出 力 す る こ と を 特徴 と す る 。
請求 の 範 囲 第 1 1 項 の 発 明 は 、 請求 の 範 囲 第 9 項 に 記 載 の 音声 出 力 装 置 に お い て 、 前記音 声合成手段 に よ る 音 声 の 出 力 に 同 期 し て 、 前言 S文字 情報 を 表示す る 表 示手段 を 更 に備 え る こ と を 特徴 と す る 。
こ れ ら の よ う な 記憶媒体 • 配 信方法 · 音 声 出 力 装置 を 用 い る こ と に よ つ て 、 ボ イ ス フ オ ン 卜 の 種類 を ユ ーザー の好 み に 合 っ た も の 、 例 え ば、 有名 な 俳優 、 夕 レ ン ト 、 声優 、 キ ャ ス 夕一、 ァ ナ ウ ン サ 一等 の も の と す る こ と に よ り 、 文字情報 を それ ら 話者 に 特有 の 声色 に 似 せ た音 声 に し て 出 力 す る こ と が可 能 と な り 、 単な る 音声 合 成で は な く 、 合成 さ れ る 音声 に ュ一ザ一 の 好 み を 反 映 さ せェ ン タ ー テ ィ メ ン 卜 性 を 付与 で さ る 。
ま た 、 種 々 の ボ イ ス フ ォ ン ト を 採用 し 、 イ ン タ ー ネ ッ ト ゃ移動体ネ ッ ト ワ ー ク に代表 さ れ る 情報 ネ ッ ト ワ ー ク を 通 じ て配 信 し 、 資格者 に 有料 で配信す る サー ビ ス を 実 現す る こ と がで さ る 。
そ し て 、 ボ イ ス フ オ ン ト そ の も の を 文字情報 と 同 じ よ う に 、 そ の と き の 好 み に 応 じ て 何度 も 書 き 換 え 可 能な ァ プ リ ケ ー シ ョ ン ソ フ ト と し て 商 品化 す る こ と がで き る 。 図 面 の簡単な 説明
図 1 は 、 特定 の 話者カゝ ら ボ イ ス フ ォ ン ト を 抽 出 し 、 そ の ボ イ ス フ ォ ン ト を 、 中 間 言語 が適用 さ れた 原文 に 合 成 し 、 特定 の 話者 の 特徴 を 有す る 音 声 を 生成す る 手順 を 示 す ブ ロ ッ ク 図 で あ る 。
図 2 は 、 本発 明 に お け る 再 生用 電子機器 の ブ ロ ッ ク 図 で あ る 。
図 3 は 、 コ ン テ ン ツ 及 びボ イ ス フ ォ ン ト の 暗号化処 理 の 手順 を 示す ブ ロ ッ ク 図 で あ る 。
図 4 は 、 コ ン テ ン ツ 及 びボ イ ス フ ォ ン ト の 復 号化処 理 の 手順 を 示す ブ ロ ッ ク 図 で あ る 。
図 5 は、 コ ン テ ン ツ 及びボ イ ス フ ォ ン ト の 配信 に お け る ラ イ セ ン ス 関 係 の 一例 を 示す 図 で あ る 。
図 6 は、 本発 明 が適用 さ れ る デー タ 配信 シ ス テ ム の一 例 を 示す 図 で あ る 。
図 7 は 、 コ ン テ ン ツ 及 びボ イ ス フ ォ ン ト の 配信 に お け る 課 金 シ ス テ ム ( 関 係) を 示す ブ ロ ッ ク 図 で あ る 。
図 8 は 、 コ ン テ ン ツ デー タ の 再 生 形 態 の 一例 を 説 明 す る た め の 図 で あ る 。 発 明 を 実施す る た め の 最 良 の 形態
以下 、 本 発 明 の 実施 の 形態 を 図 に 基づい て 詳説す る 。 ま ず 図 1 に 基づ き 、 ボ イ ス フ ォ ン ト と 中 間言語 に つ い て 説 明 す る 。 人 に あ る 文章 を 読 ま せ て 、 そ の 自 然音声 を 解析すれ ば、 話す速度や 、 音 声 が有 意な 言葉 と し て 聞 き 取れ る た め の 要 素 で あ る ほ ぼ万 人 に 一般的 な ア ク セ ン ト や イ ン ト ネ ー シ ョ ン · リ ズム ( 以下 の 説 明 で は 、 標準語 ア ク セ ン ト に つ い て説 明 す る が 、 方言で あ っ て も よ い ) の よ う な規則性 の あ る 言語要 素 ( 厂 中 間 言語情 報 」 と 称 す る ) と 、 特定 の 声色 ( 人 間 、 動物 そ の 他 ) を 特徴づ け る 要素 (特殊音声 パ ラ メ ー タ : で は 「 ボ イ ス フ オ ン ト 」 と 称す る ) と 、 を 抽 出 す る こ と がで き る 。
こ こ で 中 間言語情報 と は 、 表音文字列 を 表現す る も の で 、 具体例 と し て は 、 読 み を 表す 力 夕 カ ナ 表記 、 ァ ク セ ン ト を 表す制御機能 、 イ ン 卜 ネ 一 シ ヨ ン ^ 表す 制御機 能 、 ポ ー ズ を 表す制御 機能 を 導入 し て表音文字 列 を 表現す る も の で あ る 。 そ し て 、 ボ イ ス フ ォ ン 卜 と は 、 同 じ 文章 を 同 じ 中 間言語情 づ い て朗 §冗 し た と し て も 、 —声質 の ノ ラ メ 一 夕 に よ り それが誰 に よ つ て読 ま れて い る の カゝ を 識別 で き る 声色 を 表現す る も の で あ る 。 そ し て こ の ボ イ ス フ オ ン 卜 は 、 例 え ば、 有名 な 俳優 、 夕 レ ン 卜 、 尸 ί愛 、 タ レ ン 卜 、 キ ヤ ス タ ー 、 ァ ナ ウ ンサ 一 等 の 声色 を 有す る よ う に し て お き 、 そ の 音 声 を ュ 一 の 好 み の も の に 選 択 、 変更 で き れ る よ に すれ ば 籍 の 朗 読 で あ っ て も 、 それ 自 体が流通価値 の あ る 商品 と な る 。
そ こ で 、 例 え ば、 有 名 な俳優 、 夕 レ ン ト 、 声優 、 タ レ ン ト 、 キ ャ ス 夕 一 、 ァ ナ ウ ン サ一 等 に個 々 に 特定 の 文章 を 読上 げて も ら つ て 、 そ れ を 音声収録 し て デー タ ベー ス 1 0 に 登録す る 。 そ し て 各 人 の 音声 を解析す る こ と に よ り 、 話す速度や リ ズム の パ ラ メ - ~~ - 々 か ら 上述 し た 中 間 言 語情報 2 0 を 抽 出 し て 記憶 し 、 ま た 声 質 の パ ラ メ 一 夕 を 抽 出 し て 各 人 の ボ イ ス フ ォ ン ト 情報 3 0 を 記憶す る 。 つ ま り 、 あ る 文字情報 、 例 え ば、 文章 ( 原文) 4 0 を 話者 に 読 み上 げ さ せて 出 力 さ せ る 場合 、 次 の よ う に 処 理 す る 。 ま ず文章情報 4 0 に 対 し て 文解析 を 行 い 、 中 間 言 語情報 2 0 を 適用 し て ア ク セ ン ト 、 イ ン ト ネ ー シ ョ ン 、 リ ズム に つ い て文解析 さ れた 文 に 付 け る と 共 に 、 特定話 者 A の ボ イ ス フ ォ ン ト 情報 3 0 を 用 い て 声色 を 付与 し て 音 声合 成 を 行 っ て 合成音 声 5 0 を 生 成 し 、 出 力 す る の で あ る 。 こ れ に よ り 、 最終 的 に 元 の 文章 4 0 を 収 録 話者 の 声色 に 似せ た 合 成音 声 5 0 で読上 げ さ せ る こ と が で き る こ と に な る 。
上記 に お い て 、 文字情報 4 0 と こ れ を 文解析 し て 得 ら れた ア ク セ ン ト 、 イ ン ト ネ ー シ ョ ン 、 リ ズム 等 の 中 間 言 語情報 2 0 と を ひ と く く り に し て 商 品 と し 、 こ れ を 記憶 さ せ た 記録媒体 を 流通 さ せた り 、 あ る い はイ ン タ ー ネ ッ ト を 含 む情報 ネ ッ ト ワ ー ク を 通 じ て 配信 し 、 ユ ー ザー 端 末 の 記憶装置 に ダ ウ ン ロ ー ド さ せて 流通 さ せ る こ と がで き る 。 ま た ボ イ ス フ ォ ン ト 3 0 に つ い て も 、 こ れ を 記憶 さ せ た 記録媒体 を 流通 さ せ た り 、 あ る い はイ ン 夕 一 ネ ッ ト ゃ移動体通信 ネ ッ ト ワ ー ク の よ う な公 開 情報 ネ ッ ト ヮ ー ク を 通 じ て配信 し 、 ユ ー ザ一 端末 の 記憶装置 に ダ ウ ン 口 一 ド さ せ て 流通 さ せ る こ と がで き る 。 こ の 流通方法 に つ い て は 、 後述す る 。
そ し て ユ ー ザー は 、 そ れ ら の 情報 を 、 図 1 に 示 し た 処 理機能 を ア プ リ ケ ー シ ョ ン ソ フ ト と し て 内 蔵 し た コ ン ビ ユ ー 夕 1 0 0 に よ っ て 再 生 し 、 あ る い は一例 と し て 図 2 に 示す よ う な 再生用 電子機器 2 0 0 に よ っ て再 生 し て 楽 し む こ と がで さ る 。 こ の再生 用 電子機器 2 0 0 フ い て説明 す る 。 こ の 再 生用 電子機器 2 0 0 は書 籍朗 ίκ用 の も の で あ り 、 本体 2 1 0 はポ一 夕 ブル な 形状 を な し 、 カ ー ド 型 若 し く はス テ ィ ッ ク 型 の 記録媒体で あ る 半導体 メ デ ィ ア カ ー ド 2 2 0 が着脱 自 在 に 装着 さ れ る よ う に 構成 さ れて い る 。 さ ら に 機器本体 2 1 0 内 の電子 回路部 に は 、 復号部 2 1 1 、 音 声合成処理 · 合成音 出 力 部 2 1 2 、 ス ピ ー 力 ( 又 はィ ャ ホ ン ) 2 1 3 、 デ ィ ス プ レ ィ 駆動部 2 1 4 、 液 晶 デ イ ス プ レ イ 2 1 5 、 及 び制御 部 2 1 6 が設 け ら れて い る。 制 御部 2 1 6 は 、 例 え ばマ ィ ク 口 プ 口 セ ッ サ で構 成 さ れ 、 半導体 メ デ ィ ァ カ ー ド 2 2 0 の格納デー タ を 読 み 出 す 制 御や 上記各要 素 間 の タ イ ≤ ン グ調整等 の機器全体 の 制御 を 司 る 。 ま た 、 図 示 は し な い が 、 制 御 回路 2 1 6 に 対 し て 、 ユ ーザー の 操 作 に 応 じ た 各種 の 指示信 号 を 出 力 す る 操作ボ タ ン 及 びそ の ィ ン フ ェ イ ス 回路 も 設 け ら れ 、 上記 の 各要素 の 駆動 は 内 蔵バ ッ テ リ に よ つ て行 わ れ る 。 こ こ で 、 半導体 メ デ ィ ァ 力一 ド 2 2 0 は 、 不揮発性 の メ モ リ チ ッ プ と 、 こ の メ モ リ チ ッ プ を 支持 —9 る Y#型 カ ー ド 状若 し く は ス テ ィ ッ ク 状 の 基体 と 、 で構 成 さ れ て い る こ の 半導体 メ デ ィ ァ カ ー 2 2 0 の 記憶領域 2 2 1 Α に
、 ―" - は 、 活字デー 夕 で あ る 書籍 コ ノ 丁 ン ッ デ一 夕 D と 中 間 言 語 デー タ S と を 共 に 暗号化 し て 生成 し た 暗号ィヒ コ ン テ ン ッ デー タ D S ( k a ) が格納 さ れて お り 、 記憶領域 2 2 1 B に は、 ユ ー ザー が入 手 し た 好 み の ボ イ ス フ ォ ン ト デ — 夕 V を 暗号化 し て 生成 し た 暗号化 ボ イ ス フ ォ ン ト デー 夕 V ( k a ) が格納 さ れて い る 。 実際 に 、 本電子機器 2 0 0 を 動作 さ せ る た め に は 、 半 導体 メ デ ィ ア カ ー ド 2 2 0 を 機器 体 2 1 0 に 差 し 込 み 暗号化 コ ン テ ン ツ デ一 夕 D S ( k a ) と 暗号化 ボ イ ス フ オ ン 卜 デー タ V ( k a ) と を 機器本体 2 1 0 内 に 取 り 込 ん で処理す る こ と に な る 。 す給声成出ズたンををにンント な わ ち 、 こ の 半導体 メ デ ィ ァ カ 一 ド 2 2 0 力 ら B7C み 出 さ れた 暗号化 コ ン テ ン ッ デ一 夕 D S ( k a ) は復号部 2 1 1 で復号 さ れて 、 元 の 書籍 コ ン テ ン ッ デ一 夕 D と そ れ 対応 し た 中 間言語 デ一 夕 S が得 ら れ る 。 ま た 半導体 メ ァ ィ ァ 力一 ド 2 2 0 か ら 読 み 出 さ れた 暗号化ボ イ ス フ ォ 卜 V ( k a ) も 復号部 2 1 1 で復号 さ れて ボ イ ス フ ォ ト デ一夕 V が得 ら れ る 。 そ し て 音声合 成処理 - . 成 曰 力 部 2 1 2 で は 、 復号 さ れ た 書籍 コ ン テ ン ツ デ一 夕 D 受 け取 つ て 、 こ の デ一 夕 D に対 し て 中 間言語デ一 夕 S M用 し て 一般的 な ァ ク セ ン 卜 、 ィ ン ト ネ 一 シ ョ ン 、 リ ム を 備 え た 中 間 音声情報 と し 、 さ ら に 、 ボ イ ス フ ォ ン V に よ り あ る 人物 の 尸 色 を 付 け た 音 声 と な る よ う に 音 合 成 を 行 い 、 さ ら に ス ピ ー 力 2 1 3 を 駆動す る 。 こ れ よ つ て 、 ス ピ ー カ 2 1 3 カゝ
_―、、
ら は 、 書籍 内容 を 活字化 し 活字 1 夕 D が、 ユ ーザー の 選択 し た 人物 の 声色 の 合 音 声 と し て 出 力 さ れ る 。 一方 、 復号 さ れた 書籍 コ テ ン ッ デ— 夕 D は 、 デ イ ス プ レ イ 駆動部 2 1 4 に も 供 さ れ の デ ィ ス プ レ イ 駆 動部 2 1 4 が液晶 デ ィ ス プ レ イ 2 1 5 を 駆動 し て 、 書籍 コ ン テ ン ツ デー タ D の活字表示 を 行 う 。 具体的 に は 、 液 晶 デ ィ ス プ レ イ 2 1 5 に は 、 合成音声 と 同期 し た活字 を 所定字数単位或 い は書籍 ペー ジ単位 で表示す る よ う に す る 。 ま た 、 デ ィ ス プ レ イ 2 1 5 上 で の活字表示 と 合成音 の 同 期 は 、 例 え ばペ ー ジ単位で行 い 、 そ の ペー ジ の 朗 読 が終わ っ た ら 次 の ペ ー ジ の 表示 を 行 う と い っ た 動作 を 繰 り 返す。
次 に 、 暗号化方 式及 び復号方式 を 説明す る 。 著作権 上 の違法な コ ピ ー を 防止す る コ ピ ー ガ ー ド と し て 、 上述 し た よ う に 半導体 メ デ ィ ア カ ー ド 2 2 0 の 記憶領域 2 2 1 A に は、 活 字 タ イ プの 書籍 コ ン テ ン ツ デー タ D と 中 間 言 語デー タ S を 暗号化 し て 生成 し た 暗号化 コ ン テ ン ッ デー 夕 D S ( k a ) が格納 さ れ 、 た ま 記憶領域 2 2 1 B に は 、 ボ イ ス フ ォ ン ト デー タ V を 暗号化 し て 生成 し た 暗号化 ボ イ ス フ ォ ン ト V ( k a ) が格納 さ れて い る 。 な お 、 電子 機器 2 0 0 に 複数 ス ロ ッ ト を 設 け 、 暗号化 コ ン テ ン ツ デ 一 夕 D S ( k a ) が格納 さ れた 半 導体 メ デ ィ ア カ ー ド と 暗号化ボ イ ス フ ォ ン ト V ( k a ) が格納 さ れた 半導体 メ デ ィ ア カ ー ド と を そ れぞれ の ス ロ ッ 卜 に 装着す る 形式 に し て も よ レ 。
図 3 は 、 暗号化方式 の 一例 を 示 し て い る 。 半 導体 メ デ ィ ァ カ ー ド 2 2 0 は 、 暗号化 コ ン テ ン ツ デ一 夕 D S ( k a ) を 記憶す る 記憶領域 2 2 1 A 、 暗号化 ボ イ ス フ ォ ン 卜 デ一 夕 V ( k a ) を 記憶す る 記憶領域 2 2 1 B の ほ 力、 に 、 識別番号 A ( メ デ ィ ア ユ ニ ー ク I D : A ) を 記憶す る 読み 出 し 専用 領域 2 2 2 を 有 し て い る 。
ま ず 、 半 導体 メ デ ィ ア カ ー ド 2 2 0 の こ の読 み 出 し 専 用 領域 2 2 2 か ら 識別 番号 A を 読 み 出 し 、 識別 番号 A を キー 或 い は キ ー の 一部 と す る キ ー 化 を 行 っ て 喑号 キ ー
( k a ) を 生 成す る ( 図 3 の T 3 1 ) 。 そ し て 、 こ の 喑 号キ ー ( k a ) を 用 い て 、 オ リ ジ ナ リレ の 書籍 コ ン テ ン ツ デー タ D と 中 間言語デ一 夕 S を 暗号化す る こ と で ( 図 3 の T 3 2 ) 、 暗号化 さ れ た コ ン テ ン ツ デー タ D S ( k a ) を 生成 し 、 こ の 暗号化 コ ン テ ン ツ デー タ D S ( k a ) を 半導体 メ デ ィ ア カ ー ド 2 2 0 の 記憶領域 2 2 1 A に格納す る ( 図 3 の T 3 3 ) 。 ボ イ ス フ ォ ン ト デー タ V に つ い て も 、 コ ン テ ン ツ デ一 夕 D S と 同 様 に 喑号ィ匕 し て 記憶領域 2 2 1 B に 格納す る 。 な お 、 ボ イ ス フ ォ ン ト デ — 夕 V は コ ン テ ン ツ デー タ D S と 別個 に 流通 さ せ る の で 、 ボ イ ス フ ォ ン ト デ一 夕 V に つ い て は別 の 識別番号 B を 登 録 し 、 こ の 識別番号 B を キ 一 或 い は キ ー の 一部 と す る キ 一化 を 行 っ て暗号 キ ー ( k b ) を 生 成す る 方が実用 的 で あ る 。 た だ し 、 こ こ で の 説 明 で は 、 同 じ 識別番号 A に よ り 生成 し た 暗号 キ ー ( k a ) を 採用 し た 場 合 を 説 明 す る 。
こ の よ う に し て 半導体 メ デ ィ ア カ ー ド 2 2 0 に 格納 さ れた 暗号化 コ ン テ ン ツ デー タ D S ( k a ) 、 そ し て ボ イ ス フ ォ ン ト デ一 夕 V ( k a ) を 機器本体 2 1 0 で 再 生す る 方法 に つ い て 、 以下 、 図 4 を 用 い て 説明 す る 。
図 4 は 、 復号方式 の 一例 を 示す 図 で あ る 。 ま ず 、 制御 部 2 1 6 は、 機器本体 2 1 0 に 装着 さ れ た 半導体 メ デ ィ ァ カ ー ド 2 2 0 の 識別 番号 A を 読み込 み 、 こ の 識別番号 A を キ ー或 い は キ ー の 一部 と す る キ 一 化 を 行 っ て 喑号 キ 一 ( k a ) を 生 成す る ( 図 4 の T 4 1 ) 。 復号 部 2 1 1 は 、 こ の 暗号 キ ー ( k a ) を 用 い て 、 識別 番号 A を 有 す る 半 導体 メ デ ィ ア カ ー ド 2 2 0 の 記憶領域 2 2 1 A 力、 ら 読み 出 さ れ た 暗号化 コ ン テ ン ツ デー タ D S ( k a ) を 復 号 し ( 図 4 の T 4 2 , Τ 4 3 ) 、 こ れ に よ つ て 、 オ リ ジ ナ ル の 書籍 コ ン テ ン ッ デ一 夕 D と 中 間言語デー タ S を 取 り 出 す。 同 様 に し て ボ イ ス フ ォ ン ト デ一 夕 V も 復 号 し て 取 り 出す。
こ こ で 、 識別番号 Α を 持つ 半導体 メ デ ィ ア カ ー ド 中 の 暗号化 コ ン テ ン ツ デー タ D S ( k a ) が 、 識別 番号 C を 持つ 半導体 メ デ ィ ァ カ ー ド に コ ピ ー さ れ る と レゝ ぅ 違法 コ ピ ー が行わ れ た と す る 。 こ の 場 合 は 、 識別 番号 C を 持 つ 半導体 メ デ ィ ァ カ ー ド に は暗号化 コ ン テ ン ツ デ 一 夕 D S ( k a ) が格納 さ れて お り 、 こ の 半 導体 メ デ ィ ア カ ー ド を 機器本体 2 1 0 に 装着 し て 、 当 該半 導体 メ デ ィ ア カ ー ド 中 の 暗号化 コ ン テ ン ツ デー タ D S ( k a ) を 再 生 し よ う と し て も 、 暗号化 コ ン テ ン ツ デー タ D S ( k a ) は 当 該機器本体 2 1 0 内 で暗号化 キ ー ( k c ) を 用 い て は復 号 さ れな い た め 、 再 生す る こ と がで き な い 。 本機器本体 2 1 0 内 に お い て 、 識別 番号 C を 持 つ 半導体 メ デ ィ ア 力 一 ド が復 号 で き る の は 、 正 し く 暗号化 さ れ た コ ン テ ン ツ デ一 夕 D S ( k c ) が格納 さ れて い る 場合 の み で あ る 。 こ の よ う な 再生用 電子機器 2 0 0 は 、 活字 デー タ の 記 録媒体 と し て メ モ リ カ ー ド タ イ プの も の で あ る 半導体 メ デ ィ ア カ ー ド を 使用 し て い る の で 、 記録媒体 自 体が小 型 軽量で あ る ばか り で な く 、 磁気や光デ ィ ス ク 方式 と 比 べ て駆動部分 な い た め に 、 機器本体 2 1 0 が小型化且 つ 軽量化 さ れ る 。 し た つ て 、 ユーザ一 は 、 イ ヤ ホ ン な ど で音声合成音 を 聞 き な が ら 、 液晶デ イ ス プ レ イ 2 1 5 上 に 表示 さ れた 活字 を 目 で追 い か け る こ と がで き る た め 、 音 の みで 聞 い て書 籍 内 容 を 理解す る よ り も 理解 を 容 易 に し 且つ 深め る こ と が可能 に な る 。 さ ら に 、 合 成音 声 だ け で携帯的 に 使 う こ と ち 、 完全 に 本 の よ う に デ ィ ス プ レ イ
2 1 5 上 の 活 字 だ む よ う に使 う こ と も 可能 に構 成 さ れて お り 、 使 い 方 はそ の 時 の 状況 と ユー ザー の 好み に よ っ て使 い 分 け る こ と がで き る 。
そ し て本実施 の 形態 の 場合 、 文芸書そ の他 の 書籍 を ボ イ ス フ ォ ン 卜 に よ つ て ュ一ザ一 の好 み の 人物 の 声色 に し て朗 読 さ せ る の で 、 ェ ン タ ー テ ィ メ ン ト 性 がー層 向 上 す る 。
な お 、 暗号化 を 不要 と す る ケ ー ス も 考 え ら れ る が、 そ の 場合 の 再 生 用 電子機器 2 0 0 は 、 機器本体 2 1 0 内 の 復号部 2 1 1 を 省 略す る こ と に な る 。
ま た 、 本実施形態 の 変 形例 と し て 、 書籍 の 中 の コ ミ ツ ク · 漫画 · 劇画 と 呼 ばれ る ジ ャ ン ル を 取 り 扱 う 場合 、 書 籍 コ ン テ ン ッ デー 夕 D は 、 活字デー タ で は な く 、 ィ メ 一 ジ デ一 夕 と な り 、 中 間 言語 デー タ S は コ ミ ッ ク · 漫画 - 劇画 の 中 に 書 か れた 活字 デ一 夕 を 取 り 出 し 、 そ れ を 基 に 音声ル一 ル を 付加 し た も の と な る 。
、、、 — ^
ィ メ 一 ン っ 夕 は活字デ一 夕 に 比べて 、 半導体 メ デ ィ ァ 力 一 ド 2 2 0 に 必要 と さ れ る メ モ リ 容量が 白 黒 の ィ メ 一 ン テ 一 夕 と し て も 5 倍以 上 は必要 と な る が、 書籍 の 中 の コ ミ ッ ク · 漫画 , 劇 画 と 呼 ばれ る ジ ャ ン ル も 力 ノ 一 で さ る よ う に な る
な お 、 上記で は再 生用 電子機器 2 0 0 に つ い て 説 明 し た が 、 同 じ コ ン テ ン ッ デー 夕 、 ボ イ ス フ ォ ン ト を 格納 し て い る 半導体 メ デ ィ ア 力 一 ド に ァ ク セ ス 可能 な ス ロ ッ 卜 を 備 え た マ ルチ メ デ ィ ア 対応 の コ ン ピ ュ ー 夕 ( デ ス ク ト ッ プ夕 ィ プ、 ノ ー ト タ イ プ、 さ ら に 小形 の P D A ) に お い て も 同 様 の 機能 を 発揮 さ せ る こ と がで き る
次 上 記 の コ ン ビ ユ ー 夕 や 再生 用 電子機器 2 0 0 に そ の 他 の 文芸書 の コ ン テ ン ッ デー タ D S 、 そ し て ボ ィ ス フ ォ ン 卜 V ¾ 酉己 1§ す る 方法 に つ い て説 明 す る 。
5 は 、 コ ン テ ン ッ デー 夕 D S 、 そ し て ボ イ ス フ ォ ン ト デ一 夕 V の 配信 に お け る ラ イ セ ン ス 関係 の 一例 を 示 し て い る 。 文芸著作物 に は著作権 が絡 み、 ま た 当 該 中 間言
— - 7 及びボ イ ス フ ォ ン h 7 夕 に 関連す る 技術 の 実 施権 の ラ ィ セ ン ス も 絡 ん で く る 。 そ こ で 、 コ ン テ ン ッ テ 一 夕 D S 、 そ し て ボ イ ス フ オ ン 卜 デー タ V の 作成 に 関 連 す る 技術 を 所有す る ラ イ セ ンサ ー L 1 は 、 書籍 メ ー カ ー
L 2 カゝ ら 文芸著作物 の デ ィ ジ 夕 リレ化権 を 買 い 上 げ る 。 そ し て 、 著作物 の 文字情報 (書籍 コ ン テ ン ッ デ一 夕 ) に 対 す る 中 間言語デー タ を 作成す る 必要 が あ り 、 こ れ を 中 間 言語 メ ー カ ー L 3 に ラ イ セ ン ス す る 。 中 間 言語 メ ー カ 一 L 3 は、 こ れ を 外部 の ソ フ ト メ ー カ ー L 4 に 外 注 し 、 或 い は社内 に お い て 書籍 コ ン テ ン ツ デー タ D と 中 間言語デ — 夕 S と を 統合 し た コ ン テ ン ツ デー タ D S を 作成す る 。
同 様 に 、 ラ イ セ ン サ一 L 1 は、 俳優 、 タ レ ン ト 、 歌手 、 そ の 他 の 人物 L 5 か ら 音声 デー タ を 収録 し 、 ボ イ ス フ ォ ン ト デー タ を 作成す る た め の デ ジ タ ル化権 の 契 約 を 結 ぶ。 そ し て ボ イ ス フ ォ ン ト メ 一 力 一 L 6 に ボ イ ス フ ォ ン ト 化 を ラ イ セ ン ス す る 。 ボ イ ス フ ォ ン ト メ ー カ 一 L 6 は 、 自 社 内 で或 い は ソ フ ト メ 一 力 一 L 4 に 外注 し て ボ イ ス フ ォ ン ト デ一 夕 V を 作成す る 。
な お 、 ラ イ セ ン サ一 L 1 は 中 間言語 メ ー カ ー L 3 に 対 し て 中 間言語作成技術 の ラ イ セ ン ス を 与 え 、 中 間言語 メ 一 力 一 L 3 側 で独立 に 書籍 メ ー カ ー L 2 と 文 芸著作物 に 対す る デ ジ タ ル化権 を 取得 さ せ る よ う に し て も よ い 。 ま た ボ イ ス フ ォ ン ト メ ー カ 一 L 6 に対 し て も ボ イ ス フ ォ ン ト 作成技術 の ラ イ セ ン ス を 与 え 、 ボ イ ス フ ォ ン ト メ ー カ 一 L 6 側 で独立 に 特定 の 人物 L 5 と ボ イ ス フ ォ ン ト 作 成 の 契約 を 結 ばせ る よ う に し て も よ い 。
ま た 中 間言語 メ ー カ 一 L 3 と ボ イ ス フ ォ ン ト メ ー カ 一 L 6 は 同 一で あ っ て も 異な っ て い て も よ い 。 そ し て 、 こ れ ら の メ 一 カ ー L 3 , L 6 は以下 で 説 明す る 通 信 キ ヤ リ ァ 又 は プ ロ ノ イ ダ と し て 、 イ ン タ ー ネ ッ ト 上 で の 配信 、 あ る い は通信 販 売 を 行 う 。 次 に 、 図 6 に 基づ い て コ ン テ ン ツ デ一 夕 及 びボ イ ス フ オ ン ト デ一 夕 の 配信 (通信販 売 も 含 む) 方法 に つ い て 説 明 す る 。 図 6 に 示す よ う に 、 書籍 に 代表 さ れ る コ ン テ ン ッ を 供給す る コ ン テ ン ツ プ ロ ゾ、'イ ダ 3 0 0 、 そ し て こ れ と 同 一或 い は別個 の 中 間 言語作成者 ( プ ロ バイ ダ) 3 0 2 、 ま た こ れ と 同 一或 い は別個 の ボ イ ス フ ォ ン ト 作成者 ( プ ロ ノ イ ダ) 3 0 1 は 、 通 信 キ ャ リ ア を 通 じ て 、 イ ン 夕 一 ネ ッ ト の よ う な 情報 ネ ッ ト ワ ー ク 3 1 0 上 に e — ビ ジ ネ ス の 販 売 シ ョ ッ プ又 は ダ ウ ン ロ ー ド サイ ト を 展 開 す る 。
( 1 ) ネ ッ ト ワ ー ク を 通 じ た 配信
コ ン テ ン ツ プ ロ バ イ ダ 3 0 0 で あ れ ば、 ダ ウ ン ロ ー ド サ イ ト を 展 開 し て 、 種 々 の 暗号化 コ ン テ ン ツ デ一 夕 D S ( k a ) を ア ッ プ ロ ー ド し て お き 、 ユ ーザー か ら 所定 の 購入 手続 を 行わ せ 、 条 件 、 資格 に か な っ た ア ク セ ス に 対 し て ダ ウ ン ロ ー ド さ せ 、 ユ ー ザ ー 端 末 3 2 0 の ハ ー ド デ イ ス ク 、 半導体 メ デ ィ ア カ ー ド な ど に 保存 さ せ る 。
同 様 に ボ イ ス フ ォ ン ト プ ロ バ イ ダ 3 0 1 も 同 様 に 、 情 報 ネ ッ ト ワ ー ク 3 1 0 上 に ダ ウ ン ロ ー ド サ イ 卜 を 展 開 し て 、 種 々 の 暗号化 ボ イ ス フ ォ ン ト デ一 夕 V ( k a ) を ァ ッ プ ロ ー ド し て お き 、 ユ ーザー か ら 所定 の 購入手続 に よ り ダ ウ ン ロ ー ド さ せ 、 ユ ー ザー 端末 3 2 0 の ハ ー ド デ ィ ス ク 、 半 導体 メ デ ィ ア カ ー ド な ど に 保存 さ せ る 。
な お 、 こ れ ら の 情報 ネ ッ ト ワ ー ク 3 1 0 を 通 し て の ダ ゥ ン ロ ー ド に よ る 対価 は 、 簡便 の た め に 、 通常 はユー ザ — が登録 し た ク レ ジ ッ ト カ ー ド 会社 か ら の こ の 情報 ネ ッ ト ワ ー ク 3 1 0 を 通 じ た 支払 と す る 。
( 2 ) ネ ッ ト ワ ー ク を 通 じ た 販 売
プ ロ ノ イ ダ 3 0 1 , 3 0 2 は 、 情報 ネ ッ ト ワ ー ク 3 1 0 上 に e — シ ョ ッ プ を 展 開 し て お く 。 そ し て 暗 号化 コ ン テ ン ッ デー タ D S ( k a ) 、 暗号化 ボ イ ス フ ォ ン ト デ一 夕 V ( k a ) は半 導体 メ デ ィ ア カ ー ド 、 C D — R O M 、 F D 等 の記録 メ デ ィ ア に 格納 し た 商 品 と し て 準備 し て お < 。
そ し てユー ザー がユ ー ザー端末 3 2 0 を 通 じ て 通信 販 売 の 申 し 込 み を 行 え ば、 申 し 込 み の あ っ た コ ン テ ン ツ や ボ イ ス フ ォ ン ト の 記録媒体 を 宅配業者 を 通 じ て 配達す る 。 こ の 場合 の 対価 の 支払 は 、 通常 の e — シ ョ ッ プ ( イ ン タ — ネ ッ ト シ ョ ッ ビ ン グや テ レ ビ シ ョ ッ ビ ン グな ど ) と 同 様 、 ク レ ジ ッ ト 、 代 引 払 い 、 郵便振替等 を 利用 す る 。
な お 、 情報 ネ ッ ト ワ ー ク を 通 じ た 電子的 な配 信 、 ま た 記録 メ デ ィ ア を 販 売す る 場合 の い ずれで あ っ て も 、 コ ピ 一 ガ ー ド の た め の 暗号化 し た デー タ を 配信 し 、 あ る い は 記録 媒体 に 格納 し て 販 売す る こ と に な る 。 そ の た め 、 ュ 一ザ一 は喑号化 さ れた デー タ の 復号 の た め の 喑号キ 一 の 取得 が必要で あ る が 、 そ の た め に は 、 申 し 込 み ユ ー ザー 毎 に パ ス ヮ 一 ド を 登録 さ せて お き 、 暗号化 の 際 に そ の パ ス ワ ー ド を 利 用 し て 暗号化 し 、 ま た パ ス ワ ー ド に よ っ て 復号 で き る 様式 に す る の が好 ま し い 。
ま た 再 生用 電子機器 で の 使用 を 前提 と す る 場 合 、 再 生 用 電子機器毎 に 異 な っ た 暗号 キ ー を 割 り 付 け 、 コ ン テ ン ッ ゃ ボ イ ス フ ォ ン ト 購入 の 際 に そ の 暗号キ ー を 識別す る 番号 を ユー ザー か ら 送信 さ せ 、 こ の番号 を 上述 し た パ ス ワ ー ド の よ う に 用 レ る よ う に し て も よ い 。
以上 の コ ン テ ン ツ 及 びボ イ ス フ ォ ン ト の ソ フ ト ウ ェ ア 配信 の課金 シ ス テ ム は 、 図 7 の よ う に ま と め る こ と が で き る 。 ラ イ セ ン サー 4 0 0 は例 え ば 、 イ ン タ ー ネ ッ ト を 利用 す る 通 信 キ ャ リ ア 4 0 1 に 対 し て は課金委 託 の ラ イ セ ン ス を 行 い 、 ま た 無線通信 ネ ッ ト ワ ー ク を 禾 U 用 す る 通 信 キ ャ リ ア 4 0 2 に 対 し て も 同 様 の ラ イ セ ン ス を 行 う 。 な お 、 こ こ で通 信 キ ャ リ ア 4 0 1 , 4 0 2 が 自 ら 若 し く は外注 に て コ ン テ ン ツ を 制作す る 場合 に は 、 ラ イ セ ン サ 一 4 0 0 は不 要 と な る 。
通信 キ ャ リ ア 4 0 1 , 4 0 2 はユ ー ザ一 4 1 0 力、 ら の 配信 申 し 込 み に 対 し て コ ン テ ン ツ デー タ 、 ボ イ ス フ ォ ン ト デー タ を 配 信 し 、 同 時 に 対価 の 決済方 法 を も 取 り 決 め 、 対価 を ク レ ジ ッ ト 会社の よ う な 決済業者 4 0 3 や無線 通 信事業者 の よ う な 課金業者 4 0 4 か ら 受 け る 。 そ し て ュ 一ザ一 4 1 0 は対価 を こ れ ら の 決済業者 4 0 3 、 課金 業 者 4 0 4 に 支払 う 。
上述 し た よ う に 情報 ネ ッ 卜 ワ ー ク を 通 じ て ソ フ ト ウ ェ ァ を 格納 し た 記録 メ デ ィ ア を 販売す る 場 合 、 通信キ ヤ リ ァ 4 0 1 , 4 0 2 は 申 し 込 み の あ っ た 記録 メ デ ィ ア を 運 送業者 4 0 5 に 委託 し て 宅配 さ せ る こ と に な る 。 こ の 場 合 に は 、 代 引 配 送 で あ れ ば、 運送業者 4 0 5 がユーザー 4 1 0 力ゝ ら 代金 を 代理受 領 し 、 通 信 キ ャ リ ア 4 0 1 , 4 0 2 に 対 し て代金精算す る こ と に な る 。
ユー ザー が 自 身 の 好み の コ ン テ ン ツ デー タ 、 そ し て ボ イ ス フ ォ ン 卜 デ一 夕 を 取得すれ ば、 こ れ を 用 い て コ ン テ ン ッ を 再生す る こ と に な る 。 こ の 再 生 に は 、 図 1 で示 し た 機能 を有 す る コ ン ピ ュ ー 夕 あ る い は 図 2 に 示 し た 再 生 用 電子機器 2 0 0 を 利用 す る 。
再生形態 は、 図 8 に 示す よ う な も の で あ る 。 い ま 、 ュ
4 0 は通 信 キ ヤ リ ァ 4 0 1 又 は 4 0 2 か ら 書 籍 コ ン テ ン ツ と 中 間 言語デー 夕 カゝ ら 成 る コ ン テ ン ッ デー タ 5 0 0 を 取得 し 、 ま た ( A ) , ( B ) , ( C ) 3 種類 の ボ イ ス フ ォ ン 卜 5 0 1 A , 5 0 1 B , 5 0 1 C を 取得 し て い る と す る 。 な お 、 実 際 に は暗号化 さ れて い る 力 、 こ こ で は説 明 を 省略す る 。
ユー ザ一 4 1 0 は 、 コ ン テ ン ッ 5 0 0 を 再生 す る 場 合 ボ イ ス フ ォ ン 卜 ( A ) 5 0 1 A を 選択 し て 再 生す る な ら ば、 コ ン テ ン ッ 5 0 0 の 文字情報 が音声 A の 声色 で 出 力 さ れ る の を 聴取で き る こ と に な る 。 そ し て ボ イ ス フ ォ ン 卜 ( B ) 5 0 1 B を 選択すれ ば、 同 じ 内容 の コ ン テ ン ツ 5 0 0 を 音声 B の 声色で聴取す る こ と がで き 、 さ ら に ボ イ ス フ ォ ン 卜 ( C ) 5 0 1 C を 選択すれ ば、 音 声 C の 声 色で聴取で き る こ と に な る
こ の よ う に し て 、 本発 明 の 実施 の 形態 に よ れ ば、 小 説 や 随筆 の よ う な 文 学書 、 漫画 、 劇画 の 類 の 文 芸 書 、 さ ら に 一般 の 文字情報 を 音読 さ せて 聴取 さ せ る 場合 、 同 じ 内 容 の 文字情報 で あ っ て も ボ イ ス フ ォ ン 卜 の 選択 に よ り ュ 一ザ一 の好み の 声色 に し て 聴取 さ せ る こ と が で き る の で あ る 。
な お 、 ボ イ ス フ ォ ン ト の 用 途 は上述 し た 文 芸 書 そ の 他 の 文字情報 を 音読す る 場 合 に 限 ら れ る わ けで は な く 、 次 の よ う に 広 い 用 途 に 利 用 で き 、 点字 で あ っ て も そ の 対 象 と な り 、 福祉分野で も 利 用 で き る 。
( 1 ) 目 覚 ま し 時計 、 ま た P D A そ の 他 の 電子機器 で ア ラ ー ム 機能 を 有 し て い る も の に お い て 、 時 刻 到来 の メ ッ セ ー ジ を ユ ーザー の 好 み の 人物 の 声 色 の 合 成音声 に し て 出 力 さ せ る こ と がで き る 。
( 2 ) 手紙 、 日 記 、 電子 メ ー ル の よ う な文字 情報 を 読 上 げ る ソ フ 卜 に お い て 、 そ の 文字情報 を 好 み の 人物 の 声 色 の 合成音 声 に し て読 上 げ さ せ る こ と がで き る 。
( 3 ) 映像 中 の 音 声 や コ ン ピ ュ ー タ ゲー ム 中 の 台詞 を 好 み の 人物 の 声 色 の 合 成音 声 に し て 出 力 さ せ る こ と がで さ る 。
( 4 ) 移 動体電話又 は据置電話 の 自 動応答 メ ッ セ ー ジ を 、 好 み の 人物 の 声 色 の 合成音 声 に し て 出 力 さ せ る こ と がで き る 。
( 5 ) 点字 情報 を 音 声 出 力 さ せ る 場 合 に も 、 好み の 人 物 の 声色 の 合 成音声 に し て 出 力 さ せ る こ と がで き る 。
さ ら に 、 ボ イ ス フ ォ ン ト の 配信方法 に つ い て は 、 多数 の ボ イ ス フ ォ ン ト デー タ を キ オ ス ク 端 末 に 登録 し て お き , ユ ー ザー が 自 分用 の メ モ リ 力 一 ド を 用 意 し て そ の キ ォ ス ク 端末 に挿入 し て 有償 で 好 み の ボ イ ス フ ォ ン ト デ一 夕 を 選択 し て ダ ウ ン ロ ー ド さ せ る 方法 を 採用 す る こ と も で き る 。
ま た 、 上記 の 実施 の 形態 で は暗号化技術 を 必 須 の も の と し て 説 明 し た が、 ボ イ ス フ ォ ン ト の 暗号化 は 商業的 に 無資格者 の 盗用 を 防止す る た め に 必要 な も の で あ り 、 不 特定 人 に 使用 さ せ る こ と に 支 障がな けれ ば、 暗 号化技術 を 採用 す る 必要 は な い 。 ま た 、 コ ン テ ン ツ の 内 容 に 応 じ て 暗号化技術 を 採用 す る よ う に し て も よ い 。 産業 上 の 利 用 可能性
以 上 の よ う に 本発 明 の 記憶媒体、 配信方法 又 は音声 出 力 装 置 を 用 い る こ と に よ っ て 、 ボ イ ス フ ォ ン ト の 種類 を ユー ザ一 の 好み に 合 つ た も の 、 例 え ば、 有 名 な 俳優 、 夕 レ ン 卜 、 尸 優 、 キ ャ ス 夕 一 、 ア ナ ウ ンサー 等 の も の と す る こ と に よ り 、 文字情報 を そ れ ら 話者 に 特有 の 声 色 に 似 せ た 音尸 に し て 出 力 す る こ と が可能 と な り 、 単 な る 音 声 合成 で はな く 、 合成 さ れ る 音声 に ユ ー ザー の好 み を 反 映 さ せ ェ ン 夕 ー テ ィ メ ン ト 性 を 付与で き る 。
ま た 、 種 々 の ボ イ ス フ ォ ン ト を 採用 し 、 イ ン 夕 一 ネ ッ 卜 や移動体 ネ ッ ト ヮ 一 ク に 代表 さ れ る 情報 ネ ッ ト ワ ー ク を 通 じ て配信 し 、 資格者 に 有料で配信す る サー ビ ス を 実 現す る こ と がで き る 。
そ し て 、 ボ イ ス フ ォ ン ト そ の も の を 文字情報 と 同 じ よ う に 、 そ の と き の 好 み に 応 じ て 何度 も 書 き 換 え 可能 な ァ ? 4 ¾钷 u ¾ム-。 Λ Λ Λ m, - 1
Figure imgf000026_0001

Claims

請 求 の 範 囲
1 . 音声合成 に よ り 出 力 さ れ る 音 声 に 対 し て 、 特定 の 声 色 を 付与す る 要素 に 関 す る 情報 に つ い て の み 、 記憶 し た こ と を 特徴 と す る 記憶媒体 。
2 . 前記情報 は 、 書 き 換 え 可能 と な っ て い る こ と を 特 徴 と す る 請求 の 範 囲 第 1 項 に 記載 の 記憶媒体。
3 . 音 声合 成 に よ り 出 力 さ れ る 音 声 に 対 し て 、 特定 の 声色 を 付与す る 要 素 に 関 す る 情報 に つ い て 、 情報 ネ ッ ト ワ ー ク ( 3 1 0 ) を 通 じ て配信 を 行 な う こ と を 特徴 と す る 配信方法 。
4 . 前記情報 は 、 複数種 の 声 色 に 係 る 要素 に 関 す る も の で あ る こ と を 特徴 と す る 請求 の 範 囲第 3 項 に 記載 の 配 信方法。
5 . 前記情報 は、 暗号化 し て配信 を 行な う こ と を 特徴 と す る 請求 の 範 囲第 3 項 に 記載 の配信方法。
6 . 前記配信 は 、 通 信 キ ャ リ ア ( 4 0 1 , 4 0 2 ) を 通 じ て 行 な う こ と を 特徴 と す る 請求 の 範 囲第 3 項 に 記載 の 配信方法。
7 . 前記配信 は 、 有料 で行 な わ れ 、 前記情報 ネ ッ ト ヮ ー ク ( 3 1 0 ) を 通 じ た ク レ ジ ッ ト カ ー ド に よ る 決 済 で 料金 が支払 わ れ る こ と を 特徴 と す る 請求 の 範 囲 第 3 項 に 記載 の配信方法 。
8 . 前記音声 は 、 所定 の 文字情報 に基 づ く も の で あ り こ の 文字情報 は文芸書 、 目 覚 ま し メ ッ セ 一 ジ 、 手紙 、 ゲ — ム 中 の 台詞、 日 記 、 電子 メ ー ル 、 映像 中 の 音 声 、 移 動 体電話又 は据置電 話 の応答 メ ッ セ ー ジ 、 点字 の 読取 り 情 報 の い ずれか で あ る こ と を 特徴 と す る 請求 の 範 囲第 3 項 に 記載 の配信方法 。
9 . 所定 の 文字 情報 を 記憶す る 文字情報記憶 手段 ( 2 2 1 A ) と 、
前記文字情報 に つ い て 付与す る 発 声速度や リ ズム を 含 む 中 間言語情報 を 記憶す る 中 間言語情報記憶手段 ( 2 2 1 A ) と 、
話者 に 発 声 さ せ た と き に こ の 話者 に 係 る 特有 の 声色 に 関 す る 情報 で あ る ボ イ ス フ ォ ン ト を 記憶す る ボ イ ス フ ォ ン ト 記憶手段 ( 2 2 1 B ) と 、
前記文字情報記憶手段 に 記憶 さ れて い る 文字情報 に 対 し て 、 前記 中 間言語情報記憶手段 に 記憶 さ れて い る 中 間 言語情報 を 適用 し て 中 間言語 を 形 成 し 、 こ の 中 間言語 に 対 し て 前記 ボ イ ス フ ォ ン ト 記憶手段 に 記憶 さ れて い る ボ イ ス フ ォ ン ト を 適用 し て 特定 の 声 色 が付加 さ れ た 音 声 を 合成 し て 出 力 す る 音 声 合 成手段 ( 2 1 2 ) と 、
を 備 え る こ と を 特徴 と す る 音声 出 力 装置 。
1 0 . 前記 ボ イ ス フ ォ ン ト 記憶手段 ( 2 2 1 B ) は 、 複数種 の ボ イ ス フ ォ ン ト を 記憶 し 、 前記音 声 合 成手段
( 2 1 2 ) は 、 こ れ ら 複数種 の ボ イ ス フ ォ ン ト の 中 力 ら 選択 さ れた ボ イ ス フ ォ ン ト を 前記 中 間言語 に 適 用 し て 選 択 し た ボ イ ス フ ォ ン 卜 に 対応 し た 声 色 を 付加 し て 音 声 を 合成 し て 出 力 す る こ と を 特徴 と す る 請求 の 範 囲 第 9 項 に 記載 の 音声 出 力 装置。
1 1 . 前記音 声合 成手 段 ( 2 1 2 ) に よ る 音 声 の 出 力 に 同 期 し て 、 前記文字情報 を 表示す る 表示手段 ( 2 1 4 2 1 5 ) を 更 に 備 え る こ と を 特徴 と す る 請求 の 範 囲 第 9 項 に 記載 の 音 声 出 力 装置 。
PCT/JP2000/006546 2000-03-28 2000-09-25 Moyen de stockage, procede de distribution et dispositif de sortie vocale WO2001073752A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000-89862 2000-03-28
JP2000089862A JP2001282281A (ja) 2000-03-28 2000-03-28 記憶媒体、配信方法及び音声出力装置

Publications (1)

Publication Number Publication Date
WO2001073752A1 true WO2001073752A1 (fr) 2001-10-04

Family

ID=18605559

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/006546 WO2001073752A1 (fr) 2000-03-28 2000-09-25 Moyen de stockage, procede de distribution et dispositif de sortie vocale

Country Status (2)

Country Link
JP (1) JP2001282281A (ja)
WO (1) WO2001073752A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058180A (ja) * 2001-06-08 2003-02-28 Matsushita Electric Ind Co Ltd 合成音販売システムおよび音素の著作権認定システム
JP2003122387A (ja) * 2001-10-11 2003-04-25 Matsushita Electric Ind Co Ltd 読み上げシステム
JP2003140672A (ja) * 2001-11-06 2003-05-16 Matsushita Electric Ind Co Ltd 音素ビジネスシステム
JP2003140677A (ja) * 2001-11-06 2003-05-16 Matsushita Electric Ind Co Ltd 読み上げシステム
US7299182B2 (en) * 2002-05-09 2007-11-20 Thomson Licensing Text-to-speech (TTS) for hand-held devices
JP2020076885A (ja) * 2018-11-08 2020-05-21 東京瓦斯株式会社 音声出力システムおよびプログラム
JP6948044B1 (ja) * 2020-10-05 2021-10-13 合同会社オフィス香川 管理サーバおよび電子書籍提供方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08288940A (ja) * 1994-12-13 1996-11-01 Mitsubishi Corp 暗号鍵システム
JPH0950286A (ja) * 1995-05-29 1997-02-18 Sanyo Electric Co Ltd 音声合成装置及びこれに使用する記録媒体
JPH10222187A (ja) * 1996-12-04 1998-08-21 Just Syst Corp 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
JPH10304088A (ja) * 1997-05-01 1998-11-13 Nippon Telegr & Teleph Corp <Ntt> 端末装置
JPH1138996A (ja) * 1997-07-10 1999-02-12 Internatl Business Mach Corp <Ibm> 音声メールシステム、音声合成装置およびこれらの方法
JPH11143483A (ja) * 1997-08-15 1999-05-28 Hiroshi Kurita 音声発生システム
JPH11175308A (ja) * 1997-12-15 1999-07-02 Nec Software Kobe Ltd 文書読み上げ音声の声色指定方法
JPH11282772A (ja) * 1998-03-27 1999-10-15 Sony Corp 情報配信システム、情報送信装置、情報受信装置
JPH11308270A (ja) * 1998-04-22 1999-11-05 Olympus Optical Co Ltd 通信システム及びそれに用いられる端末装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08288940A (ja) * 1994-12-13 1996-11-01 Mitsubishi Corp 暗号鍵システム
JPH0950286A (ja) * 1995-05-29 1997-02-18 Sanyo Electric Co Ltd 音声合成装置及びこれに使用する記録媒体
JPH10222187A (ja) * 1996-12-04 1998-08-21 Just Syst Corp 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
JPH10304088A (ja) * 1997-05-01 1998-11-13 Nippon Telegr & Teleph Corp <Ntt> 端末装置
JPH1138996A (ja) * 1997-07-10 1999-02-12 Internatl Business Mach Corp <Ibm> 音声メールシステム、音声合成装置およびこれらの方法
JPH11143483A (ja) * 1997-08-15 1999-05-28 Hiroshi Kurita 音声発生システム
JPH11175308A (ja) * 1997-12-15 1999-07-02 Nec Software Kobe Ltd 文書読み上げ音声の声色指定方法
JPH11282772A (ja) * 1998-03-27 1999-10-15 Sony Corp 情報配信システム、情報送信装置、情報受信装置
JPH11308270A (ja) * 1998-04-22 1999-11-05 Olympus Optical Co Ltd 通信システム及びそれに用いられる端末装置

Also Published As

Publication number Publication date
JP2001282281A (ja) 2001-10-12

Similar Documents

Publication Publication Date Title
US8583418B2 (en) Systems and methods of detecting language and natural language strings for text to speech synthesis
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
US20090254826A1 (en) Portable Communications Device
US20100082327A1 (en) Systems and methods for mapping phonemes for text to speech synthesis
US20100082346A1 (en) Systems and methods for text to speech synthesis
US20100082344A1 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US20100082328A1 (en) Systems and methods for speech preprocessing in text to speech synthesis
US20100082348A1 (en) Systems and methods for text normalization for text to speech synthesis
US20080119953A1 (en) Device and System for Utilizing an Information Unit to Present Content and Metadata on a Device
TW200813979A (en) E-mail administration for rendering email on a digital audio player
US20140019137A1 (en) Method, system and server for speech synthesis
JP2003140672A (ja) 音素ビジネスシステム
JP2003114692A (ja) 音源データの提供システム、端末、玩具、提供方法、プログラム、および媒体
WO2001073752A1 (fr) Moyen de stockage, procede de distribution et dispositif de sortie vocale
WO2021111872A1 (ja) コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
EP2113907A1 (en) Music reproducing device and music reproducing method
JP2003122554A (ja) 電子書籍データ配信装置、電子書籍装置およびプログラム
JP5693834B2 (ja) 音声認識装置及び音声認識方法
US20030009340A1 (en) Synthetic voice sales system and phoneme copyright authentication system
US20230353843A1 (en) Information processing system, information processing method, and storage medium
KR100422110B1 (ko) 휴대용 멀티미디어 학습장치 및 방법
JP4840476B2 (ja) 音声データ作成装置および音声データ作成方法
JP4244661B2 (ja) 音声データ提供システムならびに音声データ作成装置および音声データ作成プログラム
JP2020204683A (ja) 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム
JP4356334B2 (ja) 音声データ提供システムならびに音声データ作成装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN KR SG US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase