WO2013061718A1 - Apparatus for providing text data with synthesized voice information and method for providing text data - Google Patents

Apparatus for providing text data with synthesized voice information and method for providing text data Download PDF

Info

Publication number
WO2013061718A1
WO2013061718A1 PCT/JP2012/074370 JP2012074370W WO2013061718A1 WO 2013061718 A1 WO2013061718 A1 WO 2013061718A1 JP 2012074370 W JP2012074370 W JP 2012074370W WO 2013061718 A1 WO2013061718 A1 WO 2013061718A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
text data
sentence
data
phonetic symbol
Prior art date
Application number
PCT/JP2012/074370
Other languages
French (fr)
Japanese (ja)
Inventor
五十嵐 信夫
佳史 亀島
田中 公司
Original Assignee
日立公共システムエンジニアリング株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日立公共システムエンジニアリング株式会社 filed Critical 日立公共システムエンジニアリング株式会社
Priority to CN201280044941.4A priority Critical patent/CN103827961A/en
Publication of WO2013061718A1 publication Critical patent/WO2013061718A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

[Problem] To provide an apparatus which optionally enables an operation for reading aloud arbitrary text of a user's choosing and provides text segments which can be read by speech synthesis in a manner convenient to the user by an operation matching the intention of the user. [Solution] Text data selected from a database which stores a plurality of pieces of text data is loaded in response to an instruction signal from a user terminal, and the text segments constituting the text data are determined. A phonetic symbol sequence is generated by a phonetic symbol sequence generation program per text segment, and a generated phonetic symbol sequence is added to each text segment. The text data having the phonetic symbol sequences added to the text segments thereof is transmitted from a transmission means to a user terminal together with a text-to-speech program.

Description

音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法Text data providing apparatus with speech synthesis information and text data providing method
 本発明は、音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法に関する。 The present invention relates to a text data providing apparatus with speech synthesis information and a text data providing method.
 インターネットのホームページを含めたある種のテキストデータは、HTML(Hyper Text Markup Language)で記述される。 Certain types of text data including Internet homepages are described in HTML (Hyper Text Markup Language).
 テキストデータなどの文字データを音声データに変換する音声合成システムが存在する。 There are speech synthesis systems that convert text data and other text data into speech data.
 特許文献1には、テキストデータを音声合成する音声合成装置が記載されている。 Patent Document 1 describes a speech synthesizer for speech synthesis of text data.
 特許文献2には、ホームページの文書を新規作成するか、または既存の文書を読み込んでホームページの文書とすることが記載され、文書の読み上げ範囲を指定して、読み上げ範囲タグを挿入し、読み上げ識別子により識別される読み上げ検出テキストプログラムに、音声読み上げ範囲を渡すことが記載されている。 Patent Document 2 describes that a homepage document is newly created or an existing document is read to be a homepage document, a reading range tag is specified, a reading range tag is inserted, and a reading identifier is specified. It is described that the speech reading range is passed to the reading detection text program identified by the above.
 特許文献3には、取得したコンテンツの中で読み上げ箇所を特定し、特定した読み上げ箇所部分を音声データで読み上げて、ユーザに音声データで応答することが記載されている。 Patent Document 3 describes that a read-out part is specified in acquired content, the specified read-out part is read out with sound data, and the user is responded with sound data.
特開2003-140673号公報JP 2003-140673 A 特開2001-109612号公報JP 2001-109612 A 特開2003-99079号公報JP 2003-99079 A
 従来、Webサーバで、あるいはその他のサーバで選択されたテキストデータ、例えばホームページテキストデータについて音声合成プログラムを用いて音声データを生成し、テキストデータと共に利用者端末に送信し、利用者はその端末でテキストデータを閲覧する時に、音声読み上げ操作を行っていた。従来例にあっては、音声データを読み上げるツールは、利用者端末に内蔵されている。 Conventionally, voice data is generated by using a voice synthesis program for text data selected by a Web server or other server, for example, homepage text data, and transmitted to a user terminal together with the text data. When reading text data, a voice-to-speech operation was performed. In the conventional example, a tool for reading out voice data is built in the user terminal.
 しかし、このようなツールを利用者端末にインストールするには、管理者権限が必要とされ、インストールという行為自体が面倒なために利用者に敬遠されて来た。 However, in order to install such a tool on a user terminal, administrator authority is required, and the act of installation itself is troublesome and has been avoided by users.
 特許文献2には、音声読み上げ範囲に、読み上げ範囲指定タグを挿入し、読み上げテキスト検出プログラムを識別するための読み上げテキスト識別子を読み上げ範囲指定タグの属性として指定することを行っているが、この例にあっても音声読み上げに当っては、音声読み上げのためのツールを利用者端末にインストールすることを要するものとなっている。 In Patent Document 2, a reading range designation tag is inserted into a voice reading range, and a reading text identifier for identifying a reading text detection program is designated as an attribute of the reading range designation tag. However, when reading aloud, it is necessary to install a tool for reading aloud into the user terminal.
 利用者には、テキストデータの任意の位置にある文章を読み上げたいとする希望がある。このため、利用者の意向に沿った操作が求められる。読み上げのためのツールを利用者端末にインストールすることは面倒なために利用者に敬遠されるばかりでなく、従来例のようにサーバ側で一括して音声データに変換しているため、利用者が求める任意の位置、すなわち任意の文章について任意に読み上げを操作できず、読み上げはサーバ側で一括して変換した音声データ全体について読み上げがなされていて、利用者に意向に沿った操作がなされないでいる。また、既存の利用者端末で音声合成のためのツールがインストールされている場合にあっても、インストールされたツールを使用しなくても利用者の意向に沿った操作が求められる。 The user wants to read a sentence at an arbitrary position in the text data. For this reason, the operation | movement along a user's intention is calculated | required. It is troublesome to install a reading tool on the user terminal, so it is not avoided by the user, but it is converted into voice data at the server side as in the conventional example. Can not be arbitrarily read out for any position that is required, that is, any text is read out, the entire voice data that has been converted collectively on the server side is read out, and the operation according to the intention is not made to the user It is out. Further, even when a tool for speech synthesis is installed in an existing user terminal, an operation in accordance with the user's intention is required without using the installed tool.
 本発明は、かかる点に鑑みて利用者が求める任意の文章について任意に読み上げる操作を可能にして、利用者の意向に沿った操作によって利用者に便利なようにして音声読み上げができるようにすることを目的とする。 In view of the above, the present invention enables an operation to arbitrarily read out an arbitrary sentence requested by the user, and enables the user to read out the voice in a manner convenient for the user by an operation in accordance with the user's intention. For the purpose.
 本発明は、Webページに記述されたテキストデータを音声合成情報に変換する音声合成情報変換手段を備えて、ネットワークを介してテキストデータと共に音声合成情報を利用者端末に提供する音声合成情報付きのテキストデータ提供装置において、
 発音記号列生成プログラム及び発音記号列を音声データに変換合成する音声変換合成プログラムを格納するデータベースと、
 利用者端末からの指示信号に基づいて複数のテキストデータを格納するデータベースから選択されたテキストデータを読み込み、前記発音記号列生成プログラムによって、テキストデータの文章テキスト毎に読む順序と読み方とからなる発音記号列を生成し、各文章テキストに生成した文章毎発音記号列を添付する文章毎発音記号列付きテキストデータ生成手段と、
 文章毎発音記号列付きテキストデータ及び音声合成変換プログラムをネットワークを介して利用者端末に送信する送信手段と
 を有することを特徴とする音声合成情報付きのテキストデータ提供装置を提供する。
The present invention includes speech synthesis information converting means for converting text data described on a Web page into speech synthesis information, and provides speech synthesis information together with text data to a user terminal via a network. In the text data providing device,
A database for storing a phonetic symbol generation program and a voice conversion synthesis program for converting and synthesizing a phonetic symbol sequence into speech data;
Reads the selected text data from a database storing a plurality of text data based on an instruction signal from the user terminal, and generates a pronunciation consisting of the reading order and how to read each sentence text of the text data by the phonetic symbol string generation program Text data generating means with a sentence-by-sentence symbol string that generates a symbol string and attaches the sentence-by-sentence pronunciation string to each sentence text;
There is provided a text data providing apparatus with speech synthesis information, characterized by comprising: transmission means for transmitting text data with a phonetic symbol string for each sentence and a speech synthesis conversion program to a user terminal via a network.
 本発明は、また、上述した音声変換合成プログラムは、音声データを読み上げたい箇所としてテキストデータのいずれかの文章テキストが指示されると、当該文章テキストに添付された発音記号列を音声データに変換するプログラムであることを特徴とする音声合成情報付きのテキストデータ提供装置を提供する。 According to the present invention, the above-described speech conversion synthesis program converts the phonetic symbol string attached to the text text into the speech data when any text text of the text data is designated as a location where the speech data is to be read out. A text data providing apparatus with speech synthesis information is provided.
 本発明は、また、上述した発音記号列生成プログラムは、各文章テキストについて分割記号単位で文章テキストを区切って読む順序を読み方とからなる発音記号列を生成することを特徴とする音声合成情報付きのテキストデータ提供装置を提供する。 According to the present invention, the above-described phonetic symbol string generation program generates a phonetic symbol string including a reading order by dividing a sentence text into divided symbol units for each sentence text. A text data providing apparatus is provided.
 本発明は、Webページに記述されたテキストデータを音声合成情報に変換する音声合成情報変換手段を備えて、ネットワークを介してテキストデータと共に音声合成情報を利用者端末に提供する音声合成情報付きのホームページテキストデータ提供装置による音声合成情報付きのテキストデータ提供方法において、
 データベースに、発音記号列生成プログラム及び発音記号列を音声データに変換合成する音声変換合成プログラムを格納し、
 文章毎発音記号列テキストデータ生成手段が、利用者端末からの指示信号に基づいて複数のテキストデータを格納するデータベースから選択されたテキストデータを読み込み、前記発音記号列生成プログラムによって、文章テキスト毎に発音記号列を生成し、各文章テキストに生成した文章毎発音記号列を添付し、
 送信手段が、各文章テキストに文章毎発音記号列を添付したテキストデータ及び音声合成変換プログラムをネットワークを介して利用者端末に送信すること
 を有することを特徴とする音声合成情報付きのテキストデータ提供方法を提供する。
The present invention includes speech synthesis information converting means for converting text data described on a Web page into speech synthesis information, and provides speech synthesis information to a user terminal together with text data via a network. In the text data providing method with speech synthesis information by the homepage text data providing device,
In the database, a phonetic symbol string generation program and a voice conversion synthesis program for converting and synthesizing a phonetic symbol string into speech data are stored.
A sentence-by-sentence phonetic symbol text data generation unit reads text data selected from a database that stores a plurality of text data based on an instruction signal from a user terminal, and the phonetic symbol string generation program reads the text data for each sentence. Generate a phonetic symbol string, attach the generated phonetic symbol string to each sentence text,
Providing text data with speech synthesis information, characterized in that the transmission means includes transmitting text data in which each sentence text is attached with a phonetic symbol string for each sentence and a speech synthesis conversion program to the user terminal via the network. Provide a method.
 本発明は、また、上述した音声変換合成プログラムが、音声データを読み上げたい箇所としてテキストデータ内のいずれかの文章テキストが指示されると、当該文章テキストに添付された発音記号列を音声データに変換するプログラムであることを特徴とする音声合成情報付きのテキストデータ提供方法を提供する。 In the present invention, when any of the text texts in the text data is designated as a location where the voice data is to be read out, the above-described voice conversion synthesis program converts the phonetic symbol string attached to the text text into the voice data. Provided is a method for providing text data with speech synthesis information, which is a program for conversion.
 本発明は、また、上述した発音記号列生成プログラムは、各文章テキストについて分割記号単位で文章テキストを区切って読む順序を読み方とからなる発音記号列を生成することを特徴とする音声合成情報付きのテキストデータ提供方法を提供する。 According to the present invention, the above-described phonetic symbol string generation program generates a phonetic symbol string including a reading order by dividing a sentence text into divided symbol units for each sentence text. A method for providing text data is provided.
 本発明がホームページテキストデータに適用されるとき、上述のテキストデータをホームページテキストデータと読み替えるものとする。 When the present invention is applied to homepage text data, the above text data shall be read as homepage text data.
 本発明は、上述のように発音記号列生成プログラム及び音声変換合成プログラムを用いて、テキストデータ、例えばホームページテキストデータの文章テキスト毎に発音記号列を生成し、特定された文章テキストの文章毎発音記号列を、音声データに変換して、利用者端末で利用し易いようにしているので、従来のように音声データにするツールを利用者端末にインストールすることを要しない。しかも文章テキスト毎に文章毎発音記号列と音声データに変換する音声変換合成プログラムを利用者端末に送信するので、利用者は、任意の文章テキストについて任意に指示して読み上げする操作が可能となり、利用者の意向に沿ったテキストデータ、例えばホームページが提供されることになる。 As described above, the present invention generates a phonetic symbol string for each sentence text of text data, for example, homepage text data, using the phonetic symbol string generation program and the speech conversion synthesis program, and pronounces each sentence of the specified sentence text. Since the symbol string is converted into voice data so that it can be easily used on the user terminal, it is not necessary to install a tool for converting voice data into the user terminal as in the prior art. Moreover, since a voice conversion synthesis program for converting each sentence text into a phonetic symbol string and voice data for each sentence is transmitted to the user terminal, the user can arbitrarily instruct and read out any sentence text, Text data according to the user's intention, such as a home page, will be provided.
本発明の実施例を説明するブロック図。The block diagram explaining the Example of this invention. 音声合成情報付きのホームページテキストデータ提供装置の構成をブロックで示す図。The figure which shows the structure of the homepage text data provision apparatus with speech synthesis information with a block. ホームページテキストの画面を示す図。The figure which shows the screen of a homepage text. HTML形式の文章テキストの状態遷移を示すイメージ図。The image figure which shows the state transition of the text text of an HTML format. 図4に示すイメージをより具体的にして示す図。The figure which shows the image shown in FIG. 4 more concretely.
 以下、本発明の実施例を図面に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
 図1は、本発明の実施例を説明するブロック図である。
 図1において、本発明の実施例の音声合成情報付きのホームページテキストデータ提供装置100は、サーバ1(サーバシステムという場合がある。)を含んで構成され、サーバ1にはWebサーバ2及び利用者端末がネットワーク4,5を介して接続されている。
本実施例は、ホームページを含む各種のコンテンツについてのテキストデータ提供に適用可能であるが、典型的な例としてのホームページについて説明する。
サーバ1とWebサーバ2とは一体のものとして構成されてもよいが、ここでは別体構成のものとして説明する。
FIG. 1 is a block diagram illustrating an embodiment of the present invention.
In FIG. 1, a homepage text data providing apparatus 100 with speech synthesis information according to an embodiment of the present invention includes a server 1 (sometimes referred to as a server system). The server 1 includes a Web server 2 and a user. Terminals are connected via networks 4 and 5.
The present embodiment is applicable to providing text data for various contents including a home page, but a home page as a typical example will be described.
Although the server 1 and the Web server 2 may be configured as an integral unit, they will be described as separate components here.
 サーバ1は、後述するようにそのデータベースに発音記号列生成プログラム11及び音声変換合成プログラム12をデータベースに格納する。 The server 1 stores a phonetic symbol string generation program 11 and a speech conversion synthesis program 12 in the database as will be described later.
 スクロールコントロールは、利用者端末のウィンドウ画面にコントロールパネル形体で表示され、コントロール形体を構成する制御項目をクリック(すなわちタッチ)することで画面制御を行うツールである。 Scroll control is a tool that is displayed in the form of a control panel on the window screen of the user terminal, and controls the screen by clicking (ie, touching) the control items constituting the control form.
 このような構成において、利用者は、利用者端末3からHTML文書形式のホームページの取得要求をネットワーク5を介してホームページテキストデータ提供装置100に行う。ホームページテキストデータ提供装置100は、ネットワーク4を介してWebサーバ2に取得要求する。Webサーバ2は、多数のホームページをデータベースに格納している。 In such a configuration, the user sends a homepage acquisition request in HTML document format from the user terminal 3 to the homepage text data providing apparatus 100 via the network 5. The homepage text data providing apparatus 100 makes an acquisition request to the Web server 2 via the network 4. The Web server 2 stores a large number of home pages in a database.
 Webサーバ2は、取得要求された指示に基づいて該当のホームページを選択する。ホームページは、各種のホームページテキスト情報を含む。以下、このホームページテキスト情報をホームページテキストデータと称する。テキスト情報についてはテキストデータと称する。ホームページテキストデータは、複数の文章のテキストから(HTML文書)から構成される。ホームページテキストデータはブロック単位で形成されるのは普通であり、従って、ホームページテキストデータはブロック単位で抽出されうる。 The Web server 2 selects a corresponding home page based on the instruction requested to be acquired. The home page includes various home page text information. Hereinafter, this homepage text information is referred to as homepage text data. The text information is referred to as text data. The homepage text data is composed of a plurality of texts (HTML documents). The home page text data is usually formed in units of blocks, and therefore the home page text data can be extracted in units of blocks.
 Webサーバ2は、選択されたホームページテキストデータをネットワーク4を介してホームページテキストデータ提供装置100に送信する。これらのデータはサーバ1に格納される。 The Web server 2 transmits the selected homepage text data to the homepage text data providing apparatus 100 via the network 4. These data are stored in the server 1.
 ホームページテキストデータ提供装置100は、サーバ1に格納されてデータに基づいて、送信されたホームページテキストのHTML文書を解析、音声データの元データとなる発音記号列(言語解析データ)を作成する。 The homepage text data providing apparatus 100 analyzes the HTML document of the sent homepage text based on the data stored in the server 1 and creates a phonetic symbol string (language analysis data) that is the original data of the voice data.
 ホームページテキストデータ提供装置100は、発音記号列付きのホームページテキストデータの文章テキスト及び音声変換合成プログラムをネットワーク5を介して利用者端末3に送信する。 The homepage text data providing apparatus 100 transmits the text text of the homepage text data with a phonetic symbol string and the voice conversion synthesis program to the user terminal 3 via the network 5.
 利用者端末3は、送信された発音記号列を音声変換合成プログラムによって音声データとして、ホームページテキストデータの各文章テキストについての読み上げを行う。これによって、発音記号列から音声データが作成され、再生される。この音声データの再生のためのツールは利用者端末にインストールされず、発音記号列及び音声変換合成プログラムがホームページテキストデータ提供装置100から送信される。利用者端末3に既に音声データツールがインストールされているのを妨げない。 The user terminal 3 reads out each sentence text of the homepage text data using the transmitted phonetic symbol string as voice data by the voice conversion synthesis program. As a result, sound data is created from the phonetic symbol string and reproduced. The tool for reproducing the voice data is not installed in the user terminal, and the phonetic symbol string and the voice conversion synthesis program are transmitted from the homepage text data providing apparatus 100. It does not prevent the voice data tool from being already installed in the user terminal 3.
 このようにして、音声合成情報付きのホームページテキストデータ提供装置100を含んだホームページテキストデータ提供システム200が構成される。 Thus, the homepage text data providing system 200 including the homepage text data providing apparatus 100 with speech synthesis information is configured.
 図2を用いて本実施例を更に詳述する。
 図2は、音声合成情報付きのホームページテキストデータ提供装置100の構成をブロックで示す。
This embodiment will be described in further detail with reference to FIG.
FIG. 2 is a block diagram showing the configuration of the homepage text data providing apparatus 100 with speech synthesis information.
 図2において、音声合成情報付きのホームページテキストデータ提供装置100は、入力手段21、文章毎発音記号列付きホームページテキストデータ生成手段22、送信手段24、サーバ1に格納されたデータベース25及び画像表示手段26から構成され、これらの手段は通信回路27によって互いに結ばれ、データの授受がなされる。 In FIG. 2, the homepage text data providing apparatus 100 with speech synthesis information includes an input means 21, homepage text data generation means 22 with sentence-by-sentence phonetic symbol string, transmission means 24, database 25 stored in the server 1, and image display means. 26. These means are connected to each other by a communication circuit 27 to exchange data.
 上述したように、音声合成情報付きホームページテキストデータ提供装置100は、ネットワーク4を介してWebサーバ2に接続され、ネットワーク5を介して利用者端末3に接続される。 As described above, the homepage text data providing apparatus 100 with speech synthesis information is connected to the Web server 2 via the network 4 and is connected to the user terminal 3 via the network 5.
 上述したように、Webサーバ2は、ホームページテキストデータ提供装置100からホームページの取得要求を受信し、該当のホームページの選択とホームページテキストデータの入力手段21への送信を行う。 As described above, the Web server 2 receives a homepage acquisition request from the homepage text data providing apparatus 100, selects the corresponding homepage, and transmits the homepage text data to the input means 21.
 入力手段21は、選択されたホームページテキストデータを入力する。 The input means 21 inputs the selected homepage text data.
 ホームページテキストデータは、HTML文書形式の文章テキストの集合体として形成され、1つの文章テキストであるHTML文書、すなわち1つの文書テキストは分割記号を備える。 The homepage text data is formed as a collection of sentence texts in the HTML document format, and an HTML document that is one sentence text, that is, one document text is provided with a division symbol.
 データベース25は、発音記号列生成プログラム、音声変換プログラムを格納し、文章毎発音記号列付きホームページテキストデータ生成手段22が生成した発音記号列付きホームページテキスト及び音声変換合成プログラムを格納する。 The database 25 stores a phonetic symbol string generation program and a voice conversion program, and stores a homepage text with a phonetic symbol string generated by the homepage text data generation unit 22 with a phonetic symbol string for each sentence and a voice conversion synthesis program.
 文章毎発音記号列付きホームページテキストデータ生成手段22は、各文章テキストの分割記号を用いて、文書テキストをいくつかに区切ることを行う。 The homepage text data generation means 22 with a sentence-by-sentence symbol string for each sentence divides the document text into several parts using the division symbols of each sentence text.
 各文章テキストについて、発音記号列生成プログラムを用いて、各文章テキストの発音記号列の生成を行い、ホームページテキストデータへの添付を行う。 For each sentence text, the phonetic symbol string generation of each sentence text is generated using the phonetic symbol string generation program and attached to the homepage text data.
 送信手段24は、文章テキスト毎に発音記号列が添付されたホームページテキストデータ及び音声変換合成プログラムを利用者端末3に送信する。 The transmission means 24 transmits the homepage text data and the speech conversion synthesis program to which the phonetic symbol string is attached for each sentence text to the user terminal 3.
 生成されたこれらの文章テキスト毎の発音記号列が添付されたホームページテキストデータは、画像表示手段26の表示画面に表示される。 The homepage text data to which the generated phonetic symbol string for each sentence text is attached is displayed on the display screen of the image display means 26.
 以上のように、データベース25は、発音記号列生成プログラム及び発音記号列を音声データに変換合成する音声変換合成プログラムを格納する。文章テキスト毎の音声変換合成プログラムは、文章テキスト毎に生成された言語解析データから音声データを生成し、再生できるプログラムであり、ブラウザに常駐するだけで、利用者端末3にインストールしないため、ブラウザを閉じるとプログラムは消滅する。このプログラムは、このように、利用者端末3にインストールせずに、ブラウザ上で動作するプログラムである。文章毎発音記号列付きホームページテキストデータ生成手段22は、利用者端末3から指示信号に基づいて複数のテキストデータを格納するデータベースから選択されたホームページテキストデータを読み込み、ホームページテキストデータを構成する各文章テキストの分割記号を判読し、前記発音記号列生成プログラムによって、文章テキスト毎に発音記号列を生成し、各文章テキストに生成した文章毎発音記号列を添付する。 As described above, the database 25 stores a phonetic symbol string generation program and a voice conversion synthesis program for converting and synthesizing a phonetic symbol string into voice data. The voice conversion synthesis program for each sentence text is a program that can generate and reproduce voice data from the language analysis data generated for each sentence text, and only resides in the browser, and does not install on the user terminal 3. Closing closes the program. As described above, this program is a program that runs on the browser without being installed in the user terminal 3. The homepage text data generation means 22 with a phonetic symbol string for each sentence reads the homepage text data selected from the database storing a plurality of text data based on the instruction signal from the user terminal 3, and each sentence constituting the homepage text data The divided symbols of the text are read, a phonetic symbol string is generated for each sentence text by the phonetic symbol string generation program, and the generated phonetic symbol string for each sentence is attached to each sentence text.
 音声変換合成プログラムは、音声データを読み上げたい箇所としてホームページテキストデータのいずれかの文章テキストが指示されると、当該文章テキストに添付された文章毎発音記号列を用い、各文章テキストを識別子として音声データに変換するプログラムである。 When a sentence text of homepage text data is designated as a place where the voice data is to be read out, the voice conversion synthesis program uses the pronunciation symbol string for each sentence attached to the sentence text and uses each sentence text as an identifier. A program that converts data.
 図3は、表示されたホームページの表示例を示す。
 画面に表示されるスクロールコントロールを制御して、文章テキストを特定して読み上げさせる。更に「巻き戻し」、「先送り」させることができる。
FIG. 3 shows a display example of the displayed home page.
Control the scroll control displayed on the screen to identify and read out text text. Further, “rewinding” and “delaying” can be performed.
 利用者端末3は、文章毎の発音記号列付きホームページテキストデータ及び音声変換合成プログラムの送信を受け、スクロールコントロールから音声データとして読み上げたい文章テキストを画面上で指定を受ける。文書テキストの文頭に指定欄を形成しておくこともできる。文章テキスト自体が音声データとして読み上げることを識別するための識別子となる。送信された音声変換合成プログラムは、ブラウザ上でのプログラムとして動作し、識別子となった文章テキストについて音声データとして読み上げる。識別子の付いた文章テキストは複数指定することが可能である。 The user terminal 3 receives the homepage text data with phonetic symbol strings for each sentence and the voice conversion synthesis program, and receives the text text to be read out as voice data from the scroll control. A designation field can also be formed at the beginning of the document text. This is an identifier for identifying that the text of the text itself is read out as voice data. The transmitted voice conversion synthesis program operates as a program on the browser, and reads out the sentence text as an identifier as voice data. A plurality of text texts with identifiers can be specified.
 このように、利用者端末3が送信された上述のデータに基づいて音声データを作成する。 Thus, voice data is created based on the above-mentioned data transmitted from the user terminal 3.
 利用者端末3で音声データを生成することにより、必要なときに必要な箇所(すなわち文章テキスト)を指定して音声データを生成でき、利用者の意向に沿った読み上げ操作、読み上げが可能となる。 By generating the voice data at the user terminal 3, the voice data can be generated by designating a necessary portion (that is, sentence text) when necessary, and reading operation and reading in accordance with the user's intention are possible. .
 図4は、HTML形式の文章テキストの状態遷移を示すイメージ図である。 FIG. 4 is an image diagram showing the state transition of the text text in the HTML format.
 図4において、Webサーバ2からホームページテキストデータ提供装置100にホームページテキストデータの一部の文章テキストである“今日は、天気が良いので、散歩します。”が送信されたことを想定する。 In FIG. 4, it is assumed that the text text of a part of the homepage text data, “Today, take a walk because the weather is good” is transmitted from the Web server 2 to the homepage text data providing apparatus 100.
 ホームページテキストデータ提供装置100の文章毎発音記号列付きホームページテキストデータ生成手段22は、データべースに格納されたプログラムで、「、」「。」など分割記号単位で文節を区切る。 The homepage text data generation means 22 with sentence-by-sentence phonetic symbol string of the homepage text data providing apparatus 100 is a program stored in the database, and divides the clauses in units of divided symbols such as “,” “.”.
 分割記号は、以下の8つの記号で定義される。
  ・「、」
  ・「。」
  ・「?」
  ・「?」
  ・「!」
  ・「!」
  ・「 」(全角スペース)
  ・「 」(半角スペース)
 次いで、読む順序を示した番号(属性)と、読み方からなる発音記号列を付加することを行う。これによって発音記号列が付加される。
The division symbol is defined by the following eight symbols.
・ 「、」
・ "."
・ "?"
・ 「?」
・ "!"
・ 「!」
・ "" (Full-width space)
・ "" (Half-width space)
Next, a number (attribute) indicating the reading order and a phonetic symbol string consisting of how to read are added. As a result, a phonetic symbol string is added.
 生成した発音記号列をホームページテキストデータに添付し、送信手段から音声変換合成プログラムと共に利用者端末3へ送信する。 The generated phonetic symbol string is attached to the homepage text data and transmitted from the transmission means to the user terminal 3 together with the voice conversion synthesis program.
 利用者端末3では、音声変換プログラムによって、発音記号列から音声データを作成し、発話する。 The user terminal 3 creates voice data from the phonetic symbol string by the voice conversion program and speaks.
 図5は、図4に示すイメージをより具体的にして示す。
 読む順序を示した番号(属性)と読み方を付加した発音記号列を付加する。これによって、今日は天気が良いので、散歩します。というように発音記号列が付加された文章テキストが構成されることになる。
FIG. 5 shows the image shown in FIG. 4 more specifically.
A number (attribute) indicating the reading order and a phonetic symbol string to which the reading is added are added. Because of this, the weather is nice today so I will take a walk. Thus, a sentence text to which a phonetic symbol string is added is constructed.
 利用者端末でブラウザを起動し、サーバに最初にアクセスした際に、音声変換合成プログラムは、ホームページテキストデータと一緒に利用者端末にダウンロードされる。ダウンロードした音声変換プログラムは利用者端末のブラウザ内に常駐(操作可能に保持)するため、2回目以降のアクセスについては、ホームページテキストデータのみが利用者端末にダウンロードされる。音声変換合成プログラムは、ブラウザに常駐するだけで、利用者端末にインストールされないため、ブラウザを閉じると消滅する。ブラウザを再度立ち上げ、サーバにアクセスすると、ホームページテキストデータと共に音声変換プログラムが再び利用者端末にダウンロードされる。 When the browser is started on the user terminal and the server is accessed for the first time, the speech conversion synthesis program is downloaded to the user terminal together with the homepage text data. Since the downloaded voice conversion program is resident (operably held) in the browser of the user terminal, only the homepage text data is downloaded to the user terminal for the second and subsequent accesses. Since the voice conversion synthesis program resides only in the browser and is not installed in the user terminal, it disappears when the browser is closed. When the browser is restarted and the server is accessed, the voice conversion program is downloaded to the user terminal again together with the homepage text data.
 図4及び図5において、ホームページテキストデータの文章テキストをHTML文書で実装する利点は次の通りである。 4 and 5, the advantage of implementing the text text of the homepage text data as an HTML document is as follows.
・記述形式の構造上、文字列とその音声データの対応付けなど、データの加工が容易。
・記述形式が世界標準であるため、(ほぼ)全てのコンテンツに対して、音声データを付加できる。
・HTML文章形式の表示プログラム(ブラウザ)と、それに付随するツール類(プラグイン)が高機能であるため、他のテキストデータに比べて、加工が容易。
・画像や外部リンクなど、性質の異なるデータとテキストデータとを、ひとつのファイルに同居できる。
-Due to the structure of the description format, data processing such as correspondence between character strings and their voice data is easy.
-Since the description format is a global standard, audio data can be added to (almost) all contents.
-The HTML text format display program (browser) and the accompanying tools (plug-ins) are highly functional, so they are easier to process than other text data.
-Data and text data with different properties such as images and external links can coexist in one file.
 図4、図5において、データベースには予め発音記号列生成プログラム及び発音記号列を音声データに変換合成する音声変換合成プログラムが格納される。利用者端末3からホームページの取得指示がホームページテキストデータ提供装置100経由でWebサーバ2になされ、Webサーバ2はこの指示に基づいてホームページを選択し、音声合成情報を利用者端末に提供するサーバに送信する。ホームぺージテキストデータ提供装置100は、選択されたホームページの文章テキストの読み込みを行う。発音記号列生成プログラムによって各文章テキストの分割記号の判別を行う。 4 and 5, the database stores in advance a phonetic symbol string generation program and a voice conversion synthesis program for converting and synthesizing a phonetic symbol string into speech data. A homepage acquisition instruction is issued from the user terminal 3 to the Web server 2 via the homepage text data providing apparatus 100, and the Web server 2 selects a homepage based on this instruction and provides a server that provides speech synthesis information to the user terminal. Send. The home page text data providing apparatus 100 reads the text text of the selected home page. The divided symbol of each sentence text is discriminated by the phonetic symbol string generation program.
 発音記号列生成プログラムによって発音記号列を生成する。これによって文章毎発音記号列が作成される。作成した文章毎発音記号列を文章テキストに添付する。文章テキストは文章テキスト毎に特定の文章テキストとされ、この特定の文章テキスト自体が識別子を構成する。 The phonetic symbol string is generated by the phonetic symbol string generation program. Thereby, a phonetic symbol string for each sentence is created. Attach the generated phonetic symbol string to the text. The sentence text is a specific sentence text for each sentence text, and the specific sentence text itself constitutes an identifier.
 特定された文章テキストの文章毎発音記号列からなるホームページテキストデータに、音声変換合成プログラムが添付される。 音 声 A speech conversion synthesis program is attached to homepage text data consisting of phonetic symbol strings for each sentence of the specified text.
 生成された文章テキスト毎に発音記号列が生成されたホームページテキストデータ及び音声変換合成プログラムが利用者端末に送信される。これによって、利用者は、その利用者端末に目的としたホームページテキストデータ毎に生成された発音記号列及び音声変換合成プログラムを取得する。これらの発音記号列と音声変換合成プログラムは、ブラウザ上で動作されるデータ及びプログラムであり、利用者端末にインストールされることはない。 ∙ Homepage text data in which phonetic symbol strings are generated for each generated text text and voice conversion synthesis program are transmitted to the user terminal. As a result, the user acquires the phonetic symbol string and the speech conversion synthesis program generated for each homepage text data intended for the user terminal. These phonetic symbol strings and the speech conversion synthesis program are data and programs that are operated on the browser, and are not installed in the user terminal.
 本実施例によって、機能を向上させた音声読み上げが可能になる。これによって、高齢者をはじめ視力の弱い人や色の識別が苦手の人のアクセシビリティを改善できることになる。これによって、ホームページをより利用しやすくなる。 This example makes it possible to read out speech with improved functions. This will improve accessibility for older people, people with weak vision, and people who are not good at color identification. This makes it easier to use the home page.
 利用者は、利用者端末の操作によって任意の文章テキストを指定して音声データの読み上げを指示する。この文章テキストが識別子の機能を有しているので、この文章テキストがこの文章テキストに添付されて来た発音記号列及び音声変換合成プログラムの機能・働きによって音声データに変換合成され、音声データでの読み上げがなされる。この音声データでの読み上げは、文章テキストについて読み上げ指示することによって繰り返して行うことができることになり、また任意の文章テキストを指定して、すなわち巻き戻し、先送りさせて行うことができることになる。 The user designates arbitrary text text by operating the user terminal and instructs to read out the voice data. Since this sentence text has the function of an identifier, this sentence text is converted and synthesized into voice data by the phonetic symbol sequence attached to this sentence text and the function / function of the voice conversion synthesis program. Is read out. This voice data can be read aloud repeatedly by instructing the text text to be read, and any text text can be designated, that is, rewinded and advanced.
 以上のように、テキストデータとしてホームページテキストが用いられる時の音声合成情報のホームページテキストデータ提供方法は、次のステップによって構成される。 As described above, the homepage text data providing method of speech synthesis information when the homepage text is used as the text data includes the following steps.
 データベースに、発音記号列生成プログラム及び発音記号列を音声データに変換合成する音声変換合成プログラムを格納するステップ
 文章毎発音記号列付きホームページテキストデータ生成手段が、利用者端末から指示信号に基づいて複数のテキストデータを格納するデータベースから選択されたホームページテキストデータを読み込み、前記発音記号列生成プログラムによって、文章テキスト毎に発音記号列を生成し、各文章テキストに生成した文章毎発音記号列を添付するステップ
 送信手段が、各文章テキストに文章毎発音記号列を添付したホームページテキストデータ及び音声合成変換プログラムをネットワークを介して利用者端末に送信するステップ
Step of storing a phonetic symbol string generation program and a voice conversion synthesis program for converting and synthesizing phonetic symbol strings into voice data in the database. The selected homepage text data is read from the database for storing the text data, the phonetic symbol string is generated for each sentence text by the phonetic symbol string generation program, and the generated phonetic symbol string for each sentence text is attached. A step in which the transmitting means transmits homepage text data and a speech synthesis conversion program in which each sentence text is attached to each sentence text to the user terminal via the network.
 このように、ホームページ(サーバ)側ではなく、利用者端末側で音声データを作成することで、課題の解決がなされる。利用者端末で音声データを作成することにより、必要なときに必要な箇所(分)だけ音声データを作成できるため、利用者の意向に沿った簡便な読み上げ操作や、音声読み上げが可能になる。 Thus, the problem is solved by creating the voice data on the user terminal side, not on the home page (server) side. By creating voice data on the user terminal, voice data can be created only when necessary (minutes) when necessary, so that it is possible to perform a simple reading operation or voice reading in accordance with the user's intention.
 1…サーバ、2…Webサーバ、3…利用者端末、4,5…ネットワーク、11…発音記号列(言語解析データ生成プログラム)、12…音声変換合成プログラム、21…入力手段、22…文章毎発音記号列付きホームページデータ生成手段、24…送信手段、25…データベース、100…音声合成情報付きのホームページテキストデータ提供装置、200…ホームページテキストデータ提供システム。 DESCRIPTION OF SYMBOLS 1 ... Server, 2 ... Web server, 3 ... User terminal, 4, 5 ... Network, 11 ... Phonetic symbol string (language analysis data generation program), 12 ... Speech conversion synthesis program, 21 ... Input means, 22 ... For each sentence Homepage data generation means with phonetic symbol string, 24 ... transmission means, 25 ... database, 100 ... homepage text data providing device with speech synthesis information, 200 ... homepage text data providing system.

Claims (8)

  1.  Webページに記述されたテキストデータを音声合成情報に変換する音声合成情報変換手段を備えて、ネットワークを介してテキストデータと共に音声合成情報を利用者端末に提供する音声合成情報付きのテキストデータ提供装置において、
     発音記号列生成プログラム及び発音記号列を音声データに変換合成する音声変換合成プログラムを格納するデータベースと、
     利用者端末からの指示信号に基づいて格納された複数のテキストデータから選択されたテキストデータを読み込み、前記発音記号列生成プログラムによって、テキストデータの文章テキスト毎に読む順序と読み方とからなる発音記号列を生成し、各文章テキストに生成した文章毎発音記号列を添付する文章毎発音記号列付きテキストデータ生成手段と、
     文章毎発音記号列付きテキストデータ及び音声合成変換プログラムをネットワークを介して利用者端末に送信する送信手段と
     を有することを特徴とする音声合成情報付きのテキストデータ提供装置。
    A text data providing apparatus with speech synthesis information provided with speech synthesis information converting means for converting text data described in a Web page into speech synthesis information, and providing the speech synthesis information together with the text data to the user terminal via the network In
    A database for storing a phonetic symbol generation program and a voice conversion synthesis program for converting and synthesizing a phonetic symbol sequence into speech data;
    A phonetic symbol consisting of a reading order and a reading method for each sentence text of the text data by reading the text data selected from the plurality of text data stored based on the instruction signal from the user terminal and by the phonetic symbol string generation program A text data generating means with a sentence-by-sentence symbol string, which generates a string and attaches the sentence-by-sentence pronunciation string to each sentence text;
    An apparatus for providing text data with speech synthesis information, comprising: transmission means for transmitting text data with a pronunciation symbol string for each sentence and a speech synthesis conversion program to a user terminal via a network.
  2.  請求項1において、前記音声変換合成プログラムは、音声データを読み上げたい箇所としてテキストデータのいずれかの文章テキストが指示されると、当該文章テキストに添付された発音記号列を音声データに変換するプログラムであることを特徴とする音声合成情報付きのテキストデータ提供装置。 2. The program according to claim 1, wherein the voice conversion synthesis program converts a phonetic symbol string attached to the sentence text into voice data when any sentence text of the text data is designated as a portion where the voice data is to be read out. An apparatus for providing text data with speech synthesis information.
  3.  請求項1において、前記音声変換合成プログラムが、利用者端末にインストールされず、そのブラウザ内に常駐し、ブラウザを閉じると消滅することを特徴とする音声合成情報付きのテキストデータ提供装置。 2. The text data providing apparatus with speech synthesis information according to claim 1, wherein the speech conversion synthesis program is not installed in a user terminal, resides in the browser, and disappears when the browser is closed.
  4.  請求項2において、前記発音記号列生成プログラムは、各文章テキストについて分割記号単位で文章テキストを区切って読む順序を読み方とからなる発音記号列を生成することを特徴とする音声合成情報付きのテキストデータ提供装置。 3. The text with speech synthesis information according to claim 2, wherein the phonetic symbol string generation program generates a phonetic symbol string including a reading order by dividing the sentence text in units of divided symbols for each sentence text. Data provision device.
  5.  Webページに記述されたテキストデータを音声合成情報に変換する音声合成情報変換手段を備えて、ネットワークを介してテキストデータと共に音声合成情報を利用者端末に提供する音声合成情報付きのテキストデータ提供装置による音声合成情報付きのテキストデータ提供方法において、
     データベースに、発音記号列生成プログラム及び発音記号列を音声データに変換合成する音声変換合成プログラムを格納し、
     文章毎発音記号列テキストデータ生成手段が、利用者端末からの指示信号に基づいて格納された複数のテキストデータから選択されたテキストデータを読み込み、前記発音記号列生成プログラムによって、文章テキスト毎に発音記号列を生成し、各文章テキストに生成した文章毎発音記号列を添付し、
     送信手段が、各文章テキストに文章毎発音記号列を添付したテキストデータ及び音声合成変換プログラムをネットワークを介して利用者端末に送信すること
     を有することを特徴とする音声合成情報付きのテキストデータ提供方法。
    A text data providing apparatus with speech synthesis information provided with speech synthesis information converting means for converting text data described in a Web page into speech synthesis information, and providing the speech synthesis information together with the text data to the user terminal via the network In the text data providing method with speech synthesis information by
    In the database, a phonetic symbol string generation program and a voice conversion synthesis program for converting and synthesizing a phonetic symbol string into speech data are stored,
    A sentence-by-sentence phonetic symbol string data generation unit reads text data selected from a plurality of text data stored based on an instruction signal from a user terminal, and the phonetic symbol string generation program generates a pronunciation for each sentence text. Generate a symbol string, attach the generated pronunciation symbol string for each sentence text,
    Providing text data with speech synthesis information, characterized in that the transmission means includes transmitting text data in which each sentence text is attached to each sentence text and a speech synthesis conversion program to the user terminal via the network. Method.
  6.  請求項5において、前記音声変換合成プログラムが、音声データを読み上げたい箇所としてテキストデータ内のいずれかの文章テキストが指示されると、当該文章テキストに添付された発音記号列を音声データに変換するプログラムであることを特徴とする音声合成情報付きのテキストデータ提供方法。 6. The voice conversion synthesis program according to claim 5, wherein when any sentence text in the text data is instructed as a part where the voice data is to be read out, the phonetic symbol string attached to the sentence text is converted into the voice data. A method for providing text data with speech synthesis information, characterized by being a program.
  7.  請求項5において、前記音声変換合成プログラムが、利用者端末にインストールされず、そのブラウザ内に常駐し、ブラウザを閉じると消滅することを特徴とする音声合成情報付きのテキストデータ提供方法。 6. The method for providing text data with speech synthesis information according to claim 5, wherein the speech conversion synthesis program is not installed in a user terminal, resides in the browser, and disappears when the browser is closed.
  8.  請求項5において、前記発音記号列生成プログラムは、各文章テキストについて分割記号単位で文章テキストを区切って読む順序を読み方とからなる発音記号列を生成することを特徴とする音声合成情報付きのテキストデータ提供方法。 6. The text with speech synthesis information according to claim 5, wherein the phonetic symbol string generation program generates a phonetic symbol string including a reading order by dividing the sentence text into divided symbols for each sentence text. Data provision method.
PCT/JP2012/074370 2011-10-28 2012-09-24 Apparatus for providing text data with synthesized voice information and method for providing text data WO2013061718A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201280044941.4A CN103827961A (en) 2011-10-28 2012-09-24 Apparatus for providing text data with synthesized voice information and method for providing text data

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-237049 2011-10-28
JP2011237049A JP2013097033A (en) 2011-10-28 2011-10-28 Apparatus for providing text data with synthesized voice information and method for providing text data

Publications (1)

Publication Number Publication Date
WO2013061718A1 true WO2013061718A1 (en) 2013-05-02

Family

ID=48167554

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/074370 WO2013061718A1 (en) 2011-10-28 2012-09-24 Apparatus for providing text data with synthesized voice information and method for providing text data

Country Status (3)

Country Link
JP (1) JP2013097033A (en)
CN (1) CN103827961A (en)
WO (1) WO2013061718A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193941A (en) * 2017-05-19 2017-09-22 北京金山安全软件有限公司 Story generation method and device based on picture content

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043064A (en) * 1999-07-30 2001-02-16 Canon Inc Method and device for processing voice information, and storage medium
JP2001256142A (en) * 2000-03-09 2001-09-21 Toshiba Corp Voice information provision method and voice information provision device
JP2003044072A (en) * 2001-07-30 2003-02-14 Seiko Epson Corp Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium
JP2003044070A (en) * 2001-07-31 2003-02-14 Toshiba Corp Voice synthesis control method and information processor
JP2005070304A (en) * 2003-08-22 2005-03-17 Oki Electric Ind Co Ltd Device, method, and program for providing voice data
JP2005107320A (en) * 2003-09-30 2005-04-21 Sanyo Electric Co Ltd Data generator for voice reproduction
WO2006003714A1 (en) * 2004-07-06 2006-01-12 Fujitsu Limited Browser program with screen-reading function, browser with screen-reading function, browsing processing method, borrower program recording medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339132A (en) * 1999-05-31 2000-12-08 Sony Corp Document voicing device and its method
JP3580481B2 (en) * 1999-10-06 2004-10-20 インターナショナル・ビジネス・マシーンズ・コーポレーション Method and apparatus for specifying speech reading range
CN1212601C (en) * 2002-11-01 2005-07-27 中国科学院声学研究所 Imbedded voice synthesis method and system
JP4082249B2 (en) * 2003-03-14 2008-04-30 日本電気株式会社 Content distribution system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043064A (en) * 1999-07-30 2001-02-16 Canon Inc Method and device for processing voice information, and storage medium
JP2001256142A (en) * 2000-03-09 2001-09-21 Toshiba Corp Voice information provision method and voice information provision device
JP2003044072A (en) * 2001-07-30 2003-02-14 Seiko Epson Corp Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium
JP2003044070A (en) * 2001-07-31 2003-02-14 Toshiba Corp Voice synthesis control method and information processor
JP2005070304A (en) * 2003-08-22 2005-03-17 Oki Electric Ind Co Ltd Device, method, and program for providing voice data
JP2005107320A (en) * 2003-09-30 2005-04-21 Sanyo Electric Co Ltd Data generator for voice reproduction
WO2006003714A1 (en) * 2004-07-06 2006-01-12 Fujitsu Limited Browser program with screen-reading function, browser with screen-reading function, browsing processing method, borrower program recording medium

Also Published As

Publication number Publication date
JP2013097033A (en) 2013-05-20
CN103827961A (en) 2014-05-28

Similar Documents

Publication Publication Date Title
EP3125134B1 (en) Speech retrieval device, speech retrieval method, and display device
Baumann et al. The Spoken Wikipedia Corpus collection: Harvesting, alignment and an application to hyperlistening
US8707183B2 (en) Detection of a user's visual impairment based on user inputs or device settings, and presentation of a website-related data for sighted or visually-impaired users based on those inputs or settings
US20050060046A1 (en) Information processing apparatus, its control method, and program
JPH11249867A (en) Voice browser system
WO2007018102A1 (en) Mobile information device and mobile information device display method
WO2007069512A1 (en) Information processing device, and program
CN108241596A (en) The production method and device of a kind of PowerPoint
JP7200533B2 (en) Information processing device and program
JP5267342B2 (en) Mashup program, mashup device, and mashup method
JP4392190B2 (en) Data content transmitting apparatus and data content transmitting program
JP3467160B2 (en) Multilingual communication system, server device, and document transmission method for server device
WO2013061718A1 (en) Apparatus for providing text data with synthesized voice information and method for providing text data
WO2013061719A1 (en) Device for providing text data appended with speech synthesis information, and method for providing text data
JP2010230948A (en) Content distribution system and text display method
JP2005004100A (en) Listening system and voice synthesizer
JP4014361B2 (en) Speech synthesis apparatus, speech synthesis method, and computer-readable recording medium recording speech synthesis program
US20080040658A1 (en) Linking of Content Portions Developed Independently
JP2005115684A (en) Content search device and content search method
Nisimura et al. Development of speech input method for interactive voiceweb systems
JP2007164732A (en) Computer executable program and information processing device
KR101814431B1 (en) Translation system and method for translation syncronization
JP7140016B2 (en) Audio output method, audio output system and program
JP2005181358A (en) Speech recognition and synthesis system
JP4289080B2 (en) Audio data providing apparatus, audio data providing method, and audio data providing program

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12842722

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12842722

Country of ref document: EP

Kind code of ref document: A1