JP2003044072A - Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium - Google Patents

Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium

Info

Publication number
JP2003044072A
JP2003044072A JP2001230180A JP2001230180A JP2003044072A JP 2003044072 A JP2003044072 A JP 2003044072A JP 2001230180 A JP2001230180 A JP 2001230180A JP 2001230180 A JP2001230180 A JP 2001230180A JP 2003044072 A JP2003044072 A JP 2003044072A
Authority
JP
Japan
Prior art keywords
reading
setting
voice
target document
voice reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001230180A
Other languages
Japanese (ja)
Inventor
Masashi Aiiso
政司 相磯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2001230180A priority Critical patent/JP2003044072A/en
Publication of JP2003044072A publication Critical patent/JP2003044072A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To comfortably perform reading by appropriately changing the reading characteristics corresponding to the liking of a user even when special data for voice reading setting are not integrated in the data of a voice reading object. SOLUTION: A category, to which a reading object document belongs, is discriminated (step S2), voice reading setting corresponding to the category of the discriminated result is applied to the reading object document (step S3), and voice reading is performed on the basis of reading object document data and voice reading setting corresponding to the reading object document (steps S4-S6).

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声読み上げ設定
装置、音声読み上げ装置、音声読み上げ設定方法、音声
読み上げ設定プログラム及び記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice reading setting device, a voice reading device, a voice reading setting method, a voice reading setting program and a recording medium.

【0002】[0002]

【従来の技術】従来よりテキストデータを音声合成を行
って音声により読み上げる音声読み上げ装置が知られて
いる。このような音声読み上げ装置において、生成する
音声の特性を変えるために、特開平3−276193号
公報においては、あらかじめテキストデータ中に特性変
更用の制御データ(タグなど)を組み込んでおき、テキ
ストデータを読み込んだ際にこの制御データに基づいて
音声合成の設定、変更を行う技術が開示されている。ま
た、電子メールの読み上げに関しては、特開平4−10
734号公報において、電子メールの差出人に応じて音
声合成の設定を行う技術が開示されている。さらに特開
平9−265380号公報において、文書内の各テキス
ト列の属性によって出力音声を変更する技術が開示され
ている。
2. Description of the Related Art Conventionally, there has been known a voice reading device which performs voice synthesis on text data and reads it by voice. In such a voice reading device, in order to change the characteristic of the generated voice, in Japanese Patent Laid-Open No. 3-276193, the control data for changing the characteristic (such as a tag) is previously incorporated in the text data, and the text data is stored. There is disclosed a technique for setting and changing voice synthesis based on the control data when reading the. Regarding the reading of electronic mail, Japanese Patent Laid-Open No. 4-10
Japanese Patent No. 734 discloses a technique for setting voice synthesis according to the sender of an electronic mail. Further, Japanese Patent Laid-Open No. 9-265380 discloses a technique for changing the output voice according to the attribute of each text string in a document.

【0003】[0003]

【発明が解決しようとする課題】ところで、自動読み上
げ用のテキストデータには、あらかじめ読み上げ特性を
指定するためのタグが含まれ、このタグなどに基づいて
読み上げ特性を設定するのが一般的である。設定される
読み上げ特性としては、男声、女声、子供の声、ロボッ
トの声等の声の種類、抑揚の多少、ピッチの高低、スピ
ード等が挙げられる。また、読み上げ特性を設定するた
めのデータには、声の種類を変更する制御データを組み
込むことにより、読み上げの雰囲気などを現実味を持た
せることも可能である。しかしながら、現実的には、ブ
ラウザなどが自動読み上げ機能を備えているにも関わら
ず、テキストデータに読み上げ特性を設定するためのデ
ータが含まれていることはまれであり、従って、読み上
げ特性の設定が自動でなされることはほとんどない。
By the way, the text data for automatic reading includes a tag for specifying the reading characteristic in advance, and the reading characteristic is generally set based on this tag or the like. . Examples of the read-aloud characteristics to be set include the type of voice such as a male voice, a female voice, a voice of a child, and a voice of a robot, the degree of intonation, pitch high / low, and speed. In addition, by incorporating control data for changing the type of voice into the data for setting the reading characteristics, it is possible to add a realistic atmosphere to the reading. However, in reality, it is rare that the text data includes data for setting the reading characteristics, even though the browser or the like has the automatic reading function. Is rarely done automatically.

【0004】すなわち、読み上げ特性の設定をユーザが
変更しない限り、規定の設定で音声合成がなされ、読み
上げ処理が行われることとなっていた。このように常に
一定の音声で読み上げを行わせることは、ユーザにとっ
て機械合成音であるとの印象が強くなり、時としてユー
ザに不快感さえも与えかねないという問題点があった。
そこで、本発明の目的は、音声読み上げ対象のデータに
特別の音声読み上げ設定用のデータが組み込まれていな
い場合であっても、ユーザの好みに合わせて適宜、読み
上げ特性を変更して快適に読み上げを行わせることが可
能な音声読み上げ設定装置、音声読み上げ装置、音声読
み上げ設定方法、音声読み上げ設定プログラム及び記録
媒体を提供することにある。
That is, unless the user changes the setting of the reading characteristic, the voice synthesis is performed with the specified setting and the reading process is performed. Such constant reading with a constant voice increases the user's impression that the sound is a machine-synthesized sound, and sometimes causes the user to feel uncomfortable.
Therefore, an object of the present invention is to read aloud comfortably by appropriately changing the reading characteristics according to the user's preference even when the data to be read aloud does not include special voice reading setting data. It is to provide a voice reading setting device, a voice reading device, a voice reading setting method, a voice reading setting program, and a recording medium capable of performing the above.

【0005】[0005]

【課題を解決するための手段】上記課題を解決するた
め、読み上げ対象文書の音声読み上げを行うための設定
を行う音声読み上げ設定装置は、前記読み上げ対象文書
の属するカテゴリを判別する判別部と、前記読み上げ対
象文書に対し、判別結果のカテゴリに対応する音声読み
上げ設定を行う設定部と、を備えたことを特徴としてい
る。上記構成によれば、判別部は、読み上げ対象文書の
属するカテゴリを判別する。設定部は、読み上げ対象文
書に対し、判別結果のカテゴリに対応する音声読み上げ
設定を行う。
In order to solve the above-mentioned problems, a voice-reading setting device for performing settings for voice-reading a read-aloud document includes a discriminating section for discriminating a category to which the read-aloud document belongs, It is characterized in that it comprises a setting unit for making a voice reading setting corresponding to the category of the discrimination result for the reading target document. According to the above configuration, the determining unit determines the category to which the reading target document belongs. The setting unit performs voice reading setting corresponding to the category of the discrimination result for the reading target document.

【0006】この場合において、各カテゴリに対応する
音声読み上げ設定を予め記憶する設定記憶部を備え、前
記設定部は、前記設定記憶部を参照して前記音声読み上
げ設定を行う、ようにしてもよい。また、前記判別部
は、前記読み上げ対象文書の内容を解析する解析部を備
えるようにしてもよい。さらに、前記解析部は、前記読
み上げ対象文書あるいは特定文書の一部を前記読み上げ
対象文書とする場合には前記特定文書に含まれるキーワ
ード、表題、当該読み上げ対象文書のリンク先情報、U
RL、画像内容の少なくともいずれか一つに基づいて前
記読み上げ対象文書の内容を解析するようにしてもよ
い。
In this case, a setting storage unit may be provided for storing in advance the voice reading setting corresponding to each category, and the setting unit may perform the voice reading setting by referring to the setting storage unit. . Further, the determination unit may include an analysis unit that analyzes the content of the reading target document. Further, when the reading target document or a part of the specific document is set as the reading target document, the analyzing unit further includes a keyword included in the specific document, a title, link destination information of the reading target document, and U.
The content of the reading target document may be analyzed based on at least one of RL and image content.

【0007】また、音声読み上げ装置は、上記音声読み
上げ設定装置と、前記読み上げ対象文書に対応する読み
上げ対象文書データおよび前記音声読み上げ設定に基づ
いて音声読み上げを行う音声読み上げ部を備えたことを
特徴としている。上記構成によれば、音声読み上げ部
は、読み上げ対象文書に対応する読み上げ対象文書デー
タおよび音声読み上げ設定装置により設定された音声読
み上げ設定に基づいて音声読み上げを行う。
Further, the voice reading device comprises the voice reading setting device, and a voice reading unit for reading voice based on the reading target document data corresponding to the reading target document and the voice reading setting. There is. According to the above configuration, the voice reading unit performs voice reading based on the read target document data corresponding to the read target document and the voice reading setting set by the voice reading setting device.

【0008】この場合において、前記音声読み上げの際
に前記音声読み上げ設定を表示する設定表示部と、前記
音声読み上げ設定をユーザが変更する設定変更部と、前
記音声読み上げ設定の変更を前記読み上げ設定装置側に
反映させる設定更新部と、を備えるようにしてもよい。
In this case, a setting display unit for displaying the voice reading setting at the time of the voice reading, a setting changing unit for changing the voice reading setting by the user, and a change of the voice reading setting for the voice setting device. It may be configured to include a setting update unit that is reflected on the side.

【0009】また、読み上げ対象文書の音声読み上げを
行うための設定を行う音声読み上げ設定方法は、前記読
み上げ対象文書の属するカテゴリを判別する判別過程
と、前記読み上げ対象文書に対し、判別結果のカテゴリ
に対応する音声読み上げ設定を行う設定過程と、を備え
たことを特徴としている。上記構成によれば、判別過程
において、読み上げ対象文書の属するカテゴリを判別す
る。そして、設定過程において、読み上げ対象文書に対
し、判別結果のカテゴリに対応する音声読み上げ設定を
行う。
Further, the voice reading setting method for setting the voice reading of the reading target document includes a determination process of determining the category to which the reading target document belongs, and a determination result category for the reading target document. It is characterized by having a setting process of performing corresponding voice reading setting. According to the above configuration, in the determination process, the category to which the reading target document belongs is determined. Then, in the setting process, voice reading setting corresponding to the category of the discrimination result is performed on the reading target document.

【0010】この場合において、各カテゴリに対応する
音声読み上げ設定を予め記憶する設定記憶過程を備え、
前記設定過程は、前記設定記憶過程で記憶した音声読み
上げ設定を参照して前記音声読み上げ設定を行うように
してもよい。また、前記判別過程は、前記読み上げ対象
文書の内容を解析する解析過程を備えるようにしてもよ
い。さらに、前記解析過程は、前記読み上げ対象文書あ
るいは特定文書の一部を前記読み上げ対象文書とする場
合には前記特定文書に含まれるキーワード、表題、当該
読み上げ対象文書のリンク先情報、URL、画像内容の
少なくともいずれか一つに基づいて前記読み上げ対象文
書の内容を解析するようにしてもよい。
In this case, there is provided a setting storing process for storing in advance the voice reading setting corresponding to each category,
In the setting process, the voice reading setting may be performed with reference to the voice reading setting stored in the setting storing process. Further, the determining step may include an analyzing step of analyzing the content of the reading target document. Further, in the analysis process, when the reading target document or a part of the specific document is set as the reading target document, the keyword, the title, the link destination information of the reading target document, the URL, and the image content are included in the specific document. The content of the reading target document may be analyzed based on at least one of the above.

【0011】また、コンピュータに読み上げ対象文書の
音声読み上げを行わせるための設定を行う音声読み上げ
設定プログラムは、前記読み上げ対象文書の属するカテ
ゴリを判別させ、前記読み上げ対象文書に対し、判別結
果のカテゴリに対応する音声読み上げ設定を行わせる、
ことを特徴としている。この場合において、各カテゴリ
に対応する音声読み上げ設定を予め記憶させ、前記設定
過程は、前記設定記憶過程で記憶した音声読み上げ設定
を参照させて前記音声読み上げ設定を行わせるようにし
てもよい。また、これらの音声読み上げ設定プログラム
を記録媒体に記録するようにしてもよい。
Further, a voice-reading setting program for setting a computer to read aloud the read-aloud document is made to discriminate the category to which the read-aloud document belongs, and the category of the discrimination result is set for the read-aloud document. Make the corresponding voice reading settings,
It is characterized by that. In this case, the voice reading setting corresponding to each category may be stored in advance, and in the setting process, the voice reading setting stored in the setting storing process may be referred to to perform the voice reading setting. Further, these voice reading setting programs may be recorded in a recording medium.

【0012】[0012]

【発明の実施の形態】次に本発明の好適な実施の形態に
ついて図面を参照して説明する。 [1]第1実施形態 [1.1]第1実施形態の構成 図1に実施形態の文書読み上げ装置の概要構成ブロック
図を示す。文書読み上げ装置10は、一般的なコンピュ
ータシステムと同様の構成をとっており、大別すると、
文書読み上げ装置本体11、データ入力部12、ディス
プレイ部13および出力部14を備えている。図2に文
書読み上げ装置本体の概要構成ブロック図を示す。文書
読み上げ装置本体11は、文書読み上げ設定装置および
文書読み上げ装置として機能するものであり、MPU2
1、ROM22、RAM23、外部記憶装置24および
通信インターフェース25を備えて構成されている。M
PU21は、RAM23の記憶領域をワークエリアとし
つつROM22に格納された制御プログラムおよび外部
記憶装置24に格納された文書読み上げアプリケーショ
ンプログラム(音声読み上げ特性設定プログラムとして
機能)に基づいて当該文書見上げ装置本体11を制御す
る。ROM22は、制御プログラムなどの各種不揮発性
データを格納している。RAM23は、MPU21のワ
ーキングエリアとして用いられ、アプリケーションプロ
グラムおよび各種データを一時的に格納する。
BEST MODE FOR CARRYING OUT THE INVENTION Next, preferred embodiments of the present invention will be described with reference to the drawings. [1] First Embodiment [1.1] Configuration of First Embodiment FIG. 1 shows a schematic configuration block diagram of a document reading device according to the embodiment. The document reading device 10 has a configuration similar to that of a general computer system.
The document reading device main body 11, a data input unit 12, a display unit 13, and an output unit 14 are provided. FIG. 2 shows a schematic block diagram of the document reading device body. The document reading device main body 11 functions as a document reading setting device and a document reading device.
1, a ROM 22, a RAM 23, an external storage device 24, and a communication interface 25. M
The PU 21 uses the storage area of the RAM 23 as a work area, and based on a control program stored in the ROM 22 and a document reading application program (functions as a voice reading characteristic setting program) stored in the external storage device 24, the document reading apparatus main body 11 To control. The ROM 22 stores various non-volatile data such as control programs. The RAM 23 is used as a working area of the MPU 21, and temporarily stores an application program and various data.

【0013】外部記憶装置24は、ハードディスクなど
で構成され、後述するカテゴリ定義データベース、読み
上げ設定定義データベース、形態素解析用辞書、音韻辞
書、波形辞書などの各種データベースや、文書読み上げ
アプリケーションプログラム、ブラウザプログラム、電
子メールプログラムなどの各種アプリケーションプログ
ラムを格納している。通信インターフェース25は、L
AN、アナログ電話回線ネットワーク、ISDN回線、
ADSLなどのデジタル電話回線ネットワーク、光ファ
イバ回線ネットワークなど各種ネットワークとの間のイ
ンターフェース機能を提供する。データ入力部12は、
キーボード、マウス、タブレットなどを備え、文書デー
タを含む各種データを入力する。ディスプレイ部13
は、文書読み上げ装置本体11の制御下で各種データを
表示する。出力部14は、文書読み上げ装置本体11か
ら出力される音声データに基づいて実際の音声出力を行
う音声出力装置としての機能を有するとともに、各種出
力処理を行う。
The external storage device 24 is composed of a hard disk, etc., and various databases such as a category definition database, a reading setting definition database, a morphological analysis dictionary, a phoneme dictionary, a waveform dictionary, etc., which will be described later, a document reading application program, a browser program, It stores various application programs such as electronic mail programs. The communication interface 25 is L
AN, analog telephone line network, ISDN line,
It provides an interface function with various networks such as digital telephone line networks such as ADSL and optical fiber line networks. The data input section 12 is
It is equipped with a keyboard, mouse, tablet, etc., and inputs various data including document data. Display unit 13
Displays various data under the control of the document reading device body 11. The output unit 14 has a function as a voice output device that actually outputs voice based on voice data output from the document reading device body 11, and performs various output processes.

【0014】[1.2]表示画面 まず具体的動作の説明に先立って、ブラウザ表示画面の
一例について説明する。図3に示すように、ディスプレ
イ部13に表示されるブラウザ表示画面は、大別する
と、ブラウザ操作部31、URL表示部32および本文
表示部33を備えている。ブラウザ操作部31には、表
示ウェブページを現在表示している第Nページから第
(N−1)ページに戻す「戻る」ボタン41、表示ウェ
ブページを現在表示している第Nページから第(N+
1)ページに進める「進む」ボタン42、表示データの
ダウンロードや更新などを中止する「中止」ボタン43
などの各種表示操作ボタン44のほか、本発明に関わる
読み上げボタン45が設けられている。URL表示部3
2には、現在表示しているウェブページのURLを表示
している。本文表示部33は、表示対象のウェブページ
の本文を表示する領域であり、図3の場合、3つのフレ
ームが表示されている。具体的には、図3の場合、第1
フレームには、「○○新聞」のタイトルが表示され、第
2フレームには、今日のニュース記事が表示され、第3
フレームには、明日の天気情報が表示されている。とこ
ろで、本実施形態においては、読み上げ文をカテゴリに
分類し、当該読み上げ文が属するカテゴリに対応する読
み上げ設定に応じて読み上げを行う構成を採っている。
[1.2] Display Screen First, an example of the browser display screen will be described prior to the description of the specific operation. As shown in FIG. 3, the browser display screen displayed on the display unit 13 roughly includes a browser operation unit 31, a URL display unit 32, and a text display unit 33. The browser operation unit 31 includes a “return” button 41 for returning the displayed web page from the currently displayed Nth page to the (N−1) th page, and the displayed web page from the currently displayed Nth page to the (N) th page. N +
1) "Forward" button 42 for advancing to the page, "Cancel" button 43 for stopping downloading or updating of display data
In addition to various display operation buttons 44 such as the above, a reading button 45 relating to the present invention is provided. URL display section 3
In 2, the URL of the currently displayed web page is displayed. The body display section 33 is an area for displaying the body of the web page to be displayed, and in the case of FIG. 3, three frames are displayed. Specifically, in the case of FIG. 3, the first
The title "XX newspaper" is displayed in the frame, the today's news article is displayed in the second frame, and the third
The weather information for tomorrow is displayed in the frame. By the way, in the present embodiment, the reading sentence is classified into categories, and the reading is performed according to the reading setting corresponding to the category to which the reading sentence belongs.

【0015】[1.3]カテゴリ定義データベースおよ
び読み上げ設定定義データベース 次に読み上げ文のカテゴリ分類および読み上げ設定に用
いられるカテゴリ定義データベースCDDBおよび読み
上げ設定定義データベースRDDBについて説明する。
図4にカテゴリ定義データベースの一例を示す。カテゴ
リ定義データベースCDDBは、大別すると、カテゴリ
名データCN、キーワードデータKW、読み上げ設定デ
ータDNを備えている。カテゴリ名データCNは、対応
するカテゴリをユーザが容易に識別するために設けられ
ているものである。例えば、ニュースのカテゴリは「ニ
ュース」、天気予報のカテゴリは「天気予報」、占いの
カテゴリは「占い」などのように当該カテゴリをユーザ
が容易に把握できる名称が割り当てられている。この名
称については、ユーザが任意に設定することが可能であ
る。キーワードデータKWは、各カテゴリにおいて頻出
すると考えられるキーワードが複数格納されている。例
えば、ニュースのカテゴリにおいては「ニュース」、
「事件」、「事故」、「裁判」などが格納されている。
また、占いのカテゴリには「占い」、「運勢」、「ラッ
キー」、「牡羊座」などが格納されている。さらに掲示
板(電子掲示板)のカテゴリには、「掲示板」、「BB
S」、「投稿」などが格納されている。
[1.3] Category Definition Database and Reading Setting Definition Database Next, the category definition database CDDB and the reading setting definition database RDDB used for category classification and reading setting of reading sentences will be described.
FIG. 4 shows an example of the category definition database. The category definition database CDDB roughly includes category name data CN, keyword data KW, and reading setting data DN. The category name data CN is provided for the user to easily identify the corresponding category. For example, names such as “news” for the news category, “weather forecast” for the weather forecast category, “fortune-telling” for the fortune-telling category, etc. are assigned names that the user can easily understand. The name can be arbitrarily set by the user. The keyword data KW stores a plurality of keywords that are considered to appear frequently in each category. For example, in the news category, "news",
The “case”, “accident”, “trial”, etc. are stored.
In the fortune-telling category, “fortune-telling”, “fortune”, “lucky”, “Aries”, etc. are stored. Furthermore, the bulletin board (electronic bulletin board) categories include "bulletin board" and "BB".
"S", "post", etc. are stored.

【0016】読み上げ設定データDNは、当該カテゴリ
の読み上げ設定に対応する読み上げ設定定義データベー
ス上の設定名が格納されている。例えば、天気予報のカ
テゴリの場合には、設定名=「お天気キャスター」とな
っており、スポーツのカテゴリの場合には、設定名=
「アナウンサー」となっている。なお、各設定名に対応
する実際の読み上げ設定の定義については後述する。
The reading setting data DN stores the setting name on the reading setting definition database corresponding to the reading setting of the category. For example, in the case of the weather forecast category, the setting name = “weather caster”, and in the case of the sports category, the setting name =
Has become an "announcer". The definition of the actual reading setting corresponding to each setting name will be described later.

【0017】図5に読み上げ設定定義データベースの一
例を示す。読み上げ設定定義データベースRDDBは、
大別すると、設定名データDNN、声の種類データD
V、速さデータDS、抑揚データDI、口調データDM
を備えている。設定名データDNNは、当該読み上げ設
定をユーザが容易に識別することができるために設けら
れているとともに、カテゴリ定義データベースCDDB
からの参照用に用いられる。声の種類データDVは、使
用する音声データを特定するために割り当てられた名称
を格納している。具体的には、女性の声の場合に、「女
声A」(少女の声)、「女声B」(若い女性の比較的高
い声)、「女声C」(若い女性の比較的低い声)などの
ように声の種類に割り当てられた名称が格納されてい
る。速さデータDSは、読み上げ時の速さを設定するた
めのデータであり、例えば、「ゆっくり」、「ややゆっ
くり」、「普通」、「やや速い」、「速い」などが格納
されている。
FIG. 5 shows an example of the reading setting definition database. The reading setting definition database RDDB is
Broadly classified, setting name data DNN and voice type data D
V, speed data DS, intonation data DI, tone data DM
Is equipped with. The setting name data DNN is provided so that the user can easily identify the reading setting, and also the category definition database CDDB.
Used for reference from. The voice type data DV stores a name assigned to specify the voice data to be used. Specifically, in the case of a female voice, "female voice A"(girl's voice), "female voice B" (younger woman's higher voice), "female voice C" (younger woman's lower voice), etc. The names assigned to the voice types are stored as shown in. The speed data DS is data for setting the speed at the time of reading, and for example, “slow”, “slightly slow”, “normal”, “slightly fast”, “fast”, etc. are stored.

【0018】抑揚データDIは、読み上げ時の調子を設
定するためのデータであり、例えば、「大きい」、「や
や大きい」、「普通」、「やや小さい」、「小さい」な
どが格納されている。口調データDMは、どのような口
調で読み上げを行うかを設定するためのデータであり、
例えば、「とても丁寧」、「丁寧」、「やや丁寧」、
「普通」、「ややくだけている」、「くだけている」、
「とてもくだけている」などが格納されている。この場
合において、速さデータDS、抑揚データDI等は、各
音素の継続長、ピッチ、パワー等を特定するために用い
られる。また、口調データDMは、イントネーションや
発音方法を特定するために用いられる。同様の用い方が
可能なデータとしては、図示していないが地域データ
(方言、アクセント等を特定)等が挙げられる。
The inflection data DI is data for setting the tone at the time of reading, and for example, "large", "slightly large", "normal", "slightly small", "small", etc. are stored. . The tone data DM is data for setting what tone to read aloud,
For example, "very polite", "polite", "slightly polite",
"Ordinary", "Slightly", "Slightly",
It stores "I'm very tired". In this case, the speed data DS, the intonation data DI, etc. are used to specify the duration, pitch, power, etc. of each phoneme. Further, the tone data DM is used to specify the intonation and the pronunciation method. Although not shown, examples of data that can be used in the same manner include regional data (specifying dialects, accents, etc.) and the like.

【0019】[1.4]第1実施形態の動作 次に図6の読み上げ処理時の処理フローチャートを参照
して動作を説明する。以下の説明においては、文章の一
部を読み上げさせる場合を例として説明するが、文章全
体を読み上げさせる場合も同様である。まず、ユーザは
ディスプレイ部13の表示画面に読み上げを行わせる文
章を含む文書を表示させる。この場合において、当該文
書は予め外部記憶装置24内に格納しておくか、直接デ
ータ入力部12を用いて入力するか、あるいは、通信イ
ンターフェース25を介してダウンロードするものとす
る。ユーザは、読み上げ文選択を行う場合には、ディス
プレイ部13の表示画面上に表示された文章の読み上げ
範囲を指定し、読み上げボタン45をクリックして押し
下げる(ステップS1)。これによりMPU21は、外
部記憶装置24内のカテゴリ定義データベースCDDB
を参照し、文分類処理を行う(ステップS2) 具体的には、MPU21は読み上げが指定された文章を
形態素解析用辞書DIC1を用いた形態素解析により分
析して、キーワードを抽出する。そしてMPU21は、
カテゴリ定義データベースのキーワードデータを参照
し、キーワードデータに含まれるキーワードと抽出した
キーワードとを比較し、各カテゴリごとにキーワードの
出現頻度を判別する。この結果、MPU21は、キーワ
ードの出現頻度が最も高かったカテゴリを当該文章のカ
テゴリとする。簡単な例を挙げれば、抽出したキーワー
ドおよび出現回数が「天気」−5回、「晴れ」−10
回、「スポーツ」−1回である場合には、当該文章が属
するカテゴリは「天気予報」とされ、「スポーツ」のカ
テゴリに分類されることはない。
[1.4] Operation of the First Embodiment Next, the operation will be described with reference to the processing flowchart of the reading processing of FIG. In the following description, the case where a part of a sentence is read out is described as an example, but the same is true when the whole sentence is read out. First, the user displays a document including a sentence to be read aloud on the display screen of the display unit 13. In this case, the document is stored in the external storage device 24 in advance, is directly input using the data input unit 12, or is downloaded via the communication interface 25. When selecting the reading sentence, the user specifies the reading range of the sentence displayed on the display screen of the display unit 13, and clicks and depresses the reading button 45 (step S1). As a result, the MPU 21 makes the category definition database CDDB in the external storage device 24.
To perform sentence classification processing (step S2). Specifically, the MPU 21 analyzes a sentence whose reading is specified by morphological analysis using the morphological analysis dictionary DIC1 and extracts a keyword. And MPU21
The keyword data of the category definition database is referred to, the keywords included in the keyword data are compared with the extracted keywords, and the appearance frequency of the keywords is determined for each category. As a result, the MPU 21 sets the category in which the keyword appears most frequently as the category of the sentence. To give a simple example, the extracted keywords and the number of appearances are “weather” -5 times and “clear” -10
When the number of times is "sports" -one time, the category to which the sentence belongs is "weather forecast" and is not classified into the category of "sports".

【0020】また、キーワード全体で見れば出現頻度が
ほぼ同等である場合には、より多くのキーワードが出現
したカテゴリを当該文章の属するカテゴリとする。この
手法によってもカテゴリに分類できない場合には、各カ
テゴリに優先順位をつけておき、優先順位の高いカテゴ
リに分類する。なお、文章中にキーワードデータに含ま
れるキーワードが全く含まれていない場合には、「その
他」のカテゴリに分類される。MPU21は、読み上げ
対象の文章のカテゴリを決定すると、カテゴリ定義デー
タベースを参照して当該カテゴリの読み上げ設定データ
を参照し、読み上げ設定選択処理を行う(ステップS
3)。具体的には、MPU21は、分類カテゴリが「天
気予報」である場合には、読み上げ設定データを参照し
て読み上げ設定名が「お天気キャスター」であることを
検出する。次にMPU21は、読み上げ設定定義データ
ベースRDDBの設定名データDNNが「お天気キャス
ター」である読み上げ設定を読み出す。すなわち、MP
U21は、声の種類データDV=「女声A」、速さデー
タDS=「ややゆっくり」、抑揚データDI=「普
通」、口調データDM=「やや丁寧」といった読み上げ
設定データを読み出すこととなる。
If the appearance frequencies of all the keywords are almost the same, the category in which more keywords appear is set as the category to which the sentence belongs. If this method cannot be used to classify into categories, each category is prioritized and classified into a category with a high priority. If the text does not include any keywords included in the keyword data, the text is classified into the "other" category. When the MPU 21 determines the category of the sentence to be read out, the MPU 21 refers to the category definition database to refer to the reading setting data of the category, and performs the reading setting selection process (step S).
3). Specifically, when the classification category is “weather forecast”, the MPU 21 refers to the reading setting data and detects that the reading setting name is “weather caster”. Next, the MPU 21 reads the reading setting whose setting name data DNN of the reading setting definition database RDDB is “weather caster”. That is, MP
The U21 reads out the reading setting data such as voice type data DV = “female voice A”, speed data DS = “slightly slow”, intonation data DI = “normal”, tone data DM = “slightly polite”.

【0021】次にMPU21は、形態素解析用辞書DI
C1及び音陰辞書DIC2を参照し、読み上げ対象の文
章を単語及び文節に分解し、各単語あるいは文節のつな
がりを認識する等の言語処理を施す(ステップS4)。
次にMPU21は、波形辞書DIC3を参照し、読み上
げ対象の文章を構成する、単語、文節および各単語ある
いは文節のつながりに基づいて読み上げに用いる音声波
形データ(音声データ)を割り当てる音響処理を行う
(ステップS5)。次にMPU21は、音声波形データ
を出力部14に出力する。この結果、出力部14は、音
声波形データのディジタル/アナログ変換を行い、読み
上げ音声を生成して出力する(ステップS6)。従っ
て、ユーザは、自己の好みにあった音声読み上げ特性に
よる音声を聞くことができる。
Next, the MPU 21 uses the morphological analysis dictionary DI.
With reference to C1 and the phonetic dictionary DIC2, the sentence to be read is decomposed into words and phrases, and language processing such as recognizing the connection of each word or phrase is performed (step S4).
Next, the MPU 21 refers to the waveform dictionary DIC3 and performs an acoustic process of allocating speech waveform data (speech data) to be used for reading based on the words, the clauses, and each word or the connection of the clauses that compose the sentence to be read ( Step S5). Next, the MPU 21 outputs the voice waveform data to the output unit 14. As a result, the output unit 14 performs digital / analog conversion of the voice waveform data to generate and output a read voice (step S6). Therefore, the user can listen to the voice having the voice reading characteristic suited to his / her preference.

【0022】[1.5]第1実施形態の変形例 [1.5.1]第1変形例 以上の説明においては、各カテゴリごとに設定される読
み上げ設定は、予め設定されたものを読み上げ中に変更
したりすることはできなかったが、本第1変形例は、読
み上げ中であっても設定の変更ができるものである。以
下、本第1変形例について図7及び図8を参照して説明
する。図7に設定変更ダイアログボックスの表示例を示
す。また、図8に読み上げ設定変更処理のフローチャー
トを示す。文章の読み上げが開始されると、MPU21
は、読み上げ設定定義データベースを参照し、現在の読
み上げ設定データに基づいて図7に示すような設定変更
ダイアログボックス50を、読み上げ中にディスプレイ
部の表示画面において表示する(ステップS11)。こ
のとき、RAM内には読み上げ設定データのコピーが生
成されており、当該コピーされた読み上げ設定データに
基づいて読み上げ処理を行っているものとする。これ
は、一時的な変更により、外部記憶装置内の元の読み上
げ設定データが変更されないようにするためである。
[1.5] Modification of First Embodiment [1.5.1] First Modification In the above description, the reading setting set for each category is the reading of a preset setting. Although it could not be changed in the middle, in the first modified example, the setting can be changed even while reading aloud. Hereinafter, the first modified example will be described with reference to FIGS. 7 and 8. FIG. 7 shows a display example of the setting change dialog box. Further, FIG. 8 shows a flowchart of the reading setting changing process. When reading the text starts, MPU21
Refers to the reading setting definition database and displays the setting change dialog box 50 as shown in FIG. 7 on the display screen of the display unit during reading based on the current reading setting data (step S11). At this time, a copy of the reading setting data is generated in the RAM, and the reading process is performed based on the copied reading setting data. This is to prevent the original reading setting data in the external storage device from being changed by a temporary change.

【0023】この場合に、ユーザは、設定変更ダイアロ
グボックス50を用いて読み上げ設定データの全部また
は一部を変更することができる。具体的には、速さデー
タを現在の「ゆっくり」から「ややゆっくり」に変更し
たい場合には、選択ボタン53をクリックすると、速さ
データにおいて選択可能な項目が表示されるので、「や
やゆっくり」をクリックして選択を確定することとな
る。一方、MPU21はユーザによる読み上げ設定デー
タの変更が検知されたかを常に監視している(ステップ
S12)。MPU21は、ユーザによる読み上げ設定デ
ータの変更が検知された場合には(ステップS12;Y
es)、RAM内の読み上げ設定データを変更する(ス
テップS14)。
In this case, the user can change all or part of the reading setting data by using the setting change dialog box 50. Specifically, if you want to change the speed data from the current "slow" to "slightly slow", click the select button 53 to display the selectable items in the speed data. Click to confirm your choice. On the other hand, the MPU 21 constantly monitors whether a change in the reading setting data by the user is detected (step S12). The MPU 21, when the change of the reading setting data by the user is detected (step S12; Y
es), the reading setting data in the RAM is changed (step S14).

【0024】次にMPU21は、設定変更ダイアログボ
ックス50のカテゴリ定義への反映チェックボックス5
6がチェックされているか否かを判別する(ステップS
15)。そして反映チェックボックス56がチェックさ
れている場合には(ステップS15;Yes)、外部記
憶装置内の元の読み上げ設定データを変更して更新する
(ステップS16)。そしてMPU21は、読み上げが
終了したか否かを判別し(ステップS13)、読み上げ
が終了していない場合には(ステップS13;No)、
処理をステップS12に移行して同様の処理を行う。ま
た、MPU21は、ユーザによる読み上げ設定データの
変更が検知されなかった場合には(ステップS12;N
o)、読み上げが終了したか否かを判別し(ステップS
13)、読み上げが終了していない場合には(ステップ
S13;No)、処理をステップS12に移行して同様
の処理を行う。また、ステップS13の判別において、
読み上げが終了した場合には、設定変更ダイアログボッ
クス50を閉じて処理を終了することとなる。なお、選
択ボタン51をクリックし、設定名を変更した場合に
は、新たな設定名に対応する読み上げ設定データとな
り、変更前に設定変更ダイアログボックスに表示されて
いた読み上げ設定データの内容が、新たな設定名の読み
上げ設定データとなるわけではない。以上の説明のよう
に、本変形例によれば、読み上げ中であっても容易に読
み上げ設定を変更でき、よりユーザの使い勝手のよいも
のとなる。
Next, the MPU 21 reflects the setting change dialog box 50 on the category definition check box 5
It is determined whether or not 6 is checked (step S
15). When the reflection check box 56 is checked (step S15; Yes), the original reading setting data in the external storage device is changed and updated (step S16). Then, the MPU 21 determines whether or not the reading is finished (step S13), and when the reading is not finished (step S13; No),
The process proceeds to step S12 and the same process is performed. Further, when the MPU 21 does not detect the change of the reading setting data by the user (step S12; N).
o), it is determined whether or not the reading has been completed (step S
13) If the reading has not been completed (step S13; No), the process proceeds to step S12 and the same process is performed. Further, in the determination of step S13,
When the reading is finished, the setting change dialog box 50 is closed and the process is finished. If the setting name is changed by clicking the select button 51, the reading setting data corresponding to the new setting name becomes the reading setting data displayed in the setting change dialog box before the change. It does not mean that the setting data is read aloud with a different setting name. As described above, according to this modified example, the reading setting can be easily changed even during reading, which is more convenient for the user.

【0025】[1.5.2]第2変形例 以上の説明においては、カテゴリ分類にキーワードを用
いる簡単な例を説明したが、これに限定されるものでは
ない。例えば、文章の一部を選択して読み上げ対象とす
る場合には、ファイル名、選択範囲の近傍の文章の内
容、タイトル、画像の内容(画像タイトルなど)、リン
ク先情報、URLなどの情報を総合的に判断してカテゴ
リ決定精度を高めるようにすることも可能である。
[1.5.2] Second Modification In the above description, a simple example in which a keyword is used for category classification has been described, but the present invention is not limited to this. For example, when selecting a part of a sentence to be read aloud, information such as the file name, the content of the sentence near the selected range, the title, the content of the image (image title, etc.), link destination information, URL, etc. It is also possible to make a comprehensive judgment to improve the accuracy of category determination.

【0026】[1.5.3]第3変形例 以上の説明においては、読み上げ設定を行うに際し、カ
テゴリ定義データベースの読み上げ設定データを介して
読み上げ設定定義データベースを参照する構成を採って
いたが、カテゴリ定義データベースに直接、読み上げ設
定定義データベースの内容を記述するように構成するこ
とも可能である。
[1.5.3] Third Modification In the above description, when the reading setting is performed, the reading setting definition database is referred to via the reading setting data of the category definition database. It is also possible to directly configure the contents of the reading setting definition database in the category definition database.

【0027】[2]第2実施形態 本第2実施形態は、本発明を電子メールの読み上げに応
用した場合の実施形態である。電子メールの場合、一般
的に文章全体は長くはないので、本第2実施形態では、
読み上げボタンをクリックすることにより全文を読むも
のとしている。
[2] Second Embodiment The second embodiment is an embodiment in which the present invention is applied to the reading of an electronic mail. In the case of electronic mail, the entire sentence is generally not long, so in the second embodiment,
The full text is read by clicking the read button.

【0028】図9に電子メール表示時の表示画面を示
す。図9に示すように、ディスプレイ部13に表示され
る電子メール表示画面は、大別すると、メール操作部8
1、情報表示部82および本文表示部83を備えてい
る。メールブラウザ操作部81には、メールを返信する
ための返信ボタン91やメールを転送するための転送ボ
タン92等の各種メール操作ボタン93のほか、本発明
に関わる読み上げボタン94が設けられている。情報表
示部82には、現在表示しているメールの送信者の情報
などの各種情報を表示している。本文表示部83は、表
示対象のメール本文を表示する領域である。本第2実施
形態では、第1実施形態と異なり、読み上げ範囲の指定
がないので、読み上げボタン94をクリックすることに
より、メール本文の読み上げが開始される。
FIG. 9 shows a display screen when an electronic mail is displayed. As shown in FIG. 9, the electronic mail display screen displayed on the display unit 13 is roughly classified into the mail operation unit 8
1, an information display section 82 and a text display section 83. The mail browser operation unit 81 is provided with various mail operation buttons 93 such as a reply button 91 for replying a mail and a transfer button 92 for transferring a mail, as well as a reading button 94 according to the present invention. The information display section 82 displays various information such as information on the sender of the currently displayed mail. The body display section 83 is an area for displaying the body of the mail to be displayed. In the second embodiment, unlike the first embodiment, since the reading range is not specified, the reading of the mail text is started by clicking the reading button 94.

【0029】この場合の読み上げ設定は、カテゴリとし
て、送信者を用いており、MPU21が送信者を判別す
ることにより読み上げ設定がなされる。従って、送信者
が今まで読み上げ設定がなされたことがない送信者であ
る場合には、ユーザにいずれの読み上げ設定データを用
いるかを問い合わせるダイアログボックスを開いて、ユ
ーザに選択を促すこととなる。また、読み上げ設定の他
の手法としては、第1実施形態と同様に、メール本文の
内容を解析し文章の特徴を用いてカテゴリを分類し、読
み上げ設定を行うようにすることも可能である。例え
ば、図10に示すように、カテゴリ名を「カジュアルメ
ール」、「フォーマルメール」、「ダイレクトメール
風」などとする。そして、「カジュアルメール」は「〜
だよね。」などのくだけ表現が含まれている場合に選択
される。また「フォーマルメール」は丁寧語が含まれて
いる場合に選択される。さらに「ダイレクトメール風」
は、図9に示したように挨拶語で始まり、丁寧語が使わ
れている場合に選択される。カテゴリ分類後の読み上げ
設定の手法については、第1実施形態と同様である。以
上の説明のように、本第2実施形態によれば、メールの
内容などに応じて音声読み上げ設定を最適なものとする
ことができる。
In the reading setting in this case, the sender is used as the category, and the reading setting is made by the MPU 21 discriminating the sender. Therefore, if the sender is a sender who has never been set to read aloud, a dialog box inquiring the user which reading setting data to use is opened to prompt the user to make a selection. As another method of reading aloud, as in the first embodiment, it is possible to analyze the contents of the mail text, classify the categories using the characteristics of the text, and set the reading aloud. For example, as shown in FIG. 10, the category names are “casual mail”, “formal mail”, “direct mail style”, and the like. And "casual mail" is "~
right. It is selected when an expression such as "" is included. Also, "formal mail" is selected when a polite word is included. Furthermore, "direct mail style"
Is selected when a polite word is used, which starts with a greeting word as shown in FIG. The reading setting method after category classification is the same as in the first embodiment. As described above, according to the second embodiment, the read-aloud setting can be optimized according to the content of the mail and the like.

【0030】[3]実施形態の効果 以上の説明のように本実施形態によれば、読み上げ対象
の文章の内容などに応じて音声読み上げの設定がなされ
るため、ユーザは手間をかけることなく、また、人工的
な音声合成であることをあまり認識することなく、音声
読み上げを快適に利用することができる。また、文章の
内容に基づいて音声読み上げ設定がなされるため、ユー
ザの内容理解の一助とすることができる。
[3] Effects of the Embodiment According to the present embodiment as described above, the voice reading is set in accordance with the contents of the sentence to be read, so that the user does not have to take time and effort. Further, it is possible to comfortably use the voice reading without recognizing that it is artificial voice synthesis. In addition, since the reading aloud setting is made based on the content of the sentence, it is possible to help the user to understand the content.

【0031】[4]実施形態の変形例 [4.1]第1変形例 以上の説明においては、音声読み上げ装置として、コン
ピュータシステムの場合について説明したが、表示装置
および音声合成装置を内蔵した小型情報機器、携帯電話
端末、ファクシミリ端末、ワークステーション、腕時計
型の情報機器など様々な機器に本発明の適用が可能であ
る。
[4] Modification of Embodiment [4.1] First Modification In the above description, a computer system was described as the voice reading device, but a small device incorporating a display device and a voice synthesizing device is used. The present invention can be applied to various devices such as information devices, mobile phone terminals, facsimile terminals, workstations, and wristwatch-type information devices.

【0032】[4.2]第2変形例 以上の説明においては、コンピュータシステムを文書読
み上げ装置として機能させるためのプログラムを外部記
憶装置に予め格納してRAM等に展開して実施する場合
について説明したが、これらのプログラムを光ディスク
などのリムーバブル記録媒体に記録して、インストール
するようにしたり、ネットワークを介してダウンロード
し、インストールするように構成することも可能であ
る。ダウンロードを行う場合には、実行のたびにダウン
ロードするようにすることも可能である。
[4.2] Second Modification In the above description, the case where a program for causing the computer system to function as a document reading device is stored in advance in an external storage device and expanded in RAM or the like is executed. However, it is also possible to record these programs on a removable recording medium such as an optical disc and install them, or to download and install them via a network. When downloading, it is possible to download each time it is executed.

【0033】[4.3]第3変形例 以上の説明においては、カテゴリ定義データベースなど
の各種データベースを内蔵する外部記憶装置に格納して
いたが、分散システムを構成し、外部のデータベースを
利用するように構成したり、小型情報機器などの場合に
は、外部のデータベースサーバを利用するように構成す
ることも可能である。
[4.3] Third Modification In the above description, various databases such as a category definition database are stored in an external storage device, but a distributed system is configured and an external database is used. Alternatively, in the case of a small-sized information device or the like, it is possible to use an external database server.

【0034】[4.4]第4変形例 以上の説明においては、読み上げ対象の文書については
全て同一の音声読み上げ設定を用いる場合についてのみ
説明したが、小説やシナリオのように、会話部分が含ま
れるような場合には、会話部分とその他の部分を別の音
声読み上げ設定で行うようにすることも可能である。特
にシナリオのように話者名と会話文とが連続して記載さ
れ、話者名とそれに続くカギ括弧分とが一体に識別可能
な場合には、話者ごとに音声読み上げ設定を行うように
構成することも可能である。これにより、より臨場感を
もって読み上げを行わせることが可能である。
[4.4] Fourth Modification In the above description, only the case where the same voice reading setting is used for all the reading target documents has been explained, but the conversation portion is included like novels and scenarios. In such a case, the conversation part and the other part can be set to different voice reading settings. In particular, if the speaker name and the conversational sentence are written consecutively and the speaker name and the brackets that follow it can be identified as one, as in a scenario, set the reading aloud for each speaker. It is also possible to configure. This makes it possible to read aloud with a more realistic feeling.

【0035】[4.5]第5変形例 以上の説明においては、読み上げ対象の文書の内容によ
って音声読み上げ設定を行うようにしていたが、さらに
ユーザを識別して音声読み上げ設定を行うように構成す
ることも可能である。例えば、家庭用のコンピュータに
おいては、家族が交代で使用する場合もあり、そのよう
な場合にはログイン名でユーザを識別している。そこ
で、ログイン名に応じてユーザが大人であるか子供であ
るかなどを識別する情報を予め記憶しておき、同一内容
の文書であっても、子供の場合には、よりゆっくりと本
を読んであげるときのような読み方に設定するようにす
れば、より一層ユーザが快適に使用することができる。
[4.5] Fifth Modification In the above description, the voice reading setting is made according to the contents of the document to be read, but the user is further identified and the voice reading setting is made. It is also possible to do so. For example, in a home computer, a family may be used alternately, and in such a case, the login name identifies the user. Therefore, the information for identifying whether the user is an adult or a child according to the login name is stored in advance, and even if the document has the same content, if the child is a child, read the book more slowly. If the reading is set to be the same as that given in step 1, the user can use it more comfortably.

【0036】[4.6]第6変形例 俳句や短歌のように字数およびある程度読み方に定めが
あるような文書の場合には、専用の音声読み上げ設定を
行うようにすることが可能である。例えば、俳句の場
合、5音、7音、5音単位ではっきりと区切るような音
声設定を行えばよい。
[4.6] Sixth Modified Example In the case of a document such as haiku or tanka in which the number of characters and the reading method are defined to some extent, it is possible to make a dedicated voice reading setting. For example, in the case of haiku, voice settings may be set so as to be clearly divided into units of 5, 7, and 5.

【0037】[4.7]第7変形例 以上の説明においては、読み上げ設定は予め定めてお
き、ユーザの好みに応じて設定を変更できる旨を述べた
が、ユーザが設定を変更した場合に元の設定も保存して
おき、カテゴリ判別時の状態(例えば、どのようなキー
ワード分布をしていたか等)を学習しておき、同様の判
別状態が検出された場合に、ユーザの変更後の設定を用
いるようにし、一般的な判別状態の場合には元の設定を
用いるようにすることも可能である。
[4.7] Seventh Modification In the above description, it is stated that the reading setting is predetermined and the setting can be changed according to the preference of the user. However, when the user changes the setting. The original settings are also saved, the state at the time of category discrimination (for example, what kind of keyword distribution was used, etc.) is learned, and if a similar discrimination state is detected, the user's change It is also possible to use the settings and use the original settings in the case of a general determination state.

【0038】[0038]

【発明の効果】本発明によれば、あらかじめ読み上げ設
定のためのデータが含まれていない場合であっても、読
み上げ対象の文章が属するカテゴリに応じて音声読み上
げの設定がなされるため、ユーザに手間をかけることな
く、また、人工的な音声合成であることをあまり認識す
ることなく、音声読み上げを快適に利用することができ
る。また、読み上げ対象の文章が属するカテゴリに基づ
いて音声読み上げ設定がなされるため、ユーザの内容理
解の一助とすることができる。
According to the present invention, even if the data for reading setting is not included in advance, the reading of voice is set according to the category to which the sentence to be read belongs. It is possible to comfortably use the voice reading without trouble and without recognizing artificial voice synthesis. Further, since the voice reading setting is made based on the category to which the sentence to be read out belongs, it is possible to help the user to understand the content.

【図面の簡単な説明】[Brief description of drawings]

【図1】 実施形態の文書読み上げ装置の概要構成ブロ
ック図である。
FIG. 1 is a schematic configuration block diagram of a document reading device according to an embodiment.

【図2】 文書読み上げ装置本体の概要構成ブロック図
である。
FIG. 2 is a schematic configuration block diagram of a document reading device main body.

【図3】 ブラウザ表示画面の一例を説明するための図
である。
FIG. 3 is a diagram for explaining an example of a browser display screen.

【図4】 カテゴリ定義データベースの一例を説明する
ための図である。
FIG. 4 is a diagram illustrating an example of a category definition database.

【図5】 読み上げ設定定義データベースの一例を説明
するための図である。
FIG. 5 is a diagram illustrating an example of a reading setting definition database.

【図6】 読み上げ処理の処理フローチャートである。FIG. 6 is a processing flowchart of reading processing.

【図7】 設定変更ダイアログボックスの表示例であ
る。
FIG. 7 is a display example of a setting change dialog box.

【図8】 読み上げ設定変更処理のフローチャートであ
る。
FIG. 8 is a flowchart of a reading setting changing process.

【図9】 メール表示画面の一例を説明するための図で
ある。
FIG. 9 is a diagram illustrating an example of a mail display screen.

【図10】 他のカテゴリ定義データベースの一例を説
明するための図である。
FIG. 10 is a diagram for explaining an example of another category definition database.

【符号の説明】[Explanation of symbols]

10……文書読み上げ装置 11……文書読み上げ装置本体 12……データ入力部 13……ディスプレイ部 14……出力部 CDDB……カテゴリ定義データベース RDDB……読み上げ設定定義データベース 10: Document reading device 11 ... Document reading device body 12 ... Data input section 13 ... Display section 14 ... Output section CDDB: Category definition database RDDB: Reading setting definition database

Claims (13)

【特許請求の範囲】[Claims] 【請求項1】 読み上げ対象文書の音声読み上げを行う
ための設定を行う音声読み上げ設定装置において、 前記読み上げ対象文書の属するカテゴリを判別する判別
部と、 前記読み上げ対象文書に対し、判別結果のカテゴリに対
応する音声読み上げ設定を行う設定部と、 を備えたことを特徴とする音声読み上げ設定装置。
1. A voice reading setting device for performing a voice reading of a reading target document, comprising: a discriminating unit for discriminating a category to which the reading target document belongs; and a discrimination result category for the reading target document. A voice reading setting device comprising: a setting unit that performs voice reading setting corresponding thereto.
【請求項2】 請求項1記載の音声読み上げ設定装置に
おいて、 各カテゴリに対応する音声読み上げ設定を予め記憶する
設定記憶部を備え、 前記設定部は、前記設定記憶部を参照して前記音声読み
上げ設定を行う、ことを特徴とする音声読み上げ設定装
置。
2. The voice reading setting device according to claim 1, further comprising a setting storage unit that stores in advance voice reading settings corresponding to each category, and the setting unit refers to the setting storage unit to read the voice reading. A voice-to-speech setting device characterized by making settings.
【請求項3】 請求項1記載の音声読み上げ設定装置に
おいて、 前記判別部は、前記読み上げ対象文書の内容を解析する
解析部を備えたことを特徴とする音声読み上げ設定装
置。
3. The voice reading setting device according to claim 1, wherein the determination unit includes an analysis unit that analyzes the content of the reading target document.
【請求項4】 請求項3記載の音声読み上げ設定装置に
おいて、 前記解析部は、前記読み上げ対象文書あるいは特定文書
の一部を前記読み上げ対象文書とする場合には前記特定
文書に含まれるキーワード、表題、当該読み上げ対象文
書のリンク先情報、URL、画像内容の少なくともいず
れか一つに基づいて前記読み上げ対象文書の内容を解析
することを特徴とする音声読み上げ設定装置。
4. The read-aloud setting device according to claim 3, wherein, when the analysis unit sets a part of the reading target document or a specific document as the reading target document, a keyword and a title included in the specific document. A voice reading setting device which analyzes the content of the reading target document based on at least one of link destination information, URL, and image content of the reading target document.
【請求項5】 請求項1ないし請求項4のいずれかに記
載の音声読み上げ設定装置と、 前記読み上げ対象文書に対応する読み上げ対象文書デー
タおよび前記音声読み上げ設定に基づいて音声読み上げ
を行う音声読み上げ部を備えたことを特徴とする音声読
み上げ装置。
5. The voice reading setting device according to claim 1, and a voice reading unit that performs voice reading based on the reading target document data corresponding to the reading target document and the voice reading setting. A voice reading device characterized by comprising.
【請求項6】 請求項5記載の音声読み上げ装置におい
て、 前記音声読み上げの際に前記音声読み上げ設定を表示す
る設定表示部と、 前記音声読み上げ設定をユーザが変更する設定変更部
と、 前記音声読み上げ設定の変更を前記読み上げ設定装置側
に反映させる設定更新部と、 を備えたことを特徴とする音声読み上げ装置。
6. The voice reading device according to claim 5, wherein a setting display unit that displays the voice reading setting when the voice is read, a setting changing unit that allows the user to change the voice reading setting, and the voice reading. A voice reading device, comprising: a setting updating unit for reflecting a setting change on the reading setting device side.
【請求項7】 読み上げ対象文書の音声読み上げを行う
ための設定を行う音声読み上げ設定方法において、 前記読み上げ対象文書の属するカテゴリを判別する判別
過程と、 前記読み上げ対象文書に対し、判別結果のカテゴリに対
応する音声読み上げ設定を行う設定過程と、 を備えたことを特徴とする音声読み上げ設定方法。
7. A voice reading setting method for performing a voice reading of a reading target document, comprising a determination step of determining a category to which the reading target document belongs, and a determination result category for the reading target document. A voice reading setting method characterized by comprising a setting process for performing the corresponding voice reading setting.
【請求項8】 請求項7記載の音声読み上げ設定方法に
おいて、 各カテゴリに対応する音声読み上げ設定を予め記憶する
設定記憶過程を備え、 前記設定過程は、前記設定記憶過程で記憶した音声読み
上げ設定を参照して前記音声読み上げ設定を行う、 ことを特徴とする音声読み上げ設定方法。
8. The voice reading setting method according to claim 7, further comprising a setting storing step of storing in advance voice reading setting corresponding to each category, wherein the setting step stores the voice reading setting stored in the setting storing step. A voice reading setting method, wherein the voice reading setting is performed with reference to the voice reading setting.
【請求項9】 請求項7記載の音声読み上げ設定方法に
おいて、 前記判別過程は、前記読み上げ対象文書の内容を解析す
る解析過程を備えたことを特徴とする音声読み上げ設定
方法。
9. The voice reading setting method according to claim 7, wherein the determining step includes an analyzing step of analyzing the content of the reading target document.
【請求項10】 請求項9記載の音声読み上げ設定方法
において、 前記解析過程は、前記読み上げ対象文書あるいは特定文
書の一部を前記読み上げ対象文書とする場合には前記特
定文書に含まれるキーワード、表題、当該読み上げ対象
文書のリンク先情報、URL、画像内容の少なくともい
ずれか一つに基づいて前記読み上げ対象文書の内容を解
析することを特徴とする音声読み上げ設定方法。
10. The voice reading setting method according to claim 9, wherein in the analyzing step, when a part of the reading target document or the specific document is set as the reading target document, a keyword and a title included in the specific document are included. A voice reading setting method characterized by analyzing the content of the reading target document based on at least one of link destination information, URL, and image content of the reading target document.
【請求項11】 コンピュータに読み上げ対象文書の音
声読み上げを行わせるための設定を行う音声読み上げ設
定プログラムにおいて、 前記読み上げ対象文書の属するカテゴリを判別させ、 前記読み上げ対象文書に対し、判別結果のカテゴリに対
応する音声読み上げ設定を行わせる、 ことを特徴とする音声読み上げ設定プログラム。
11. A voice reading setting program for setting a computer to read a voice of a reading target document, to discriminate a category to which the reading target document belongs, and to determine a category of a discrimination result for the reading target document. A voice-to-speech setting program that allows you to set the corresponding voice-to-speech settings.
【請求項12】 請求項11記載の音声読み上げ設定プ
ログラムにおいて、 各カテゴリに対応する音声読み上げ設定を予め記憶さ
せ、 前記設定過程は、前記設定記憶過程で記憶した音声読み
上げ設定を参照させて前記音声読み上げ設定を行わせ
る、 ことを特徴とする音声読み上げ設定プログラム。
12. The voice-reading setting program according to claim 11, wherein voice-reading settings corresponding to each category are stored in advance, and in the setting process, the voice-reading setting stored in the setting storing process is referred to to read the voice. A voice-to-speech setting program characterized in that it allows you to make speech settings.
【請求項13】 請求項11または請求項12のいずれ
かに記載の音声読み上げ設定プログラムを記録したこと
を特徴とする記録媒体。
13. A recording medium on which the voice reading setting program according to claim 11 or 12 is recorded.
JP2001230180A 2001-07-30 2001-07-30 Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium Withdrawn JP2003044072A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001230180A JP2003044072A (en) 2001-07-30 2001-07-30 Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001230180A JP2003044072A (en) 2001-07-30 2001-07-30 Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium

Publications (1)

Publication Number Publication Date
JP2003044072A true JP2003044072A (en) 2003-02-14

Family

ID=19062425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001230180A Withdrawn JP2003044072A (en) 2001-07-30 2001-07-30 Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium

Country Status (1)

Country Link
JP (1) JP2003044072A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013072957A (en) * 2011-09-27 2013-04-22 Toshiba Corp Document read-aloud support device, method and program
WO2013061718A1 (en) * 2011-10-28 2013-05-02 日立公共システムエンジニアリング株式会社 Apparatus for providing text data with synthesized voice information and method for providing text data
JP2014130211A (en) * 2012-12-28 2014-07-10 Brother Ind Ltd Speech output device, speech output method, and program
JP2020009249A (en) * 2018-07-10 2020-01-16 Line株式会社 Information processing method, information processing device, and program
WO2023022206A1 (en) * 2021-08-18 2023-02-23 日本電信電話株式会社 Voice synthesis device, voice synthesis method, and voice synthesis program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013072957A (en) * 2011-09-27 2013-04-22 Toshiba Corp Document read-aloud support device, method and program
WO2013061718A1 (en) * 2011-10-28 2013-05-02 日立公共システムエンジニアリング株式会社 Apparatus for providing text data with synthesized voice information and method for providing text data
JP2013097033A (en) * 2011-10-28 2013-05-20 Hitachi Government & Public Corporation System Engineering Ltd Apparatus for providing text data with synthesized voice information and method for providing text data
JP2014130211A (en) * 2012-12-28 2014-07-10 Brother Ind Ltd Speech output device, speech output method, and program
JP2020009249A (en) * 2018-07-10 2020-01-16 Line株式会社 Information processing method, information processing device, and program
JP7179512B2 (en) 2018-07-10 2022-11-29 Line株式会社 Information processing method, information processing device, and program
WO2023022206A1 (en) * 2021-08-18 2023-02-23 日本電信電話株式会社 Voice synthesis device, voice synthesis method, and voice synthesis program

Similar Documents

Publication Publication Date Title
US7062437B2 (en) Audio renderings for expressing non-audio nuances
US6334102B1 (en) Method of adding vocabulary to a speech recognition system
US6181351B1 (en) Synchronizing the moveable mouths of animated characters with recorded speech
US6564186B1 (en) Method of displaying information to a user in multiple windows
US7809117B2 (en) Method and system for processing messages within the framework of an integrated message system
JP3142803B2 (en) A text-to-speech synthesizer
US8326629B2 (en) Dynamically changing voice attributes during speech synthesis based upon parameter differentiation for dialog contexts
US7440900B2 (en) Voice message processing system and method
JP4745036B2 (en) Speech translation apparatus and speech translation method
KR20050012743A (en) Context searchable communications
WO2007043566A1 (en) Voice recognition system, voice recognition method, and program
US6253177B1 (en) Method and system for automatically determining whether to update a language model based upon user amendments to dictated text
Campbell Conversational speech synthesis and the need for some laughter
JP7200533B2 (en) Information processing device and program
JP3595041B2 (en) Speech synthesis system and speech synthesis method
JP2003044072A (en) Voice reading setting device, voice reading device, voice reading setting method, voice reading setting program and recording medium
CN112185341A (en) Dubbing method, apparatus, device and storage medium based on speech synthesis
CN1292400C (en) Expression figure explanation treatment method for text and voice transfer system
KR20190083438A (en) Korean dialogue apparatus
JP3691773B2 (en) Sentence analysis method and sentence analysis apparatus capable of using the method
JPH10171485A (en) Voice synthesizer
JP6843689B2 (en) Devices, programs and methods for generating contextual dialogue scenarios
JPH08272388A (en) Device and method for synthesizing voice
TWI358649B (en) System and method for speech translation between c
Hempel Usability of speech dialog systems: listening to the target audience

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070402

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007