JPS62208125A - Sentence reading device - Google Patents

Sentence reading device

Info

Publication number
JPS62208125A
JPS62208125A JP61051943A JP5194386A JPS62208125A JP S62208125 A JPS62208125 A JP S62208125A JP 61051943 A JP61051943 A JP 61051943A JP 5194386 A JP5194386 A JP 5194386A JP S62208125 A JPS62208125 A JP S62208125A
Authority
JP
Japan
Prior art keywords
reading
sentence
silent
text
silence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61051943A
Other languages
Japanese (ja)
Other versions
JPS6349244B2 (en
Inventor
Fukami Kamiyama
神山 ふかみ
Makoto Sueda
末田 信
Tetsuo Tamura
田村 鉄夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61051943A priority Critical patent/JPS62208125A/en
Publication of JPS62208125A publication Critical patent/JPS62208125A/en
Publication of JPS6349244B2 publication Critical patent/JPS6349244B2/ja
Granted legal-status Critical Current

Links

Abstract

PURPOSE:To attain reading to be easily listened by inserting silent codes into a sentence reading string in accordance with previously set conditions. CONSTITUTION:When a sentence consisting of a character string is inputted from a document input part 11, a sentence analyzing part 12 analyzes the sentence while referring a reading dictionary 13 to execute word identification processing 121. Then, silent insertion condition deciding processing 122 is executed in accordance with previously set condition such as the continuation of the same vowel on a border of words or the continuation of specified word groups such as numerals and reading string forming processing 123 for a reading string into which a necessary silent part is inserted is executed. The reading string processed by said processing is outputted as voice through a reading string storing part 14, a voice output part 15, and so on. Thus, sentence reading to be easily listened can be attained by inserting required silent parts.

Description

【発明の詳細な説明】 〔概要〕 文章読上げ装置から出力される文章の読上げ音声中で、
単語間が母音同士で接続されたりすると。
[Detailed Description of the Invention] [Summary] In the text reading voice output from the text reading device,
When words are connected by vowels.

癒着して聞き分けにくくなる場合があるため、必要に応
じて、単語間に無音区間を挿入できるようにする。
Since words may coalesce and become difficult to distinguish, it is possible to insert silent intervals between words as necessary.

〔産業上の利用分野〕[Industrial application field]

本発明は2表記された文章を入力して読上げ出力を行う
文章読上げ装置に関するものであり、特に単語区分を明
瞭にするため無音区間を挿入する読み列生成方式に関す
る。
The present invention relates to a text reading device that inputs a sentence written in binary notation and outputs it aloud, and particularly relates to a reading string generation method that inserts silent intervals to clarify word divisions.

〔従来の技術〕[Conventional technology]

一般の日本語文の形で表記された文章を文字入力し、そ
の正しい読みを音声出力する文章読上げ装置は1文書の
確認や校正などの多くの用途において、有用なものとし
て、最近注目されている。
Text-to-speech devices that input sentences written in the form of ordinary Japanese sentences and output the correct pronunciation aloud have recently been attracting attention as useful for many purposes such as checking and proofreading a single document. .

日本語文では、1つの漢字に音訓等の複数の“読み”が
存在している場合が多く、意味や連続する単語と単語と
の関係などで用法が異なり、さらには、濁音変化や、音
便変化等が生じうるため。
In Japanese sentences, a single kanji often has multiple readings, such as onkun, and the usage differs depending on the meaning and the relationship between consecutive words. Because changes may occur.

文章に対応する正しい“読み”を確定するためには1文
章についての多面的な解析が必要とされる。
In order to determine the correct "reading" for a sentence, a multifaceted analysis of a single sentence is required.

第3図は、従来の文章読上げ装置の基本的な構成を示し
たものである。
FIG. 3 shows the basic configuration of a conventional text reading device.

図において、31は文章入力部、32は文章解析部。In the figure, 31 is a text input section, and 32 is a text analysis section.

33は読み辞書、34は読み列格納部、35は音声出力
部である。
33 is a reading dictionary, 34 is a reading sequence storage section, and 35 is an audio output section.

文章入力部31は、キーボード等を用いて日本語文章を
入力する。
The text input unit 31 inputs Japanese text using a keyboard or the like.

文章解析部32は、読み辞書33を用いて入力された文
章データを解析し、各単語を同定してその読み列を作成
し、読み列格納部34に格納する。文章中の単語の同定
は、読み辞書33から候補単語を取り出し1文章データ
との間でDPマツチングを行って、最適な単語の組合わ
せを選択する方法で行われる。
The text analysis unit 32 analyzes the input text data using the reading dictionary 33, identifies each word, creates a pronunciation sequence thereof, and stores the pronunciation sequence in the pronunciation sequence storage unit 34. Identification of words in a sentence is performed by extracting candidate words from the reading dictionary 33 and performing DP matching with one sentence data to select an optimal combination of words.

読み辞書33には、i語の表記とその読み、用法等の文
法が登録されている。単語には、漢字語。
In the reading dictionary 33, the notation of the i-word, its pronunciation, usage, and other grammar are registered. The words are kanji words.

カタカナ語、漢字かなまじり語などが含まれる。Includes katakana, kanji, kana, and other words.

音声出力部35は、読み列格納部34から文章の読み列
を取り出し、音声合成を行って、音声出力する。
The audio output unit 35 takes out the pronunciation of the sentence from the pronunciation storage unit 34, performs speech synthesis, and outputs the result as a voice.

このようにして、任意の表記された文章を読上げ装置に
入力すれば、その適切な読み列が自動的に作成され、読
上げが行われる。
In this way, if any written text is input into the reading device, an appropriate reading sequence will be automatically created and the text will be read aloud.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

従来の文章読上げ装置では1作成した読み列の中に母音
が連続していると、読上げの際に、音声合成上の理由か
ら、それらは母音の長音として発声され、たとえば「ア
ア」という表記と「アー」という表記とに対応する発声
は、いずれも“アー”となって9表記の違いを区別して
聞き取ることができなかった。具体例をあげると、「砂
糖売り」は“サトーリ”と発声される。また、別の例と
して、数字が連続する表記、たとえばr2222」は、
読上げ時に“ニーニーニーニー”と発声され、聞き分け
にくいという問題があった。
With conventional sentence reading devices, if there are consecutive vowels in a created reading sequence, for reasons of speech synthesis, they are uttered as long vowels during reading, such as the notation ``aa''. The utterances corresponding to the notation "ah" were all "ah", and it was not possible to distinguish and hear the difference between the nine notations. To give a specific example, "sugar seller" is pronounced as "satori." In addition, as another example, a notation with consecutive numbers, such as "r2222", is
There was a problem with the words being uttered as "nee nee nee nee" when being read aloud, making them difficult to distinguish.

〔問題点を解決するための手段〕[Means for solving problems]

本発明は2文章解析の際、読み列中の必要部分に無音コ
ードを挿入できるようにして、読上げ発声中に無音区間
を設定し、単語の聞き分けを容易にするものである。
The present invention makes it possible to insert silence codes into necessary parts of the reading sequence when analyzing two sentences, and sets silent intervals during reading aloud, thereby making it easier to distinguish between words.

第1図に1本発明の原理的構成を示す。FIG. 1 shows the basic configuration of the present invention.

図において、 11は文章入力部、12は文章解析部。In the figure, 11 is a text input section, and 12 is a text analysis section.

13は読み辞書、 14は読み列格納部、15は音声出
力部、121は単語同定処理、122は無音挿入条件判
定処理、123は読み列作成処理を示す。
13 is a reading dictionary; 14 is a reading sequence storage unit; 15 is an audio output unit; 121 is a word identification process; 122 is a silence insertion condition determination process; and 123 is a reading sequence creation process.

文章入力部11は、読上げるべき文章の表記を入力し、
漢字コードの文字列データとして文章解析部12に供給
する。
The text input unit 11 inputs the notation of the text to be read out,
It is supplied to the text analysis section 12 as character string data of Kanji code.

文章解析部12は、入力された文字列データを種々に区
分し、読み辞書13を検索して、単語同定処理121を
行い1次に同定された単語列を解析し。
The text analysis unit 12 divides the input character string data into various types, searches the reading dictionary 13, performs word identification processing 121, and analyzes the primary identified word string.

単語間母音接・続や連続数字などの所定の無音コード挿
入条件に合致する部分を識別し、無音コード挿入位置を
指示する無音挿入条件判定処理122を行う。このよう
にして、同定された単語列および無音コード挿入指示に
したがって、読み列作成処理123を行う。
Silence insertion condition determination processing 122 is performed to identify a portion that matches a predetermined silence code insertion condition such as inter-word vowel connection/continuation or continuous digits, and to specify a silence code insertion position. In this manner, the reading sequence creation process 123 is performed according to the identified word sequence and the silent code insertion instruction.

読み列格納部14は文章解析部12により作成された読
み列データを一旦蓄積する。
The reading sequence storage unit 14 temporarily stores the reading sequence data created by the text analysis unit 12.

音声出力部15は、読み列格納部14に蓄積されている
読み列データを読み出し、音声合成して音声出力する。
The audio output unit 15 reads out the reading sequence data stored in the reading sequence storage unit 14, synthesizes the data, and outputs the voice.

その際、読み列データ中に無音コードが存在すれば、そ
の位置に適当な一定の無音区間を挿入して音声出力を区
切る。
At this time, if a silence code exists in the pronunciation sequence data, an appropriate fixed silence interval is inserted at that position to delimit the audio output.

〔作用〕[Effect]

本発明によれば、読上げ時に無音区間を挿入する条件を
予め設定しておくことにより、任意の表記された文章に
ついて、読み列中に無音コードを挿入し、その読上げ発
声中に無音区間による区切りを入れることができる。
According to the present invention, by setting in advance the conditions for inserting a silent section when reading aloud, a silent code can be inserted in the reading sequence for any written text, and the silent section can be used as a delimiter during the reading. can be entered.

無音コードを挿入する条件としては、同定された単語列
中の順次の単語の境界で同じ母音と母音とが接している
場合、数字などの予め指定されている単語のグループが
連続している場合、その他任意の条件が使用できる。こ
のような条件に合致する単語列が検出された場合、該当
する単語間に無音コードが挿入される。
The conditions for inserting a silent code are when the same vowel is in contact with the same vowel at the boundary between successive words in the identified word string, or when pre-specified word groups such as numbers are consecutive. , any other conditions can be used. When a word string matching these conditions is detected, a silence code is inserted between the corresponding words.

特定の単語のグループを指定する方法としては。As a way to specify a specific group of words.

読み辞書中でフラグ等により識別可能にする方法。A method of making it identifiable using flags, etc. in the reading dictionary.

あるいは別にテーブルでもつ方法などがある。Alternatively, there is another way to hold it on a table.

また無音コードの挿入は、無音コードを挿入する可能性
のある各単語に、無音コードを付加したものと付加しな
いものとの2種類を読み辞書中に登録しておき、無音コ
ード挿入の条件判定結果にしたがっていずれか一方を選
択することにより挿入する方法が簡単であるが、読み辞
書内の単語を無音コードなしのもののみとし9条件判定
結果にしたがってプログラムにより無音コードを付加す
る方法も可能である。
In addition, to insert a silence code, read two types of words for which a silence code may be inserted, one with and without a silence code, and register them in the dictionary, and then judge the conditions for inserting a silence code. The simplest method is to select one of the words according to the results, but it is also possible to insert only words without silence codes in the reading dictionary and add silence codes by program according to the results of the 9-condition judgment. be.

〔実施例〕〔Example〕

第2図に本発明の1実施例の構成を示す。 FIG. 2 shows the configuration of one embodiment of the present invention.

第2図に示されている構成は、第1図の構成を基礎とし
ており、参照番号も同じものが使用されている。ただし
、説明を具体的なレベルで行う必要から1文章解析部1
2中に、細部の手順が追加して示されている。
The configuration shown in FIG. 2 is based on the configuration in FIG. 1, and the same reference numerals are used. However, because it is necessary to explain at a concrete level, 1 sentence analysis section 1
2, additional detailed steps are shown.

読み辞書13には、砂、砂糖、砂漠・・・や1図示を省
略されているが数字1.2.・・・、9等の区切(無音
)を入れて発音することが望まれる単語には。
Reading Dictionary 13 includes sand, sugar, desert... and numbers 1, 2, etc., although illustrations are omitted. ..., for words that should be pronounced with a 9th grade (silence).

予め無音コードを付けないものと付けたものとの2種類
を用意して置き、いずれか一方を選択可能にする。勿論
、必ず区切りを入れて発声することが要求されている特
定の単語については、無音コード付きのもののみとする
ことができる。
Two types are prepared in advance, one without a silent code and one with one, and one of them can be selected. Of course, for specific words that must be uttered with breaks, only those with silence codes can be used.

文章入力部11から入力された文章の表記に基づく文字
列データは2文章解析部12の単語同定処理121にお
いて、まず種々に区分され、読み辞書13を検索する。
The character string data based on the notation of the sentence inputted from the sentence input section 11 is first classified into various types in the word identification process 121 of the two-sentence analysis section 12, and then the reading dictionary 13 is searched.

検索の結果、複数の候補単語が得られ、これらの検索結
果の単語は、単語ラティステーブルと呼ばれるテーブル
に順次的に格納される。
As a result of the search, a plurality of candidate words are obtained, and these search result words are sequentially stored in a table called a word lattice table.

続いて、単語ラティステーブル内の単語について照合を
行って、入力文章に対応する最適な単語列を確定する。
Next, the words in the word lattice table are compared to determine the optimal word string corresponding to the input sentence.

次の無音挿入条件判定処理122においては、確定され
た単語列を対象に、無音コード挿入のための条件をチェ
ックし1条件を充たす単語間には。
In the next silence insertion condition determination process 122, conditions for inserting a silence code are checked for the determined word string, and between words that satisfy one condition.

無音コードを挿入する指示を行う。Instructs to insert a silence code.

次の読み列作成処理においては、無音コード挿入指示を
伴う単語列に基づいて読み列データを作成する。ここで
無音コード挿入指示があった読み列中の位置には、無音
コードが挿入される。たとえば、「砂糖売り場」の表記
に対応する読み列は。
In the next pronunciation sequence creation process, pronunciation data is created based on the word string accompanied by a silent code insertion instruction. Here, the silence code is inserted at the position in the reading sequence where the silence code insertion instruction was given. For example, the reading sequence that corresponds to the notation "sugar counter" is:

サトウ・無音コード・ウリバとなる。Sato, silent code, and Uriba.

作成された読み列データは、読み列格納部14に一旦格
納された後、音声出力部15において音声合成され、無
音コードには無音区間(ポーズ)が設定されて、音声出
力される。たとえば、上記の「砂糖売り場」の例では“
サトウ”と“ウリバの間に無音区間が置かれ、単語間の
区切が行われる。
The created pronunciation data is once stored in the pronunciation storage unit 14, and then is synthesized into speech in the audio output unit 15, and a silent section (pause) is set in the silent code and output as audio. For example, in the “sugar counter” example above, “
A silent section is placed between "Sato" and "Uriba" to separate the words.

無音コードに対応する無音区間の長さは、予め適当な長
さに設定されている。しかし、複数の無音コードを連続
挿入することにより、無音区間を任意に延ばすことが可
能である。また無音コードを複数種設けて、無音区間の
長さを任意に指定できるようにすることも可能である。
The length of the silent section corresponding to the silent code is set to an appropriate length in advance. However, by continuously inserting a plurality of silence codes, it is possible to extend the silence interval arbitrarily. It is also possible to provide a plurality of types of silence codes so that the length of the silence section can be specified arbitrarily.

〔発明の効果〕〔Effect of the invention〕

本発明により1文章読上げ装置から発声出力される読み
列について、単語の聞き分けが容易となり、読上げ校正
に利用される場合など9作業能率と信頼性との向上が可
能となる。
According to the present invention, it becomes easy to distinguish between words in a reading sequence outputted from a single-sentence reading device, and work efficiency and reliability can be improved when the reading sequence is used for reading proofreading.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の原理的構成図、第2図は本発明の1実
施例の構成図、第3図は従来例装置の基本構成図である
。 第1図中。 11:文章入力部 12:文章解析部 13:読み辞書 14:読み列格納部 15:音声出力部 121:単語同定処理 122:無音挿入条件判定処理 123:読み列作成処理
FIG. 1 is a basic configuration diagram of the present invention, FIG. 2 is a configuration diagram of one embodiment of the present invention, and FIG. 3 is a basic configuration diagram of a conventional device. In Figure 1. 11: Text input unit 12: Text analysis unit 13: Reading dictionary 14: Reading sequence storage unit 15: Audio output unit 121: Word identification process 122: Silence insertion condition determination process 123: Reading sequence creation process

Claims (1)

【特許請求の範囲】 表記された単語についてその読みを与える読み辞書と文
章解析部とをそなえ、前記文章解析部は表記された文章
を入力として前記読み辞書により文章解析し、文章の読
み列を生成して音声出力する文章読上げ装置において、 前記文章解析部は、文章解析の結果確定した単語の読み
に無音コードを挿入する手段を有し、無音コード挿入条
件の判定結果にしたがって読み列に無音コードを挿入す
ることを特徴とする文章読上げ装置。
[Scope of Claims] A pronunciation dictionary that provides the pronunciation of a written word and a sentence analysis unit are provided, and the text analysis unit receives the written text as input and analyzes the text using the reading dictionary, and generates a pronunciation sequence of the sentence. In the text reading device that generates and outputs audio, the text analysis unit includes means for inserting a silence code into the pronunciation of the word determined as a result of the text analysis, and inserts silence into the pronunciation sequence according to the determination result of the silence code insertion condition. A text reading device that is characterized by inserting a code.
JP61051943A 1986-03-10 1986-03-10 Sentence reading device Granted JPS62208125A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61051943A JPS62208125A (en) 1986-03-10 1986-03-10 Sentence reading device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61051943A JPS62208125A (en) 1986-03-10 1986-03-10 Sentence reading device

Publications (2)

Publication Number Publication Date
JPS62208125A true JPS62208125A (en) 1987-09-12
JPS6349244B2 JPS6349244B2 (en) 1988-10-04

Family

ID=12900951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61051943A Granted JPS62208125A (en) 1986-03-10 1986-03-10 Sentence reading device

Country Status (1)

Country Link
JP (1) JPS62208125A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10558943B2 (en) 2016-04-20 2020-02-11 Wishelf Ltd. System and method for monitoring stocking shelves

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55130600A (en) * 1979-03-30 1980-10-09 Sharp Kk Voice output equipment
JPS57192999A (en) * 1981-05-25 1982-11-27 Tokyo Shibaura Electric Co Voice output unit
JPS5972540A (en) * 1982-10-20 1984-04-24 Hitachi Ltd Audio response unit
JPS59123890A (en) * 1982-12-29 1984-07-17 富士通株式会社 Voice editing/synthesization output system
JPS59165097A (en) * 1983-03-11 1984-09-18 株式会社東芝 Outputting of voice data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55130600A (en) * 1979-03-30 1980-10-09 Sharp Kk Voice output equipment
JPS57192999A (en) * 1981-05-25 1982-11-27 Tokyo Shibaura Electric Co Voice output unit
JPS5972540A (en) * 1982-10-20 1984-04-24 Hitachi Ltd Audio response unit
JPS59123890A (en) * 1982-12-29 1984-07-17 富士通株式会社 Voice editing/synthesization output system
JPS59165097A (en) * 1983-03-11 1984-09-18 株式会社東芝 Outputting of voice data

Also Published As

Publication number Publication date
JPS6349244B2 (en) 1988-10-04

Similar Documents

Publication Publication Date Title
US6208968B1 (en) Computer method and apparatus for text-to-speech synthesizer dictionary reduction
US5765131A (en) Language translation system and method
US6076060A (en) Computer method and apparatus for translating text to sound
US6094633A (en) Grapheme to phoneme module for synthesizing speech alternately using pairs of four related data bases
US5995931A (en) Method for modeling and recognizing speech including word liaisons
JPH1039895A (en) Speech synthesising method and apparatus therefor
JP2002149643A (en) Method for predicting reading of japanese ideogram
JP2002278579A (en) Voice data retrieving device
JPH06282290A (en) Natural language processing device and method thereof
JP3371761B2 (en) Name reading speech synthesizer
JPS62208125A (en) Sentence reading device
JP2595934B2 (en) Kana-Kanji conversion processor
JPH07262191A (en) Word dividing method and voice synthesizer
JPH11338498A (en) Voice synthesizer
JPS62119591A (en) Sentence reciting apparatus
JP3414326B2 (en) Speech synthesis dictionary registration apparatus and method
JPH096378A (en) Text voice conversion device
JP2801601B2 (en) Text-to-speech synthesizer
KR20010077042A (en) Speech recognition apparatus with tree style wordbook
JP2996978B2 (en) Text-to-speech synthesizer
JP3573889B2 (en) Audio output device
KR0136423B1 (en) Phonetic change processing method by validity check of sound control symbol
JPH04127199A (en) Japanese pronunciation determining method for foreign language word
JP2721341B2 (en) Voice recognition method
JPH06289890A (en) Natural language processor