JPS62119591A - Sentence reciting apparatus - Google Patents

Sentence reciting apparatus

Info

Publication number
JPS62119591A
JPS62119591A JP60260303A JP26030385A JPS62119591A JP S62119591 A JPS62119591 A JP S62119591A JP 60260303 A JP60260303 A JP 60260303A JP 26030385 A JP26030385 A JP 26030385A JP S62119591 A JPS62119591 A JP S62119591A
Authority
JP
Japan
Prior art keywords
sentence
section
text
unknown word
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60260303A
Other languages
Japanese (ja)
Other versions
JPH0634175B2 (en
Inventor
神山 ふかみ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60260303A priority Critical patent/JPH0634175B2/en
Publication of JPS62119591A publication Critical patent/JPS62119591A/en
Publication of JPH0634175B2 publication Critical patent/JPH0634175B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔発明の概要〕 本発明は表記された文章を辞書部の単語等とマツチング
をとりながら単語等を同定し、読みに変換し音声合成部
において文章を読上げる文章読上げ装置に関する。
[Detailed Description of the Invention] [Summary of the Invention] The present invention identifies words by matching written sentences with words in a dictionary section, converts them into pronunciations, and reads out the sentences in a speech synthesis section. Regarding equipment.

従来、この種の文章読上げ装置において文章中のあるカ
タカナや平仮名は・辞書中の単語等とマツチングがとれ
ないために単語の同定に失敗し正しい文章を読上げるこ
とが出来なくなる場合があった。本発明の文章読上げ装
置においては、辞書部に存在していないカタカナまたは
平板名文字列が=2= 文章中に存在した場合、そこでIW析を一時ス1−ノブ
し文章を後方に男−チし辞書部に存在する単語の始まり
を検出し、そこからM°析を再開し、無視した前記力タ
カリ・や平仮名の未知語に対しては一字ずつ読みに変換
し、音声合成部に入力して文章を読上げて正しい文章を
読−にげる訪」二げ装置を提供している。
Conventionally, in this type of text reading device, certain katakana or hiragana characters in a text cannot be matched with words in a dictionary, so word identification may fail and the correct text may not be read aloud. In the text reading device of the present invention, if a katakana or plain name character string that does not exist in the dictionary part exists in the text, the IW analysis is temporarily scrolled and the text is read backwards. Then, the beginning of the word existing in the dictionary section is detected, the M° analysis is restarted from there, and the ignored unknown words in Chikaratakari and Hiragana are converted into readings one by one and input into the speech synthesis section. The company provides a device that reads the correct text by reading the text aloud.

〔産業上の利用分野〕[Industrial application field]

本発明は日本語処理装置の構成に関し、特に単語、文節
、句等の単語等から構成される文章の各単語等を辞書部
の単語等とマツチングをとりながら単語等を同定し、音
声合成部で文章を読上げる文章読上げ装置の構成に関す
る。
The present invention relates to the configuration of a Japanese language processing device, and in particular, the present invention identifies words, etc. by matching each word, etc. of a sentence composed of words, phrases, etc. with words, etc. in a dictionary section, and identifies the words, etc. by a speech synthesis section. The present invention relates to the configuration of a text reading device that reads texts aloud.

〔従 来 技 術〕[Traditional technique]

集積化技術の発展に伴い、プロセッサ、メモリ素子ある
いはプリンタやディスク装置等の高性能化や低価格とと
もに計算機システムの性能が向上し利用形態も個別使用
のみでなくネットワークを介してシステムの多用化が進
んできた。そして入出力装置の面ではパターン認識や音
声認識の技術の進歩に伴い漢字入出力、あるいは音声入
出力等、人間とのインターフェースの改善がなされ、日
本語処理を行う専用の処理装置もOA機器として重要視
されてきた。特にワードプロセッサは文章構造の処理機
能を備え、文章の編集や保管或いは文章作成を自動的に
行う装置として普及され日本語の文章が簡単に計算機シ
ステムの外部記憶装置に記憶されるようになった。また
最近では人間の音声を音節や単語等の単位で区切って発
声させ、個々の音節や単語を認識していく、いわゆる離
散型単語装置が実用化されるようになり、音声で日本語
文章をシステムに入力することができるようになってき
た。このようなワードプロセッサや音声入力装置を用い
て入力された日本語文章を正しく入力されたかどうかを
検査したり、あるいはすでにシステムに格納された新聞
記事等を単に耳で聞く場合、機械が格納された文章を読
上げる文章読上げ装置の重要性が高まってきた。この文
章読上げ装置は文章の単語あるいは文節や句等の単語等
を辞書部の単語等とマツチングをとりながら同定し各文
章を音声合成部を介して読上げる機能を必要とする。と
ころが日本語の文章は新聞記事等に見られるようにカタ
カナ文字列の固有名詞や新語、強調のためのカタカナ書
き、あるいは漢字のかわりに平板名書きにしている文章
が非常に多く存在している。このような文章を読上げ装
置で解析する場合に、文字列(ずなわら基本的には単語
であるが文節や句でも良くこれらを総称して単語等と呼
ぶことにする)としての単語等の同定が辞書部にその単
語等が存在しないために失敗することが非常に多い。従
来この種の文童読」二げ装置においては単語等の同定に
失敗した場合には正しい文章の読上げが出来なくなると
いう欠点を有していた。
With the development of integration technology, the performance of computer systems has improved as processors, memory elements, printers, disk devices, etc. have become more efficient and cheaper, and the form of use has expanded to include not only individual use but also multipurpose use of systems via networks. It has progressed. In terms of input/output devices, advances in pattern recognition and voice recognition technology have led to improvements in the interface with humans, such as kanji input/output or voice input/output, and processing devices dedicated to Japanese processing have also been used as OA equipment. has been considered important. In particular, word processors are equipped with sentence structure processing functions and have become popular as devices that automatically edit, store, or create sentences, and Japanese sentences can now be easily stored in external storage devices of computer systems. Recently, so-called discrete word devices have been put into practical use, which recognize individual syllables and words by dividing human speech into units such as syllables and words. Now you can enter it into the system. When checking whether Japanese sentences entered using such a word processor or voice input device have been input correctly, or simply listening to newspaper articles etc. that have already been stored in the system, the machine is The importance of text reading devices that read texts aloud has increased. This text reading device needs a function to identify words of a text or words such as clauses or phrases by matching them with words in a dictionary section, and read out each sentence via a speech synthesis section. However, as seen in newspaper articles, there are many Japanese texts that use proper nouns or new words in katakana strings, katakana for emphasis, or plain names instead of kanji. . When analyzing such sentences with a reading device, it is necessary to analyze words as character strings (basically words, but clauses and phrases may also be used, and these will be collectively referred to as words). Identification very often fails because the word etc. does not exist in the dictionary section. Conventionally, this type of Bundo-yomi device has the disadvantage that if it fails to identify a word or the like, it will not be able to read out the correct sentence.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

本発明は上記従来の文章読」二げ装置の欠点を除去し辞
書部の中の単語等と入力した単語等とがマツチングがと
れなかった場合、すなわち未知語の5一 部分は一度無視して同定できる部分を解析し無視した前
記未知語に対しては一字ずつ読みに変換することにより
文章全体を正しく読上げることを可能とする読上げ装置
を提供するものである。
The present invention eliminates the shortcomings of the conventional text reading device, and when the words in the dictionary section cannot be matched with the input words, that is, parts of unknown words are ignored and identified. The present invention provides a reading device that can correctly read out the entire sentence by analyzing the possible parts and converting the ignored unknown words into readings one by one.

〔問題点を解決するための手段〕[Means for solving problems]

本発明は、上記目的を達成するために文章を格納する文
章ファイル部と、前記文章ファイル部から文章を入力又
は出力することを制御する文章入出力部と、前記文章フ
ァイル部から前記文章入出力部を介して読み出された文
章を小さな文字列の単位に分割し各単位毎に辞書部の内
容とマツチングし同定する文章解析部と、前記文章解析
部の出力である読みを音声に変換する音声合成部と、前
記文章解析部に接続され文章中で前記辞書部に存在しな
かった未知語を見つける未知語検出手段と、前記未知語
の始まりと終わりの位置を検出する位置検出部と、前記
未知語の読みを表記から作成する未知語読み変換手段と
からなり、辞書部に存在しない未知語が文章中に存在し
た場合、未知語の始まりのところで文g解析を一時停止
し文章を後方にサーチし未知語の次にくる部分から文章
解析を再開し前記未知語の読みは表記から作成すること
を特徴とする。
In order to achieve the above object, the present invention provides a text file section that stores texts, a text input/output section that controls text input or output from the text file section, and a text input/output section that controls the text input/output from the text file section. a sentence analysis section that divides the text read out through the section into small character string units and matches each unit with the contents of the dictionary section for identification; and a sentence analysis section that converts the reading output from the sentence analysis section into speech. a speech synthesis section, an unknown word detection means connected to the sentence analysis section and detecting an unknown word in a sentence that was not present in the dictionary section, and a position detection section detecting the start and end positions of the unknown word; It consists of an unknown word reading conversion means that creates the reading of the unknown word from the notation, and when an unknown word that does not exist in the dictionary section exists in a sentence, sentence g analysis is paused at the beginning of the unknown word and the sentence is read backwards. The present invention is characterized in that the sentence analysis is restarted from the part following the unknown word, and the reading of the unknown word is created from the notation.

〔作  用〕[For production]

本発明は辞書中に存在しないカタカナ、或いは平板名文
字列が文章中に存在した場合、そこで同定解析を一時ス
トップし文章を後方にサーチし、新たに同定できる単語
の始まりとわかる単語等から解析を再開し、解析を無視
した前記カタカナや平仮名は一字ずつ読みに変換し、音
声合成部に転送することにより文章を読上げるようにし
ている。
In the present invention, when a katakana character string or a plain name character string that does not exist in the dictionary is found in a sentence, identification analysis is temporarily stopped, the sentence is searched backwards, and the analysis is started from a word that is found to be the beginning of a newly identified word. The above-mentioned katakana and hiragana, which were ignored for analysis, are converted into pronunciations one by one and transferred to the speech synthesis section to read out the text.

〔実  施  例〕〔Example〕

次に本発明の文章読上げ装置の実施例を図面を参照して
説明する。
Next, an embodiment of the text reading device of the present invention will be described with reference to the drawings.

第1図は本発明の文章読上げ装置の構成ブロック図であ
る。
FIG. 1 is a block diagram of the structure of a text reading device according to the present invention.

主制御部1は汎用の計算機と同様に記憶装置内に予め貯
えられているプログラムを順次取り出してそれに従って
逐次制御を行う部分で、中央処理部と主記憶装置及び入
出力制御装置等から構成されている部分である。ディス
プレイ装置1o、キーボード入力部11は主制御部1の
中の入出力制御装置に接続され、使用者である人間と文
章読上げ装置との間で情報交換を行う部分である。文書
ファイル2は読上げるべき文書が格納されているファイ
ルであり、一般にはフロンビイディスク装置、或いはデ
ィスク装置等の外部記憶装置に記憶されている。各文書
は文書ファイル2から文書入出力部3により読出される
。この文書入出力部3は文書ファイル2の中から各文書
を主制御部1の制御のもとて文章解析部4に転送するこ
とを制御する部分である。各文章は文字列の表記として
構成され、前記文字列は基本的には単語であるが文節あ
るいは句でも良く、以下「単語等」と呼ぶことにする。
The main control unit 1 is a part that sequentially retrieves programs stored in advance in a storage device and performs sequential control according to them, similar to a general-purpose computer, and is composed of a central processing unit, a main storage device, an input/output control device, etc. This is the part where The display device 1o and the keyboard input section 11 are connected to an input/output control device in the main control section 1, and are parts for exchanging information between a human user and the text reading device. The document file 2 is a file in which a document to be read out is stored, and is generally stored in an external storage device such as a Fronbi disk device or a disk device. Each document is read from the document file 2 by the document input/output unit 3. The document input/output section 3 is a section that controls the transfer of each document from the document file 2 to the text analysis section 4 under the control of the main control section 1. Each sentence is constructed as a notation of a character string, and the character string is basically a word, but may also be a clause or a phrase, and will hereinafter be referred to as a "word, etc.".

文書ファイル2から文章入出力部3により読出された各
文章は文章解析部4において「、」、「。」など記号等
で区切られ辞書部5に格納された単語等とのマツチング
によって単語等の同定が実行される。辞書部5は例えば
漢字を入出力しこれを仮名に変換する漢字仮名変換辞書
である。文章解析部4は文章入出力部3から出力された
各文章のうち漢字等の単語が辞書部5に格納されたもの
である場合には即座に読み変換することができ、規則合
成部6に変換された読みが与えられる。規則合成部6は
前記読みに対応する情報内容を音声の形で音声出力部7
から出力できるように処理する部分である。規則合成部
6及び音声出力部7から構成される音声合成部は音声出
力のためのデータを予め分析し記IQ しておいて読み
に対応して単語等の文字列を音声で読」二げる部分であ
る。
Each sentence read from the document file 2 by the text input/output section 3 is separated by symbols such as ",", ".", etc. in the text analysis section 4, and is matched with words stored in the dictionary section 5 to find words, etc. Identification is performed. The dictionary section 5 is, for example, a kanji-kana conversion dictionary that inputs and outputs kanji and converts them into kana. If a word such as a kanji character is stored in the dictionary section 5 in each sentence outputted from the text input/output section 3, the sentence analysis section 4 can immediately convert the reading, and send the word to the rule synthesis section 6. The converted reading is given. The rule synthesis unit 6 outputs the information content corresponding to the reading in the form of voice to the audio output unit 7.
This is the part that processes it so that it can be output from. The speech synthesis section, which consists of a rule synthesis section 6 and a speech output section 7, analyzes and records the data for speech output in advance, and then reads out character strings such as words aloud in accordance with the pronunciation. This is the part that

音声合成のためのデータ分析は波形符号化や線形予測分
析等すでに種々の分析技術が用いられており、音声波形
そのものについて符号化処理を行う波形処理系の処理を
用いてもよく、また音声の生成モデルを根底としてその
制御信号をデータに用いる生成源処理系の処理を用いて
もよい。前者は単語や文節等の自然音声に含まれる音素
間の長音結合の特徴やアクセントあるいは抑揚等の特徴
がそのまま保持されるので音質がよいが予め分析しであ
る単語や文節の組み合わせ以外の音声出力は出力できな
いという欠点を有している。それに反し、後者の方法に
よれば出力したい単語や文章を音素や音節記号系列の形
で入力することになるので、任意の文章の文章に対して
合成できることになる。しかし音声のいろいろな特徴は
人工的に付加してやれらなければならないという問題が
ある。規則合成部6は特に音素あるいは音節による生成
源処理方法であり音素や音節単位の音声分析データを音
声生成モデルの制御信号に用いる形式に従っている。従
って規則合成部6は合成音の語堂数には制限がなく自然
音声に見られる長音結合や韻律特性によって音響的な性
質に関しては変形のしかたを規則化しているものである
。この音響的性質の変形を規則化し、これに基づいて制
御信号を変形することにより合成音の音質を自然音声に
非常に似たものになるように高めている。そしてこの規
則合成部6においてt;Il’v素や音節記号あるいは
文字の系列だりを文t′、?扇!析部4から読めとして
入力すればそれに対応する任意の合成音を音声出力部7
から出力するこ1とができる。規則合成部6を使って文
別ファイル2の各文章を文章IW析部4の解析のもとで
音声を合成する場合には人間が書物を朗読する過程を実
行できることが理想であるので、各文章の文字列から単
語等の境界の検出と分割を行い、検出された単語等の音
素記号列の変換過程を経て、最後に単語のアクセントあ
るいは文のイン1−ネーションの伺加を実行しなくては
ならない。また、この規則合成部6は一般に波形処理形
よりも記憶容量が減らせるが回路構成が複雑になるので
ワンチップのLSIでディジタル演算的に実行すること
によって、回路構成の複雑性を減じることが必要である
。さらに音声合成器の動作に必要な制御信号を前もって
記憶された音声データと決められた規則によって生成す
る必要がある。そのためのLSIとしてはホルマント形
とPARCOR系の2種類がある。例えばPARCOR
系音声合成LSIはそれぞれ2個ずつの除算器と加算器
とで構成された格子型ディジタルフィルタを中段程度カ
スケードに接続して音声を合成しているものである。こ
のようなLSIを用いて構成される規則合成部6は入力
の文字列が規則に従って音素系列に変換され例えば子音
→−母音十母音系のいわゆるC−V −V音節と呼ばれ
る方式に従って分割される。そして韻律的特徴に関して
は前もって記憶された音響データの格納データを使って
合成音声に対する基本周波数、振幅、あるいは音素の継
続時間等が決められる。このような規則に従った合成音
声の音質は日本語100音節に対して明瞭度は90%以
上であることが知られている。
Various analysis techniques such as waveform encoding and linear predictive analysis have already been used for data analysis for speech synthesis, and it is also possible to use a waveform processing system that encodes the speech waveform itself. Processing of a generation source processing system based on a generation model and using its control signals as data may be used. The former has good sound quality because it retains the characteristics of long sound combinations between phonemes, accents, and intonation contained in natural speech such as words and phrases, but it is not suitable for speech output other than combinations of words and phrases that have been analyzed in advance. has the disadvantage that it cannot be output. On the other hand, according to the latter method, the word or sentence to be output is input in the form of a series of phonemes or syllable symbols, so it is possible to synthesize any text. However, there is a problem in that various features of speech must be added artificially. The rule synthesis unit 6 is particularly a method for processing generation sources using phonemes or syllables, and follows a format in which speech analysis data in units of phonemes or syllables is used as a control signal for a speech production model. Therefore, the rule synthesis section 6 has no limit to the number of synthesized sounds, and regularizes the way the sounds are transformed in terms of acoustic properties based on the long combination and prosodic characteristics found in natural speech. By regularizing the transformation of this acoustic property and modifying the control signal based on this, the quality of the synthesized sound is improved so that it closely resembles natural speech. Then, in this rule synthesis section 6, t;Il'v elements, syllable symbols, or character sequences are converted into sentences t', ? fan! If the reading is inputted from the analysis section 4, an arbitrary synthesized sound corresponding to it is outputted to the speech output section 7.
It is possible to output from When using the rule synthesis section 6 to synthesize speech from each sentence in the sentence file 2 under the analysis of the text IW analysis section 4, it is ideal that a human being can perform the process of reading a book aloud. It detects and divides the boundaries of words, etc. from the text string, goes through the process of converting the phoneme symbol strings of the detected words, etc., and finally adds the accent of the word or the innation of the sentence. must not. In addition, although this rule synthesis section 6 generally has a smaller storage capacity than the waveform processing type, the circuit configuration becomes more complicated, so it is possible to reduce the complexity of the circuit configuration by executing digital calculations on a one-chip LSI. is necessary. Furthermore, it is necessary to generate control signals necessary for the operation of the speech synthesizer based on pre-stored speech data and predetermined rules. There are two types of LSIs for this purpose: formant type and PARCOR type. For example, PARCOR
The system speech synthesis LSI synthesizes speech by connecting lattice-type digital filters, each consisting of two dividers and two adders, in a cascade in the middle stage. The rule synthesis unit 6, which is configured using such an LSI, converts an input character string into a phoneme sequence according to rules and divides it into a so-called C-V-V syllable system, for example, a consonant → -vowel deca vowel system. . As for prosodic features, the fundamental frequency, amplitude, phoneme duration, etc. for the synthesized speech are determined using stored data of acoustic data stored in advance. It is known that the sound quality of synthesized speech according to such rules has an intelligibility of 90% or more for 100 Japanese syllables.

文書ファイル2から文章入出力部3を介して読出された
各文章が単語単位あるいは文節単位等に分割され辞書部
5の単語等とマツチングされ同定される。その場合に辞
書部5において存在しない平仮名あるいはカタカナ等の
未知語が文章中に存在する場合がある。特に新聞記事等
においてはカタカナ文字列の゛固有名詞や新語あるいは
強調のためのカタカナ書きや漢字のかわりに平仮名にし
ている文章が多く存在しこのような文章を解析すると単
語の同定にかなりの高い確率で同定が失敗することがあ
る。そのために、そのままでは正しい文章が読」こげる
ことができなくなる。そこで本発明では文章解析部4に
未知語検出部40、再開位置検出部41及び未知語読み
変換部42が接続されこれらの回路を動作させることに
よって辞書部5の中にある単語等と文章中の単語等がマ
ツチングがとれなかった場合にはこの未知語を無視して
まず解析しその部分の読みは表記から補うことにより正
しい読上げを可使としている。すなわち辞書部5に存在
しない平仮名、又はカタカナ等の未知語が文章中に存在
した場合、単語の同定が出来なくなるため未知dh検出
部40でその未知語の位置P+を決定する。そして文章
をそのまま後方にサーチして新たな単dΔの始まりとわ
かる漢字、カタカナの表記の位81〕2を再開位置検出
部41で見つける。そしてまず未知語の位置P+の前ま
での解析を行いその後前記P2から再び解析を行う。
Each sentence read out from the document file 2 via the text input/output unit 3 is divided into units of words or phrases, and is matched with words in the dictionary unit 5 and identified. In this case, unknown words such as hiragana or katakana that do not exist in the dictionary section 5 may exist in the text. Especially in newspaper articles, there are many sentences in which hiragana is used instead of katakana character strings, proper nouns, new words, or katakana or kanji for emphasis, and when such sentences are analyzed, it is quite difficult to identify the words. Identification may fail due to probability. As a result, it becomes impossible to read correct sentences if left as is. Therefore, in the present invention, an unknown word detection section 40, a restart position detection section 41, and an unknown word reading conversion section 42 are connected to the sentence analysis section 4, and by operating these circuits, words etc. in the dictionary section 5 and words in the sentence are connected. If a word cannot be matched, the unknown word is ignored and analyzed first, and the pronunciation of that part is supplemented from the notation, so that the correct reading can be used. That is, if an unknown word such as hiragana or katakana that does not exist in the dictionary section 5 exists in the text, the word cannot be identified, so the unknown dh detection section 40 determines the position P+ of the unknown word. Then, the text is searched backward as it is, and the restart position detecting unit 41 finds the kanji or katakana notation position 81]2 which is the beginning of a new single dΔ. First, analysis is performed up to the position P+ of the unknown word, and then analysis is performed again from P2.

そして未知語読上げ変換部42において前記未知語の位
WPIから前記辞書部5に存在する単語のある単語位置
P2の前までの未知語部分の読みを見つけ読みに変換さ
れ規則合成部6に送られ音声合成され音声出力部7によ
って、文章が読上げられる。
Then, in the unknown word reading conversion section 42, the reading of the unknown word part from the unknown word position WPI to before the word position P2 where the word existing in the dictionary section 5 is located is found, converted into a reading, and sent to the rule synthesis section 6. The text is synthesized and the text is read aloud by the speech output unit 7.

例えば1つの文章として「そこで プツリ と中断して
いる」という文章を本発明の文章読上げ装置によって読
上げる場合、「そこで」という先頭の文字列から解析を
始める。この場合、「そこで」という平仮名は辞書部5
に存在しこの言葉の同定は実行されるものとする。しか
し次の「プツリ」というカタカナは辞書中に単語として
存在しないと仮定する。従ってこの単語の同定ができな
くなるので未知語検出部40においてその未知語の位置
P+、すなわち「プ」という文字の位置をポインタとし
て記憶しておきそのまま文章を後方にサーチする。そし
て新たな単語の始まりとわかる漢字すなわち「中断」と
いう単語の位置P2すなわち「中」という文字の位置を
再開位置検出部−14= 41によって見つける。そこでPlまでの解析を行った
あと「プツリと」という未知語に関しては解析を行わず
、次の「中断している」という部分に対して解析を再開
する。その1&P1からP2の前までの「プツリと−1
という未知語部分の31εのを一字ずつ力タカリーにし
て未知詔読Zl変換部42において読みを付ける。ずな
わら「プツリと」の読みは表記からカタカナで「ブツリ
ト」となる。以上の解析結果に従って前記文章はすべて
カタカナに変換され、カタカナで「ソコデプツリトチュ
ウダンシテイル」というカタカナに変換され、規則合成
部6へ読みとして与えられ音声合成され音声出力部7か
ら音声として出力される。
For example, when a sentence such as "There is a pause" is read out by the text reading device of the present invention, the analysis starts from the first character string "So". In this case, the hiragana ``there'' is in the dictionary section 5.
, and the identification of this word shall be carried out. However, let us assume that the following katakana word ``puturi'' does not exist as a word in the dictionary. Therefore, since this word cannot be identified, the unknown word detection unit 40 stores the position P+ of the unknown word, that is, the position of the character "pu" as a pointer, and searches the sentence backward. Then, the position P2 of the kanji character that is known to be the beginning of a new word, that is, the word "interruption", that is, the position of the character "chu" is found by the restart position detection unit-14=41. Therefore, after performing the analysis up to Pl, no analysis is performed on the unknown word ``Putsurito'', and the analysis is restarted on the next part ``Interrupted''. Part 1 & P1 to before P2 “Putsuri and -1
The unknown word part 31ε is changed character by character into a reading in the unknown edict reading Zl conversion unit 42. Zunawara ``Putsurito'' is pronounced as ``Butsurito'' in katakana. According to the above analysis results, all of the above sentences are converted into katakana, which is converted into katakana "Sokodeptsuritochudanshitail", which is given as a reading to the rule synthesis section 6, where it is synthesized into speech and outputted as speech from the speech output section 7. Ru.

次に第1図の本発明の文章読上げ装置の動作を第2図の
フローチャー1・に従って説明する。第2図のフローチ
ャートによれば各文章は文章解析部4に入力され文章の
各単語等が辞書部5の単語等とマツチングされ同定され
、単語ラティスの作成が行われる。そして各文章におい
てカタカナあるいは平仮名の未知語が存在するかどうか
を判定する。もし未知語がなければ文章の始まりのポイ
ンタであるSPから文章の終わりの文字のポインタであ
るEPまでの文章を解析し解析結果を格納するWLIS
Tに解析結果を追加し、規則合成部6に転送する。しか
しもし、カタカナあるいは平仮名の未知語がある場合に
は未知語の先頭文字のポインタP1を未知語検出部40
によって見つける。
Next, the operation of the text reading device of the present invention shown in FIG. 1 will be explained according to flowchart 1 in FIG. 2. According to the flowchart of FIG. 2, each sentence is input to the sentence analysis section 4, each word of the sentence is matched and identified with the words of the dictionary section 5, and a word lattice is created. Then, it is determined whether an unknown word in katakana or hiragana exists in each sentence. If there is no unknown word, WLIS analyzes the sentence from SP, which is the pointer at the beginning of the sentence, to EP, which is the pointer to the end of the sentence, and stores the analysis results.
The analysis results are added to T and transferred to the rule synthesis section 6. However, if there is an unknown word in katakana or hiragana, pointer P1 of the first character of the unknown word is sent to the unknown word detection unit 40.
Find by.

そして文章を後方にサーチする。サーチした結果再び辞
書に存在する単語の先頭の文字のポインタP2を見つげ
る。すなわち再開位置検出部41によって文章中で未知
語の後の新たな単語の始まりとわかる位置を見つ番Jる
。その後文章の頭のポインタであるSPから未知語の頭
の文字のポインタであるPIよりも1つ前のPl−1ま
での文章を解析し、解析結果を格納する領域であるWL
ISTに追加する。次に未知語の先頭文字であるPlか
ら未知語の終わりのポインタであるP2−1までの読み
を一字ずつ表記から作り、前記WLISTに追加する。
Then search the text backwards. As a result of the search, the user looks at the pointer P2 of the first character of the word that is found in the dictionary again. That is, the restart position detection unit 41 detects a position in the sentence that is known to be the beginning of a new word after the unknown word. After that, the sentence is analyzed from SP, which is the pointer at the beginning of the sentence, to Pl-1, which is one point before PI, which is the pointer to the first character of the unknown word, and WL is an area where the analysis results are stored.
Add to IST. Next, the pronunciation from Pl, which is the first character of the unknown word, to P2-1, which is the end pointer of the unknown word, is created character by character from the notation and added to the WLIST.

すなわち未知語読み変換部42に従って未知部の読みを
WLISTに追加する。そしてP2を文章の始まりとし
てSPにし、P2から解析を再開する。その後再び未知
語があるかないかのチェックを実行する。このような繰
り返しに従って1つの文章の終わりまで解析または未知
語の読みをWLISTに追加することができ、規則合成
部6にその文章の読みすべてを転送し音声合成に従って
音声に変え、文章の読」二げを実行することを可能とす
る。
That is, the unknown word reading converter 42 adds the reading of the unknown part to the WLIST. Then, P2 is set as SP as the beginning of the sentence, and analysis is restarted from P2. After that, check again to see if there are any unknown words. By repeating this process, it is possible to analyze or add readings of unknown words to the WLIST until the end of one sentence, and then transfer all the readings of the sentence to the rule synthesis unit 6, convert it into speech according to speech synthesis, and read the sentence. Enables you to perform second-order operations.

〔発明の効果〕〔Effect of the invention〕

このように本発明の文章読上げ装置は文章の中の単語等
が辞書中の単語等とマツチングが取れなかった未知語に
対しては文章解析を無視して他の部分を解析し、前記未
知語に対しては表記から読みを補うことにより正しい読
上げを可能とし、任意の文音声に対して合成できるとい
うす1果がある。
In this way, the text reading device of the present invention ignores text analysis for unknown words for which words in the text cannot be matched with words in the dictionary, and analyzes the other parts. By supplementing the pronunciation from the notation, it is possible to read out the correct reading, and the result is that it can be synthesized for any sentence sound.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の文章読」二げ装置の構成ブロック図、 第2図はその動作のフローチャートを示す。 ■・・・主制御部、 2・・・文書ファイル、 3・・・文章入出力部、 4・・・文章解析部1 、 5・・・辞書部、 6・・・規則合成部、 7・・・音声出力部、 10・・・表示部、 11・・・入力部、 40・・・未知語検出部、 41・・・再開位置検出部、 42・・・未知語読み変換部。 FIG. 1 is a block diagram of the structure of the text reading device of the present invention. FIG. 2 shows a flowchart of its operation. ■・・・Main control unit, 2...Document file, 3...Text input/output section, 4...Text analysis section 1 , 5...Dictionary department, 6... Rule synthesis section, 7...Audio output section, 10...display section, 11...input section, 40...Unknown word detection unit, 41... restart position detection unit, 42...Unknown word reading conversion unit.

Claims (1)

【特許請求の範囲】 文章を格納する文章ファイル部と、 前記文章ファイル部から文章を入力又は出力することを
制御する文章入出力部と、 前記文章ファイル部から前記文章入出力部を介して読み
出された文章を小さな文字列の単位に分割し各単位毎に
辞書部の内容とマッチングし、同定する文章解析部と、 前記文章解析部の出力である読みを音声に変換する音声
合成部と、 前記文章解析部に接続され文章中で前記辞書部に存在し
なかった未知語を見つける未知語検出手段と、 前記未知語の始まりと終わりの位置を検出する位置検出
部と、 前記未知語の読みを表記から作成する未知語読み変換手
段とを有し、 前記辞書部に存在しない未知語が文章中に存在した場合
、未知語の始まりのところで文章解析を一時停止し文章
を後方にサーチし未知語の次にくる部分から文章解析を
再開し前記未知語の読みは表記から作成することを特徴
とする文章読上げ装置。
[Scope of Claims] A text file section that stores texts; a text input/output section that controls inputting or outputting texts from the text file section; and a text input/output section that controls text input/output from the text file section; a sentence analysis unit that divides the issued sentence into small character string units and matches each unit with the contents of the dictionary unit for identification; and a speech synthesis unit that converts the reading output from the sentence analysis unit into speech. , an unknown word detection unit connected to the sentence analysis unit and configured to find an unknown word in a sentence that is not present in the dictionary unit; a position detection unit configured to detect the beginning and end positions of the unknown word; and an unknown word reading conversion means that creates a reading from the notation, and when an unknown word that does not exist in the dictionary part exists in a sentence, the sentence analysis is paused at the beginning of the unknown word and the sentence is searched backwards. A text reading device characterized in that text analysis is restarted from the part following the unknown word, and the reading of the unknown word is created from the notation.
JP60260303A 1985-11-20 1985-11-20 Text-to-speech device Expired - Lifetime JPH0634175B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60260303A JPH0634175B2 (en) 1985-11-20 1985-11-20 Text-to-speech device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60260303A JPH0634175B2 (en) 1985-11-20 1985-11-20 Text-to-speech device

Publications (2)

Publication Number Publication Date
JPS62119591A true JPS62119591A (en) 1987-05-30
JPH0634175B2 JPH0634175B2 (en) 1994-05-02

Family

ID=17346157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60260303A Expired - Lifetime JPH0634175B2 (en) 1985-11-20 1985-11-20 Text-to-speech device

Country Status (1)

Country Link
JP (1) JPH0634175B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01296373A (en) * 1988-05-25 1989-11-29 Ricoh Co Ltd Method for processing unregistered word
JPH01321557A (en) * 1988-06-23 1989-12-27 Ricoh Co Ltd Text voice synthesizing device
JPH08123457A (en) * 1994-10-21 1996-05-17 Oki Electric Ind Co Ltd Undefined code detecting device of text speech conversion system

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11769323B2 (en) * 2021-02-02 2023-09-26 Google Llc Generating assistive indications based on detected characters

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840597A (en) * 1981-09-02 1983-03-09 カシオ計算機株式会社 Voice generation system
JPS5878199A (en) * 1981-11-04 1983-05-11 株式会社リコー Voice output unit
JPS59127151A (en) * 1982-12-29 1984-07-21 Fujitsu Ltd Sentence reading device
JPS60188995A (en) * 1984-03-07 1985-09-26 日本電気株式会社 Sentence enunciation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840597A (en) * 1981-09-02 1983-03-09 カシオ計算機株式会社 Voice generation system
JPS5878199A (en) * 1981-11-04 1983-05-11 株式会社リコー Voice output unit
JPS59127151A (en) * 1982-12-29 1984-07-21 Fujitsu Ltd Sentence reading device
JPS60188995A (en) * 1984-03-07 1985-09-26 日本電気株式会社 Sentence enunciation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01296373A (en) * 1988-05-25 1989-11-29 Ricoh Co Ltd Method for processing unregistered word
JPH01321557A (en) * 1988-06-23 1989-12-27 Ricoh Co Ltd Text voice synthesizing device
JPH08123457A (en) * 1994-10-21 1996-05-17 Oki Electric Ind Co Ltd Undefined code detecting device of text speech conversion system

Also Published As

Publication number Publication date
JPH0634175B2 (en) 1994-05-02

Similar Documents

Publication Publication Date Title
Klatt The Klattalk text-to-speech conversion system
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
WO2004066271A1 (en) Speech synthesizing apparatus, speech synthesizing method, and speech synthesizing system
Kayte et al. Speech synthesis system for marathi accent using festvox
Kayte et al. A text-to-speech synthesis for Marathi language using festival and Festvox
Abujar et al. A comprehensive text analysis for Bengali TTS using unicode
Aida-Zade et al. The main principles of text-to-speech synthesis system
JPS62119591A (en) Sentence reciting apparatus
JPH08335096A (en) Text voice synthesizer
JP2000187495A (en) Method and device for synthesizing speech, and recording medium where speech synthesis program is recorded
Hendessi et al. A speech synthesizer for Persian text using a neural network with a smooth ergodic HMM
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP3414326B2 (en) Speech synthesis dictionary registration apparatus and method
Allen Speech synthesis from text
JPH0229797A (en) Text voice converting device
JP2002358091A (en) Method and device for synthesizing voice
JP2003005776A (en) Voice synthesizing device
JP2001350490A (en) Device and method for converting text voice
JP2000056788A (en) Meter control method of speech synthesis device
Jasir et al. A detailed study on the linguistic peculiarities of Malayalam in the context of text to speech synthesis
JPS6326723A (en) Sentence reading device
JPH02234198A (en) Text voice synthesizing system
JP2000172286A (en) Simultaneous articulation processor for chinese voice synthesis
FalDessai Development of a Text to Speech System for Devanagari Konkani