JPS6177898A - 文・音声変換方法 - Google Patents
文・音声変換方法Info
- Publication number
- JPS6177898A JPS6177898A JP59200868A JP20086884A JPS6177898A JP S6177898 A JPS6177898 A JP S6177898A JP 59200868 A JP59200868 A JP 59200868A JP 20086884 A JP20086884 A JP 20086884A JP S6177898 A JPS6177898 A JP S6177898A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- storage area
- data storage
- word
- overflow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、漢字かな混9文章を音声に変換する文・音声
変換方法に関するものである。
変換方法に関するものである。
従来例の構成とその問題点
第1図は、文・音声変換装置の概要を示している。第1
図において、入力された漢字かな混9文章は、単語処理
部Iにおいて、単語単位に読みとアクセントが与えられ
、複合語処理部2に渡される。複合語処理部2では、単
語単位のアクセントを文節単位のアクセンHCまとめる
。音声合成部3では、このように生成されたカナ文字列
とアクセントから音声パラメータを生成し、音声を合成
する0 インタフェース等を通して文・音声変換装置に入力さ1
1.た漢字かな混り文章は、受信データ格納エリアに格
納される。このエリアのデータは、#」、「、J、「/
」等の記号が現われるところを句の区切りとして、1句
毎ニ単語処理部lの入カデータ格納エリアAK格納され
る。これらのデータは単語処理部2において単語単位に
読みとアクセントが与えられ、出力データ格納エリアB
K格納される。第2図は、この処理におけるデータの流
れを示すものである。第2図において、「ジーウライ」
は1型アクセント、即ち1音節目の「ジー」の音程が高
く、「ウライ」が低くなることを表わす。また、[/J
1;E−≠s4’ll−*&幻f。
図において、入力された漢字かな混9文章は、単語処理
部Iにおいて、単語単位に読みとアクセントが与えられ
、複合語処理部2に渡される。複合語処理部2では、単
語単位のアクセントを文節単位のアクセンHCまとめる
。音声合成部3では、このように生成されたカナ文字列
とアクセントから音声パラメータを生成し、音声を合成
する0 インタフェース等を通して文・音声変換装置に入力さ1
1.た漢字かな混り文章は、受信データ格納エリアに格
納される。このエリアのデータは、#」、「、J、「/
」等の記号が現われるところを句の区切りとして、1句
毎ニ単語処理部lの入カデータ格納エリアAK格納され
る。これらのデータは単語処理部2において単語単位に
読みとアクセントが与えられ、出力データ格納エリアB
K格納される。第2図は、この処理におけるデータの流
れを示すものである。第2図において、「ジーウライ」
は1型アクセント、即ち1音節目の「ジー」の音程が高
く、「ウライ」が低くなることを表わす。また、[/J
1;E−≠s4’ll−*&幻f。
出力データ格納エリア8に格納されたデータは助詞「は
」、「が」、「を」の後ろ等、発声の時に生じる休止区
間に相当する位置を区切りとして句に分割され、1句毎
に次の複合語処理部20入カデー、タ格納エリアCK格
納される。このデータは複合語処理部2において、単語
単位から文節単位のアクセンHC4とめ上げられ、出力
データ格納エリアDに格納される。第3図は、この処理
のデータの流れを示すものである。なお第4図は上記一
連の処理を示している。
」、「が」、「を」の後ろ等、発声の時に生じる休止区
間に相当する位置を区切りとして句に分割され、1句毎
に次の複合語処理部20入カデー、タ格納エリアCK格
納される。このデータは複合語処理部2において、単語
単位から文節単位のアクセンHC4とめ上げられ、出力
データ格納エリアDに格納される。第3図は、この処理
のデータの流れを示すものである。なお第4図は上記一
連の処理を示している。
ところで、入力データ格納エリアの大きさは、システム
のワークエリアの大きさにより制限される。このため各
処理過程でのデータ量が、エリアの大きさを超えた場合
、オーバフローを起こし、正常処理ができなくなる。例
えば、入力データ格納エリアAの大きさが55文字分と
すると、次の第1文例では、56文字目の「いJでオー
バ70−1−起こし、正常処理ができなくなる。
のワークエリアの大きさにより制限される。このため各
処理過程でのデータ量が、エリアの大きさを超えた場合
、オーバフローを起こし、正常処理ができなくなる。例
えば、入力データ格納エリアAの大きさが55文字分と
すると、次の第1文例では、56文字目の「いJでオー
バ70−1−起こし、正常処理ができなくなる。
(第1文例)データ通信システムは近年の電気通信技術
とソフトウェア技術等の発達に伴ない集が見られる。
とソフトウェア技術等の発達に伴ない集が見られる。
また、入力データエリアCの大きさが20文字分とする
と、次の第2文例では21文字目の「イ」でオーバフロ
ーを起こし、正常処理ができなくなる○ (第2文例)日本語漢字カナ入力装置については・・・
・・・ /ニホンゴ/カンジ/カナ/ニューリョク/ソウチ/=
1イテワ゛°゛°°゛ 従来例のように、オーバフロー防止策を施していない文
・音声変換方法では音声が中断される事があり、円滑な
文・音声変換ができないという欠点を有していた。
と、次の第2文例では21文字目の「イ」でオーバフロ
ーを起こし、正常処理ができなくなる○ (第2文例)日本語漢字カナ入力装置については・・・
・・・ /ニホンゴ/カンジ/カナ/ニューリョク/ソウチ/=
1イテワ゛°゛°°゛ 従来例のように、オーバフロー防止策を施していない文
・音声変換方法では音声が中断される事があり、円滑な
文・音声変換ができないという欠点を有していた。
発明の目的
本発明は、上記従来例の欠点を除去するものであり、バ
ッファオーバフローによシ生じる音声合成の中断を防止
し、文・音声変換処理を円滑π行なうことを目的として
いる。
ッファオーバフローによシ生じる音声合成の中断を防止
し、文・音声変換処理を円滑π行なうことを目的として
いる。
発明の構成
本発明に、上記目的全達成するため、各処理過程で、累
積されたデータ量が格納エリアの大きさによシ決まる閾
値を超えた場合は、文字種の変移点、文節あるいは単語
の境界等を第1候補として句を区切シ、これらがない場
合は音節全単位さして強制的に句を区切ることにより、
オーバ70−による音声合成の中断全防止し、円滑な音
声合成を実現する効果を得るものである。
積されたデータ量が格納エリアの大きさによシ決まる閾
値を超えた場合は、文字種の変移点、文節あるいは単語
の境界等を第1候補として句を区切シ、これらがない場
合は音節全単位さして強制的に句を区切ることにより、
オーバ70−による音声合成の中断全防止し、円滑な音
声合成を実現する効果を得るものである。
実施例の説明
以下に、本発明の一実施flJ Kついて述べる。句の
境界、即ち息継ぎのだめの休止区間は助詞「は」、「が
」、「をJ等のうしろの他Kld、文節、単語境界等に
生じる、この点を考慮して、次のよってオーバフロ一対
策を施す。
境界、即ち息継ぎのだめの休止区間は助詞「は」、「が
」、「をJ等のうしろの他Kld、文節、単語境界等に
生じる、この点を考慮して、次のよってオーバフロ一対
策を施す。
第5図に示すように受信データ格納エリアから、単語処
理部の入力データエリアにデータを転送、格納する時は
、N、≦(文字数)≦N2における文字種の変移点(但
し、漢字から平がなへの変移点は平がなが語尾になるこ
とがあるため除く)で句を区切る。変移点がない時は、
N2文字目で強制的に区切る。但し、発声単位を考えて
「ゆ」、「つ」、「=」、「ツ」等の小゛文字又は「々
」がある場合は後ろへずらす(例:「ゆっくり」は「ゆ
っ」と「くり」K分ける)。
理部の入力データエリアにデータを転送、格納する時は
、N、≦(文字数)≦N2における文字種の変移点(但
し、漢字から平がなへの変移点は平がなが語尾になるこ
とがあるため除く)で句を区切る。変移点がない時は、
N2文字目で強制的に区切る。但し、発声単位を考えて
「ゆ」、「つ」、「=」、「ツ」等の小゛文字又は「々
」がある場合は後ろへずらす(例:「ゆっくり」は「ゆ
っ」と「くり」K分ける)。
また、単語処理部の出力データ格納エリアBから複合語
処理の入力データ格納エリアへデータを転送格納する場
合、N3番目の文字が平がなの時は直前より一つ前の単
語境界で句を区切って格納し、平がな以外のときは、直
前の単語境界で句を区切る(平がなが語尾になることが
あるため)。
処理の入力データ格納エリアへデータを転送格納する場
合、N3番目の文字が平がなの時は直前より一つ前の単
語境界で句を区切って格納し、平がな以外のときは、直
前の単語境界で句を区切る(平がなが語尾になることが
あるため)。
次に、Nl =40. NZ =55. N3 = 2
0 として、オーバフロー防止策が施された場合のい
くつかの例を示す。まず、受信データ格納エリアから、
単語処理部の入力データ格納エリア(55文字分のデー
タを格納)Kデータを転送、格納する時に、上記のオー
バフロー防止策が施されると、前記第1文例は第3文例
のように↑の位置で句が切られオーバフローを起こさな
い。
0 として、オーバフロー防止策が施された場合のい
くつかの例を示す。まず、受信データ格納エリアから、
単語処理部の入力データ格納エリア(55文字分のデー
タを格納)Kデータを転送、格納する時に、上記のオー
バフロー防止策が施されると、前記第1文例は第3文例
のように↑の位置で句が切られオーバフローを起こさな
い。
(第3文例)データ通信システムは近年の電気通信技術
とソフトウェア技術等の発達に伴ない集中処理方式から
↑分散処理方式へ移行して“く傾向が見られる。
とソフトウェア技術等の発達に伴ない集中処理方式から
↑分散処理方式へ移行して“く傾向が見られる。
同様に、単語処理部の出力データ格納エリアBから複合
語処理部の入力データ格納エリアCにデータを転送、格
納する場合は、前記第2文例は第4文例のように↑の位
置で句が切られオーバフローを起こさない。
語処理部の入力データ格納エリアCにデータを転送、格
納する場合は、前記第2文例は第4文例のように↑の位
置で句が切られオーバフローを起こさない。
(IE4文例)/二ホンゴ/カンジ/カナ/ニュ本実施
例では、上記のようなオーバフロ一対策を施しているの
で、オーバフローによる音声の中断がなくなシ、円滑な
文・音声変換が行なえる。
例では、上記のようなオーバフロ一対策を施しているの
で、オーバフローによる音声の中断がなくなシ、円滑な
文・音声変換が行なえる。
発明の効果
本発明は、上記のような構成であり、文節、単語の境界
、文字種の変移点等を候補として句を区切ることにより
、データ格納エリアでのオーバフロー防止を行なってい
るので、オーバフローにより音声が中断することなく、
円滑な音声合成が行なえるという利点を有する。
、文字種の変移点等を候補として句を区切ることにより
、データ格納エリアでのオーバフロー防止を行なってい
るので、オーバフローにより音声が中断することなく、
円滑な音声合成が行なえるという利点を有する。
第1図は、従来の文・音声変換方法の処理概要を示す図
、 ′ 第2図、第3図、第
4図はそれぞれ同方法における処理の概略の流れと、主
要なデータ格納エリアを示す図、第ぎ図は、本発明の一
実施例における文・音声変換方法におけるオーバフロ一
対策処理の概略の流れ図である。 [・・・単語処理部、2・・・複合語処理部、3・・・
音声合成部。
、 ′ 第2図、第3図、第
4図はそれぞれ同方法における処理の概略の流れと、主
要なデータ格納エリアを示す図、第ぎ図は、本発明の一
実施例における文・音声変換方法におけるオーバフロ一
対策処理の概略の流れ図である。 [・・・単語処理部、2・・・複合語処理部、3・・・
音声合成部。
Claims (1)
- 文・音声変換の各処理過程で、累積されたデータ量が閾
値を超えた場合は、文字種の変移点、文節あるいは単語
の境界等を第1候補として句を区切り、これらがない場
合は音節を単位として強制的に句を区切ることにより、
各データ格納エリアでのオーバフロー防止を行なうこと
を特徴とする文・音声変換方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59200868A JPS6177898A (ja) | 1984-09-26 | 1984-09-26 | 文・音声変換方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59200868A JPS6177898A (ja) | 1984-09-26 | 1984-09-26 | 文・音声変換方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6177898A true JPS6177898A (ja) | 1986-04-21 |
JPH0552958B2 JPH0552958B2 (ja) | 1993-08-06 |
Family
ID=16431559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59200868A Granted JPS6177898A (ja) | 1984-09-26 | 1984-09-26 | 文・音声変換方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6177898A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6435498A (en) * | 1987-07-30 | 1989-02-06 | Sanyo Electric Co | Voice synthesizer |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5762461A (en) * | 1980-10-02 | 1982-04-15 | Nec Corp | Word splitting system |
JPS58192129A (ja) * | 1982-05-06 | 1983-11-09 | Matsushita Electric Ind Co Ltd | カナ漢字変換装置 |
JPS5991497A (ja) * | 1982-11-17 | 1984-05-26 | 株式会社東芝 | 音声合成出力装置 |
-
1984
- 1984-09-26 JP JP59200868A patent/JPS6177898A/ja active Granted
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5762461A (en) * | 1980-10-02 | 1982-04-15 | Nec Corp | Word splitting system |
JPS58192129A (ja) * | 1982-05-06 | 1983-11-09 | Matsushita Electric Ind Co Ltd | カナ漢字変換装置 |
JPS5991497A (ja) * | 1982-11-17 | 1984-05-26 | 株式会社東芝 | 音声合成出力装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6435498A (en) * | 1987-07-30 | 1989-02-06 | Sanyo Electric Co | Voice synthesizer |
Also Published As
Publication number | Publication date |
---|---|
JPH0552958B2 (ja) | 1993-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7239998B2 (en) | Performing machine translation using a unified language model and translation model | |
Priva | Not so fast: Fast speech correlates with lower lexical and structural information | |
US20130151232A1 (en) | System and method for enriching spoken language translation with dialog acts | |
MacDonald | The emergence of language comprehension | |
Feng et al. | How phonotactics affect multilingual and zero-shot asr performance | |
Wingfield et al. | Multiple memory systems in the processing of speech: Evidence from aging | |
JPS6177898A (ja) | 文・音声変換方法 | |
GB2378877A (en) | Prosodic boundary markup mechanism | |
Callow | The Apinaye language: Phonology and grammar. | |
Altenberg | Predicting text segmentation into tone units | |
Brenier et al. | The (non) utility of linguistic features for predicting prominence in spontaneous speech | |
JP2643363B2 (ja) | 複合語のアクセント句境界付与方式 | |
JPS60142464A (ja) | 音声入力による文章作成システム | |
Whetten et al. | Evaluating Automatic Speech Recognition and Natural Language Understanding in an Incremental Setting | |
Olabe et al. | Real time text-to-speech conversion system for spanish | |
Gilman | A comparison of Jamaican Creole and Cameroonian Pidgin English | |
Mahar et al. | Phonology for Sindhi letter-to-sound conversion | |
Sproat | Corpus-based methods and hand-built methods | |
Wang et al. | Word-level and syllable-level predictability effects on syllable duration in Taiwan Mandarin | |
Martens et al. | Some notes on the inelegant glottal: a problem in Uma phonology | |
Boruta | A note on the generation of allophonic rules | |
Wescott | Ibo phasis | |
Mirza et al. | Analysis of Urdu Syllables and Proposed Algorithm Structure for Determination of Speaker's Speaking Rate | |
Sproat | Pmtools: A pronunciation modeling toolkit. | |
Stevenson | Intonation Patterns and Modality |