JPH06332494A - 音声を第1の言語から第2の言語に翻訳する際に音声理解を高めるための装置 - Google Patents

音声を第1の言語から第2の言語に翻訳する際に音声理解を高めるための装置

Info

Publication number
JPH06332494A
JPH06332494A JP6120673A JP12067394A JPH06332494A JP H06332494 A JPH06332494 A JP H06332494A JP 6120673 A JP6120673 A JP 6120673A JP 12067394 A JP12067394 A JP 12067394A JP H06332494 A JPH06332494 A JP H06332494A
Authority
JP
Japan
Prior art keywords
language
voice
speech
text
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6120673A
Other languages
English (en)
Inventor
Bertil Lyberg
リュベルグ ベルキル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telia AB
Original Assignee
Telia AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telia AB filed Critical Telia AB
Publication of JPH06332494A publication Critical patent/JPH06332494A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】音声を第1の言語から第2の言語に翻訳する際
に音声理解を高める。 【構成】分析ユニットは、第1の言語による音声の基本
音調および継続時間を分析する。韻律学的解釈ユニット
は、分析ユニットによる分析、および第1の言語に関す
る言語特徴情報に基づいて第1の韻律学的情報を決定す
る。韻律学的発生ユニットは、第1の韻律額的情報、お
よび第2の言語に関係する言語特徴情報から第2の韻律
学的情報を発生する。音声合成素子は、第2の韻律学的
情報を用いて、第1の言語による音声におけるアクセン
トに対応する第2の言語におけるアクセントを生成す
る。

Description

【発明の詳細な説明】
【0001】
【発明の分野】本発明は、音声を第1の言語から第2の
言語に翻訳する際に音声理解を高めるための装置に関す
る。本発明は、音声を第1の言語から第2の言語による
言葉の情報に人工的に翻訳する装置において用いられる
ことを意図されている。本発明の目的は、人工翻訳によ
って元の言語に相当する翻訳を生成することに関する改
良を成し遂げることである。
【0002】
【従来の技術】音声合成および音声翻訳のための装置が
既に知られている。EP327,408およびUS4,
852,170は、共に言語翻訳のためのシステムに関
係している。これらの文献に記載されたシステムは、音
声認識並びに音声合成を含んでいる。しかしながら、こ
れらのシステムは、韻律学的解釈および韻律学的発生を
用いていない。
【0003】EP0,095,139およびEP0,1
39,419は、韻律学的情報を用いる音声合成装置に
ついて記載している。しかしながら、これらの文献は、
言語翻訳において韻律学的情報を用いることについては
触れていない。
【0004】先行技術に伴う1つの問題点は、1つの言
語から別の言語に翻訳する際に、アクセントが考慮され
ていないことである。本発明は、この問題点を、韻律学
的解釈ユニットおよび韻律学的発生ユニットを用いるこ
とによって解決するものである。
【0005】
【発明の要約】本発明は、音声を第1の言語から第2の
言語に翻訳する際に音声理解を高めるための装置を提供
する。本発明によれば、装置は、第1の言語による音声
を受ける素子と、第1の言語による音声を第2の言語に
翻訳する翻訳ユニットと、第2の言語による音声を発生
する音声合成素子を備えている。装置は、さらに、第1
の言語による音声の基本音調および継続時間における変
化を分析する分析ユニットと、分析ユニットによる分
析、および第1の言語に関係する言語特徴情報に基づい
て第1の韻律学的情報を決定する韻律学的解釈ユニット
と、第1の韻律学的情報、並びに前記第2の言語に関係
する言語特徴情報から、第1の言語による音声における
アクセントに対応する第2の言語におけるアクセントを
生成すべく音声合成素子によって用いられる第2の韻律
学的情報を発生する韻律学的発生ユニットを有してい
る。
【0006】本発明の好ましい実施例によれば、第1の
言語による音声を受ける素子は、第1の音声をテキスト
に変換する音声理解素子を有し、翻訳ユニットは、第1
の言語によるテキストを第2の言語によるテキストに変
換し、音声合成素子は、テキスト/音声変換素子を有し
ている。
【0007】
【好ましい実施例の詳細な説明】以下、添付図面を参照
しながら本発明の好ましい実施例について説明する。図
1は、本発明の実施例のブロック図である。本発明によ
る装置は、第1の言語による音声から第2の言語による
音声への翻訳を生み出す。装置は、第1の言語による音
声を受ける素子と、第1の言語による音声を第2の言語
に翻訳する翻訳ユニットと、第2の言語による音声を発
生する音声合成素子を有している。第1の言語による音
声を受ける素子は、受けた音声をテキストに変換する音
声理解素子を有している。翻訳ユニットは、第1の言語
によるテキストを望まれた第2の言語によるテキストに
変換する。音声合成素子は、変換された第2の言語によ
るテキストを音声に変換するテキスト/音声変換素子を
有している。
【0008】本発明によれば、韻律学、すなわち、音声
の組合せ、入力音声における音声特性に関する情報が、
翻訳された音声の合成において用いられる。したがっ
て、装置は、音声に含まれる音声の組合せの基本音調お
よび継続時間を分析する分析ユニットを有している。こ
の分析は、入力音声に関する韻律学的情報、つまり、こ
こで第1の韻律学的情報と呼ぶ情報をアセンブルする韻
律学的解釈ユニットに送られる。韻律学的解釈ユニット
は、第1の言語の言語特徴に関する情報を用いる。これ
らの言語特徴は、前もって、韻律学的解釈ユニット内に
記憶される。
【0009】第1の韻律学的情報は、翻訳ユニットによ
って用いられるだけでなく、また、韻律学的発生ユニッ
トによっても用いられる。韻律学的発生ユニットは、第
2の韻律学的情報を発生する。第2の韻律学的情報はテ
キスト/音声変換素子に送られる。テキスト/音声変換
素子は、第2の韻律学的情報を用いて、言語の観点から
第1の言語による入力音声におけるアクセントに対応す
るアクセント、すなわち、基本音調、継続時間を発生す
る。翻訳、すなわち第2の言語による音声は、こうし
て、翻訳されるべき第1の言語による音声における韻律
学に対応する韻律学を与える。このようにして、音声理
解を高めることが成し遂げられる。
【図面の簡単な説明】
【図1】本発明の好ましい実施例のブロック図である。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声を第1の言語から第2の言語に翻訳
    する際に音声理解を高めるための装置であって、 第1の言語による音声を受ける素子と、前記第1の言語
    による音声を第2の言語に翻訳する翻訳ユニットと、前
    記第2の言語による音声を発生する音声合成素子を備え
    たものにおいて、 前記第1の言語による音声の基本音調および継続時間に
    おける変化を分析する分析ユニットと、 前記分析ユニットによる分析、および前記第1の言語に
    関係する言語特徴情報に基づいて第1の韻律学的情報を
    決定する韻律学的解釈ユニットと、 前記第1の韻律学的情報、並びに前記第2の言語に関係
    する言語特徴情報から、前記第1の言語による音声にお
    けるアクセントに対応する前記第2の言語におけるアク
    セントを生成すべく前記音声合成素子によって用いられ
    る第2の韻律学的情報を発生する韻律学的発生ユニット
    を有していることを特徴とする装置。
  2. 【請求項2】 前記第1の言語による音声を受ける素子
    は、受けた前記第1の音声をテキストに変換する音声理
    解素子を有し、前記翻訳ユニットは、前記第1の言語に
    よるテキストを前記第2の言語によるテキストに変換
    し、前記音声合成素子は、テキスト/音声変換素子を有
    していることを特徴とする請求項1に記載の装置。
JP6120673A 1993-05-10 1994-05-09 音声を第1の言語から第2の言語に翻訳する際に音声理解を高めるための装置 Pending JPH06332494A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9301596A SE500277C2 (sv) 1993-05-10 1993-05-10 Anordning för att öka talförståelsen vid översätttning av tal från ett första språk till ett andra språk
SE9301596-4 1993-05-10

Publications (1)

Publication Number Publication Date
JPH06332494A true JPH06332494A (ja) 1994-12-02

Family

ID=20389881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6120673A Pending JPH06332494A (ja) 1993-05-10 1994-05-09 音声を第1の言語から第2の言語に翻訳する際に音声理解を高めるための装置

Country Status (5)

Country Link
US (1) US5546500A (ja)
EP (1) EP0624865B1 (ja)
JP (1) JPH06332494A (ja)
DE (1) DE69420614T2 (ja)
SE (1) SE500277C2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461001B2 (en) 2001-04-11 2008-12-02 International Business Machines Corporation Speech-to-speech generation system and method

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE516526C2 (sv) * 1993-11-03 2002-01-22 Telia Ab Metod och anordning vid automatisk extrahering av prosodisk information
SE513456C2 (sv) * 1994-05-10 2000-09-18 Telia Ab Metod och anordning vid tal- till textomvandling
SE514684C2 (sv) * 1995-06-16 2001-04-02 Telia Ab Metod vid tal-till-textomvandling
SE9600959L (sv) * 1996-03-13 1997-09-14 Telia Ab Metod och anordning vid tal-till-talöversättning
SE519273C2 (sv) * 1996-05-13 2003-02-11 Telia Ab Förbättringar av , eller med avseende på, tal-till-tal- omvandling
SE9601811L (sv) * 1996-05-13 1997-11-03 Telia Ab Metod och system för tal-till-tal-omvandling med extrahering av prosodiinformation
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
SE520065C2 (sv) 1997-03-25 2003-05-20 Telia Ab Anordning och metod för prosodigenerering vid visuell talsyntes
SE519679C2 (sv) 1997-03-25 2003-03-25 Telia Ab Metod vid talsyntes
JP3890692B2 (ja) * 1997-08-29 2007-03-07 ソニー株式会社 情報処理装置及び情報配信システム
WO1999046762A1 (en) * 1998-03-09 1999-09-16 Kelvin Lp Automatic speech translator
US6901367B1 (en) * 1999-01-28 2005-05-31 International Business Machines Corporation Front end translation mechanism for received communication
US6223150B1 (en) 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6278968B1 (en) 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6243669B1 (en) 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6442524B1 (en) 1999-01-29 2002-08-27 Sony Corporation Analyzing inflectional morphology in a spoken language translation system
US6282507B1 (en) 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6374224B1 (en) 1999-03-10 2002-04-16 Sony Corporation Method and apparatus for style control in natural language generation
KR20010072936A (ko) * 1999-06-24 2001-07-31 요트.게.아. 롤페즈 정보 스트림의 포스트-동기화
JP2001034282A (ja) * 1999-07-21 2001-02-09 Konami Co Ltd 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体
DE19938649A1 (de) * 1999-08-05 2001-02-15 Deutsche Telekom Ag Verfahren und Vorrichtung zur Spracherkennung
DE10018143C5 (de) * 2000-04-12 2012-09-06 Oerlikon Trading Ag, Trübbach DLC-Schichtsystem sowie Verfahren und Vorrichtung zur Herstellung eines derartigen Schichtsystems
DE10031832C2 (de) * 2000-06-30 2003-04-30 Cochlear Ltd Hörgerät zur Rehabilitation einer Hörstörung
JP2002024141A (ja) * 2000-07-05 2002-01-25 Nec Corp 電子メールの翻訳を代行する方法、そのための装置及びシステム
US7035803B1 (en) 2000-11-03 2006-04-25 At&T Corp. Method for sending multi-media messages using customizable background images
US7203648B1 (en) 2000-11-03 2007-04-10 At&T Corp. Method for sending multi-media messages with customized audio
US20080040227A1 (en) 2000-11-03 2008-02-14 At&T Corp. System and method of marketing using a multi-media communication system
US6990452B1 (en) 2000-11-03 2006-01-24 At&T Corp. Method for sending multi-media messages using emoticons
US6976082B1 (en) 2000-11-03 2005-12-13 At&T Corp. System and method for receiving multi-media messages
US7091976B1 (en) * 2000-11-03 2006-08-15 At&T Corp. System and method of customizing animated entities for use in a multi-media communication application
US6963839B1 (en) * 2000-11-03 2005-11-08 At&T Corp. System and method of controlling sound in a multi-media communication application
AU2002239550B2 (en) * 2000-11-17 2006-11-16 Tate & Lyle Technology Limited Meltable form of sucralose
US7671861B1 (en) 2001-11-02 2010-03-02 At&T Intellectual Property Ii, L.P. Apparatus and method of customizing animated entities for use in a multi-media communication application
US20050144003A1 (en) * 2003-12-08 2005-06-30 Nokia Corporation Multi-lingual speech synthesis
DE102004050785A1 (de) * 2004-10-14 2006-05-04 Deutsche Telekom Ag Verfahren und Anordnung zur Bearbeitung von Nachrichten im Rahmen eines Integrated Messaging Systems
EP1856628A2 (en) * 2005-03-07 2007-11-21 Linguatec Sprachtechnologien GmbH Methods and arrangements for enhancing machine processable text information
US8510113B1 (en) 2006-08-31 2013-08-13 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US8510112B1 (en) * 2006-08-31 2013-08-13 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US7912718B1 (en) 2006-08-31 2011-03-22 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US7860705B2 (en) * 2006-09-01 2010-12-28 International Business Machines Corporation Methods and apparatus for context adaptation of speech-to-speech translation systems
JP4213755B2 (ja) * 2007-03-28 2009-01-21 株式会社東芝 音声翻訳装置、方法およびプログラム
JP2009048003A (ja) * 2007-08-21 2009-03-05 Toshiba Corp 音声翻訳装置及び方法
JP2009186820A (ja) * 2008-02-07 2009-08-20 Hitachi Ltd 音声処理システム、音声処理プログラム及び音声処理方法
CN101727904B (zh) * 2008-10-31 2013-04-24 国际商业机器公司 语音翻译方法和装置
US9798653B1 (en) * 2010-05-05 2017-10-24 Nuance Communications, Inc. Methods, apparatus and data structure for cross-language speech adaptation
CN104424179A (zh) * 2013-08-30 2015-03-18 湖北金像无人航空科技服务有限公司 一种在网络论坛楼层内实现多语言人工翻译的方法
CN109300469A (zh) * 2018-09-05 2019-02-01 满金坝(深圳)科技有限公司 基于机器学习的同声传译方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3704345A (en) * 1971-03-19 1972-11-28 Bell Telephone Labor Inc Conversion of printed text into synthetic speech
JPS5789177A (en) * 1980-11-25 1982-06-03 Noriko Ikegami Electronic translation device
EP0095139A3 (en) * 1982-05-25 1984-08-22 Texas Instruments Incorporated Speech synthesis from prosody data and human sound indicia data
DE3367474D1 (en) * 1982-05-25 1986-12-11 Texas Instruments Inc Electronic learning aid with sound effects mode
JPS6050600A (ja) * 1983-08-31 1985-03-20 株式会社東芝 規則合成方式
US5384701A (en) * 1986-10-03 1995-01-24 British Telecommunications Public Limited Company Language translation system
US4852170A (en) * 1986-12-18 1989-07-25 R & D Associates Real time computer speech recognition system
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
US5384893A (en) * 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461001B2 (en) 2001-04-11 2008-12-02 International Business Machines Corporation Speech-to-speech generation system and method

Also Published As

Publication number Publication date
SE9301596D0 (sv) 1993-05-10
US5546500A (en) 1996-08-13
DE69420614D1 (de) 1999-10-21
SE9301596L (sv) 1994-05-24
DE69420614T2 (de) 2000-07-06
EP0624865A1 (en) 1994-11-17
EP0624865B1 (en) 1999-09-15
SE500277C2 (sv) 1994-05-24

Similar Documents

Publication Publication Date Title
JPH06332494A (ja) 音声を第1の言語から第2の言語に翻訳する際に音声理解を高めるための装置
US8224645B2 (en) Method and system for preselection of suitable units for concatenative speech
US6829581B2 (en) Method for prosody generation by unit selection from an imitation speech database
JP2005502102A (ja) 音声−音声生成システムおよび方法
EP0749109A3 (en) Speech recognition for tonal languages
Tang et al. Voice transformations: from speech synthesis to mammalian vocalizations.
WO1997034292A1 (en) Method and device at speech-to-speech translation
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
JP2003140678A (ja) 合成音声の音質調整方法と音声合成装置
JP3575919B2 (ja) テキスト音声変換装置
KR20080011859A (ko) 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템
JP2740510B2 (ja) テキスト音声合成方式
JP2536896B2 (ja) 音声合成装置
KR0134707B1 (ko) 다이폰 단위를 이용한 엘에스피(lsp)방식의 음성 합성 방법
JP2703253B2 (ja) 音声合成装置
JPH0323500A (ja) テキスト音声合成装置
JPH06149283A (ja) 音声合成装置
JPH09292897A (ja) 音声合成装置
JPH10319992A (ja) 車載用音声合成装置
JPH02236600A (ja) 合成音声情緒付与回路
Lavner et al. Voice morphing using 3D waveform interpolation surfaces and lossless tube area functions
JPH04243299A (ja) 音声出力装置
Strecha et al. Low resource tts synthesis based on cepstral filter with phase randomized excitation
Hwang et al. An RNN-Based Spectral Information Generation for Mandarin Text-To-Speech

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040831

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050419