DE706170T1 - Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen - Google Patents
Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von WellenformenInfo
- Publication number
- DE706170T1 DE706170T1 DE0706170T DE95107944T DE706170T1 DE 706170 T1 DE706170 T1 DE 706170T1 DE 0706170 T DE0706170 T DE 0706170T DE 95107944 T DE95107944 T DE 95107944T DE 706170 T1 DE706170 T1 DE 706170T1
- Authority
- DE
- Germany
- Prior art keywords
- edge
- interval
- synthesis
- duration
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 title claims 30
- 238000003786 synthesis reaction Methods 0.000 title claims 30
- 238000000034 method Methods 0.000 title claims 10
- 230000007423 decrease Effects 0.000 claims 1
- 230000005284 excitation Effects 0.000 claims 1
- 239000003550 marker Substances 0.000 claims 1
- 230000001360 synchronised effect Effects 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
- 210000001260 vocal cord Anatomy 0.000 claims 1
- 230000001755 vocal effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L2013/021—Overlap-add techniques
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Electrophonic Musical Instruments (AREA)
- Mobile Radio Communication Systems (AREA)
- Machine Translation (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
- Auxiliary Devices For Music (AREA)
- Stereophonic System (AREA)
Claims (9)
- LEDERER, KELLER & RIEDERERPatentanwälte - European Patent Attorneys j,^ FRANZ Lc)DERSR. DlpL-Cian. MröcnenDr t &Ggr; &eegr; &lgr; &eegr;* * 4 in &tgr;&lgr; ' dr. Günter hellert~ I &Ggr; &Ggr; &Pgr; ■* F I h !/Il T 1 DipL-Biol. MünchenL_/l_f UjUUs/UJI DR. MICHAEL BESTDipL-Chen. MünchenANTON FREIHERR RIEDERER v. PAAR DipL-ing. LandshutLederer. Keller & Riederer. Postfach 2664. D-84010 LandshutD-84010 Landshut
Postfach 26 64(84028 Landshut, Freyung 615) Telefon (08 71) 2 21 70 Telefax (08 71) 2 21 43Europäische Patentanmeldung 95 107 944.1
(Veröffentlichungsnummer 0 706 170)
CSELT Centra Studi e Laboratori
Telecomunicazioni S.p.A.
Turin, ItalienPatentansprüche1. Verfahren zur Sprachsignalsynthese mit Hilfe einer Zeitverkettung von Signalverläufen, die elementare Sprachsignaleinheiten wiedergeben, wobei man: wenigstens diejenigen Signalverläufe, die stimmhaften Lauten zugeordnet sind, in eine Vielzahl von Intervallen unterteilt, die den Reaktionen des Vokaltraktes auf eine Serie von Impulsen der Stimmbanderregung entsprechen, die synchron der Grundfrequenz des Signals sind; den Signalverlauf in jedem Intervall gewichtet; die aus der Gewichtung resultierenden Signale ersetzt durch eine Replik derselben, die zeitlich um einen Betrag verschoben ist, der von einer prosodischen Information abhängt; und die Synthese durchführt durch Überlappen und Addieren der verschobenen Signale; dadurch gekennzeichnet, daßman ein laufendes Intervall des in Synthese zu reproduzierenden ursprünglichen Signals in einen unveränderlichen Teil und einenvariablen Teil unterteilt, von denen der unveränderliche Teil zwischen dem Intervallbeginn und einem linken Analyserand liegt, welcher durch einen Nulldurchgang des ursprünglichen Sprachsignals gegeben ist, dervorgegebene Bedingungen erfüllt, und der variable Teil zwischen dem linken Analyserand und einem rechten Analyserand liegt, welcher im wesentlichen mit dem Ende des laufenden Intervalls übereinstimmt, wobei der linke und der rechte Analyserand im synthetisierten Signal einem linken Syntheserand bzw. einem rechten Syntheserand zugeordnet sind, von denen der linke Syntheserand mit dem linken Analyserand unter Bezugnahme auf eine Intervallstart-Markierung zusammenfällt, und der rechte Syntheserand im wesentlichen mit dem Ende des Intervalls im synthetisierten Signal zusammenfällt;&iacgr;&ogr; - man den Teil des Signalverlaufs auf der rechten Seite des linkenAnalyserands des laufenden Intervalls des ursprünglichen Signals einer ersten Verbindungsfunktion unterwirft, die eine Dauer gleich der des Abschnitts des synthetisierten Signalverlaufs hat, der zwischen dem linken Syntheserand und dem rechten Syntheserand liegt, und eine Amplitude hat, die fortschreitend abnimmt und in Übereinstimmung mitdem linken Analyserand maximal ist;man den Teil des Signalverlaufs auf der linken Seite des nachfolgenden Intervalls des ursprünglichen in Synthese zu reproduzierenden Signals einer zweiten Verbindungsfunktion unterwirft, die eine Dauer gleich der&ogr; des Abschnitts des synthetisierten Signalverlaufs hat, der zwischen demlinken Syntheserand und dem rechten Syntheserand liegt, und eine Amplitude hat, die fortschreitend zunimmt und ihr Maximum in Übereinstimmung mit dem Beginn des nachfolgenden Intervalls hat;
man jedes Intervall des synthetisierten Signals aufbaut durch unveränderte Wiedergabe des Signalverlaufs im unveränderlichen Teil desursprünglichen Intervalls und durch daran Anhängen des durch zeitliche Ausrichtung erhaltenen Signalverlaufs und Hinzufügung der beiden durch Anwendung der zwei Verbindungsfunktion resultierenden Signalverläufe. - 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man, sofern die Dauer eines Intervalls für die Synthese im Hinblick auf die Dauer desentsprechenden Intervalls des ursprünglichen Signals vermindert oder unverändert aufrechterhalten wird, den linken Analyserand und den linken Syntheserand mit den folgenden Operationen bestimmt:man berechnet die Zahl der Nulldurchgänge des ursprünglichen Signalverlaufs und ordnet jedem Nulldurchgang einen Index zu, dervom Anfang zum Ende des Intervalls zu ansteigt;
man überprüft, daß die Zahl der Nulldurchgänge nicht niedriger als eine erste Schwelle ist;man sucht im Fall eines positiven Ergebnisses dieser Überprüfung einen &iacgr;&ogr; Nulldurchgang als Kandidaten, der als linker Analyserand und Syntheserand dienen soll;man sucht unter allen Nulldurchgängen des Intervalls mit Ausnahme des letzten Nuildurchgangs rückwärts nach einem Kandidaten, der links vom rechten Syntheserand liegt, diesem so nahe als möglich ist und eine für die anzuwendende Verbindungsfunktion ausreichende Zeitspanne sicherstellt, und weist die Aufgabe des linken Analyserands und Synthesrands diesem Kandidaten zu. - 3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß man bei dieser &ogr; Berechnung der Nulldurchgänge solche Nulldurchgänge, deren Abstand vomvorhergehenden Nulldurchgang kleiner ist als ein gegebener Abstand, außer Betracht läßt.
- 4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß man, falls die Rückwärtssuche ein negatives Ergebnis erbracht hat und die Zahl der Nulldurchgänge höher ist als die erste Schwelle, die Aufgaben des linken Analyserands und des linken Syntheserands demjenigen Nulldurchgang zuordnet, dessen Index dieser Schwelle entspricht, sofern dieser Nulldurchgang links vom rechten Syntheserand liegt.
- 5. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, daß man, falls die Rückwärtssuche ein negatives Ergebnis erbracht hat und dieZahl der Nulldurchgänge nicht höher als die erste Schwelle ist, eine weitere Suchphase zum Identifizieren der Nulldurchgänge, die links vom rechten Syntheserand liegen und von diesem einen Abstand haben, der nicht niedriger als eine zweite Schwelle ist, durchführt und die Aufgaben des linken Analyserands und des rechten Analyserands dem Nulldurchgang, der diese Bedingungen erfüllt, mit dem höchsten Index zuweist.
- 6. Verfahren nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, daß man, falls der Vergleich mit der ersten Schwelle anzeigt, daß die Zahl der&iacgr;&ogr; Nulldurchgänge niedriger ist als die erste Schwelle, die Rückwärtssuchedirekt durchführt und, wenn sie ein negatives Ergebnis erbringt, die weitere Suchphase direkt durchführt.
- 7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß man, sofern die Dauer des Intervalls für die Synthese im Vergleich zur Dauerdes Intervallsdes ursprünglichen Signals erhöht wird, den linken Analyserand und den linken Syntheserand mit den folgenden Operationen bestimmt:
man berechnet die Zahl der Nulldurchgänge des ursprünglichen Signalverlaufs;- man vergleicht die Verlängerung der Zeitdauer des Syntheseintervallsmit der Zeitdauer des ursprünglichen Intervalls zur Überprüfung, daß die Verlängerung nicht mehr als die Hälfte der ursprünglichen Intervalldauer ausmacht;
sofern die Überprüfung ein positives Ergebnis gibt, sucht man unter allen Nulldurchgängen außerdem letzten Nulldurchgang rückwärts nacheinem Nulldurchgang als Kandidaten, der links vom rechten Syntheserand liegt und der erste ist, für den der Abstand vom rechten Syntheserand nicht kürzer als die Verlängerung der Dauer des Intervalls ist, und weist man die Aufgaben des linken Analyserands und des linken&ogr; Syntheserands demjenigen Nulldurchgang zu, der diese Bedingungenerfüllt, sofern ein solcher existiert. - 8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß man bei der Berechnung der Nulldurchgänge diejenigen Nulldurchgänge, deren Abstand vom vorhergehenden Nulldurchgang niedriger ist als ein gegebener Abstand, nicht in Betracht zieht.
- 9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, daß man, sofern die Verlängerung der Intervalldauer mehr als die Hälfte der Dauer des ursprünglichen Intervalls ausmacht oder sofern die Rückwärtssuche erfolglos ist, eine weitere Rückwärtssuchphase durchführt, um die Nulldurchgänge zu&iacgr;&ogr; identifizieren, die links vom rechten Syntheserand liegen und von diesemeinen Abstand haben, der nicht kleiner als eine dritte Schwelle ist; daß man die Abstände vom rechten Syntheserand und vom rechten Analyserand und das Verhältnis zwischen diesen Abständen für diese Nulldurchgänge berechnet; daß man dieses Verhältnis mit dem Wert des Verhältnisses zwischen der Dauer des Syntheseintervalls und der Dauer des ursprünglichen Intervalls vergleicht und die Aufgaben des linken Analyserands und des linken Syntheserands demjenigen Nulldurchgang zuweist, dessen Index der niedrigste unter denjenigen ist, für die das Verhältnis der Abstände von den Rändern das Verhältnis zwischen den Zeitdauern nicht um mehr als einen gegebenen Faktor übersteigt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT94TO000756A IT1266943B1 (it) | 1994-09-29 | 1994-09-29 | Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda. |
Publications (1)
Publication Number | Publication Date |
---|---|
DE706170T1 true DE706170T1 (de) | 1998-11-19 |
Family
ID=11412789
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69521955T Expired - Lifetime DE69521955T2 (de) | 1994-09-29 | 1995-05-24 | Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen |
DE0706170T Pending DE706170T1 (de) | 1994-09-29 | 1995-05-24 | Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69521955T Expired - Lifetime DE69521955T2 (de) | 1994-09-29 | 1995-05-24 | Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen |
Country Status (8)
Country | Link |
---|---|
US (1) | US5774855A (de) |
EP (1) | EP0706170B1 (de) |
JP (1) | JP3078205B2 (de) |
CA (1) | CA2150614C (de) |
DE (2) | DE69521955T2 (de) |
DK (1) | DK0706170T3 (de) |
ES (1) | ES2113329T3 (de) |
IT (1) | IT1266943B1 (de) |
Families Citing this family (130)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6240384B1 (en) | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
US6453288B1 (en) | 1996-11-07 | 2002-09-17 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for producing component of excitation vector |
KR100236974B1 (ko) * | 1996-12-13 | 2000-02-01 | 정선종 | 동화상과 텍스트/음성변환기 간의 동기화 시스템 |
US8209184B1 (en) * | 1997-04-14 | 2012-06-26 | At&T Intellectual Property Ii, L.P. | System and method of providing generated speech via a network |
KR100240637B1 (ko) | 1997-05-08 | 2000-01-15 | 정선종 | 다중매체와의 연동을 위한 텍스트/음성변환 구현방법 및 그 장치 |
EP1000499B1 (de) * | 1997-07-31 | 2008-12-31 | Cisco Technology, Inc. | Erzeugung von sprachnachrichten |
US6725190B1 (en) * | 1999-11-02 | 2004-04-20 | International Business Machines Corporation | Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
JP3673471B2 (ja) * | 2000-12-28 | 2005-07-20 | シャープ株式会社 | テキスト音声合成装置およびプログラム記録媒体 |
US7035794B2 (en) * | 2001-03-30 | 2006-04-25 | Intel Corporation | Compressing and using a concatenative speech database in text-to-speech systems |
EP1262952B1 (de) * | 2001-05-28 | 2006-08-16 | Texas Instruments Incorporated | Programmierbarer Melodienerzeuger |
US6809526B2 (en) * | 2001-07-02 | 2004-10-26 | Abratech Corporation | QSD apparatus and method for recovery of transient response obscured by superposition |
DE10230884B4 (de) * | 2002-07-09 | 2006-01-12 | Siemens Ag | Vereinigung von Prosodiegenerierung und Bausteinauswahl bei der Sprachsynthese |
GB2392358A (en) * | 2002-08-02 | 2004-02-25 | Rhetorical Systems Ltd | Method and apparatus for smoothing fundamental frequency discontinuities across synthesized speech segments |
ATE318440T1 (de) | 2002-09-17 | 2006-03-15 | Koninkl Philips Electronics Nv | Sprachsynthese durch verkettung von sprachsignalformen |
ATE352837T1 (de) | 2002-09-17 | 2007-02-15 | Koninkl Philips Electronics Nv | Verfahren zur steuerung der dauer bei der sprachsynthese |
AU2003253152A1 (en) | 2002-09-17 | 2004-04-08 | Koninklijke Philips Electronics N.V. | A method of synthesizing of an unvoiced speech signal |
EP1543497B1 (de) | 2002-09-17 | 2006-06-07 | Koninklijke Philips Electronics N.V. | Verfahren zur synthese eines stationären klangsignals |
CN1604077B (zh) * | 2003-09-29 | 2012-08-08 | 纽昂斯通讯公司 | 对发音波形语料库的改进方法 |
US7409347B1 (en) * | 2003-10-23 | 2008-08-05 | Apple Inc. | Data-driven global boundary optimization |
US7643990B1 (en) * | 2003-10-23 | 2010-01-05 | Apple Inc. | Global boundary-centric feature extraction and associated discontinuity metrics |
KR20050059766A (ko) * | 2003-12-15 | 2005-06-21 | 엘지전자 주식회사 | 동적 시간 워핑을 이용한 음성 인식 방법 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070299657A1 (en) * | 2006-06-21 | 2007-12-27 | Kang George S | Method and apparatus for monitoring multichannel voice transmissions |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US9922642B2 (en) | 2013-03-15 | 2018-03-20 | Apple Inc. | Training an at least partial voice command system |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (de) | 2013-06-09 | 2016-04-20 | Apple Inc. | Vorrichtung, verfahren und grafische benutzeroberfläche für gesprächspersistenz über zwei oder mehrere instanzen eines digitaler assistenten |
WO2014200731A1 (en) | 2013-06-13 | 2014-12-18 | Apple Inc. | System and method for emergency calls initiated by voice command |
KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
AU2015266863B2 (en) | 2014-05-30 | 2018-03-15 | Apple Inc. | Multi-command single utterance input method |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU574104B2 (en) * | 1983-09-09 | 1988-06-30 | Sony Corporation | Apparatus for reproducing audio signal |
US4692941A (en) * | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
FR2636163B1 (fr) * | 1988-09-02 | 1991-07-05 | Hamon Christian | Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde |
US5384893A (en) * | 1992-09-23 | 1995-01-24 | Emerson & Stern Associates, Inc. | Method and apparatus for speech synthesis based on prosodic analysis |
EP0813733B1 (de) * | 1995-03-07 | 2003-12-10 | BRITISH TELECOMMUNICATIONS public limited company | Sprachsysnthese |
-
1994
- 1994-09-29 IT IT94TO000756A patent/IT1266943B1/it active IP Right Grant
-
1995
- 1995-05-24 EP EP95107944A patent/EP0706170B1/de not_active Expired - Lifetime
- 1995-05-24 DE DE69521955T patent/DE69521955T2/de not_active Expired - Lifetime
- 1995-05-24 DK DK95107944T patent/DK0706170T3/da active
- 1995-05-24 ES ES95107944T patent/ES2113329T3/es not_active Expired - Lifetime
- 1995-05-24 DE DE0706170T patent/DE706170T1/de active Pending
- 1995-05-31 CA CA002150614A patent/CA2150614C/en not_active Expired - Lifetime
- 1995-06-20 JP JP07175553A patent/JP3078205B2/ja not_active Expired - Lifetime
- 1995-09-15 US US08/528,713 patent/US5774855A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
ES2113329T1 (es) | 1998-05-01 |
ITTO940756A0 (it) | 1994-09-29 |
EP0706170A2 (de) | 1996-04-10 |
JP3078205B2 (ja) | 2000-08-21 |
CA2150614A1 (en) | 1996-03-30 |
EP0706170B1 (de) | 2001-08-01 |
US5774855A (en) | 1998-06-30 |
DK0706170T3 (da) | 2001-11-12 |
DE69521955D1 (de) | 2001-09-06 |
ITTO940756A1 (it) | 1996-03-29 |
EP0706170A3 (de) | 1997-11-26 |
JPH08110789A (ja) | 1996-04-30 |
DE69521955T2 (de) | 2002-04-04 |
IT1266943B1 (it) | 1997-01-21 |
ES2113329T3 (es) | 2001-12-16 |
CA2150614C (en) | 2000-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE706170T1 (de) | Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen | |
DE60009827T2 (de) | Zeitskalenmodifikation eines audiosignals | |
DE60303993T2 (de) | Musikstrukturerkennungsgerät und -verfahren | |
DE69720861T2 (de) | Verfahren zur Tonsynthese | |
DE69930961T2 (de) | Vorrichtung und verfahren zur sprachsegmentierung | |
DE2431161A1 (de) | Elektronisches musikinstrument | |
EP2180463A1 (de) | Verfahren zur Erkennung von Notenmustern in Musikstücken | |
DE69531525T2 (de) | Tonerkennung mit Minimierung falscher Identifikation | |
DE3786581T2 (de) | Kodierung und dekodierung von digitalen videokomponentensignalen. | |
DE2429871C3 (de) | Verfahren zum Erzeugen von elektrischen Klangsignalen entsprechend Klängen bestimmter Klanghöhe jedoch unterschiedlicher Lautstärkewerte | |
DE68915353T2 (de) | Einrichtung zur Sprachsynthese. | |
DE102004028693B4 (de) | Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt | |
DE102012025016B3 (de) | Verfahren zur Ermittlung wenigstens zweier Einzelsignale aus wenigstens zwei Ausgangssignalen | |
EP0797361B1 (de) | Verfahren zur Signalgewinnung in elektronischen Geräten mittels Interpolation zwischen Stützstellenwerten | |
DE3702215C2 (de) | ||
DE3101590C2 (de) | Anordnung zum Erzeugen eines Sprachsignals | |
DE3246712C2 (de) | ||
DE2610236A1 (de) | Verfahren und schaltung zur erzeugung von digitalen zweifrequenz- signalen | |
DE3220281A1 (de) | System zum zusammensetzen einer stimme durch kompilation von phonemstuecken | |
EP1489842A2 (de) | Verfahren und Vorrichtung zur bewegungsvektorgestützten Bildpunktinterpolation | |
DE4433366A1 (de) | Verfahren und Einrichtung zur Bestimmung eines Maßes der Übereinstimmung zwischen zwei Mustern sowie Spracherkennungseinrichtung damit und Programm-Modul dafür | |
EP0047512B1 (de) | Verfahren und Schaltungsanordnung zur Segmentierung von Zeichen aus einer seriell gelesenen Zeichenfolge | |
DE2051589A1 (de) | Anordnung zur Synthese eines Signals | |
DE3718337C2 (de) | ||
EP0399431A2 (de) | Neuronale Netzwerkarchitektur |