DE706170T1 - Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen - Google Patents

Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen

Info

Publication number
DE706170T1
DE706170T1 DE0706170T DE95107944T DE706170T1 DE 706170 T1 DE706170 T1 DE 706170T1 DE 0706170 T DE0706170 T DE 0706170T DE 95107944 T DE95107944 T DE 95107944T DE 706170 T1 DE706170 T1 DE 706170T1
Authority
DE
Germany
Prior art keywords
edge
interval
synthesis
duration
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE0706170T
Other languages
English (en)
Other versions
DE19507944A1 (de
Inventor
Enzo Foti
Luciano Nebbia
Stefano Sandri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telecom Italia SpA
Original Assignee
CSELT Centro Studi e Laboratori Telecomunicazioni SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSELT Centro Studi e Laboratori Telecomunicazioni SpA filed Critical CSELT Centro Studi e Laboratori Telecomunicazioni SpA
Publication of DE706170T1 publication Critical patent/DE706170T1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L2013/021Overlap-add techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Machine Translation (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Auxiliary Devices For Music (AREA)
  • Stereophonic System (AREA)

Claims (9)

  1. LEDERER, KELLER & RIEDERER
    Patentanwälte - European Patent Attorneys j,^ FRANZ Lc)DERSR
    . DlpL-Cian. Mröcnen
    Dr t &Ggr; &eegr; &lgr; &eegr;* * 4 in &tgr;&lgr; ' dr. Günter heller
    t~ I &Ggr; &Ggr; &Pgr; ■* F I h !/Il T 1 DipL-Biol. München
    L_/l_f UjUUs/UJI DR. MICHAEL BEST
    DipL-Chen. München
    ANTON FREIHERR RIEDERER v. PAAR DipL-ing. Landshut
    Lederer. Keller & Riederer. Postfach 2664. D-84010 Landshut
    D-84010 Landshut
    Postfach 26 64
    (84028 Landshut, Freyung 615) Telefon (08 71) 2 21 70 Telefax (08 71) 2 21 43
    Europäische Patentanmeldung 95 107 944.1
    (Veröffentlichungsnummer 0 706 170)
    CSELT Centra Studi e Laboratori
    Telecomunicazioni S.p.A.
    Turin, Italien
    Patentansprüche
    1. Verfahren zur Sprachsignalsynthese mit Hilfe einer Zeitverkettung von Signalverläufen, die elementare Sprachsignaleinheiten wiedergeben, wobei man: wenigstens diejenigen Signalverläufe, die stimmhaften Lauten zugeordnet sind, in eine Vielzahl von Intervallen unterteilt, die den Reaktionen des Vokaltraktes auf eine Serie von Impulsen der Stimmbanderregung entsprechen, die synchron der Grundfrequenz des Signals sind; den Signalverlauf in jedem Intervall gewichtet; die aus der Gewichtung resultierenden Signale ersetzt durch eine Replik derselben, die zeitlich um einen Betrag verschoben ist, der von einer prosodischen Information abhängt; und die Synthese durchführt durch Überlappen und Addieren der verschobenen Signale; dadurch gekennzeichnet, daß
    man ein laufendes Intervall des in Synthese zu reproduzierenden ursprünglichen Signals in einen unveränderlichen Teil und einen
    variablen Teil unterteilt, von denen der unveränderliche Teil zwischen dem Intervallbeginn und einem linken Analyserand liegt, welcher durch einen Nulldurchgang des ursprünglichen Sprachsignals gegeben ist, der
    vorgegebene Bedingungen erfüllt, und der variable Teil zwischen dem linken Analyserand und einem rechten Analyserand liegt, welcher im wesentlichen mit dem Ende des laufenden Intervalls übereinstimmt, wobei der linke und der rechte Analyserand im synthetisierten Signal einem linken Syntheserand bzw. einem rechten Syntheserand zu
    geordnet sind, von denen der linke Syntheserand mit dem linken Analyserand unter Bezugnahme auf eine Intervallstart-Markierung zusammenfällt, und der rechte Syntheserand im wesentlichen mit dem Ende des Intervalls im synthetisierten Signal zusammenfällt;
    &iacgr;&ogr; - man den Teil des Signalverlaufs auf der rechten Seite des linken
    Analyserands des laufenden Intervalls des ursprünglichen Signals einer ersten Verbindungsfunktion unterwirft, die eine Dauer gleich der des Abschnitts des synthetisierten Signalverlaufs hat, der zwischen dem linken Syntheserand und dem rechten Syntheserand liegt, und eine Amplitude hat, die fortschreitend abnimmt und in Übereinstimmung mit
    dem linken Analyserand maximal ist;
    man den Teil des Signalverlaufs auf der linken Seite des nachfolgenden Intervalls des ursprünglichen in Synthese zu reproduzierenden Signals einer zweiten Verbindungsfunktion unterwirft, die eine Dauer gleich der
    &ogr; des Abschnitts des synthetisierten Signalverlaufs hat, der zwischen dem
    linken Syntheserand und dem rechten Syntheserand liegt, und eine Amplitude hat, die fortschreitend zunimmt und ihr Maximum in Übereinstimmung mit dem Beginn des nachfolgenden Intervalls hat;
    man jedes Intervall des synthetisierten Signals aufbaut durch unveränderte Wiedergabe des Signalverlaufs im unveränderlichen Teil des
    ursprünglichen Intervalls und durch daran Anhängen des durch zeitliche Ausrichtung erhaltenen Signalverlaufs und Hinzufügung der beiden durch Anwendung der zwei Verbindungsfunktion resultierenden Signalverläufe.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man, sofern die Dauer eines Intervalls für die Synthese im Hinblick auf die Dauer des
    entsprechenden Intervalls des ursprünglichen Signals vermindert oder unverändert aufrechterhalten wird, den linken Analyserand und den linken Syntheserand mit den folgenden Operationen bestimmt:
    man berechnet die Zahl der Nulldurchgänge des ursprünglichen Signalverlaufs und ordnet jedem Nulldurchgang einen Index zu, der
    vom Anfang zum Ende des Intervalls zu ansteigt;
    man überprüft, daß die Zahl der Nulldurchgänge nicht niedriger als eine erste Schwelle ist;
    man sucht im Fall eines positiven Ergebnisses dieser Überprüfung einen &iacgr;&ogr; Nulldurchgang als Kandidaten, der als linker Analyserand und Syn
    theserand dienen soll;
    man sucht unter allen Nulldurchgängen des Intervalls mit Ausnahme des letzten Nuildurchgangs rückwärts nach einem Kandidaten, der links vom rechten Syntheserand liegt, diesem so nahe als möglich ist und eine für die anzuwendende Verbindungsfunktion ausreichende Zeit
    spanne sicherstellt, und weist die Aufgabe des linken Analyserands und Synthesrands diesem Kandidaten zu.
  3. 3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß man bei dieser &ogr; Berechnung der Nulldurchgänge solche Nulldurchgänge, deren Abstand vom
    vorhergehenden Nulldurchgang kleiner ist als ein gegebener Abstand, außer Betracht läßt.
  4. 4. Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß man, falls die Rückwärtssuche ein negatives Ergebnis erbracht hat und die Zahl der Nulldurchgänge höher ist als die erste Schwelle, die Aufgaben des linken Analyserands und des linken Syntheserands demjenigen Nulldurchgang zuordnet, dessen Index dieser Schwelle entspricht, sofern dieser Nulldurchgang links vom rechten Syntheserand liegt.
  5. 5. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, daß man, falls die Rückwärtssuche ein negatives Ergebnis erbracht hat und die
    Zahl der Nulldurchgänge nicht höher als die erste Schwelle ist, eine weitere Suchphase zum Identifizieren der Nulldurchgänge, die links vom rechten Syntheserand liegen und von diesem einen Abstand haben, der nicht niedriger als eine zweite Schwelle ist, durchführt und die Aufgaben des linken Analyserands und des rechten Analyserands dem Nulldurchgang, der diese Bedingungen erfüllt, mit dem höchsten Index zuweist.
  6. 6. Verfahren nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, daß man, falls der Vergleich mit der ersten Schwelle anzeigt, daß die Zahl der
    &iacgr;&ogr; Nulldurchgänge niedriger ist als die erste Schwelle, die Rückwärtssuche
    direkt durchführt und, wenn sie ein negatives Ergebnis erbringt, die weitere Suchphase direkt durchführt.
  7. 7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß man, sofern die Dauer des Intervalls für die Synthese im Vergleich zur Dauer
    des Intervallsdes ursprünglichen Signals erhöht wird, den linken Analyserand und den linken Syntheserand mit den folgenden Operationen bestimmt:
    man berechnet die Zahl der Nulldurchgänge des ursprünglichen Signalverlaufs;
    - man vergleicht die Verlängerung der Zeitdauer des Syntheseintervalls
    mit der Zeitdauer des ursprünglichen Intervalls zur Überprüfung, daß die Verlängerung nicht mehr als die Hälfte der ursprünglichen Intervalldauer ausmacht;
    sofern die Überprüfung ein positives Ergebnis gibt, sucht man unter allen Nulldurchgängen außerdem letzten Nulldurchgang rückwärts nach
    einem Nulldurchgang als Kandidaten, der links vom rechten Syntheserand liegt und der erste ist, für den der Abstand vom rechten Syntheserand nicht kürzer als die Verlängerung der Dauer des Intervalls ist, und weist man die Aufgaben des linken Analyserands und des linken
    &ogr; Syntheserands demjenigen Nulldurchgang zu, der diese Bedingungen
    erfüllt, sofern ein solcher existiert.
  8. 8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß man bei der Berechnung der Nulldurchgänge diejenigen Nulldurchgänge, deren Abstand vom vorhergehenden Nulldurchgang niedriger ist als ein gegebener Abstand, nicht in Betracht zieht.
  9. 9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, daß man, sofern die Verlängerung der Intervalldauer mehr als die Hälfte der Dauer des ursprünglichen Intervalls ausmacht oder sofern die Rückwärtssuche erfolglos ist, eine weitere Rückwärtssuchphase durchführt, um die Nulldurchgänge zu
    &iacgr;&ogr; identifizieren, die links vom rechten Syntheserand liegen und von diesem
    einen Abstand haben, der nicht kleiner als eine dritte Schwelle ist; daß man die Abstände vom rechten Syntheserand und vom rechten Analyserand und das Verhältnis zwischen diesen Abständen für diese Nulldurchgänge berechnet; daß man dieses Verhältnis mit dem Wert des Verhältnisses zwischen der Dauer des Syntheseintervalls und der Dauer des ursprünglichen Intervalls vergleicht und die Aufgaben des linken Analyserands und des linken Syntheserands demjenigen Nulldurchgang zuweist, dessen Index der niedrigste unter denjenigen ist, für die das Verhältnis der Abstände von den Rändern das Verhältnis zwischen den Zeitdauern nicht um mehr als einen gegebenen Faktor übersteigt.
DE0706170T 1994-09-29 1995-05-24 Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen Pending DE706170T1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT94TO000756A IT1266943B1 (it) 1994-09-29 1994-09-29 Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda.

Publications (1)

Publication Number Publication Date
DE706170T1 true DE706170T1 (de) 1998-11-19

Family

ID=11412789

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69521955T Expired - Lifetime DE69521955T2 (de) 1994-09-29 1995-05-24 Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen
DE0706170T Pending DE706170T1 (de) 1994-09-29 1995-05-24 Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69521955T Expired - Lifetime DE69521955T2 (de) 1994-09-29 1995-05-24 Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen

Country Status (8)

Country Link
US (1) US5774855A (de)
EP (1) EP0706170B1 (de)
JP (1) JP3078205B2 (de)
CA (1) CA2150614C (de)
DE (2) DE69521955T2 (de)
DK (1) DK0706170T3 (de)
ES (1) ES2113329T3 (de)
IT (1) IT1266943B1 (de)

Families Citing this family (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240384B1 (en) 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
US6453288B1 (en) 1996-11-07 2002-09-17 Matsushita Electric Industrial Co., Ltd. Method and apparatus for producing component of excitation vector
KR100236974B1 (ko) * 1996-12-13 2000-02-01 정선종 동화상과 텍스트/음성변환기 간의 동기화 시스템
US8209184B1 (en) * 1997-04-14 2012-06-26 At&T Intellectual Property Ii, L.P. System and method of providing generated speech via a network
KR100240637B1 (ko) 1997-05-08 2000-01-15 정선종 다중매체와의 연동을 위한 텍스트/음성변환 구현방법 및 그 장치
EP1000499B1 (de) * 1997-07-31 2008-12-31 Cisco Technology, Inc. Erzeugung von sprachnachrichten
US6725190B1 (en) * 1999-11-02 2004-04-20 International Business Machines Corporation Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP3673471B2 (ja) * 2000-12-28 2005-07-20 シャープ株式会社 テキスト音声合成装置およびプログラム記録媒体
US7035794B2 (en) * 2001-03-30 2006-04-25 Intel Corporation Compressing and using a concatenative speech database in text-to-speech systems
EP1262952B1 (de) * 2001-05-28 2006-08-16 Texas Instruments Incorporated Programmierbarer Melodienerzeuger
US6809526B2 (en) * 2001-07-02 2004-10-26 Abratech Corporation QSD apparatus and method for recovery of transient response obscured by superposition
DE10230884B4 (de) * 2002-07-09 2006-01-12 Siemens Ag Vereinigung von Prosodiegenerierung und Bausteinauswahl bei der Sprachsynthese
GB2392358A (en) * 2002-08-02 2004-02-25 Rhetorical Systems Ltd Method and apparatus for smoothing fundamental frequency discontinuities across synthesized speech segments
ATE318440T1 (de) 2002-09-17 2006-03-15 Koninkl Philips Electronics Nv Sprachsynthese durch verkettung von sprachsignalformen
ATE352837T1 (de) 2002-09-17 2007-02-15 Koninkl Philips Electronics Nv Verfahren zur steuerung der dauer bei der sprachsynthese
AU2003253152A1 (en) 2002-09-17 2004-04-08 Koninklijke Philips Electronics N.V. A method of synthesizing of an unvoiced speech signal
EP1543497B1 (de) 2002-09-17 2006-06-07 Koninklijke Philips Electronics N.V. Verfahren zur synthese eines stationären klangsignals
CN1604077B (zh) * 2003-09-29 2012-08-08 纽昂斯通讯公司 对发音波形语料库的改进方法
US7409347B1 (en) * 2003-10-23 2008-08-05 Apple Inc. Data-driven global boundary optimization
US7643990B1 (en) * 2003-10-23 2010-01-05 Apple Inc. Global boundary-centric feature extraction and associated discontinuity metrics
KR20050059766A (ko) * 2003-12-15 2005-06-21 엘지전자 주식회사 동적 시간 워핑을 이용한 음성 인식 방법
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070299657A1 (en) * 2006-06-21 2007-12-27 Kang George S Method and apparatus for monitoring multichannel voice transmissions
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (de) 2013-06-09 2016-04-20 Apple Inc. Vorrichtung, verfahren und grafische benutzeroberfläche für gesprächspersistenz über zwei oder mehrere instanzen eines digitaler assistenten
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU574104B2 (en) * 1983-09-09 1988-06-30 Sony Corporation Apparatus for reproducing audio signal
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
FR2636163B1 (fr) * 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
US5384893A (en) * 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
EP0813733B1 (de) * 1995-03-07 2003-12-10 BRITISH TELECOMMUNICATIONS public limited company Sprachsysnthese

Also Published As

Publication number Publication date
ES2113329T1 (es) 1998-05-01
ITTO940756A0 (it) 1994-09-29
EP0706170A2 (de) 1996-04-10
JP3078205B2 (ja) 2000-08-21
CA2150614A1 (en) 1996-03-30
EP0706170B1 (de) 2001-08-01
US5774855A (en) 1998-06-30
DK0706170T3 (da) 2001-11-12
DE69521955D1 (de) 2001-09-06
ITTO940756A1 (it) 1996-03-29
EP0706170A3 (de) 1997-11-26
JPH08110789A (ja) 1996-04-30
DE69521955T2 (de) 2002-04-04
IT1266943B1 (it) 1997-01-21
ES2113329T3 (es) 2001-12-16
CA2150614C (en) 2000-04-11

Similar Documents

Publication Publication Date Title
DE706170T1 (de) Verfahren zur Sprachsynthese durch Verkettung und teilweise Überlappung von Wellenformen
DE60009827T2 (de) Zeitskalenmodifikation eines audiosignals
DE60303993T2 (de) Musikstrukturerkennungsgerät und -verfahren
DE69720861T2 (de) Verfahren zur Tonsynthese
DE69930961T2 (de) Vorrichtung und verfahren zur sprachsegmentierung
DE2431161A1 (de) Elektronisches musikinstrument
EP2180463A1 (de) Verfahren zur Erkennung von Notenmustern in Musikstücken
DE69531525T2 (de) Tonerkennung mit Minimierung falscher Identifikation
DE3786581T2 (de) Kodierung und dekodierung von digitalen videokomponentensignalen.
DE2429871C3 (de) Verfahren zum Erzeugen von elektrischen Klangsignalen entsprechend Klängen bestimmter Klanghöhe jedoch unterschiedlicher Lautstärkewerte
DE68915353T2 (de) Einrichtung zur Sprachsynthese.
DE102004028693B4 (de) Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt
DE102012025016B3 (de) Verfahren zur Ermittlung wenigstens zweier Einzelsignale aus wenigstens zwei Ausgangssignalen
EP0797361B1 (de) Verfahren zur Signalgewinnung in elektronischen Geräten mittels Interpolation zwischen Stützstellenwerten
DE3702215C2 (de)
DE3101590C2 (de) Anordnung zum Erzeugen eines Sprachsignals
DE3246712C2 (de)
DE2610236A1 (de) Verfahren und schaltung zur erzeugung von digitalen zweifrequenz- signalen
DE3220281A1 (de) System zum zusammensetzen einer stimme durch kompilation von phonemstuecken
EP1489842A2 (de) Verfahren und Vorrichtung zur bewegungsvektorgestützten Bildpunktinterpolation
DE4433366A1 (de) Verfahren und Einrichtung zur Bestimmung eines Maßes der Übereinstimmung zwischen zwei Mustern sowie Spracherkennungseinrichtung damit und Programm-Modul dafür
EP0047512B1 (de) Verfahren und Schaltungsanordnung zur Segmentierung von Zeichen aus einer seriell gelesenen Zeichenfolge
DE2051589A1 (de) Anordnung zur Synthese eines Signals
DE3718337C2 (de)
EP0399431A2 (de) Neuronale Netzwerkarchitektur