PL401347A1 - Spójny interfejs do lokalnej i oddalonej syntezy mowy - Google Patents

Spójny interfejs do lokalnej i oddalonej syntezy mowy

Info

Publication number
PL401347A1
PL401347A1 PL401347A PL40134712A PL401347A1 PL 401347 A1 PL401347 A1 PL 401347A1 PL 401347 A PL401347 A PL 401347A PL 40134712 A PL40134712 A PL 40134712A PL 401347 A1 PL401347 A1 PL 401347A1
Authority
PL
Poland
Prior art keywords
interface
generate
tts
audio presentation
computing device
Prior art date
Application number
PL401347A
Other languages
English (en)
Inventor
Michał T. Kaszczuk
Łukasz M. Osowski
Original Assignee
Ivona Software Spółka Z Ograniczoną Odpowiedzialnością
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ivona Software Spółka Z Ograniczoną Odpowiedzialnością filed Critical Ivona Software Spółka Z Ograniczoną Odpowiedzialnością
Priority to PL401347A priority Critical patent/PL401347A1/pl
Priority to US13/720,883 priority patent/US8959021B2/en
Publication of PL401347A1 publication Critical patent/PL401347A1/pl
Priority to US14/622,748 priority patent/US9595255B2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Stored Programmes (AREA)

Abstract

Wynalazek dotyczy komputerowego nośnika pamięci nieulotnej, na którym przechowywany jest moduł kodu wykonywalnego kierujący urządzeniem obliczeniowym klienta. Moduł kodu wykonywalnego kieruje urządzeniem obliczeniowym klienta dla przeprowadzenia procesu obejmującego: odbieranie, za pomocą pierwszego interfejsu, pierwszego żądania generowania pierwszej prezentacji audio dla pierwszych wejściowych danych tekstowych, gdzie pierwsze żądanie wskazuje pierwszy głos, z wykorzystaniem którego generowana będzie pierwsza prezentacja audio; wybieranie drugiego interfejsu z wykorzystaniem charakterystyki urządzenia obliczeniowego klienta, gdzie drugi interfejs jest interfejsem do lokalnego modułu zamiany tekstu na mowę; użycie drugiego interfejsu do generowania pierwszej prezentacji audio; odbieranie, za pomocą pierwszego interfejsu, drugiego żądania generowania drugiej prezentacji audio dla drugich wejściowych danych tekstowych, gdzie drugie żądanie wskazuje drugi głos, z wykorzystaniem którego generowana będzie druga prezentacja audio; wybieranie trzeciego interfejsu z wykorzystaniem charakterystyki urządzenia obliczeniowego klienta, gdzie trzeci interfejs jest interfejsem dla oddalonego modułu zamiany tekstu na mowę; oraz użycie trzeciego interfejsu do generowania drugiej prezentacji audio. Wynalazek dotyczy także sposobu implementowanego komputerowo, oraz systemu obejmującego urządzenie obliczeniowe obejmujące co najmniej jeden procesor. Rozwiązanie ujawnia funkcje dla zapewnienia spójnego interfejsu na potrzeby lokalnych i rozproszonych systemów zamiany tekstu na mowę TTS. Pewne części systemu TTS takie, jak głosy oraz elementy mechanizmu TTS mogą być instalowane na urządzeniach klienta, a niektóre mogą znajdować się na systemach oddalonych dostępnych za pomocą linku sieciowego. Można ustalić, które komponenty systemu TTS należy zainstalować na urządzeniu klienta, a które na serwerze oddalonym. Jednolity interfejs ułatwia łączenie się lub innego rodzaju wykorzystanie systemu TTS przez użycie tych samych metod i technik bez względu na to, która konfiguracja systemu TTS jest instalowana.
PL401347A 2012-10-25 2012-10-25 Spójny interfejs do lokalnej i oddalonej syntezy mowy PL401347A1 (pl)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PL401347A PL401347A1 (pl) 2012-10-25 2012-10-25 Spójny interfejs do lokalnej i oddalonej syntezy mowy
US13/720,883 US8959021B2 (en) 2012-10-25 2012-12-19 Single interface for local and remote speech synthesis
US14/622,748 US9595255B2 (en) 2012-10-25 2015-02-13 Single interface for local and remote speech synthesis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL401347A PL401347A1 (pl) 2012-10-25 2012-10-25 Spójny interfejs do lokalnej i oddalonej syntezy mowy

Publications (1)

Publication Number Publication Date
PL401347A1 true PL401347A1 (pl) 2014-04-28

Family

ID=50514985

Family Applications (1)

Application Number Title Priority Date Filing Date
PL401347A PL401347A1 (pl) 2012-10-25 2012-10-25 Spójny interfejs do lokalnej i oddalonej syntezy mowy

Country Status (2)

Country Link
US (2) US8959021B2 (pl)
PL (1) PL401347A1 (pl)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9240180B2 (en) * 2011-12-01 2016-01-19 At&T Intellectual Property I, L.P. System and method for low-latency web-based text-to-speech without plugins
US9159314B2 (en) * 2013-01-14 2015-10-13 Amazon Technologies, Inc. Distributed speech unit inventory for TTS systems
KR101319666B1 (ko) * 2013-02-27 2013-10-17 주식회사 위두커뮤니케이션즈 전자서적과 연동되는 게임의 제공 장치
US9431002B2 (en) 2014-03-04 2016-08-30 Tribune Digital Ventures, Llc Real time popularity based audible content aquisition
US9633649B2 (en) * 2014-05-02 2017-04-25 At&T Intellectual Property I, L.P. System and method for creating voice profiles for specific demographics
US9558736B2 (en) * 2014-07-02 2017-01-31 Bose Corporation Voice prompt generation combining native and remotely-generated speech data
US9959343B2 (en) 2016-01-04 2018-05-01 Gracenote, Inc. Generating and distributing a replacement playlist
US11170757B2 (en) * 2016-09-30 2021-11-09 T-Mobile Usa, Inc. Systems and methods for improved call handling
US10565980B1 (en) 2016-12-21 2020-02-18 Gracenote Digital Ventures, Llc Audio streaming of text-based articles from newsfeeds
US10419508B1 (en) 2016-12-21 2019-09-17 Gracenote Digital Ventures, Llc Saving media for in-automobile playout
US10019225B1 (en) 2016-12-21 2018-07-10 Gracenote Digital Ventures, Llc Audio streaming based on in-automobile detection
CN110971685B (zh) * 2019-11-29 2021-01-01 腾讯科技(深圳)有限公司 内容处理方法、装置、计算机设备及存储介质
US20220130377A1 (en) * 2020-10-27 2022-04-28 Samsung Electronics Co., Ltd. Electronic device and method for performing voice recognition thereof
CN116235244A (zh) * 2021-04-26 2023-06-06 微软技术许可有限责任公司 混合文本到语音

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
US7483832B2 (en) * 2001-12-10 2009-01-27 At&T Intellectual Property I, L.P. Method and system for customizing voice translation of text to speech
US8311822B2 (en) * 2004-11-02 2012-11-13 Nuance Communications, Inc. Method and system of enabling intelligent and lightweight speech to text transcription through distributed environment
EP1886302B1 (en) * 2005-05-31 2009-11-18 Telecom Italia S.p.A. Providing speech synthesis on user terminals over a communications network
US8224647B2 (en) * 2005-10-03 2012-07-17 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
CN101593516B (zh) * 2008-05-28 2011-08-24 国际商业机器公司 语音合成的方法和系统
US9761219B2 (en) * 2009-04-21 2017-09-12 Creative Technology Ltd System and method for distributed text-to-speech synthesis and intelligibility
US9009050B2 (en) * 2010-11-30 2015-04-14 At&T Intellectual Property I, L.P. System and method for cloud-based text-to-speech web services

Also Published As

Publication number Publication date
US9595255B2 (en) 2017-03-14
US8959021B2 (en) 2015-02-17
US20140122080A1 (en) 2014-05-01
US20150262571A1 (en) 2015-09-17

Similar Documents

Publication Publication Date Title
PL401347A1 (pl) Spójny interfejs do lokalnej i oddalonej syntezy mowy
GB2557833A (en) Risk and compliance analytic system
WO2014108805A3 (en) Distributed speech unit inventory for tts systems
BR112018010876A2 (pt) dispositivo eletrônico que gera notificação com base nos dados de contexto em resposta à frase da fala de usuário
EP3923277A3 (en) Delayed responses by computational assistant
IN2014MN02173A (pl)
EA201890924A1 (ru) Сеть обработки информации на основе выпуска единого кода, способ обработки информации и устройство распознавания для доступа
IN2014MN02176A (pl)
RU2012150996A (ru) Способ коммуникации пользователя с информационной диалоговой системой
EP2499582A4 (en) SYSTEM AND METHOD FOR HYBRID PROCESSING IN AN ENVIRONMENT OF TELEPHONE SERVICES IN NATURAL LANGUAGE
BR112017013065A2 (pt) facilitação de envio e recebimento de pagamentos entre indivíduos e empresas
BR112015031231A8 (pt) método, dispositivo de armazenamento legível por computador e sistema para utilizar condições ambientais em adição a outras informações de estado do diálogo em um sistema de diálogo de conversação
BR112013021381A2 (pt) sistema e método para estabelecer uma rede de comunicações de incidente
BR112018072903A2 (pt) método, e, dispositivos de comunicação e conectado.
BR112014024648A8 (pt) método e sistema para codificar por celp um sinal de áudio/voz e método de busca rápida de um livro-código mixado
BR112016007271A2 (pt) ?métodos e sistemas para gerenciar informações de comunidade?
WO2018118492A3 (en) Linguistic modeling using sets of base phonetics
UA113173C2 (xx) Система та спосіб розпізнавання контенту програми мовлення
BR112017023309A2 (pt) método, computador servidor, e, método implementado por computador
JP2015523623A5 (pl)
GB2555543A (en) Converting flash content to HTML content by generating an instruction list
JP2014066779A5 (pl)
WO2014210542A3 (en) System, method, and computer program product for providing test logic to user devices
US20140142938A1 (en) Message processing device
PH12014501588A1 (en) Cloud-based translation method and system for mobile client