PL401347A1 - Spójny interfejs do lokalnej i oddalonej syntezy mowy - Google Patents
Spójny interfejs do lokalnej i oddalonej syntezy mowyInfo
- Publication number
- PL401347A1 PL401347A1 PL401347A PL40134712A PL401347A1 PL 401347 A1 PL401347 A1 PL 401347A1 PL 401347 A PL401347 A PL 401347A PL 40134712 A PL40134712 A PL 40134712A PL 401347 A1 PL401347 A1 PL 401347A1
- Authority
- PL
- Poland
- Prior art keywords
- interface
- generate
- tts
- audio presentation
- computing device
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title 1
- 238000003786 synthesis reaction Methods 0.000 title 1
- 238000000034 method Methods 0.000 abstract 4
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Stored Programmes (AREA)
Abstract
Wynalazek dotyczy komputerowego nośnika pamięci nieulotnej, na którym przechowywany jest moduł kodu wykonywalnego kierujący urządzeniem obliczeniowym klienta. Moduł kodu wykonywalnego kieruje urządzeniem obliczeniowym klienta dla przeprowadzenia procesu obejmującego: odbieranie, za pomocą pierwszego interfejsu, pierwszego żądania generowania pierwszej prezentacji audio dla pierwszych wejściowych danych tekstowych, gdzie pierwsze żądanie wskazuje pierwszy głos, z wykorzystaniem którego generowana będzie pierwsza prezentacja audio; wybieranie drugiego interfejsu z wykorzystaniem charakterystyki urządzenia obliczeniowego klienta, gdzie drugi interfejs jest interfejsem do lokalnego modułu zamiany tekstu na mowę; użycie drugiego interfejsu do generowania pierwszej prezentacji audio; odbieranie, za pomocą pierwszego interfejsu, drugiego żądania generowania drugiej prezentacji audio dla drugich wejściowych danych tekstowych, gdzie drugie żądanie wskazuje drugi głos, z wykorzystaniem którego generowana będzie druga prezentacja audio; wybieranie trzeciego interfejsu z wykorzystaniem charakterystyki urządzenia obliczeniowego klienta, gdzie trzeci interfejs jest interfejsem dla oddalonego modułu zamiany tekstu na mowę; oraz użycie trzeciego interfejsu do generowania drugiej prezentacji audio. Wynalazek dotyczy także sposobu implementowanego komputerowo, oraz systemu obejmującego urządzenie obliczeniowe obejmujące co najmniej jeden procesor. Rozwiązanie ujawnia funkcje dla zapewnienia spójnego interfejsu na potrzeby lokalnych i rozproszonych systemów zamiany tekstu na mowę TTS. Pewne części systemu TTS takie, jak głosy oraz elementy mechanizmu TTS mogą być instalowane na urządzeniach klienta, a niektóre mogą znajdować się na systemach oddalonych dostępnych za pomocą linku sieciowego. Można ustalić, które komponenty systemu TTS należy zainstalować na urządzeniu klienta, a które na serwerze oddalonym. Jednolity interfejs ułatwia łączenie się lub innego rodzaju wykorzystanie systemu TTS przez użycie tych samych metod i technik bez względu na to, która konfiguracja systemu TTS jest instalowana.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PL401347A PL401347A1 (pl) | 2012-10-25 | 2012-10-25 | Spójny interfejs do lokalnej i oddalonej syntezy mowy |
US13/720,883 US8959021B2 (en) | 2012-10-25 | 2012-12-19 | Single interface for local and remote speech synthesis |
US14/622,748 US9595255B2 (en) | 2012-10-25 | 2015-02-13 | Single interface for local and remote speech synthesis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PL401347A PL401347A1 (pl) | 2012-10-25 | 2012-10-25 | Spójny interfejs do lokalnej i oddalonej syntezy mowy |
Publications (1)
Publication Number | Publication Date |
---|---|
PL401347A1 true PL401347A1 (pl) | 2014-04-28 |
Family
ID=50514985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PL401347A PL401347A1 (pl) | 2012-10-25 | 2012-10-25 | Spójny interfejs do lokalnej i oddalonej syntezy mowy |
Country Status (2)
Country | Link |
---|---|
US (2) | US8959021B2 (pl) |
PL (1) | PL401347A1 (pl) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9240180B2 (en) * | 2011-12-01 | 2016-01-19 | At&T Intellectual Property I, L.P. | System and method for low-latency web-based text-to-speech without plugins |
US9159314B2 (en) * | 2013-01-14 | 2015-10-13 | Amazon Technologies, Inc. | Distributed speech unit inventory for TTS systems |
KR101319666B1 (ko) * | 2013-02-27 | 2013-10-17 | 주식회사 위두커뮤니케이션즈 | 전자서적과 연동되는 게임의 제공 장치 |
US9431002B2 (en) | 2014-03-04 | 2016-08-30 | Tribune Digital Ventures, Llc | Real time popularity based audible content aquisition |
US9633649B2 (en) * | 2014-05-02 | 2017-04-25 | At&T Intellectual Property I, L.P. | System and method for creating voice profiles for specific demographics |
US9558736B2 (en) * | 2014-07-02 | 2017-01-31 | Bose Corporation | Voice prompt generation combining native and remotely-generated speech data |
US9959343B2 (en) | 2016-01-04 | 2018-05-01 | Gracenote, Inc. | Generating and distributing a replacement playlist |
US11170757B2 (en) * | 2016-09-30 | 2021-11-09 | T-Mobile Usa, Inc. | Systems and methods for improved call handling |
US10565980B1 (en) | 2016-12-21 | 2020-02-18 | Gracenote Digital Ventures, Llc | Audio streaming of text-based articles from newsfeeds |
US10419508B1 (en) | 2016-12-21 | 2019-09-17 | Gracenote Digital Ventures, Llc | Saving media for in-automobile playout |
US10019225B1 (en) | 2016-12-21 | 2018-07-10 | Gracenote Digital Ventures, Llc | Audio streaming based on in-automobile detection |
CN110971685B (zh) * | 2019-11-29 | 2021-01-01 | 腾讯科技(深圳)有限公司 | 内容处理方法、装置、计算机设备及存储介质 |
US20220130377A1 (en) * | 2020-10-27 | 2022-04-28 | Samsung Electronics Co., Ltd. | Electronic device and method for performing voice recognition thereof |
CN116235244A (zh) * | 2021-04-26 | 2023-06-06 | 微软技术许可有限责任公司 | 混合文本到语音 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7003463B1 (en) * | 1998-10-02 | 2006-02-21 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US7483832B2 (en) * | 2001-12-10 | 2009-01-27 | At&T Intellectual Property I, L.P. | Method and system for customizing voice translation of text to speech |
US8311822B2 (en) * | 2004-11-02 | 2012-11-13 | Nuance Communications, Inc. | Method and system of enabling intelligent and lightweight speech to text transcription through distributed environment |
EP1886302B1 (en) * | 2005-05-31 | 2009-11-18 | Telecom Italia S.p.A. | Providing speech synthesis on user terminals over a communications network |
US8224647B2 (en) * | 2005-10-03 | 2012-07-17 | Nuance Communications, Inc. | Text-to-speech user's voice cooperative server for instant messaging clients |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
CN101593516B (zh) * | 2008-05-28 | 2011-08-24 | 国际商业机器公司 | 语音合成的方法和系统 |
US9761219B2 (en) * | 2009-04-21 | 2017-09-12 | Creative Technology Ltd | System and method for distributed text-to-speech synthesis and intelligibility |
US9009050B2 (en) * | 2010-11-30 | 2015-04-14 | At&T Intellectual Property I, L.P. | System and method for cloud-based text-to-speech web services |
-
2012
- 2012-10-25 PL PL401347A patent/PL401347A1/pl unknown
- 2012-12-19 US US13/720,883 patent/US8959021B2/en active Active
-
2015
- 2015-02-13 US US14/622,748 patent/US9595255B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9595255B2 (en) | 2017-03-14 |
US8959021B2 (en) | 2015-02-17 |
US20140122080A1 (en) | 2014-05-01 |
US20150262571A1 (en) | 2015-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PL401347A1 (pl) | Spójny interfejs do lokalnej i oddalonej syntezy mowy | |
GB2557833A (en) | Risk and compliance analytic system | |
WO2014108805A3 (en) | Distributed speech unit inventory for tts systems | |
BR112018010876A2 (pt) | dispositivo eletrônico que gera notificação com base nos dados de contexto em resposta à frase da fala de usuário | |
EP3923277A3 (en) | Delayed responses by computational assistant | |
IN2014MN02173A (pl) | ||
EA201890924A1 (ru) | Сеть обработки информации на основе выпуска единого кода, способ обработки информации и устройство распознавания для доступа | |
IN2014MN02176A (pl) | ||
RU2012150996A (ru) | Способ коммуникации пользователя с информационной диалоговой системой | |
EP2499582A4 (en) | SYSTEM AND METHOD FOR HYBRID PROCESSING IN AN ENVIRONMENT OF TELEPHONE SERVICES IN NATURAL LANGUAGE | |
BR112017013065A2 (pt) | facilitação de envio e recebimento de pagamentos entre indivíduos e empresas | |
BR112015031231A8 (pt) | método, dispositivo de armazenamento legível por computador e sistema para utilizar condições ambientais em adição a outras informações de estado do diálogo em um sistema de diálogo de conversação | |
BR112013021381A2 (pt) | sistema e método para estabelecer uma rede de comunicações de incidente | |
BR112018072903A2 (pt) | método, e, dispositivos de comunicação e conectado. | |
BR112014024648A8 (pt) | método e sistema para codificar por celp um sinal de áudio/voz e método de busca rápida de um livro-código mixado | |
BR112016007271A2 (pt) | ?métodos e sistemas para gerenciar informações de comunidade? | |
WO2018118492A3 (en) | Linguistic modeling using sets of base phonetics | |
UA113173C2 (xx) | Система та спосіб розпізнавання контенту програми мовлення | |
BR112017023309A2 (pt) | método, computador servidor, e, método implementado por computador | |
JP2015523623A5 (pl) | ||
GB2555543A (en) | Converting flash content to HTML content by generating an instruction list | |
JP2014066779A5 (pl) | ||
WO2014210542A3 (en) | System, method, and computer program product for providing test logic to user devices | |
US20140142938A1 (en) | Message processing device | |
PH12014501588A1 (en) | Cloud-based translation method and system for mobile client |