FI115868B - Puhesynteesi - Google Patents
Puhesynteesi Download PDFInfo
- Publication number
- FI115868B FI115868B FI20001572A FI20001572A FI115868B FI 115868 B FI115868 B FI 115868B FI 20001572 A FI20001572 A FI 20001572A FI 20001572 A FI20001572 A FI 20001572A FI 115868 B FI115868 B FI 115868B
- Authority
- FI
- Finland
- Prior art keywords
- speech synthesis
- speech
- synthesis template
- template
- text message
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 149
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 149
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000004891 communication Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000000007 visual effect Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims 5
- 230000015654 memory Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72436—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
- Absorbent Articles And Supports Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Telephone Function (AREA)
Description
PUHESYNTEESI 1 1 5 8 6 8
Keksintö liittyy yleisesti puhesynteesiin ja ääneen tapahtuvaan tekstin keinotekoiseen lukemiseen.
5
Merkittävä osa viestinnästä on siirtynyt puhelinsoitoista ja paperipohjaisista viesteistä sähköisessä muodossa välitettäviin tekstiviesteihin, kuten sähköpostiviesteihin. Sähköisessä muodossa olevat tekstiviestit otetaan vastaan ja esitetään tietokoneen näytöllä ja muilla sähköisillä ja elektronisilla näytöillä. 10 Tekstiviestien kirjoittaminen ja lähettäminen sähköpostilla on suosittua, koska sähköpostilla viesti voidaan toimittaa nopeasti ja tarvittaessa suurelle vastaanottajajoukolle, ja lisäksi viestit voidaan tehdä tietokoneilla, joita monilla on mahdollisuus käyttää. Lisäksi kukin vastaanottaja voi helposti tallentaa tekstiviestin ja lukea sen silloin kun hänelle sopii.
15
Esimerkkejä tekstiviesteistä ovat tietokoneilla näkyvät sähköpostitekstiviestit ja matkapuhelimilla näkyvät SMS-viestit eli lyhytsanomat (SMS - short message service). Digitaalisen konvergenssin ollessa nykyään käynnissä viestit lähetetään yleisesti yhdenlaisella sähköisellä lähetyslaitteella ja otetaan vastaan toisenlaisella /·,; 20 sähköisellä laitteella. Esimerkiksi tietokoneella lähetetyt sähköpostitekstiviestit * » j\, voidaan ottaa vastaan ja näyttää matkapuhelimilla. Samoin matkapuhelimet voivat Γ lähettää sähköpostitekstiviestejä tietokoneisiin tai toisiin matkapuhelimiin.
Ongelmia ei ollut suhteellisen pitkienkään tekstiviestien kanssa silloin, kun tällaisia 25 tekstiviestejä lähetettiin ainoastaan tietokoneelta tietokoneelle. Tämä johtuu siitä, että tietokoneiden näytöt ovat tarpeeksi isoja, jotta tällaiset tekstiviestit voidaan esittää vaikeuksitta. Lisäksi tietokoneiden käyttäjät eivät yleensä ole liikkeellä, vaan kykenevät keskittämään huomionsa tietokoneen näyttöön. Tekstiviestien :*·.· vastaanottaminen matkapuhelinten kaltaisilla langattomilla viestimillä on entistä *:·· 30 yleisempää. Näiden laitteiden näytöt ovat kuitenkin yleensä liian pieniä, jotta tekstiviestin lukeminen onnistuisi vaivatta, varsinkin jos viestissä on paljon tekstiä.
.* ·. Jos langattomista viestimistä tehdään suurempia, käyttäjän voi olla hankala kuljettaa niitä mukanaan. Koska laitteen käyttäjä on lisäksi vielä liikkeellä, 2 115868 tekstiviestien lukeminen voi olla ongelmallista, esimerkiksi jos käyttäjä ajaa autoa tai tekee jotain muuta, minkä vuoksi hänen on katsottava muualle kuin matkaviestimeensä.
5 Koska tekstiviestien lähettämisessä on tällaisia ongelmia, on kehitetty informaatiojärjestelmiä, joiden avulla voidaan äänittää puheviestejä tai muuntaa tekstiä puheeksi puhesynteesin avulla.
Tuotetun puheen laatu riippuu puhesynteesissä laajalti siitä, kuinka paljon tavuja 10 käytetään syntetisoitavaa puhetta kuvaavassa puhesynteesimallissa. Laadukas puhesynteesi saattaa vaatia suuren määrän dataa puhesynteesimallilta. Tämä on epäkäytännöllistä etenkin matkapuhelimissa. Puhesynteesimallin tuottamiseksi vaaditaan lisäksi huomattava määrä tiedonkäsittelykykyä. Lisäksi puhesynteesimallin luominen vaatii runsaasti aikaa puhujalta, jonka puhetta 15 syntetisoidaan. Tästä johtuen jokin laite sisältää yleensä vain yhden tai korkeintaan muutaman puhujan puhesynteesimallin syntetisoidun puheen luomiseksi.
Japanilaisessa patenttijulkaisussa 11-219278 esitetään järjestelmä, jossa käyttäjät 20 voivat olla virtuaalisesti läsnä kolmiulotteisessa virtuaaliavaruudessa. Jos käyttäjä haluaa puhua toiselle käyttäjälle, hänen puheensa tunnistetaan ja muunnetaan merkkipohjaiseksi viestiksi, minkä jälkeen merkkipohjainen viesti lähetetään. ·:··: Merkkipohjainen viesti syntetisoidaan vastaanotettaessa puheeksi, ja syntetisoitu viesti soitetaan toiselle käyttäjälle. Puhesynteesiä parannetaan äänen sävyn ja 25 voimakkuuden säätöä soveltamalla, ja näin simuloidaan puhujan ja kuuntelijan välistä virtuaalista etäisyyttä virtuaaliavaruudessa.
«
Esillä olevan keksinnön ensimmäisen aspektin mukaisesti tarjotaan oheisen : ’·.* patenttivaatimuksen 1 mukainen menetelmä tekstiviestin muuntamiseksi •: ”: 30 syntetisoiduksi puheeksi.
115868 3
Edullisesti ainakin yksi ensimmäisestä ja toisesta päätelaitteesta on valittu ryhmästä joka koostuu seuraavista: matkaviestin, matkapuhelin, PDA (Personal Digital Assistant) laite, tietokone, langaton tietokone, viestintälaite ja verkkopääte.
5 Edullisesti viestintälaite viestii viestintäverkon kanssa, tai viestintäverkon kautta muiden viestintälaitteiden, esimerkiksi vastaanottajan, kanssa.
Edullisesti viestintälaite käsittää viestigeneraattorin tekstiviestin luomiseksi.
10 Edullisesti puhesynteesimalli on yksilöllinen viestintälaitteen käyttäjälle, jotta puhesynteesimallia käyttämällä voidaan tarjota syntetisoitua puhetta, joka kuulostaa asianomaisen käyttäjän puheelta.
Edullisesti viestintälaite on matkaviestin. Vaihtoehtoisesti viestintälaite on 15 kiinteässä verkossa. Se saattaa olla matkapuhelin, kämmentietokone eli PDA (personal digital assistant) tai langaton tietokone kuten kannettava tietokone tai verkkopääte.
Keksinnön toisen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen 15 . . 20 mukainen verkko tekstiviestin muuntamiseksi syntetisoiduksi puheeksi.
• > I • « • * · ! . Keksinnön kolmannen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen ] “ 16 mukainen puhesynteesimallipalvelin tekstiviestin muuntamiseksi syntetisoiduksi • » .···, puheeksi.
• I
25 • * »« »
Keksinnön neljännen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen : 17 mukainen tiedonsiirtojärjestelmä tekstiviestin muuntamiseksi syntetisoiduksi : : puheeksi käsittäen ensimmäisen päätelaitteen, toisen päätelaitteen ja verkon.
* 4 115868
Keksinnön viidennen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen 18 mukainen tietokoneohjelmatuote tekstiviestin muuntamiseksi syntetisoiduksi puheeksi.
5
Edullisesti verkko käsittää tietokannan useiden puhesynteesimallien tallentamiseksi. Tietokanta voi tallentaa tunnisteita, jotka vastaavat puhesynteesimallia. Puhesynteesimallit on saatettu vastaanottaa viestintälaitteista. Edullisesti palvelin käsittää tietokannan mainittujen useiden puhesynteesimallien 10 tallentamiseksi. Puhesynteesimallit on saatettu vastaanottaa viestintälaitteista.
Edullisesti viestintälaite on tekstiviestin vastaanottaja, joka tekstiviesti on vastaanotettu osapuolelta, joka on tietyn puhesynteesimallin lähde.
15 Edullisesti määritetyt lähteet yksilöivät määrättyjä yksilöitä. Vaihtoehtoisesti määritetyt lähteet yksilöivät yksilöryhmiä. Yksinkertaisimmassa muodossaan ryhmät voivat olla mies- ja naispuolisia tekstiviestien lähettäjiä.
Edullisesti syntetisoitua puhetta kuunteleva ihminen erottaa toisella 20 puhepiirrejoukolla syntetisoidun puheen ensimmäisellä puhepiirrejoukolla syntetisoidusta puheesta.
I · ( I t ·
Eräässä keksinnön mukaisessa menetelmässä on ainakin yksi puhesynteesimalli ♦ t I * · ... tallennettu verkkoon, ja puheen syntetisointi tällä puhesynteesimallilla suoritetaan t".\ 25 verkossa, ja tuloksena syntynyt syntetisoitu puhe (tai koodi, joka mahdollistaa tällaisen syntetisoidun puheen) välitetään viestintälaitteeseen. Tällä tavalla ei ole : . tarpeen lähettää ja tallentaa puhesynteesimalleja vastaanottajalaitteelle.
Keksintö tunnistaa sen, että tulevaisuudessa saattaa olla suotavaa käsitellä ‘lii 30 tekstiviestejä sähköisessä muodossa ja esittää tällaisten tekstiviestien sisältö *' syntetisoituna puheena mieluummin kuin tekstimuodossa. Saattaa olla erityisen suotavaa syntetisoida puhetta, joka käyttää tekstiviestin lähettäjän äänen mukaan • 1 valmistettua puhesynteesimallia tyypillisesti käyttämällä lähettävää viestintälaitetta B 115868 5 (tästä lähin "lähetyslaite") niin, että syntetisoitu puhe kuulostaa samalta kuin tekstiviestiä lähettävän käyttäjän puhe.
Keksinnön muita aspekteja ovat tietokoneohjelmat, jotka käsittävät luettavaa 5 tietokonekoodia jokaisen menetelmän vaiheen toteuttamiseksi keksinnön aspektien mukaisesti. Jokainen näin määritellyistä tietokoneohjelmista voidaan tallentaa tietosäilöön, esimerkiksi levykkeelle, CD-ROM levylle tai kovoon.
Keksintöä selostetaan seuraavassa ainoastaan esimerkinomaisesti viittaamalla 10 oheisiin piirustuksiin, joissa:
Kuvio 1 esittää keksinnön mukaisen viestintäjärjestelmän suoritusmuodon;
Kuvio 2 esittää vuokaavion keksinnön menetelmästä;
Kuvio 3 esittää keksinnön mukaisen viestintäjärjestelmän toisen suoritusmuodon; 15 Kuviossa 1 on esitetty keksinnön mukainen viestintäjärjestelmän suoritusmuoto. Järjestelmä käsittää kolme pääyksikköä; langattoman televiestintäverkon 130, lähetyslaitteen 110 ja vastaanottajalaitteen 120. Lähetyslaite ja vastaanottajalaite on kytketty langattomaan televiestintäverkkoon 130. Ne ovat identtisiä laitteita ja saattavat olla langattomia viestintälaitteita, esimerkiksi matkapuhelimia. Jokainen , . 20 laite käsittää keskusprosessointiyksikön 124, joka ohjaa ensimmäistä muistia 111, ' toista muistia 112 ja kolmatta muistia 113 sekä lisäksi antenniin 116 kytkettyä j radiotaajuuslohkoa 115. Muistit 111, 112 ja 113 ovat edullisesti sellaisia, että !".· niiden sisältö säilyy, vaikka laitteesta loppuisi virta. Edullisessa suoritusmuodossa .·**. laitteiden muistit ovat puolijohdemuisteja, esimerkiksi flash-RAM -muisteja, joissa 25 ei ole liikkuvia osia. Lähetyslaite 110 ja vastanottajalaite 120 on liitetty langattomaan televiestintäverkkoon 130 radiokanavien kautta.
Langaton televiestintäverkko 130 käsittää tietokannan 132, joka käsittää useita ; tallenteita 133, 134, 135 ja 136 puhesynteesimallien säilyttämiseksi useille verkon 30 käyttäjille. Tietokantaa ohjaa prosessointiyksikkö 131, jolla on pääsy jokaiseen tallenteista 133, 134, 135 ja 136. Tietokanta on edullisesti tallennettu • » ! ‘. massamuistiin, kuten kovalevylle tai kovalevyjoukolle. Yhdistelmänä tietokanta 132
t > I
ja prosessointiyksikkö 131 ovat puhesynteesimallipalvelimen 137 osa.
6 115868
Seuraavaksi kuvataan viestintäjärjestelmän toiminta. Kun vastaanottajalleen käyttäjä vastaanottaa tekstiviestin, tekstiviestiä varten annetaan valintamahdollisuus niin, että se voidaan joko näyttää visuaalisesti tai lukea 5 auditiivisesti niin, että käyttäjä voi kuunnella tekstiviestin sisällön. Käyttäjä voi luonnollisesti valita sekä visuaalisen näyttämisen että auditiivisen esityksen, joskin yleensä vain toinen esitysmuoto on tarpeen. Oletusmenetelmänä suositaan visuaalista näyttöä. Jos käyttäjä valitsee auditiivisen esityksen, vastaanottajalaite tarkistaa tekstiviestin lähettäjän henkilöllisyyden ja käyttää sitten lähettäjään 10 assosioitua puhesynteesimallia, ja esittää tekstiviestin auditiivisessa muodossa, joka vastaa lähettäjän ääntä. Jos puhesynteesimalli ei sijaitse vastaanottajalaitteessa, vastaanottajalaite saa sen joko verkosta tai lähetyslaitteelta verkon kautta. Tällä tavoin käyttäjä voi kuunnella tekstiviestejä äänillä, jotka vastaavat tekstiviestien lähettäjiä. Tämän eräs etu on se, että 15 käyttäjä voi erottaa tekstiviestit toisistaan sen perusteella, millä äänellä ne luetaan, tai jopa yksilöidä tekstiviestin lähettäjän sen äänen perusteella, jolla tekstiviesti luetaan.
Kun lähetyslaite 110 ensin lähettää tekstiviestin verkkoon 130, verkon on 20 vastaanotettava kyseiseen lähetyslaitteeseen 110 sopiva puhesynteesimalli. Tämä » * · [l "· on se puhesynteesimalli, jolla luodaan puhetta, joka kuulostaa samalta kuin ; ,* lähetyslaitteen käyttäjän tai jonkun käyttäjistä puhe. Siksi puhesynteesimalli * · · ; lähetetään (i) tekstiviestin kanssa, (ii) myöhempänä ajankohtana, jonka päättää lähetyslaite 110 tai (iii) verkon 130 esittämän puhesynteesimallia koskevan .'I! 25 pyynnön perusteella (joko siihen aikaan, jolloin verkko 130 on vastaanottanut tekstiviestin tai myöhempänä ajankohtana). Puhesynteesimallit on tallennettu : (i) verkkoon, (ii) vastaanottajalaitteisiin tai (iii) sekä verkkoon että .··*. vastaanottajalaitteisiin. Olosuhteet, joissa puhesynteesimallit lähetetään, riippuvat siitä, mitä keksinnön jäljempänä kuvatuista menetelmistä käytetään. On tärkeää ’!!; 30 ymmärtää, että seuraavat menetelmät koskevat tilanteita, joissa lähetyslaitteet 110 ovat jo saattaneet lähettää joitakin puhesynteesimalleja, ja verkko 130 on *; ‘ ’ vastaanottanut puhesynteesimallit, minkä jälkeen ne on tallennettu.
115868 7
Puhesynteesimallien hallintamenetelmässä puhesynteesimalleja ei tarvitse lainkaan lähettää vastaanottajalaitteille 120. Tässä menetelmässä puhesynteesimallit lähetetään verkkoon 130 lähetyslaitteista 110, minkä jälkeen puhesynteesimallit tallennetaan verkkoon 130. Kun tekstiviestiä pyydetään 5 esitettäväksi syntetisoidun puheen muodossa, tarvittava puhesynteesi suoritetaan verkossa 130 ja syntetisoitu puhe lähetetään verkosta vastaanottajalle sopivasti koodatussa muodossa. Puhesynteesimallit saatetaan välittää verkkoon 130 tekstiviestin lähetyksen yhteydessä, tai lähetyslaitteen 110 tai verkon 130 aloitteesta, kuten tässä kuvataan.
10
Menetelmä on esitetty kuviossa 2.
Menetelmässä kaikki puhesynteesimalleja ja puhesynteesiä koskeva toiminnallisuus on verkossa. Viestintälaitteilta vaaditaan vain kyky lähettää ja 15 vastaanottaa tekstiviestejä ja pyytää tekstiviestien syntetisoitua esitystä.
Menetelmä mahdollistaa puhuttujen viestien vastaanottamisen laitteilla, jotka eivät kykene vastaanottamaan puhesynteesimalleja.
. 20 Kuvio 3 esittää viestintäjärjestelmän puhesynteesimallien käsittelemiseksi. Sen .! ' avulla puhesynteesimalleja voidaan hankkia ja tallentaa i puhesynteesimallipalvelimelle.
» » * • · · · • .··. Kuviossa 3 on kuvion 1 kanssa yhteneviä piirteitä, ja vastaavia viitenumerolta on 25 sovellettu molempien järjestelmien yhteisiin piirteisiin. Puhesynteesimallit tallennetaan puhesynteesimallipalvelimelle 137. Sen sijaan että ne hankittaisiin • j* vain lähetyslaitteista 110, ne hankitaan puhesynteesimallien luontiyksiköistä 160 : “': verkon 158 (kuten intranet tai Internet) kautta.
30 Puhesynteesimallien luontiyksiköt 160 ovat verkkopäätteitä, jotka on varustettu puhesynteesimallien luontiohjelmistoilla. Nämä yksiköt saattavat käsittää ly. henkilökohtaisia tietokoneita. Yksittäinen yksikkö 160 käsittää äänenkaappauslaitteen 160. Äänenkaappauslaitteessa on mikrofoni sekä siihen 3 115868 liitetty analogia-digitaalimuunnin kaapatun puheen digitoimiseksi. Digitoitu kaapattu puhe tallennetaan kovalevylle 162. Puhesynteesimallin luontiohjelmisto 165 luo puhesynteesimallin analysoimalla kovalevylle 162 tallennettua digitoitua kaapattua puhetta. Ohjelmisto 165 saattaa myös olla tallennettuna kovalevylle 5 162.
Yksikkö 160 käsittää myös Verkkosovittimen 163, mikä mahdollistaa yhteyden yksikön 160 ja verkon sekä käyttöliittymän 164 välillä. Käyttöliittymän 164 ansiosta käyttäjän on mahdollista päästä käyttämään ohjelmistoa 165.
10
Seuraavaksi kuvataan viestintäjärjestelmän toiminta. Tyypillisesti verkkopääte 160 on käyttäjän henkilökohtainen tietokone. Jos käyttäjä haluaa antaa yleisen pääsyn puhesynteesimalliinsa (jolloin häneltä tekstiviestejä vastaanottavat henkilöt voivat hankkia sen), käyttäjä aktivoi ohjelmiston 165 ja seuraa erilaisia vaadittavia puhe-15 ja opetusharjoituksia, joihin usein kuuluu äänten, sanojen ja lauseiden toistoa. Kun puhesynteesimalli on kerran luotu, käyttäjä voi lähettää sen puhesynteesimallipalvelimelle 137. Tätä palvelinta ohjaa tyypillisesti verkon 130 operaattori.
. . 20 Vaihtoehtoisesti palveluntarjoaja tarjoaa verkkopäätteen 160 ja ohjaa sitä. Tässä ‘ tapauksessa käyttäjä voi luoda puhesynteesimallin tarpeen mukaan. Eräs sopiva ► · 1 ,·. ajankohta puhesynteesimallin luomiselle on esimerkiksi silloin, kun muodostetaan ,.,,: uusi yhteys verkkoon 130, esimerkiksi ostettaessa matkapuhelin.
» · »1 1 • · 25 Kun palvelinta 137 käytetään puhesynteesimallin tarjoamiseksi, •» » puhesynteesimallia pyytävältä osapuolelta saatetaan periä maksu.
Päämääränä on lähettää puhesynteesimalleja ainoastaan tarpeen niin vaatiessa, ,·! : esimerkiksi verkon 130 aloitteesta.
30 a i
Seuraavaksi kuvataan tarkoituksenmukainen puhesynteesimallien luontitapa. Tähän sisältyy syntetisoitavan äänen erityisominaisuuksien opettaminen puhesynteesimallille, jotta ääni voidaan tuottaa uudestaan.
9 115868
Eräässä suoritusmuodossa viestintälaitteet luovat tekstiviestejä puheentunnistuksen avulla. Viestintälaitteessa on muistitilan säilyttämiseksi yhdistetty puheentunnistus/synteesisovellusohjelma. Tämä sovellusohjelma 5 kykenee tunnistamaan puheen ja muuntamaan sen tekstiksi. Vaikka puheentunnistus on jo tekniikan tasosta tuttua (vaatien joko puhujariippuvien tai puhujasta riippumattomien puheentunnistusmallien käyttöä), keksintö ehdottaa, että ennen keksintöä olemassa olevaa puheentunnistustoiminnallisuutta käytetään lisäksi tekstin muuttamiseksi puheeksi. Aikaisempia puheentunnistusmalleja 10 käyttämällä viestintälaitteen käyttäjän ei tarvitsisi kuluttaa aikaa opettamalla laitetta tunnistamaan ja syntetisoimaan puhetta yksittäisenä ja erillisenä toimintona, vaan opetus voidaan yhdistää sekä puheen tunnistamiseen että puhesynteesiin.
Silloin kun puheentunnistusta käytetään tekstiviestien tuottamiseen kirjoittamisen 15 sijaan, ja lähetyslaite 110 opettelee tunnistamaan lähettäjän puhetta luodakseen puhesynteesimallin suhteellisen nopeasti, luettu teksti saatetaan esittää lähettäjälle niin, että korostetaan tiettyjä helposti väärin lausuttuja sanoja ja pyydetään vahvistusta tai korjausta näille sanoille. Tällainen vahvistus tai korjaus yhdistetään puhesynteesimallin luomiseen kuuluvaan oppimisprosessiin niin, että . . 20 puhesynteesimalli kyetään luomaan tehokkaammin. 1 2 3 .·. Puhesynteesimallien ei välttämättä tarvitse kuulua lähetyslaitteen 110 käyttäjille.
Riittää, että puhesynteesimallit tekevät eron käyttäjien välillä kun niitä kuunnellaan. ,···. Vastaanottajalleen 120 käyttäjä voi valita ne, ja ne voivat olla myös humoristisia 2 25 puhesynteesimalleja, kuten esimerkiksi sarjakuvahahmon puheen syntetisoimiseksi käytettäviä puhesynteesimalleja. Vaihtoehtoisesti voi olla kaksi 3 puhesynteesimallia, yksi miespuoliselle puhujalle ja yksi naispuoliselle puhujalle.
, Tekstiviestin mukana lähetetty sukupuolen osoitin voi varmistaa, että tekstiviesti ; puhutaan oikeaa sukupuolta olevalla syntetisoidulla äänellä. Eräs tapa on 30 varmistaa lähetyslaitteen käyttäjän etunimi ja käyttää sitä sukupuolen määrittämiseen. Myös muita erotustekijöitä voidaan käyttää. Puhesynteesimallit i ‘. voivat esimerkiksi esittää nuoria ja vanhoja ääniä.
115868 10
Koska puhujan puhesynteesimallin tallentaminen voi mahdollistaa väärennettyjen viestien lähettämisen jonkun toisen "ääntä" käyttämällä, puhesynteesimalliin saattaa olla suotavaa sisällyttää jonkinlainen digitaalinen allekirjoitus (kenties sulautettu allekirjoitus) niin, että ainoastaan puhesynteesimallin lähettäjällä on 5 oikeus käyttää sitä. Eräässä suoritusmuodossa tämä perustuu kahden avaimen salausjärjestelmään, jossa puhesynteesimalli luo yhden avaimen, ja uudet tekstiviestit tarjotaan toisen avaimen kanssa. Vastaanottajalaite tarkistaa salausalgoritmilla, että avaimet vastaavat tekstiviestin sisältöä ja tunnistaa näin tekstiviestin lähteen. Nämä turvallisuusnäkökohdat eivät ole kovin suuri ongelma 10 kun puhesynteesimalleja ei siirretä viestintälaitteisiin.
Siinä tapauksessa, että tekstiviesti tulee useilta ihmisiltä, voidaan lähettää useita puhesynteesimalleja niin, että tekstiviestin eri osat voidaan lukea ääneen eri äänillä tekstin eri osien lähteestä riippuen. Tässä tapauksessa lähteen tunnisteet 15 voidaan upottaa tekstiviestin uuden lähteen osan alkuun. Tapaa voidaan soveltaa tekstiviesteihin, jotka moni vastaanottaja on vastaanottanut, ja joista kaikki ovat lisänneet jonkin verran tekstiä ja lähettäneet tekstin sitten eteenpäin. Tällainen tekstiviesti saattaa olla sähköpostiviesti, joka on vastaanotettu ja välitetty edelleen, tai johon on vastattu yhden tai useamman kerran.
: 20 : ' Keksintöä voidaan käyttää langoitetuilla viestintäpoluilla sekä myös langattomilla viestintäpoluilla niin, että sitä voidaan käyttää esimerkiksi sellaisissa tapauksissa, joissa toinen tai molemmat osapuolet ovat yhteydessä intranetiin tai Internetiin.
• · *. 25 Keksinnön myötä tulee mahdolliseksi lähettää vähän kaistanleveyttä kuluttavia tekstiviestejä ja lukea ne puhuttuina siten, että niiden lähteet voidaan yksilöidä.
·:. Siten voidaan tuottaa syntetisoitua puhetta, joka on persoonallista, tai ainakin mahdollista erottaa eri lähteiden mukaan. Keksintö mahdollistaa tällaisten : "puhuttujen tekstiviestien" lähettämisen yhtä helposti kuin sähköpostiviestien
> » I
____: 30 lähettäminen on tällä hetkellä. On myös mahdollista varata yksilöityjä puhesynteesimalleja samalla kun niiden lähettämisessä käytetään pientä kaistanleveyttä. Näin on erityisesti keksinnön siinä menetelmässä, jossa puhesynteesimallit lähetetään vain kerran. Yksi keksinnön tarjoamista eduista on 115868 11 se, että tekstiviestit tallennetaan edelleen tavallisena tekstinä, mikä tarkoittaa sitä, että niiden tallentamiseen kuluu vähän muistia verrattuna puheen tallentamiseen. Lisäksi tekstiviestejä on suhteellisen helppo etsiä avainsanojen avulla.
5 Keksinnön erityisiä toteutuksia ja suoritusmuotoja on kuvattu edellä. Alan ammattimiehelle on selvää, että keksintö ei rajoitu yllä esitettyihin suoritusmuotohin, vaan se voidaan vastaavia välineitä käyttäen toteuttaa muissa suoritusmuodoissa ilman, että keksinnön tunnusmerkeistä poiketaan. Keksinnön puitteita rajoittavat ainoastaan liitteenä olevat patenttivaatimukset.
10 • · I · • · • » • · · • I M t
‘ I
1' » » • * i » #
Claims (18)
1. Menetelmä tekstiviestin muuntamiseksi syntetisoiduksi puheeksi, jossa: tallennetaan verkossa (130) puheen synteesiä varten ensimmäinen 5 puhesynteesimalli (130,134,135,136) jolla on ensimmäinen joukko puhepiirteitä; assosioidaan ensimmäinen puhesynteesimalli (130,134,135,136) ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; tallennetaan verkossa (130) puheen synteesiä varten toinen puhesynteesimalli (130,134,135,136) jolla on toinen joukko puhepiirteitä, 10 ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; assosioidaan toinen puhesynteesimalli (130,134,135,136) ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; 15 vastaanotetaan verkon (130) toimesta ensimmäisen määritellyn lähteen kanssa assosioitu tekstiviesti ensimmäiseltä päätelaitteelta (110); määritetään että tekstiviesti on peräisin ensimmäisestä määritellystä lähteestä; ja syntetisoidaan puhe ensimmäisen puhesynteesimallin (130,134,135,136) . . 20 mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti on peräisin i * ! ' ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä lähteestä, tunnettu siitä, että • · ' • · ’ [, j menetelmässä lähetetään verkosta syntetisoitua puhetta toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella. 25
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että ensimmäinen ;. puhesynteesimalli on yksilöllinen tietylle ensimmäisen päätelaitteen käyttäjälle.
‘ : 3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että 30 ensimmäinen ja toinen puhesynteesimalli tallennetaan verkon (130) tietokantaan.
'. 4. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu I ! * 115868 siitä, että tekstiviesti muodostetaan tekstisyötöllä käyttäjän toimesta ensimmäisellä päätelaitteella (110).
5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että tekstiviesti 5 muodostetaan näppäilemällä.
6. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että tekstiviesti on sähköpostiviesti.
7. Jonkin patenttivaatimuksen 1-5 mukainen menetelmä, tunnettu siitä, että tekstiviesti on lyhytsanoma.
8. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että menetelmässä valitaan tekstiviestin esitystapa ryhmästä joka koostuu: 15 visuaalisesta esittämisestä siten että vastaanottava henkilö voi lukea tekstiviestin, kuultavasta lukemisesta siten että vastaanottava henkilö voi kuunnella tekstiviestin, ja visuaalisesta esittämisestä sekä kuultavasta lukemisesta.
9. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu : 20 siitä, että siinä tapauksessa että tekstiviesti esitetään vastaanottavalle henkilölle . puhutussa muodossa, suoritetaan askeleet: .·. määritetään että tekstiviesti on peräisin ensimmäisestä määritellystä • · lähteestä; ·. syntetisoidaan puhe ensimmäisen puhesynteesimallin (130,134,135,136) 25 mukaan; ja » · lähetetään verkosta syntetisoitua puhetta toiselle päätelaitteelle (120).
, .· 10. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, . : tunnettu siitä, että ainakin yksi ensimmäisestä ja toisesta päätelaitteesta on : 30 valittu ryhmästä joka koostuu seuraavista: matkaviestin, matkapuhelin, PDA '. t (Personal Digital Assistant) laite, tietokone, langaton tietokone, viestintälaite ja verkkopääte. 115068
11. Patenttivaatimuksen 3 mukainen menetelmä, tunnettu siitä, että tietokanta on järjestetty tallentamaan tunnisteita jotka kukin vastaavat yhtä puhesynteesimallia ja yhtä lähdettä.
12. Minkä tahansa patenttivaatimuksen 9-11 mukainen menetelmä, tunnettu siitä, että verkko käsittää puhesynteesimallin käsittelijän puhesynteesimallien kopioiden vastaanottamiseksi.
12 1 1 5868
13. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, 10 tunnettu siitä, että verkko (130) vastaanottaa ensimmäisen puhesynteesimallin (133, 134, 135, 136) ensimmäiseltä päätelaitteelta (110).
14. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että ensimmäinen puhesynteesimalli (133, 134, 135, 136) on 15 muodostettu ensimmäisellä päätelaitteella (110).
15. Verkko (130) tekstiviestin muuntamiseksi syntetisoiduksi puheeksi käsittäen: välineet ensimmäinen puhesynteesimallin tallentamiseksi puheen synteesiä varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on . ; 20 ensimmäinen joukko puhepiirteitä; ·, ’ välineet ensimmäisen puhesynteesimallin (130,134,135,136) .·. assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien • · * · kanssa; ·*. välineet toisen puhesynteesimallin (130,134,135,136) tallentamiseksi '; 25 puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan , · puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; : välineet toisen puhesynteesimallin (130,134,135,136) assosioimiseksi 30 toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; :. välineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin : vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); ja 15 1 1 5868 välineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin (130.134.135.136) mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä lähteestä; 5 tunnettu siitä, että verkko käsittää välineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella.
16. Puhesynteesimallipalvelin tekstiviestin muuntamiseksi syntetisoiduksi puheeksi 10 käsittäen: välineet ensimmäinen puhesynteesimallin tallentamiseksi puheen synteesiä varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on ensimmäinen joukko puhepiirteitä; välineet ensimmäisen puhesynteesimallin (130,134,135,136) 15 assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; välineet toisen puhesynteesimallin (130,134,135,136) tallentamiseksi puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan •, : 20 puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; • * välineet toisen puhesynteesimallin (130,134,135,136) assosioimiseksi ;..: toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; " välineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin *: 25 vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); välineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin (130.134.135.136) mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti : on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä ; lähteestä; ja • 30 välineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella. 115868
17. Tiedonsiirtojärjestelmä tekstiviestin muuntamiseksi syntetisoiduksi puheeksi käsittäen ensimmäisen päätelaitteen, toisen päätelaitteen ja verkon, joka verkko käsittää: välineet ensimmäinen puhesynteesimallin tallentamiseksi puheen synteesiä 5 varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on ensimmäinen joukko puhepiirteitä; välineet ensimmäisen puhesynteesimallin (130,134,135,136) assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; 10 välineet toisen puhesynteesimallin (130,134,135,136) tallentamiseksi puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; 15 välineet toisen puhesynteesimallin (130,134,135,136) assosioimiseksi toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; välineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); ja välineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin : 20 (130,134,135,136) mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti , ’ on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä • I lähteestä; i · > · ,,: tunnettu siitä, että verkko käsittää: ·'; välineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) 25 jolla vastaanottava henkilö voi sitä kuunnella.
18. Tietokoneohjelmatuote tekstiviestin muuntamiseksi syntetisoiduksi puheeksi käsittäen: : tietokoneohjelmakoodivälineet ensimmäinen puhesynteesimallin • 30 tallentamiseksi puheen synteesiä varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on ensimmäinen joukko puhepiirteitä; : I 17 1 1 5868 tietokoneohjelmakoodivälineet ensimmäisen puhesynteesimallin (130.134.135.136) assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; tietokoneohjelmakoodivälineet toisen puhesynteesimallin (130,134,135,136) 5 tallentamiseksi puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan puheen ollessa erotettavissa toisella puhesynteesimallilla (130.134.135.136) tuotettavasta puheesta; tietokoneohjelmakoodivälineet toisen puhesynteesimallin (130,134,135,136) 10 assosioimiseksi toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; tietokoneohjelmakoodivälineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); tietokoneohjelmakoodivälineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin (130,134,135,136) mukaan vastaanottavan henkilön 15 sallimiseksi erottaa että viesti on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä lähteestä; ja tietokoneohjelmakoodivälineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella. : 20 » * «· * * * I · * = i ‘ « > » · > t » 18 1 1 5868
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20001572A FI115868B (fi) | 2000-06-30 | 2000-06-30 | Puhesynteesi |
EP01660131A EP1168297B1 (en) | 2000-06-30 | 2001-06-29 | Speech synthesis |
AT01660131T ATE347726T1 (de) | 2000-06-30 | 2001-06-29 | Sprachsynthese |
US09/895,714 US20020013708A1 (en) | 2000-06-30 | 2001-06-29 | Speech synthesis |
DE60124985T DE60124985T2 (de) | 2000-06-30 | 2001-06-29 | Sprachsynthese |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20001572A FI115868B (fi) | 2000-06-30 | 2000-06-30 | Puhesynteesi |
FI20001572 | 2000-06-30 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI20001572A0 FI20001572A0 (fi) | 2000-06-30 |
FI20001572A FI20001572A (fi) | 2001-12-31 |
FI115868B true FI115868B (fi) | 2005-07-29 |
Family
ID=8558698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI20001572A FI115868B (fi) | 2000-06-30 | 2000-06-30 | Puhesynteesi |
Country Status (5)
Country | Link |
---|---|
US (1) | US20020013708A1 (fi) |
EP (1) | EP1168297B1 (fi) |
AT (1) | ATE347726T1 (fi) |
DE (1) | DE60124985T2 (fi) |
FI (1) | FI115868B (fi) |
Families Citing this family (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3709916B2 (ja) * | 2000-05-25 | 2005-10-26 | 日本電気株式会社 | 電話端末における文字メッセージ通信方法および装置 |
US7886006B1 (en) * | 2000-09-25 | 2011-02-08 | Avaya Inc. | Method for announcing e-mail and converting e-mail text to voice |
DE10062379A1 (de) * | 2000-12-14 | 2002-06-20 | Siemens Ag | Verfahren und System zum Umsetzen von Text in Sprache |
US6513008B2 (en) * | 2001-03-15 | 2003-01-28 | Matsushita Electric Industrial Co., Ltd. | Method and tool for customization of speech synthesizer databases using hierarchical generalized speech templates |
JP2003016008A (ja) * | 2001-07-03 | 2003-01-17 | Sony Corp | 情報処理装置および情報処理方法、並びにプログラム |
KR100450319B1 (ko) * | 2001-12-24 | 2004-10-01 | 한국전자통신연구원 | 가상 환경에서 참여자간의 의사전달 장치 및 방법 |
DE10207875A1 (de) * | 2002-02-19 | 2003-08-28 | Deutsche Telekom Ag | Parametergesteuerte Sprachsynthese |
DE10254183A1 (de) * | 2002-11-20 | 2004-06-17 | Siemens Ag | Verfahren zur Wiedergabe von gesendeten Textnachrichten |
DE10304229A1 (de) * | 2003-01-28 | 2004-08-05 | Deutsche Telekom Ag | Kommunikationssystem, Kommunikationsendeinrichtung und Vorrichtung zum Erkennen fehlerbehafteter Text-Nachrichten |
DE10305658A1 (de) * | 2003-02-12 | 2004-08-26 | Robert Bosch Gmbh | Informationseinrichtung, insbesondere für Fahrzeuge, sowie Verfahren zur Steuerung der Sprachwiedergabe |
US7013282B2 (en) * | 2003-04-18 | 2006-03-14 | At&T Corp. | System and method for text-to-speech processing in a portable device |
US20050048992A1 (en) * | 2003-08-28 | 2005-03-03 | Alcatel | Multimode voice/screen simultaneous communication device |
US20050096909A1 (en) * | 2003-10-29 | 2005-05-05 | Raimo Bakis | Systems and methods for expressive text-to-speech |
GB2412046A (en) | 2004-03-11 | 2005-09-14 | Seiko Epson Corp | Semiconductor device having a TTS system to which is applied a voice parameter set |
KR100719776B1 (ko) * | 2005-02-25 | 2007-05-18 | 에이디정보통신 주식회사 | 휴대형 코드인식 음성 합성출력장치 |
ATE362164T1 (de) * | 2005-03-16 | 2007-06-15 | Research In Motion Ltd | Verfahren und system zur personalisierung von text-zu-sprache umsetzung |
US7706510B2 (en) | 2005-03-16 | 2010-04-27 | Research In Motion | System and method for personalized text-to-voice synthesis |
JP5259050B2 (ja) * | 2005-03-30 | 2013-08-07 | 京セラ株式会社 | 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム |
DE602005017829D1 (de) * | 2005-05-31 | 2009-12-31 | Telecom Italia Spa | Bereitstellung von sprachsynthese auf benutzerendgeräten über ein kommunikationsnetz |
EP1736962A1 (en) * | 2005-06-22 | 2006-12-27 | Harman/Becker Automotive Systems GmbH | System for generating speech data |
US8977636B2 (en) * | 2005-08-19 | 2015-03-10 | International Business Machines Corporation | Synthesizing aggregate data of disparate data types into data of a uniform data type |
US8266220B2 (en) * | 2005-09-14 | 2012-09-11 | International Business Machines Corporation | Email management and rendering |
US20070078655A1 (en) * | 2005-09-30 | 2007-04-05 | Rockwell Automation Technologies, Inc. | Report generation system with speech output |
CN100487788C (zh) * | 2005-10-21 | 2009-05-13 | 华为技术有限公司 | 一种实现文语转换功能的方法 |
US8694319B2 (en) | 2005-11-03 | 2014-04-08 | International Business Machines Corporation | Dynamic prosody adjustment for voice-rendering synthesized data |
US8326629B2 (en) * | 2005-11-22 | 2012-12-04 | Nuance Communications, Inc. | Dynamically changing voice attributes during speech synthesis based upon parameter differentiation for dialog contexts |
US8271107B2 (en) * | 2006-01-13 | 2012-09-18 | International Business Machines Corporation | Controlling audio operation for data management and data rendering |
US20070192683A1 (en) * | 2006-02-13 | 2007-08-16 | Bodin William K | Synthesizing the content of disparate data types |
US9135339B2 (en) | 2006-02-13 | 2015-09-15 | International Business Machines Corporation | Invoking an audio hyperlink |
US7996754B2 (en) * | 2006-02-13 | 2011-08-09 | International Business Machines Corporation | Consolidated content management |
US7505978B2 (en) * | 2006-02-13 | 2009-03-17 | International Business Machines Corporation | Aggregating content of disparate data types from disparate data sources for single point access |
US9037466B2 (en) * | 2006-03-09 | 2015-05-19 | Nuance Communications, Inc. | Email administration for rendering email on a digital audio player |
US9092542B2 (en) | 2006-03-09 | 2015-07-28 | International Business Machines Corporation | Podcasting content associated with a user account |
US9361299B2 (en) * | 2006-03-09 | 2016-06-07 | International Business Machines Corporation | RSS content administration for rendering RSS content on a digital audio player |
US8849895B2 (en) * | 2006-03-09 | 2014-09-30 | International Business Machines Corporation | Associating user selected content management directives with user selected ratings |
US20070214148A1 (en) * | 2006-03-09 | 2007-09-13 | Bodin William K | Invoking content management directives |
US8286229B2 (en) * | 2006-05-24 | 2012-10-09 | International Business Machines Corporation | Token-based content subscription |
US20070277088A1 (en) * | 2006-05-24 | 2007-11-29 | Bodin William K | Enhancing an existing web page |
US7778980B2 (en) * | 2006-05-24 | 2010-08-17 | International Business Machines Corporation | Providing disparate content as a playlist of media files |
US7822606B2 (en) * | 2006-07-14 | 2010-10-26 | Qualcomm Incorporated | Method and apparatus for generating audio information from received synthesis information |
US20080034044A1 (en) * | 2006-08-04 | 2008-02-07 | International Business Machines Corporation | Electronic mail reader capable of adapting gender and emotions of sender |
US7831432B2 (en) * | 2006-09-29 | 2010-11-09 | International Business Machines Corporation | Audio menus describing media contents of media players |
US9196241B2 (en) * | 2006-09-29 | 2015-11-24 | International Business Machines Corporation | Asynchronous communications using messages recorded on handheld devices |
US20080086565A1 (en) * | 2006-10-10 | 2008-04-10 | International Business Machines Corporation | Voice messaging feature provided for immediate electronic communications |
US20080162131A1 (en) * | 2007-01-03 | 2008-07-03 | Bodin William K | Blogcasting using speech recorded on a handheld recording device |
US9318100B2 (en) * | 2007-01-03 | 2016-04-19 | International Business Machines Corporation | Supplementing audio recorded in a media file |
US8219402B2 (en) * | 2007-01-03 | 2012-07-10 | International Business Machines Corporation | Asynchronous receipt of information from a user |
WO2008132533A1 (en) * | 2007-04-26 | 2008-11-06 | Nokia Corporation | Text-to-speech conversion method, apparatus and system |
KR20090085376A (ko) * | 2008-02-04 | 2009-08-07 | 삼성전자주식회사 | 문자 메시지의 음성 합성을 이용한 서비스 방법 및 장치 |
US8285548B2 (en) | 2008-03-10 | 2012-10-09 | Lg Electronics Inc. | Communication device processing text message to transform it into speech |
US8494854B2 (en) | 2008-06-23 | 2013-07-23 | John Nicholas and Kristin Gross | CAPTCHA using challenges optimized for distinguishing between humans and machines |
US9186579B2 (en) * | 2008-06-27 | 2015-11-17 | John Nicholas and Kristin Gross Trust | Internet based pictorial game system and method |
EP2205010A1 (en) | 2009-01-06 | 2010-07-07 | BRITISH TELECOMMUNICATIONS public limited company | Messaging |
US20120069974A1 (en) * | 2010-09-21 | 2012-03-22 | Telefonaktiebolaget L M Ericsson (Publ) | Text-to-multi-voice messaging systems and methods |
US20120259633A1 (en) * | 2011-04-07 | 2012-10-11 | Microsoft Corporation | Audio-interactive message exchange |
US9166977B2 (en) | 2011-12-22 | 2015-10-20 | Blackberry Limited | Secure text-to-speech synthesis in portable electronic devices |
EP2608195B1 (en) * | 2011-12-22 | 2016-10-05 | BlackBerry Limited | Secure text-to-speech synthesis for portable electronic devices |
KR20140008870A (ko) * | 2012-07-12 | 2014-01-22 | 삼성전자주식회사 | 컨텐츠 정보 제공 방법 및 이를 적용한 방송 수신 장치 |
US10439965B1 (en) | 2013-01-18 | 2019-10-08 | Twitter, Inc. | In-message applications in a messaging platform |
US9813260B1 (en) * | 2013-01-18 | 2017-11-07 | Twitter, Inc. | In-message applications in a messaging platform |
US9117451B2 (en) * | 2013-02-20 | 2015-08-25 | Google Inc. | Methods and systems for sharing of adapted voice profiles |
US9767787B2 (en) * | 2014-01-01 | 2017-09-19 | International Business Machines Corporation | Artificial utterances for speaker verification |
KR101703214B1 (ko) * | 2014-08-06 | 2017-02-06 | 주식회사 엘지화학 | 문자 데이터의 내용을 문자 데이터 송신자의 음성으로 출력하는 방법 |
US11735156B1 (en) * | 2020-08-31 | 2023-08-22 | Amazon Technologies, Inc. | Synthetic speech processing |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5841979A (en) * | 1995-05-25 | 1998-11-24 | Information Highway Media Corp. | Enhanced delivery of audio data |
US6035273A (en) * | 1996-06-26 | 2000-03-07 | Lucent Technologies, Inc. | Speaker-specific speech-to-text/text-to-speech communication system with hypertext-indicated speech parameter changes |
US6078886A (en) * | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
JP3287281B2 (ja) * | 1997-07-31 | 2002-06-04 | トヨタ自動車株式会社 | メッセージ処理装置 |
-
2000
- 2000-06-30 FI FI20001572A patent/FI115868B/fi not_active IP Right Cessation
-
2001
- 2001-06-29 DE DE60124985T patent/DE60124985T2/de not_active Expired - Lifetime
- 2001-06-29 US US09/895,714 patent/US20020013708A1/en not_active Abandoned
- 2001-06-29 EP EP01660131A patent/EP1168297B1/en not_active Expired - Lifetime
- 2001-06-29 AT AT01660131T patent/ATE347726T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE60124985T2 (de) | 2007-07-05 |
FI20001572A0 (fi) | 2000-06-30 |
DE60124985D1 (de) | 2007-01-18 |
FI20001572A (fi) | 2001-12-31 |
EP1168297B1 (en) | 2006-12-06 |
US20020013708A1 (en) | 2002-01-31 |
EP1168297A1 (en) | 2002-01-02 |
ATE347726T1 (de) | 2006-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI115868B (fi) | Puhesynteesi | |
US9214154B2 (en) | Personalized text-to-speech services | |
CN100481851C (zh) | 使用通信设备的化身控制 | |
CN100546322C (zh) | 具有文本到语音和语音到文本翻译的聊天与远程会议系统 | |
AU2007346312B2 (en) | A communication network and devices for text to speech and text to facial animation conversion | |
US20080126491A1 (en) | Method for Transmitting Messages from a Sender to a Recipient, a Messaging System and Message Converting Means | |
US8874445B2 (en) | Apparatus and method for controlling output format of information | |
JP2010531607A (ja) | 映像メッセージサービスを提供するためのシステムおよびその方法 | |
KR100788781B1 (ko) | 어학학습 시스템 및 그 방법 | |
US20060093098A1 (en) | System and method for communicating instant messages from one type to another | |
CN113194203A (zh) | 一种用于听障人士的沟通系统、接听拨打方法及通讯系统 | |
CN108364638A (zh) | 一种语音数据处理方法、装置、电子设备和存储介质 | |
JP3923712B2 (ja) | メッセージ交換システムおよび記録媒体 | |
US20030120492A1 (en) | Apparatus and method for communication with reality in virtual environments | |
KR101916107B1 (ko) | 통신 단말 및 그 통신 단말의 정보처리 방법 | |
JP2002101205A (ja) | 会議支援装置及び方法並びにこれに利用される記憶媒体 | |
KR100920174B1 (ko) | 본인 음성 기반의 tts 서비스 제공 장치와 시스템 및 그방법 | |
US20180300316A1 (en) | System and method for performing message translations | |
US8326445B2 (en) | Message string correspondence sound generation system | |
JP5326539B2 (ja) | 留守番電話システム、留守番電話サービスサーバ及び留守番電話サービス方法 | |
KR100487446B1 (ko) | 이동 통신 단말의 오디오 장치를 이용한 감정 표현 방법및 이를 위한 이동 통신 단말 | |
JP4530016B2 (ja) | 情報通信システムおよびそのデータ通信方法 | |
KR20150011430A (ko) | 영상 컬러링/레터링 기반의 컨텐츠 제공 시스템 및 그의 컨텐츠 제공 방법 | |
KR20040039771A (ko) | 이모티콘 사운드 재생 장치 및 방법 | |
WO2010074406A2 (ko) | 이동 통신 시스템의 이메일 서비스 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Ref document number: 115868 Country of ref document: FI |
|
MM | Patent lapsed |