FI115868B - Puhesynteesi - Google Patents

Puhesynteesi Download PDF

Info

Publication number
FI115868B
FI115868B FI20001572A FI20001572A FI115868B FI 115868 B FI115868 B FI 115868B FI 20001572 A FI20001572 A FI 20001572A FI 20001572 A FI20001572 A FI 20001572A FI 115868 B FI115868 B FI 115868B
Authority
FI
Finland
Prior art keywords
speech synthesis
speech
synthesis template
template
text message
Prior art date
Application number
FI20001572A
Other languages
English (en)
Swedish (sv)
Other versions
FI20001572A0 (fi
FI20001572A (fi
Inventor
Andrew Walker
Samu Lamberg
Simon Walker
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Priority to FI20001572A priority Critical patent/FI115868B/fi
Publication of FI20001572A0 publication Critical patent/FI20001572A0/fi
Priority to EP01660131A priority patent/EP1168297B1/en
Priority to AT01660131T priority patent/ATE347726T1/de
Priority to US09/895,714 priority patent/US20020013708A1/en
Priority to DE60124985T priority patent/DE60124985T2/de
Publication of FI20001572A publication Critical patent/FI20001572A/fi
Application granted granted Critical
Publication of FI115868B publication Critical patent/FI115868B/fi

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Absorbent Articles And Supports Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephone Function (AREA)

Description

PUHESYNTEESI 1 1 5 8 6 8
Keksintö liittyy yleisesti puhesynteesiin ja ääneen tapahtuvaan tekstin keinotekoiseen lukemiseen.
5
Merkittävä osa viestinnästä on siirtynyt puhelinsoitoista ja paperipohjaisista viesteistä sähköisessä muodossa välitettäviin tekstiviesteihin, kuten sähköpostiviesteihin. Sähköisessä muodossa olevat tekstiviestit otetaan vastaan ja esitetään tietokoneen näytöllä ja muilla sähköisillä ja elektronisilla näytöillä. 10 Tekstiviestien kirjoittaminen ja lähettäminen sähköpostilla on suosittua, koska sähköpostilla viesti voidaan toimittaa nopeasti ja tarvittaessa suurelle vastaanottajajoukolle, ja lisäksi viestit voidaan tehdä tietokoneilla, joita monilla on mahdollisuus käyttää. Lisäksi kukin vastaanottaja voi helposti tallentaa tekstiviestin ja lukea sen silloin kun hänelle sopii.
15
Esimerkkejä tekstiviesteistä ovat tietokoneilla näkyvät sähköpostitekstiviestit ja matkapuhelimilla näkyvät SMS-viestit eli lyhytsanomat (SMS - short message service). Digitaalisen konvergenssin ollessa nykyään käynnissä viestit lähetetään yleisesti yhdenlaisella sähköisellä lähetyslaitteella ja otetaan vastaan toisenlaisella /·,; 20 sähköisellä laitteella. Esimerkiksi tietokoneella lähetetyt sähköpostitekstiviestit * » j\, voidaan ottaa vastaan ja näyttää matkapuhelimilla. Samoin matkapuhelimet voivat Γ lähettää sähköpostitekstiviestejä tietokoneisiin tai toisiin matkapuhelimiin.
Ongelmia ei ollut suhteellisen pitkienkään tekstiviestien kanssa silloin, kun tällaisia 25 tekstiviestejä lähetettiin ainoastaan tietokoneelta tietokoneelle. Tämä johtuu siitä, että tietokoneiden näytöt ovat tarpeeksi isoja, jotta tällaiset tekstiviestit voidaan esittää vaikeuksitta. Lisäksi tietokoneiden käyttäjät eivät yleensä ole liikkeellä, vaan kykenevät keskittämään huomionsa tietokoneen näyttöön. Tekstiviestien :*·.· vastaanottaminen matkapuhelinten kaltaisilla langattomilla viestimillä on entistä *:·· 30 yleisempää. Näiden laitteiden näytöt ovat kuitenkin yleensä liian pieniä, jotta tekstiviestin lukeminen onnistuisi vaivatta, varsinkin jos viestissä on paljon tekstiä.
.* ·. Jos langattomista viestimistä tehdään suurempia, käyttäjän voi olla hankala kuljettaa niitä mukanaan. Koska laitteen käyttäjä on lisäksi vielä liikkeellä, 2 115868 tekstiviestien lukeminen voi olla ongelmallista, esimerkiksi jos käyttäjä ajaa autoa tai tekee jotain muuta, minkä vuoksi hänen on katsottava muualle kuin matkaviestimeensä.
5 Koska tekstiviestien lähettämisessä on tällaisia ongelmia, on kehitetty informaatiojärjestelmiä, joiden avulla voidaan äänittää puheviestejä tai muuntaa tekstiä puheeksi puhesynteesin avulla.
Tuotetun puheen laatu riippuu puhesynteesissä laajalti siitä, kuinka paljon tavuja 10 käytetään syntetisoitavaa puhetta kuvaavassa puhesynteesimallissa. Laadukas puhesynteesi saattaa vaatia suuren määrän dataa puhesynteesimallilta. Tämä on epäkäytännöllistä etenkin matkapuhelimissa. Puhesynteesimallin tuottamiseksi vaaditaan lisäksi huomattava määrä tiedonkäsittelykykyä. Lisäksi puhesynteesimallin luominen vaatii runsaasti aikaa puhujalta, jonka puhetta 15 syntetisoidaan. Tästä johtuen jokin laite sisältää yleensä vain yhden tai korkeintaan muutaman puhujan puhesynteesimallin syntetisoidun puheen luomiseksi.
Japanilaisessa patenttijulkaisussa 11-219278 esitetään järjestelmä, jossa käyttäjät 20 voivat olla virtuaalisesti läsnä kolmiulotteisessa virtuaaliavaruudessa. Jos käyttäjä haluaa puhua toiselle käyttäjälle, hänen puheensa tunnistetaan ja muunnetaan merkkipohjaiseksi viestiksi, minkä jälkeen merkkipohjainen viesti lähetetään. ·:··: Merkkipohjainen viesti syntetisoidaan vastaanotettaessa puheeksi, ja syntetisoitu viesti soitetaan toiselle käyttäjälle. Puhesynteesiä parannetaan äänen sävyn ja 25 voimakkuuden säätöä soveltamalla, ja näin simuloidaan puhujan ja kuuntelijan välistä virtuaalista etäisyyttä virtuaaliavaruudessa.
«
Esillä olevan keksinnön ensimmäisen aspektin mukaisesti tarjotaan oheisen : ’·.* patenttivaatimuksen 1 mukainen menetelmä tekstiviestin muuntamiseksi •: ”: 30 syntetisoiduksi puheeksi.
115868 3
Edullisesti ainakin yksi ensimmäisestä ja toisesta päätelaitteesta on valittu ryhmästä joka koostuu seuraavista: matkaviestin, matkapuhelin, PDA (Personal Digital Assistant) laite, tietokone, langaton tietokone, viestintälaite ja verkkopääte.
5 Edullisesti viestintälaite viestii viestintäverkon kanssa, tai viestintäverkon kautta muiden viestintälaitteiden, esimerkiksi vastaanottajan, kanssa.
Edullisesti viestintälaite käsittää viestigeneraattorin tekstiviestin luomiseksi.
10 Edullisesti puhesynteesimalli on yksilöllinen viestintälaitteen käyttäjälle, jotta puhesynteesimallia käyttämällä voidaan tarjota syntetisoitua puhetta, joka kuulostaa asianomaisen käyttäjän puheelta.
Edullisesti viestintälaite on matkaviestin. Vaihtoehtoisesti viestintälaite on 15 kiinteässä verkossa. Se saattaa olla matkapuhelin, kämmentietokone eli PDA (personal digital assistant) tai langaton tietokone kuten kannettava tietokone tai verkkopääte.
Keksinnön toisen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen 15 . . 20 mukainen verkko tekstiviestin muuntamiseksi syntetisoiduksi puheeksi.
• > I • « • * · ! . Keksinnön kolmannen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen ] “ 16 mukainen puhesynteesimallipalvelin tekstiviestin muuntamiseksi syntetisoiduksi • » .···, puheeksi.
• I
25 • * »« »
Keksinnön neljännen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen : 17 mukainen tiedonsiirtojärjestelmä tekstiviestin muuntamiseksi syntetisoiduksi : : puheeksi käsittäen ensimmäisen päätelaitteen, toisen päätelaitteen ja verkon.
* 4 115868
Keksinnön viidennen aspektin mukaisesti tarjotaan oheisen patenttivaatimuksen 18 mukainen tietokoneohjelmatuote tekstiviestin muuntamiseksi syntetisoiduksi puheeksi.
5
Edullisesti verkko käsittää tietokannan useiden puhesynteesimallien tallentamiseksi. Tietokanta voi tallentaa tunnisteita, jotka vastaavat puhesynteesimallia. Puhesynteesimallit on saatettu vastaanottaa viestintälaitteista. Edullisesti palvelin käsittää tietokannan mainittujen useiden puhesynteesimallien 10 tallentamiseksi. Puhesynteesimallit on saatettu vastaanottaa viestintälaitteista.
Edullisesti viestintälaite on tekstiviestin vastaanottaja, joka tekstiviesti on vastaanotettu osapuolelta, joka on tietyn puhesynteesimallin lähde.
15 Edullisesti määritetyt lähteet yksilöivät määrättyjä yksilöitä. Vaihtoehtoisesti määritetyt lähteet yksilöivät yksilöryhmiä. Yksinkertaisimmassa muodossaan ryhmät voivat olla mies- ja naispuolisia tekstiviestien lähettäjiä.
Edullisesti syntetisoitua puhetta kuunteleva ihminen erottaa toisella 20 puhepiirrejoukolla syntetisoidun puheen ensimmäisellä puhepiirrejoukolla syntetisoidusta puheesta.
I · ( I t ·
Eräässä keksinnön mukaisessa menetelmässä on ainakin yksi puhesynteesimalli ♦ t I * · ... tallennettu verkkoon, ja puheen syntetisointi tällä puhesynteesimallilla suoritetaan t".\ 25 verkossa, ja tuloksena syntynyt syntetisoitu puhe (tai koodi, joka mahdollistaa tällaisen syntetisoidun puheen) välitetään viestintälaitteeseen. Tällä tavalla ei ole : . tarpeen lähettää ja tallentaa puhesynteesimalleja vastaanottajalaitteelle.
Keksintö tunnistaa sen, että tulevaisuudessa saattaa olla suotavaa käsitellä ‘lii 30 tekstiviestejä sähköisessä muodossa ja esittää tällaisten tekstiviestien sisältö *' syntetisoituna puheena mieluummin kuin tekstimuodossa. Saattaa olla erityisen suotavaa syntetisoida puhetta, joka käyttää tekstiviestin lähettäjän äänen mukaan • 1 valmistettua puhesynteesimallia tyypillisesti käyttämällä lähettävää viestintälaitetta B 115868 5 (tästä lähin "lähetyslaite") niin, että syntetisoitu puhe kuulostaa samalta kuin tekstiviestiä lähettävän käyttäjän puhe.
Keksinnön muita aspekteja ovat tietokoneohjelmat, jotka käsittävät luettavaa 5 tietokonekoodia jokaisen menetelmän vaiheen toteuttamiseksi keksinnön aspektien mukaisesti. Jokainen näin määritellyistä tietokoneohjelmista voidaan tallentaa tietosäilöön, esimerkiksi levykkeelle, CD-ROM levylle tai kovoon.
Keksintöä selostetaan seuraavassa ainoastaan esimerkinomaisesti viittaamalla 10 oheisiin piirustuksiin, joissa:
Kuvio 1 esittää keksinnön mukaisen viestintäjärjestelmän suoritusmuodon;
Kuvio 2 esittää vuokaavion keksinnön menetelmästä;
Kuvio 3 esittää keksinnön mukaisen viestintäjärjestelmän toisen suoritusmuodon; 15 Kuviossa 1 on esitetty keksinnön mukainen viestintäjärjestelmän suoritusmuoto. Järjestelmä käsittää kolme pääyksikköä; langattoman televiestintäverkon 130, lähetyslaitteen 110 ja vastaanottajalaitteen 120. Lähetyslaite ja vastaanottajalaite on kytketty langattomaan televiestintäverkkoon 130. Ne ovat identtisiä laitteita ja saattavat olla langattomia viestintälaitteita, esimerkiksi matkapuhelimia. Jokainen , . 20 laite käsittää keskusprosessointiyksikön 124, joka ohjaa ensimmäistä muistia 111, ' toista muistia 112 ja kolmatta muistia 113 sekä lisäksi antenniin 116 kytkettyä j radiotaajuuslohkoa 115. Muistit 111, 112 ja 113 ovat edullisesti sellaisia, että !".· niiden sisältö säilyy, vaikka laitteesta loppuisi virta. Edullisessa suoritusmuodossa .·**. laitteiden muistit ovat puolijohdemuisteja, esimerkiksi flash-RAM -muisteja, joissa 25 ei ole liikkuvia osia. Lähetyslaite 110 ja vastanottajalaite 120 on liitetty langattomaan televiestintäverkkoon 130 radiokanavien kautta.
Langaton televiestintäverkko 130 käsittää tietokannan 132, joka käsittää useita ; tallenteita 133, 134, 135 ja 136 puhesynteesimallien säilyttämiseksi useille verkon 30 käyttäjille. Tietokantaa ohjaa prosessointiyksikkö 131, jolla on pääsy jokaiseen tallenteista 133, 134, 135 ja 136. Tietokanta on edullisesti tallennettu • » ! ‘. massamuistiin, kuten kovalevylle tai kovalevyjoukolle. Yhdistelmänä tietokanta 132
t > I
ja prosessointiyksikkö 131 ovat puhesynteesimallipalvelimen 137 osa.
6 115868
Seuraavaksi kuvataan viestintäjärjestelmän toiminta. Kun vastaanottajalleen käyttäjä vastaanottaa tekstiviestin, tekstiviestiä varten annetaan valintamahdollisuus niin, että se voidaan joko näyttää visuaalisesti tai lukea 5 auditiivisesti niin, että käyttäjä voi kuunnella tekstiviestin sisällön. Käyttäjä voi luonnollisesti valita sekä visuaalisen näyttämisen että auditiivisen esityksen, joskin yleensä vain toinen esitysmuoto on tarpeen. Oletusmenetelmänä suositaan visuaalista näyttöä. Jos käyttäjä valitsee auditiivisen esityksen, vastaanottajalaite tarkistaa tekstiviestin lähettäjän henkilöllisyyden ja käyttää sitten lähettäjään 10 assosioitua puhesynteesimallia, ja esittää tekstiviestin auditiivisessa muodossa, joka vastaa lähettäjän ääntä. Jos puhesynteesimalli ei sijaitse vastaanottajalaitteessa, vastaanottajalaite saa sen joko verkosta tai lähetyslaitteelta verkon kautta. Tällä tavoin käyttäjä voi kuunnella tekstiviestejä äänillä, jotka vastaavat tekstiviestien lähettäjiä. Tämän eräs etu on se, että 15 käyttäjä voi erottaa tekstiviestit toisistaan sen perusteella, millä äänellä ne luetaan, tai jopa yksilöidä tekstiviestin lähettäjän sen äänen perusteella, jolla tekstiviesti luetaan.
Kun lähetyslaite 110 ensin lähettää tekstiviestin verkkoon 130, verkon on 20 vastaanotettava kyseiseen lähetyslaitteeseen 110 sopiva puhesynteesimalli. Tämä » * · [l "· on se puhesynteesimalli, jolla luodaan puhetta, joka kuulostaa samalta kuin ; ,* lähetyslaitteen käyttäjän tai jonkun käyttäjistä puhe. Siksi puhesynteesimalli * · · ; lähetetään (i) tekstiviestin kanssa, (ii) myöhempänä ajankohtana, jonka päättää lähetyslaite 110 tai (iii) verkon 130 esittämän puhesynteesimallia koskevan .'I! 25 pyynnön perusteella (joko siihen aikaan, jolloin verkko 130 on vastaanottanut tekstiviestin tai myöhempänä ajankohtana). Puhesynteesimallit on tallennettu : (i) verkkoon, (ii) vastaanottajalaitteisiin tai (iii) sekä verkkoon että .··*. vastaanottajalaitteisiin. Olosuhteet, joissa puhesynteesimallit lähetetään, riippuvat siitä, mitä keksinnön jäljempänä kuvatuista menetelmistä käytetään. On tärkeää ’!!; 30 ymmärtää, että seuraavat menetelmät koskevat tilanteita, joissa lähetyslaitteet 110 ovat jo saattaneet lähettää joitakin puhesynteesimalleja, ja verkko 130 on *; ‘ ’ vastaanottanut puhesynteesimallit, minkä jälkeen ne on tallennettu.
115868 7
Puhesynteesimallien hallintamenetelmässä puhesynteesimalleja ei tarvitse lainkaan lähettää vastaanottajalaitteille 120. Tässä menetelmässä puhesynteesimallit lähetetään verkkoon 130 lähetyslaitteista 110, minkä jälkeen puhesynteesimallit tallennetaan verkkoon 130. Kun tekstiviestiä pyydetään 5 esitettäväksi syntetisoidun puheen muodossa, tarvittava puhesynteesi suoritetaan verkossa 130 ja syntetisoitu puhe lähetetään verkosta vastaanottajalle sopivasti koodatussa muodossa. Puhesynteesimallit saatetaan välittää verkkoon 130 tekstiviestin lähetyksen yhteydessä, tai lähetyslaitteen 110 tai verkon 130 aloitteesta, kuten tässä kuvataan.
10
Menetelmä on esitetty kuviossa 2.
Menetelmässä kaikki puhesynteesimalleja ja puhesynteesiä koskeva toiminnallisuus on verkossa. Viestintälaitteilta vaaditaan vain kyky lähettää ja 15 vastaanottaa tekstiviestejä ja pyytää tekstiviestien syntetisoitua esitystä.
Menetelmä mahdollistaa puhuttujen viestien vastaanottamisen laitteilla, jotka eivät kykene vastaanottamaan puhesynteesimalleja.
. 20 Kuvio 3 esittää viestintäjärjestelmän puhesynteesimallien käsittelemiseksi. Sen .! ' avulla puhesynteesimalleja voidaan hankkia ja tallentaa i puhesynteesimallipalvelimelle.
» » * • · · · • .··. Kuviossa 3 on kuvion 1 kanssa yhteneviä piirteitä, ja vastaavia viitenumerolta on 25 sovellettu molempien järjestelmien yhteisiin piirteisiin. Puhesynteesimallit tallennetaan puhesynteesimallipalvelimelle 137. Sen sijaan että ne hankittaisiin • j* vain lähetyslaitteista 110, ne hankitaan puhesynteesimallien luontiyksiköistä 160 : “': verkon 158 (kuten intranet tai Internet) kautta.
30 Puhesynteesimallien luontiyksiköt 160 ovat verkkopäätteitä, jotka on varustettu puhesynteesimallien luontiohjelmistoilla. Nämä yksiköt saattavat käsittää ly. henkilökohtaisia tietokoneita. Yksittäinen yksikkö 160 käsittää äänenkaappauslaitteen 160. Äänenkaappauslaitteessa on mikrofoni sekä siihen 3 115868 liitetty analogia-digitaalimuunnin kaapatun puheen digitoimiseksi. Digitoitu kaapattu puhe tallennetaan kovalevylle 162. Puhesynteesimallin luontiohjelmisto 165 luo puhesynteesimallin analysoimalla kovalevylle 162 tallennettua digitoitua kaapattua puhetta. Ohjelmisto 165 saattaa myös olla tallennettuna kovalevylle 5 162.
Yksikkö 160 käsittää myös Verkkosovittimen 163, mikä mahdollistaa yhteyden yksikön 160 ja verkon sekä käyttöliittymän 164 välillä. Käyttöliittymän 164 ansiosta käyttäjän on mahdollista päästä käyttämään ohjelmistoa 165.
10
Seuraavaksi kuvataan viestintäjärjestelmän toiminta. Tyypillisesti verkkopääte 160 on käyttäjän henkilökohtainen tietokone. Jos käyttäjä haluaa antaa yleisen pääsyn puhesynteesimalliinsa (jolloin häneltä tekstiviestejä vastaanottavat henkilöt voivat hankkia sen), käyttäjä aktivoi ohjelmiston 165 ja seuraa erilaisia vaadittavia puhe-15 ja opetusharjoituksia, joihin usein kuuluu äänten, sanojen ja lauseiden toistoa. Kun puhesynteesimalli on kerran luotu, käyttäjä voi lähettää sen puhesynteesimallipalvelimelle 137. Tätä palvelinta ohjaa tyypillisesti verkon 130 operaattori.
. . 20 Vaihtoehtoisesti palveluntarjoaja tarjoaa verkkopäätteen 160 ja ohjaa sitä. Tässä ‘ tapauksessa käyttäjä voi luoda puhesynteesimallin tarpeen mukaan. Eräs sopiva ► · 1 ,·. ajankohta puhesynteesimallin luomiselle on esimerkiksi silloin, kun muodostetaan ,.,,: uusi yhteys verkkoon 130, esimerkiksi ostettaessa matkapuhelin.
» · »1 1 • · 25 Kun palvelinta 137 käytetään puhesynteesimallin tarjoamiseksi, •» » puhesynteesimallia pyytävältä osapuolelta saatetaan periä maksu.
Päämääränä on lähettää puhesynteesimalleja ainoastaan tarpeen niin vaatiessa, ,·! : esimerkiksi verkon 130 aloitteesta.
30 a i
Seuraavaksi kuvataan tarkoituksenmukainen puhesynteesimallien luontitapa. Tähän sisältyy syntetisoitavan äänen erityisominaisuuksien opettaminen puhesynteesimallille, jotta ääni voidaan tuottaa uudestaan.
9 115868
Eräässä suoritusmuodossa viestintälaitteet luovat tekstiviestejä puheentunnistuksen avulla. Viestintälaitteessa on muistitilan säilyttämiseksi yhdistetty puheentunnistus/synteesisovellusohjelma. Tämä sovellusohjelma 5 kykenee tunnistamaan puheen ja muuntamaan sen tekstiksi. Vaikka puheentunnistus on jo tekniikan tasosta tuttua (vaatien joko puhujariippuvien tai puhujasta riippumattomien puheentunnistusmallien käyttöä), keksintö ehdottaa, että ennen keksintöä olemassa olevaa puheentunnistustoiminnallisuutta käytetään lisäksi tekstin muuttamiseksi puheeksi. Aikaisempia puheentunnistusmalleja 10 käyttämällä viestintälaitteen käyttäjän ei tarvitsisi kuluttaa aikaa opettamalla laitetta tunnistamaan ja syntetisoimaan puhetta yksittäisenä ja erillisenä toimintona, vaan opetus voidaan yhdistää sekä puheen tunnistamiseen että puhesynteesiin.
Silloin kun puheentunnistusta käytetään tekstiviestien tuottamiseen kirjoittamisen 15 sijaan, ja lähetyslaite 110 opettelee tunnistamaan lähettäjän puhetta luodakseen puhesynteesimallin suhteellisen nopeasti, luettu teksti saatetaan esittää lähettäjälle niin, että korostetaan tiettyjä helposti väärin lausuttuja sanoja ja pyydetään vahvistusta tai korjausta näille sanoille. Tällainen vahvistus tai korjaus yhdistetään puhesynteesimallin luomiseen kuuluvaan oppimisprosessiin niin, että . . 20 puhesynteesimalli kyetään luomaan tehokkaammin. 1 2 3 .·. Puhesynteesimallien ei välttämättä tarvitse kuulua lähetyslaitteen 110 käyttäjille.
Riittää, että puhesynteesimallit tekevät eron käyttäjien välillä kun niitä kuunnellaan. ,···. Vastaanottajalleen 120 käyttäjä voi valita ne, ja ne voivat olla myös humoristisia 2 25 puhesynteesimalleja, kuten esimerkiksi sarjakuvahahmon puheen syntetisoimiseksi käytettäviä puhesynteesimalleja. Vaihtoehtoisesti voi olla kaksi 3 puhesynteesimallia, yksi miespuoliselle puhujalle ja yksi naispuoliselle puhujalle.
, Tekstiviestin mukana lähetetty sukupuolen osoitin voi varmistaa, että tekstiviesti ; puhutaan oikeaa sukupuolta olevalla syntetisoidulla äänellä. Eräs tapa on 30 varmistaa lähetyslaitteen käyttäjän etunimi ja käyttää sitä sukupuolen määrittämiseen. Myös muita erotustekijöitä voidaan käyttää. Puhesynteesimallit i ‘. voivat esimerkiksi esittää nuoria ja vanhoja ääniä.
115868 10
Koska puhujan puhesynteesimallin tallentaminen voi mahdollistaa väärennettyjen viestien lähettämisen jonkun toisen "ääntä" käyttämällä, puhesynteesimalliin saattaa olla suotavaa sisällyttää jonkinlainen digitaalinen allekirjoitus (kenties sulautettu allekirjoitus) niin, että ainoastaan puhesynteesimallin lähettäjällä on 5 oikeus käyttää sitä. Eräässä suoritusmuodossa tämä perustuu kahden avaimen salausjärjestelmään, jossa puhesynteesimalli luo yhden avaimen, ja uudet tekstiviestit tarjotaan toisen avaimen kanssa. Vastaanottajalaite tarkistaa salausalgoritmilla, että avaimet vastaavat tekstiviestin sisältöä ja tunnistaa näin tekstiviestin lähteen. Nämä turvallisuusnäkökohdat eivät ole kovin suuri ongelma 10 kun puhesynteesimalleja ei siirretä viestintälaitteisiin.
Siinä tapauksessa, että tekstiviesti tulee useilta ihmisiltä, voidaan lähettää useita puhesynteesimalleja niin, että tekstiviestin eri osat voidaan lukea ääneen eri äänillä tekstin eri osien lähteestä riippuen. Tässä tapauksessa lähteen tunnisteet 15 voidaan upottaa tekstiviestin uuden lähteen osan alkuun. Tapaa voidaan soveltaa tekstiviesteihin, jotka moni vastaanottaja on vastaanottanut, ja joista kaikki ovat lisänneet jonkin verran tekstiä ja lähettäneet tekstin sitten eteenpäin. Tällainen tekstiviesti saattaa olla sähköpostiviesti, joka on vastaanotettu ja välitetty edelleen, tai johon on vastattu yhden tai useamman kerran.
: 20 : ' Keksintöä voidaan käyttää langoitetuilla viestintäpoluilla sekä myös langattomilla viestintäpoluilla niin, että sitä voidaan käyttää esimerkiksi sellaisissa tapauksissa, joissa toinen tai molemmat osapuolet ovat yhteydessä intranetiin tai Internetiin.
• · *. 25 Keksinnön myötä tulee mahdolliseksi lähettää vähän kaistanleveyttä kuluttavia tekstiviestejä ja lukea ne puhuttuina siten, että niiden lähteet voidaan yksilöidä.
·:. Siten voidaan tuottaa syntetisoitua puhetta, joka on persoonallista, tai ainakin mahdollista erottaa eri lähteiden mukaan. Keksintö mahdollistaa tällaisten : "puhuttujen tekstiviestien" lähettämisen yhtä helposti kuin sähköpostiviestien
> » I
____: 30 lähettäminen on tällä hetkellä. On myös mahdollista varata yksilöityjä puhesynteesimalleja samalla kun niiden lähettämisessä käytetään pientä kaistanleveyttä. Näin on erityisesti keksinnön siinä menetelmässä, jossa puhesynteesimallit lähetetään vain kerran. Yksi keksinnön tarjoamista eduista on 115868 11 se, että tekstiviestit tallennetaan edelleen tavallisena tekstinä, mikä tarkoittaa sitä, että niiden tallentamiseen kuluu vähän muistia verrattuna puheen tallentamiseen. Lisäksi tekstiviestejä on suhteellisen helppo etsiä avainsanojen avulla.
5 Keksinnön erityisiä toteutuksia ja suoritusmuotoja on kuvattu edellä. Alan ammattimiehelle on selvää, että keksintö ei rajoitu yllä esitettyihin suoritusmuotohin, vaan se voidaan vastaavia välineitä käyttäen toteuttaa muissa suoritusmuodoissa ilman, että keksinnön tunnusmerkeistä poiketaan. Keksinnön puitteita rajoittavat ainoastaan liitteenä olevat patenttivaatimukset.
10 • · I · • · • » • · · • I M t
‘ I
1' » » • * i » #

Claims (18)

1. Menetelmä tekstiviestin muuntamiseksi syntetisoiduksi puheeksi, jossa: tallennetaan verkossa (130) puheen synteesiä varten ensimmäinen 5 puhesynteesimalli (130,134,135,136) jolla on ensimmäinen joukko puhepiirteitä; assosioidaan ensimmäinen puhesynteesimalli (130,134,135,136) ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; tallennetaan verkossa (130) puheen synteesiä varten toinen puhesynteesimalli (130,134,135,136) jolla on toinen joukko puhepiirteitä, 10 ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; assosioidaan toinen puhesynteesimalli (130,134,135,136) ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; 15 vastaanotetaan verkon (130) toimesta ensimmäisen määritellyn lähteen kanssa assosioitu tekstiviesti ensimmäiseltä päätelaitteelta (110); määritetään että tekstiviesti on peräisin ensimmäisestä määritellystä lähteestä; ja syntetisoidaan puhe ensimmäisen puhesynteesimallin (130,134,135,136) . . 20 mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti on peräisin i * ! ' ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä lähteestä, tunnettu siitä, että • · ' • · ’ [, j menetelmässä lähetetään verkosta syntetisoitua puhetta toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella. 25
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että ensimmäinen ;. puhesynteesimalli on yksilöllinen tietylle ensimmäisen päätelaitteen käyttäjälle.
‘ : 3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että 30 ensimmäinen ja toinen puhesynteesimalli tallennetaan verkon (130) tietokantaan.
'. 4. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu I ! * 115868 siitä, että tekstiviesti muodostetaan tekstisyötöllä käyttäjän toimesta ensimmäisellä päätelaitteella (110).
5. Patenttivaatimuksen 4 mukainen menetelmä, tunnettu siitä, että tekstiviesti 5 muodostetaan näppäilemällä.
6. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että tekstiviesti on sähköpostiviesti.
7. Jonkin patenttivaatimuksen 1-5 mukainen menetelmä, tunnettu siitä, että tekstiviesti on lyhytsanoma.
8. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että menetelmässä valitaan tekstiviestin esitystapa ryhmästä joka koostuu: 15 visuaalisesta esittämisestä siten että vastaanottava henkilö voi lukea tekstiviestin, kuultavasta lukemisesta siten että vastaanottava henkilö voi kuunnella tekstiviestin, ja visuaalisesta esittämisestä sekä kuultavasta lukemisesta.
9. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu : 20 siitä, että siinä tapauksessa että tekstiviesti esitetään vastaanottavalle henkilölle . puhutussa muodossa, suoritetaan askeleet: .·. määritetään että tekstiviesti on peräisin ensimmäisestä määritellystä • · lähteestä; ·. syntetisoidaan puhe ensimmäisen puhesynteesimallin (130,134,135,136) 25 mukaan; ja » · lähetetään verkosta syntetisoitua puhetta toiselle päätelaitteelle (120).
, .· 10. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, . : tunnettu siitä, että ainakin yksi ensimmäisestä ja toisesta päätelaitteesta on : 30 valittu ryhmästä joka koostuu seuraavista: matkaviestin, matkapuhelin, PDA '. t (Personal Digital Assistant) laite, tietokone, langaton tietokone, viestintälaite ja verkkopääte. 115068
11. Patenttivaatimuksen 3 mukainen menetelmä, tunnettu siitä, että tietokanta on järjestetty tallentamaan tunnisteita jotka kukin vastaavat yhtä puhesynteesimallia ja yhtä lähdettä.
12. Minkä tahansa patenttivaatimuksen 9-11 mukainen menetelmä, tunnettu siitä, että verkko käsittää puhesynteesimallin käsittelijän puhesynteesimallien kopioiden vastaanottamiseksi.
12 1 1 5868
13. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, 10 tunnettu siitä, että verkko (130) vastaanottaa ensimmäisen puhesynteesimallin (133, 134, 135, 136) ensimmäiseltä päätelaitteelta (110).
14. Minkä tahansa edeltävän patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että ensimmäinen puhesynteesimalli (133, 134, 135, 136) on 15 muodostettu ensimmäisellä päätelaitteella (110).
15. Verkko (130) tekstiviestin muuntamiseksi syntetisoiduksi puheeksi käsittäen: välineet ensimmäinen puhesynteesimallin tallentamiseksi puheen synteesiä varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on . ; 20 ensimmäinen joukko puhepiirteitä; ·, ’ välineet ensimmäisen puhesynteesimallin (130,134,135,136) .·. assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien • · * · kanssa; ·*. välineet toisen puhesynteesimallin (130,134,135,136) tallentamiseksi '; 25 puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan , · puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; : välineet toisen puhesynteesimallin (130,134,135,136) assosioimiseksi 30 toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; :. välineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin : vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); ja 15 1 1 5868 välineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin (130.134.135.136) mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä lähteestä; 5 tunnettu siitä, että verkko käsittää välineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella.
16. Puhesynteesimallipalvelin tekstiviestin muuntamiseksi syntetisoiduksi puheeksi 10 käsittäen: välineet ensimmäinen puhesynteesimallin tallentamiseksi puheen synteesiä varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on ensimmäinen joukko puhepiirteitä; välineet ensimmäisen puhesynteesimallin (130,134,135,136) 15 assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; välineet toisen puhesynteesimallin (130,134,135,136) tallentamiseksi puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan •, : 20 puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; • * välineet toisen puhesynteesimallin (130,134,135,136) assosioimiseksi ;..: toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; " välineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin *: 25 vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); välineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin (130.134.135.136) mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti : on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä ; lähteestä; ja • 30 välineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella. 115868
17. Tiedonsiirtojärjestelmä tekstiviestin muuntamiseksi syntetisoiduksi puheeksi käsittäen ensimmäisen päätelaitteen, toisen päätelaitteen ja verkon, joka verkko käsittää: välineet ensimmäinen puhesynteesimallin tallentamiseksi puheen synteesiä 5 varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on ensimmäinen joukko puhepiirteitä; välineet ensimmäisen puhesynteesimallin (130,134,135,136) assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; 10 välineet toisen puhesynteesimallin (130,134,135,136) tallentamiseksi puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan puheen ollessa erotettavissa toisella puhesynteesimallilla (130,134,135,136) tuotettavasta puheesta; 15 välineet toisen puhesynteesimallin (130,134,135,136) assosioimiseksi toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; välineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); ja välineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin : 20 (130,134,135,136) mukaan vastaanottavan henkilön sallimiseksi erottaa että viesti , ’ on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä • I lähteestä; i · > · ,,: tunnettu siitä, että verkko käsittää: ·'; välineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) 25 jolla vastaanottava henkilö voi sitä kuunnella.
18. Tietokoneohjelmatuote tekstiviestin muuntamiseksi syntetisoiduksi puheeksi käsittäen: : tietokoneohjelmakoodivälineet ensimmäinen puhesynteesimallin • 30 tallentamiseksi puheen synteesiä varten (130,134,135,136), jolla ensimmäisellä puhesynteesimallilla on ensimmäinen joukko puhepiirteitä; : I 17 1 1 5868 tietokoneohjelmakoodivälineet ensimmäisen puhesynteesimallin (130.134.135.136) assosioimiseksi ensimmäisestä määritellystä lähteestä tulevien tekstiviestien kanssa; tietokoneohjelmakoodivälineet toisen puhesynteesimallin (130,134,135,136) 5 tallentamiseksi puheen synteesiä varten, jolla toisella puhesynteesimallilla on toinen joukko puhepiirteitä, ensimmäisellä puhesynteesimallilla (130,134,135,136) tuotettavan puheen ollessa erotettavissa toisella puhesynteesimallilla (130.134.135.136) tuotettavasta puheesta; tietokoneohjelmakoodivälineet toisen puhesynteesimallin (130,134,135,136) 10 assosioimiseksi toisesta määritellystä lähteestä tulevien tekstiviestien kanssa; tietokoneohjelmakoodivälineet ensimmäisen määritellyn lähteen kanssa assosioidun tekstiviestin vastaanottamiseksi ensimmäiseltä päätelaitteelta (110); tietokoneohjelmakoodivälineet puheen syntetisoimiseksi ensimmäisen puhesynteesimallin (130,134,135,136) mukaan vastaanottavan henkilön 15 sallimiseksi erottaa että viesti on peräisin ensimmäisestä määritellystä lähteestä eikä toisesta määritellystä lähteestä; ja tietokoneohjelmakoodivälineet syntetisoidun puheen lähettämiseksi toiselle päätelaitteelle (120) jolla vastaanottava henkilö voi sitä kuunnella. : 20 » * «· * * * I · * = i ‘ « > » · > t » 18 1 1 5868
FI20001572A 2000-06-30 2000-06-30 Puhesynteesi FI115868B (fi)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FI20001572A FI115868B (fi) 2000-06-30 2000-06-30 Puhesynteesi
EP01660131A EP1168297B1 (en) 2000-06-30 2001-06-29 Speech synthesis
AT01660131T ATE347726T1 (de) 2000-06-30 2001-06-29 Sprachsynthese
US09/895,714 US20020013708A1 (en) 2000-06-30 2001-06-29 Speech synthesis
DE60124985T DE60124985T2 (de) 2000-06-30 2001-06-29 Sprachsynthese

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20001572A FI115868B (fi) 2000-06-30 2000-06-30 Puhesynteesi
FI20001572 2000-06-30

Publications (3)

Publication Number Publication Date
FI20001572A0 FI20001572A0 (fi) 2000-06-30
FI20001572A FI20001572A (fi) 2001-12-31
FI115868B true FI115868B (fi) 2005-07-29

Family

ID=8558698

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20001572A FI115868B (fi) 2000-06-30 2000-06-30 Puhesynteesi

Country Status (5)

Country Link
US (1) US20020013708A1 (fi)
EP (1) EP1168297B1 (fi)
AT (1) ATE347726T1 (fi)
DE (1) DE60124985T2 (fi)
FI (1) FI115868B (fi)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3709916B2 (ja) * 2000-05-25 2005-10-26 日本電気株式会社 電話端末における文字メッセージ通信方法および装置
US7886006B1 (en) * 2000-09-25 2011-02-08 Avaya Inc. Method for announcing e-mail and converting e-mail text to voice
DE10062379A1 (de) * 2000-12-14 2002-06-20 Siemens Ag Verfahren und System zum Umsetzen von Text in Sprache
US6513008B2 (en) * 2001-03-15 2003-01-28 Matsushita Electric Industrial Co., Ltd. Method and tool for customization of speech synthesizer databases using hierarchical generalized speech templates
JP2003016008A (ja) * 2001-07-03 2003-01-17 Sony Corp 情報処理装置および情報処理方法、並びにプログラム
KR100450319B1 (ko) * 2001-12-24 2004-10-01 한국전자통신연구원 가상 환경에서 참여자간의 의사전달 장치 및 방법
DE10207875A1 (de) * 2002-02-19 2003-08-28 Deutsche Telekom Ag Parametergesteuerte Sprachsynthese
DE10254183A1 (de) * 2002-11-20 2004-06-17 Siemens Ag Verfahren zur Wiedergabe von gesendeten Textnachrichten
DE10304229A1 (de) * 2003-01-28 2004-08-05 Deutsche Telekom Ag Kommunikationssystem, Kommunikationsendeinrichtung und Vorrichtung zum Erkennen fehlerbehafteter Text-Nachrichten
DE10305658A1 (de) * 2003-02-12 2004-08-26 Robert Bosch Gmbh Informationseinrichtung, insbesondere für Fahrzeuge, sowie Verfahren zur Steuerung der Sprachwiedergabe
US7013282B2 (en) * 2003-04-18 2006-03-14 At&T Corp. System and method for text-to-speech processing in a portable device
US20050048992A1 (en) * 2003-08-28 2005-03-03 Alcatel Multimode voice/screen simultaneous communication device
US20050096909A1 (en) * 2003-10-29 2005-05-05 Raimo Bakis Systems and methods for expressive text-to-speech
GB2412046A (en) 2004-03-11 2005-09-14 Seiko Epson Corp Semiconductor device having a TTS system to which is applied a voice parameter set
KR100719776B1 (ko) * 2005-02-25 2007-05-18 에이디정보통신 주식회사 휴대형 코드인식 음성 합성출력장치
ATE362164T1 (de) * 2005-03-16 2007-06-15 Research In Motion Ltd Verfahren und system zur personalisierung von text-zu-sprache umsetzung
US7706510B2 (en) 2005-03-16 2010-04-27 Research In Motion System and method for personalized text-to-voice synthesis
JP5259050B2 (ja) * 2005-03-30 2013-08-07 京セラ株式会社 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム
DE602005017829D1 (de) * 2005-05-31 2009-12-31 Telecom Italia Spa Bereitstellung von sprachsynthese auf benutzerendgeräten über ein kommunikationsnetz
EP1736962A1 (en) * 2005-06-22 2006-12-27 Harman/Becker Automotive Systems GmbH System for generating speech data
US8977636B2 (en) * 2005-08-19 2015-03-10 International Business Machines Corporation Synthesizing aggregate data of disparate data types into data of a uniform data type
US8266220B2 (en) * 2005-09-14 2012-09-11 International Business Machines Corporation Email management and rendering
US20070078655A1 (en) * 2005-09-30 2007-04-05 Rockwell Automation Technologies, Inc. Report generation system with speech output
CN100487788C (zh) * 2005-10-21 2009-05-13 华为技术有限公司 一种实现文语转换功能的方法
US8694319B2 (en) 2005-11-03 2014-04-08 International Business Machines Corporation Dynamic prosody adjustment for voice-rendering synthesized data
US8326629B2 (en) * 2005-11-22 2012-12-04 Nuance Communications, Inc. Dynamically changing voice attributes during speech synthesis based upon parameter differentiation for dialog contexts
US8271107B2 (en) * 2006-01-13 2012-09-18 International Business Machines Corporation Controlling audio operation for data management and data rendering
US20070192683A1 (en) * 2006-02-13 2007-08-16 Bodin William K Synthesizing the content of disparate data types
US9135339B2 (en) 2006-02-13 2015-09-15 International Business Machines Corporation Invoking an audio hyperlink
US7996754B2 (en) * 2006-02-13 2011-08-09 International Business Machines Corporation Consolidated content management
US7505978B2 (en) * 2006-02-13 2009-03-17 International Business Machines Corporation Aggregating content of disparate data types from disparate data sources for single point access
US9037466B2 (en) * 2006-03-09 2015-05-19 Nuance Communications, Inc. Email administration for rendering email on a digital audio player
US9092542B2 (en) 2006-03-09 2015-07-28 International Business Machines Corporation Podcasting content associated with a user account
US9361299B2 (en) * 2006-03-09 2016-06-07 International Business Machines Corporation RSS content administration for rendering RSS content on a digital audio player
US8849895B2 (en) * 2006-03-09 2014-09-30 International Business Machines Corporation Associating user selected content management directives with user selected ratings
US20070214148A1 (en) * 2006-03-09 2007-09-13 Bodin William K Invoking content management directives
US8286229B2 (en) * 2006-05-24 2012-10-09 International Business Machines Corporation Token-based content subscription
US20070277088A1 (en) * 2006-05-24 2007-11-29 Bodin William K Enhancing an existing web page
US7778980B2 (en) * 2006-05-24 2010-08-17 International Business Machines Corporation Providing disparate content as a playlist of media files
US7822606B2 (en) * 2006-07-14 2010-10-26 Qualcomm Incorporated Method and apparatus for generating audio information from received synthesis information
US20080034044A1 (en) * 2006-08-04 2008-02-07 International Business Machines Corporation Electronic mail reader capable of adapting gender and emotions of sender
US7831432B2 (en) * 2006-09-29 2010-11-09 International Business Machines Corporation Audio menus describing media contents of media players
US9196241B2 (en) * 2006-09-29 2015-11-24 International Business Machines Corporation Asynchronous communications using messages recorded on handheld devices
US20080086565A1 (en) * 2006-10-10 2008-04-10 International Business Machines Corporation Voice messaging feature provided for immediate electronic communications
US20080162131A1 (en) * 2007-01-03 2008-07-03 Bodin William K Blogcasting using speech recorded on a handheld recording device
US9318100B2 (en) * 2007-01-03 2016-04-19 International Business Machines Corporation Supplementing audio recorded in a media file
US8219402B2 (en) * 2007-01-03 2012-07-10 International Business Machines Corporation Asynchronous receipt of information from a user
WO2008132533A1 (en) * 2007-04-26 2008-11-06 Nokia Corporation Text-to-speech conversion method, apparatus and system
KR20090085376A (ko) * 2008-02-04 2009-08-07 삼성전자주식회사 문자 메시지의 음성 합성을 이용한 서비스 방법 및 장치
US8285548B2 (en) 2008-03-10 2012-10-09 Lg Electronics Inc. Communication device processing text message to transform it into speech
US8494854B2 (en) 2008-06-23 2013-07-23 John Nicholas and Kristin Gross CAPTCHA using challenges optimized for distinguishing between humans and machines
US9186579B2 (en) * 2008-06-27 2015-11-17 John Nicholas and Kristin Gross Trust Internet based pictorial game system and method
EP2205010A1 (en) 2009-01-06 2010-07-07 BRITISH TELECOMMUNICATIONS public limited company Messaging
US20120069974A1 (en) * 2010-09-21 2012-03-22 Telefonaktiebolaget L M Ericsson (Publ) Text-to-multi-voice messaging systems and methods
US20120259633A1 (en) * 2011-04-07 2012-10-11 Microsoft Corporation Audio-interactive message exchange
US9166977B2 (en) 2011-12-22 2015-10-20 Blackberry Limited Secure text-to-speech synthesis in portable electronic devices
EP2608195B1 (en) * 2011-12-22 2016-10-05 BlackBerry Limited Secure text-to-speech synthesis for portable electronic devices
KR20140008870A (ko) * 2012-07-12 2014-01-22 삼성전자주식회사 컨텐츠 정보 제공 방법 및 이를 적용한 방송 수신 장치
US10439965B1 (en) 2013-01-18 2019-10-08 Twitter, Inc. In-message applications in a messaging platform
US9813260B1 (en) * 2013-01-18 2017-11-07 Twitter, Inc. In-message applications in a messaging platform
US9117451B2 (en) * 2013-02-20 2015-08-25 Google Inc. Methods and systems for sharing of adapted voice profiles
US9767787B2 (en) * 2014-01-01 2017-09-19 International Business Machines Corporation Artificial utterances for speaker verification
KR101703214B1 (ko) * 2014-08-06 2017-02-06 주식회사 엘지화학 문자 데이터의 내용을 문자 데이터 송신자의 음성으로 출력하는 방법
US11735156B1 (en) * 2020-08-31 2023-08-22 Amazon Technologies, Inc. Synthetic speech processing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5841979A (en) * 1995-05-25 1998-11-24 Information Highway Media Corp. Enhanced delivery of audio data
US6035273A (en) * 1996-06-26 2000-03-07 Lucent Technologies, Inc. Speaker-specific speech-to-text/text-to-speech communication system with hypertext-indicated speech parameter changes
US6078886A (en) * 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
JP3287281B2 (ja) * 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置

Also Published As

Publication number Publication date
DE60124985T2 (de) 2007-07-05
FI20001572A0 (fi) 2000-06-30
DE60124985D1 (de) 2007-01-18
FI20001572A (fi) 2001-12-31
EP1168297B1 (en) 2006-12-06
US20020013708A1 (en) 2002-01-31
EP1168297A1 (en) 2002-01-02
ATE347726T1 (de) 2006-12-15

Similar Documents

Publication Publication Date Title
FI115868B (fi) Puhesynteesi
US9214154B2 (en) Personalized text-to-speech services
CN100481851C (zh) 使用通信设备的化身控制
CN100546322C (zh) 具有文本到语音和语音到文本翻译的聊天与远程会议系统
AU2007346312B2 (en) A communication network and devices for text to speech and text to facial animation conversion
US20080126491A1 (en) Method for Transmitting Messages from a Sender to a Recipient, a Messaging System and Message Converting Means
US8874445B2 (en) Apparatus and method for controlling output format of information
JP2010531607A (ja) 映像メッセージサービスを提供するためのシステムおよびその方法
KR100788781B1 (ko) 어학학습 시스템 및 그 방법
US20060093098A1 (en) System and method for communicating instant messages from one type to another
CN113194203A (zh) 一种用于听障人士的沟通系统、接听拨打方法及通讯系统
CN108364638A (zh) 一种语音数据处理方法、装置、电子设备和存储介质
JP3923712B2 (ja) メッセージ交換システムおよび記録媒体
US20030120492A1 (en) Apparatus and method for communication with reality in virtual environments
KR101916107B1 (ko) 통신 단말 및 그 통신 단말의 정보처리 방법
JP2002101205A (ja) 会議支援装置及び方法並びにこれに利用される記憶媒体
KR100920174B1 (ko) 본인 음성 기반의 tts 서비스 제공 장치와 시스템 및 그방법
US20180300316A1 (en) System and method for performing message translations
US8326445B2 (en) Message string correspondence sound generation system
JP5326539B2 (ja) 留守番電話システム、留守番電話サービスサーバ及び留守番電話サービス方法
KR100487446B1 (ko) 이동 통신 단말의 오디오 장치를 이용한 감정 표현 방법및 이를 위한 이동 통신 단말
JP4530016B2 (ja) 情報通信システムおよびそのデータ通信方法
KR20150011430A (ko) 영상 컬러링/레터링 기반의 컨텐츠 제공 시스템 및 그의 컨텐츠 제공 방법
KR20040039771A (ko) 이모티콘 사운드 재생 장치 및 방법
WO2010074406A2 (ko) 이동 통신 시스템의 이메일 서비스 장치 및 방법

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 115868

Country of ref document: FI

MM Patent lapsed