NL8200726A - Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. - Google Patents

Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. Download PDF

Info

Publication number
NL8200726A
NL8200726A NL8200726A NL8200726A NL8200726A NL 8200726 A NL8200726 A NL 8200726A NL 8200726 A NL8200726 A NL 8200726A NL 8200726 A NL8200726 A NL 8200726A NL 8200726 A NL8200726 A NL 8200726A
Authority
NL
Netherlands
Prior art keywords
speech
modification
speech pattern
pitch
characters
Prior art date
Application number
NL8200726A
Other languages
English (en)
Original Assignee
Philips Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Nv filed Critical Philips Nv
Priority to NL8200726A priority Critical patent/NL8200726A/nl
Priority to EP83200244A priority patent/EP0087199B1/en
Priority to DE8383200244T priority patent/DE3364818D1/de
Priority to JP58028655A priority patent/JPS58157000A/ja
Publication of NL8200726A publication Critical patent/NL8200726A/nl
Priority to US06/821,112 priority patent/US4689817A/en
Priority to US07/035,103 priority patent/US4783810A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

. X È ίϋ PEN 10.287 1 N.V. PHILIPS1 GLOEILAMPENFABRIEKEN TE EINDHOVEN.
"Inrichting voor het genereren van de auditieve informatie van een verzameling karakters".
De uitvinding heeft betrekking op een inrichting voor het genereren van de auditieve informatie van een verzameling karakters die een eerste deelverzameling van kleine letters en een tweede deelverzameling van hoofdletters bevat, welke inrichting een proeessorreenheid bevat 5 met daaraan verbonden een eerste geheugen voor het opslaan van spraak-gegevens en een tweede geheugen voor het opslaan van aangeboden karakters, welke processoreenheid van besturingsmiddelen is voorzien cm voor een aangeboden karakter het vormen, op basis van genoemde spraak-gegevens, van een spraakpatroon voor een met het eerste geheugen ver-10 bonden spraakgenerator te besturen, welke processoreenheid verder van herkenningsmiddelen is voorzien om uit de aangeboden karakters die karakters te herkennen welke tot genoemde tweede deelverzamding behoren een eerste modifikatie met behoud van identiteit bij het spraakpatroon aan te brengen.
15 Een dergelijke inrichting is bekend uit het amerikaanse octrooischrift no 4 060 848. Hierin worden onder meer een rekenmachine en een typmachine beschreven waarbij de door een gebruiker, via een aan de inrichting aangesloten toetsenbord aangeboden karakters in spraak worden omgezet. Hierdoor kan de gebruiker controleren of hij de juiste in-20 formatie heeft aangereikt zonder zijn blik van het toetsenbord of de te typen tekst af te wenden. De aangeboden karakters worden in het tweede geheugen qpgeslagen. Onder besturing van de digitale data processor wordt van een aangeboden karakters op basis van de in het eerste geheugen qpgeslagen spraakgegevens een spraakpatroon gevormd, uit welk spraakpatroon 25 door de spraakgenerator spraak wordt gegenereerd. De digitale data processor bevat herkenningsmiddelen cm uit de aangeboden karakters de hoofdletters van de overige karakters te onderscheiden.
Voor een hoofdletter wordt een modifikatie bij het spraakpatroon aangebracht. Deze modifikatie bevat het toevoegen van het voor-30 voegsel "CAP".
Een nadeel van een dergelijke inrichting is dat door het toevoegen van genoemde voorvoegsel de uitspraakduur en de daarmee gekoppelde - 8200726
<, V
EHN 10.287 2 ----uitspraaksnelheid ongunstig beïnvloedt worden. Een verder nadeel van_________ een dergelijke inrichting is dat de gegenereerde spraak allemaal volgens eenzelfde spraakpatroon wordt uitgesproken. Door deze monotone uitsrpaak is het moeilijk de verschillende woorden in eenzelfde zin van elkaar 5 te onderscheiden.
De uitvinding beoogt een inrichting voor het genereren van de auditieve informatie van een verzameling karakters te realiseren waarbij een hoofdletter duidelijk te onderscheiden is van de overige karakters zonder daarom de uitspraakduur en de daarmee gekoppelde uit-10 spraaksnelheid nadelig te beïnvloeden.
Een inrichting volgens de uitvinidng heeft daartoe het kenmerk, dat de eerste modifikatie een modifikatie van een toonhoogte-ccmponent en/of een stemkaraktercarponent van het spraakpatroon bevat.
Door een toonhoogtecorponent en/of een stemkaraktercoiponent 15 van het spraakpatroon voor een hoofdletter te modificeren wordt deze hoofdletter duidelijk herkenbaar voor een gebruiker. De spraakduur en de daarbij behorende uitspraaksnelheid worden hierdoor nagenoeg niet veranderd, ten opzichte van een spraakpatroon voor een kleine letter. Hetzij, vermeld dat het aanpassen van de toonhoogte bekend is uit het genoemde 20 amerikaanse octrooischrift no 4 060 848. Echter de daar beschreven toonhoogte variatie wordt door de gebruiker naar eigen smaak ingesteld door middel van een toonhoogtevariatieknop zoals gebruikelijk bij een audio-versterker. Er is geen sprake van een door de data processor gestuurde toonhoogte variatie voor een hoofdletter.
25 De uitvinding beoogt verder een inrichting voor het genereren van de auditieve informatie van een verzameling karakters te realiseren waarbij de verschillende woorden in eenzelfde zin duidelijk van elkaar te onderscheiden zijn.
Een inrichting volgens de uitvinding heeft daartoe het kenmerk, 30 dat de processor eenheid van pos itiebepalingsmiddelen is voorzien cm de positie van ten minste één letter uit een uit aangeboden karakters samengesteld woord te bepalen, ên om voor die genoemde letter een tweede modifikatie met behoud van identiteit bij het spraakpatroon aan te brengen, welke tweede modifikatie een modifikatie van de toonhoogtecom-35 ponent en/of een stemkaraktercamponent van het spraakpatroon bevat.
Door de bepaling van de positie van ten minste één letter in een uit aangeboden karakters samengesteld woord en voor die letter het spraak- 8200726 / 1 EHN 10*287 3 l patroon te modificeren is het mogelijk een Intonatie in dat woord te--- leggen waardoor het als woord beter onderscheidbaar wordt.
Een voorkeursuitvoering van een inrichting volgens de uitvinding heeft het kenmerk, dat genoemde eerste modifikatie van een toan-5 hoogtecomponent van het spraakpatroon een hogere toon ten opzichte van een gemiddelde toonhoogtecanponent voor de karakters van de eerste deelverzameling bevat.
Door gébruik te maken van een hogere toon voor de uitspraak van een hoofdletter is deze hoofdletter beter te onderscheiden van een 10 kleine letter.
Een verdere voorkeursuitvoering van een inrichting volgens de . uitvinding heeft het kenmerk, dat genoemde eerste modif ikatie van een toonhoogteccmponent van het spraakpatroon een binnen de tijdsduur van dat spraakpatroon stijgende toonhoogte ten opzichte van een gemiddelde 15 toonhoogteccmponent voor de karakters van de eerste deelverzameling bevat. J
Qoor voor de uitspraak van een hoofdletter de toonhoogte te doen stijgen is deze hoofdletter beter te onderscheiden van kleine letters.
20 Een andere voorkeursuitvoering van een inrichting volgens de uitvinding heeft het kenmerk, dat genoemde eerste modif ikatie van de staikaraktercoiponent van het spraakpatroon een verschuiving van de formanten ten opzichte van de representatie van formanten voor de karakters van de eerste deelverzameling bevat.
25 De stemkarakterccmponent van een spraakpatroon voor een bepaald karakter bevat een representatie van formanten, dat zijn een aantal voorkeursfrequenties. Een verschuiving in deze formanten, bijvoorbeeld naar een wat hardere stem, voor de uitspraak van een hoofdletter maakt deze laatste goed onderscheidbaar van kleine letters.
30 Om een goed onderscheid tussen de verschillende woorden in een zin te realiseren is het gunstig dat een inrichting volgens de uitvinding het kenmerk heeft dat genoemde letter de laatste letter van een uit aangeboden karakteissamengesteld woord is.
Het is gunstig dat genoemde positiebepalingsmiddelen akti-35 veerhaar zijn door een aangeboden spatiékarakter en/of een bij een zinsdeel behorend leestekenkarakter.
Een spatiekarakter en/of een bij een zinsdeel behorend leestekenkarakter zijn duidelijk herkenbare grenzen tussen twee woorden.
8200726 EHN 10.287 4 * v ·
Een voorkeursuitvoering van een inrichting volgens de uitvin-......
ding heeft het kenmerk, dat genoemde tweede modifikatie van een toon-hoogtecanponent van het spraakpatroon een binnen de tijdsduur van het spraakpatroon dalende toonhoogte ten opzichte van een gemiddelde toon-5 hcxogteccmponent van het spraakpatroon bevat. Door voor de uitspraak van een laatste letter uit een woord de toonhoogte te doen dalen is deze laatste letter beter te onderscheiden van de overige letters van dat woord waardoor de grens met de overige woorden beter kan worden vastgesteld.
10 Een verdere voorkeursuitvoering van een inrichting volgens de uitvinding heeft het kenmerk, dat genoemde tweede modifikatie van een toonhoogtecomponent van het spraakpatroon een lagere toon ten opzichte van een gemiddelde toonhoogtecomponent van het spraakpatroon bevat.
Door gebruik te maken van een lagere toon voor de uitspraak van de laat-15 ste letter uit een woord is deze laatste letter beter te onderscheiden van de overige letters uit dat woord waardoor de grens net de overige woorden beter kan worden vastgesteld.
Een andere voorkeursuitvoering van een inrichting volgens de uitvinding heeft het kenmerk, dat genoemde tweede modifikatie van de 20 stemkaraktercomponent van het spraakpatroon een verschuiving van de formanten ten opzichte van de representatie van formanten van het spraakpatroon bevat.
Een verschuiving van de formanten, bijvoorbeeld naar een wat zachtere stem, voor de uitspraak van een laatste letter uit een woord 25 maakt dit woord goed onderscheidbaar van de overige- woorden uit de zin.
Het is gunstig- dat de modifikatie van de toonhoogtecomponent binnen een gebied van 1/4 tot 1,5 oktaaf ligt.
Binnen een gebied van 1/4 tot 1,5 oktaaf zijn variaties van toonhoogte goed waarneembaar voor het menselijk oor.
30 De uitvinding zal aan de hand van figuren nader worden toege licht.
Fig. 1 geeft een blokschema van een uitvoeringsvoorbeeld van een inrichting volgens de uitvinding,
Fig. 2 geeft een stroomdiagram van een spraakpreparatieprogram- 35 ma,
Fig. 3 geeft een stroomdiagram van een konmando subprogramma,
Fig. 4 geeft een stroomdiagram van een typ subprogramma, 8200726 PHN 10.287 5 0
Wf ¥
Fig. 1 geeft een blokschema van een uitvoeringsvoorbeeld van— een inrichting volgens de uitvinding. Deze inrichting 1 bevat een microprocessor 2 met daaraan verbonden een databas 7 en een adresbas 8 alsook een klok 14. Deze microprocessor genereert controlesignalen 5 voor de elemental van van de inrichting en behandelt de daarvan afkomstige signalen. Verder selekteert en prepareert de microprocessor spraakgegevens voor de spraakchip 6. pp de databus en de adresbas zijn verder een eerste geheugen 3 ((P)RCM) en een tweede geheugen 4 (RAM) aangesloten. Het eerste geheugen 3 dient voor opslag van programma's 10 door de mlcroprocssor te gebruiken alsook voor het opslaan van spraakgegevens. Het is mogelijk cm in dit eerste geheugen meerdere spelalfa-betten op te slaan zoals bijvoorbeeld het gewone spelalfabet (aa, bê, etc,) alfabetklanken (fonemen) en eventueel ook een alfabetkode (Anna, Bernard, etc.). Het tweede geheugen 4 dient onder meer voor het op-15 slaan van aangeboden informatie welke via een ingangs-uitgangsschake-ling 5 wordt aangeboden. Deze ingangs-uitgangsschakeling is voorzien van een aansluiting voor het aansluiten van een toetsenbord (10) en een printer (15) of een in de handel verkrijgbare typmachine voorzien van een data-aansluitingsbus. De informatie van een ingedrukte 20 toets (een ASCII-karakter bijvoorbeeld) wordt in deze uitvoeringsvorm serieel aan de ingangs-uitgangsschakeling aangeboden. Na elk ontvangen karakter wordt een onderbrekingssignaal naar de microprocessor 2 gestuurd. De inrichting 1 bevat verder een aantal funktietoetsen 11, die verbonden zijn met de ingangs-uitgangsschakeling 5. Carnunicatie tussen 25 deze functietoetsen en de microprocessor geschiedt in dit uitvoer ingsvoorbeeld ook op interrupt basis. Met deze funktietoetsen worden aan een gebruiker bepaalde faciliteiten verstrekt. Deze faciliteiten bevatten onder meer - een oefen/typ toets . Dit kan gebruikt worden door een visueel gehan-30 dicapte typist die een bepaalde toets zoekt. In zgningeschakelde stand zorgt deze toets ervoor dat het ingedrukte karakter niet in het tweede geheugen 4 wordt opgeslagen, maar wel wordt uitgesproken.
- een spraak aan/uit toets cm aan de gebruiker de mogelijkheid te bieden de spraak te onderdrukken indien de gebruiker de spraak niet wenst 35 te horen.
- een karakter/woord/regel-keuzeschakelaar waarbij de mogelijkheid geboden wordt om de spraak hetzij per karakter, hetzij per geheel woord of gehele regel weer te geven.
8200726 PHN 10.287 6 ι' * — - - een herhalingstoets die de positie van de cursor niet doet wijzigen-. - - een vooruit-achteruit-toets waardoor de positie van de cursor door de gebruiker te wijzigen is.
- alfabetkeuzetoets voor de reeds eerder genoemde alfabetkeuze. Deze 5 toets verhindert de toegang tot die adressen van het eerste geheugen waar niet gekozen alfabets zijn opgeslagen.
- spraaksnelheidtoets waarmee de uitspraaksnelheid regelbaar is.
van
Het volume/de spraakweergave wordt geregeld met een bekende potentiometer 9. Een uitgang van de spraakchip 6 is verbonden met een aansluit-10 bus voor het aansluiten van een versterker 12 en een luidspreker of koptelefoon 13. Laatstgenoemde aansluitbus is ook te verbinden met een telefoonlijn waardoor de inrichting ook te gebruiken is als kommunicatiehulpmiddel voor personen met een spraakhandicap.
De spraakchip 6 (PHILIPS MEA 8000), genereert na instelling van een be-15 ginwaarde voor de grondtoon, te weten circa 100-150 Hz voor een mannelijke stem en ca. 200-300 Hz voor een vrouwelijke stem, uit bijvoorbeeld 32 bit spraakdata een spraaksegment (speechframe). Onder grondtoon wordt verstaan de laagste frequentiekomponent die optreedt in het periodiek signaal waaruit de spraak wordt opgebouwd. Het kiezen van 20 deze beginwaarde geschiedt door middel van een bekende toonregelknop welke bijvoorbeeld op een audio versterker wordt aangetroffen. De frequentie van de grondtoon is vastgelegd in de spraakgegevens van de achtereenvolgende spraaksegmenten. De gemiddelde toonhoogte is gebaseerd op deze grondtoon. De duur van zo'n spraaksegment wordt bepaald door de 25 spraakdata zelf: en is bijvoorbeeld 8, 16, 32 of 64 milliseconde. De spraaksnelheid. kan variëren tussen ongeveer 1 tot 15 karakters per seconde waardoor deze weinig hinder geeft voor het halen van een zekere snelheid bij het typen. Bovendien wordt bij elke nieuwe toetsaanslag de lopende spraak afgebroken, waardoor de tijd tussen twee aanslagen 30 · dan ook niet beperkt wordt door de duur van de spraakresponsies. Dit afbreken wordt gerealiseerd door het interrupts ignaal gegenereerd bij · elke toetsaanslag. ,
Fig. 2 geeft een stroomdiagram van een - programma voor het prepareren van spraakgegevens, genaamd preparatieprogramma. In de 35 figuur staat een ruit voor een onderzoekstap en een rechthoek voor een uitvoeringsstap. Deze spraakgegevens worden gegenereerd door spraakinformatie uit het eerste geheugen op te halen en deze aan de spraakchip af te geven die de spraak op zijn beurt afgeeft aan de 8200726 PHN 10 287 7 o - aangesloten weergeefinrlchtlng voor auditieve weergave. Het prepareren -van spraak geschiedt via naamkodes die aangedragen worden door subprogramma's welke verderop zullen worden beschreven. In deze naamkodes wordt cm te beginnen een onderscheid genaakt tussen enerzijds letters 5 en anderzijds niet-letters (IOC). Bij "niet-letters" (101) worden de spraakgegevens uit de in het eerste geheugen opgeslagen algemene spraak-tabel opgehaald. In het geval dat de aangeboden informatie wel een letter is wordt in een volgende stap van het programma de stand van de al-fabetkeuzetoets (102), indien de inrichting hiervan is voorzien, opge-10 vraagd. Afhankelijk van de stand van deze alfabetkeuzetoets wordt uit de bijbehorende tabel, opgeslagen in het eerste geheugen, de bij de aangeboden letter passende spraakdata opgehaald. In de figuur is ter illustratie de keuze tussen spelalfabet (103) en fonetisch alfabet (104) af geheeld. In een volgende programmastap wordt nagegaan of de aangeboden 15 letter een hoofdletter of een kleine letter is (105). Bij het gebruik van ASCII-kode is uit de codering van het karakter zelf te herkennen of het een hoofd- of een kleine letter betreft. In het geval dat het een hoofdletter (106) is dan wordt de beginwaarde (start pitch value) van de grondtoon gewijzigd waardoor deze letter als spraak net een hogere 20 toonhoogte ten opzichte van de gemiddelde waarde wordt gegenereerd.
Onder een hogere toonhoogte ten opzichte van de gemiddelde waarde dient te worden verstaan dat deze hogere toonhoogte in een gebied van 1/4 a 1,5 oktaaf boven de gemiddelde waarde ligt. In een volgende programmastap (107) wordt onderzocht of de gebruiker voor een uitspraak per lettor, 25 per woord of per regel gekozen heeft. Heeft de gebruiker voor een uifcr spraak per letter gekozen dan wordt de letter - op de standaard grondtoon, respektievelijk de verhoogde grondtoon voor hoofdletters uitgesproken. Heeft de gebruiker de optie woord of regel gekozen dan wordt in de volgende prograirmastap onderzocht of het de laatste letter 30 van een woord was (108). De informatie "laatste letter" wordt verstrekt door het verderop te beschrijven kommando subprogramma. Is de aangeboden letter niet de laatste letter dan wordt de letter pp de standaard toonhoogte uitgesproken en blijft de beginwaarde van de grondtoon onveranderd. In het geval dat het wel de laatste letter van een woord was 35 (109), wordt voor elk spraaksegment de verschilwaarde van de grondtoon (picht increment) zodanig aangepast dat deze laatste letter als spraak met een dalende toonhoogte hoorbaar wordt. Onder dalende toonhoogte ten 8200726 EHN 10.287 8 __________opzichte van een gemiddelde waarde dient te worden verstaan dat deze .... .
toonhoogtedaling in een gebied van 1/4 a 1,5 oktaaf per uitgesproken letter ligt. Het zal duidelijk zijn dat de keuze om een hoofdletter met een hogere toon en de laatste letter van een,woord met een dalende 5 toon uit te spréken slechts een uitvoer ingsvorm^s waartoe de uitvinding niet beperkt is. De uitvinding strekt zich ook2tot elke variatie hierop zoals bijvoorbeeld stijgende toonhoogte voor een hoofdletter en dalende toonhoogte voor een laatste letter.
In de volgende prograirmastap (110) wordt nagegaan of de uit de 10 passende tabel in het eerste geheugen opgehaalde spraakdata op een andere dan de standaardsnelheid moet worden uitgesproken.
Deze standaardsnelheid is bijvoorbeeld drie karakters per seconde.
Bij deze gekozen standaardsnelheid is het dan mogelijk de spraaksnel-heid te doen variëren tussen 1 tot 15 karakters per seconde. Ms de 1S snelheidsinstelling anders is dan de standaardsnelheid dan moet bij elk spraaksegment de segmentduur aangepast worden (111).De bewerkte spraakgegevens worden daarna achtereenvolgens in een spraakbuffer opgeslagen, wat tevens de laatste stap van dit programma is (112). Het uitspreken zelf van deze spraakgegevens geschiedt volgens een 20 spraak-programma. Dit spraakprograitma zogb ervoor dat de spraakbuffer in de spraakchip op het juiste moment wordt geladen. De tijd tussen het aanbieden van de spraakdata is afhankelijk van de duur van het spraaksegment. Het laden geschiedt op kcrrmando, bijvoorbeeld interruptbasis van de spraakchip.
25 Zoals reeds bij de beschrijving van fig. 2 is vermeld geschiedt het prepareren van de spraakgegevens door middel van naaitikodés die door suhprogranma's worden aangedragen. In het bijzonder zijn er twee subprogranma's, namelijk een kortmando-suhprogramma en een type-sub-programma.
30 Fig. 3 geeft een stroomdiagram voor een kommandosubprograirma.
De eerste stap (200) van het kontnando subprograirma onderzoekt de aard van het karmando. De kommando's zelf worden gegeven door het indrukken van de hiervóór beschreven funktietoetsen, of van de toetsen van een aangesloten toetsenbord.
35 Er wordt een onderscheid gemaakt tussen twee soorten kommando's, namelijk instelling-kommando bijvoorbeeld alfabetkeuze, spraaksnelheid, en opdracht-kommando's bijvoorbeeld "woord herhalen".
8200726 • ^ PHN 10.287 9
Voor een instellingscarrmando wordt de ins.teU.lng gewijzigd (201)'.' volgens de gekozen manier, waarna (202) met naamkode van de nieuwe instelling naar het preparatie-prograirma wordt overgestapt, (een rechthoek met dubbele vertikale zijden wijst op het overstappen naar een ander programr 5 ma). Het wijzigen van de instelling bevat bijvoorbeeld dat bij een keuze van spelalfabet (met de alfabettoets aangegeven) alleen het . ^ bereik waarbinnen zich het spelalfabet in het eerste geheugen bevindt adresseer baar is.
voor een cpdrachtcammando wordt achtereenvolgens een of meer karakters 10 uit het tweede geheugen opgehaald (203). In de volgende subprogramma-* stap (204) wordt onderzocht of het aangeboden karakter een spatie of eventueel een leesteken is. Met leesteken wordt bedoeld al die tekens die onmiddellijk na een volledig woord volgen zoals een karna, een punt, een vraagteken, een uitroepteken een dubbelpunt en een punt-komma. Is 15 het karakter een spatie of eventueel een leestaken (205) dan was het daarvoor staande karakter de laatste letter. Deze informatie is van belang, zoals vermeld, voor het preparatie-programma. Vervolgens wordt de stand van de spraaktoets opgevraagd (206). Als de spraaktoets in de stand "aan" staat dan worden de naamkodes van de opdrachtnaam (207) 20 en van de opgehaalde karakters (208) naar het preparatieprograirma gebracht. Als de spraaktoets in de stand "uit" staat (209) dan wordt het preparatieprogramma niet aangeroepen. Echter kan het in het bijzonder voor visueel gehandicapte personen prettig zijn gesproken informatie te hebben over het resultaat van een gegeven opdracht zonder dat daarom 25 naar de overige ingetypte karakters hoeft te warden geluisterd. Hiervoor is dan eventueel een bijzondere stap voorzien (210, 208) waarbij alleen het resultaat van de uitgevoerde opdracht wordt uitgesproken zelfs in het geval dat de spraak "uit" staat. Bijvoorbeeld bij een opdracht "herhaal letter" wrdt alleen de betreffende letter uitgesproken.
30 Fig. 4 geeft een stroomdiagram voor een typ-subprogramma
Dit subprogramma wordt aangeroepen nadat een signaal, bijvoorbeeld in ASCII-kode, is ontvangen van een aangesloten toetsenbord of typmachine.
Bij de eerste stap (300) van het typ subprogramma wordt de spraakweer-gave gestopt door een stcpkormando naar de spraakchip over te brengen, 35 ei het spraakbuffer leeg te maken. In een volgende stap (301) wordt onderzocht of het aangeboden signaal een karakter, bijvoorbeeld een letter, of een tekstbewerking, bijvoorbeeld een korrèktie, is. In het geval 8200726 > EHN 10.287 10 ...... dat het aangeboden signaal een karakter is, wordt dit karakter in het tweede geheugen opgeslagen (302). Vervolgens (303) wordt de stand van de spraaktoets opgevraagd. Als de spraak "aan" staat wordt de naamkode van het karakter naar het preparatieprograrana gestuurd (304). Als de spraak 5 "uit" staat wordt het preparatieprograrana niet aangeroepen.
In het geval dat het aangeboden signaal een tekstbewerking is dan wordt deze bewerking in het tweede geheugen uitgevoerd (305). Vervolgens wordt (306) de stand van de spraaktoets opgevraagd. Als de spraak "aan" staat wordt de naamkode van de bewerking en die van het resultaat naar _ 10 het preparatieprogramma gestuurd (307+ 308). Als de spraak "uit" staat (309) wordt het preparatieprograrana niet aangeroepen. Echter is het bij sommige tekstbewerkingen uitgevoerd door visueel gehandicapte personen prettig een gesproken bevestiging te hebben van de uitgevoerde tekstverwerking. Bijvoorbeeld wanneer de tekstbewerking een correctie 15 bevat is het prettig te vernemen welke letter men gecorrigeerd heeft zonder dat daarcm naar alle overige ingetypte letters hoeft te worden geluisterd. Voor een dergelijke implementatie (310) kan dan zelfs bij spraak "uit" alsnog naar het preparatie--’programma worden overgestapt, waar dan het resultaat (308) van de bewerking, bijvoorbeeld 20 de gecorrigeerde letter, naar het preparatieprogramma wordt overgebracht.
Het variëren van de toonhoogte cm een onderscheid te maken tussen enerzijds hoofdletters en kleine letters en anderzijds laatste letters en de overige letters van een woord is natuurlijk slechts één mogelijkheid uit een veelheid van mogelijkheden. Een andere mogelijkheid 25 cm onderscheid te realiseren is het veranderen van het' stonkarakter. Dit wordt op een analoge wijze gerealiseerd als beschreven in het preparatieprograrana . Het stenikarakter wordt veranderd door een bewerking uit te voeren op de formaten, dat zijn voorkeursfrequenties bij spraak. Een spraakpatroon bevat meestal een aantal, bijvoorbeeld vier, forxnan-30 ten. Bij elke van deze frequenties behoort meestal ook een bandbreedte. Verandering van het stemkarakter wordt gerealiseerd door een of meerdere van deze frequenties ten opzichte van de gemiddelde waarde te verschuiven naar een hogere of lagere frequentie.
35 8200726

Claims (11)

  1. 2, Inrichting voor het genereren van de auditieve informatie van een verzameling karakters, welke inrichting een processoreenheid bevat met daaraan verbonden een eerste geheugen voor het opslaan van spraak- 20 gegevens en een tweede geheugen voor het opslaan van aangeboden karakters welke processoreenheid van besturingsmiddelen is voorzien om voor een aangeboden karakter het vormen, op basis van genoemde spraakgegevens, van een spraakpatroon voor een met het eerste geheugen verbonden spraakgenerator te besturen, met het kenmerk, dat de processoreenheid van 25 positiebepalingsmiddelen is voorzien om de positie van ten minste één letter uit een uit aangeboden karakters samengesteld woord te bepalen, en cm voor die genoemde letter een tweede modificatie met behoud van identiteit bij het spraakpatroon aan te brengen, welke tweede modificatie een modificatie van een toonhoogteconponent en/of een stemka-30 rakterccmponent van het spraakpatroon bevat.
  2. 3. Inrichting volgens conclusie 1, met het kenmerk, dat de processoreenheid van positiebepalingsmiddelen is voorzien om de positie van ten minste êén letter uit een uit aangeboden karakters samengesteld woord te bepalen, en om voor die genoemde letter een tweede modificatie 35 met behoud van identiteit bij het spraakpatroon aan te brengen, welke tweede modificatie een modificatie van een toonhoogteccnponent en/of een stemkarakter component van het spraakpatroon bevat. 8200726 PHN 10.287 12 > *
  3. 4. Inrichting volgens conclusie 1 of 3, met het kenmerk, dat genoemde eerste modificatie van een tconhoogtecaiponent van het spraak-patroon een hogere toon ten opzichte van een gemiddelde toonhoogtecorapo-. nent voor de karakters van de eerste deelverzameling bevat.
  4. 5. Inrichting volgens conclusie 1 of 3, met het kenmerk, dat genoemde eerste modificatie van een toonhoogtecarponent van het spraak-patroon een binnen de tijdsduur van dat spraakpatroon stijgende toonhoogte ten opzichte van een gemiddelde toonhoogtecaiponent voor de karakters van de eerste deelverzameling bevat.
  5. 6. Inrichting volgens conclusie 1 of 3, met het kenmerk, dat genoemde eerste modificatie van de stenkarakterccmponent van het spraakpatroon een verschuiving van de formanten ten opzichte van de representatie van formanten voor de karakters van de eerste deelverzaïieling bevat.
  6. 7. Inrichting volgens conclusie 2 of 3# met het kenmerk, dat genoemde letter de laatste letter van een uit aangeboden "karakters samengesteld woord is.
  7. 8. Inrichting volgens conclusie 2, 3 of 7, met het kenmerk, dat genoemde positiebepalingsmiddelen aktiveerbaar zijn door een aangeboden 20 spatiekarakter en/of een bij een zinsdeel behorend leestekenkarakter.
  8. 9. Inrichting volgens conclusie 2,—3-r-7-QiL 8, net het kennerk, dat genoemde tweede modifikatie van een toonhoogteccmponent van het spraakpatroon een binnen de tijdsduur van dat spraakpatroon dalende toonhoogte ten opzichte van een gemiddelde toonhoogteccmponent van 25 het spraakpatroon bevat.
  9. 10. Inrichting volgens conclusie 2, 3/ 7 of 8, met het kenmerk, dat genoemde tweede modif ikatie van een toonhoogteccmponent van het spraakpatroon een lagere toon ten opzichte van een gemiddelde toonhoogte component van het spraakpatroon bevat.
  10. 11. Inrichting volgens conclusie 2, 3, 7 of 8, met het.kenmerk, dat genoemde tweede modif ikatie van de stemkaraktercauponent van het spraakpatroon een verschuiving van de formanten ten opzichte van de representatie van formanten van het spraakpatroon bevat.
  11. 12. Inrichting volgens êên der conclusies 4, 5, 9 of 10, net het 35 kenmerk, dat de modif ikatie van de toonhoogteccmponent binnen een gebied van 1/4 tot 1,5 oktaaf ligt. — 13. Typ machine voorzien van een inrichting volgens één der voor gaande conclusies. 8200726
NL8200726A 1982-02-24 1982-02-24 Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. NL8200726A (nl)

Priority Applications (6)

Application Number Priority Date Filing Date Title
NL8200726A NL8200726A (nl) 1982-02-24 1982-02-24 Inrichting voor het genereren van de auditieve informatie van een verzameling karakters.
EP83200244A EP0087199B1 (en) 1982-02-24 1983-02-17 Device for generating audio information of individual characters
DE8383200244T DE3364818D1 (en) 1982-02-24 1983-02-17 Device for generating audio information of individual characters
JP58028655A JPS58157000A (ja) 1982-02-24 1983-02-24 文字―音声変換装置
US06/821,112 US4689817A (en) 1982-02-24 1986-01-17 Device for generating the audio information of a set of characters
US07/035,103 US4783810A (en) 1982-02-24 1987-04-06 Device for generating the audio information of a set of characters

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL8200726 1982-02-24
NL8200726A NL8200726A (nl) 1982-02-24 1982-02-24 Inrichting voor het genereren van de auditieve informatie van een verzameling karakters.

Publications (1)

Publication Number Publication Date
NL8200726A true NL8200726A (nl) 1983-09-16

Family

ID=19839308

Family Applications (1)

Application Number Title Priority Date Filing Date
NL8200726A NL8200726A (nl) 1982-02-24 1982-02-24 Inrichting voor het genereren van de auditieve informatie van een verzameling karakters.

Country Status (5)

Country Link
US (2) US4689817A (nl)
EP (1) EP0087199B1 (nl)
JP (1) JPS58157000A (nl)
DE (1) DE3364818D1 (nl)
NL (1) NL8200726A (nl)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0642158B2 (ja) * 1983-11-01 1994-06-01 日本電気株式会社 音声合成装置
US4872202A (en) * 1984-09-14 1989-10-03 Motorola, Inc. ASCII LPC-10 conversion
JPS61252596A (ja) * 1985-05-02 1986-11-10 株式会社日立製作所 文字音声通信方式及び装置
JPH0833744B2 (ja) * 1986-01-09 1996-03-29 株式会社東芝 音声合成装置
JPS6488599A (en) * 1987-09-30 1989-04-03 Matsushita Electric Ind Co Ltd Voice synthesizer
ATE102731T1 (de) * 1988-11-23 1994-03-15 Digital Equipment Corp Namenaussprache durch einen synthetisator.
US5278943A (en) * 1990-03-23 1994-01-11 Bright Star Technology, Inc. Speech animation and inflection system
KR920008259B1 (ko) * 1990-03-31 1992-09-25 주식회사 금성사 포만트의 선형전이구간 분할에 의한 한국어 합성방법
US5188533B1 (en) * 1990-06-01 1997-09-09 Leapfrog Rbt Llc Speech synthesizing indicia for interactive learning
JP3070127B2 (ja) * 1991-05-07 2000-07-24 株式会社明電舎 音声合成装置のアクセント成分制御方式
DE69230815T2 (de) * 1991-07-11 2000-11-02 Koninkl Philips Electronics Nv Medien Handhabungssystem
DE4204929A1 (de) * 1992-02-19 1993-08-26 Sel Alcatel Ag Digitales sprachspeichersystem fuer ein telekommunikationssystem
US5325462A (en) * 1992-08-03 1994-06-28 International Business Machines Corporation System and method for speech synthesis employing improved formant composition
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
US5813861A (en) * 1994-02-23 1998-09-29 Knowledge Kids Enterprises, Inc. Talking phonics interactive learning device
JPH098752A (ja) * 1995-06-26 1997-01-10 Matsushita Electric Ind Co Ltd 多重情報受信装置及びナビゲーション装置
US5761640A (en) * 1995-12-18 1998-06-02 Nynex Science & Technology, Inc. Name and address processor
US5983182A (en) * 1996-01-02 1999-11-09 Moore; Steven Jerome Apparatus and method for producing audible labels in multiple languages
US5832433A (en) * 1996-06-24 1998-11-03 Nynex Science And Technology, Inc. Speech synthesis method for operator assistance telecommunications calls comprising a plurality of text-to-speech (TTS) devices
US5899975A (en) * 1997-04-03 1999-05-04 Sun Microsystems, Inc. Style sheets for speech-based presentation of web pages
US20050011378A1 (en) * 2002-12-27 2005-01-20 Leapfrog Enterprises, Inc. Audio producing stamping apparatus
US7991613B2 (en) * 2006-09-29 2011-08-02 Verint Americas Inc. Analyzing audio components and generating text with integrated additional session information

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR1602936A (nl) * 1968-12-31 1971-02-22
US4060848A (en) * 1970-12-28 1977-11-29 Gilbert Peter Hyatt Electronic calculator system having audio messages for operator interaction
CH622766A5 (en) * 1976-10-26 1981-04-30 Labofina Sa Process for the preparation of terephthalic acid
JPH0116160Y2 (nl) * 1979-09-14 1989-05-12
JPS5667470A (en) * 1979-11-07 1981-06-06 Canon Inc Voice desk-top calculator
JPS56153394A (en) * 1980-04-30 1981-11-27 Nippon Telegraph & Telephone Character voice converting system

Also Published As

Publication number Publication date
EP0087199A1 (en) 1983-08-31
US4783810A (en) 1988-11-08
DE3364818D1 (en) 1986-09-04
JPH045197B2 (nl) 1992-01-30
JPS58157000A (ja) 1983-09-19
US4689817A (en) 1987-08-25
EP0087199B1 (en) 1986-07-30

Similar Documents

Publication Publication Date Title
NL8200726A (nl) Inrichting voor het genereren van de auditieve informatie van een verzameling karakters.
AU623629B2 (en) Voice language translator
US7454345B2 (en) Word or collocation emphasizing voice synthesizer
JP4570176B2 (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
US8527281B2 (en) Method and apparatus for sculpting synthesized speech
JP3880163B2 (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
US5615300A (en) Text-to-speech synthesis with controllable processing time and speech quality
US7912716B2 (en) Generating words and names using N-grams of phonemes
JPH06175679A (ja) 音声認識用コンピュータ・システム
JPH09265299A (ja) テキスト読み上げ装置
JPH11109991A (ja) マンマシンインターフェースシステム
JPH10171485A (ja) 音声合成装置
JPH08272388A (ja) 音声合成装置及びその方法
JPH07160289A (ja) 音声認識方法及び装置
JP7036483B1 (ja) プログラム、情報処理装置及び情報処理方法
Lee Sound and Structure in the Gospel of Matthew
JP2547611B2 (ja) 文章作成システム
Grønnum Danish Vowels–Surface Contrast versus Underlying Form
JPH0560880B2 (nl)
JPH06231124A (ja) 音声変換システム
JPH04177526A (ja) 文章読み上げ装置
JPH01161296A (ja) 音声認識システム
JPS607587A (ja) パターン認識装置
JPS62154022A (ja) 音声タイプライタ
JPH0442363A (ja) 携帯型音声認識電子辞書

Legal Events

Date Code Title Description
A1B A search report has been drawn up
A85 Still pending on 85-01-01
BV The patent application has lapsed