FI91925B - Förfarande för identifiering av en talare - Google Patents

Förfarande för identifiering av en talare Download PDF

Info

Publication number
FI91925B
FI91925B FI912088A FI912088A FI91925B FI 91925 B FI91925 B FI 91925B FI 912088 A FI912088 A FI 912088A FI 912088 A FI912088 A FI 912088A FI 91925 B FI91925 B FI 91925B
Authority
FI
Finland
Prior art keywords
model
speaker
lossless tube
calculated
cross
Prior art date
Application number
FI912088A
Other languages
English (en)
Finnish (fi)
Other versions
FI912088A0 (sv
FI91925C (sv
FI912088L (sv
Inventor
Marko Vaenskae
Original Assignee
Nokia Telecommunications Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Telecommunications Oy filed Critical Nokia Telecommunications Oy
Publication of FI912088A0 publication Critical patent/FI912088A0/sv
Priority to FI912088A priority Critical patent/FI91925C/sv
Priority to EP92909205A priority patent/EP0537316B1/en
Priority to AU16530/92A priority patent/AU653811B2/en
Priority to AT92909205T priority patent/ATE140552T1/de
Priority to JP50856192A priority patent/JP3184525B2/ja
Priority to DE69212261T priority patent/DE69212261T2/de
Priority to PCT/FI1992/000128 priority patent/WO1992020064A1/en
Publication of FI912088L publication Critical patent/FI912088L/sv
Priority to NO924782A priority patent/NO306965B1/no
Application granted granted Critical
Publication of FI91925B publication Critical patent/FI91925B/sv
Publication of FI91925C publication Critical patent/FI91925C/sv
Priority to US08/387,623 priority patent/US5522013A/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Analogue/Digital Conversion (AREA)
  • Complex Calculations (AREA)
  • Telephonic Communication Services (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Claims (7)

1. Förfarande för identifiering av en talare, vilket förfarande omfattar en jämförelse av en modell som uträk- 5 nats p& basis av prov tagna pä en talsignal med en lagrad modell för ätminstone en känd talare, känneteck-n a t av att medeltalen för tvärsnittsareor eller övriga tvärsnittsmätt hos de delar av ett förlustfritt rör som utgör en modell för talarens ljudkanal, vilka uträknats p& 10 basis av talsignalproven, jämförs med motsvarande medeltal för delar av en lagrad 1judkanalsmodell för ätminstone en känd talare.
2. Förfarande enligt patentkrav 1, vilket omfattar a) gruppering av prov tagna pä talsignalen i ramar 15 som innehiller M stycken prov, b) uträkning av värden för en förutbestämd autokor-relationsfunktion eller motsvarande funktion pä basis av ramens prov, c) uträkning av ref lexionskoef f icienter rekursivt pä 20 basis av värdena för autokorrelationsfunktionen eller motsvarande funktion, d) jämförelse av uträknade parametrar med motsvarande i minnet lagrade parametrar för ätminstone en känd talare genom att utnyttja reflexionskoefficienterna, 25 kännetecknat av att i steg d) uträknas pä basis av ramens reflexionskoeffierenter arean för varje cylinderdel i det förlustfria röret som utgör en modell för talarens ljudkanal i de cylindriska delarna, ? 30 upprepas uträkningen av nämnda areor med N stycken ramar och uträknas medeltalet av de sälunda erhällna areor-na skilt för varje cylinderdel, och jämförs de sälunda uträknade medelareorna med medel-areorna för ätminstone en känd talares cylinderdelar av en 35 lagrad modell. 91925
3. Förfarande enligt patentkrav 1 eller 2, k ä n -netecknat av att extremvärdet för varje cylinder-dels area bestäms under N ramar, och cylinderdelarnas medel- och maximiareor jämförs med cylinderdelarns medel- 5 och maximiareor för ätminstone en känd talares lagrade 1judkanalsmodell.
4. Förfarande enligt patentkrav 1, 2 eller 3, k ä n-netecknat av att medeltvärsnittsmätten för cylin-derdelarna i det förlustfria röret som utgör en modell för 10 talarens ljudkanal utgörs av medeltalen för de momentana tvärsnittsmätt hos cylinderdelarna i det förlustfria rörets modeller som bildats under ett visst ljud.
5. Förfarande enligt patentkrav 4, kanne-tecknat av att medeltalen för tvärsnittsmitten hos 15 cylinderdelarna i det förlustfria rörets modell uträknas skilt för ätminstone tvä olika ljud, varje ljuds medeltal för cylinderdelarna i det förlustfria rörets modell jämförs med den kända talarens mot-svarande ljuds tvärsnittsmätt hos cylinderdelarna i det 20 lagrade förlustfria rörets modell, och talaren identifieras s&vida det förlustfria rörets modell, uträknat pä tillräckligt mänga ljud, korrelerar tillräckligt exakt med motsvarande lagrade förlustfria rörs modell. 25
6. Förfarande enligt patentkrav 4 eller 5, k ä n - netecknat av att den av talsignaler bildade momentana modellen av det förlustfria röret identifieras tili att motsvara ett visst ljud, sävida tvärsnittsmättet av varje del i den momentana modellen av det förlustfria röret 30 ligger inom de förutbestämda gränsvärden för ett motsvarande ljud vilka lagrats i en kvantiseringstabell.
7. Förfarande enligt patentkrav 4, 5 eller 6, k ä n-netecknat av att nämnda ljud är vokaler och/eller konsonanter.
FI912088A 1991-04-30 1991-04-30 Förfarande för identifiering av en talare FI91925C (sv)

Priority Applications (9)

Application Number Priority Date Filing Date Title
FI912088A FI91925C (sv) 1991-04-30 1991-04-30 Förfarande för identifiering av en talare
JP50856192A JP3184525B2 (ja) 1991-04-30 1992-04-29 話者認識方法
AU16530/92A AU653811B2 (en) 1991-04-30 1992-04-29 Speaker recognition method
AT92909205T ATE140552T1 (de) 1991-04-30 1992-04-29 Verfahren zur sprechererkennung
EP92909205A EP0537316B1 (en) 1991-04-30 1992-04-29 Speaker recognition method
DE69212261T DE69212261T2 (de) 1991-04-30 1992-04-29 Verfahren zur sprechererkennung
PCT/FI1992/000128 WO1992020064A1 (en) 1991-04-30 1992-04-29 Speaker recognition method
NO924782A NO306965B1 (no) 1991-04-30 1992-12-10 Fremgangsmåte for gjenkjennelse av en taler
US08/387,623 US5522013A (en) 1991-04-30 1995-02-13 Method for speaker recognition using a lossless tube model of the speaker's

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI912088 1991-04-30
FI912088A FI91925C (sv) 1991-04-30 1991-04-30 Förfarande för identifiering av en talare

Publications (4)

Publication Number Publication Date
FI912088A0 FI912088A0 (sv) 1991-04-30
FI912088L FI912088L (sv) 1992-10-31
FI91925B true FI91925B (sv) 1994-05-13
FI91925C FI91925C (sv) 1994-08-25

Family

ID=8532415

Family Applications (1)

Application Number Title Priority Date Filing Date
FI912088A FI91925C (sv) 1991-04-30 1991-04-30 Förfarande för identifiering av en talare

Country Status (8)

Country Link
EP (1) EP0537316B1 (sv)
JP (1) JP3184525B2 (sv)
AT (1) ATE140552T1 (sv)
AU (1) AU653811B2 (sv)
DE (1) DE69212261T2 (sv)
FI (1) FI91925C (sv)
NO (1) NO306965B1 (sv)
WO (1) WO1992020064A1 (sv)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI96246C (sv) * 1993-02-04 1996-05-27 Nokia Telecommunications Oy Förfarande för sändning och mottagande av kodat tal
FI96247C (sv) * 1993-02-12 1996-05-27 Nokia Telecommunications Oy Förfarande för att omvandla tal
JP4556028B2 (ja) * 2005-11-04 2010-10-06 株式会社国際電気通信基礎技術研究所 発話主体同定装置及びコンピュータプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1334868C (en) * 1987-04-14 1995-03-21 Norio Suda Sound synthesizing method and apparatus
FR2632725B1 (fr) * 1988-06-14 1990-09-28 Centre Nat Rech Scient Procede et dispositif d'analyse, synthese, codage de la parole
US5054082A (en) * 1988-06-30 1991-10-01 Motorola, Inc. Method and apparatus for programming devices to recognize voice commands

Also Published As

Publication number Publication date
NO924782L (no) 1993-02-26
DE69212261D1 (de) 1996-08-22
EP0537316B1 (en) 1996-07-17
NO306965B1 (no) 2000-01-17
FI912088A0 (sv) 1991-04-30
EP0537316A1 (en) 1993-04-21
NO924782D0 (no) 1992-12-10
FI91925C (sv) 1994-08-25
JPH05508242A (ja) 1993-11-18
DE69212261T2 (de) 1997-02-20
AU653811B2 (en) 1994-10-13
JP3184525B2 (ja) 2001-07-09
ATE140552T1 (de) 1996-08-15
AU1653092A (en) 1992-12-21
WO1992020064A1 (en) 1992-11-12
FI912088L (sv) 1992-10-31

Similar Documents

Publication Publication Date Title
AU8227798A (en) Method and apparatus for speech enhancement in a speech communication system
FI96247B (sv) Förfarande för att omvandla tal
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
US5522013A (en) Method for speaker recognition using a lossless tube model of the speaker's
US6915257B2 (en) Method and apparatus for speech coding with voiced/unvoiced determination
FI91925B (sv) Förfarande för identifiering av en talare
KR100291584B1 (ko) 피치 구간별 fo/f1률의 유사성에 의한 음성파형 압축방법
JPH1097274A (ja) 話者認識方法及び装置
KR100399057B1 (ko) 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
GB2343822A (en) Using LSP to alter frequency characteristics of speech
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置
KR100647291B1 (ko) 음성의 특징을 이용한 음성 다이얼링 장치 및 방법
KR100278640B1 (ko) 이동 전화기를 위한 음성 다이얼링 장치 및방법
KR100322704B1 (ko) 음성신호의지속시간변경방법
Krebber Prediction of speech transmission quality of wideband and narrow‐band telephone handsets using short‐time sub‐band analysis and psychoacoustic models
JPS6054000A (ja) 音声の有声・無声判定方法
HK1015183B (en) Method and apparatus for encoding/decoding of background sounds

Legal Events

Date Code Title Description
HC Name/ company changed in application

Owner name: NOKIA TELECOMMUNICATIONS OY

BB Publication of examined application