FI91925B - Förfarande för identifiering av en talare - Google Patents
Förfarande för identifiering av en talare Download PDFInfo
- Publication number
- FI91925B FI91925B FI912088A FI912088A FI91925B FI 91925 B FI91925 B FI 91925B FI 912088 A FI912088 A FI 912088A FI 912088 A FI912088 A FI 912088A FI 91925 B FI91925 B FI 91925B
- Authority
- FI
- Finland
- Prior art keywords
- model
- speaker
- lossless tube
- calculated
- cross
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005311 autocorrelation function Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims 1
- 230000001755 vocal effect Effects 0.000 abstract 2
- 210000003800 pharynx Anatomy 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000000088 lip Anatomy 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Analogue/Digital Conversion (AREA)
- Complex Calculations (AREA)
- Telephonic Communication Services (AREA)
- Image Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Electrophonic Musical Instruments (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Claims (7)
1. Förfarande för identifiering av en talare, vilket förfarande omfattar en jämförelse av en modell som uträk- 5 nats p& basis av prov tagna pä en talsignal med en lagrad modell för ätminstone en känd talare, känneteck-n a t av att medeltalen för tvärsnittsareor eller övriga tvärsnittsmätt hos de delar av ett förlustfritt rör som utgör en modell för talarens ljudkanal, vilka uträknats p& 10 basis av talsignalproven, jämförs med motsvarande medeltal för delar av en lagrad 1judkanalsmodell för ätminstone en känd talare.
2. Förfarande enligt patentkrav 1, vilket omfattar a) gruppering av prov tagna pä talsignalen i ramar 15 som innehiller M stycken prov, b) uträkning av värden för en förutbestämd autokor-relationsfunktion eller motsvarande funktion pä basis av ramens prov, c) uträkning av ref lexionskoef f icienter rekursivt pä 20 basis av värdena för autokorrelationsfunktionen eller motsvarande funktion, d) jämförelse av uträknade parametrar med motsvarande i minnet lagrade parametrar för ätminstone en känd talare genom att utnyttja reflexionskoefficienterna, 25 kännetecknat av att i steg d) uträknas pä basis av ramens reflexionskoeffierenter arean för varje cylinderdel i det förlustfria röret som utgör en modell för talarens ljudkanal i de cylindriska delarna, ? 30 upprepas uträkningen av nämnda areor med N stycken ramar och uträknas medeltalet av de sälunda erhällna areor-na skilt för varje cylinderdel, och jämförs de sälunda uträknade medelareorna med medel-areorna för ätminstone en känd talares cylinderdelar av en 35 lagrad modell. 91925
3. Förfarande enligt patentkrav 1 eller 2, k ä n -netecknat av att extremvärdet för varje cylinder-dels area bestäms under N ramar, och cylinderdelarnas medel- och maximiareor jämförs med cylinderdelarns medel- 5 och maximiareor för ätminstone en känd talares lagrade 1judkanalsmodell.
4. Förfarande enligt patentkrav 1, 2 eller 3, k ä n-netecknat av att medeltvärsnittsmätten för cylin-derdelarna i det förlustfria röret som utgör en modell för 10 talarens ljudkanal utgörs av medeltalen för de momentana tvärsnittsmätt hos cylinderdelarna i det förlustfria rörets modeller som bildats under ett visst ljud.
5. Förfarande enligt patentkrav 4, kanne-tecknat av att medeltalen för tvärsnittsmitten hos 15 cylinderdelarna i det förlustfria rörets modell uträknas skilt för ätminstone tvä olika ljud, varje ljuds medeltal för cylinderdelarna i det förlustfria rörets modell jämförs med den kända talarens mot-svarande ljuds tvärsnittsmätt hos cylinderdelarna i det 20 lagrade förlustfria rörets modell, och talaren identifieras s&vida det förlustfria rörets modell, uträknat pä tillräckligt mänga ljud, korrelerar tillräckligt exakt med motsvarande lagrade förlustfria rörs modell. 25
6. Förfarande enligt patentkrav 4 eller 5, k ä n - netecknat av att den av talsignaler bildade momentana modellen av det förlustfria röret identifieras tili att motsvara ett visst ljud, sävida tvärsnittsmättet av varje del i den momentana modellen av det förlustfria röret 30 ligger inom de förutbestämda gränsvärden för ett motsvarande ljud vilka lagrats i en kvantiseringstabell.
7. Förfarande enligt patentkrav 4, 5 eller 6, k ä n-netecknat av att nämnda ljud är vokaler och/eller konsonanter.
Priority Applications (9)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FI912088A FI91925C (sv) | 1991-04-30 | 1991-04-30 | Förfarande för identifiering av en talare |
| JP50856192A JP3184525B2 (ja) | 1991-04-30 | 1992-04-29 | 話者認識方法 |
| AU16530/92A AU653811B2 (en) | 1991-04-30 | 1992-04-29 | Speaker recognition method |
| AT92909205T ATE140552T1 (de) | 1991-04-30 | 1992-04-29 | Verfahren zur sprechererkennung |
| EP92909205A EP0537316B1 (en) | 1991-04-30 | 1992-04-29 | Speaker recognition method |
| DE69212261T DE69212261T2 (de) | 1991-04-30 | 1992-04-29 | Verfahren zur sprechererkennung |
| PCT/FI1992/000128 WO1992020064A1 (en) | 1991-04-30 | 1992-04-29 | Speaker recognition method |
| NO924782A NO306965B1 (no) | 1991-04-30 | 1992-12-10 | Fremgangsmåte for gjenkjennelse av en taler |
| US08/387,623 US5522013A (en) | 1991-04-30 | 1995-02-13 | Method for speaker recognition using a lossless tube model of the speaker's |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FI912088 | 1991-04-30 | ||
| FI912088A FI91925C (sv) | 1991-04-30 | 1991-04-30 | Förfarande för identifiering av en talare |
Publications (4)
| Publication Number | Publication Date |
|---|---|
| FI912088A0 FI912088A0 (sv) | 1991-04-30 |
| FI912088L FI912088L (sv) | 1992-10-31 |
| FI91925B true FI91925B (sv) | 1994-05-13 |
| FI91925C FI91925C (sv) | 1994-08-25 |
Family
ID=8532415
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FI912088A FI91925C (sv) | 1991-04-30 | 1991-04-30 | Förfarande för identifiering av en talare |
Country Status (8)
| Country | Link |
|---|---|
| EP (1) | EP0537316B1 (sv) |
| JP (1) | JP3184525B2 (sv) |
| AT (1) | ATE140552T1 (sv) |
| AU (1) | AU653811B2 (sv) |
| DE (1) | DE69212261T2 (sv) |
| FI (1) | FI91925C (sv) |
| NO (1) | NO306965B1 (sv) |
| WO (1) | WO1992020064A1 (sv) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FI96246C (sv) * | 1993-02-04 | 1996-05-27 | Nokia Telecommunications Oy | Förfarande för sändning och mottagande av kodat tal |
| FI96247C (sv) * | 1993-02-12 | 1996-05-27 | Nokia Telecommunications Oy | Förfarande för att omvandla tal |
| JP4556028B2 (ja) * | 2005-11-04 | 2010-10-06 | 株式会社国際電気通信基礎技術研究所 | 発話主体同定装置及びコンピュータプログラム |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA1334868C (en) * | 1987-04-14 | 1995-03-21 | Norio Suda | Sound synthesizing method and apparatus |
| FR2632725B1 (fr) * | 1988-06-14 | 1990-09-28 | Centre Nat Rech Scient | Procede et dispositif d'analyse, synthese, codage de la parole |
| US5054082A (en) * | 1988-06-30 | 1991-10-01 | Motorola, Inc. | Method and apparatus for programming devices to recognize voice commands |
-
1991
- 1991-04-30 FI FI912088A patent/FI91925C/sv active
-
1992
- 1992-04-29 EP EP92909205A patent/EP0537316B1/en not_active Expired - Lifetime
- 1992-04-29 AT AT92909205T patent/ATE140552T1/de not_active IP Right Cessation
- 1992-04-29 WO PCT/FI1992/000128 patent/WO1992020064A1/en not_active Ceased
- 1992-04-29 AU AU16530/92A patent/AU653811B2/en not_active Ceased
- 1992-04-29 DE DE69212261T patent/DE69212261T2/de not_active Expired - Fee Related
- 1992-04-29 JP JP50856192A patent/JP3184525B2/ja not_active Expired - Fee Related
- 1992-12-10 NO NO924782A patent/NO306965B1/no not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| NO924782L (no) | 1993-02-26 |
| DE69212261D1 (de) | 1996-08-22 |
| EP0537316B1 (en) | 1996-07-17 |
| NO306965B1 (no) | 2000-01-17 |
| FI912088A0 (sv) | 1991-04-30 |
| EP0537316A1 (en) | 1993-04-21 |
| NO924782D0 (no) | 1992-12-10 |
| FI91925C (sv) | 1994-08-25 |
| JPH05508242A (ja) | 1993-11-18 |
| DE69212261T2 (de) | 1997-02-20 |
| AU653811B2 (en) | 1994-10-13 |
| JP3184525B2 (ja) | 2001-07-09 |
| ATE140552T1 (de) | 1996-08-15 |
| AU1653092A (en) | 1992-12-21 |
| WO1992020064A1 (en) | 1992-11-12 |
| FI912088L (sv) | 1992-10-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU8227798A (en) | Method and apparatus for speech enhancement in a speech communication system | |
| FI96247B (sv) | Förfarande för att omvandla tal | |
| KR100216018B1 (ko) | 배경음을 엔코딩 및 디코딩하는 방법 및 장치 | |
| US5522013A (en) | Method for speaker recognition using a lossless tube model of the speaker's | |
| US6915257B2 (en) | Method and apparatus for speech coding with voiced/unvoiced determination | |
| FI91925B (sv) | Förfarande för identifiering av en talare | |
| KR100291584B1 (ko) | 피치 구간별 fo/f1률의 유사성에 의한 음성파형 압축방법 | |
| JPH1097274A (ja) | 話者認識方法及び装置 | |
| KR100399057B1 (ko) | 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법 | |
| GB2343822A (en) | Using LSP to alter frequency characteristics of speech | |
| JPH1097288A (ja) | 背景雑音除去装置及び音声認識装置 | |
| KR100647291B1 (ko) | 음성의 특징을 이용한 음성 다이얼링 장치 및 방법 | |
| KR100278640B1 (ko) | 이동 전화기를 위한 음성 다이얼링 장치 및방법 | |
| KR100322704B1 (ko) | 음성신호의지속시간변경방법 | |
| Krebber | Prediction of speech transmission quality of wideband and narrow‐band telephone handsets using short‐time sub‐band analysis and psychoacoustic models | |
| JPS6054000A (ja) | 音声の有声・無声判定方法 | |
| HK1015183B (en) | Method and apparatus for encoding/decoding of background sounds |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| HC | Name/ company changed in application |
Owner name: NOKIA TELECOMMUNICATIONS OY |
|
| BB | Publication of examined application |