RU2015118431A - Устройство и способ распознавания речи - Google Patents
Устройство и способ распознавания речи Download PDFInfo
- Publication number
- RU2015118431A RU2015118431A RU2015118431A RU2015118431A RU2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A
- Authority
- RU
- Russia
- Prior art keywords
- user
- speech
- profile
- processing
- memory unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 3
- 230000005236 sound signal Effects 0.000 claims abstract 9
- 230000005540 biological transmission Effects 0.000 claims abstract 2
- 230000006866 deterioration Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
- G10L15/075—Adaptation to the speaker supervised, i.e. under machine guidance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Child & Adolescent Psychology (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Lock And Its Accessories (AREA)
Abstract
1. Устройство для распознавания речи с блоком обработки для обработки звуковых сигналов от пользователя на основании речевого профиля, соответствующего этому пользователю, выполненное с возможностью:сохранять речевой профиль пользователя во внешнем блоке памяти, предназначенном только для этого пользователя и расположенном вне блока обработки, иавтоматически извлекать речевой профиль пользователя, сохраненный во внешнем блоке памяти, при каждом повторном включении устройства, после чего автоматически извлеченный речевой профиль пользователя передается в блок обработки для использования в обработке последующих звуковых сигналов от пользователя.2. Устройство по п. 1, которое предназначено для распознавания речи в транспортном средстве.3. Устройство по п. 1, в котором блок памяти, предназначенный пользователю, расположен в мобильном и портативном запоминающем устройстве.4. Устройство по п. 3, в котором блок памяти, предназначенный пользователю, расположен в ключе (2) зажигания или брелоке, или браслете (3).5. Устройство по п. 1 или 3, в котором блок памяти, предназначенный пользователю, представляет собой область памяти «облачной памяти» (4).6. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи беспроводной передачи данных.7. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи криптографической защиты.8. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять автоматическую корректировку речевого профиля пользователя в
Claims (13)
1. Устройство для распознавания речи с блоком обработки для обработки звуковых сигналов от пользователя на основании речевого профиля, соответствующего этому пользователю, выполненное с возможностью:
сохранять речевой профиль пользователя во внешнем блоке памяти, предназначенном только для этого пользователя и расположенном вне блока обработки, и
автоматически извлекать речевой профиль пользователя, сохраненный во внешнем блоке памяти, при каждом повторном включении устройства, после чего автоматически извлеченный речевой профиль пользователя передается в блок обработки для использования в обработке последующих звуковых сигналов от пользователя.
2. Устройство по п. 1, которое предназначено для распознавания речи в транспортном средстве.
3. Устройство по п. 1, в котором блок памяти, предназначенный пользователю, расположен в мобильном и портативном запоминающем устройстве.
4. Устройство по п. 3, в котором блок памяти, предназначенный пользователю, расположен в ключе (2) зажигания или брелоке, или браслете (3).
5. Устройство по п. 1 или 3, в котором блок памяти, предназначенный пользователю, представляет собой область памяти «облачной памяти» (4).
6. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи беспроводной передачи данных.
7. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи криптографической защиты.
8. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять автоматическую корректировку речевого профиля пользователя в соответствии с текущей речевой моделью пользователя.
9. Устройство по п. 1, которое дополнительно выполнено с возможностью корректировать речевой профиль пользователя, переданного в блок обработки для использования в обработке последующих звуковых сигналов от пользователя с учетом его приобретенного текущего состояния.
10. Устройство по п. 1, которое дополнительно выполнено с возможностью корректировать речевой профиль пользователя, переданного в блок обработки для использования в обработке последующих звуковых сигналов от пользователя, в случае, если во время обработки звуковых сигналов от пользователя выявлено ухудшение различимости последовательных фонем и (или) снижение доли распознавания фонем.
11. Устройство по п. 1, которое дополнительно выполнено с возможностью вызывать генерирование предупреждающего сигнала на основании отклонения между речевым профилем пользователя, сохраненным во внешнем блоке памяти, и текущей речевой моделью пользователя.
12. Способ распознавания речи с помощью устройства для обработки, предназначенного для обработки звуковых сигналов от пользователя на основании речевого профиля, соответствующего этому пользователю, в котором:
сохраняют речевой профиль пользователя во внешнем блоке памяти, предназначенном только для этого пользователя и расположенном вне блока обработки, и
автоматически извлекают речевой профиль пользователя, сохраненный во внешнем блоке памяти, при каждом повторном включении устройства, после чего автоматически извлеченный речевой профиль пользователя передается в блок обработки для использования в обработке последующих звуковых сигналов от пользователя.
13. Способ по п. 12, который предназначен для использования в транспортном средстве.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102014209358.9A DE102014209358A1 (de) | 2014-05-16 | 2014-05-16 | Vorrichtung und Verfahren zur Spracherkennung, insbesondere in einem Fahrzeug |
DE102014209358.9 | 2014-05-16 |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2015118431A true RU2015118431A (ru) | 2016-12-10 |
RU2015118431A3 RU2015118431A3 (ru) | 2018-12-26 |
RU2698773C2 RU2698773C2 (ru) | 2019-08-29 |
Family
ID=53015650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015118431A RU2698773C2 (ru) | 2014-05-16 | 2015-05-18 | Устройство и способ распознавания речи |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150332671A1 (ru) |
EP (1) | EP2945155A1 (ru) |
CN (1) | CN105096948A (ru) |
DE (1) | DE102014209358A1 (ru) |
RU (1) | RU2698773C2 (ru) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10896673B1 (en) | 2017-09-21 | 2021-01-19 | Wells Fargo Bank, N.A. | Authentication of impaired voices |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6236968B1 (en) * | 1998-05-14 | 2001-05-22 | International Business Machines Corporation | Sleep prevention dialog based car system |
US7451085B2 (en) * | 2000-10-13 | 2008-11-11 | At&T Intellectual Property Ii, L.P. | System and method for providing a compensated speech recognition model for speech recognition |
US7516072B2 (en) * | 2003-10-21 | 2009-04-07 | Johnson Controls Technology Company | System and method for selecting a user speech profile for a device in a vehicle |
US7386443B1 (en) * | 2004-01-09 | 2008-06-10 | At&T Corp. | System and method for mobile automatic speech recognition |
CN101326571B (zh) * | 2005-12-07 | 2012-05-23 | 三菱电机株式会社 | 声音识别装置 |
US7698140B2 (en) * | 2006-03-06 | 2010-04-13 | Foneweb, Inc. | Message transcription, voice query and query delivery system |
US8015014B2 (en) * | 2006-06-16 | 2011-09-06 | Storz Endoskop Produktions Gmbh | Speech recognition system with user profiles management component |
DE102006056286B4 (de) | 2006-11-29 | 2014-09-11 | Audi Ag | Verfahren zur Wiedergabe von Textinformationen durch Sprache in einem Fahrzeug |
WO2009073806A2 (en) | 2007-12-05 | 2009-06-11 | Johnson Controls Technology Company | Vehicle user interface systems and methods |
RU2415462C1 (ru) * | 2009-11-23 | 2011-03-27 | Закрытое акционерное общество "Лаборатория Касперского" | Система и метод отображения информации для различных уровней знаний с возможностью индивидуального подхода |
US8370157B2 (en) * | 2010-07-08 | 2013-02-05 | Honeywell International Inc. | Aircraft speech recognition and voice training data storage and retrieval methods and apparatus |
US9734151B2 (en) * | 2012-10-31 | 2017-08-15 | Tivo Solutions Inc. | Method and system for voice based media search |
-
2014
- 2014-05-16 DE DE102014209358.9A patent/DE102014209358A1/de not_active Withdrawn
-
2015
- 2015-04-29 EP EP15165595.8A patent/EP2945155A1/de not_active Withdrawn
- 2015-05-14 US US14/712,752 patent/US20150332671A1/en not_active Abandoned
- 2015-05-18 CN CN201510252730.5A patent/CN105096948A/zh active Pending
- 2015-05-18 RU RU2015118431A patent/RU2698773C2/ru not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP2945155A1 (de) | 2015-11-18 |
RU2698773C2 (ru) | 2019-08-29 |
DE102014209358A1 (de) | 2015-11-19 |
RU2015118431A3 (ru) | 2018-12-26 |
US20150332671A1 (en) | 2015-11-19 |
CN105096948A (zh) | 2015-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
GB2566215A (en) | Voice user interface | |
SG10201900178WA (en) | Speech transaction processing | |
KR20180084394A (ko) | 발화 완료 감지 방법 및 이를 구현한 전자 장치 | |
EP4293661A3 (en) | Multi-user authentication on a device | |
EP3751561A3 (en) | Hotword recognition | |
EP4276819A3 (en) | Electronic device and voice recognition method thereof | |
EP2981063A3 (en) | Method of modifying image including photographing restricted element, and device and system for performing the method | |
EP3584790A4 (en) | VOICEPRINT RECOGNITION METHOD, DEVICE, STORAGE MEDIUM AND BACKGROUND SERVER | |
WO2016028628A3 (en) | System and method for speech validation | |
GB2536836A (en) | Voice command triggered speech enhancement | |
WO2008083173A3 (en) | Local storage and use of search results for voice-enabled mobile communications devices | |
MX2017001121A (es) | Reconocimiento del habla en base a acustica y a dominio para vehiculos. | |
TWD198227S (zh) | 電子裝置 | |
WO2012155079A3 (en) | Adaptive voice recognition systems and methods | |
GB2534692A (en) | Utilizing voice biometrics | |
WO2015116105A3 (en) | Context-based mobile device | |
WO2014115115A3 (en) | Determining apnea-hypopnia index ahi from speech | |
WO2014081429A3 (en) | Speech recognition | |
TWD217223S (zh) | 電子裝置 | |
MX2018001996A (es) | Modelo acustico dinamico para un vehículo. | |
JP2016510133A5 (ru) | ||
EA201990617A1 (ru) | Портативное электронное устройство | |
MX2016000734A (es) | Accion activada por movimiento para dispositivo movil. | |
MX2015014413A (es) | Simulacion de respuesta al impulso acustico. | |
NZ727976A (en) | Natural language user interface |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20200519 |