RU2015118431A - Устройство и способ распознавания речи - Google Patents

Устройство и способ распознавания речи Download PDF

Info

Publication number
RU2015118431A
RU2015118431A RU2015118431A RU2015118431A RU2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A RU 2015118431 A RU2015118431 A RU 2015118431A
Authority
RU
Russia
Prior art keywords
user
speech
profile
processing
memory unit
Prior art date
Application number
RU2015118431A
Other languages
English (en)
Other versions
RU2698773C2 (ru
RU2015118431A3 (ru
Inventor
ДР ХАБИЛ Кристоф АРНДТ
Уве ГУССЕН
Фредерик ШТЕФАН
Original Assignee
Форд Глобал Технолоджис, ЛЛК
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Форд Глобал Технолоджис, ЛЛК filed Critical Форд Глобал Технолоджис, ЛЛК
Publication of RU2015118431A publication Critical patent/RU2015118431A/ru
Publication of RU2015118431A3 publication Critical patent/RU2015118431A3/ru
Application granted granted Critical
Publication of RU2698773C2 publication Critical patent/RU2698773C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • G10L15/075Adaptation to the speaker supervised, i.e. under machine guidance
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Child & Adolescent Psychology (AREA)
  • Psychiatry (AREA)
  • Hospice & Palliative Care (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Lock And Its Accessories (AREA)

Abstract

1. Устройство для распознавания речи с блоком обработки для обработки звуковых сигналов от пользователя на основании речевого профиля, соответствующего этому пользователю, выполненное с возможностью:сохранять речевой профиль пользователя во внешнем блоке памяти, предназначенном только для этого пользователя и расположенном вне блока обработки, иавтоматически извлекать речевой профиль пользователя, сохраненный во внешнем блоке памяти, при каждом повторном включении устройства, после чего автоматически извлеченный речевой профиль пользователя передается в блок обработки для использования в обработке последующих звуковых сигналов от пользователя.2. Устройство по п. 1, которое предназначено для распознавания речи в транспортном средстве.3. Устройство по п. 1, в котором блок памяти, предназначенный пользователю, расположен в мобильном и портативном запоминающем устройстве.4. Устройство по п. 3, в котором блок памяти, предназначенный пользователю, расположен в ключе (2) зажигания или брелоке, или браслете (3).5. Устройство по п. 1 или 3, в котором блок памяти, предназначенный пользователю, представляет собой область памяти «облачной памяти» (4).6. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи беспроводной передачи данных.7. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи криптографической защиты.8. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять автоматическую корректировку речевого профиля пользователя в

Claims (13)

1. Устройство для распознавания речи с блоком обработки для обработки звуковых сигналов от пользователя на основании речевого профиля, соответствующего этому пользователю, выполненное с возможностью:
сохранять речевой профиль пользователя во внешнем блоке памяти, предназначенном только для этого пользователя и расположенном вне блока обработки, и
автоматически извлекать речевой профиль пользователя, сохраненный во внешнем блоке памяти, при каждом повторном включении устройства, после чего автоматически извлеченный речевой профиль пользователя передается в блок обработки для использования в обработке последующих звуковых сигналов от пользователя.
2. Устройство по п. 1, которое предназначено для распознавания речи в транспортном средстве.
3. Устройство по п. 1, в котором блок памяти, предназначенный пользователю, расположен в мобильном и портативном запоминающем устройстве.
4. Устройство по п. 3, в котором блок памяти, предназначенный пользователю, расположен в ключе (2) зажигания или брелоке, или браслете (3).
5. Устройство по п. 1 или 3, в котором блок памяти, предназначенный пользователю, представляет собой область памяти «облачной памяти» (4).
6. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи беспроводной передачи данных.
7. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять сохранение и извлечение речевого профиля пользователя при помощи криптографической защиты.
8. Устройство по п. 1, которое дополнительно выполнено с возможностью осуществлять автоматическую корректировку речевого профиля пользователя в соответствии с текущей речевой моделью пользователя.
9. Устройство по п. 1, которое дополнительно выполнено с возможностью корректировать речевой профиль пользователя, переданного в блок обработки для использования в обработке последующих звуковых сигналов от пользователя с учетом его приобретенного текущего состояния.
10. Устройство по п. 1, которое дополнительно выполнено с возможностью корректировать речевой профиль пользователя, переданного в блок обработки для использования в обработке последующих звуковых сигналов от пользователя, в случае, если во время обработки звуковых сигналов от пользователя выявлено ухудшение различимости последовательных фонем и (или) снижение доли распознавания фонем.
11. Устройство по п. 1, которое дополнительно выполнено с возможностью вызывать генерирование предупреждающего сигнала на основании отклонения между речевым профилем пользователя, сохраненным во внешнем блоке памяти, и текущей речевой моделью пользователя.
12. Способ распознавания речи с помощью устройства для обработки, предназначенного для обработки звуковых сигналов от пользователя на основании речевого профиля, соответствующего этому пользователю, в котором:
сохраняют речевой профиль пользователя во внешнем блоке памяти, предназначенном только для этого пользователя и расположенном вне блока обработки, и
автоматически извлекают речевой профиль пользователя, сохраненный во внешнем блоке памяти, при каждом повторном включении устройства, после чего автоматически извлеченный речевой профиль пользователя передается в блок обработки для использования в обработке последующих звуковых сигналов от пользователя.
13. Способ по п. 12, который предназначен для использования в транспортном средстве.
RU2015118431A 2014-05-16 2015-05-18 Устройство и способ распознавания речи RU2698773C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102014209358.9A DE102014209358A1 (de) 2014-05-16 2014-05-16 Vorrichtung und Verfahren zur Spracherkennung, insbesondere in einem Fahrzeug
DE102014209358.9 2014-05-16

Publications (3)

Publication Number Publication Date
RU2015118431A true RU2015118431A (ru) 2016-12-10
RU2015118431A3 RU2015118431A3 (ru) 2018-12-26
RU2698773C2 RU2698773C2 (ru) 2019-08-29

Family

ID=53015650

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015118431A RU2698773C2 (ru) 2014-05-16 2015-05-18 Устройство и способ распознавания речи

Country Status (5)

Country Link
US (1) US20150332671A1 (ru)
EP (1) EP2945155A1 (ru)
CN (1) CN105096948A (ru)
DE (1) DE102014209358A1 (ru)
RU (1) RU2698773C2 (ru)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10896673B1 (en) 2017-09-21 2021-01-19 Wells Fargo Bank, N.A. Authentication of impaired voices

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6236968B1 (en) * 1998-05-14 2001-05-22 International Business Machines Corporation Sleep prevention dialog based car system
US7451085B2 (en) * 2000-10-13 2008-11-11 At&T Intellectual Property Ii, L.P. System and method for providing a compensated speech recognition model for speech recognition
US7516072B2 (en) * 2003-10-21 2009-04-07 Johnson Controls Technology Company System and method for selecting a user speech profile for a device in a vehicle
US7386443B1 (en) * 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
CN101326571B (zh) * 2005-12-07 2012-05-23 三菱电机株式会社 声音识别装置
US7698140B2 (en) * 2006-03-06 2010-04-13 Foneweb, Inc. Message transcription, voice query and query delivery system
US8015014B2 (en) * 2006-06-16 2011-09-06 Storz Endoskop Produktions Gmbh Speech recognition system with user profiles management component
DE102006056286B4 (de) 2006-11-29 2014-09-11 Audi Ag Verfahren zur Wiedergabe von Textinformationen durch Sprache in einem Fahrzeug
WO2009073806A2 (en) 2007-12-05 2009-06-11 Johnson Controls Technology Company Vehicle user interface systems and methods
RU2415462C1 (ru) * 2009-11-23 2011-03-27 Закрытое акционерное общество "Лаборатория Касперского" Система и метод отображения информации для различных уровней знаний с возможностью индивидуального подхода
US8370157B2 (en) * 2010-07-08 2013-02-05 Honeywell International Inc. Aircraft speech recognition and voice training data storage and retrieval methods and apparatus
US9734151B2 (en) * 2012-10-31 2017-08-15 Tivo Solutions Inc. Method and system for voice based media search

Also Published As

Publication number Publication date
EP2945155A1 (de) 2015-11-18
RU2698773C2 (ru) 2019-08-29
DE102014209358A1 (de) 2015-11-19
RU2015118431A3 (ru) 2018-12-26
US20150332671A1 (en) 2015-11-19
CN105096948A (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
GB2566215A (en) Voice user interface
SG10201900178WA (en) Speech transaction processing
KR20180084394A (ko) 발화 완료 감지 방법 및 이를 구현한 전자 장치
EP4293661A3 (en) Multi-user authentication on a device
EP3751561A3 (en) Hotword recognition
EP4276819A3 (en) Electronic device and voice recognition method thereof
EP2981063A3 (en) Method of modifying image including photographing restricted element, and device and system for performing the method
EP3584790A4 (en) VOICEPRINT RECOGNITION METHOD, DEVICE, STORAGE MEDIUM AND BACKGROUND SERVER
WO2016028628A3 (en) System and method for speech validation
GB2536836A (en) Voice command triggered speech enhancement
WO2008083173A3 (en) Local storage and use of search results for voice-enabled mobile communications devices
MX2017001121A (es) Reconocimiento del habla en base a acustica y a dominio para vehiculos.
TWD198227S (zh) 電子裝置
WO2012155079A3 (en) Adaptive voice recognition systems and methods
GB2534692A (en) Utilizing voice biometrics
WO2015116105A3 (en) Context-based mobile device
WO2014115115A3 (en) Determining apnea-hypopnia index ahi from speech
WO2014081429A3 (en) Speech recognition
TWD217223S (zh) 電子裝置
MX2018001996A (es) Modelo acustico dinamico para un vehículo.
JP2016510133A5 (ru)
EA201990617A1 (ru) Портативное электронное устройство
MX2016000734A (es) Accion activada por movimiento para dispositivo movil.
MX2015014413A (es) Simulacion de respuesta al impulso acustico.
NZ727976A (en) Natural language user interface

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20200519