RU2001109249A - Устройство распознавания речи - Google Patents
Устройство распознавания речиInfo
- Publication number
- RU2001109249A RU2001109249A RU2001109249/09A RU2001109249A RU2001109249A RU 2001109249 A RU2001109249 A RU 2001109249A RU 2001109249/09 A RU2001109249/09 A RU 2001109249/09A RU 2001109249 A RU2001109249 A RU 2001109249A RU 2001109249 A RU2001109249 A RU 2001109249A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- words
- designations
- elements
- sequences
- Prior art date
Links
- 238000009825 accumulation Methods 0.000 claims 7
Claims (12)
1. Устройство распознавания речи для осуществления распознавания слов по введенной речевой информации посредством использования информации о моделях единичных элементов речи, каждый из которых является более коротким, чем слово, включающее средство накопления совокупности словарных обозначений, осуществляющее накопление последовательностей обозначений указанных единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, средство извлечения последовательностей обозначений для зарегистрированных слов, осуществляющее генерацию последовательностей обозначений указанных единичных элементов речи для зарегистрированных слов из введенной речевой информации конкретного говорящего субъекта, и средство регистрации, осуществляющее запоминание последовательностей обозначений единичных элементов речи для слов общего характера, обычно используемых для распознавания слов из введенной речевой информации указанных произвольных говорящих субъектов, и созданных последовательностей обозначений для зарегистрированных слов в виде параллельных совокупностей в указанном средстве накопления совокупности словарных обозначений, в котором указанные единичные элементы речи представляют собой акустические события, генерация которых выполнена посредством разделения скрытой марковской модели фонемы на отдельные состояния без изменения значений вероятности перехода, результирующей вероятности и количества состояний.
2. Устройство распознавания речи по п.1, дополнительно включающее средство, осуществляющее регистрацию указанных слов общего характера при помощи указанного средства накопления совокупности словарных обозначений.
3. Устройство распознавания речи для осуществления распознавания слов по введенной речевой информации посредством использования информация о моделях единичных элементов речи, каждый из которых является более коротким, чем слово, включающее средство накопления совокупности словарных обозначений, осуществляющее накопление последовательностей обозначений указанных единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, средство извлечения последовательностей обозначений для зарегистрированных слов, осуществляющее генерацию последовательностей обозначений, которые соответствуют связи указанных единичных элементов речи между собой, причем последовательности обозначений указанных единичных элементов речи имеют наибольшую вероятность для зарегистрированных слов из введенной речевой информации конкретного говорящего субъекта, посредством использования совокупности, в которой описано указанное условие о связи единичных элементов речи, и средство регистрации, осуществляющее регистрацию таким образом, что добавляет созданные последовательности обозначений для зарегистрированных слов в указанное средство накопления совокупности словарных обозначений, в котором указанные единичные элементы речи представляют собой акустические события, генерация которых выполнена посредством разделения скрытой марковской модели фонемы на отдельные состояния без изменения значений вероятности перехода, результирующей вероятности и количества состояний.
4. Устройство распознавания речи по п.3, дополнительно включающее средство, осуществляющее регистрацию указанных слов общего характера при помощи указанного средства накопления совокупности словарных обозначений.
5. Устройство распознавания речи для осуществления распознавания слов по введенной речевой информации посредством использования информации о моделях единичных элементов речи, каждый из которых является более коротким, чем слово, включающее средство накопления совокупности словарных обозначений, осуществляющее накопление последовательностей обозначений указанных единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, средство извлечения последовательностей обозначений для зарегистрированных слов, осуществляющее генерацию последовательностей обозначений, которые соответствуют связи указанных единичных элементов речи между собой, причем последовательности обозначений указанных единичных элементов речи имеют наибольшую вероятность для зарегистрированных слов из введенной речевой информации конкретного говорящего субъекта, посредством использования совокупности, в которой описано указанное условие о связи единичных элементов речи, и средство регистрации, осуществляющее запоминание указанных последовательностей обозначений единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов и созданным последовательностям обозначений для зарегистрированных слов, в виде параллельных совокупностей в указанном средстве накопления совокупности словарных обозначений, в котором указанные единичные элементы речи представляют собой акустические события, генерация которых выполнена посредством разделения скрытой марковской модели фонемы на отдельные состояния без изменения значений вероятности перехода, результирующей вероятности и количества состояний.
6. Устройство распознавания речи по п.5, дополнительно включающее средство, осуществляющее регистрацию указанных слов общего характера при помощи указанного средства накопления совокупности словарных обозначений.
7. Способ распознавания речи, в котором распознавание слов по введенной речевой информации осуществляют посредством использования информации о моделях единичных элементов речи, каждый из которых является более коротким, чем слово, в котором накопление последовательностей обозначений указанных единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, осуществляют в средстве накопления совокупности словарных обозначений, согласно которому осуществляют генерацию последовательностей обозначений указанных единичных элементов речи для зарегистрированных слов из введенной речевой информации конкретного говорящего субъекта, и осуществляют запоминание указанных последовательностей обозначений единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, и созданных последовательностей обозначений для зарегистрированных слов в виде параллельных совокупностей в указанном средстве накопления совокупности словарных обозначений, причем указанные единичные элементы речи представляют собой акустические события, генерация которых выполнена посредством разделения скрытой марковской модели фонемы на отдельные состояния без изменения значений вероятности перехода, результирующей вероятности и количества состояний.
8. Способ распознавания речи по п.7, в котором регистрацию указанных слов общего характера могут осуществить указанным средством накопления совокупности словарных обозначений.
9. Способ распознавания речи, в котором распознавание слов по введенной речевой информации осуществляют посредством использования информации о моделях единичных элементов речи, каждый из которых является более коротким, чем слово, в котором накопление последовательностей обозначений указанных единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, осуществляют в средстве накопления совокупности словарных обозначений, согласно которому осуществляют генерацию последовательностей обозначений, которые соответствуют связи указанных единичных элементов речи между собой, причем последовательности обозначений указанных единичных элементов речи имеют наибольшую вероятность для зарегистрированных слов из введенной речевой информации конкретного говорящего субъекта, посредством использования совокупности, в которой описано указанное условие о связи единичных элементов речи, и осуществляют регистрацию таким образом, что созданные последовательности обозначений для зарегистрированных слов добавляют в указанное средство накопления совокупности словарных обозначений, в котором указанные единичные элементы речи представляют собой акустические события, генерацию которых выполняют посредством разделения скрытой марковской модели фонемы на отдельные состояния без изменения значений вероятности перехода, результирующей вероятности и количества состояний.
10. Способ распознавания речи по п.9, в котором регистрацию указанных слов общего характера могут осуществить указанным средством накопления совокупности словарных обозначений.
11. Способ распознавания речи, в котором распознавание слов по введенной речевой информации осуществляют посредством использования информации о моделях единичных элементов речи, каждый из которых является более коротким, чем слово, в котором накопление последовательностей обозначений указанных единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, осуществляют в средстве накопления совокупности словарных обозначений, согласно которому осуществляют генерацию последовательностей обозначений, которые соответствуют связи указанных единичных элементов речи между собой, причем последовательности обозначений указанных единичных элементов речи имеют наибольшую вероятность для зарегистрированных слов из введенной речевой информации конкретного говорящего субъекта, посредством использования совокупности, в которой описано указанное условие о связи единичных элементов речи, и осуществляют запоминание указанных последовательностей обозначений единичных элементов речи для слов общего характера, обычно используемых для выполнения распознавания слов по введенной речевой информации произвольных говорящих субъектов, и созданных последовательностей обозначений для зарегистрированных слов в указанном средстве накопления совокупности словарных обозначений, причем указанные единичные элементы речи представляют собой акустические события, генерацию которых выполняют посредством разделения скрытой марковской модели фонемы на отдельные состояния без изменения значений вероятности перехода, результирующей вероятности и количества состояний.
12. Способ распознавания речи по п.11, в котором регистрацию указанных слов общего характера могут осуществить указанным средством накопления совокупности словарных обозначений.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10/255196 | 1998-09-09 | ||
JP25519698 | 1998-09-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2001109249A true RU2001109249A (ru) | 2003-05-27 |
RU2223554C2 RU2223554C2 (ru) | 2004-02-10 |
Family
ID=17275371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2001109249/09A RU2223554C2 (ru) | 1998-09-09 | 1999-09-08 | Устройство распознавания речи |
Country Status (13)
Country | Link |
---|---|
US (1) | US6868382B2 (ru) |
EP (1) | EP1126438B1 (ru) |
JP (1) | JP3803029B2 (ru) |
KR (1) | KR100415217B1 (ru) |
CN (1) | CN1280783C (ru) |
AU (1) | AU5647899A (ru) |
BR (1) | BR9913524A (ru) |
DE (1) | DE69939124D1 (ru) |
HK (1) | HK1040312A1 (ru) |
ID (1) | ID27346A (ru) |
MX (1) | MXPA01002514A (ru) |
RU (1) | RU2223554C2 (ru) |
WO (1) | WO2000014723A1 (ru) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100423495B1 (ko) * | 2001-06-21 | 2004-03-18 | 삼성전자주식회사 | 음성인식에 의한 휴대용 기기의 동작제어 장치 및 방법 |
US7080013B2 (en) * | 2002-06-06 | 2006-07-18 | International Business Machines Corporation | Categorization and recall methodology for physical media in large carousel systems |
DE102004063552A1 (de) * | 2004-12-30 | 2006-07-13 | Siemens Ag | Verfahren zur Ermittlung von Aussprachevarianten eines Wortes aus einem vorgebbaren Vokabular eines Spracherkennungssystems |
WO2006109515A1 (ja) * | 2005-03-31 | 2006-10-19 | Pioneer Corporation | 操作者認識装置、操作者認識方法、および、操作者認識プログラム |
CN1889171B (zh) * | 2005-06-29 | 2010-09-01 | 诺基亚(中国)投资有限公司 | 用于识别字符/字符串的语音识别方法和系统 |
US7970613B2 (en) | 2005-11-12 | 2011-06-28 | Sony Computer Entertainment Inc. | Method and system for Gaussian probability data bit reduction and computation |
US7778831B2 (en) | 2006-02-21 | 2010-08-17 | Sony Computer Entertainment Inc. | Voice recognition with dynamic filter bank adjustment based on speaker categorization determined from runtime pitch |
US8010358B2 (en) * | 2006-02-21 | 2011-08-30 | Sony Computer Entertainment Inc. | Voice recognition with parallel gender and age normalization |
US20080256613A1 (en) * | 2007-03-13 | 2008-10-16 | Grover Noel J | Voice print identification portal |
US8442833B2 (en) * | 2009-02-17 | 2013-05-14 | Sony Computer Entertainment Inc. | Speech processing with source location estimation using signals from two or more microphones |
US8788256B2 (en) * | 2009-02-17 | 2014-07-22 | Sony Computer Entertainment Inc. | Multiple language voice recognition |
US8442829B2 (en) * | 2009-02-17 | 2013-05-14 | Sony Computer Entertainment Inc. | Automatic computation streaming partition for voice recognition on multiple processors with limited memory |
US20110093266A1 (en) * | 2009-10-15 | 2011-04-21 | Tham Krister | Voice pattern tagged contacts |
US9153235B2 (en) | 2012-04-09 | 2015-10-06 | Sony Computer Entertainment Inc. | Text dependent speaker recognition with long-term feature based on functional data analysis |
WO2014025282A1 (en) | 2012-08-10 | 2014-02-13 | Khitrov Mikhail Vasilevich | Method for recognition of speech messages and device for carrying out the method |
CN103784255A (zh) * | 2012-10-29 | 2014-05-14 | 赵士星 | 听力辅助系统 |
CN103077714B (zh) * | 2013-01-29 | 2015-07-08 | 华为终端有限公司 | 信息的识别方法和装置 |
KR101610151B1 (ko) * | 2014-10-17 | 2016-04-08 | 현대자동차 주식회사 | 개인음향모델을 이용한 음성 인식장치 및 방법 |
RU2701120C1 (ru) * | 2018-05-14 | 2019-09-24 | Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" | Устройство для обработки речевого сигнала |
JP2022001967A (ja) * | 2018-09-11 | 2022-01-06 | ソニーグループ株式会社 | 音響イベント認識装置 |
US11283586B1 (en) | 2020-09-05 | 2022-03-22 | Francis Tiong | Method to estimate and compensate for clock rate difference in acoustic sensors |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58106329A (ja) * | 1981-12-17 | 1983-06-24 | Matsushita Electric Ind Co Ltd | 加熱装置 |
US4718094A (en) * | 1984-11-19 | 1988-01-05 | International Business Machines Corp. | Speech recognition system |
JPS6332596A (ja) * | 1986-07-25 | 1988-02-12 | 日本電信電話株式会社 | 音声認識装置 |
US4817156A (en) * | 1987-08-10 | 1989-03-28 | International Business Machines Corporation | Rapidly training a speech recognizer to a subsequent speaker given training data of a reference speaker |
US5054074A (en) * | 1989-03-02 | 1991-10-01 | International Business Machines Corporation | Optimized speech recognition system and method |
US5025471A (en) * | 1989-08-04 | 1991-06-18 | Scott Instruments Corporation | Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns |
US5182773A (en) * | 1991-03-22 | 1993-01-26 | International Business Machines Corporation | Speaker-independent label coding apparatus |
KR930014258A (ko) * | 1991-12-30 | 1993-07-22 | 이헌조 | 음성인식시스템에서의 음성인식 등록 선택 제어방법 |
JPH05232989A (ja) * | 1992-02-20 | 1993-09-10 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデルの話者適応化法 |
JPH0782348B2 (ja) * | 1992-03-21 | 1995-09-06 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | 音声認識用サブワードモデル生成方法 |
JP3422541B2 (ja) * | 1992-12-17 | 2003-06-30 | ゼロックス・コーポレーション | キーワードのモデル化方法及び非キーワードhmmの提供方法 |
JP2912513B2 (ja) | 1992-12-18 | 1999-06-28 | 沖電気工業株式会社 | ヒドン・マルコフ・モデルの学習方法 |
US5732187A (en) | 1993-09-27 | 1998-03-24 | Texas Instruments Incorporated | Speaker-dependent speech recognition using speaker independent models |
JP3076702B2 (ja) | 1993-10-08 | 2000-08-14 | 三菱電機株式会社 | 表示素子の保持装置 |
JPH0869297A (ja) * | 1994-08-30 | 1996-03-12 | Aqueous Res:Kk | 音声認識装置 |
JP2980228B2 (ja) * | 1994-10-25 | 1999-11-22 | 日本ビクター株式会社 | 音声認識用音響モデル生成方法 |
JPH08221090A (ja) * | 1995-02-15 | 1996-08-30 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法 |
JP3968133B2 (ja) * | 1995-06-22 | 2007-08-29 | セイコーエプソン株式会社 | 音声認識対話処理方法および音声認識対話装置 |
JPH0997096A (ja) * | 1995-09-28 | 1997-04-08 | Victor Co Of Japan Ltd | 音声認識用音響モデル生成方法 |
JP2871561B2 (ja) * | 1995-11-30 | 1999-03-17 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 不特定話者モデル生成装置及び音声認識装置 |
ES2169432T3 (es) * | 1996-09-10 | 2002-07-01 | Siemens Ag | Procedimiento para la adaptacion de un modelo de sonido hidden markov en un sistema de reconocimiento de voz. |
-
1999
- 1999-09-08 KR KR10-2001-7003092A patent/KR100415217B1/ko not_active IP Right Cessation
- 1999-09-08 EP EP99943224A patent/EP1126438B1/en not_active Expired - Lifetime
- 1999-09-08 RU RU2001109249/09A patent/RU2223554C2/ru not_active IP Right Cessation
- 1999-09-08 CN CNB998119504A patent/CN1280783C/zh not_active Expired - Fee Related
- 1999-09-08 WO PCT/JP1999/004885 patent/WO2000014723A1/ja active IP Right Grant
- 1999-09-08 ID IDW20010572A patent/ID27346A/id unknown
- 1999-09-08 MX MXPA01002514A patent/MXPA01002514A/es unknown
- 1999-09-08 JP JP2000569386A patent/JP3803029B2/ja not_active Expired - Fee Related
- 1999-09-08 BR BR9913524-8A patent/BR9913524A/pt not_active IP Right Cessation
- 1999-09-08 DE DE69939124T patent/DE69939124D1/de not_active Expired - Lifetime
- 1999-09-09 AU AU56478/99A patent/AU5647899A/en not_active Abandoned
-
2001
- 2001-03-09 US US09/802,768 patent/US6868382B2/en not_active Expired - Fee Related
-
2002
- 2002-02-19 HK HK02101185.1A patent/HK1040312A1/zh unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2001109249A (ru) | Устройство распознавания речи | |
Soong et al. | A Tree. Trellis based fast search for finding the n best sentence hypotheses in continuous speech recognition | |
Lee | Voice dictation of mandarin chinese | |
EP0953970B1 (en) | Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word | |
EP0573553A1 (en) | Method for recognizing speech using linguistically-motivated hidden markov models | |
JPH04122996A (ja) | 自動音声認識用に音類似に基づく文脈依存カテゴリへ音素の発音をグループ化する方法と装置 | |
CN108090038A (zh) | 文本断句方法及系统 | |
Lounnas et al. | CLIASR: a combined automatic speech recognition and language identification system | |
Ganapathiraju et al. | Syllable-A promising recognition unit for LVCSR | |
Samudravijaya et al. | A comparison of public-domain software tools for speech recognition | |
Seng et al. | Which unit for acoustic and language modeling for Khmer Automatic Speech Recognition? | |
Elhadj et al. | Approach for recognizing allophonic sounds of the classical Arabic based on Quran recitations | |
Mihajlik et al. | Phonetic transcription in automatic speech recognition | |
Tungthangthum | Tone recognition for Thai | |
Chalamandaris et al. | Rule-based grapheme-to-phoneme method for the Greek | |
Vu et al. | Vietnamese automatic speech recognition: The flavor approach | |
Hsieh et al. | Improved spoken document retrieval with dynamic key term lexicon and probabilistic latent semantic analysis (PLSA) | |
Wang et al. | Extracting dynamic features using the stochastic matching pursuit algorithm for speech event detection | |
Bloothooft | Corpus-based name standardization | |
Seneff | The use of subword linguistic modeling for multiple tasks in speech recognition | |
Zgank et al. | Crosslingual transfer of source acoustic models to two different target languages | |
Huggins et al. | The use of shibboleth words for automatically classifying speakers by dialect | |
Ljolje | Multiple task-domain acoustic models | |
Cox | Speech and language processing for a constrained speech translation system. | |
Billi et al. | A PC-based very large vocabulary isolated word speech recognition system |