KR100305455B1 - 연속 음성 인식시에 구두점들을 자동으로 발생시키기 위한 장치및 방법 - Google Patents
연속 음성 인식시에 구두점들을 자동으로 발생시키기 위한 장치및 방법 Download PDFInfo
- Publication number
- KR100305455B1 KR100305455B1 KR1019990013422A KR19990013422A KR100305455B1 KR 100305455 B1 KR100305455 B1 KR 100305455B1 KR 1019990013422 A KR1019990013422 A KR 1019990013422A KR 19990013422 A KR19990013422 A KR 19990013422A KR 100305455 B1 KR100305455 B1 KR 100305455B1
- Authority
- KR
- South Korea
- Prior art keywords
- punctuation
- pseudo
- user
- voice
- recognizing
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 44
- 230000000875 corresponding effect Effects 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000007619 statistical method Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 238000002559 palpation Methods 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (5)
- 연속 음성 인식 시스템에서 구두점을 자동으로 발생시키기 위한 장치에 있어서,사용자의 음성을 인식하고 상기 사용자의 음성을 단어들로 변환하기 위한 수단(1,2,3,5)을 포함하고,사용자 음성을 인식하기 위한 상기 수단(1,2,3,5)은 상기 사용자 음성 내의 의사 잡음(pseudo noises)들도 역시 인식하는 것을 특징으로 하며,상기 장치는,사용자의 음성을 인식하기 위한 상기 수단(1,2,3,5)의 출력 결과에서 의사 잡음들을 표시하기 위한 수단(9), 및의사 구두점들을 포함하는 언어 모델에 기초하여 의사 잡음들을 표시하기 위한 상기 수단(9)에 의해 표시된 의사 잡음들의 위치에서 가장 가능성있는 의사 구두점들을 발견하여 구두점들을 발생시키기 위한 수단(10, 14, 13)을 더 포함하는 것을 특징으로하는 구두점 자동 발생 장치.
- 제1항에 있어서, 구두점들을 발생시키기 위한 상기 수단은의사 구두점을 포함하는 언어 모델 내의 각각의 의사 구두점에 대해, 상기 구두점이 사용자의 음성을 인식하기 위한 상기 수단의 상기 출력 결과내에서 발생할 확률을 계산하기 위한 수단(10),특정의 의사 구두점의 위치들에서 특정의 의사 잡음들이 발생할 확률들을 계산하기 위한 수단(14), 및상기 계산된 확률들에 기초하여 의사 잡음들을 표시하기 위한 상기 수단(9)에 의해 표시된 상기 의사 잡음들의 위치들에서 가장 가능성있는 의사 구두점들을 발견하고 상기 가장 가능성있는 의사 구두점들에 대응하는 구두점들을 발생시키기 위한 수단(13)을 포함하는 것을 특징으로 하는 구두점 자동 발생 장치.
- 연속 음성 인식 시스템에서 구두점을 자동으로 발생시키기 위한 장치에 있어서,사용자의 음성을 인식하고 상기 사용자의 음성을 단어들로 변환하기 위한 수단(1,2,3,5)을 포함하고,구술 동안에 사용자의 동작에 응답하여, 사용자 음성을 인식하기 위한 상기 수단(1,2,3,5)의 출력 결과 내에서의 위치들을 표시하는 위치 표시 신호를 발생시키기 위한 수단과,의사 구두점을 포함하는 언어 모델 내의 각각의 의사 구두점에 대해, 상기 의사 구두점이 인식을 위한 상기 수단의 상기 출력 결과 내에서 발생할 확률을 계산하기 위한 수단(10)과,상기 계산된 확률에 기초하여 상기 위치 표시 신호에 의해 표시된 위치들에서 가장 가능성있는 의사 구두점을 발견하고, 상기 가장 가능성있는 구두점들에 대응하는 구두점들을 발생시키기 위한 수단(13)을 더 포함하는 것을 특징으로 하는 구두점 자동 발생 장치.
- 연속 음성 인식 시스템에서 구두점들을 자동으로 발생시키기 위한 방법에 있어서,사용자의 음성을 인식하여 상기 인식된 사용자의 음성을 단어들로 변환하는 단계를 포함하고,상기 사용자 음성 내의 의사 잡음들은 사용자 음성을 인식하는 상기 단계에서 역시 인식되는 것을 특징으로 하며,상기 방법은,사용자의 음성을 인식하는 상기 단계의 출력 결과 내에 의사 잡음을 표시해두는 단계, 및의사 구두점들을 포함하는 언어 모델에 기초하여, 의사 잡음들을 표시해두는 상기 단계에서 표시된 상기 의사 잡음들의 위치들에서 가장 가능성있는 의사 구두점들을 발견하여 구두점들을 발생시키는 단계를 더 포함하는 것을 특징으로 하는 구두점 자동 발생 방법.
- 연속 음성 인식 시스템에서 구두점들을 자동으로 발생시키기 위한 방법에 있어서,사용자의 음성을 인식하여 상기 인식된 사용자의 음성을 단어들로 변환하는 단계를 포함하고,구술 동안에 사용자의 동작에 응답하여, 사용자 음성을 인식하는 상기 단계의 출력 결과내의 위치들을 표시하는 위치 표시 신호를 발생시키는 단계,의사 구두점들을 포함하는 언어 모델 내의 각각의 의사 구두점에 대해, 상기 구두점이 사용자 음성을 인식하는 상기 단계의 상기 출력 결과 내에서 발생할 확률을 계산하는 단계, 및상기 계산된 확률들에 기초하여 상기 위치 표시 신호에 의해 표시된 위치들에서 가장 가능성있는 의사 구두점들을 발견하여 상기 가장 가능성있는 의사 구두점들에 대응하는 구두점들을 발생시키는 단계를 더 포함하는 것을 특징으로 하는 구두점 자동 발생 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB981083676A CN1159662C (zh) | 1998-05-13 | 1998-05-13 | 连续语音识别中的标点符号自动生成装置及方法 |
CN98108367.6 | 1998-05-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990087935A KR19990087935A (ko) | 1999-12-27 |
KR100305455B1 true KR100305455B1 (ko) | 2001-09-26 |
Family
ID=5219607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990013422A KR100305455B1 (ko) | 1998-05-13 | 1999-04-15 | 연속 음성 인식시에 구두점들을 자동으로 발생시키기 위한 장치및 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6718303B2 (ko) |
JP (1) | JP3282075B2 (ko) |
KR (1) | KR100305455B1 (ko) |
CN (1) | CN1159662C (ko) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3232289B2 (ja) * | 1999-08-30 | 2001-11-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 記号挿入装置およびその方法 |
JP3426176B2 (ja) * | 1999-12-27 | 2003-07-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、方法、コンピュータ・システム及び記憶媒体 |
US7219056B2 (en) * | 2000-04-20 | 2007-05-15 | International Business Machines Corporation | Determining and using acoustic confusability, acoustic perplexity and synthetic acoustic word error rate |
AU2000276392A1 (en) | 2000-09-28 | 2002-04-08 | Intel Corporation | Method and system for expanding a word graph to a phone graph based on a cross-word acoustical model to improve continuous speech recognition |
US20040006628A1 (en) * | 2002-07-03 | 2004-01-08 | Scott Shepard | Systems and methods for providing real-time alerting |
US20040021765A1 (en) * | 2002-07-03 | 2004-02-05 | Francis Kubala | Speech recognition system for managing telemeetings |
US20040024598A1 (en) * | 2002-07-03 | 2004-02-05 | Amit Srivastava | Thematic segmentation of speech |
US7389229B2 (en) * | 2002-10-17 | 2008-06-17 | Bbn Technologies Corp. | Unified clustering tree |
US7580838B2 (en) * | 2002-11-22 | 2009-08-25 | Scansoft, Inc. | Automatic insertion of non-verbalized punctuation |
JP2005202884A (ja) * | 2004-01-19 | 2005-07-28 | Toshiba Corp | 送信装置、受信装置、中継装置、および送受信システム |
US7921374B2 (en) * | 2004-07-08 | 2011-04-05 | Research In Motion Limited | Adding interrogative punctuation to an electronic message |
US7836412B1 (en) * | 2004-12-03 | 2010-11-16 | Escription, Inc. | Transcription editing |
FI20060666A0 (fi) * | 2006-07-07 | 2006-07-07 | Nokia Corp | Menetelmä ja järjestelmä epäjatkuvan lähetyksen toiminnallisuuden parantamiseksi |
US8577679B2 (en) | 2008-02-13 | 2013-11-05 | Nec Corporation | Symbol insertion apparatus and symbol insertion method |
JPWO2009122779A1 (ja) * | 2008-04-03 | 2011-07-28 | 日本電気株式会社 | テキストデータ処理装置、方法、プログラム |
CA2680304C (en) * | 2008-09-25 | 2017-08-22 | Multimodal Technologies, Inc. | Decoding-time prediction of non-verbalized tokens |
US8719004B2 (en) * | 2009-03-19 | 2014-05-06 | Ditech Networks, Inc. | Systems and methods for punctuating voicemail transcriptions |
CN101876887A (zh) * | 2010-07-26 | 2010-11-03 | 刘彤 | 语音输入方法及装置 |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
CN102231278B (zh) * | 2011-06-10 | 2013-08-21 | 安徽科大讯飞信息科技股份有限公司 | 实现语音识别中自动添加标点符号的方法及系统 |
US8990224B1 (en) * | 2011-11-14 | 2015-03-24 | Google Inc. | Detecting document text that is hard to read |
GB2502944A (en) * | 2012-03-30 | 2013-12-18 | Jpal Ltd | Segmentation and transcription of speech |
US9811517B2 (en) | 2013-01-29 | 2017-11-07 | Tencent Technology (Shenzhen) Company Limited | Method and system of adding punctuation and establishing language model using a punctuation weighting applied to chinese speech recognized text |
CN103971684B (zh) * | 2013-01-29 | 2015-12-09 | 腾讯科技(深圳)有限公司 | 一种添加标点的方法、系统及其语言模型建立方法、装置 |
CN104143331B (zh) | 2013-05-24 | 2015-12-09 | 腾讯科技(深圳)有限公司 | 一种添加标点的方法和系统 |
CN104142915B (zh) | 2013-05-24 | 2016-02-24 | 腾讯科技(深圳)有限公司 | 一种添加标点的方法和系统 |
US9460088B1 (en) * | 2013-05-31 | 2016-10-04 | Google Inc. | Written-domain language modeling with decomposition |
US9460067B2 (en) * | 2013-10-30 | 2016-10-04 | Lenovo (Singapore) Pte. Ltd. | Automatic sentence punctuation |
JP6686553B2 (ja) * | 2016-03-08 | 2020-04-22 | 富士通株式会社 | 応対品質評価プログラム、応対品質評価方法及び応対品質評価装置 |
CN107564526B (zh) * | 2017-07-28 | 2020-10-27 | 北京搜狗科技发展有限公司 | 处理方法、装置和机器可读介质 |
CN107632980B (zh) * | 2017-08-03 | 2020-10-27 | 北京搜狗科技发展有限公司 | 语音翻译方法和装置、用于语音翻译的装置 |
CN108538292B (zh) * | 2018-04-26 | 2020-12-22 | 科大讯飞股份有限公司 | 一种语音识别方法、装置、设备及可读存储介质 |
US11315570B2 (en) * | 2018-05-02 | 2022-04-26 | Facebook Technologies, Llc | Machine learning-based speech-to-text transcription cloud intermediary |
US10242669B1 (en) * | 2018-08-07 | 2019-03-26 | Repnow Inc. | Enhanced transcription of audio data with punctuation markings based on silence durations |
JP6605105B1 (ja) * | 2018-10-15 | 2019-11-13 | 株式会社野村総合研究所 | 文章記号挿入装置及びその方法 |
CN110264997A (zh) * | 2019-05-30 | 2019-09-20 | 北京百度网讯科技有限公司 | 语音断句的方法、装置和存储介质 |
JP7229144B2 (ja) * | 2019-10-11 | 2023-02-27 | 株式会社野村総合研究所 | 文章記号挿入装置及びその方法 |
CN110908583B (zh) * | 2019-11-29 | 2022-10-14 | 维沃移动通信有限公司 | 符号显示方法及电子设备 |
CN112445453B (zh) * | 2020-11-10 | 2024-09-13 | 北京搜狗科技发展有限公司 | 一种输入方法、装置和电子设备 |
CN112906348B (zh) * | 2021-02-04 | 2022-04-26 | 云从科技集团股份有限公司 | 对文本自动添加标点符号的方法、系统、设备及介质 |
CN113095062B (zh) * | 2021-04-12 | 2024-10-01 | 阿里巴巴创新公司 | 数据处理方法、装置、电子设备及计算机存储介质 |
CN117113941B (zh) * | 2023-10-23 | 2024-02-06 | 新声科技(深圳)有限公司 | 标点符号恢复方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56114041A (en) | 1980-02-12 | 1981-09-08 | Toshiba Corp | Producing device of voice input document |
JPH0693221B2 (ja) * | 1985-06-12 | 1994-11-16 | 株式会社日立製作所 | 音声入力装置 |
US5146405A (en) | 1988-02-05 | 1992-09-08 | At&T Bell Laboratories | Methods for part-of-speech determination and usage |
US5799276A (en) * | 1995-11-07 | 1998-08-25 | Accent Incorporated | Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals |
US6067514A (en) * | 1998-06-23 | 2000-05-23 | International Business Machines Corporation | Method for automatically punctuating a speech utterance in a continuous speech recognition system |
JP2000047688A (ja) | 1998-07-28 | 2000-02-18 | Nikon Corp | 音声入力方法、および、記録媒体 |
-
1998
- 1998-05-13 CN CNB981083676A patent/CN1159662C/zh not_active Expired - Fee Related
-
1999
- 1999-04-15 KR KR1019990013422A patent/KR100305455B1/ko not_active IP Right Cessation
- 1999-05-13 JP JP13211799A patent/JP3282075B2/ja not_active Expired - Fee Related
- 1999-05-13 US US09/311,503 patent/US6718303B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3282075B2 (ja) | 2002-05-13 |
US6718303B2 (en) | 2004-04-06 |
US20020069055A1 (en) | 2002-06-06 |
JP2000029496A (ja) | 2000-01-28 |
KR19990087935A (ko) | 1999-12-27 |
CN1235312A (zh) | 1999-11-17 |
CN1159662C (zh) | 2004-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100305455B1 (ko) | 연속 음성 인식시에 구두점들을 자동으로 발생시키기 위한 장치및 방법 | |
CN110148427B (zh) | 音频处理方法、装置、系统、存储介质、终端及服务器 | |
KR101183344B1 (ko) | 사용자 정정들을 이용한 자동 음성 인식 학습 | |
US8204747B2 (en) | Emotion recognition apparatus | |
US6973427B2 (en) | Method for adding phonetic descriptions to a speech recognition lexicon | |
JP3520022B2 (ja) | 外国語学習装置、外国語学習方法および媒体 | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
JP3782943B2 (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
US7711560B2 (en) | Speech recognition device and speech recognition method | |
US20070239455A1 (en) | Method and system for managing pronunciation dictionaries in a speech application | |
US11810471B2 (en) | Computer implemented method and apparatus for recognition of speech patterns and feedback | |
KR20160122542A (ko) | 발음 유사도 측정 방법 및 장치 | |
JP4885160B2 (ja) | 英語変異発音を識別するモジュールの構築方法、および、当該モジュールの構築を実現するプログラムを記憶したコンピュータが読み取り可能な記録媒体 | |
JP2003177779A (ja) | 音声認識のための話者学習法 | |
JP2006084966A (ja) | 発話音声の自動評定装置およびコンピュータプログラム | |
JP5243886B2 (ja) | 字幕出力装置、字幕出力方法及びプログラム | |
CN116434780A (zh) | 具备多读音纠错功能的语言学习系统 | |
KR101487006B1 (ko) | 연음법칙이 적용되는 발음의 발음교정을 실시하는 외국어 학습장치 및 그 학습방법 | |
Miyazaki et al. | Connectionist temporal classification-based sound event encoder for converting sound events into onomatopoeic representations | |
JP5066668B2 (ja) | 音声認識装置、およびプログラム | |
JP4621936B2 (ja) | 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム | |
Enarvi | Finnish Language Speech Recognition for Dental Health Care | |
Furui | Toward robust speech recognition and understanding | |
CN116434779A (zh) | 语言学习系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19990415 |
|
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 19990909 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 19990415 Comment text: Patent Application |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20010627 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20010730 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20010731 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20040510 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20050616 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20050616 Start annual number: 5 End annual number: 5 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |