CN105244029B - 语音识别后处理方法及系统 - Google Patents
语音识别后处理方法及系统 Download PDFInfo
- Publication number
- CN105244029B CN105244029B CN201510560841.2A CN201510560841A CN105244029B CN 105244029 B CN105244029 B CN 105244029B CN 201510560841 A CN201510560841 A CN 201510560841A CN 105244029 B CN105244029 B CN 105244029B
- Authority
- CN
- China
- Prior art keywords
- word
- words
- wrong
- recognition
- general
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012805 post-processing Methods 0.000 title claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 64
- 239000013598 vector Substances 0.000 claims description 155
- 238000012549 training Methods 0.000 claims description 52
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 11
- 230000007613 environmental effect Effects 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 10
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 3
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 210000002268 wool Anatomy 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
Description
类1 | 类2 | 类3 | 类4 | 类5 |
查看一下 | 网银 | 邮政储蓄 | 详单 | 新加坡 |
查讯 | 个人网银 | 工商银行 | 通话详单 | 澳门 |
查看 | 网上银行 | 建设银行 | 通话记录 | 台湾 |
查 | 浦发 | 农业银行 | 详单查询 | 香港 |
查询 | 动态密码 | 农行 | 详 | 韩国 |
查清单 | 银行卡 | 储蓄卡 | 单是 | 内地 |
查的 | 签约 | 借记卡 | 单是吧 | 英国 |
旬 | 请问 | 信用卡 | 单是吗 | 9毛9 |
查寻到 | 证书版网银 | 邮政 | 前五个月 | 法国 |
寻找 | 手续费 | 银行 | 前一天 | 2块9毛9 |
a | ai | an | ang | ao | b | c | ch | d | e | ei | en | eng | |
a | - | 0.67 | 0.65 | 0.72 | 0.6 | 1 | 1 | 1 | 1 | 0.6 | 0.893 | 0.88 | 0.927 |
ai | 0.67 | - | 0.7 | 0.95 | 0.928 | 1 | 1 | 1 | 1 | 0.914 | 0.763 | 0.866 | 0.928 |
an | 0.654 | 0.699 | - | 0.6 | 0.938 | 1 | 1 | 1 | 1 | 0.954 | 0.944 | 0.67 | 0.832 |
ang | 0.716 | 0.95 | 0.6 | - | 0.793 | 1 | 1 | 1 | 1 | 0.972 | 0.971 | 0.877 | 0.737 |
b | ao | an | |
b | 0 | 1 | 1 |
ei | 1 | 0.976 | 0.944 |
c | 1 | 1 | 1 |
ai | 1 | 0.928 | 0.699 |
Claims (13)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510560841.2A CN105244029B (zh) | 2015-08-28 | 2015-08-28 | 语音识别后处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510560841.2A CN105244029B (zh) | 2015-08-28 | 2015-08-28 | 语音识别后处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105244029A CN105244029A (zh) | 2016-01-13 |
CN105244029B true CN105244029B (zh) | 2019-02-26 |
Family
ID=55041651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510560841.2A Active CN105244029B (zh) | 2015-08-28 | 2015-08-28 | 语音识别后处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105244029B (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105845130A (zh) * | 2016-03-30 | 2016-08-10 | 乐视控股(北京)有限公司 | 用于语音识别的声学模型训练方法及装置 |
CN107305541B (zh) * | 2016-04-20 | 2021-05-04 | 科大讯飞股份有限公司 | 语音识别文本分段方法及装置 |
CN107590121B (zh) * | 2016-07-08 | 2020-09-11 | 科大讯飞股份有限公司 | 文本规整方法及系统 |
CN106250364A (zh) * | 2016-07-20 | 2016-12-21 | 科大讯飞股份有限公司 | 一种文本修正方法及装置 |
CN106297797B (zh) * | 2016-07-26 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 语音识别结果纠错方法和装置 |
JP6597527B2 (ja) * | 2016-09-06 | 2019-10-30 | トヨタ自動車株式会社 | 音声認識装置および音声認識方法 |
CN108062954B (zh) * | 2016-11-08 | 2020-12-08 | 科大讯飞股份有限公司 | 语音识别方法和装置 |
CN108107457B (zh) * | 2016-11-24 | 2021-07-23 | 百度在线网络技术(北京)有限公司 | 用于获取位置信息的方法和装置 |
CN107590172B (zh) * | 2017-07-17 | 2020-06-05 | 北京捷通华声科技股份有限公司 | 一种大规模语音数据的核心内容挖掘方法及设备 |
CN107562718B (zh) * | 2017-07-24 | 2020-12-22 | 科大讯飞股份有限公司 | 文本规整方法及装置、存储介质、电子设备 |
CN107844481B (zh) * | 2017-11-21 | 2019-09-13 | 新疆科大讯飞信息科技有限责任公司 | 识别文本检错方法及装置 |
CN108010526B (zh) * | 2017-12-08 | 2021-11-23 | 北京奇虎科技有限公司 | 语音处理方法及装置 |
CN108255805B (zh) * | 2017-12-13 | 2022-02-25 | 讯飞智元信息科技有限公司 | 舆情分析方法及装置、存储介质、电子设备 |
CN108417210B (zh) * | 2018-01-10 | 2020-06-26 | 苏州思必驰信息科技有限公司 | 一种词嵌入语言模型训练方法、词语识别方法及系统 |
CN108509416B (zh) * | 2018-03-20 | 2022-10-11 | 京东方科技集团股份有限公司 | 句意识别方法及装置、设备和存储介质 |
CN108549637A (zh) | 2018-04-19 | 2018-09-18 | 京东方科技集团股份有限公司 | 基于拼音的语义识别方法、装置以及人机对话系统 |
CN108597502A (zh) * | 2018-04-27 | 2018-09-28 | 上海适享文化传播有限公司 | 基于对抗训练的领域语音识别训练方法 |
CN108595431B (zh) * | 2018-04-28 | 2020-09-25 | 海信集团有限公司 | 语音交互文本纠错方法、装置、终端及存储介质 |
CN109040482A (zh) * | 2018-08-09 | 2018-12-18 | 武汉优品楚鼎科技有限公司 | 证券领域的无人值守智能电话问询方法、系统及装置 |
CN109040481A (zh) * | 2018-08-09 | 2018-12-18 | 武汉优品楚鼎科技有限公司 | 证券领域的自动纠错智能电话问询方法、系统及装置 |
CN109242516A (zh) * | 2018-09-06 | 2019-01-18 | 北京京东尚科信息技术有限公司 | 处理服务单的方法和装置 |
CN109344253A (zh) * | 2018-09-18 | 2019-02-15 | 平安科技(深圳)有限公司 | 添加用户标签的方法、装置、计算机设备和存储介质 |
CN109920430A (zh) * | 2019-01-10 | 2019-06-21 | 上海言通网络科技有限公司 | 语音识别语义处理系统及其方法 |
CN110211571B (zh) * | 2019-04-26 | 2023-05-26 | 平安科技(深圳)有限公司 | 错句检测方法、装置及计算机可读存储介质 |
JP6718182B1 (ja) * | 2019-05-08 | 2020-07-08 | 株式会社インタラクティブソリューションズ | 誤変換辞書作成システム |
CN110265010A (zh) * | 2019-06-05 | 2019-09-20 | 四川驹马科技有限公司 | 基于百度语音的货车多人语音识别方法及系统 |
CN110807325B (zh) * | 2019-10-18 | 2023-05-26 | 腾讯科技(深圳)有限公司 | 谓词识别方法、装置及存储介质 |
CN113035175B (zh) * | 2021-03-02 | 2024-04-12 | 科大讯飞股份有限公司 | 一种语音文本重写模型构建方法、语音识别方法 |
CN116050391B (zh) * | 2022-11-17 | 2024-05-14 | 西安电子科技大学广州研究院 | 基于细分行业纠错词表的语音识别纠错方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1979638A (zh) * | 2005-12-02 | 2007-06-13 | 中国科学院自动化研究所 | 一种语音识别结果纠错方法 |
US20110004475A1 (en) * | 2009-07-02 | 2011-01-06 | Bellegarda Jerome R | Methods and apparatuses for automatic speech recognition |
CN103440865A (zh) * | 2013-08-06 | 2013-12-11 | 普强信息技术(北京)有限公司 | 语音识别的后处理方法 |
CN103942223A (zh) * | 2013-01-23 | 2014-07-23 | 北京百度网讯科技有限公司 | 一种对语言模型进行在线纠错的方法及系统 |
CN104182386A (zh) * | 2013-05-27 | 2014-12-03 | 华东师范大学 | 词对关系相似度的计算方法 |
-
2015
- 2015-08-28 CN CN201510560841.2A patent/CN105244029B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1979638A (zh) * | 2005-12-02 | 2007-06-13 | 中国科学院自动化研究所 | 一种语音识别结果纠错方法 |
US20110004475A1 (en) * | 2009-07-02 | 2011-01-06 | Bellegarda Jerome R | Methods and apparatuses for automatic speech recognition |
CN103942223A (zh) * | 2013-01-23 | 2014-07-23 | 北京百度网讯科技有限公司 | 一种对语言模型进行在线纠错的方法及系统 |
CN104182386A (zh) * | 2013-05-27 | 2014-12-03 | 华东师范大学 | 词对关系相似度的计算方法 |
CN103440865A (zh) * | 2013-08-06 | 2013-12-11 | 普强信息技术(北京)有限公司 | 语音识别的后处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105244029A (zh) | 2016-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105244029B (zh) | 语音识别后处理方法及系统 | |
CN106202153B (zh) | 一种es搜索引擎的拼写纠错方法及系统 | |
CN107291783B (zh) | 一种语义匹配方法及智能设备 | |
CN103646088B (zh) | 基于CRFs和SVM的产品评论细粒度情感要素提取 | |
CN101655837B (zh) | 一种对语音识别后文本进行检错并纠错的方法 | |
CN110717031A (zh) | 一种智能会议纪要生成方法和系统 | |
CN105956053B (zh) | 一种基于网络信息的搜索方法及装置 | |
CN105988990A (zh) | 用于汉语中的零指代消解的装置和方法以及模型训练方法 | |
CN106570180A (zh) | 基于人工智能的语音搜索方法及装置 | |
CN105912576A (zh) | 情感分类方法及系统 | |
CN107122349A (zh) | 一种基于word2vec‑LDA模型的文本主题词提取方法 | |
Khasawneh et al. | Sentiment analysis of Arabic social media content: a comparative study | |
CN109408806A (zh) | 一种基于英文语法规则的事件提取方法 | |
CN107832290B (zh) | 中文语义关系的识别方法及装置 | |
CN107526721B (zh) | 一种对电商产品评论词汇的歧义消除方法及装置 | |
CN102439660A (zh) | 基于置信度得分的语音标签方法和装置 | |
KR101836996B1 (ko) | 러프 셋을 이용한 형태소 품사 태깅 코퍼스 오류 자동 검출 장치 및 그 방법 | |
Simm et al. | Classification of short text comments by sentiment and actionability for voiceyourview | |
CN111488468A (zh) | 地理信息知识点抽取方法、装置、存储介质及计算机设备 | |
CN105609116A (zh) | 一种语音情感维度区域的自动识别方法 | |
CN109002803A (zh) | 一种基于智能手表的握笔姿势检测和汉字笔顺识别方法 | |
CN110362673B (zh) | 基于摘要语义分析的计算机视觉类论文内容判别方法及系统 | |
CN106548787B (zh) | 优化生词的评测方法及评测系统 | |
CN109346108B (zh) | 一种作业检查方法及系统 | |
WO2015099418A1 (ko) | 채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20170706 Address after: 230088, Hefei province high tech Zone, 2800 innovation Avenue, 288 innovation industry park, H2 building, room two, Anhui Applicant after: Anhui Puji Information Technology Co.,Ltd. Address before: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666 Applicant before: IFLYTEK Co.,Ltd. |
|
CB02 | Change of applicant information |
Address after: 230088, Hefei province high tech Zone, 2800 innovation Avenue, 288 innovation industry park, H2 building, room two, Anhui Applicant after: ANHUI IFLYTEK MEDICAL INFORMATION TECHNOLOGY CO.,LTD. Address before: 230088, Hefei province high tech Zone, 2800 innovation Avenue, 288 innovation industry park, H2 building, room two, Anhui Applicant before: Anhui Puji Information Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 230088 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei, Anhui Province Patentee after: Anhui Xunfei Medical Co.,Ltd. Address before: Room 288, H2 / F, phase II, innovation industrial park, 2800 innovation Avenue, high tech Zone, Hefei City, Anhui Province, 230088 Patentee before: ANHUI IFLYTEK MEDICAL INFORMATION TECHNOLOGY CO.,LTD. |
|
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 230088 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei, Anhui Province Patentee after: IFLYTEK Medical Technology Co.,Ltd. Address before: 230088 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei, Anhui Province Patentee before: Anhui Xunfei Medical Co.,Ltd. |