CN114556328A - 数据处理方法、装置、电子设备和存储介质 - Google Patents
数据处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114556328A CN114556328A CN201980101007.3A CN201980101007A CN114556328A CN 114556328 A CN114556328 A CN 114556328A CN 201980101007 A CN201980101007 A CN 201980101007A CN 114556328 A CN114556328 A CN 114556328A
- Authority
- CN
- China
- Prior art keywords
- target
- word
- candidate
- dictionary
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种数据处理方法、装置、电子设备和存储介质。其中,所述方法包括:从目标文档中获取目标关键词(201);根据所述目标关键词获取相关的网页文档,从所述网页文档中确定至少一个目标词;所述目标词不属于预设的词典(202);根据所述至少一个目标词更新所述词典,利用更新后的所述词典训练语言模型;所述语言模型用于对包括所述目标关键词或所述目标词的语音数据进行文本识别,得到识别结果;所述识别结果用于在所述语音数据被播放时进行呈现(203)。
Description
PCT国内申请,说明书已公开。
Claims (11)
- PCT国内申请,权利要求书已公开。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/130650 WO2021134524A1 (zh) | 2019-12-31 | 2019-12-31 | 数据处理方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114556328A true CN114556328A (zh) | 2022-05-27 |
Family
ID=76686075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980101007.3A Pending CN114556328A (zh) | 2019-12-31 | 2019-12-31 | 数据处理方法、装置、电子设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114556328A (zh) |
WO (1) | WO2021134524A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115394293A (zh) * | 2022-08-08 | 2022-11-25 | 湖北星纪时代科技有限公司 | 对话系统和用于实现对话的方法 |
CN115563375A (zh) * | 2022-09-29 | 2023-01-03 | 北京海泰方圆科技股份有限公司 | 一种文档索引的更新方法、装置、设备和介质 |
CN116108834A (zh) * | 2023-04-10 | 2023-05-12 | 中国民用航空飞行学院 | 交互式用户词典构建方法、装置和设备 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743112B (zh) * | 2021-08-24 | 2023-09-12 | 北京百度网讯科技有限公司 | 关键词的提取方法、装置、电子设备及可读存储介质 |
CN114170856B (zh) * | 2021-12-06 | 2024-03-12 | 网易有道信息技术(北京)有限公司 | 用机器实施的听力训练方法、设备及可读存储介质 |
CN114186552B (zh) * | 2021-12-13 | 2023-04-07 | 北京百度网讯科技有限公司 | 文本分析方法、装置、设备及计算机存储介质 |
CN115344787B (zh) * | 2022-08-23 | 2023-07-04 | 华南师范大学 | 一种多粒度推荐方法、系统、装置及存储介质 |
CN115618397B (zh) * | 2022-12-19 | 2023-03-03 | 深圳市研强物联技术有限公司 | 一种录音笔语音加密方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106033462B (zh) * | 2015-03-19 | 2019-11-15 | 科大讯飞股份有限公司 | 一种新词发现方法及系统 |
JP6526608B2 (ja) * | 2016-09-06 | 2019-06-05 | 株式会社東芝 | 辞書更新装置およびプログラム |
CN108804512B (zh) * | 2018-04-20 | 2020-11-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
CN108920473B (zh) * | 2018-07-04 | 2022-08-09 | 中译语通科技股份有限公司 | 一种基于同类词与同义词替换的数据增强机器翻译方法 |
CN109783649B (zh) * | 2019-01-02 | 2023-01-24 | 腾讯科技(深圳)有限公司 | 一种领域词典生成方法及装置 |
-
2019
- 2019-12-31 CN CN201980101007.3A patent/CN114556328A/zh active Pending
- 2019-12-31 WO PCT/CN2019/130650 patent/WO2021134524A1/zh active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115394293A (zh) * | 2022-08-08 | 2022-11-25 | 湖北星纪时代科技有限公司 | 对话系统和用于实现对话的方法 |
CN115563375A (zh) * | 2022-09-29 | 2023-01-03 | 北京海泰方圆科技股份有限公司 | 一种文档索引的更新方法、装置、设备和介质 |
CN116108834A (zh) * | 2023-04-10 | 2023-05-12 | 中国民用航空飞行学院 | 交互式用户词典构建方法、装置和设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2021134524A1 (zh) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114556328A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
US20170206897A1 (en) | Analyzing textual data | |
CN108287858B (zh) | 自然语言的语义提取方法及装置 | |
KR101130444B1 (ko) | 기계번역기법을 이용한 유사문장 식별 시스템 | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
CN106570180B (zh) | 基于人工智能的语音搜索方法及装置 | |
CN110276023B (zh) | Poi变迁事件发现方法、装置、计算设备和介质 | |
WO2018045646A1 (zh) | 基于人工智能的人机交互方法和装置 | |
WO2020103899A1 (zh) | 用于生成图文信息的方法和用于生成图像数据库的方法 | |
KR102041621B1 (ko) | 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법 | |
CN111178076B (zh) | 命名实体识别与链接方法、装置、设备及可读存储介质 | |
CN111783471B (zh) | 自然语言的语义识别方法、装置、设备及存储介质 | |
WO2022134779A1 (zh) | 人物动作相关数据的提取方法、装置、设备及存储介质 | |
CN111126084B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
EP3550449A1 (en) | Search method and electronic device using the method | |
CN112560510A (zh) | 翻译模型训练方法、装置、设备及存储介质 | |
US11893813B2 (en) | Electronic device and control method therefor | |
CN110647613A (zh) | 一种课件构建方法、装置、服务器和存储介质 | |
CN109635125B (zh) | 一种词汇图谱搭建方法及电子设备 | |
CN110020429A (zh) | 语义识别方法及设备 | |
CN114430832A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN115858776B (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 | |
CN115134660A (zh) | 视频剪辑方法、装置、计算机设备及存储介质 | |
CN114241279A (zh) | 图文联合纠错方法、装置、存储介质及计算机设备 | |
CN110276001B (zh) | 盘点页识别方法、装置、计算设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |