CN107341251A - 一种医药偏方与关键字的提取和处理方法 - Google Patents

一种医药偏方与关键字的提取和处理方法 Download PDF

Info

Publication number
CN107341251A
CN107341251A CN201710555383.2A CN201710555383A CN107341251A CN 107341251 A CN107341251 A CN 107341251A CN 201710555383 A CN201710555383 A CN 201710555383A CN 107341251 A CN107341251 A CN 107341251A
Authority
CN
China
Prior art keywords
keyword
text
medical
folk prescription
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710555383.2A
Other languages
English (en)
Inventor
石李虹
张鹏
王帅
刘沛丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Borui Tongyun Technology Co Ltd
Original Assignee
Jiangxi Borui Tongyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Borui Tongyun Technology Co Ltd filed Critical Jiangxi Borui Tongyun Technology Co Ltd
Priority to CN201710555383.2A priority Critical patent/CN107341251A/zh
Publication of CN107341251A publication Critical patent/CN107341251A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉一种医药偏方与关键字的提取和处理方法,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;终端发送搜索输入命令将文本和/或语音命令传输至服务端;服务端提取文字命令文本,服务端进行处理;服务端通过对文本进行自然分割、词库分割、词组分词的方式提取有效的关键字;服务器通过比对关键字。本发明能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。

Description

一种医药偏方与关键字的提取和处理方法
技术领域
本发明涉及软件方法,具体涉及一种医药偏方与关键字的提取和处理方法。
背景技术
目前国内老年人群在受教育程度上差异很大,对智能设备的接受程度也有很大不同,在输入文本上有大量的表述不清、错字、语序混乱问题,在终端的医药偏方推送中,往往不能够明确的得知用户的真实意图,因此,需要设计一种能够纠错、识别语音并高效筛选关键字进行文本推送的方法,以解决老年人群体使用终端带来的极大不便。
发明内容
本发明的目的在于克服现有技术中的缺陷,设计一种医药偏方与关键字的提取和处理方法,能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。
为实现上述目的,本发明所采用的技术方案是一种医药偏方与关键字的提取和处理方法,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;
具体的方法步骤为:
(1)终端发送搜索输入命令将文本和/或语音命令传输至服务端;
(2)服务端提取文字命令文本,将语音命令转换为文本,服务端的服务器对搜索命令进行处理;
(3)服务端通过对文字命令文本和语音命令转换的文本进行自然分割、词库分割、词组分词的方式提取有效的初级关键字;
(4)服务器同时对文字命令文本和语音命令转换的文本进行分字和纠错处理后,得到二级关键字;二级关键词优先为主要检索关键词,初级关键词为次要检索关键词组及非文本的目的判断,如分割出的标点符号及空格、标点符号不进入偏方搜索关键词范围。
(5)服务器通过比对初级关键字和二级关键字后进行关键字排序,按排序先后的关键字与数据库中的医药偏方文章对比后将搜索结果按对应的排序推送至客户端,为用户提供医药偏方信息。根据得出的关键词进行数据库中的文章搜索,命中关键词越多的文章推送权重越高,相同命中效果的文章根据文章浏览量、更新时间进行次级排序。
优选的,步骤(1)中,搜索输入命令包括输入法文本命令传输和语音输入音频命令传输;终端同时传输终端信息至服务端,包括终端位置、常使用位置信息。
优选的,步骤(2)中,将语音命令转换为文本过程中采用语音分析,其中语音分析优先采用普通话解析,同时根据步骤(1)上传的用户身份及所在地区方言进行解析,得出语音命令转换的文本。
语音分析软件采用第三方语音解析能力,可选用是科大讯飞股份有限公司的语音识别引擎等相关分析软件得到文本。也可以选择多个多个第三方的语音转文字系统服务多维转换得最终结果。
优选的,步骤(3)中自然分割的方式是以语气词、标点符号、空格符号、换行符作为首要分割条件对文本进行分割,以此为基础满足提取的关键词贴切终端的搜索意图。如文本“糖尿病应该食用哪些食物”,则系统优先划分为“糖尿病”“应该食用哪些”“食物”,确保贴切终端的索索意图。
优选的,步骤(3)中的词库分割方式是依靠中文词典数据库、终端历史行为词库、历史搜索词库、全平台热门搜索词库进行关键词组合分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”“应该食用”“食用哪些食物”“食用哪些”。
优选的,步骤(3)中的词组分词方式是利用终端的历史行为数据按照顺序优先原则得出关键搜索词组合即初级关键字,分析原则就是分割关键词按最少分割次数的分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”,分析出的结果为“糖尿病”“食用”“食物”,主要索引项以及这三个词的顺序组合,按照顺序优先原则得出关键搜索词组合,整个分析基本的原则就是分割关键词按最少的分割。最少次数分割原则为断句式分割方式,不做相同文字的多次组词处理。
优选的,终端的历史行为数据包含终端历史行为词库、历史搜索词库、全平台热门搜索词库,以及终端使用过程中通过内容标签记录用户行为的关键词数据,记录用户有效历史搜索关键词、记录全平台用户搜索关键词及热门搜索词数据。
优选的,步骤(4)中服务器的分字处理是将文本文本拆分为基本的字和/或词,将拆分的字词与服务端的数据库进行比对后得到二级关键词。如文本“糖尿病应该食用哪些食物”,分字处理后得到“糖”“尿”“病”“应该”“食”“用”“哪”“些”“食物”,然后去数据库中匹配。
优选的,步骤(4)中服务器的纠错处理是为了防止终端错误输入文字或语音转文字处理错误的因素;服务端对错别字进行处理分析时,首先通过近义词匹配来进行纠错,然后采用常见同音字判断词组是否存在,若存在则进行纠错替换。如“食物”,在文本或语音输入过程中可能会成为“事务”或“实物”“失误”等错误信息,通过纠错处理后,替换为正确的“食物”。
优选的,终端智能设备终端,包括手机、电脑及平板电脑;服务端通过有线和/或无线的方式与终端数据连接。
本发明的优点和有益效果在于:
医药偏方与关键字的提取和处理方法,能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。
附图说明
图1是本发明医药偏方与关键字的提取和处理方法的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1
如图1所示:本实施例为一种医药偏方与关键字的提取和处理方法,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;
具体的方法步骤为:
(1)终端发送搜索输入命令将文本和/或语音命令传输至服务端;
(2)服务端提取文字命令文本,将语音命令转换为文本,服务端的服务器对搜索命令进行处理;
(3)服务端通过对文字命令文本和语音命令转换的文本进行自然分割、词库分割、词组分词的方式提取有效的初级关键字;
(4)服务器同时对文字命令文本和语音命令转换的文本进行分字和纠错处理后,得到二级关键字;二级关键词优先为主要检索关键词,初级关键词为次要检索关键词组及非文本的目的判断,如分割出的标点符号及空格、标点符号不进入偏方搜索关键词范围。
(5)服务器通过比对初级关键字和二级关键字后进行关键字排序,按排序先后的关键字与数据库中的医药偏方文章对比后将搜索结果按对应的排序推送至客户端,为用户提供医药偏方信息。根据得出的关键词进行数据库中的文章搜索,命中关键词越多的文章推送权重越高,相同命中效果的文章根据文章浏览量、更新时间进行次级排序。
步骤(1)中,搜索输入命令包括输入法文本命令传输和语音输入音频命令传输;终端同时传输终端信息至服务端,包括终端位置、常使用位置信息。
步骤(2)中,将语音命令转换为文本过程中采用语音分析,其中语音分析优先采用普通话解析,同时根据步骤(1)上传的用户身份及所在地区方言进行解析,得出语音命令转换的文本。
语音分析软件采用第三方语音解析能力,可选用是科大讯飞股份有限公司的语音识别引擎等相关分析软件得到文本。
优选的,步骤(3)中自然分割的方式是以语气词、标点符号、空格符号、换行符作为首要分割条件对文本进行分割,以此为基础满足提取的关键词贴切终端的搜索意图。如文本“糖尿病应该食用哪些食物”,则系统优先划分为“糖尿病”“应该食用哪些”“食物”,确保贴切终端的索索意图。
优选的,步骤(3)中的词库分割方式是依靠中文词典数据库、终端历史行为词库、历史搜索词库、全平台热门搜索词库进行关键词组合分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”“应该食用”“食用哪些食物”“食用哪些”。
优选的,步骤(3)中的词组分词方式是利用终端的历史行为数据按照顺序优先原则得出关键搜索词组合即初级关键字,分析原则就是分割关键词按最少分割次数的分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”,分析出的结果为“糖尿病”“食用”“食物”,主要索引项以及这三个词的顺序组合,按照顺序优先原则得出关键搜索词组合,整个分析基本的原则就是分割关键词按最少的分割。最少次数分割原则为断句式分割方式,不做相同文字的多次组词处理。
终端的历史行为数据包含终端历史行为词库、历史搜索词库、全平台热门搜索词库,以及终端使用过程中通过内容标签记录用户行为的关键词数据,记录用户有效历史搜索关键词、记录全平台用户搜索关键词及热门搜索词数据。
步骤(4)中服务器的分字处理是将文本文本拆分为基本的字和/或词,将拆分的字词与服务端的数据库进行比对后得到二级关键词。如文本“糖尿病应该食用哪些食物”,分字处理后得到“糖”“尿”“病”“应该”“食”“用”“哪”“些”“食物”,然后去数据库中匹配。
步骤(4)中服务器的纠错处理是为了防止终端错误输入文字或语音转文字处理错误的因素;服务端对错别字进行处理分析时,首先通过近义词匹配来进行纠错,然后采用常见同音字判断词组是否存在,若存在则进行纠错替换。如“食物”,在文本或语音输入过程中可能会成为“事务”或“实物”“失误”等错误信息,通过纠错处理后,替换为正确的“食物”。
终端智能设备终端,包括手机、电脑及平板电脑;服务端通过有线和/或无线的方式与终端数据连接。
本实施例的有益效果在于:
医药偏方与关键字的提取和处理方法,能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种医药偏方与关键字的提取和处理方法,其特征在于,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;
具体的方法步骤为:
(1)终端发送搜索输入命令将文本和/或语音命令传输至服务端;
(2)服务端提取文字命令文本,将语音命令转换为文本,服务端的服务器对搜索命令进行处理;
(3)服务端通过对文字命令文本和语音命令转换的文本进行自然分割、词库分割、词组分词的方式提取有效的初级关键字;
(4)服务器同时对文字命令文本和语音命令转换的文本进行分字和纠错处理后,得到二级关键字;
(5)服务器通过比对初级关键字和二级关键字后进行关键字排序,按排序先后的关键字与数据库中的医药偏方文章对比后将搜索结果按对应的排序推送至客户端,为用户提供医药偏方信息。
2.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(1)中,搜索输入命令包括输入法文本命令传输和语音输入音频命令传输;终端同时传输终端信息至服务端,包括终端位置、常使用位置信息。
3.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(2)中,将语音命令转换为文本过程中采用语音分析,其中语音分析优先采用普通话解析,同时根据步骤(1)上传的用户身份及所在地区方言进行解析,得出语音命令转换的文本。
4.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(3)中自然分割的方式是以语气词、标点符号、空格符号、换行符作为首要分割条件对文本进行分割,以此为基础满足提取的关键词贴切终端的搜索意图。
5.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(3)中的词库分割方式是依靠中文词典数据库、终端历史行为词库、历史搜索词库、全平台热门搜索词库进行关键词组合分割。
6.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(3)中的词组分词方式是利用终端的历史行为数据按照顺序优先原则得出关键搜索词组合即初级关键字,分析原则就是分割关键词按最少分割次数的分割。
7.如权利要求6所述的医药偏方与关键字的提取和处理方法,其特征在于,终端的历史行为数据包含终端历史行为词库、历史搜索词库、全平台热门搜索词库,以及终端使用过程中通过内容标签记录用户行为的关键词数据,记录用户有效历史搜索关键词、记录全平台用户搜索关键词及热门搜索词数据。
8.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(4)中服务器的分字处理是将文本文本拆分为基本的字和/或词,将拆分的字词与服务端的数据库进行比对后得到二级关键词。
9.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(4)中服务器的纠错处理是为了防止终端错误输入文字或语音转文字处理错误的因素;服务端对错别字进行处理分析时,首先通过近义词匹配来进行纠错,然后采用常见同音字判断词组是否存在,若存在则进行纠错替换。
10.如权利要求1-9任一所述的医药偏方与关键字的提取和处理方法,其特征在于,终端智能设备终端,包括手机、电脑及平板电脑;服务端通过有线和/或无线的方式与终端数据连接。
CN201710555383.2A 2017-07-10 2017-07-10 一种医药偏方与关键字的提取和处理方法 Pending CN107341251A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710555383.2A CN107341251A (zh) 2017-07-10 2017-07-10 一种医药偏方与关键字的提取和处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710555383.2A CN107341251A (zh) 2017-07-10 2017-07-10 一种医药偏方与关键字的提取和处理方法

Publications (1)

Publication Number Publication Date
CN107341251A true CN107341251A (zh) 2017-11-10

Family

ID=60219735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710555383.2A Pending CN107341251A (zh) 2017-07-10 2017-07-10 一种医药偏方与关键字的提取和处理方法

Country Status (1)

Country Link
CN (1) CN107341251A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832442A (zh) * 2017-11-17 2018-03-23 陆光辉 一种中医药信息查询系统和方法
CN109243549A (zh) * 2018-07-11 2019-01-18 腾讯科技(深圳)有限公司 一种智能随访方法、装置及服务器
CN109360589A (zh) * 2018-10-25 2019-02-19 天水师范学院 一种体育赛事数据统计方法及系统
CN109979450A (zh) * 2019-03-11 2019-07-05 青岛海信电器股份有限公司 信息处理方法、装置及电子设备
CN110827801A (zh) * 2020-01-09 2020-02-21 成都无糖信息技术有限公司 一种基于人工智能的自动语音识别方法及系统
CN110880316A (zh) * 2019-10-16 2020-03-13 苏宁云计算有限公司 一种音频的输出方法和系统
CN111161706A (zh) * 2018-10-22 2020-05-15 阿里巴巴集团控股有限公司 交互方法、装置、设备和系统
CN111291088A (zh) * 2020-01-17 2020-06-16 安徽机器猫电子商务股份有限公司 一种基于从属关系的零件号智能搜索方法
CN117152778A (zh) * 2023-10-31 2023-12-01 安徽省立医院(中国科学技术大学附属第一医院) 一种基于ocr的医疗器械注册证识别方法、装置及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912872A (zh) * 2006-07-25 2007-02-14 北京搜狗科技发展有限公司 一种提取新词的方法和系统
CN101206673A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 网络搜索过程中关键词的智能纠错系统及方法
US20100161655A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute System for string matching based on segmentation method and method thereof
CN102930022A (zh) * 2012-10-31 2013-02-13 中国运载火箭技术研究院 面向用户的信息搜索引擎系统及方法
CN104281702A (zh) * 2014-10-22 2015-01-14 国家电网公司 基于电力关键词分词的数据检索方法及装置
CN106815195A (zh) * 2015-11-27 2017-06-09 方正国际软件(北京)有限公司 一种分词方法及装置、检索方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912872A (zh) * 2006-07-25 2007-02-14 北京搜狗科技发展有限公司 一种提取新词的方法和系统
CN101206673A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 网络搜索过程中关键词的智能纠错系统及方法
US20100161655A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute System for string matching based on segmentation method and method thereof
CN102930022A (zh) * 2012-10-31 2013-02-13 中国运载火箭技术研究院 面向用户的信息搜索引擎系统及方法
CN104281702A (zh) * 2014-10-22 2015-01-14 国家电网公司 基于电力关键词分词的数据检索方法及装置
CN106815195A (zh) * 2015-11-27 2017-06-09 方正国际软件(北京)有限公司 一种分词方法及装置、检索方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
B.GATOS: "A segmentation-free approach for keyword search in historical typewritten documents", 《IEEEXPLORE》 *
吴亮等: "基于关键词筛选分词算法的企业级搜索引擎", 《微型电脑应用》 *
欧振猛等: "中文分词算法在搜索引擎应用中的研究", 《计算机工程与应用》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832442A (zh) * 2017-11-17 2018-03-23 陆光辉 一种中医药信息查询系统和方法
CN109243549A (zh) * 2018-07-11 2019-01-18 腾讯科技(深圳)有限公司 一种智能随访方法、装置及服务器
CN109243549B (zh) * 2018-07-11 2022-05-20 腾讯科技(深圳)有限公司 一种智能随访方法、装置及服务器
CN111161706A (zh) * 2018-10-22 2020-05-15 阿里巴巴集团控股有限公司 交互方法、装置、设备和系统
CN109360589A (zh) * 2018-10-25 2019-02-19 天水师范学院 一种体育赛事数据统计方法及系统
CN109979450B (zh) * 2019-03-11 2021-12-07 海信视像科技股份有限公司 信息处理方法、装置及电子设备
CN109979450A (zh) * 2019-03-11 2019-07-05 青岛海信电器股份有限公司 信息处理方法、装置及电子设备
CN110880316A (zh) * 2019-10-16 2020-03-13 苏宁云计算有限公司 一种音频的输出方法和系统
CN110827801B (zh) * 2020-01-09 2020-04-17 成都无糖信息技术有限公司 一种基于人工智能的自动语音识别方法及系统
CN110827801A (zh) * 2020-01-09 2020-02-21 成都无糖信息技术有限公司 一种基于人工智能的自动语音识别方法及系统
CN111291088A (zh) * 2020-01-17 2020-06-16 安徽机器猫电子商务股份有限公司 一种基于从属关系的零件号智能搜索方法
CN117152778A (zh) * 2023-10-31 2023-12-01 安徽省立医院(中国科学技术大学附属第一医院) 一种基于ocr的医疗器械注册证识别方法、装置及介质
CN117152778B (zh) * 2023-10-31 2024-01-16 安徽省立医院(中国科学技术大学附属第一医院) 一种基于ocr的医疗器械注册证识别方法、装置及介质

Similar Documents

Publication Publication Date Title
CN107341251A (zh) 一种医药偏方与关键字的提取和处理方法
US11675977B2 (en) Intelligent system that dynamically improves its knowledge and code-base for natural language understanding
KR102163549B1 (ko) 선행사의 결정방법 및 장치
US9164983B2 (en) Broad-coverage normalization system for social media language
US9058322B2 (en) Apparatus and method for providing two-way automatic interpretation and translation service
US10803253B2 (en) Method and device for extracting point of interest from natural language sentences
US20180011830A1 (en) Annotation Assisting Apparatus and Computer Program Therefor
US20120303355A1 (en) Method and System for Text Message Normalization Based on Character Transformation and Web Data
CN107077843A (zh) 对话控制装置和对话控制方法
CN105760359B (zh) 问句处理系统及其方法
US10366173B2 (en) Device and method of simultaneous interpretation based on real-time extraction of interpretation unit
US20140214406A1 (en) Method and system of adding punctuation and establishing language model
US9063923B2 (en) Method for identifying the integrity of information
CN107844470A (zh) 一种语音数据处理方法及其设备
CN106528694A (zh) 基于人工智能的语义判定处理方法和装置
CN106021532B (zh) 关键词的显示方法和装置
KR101333485B1 (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
CN103164397B (zh) 汉哈电子辞典及其自动转译汉哈语的方法
CN110610003A (zh) 用于辅助文本标注的方法和系统
EP4080381A1 (en) Method and apparatus for generating patent summary information, and electronic device and medium
KR20150042533A (ko) 복합 문장 분석 장치, 이를 위한 기록매체
RU2595531C2 (ru) Способ и система генерирования определения слова на основе множественных источников
CN103164396B (zh) 使用汉维哈柯电子辞典自动转译汉维哈柯语的方法
Bell et al. A system for automatic broadcast news summarisation, geolocation and translation
US11520989B1 (en) Natural language processing with keywords

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171110

WD01 Invention patent application deemed withdrawn after publication