CN113704406B - 一种流行缩略语的中文释义匹配系统与方法 - Google Patents
一种流行缩略语的中文释义匹配系统与方法 Download PDFInfo
- Publication number
- CN113704406B CN113704406B CN202111006701.2A CN202111006701A CN113704406B CN 113704406 B CN113704406 B CN 113704406B CN 202111006701 A CN202111006701 A CN 202111006701A CN 113704406 B CN113704406 B CN 113704406B
- Authority
- CN
- China
- Prior art keywords
- screening
- terminal
- abbreviation
- server
- compiling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
Abstract
一种流行缩略语的中文释义匹配系统,其特征在于包括中央计算机、筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组、查询服务器。一种流行缩略语的中文释义匹配方法,其利用流行缩略语的中文释义匹配系统以进行,其特征在于,包括以下步骤:原始信息搜集步骤、筛选步骤、编制步骤、查询步骤、返查步骤、总结步骤。
Description
技术领域
本发明涉及缩略语的分析和查询技术领域,尤其涉及一种流行缩略语的中文释义匹配系统与方法。
背景技术
英语由于其本身不够简略,很多科技或者法律等学术名称难以很短就说清,因此,英文行文中缩略语大行其道,这一方面对于英语国家人员节约输入和读取精力,但对于非英语母语国家人员来讲,有很大的理解困难,例如ASAP,英语国家人员都理解是as soon aspossible,非英语母语国家人员则不明所以。介于英语缩略语在科技、法律、医疗、商业信函中的广泛使用,为非英语母语国家人员提供缩略语的查询和翻译功能刻不容缓。
但是现有技术中鲜有这种软件或技术,一般缩略语查询多依附于词典,或者是某电子词典的一部分,或者最多是某词典的词库,也有将缩略语单独列出进行查询的一些软件,但是这些软件或系统,明显内容不足。
缩略语与词汇查询有着非常大的不同,一般词汇内容较为固定,如果要查询词汇,95-98%以上的内容都可以靠词典或者电子词典本身搞定,但是缩略词则很难,一是缩略词的变化很快,往往一个月就可以产生数以千计的新缩略语,固定词库很难应付其高速增长的态势,二是缩略语的查询比较难,往往需要结合上下文,语境,其技术领域的说明才能确定到底是哪一个具体含义。例如BT、ZT、PMP等缩略语,其在不同领域都有不同含义,有时一个缩略词的含义有十几种,这为查询确认带来了很大困难。还有一个现有技术的不足,是在用户发现没有该要查询的含义时,系统可以利用该发现直接丰富词库,而现有技术的查询往往不具备这样的功能,导致词库只能由管理人员更新,浪费了查询者的参与意愿。
发明内容
本发明的第一目的是解决现有技术中所存在的没有有效又全面地查询缩略语的中文释义的有效系统,而设计的。而且系统经过尽心设计,充分地适合互联网时代的情况,大量地吸纳并筛选新的缩略语,并周期性地经过审核和编辑,有效地加入词库。同时,本申请还有效地利用了读者的增补意愿,将查询不到的词直接纳入审核,使得用户的参与意愿得到了充分尊重,词库的建设也更有针对性。
本申请要求保护一种流行缩略语的中文释义匹配系统,其特征在于:包括中央计算机、筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组、查询服务器。
筛选服务器从互联网获取数据,用于从互联网获取数据中筛选疑似缩略语信息并生成初步条目。
基础服务器存储有缩略语释义条目,缩略语释义条目有预加载的部分和后来加入的部分,缩略语释义条目包含缩略语、英文全称、中文释义、摘要,摘要包含缩略语的定义、作用、由来、用途、技术领域的说明,且不少于150字。
筛选终端组包含若干个筛选终端,每个筛选终端用于给出初步条目是否属于缩略语的判断意见。
编制终端组包含若干个编制终端,每个编制终端用于将筛选终端确认的缩略语条目按照缩略语释义条目进行规范编写。
查询终端组包含若干个查询终端,每个查询终端用于查询人员从基础服务器中查询和确认缩略语释义条目。
查询服务器接收所有查询终端的查询行为数据,并如实记录。
进一步地,每一个筛选终端、编制终端和查询终端均是具有需要身份认证的智能手机或PDA,每一个筛选终端和查询终端均只允许特定的一个认证人员登录;每一个编制终端允许不特定的认证人员登录,但登录时必须输入自身的身份码。
所述缩略语是英文缩略语,摘要为中文且可选地包含英文。
基础服务器和筛选服务器均自带计算模块,中央计算机全部或补充地处理筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组之间的计算或数据处理操作。
中央计算机配有计算用的足量缓冲存储器,以及至少一台能自动按指示向互联网发送邮件的PC终端。
一种流行缩略语的中文释义匹配方法,其利用如前所述的一种流行缩略语的中文释义匹配系统以进行,其特征在于,包括以下步骤。
(1)原始信息搜集步骤:由中央计算机周期性地搜集疑似缩略语的原始字符串信息,并将其记录到筛选服务器的预收录存储区;每24h搜集不少于500-1000条;该疑似缩略语至少包含一个连续英文字符串和多个连续英文单词,连续英文字符串至少包含两个大写英文字母,多个连续英文单词中至少两个连续单词的首字母存在于连续英文字符串中,并且以同样顺序连续存在。
(2)筛选步骤:中央计算机指示筛选服务器,将每天新增的原始字符串信息,发送至随机的筛选终端以筛选,每一个筛选终端在接收到原始字符串信息后,调取并参考基础服务器中已有的同样的或者相似的缩略语的连续字符串,判断是否是新的有效的缩略语,如果不是,指示筛选服务器予以删除,如果是,指示筛选服务器将该原始字符串信息存入永久存储区,并将该原始字符串信息发送至某一个编制终端;每天24时前,确保前一天新增的原始字符串信息全部得到筛选。
(3)编制步骤:当某随机的编制终端接到判定为是的原始字符串信息时,将其按照缩略语、英文全称、中文释义、摘要的顺序编制为适于基础服务器存储的缩略语条目,并经另一台随机的编制终端修改确认,将缩略语正式条目发送至基础服务器,存储为缩略语释义条目。
(4)查询步骤:使用人使用某一台查询终端,输入欲查询的缩略语以查询,基础服务器向该查询终端推送与该缩略语相符的一个或多个缩略语条目,并由查询终端确认,当查到正确释义时,终止查询,当没有找到正确释义时,查询人填写该缩略语的可能英文全称和可能释义,生成返查缩略语释义并将其推送至中央计算机;并且查询终端作出的所有查询行为,都记录且送至查询服务器存储。
(5)返查步骤:对于返查缩略语释义,将其发送至筛选服务器的返查存储区存储,并按照步骤(2)同样的操作送至筛选终端进行筛选,并按照步骤(2)-(3)顺序执行。
(6)总结步骤:当匹配系统运行1-3月时,分析查询服务器的结果,并统计查询到的,没查到的以及返查缩略语释义被确认的比例数据,生成匹配报告,并上传至查询服务器以及所有的筛选终端、编制终端和查询终端。
进一步地,针对于步骤(2)、(3)中向筛选终端和编制终端发送工作,每次随机地向筛选终端或编制终端选取一个并发送工作,直至全部筛选终端或编制终端都执行过一次工作,重复此过程;步骤(3)中编制终端的编制工作附加摘要的中文翻译。
本发明的优点是,主要可以分为以下几点,一是设置了一套专门的缩略语查询系统,查询缩略语的准确度,全面性都有保证,现有技术中并无单纯缩略语的系统,这一点是明显进步。二是将缩略语的编制工作有效分解,现有技术中即使有缩略语词库,其也都是由管理人员人工编制的,本申请将其编制过程分为,自动收集,初步判断,确定编制,而且还给编制提出了全面妥善的编制格式,使得编制和查询都更加有效。三是查询方便,在具有终端时,可以查询,系统会推送相关的以及解释,可以轻松找出对应的词,而不像现有技术,干瘪的词库式查询往往不能解决问题,查询者往往需要调用搜索引擎,并反复比较不同的网页和文献,才能确定一个缩略语的正确释义,这一点本申请填补了空白,具有显著的进步。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的系统主要部件示意图。
附图标记:1中央计算机、2筛选服务器、3基础服务器、4筛选终端组、5编制终端组、6查询终端组、7查询服务器。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
实施例1
一种流行缩略语的中文释义匹配系统,其特征在于:包括中央计算机、筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组、查询服务器。
这里的终端都是一样规格的智能手机或PDA,或者类似物,也可以用兼容设备代替,每台设备至少具备指纹或者掌纹验证功能,或者人脸识别,各种服务器是整台商用服务器,或者是某大型服务器的分配的部分存储空间。
筛选服务器从互联网获取数据,用于从互联网获取数据中筛选疑似缩略语信息并生成初步条目。这里的初步条目是疑似缩略语内容,一般而言,至少包括含两个大写字母的英问字符串,因为一般只有一个大写字母的缩略语很少见,然后其前或者后面有英问全称,即每个字母的具体单词,例如呼吸机相关性肺炎(ventilator associated pneumonia,VAP),但是经常会出现,不是取严格的每个首字母成缩略语,如双相气道正压(bilevelpossitive airway pressure,BiPAP),因此,一般只要连续2-3个字符是与后面的单词首字母连续对应,即可认定为疑似情况。
基础服务器存储有缩略语释义条目,缩略语释义条目有预加载的部分和后来加入的部分,缩略语释义条目包含缩略语、英文全称、中文释义、摘要,摘要包含缩略语的定义、作用、由来、用途、技术领域的说明,且不少于150字。这里的释义,一般都是指英问缩略语的释义。这里的每一个具体项目,都可以设置最长或最短的限制,例如缩略语不长于20字符,定义不少于15字,不多于30字。
筛选终端组包含若干个筛选终端,每个筛选终端用于给出初步条目是否属于缩略语的判断意见。为了保证筛选任务到人,一般需要在使用前进行指纹、人脸或者身份码的验证,不允许不相干人员进行互动,在有任务需要处理时,系统会同时同时给该用户手机发出短信或者各类SNS提示信息。为了保证工作被及时执行,可以在一个终端若干时间不响应后,不再等待,而是将工作发给另外的终端,例如等待30min。
编制终端组包含若干个编制终端,每个编制终端用于将筛选终端确认的缩略语条目按照缩略语释义条目进行规范编写。为了保证编制任务到人,一般需要在使用前进行指纹、人脸或者身份码的验证,不允许不相干人员进行互动,在有任务需要处理时,系统会同时同时给该用户手机发出短信或者各类SNS提示信息。编制终端的用户一般是经过特殊培训的教师或类似人员,其经过了系统的培训,词汇量足够,对缩略词的编制有更强的敏感性,编制终端所工作的按时间或者按次的酬劳也要高于筛选终端。
对于筛选终端和编制终端,每一个筛选终端和编制终端的响应工作次数,每次筛选、和编制行为都算工作一次,例如可将当前响应工作次数最少的筛选终端和编制终端号码列入当前活跃列表。例如其他筛选终端均响应了8次以上,有50个筛选终端仅响应了7次,则这些列入当前活跃列表,下次有筛选任务优先从这些终端中选取,而且这个列表是动态变化,这种设定,对于大多数教学和管理的人力资源可能是兼职的当下,可以说最大限度地平坦了人力资源,当然如果某终端使用者不怕辛苦,希望多得酬劳,也可以要求多分配任务,这可以在系统中进行设定。
查询终端组包含若干个查询终端,每个查询终端用于查询人员从基础服务器中查询和确认缩略语释义条目。为了保证查询功能不被额外的人所使用,一般需要在使用前进行指纹、人脸或者身份码的验证,不允许不相干人员进行互动,在有任务需要处理时,系统会同时同时给该用户手机发出短信或者各类SNS提示信息。
查询服务器接收所有查询终端的查询行为数据,并如实记录。查询服务器记录所有查询终端的所有行为的历史信息。这样的记录使得所有查询行为的历史有迹可循。
进一步地,每一个筛选终端、编制终端和查询终端均是具有需要身份认证的智能手机或PDA,每一个筛选终端和查询终端均只允许特定的一个认证人员登录;每一个编制终端允许不特定的认证人员登录,但登录时必须输入自身的身份码。
所述缩略语是英文缩略语,摘要为中文且可选地包含英文。
基础服务器和筛选服务器均自带计算模块,中央计算机全部或补充地处理筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组之间的计算或数据处理操作。
中央计算机配有计算用的足量缓冲存储器,以及至少一台能自动按指示向互联网发送邮件的PC终端。
每一个终端均是具有需要身份认证的智能手机或PDA,每一个终端均只允许特定的一个认证人员登录;每一个编制终端要求更高,登录时必须输入自身的身份码,该身份码例如是必须包含数字,英文字母和特殊字符,且不得少于8位字符。
中央计算机配有计算用的足量缓冲存储器,以及至少一台能自动按指示向互联网发送邮件的PC终端。这里可以是定期向筛选和编制人员的预定邮箱发送具体工作情况,以及向查询人员发送查询历史记录,方便对照和确认。
实施例2
一种流行缩略语的中文释义匹配方法,其利用如前所述的一种流行缩略语的中文释义匹配系统以进行,其特征在于,包括以下步骤。
(1)原始信息搜集步骤:由中央计算机周期性地搜集疑似缩略语的原始字符串信息,并将其记录到筛选服务器的预收录存储区;每24h搜集不少于500-1000条,例如600、700、800、900条;该疑似缩略语至少包含一个连续英文字符串和多个连续英文单词,连续英文字符串至少包含两个大写英文字母,多个连续英文单词中至少两个连续单词的首字母存在于连续英文字符串中,并且以同样顺序连续存在。介于互联网的很多信息并不规范,这里的规则不宜过于严苛,以免漏掉大量本来可以进入筛选的信息。从格式上,一般全称出现在之前或之后,以逗号隔开或者放在括号内。这里的缩略语是指医疗和护理领域的缩略语,如HIV、HBV、AIDS等。
(2)筛选步骤:中央计算机指示筛选服务器,将每天新增的原始字符串信息,发送至随机的筛选终端以筛选,每一个筛选终端在接收到原始字符串信息后,调取并参考基础服务器中已有的同样的或者相似的缩略语的连续字符串,判断是否是新的有效的缩略语,如果不是,指示筛选服务器予以删除,如果是,则指示筛选服务器将该原始字符串信息存入永久存储区,并将该原始字符串信息发送至某一个编制终端;每天24时前,确保前一天新增的原始字符串信息全部得到筛选。
(3)编制步骤:当某随机的编制终端接到判定为是的原始字符串信息时,将其按照缩略语、英文全称、中文释义、摘要的顺序编制为适于基础服务器存储的缩略语条目,并经另一台随机的编制终端修改确认,将缩略语正式条目发送至基础服务器,存储为缩略语释义条目。该编制人员一般均经过严格培训,对于如果编制规范的缩略语条目至少人均进行过800-1000条的练习和研讨。一般而言,这里仅使用朗文双解或者牛津双解上的词汇解释,而不使用过于冷僻的词汇,例如《了不起的盖茨比》上的大量生僻词。
(4)查询步骤:使用人使用某一台查询终端,输入欲查询的缩略语以查询,基础服务器向该查询终端推送与该缩略语相符的一个或多个缩略语条目,并由查询终端确认,当查到正确释义时,终止查询,当没有找到正确释义时,查询人填写该缩略语的可能英文全称和可能释义,生成返查缩略语释义并将其推送至中央计算机;并且查询终端作出的所有查询行为,都记录且送至查询服务器存储。查询终端可以作为系统盈利点,例如在规定时间内,必须具有会员资格才能进行查询,会员资格例如是每月100-300元购得,如果每月进行多于500次以上的查询,则每多查100条,则多付款100元等。
(5)返查步骤:对于返查缩略语释义,将其发送至筛选服务器的返查存储区存储,并按照步骤(2)同样的操作送至筛选终端进行筛选,并按照步骤(2)-(3)顺序执行。这里返查的缩略语释义一般要求与原始字符串信息有类似的格式,这里的空白信息可以要求查询终端给予,也可以由筛选服务器根据预设规则从互联网搜寻信息以填充。
(6)总结步骤:当匹配系统运行1-3月时,分析查询服务器的结果,并统计查询到的,没查到的以及返查缩略语释义被确认的比例数据,生成匹配报告,并上传至查询服务器以及所有的筛选终端、编制终端和查询终端。例如是每月都总结。
进一步地,针对于步骤(2)、(3)中向筛选终端和编制终端发送工作,每次随机地向筛选终端或编制终端选取一个并发送工作,直至全部筛选终端或编制终端都执行过一次工作,重复此过程,这样可以保证每个筛选或编制终端工作量持平,当某终端自动要求更多的工作时,可按照规则一定程度上优先推送,例如某编制终端要求每周工作条目不少于100条,则可在其满足条件之前,一直给其推送,或者一直给其加倍推送;步骤(3)中编制终端的编制工作附加摘要的中文翻译。
实施例3
其他类似实施例2,针对于步骤(2)、(3)中选取筛选或编制终端发送工作,发送筛选或编制的工作请求,是按照终端编号从小到大循环发送请求,或者是按照从大到小,或者随机顺序放松。这样每一个终端都工作一次,在一个周期中。使得工作需求尽量平均。
这里的缩略语是指生物生化领域的缩略语,如DNA、RNA、HbsAg、PCR等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书所限定的保护范围为准。
Claims (3)
1.一种流行缩略语的中文释义匹配系统,其特征在于:
包括中央计算机、筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组、查询服务器;
筛选服务器从互联网获取数据,用于从互联网获取数据中筛选疑似缩略语信息并生成初步条目;
基础服务器存储有缩略语释义条目,缩略语释义条目有预加载的部分和后来加入的部分,缩略语释义条目包含缩略语、英文全称、中文释义、摘要,摘要包含缩略语的定义、作用、由来、用途、技术领域的说明,且不少于150字;
筛选终端组包含若干个筛选终端,每个筛选终端用于给出初步条目是否属于缩略语的判断意见;
编制终端组包含若干个编制终端,每个编制终端用于将筛选终端确认的缩略语条目按照缩略语释义条目进行规范编写;
查询终端组包含若干个查询终端,每个查询终端用于查询人员从基础服务器中查询和确认缩略语释义条目;
查询服务器接收所有查询终端的查询行为数据,并如实记录;
每一个筛选终端、编制终端和查询终端均是具有需要身份认证的智能手机或PDA,每一个筛选终端和查询终端均只允许特定的一个认证人员登录;每一个编制终端允许不特定的认证人员登录,但登录时必须输入自身的身份码;
所述缩略语是英文缩略语,摘要为中文且可选地包含英文;
基础服务器和筛选服务器均自带计算模块,中央计算机全部或补充地处理筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组之间的计算或数据处理操作;
中央计算机配有计算用的足量缓冲存储器,以及至少一台能自动按指示向互联网发送邮件的PC终端。
2.一种流行缩略语的中文释义匹配方法,其利用如前权利要求1所述的一种流行缩略语的中文释义匹配系统以进行,其特征在于,包括以下步骤:
(1)原始信息搜集步骤:由中央计算机周期性地搜集疑似缩略语的原始字符串信息,并将其记录到筛选服务器的预收录存储区;每24h搜集不少于500条;该疑似缩略语至少包含一个连续英文字符串和多个连续英文单词,连续英文字符串至少包含两个大写英文字母,多个连续英文单词中至少两个连续单词的首字母存在于连续英文字符串中,并且以同样顺序连续存在;
(2)筛选步骤:中央计算机指示筛选服务器,将每天新增的原始字符串信息,发送至随机的筛选终端以筛选,每一个筛选终端在接收到原始字符串信息后,调取并参考基础服务器中已有的同样的或者相似的缩略语的连续字符串,判断是否是新的有效的缩略语,如果不是,指示筛选服务器予以删除,如果是,则指示筛选服务器将该原始字符串信息存入永久存储区,并将该原始字符串信息发送至某一个编制终端;每天24时前,确保前一天新增的原始字符串信息全部得到筛选;
(3)编制步骤:当某随机的编制终端接到判定为是的原始字符串信息时,将其按照缩略语、英文全称、中文释义、摘要的顺序编制为适于基础服务器存储的缩略语条目,并经另一台随机的编制终端修改确认,将缩略语正式条目发送至基础服务器,存储为缩略语释义条目;
(4)查询步骤:使用人使用某一台查询终端,输入欲查询的缩略语以查询,基础服务器向该查询终端推送与该缩略语相符的一个或多个缩略语条目,并由查询终端确认,当查到正确释义时,终止查询,当没有找到正确释义时,查询人填写该缩略语的可能英文全称和可能释义,生成返查缩略语释义并将其推送至中央计算机;并且查询终端作出的所有查询行为,都记录且送至查询服务器存储;
(5)返查步骤:对于返查缩略语释义,将其发送至筛选服务器的返查存储区存储,并按照步骤(2)同样的操作送至筛选终端进行筛选,并按照步骤(2)-(3)顺序执行;
(6)总结步骤:当匹配系统运行1-3个月时,分析查询服务器的结果,并统计查询到的,没查到的以及返查缩略语释义被确认的比例数据,生成匹配报告,并上传至查询服务器以及所有的筛选终端、编制终端和查询终端。
3.如权利要求2所述的一种流行缩略语的中文释义匹配方法,其特征在于:
针对于步骤(2)、(3)中向筛选终端和编制终端发送工作,每次随机地向筛选终端或编制终端选取一个并发送工作,直至全部筛选终端或编制终端都执行过一次工作,重复此过程;
步骤(3)中编制终端的编制工作附加摘要的中文翻译。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111006701.2A CN113704406B (zh) | 2021-08-30 | 2021-08-30 | 一种流行缩略语的中文释义匹配系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111006701.2A CN113704406B (zh) | 2021-08-30 | 2021-08-30 | 一种流行缩略语的中文释义匹配系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113704406A CN113704406A (zh) | 2021-11-26 |
CN113704406B true CN113704406B (zh) | 2023-06-30 |
Family
ID=78655117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111006701.2A Active CN113704406B (zh) | 2021-08-30 | 2021-08-30 | 一种流行缩略语的中文释义匹配系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113704406B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117555995B (zh) * | 2024-01-11 | 2024-04-12 | 北京领初医药科技有限公司 | 一种分级式缩略语句匹配确认方法及系统 |
CN117555996B (zh) * | 2024-01-11 | 2024-04-12 | 北京领初医药科技有限公司 | 一种一体化文本管理维护方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1983271A (zh) * | 2005-12-16 | 2007-06-20 | 国际商业机器公司 | 用于定义和翻译聊天缩略语的系统和方法 |
CN101676898A (zh) * | 2008-09-17 | 2010-03-24 | 中国科学院自动化研究所 | 一种借助网络知识辅助的汉英机构名翻译方法及装置 |
CN106528835A (zh) * | 2016-11-18 | 2017-03-22 | 百度在线网络技术(北京)有限公司 | 信息获取方法和装置 |
CN107729327A (zh) * | 2017-09-30 | 2018-02-23 | 联想(北京)有限公司 | 一种释义方法及一种释义装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7478033B2 (en) * | 2004-03-16 | 2009-01-13 | Google Inc. | Systems and methods for translating Chinese pinyin to Chinese characters |
US20110314003A1 (en) * | 2010-06-17 | 2011-12-22 | Microsoft Corporation | Template concatenation for capturing multiple concepts in a voice query |
-
2021
- 2021-08-30 CN CN202111006701.2A patent/CN113704406B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1983271A (zh) * | 2005-12-16 | 2007-06-20 | 国际商业机器公司 | 用于定义和翻译聊天缩略语的系统和方法 |
CN101676898A (zh) * | 2008-09-17 | 2010-03-24 | 中国科学院自动化研究所 | 一种借助网络知识辅助的汉英机构名翻译方法及装置 |
CN106528835A (zh) * | 2016-11-18 | 2017-03-22 | 百度在线网络技术(北京)有限公司 | 信息获取方法和装置 |
CN107729327A (zh) * | 2017-09-30 | 2018-02-23 | 联想(北京)有限公司 | 一种释义方法及一种释义装置 |
Non-Patent Citations (2)
Title |
---|
基于机器学习方法与搜索引擎验证的缩略语预测;焦妍,王厚峰;中国计算语言学研究前沿进展;全文 * |
基于网络的词典辅助编纂及生成系统(Ⅲ)――工作流和词典项目管理;刘辉;;沈阳师范大学学报(自然科学版)(01);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113704406A (zh) | 2021-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113704406B (zh) | 一种流行缩略语的中文释义匹配系统与方法 | |
CN100555266C (zh) | 电子邮件消息传递方法及系统 | |
CN101816000B (zh) | 用于部分输入的搜索查询的自动完成和自动输入法校正 | |
CN102317936B (zh) | 识别评论以连同文档一起示出 | |
US8095547B2 (en) | Method and apparatus for detecting spam user created content | |
CN112631997B (zh) | 数据处理方法、装置、终端及存储介质 | |
EP2570974A1 (en) | Automatic crowd sourcing for machine learning in information extraction | |
CN101958848B (zh) | 具有协作约束的社交社区生成的回答系统 | |
EP1990740A1 (en) | Schema matching for data migration | |
CN109508458B (zh) | 法律实体的识别方法及装置 | |
US20070265832A1 (en) | Updating dictionary during application installation | |
US20110231411A1 (en) | Topic Word Generation Method and System | |
US8793120B1 (en) | Behavior-driven multilingual stemming | |
CN1896990A (zh) | 类别设定的支持方法和装置 | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
CN103020119A (zh) | 将纸版简历转化为电子版的转化方法、装置与系统 | |
CN111191105B (zh) | 政务信息的搜索方法、装置、系统、设备及存储介质 | |
CN110781183A (zh) | Hive数据库中增量数据的处理方法、装置以及计算机设备 | |
CN115840808B (zh) | 科技项目咨询方法、装置、服务器及计算机可读存储介质 | |
CN113723926A (zh) | 结合rpa和ai的银行流水处理方法、装置及电子设备 | |
US7379596B2 (en) | System and method for personalization of handwriting recognition | |
CN111736804B (zh) | 一种基于用户评论识别App关键功能的方法及装置 | |
CN109145092B (zh) | 一种数据库更新、智能问答管理方法、装置及其设备 | |
CN113326363A (zh) | 搜索方法及装置、预测模型训练方法及装置、电子设备 | |
CN1588968A (zh) | 使用移动终端的短信服务进行信息搜索的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |