CN113742459B - 词汇展示方法、装置、电子设备及存储介质 - Google Patents

词汇展示方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113742459B
CN113742459B CN202111308274.3A CN202111308274A CN113742459B CN 113742459 B CN113742459 B CN 113742459B CN 202111308274 A CN202111308274 A CN 202111308274A CN 113742459 B CN113742459 B CN 113742459B
Authority
CN
China
Prior art keywords
vocabulary
attribute
target
query
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111308274.3A
Other languages
English (en)
Other versions
CN113742459A (zh
Inventor
杨子钰
陈沫
吴珊珊
高悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN202111308274.3A priority Critical patent/CN113742459B/zh
Publication of CN113742459A publication Critical patent/CN113742459A/zh
Application granted granted Critical
Publication of CN113742459B publication Critical patent/CN113742459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本公开提供了一种词汇展示方法、装置、电子设备及存储介质,首先,响应于用户从词汇分类检索页面中选择目标功能的操作,显示与目标功能匹配的目标界面,并接收用户通过目标界面输入的查询信息,查询信息包括词汇、属性维度和属性值中的至少一种,属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种。然后,查询预先构建的词汇数据库,以获取与查询信息匹配的词汇查询结果,进而在目标界面上展示词汇查询结果。本公开实施例能够向用户展示丰富的词汇学习内容,有利于扩展词汇学习的广度和深度。

Description

词汇展示方法、装置、电子设备及存储介质
技术领域
本公开涉及自然语言处理技术领域,尤其涉及一种词汇展示方法、装置、电子设备及存储介质。
背景技术
在当今教育科学技术蓬勃发展的数字化时代,通过高信息量的技术支持,越来越多的新工具和应用程序可以更加有效地辅助语言的教和学。例如,利用电子词典,用户输入想要查询的词语,电子词典可以实时返回该词语对应的拼音以及各种来源的词义解释。
可见,词汇学习工具能够有效辅助用户对词汇的学习,功能丰富的词汇学习工具对用户来说显得尤为重要。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种词汇展示方法,通过词汇分类检索页面提供的功能,可以查询词汇或者词汇的属性信息,能够向用户展示丰富的词汇学习内容,有利于扩展词汇学习的广度和深度。
根据本公开的一方面,提供了一种词汇展示方法,所述方法包括:
响应于用户从词汇分类检索页面中选择目标功能的操作,显示与所述目标功能匹配的目标界面;
接收所述用户通过所述目标界面输入的查询信息,其中,所述查询信息包括词汇、属性维度和属性值中的至少一种,所述属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种;
查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,其中,当所述查询信息为多个词汇时,所述词汇查询结果由对所述多个词汇按照年龄属性进行分组并排序后得到;
在所述目标界面上展示所述词汇查询结果。
根据本公开的另一方面,提供了一种词汇展示装置,所述装置包括:
界面显示模块,用于响应于用户从词汇分类检索页面中选择目标功能的操作,显示与所述目标功能匹配的目标界面;
接收模块,用于接收所述用户通过所述目标界面输入的查询信息,其中,所述查询信息包括词汇、属性维度和属性值中的至少一种,所述属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种;
查询模块,用于查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,其中,当所述查询信息为多个词汇时,所述词汇查询结果由对所述多个词汇按照年龄属性进行分组并排序后得到;
结果展示模块,用于在所述目标界面上展示所述词汇查询结果。
根据本公开的另一方面,提供了一种电子设备,包括:处理器;以及存储计算机程序的存储器,其中,所述计算机程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述的词汇展示方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机上述的词汇展示方法。
根据本公开的另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令在被计算机的处理器执行时实现上述的词汇展示方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例提供了一种词汇展示方法,首先,响应于用户从词汇分类检索页面中选择目标功能的操作,显示与目标功能匹配的目标界面,并接收用户通过目标界面输入的查询信息,查询信息包括词汇、属性维度和属性值中的至少一种,属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种。然后,查询预先构建的词汇数据库,以获取与查询信息匹配的词汇查询结果,进而在目标界面上展示词汇查询结果。本公开实施例通过接收用户输入的词汇、属性维度和属性值中的至少一种作为查询信息,并获取对应的词汇查询结果展示给用户,能够向用户展示丰富的词汇学习内容,有利于扩展词汇学习的广度和深度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开一实施例提供的一种词汇展示方法的流程图;
图2为本公开实施例提供的一种词汇分类检索页面的示例图;
图3A为词汇产出功能对应的查询界面示例图;
图3B为词汇查询功能对应的查询界面示例图;
图3C为词汇排序功能对应的查询界面示例图;
图4为本公开另一实施例提供的一种词汇展示方法的流程图;
图5为目标界面中展示的词汇查询结果的示例图一;
图6为目标界面中展示的词汇查询结果的示例图二;
图7为本公开又一实施例提供的一种词汇展示方法的流程图;
图8为目标界面中展示的词汇查询结果的示例图三;
图9为本公开再一实施例提供的一种词汇展示方法的流程图;
图10为目标界面中展示的词汇查询结果的示例图四;
图11为目标界面中展示的词汇查询结果的示例图五;
图12为本公开实施例提供的一种词汇展示装置的结构示意图;
图13为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
在描述本公开实施例之前,对本公开实施例中可能涉及的专业术语进行解释如下:
具体度:是指对事物具体或抽象程度的度量,具体度高的词汇代表在现实世界中以某种确定的物理形式存在的事物,相反,具体度低的词汇代表的是抽象的概念或想法。例如,“老虎”是实际存在的动物,那么“老虎”就是高具体度的词汇;而“奋斗”是一种抽象的概念,那么“奋斗”的具体度就相对较低。
唤醒度:是指词语所能引起的激活反应程度,是词汇激发兴奋与平静情绪的衡量标准,高唤醒度的词汇会让人感到刺激、兴奋、疯狂、紧张或清醒;低唤醒度的词汇会让人感到放松、平静、呆滞、沉闷或困倦。
可想象性:是指通过一个词汇来想象事物难易程度的度量,高可想象性的词汇代表了很容易想象或在脑海中呈现图片的事物,而低可想象性的词汇代表很难想象或在脑海中呈现图片的事物。
情感效价:是指一个词语是积极的还是消极的,高情感效价的词汇代表被认为是正向积极的事物,低情感效价的词汇代表被认为是负面消极的事物。
韵母:是指在发音时,气流在口腔中受到各种阻碍所产生的声音,发音的过程即是气流阻和克服阻碍的过程。
声母:是指韵母前的辅音,与韵母一起构成一个完整的音节。
介母:作为独立元音,拼在声母之后,作为替代韵母,也可介入声母和韵母中间。
下面结合附图描述本公开实施例提供的词汇展示方法、装置、电子设备及存储介质。
在当今这个教育科学技术蓬勃发展的数字化时代,通过高信息量的技术支持,有越来越多的新工具和应用程序可以更加有效地辅助语言的教和学,并且提升学生的学习体验。例如,在查电子词典的时候,用户输入想要查询的词语,词典可以实时自动地返回该词语对应的拼音,以及各种来源的词义解释。然而,这种查询方式仅展示了被查询词汇的个别信息,存在查询方式单一、返回的词汇属性信息不够丰富、针对性不强的问题,并且没有考虑用户的认知水平和语言能力水平的发展,拓展信息不足。因此,需要更加多样的学习模式以使词汇学习不再枯燥乏味,以及需要更加有效的学习方法来辅助词汇的记忆和理解。
针对上述问题,本公开提供了一种词汇展示方法,通过对词汇标注多个不同维度的属性标签,可以更好的提供全面综合的词汇检索方式和汉语词汇扩展信息,以及提供有效的词汇学习方法,扩展学生词汇习得的广度和深度。
图1为本公开实施例提供的一种词汇展示方法的流程图,该方法可以由本公开实施例提供的词汇展示装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电脑、智能手机、服务器等电子设备中。如图1所示,该词汇展示方法可以包括以下步骤:
S101,响应于用户从词汇分类检索页面中选择目标功能的操作,显示与所述目标功能匹配的目标界面。
其中,词汇分类检索页面可以是词汇学习工具(比如电子设备、小程序等)提供的查询页面,该页面中可以包括多个不同的词汇查询功能,以满足用户的不同需求。
示例性地,如图2所示,词汇分类检索页面中可以包括词汇产出功能、词汇查询功能和词汇排序功能三个功能模块。能够理解的是,图2所示的词汇分类检索页面仅作为示例,而不能作为对本公开的限制,还可以根据实际需求在词汇分类检索页面中扩展其他功能。其中,词汇产出功能可以用于根据用户选择的词汇属性,输出符合所选属性组合的词汇及其对应的属性信息,有助于用户学习同属性的词语;词汇查询功能可以用于根据用户输入的词语和选择的属性维度,输出该词汇对应的属性信息,还可以输出与该词汇相对应的近义词、反义词、和同难度同属性的拓展词汇;词汇排序功能可以用于将输入的多个词汇按照年龄、主题、或词性进行分类,并将同类别中的词语根据词汇属性,按照预设的难度等级进行排序。
当用户需要进行词汇查询时,可以根据所需查询的内容,从词汇分类检索页面中选择合适的功能进行查询,用户选择的功能称为目标功能。比如,如果用户有批量词汇,目的是探究词汇的主题分类和各主题下词汇的难度等级,并想要根据各词汇的难度设计学习计划的时候,则用户可以从词汇分类检索页面中选择词汇排序功能,从而,词汇排序功能即为本次查询的目标功能。响应于用户选择的目标功能,显示与目标功能匹配的目标界面。
示例性地,在显示目标界面时,可以从当前的词汇分类检索页面,跳转至目标功能对应的目标页面。
能够理解的是,不同的功能对应的查询界面不同。示例性地,图3A为词汇产出功能对应的查询界面示例图,图3B为词汇查询功能对应的查询界面示例图,图3C为词汇排序功能对应的查询界面示例图。如图3A所示,词汇产出功能对应的查询界面包括习得年龄、词性、主题、笔画范围、拼音难度和叠词类型共六个属性维度的输入栏,用户可以从各维度对应的下拉菜单中,选择至少一个属性维度对应的属性值来产出词汇,其中,年龄、词性和主题为可以选择指定值的指标,笔画数和拼音难度为可以选择区间范围的指标。如图3B所示,词汇查询功能对应的查询界面包括词汇输入区域31和属性维度勾选区域32。如图3C所示,词汇排序功能对应的查询界面包括词汇输入区域33、分类属性选择区域34和排序属性选择区域35。需要说明的是,图3A、图3B和图3C仅作为示例解释说明本公开,而不能作为对本公开的限制。
举例而言,假设用户从图2所示的词汇分类检索页面中选择的目标功能为词汇排序功能,则响应于用户的选择操作,显示如图3C所示的目标界面。
S102,接收所述用户通过所述目标界面输入的查询信息,其中,所述查询信息包括词汇、属性维度和属性值中的至少一种,所述属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种。
本公开实施例中,对于词汇属性的分析考虑了词汇的主观维度和客观维度,主观维度包括年龄、拼音难度、具体度、唤醒度、可想象性和情感效价,客观维度包括词性、主题、笔画数、词频、词义数、词汇长度和叠词类型。
其中,词性对应的属性值包括但不限于名词、动词、形容词、副词和习惯用语;主题对应的属性值包括但不限于地貌、食品、动物、植物、家具等;年龄、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度和可想象性对应的属性值是一个数值;情感效价对应的属性值包括但不限于高和低;叠词类型对应的属性值包括AAB、BAA、AABB、AABC、ABCC、ABAC、ABCB、ABCA和非叠词。
本公开实施例中,用户通过目标界面输入的查询信息,可以是一个或多个词汇,可以是一个或多个属性维度的属性值,可以是一个词汇与至少一个属性维度的组合,还可以是多个词汇和至少一个属性维度的组合。
S103,查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,其中,当所述查询信息为多个词汇时,所述词汇查询结果由对所述多个词汇按照年龄属性进行分组并排序后得到。
其中,预先构建的词汇数据库中存储有大量的词汇,每个词汇都从年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型共13个维度进行了标注。词汇数据库中词汇的各属性维度对应的属性值可以结合认知神经科学、语言学和计量词汇学确定。
示例性地,词汇的年龄标签范围为3~18岁,年龄数据可以依据中文词汇研究中的习得年龄数据、CHILDES国际儿童口语语料库的汉语口语语料中词汇首次出现的年龄,以及词汇在语文教科书中首次出现的对应年龄确定。
词性的标注可以采用中文词汇研究中的词性数据,也可以采用正则表达式对CHILDES国际儿童口语语料库中的汉语口语语料和教育部编义务教育语文教科书中的词汇进行分词、预处理及标注。
主题分类可以参考《同义词词林 (第二版)》中对词汇的主题分类,确认分类标准之后,对词汇进行主题的标注。
笔画数可以根据已有汉字属性数据(包括汉典)进行标注。笔画数共分为5个范围区间,分别为:1~10、11~20、20~30、30~40和40以上,每个区间对应不同的难度等级,笔画数越少,难度等级越低。
拼音难度可以采用python包pypinyin进行词汇拼音的标注,拼音的分类包括:将声母和韵母中的任意m个维度进行组合,组合后的难度等级为m个难度的平均值。
词汇长度可以用python自动返回每个词中单字的个数信息;词频的数据可以来源于对部编版语文教材的文本词频的统计数据、CHILDES儿童口语语料库中各词频的统计数据;词义数的数据可以通过对现代汉语词典中各词汇的词义个数进行统计得到。
具体度、唤醒度、可想象性、情感效价可以根据已有英文词汇信息翻译成中文释义后的词汇对应的指标信息进行整合得到。
叠词类型可以根据词汇的形式确定,根据词汇的形式判断该词汇是否属于叠词,若是,根据词语的形式赋予叠词种类的标签,包括AAB、BAA、AABB、AABC、ABCC、ABAC、ABCB、ABCA,若不是得出,则标注非叠词。
通过利用标注了多个属性维度的词汇构建词汇数据库,查询词汇数据库来匹配获得用户想要学习的信息,使得用户能够从不同的维度学习词汇,丰富了词汇学习内容。并且,对每个词汇进行年龄维度的标注,可以根据不同年龄阶段的用户群体的认知水平,有针对性地输出词汇,使得产出的词汇与用户年龄匹配。
本公开实施例中,根据用户输入的查询信息,可以查询预先构建的词汇数据库,以获取与查询信息匹配的词汇查询结果。
示例性地,假设用户输入的查询信息为一个词汇,则通过在词汇数据库中查询,可以找到该词汇以及该词汇的所有属性维度的属性值,进而获取该词汇及标注的属性维度和属性值作为词汇查询结果。
示例性地,假设用户输入的查询信息为多个词汇,则可以查询词汇数据库来获取这些词汇分别对应的年龄属性的属性值,并将多个词汇按照年龄属性进行分组,以及按照年龄对生成的分组进行排序,得到匹配的查询结果。
S104,在所述目标界面上展示所述词汇查询结果。
本公开实施例中,确定了词汇查询结果之后,则可以在目标界面上展示该词汇查询结果。
示例性地,词汇查询结果可以通过在目标界面上显示弹窗的形式展示,也可以在目标界面的任意空白区域显示,本公开对此不作限制。
本公开实施例所提供的词汇展示方法,首先,响应于用户从词汇分类检索页面中选择目标功能的操作,显示与目标功能匹配的目标界面,并接收用户通过目标界面输入的查询信息,查询信息包括词汇、属性维度和属性值中的至少一种,属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种。然后,查询预先构建的词汇数据库,以获取与查询信息匹配的词汇查询结果,进而在目标界面上展示词汇查询结果。本公开实施例通过接收用户输入的词汇、属性维度和属性值中的至少一种作为查询信息,并获取对应的词汇查询结果展示给用户,能够向用户展示丰富的词汇学习内容,有利于扩展词汇学习的广度和深度。
一种可选的实施方式中,所述目标功能为词汇排序功能,所述查询信息包括多个词汇,其中,多个词汇可以通过不同的方式输入。
示例性地,以目标界面为图3C所示的界面为例,用户可以通过词汇输入区域33中的词汇输入框331,依次输入想要进行排序的多个词汇;或者,用户可以通过词汇输入区域33中的文件上传入口332上传包含有待排序的多个词汇的预设格式文件的方式输入多个词汇。从而,目标界面包括文件上传入口,例如,图3C中所示的文件上传入口332,所述接收所述用户通过所述目标界面输入的查询信息,包括:
接收所述用户通过所述文件上传入口上传的预设格式文件,其中,所述预设格式文件中包括多个词汇;
对所述预设格式文件进行识别,以获取所述多个词汇。
其中,预设格式文件比如可以是TXT格式的文件、word文件等。
本公开实施例中,通过接收用户通过文件上传入口上传的预设格式文件来获取多个词汇,避免了用户依次输入每个词汇,尤其在用户多次想要排序的词汇中存在部分重复词汇时,可以在预设格式文件中替换其他词汇即可,无需每次输入重复词汇,节省了词汇输入的时间。
当查询信息为多个词汇时,如图4所示,在前述实施例的基础上,步骤103可以包括以下步骤:
S201,查询预先构建的词汇数据库,以获取所述多个词汇分别对应的属性信息,其中,所述属性信息包括年龄信息。
本公开实施例中,词汇数据库中的每个词汇标注了年龄信息,对于获取的多个词汇,可以从词汇数据库中获取多个词汇中每个词汇的年龄信息。
S202,将所述多个词汇按照所述年龄信息进行分组,得到每个年龄对应的词群。
举例而言,多个词汇分别为蚂蚁、松鼠、铅笔、狐狸、肥料和锅盖,通过查询词汇数据库,可以确定各词汇对应的年龄信息为:蚂蚁-3岁、松鼠-3岁、铅笔-4岁、狐狸-4岁、肥料-6岁和锅盖-7岁,则按照年龄信息可以将各词汇划分为4个词群,分别为3岁(蚂蚁松鼠)、4岁(铅笔狐狸)、6岁(肥料)和7岁(锅盖)。
S203,将所述每个年龄对应的词群按照预设年龄顺序进行排序,得到词汇查询结果。
其中,预设年龄顺序可以是年龄从小到大的顺序,或者,可以是年龄从大到小的顺序。
本公开实施例中,对于每个年龄对应的词群,可以按照年龄从小到大或年龄从大到小的顺序,对各词群进行排序,将排序后的各词群作为词汇查询结果。
本公开实施例的词汇展示方法,通过查询预先构建的词汇数据库,以获取多个词汇分别对应的属性信息,属性信息包括年龄信息,并将多个词汇按照年龄信息进行分组,得到每个年龄对应的词群,进而将每个年龄对应的词群按照预设年龄顺序进行排序,得到词汇查询结果,由此,实现了将多个词汇按照年龄进行分组并排序,有利于用户了解各词汇适宜的年龄阶段,便于用户根据各词汇的习得年龄对汉语词汇素材进行编排。
进一步地,一种可选的实施方式中,对于按年龄分组得分的各词群,还可以获取所述词群中的每个词汇对应的词汇难度评分,并根据各词汇对应的词汇难度评分,将每个年龄对应的词群中的各词汇,按照预设难度顺序进行排序。由此,有利于用户掌握同一年龄分组中的各词汇的难易程度,便于用户根据各词汇的难易程度对汉语词汇素材进行编排。
其中,预设难度顺序可以是从易到难或者从难到易。
示例性地,可以预先按照预设的难度评判规则,确定词汇数据库中的每个词汇对应的词汇难度评分,并基于词汇难度评分对对应的词汇进行难度标注,进而,通过查询词汇数据库,可以获取词群中的每个词汇对应的词汇难度评分。
一种可选的实施方式中,所述查询信息还可以包括所述用户通过所述目标界面选择的第一属性维度,所述属性信息还包括与所述第一属性维度对应的第一属性值,从而,所述获取所述词群中的每个词汇对应的词汇难度评分,包括:
根据所述词群中的每个词汇对应的第一属性值,查询预设的属性值与难度等级的对应关系,以确定与所述第一属性值对应的目标难度等级;
根据所述词群中的每个词汇对应的年龄信息及第一属性维度,查询预设的年龄范围与各属性维度的权重值之间的对应关系,以确定所述词群中的每个词汇的所述第一属性维度对应的目标权重值;
根据所述词群中的每个词汇的所述第一属性维度对应的目标权重值,以及与所述第一属性维度的第一属性值对应的目标难度等级,确定所述词群中的每个词汇的词汇难度评分。
其中,第一属性维度为笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性和情感效价中的至少一个。属性值与难度等级的对应关系可以预先设定,比如,对于词频这一属性维度,其属性值越高(即词频越高),对应的难度等级越低;对于笔画数这一属性维度,其属性值越高(即笔画数越多),对应的难度等级越低。针对笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性和情感效价这几个属性维度,可以预先设置各维度的属性值与难度等级的对应关系,进而,根据从词汇数据库获取的词群中每个词汇的第一属性值,可以查询第一属性维度的各属性值与难度等级的对应关系,确定与第一属性值对应的目标难度等级。
示例性地,假设笔画数的各属性值与难度等级的对应关系如表1所示。对于词汇饺子,其笔画数为12,则通过查询表1,可以确定饺子的笔画数这一维度对应的目标难度等级为2。
表1
笔画范围 难度等级
1~10 1
11~20 2
21~30 3
31~40 4
40以上 5
本公开实施例中,根据各属性在不同年龄段中的影响程度,可以针对同一属性维度,设置不同年龄对应不同的权重值。
示例性地,预设的年龄范围与各属性维度的权重值之间的对应关系可以如表2所示。
表2
年龄范围 各属性维度的权重值
年龄3~6岁 (包含3岁和6岁) 年龄维度的权重为:0.35; 词性和主题维度的权重为:0.25; 笔画数和拼音难度维度的权重为:0.2; 其他客观维度(包括词频、词义数、词汇长度)的权重为:0.12; 其他主观维度(包括具体度、唤醒度、可想象性、情感效价)的权重为:0.08
年龄7~12岁 (包含7岁和12岁) 年龄维度的权重为:0.2; 词性和主题维度的权重为:0.3; 笔画数和拼音难度维度的权重为:0.23; 其他客观维度(包括词频、词义数、词汇长度)的权重为:0.17; 其他主观维度(包括具体度、唤醒度、可想象性、情感效价)的权重为:0.1
年龄12~18岁 (包含12岁和18岁) 年龄维度的权重为:0.1; 词性和主题维度的权重为:0.15; 笔画数和拼音难度维度的权重为:0.2; 其他客观维度(包括词频、词义数、词汇长度)的权重为:0.25; 其他主观维度(包括具体度、唤醒度、可想象性、情感效价)的权重为:0.3
从而,根据词群中每个词汇对应的年龄信息和第一属性维度,查询表2所示的年龄范围与各属性维度的权重值之间的对应关系,可以确定词群中的每个词汇的第一属性维度对应的目标权重值。
继续以饺子为例,饺子的习得年龄为6岁,假设第一属性维度为笔画数,则通过查询表2所示的年龄范围与各属性维度的权重值之间的对应关系,可以确定饺子的笔画数维度对应的目标权重值为0.2。
本公开实施例中,针对词群中的每个词汇,可以根据该词汇的第一属性值对应的目标权重值,以及与该词汇的第一属性维度的第一属性值对应的目标难度等级,确定词群中的每个词汇的词汇难度评分。
示例性地,可以通过对目标权重值和目标难度等级进行加权求和的方式,确定每个词汇的词汇难度评分。
图5为目标界面中展示的词汇查询结果的示例图一。从图5可以看出,分类方式为“全分类”,即默认按照年龄对多个词汇进行分组,用户选择的第一属性维度为笔画数和拼音难度,则对于图5中的每个词汇,在展示之前,先根据笔画数和拼音难度确定各词汇的词汇难度评分。以“保护”为例,“保护”的习得年龄为3岁,笔画数为16,拼音难度为2级,通过查询表1和表2,可以确定笔画数对应的难度等级为2,笔画数对应的权重为0.2,拼音难度的属性值即为拼音难度这一属性维度的难度等级,拼音难度对应的权重为0.2,则通过难度等级和权重的加权和可以确定“保护”的词汇难度评分为0.2*2+0.2*2=0.8。之后,再按照预设难度顺序(比如由易到难),对各年龄分组对应的词群中的各词汇进行排序,之后展示排序后的词群,如图5所示。
本公开实施例中,用户可以通过目标界面选择第一属性维度,获取的多个词汇的属性信息包括与第一属性维度对应的第一属性值,进而确定第一属性值对应的目标难度等级,以及根据年龄信息和第一属性维度确定目标权重值,进而根据目标难度等级和目标权重值确定各词汇的词汇难度评分,使得用户可以根据自身需求选择词汇的排序维度,灵活性强。
一种可选的实施方式中,用户还可以通过目标界面选择对多个词汇进行分类的类别属性维度,其中,类别属性维度为词性维度或主题维度,从而,多个词汇分别对应的属性信息还包括:与所述用户通过所述目标界面选择的类别属性维度对应的类别属性值。
示例性地,若用户选择的类别属性维度为词性维度,则按照词性对多个词汇进行分类,获取的属性信息包括多个词汇中的每个词汇对应的词性类别。比如,对于词汇“饺子”,获取的类别属性值(即词性类别)为名词,对于词汇“责怪”,获取的词性类别为动词。
示例性地,若用户选择的类别属性维度为主题维度,则按照主题对多个词汇进行分类,获取的属性信息包括多个词汇中的每个词汇对应的主题类型。比如,对于词汇“饺子”,获取的类别属性值(即主题类别)为食品,对于词汇“衬衫”,获取的主题类别为服装。
从而,本公开实施例中,所述方法还包括:根据所述词群中的每个词汇对应的类别属性值,将所述每个年龄对应的词群划分为多个子词群;
相应地,所述将所述每个年龄对应的词群按照预设年龄顺序进行排序,得到词汇查询结果,包括:
将每个年龄对应的所述多个子词群按照预设年龄顺序进行排序,得到词汇查询结果。
本公开实施例中,根据词群中的每个词汇对应的类别属性值,可以将每个年龄对应的词群,按照类别进行分类,得到多个子词群,其中,每个年龄对应的词群均可以划分为多个子词群,则每个年龄对应多个子词群,进而,可以将每个年龄对应的多个子词群,按照预设年龄顺序进行排序,得到词汇查询结果。
能够理解的是,若词群中的各词汇未按照词汇难度评分进行排序,则各子词群中的词汇可以是未排序的,若词群中的各词汇已按照词汇难度评分进行排序,则各子词群中的词汇可以是已排序的。
图6为目标界面中展示的词汇查询结果的示例图二。从图6可以看出,用户从目标界面中选择的类别属性维度为词性分类,即将多个词汇按照词性进行分类,词性类别包括名词、动词、形容词、副词和习用语。如图6所示,每个年龄对应的词群中的各词汇,被按照词性进行分类,将每个年龄对应的词群中同一词性类别的词汇划分为一个子词群。以年龄3对应的词群为例,如图6所示,年龄3对应的词群包括名词“蝴蝶”、“蚂蚁”、“松鼠”、“姐姐”和“阿姨”,以及动词“保护”和“谢谢”,则对年龄3对应的词群按词性进行分类,分为名词对应的子词群、动词对应的子词群、形容词对应的子词群、副词对应的子词群和习用语对应的子词群,其中,名词对应的子词群包括词汇“蝴蝶”、“蚂蚁”、“松鼠”、“姐姐”和“阿姨”,动词对应的子词群包括词汇“保护”和“谢谢”,而形容词对应的子词群、副词对应的子词群和习用语对应的子词群均为空。
结合图5和图6可以看出,本公开实施例中,当用户未选择类别属性维度时,即默认“全分类”时,将多个词汇按照年龄维度进行分组;当用户选择了对词汇进行分类的类别属性维度时,会将多个词汇从年龄维度和用户选择的类别属性维度两个维度上进行分组。
本公开实施例中,通过接收用户通过目标界面选择的类别属性维度,获取的属性信息包括类别属性维度对应的类别属性值,进而根据词群中的每个词汇对应的类别属性值,将每个年龄对应的词群划分为多个子词群,并将每个年龄对应的多个子词群按照预设年龄顺序进行排序,得到词汇查询结果。由此,使得用户能够根据自身需求,自主选择属性维度对词汇进行分类,便于用户根据各词汇对应的类别,对汉语词汇素材进行编排。
一种可选的实施方式中,所述目标功能为词汇产出功能,所述查询信息包括第二属性维度对应的第二属性值,其中,第二属性维度为年龄维度、词性维度、主题维度、笔画数维度、拼音难度维度和叠词类型维度中的至少一个,其中,年龄维度、词性维度、主题维度和叠词类型维度为可选指定值的指标,笔画数维度和拼音难度维度为可选区间范围的指标,其他属性维度如词频、词义数、词汇长度、具体度、唤醒度、可想象性和情感效价为自动输出项,无属性值可选。词汇产出功能对应的目标界面如图3A所示。
当查询信息为第二属性维度对应的第二属性值时,如图7所示,在前述实施例的基础上,步骤103可以包括以下步骤:
S301,查询预先构建的词汇数据库,以获取与所述第二属性值匹配的目标词汇及与所述目标词汇关联的属性信息,所述属性信息包括多个属性维度及对应的属性值。
本公开实施例中,当用户通过目标界面输入的查询信息为第二属性维度对应的第二属性值时,查询预设的词汇数据库,从词汇数据库中匹配出符合第二属性维度对应的第二属性值的目标词汇,并获取与目标词汇中的每个目标词汇分别关联的属性信息,其中,属性信息包括与每个目标词汇关联的所有属性维度及各维度对应的属性值。
其中,所有属性维度包括年龄、词性、主题、叠词类型、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性和情感效价。
在一种可选的实施方式中,若查询词汇数据库未匹配到满足第二属性值要求的目标词汇,则可以在目标界面上展示如“未匹配到相关词汇,请重新选择维度参数”的提示信息,以提醒用户调整第二属性维度及第二属性值。比如,用户在看到未匹配到相关词汇的提示信息后,可以减少所选择的第二属性维度的个数,或者,在不变更所选择的第二属性维度的情况下,改变第二属性维度对应的第二属性值。
S302,将所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果。
本公开实施例中,对于查询到的目标词汇,可以将目标词汇以及关联的各属性维度的属性值,确定为本次查询的词汇查询结果。
本公开实施例的词汇展示方法,当用户通过目标界面输入的查询信息包括第二属性维度对应的第二属性值时,查询预先构建的词汇数据库,以获取与第二属性值匹配的目标词汇及与目标词汇关联的属性信息,属性信息包括多个属性维度及对应的属性值,进而将目标词汇,以及与目标词汇关联的属性信息,确定为词汇查询结果。由此,能够根据用户输入的属性值,产出与属性值匹配的目标词汇,有利于用户获知符合所选属性值的词汇有哪些。
一种可选的实施方式中,所述方法还包括:
获取用户从所述多个属性维度中选择的目标属性维度的目标排序方式,所述目标排序方式包括降序或升序;
将所述目标界面上展示的所述目标词汇以及与所述目标词汇关联的属性信息,按照所述目标属性维度的目标排序方式进行排序。
其中,目标属性维度为年龄、笔画数、拼音难度、词频、词义数和词汇长度中的任意一个维度。
本公开实施例中,对于目标界面上展示的目标词汇相关的属性维度中,年龄、笔画数、拼音难度、词频、词义数、词汇长度这几个维度可以让用户选择按照升序(从小到大)或降序(从大到小)的顺序进行重新排序,其他属性维度则根据选定的目标属性维度升序或降序进行扩展排序。比如,假设用户选择了按照年龄从小到大的顺序进行排序,则其他属性维度随着目标词汇对应习得年龄的移动而移动。也就是说,目标词汇以及关联的属性信息作为整体,按照选择的目标属性维度的升序或降序的顺序进行排序。
一种可选的实施方式中,对于产出的目标词汇,在将目标词汇展示在目标界面上之前,还可以先对目标词汇按照难易程度进行排序。从而,所述方法还包括:
获取所述目标词汇的多个属性维度分别对应的权重值;
获取与所述目标词汇的多个属性维度的属性值分别对应的难度等级;
根据所述目标词汇的多个属性维度分别对应的权重值及所述难度等级,确定所述目标词汇中每个词汇的难度评分;
根据所述目标词汇中每个词汇的难度评分,按照预设难度顺序对所述目标词汇进行排序;
相应地,所述将所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果,包括:
将排序后的所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果。
本公开实施例中,对于匹配到的目标词汇,可以针对每个目标词汇,获取与目标词汇的各个属性维度分别对应的权重值,其中,可以基于目标词汇的年龄,查询预设的年龄与不同维度的权重值之间的对应关系(例如表2),确定各目标词汇的不同属性维度对应的权重值。并且,针对每个目标词汇,根据目标词汇的各属性维度的属性值,可以查询预设的不同属性维度的各属性值与难度等级的对应关系,确定每个目标词汇的各属性值分别对应的难度等级。接着,针对每个目标词汇,根据各属性维度对应的权重值和难度等级进行加权求和,得到各目标词汇对应的难度评分,并根据每个目标词汇的难度评分,按照预设难度顺序(由难到易或由易到难),对目标词汇进行排序,得到排序后的目标词汇,并将排序后的目标词汇及关联的属性信息,确定为词汇查询结果。由此,实现了将产出的目标词汇按预设难度顺序进行排序后再展示,方便了用户获知各目标词汇的难易程度。
需要说明的是,计算目标词汇对应的难度评分时,可以基于所有的属性维度(即上述13个属性维度)进行难度评分的计算,也可以仅针对预设属性维度进行难度评分的计算,其中,预设属性维度可以预先设定,预设属性维度的个数可以是一个或多个,比如,预设属性维度可以是拼音难度,也可以是拼音难度与笔画数的组合,等等。本公开仅以多个属性维度为所有的属性维度为例来解释说明本公开,而不能作为对本公开的限制。
图8为目标界面中展示的词汇查询结果的示例图三,如图8所示,用户从词汇产出功能对应的目标界面上选择的第二属性值包括:习得年龄为7岁,词性为名词,主题为自然现象,笔画范围为11-20,拼音难度为2级,以及叠词类型为非叠词,通过查询词汇数据库,匹配到符合上述第二属性值的目标词汇为“晴天”,同时将“晴天”以及与“晴天”关联的所有属性维度的属性值作为词汇查询界面展示在该目标界面中。在展示目标词汇时,可以根据每个目标词汇对应的难度评分,将目标词汇按照预设难度顺序进行排序,例如,如图8所示,目标界面中显示有“提示:词汇已按照由简单到难进行排序!”的提示消息,以告知用户目标界面中展示的各目标词汇已按照由简单到难的难度顺序进行排序。从图8可以看出,习得年龄、笔画数、拼音难度、词频、词义数和词汇长度这几个维度分别设置有升序标识“↑”和降序标识“↓”,用户通过点击某个维度的“↑”或“↓”,可以将目标界面中展示的所有目标词汇,按照选择的该维度的排序方式进行排序。能够理解的是,受限于目标界面的尺寸,目标词汇的属性维度可能无法全部显示出来,这种情况下,可以将无法展示的属性维度及对应的属性值,以其他形式展示出来。示例性地,如图8所示,目标界面中仅展示了8个属性维度,而其他属性维度包括具体度、唤醒度、可想象性、情感效价和叠词类型未展示,图8中的“详细信息”下方展示有可点击的“更多”字样,用户点击“更多”,则进一步在目标界面中展示其他属性维度的属性值,比如,其他属性维度的属性值可以通过弹窗或者跳转至新页面的形式展示。可见,通过词汇产出功能对应的目标界面,用户可以获取符合所选择的属性值的目标词汇,还可以获知各目标词汇的难度程度,还可以根据自身需求对产出的目标词汇,按照某个维度升序或降序的方式进行重新排序,方便了用户迅速有效地检索到符合需求的词汇。
一种可选的实施方式中,所述目标功能为词汇查询功能,所述查询信息包括一个查询词汇以及第三属性维度,其中,第三属性维度可以为年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一个。从而,如图9所示,在前述实施例的基础上,步骤103可以包括:
S401,查询预先构建的词汇数据库,以获取与所述查询词汇的第三属性维度对应的第三属性值。
S402,将所述查询词汇、所述第三属性维度以及所述第三属性值,确定为词汇查询结果。
本公开实施例中,当用户通过目标界面输入的查询信息为一个查询词汇,以及想要了解的该词汇的第三属性维度时,根据用户输入的查询信息,查询预先构建的词汇数据库,从词汇数据库中匹配到该查询词汇,并获取该查询词汇的第三属性维度的第三属性值,进而将该查询词汇、第三属性维度及第三属性值,确定为词汇查询结果。
能够理解的是,当用户仅输入了一个查询词汇,而未选择第三属性维度时,则查询词汇数据库匹配到该查询词汇时,获取该查询词汇对应的所述属性维度及属性值,并将该查询词汇,以及获取到的该查询词汇的所有属性维度的属性值作为词汇查询结果。
进一步地,一种可选的实施方式中,词汇查询结果还可以包括与查询词汇相关的关联词,其中,所述关联词汇包括所述查询词汇的近义词、所述查询词汇的反义词,以及与所述查询词汇在至少一个属性维度上具有相同属性值的扩展词汇中的至少一种。
本公开实施例中,对于输入的查询词汇,除了输出查询词汇的属性值,还可以输出查询词汇的关联词,关联词可以是查询词汇的近义词、反义词和扩展词汇中的至少一种,其中,扩展词汇是指与查询词汇在至少一个属性维度上具有相同属性值的词汇,比如,获取具有相同主题类型的词汇作为扩展词汇。
需要说明的是,当从数据库中匹配到与查询词汇在至少一个属性维度上具有相同属性值的词汇较多时,可以从中筛选出与查询词汇最相近的预设个数的词汇作为扩展词汇,其中,与查询词汇最相近,可以认为是与查询词汇具有最多相同属性值的属性维度。
示例性地,在筛选扩展词汇时,可以按照与查询词汇具有相同属性值的属性维度的个数由多到少的顺序,对多个词汇进行排序,选取前预设个数的词汇作为该查询词汇的扩展词汇。
图10为目标界面中展示的词汇查询结果的示例图四,图11为目标界面中展示的词汇查询结果的示例图五。如图10所示,用户从词汇查询功能对应的目标界面上输入的查询词汇为“小溪”,选择的第三属性维度包括年龄、词性、主题和笔画数,用户输入完成后,点击“开始搜索”,经过后台匹配,输出词汇“小溪”的习得年龄为7岁,词性为名词,主题为地貌,笔画数为16。若用户仅输入“小溪”而未选择任何属性维度,则输出结果如图11所示。从图11可以看出,当用户未选择属性维度时,输出“小溪”的所有属性维度的属性值,包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、具体度和唤醒度。能够理解的是,对于一个已知的词汇,其叠词类型和词汇长度是显而易见的,因此可以不将叠词类型和属性长度展示在目标界面中供用户选择,例如图10和图11所示,目标界面中仅展示了年龄、词性、主题、笔画数、拼音难度、词频、词义数、具体度、唤醒度、可想象性和情感效价,而未展示叠词类型和属性长度。从图10和图11可以看出,目标界面中展示的词汇查询结果还包括消息的近义词汇、扩展词汇和反义词汇。可见,词汇查询功能对应的目标界面支持用户输入查询词汇和选择想要了解的属性维度,并根据用户输入的查询信息反馈对应的词汇查询结果,用户可以通过目标界面中展示的词汇查询结果获知词汇的属性信息和关联词汇,方便了用户从多方面学习词汇,丰富了词汇学习内容。
基于上述方法实施例,本公开还提供了一种词汇展示装置,参考图12,示出了根据本公开示例性实施例的词汇展示装置的示意性框图,所述词汇展示装置50包括:界面显示模块501、接收模块502、查询模块503和结果展示模块504。
其中,界面显示模块501,用于响应于用户从词汇分类检索页面中选择目标功能的操作,显示与所述目标功能匹配的目标界面;
接收模块502,用于接收所述用户通过所述目标界面输入的查询信息,其中,所述查询信息包括词汇、属性维度和属性值中的至少一种,所述属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种;
查询模块503,用于查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,其中,当所述查询信息为多个词汇时,所述词汇查询结果由对所述多个词汇按照年龄属性进行分组并排序后得到;
结果展示模块504,用于在所述目标界面上展示所述词汇查询结果。
一种可选的实施方式中,所述目标功能为词汇排序功能,所述查询信息包括多个词汇;所述查询模块503包括:
第一获取单元,用于查询预先构建的词汇数据库,以获取所述多个词汇分别对应的属性信息,其中,所述属性信息包括年龄信息;
分组单元,用于将所述多个词汇按照所述年龄信息进行分组,得到每个年龄对应的词群;
第一确定单元,用于将所述每个年龄对应的词群按照预设年龄顺序进行排序,得到词汇查询结果。
一种可选的实施方式中,所述装置还包括:
难度评分获取模块,用于获取所述词群中的每个词汇对应的词汇难度评分;
第一排序模块,用于根据所述词汇难度评分,将所述每个年龄对应的词群中的各词汇,按照预设难度顺序进行排序。
一种可选的实施方式中,所述查询信息还包括所述用户通过所述目标界面选择的第一属性维度,所述属性信息还包括与所述第一属性维度对应的第一属性值,所述难度评分获取模块,具体用于:
根据所述词群中的每个词汇对应的第一属性值,查询预设的属性值与难度等级的对应关系,以确定与所述第一属性值对应的目标难度等级;
根据所述词群中的每个词汇对应的年龄信息及第一属性维度,查询预设的年龄范围与各属性维度的权重值之间的对应关系,以确定所述词群中的每个词汇的所述第一属性维度对应的目标权重值;
根据所述词群中的每个词汇的所述第一属性维度对应的目标权重值,以及与所述第一属性维度的第一属性值对应的目标难度等级,确定所述词群中的每个词汇的词汇难度评分。
一种可选的实施方式中,所述属性信息还包括与所述用户通过所述目标界面选择的类别属性维度对应的类别属性值,所述类别属性维度为词性维度或主题维度,,所述装置还包括:
分组模块,用于根据所述词群中的每个词汇对应的类别属性值,将所述每个年龄对应的词群划分为多个子词群;
相应地,所述第一确定单元,具体用于:
将每个年龄对应的所述多个子词群按照预设年龄顺序进行排序,得到词汇查询结果。
一种可选的实施方式中,所述目标界面包括文件上传入口,所述接收模块502具体用于:
接收所述用户通过所述文件上传入口上传的预设格式文件,其中,所述预设格式文件中包括多个词汇;
对所述预设格式文件进行识别,以获取所述多个词汇。
一种可选的实施方式中,所述目标功能为词汇产出功能,所述查询信息包括第二属性维度对应的第二属性值;所述查询模块503包括:
第二获取单元,用于查询预先构建的词汇数据库,以获取与所述第二属性值匹配的目标词汇及与所述目标词汇关联的属性信息,所述属性信息包括多个属性维度及对应的属性值;
第二确定单元,用于将所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果。
一种可选的实施方式中,所述装置还包括:
排序方式接收模块,用于获取用户从所述多个属性维度中选择的目标属性维度的目标排序方式,所述目标排序方式包括降序或升序;
第二排序模块,用于将所述目标界面上展示的所述目标词汇以及与所述目标词汇关联的属性信息,按照所述目标属性维度的目标排序方式进行排序。
一种可选的实施方式中,所述装置还包括:
权重获取模块,用于获取所述目标词汇的多个属性维度分别对应的权重值;
难度等级获取模块,用于获取与所述目标词汇的多个属性维度的属性值分别对应的难度等级;
评分确定模块,用于根据所述目标词汇的多个属性维度分别对应的权重值及所述难度等级,确定所述目标词汇中每个词汇的难度评分;
第三排序模块,用于根据所述目标词汇中每个词汇的难度评分,按照预设难度顺序对所述目标词汇进行排序;
相应地,所述第二确定单元,具体用于:
将排序后的所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果。
一种可选的实施方式中,所述目标功能为词汇查询功能,所述查询信息包括一个查询词汇以及第三属性维度;所述查询模块503包括:
第三获取单元,用于查询预先构建的词汇数据库,以获取与所述查询词汇的第三属性维度对应的第三属性值;
第三确定单元,用于将所述查询词汇、所述第三属性维度以及所述第三属性值,确定为词汇查询结果。
一种可选的实施方式中,所述词汇查询结果还包括与所述查询词汇相关的关联词汇,所述关联词汇包括所述查询词汇的近义词、所述查询词汇的反义词,以及与所述查询词汇在至少一个属性维度上具有相同属性值的扩展词汇中的至少一种。
本公开实施例所提供的词汇展示装置,可执行本公开实施例所提供的任意可应用于电脑、智能手机、服务器等电子设备的词汇展示方法,具备执行方法相应的功能模块和有益效果。本公开装置实施例中未详尽描述的内容可以参考本公开任意方法实施例中的描述。
本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序包括指令,所述指令在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的词汇展示方法。
本公开示例性实施例还提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的词汇展示方法。
本公开示例性实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,其中,所述计算机程序/指令在被计算机的处理器执行时实现根据本公开实施例的词汇展示方法。
参考图13,现将描述可以作为本公开的服务器或客户端的电子设备60的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图13所示,电子设备60包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM603中,还可存储电子设备60操作所需的各种程序和数据。计算单元601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
电子设备60中的多个部件连接至I/O接口605,包括:输入单元606、输出单元607、存储单元608以及通信单元609。输入单元606可以是能向电子设备60输入信息的任何类型的设备,输入单元606可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元607可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元604可以包括但不限于磁盘、光盘。通信单元609允许电子设备60通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理。例如,在一些实施例中,方法S101~S104可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM602和/或通信单元609而被载入和/或安装到电子设备60上。在一些实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法S101~S104。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (14)

1.一种词汇展示方法,其特征在于,所述方法包括:
响应于用户从词汇分类检索页面中选择目标功能的操作,显示与所述目标功能匹配的目标界面;
接收所述用户通过所述目标界面输入的查询信息,其中,所述查询信息包括词汇,或者,包括词汇与属性维度的组合,或者,包括属性维度对应的属性值,所述属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种;
查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,其中,当所述查询信息为多个词汇时,所述词汇查询结果由对所述多个词汇按照年龄属性进行分组并排序后得到;
在所述目标界面上展示所述词汇查询结果。
2.根据权利要求1所述的词汇展示方法,其特征在于,所述目标功能为词汇排序功能,所述查询信息包括多个词汇;所述查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,包括:
查询预先构建的词汇数据库,以获取所述多个词汇分别对应的属性信息,其中,所述属性信息包括年龄信息;
将所述多个词汇按照所述年龄信息进行分组,得到每个年龄对应的词群;
将所述每个年龄对应的词群按照预设年龄顺序进行排序,得到词汇查询结果。
3.根据权利要求2所述的词汇展示方法,其特征在于,所述方法还包括:
获取所述词群中的每个词汇对应的词汇难度评分;
根据所述词汇难度评分,将所述每个年龄对应的词群中的各词汇,按照预设难度顺序进行排序。
4.根据权利要求3所述的词汇展示方法,其特征在于,所述查询信息还包括所述用户通过所述目标界面选择的第一属性维度,所述属性信息还包括与所述第一属性维度对应的第一属性值,所述获取所述词群中的每个词汇对应的词汇难度评分,包括:
根据所述词群中的每个词汇对应的第一属性值,查询预设的属性值与难度等级的对应关系,以确定与所述第一属性值对应的目标难度等级;
根据所述词群中的每个词汇对应的年龄信息及第一属性维度,查询预设的年龄范围与各属性维度的权重值之间的对应关系,以确定所述词群中的每个词汇的所述第一属性维度对应的目标权重值;
根据所述词群中的每个词汇的所述第一属性维度对应的目标权重值,以及与所述第一属性维度的第一属性值对应的目标难度等级,确定所述词群中的每个词汇的词汇难度评分。
5.根据权利要求2-4任一所述的词汇展示方法,其特征在于,所述属性信息还包括与所述用户通过所述目标界面选择的类别属性维度对应的类别属性值,所述类别属性维度为词性维度或主题维度,所述方法还包括:
根据所述词群中的每个词汇对应的类别属性值,将所述每个年龄对应的词群划分为多个子词群;
相应地,所述将所述每个年龄对应的词群按照预设年龄顺序进行排序,得到词汇查询结果,包括:
将每个年龄对应的所述多个子词群按照预设年龄顺序进行排序,得到词汇查询结果。
6.根据权利要求2所述的词汇展示方法,其特征在于,所述目标界面包括文件上传入口,所述接收所述用户通过所述目标界面输入的查询信息,包括:
接收所述用户通过所述文件上传入口上传的预设格式文件,其中,所述预设格式文件中包括多个词汇;
对所述预设格式文件进行识别,以获取所述多个词汇。
7.根据权利要求1所述的词汇展示方法,其特征在于,所述目标功能为词汇产出功能,所述查询信息包括第二属性维度对应的第二属性值;所述查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,包括:
查询预先构建的词汇数据库,以获取与所述第二属性值匹配的目标词汇及与所述目标词汇关联的属性信息,所述属性信息包括多个属性维度及对应的属性值;
将所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果。
8.根据权利要求7所述的词汇展示方法,其特征在于,所述方法还包括:
获取用户从所述多个属性维度中选择的目标属性维度的目标排序方式,所述目标排序方式包括降序或升序;
将所述目标界面上展示的所述目标词汇以及与所述目标词汇关联的属性信息,按照所述目标属性维度的目标排序方式进行排序。
9.根据权利要求7所述的词汇展示方法,其特征在于,所述方法还包括:
获取所述目标词汇的多个属性维度分别对应的权重值;
获取与所述目标词汇的多个属性维度的属性值分别对应的难度等级;
根据所述目标词汇的多个属性维度分别对应的权重值及所述难度等级,确定所述目标词汇中每个词汇的难度评分;
根据所述目标词汇中每个词汇的难度评分,按照预设难度顺序对所述目标词汇进行排序;
相应地,所述将所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果,包括:
将排序后的所述目标词汇,以及与所述目标词汇关联的属性信息,确定为词汇查询结果。
10.根据权利要求1所述的词汇展示方法,其特征在于,所述目标功能为词汇查询功能,所述查询信息包括一个查询词汇以及第三属性维度;所述查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,包括:
查询预先构建的词汇数据库,以获取与所述查询词汇的第三属性维度对应的第三属性值;
将所述查询词汇、所述第三属性维度以及所述第三属性值,确定为词汇查询结果。
11.根据权利要求10所述的词汇展示方法,其特征在于,所述词汇查询结果还包括与所述查询词汇相关的关联词汇,所述关联词汇包括所述查询词汇的近义词、所述查询词汇的反义词,以及与所述查询词汇在至少一个属性维度上具有相同属性值的扩展词汇中的至少一种。
12.一种词汇展示装置,其特征在于,所述装置包括:
界面显示模块,用于响应于用户从词汇分类检索页面中选择目标功能的操作,显示与所述目标功能匹配的目标界面;
接收模块,用于接收所述用户通过所述目标界面输入的查询信息,其中,所述查询信息包括词汇,或者,包括词汇与属性维度的组合,或者,包括属性维度对应的属性值,所述属性维度包括年龄、词性、主题、笔画数、拼音难度、词频、词义数、词汇长度、具体度、唤醒度、可想象性、情感效价和叠词类型中的至少一种;
查询模块,用于查询预先构建的词汇数据库,以获取与所述查询信息匹配的词汇查询结果,其中,当所述查询信息为多个词汇时,所述词汇查询结果由对所述多个词汇按照年龄属性进行分组并排序后得到;
结果展示模块,用于在所述目标界面上展示所述词汇查询结果。
13.一种电子设备,包括:
处理器;以及
存储计算机程序的存储器,
其中,所述计算机程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-11中任一项所述的词汇展示方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-11中任一项所述的词汇展示方法。
CN202111308274.3A 2021-11-05 2021-11-05 词汇展示方法、装置、电子设备及存储介质 Active CN113742459B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111308274.3A CN113742459B (zh) 2021-11-05 2021-11-05 词汇展示方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111308274.3A CN113742459B (zh) 2021-11-05 2021-11-05 词汇展示方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113742459A CN113742459A (zh) 2021-12-03
CN113742459B true CN113742459B (zh) 2022-03-04

Family

ID=78727512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111308274.3A Active CN113742459B (zh) 2021-11-05 2021-11-05 词汇展示方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113742459B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488130A (zh) * 2008-01-16 2009-07-22 文小凡 基于计算机网络的通过词义查词的系统及其方法
CN111831832A (zh) * 2020-07-27 2020-10-27 北京世纪好未来教育科技有限公司 词表构建方法、电子设备及计算机可读介质
CN113326696A (zh) * 2021-08-03 2021-08-31 北京世纪好未来教育科技有限公司 文本生成方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS608980A (ja) * 1983-06-28 1985-01-17 Brother Ind Ltd 電子辞書
US20050153263A1 (en) * 2003-10-03 2005-07-14 Scientific Learning Corporation Method for developing cognitive skills in reading
CN101145155A (zh) * 2007-10-24 2008-03-19 中山大学 一种电子词典数据存储格式及其检索方法
JP5841030B2 (ja) * 2012-09-18 2016-01-06 ビッグローブ株式会社 辞書更新方法、辞書更新システム、及び辞書更新プログラム
US9218379B2 (en) * 2013-03-15 2015-12-22 Informatica Llc Method, apparatus, and computer-readable medium for efficiently performing operations on distinct data values
CN104239314B (zh) * 2013-06-09 2018-01-19 天津海量信息技术股份有限公司 一种扩展检索词的方法和系统
CN104750819B (zh) * 2015-03-31 2018-01-23 大连理工大学 一种基于词分组排序算法的生物医学文献检索方法及系统
CN106503251A (zh) * 2016-11-11 2017-03-15 广州市万表科技股份有限公司 搜索方法和搜索装置
US10573298B2 (en) * 2018-04-16 2020-02-25 Google Llc Automated assistants that accommodate multiple age groups and/or vocabulary levels
CN109597808B (zh) * 2018-10-29 2022-12-30 清远墨墨教育科技有限公司 一种根据单词难度的单词排序方法及学习方法
CN111427991A (zh) * 2020-02-27 2020-07-17 彭炜明 面向汉语词汇学习的分级词表动态生成方法和系统
CN112860781A (zh) * 2021-02-05 2021-05-28 陈永朝 一种词汇搭配提取和语义分类相结合的挖掘和展示方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488130A (zh) * 2008-01-16 2009-07-22 文小凡 基于计算机网络的通过词义查词的系统及其方法
CN111831832A (zh) * 2020-07-27 2020-10-27 北京世纪好未来教育科技有限公司 词表构建方法、电子设备及计算机可读介质
CN113326696A (zh) * 2021-08-03 2021-08-31 北京世纪好未来教育科技有限公司 文本生成方法和装置

Also Published As

Publication number Publication date
CN113742459A (zh) 2021-12-03

Similar Documents

Publication Publication Date Title
US11537820B2 (en) Method and system for generating and correcting classification models
Mohammad et al. Using hashtags to capture fine emotion categories from tweets
US9836511B2 (en) Computer-generated sentiment-based knowledge base
JP6150282B2 (ja) ノン・ファクトイド型質問応答システム及びコンピュータプログラム
US20130325437A1 (en) Computer-Implemented Systems and Methods for Mood State Determination
CN109508441B (zh) 通过自然语言实现数据统计分析的方法、装置及电子设备
WO2014127183A4 (en) Language learning systems and methods
US9619555B2 (en) System and process for natural language processing and reporting
EP3210128A1 (en) Data clustering system and methods
JP4881147B2 (ja) 情報検索装置
CN113190692B (zh) 一种知识图谱的自适应检索方法、系统及装置
US20200279018A1 (en) Sentence extraction system, sentence extraction method, and information storage medium
CN117932022A (zh) 一种智能问答方法、装置、电子设备及存储介质
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
CN113742459B (zh) 词汇展示方法、装置、电子设备及存储介质
JP5877775B2 (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
Alexopoulou et al. Classifying intermediate Learner English: a data-driven approach to learner corpora
JP2021022292A (ja) 情報処理装置、プログラム及び情報処理方法
JP4795452B2 (ja) 検索システム及び検索プログラム
JP5697164B2 (ja) 対象文から直接的に導出できないカテゴリのタグを付与するタグ付けプログラム、装置、方法及びサーバ
US20100228756A1 (en) Systems and methods for creating an artificial intelligence
Sicilia et al. ISABEL: An Inclusive and Collaborative Task-Oriented Dialogue System
Lan et al. Robust Chinese native language identification with skip-gram
KR20190014195A (ko) 검색을 통한 폰트 제시 시스템 및 방법
JP6646014B2 (ja) 類似文書検索装置、類似性計算装置、これらの方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant