CN113806602A - 信息输出方法和装置 - Google Patents

信息输出方法和装置 Download PDF

Info

Publication number
CN113806602A
CN113806602A CN202111113402.9A CN202111113402A CN113806602A CN 113806602 A CN113806602 A CN 113806602A CN 202111113402 A CN202111113402 A CN 202111113402A CN 113806602 A CN113806602 A CN 113806602A
Authority
CN
China
Prior art keywords
target object
target
dictionary entry
image
context information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111113402.9A
Other languages
English (en)
Inventor
段勇
李辉
李凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202111113402.9A priority Critical patent/CN113806602A/zh
Publication of CN113806602A publication Critical patent/CN113806602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种信息输出方法和装置,该方法包括:获得待识别的目标图像,该目标图像中包含文本内容和用户手指的图像;基于该目标图像中用户手指的触点位置,确定该目标图像的文本内容中的目标对象及目标对象的属性,该属性表征该目标对象具有的释义种类;基于该目标对象的属性,识别该目标图像的该文本内容中属于该目标对象的上下文信息;结合该上下文信息,对该目标对象匹配的至少一条词典条目进行排序输出。本申请的方案可以使得用户能够更为快速的找出到适合文本中目标对象的候选词典条目。

Description

信息输出方法和装置
技术领域
本申请涉及智慧教育领域,尤其涉及一种信息输出方法和装置。
背景技术
在用户阅读文本内容的过程中,如果遇到不熟悉的词,可以查询该词的读音、翻译或者解释等词典条目。
很多情况下,针对某个词进行检索查询,可能会匹配出多条候选词典条目,用户很难快速找到更为适合该词的候选词典条目,也就不利于快速获得词的准确读音、翻译或者解释等。
发明内容
本申请提供了一种信息输出方法和装置。
其中,一种信息输出方法,包括:
获得待识别的目标图像,所述目标图像中包含文本内容和用户手指的图像;
基于所述目标图像中用户手指的触点位置,确定所述目标图像的文本内容中的目标对象及目标对象的属性,所述属性表征所述目标对象具有的释义种类;
基于所述目标对象的属性,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息;
结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出。
在一种可能的实现方式中,所述基于所述目标对象的属性,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息,包括:
基于所述目标对象的属性确定出所述目标对象属于具有多种释义种类的对象,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息。
在又一种可能的实现方式中,还包括:
基于所述目标对象的属性确定出所述目标对象不属于具有多种释义种类的对象,输出所述目标对象匹配的至少一条词典条目。
在又一种可能的实现方式中,所述结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出,包括:
确定所述目标对象在所述上下文信息中的语义特征;
结合所述语义特征,对所述目标对象匹配的至少一条词典条目进行排序输出。
在又一种可能的实现方式中,在对所述目标对象匹配的至少一条词典条目进行排序输出之前,还包括:
查询出所述目标对象匹配的至少一种词典条目列表,所述词典条目列表包括至少一条词典条目;
所述结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出,包括:
结合所述上下文信息,对所述目标对象匹配的所述词典条目列表中的至少一条词典条目进行排序输出。
在又一种可能的实现方式中,所述查询出所述目标对象匹配的至少一种词典条目列表,包括如下任意一种或者几种:
查询出所述目标对象匹配的释义条目列表,所述释义条目列表包括至少一条词释义条目,所述释义条目包括所述目标对象的含义解释;
查询出所述目标对象匹配的翻译列表,所述翻译列表包括至少一条翻译内容;
查询出所述目标对象匹配的读音列表,所述读音列表包括至少一组读音。
在又一种可能的实现方式中,所述目标对象的属性包括所述目标对象的至少一条词典条目信息;
基于所述目标对象的属性确定出所述目标对象属于具有多种释义种类的对象,包括:
基于所述至少一条词典条目信息确定所述目标对象具有多种释义种类。
在又一种可能的实现方式中,所述目标对象的属性为所述目标对象的历史类别标签;
所述基于所述目标对象的属性确定出所述目标对象属于具有多种释义种类的对象,包括:
基于所述历史类别标签确定出所述目标对象的类别属于具有多种释义种类的对象类别。
在又一种可能的实现方式中,所述识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息,包括:
从所述目标图像中提取所述目标对象关联的上下文所在的上下文图像区;
识别所述上下文图像区的文本内容,得到所述目标对象关联的上下文信息。
其中,一种信息输出装置,包括:
图像获得单元,用于获得待识别的目标图像,所述目标图像中包含文本内容和用户手指的图像;
对象确定单元,用于基于所述目标图像中用户手指的触点位置,确定所述目标图像的文本内容中的目标对象及目标对象的属性,所述属性表征所述目标对象具有的释义种类;
上下文确定单元,用于基于所述目标对象的属性,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息;
条目输出单元,用于结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出。
由以上可知,本申请中,根据待识别的目标图像中用户手指的触点位置,确定出该目标图像的文本内容中的目标对象之后,可以根据目标对象的属性所表征的目标对象具有的释义种类,识别目标图像的文本内容中属于该目标对象的上下文信息。由于目标对象的上下文信息能够反映出目标对象所处的语境信息,因此,结合目标对象的上下文信息,对目标对象匹配的至少一条词典条目进行排序输出,使得词典条目的排序顺序可以反映出词条条目与目标对象及其所处语境的贴合程度,从而使得用户根据排序后的词典条目能够更为便捷和高效的找出更为贴合该文本内容中的该目标对象的词典条目。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请实施例提供的信息输出方法的一种流程示意图;
图2示出了本申请方案中所适用的一种应用场景及呈现出的释义条目排序的一种示意图;
图3示出了本申请实施例提供的信息输出方法的又一种流程示意图;
图4示出了本申请实施例提供的信息输出方法的又一种流程示意图;
图5示出了本申请实施例提供的信息输出方法在一种应用场景中的流程示意图;
图6示出了基于用户指出的目标词且未结合目标词的上下文信息所呈现出的释义条目排序的一种示意图;
图7示出了本申请实施例提供的信息输出装置的一种组成结构示意图;
图8示出了本申请实施例提供的电子设备的一种组成结构示意图。
具体实施方式
本申请的方案适用于结合用户指出的文本对象进行文本检索与输出等相关场景,通过本申请的方案可以提高用户确定与文本对象贴合的词典条目的效率。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1,其示出了本申请实施例提供的信息输出方法的一种流程示意图,本实施例的方法可以包括应用于电子设备,该电子设备可以为具备图像采集装置的电子设备。
本实施例的方法可以包括:
S101,获得待识别的目标图像。
该目标图像中包含文本内容和用户手指的图像。
本申请的方案可以基于用户在任意文本内容中指出的文本对象进行检索查询的场景,因此,在本申请获得的目标图像中不仅包括文本内容的图像,还会包含有用户手指的图像。
如图2,其示出了目标图像的一种示意图。在图2的目标图像中包含采集到的文本内容201以及用户手指202在文本内容中指示所需查询的对象的示意图。
可以理解的是,本申请获得该目标图像的方式也可以有多种可能,本申请对于如何获得该目标图像的具体方式不加限制。
如,在一种可能的情况中,该电子设备可以为手机、笔记本、台式电脑,或者借助用户手指点击文本来实现翻译或者内容搜索的指点翻译设备或者学习机等。在该种情况下,在电子设备的图像采集范围内可以放置带有文本的书籍或者文档等文本资料,通过其他电子设备呈现出的文本内容图像等,用户如果遇到文本资料或者文本内容图像中某些文本对象需要查询,则可以用手指指向该文本资料或者文本内容图像中待查询的文本对象。相应的,电子设备可以不断采集图像,如果采集到包含有文本内容和用户手指的图像,将该图像确定为需要识别的目标图像。
在又一种可能的情况中,该目标图像可以为电子设备从本地已存储的图像中获取的待识别的图像,或者是,由其他电子设备传输给该电子设备的待识别的图像。
当然,以上仅仅是以两种可能的情况为例说明,对于通过其他方式获得该目标图像也适用于本实施例。
S102,基于目标图像中用户手指的触点位置,确定目标图像的文本内容中的目标对象及目标对象的属性。
可以理解的是,用户手指的触点位置实际上就是目标图像中用户手指所指示文本位置,如图2所示,用户手指与文本的接触位置就是该手指的触点位置。
该目标对象为目标图像的文本内容中由用户手指指示出的文本对象。如图2中用户手指所指向的目标对象203为字“销”。
其中,该目标对象可以为文本内容中包含的任意类型的文本对象,如,该目标对象可以为字、词、字符、图形、公式或者符号等等。
其中,在确定出用户手指的触点位置之后,可以通过光学字符识别(OpticalCharacter Recognition,OCR)等技术对目标图像中该触点位置所指向的文本对象的图像进行识别,以识别出该目标对象;或者是,通过OCR对文本内容识别后再提取出该触点位置对应的目标对象等。当然,还可以通过其他方式从目标图像中识别出用户手指所指向的该目标对象。
在本申请中,目标对象的属性表征目标对象具有的释义种类。每种释义表示该目标对象所能表达出的一种含义。目标对象的属性可以为历史上查询该目标对象所得到的属性,也可以是根据目标对象的检索结果确定出的属性,对此不加限制。
S103,基于目标对象的属性,识别目标图像的文本内容中属于目标对象的上下文信息。
其中,目标对象的上下文信息为文本内容中能够与该目标对象相关,且能够反映出目标对象所处语境的文本部分。如,目标对象的上下文可以为文本内容中目标对象所在的句子,或者,目标对象所在的行,或者是,目标对象所在的段落等等,对此不加限制。
其中,从目标图像中识别目标对象的上下文信息的方式也可以有多种。在一种可能的实现方式中,可以是对目标图像中属于文本内容的图像部分进行OCR识别等,确定出目标图像中的文本内容,再确定出文本内容中属于该目标对象的上下文信息。
在又一种可能的实现方式中,还可以是先从目标图像中提取目标对象关联的上下文所在的上下文图像区。如,根据目标对象在目标图像中的位置,确定出属于目标对象的上下文信息的图像区域,比如,确定出目标图像中目标对象所在的行或者段落的图像区域等,如图2,在目标对象为“销”时,可以先确定出目标对象所在的行,即图2中圈出的区域204。在此基础上,再采用OCR等技术识别上下文图像区的文本内容,得到该目标对象关联的上下文信息。
当然,还可以有其他方式从目标图像的文本内容中确定出目标对象关联的上下文信息,对此不加限制。
在本申请中结合上下文信息识别上下文信息可以有多种情况:
在一种可能的情况中,本申请可以结合目标对象的属性来确定是否需要识别目标对象的上下文信息。
可以理解的是,由于目标对象的属性反映的是目标对象具有的释义种类,而目标对象的释义种类不同,基于目标对象所能查询到的同一类别下的词典条目的数量也会有所不同。如果目标对象具有的释义种类为多种的情况下,那么与该目标对象匹配的词典条目也可能会存在多种,这样,就可能会无法准确和高效的确定出真实反映目标对象的词典条目。
基于此,本申请中,基于目标对象的属性确定出目标对象属于具有多种释义种类的对象,识别该目标图像的文本内容中属于该目标对象的上下文信息。
相应的,基于目标对象的属性确定出目标对象不属于具有多种释义种类的对象,则无需识别该目标对象的上下文信息。
在又一种可能的情况中,本申请还可以是结合目标对象的属性信息,确定目标图像的文本内容中需要识别的上下文信息的范围等等。
如,目标对象的属性表征目标对象仅仅有一种释义的情况下,可能也会查询出与该目标对象匹配的且内容相近的多个词典条目,为了能够确定目标对象在文本内容中真实表达的含义,也可以获得该目标对象的上下文信息,但是此处获得的上下文信息的文本范围可以相对较少,例如,仅仅获得目标对象所在行的上下文信息。
如果目标对象具有的释义种类为多种,则需要将目标对象相关的较大范围内的文本内容作为上下文信息,例如,获得目标对象所在的段落文本,将该段落文本作为目标对象的上下文信息。
S104,结合上下文信息,对目标对象匹配的至少一条词典条目进行排序输出。
其中,目标对象匹配的词典条目是指基于目标对象查询的查询结果项。
如,词典条目可以为目标对象的释义条目,每条释义条目包括对目标对象的含义解释。
又如,词典条目还可以是目标对象的翻译内容,如,目标对象为中文字词等中文文本对象,词典条目可以为目标对象对应的英文翻译;如果目标对象为英文单词或者其他外文的文本对象,则可以为目标对象对应的中文翻译。
又如,词典条目还可以是目标对象的读音。如,目标对象的读音可以为目标对象的拼音,或者是发音音标等等。
可以理解的是,在实际应用中,目标对象匹配的词典条目可以为一种类型的词典条目,也可以为多种类型的词典条目。但是,针对每种类型的词典条目,均可以结合该上下文信息对同一类型下的至少一个词典条目进行排序后输出。
在本申请中,结合上下文信息进行对至少一条词典条目进行排序的方式也可以有多种可能。在一种可能的实现方式中,为了能够更为方便用户快捷找到最符合目标对象的词典条目,可以结合各词典条目与上下文信息的关联程度(如相关度或者相似程度等)从高到低的顺序,对该至少一条词典条目进行排序。
本申请中,根据待识别的目标图像中用户手指的触点位置,确定出该目标图像的文本内容中的目标对象之后,可以根据目标对象的属性所表征的目标对象具有的释义种类,识别目标图像的文本内容中属于该目标对象的上下文信息。由于目标对象的上下文信息能够反映出目标对象所处的语境信息,因此,结合目标对象的上下文信息,对目标对象匹配的至少一条词典条目进行排序输出,使得词典条目的排序顺序可以反映出词条条目与目标对象及其所处语境的贴合程度,从而使得用户根据排序后的词典条目能够更为便捷和高效的找出更为贴合该文本内容中的该目标对象的词典条目。
而且,本申请根据用户手指在目标图像中识别出的目标对象,便可以按照目标对象所处语境输出各条词典条目,避免了用户手动输入所需搜索的目标对象而导致的搜索复杂度高以及耗时长等问题。
可以理解的是,本申请在对至少一条词典进行排序之前,需要查询出或者获得目标对象匹配的至少一条词典条目。
在此基础上,本申请可以将至少一条词典条目作为该目标对象的属性信息,即,目标对象的属性包括该目标对象匹配的至少一个词典条目信息。相应的,如果基于至少一条词典条目信息确定目标对象具有多种释义种类,则可以获取该目标对象在目标图像的文本内容中的上下文信息。
如,如果至少一条词典条目包含有多种释义条目,例如,匹配出目标对象对应的多条不同含义的释义词条,则说明该目标对象具有多种释义种类。又如,匹配出目标对象的多种读音,由于不同读音往往表征目标对象具有的不同表达意思,因此,如果匹配出多条读音条目,也可以确定目标对象具有多种释义种类。
为了便于理解,以查询出目标对象匹配的至少一种词典条目列表,并结合词典条目列表中至少一条词典条目分析目标对象是否具备多种释义种类进行说明。
如图3所示,其示出了本申请一种信息输出方法又一个实施例的流程示意图,本实施例的方法可以包括:
S301,获得待识别的目标图像。
该目标图像中包含文本内容和用户手指的图像。
S302,基于目标图像中用户手指的触点位置,确定目标图像的文本内容中的目标对象。
如上步骤可以参见前面实施例的相关介绍,在此不再赘述。
S303,查询出该目标对象匹配的至少一种词典条目列表。
其中,词典条目列表包括至少一条词典条目。
如,可以从词典平台或者特定的词典库中查询出至少一种词典条目列表,对此不加限制。
其中,每种词典条目列表中的词典条目为目标对象匹配的同一类型的词典条目,也就是说,每种词典条目列表对应目标对象在一种特征维度上的词典信息。相应的,不同词典条目列表中词典条目的类型不同。
可以理解的是,可考虑用户查询文本对象时,可能会希望从文本对象的解释、翻译以及读音等多个不同维度中的部分维度或者全部维度来了解该文本对象,因此,本申请可以查询出一种或者多种不同特征维度上的词典条目列表。
如,在一种可能的实现方式中,本申请可以查询出的至少一种词典条目列表可以包括如下一种或者多种词典条目列表:
目标对象匹配的释义条目列表,该释义条目列表包括至少一条词释义条目;
目标对象匹配的翻译列表,该翻译列表包括至少一条翻译内容;
目标对象匹配的读音列表,该读音列表包括至少一组读音。
其中,释义条目可以包括目标对象的含义解释。如,目标对象为公式文本,则释义条目可以为公式的含义描述;目标对象为字词,则释义条目为字词所表达意思的解释;目标对象为符号为符合意义的解释等。
翻译列表可以包括采用另一种语言描述出的该目标对象所表达的语义。如,目标对象为中文字词,则翻译列表中可以包括与中文字词表达相同含义的一个或者多个英文字词或者解释等。
读音列表中的读音可以为音频或者音标等。其中,目标对象在读音列表中不同读音也表达了不同的释义。如,以目标对象为中文的字词为例,由于很多汉字是多音字,因此,可以检索出字词的至少一组拼音,而字词在不同拼音读音下的含义也不同。同时。对于英语等外文也类似,同一个单词也可能会有多个读音,而不同读音下字词所表达的含义也不同。
S304,如果基于各词典条目列表中至少一条词典条目信息确定目标对象具有多种释义种类,获取该目标对象在目标图像的文本内容中的上下文信息。
可以理解的是,如果任意一个词典条目列表中包含多个用于表达不同含义的词典条目,可以说明目标对象具有的多种释义种类。如,如果读音列表中包含多个读音,则可以说明该目标对象属于具有多种释义种类的文本对象。又如,翻译列表中包含多种表达不同含义的翻译条目,则可以说明该目标对象具有多种释义种类。
在一种可选方式中,考虑到大部分情况下,如果一个词典条目列表中包括多个词典条目,则该多个词典条目一般都对应不同的表义,基于此,如果目标对象匹配的词典条目中存在多个词典条目就可以确定该目标对象具有多种释义种类。
其中,从目标图像中获取该目标对象的上下文信息可以参见前面实施例的相关介绍,在此不再赘述。
S305,结合该上下文信息,分别对目标对象匹配的每个词典条目列表中的至少一条词典条目进行排序输出。
在目标对象匹配出多个词典条目列表的情况下,针对每个词典条目列表,为了使得用户能够便捷找出该词典条目列表下最适合该目标对象的词典条目,本申请均可以按照该上下文信息,对该词典条目列表下的至少一条词典条目进行排序。
当然,由于在匹配出多个词典条目列表的情况下,如果某些词典条目列表中词典条目的数量仅仅有一个,则无需对该词典条目列表中的词典条目进行排序。
S306,如果基于各词典条目列表中确定目标对象不具有多种释义种类,输出每个词典条目列表中至少一条词典条目。
如,每个词典条目列表中各词典条目的释义种类是相同的,例如,一个中文的英文翻译有多个,但是这多个英文翻译本质上相同的语义。
可选的,如果每个词典条目列表中都仅仅包括一条词典条目则可以确定该目标对象不具有多种释义种类。
在本申请实施例中,在从目标图像的文本内容中识别出用户指出的目标对象之后,会查询该目标对象匹配的词典条目列表。如果基于该词典条目列表确定出该目标对象属于具有多种释义种类的对象,会进一步从该目标图像的文本内容中获得该目标对象的上下文信息,并根据上下文信息对词典条目列表中各词典条目进行排序,从而使得每个词典条目列表中各词典条目的顺序可以反映出词典条目与目标对象的上下文的相关程序,进而有利于用户快速查找到最贴合目标对象所处语境的释义或者读音等条目。
同时,如果基于词典条目列表表征目标对象不具有多种释义种类,本申请可以无需获得目标对象的上下文信息,而直接输出词典条目列表中各条词典条目,从而有利于减少由于获取上下文信息所耗费的数据处理资源。
可以理解的是,图3是将查询出的目标对象匹配的至少一条词典条目列表作为目标对象的属性为例说明,在实际应用中,本申请可以预先在电子设备中存储不同对象的历史类别标签,历史类别标签用于表征目标对象是否具有多种释义种类。
相应的,如果基于历史类别标签确定出目标对象的类别属于具有多种释义种类的对象类别,则需要获得该目标对象在目标图像的文本内容中的上下文信息,以便基于上下文信息对目标对象匹配的至少一条词典条目进行排序输出。
其中,目标对象的历史类别标签可以是根据经验预先配置并存储的。
目标对象的历史类别标签,也可以是历史上基于目标对象匹配的至少一条词典条目确定目标对象是否具备多种释义种类之后,为该目标对象存储的类别标签。如,在当前时刻之前根据该目标对象匹配的至少一条词典条目确定出该目标对象具有多种释义种类,则生成第一历史类别标签并存储,该第一历史类别标签表征目标对象属于具有多种释义种类的对象。相应的,如果基于目标对象匹配的至少一条词典条目,确定出目标对象不具有多种释义种类,则可以生成表征目标对象不具有多种释义种类的第二历史类别标签。
在本申请中结合目标对象的上下文信息对至少一条词典条目进行排序的具体实现可以有多种可能。为了能够更为准确的从至少一条词典条目中确定出贴合该目标对象的词典条目,本申请还可以结合目标对象的上下文信息,确定目标对象在目标图像的文本内容中的语义特征,并根据语义特征对至少一条词典条目进行排序。
下面结合一种可能情况进行说明。如图4所示,其示出了本申请一种信息输出方法又一种流程示意图,本实施例的方法可以包括:
S401,获得待识别的目标图像。
该目标图像中包含文本内容和用户手指的图像。
S402,基于目标图像中用户手指的触点位置,确定目标图像的文本内容中的目标对象及目标对象的属性。
S403,基于该目标对象的属性确定出该目标对象属于具有多种释义种类的对象,识别该目标图像的文本内容中属于该目标对象的上下文信息。
以上步骤可以参见前面任意一个实施例的相关介绍,在此不再赘述。
S404,确定目标对象在上下文信息中的语义特征。
其中,结合目标对象的山下文信息确定目标对象的语义特征的具体方式可以有多种,本申请对于采取何种方式确定语义特征不限制。如,可以利用自然语言分析(NaturalLanguage Processing,NLP)算法分析该上下文信息,确定目标对象的语义特征。
S405,按照该语义特征,对目标对象匹配的至少一条词典条目进行排序输出。
如,按照词典条目与该语义特征的相似程度从高到低的顺序,对目标对象匹配的至少一条词典条目进行排序顺序,从而使得最贴合该目标对象的词典条目的排序最靠前,有利于用户快速定位到适合该目标对象的词典条目。
可以理解的是,由于目标对象的语义特征是结合目标对象的上下文信息确定出的,通过该语义特征可以反映出目标对象在该目标图像的文本内容中所期望表达的语义,在此基础上,词典条目与该语义特征的相似程度本质上就是该词典条目与该目标对象的贴合程度,因此,结合语义特征对至少一条词典条目进行排序,可以实现有利于用户根据排序顺序快速定位到最贴合该目标对象所处语境的词典条目。
S406,基于该目标对象的属性确定出该目标对象不属于具有多种释义种类的对象,输出该目标对象匹配的至少一条词典条目。
为了便于理解本申请的方案,下面结合一种应用场景对本申请的方案进行说明。以用户希望通过点击文本中的某个词来快速和准确的确定出该词的解释为例说明。如图5,其示出了本申请的信息输出方法在一种应用场景中的流程示意图,本实施例的方法可以包括:
S501,获得待识别的目标图像。
该目标图像中包含文本内容和用户手指的图像。
S502,基于目标图像中用户手指的触点位置,确定目标图像的文本内容中属于用户手指所指示的目标词。
S503,查询该目标词匹配的释义条目列表。
该释义条目列表包括与目标词匹配的各释义条目。
S504,如果释义条目列表中包括多个不同的释义条目,确定目标图像的文本内容中包含该目标词的上下文图像区。
S505,对该上下文图像区进行OCR识别,识别出该目标词关联的上下文信息。
S506,结合目标词的上下文信息,确定目标词的语义特征。
S504,按照释义条目列表中各条释义条目与该语义特征的相似程度从高到低的顺序,对释义条目列表中各释义条目进行排序并输出。
其中,计算释义条目与语义特征的相似程度的具体方式可以有多种可能,如,可以确定释义条目的特征向量,并计算该特征向量与该语义特征的向量相似度等等,本申请对于具体确定该相似程度的方式不加限制。
S505,如果释义条目列表中未包括多个不同的释义条目,按照释义条目列表中各释义条目的原始排序,输出该释义列表中的各释义条目。
如,结合图2和图6说明,如图2为采用本申请的方案确定出目标词“销”之后,结合目标词“销”的上下文,如图2中示出的“销”所在行的文本区204所示,对“销”的多条解释条目进行排序后,可以得到图2中条目呈现出205所示的多条解释条目。如图2所示,排序最靠前的解释条目为“1、销售:供~”,而结合图2中“销”所在的上下文“先投放市场试销”,可知,该解释条目最能表达该“销”的真实含义,从而有利于用户及时和准确的确定出“销”的解释。
而在图6中,用户手指在文本内容601中指出“销”之后,会直接输出“销”字匹配出的多条解释条目,如图6中解释条目展示区602所示。在图6中排序最靠前的解释条目为“熔化金属”,这显然与文本内容601中“销”实际表达的含义不符,用户需要依次查看各条解释条目,再推测最贴近文本内容中“销”的真实含义,耗时会较长,复杂度高,也不利于准确确定“销”字的准确意思。
对应本申请的一种信息输出方法,本申请还提供了一种信息输出装置。
如图7所示,其示出了本申请一种信息输出装置的一种组成结构示意图,本实施例的装置可以包括:
图像获得单元701,用于获得待识别的目标图像,该目标图像中包含文本内容和用户手指的图像;
对象确定单元702,用于基于该目标图像中用户手指的触点位置,确定该目标图像的文本内容中的目标对象及目标对象的属性,该属性表征该目标对象具有的释义种类;
上下文确定单元703,用于基于该目标对象的属性,识别该目标图像的该文本内容中属于该目标对象的上下文信息;
条目输出单元704,用于结合该上下文信息,对该目标对象匹配的至少一条词典条目进行排序输出。
在一种可能的实现方式中,该上下文确定单元,具体为,用于基于所述目标对象的属性确定出所述目标对象属于具有多种释义种类的对象,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息。
在一种可能的情况中,对象确定单元确定出的目标对象的属性包括所述目标对象的至少一条词典条目信息;
该上下文确定单元,包括:
第一上下文确定单元,用于基于所述至少一条词典条目信息确定所述目标对象具有多种释义种类,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息。
在又一种可能的情况中,该对象确定单元确定出的目标对象的属性为所述目标对象的历史类别标签;
该上下文确定单元,包括:
第二上下文确定单元,用于基于所述历史类别标签确定出所述目标对象的类别属于具有多种释义种类的对象类别。
在又一种可能的实现方式中,该装置还包括:
非排序输出单元,用于基于所述目标对象的属性确定出所述目标对象不属于具有多种释义种类的对象,输出所述目标对象匹配的至少一条词典条目。
在一种可能的实现方式中,该条目输出单元,包括:
语义确定单元,用于确定目标对象在上下文信息中的语义特征;
排序输出单元,用于结合语义特征,对目标对象匹配的至少一条词典条目进行排序输出。
在又一种可能的实现方式中,该装置还包括:
词典查询单元,用于在条目输出单元对所述目标对象匹配的至少一条词典条目进行排序输出之前,查询出目标对象匹配的至少一种词典条目列表,该词典条目列表包括至少一条词典条目;
排序输出单元具体为,用于结合所述上下文信息,对所述目标对象匹配的所述词典条目列表中的至少一条词典条目进行排序输出。
在一种可选的实现方式中,词典查询单元,包括如下任意一种或者几种:
第一查询单元,用于在条目输出单元对所述目标对象匹配的至少一条词典条目进行排序输出之前,查询出所述目标对象匹配的释义条目列表,所述释义条目列表包括至少一条词释义条目,所述释义条目包括所述目标对象的含义解释;
第二查询单元,用于在条目输出单元对所述目标对象匹配的至少一条词典条目进行排序输出之前,查询出所述目标对象匹配的翻译列表,所述翻译列表包括至少一条翻译内容;
第三查询单元,用于在条目输出单元对所述目标对象匹配的至少一条词典条目进行排序输出之前,查询出所述目标对象匹配的读音列表,所述读音列表包括至少一组读音。
在又一种可能的实现方式中,下文确定单元,包括:
图像区提取单元,用于基于该目标对象的属性,从所述目标图像中提取所述目标对象关联的上下文所在的上下文图像区;
信息识别单元,用于识别所述上下文图像区的文本内容,得到所述目标对象关联的上下文信息。
又一方面,本申请还提供了一种电子设备,如图8所示,其示出了该电子设备的一种组成结构示意图,该电子设备可以为任意类型的电子设备,该电子设备至少包括存储器801和处理器802;
其中,处理器801用于执行如上任意一个实施例中的信息输出方法。
该存储器802用于存储处理器执行操作所需的程序。
可以理解的是,该电子设备还可以包括显示单元803以及输入单元804。
当然,该电子设备还可以具有比图8更多或者更少的部件,对此不加限制。
另一方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上任意一个实施例所述的信息输出方法。
本申请还提出了一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机程序在电子设备上运行时,用于执行如上任意一个实施例中的信息输出方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。同时,本说明书中各实施例中记载的特征可以相互替换或者组合,使本领域专业技术人员能够实现或使用本申请。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种信息输出方法,包括:
获得待识别的目标图像,所述目标图像中包含文本内容和用户手指的图像;
基于所述目标图像中用户手指的触点位置,确定所述目标图像的文本内容中的目标对象及目标对象的属性,所述属性表征所述目标对象具有的释义种类;
基于所述目标对象的属性,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息;
结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出。
2.根据权利要求1所述的方法,所述基于所述目标对象的属性,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息,包括:
基于所述目标对象的属性确定出所述目标对象属于具有多种释义种类的对象,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息。
3.根据权利要求2所述的方法,还包括:
基于所述目标对象的属性确定出所述目标对象不属于具有多种释义种类的对象,输出所述目标对象匹配的至少一条词典条目。
4.根据权利要求1所述的方法,所述结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出,包括:
确定所述目标对象在所述上下文信息中的语义特征;
结合所述语义特征,对所述目标对象匹配的至少一条词典条目进行排序输出。
5.根据权利要求1所述的方法,在对所述目标对象匹配的至少一条词典条目进行排序输出之前,还包括:
查询出所述目标对象匹配的至少一种词典条目列表,所述词典条目列表包括至少一条词典条目;
所述结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出,包括:
结合所述上下文信息,对所述目标对象匹配的所述词典条目列表中的至少一条词典条目进行排序输出。
6.根据权利要求5所述的方法,所述查询出所述目标对象匹配的至少一种词典条目列表,包括如下任意一种或者几种:
查询出所述目标对象匹配的释义条目列表,所述释义条目列表包括至少一条词释义条目,所述释义条目包括所述目标对象的含义解释;
查询出所述目标对象匹配的翻译列表,所述翻译列表包括至少一条翻译内容;
查询出所述目标对象匹配的读音列表,所述读音列表包括至少一组读音。
7.根据权利要求2所述的方法,所述目标对象的属性包括所述目标对象的至少一条词典条目信息;
基于所述目标对象的属性确定出所述目标对象属于具有多种释义种类的对象,包括:
基于所述至少一条词典条目信息确定所述目标对象具有多种释义种类。
8.根据权利要求2所述的方法,所述目标对象的属性为所述目标对象的历史类别标签;
所述基于所述目标对象的属性确定出所述目标对象属于具有多种释义种类的对象,包括:
基于所述历史类别标签确定出所述目标对象的类别属于具有多种释义种类的对象类别。
9.根据权利要求1所述的方法,所述识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息,包括:
从所述目标图像中提取所述目标对象关联的上下文所在的上下文图像区;
识别所述上下文图像区的文本内容,得到所述目标对象关联的上下文信息。
10.一种信息输出装置,包括:
图像获得单元,用于获得待识别的目标图像,所述目标图像中包含文本内容和用户手指的图像;
对象确定单元,用于基于所述目标图像中用户手指的触点位置,确定所述目标图像的文本内容中的目标对象及目标对象的属性,所述属性表征所述目标对象具有的释义种类;
上下文确定单元,用于基于所述目标对象的属性,识别所述目标图像的所述文本内容中属于所述目标对象的上下文信息;
条目输出单元,用于结合所述上下文信息,对所述目标对象匹配的至少一条词典条目进行排序输出。
CN202111113402.9A 2021-09-23 2021-09-23 信息输出方法和装置 Pending CN113806602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111113402.9A CN113806602A (zh) 2021-09-23 2021-09-23 信息输出方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111113402.9A CN113806602A (zh) 2021-09-23 2021-09-23 信息输出方法和装置

Publications (1)

Publication Number Publication Date
CN113806602A true CN113806602A (zh) 2021-12-17

Family

ID=78896350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111113402.9A Pending CN113806602A (zh) 2021-09-23 2021-09-23 信息输出方法和装置

Country Status (1)

Country Link
CN (1) CN113806602A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786803A (zh) * 2016-02-22 2016-07-20 广东小天才科技有限公司 翻译方法及翻译装置
CN111428721A (zh) * 2019-01-10 2020-07-17 北京字节跳动网络技术有限公司 词语释义的确定方法、装置、设备及存储介质
CN111858855A (zh) * 2020-07-20 2020-10-30 百度在线网络技术(北京)有限公司 信息查询方法、装置、系统、电子设备及存储介质
CN113255345A (zh) * 2021-06-10 2021-08-13 腾讯科技(深圳)有限公司 一种语义识别方法、相关装置以及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786803A (zh) * 2016-02-22 2016-07-20 广东小天才科技有限公司 翻译方法及翻译装置
CN111428721A (zh) * 2019-01-10 2020-07-17 北京字节跳动网络技术有限公司 词语释义的确定方法、装置、设备及存储介质
CN111858855A (zh) * 2020-07-20 2020-10-30 百度在线网络技术(北京)有限公司 信息查询方法、装置、系统、电子设备及存储介质
CN113255345A (zh) * 2021-06-10 2021-08-13 腾讯科技(深圳)有限公司 一种语义识别方法、相关装置以及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴昊 等: "基于认知概念信息量的文本语义相似度模型研究", 31 January 2021, 北京理工大学出版社, pages: 24 - 26 *

Similar Documents

Publication Publication Date Title
CN108829893B (zh) 确定视频标签的方法、装置、存储介质和终端设备
US10489439B2 (en) System and method for entity extraction from semi-structured text documents
US9659084B1 (en) System, methods, and user interface for presenting information from unstructured data
US7949191B1 (en) Method and system for searching for information on a network in response to an image query sent by a user from a mobile communications device
TWI536181B (zh) 在多語文本中的語言識別
CN109634436B (zh) 输入法的联想方法、装置、设备及可读存储介质
CN110543592B (zh) 信息搜索方法、装置以及计算机设备
RU2613846C2 (ru) Метод и система извлечения данных из изображений слабоструктурированных документов
CN110674429A (zh) 用于信息检索的方法、装置、设备和计算机可读存储介质
US9558234B1 (en) Automatic metadata identification
KR20050026902A (ko) 펜-기반 컴퓨팅 시스템에서의 주석 관리
US20120162244A1 (en) Image search color sketch filtering
US20140289238A1 (en) Document creation support apparatus, method and program
CN109074355B (zh) 用于表意字符分析的方法和介质
EP2806336A1 (en) Text prediction in a text input associated with an image
CN112528681A (zh) 跨语言检索及模型训练方法、装置、设备和存储介质
CN110795942B (zh) 基于语义识别的关键词确定方法、装置和存储介质
CN109783612B (zh) 报表数据定位方法及装置、存储介质、终端
CN112241463A (zh) 一种基于融合文本语义与图片信息的搜索方法
CN113806491B (zh) 一种信息处理的方法、装置、设备和介质
CN110008312A (zh) 一种文档写作助手实现方法、系统及电子设备
CN110489528B (zh) 基于电子书内容的电子词典重构方法及计算设备
US8549008B1 (en) Determining section information of a digital volume
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
CN113806602A (zh) 信息输出方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination